
Las medidas de dispersión para datos no agrupados son herramientas estadísticas que nos indican cuán extendidos o dispersos están un conjunto de datos individuales. En otras palabras, nos muestran qué tanto varían los valores alrededor del valor central, como la media. Son cruciales para comprender la variabilidad de los datos y complementan a las medidas de tendencia central.
Una de las medidas más sencillas es el rango. El rango se calcula restando el valor mínimo al valor máximo en el conjunto de datos. Por ejemplo, si tenemos los datos: 5, 8, 12, 15, 20, el rango sería 20 - 5 = 15. Es fácil de calcular, pero muy sensible a valores atípicos.
Otra medida importante es la varianza. La varianza mide la dispersión promedio de los datos alrededor de la media. Se calcula restando la media a cada dato, elevando al cuadrado cada diferencia, sumando todos esos resultados y dividiendo entre el número total de datos menos uno (n-1) para obtener la varianza muestral. La varianza es útil, pero está en unidades al cuadrado, lo que dificulta la interpretación.
Must Read
Para resolver el problema de las unidades al cuadrado, usamos la desviación estándar. La desviación estándar es simplemente la raíz cuadrada de la varianza. Por ejemplo, si la varianza es 25, la desviación estándar es 5. Una desviación estándar alta indica que los datos están más dispersos, mientras que una desviación estándar baja indica que están más agrupados alrededor de la media.

Finalmente, el coeficiente de variación es una medida relativa de dispersión. Se calcula dividiendo la desviación estándar entre la media. Es útil para comparar la dispersión de dos conjuntos de datos que tienen diferentes unidades o diferentes medias. Por ejemplo, comparar la variabilidad de las alturas (en cm) de estudiantes con la variabilidad de sus pesos (en kg).
Aplicaciones Prácticas: Imagina que eres un profesor. Puedes usar las medidas de dispersión para analizar los resultados de un examen. Una baja desviación estándar indicaría que la mayoría de los estudiantes obtuvieron calificaciones similares, mientras que una alta desviación estándar indicaría una mayor variabilidad en el rendimiento. O, piensa en controlar la calidad de un producto; una baja dispersión significa que la producción es consistente. Entender estas medidas te permite tomar decisiones informadas basadas en la variabilidad de los datos a tu alrededor.