
Las medidas de dispersión nos indican qué tan extendidos o agrupados están los datos en un conjunto. En otras palabras, muestran cuánto varían los valores individuales con respecto al valor central (como la media).
¿Qué significa esto?
Imagina que tienes dos grupos de estudiantes que hicieron un examen. Ambos grupos tienen una media de 7. Sin embargo, en el primer grupo, todas las notas están entre 6 y 8. En el segundo grupo, algunas notas son muy bajas (como 2 o 3) y otras muy altas (como 9 o 10). La media es la misma, pero la dispersión de las notas es diferente. El segundo grupo tiene una mayor dispersión que el primero.
Medidas comunes de dispersión para datos no agrupados
Cuando hablamos de datos no agrupados, nos referimos a datos que no están organizados en intervalos o clases. Estas son algunas medidas comunes:
Must Read
Rango
El rango es la diferencia entre el valor máximo y el valor mínimo en un conjunto de datos. Es la medida más sencilla de calcular. Por ejemplo, si las edades de un grupo de personas son: 15, 20, 25, 30, 35, el rango es 35 - 15 = 20.
Ventajas: Fácil de calcular.

Desventajas: Solo considera los valores extremos, no la distribución completa de los datos.
Varianza
La varianza mide la dispersión de los datos alrededor de la media. Se calcula promediando los cuadrados de las diferencias entre cada dato y la media.
Ejemplo simplificado: Supongamos que tenemos los datos: 2, 4, 6. La media es (2+4+6)/3 = 4. Las diferencias con la media son: (2-4) = -2, (4-4) = 0, (6-4) = 2. Elevamos al cuadrado: 4, 0, 4. La varianza es el promedio de estos cuadrados: (4+0+4)/3 = 2.67.

Ventajas: Considera todos los valores del conjunto de datos.
Desventajas: Está en unidades al cuadrado, lo que dificulta su interpretación directa.

Desviación Estándar
La desviación estándar es la raíz cuadrada de la varianza. Esto significa que está en las mismas unidades que los datos originales, lo que facilita su interpretación. Siguiendo el ejemplo anterior, la desviación estándar sería la raíz cuadrada de 2.67, que es aproximadamente 1.63.
Ventajas: Fácil de interpretar, se encuentra en las mismas unidades que los datos.
Desventajas: Sensible a los valores atípicos (valores muy diferentes al resto).

Desviación Media Absoluta
La desviación media absoluta (DMA) mide el promedio de las diferencias absolutas entre cada dato y la media. En otras palabras, calcula la distancia promedio de cada punto de datos a la media, sin considerar si la diferencia es positiva o negativa. Esto la hace menos sensible a los valores atípicos que la varianza y la desviación estándar.
Ejemplo: Usando los datos 2, 4, 6 (media = 4). Las diferencias absolutas son |2-4| = 2, |4-4| = 0, |6-4| = 2. La DMA es (2+0+2)/3 = 1.33.
Elegir la mejor medida de dispersión depende del contexto y del tipo de datos que estés analizando. Considera las ventajas y desventajas de cada una para tomar la decisión más informada.