
En estadística y matemáticas, la dispersión es una idea fundamental.
Pero, ¿a qué se le llama dispersión exactamente? Es la medida de cuánto se extienden o varían los datos en un conjunto.
Definición de Dispersión
Formalmente, la dispersión se refiere al grado en que los datos numéricos tienden a extenderse alrededor de un valor promedio. No es simplemente la distancia entre el valor más alto y el más bajo.
Must Read
Más bien, describe la heterogeneidad o variabilidad dentro del conjunto de datos. Cuanto mayor sea la dispersión, más diferentes serán los valores entre sí. Una dispersión baja indica que los datos están agrupados cerca de la media.
Medidas Comunes de Dispersión
Existen varias maneras de cuantificar la dispersión. Cada una ofrece una perspectiva diferente sobre la distribución de los datos.
Rango
El rango es la medida más simple. Se calcula restando el valor mínimo del valor máximo del conjunto de datos. Ofrece una idea general de la extensión de los datos, pero es sensible a los valores atípicos (outliers).
Por ejemplo, en el conjunto {2, 5, 8, 11, 20}, el rango es 20 - 2 = 18.

Es rápido de calcular, pero ignora la distribución interna de los datos.
Varianza
La varianza mide el promedio de los cuadrados de las diferencias entre cada valor y la media del conjunto de datos. Una varianza alta indica una mayor dispersión.
Para calcularla, primero se halla la media, luego se calcula la diferencia de cada dato con la media, se eleva al cuadrado cada diferencia, y finalmente se calcula el promedio de esos cuadrados.
La varianza se expresa en unidades al cuadrado, lo que puede dificultar su interpretación directa.

Desviación Estándar
La desviación estándar es la raíz cuadrada de la varianza. Es una medida de dispersión más intuitiva que la varianza, ya que se expresa en las mismas unidades que los datos originales. Representa el promedio de la distancia de cada valor con respecto a la media.
Una desviación estándar baja indica que los datos están concentrados alrededor de la media. Una alta, que están más dispersos.
Es la medida de dispersión más utilizada en estadística.
Rango Intercuartílico (IQR)
El rango intercuartílico (IQR) es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1) del conjunto de datos. Representa el rango del 50% central de los datos.

Es menos sensible a los valores atípicos que el rango total. Q1 es el valor que separa el 25% inferior de los datos, y Q3 es el valor que separa el 25% superior.
El IQR es útil para identificar valores atípicos y para describir la dispersión de los datos en distribuciones asimétricas.
Ejemplos y Aplicaciones Reales
La dispersión tiene aplicaciones en diversos campos. Por ejemplo, en finanzas, la desviación estándar de los rendimientos de una inversión se utiliza como medida de riesgo. Una mayor desviación estándar implica un mayor riesgo.
En meteorología, la dispersión de las temperaturas diarias puede indicar la estabilidad del clima. Una baja dispersión sugiere un clima más predecible.

En educación, un profesor puede analizar la dispersión de las notas de un examen para evaluar la homogeneidad del conocimiento de los estudiantes. Una alta dispersión podría indicar que algunos estudiantes dominan la materia mientras que otros tienen dificultades.
En control de calidad, la dispersión en las dimensiones de los productos fabricados es un indicador de la consistencia del proceso de producción. Una baja dispersión es deseable.
Conclusión
Comprender la dispersión es crucial para analizar y interpretar datos. Permite evaluar la variabilidad y heterogeneidad de los datos, lo que es esencial para tomar decisiones informadas en una amplia gama de disciplinas.
Al entender las diferentes medidas de dispersión, podemos obtener una visión más completa de la distribución de los datos y tomar decisiones más precisas.
Recuerda, la dispersión no solo nos dice cuánto varían los datos, sino también cómo están distribuidos alrededor de un valor central.