
Las medidas de tendencia central y de dispersión son herramientas estadísticas fundamentales para resumir y analizar conjuntos de datos. En esencia, las medidas de tendencia central nos indican el valor típico o central del conjunto, mientras que las medidas de dispersión nos informan sobre la variabilidad o propagación de los datos alrededor de ese valor central.
Comencemos con las medidas de tendencia central:
- Media (Promedio): Se calcula sumando todos los valores y dividiendo por el número total de valores. Ejemplo: Si tenemos las edades 20, 22, 24, 26, 28, la media es (20+22+24+26+28)/5 = 24.
- Mediana: Es el valor que se encuentra en el centro del conjunto de datos una vez que han sido ordenados. Ejemplo: En el conjunto anterior (20, 22, 24, 26, 28), la mediana es 24. Si tuviéramos (20, 22, 24, 26), la mediana sería (22+24)/2 = 23.
- Moda: Es el valor que aparece con mayor frecuencia en el conjunto de datos. Ejemplo: En el conjunto (20, 22, 22, 24, 26), la moda es 22.
Ahora, veamos las medidas de dispersión:
- Rango: Es la diferencia entre el valor máximo y el valor mínimo del conjunto de datos. Ejemplo: En el conjunto (20, 22, 24, 26, 28), el rango es 28 - 20 = 8.
- Desviación Estándar: Mide la dispersión de los datos alrededor de la media. Un valor bajo indica que los datos están agrupados cerca de la media, mientras que un valor alto indica mayor dispersión. Su cálculo es un poco más complejo, pero existen calculadoras y programas que lo facilitan.
- Varianza: Es el cuadrado de la desviación estándar.
Must Read
¿Por qué son importantes? Imagina que estás analizando las notas de dos clases diferentes. La media de ambas puede ser la misma, pero si una clase tiene una desviación estándar mucho mayor, significa que las notas en esa clase están más dispersas (hay alumnos con notas muy altas y muy bajas) que en la otra. En el campo de la medicina, se utilizan para analizar la efectividad de tratamientos, donde la desviación estándar nos indica la consistencia de los resultados.