
La fórmula de desviación estándar para datos agrupados nos dice qué tan dispersos están los datos alrededor de la media, cuando la información se presenta en intervalos o clases. No tenemos los datos individuales, sino la frecuencia con la que cada intervalo ocurre.
En resumen, mide el promedio de las desviaciones de cada dato respecto a la media, pero considerando que los datos están agrupados.
Entendiendo la Fórmula Paso a Paso
La fórmula, aunque parezca complicada, se puede descomponer en pasos sencillos:
Must Read
Imagina que tenemos datos de las edades de personas que asistieron a un evento. En lugar de tener la edad de cada persona individualmente, tenemos una tabla que muestra cuántas personas están en un rango de edad específico (por ejemplo, de 20 a 30 años, de 30 a 40 años, etc.).
La fórmula general es:

σ = √[Σ((xᵢ - μ)² * fᵢ) / N]
Donde:
- σ (sigma) es la desviación estándar. Es lo que queremos calcular.
- xᵢ es el punto medio de cada clase o intervalo. Para obtenerlo, sumas el límite inferior y superior del intervalo y divides entre 2. Ejemplo: Si el intervalo es de 20 a 30 años, el punto medio es (20+30)/2 = 25.
- μ (mu) es la media de los datos agrupados. Se calcula como: μ = Σ(xᵢ * fᵢ) / N. Multiplicas cada punto medio por su frecuencia, sumas todos esos resultados y divides entre el número total de datos.
- fᵢ es la frecuencia de cada clase o intervalo. Es el número de veces que ese intervalo aparece en los datos. En nuestro ejemplo, sería el número de personas en cada rango de edad.
- N es el tamaño total de la muestra. Es la suma de todas las frecuencias (Σfᵢ). En nuestro ejemplo, es el número total de personas que asistieron al evento.
- Σ (sigma mayúscula) indica la sumatoria. Significa que debemos sumar los resultados de las operaciones dentro del paréntesis para cada clase o intervalo.
Aplicando la Fórmula: Un Ejemplo Simplificado
Supongamos que tenemos la siguiente tabla de edades:

| Intervalo de Edad | Frecuencia (fᵢ) |
|---|---|
| 20-30 | 10 |
| 30-40 | 20 |
| 40-50 | 15 |
1. Calculamos los puntos medios (xᵢ):
- 20-30: x₁ = (20+30)/2 = 25
- 30-40: x₂ = (30+40)/2 = 35
- 40-50: x₃ = (40+50)/2 = 45
2. Calculamos la media (μ):

- μ = (2510 + 3520 + 45*15) / (10+20+15) = (250 + 700 + 675) / 45 = 1625 / 45 ≈ 36.11
3. Calculamos (xᵢ - μ)² * fᵢ para cada intervalo:
- (25 - 36.11)² * 10 ≈ 1234.32
- (35 - 36.11)² * 20 ≈ 24.44
- (45 - 36.11)² * 15 ≈ 1215.67
4. Sumamos los resultados del paso anterior (Σ((xᵢ - μ)² * fᵢ)):
- 1234.32 + 24.44 + 1215.67 ≈ 2474.43
5. Dividimos entre N (tamaño total de la muestra):

- 2474.43 / 45 ≈ 54.99
6. Calculamos la raíz cuadrada (σ):
- σ = √54.99 ≈ 7.42
Por lo tanto, la desviación estándar de las edades es aproximadamente 7.42 años.
En conclusión, la fórmula de desviación estándar para datos agrupados nos permite estimar la dispersión de los datos cuando solo tenemos información sobre la frecuencia de cada intervalo. Entender cada componente de la fórmula es clave para poder aplicarla correctamente.