
Los intervalos de clase son rangos numéricos utilizados para agrupar datos en una distribución de frecuencias. En esencia, dividen un conjunto de datos en categorías más manejables para su análisis y representación.
Aquí te explicamos el proceso paso a paso:
- Determinar el rango: Calcula la diferencia entre el valor máximo y el valor mínimo en tu conjunto de datos. Por ejemplo, si tus datos van de 10 a 70, el rango es 60 (70 - 10 = 60).
- Decidir el número de intervalos: No hay una regla fija, pero generalmente se recomienda usar entre 5 y 20 intervalos. Demasiados pocos pueden ocultar detalles importantes, mientras que demasiados pueden ser innecesarios. Una guía común es usar la regla de Sturges: k = 1 + 3.322 * log(n), donde n es el número de datos y k es el número de intervalos. Redondea k al entero más cercano. Por ejemplo, si tienes 50 datos, k ≈ 6.64 ≈ 7 intervalos.
- Calcular el ancho del intervalo: Divide el rango entre el número de intervalos. En nuestro ejemplo, 60 / 7 ≈ 8.57. Redondea este valor hacia arriba a un número entero conveniente, como 9, para facilitar la interpretación. Este es el ancho del intervalo.
- Definir los límites de los intervalos: Comienza con el valor mínimo de tus datos y añade el ancho del intervalo para obtener el límite superior del primer intervalo. Luego, usa ese límite superior como el límite inferior del siguiente intervalo, y así sucesivamente. Por ejemplo: [10-19), [19-28), [28-37), etc. Observa que el corchete "[" significa que el valor está incluido en el intervalo, mientras que el paréntesis ")" significa que no lo está.
- Contar las frecuencias: Cuenta cuántos datos caen dentro de cada intervalo. Este recuento es la frecuencia de cada intervalo.
Ejemplo: Supongamos que tenemos las edades de 20 personas: 22, 25, 28, 30, 32, 35, 38, 40, 42, 45, 48, 50, 52, 55, 58, 60, 62, 65, 68, 70. El rango es 48 (70-22). Si decidimos usar 5 intervalos, el ancho del intervalo sería aproximadamente 10 (48/5≈ 9.6 ≈ 10). Los intervalos serían: [22-32), [32-42), [42-52), [52-62), [62-72). Luego contaríamos cuántas edades caen en cada intervalo.
Must Read
Los intervalos de clase son importantes para resumir grandes conjuntos de datos, facilitando la creación de histogramas y otros gráficos que permiten identificar patrones y tendencias. Por ejemplo, en marketing, se pueden usar para analizar la distribución de ingresos de los clientes.