El coeficiente de correlación de Pearson es una medida estadística que indica la fuerza y la dirección de una relación lineal entre dos variables. En palabras sencillas, nos dice si dos cosas tienden a moverse juntas (de manera positiva) o en direcciones opuestas (de manera negativa).
El valor del coeficiente de correlación de Pearson (r) varía entre -1 y +1:
+1: Correlación positiva perfecta. A medida que una variable aumenta, la otra también aumenta de manera predecible.
0: No hay correlación. No existe una relación lineal evidente entre las variables.
-1: Correlación negativa perfecta. A medida que una variable aumenta, la otra disminuye de manera predecible.
¿Cómo se calcula? La fórmula puede parecer intimidante, pero la idea es simple: compara la covarianza (cómo varían las variables juntas) con las desviaciones estándar (cuánto varían individualmente).
La fórmula general es: r = cov(X, Y) / (σX * σY), donde:
cov(X, Y) es la covarianza entre las variables X e Y.
σX es la desviación estándar de la variable X.
σY es la desviación estándar de la variable Y.
Ejemplo práctico: Imaginemos que queremos saber si existe una relación entre las horas de estudio de un grupo de estudiantes y sus calificaciones en un examen.
Coeficiente de Correlación de Pearson Ejercicios Resueltos
Paso 1: Recopilamos los datos. Por ejemplo:
Estudiante A: 5 horas de estudio, Calificación: 7
Cálculo del Coeficiente de Correlación de Pearson
Estudiante B: 3 horas de estudio, Calificación: 5
Estudiante C: 8 horas de estudio, Calificación: 9
Estudiante D: 2 horas de estudio, Calificación: 4
Coeficiente de correlación de Pearson - Probabilidad y Estadística
Estudiante E: 6 horas de estudio, Calificación: 8
Paso 2: Calculamos la covarianza entre las horas de estudio y las calificaciones. Esto requiere calcular las medias de ambas variables y luego usar una fórmula específica (más allá del alcance de este artículo, pero disponible en cualquier libro de estadística o en línea).
Correlación de Pearson: fórmula y cálculo explicado fácil
Paso 3: Calculamos la desviación estándar de las horas de estudio y la desviación estándar de las calificaciones. También se puede hacer manualmente o utilizando funciones estadísticas en una hoja de cálculo o software estadístico.
Paso 4: Aplicamos la fórmula del coeficiente de correlación de Pearson (r) utilizando los valores calculados en los pasos 2 y 3.
Interpretación: Supongamos que después de realizar los cálculos obtenemos un r = 0.9. Esto indica una fuerte correlación positiva. Cuanto más estudian los estudiantes, mayor tiende a ser su calificación. Es importante recordar que la correlación no implica causalidad. Que dos variables estén correlacionadas no significa que una cause la otra. Podría haber otros factores influyendo.