You are on page 1of 7

Coeficiente de correlación de Karl Pearson

El coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables
aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de
la escala de medida de las variables.

Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el
valor de la otra variable.

El cálculo del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las
desviaciones estándar de ambas variables:

r = Sxy / Sx.Sy
Siendo:

Sx la covarianza de (X, Y)
Sx y Sy las desviaciones típicas de las distribuciones marginales.

El valor del índice de correlación varía en el intervalo [-1, + 1]:

 Si r = 0, no existe relación lineal. Pero esto no necesariamente implica una independencia total
entre las dos variables, es decir, que la variación de una de ellas puede influir en el valor que
pueda tomar la otra. Pudiendo haber relaciones no lineales entre dos variables. Estas pueden
calcularse con la razón de correlación.
 Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre
las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo
hace en idéntica proporción.
 Si 0›r≥1, existe una correlación positiva.
 Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre
las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en
idéntica proporción.
 Si -1≤ r›0, existe una correlación negativa.
Ejercicio:
Coeficiente de Curtosis
Analiza el grado de concentración que presentan los valores alrededor de la zona central de la
distribución.

Se definen 3 tipos de distribuciones según su grado de curtosis:

 Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores


centrales de la variable (el mismo que presenta una distribución normal).
 Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los
valores centrales de la variable.
 Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los
valores centrales de la variable.

El Coeficiente de Curtosis viene definido por la siguiente fórmula:

Los resultados pueden ser los siguientes:

 g2 = 0 (distribución mesocúrtica).
 g2 > 0 (distribución leptocúrtica).
 g2 < 0 (distribución platicúrtica).
Ejercicio:
Vamos a calcular el Coeficiente de Curtosis de la serie de datos referidos a la estatura de un grupo de
alumnos (lección 2ª)
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

Recordemos que la media de esta muestra es 1,253

S((xi - xm)^4)*ni S((xi - xm)^2)*ni


0,00004967 0,03046667

Luego:

(1/30) * 0,00004967
g2 = ___________________________ -3 = -1,39
((1/30) * (0,03046667))^2

Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,39, lo que quiere decir que se trata de
una distribución platicúrtica, es decir, con una reducida concentración alrededor de los valores
centrales de la distribución.

Coeficiente de correlación de Spearman

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson.


Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa
no correlación pero no independencia. La correlación estimada entre X e Y se halla calculando el
coeficiente de correlación de Pearson para el conjunto de rangos apareados. La correlación de
Spearman puede ser calculada con la fórmula de Pearson, si antes hemos transformado las
puntuaciones en rangos.

A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la correlación entre dos
variables X e Y, medidas al menos en escala ordinal, es la siguiente:

 P=0 No hay correlación


 p≠ 0 Hay correlación
Dónde:
rs = coeficiente de correlación de Spearman.
d2 = diferencias existentes entre los rangos de las dos variables, elevadas al
cuadrado.
N = tamaño de la muestra expresada en parejas de rangos de las variables.
S = sumatoria.

Ejercicio:

Desarrollo mental de algunos niños y escolaridad de las madres.

Las observaciones de cada variable se deben ordenar en rangos, así como obtener las diferencias
entre los rangos, efectuar la sumatoria y elevar ésta al cuadrado.

Educación de algunas madres y calificación de desarrollo mental de los hijos.

Calculo de rs de Spearman.

Calculo de los grados de libertad (gl).gl = número de parejas - 1 = 8 - 1 = 7

El valor rs calculado se compara con los valores críticos de rs del coeficiente de correlación por rangos
de Spearman.

El valor crítico de rs con 7 grados de libertad, para una probabilidad de 0.05 del nivel de significancia
es 0.714, o sea, mayor que el calculado. Por lo tanto, éste tiene una probabilidad mayor que 0.05.
Decisión: Como el valor de probabilidad de rs de 0.69 es mayor que 0.05, se acepta Ho y se rechaza
Ha.

Interpretación: El coeficiente de correlación de Spearman de 0.69 es menor que los valores críticos de
la tabla, pues a éstos corresponde la probabilidad de obtener esa magnitud, al nivel de confianza de
0.05 y 0.01, para 0.714 y 0.893. Esto significa que para aceptar Ha, se requiere tener un valor igual o
más alto que 0.714. Por lo tanto se acepta Ho y se rechaza Ha, aun cuando, como se observa en la
siguiente figura, existe una asociación relativa entre la educación formal de la madre y el desarrollo
mental de sus hijos; sin embargo, ésta no es significativa.

Correlación de rangos.

Coeficiente de Kendall

El Coeficiente de Concordancia de Kendall (W), ofrece el valor que posibilita decidir el nivel de
concordancia entre los expertos. El valor de W oscila entre 0 y 1. El valor de 1 significa una
concordancia de acuerdos total y el valor de 0 un desacuerdo total. La tendencia a 1 es lo deseado
pudiéndose realizar nuevas rondas si en la primera no es alcanzada significación en la concordancia.

Este coeficiente se calcula con el uso de la fórmula que muestran a continuación:

Donde:

w = coeficiente de concordancia de Kendall.


S = suma de los cuadrados de las diferencias observadas con respecto a un promedio.
N = Tamaño de la muestra en función del número de tripletes, tetrapletes, quintupletes, etc.
K = número de variables incluidas.
Li = sumatoria de las ligas o empates entre los rangos.

No basta con saber si W está más próximo a 0 o 1 sino que además debemos saber si W es
significativamente distinta de 0 para rechazar la hipótesis de concordancia casual. Esta prueba sería
en principio una prueba de hipótesis.

You might also like