Professional Documents
Culture Documents
El coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables
aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de
la escala de medida de las variables.
Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el
valor de la otra variable.
El cálculo del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las
desviaciones estándar de ambas variables:
r = Sxy / Sx.Sy
Siendo:
Sx la covarianza de (X, Y)
Sx y Sy las desviaciones típicas de las distribuciones marginales.
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica una independencia total
entre las dos variables, es decir, que la variación de una de ellas puede influir en el valor que
pueda tomar la otra. Pudiendo haber relaciones no lineales entre dos variables. Estas pueden
calcularse con la razón de correlación.
Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre
las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo
hace en idéntica proporción.
Si 0›r≥1, existe una correlación positiva.
Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre
las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en
idéntica proporción.
Si -1≤ r›0, existe una correlación negativa.
Ejercicio:
Coeficiente de Curtosis
Analiza el grado de concentración que presentan los valores alrededor de la zona central de la
distribución.
g2 = 0 (distribución mesocúrtica).
g2 > 0 (distribución leptocúrtica).
g2 < 0 (distribución platicúrtica).
Ejercicio:
Vamos a calcular el Coeficiente de Curtosis de la serie de datos referidos a la estatura de un grupo de
alumnos (lección 2ª)
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Luego:
(1/30) * 0,00004967
g2 = ___________________________ -3 = -1,39
((1/30) * (0,03046667))^2
Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,39, lo que quiere decir que se trata de
una distribución platicúrtica, es decir, con una reducida concentración alrededor de los valores
centrales de la distribución.
A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la correlación entre dos
variables X e Y, medidas al menos en escala ordinal, es la siguiente:
Ejercicio:
Las observaciones de cada variable se deben ordenar en rangos, así como obtener las diferencias
entre los rangos, efectuar la sumatoria y elevar ésta al cuadrado.
Calculo de rs de Spearman.
El valor rs calculado se compara con los valores críticos de rs del coeficiente de correlación por rangos
de Spearman.
El valor crítico de rs con 7 grados de libertad, para una probabilidad de 0.05 del nivel de significancia
es 0.714, o sea, mayor que el calculado. Por lo tanto, éste tiene una probabilidad mayor que 0.05.
Decisión: Como el valor de probabilidad de rs de 0.69 es mayor que 0.05, se acepta Ho y se rechaza
Ha.
Interpretación: El coeficiente de correlación de Spearman de 0.69 es menor que los valores críticos de
la tabla, pues a éstos corresponde la probabilidad de obtener esa magnitud, al nivel de confianza de
0.05 y 0.01, para 0.714 y 0.893. Esto significa que para aceptar Ha, se requiere tener un valor igual o
más alto que 0.714. Por lo tanto se acepta Ho y se rechaza Ha, aun cuando, como se observa en la
siguiente figura, existe una asociación relativa entre la educación formal de la madre y el desarrollo
mental de sus hijos; sin embargo, ésta no es significativa.
Correlación de rangos.
Coeficiente de Kendall
El Coeficiente de Concordancia de Kendall (W), ofrece el valor que posibilita decidir el nivel de
concordancia entre los expertos. El valor de W oscila entre 0 y 1. El valor de 1 significa una
concordancia de acuerdos total y el valor de 0 un desacuerdo total. La tendencia a 1 es lo deseado
pudiéndose realizar nuevas rondas si en la primera no es alcanzada significación en la concordancia.
Donde:
No basta con saber si W está más próximo a 0 o 1 sino que además debemos saber si W es
significativamente distinta de 0 para rechazar la hipótesis de concordancia casual. Esta prueba sería
en principio una prueba de hipótesis.