You are on page 1of 6

CORRELACION Y COVARIANZA

El concepto de relacin en estadstica coincide con lo que se entiende por


relacin en el lenguaje habitual: dos variables estn relacionadas si varan
conjuntamente. Si los sujetos tienen valores, altos o bajos, simultneamente
en dos variables, tenemos una relacin positiva. Por ejemplo peso y altura en
una muestra de nios de 5 a 12 aos: los mayores en edad son tambin los
ms altos y pesan ms, y los ms jvenes son los que pesan menos y son ms
bajos de estatura; decimos que peso y altura son dos variables que estn
relacionadas porque los ms altos pesan ms y los ms bajos pesan menos.
Si los valores altos en una variable coinciden con valores bajos en otra
variable, tenemos una relacin negativa; por ejemplo edad y fuerza fsica en
una muestra de adultos de 30 a 80 aos de edad: los mayores en edad son los
menores en fuerza fsica; hay una relacin, que puede ser muy grande, pero
negativa: segn los sujetos aumentan en una variable (edad) disminuyen en la
otra (fuerza fsica). La correlacin se define por lo tanto por la co-variacin
(co
=
con,
juntamente:
variar
a
la
vez).
Correlacin y covarianza son trminos conceptualmente equivalentes,
expresan lo mismo. La covarianza es tambin una medida de relacin, lo
mismo que el coeficiente de correlacin. Habitualmente se utiliza el
coeficiente de correlacin (r de Pearson), pero es til entender
simultneamente qu es la covarianza, y entenderlo precisamente en este
contexto, el de las medidas de relacin.

COVARIANZA EN EXCEL
COVARIANZA.M
(funcin
COVARIANZA.M)
Devuelve la covarianza de la muestra, o promedio de los productos de las desviaciones para
cada pareja de puntos de datos en dos conjuntos de datos.

Sintaxis

COVARIANZA.M(matriz1;matriz2)
La sintaxis de la funcin COVARIANZA.M tiene los siguientes argumentos:
Matriz1 Obligatorio. El primer rango de celdas de nmeros enteros.
Matriz2

Obligatorio. El segundo rango de celdas de nmeros enteros.

Observaciones

Los argumentos deben ser nmeros o nombres, matrices o referencias que contengan
nmeros.

Si un argumento de matriz o referencia contiene texto, valores lgicos o celdas vacas,


esos valores se pasan por alto; sin embargo, se incluyen las celdas que tengan el valor cero.

Si los argumentos matriz1 y matriz2 tienen nmeros distintos de puntos de datos,


COVARIANZA.M devuelve el valor de error #N/A.

Si cualquiera de los argumentos matriz1 o matriz2 est vaco o si contienen solamente


un punto de datos cada uno, COVARIANZA.M devuelve el valor de error #DIV/0!.

COVARIANCE.P
COVARIANCE.P)

(funcin

Devuelve la covarianza de la poblacin, el promedio de los productos de las desviaciones para


cada pareja de puntos de datos en dos conjuntos de datos.
Utilice la covarianza para determinar las relaciones entre dos conjuntos de datos. Por ejemplo,
puede investigar si unos ingresos ms elevados se corresponden con niveles de estudios ms
altos.

Sintaxis

COVARIANCE.P(matriz1;matriz2)
La sintaxis de la funcin COVARIANCE.P tiene los siguientes argumentos:
Matriz1 Obligatorio. El primer rango de celdas de nmeros enteros.
Matriz2

Obligatorio. El segundo rango de celdas de nmeros enteros.

Observaciones

Los argumentos deben ser nmeros o nombres, matrices o referencias que contengan
nmeros.

Si el argumento matricial o de referencia contiene texto, valores lgicos o celdas


vacas, estos valores se pasan por alto; sin embargo, se incluirn las celdas con el valor cero.

Si los argumentos matriz1 y matriz2 tienen nmeros distintos de puntos de datos,


COVARIANCE.P devuelve el valor de error #N/A.

Si los argumentos matriz1 o matriz2 estn vacos, COVARIANCE.P devuelve el valor


de error #DIV/0!.

La covarianza es:

donde x e y son las medias de muestra PROMEDIO(matriz1) y PROMEDIO(matriz2) y n es el


tamao de la muestra.

DIFERENCIA ENTRE CORRELACION, COVARIANZA Y


VARIANZA:

La correlacin indica la fuerza y direccin de la asociacin entre dos


variables aleatorias en forma de relacin lineal. Dos variables cuantitativas
estn correlacionadas cuando los valores de una de ellas varan con respecto a
los valores de la otra
La covarianza es una medida de la variacin comn a dos variables y,
por tanto, una medida del grado y tipo de su relacin.
El anlisis de varianza sirve para comparar si los valores de un grupos
de datos son diferentes significativamente a los valores de otro u otros grupos
de datos.

COVARIANZA (Definicion):
Una medida del grado en que dos variables aleatorias se mueven en la misma
direccion o en direcciones opuestas la una respecto a la otra. En otras

palabras, si dos variables aleatorias generalmente se mueven en la misma


direccion se dir que tienen una covarianza positiva. Si tienden a moverse en
direcciones opuestas, se dir que tienen una covarianza negativa. La
covarianza se mide como el valor que se espera de los productos de las
desviaciones de dos variables aleatorias respecto a sus correspondientes
medias. Una varianza es un caso especial de covarianza.

FORMULAS:
La formula suele aparecer expresada como:

La expresin se resuelve promediando el producto de las puntuaciones


diferenciales por su tamao muestral (n pares de puntuaciones, n-1 en su
forma insesgada).
Dadas dos variables estadsticas x e y definiremos la covarianza Sxy como:

en el caso de disponer de la distribucin agregada por frecuencias en una


tabla de correlacin.

en el caso de disponer de la distribucin sin agregar por frecuencias (en un


listado matricial de datos donde cada registro es una observacin y n de
registros= N)

INTERPRETACION DE LA COVARIANZA:

Si Qxy > 0 hay dependencia directa (positiva), es decir a grandes


valores de X corresponden grandes valores de Y.
Si Qxy = 0 Una covarianza (0) se interpreta como la no existencia de
una relacion lineal entre las dos variables estudiadas.
Si Qxy < 0 hay dependenciainversa o negativa es decir, a grandes
valores de X corresponden pequeos valores de Y

PROPIEDADES:

La covarianza es el momento central de orden 1,1 de la distribucin


bidimensional.
Es invariante ante los cambios de origen en cualquiera de las dos
variables.
Sin embargo depende de los cambios de unidad .Si se cambia de unidad
de medida en ambas variables la covarianza se modifica proporcionalmente a
ambos cambios:
u= a+bx
v = c + dy
Suv = b.d.Sxy
La expresin de clculo de la covarianza es

donde a11 es el llamado momento ordinario mixto y su expresin es:

si las observaciones estn agregadas por frecuencias , o bien:

si las observaciones no estn agregadas por frecuencias

Si dos variables son independientes su covarianza es cero (el resultado


recproco no es necesariamente cierto).
La covarianza nos mide la covariacin conjunta de dos variables: Si es
positiva nos dar la informacin de que a valores altos de una de las variable
hay una mayor tendencia a encontrar valores altos de la otra variable y a
valores bajos de una de las variable ,correspondientemente valores bajos.En
cambio si la covarianza es negativa, la covariacin de ambas variables ser en
sentido inverso: a valores altos le correspondern bajos, y a valores bajos,
altos.Si la covarianza es cero no hay una covariacin clara en ninguno de los
dos sentidos.Sin embargo el hecho de que la covarianza dependa de las
medidas de las variables no permite establecer comparaciones entre unos
casos y otros.

EJEMPLOS:
1.- Cinco nios de 2, 3, 5, 7 y 8 aos de edad pesan, respectivamente, 14, 20,
32, 42 y 44 kilos.
Hallar la covarianza.

xi

yi

xi2

yi 2

xi yi

14

196

28

20

400

60

32

25

1 024

160

42

49

1 764

294

44

64

1 936

352

25

152

151

5 320

894

X= 25/5=5
Y=152/5=30.4
Qx2=151/5-52
Qy2=5320/2-30.42=139.84
Qxy=894/6-5*30*4=26.8
2.- Se ha solicitado a un grupo de 50 individuos informacin sobre el nmero
de horas que dedican diariamente a dormir y ver la televisin. La clasificacin
de las respuestas ha permitido elaborar la siente tabla:
N de horas dormidas (X)

6 7

10

N de horas de televisin (Y)

4 3

Frecuencias absolutas (fi)

3 16

20

10

Calcular la covarianza
xi

yi

fi

xi fi

xi2 fi

yi fi

yi2 fi

xi yi fi

18

108

12

48

72

16

112

784

48

144

336

20

160

1280

60

180

480

10

90

810

20

40

180

10

10

100

10

50

390

3082

141

413

1078

X=390/4=7.8
Y=141/50=2.82
Qx2=3082/50-7.82=0.8
Qy2=413/50-2.822=0.3076
Qx=0.8=0.89
Qy=0.3076=0.55
Qxy=1078/50-7*8*2*82=-0.436
3.- Calcula la covarianza de las variables estadsticas X, Y dadas por la tabla
de valores:
X 4 5 6 7 8 9 1
0
y 1 1 1 1 1 1 1
. . . . . . .
4 3 4 5 5 6 6

1
1
1
.
7

Debemos calcular las medias de X y de Y, y calcular los productos X iYi. Los


resultados que se obtienen son:

You might also like