Professional Documents
Culture Documents
1. INTRODUCCIN:
El estudio de las relaciones entre dos o ms variables se puede llevar a cabo desde dos
puntos de vista. Primero, a travs del estudio del grado de asociacin existente entre
las variables y segundo a travs del estudio de la relacin funcional existente entre las
variables. El primer caso es estudiado mediante el anlisis de correlacin mientras que
el segundo mediante el anlisis de regresin.
2. COEFICIENTE DE CORRELACIN:
En el caso de que se est estudiando dos variables aleatorias x e y sobre una poblacin
estadstica; el coeficiente de correlacin de Pearson se simboliza con la letra ,
siendo la expresin que nos permite calcularlo:
EN UNA POBLACIN :
N XY ( X )(Y )
N Y (Y ) N X ( X )
2 2 2 2
EN UNA MUESTRA:
n XY ( X )( Y )
r
n Y 2 ( Y ) 2 n X 2 ( X ) 2
El rango (intervalo de variacin) de r, es:
-1 < < 1
-1 0 1
Correlacin lineal No hay relacin Correlacin lineal
negativa lineal positiva
Escalas de correlacin
Los datos visualizan una relacin lineal positiva entre las variables X e Y
0
0 5 10 15 20
Ingresos familiares (Miles de US$)
Los datos visualizan una relacin lineal negativa entre las variables X e Y
25
Precio de carne (US$)
20
15
10
0
40 50 60 70 80 90 100
Millones de unidades producidas
20
15
Unidades
10
10 20 30 40
Pr ecios
10 .0 0
Ingreso
7.50
5.00
2.50
Se rvicio
1) Hiptesis estadsticas.
H0 : 0
H1 : 0
2. Estadstico de contraste.
n2
" t calculado" r
1 r2
3) Punto critico
4) Decisin
Si el valor de cae en la regin de rechazo, se rechaza 0 tenindose
una correlacin lineal. Si por el contrario el valor de cae en la regin
de aceptacin, se rechaza 0 y no hay correlacin lineal.
Ejemplo:
70
60
copiadoras vendiadas
50
40
30
10 15 20 25 30 35 40
llamadas
X2 Y2 xy
NUMERO DE NUMERO DE
LLAMADAS COPIADORAS
(X) VENDIDAS (Y)
20 30 400 900 600
40 60 1600 3600 2400
20 40 400 1600 800
30 60 900 3600 1800
10 30 100 900 300
10 40 100 1600 400
20 40 400 1600 800
20 50 400 2500 1000
20 30 400 900 600
30 70 900 4900 2100
10(10800)(220)(450)
= =0.759
[10(5600)(220)2 ][10(22100)(450)2 ]
H1 : 0
(2) Nivel de significacin: Sea = 0.05
(3) Prueba estadstica:
10 2
"t calculado" 0.759 3.2972
1 (0.759) 2
Definicin.- Relacin de dos variables a las cuales se ajusta a una lnea recta
Y = f(X)
Y = a+ bX
Donde:
Y = Variable dependiente
a = Constante, parmetro de posicin.
b = Pendiente de la recta, coeficiente de regresin
X = Variable independiente
e = Error aleatorio, el cual se supone que tiene media 0 y varianza constante 2.
a Constante o parmetro de posicin.
Es el valor promedio de la variable de respuesta Y cuando X es cero.
Si se tiene certeza de que la variable predictora X no puede asumir el
valor 0, entonces la interpretacin no tiene sentido.
b Coeficiente de regresin.
Es el cambio (incremento o disminucin segn el signo de b)
promedio en la variable de respuesta Y cuando X se incrementa en
una unidad.
Y
x
e3
x
e1
e2 x
e minimo
i 1
i , n = n de observaciones (tamao de la muestra)
n XY ( X )(Y )
b
n X 2 ( X ) 2
a Y bX
Donde:
a = Intercepto de la ecuacin de regresin con el eje Y
b = coeficiente de regresin.
Xi = valores de la variable independiente
Yi = valores de la variable dependiente
= Promedio de los valores de la variable independiente
= Promedio de los valores de la variable dependiente.
Y =a+bX
a: Es el valor promedio de la variable respuesta (y) cuando la variable
predictora (x) se mantiene constante.
El Coeficiente de Determinacin R2
Mtodo de calcularlo
Elevar al cuadrado el
coeficiente de correlacin
EJEMPLO ANTERIOR
S
SCE
Y 2
a Y b XY
n2 n2
EJERCICIO
Analizar la relacin entre la edad y el tiempo efectivo de servicio de los
trabajadores, para el efecto se consider una muestra de 15 trabajadores:
Edad 48 40 30 39 46 42 27 36 34 46 32 42 40 32 27
Tiempo 24 18 9 14 22 22 4 13 10 20 12 18 16 8 6
de
Servicio