Professional Documents
Culture Documents
ANLISIS DE REGRESIN Y
CORRELACIN
Bioestadstica
Licenciatura en Saneamiento y Proteccin Ambiental
Facultad de Ciencias del Ambiente y la Salud
Profesora: Mg. Andrea Lavalle
T (t ) = C e k t + Ta
Modelo de crecimiento sigmoidal:
P(t ) =
K
1 + e t
01/10/2015
Ejemplos:
Calificacin promedio en el secundario / Calificacin
promedio universidad
Edad de los rboles / Altura
Edad de un nio / Cantidad de palabras que conoce
3
x1
y1
x2
y2
xn
yn
Diagrama de dispersin o
nube de puntos
01/10/2015
Covarianza:
n
(x
Poblacional:
xy =
X ).( y i Y )
i =1
n
n
( x i x ).(y i y )
Muestral:
i =1
S xy =
x i .y i
=
n1
x y
i =1
i =1
i =1
n 1
5
Signo de la Covariancia
( x x ).( y y )
i
S xy =
n 1
(x
i =1
x )> 0
(y
y ) > 0
(y
y )< 0
(x
x )< 0
6
01/10/2015
xy
xy =
x y
Muestral:
rxy =
S xy
Sx Sy
2
=
2
SPxy
SC x SC y
xi
x i yi
i =1
i =1
n
xi
n
2
x i =1
n
i =1
i =1
n
yi
n
2
y i =1
n
i =1
H0: = 0
H0: 0
r
t (n 2)
sr
S2r =
1 r
n-2
01/10/2015
ANLISIS DE REGRESIN
Anlisis de Regresin
Es la parte de la estadstica que se ocupa de investigar y modelar la
relacin entre dos o ms variables relacionadas de una manera no
determinstica.
10
01/10/2015
Ejemplo:
3,50
Y: altura
2,5
2,8
3
2,7
2,8
3,2
2,8
2,9
3
3,00
Altura
X: edad
10
10
10
11
11
11
12
12
12
2,50
2,00
9,5
10,0
10,5
11,0
11,5
12,0
12,5
Edad
Diagrama de dispersin o
nube de puntos
Variable dependiente o de respuesta. Es Aleatoria
11
3,50
Altura
3,00
Relacin
Lineal?
2,50
2,00
9,5
10,0
10,5
11,0
11,5
12,0
12,5
Edad
Modelo determinstico: Y = o + 1 X
NO es adecuado
Componente aleatoria
Componente sistemtica
(comportamiento promedio)
12
01/10/2015
Yi = 0 + 1 X i + i
donde
13
n
i
2
1
x1
14
x2
........
xi
...........
xn
01/10/2015
ei 2 =
(y y )
i
i =1
i =1
(xn,yn)
en
(x1,y1)
y^n
e1
e2
(x2,y2)
15
x1 x2
xn
yi = 0 + 1 xi + i
y i = b0 + b1 xi
Modelo Muestral:
donde b0 = 0
2
2
2
ei = ( yi y i ) = ( yi b0 b1 xi )
i =1
b1 = 1
i =1
= (b0 , b1 )
i =1
n
(b 0 , b1 )
=
b0
2(y
(b 0 , b 1 )
=
b1
2 (y
x
i =1
+ b1 .
i =1
b 0 b 1 x i )( x i ) = 0
xi =
Ecuaciones
i =1
n
i
i=1
i =1
b0 .
b 0 b 1 x i )( 1 ) = 0
b0 .n + b1 .
i =1
Normales
n
2
i
x .y
i
16
i
i =1
01/10/2015
b1 =
xi
x i .y i
i =1
i =1
SPxy
i =1
i =1
x i
x i 2 i =1
n
SCx
b0 = y b1.x
17
44,45
36,48
Efectividad
X: Temp
30
30
30
50
50
50
70
70
70
90
90
90
28,50
20,53
12,55
27,00
43,50
60,00
Temperatura
76,50
93,00
18
01/10/2015
X: Temp Y: Efect.
30
38
30
43
30
29
50
32
50
26
50
33
70
19
70
27
70
23
90
14
90
19
90
21
720
324
X2
900
900
900
2.500
2.500
2.500
4.900
4.900
4.900
8.100
8.100
8.100
49.200
Y2
1.444
1.849
841
1.024
676
1.089
361
729
529
196
361
441
9.540
XY
1.140
1.290
870
1.600
1.300
1.650
1.330
1.890
1.610
1.260
1.710
1.890
17.540
b1 = -0,3166
bo = 46
y = 46 0,3166 x
19
44,45
PRED_Efectividad
36,48
28,50
20,53
12,55
27,00
43,50
60,00
76,50
93,00
Temperatura
y = 46 0,3166 x
20
10
01/10/2015
e2 = Se2 =
i =1
n2
i =1
n 2
SCy b1 Sxy
n2
Se =
Frmula de clculo:
Valores
predichos o
ajustados
(y y )
ei 2
21
Coeficiente de Determinacin
yi
No EXPL
DT
EXPL
xi
y i y = ( y i y i ) + ( y i y )
n
(y
i =1
y )2 =
(y
i =1
y i ) 2 +
(y
y )2
i =1
22
11
01/10/2015
SC regresin
SC error
R =
=1
SC Total
SC Total
2
Frmula de
clculo:
R2 =
Es la proporcin de la
variabilidad total explicada
por la regresin
b12 SCx
SCy
R2 Ajustado:
R 2 aj = 1
CM error
CM Total
23
Inferencia en Regresin
Para poder realizar inferencia es necesario verificar los supuestos del
modelo de Regresin. Se realizar la verificacin en forma grfica.
Cuantiles observados
29,45
19,22
9,00
-1,22
-11,45
-11,45
-1,22
9,00
19,22
24
29,45
12
01/10/2015
Independencia - Homocedasticidad
Grfico de Residuales vs. Predichos
25
Inferencia sobre 0 y 1
La ordenada al origen 0 no siempre es de inters en la
investigacin. Antes de realizar inferencia sobre este parmetro es
necesario analizar si tiene sentido el valor X=0.
distribucin en el muestreo.
13
01/10/2015
Inferencia sobre 1
t=
b1 1
t n 2
Sb1
Sb1 =
Se
SCx
Inferencia sobre 0
t=
b0 0
t n 2
Sb0
Sb0 = Se
1 x
+
n SCx
27
E ( y ) = y / xo = 0 + 1 x 0
1 (x x )
V ( y ) = y2 / xo = 2 + 0
SCx
n
1 (x x )
S y2 / xo = S e2 + 0
SCx
n
y ( 0 + 1 x 0 )
t n 2
S y / xo
y0 -t n-2 ;2 . Se .
1 (x 0 x ) 2
1 (x x )2
+
< E(y/x 0 ) < y0 + t n-2 ;2 . Se . + 0
n
SC x
n
SC x
28
14
01/10/2015
1 (x x )2
1 (x x)2
y 0 - tn-2;/2 . S e . 1 + + 0
< y 0 < y 0 + tn-2;/2 . S e . 1 + + 0
n
SC x
n
SC x
29
30
15
01/10/2015
31
32
16
01/10/2015
TENER EN CUENTA:
1. Estimar los parmetros en el modelo transformado y luego volver a
transformar para obtener estimaciones de los parmetros originales no
es equivalente a usar Mnimos Cuadrados en el modelo original
2. Si se realiz una transformacin en Y, y se desea realizar Intervalos de
Confianza o Pruebas de Hiptesis, se debe considerar que los errores
del modelo transformado tengan una distribucin aproximadamente
normal.
3. Un IC para la media de Y se puede obtener transformando el intervalo
siempre que la varianza poblacional sea pequea.
4. Cuando se transforma Y, el coeficiente r2 se refiere a la variabilidad de
las y transformadas que est explicada por el modelo transformado.
5. Para evaluar el ajuste se sugiere calcular los predichos en el modelo
transformado, volver a la escala original y graficarlos versus los
valores observados.
6. Si el modelo es intrnsecamente no lineal se usan mtodos iterativos.
33
( y i y ) 2 = ( y i y i ) 2 + ( y i y ) 2
i =1
i =1
i =1
(n
1)
(n
Cuadrados medios:
34
17
01/10/2015
F=
SCreg / 1
CMreg
=
F1,n2
SCerror / n 2 CMerror
Grados de
libertad
Cuadrados
medios
Fo
Regresin
SCreg
SCreg/1
CMreg/
CMError
Error
SCError
(n 2)
SCError/(n 2)
Total
SCTotal
(n 1)
p-value
35
36
18
01/10/2015
Supuestos:
Xi no son aleatorias
N(0, )
2 es constante para todo
37
Modelo Muestral:
y i = b0 + b1 x1 + b2 x 2 + ... + b p x p
donde b0 = 0
b1 = 1
b p = p
Estimacin de parmetros:
El mtodo de mnimos cuadrados busca minimizar la suma de los cuadrados
de los desvos de las observaciones respecto del modelo estimado.
38
19
01/10/2015
Inferencia:
Prueba F general para efecto regresin
H0: 1 = 2 = ...... = p = 0
H1: j 0
Nmero de
variables
H1: j 0
Fuentes de
variacin
Sumas de
cuadrados
Grados de
libertad
Cuadrados medios
Fo
Regresin
SCreg
SCreg/p
CMreg/
CMError
Error
SCError
(n p 1)
SCError/(n p 1)
Total
SCTotal
(n 1)
pvalue
39
Seleccin de variables
CMerror =
SCerror
n p 1
40
20
01/10/2015
21