Professional Documents
Culture Documents
Fuente:
Apunte de las profesoras Mara Paz Casanova ,Amer Rivas y
Mara Isabel Navarro, Material propio.
ORIGEN DEL CONCEPTO
REGRESIN
Objetivo:
Obtener la "mejor" funcin que relacione:
- la variable respuesta Y (dependiente)
- la(s) variable(s) predictora(s) X (independientes)
Modelacin
Prediccin
Funcin: Modelo de regresin ajustado.
Variable Coeficiente
respuesta
Predictora
Error
Yi 0 1 X i i
Yi 0 1 X i 2 X i i
2
Yi 0 1 X1i 2 ln X 2i 3 e X3 i
i
Estimado o Coeficiente
Predicho estimado
Predictora
Yi 0 1 X i
Yi 0 1 X i 2 X 2i
Yi 0 1 X1i 2 ln X 2i 3 e X 3 i
Error
Modelo de Regresin Lineal Yi 0 1 X i i
E( i )
0
E(Yi )
0 1 X i
Error i Yi E(Yi )
Modelo de Regresin Lineal X
Y i 0 1 i
Ajustado
Residuo e Y Y
i i i
Representacin Grfica del
Modelo de Regresin Lineal
Representacin Grfica de los
Residuos
Observado
Estimado
MNIMOS CUADRADOS
Yi a b Xi e i
Yi
i i i
e 2
i 1
(Y
i 1
)
Y 2
Modelo de Regresin
SIMPLE: Una Predictora Cuantitativa y Una
Respuesta Cuantitativa
Estimacin de coeficientes
Diagnstico
Covarianza muestral
n
n x y i i nxy
(x x)
(y
i y)
i
i 1
n -1 S x y n; -1 Sx y
1 i 1
n
n
2
S Sx x
i
(x
i j
x 2
) i
x 2
i 1
n x 2 x
n -1
0 y 1x
Varianza muestral
Intercepto: valor que asume la
respuesta Y cuando la predictora X
asume el valor 0.
2
1,..., N (0 , )
i .i .d.
n ~
(n - 2 )s2 2
2
~ (n - 2 )
CANTIDADES PIVOTALES O ESTADSTICOS DE PRUEBA
0 0 1 1
~ t n- 2 ~ t n- 2
1 x 2 s
s Sx x
n Sx x
INTERVALOS DE CONFIANZA
1 x 2 s
t 1 t n2 ,1 / 2
n 2 ,1 / 2s
0
n S S
x x xx
yi y i
yi y ( yi y ) ( yi yi )
Variacin Variacin Variacin
Total relacionada debida al
con el modelo error
yi y i
( y y ) ( y y ) ( y y )
i 1
i
2
i 1
i
2
i 1
i i
2
Distribuciones asociadas:
2
SCE 2 (n 2)s 2
2
~ n- 2 o 2
~ n- 2 ,
para cualquier 1.
Pero, bajo H0 : 1 0 :
SCT 2 SCR 2
2
~ n-1 y 2
~ 1.
Luego,bajo H0 : 1 0 :
SCR SCR
F ~ F1,n-2 .
SCE n - 2 CME
yi y i
CMR
CME
F F(1; n-2)
yi y i
CMR
CME
2SCR
R
SCT
Coincide con el cuadrado de la correlacin entre X e Y.
Yi = b0 + b1 X1i + + bP XPi + ei
Y1 = b0 + b1 X11 + + bP XP1 + e1
Y2 = b0 + b1 X12 + + bP XP2 + e2
:
Yn = b0 + b1 X1n + + bP XPn + en
El modelo de Regresin Lineal Mltiple tambin estima
los coeficientes mediante el mtodo de mnimos
cuadrados, es decir, minimizando la suma de los cuadrados
de los errores.
NORMALIDAD
DE LOS ERRORES
VARIANZA
CONSTANTE
INDEPENDENCIA
Y X , ~ N(0 , 2 I )
.
Y1 1 X11 X1p 0 1
Y , X , , .
Yn 1 X n1 X np p n
X X X t Y, Y
1
t X , e Y - Y.
2 2 ete Y t I- HY
s
, H X(X t X)
1
Xt.
n p 1 n p 1
n
SCT (Yi Y)
2
, SCE e t e, SCR SCT - SCE.
i 1
SCR
2 , CMR
CME .
p -1
yi y i
2
SCE 2 (n p 1)s 2
2
~ n-p -1 o 2
~ n-p -1,
para cualquier .
Pero, bajo H0 : 1 ... p 0 :
SCT 2 SCR 2
2
~ n-1 y 2
~ p.
Luego, bajo H0 : 1 ... p 0 :
SCR p CMR
F ~ Fp,n-p -1.
SCE n - p - 1 CME
yi y i
CMR
CME
F F(p; n-p-1)
yi y i
CMR
CME
F F(1; n-p-1)
Prueba alternativa a la F (ANOVA):
H0 : i 0.
T i
i ~ Tn - p - 1,
V ( ) s Cii
i
con Cii diagonal de X X t
1
.
yi y i
CMR
CME
2 SCR
R
SCT
Ya no coincide con el cuadrado de la correlacin entre
X e Y, pues hay p variables X pero coincide con la
correlacin entre Y e Y.