Professional Documents
Culture Documents
Con frecuencia, nos encontramos en economa con modelos en los que el comportamiento de una variable, Y, se puede explicar a travs de una variable X; lo que representamos mediante Y = f (X) (1) Si consideramos que la relacin f, que liga Y con X, es lineal, entonces (1) se puede escribir as: t 1 2 t Y = + X (2) Como quiera que las relaciones del tipo anterior raramente son exactas, sino que ms bien son aproximaciones en las que se han omitido muchas variables de importancia secundaria, debemos incluir un trmino de perturbacin aleatoria , que refleja todos los factores distintos de X -que influyen sobre la variable endgena, pero que ninguno de ellos es relevante individualmente. Con ello, laCuando se quiere saber en qu medida estn relacionadas dos variables en estudio se utiliza el modelo de regresin lineal simple, expresado de la forma:
Y = 0 + 1X + Y: 0 y 1: X: :
Variable dependiente Parmetros del modelo Variable independiente Error del modelo
ECUACION DE REGRESION LINEAL SIMPLE Cuando tenemos varias distribuciones de datos con su propia media o valor esperado
E (Y) = 0 + 1X
La relacin lineal entre las dos variable puede ser: E(Y) Si 1 > 0 X E(Y) Si 1 < 0 X E(Y) Si 1 = 0 X No hay relacin Relacin lineal negativa Relacin lineal positiva
Ahora bien, cuando no se conocen los valores poblacionales se utiliza la ECUACION DE REGRESION LINEAL SIMPLE ESTIMADA:
y = b0 + b1x
Ejemplo: Suponemos una muestra de 10 restaurantes que presenta el nmero de clientes y las ventas trimestrales: Restaurant Clientes (miles) Ventas (miles BF) 1 2 58 2 6 105 3 8 88 4 8 118 5 12 117 6 16 137 7 20 157 8 20 169 9 22 149 10 26 202
DIAGRAMA DE DISPERSION: Se obtiene de graficar los valores de las variables, en este caso clientes (que ser X) contra ventas (Y)
Yi
250
200
150
100
50
0 0 5 10 15 20 25 30
Xi
Para predecir las ventas del restaurante se utilizar la recta de regresin lineal de la forma:
yi = b0 + b1xi yi : valor estimado de las ventas del restaurante b0 : interseccin de la recta con el eje Y b1 : pendiente de la recta xi : nmero de clientes por restaurant
CRITERIO DE LOS MINIMOS CUADRADOS Consiste en encontrar los valores de b0 y b1 que hacen mnima la suma de los cuadrados de las desviaciones entre los valores observados y los valores estimados de la misma variable. Se utilizan los datos muestrales. Entonces la notacin del criterio es: min(yi yi)2 yi : valores observados de la variable dependiente yi : valores estimados de la variable dependiente
)
-12 -8 -6 -6 -2 2 6 6 8 12 -72 -25 -42 -12 -13 7 27 39 19 72 864 200 252 72 26 14 162 234 152 864 2840 144 64 36 36 4 4 36 36 64 144 568
Luego:
yi = 60 + 5xi
250
200
50
0 0 5 10 15 20 25 30
La pendiente b1 es positiva lo que indica que la relacin lineal entre las dos variables, nmero de clientes y venta trimestral es directamente proporcional. Podemos predecir con la recta obtenida las ventas para cualquier nmero de clientes, por ejemplo, para un restaurant con 16.000 clientes las ventas sern de
yi = 60 + 5Xi
= 60 +5*16 = 60 + 80 = 140
Es decir, 140.000 Bs
SUMA DEL CUADRADO DE LOS ERRORES: SUMA DE CUADRADOS TOTAL: SUMA DE CUADRADOS DE LA REGRESION: Se demuestra que: SCT = SCR + SCE Para el ejemplo:
70 90 100 100 120 140 160 160 170 190 y- -12 15 -12 18 -3 -3 -3 9 -21 12 (yi - )2 144 225 144 324 9 9 9 81 441 144 1530
5184 625 1764 144 169 49 729 1521 361 5184 15730
3600 1600 900 900 100 100 900 900 1600 3600 14200
COEFICIENTE DE DETERMINACION:
* 100
Se expresa en forma de porcentaje, en el caso del ejemplo, r2 = 14200/15730 = 0.9027*100, se entiende que el 90.27 % de la variabilidad en las ventas es explicado por la relacin lineal entre los clientes y las ventas. COEFICIENTE DE CORRELACION MUESTRAL:
Si
tiende a 1 hay mayor correlacin positiva tiende a 1 hay mayor correlacin negativa tiende a 0 no hay correlacin
Para el ejemplo =+ = + 0.9051 Luego, como tiende a 1 se puede decir que hay fuerte correlacin positiva.
TABLA ANOVA. EL CONTRASTE DE REGRESIN. En este apartado se descompone la variabilidad de la variable respuesta en variabilidad explicada por el modelo ms variabilidad no explicada o residual, esto permitir contrastar si el modelo es significativo o no. Bajo la hiptesis de que existe una relacin lineal entre la variable prediccin y predictora, se quiere realizar el siguiente contraste de hiptesis,
frente a la alternativa
por tanto, si se acepta H0, la variable predictora no influye y no hay relacin lineal entre ambas variables. En caso contrario, si existe una dependencia lineal de la variable respuesta respecto a la predictora. Para todos los datos muestrales se hace la siguiente descomposicin
en base a la ortagonalidad de los vectores se obtiene que los productos cruzados son cero, de donde se sigue la siguiente igualdad (Teorema de Pitgoras) que permite descomponer la variabilidad de la variable respuesta en la variabilidad explicada por la recta de regresin
Global o Total
del Error
de la Regresin
Ahora se puede construir la siguiente tabla ANOVA Tabla ANOVA del modelo de regresin simple Fuente de Variacin ERROR REGRESION TOTAL Suma de Cuadrados SCE = SCR = SCT =
2
Varianzas
Para probar si la regresin efectuada es significativa se utilizan tres tipos de pruebas de significacin: Prueba t Intervalo de confianza para 1 Prueba F PRUEBA T: Se elabora el contraste para la no relacin entre las variables, es decir que la pendiente de la recta de regresin 1 es cero contra la pendiente diferente de cero. H0: 1 = 0 Ha: 1 0 Si se rechaza H0 es porque hay una relacin estadsticamente significativa entre las variables. El estadstico de prueba para este contraste es:
En donde
Criterios de rechazo: p-Valor: RECHAZO si p-valor Valor crtico: RECHAZO si t -t /2 RECHAZO si t t /2 INTERVALO DE CONFIANZA PARA 1 b1 ME ME= t /2 * sb1