Professional Documents
Culture Documents
Con el fin de ilustrar el uso de este instrumental en el desarrollo de una teoría económica a
continuación se presenta un caso. Hasta el momento hemos visto como se construye
matemáticamente la relación entre una variable dependiente (Y) y las independientes: X 1,
X2, en esta ocasión, aprovechando la exposición anterior, también aplicaremos la regresión
múltiple considerando el factor tiempo. Este factor es muy importante por que además de
que permite conocer el dinamismo del fenómeno bajo estudio (Y), permite predecirlo, es
decir, estimar su valor futuro.
La predicción es muy importante en economía por que permite visualizar, con cierta
seguridad, cual será el comportamiento de una variable (Y) en el futuro, en función de las
variables independientes: X1, X2 .
Con base en este enfoque a continuación se expone un ejercicio que permitirá ilustrar:
a) Como se prueba la teoría económica de que el consumo (Y) depende del ingreso
disponible (después de impuestos) (X1) y de la inflación (X2); de X1 en forma positiva y de
X2 en forma negativa.
b) Su comportamiento futuro
Así, para desarrollar el primer punto diremos que los datos en los últimos 10 años están
expresados en millones de pesos para Y, X1 y en porcentajes para X2 . De esta manera la
ecuación de regresión que servirá para probar la teoría económica quedará planteada de la
siguiente manera:
yˆ aˆ bˆX i cˆX 2 ui
donde:
y = Y calculada o estimada
ui expresa que no hay una relación exacta de Y con respecto a X1 “y” X2
por lo que ui es conocido como el complemento residual
Así, para encontrar y se requiere conocer los valores de a , b , c mismos que se determinan
con las tres ecuaciones normales siguientes:
Y na b X1 c X 2 .
YX
1 a X 1 b X 12 c X 1 X 2
YX
a X 2 b X 1 X 2 c X 22
2
cX
a Y bX 2
1
( b ) = b parámetro de la población
( c ) = c parámetro de la población
es el símbolo de la esperanza matemática.
En una regresión múltiple b , c son estimadores parciales de y .
Una vez establecidos tanto la teoría económica como la metodología para probarla, con los
datos que aparecen en la tabla 1, hacemos los siguientes cálculos para obtener a , b , c .
Tabla 1: Relación del consumo (Y) con el ingreso (X1) y la inflación (X2) (del año 1 al
10)
Años Y X1 X2 y x1 x2 yx1 x12 x22 x1 x2 x2 y
1 3 1 8 -3.1 -4.65 +0.9 14.415 21.623 0.81 -4.185 -2.79
2 2 2 15 -4.1 -3.65 +7.9 14.965 13.323 62.41 -28.835 -32.39
3 4 2.5 10 -2.1 -3.15 +2.9 6.615 9.923 8.41 -9.135 -6.09
4 5 3 9 -1.1 -2.65 +1.9 2.915 7.023 3.61 -5.035 -2.09
5 5 4 7 -1.1 -1.65 -0.1 1.815 2.723 0.01 +0.165 +0.11
6 7 5 6 +0.9 -0.65 -1.1 -0.585 0.423 1.21 +0.715 -0.99
7 6 7 8 -0.1 +1.35 +0.9 -0.135 1.823 0.81 +1.215 -0.09
8 8 8 4 +1.9 +2.35 -3.1 4.465 5.523 9.61 -7.285 -5.89
9 9 9 3 +2.9 +3.35 -4.1 9.715 11.223 16.81 -13.735 -11.89
10 12 15 1 +5.9 +9.35 -6.1 55.165 87.423 37.21 -57.035 -35.99
n=10 61 56.5 71 0 0 0 109.349 161.03 140.9 -123.15 -98.10
Nota: Y, X1,X2 son los valores originales, en tanto que y,x1 y x2 son minúsculas e indican las desviaciones
de los términos con respecto a sus medias respectivas.
Observamos que b = 0.4379 tiene signo positivo y c = -0.3152 tiene signo negativo. Estos
resultados confirman la teoría económica, motivo por el cual podemos continuar probando
la relación que tiene el consumo (Y) con el ingreso (X1) y la inflación (X2). Por
consiguiente, la ecuación de regresión múltiple es:
Dependent Variable: Y
Method: Least Squares
Sample: 1993 2002
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 5.800837 0.976443 5.940785 0.0006
X1 0.442193 0.076017 5.817014 0.0007
X2 -0.309751 0.081265 -3.811615 0.0066
R-squared 0.973305 Mean dependent var 6.100000
Adjusted R-squared 0.965678 S.D. dependent var 2.998148
S.E. of regression 0.555441 Akaike info criterion 1.905216
Sum squared resid 2.159601 Schwarz criterion 1.995991
Log likelihood -6.526078 F-statistic 127.6122
Durbin-Watson stat 2.464587 Prob(F-statistic) 0.000003
Ahora bien en virtud de que no hay una relación lineal exacta de Y con X1 y X2,
necesitamos calcular la relación residual que se expresa con ui; misma que no conocemos
porque pertenece al universo, razón por la cual es estimada mediante ei , cuyo
cuadrado ei2 , minimiza la suma de cuadrados de todos los residuos: ei2
Para obtener ei (donde (i) = 1,2,3... ...8,9,10), antes necesitamos determinar yi para cada
uno de los 10 años. Así:
Nota: estos resultados están ”redondeados”; la computadora ofrece más decimales; por ello las cifras
no coinciden exactamente con las que se obtienen al correr los datos en computadora
Continuación... ...Tabla 1:
Relación del consumo (Y) con el ingreso (X1) y la inflación (X2) (del año 1 al 10)
Años yi e =Y - yi e2 2
y
1 3.7800 -0.7800 0.6084 9.61
2 2.0115 -0.0115 0.0001 16.81
3 3.8065 0.1936 0.0375 4.41
4 4.3406 0.6594 0.4348 1.21
5 5.4089 -0.4089 0.1672 1.21
6 6.1620 0.8380 0.7022 0.81
7 6.4074 -0.4074 0.1660 0.01
8 8.1061 -0.1061 0.0113 3.61
9 8.8592 0.1408 0.0198 8.41
10 12.1170 -0.1170 0.0137 34.81
61.0000 0.0000* 2.1610 80.9
* Existen pequeñas diferencias debido a la magnitud de los decimales. La suma técnicamente da cero
Observe que la suma de yi 61 es la misma que Y = 61 y por ello la suma de
e 2
(Y yˆ ) 2
2.1610 en la forma que aparecen en las columnas correspondientes en
la continuación de la tabla 1.
2
e2 2.1610
Con estos valores podemos probar la significación estadística de los parámetros
poblacionales b, c, calculando primero las varianzas de los estimadores. Las fórmulas de las
varianzas son:
Var b 2u
x 2
2
x x
2
1
2
2 ( x1 x2 )2
x
2
Var c 2 1
x x ( x1 x2 )2
u 2 2
1 2
No se acostumbra calcular la varianza de a (pendiente al origen) por que no ayuda a probar
la teoría económica, ya que yi = a cuando X1 = 0; X2 = 0 puesto que lo que se desea es
probar las variaciones de yi en función de las variaciones de X1 , X2 .
Por otra parte, como 2u es desconocida por que es del universo, se estima con S 2 , como
una estimación insesgada, es decir, E (S2) = 2u .
Su formula es: S 2 2u
e 2
i
nk
donde:
n = número de términos (10 en este ejemplo)
k = número de parámetros estimados (3 en este ejemplo)
Con estas referencias, las estimaciones insesgadas de las varianzas de b , c tendrán las
siguientes fórmulas:
S Var ( b )
2 e 2
i x 2
2
; Sb Sb2
b
nk x x
2
1
2
2 ( x1 x 2 ) 2
e x
2 2
Var ( c ) ; S c S c2
2 i 1
S
x x ( x1 x 2 )
c
nk 2
1
2
2
2
S b2 , S c2 son los errores estándar de b , c con los que se pueden probar las hipótesis sobre b,
c, relativos a que hay o no hay relación de Y con respecto a X 1, X2, con la estadística t de
Student porque n 30 términos:
Para b: Para c:
Ho: b = 0 Ho: c = 0
Ha: b 0 Ha: c 0
b b c c
tb t c
Sb S c
Estas t`s “empíricas” u observadas se confrontan con las t`s ”teóricas” o de tablas. Estas
últimas se denotan con las literales t , donde = nivel de significación que junto con los
grados de libertad (n-k) determinan los puntos “críticos” donde se toma la decisión de
aceptar o rechazar Ho.
Así, para probar Ho primero calculamos S b2 , S c2 ; sustituyendo los valores de las tablas en
las fórmulas originales:
S Var (bˆ)
2 e 2
i x 2
2
2.1610 140.9
bˆ
nk x x
2
1
2
2 ( x1 x2 ) 2
10 3 (161.0250)(140.9) (123.15) 2
140.9 140.9
0.3087 0.3087(0.0187) 0.0058
22,688.4225 15,165.9225 7,522.5
también
e x
2 2
2.1610 161.0250
S 2
Var (cˆ) i 1
n k x x ( x1 x2 ) 10 3 (161.0250)(140.9) (123.15) 2
cˆ 2 2 2
1 2
161.03 161.03
0.3087 0.3087(0.0214) 0.0066
22,688.4225 15,165.9225 7,522.5
bˆ b 0.4379 0 cˆ c 0.3087 0
tb 5.7542 tcˆ 3.8017
Sbˆ 0.0761 Scˆ 0.0812
VIII.3 Determinación del Grado (o porcentaje) de la Relación que Existe entre Y y las
Variables Explicativas X1, X2
Para llevar a cabo la determinación del grado de la relación que existe entre la variable
dependiente o explicada y las variables independientes o explicativas primero se determina
el Coeficiente de Determinación Múltiple.
R2 1
e 2
i
1
2.1610
1 0.0267
y i
2
80.9
R 2 0.9733 o 97.33%
Interpretación: El ingreso y la inflación determinan el 97.33% de los cambios que
experimenta el consumo.
n 1 10 1
R 2 1 (1 R 2 ) 1 (1 0.9733)
nk 10 3
1 (1 0.9733)(1.2857)
1 (0.0267)(1.2857) 1 0.0343
R 2 0.9656
En este caso la hipótesis nula se prueba con F, estadística que se refiere al análisis de
varianza que es el cociente de dividir la varianza explicada entre la varianza no explicada.
Su formula es:
yi2 R2
( k 1) k 1
Fk 1,n k
ei2
(1 R )
2
(n k )
(n k )
donde:
(k-1) son los grados de libertad de la varianza explicada
(n-k) los grados de libertad de la varianza no explicada
(ya es conocido el significado de n y k)
Como en el caso anterior - cuando usamos t - se requiere encontrar en tablas la “F teórica”
con un cierto valor de para confrontarla con la “F empírica”. Así, primero calculamos la
F empírica:
0.9733
F2,7 2 0.4866 128.0526
1 0.9733 0.0038
7
Si decimos que = 1%, buscamos F en tablas con 2 grados de libertad para el numerador
(varianza explicada) y 7 grados de libertad para el denominador, vemos que F = 9.55.
Como F2,7 = 128.0526 F = 9.55 decimos que se acepta la hipótesis alternativa (se
rechaza la hipótesis nula) de que b y c, y R2 son significativamente diferentes de cero.
Lo anterior indica que a través de una sola estadística se confirma la hipótesis que hemos
venido desarrollando de que: Y = f(X1,X2).
Este coeficiente es útil por que mide la correlación neta entre la variable dependiente (Y) y
una variable independiente (sea X1 o X2) después de excluir la influencia que sobre ellas
ejerce la(s) otra(s) variable(s) independiente(s) en el modelo uniecuacional.
ry x1
yx1 109.35 109.35 109.35 0.959
x12 y 2 16103 . 80.9 ( 12.68 )( 8.99 ) 113.99
ry x2
yx 2
981.
981
.
981
.
0.919
x y
2
2
2
140.9 80.9 ( 1187
. )( 8.99 ) 106.71
rx1 x2
x x 1 2
12315
.
12315
.
12315
.
0.818
x x
2
2
2
1
140.9 16103
. ( 1187
. )( 12.68 ) 150.51
Sustituyendo:
ry x1 ry x2 rx1 , x2 (0.959) (0.919)(0.818)
ry x1 , x2
1 r 2
x1 , x 2 1 r 2
y x2
0.33 0.15
(0.959) (0.751) 0.208
(0.574)(0.387) 0.222
ry x1 , x2 0.936 o 93.6%
t a m b i én
ry x2 ry x1 rx1 , x2 (0.919) (0.959)(0.818)
ry x2 , x1
1 r 2
x1 , x 2 1 r 2
y x2
0.33 0.08
0.919 0.784 0.135
0.838
(0.574)(0.282) 0.161
Se dice que el ingreso (X1) es más importante explicando las variaciones del consumo (Y)
que la inflación (X2); obviamente en sentido inverso, como lo indica la teoría económica.
Con Wviews: Vamos a Quick/Group Statistics/Correlations/ aparece en pantalla “Series
List” y escibimos Y X1 X2/ ok aparecen coeficienten de correlación parcial name/Group
02/ok. Para graficar: Quick/graph/line graph/ series list: Y X1 X2/ok y aparece la gráfica.
calculado tablas
t1 = 5.817014 2.36
t2 = -3.811620 2.36
F = 124.7400 6.54
Por otra parte, si deseamos conocer gráfica y numéricamente las relaciones de Y con X1,
X2, se expresan así:
VIII.6 Predicción
Usando Eviews 5, suponga que se desea proyectar a los años 2011 y 2012, para ello se
requiere de los siguientes pasos:
1.- Nos colocamos en el Workfile (archivo) que muestra el RANGE y SAMPLE con datos
de 2001 a 2010 y por eso dice 10 obs. Necesitamos modificarlos haciendo clic en
RANGE y SAMPLE/ aparece “ workfile structure, ahí cambiamos el RANGE y el SMPL/
ahora escribimos en “Dated-regular frequency”: start date: 2001 y en end date:
2012/aparece la leyenda: “Resize involves inserting 2 observatios Continue?/yes. Aparece
la siguiente tabla con las dos observaciones adicionales:
2.- En la línea de comando se escribe: DATA X1 X2. Aparecerán las dos celdas en
blanco, mismas que hay que llenar con los datos de X1 y X2 para los años 11 y 12
respectivamente.
3. Regresamos a goup01 que muestra los 10 datos originales de Y,X1,X2 con las celdas de
los años 2011 y 2012 en blanco. Las llenamos escribiendo para el año 2011 para X1= 15.5,
X2= 1.3 y para el 2012: X1= 16, X2= 1.5
4.- Nuevamente vamos a workfile y localizamos el cuadro que contiene la ecuación de
regresión, mismo que contiene la ventana Forecast/clic/ por default aparecen y los
conservamos : a).- forecast name:yf; b).- forecast simple: 2001-2012; en output c).-
forecast graph y d).- forecast evaluation/ok/aparece la grafica con su “banda de confianza”(
para los 12 años) y las estadísticas que evalúan la predicción.
5.- Se regresa a workfile/show/ escribimos en la caja: y yf/ok/ aparecen las dos variables,
la primera con datos de 2001 a 2010 y la segunda ( la pronosticada) de 2001 a 2012.
Evaluación de la capacidad predictiva del modelo. Son cuatro las estadísticas que el programa
Eviews proporciona para evaluar dicha capacidad predictiva: 1.- La raíz del error cuadrático medio(
Root mean squared error); 2.- error absoluto medio( Mean absolute error); 3.- Error absoluto medio
del porcentaje de error( Mean absolute percent error) y 4.- el coeficiente de desigualdad de Theil(
Theil inequality coeficiente).Todos ellos aparecen a un lado de la gráfica que muestra yf con su
“banda de confianza” ( construida con yf mas y menos dos errores estándar) asociada. Mientras
más se acerque su valor a cero, mejor es la capacidad de predicción del modelo. En este sentido
vale decir que el valor del coeficiente de desigualdad de Theil oscila entre 0 y 1, por lo que
mientras más se acerque a 0, mejor será la predicciónrealizada con la ecuación de regresión.
VIII.7.1La Elasticidad Ingreso del Consumo: Mide el cambio porcentual en los niveles
del consumo como consecuencia de un cambio porcentual en el ingreso disponible
(después de impuestos). Es importante señalar que la elasticidad no es constante, es
decir, cambia en cada uno de los puntos de la función de regresión. Su cálculo puede
hacerse con la formula:
X 5.65
Eib b 1 0.44 0.44( 0.92 ) 0.40
Y 61
.
VIII.7.2 De manera similar se puede obtener la Elasticidad Precio de la Demanda Cuya
interpretación es similar a la elasticidad ingreso, pero ahora referida a los precios.
Como no hay datos, conceptualmente se mide con:
VIII.7.3 Con base en lo anterior podemos obtener la Elasticidad Inflación del Consumo
así:
X 7.1
Eic c 2 0.31 0.31( 116
. ) 0.36
Y 61
.
Curso de introducción a la econometría: Facultad de Economía de la UNAM
Dr. Genaro Sánchez Barajas : Tercer examen parcial.
Nombre del alumno………………………………………………………calif_______
Tema: Marco teórico de la expresión matemática de una teoría económica y de su verificación estadística.
I.-Conteste con una “X” en SI cuando la afirmación sea verdadera y también con una “X” en NO cuando la
afirmación sea falsa:
2.-Una variable dicotómica puede tomar más de dos valores: Si_____; No________
3.-Para predecir la variable dependiente es necesario que antes se conozcan los valores proyectados de las
variables explicativas en el tiempo: SI:_______; NO:___________
4.- Cuando se verifica la hipótesis de la relación entre la variable dependiente con las independientes, se
espera que idealmente el valor del coeficientes de correlación múltiple no sea semejante a los valores de los
coeficientes de correlación parcial: SI:__; NO__.
5.- Cuando se verifica con la estadística F que las variables independientes si explican a la variable
dependiente, teóricamente se debe de verificar con la prueba t de Student que cada una de las variables
independientes también explican a la dependiente: SI___; NO____.
6.- Al correr la regresión, cuando los signos de los coeficientes obtenidos de las variables regresoras no
coinciden con la concepción teórica de su relación con la variable regresada, se debe cambiar de variable
regresora: SI____; NO______:
7.- Al probar una hipótesis nula con la t de Student, si la t real o calculada es mayor que la t teórica o de
tablas, se acepta dicha hipótesis nula: SI____;NO_____.
8.- Cuando F real o calculada es menor que F teórica o de tablas rechazamos la hipótesis nula: SI_____;
NO____.
:
9.- en una regresión múltiple si al probar una hipótesis nula con ciertos grados de libertad y nivel de
significación, cuando los valores de t no son estadísticamente significativos pero F si lo es, se dice que
posiblemente se violó algún de los supuestos del modelo de estimación: SI____; NO______.
10.-Conocido el valor del coeficiente de la variable explicativa X, su media aritmética como la de la variable
Y
explicada Y, la elasticidad se calcula as E bˆ : SI__;NO___.
X
Observaciones: Cada una de las respuestas correctas vale 10 puntos en escala de 0 a 100. No se puede usar la
calculadora, ni las tablas estadísticas ni la bibliografía correspondiente a cada tema.