You are on page 1of 7

Ingeniería Comercial

Econometría I
COM – 05223

Práctica Nº 5

5.1 Con ayuda de los datos del archivo SLEEP75.WF1 se obtienela ecuación estimada
sleep = 3,840.83 - .163 totwrk - 11.71 educ- 8.70 age + .128 age2 + 87.75 male
(235.11) (.018) (5.86) (11.21) (.134) (34.33)
n = 706, R2= .123,2 = .117.
La variable sleep es la cantidad total de minutos, por semana, dormidos durante la noche,
totwrk es la cantidad total de minutos que se trabajó por semana, educ y age (edad)
están dadas en años y male (hombre) es una binaria para género.

i) Permaneciendo todo lo demás constante, ¿hay alguna evidencia de que los


hombres duerman más que las mujeres? ¿Qué tan fuerte es esa evidencia?
ii) ¿Hay un costo de oportunidad estadísticamente significativo entre trabajar y
dormir? ¿Cuáles el costo de oportunidad estimado?
iii) ¿Qué otra regresión necesita correr para probar la hipótesis nula de que,
manteniendotodos los demás factores constantes, la edad no afecta el
dormir?

5.2 Las ecuaciones siguientes se estimaron empleando los datos del archivo BWGHT.WF1:
log(bwght) = 4.66 - .0044 cigs + .0093 log( faminc) + .016 parity + .027 male + .055 white
(.22) (.0009) (.0059) (.006)(.010) (.013)
n = 1,388, R2= .0472
y
log(bwght) = 4.65 - .0052 cigs + .0110 log(faminc) + .017 parity
(.38) (.0010) (.0085) (.006)
+ .034 male + .045 white - .0030 motheduc+ .0032 fatheduc
(.011) (.015) (.0030) (.0026)
n = 1,191, R2= .0493.

Las variables se han definido como en el ejemplo 4.9, pero se ha agregado una variable
binariaque indica si el niño es varón (male) y que indica si el niño se clasifica como blanco
(white).
i) Interprete el coeficiente de la variable cigs en la primera ecuación. En
particular, ¿quéefecto tiene sobre el peso al nacer que la madre haya fumado
10 cigarros más por día?
ii) En la primera ecuación, permaneciendo todos los demás factores constantes,
¿cuánto más se predice que pese un niño blanco en comparación con uno no
blanco? ¿Es esta diferencia significativa?
iii) Analice el efecto estimado y la significancia estadística de motheduc.
iv) Con base en la información dada, ¿por qué no puede usted calcular el
estadístico F para lasignificancia conjunta de motheduc y fatheduc?
¿Quétendría que hacer para calcular esteestadístico F?
5.3 Con ayuda de los datos del archivo GPA2.WF1 se obtuvo la ecuación estimada
siguiente:
sat = 1,028.10 +19.30 hsize-2.19 hsize2-45.09 female -169.81 black +62.31 female*black
(6.29) (3.83) (.53) (4.29)(12.71) (18.15)
n = 4,137, R2= .0858.
La variable sat es la puntuación combinada en el examen de admisión (SAT), hsize es la
cantidad de alumnos, dada en cientos, que en la escuela del estudiante terminaron con el
bachillerato, female es una variable binaria para el género femenino y black es una
variable binaria para raza, que es igual a uno para negros y cero para los no negros.
i) ¿Existe alguna evidencia fuerte de que hsize2 deba ser incluida en el modelo?
Con base enesta ecuación, ¿cuál es el tamaño óptimo de una escuela?
ii) Manteniendo hsize constante, ¿cuál es la diferencia estimada en la puntuación
del SAT entremujeres no negras y hombres no negros? ¿Qué tan
estadísticamente significativa es esta diferencia?
iii) ¿Cuál es la diferencia estimada en la puntuación del SAT entre hombres no
negros y hombresnegros? Pruebe la hipótesis nula de que no hay diferencia
entre estas puntuacionescontra la alternativa de que si hay diferencia.
iv) ¿Cuál es la diferencia estimada en la puntuación del SAT entre mujeres negras
y mujeresno negras? ¿Qué se necesita hacer para probar si esta diferencia es
estadísticamente significativa?

5.4 Una ecuación que explica el sueldo de los presidentes de consejos de administración
es:
= 4.59 +.257 log(sales) +.011 roe +.158 finance +.181 consprod -.283 utility
(.30) (.032) (.004) (.089)(.085) (.099)
n = 209, R2= .357.
Los datos que se emplearon son los del archivo CEOSAL1.WF1, donde finance,
consprod yutility son variables binarias que corresponden a las industrias financiera,
de productos de consumoy de servicios. La industria que se ha omitido es la del
transporte.
i) Calcule la diferencia porcentual aproximada entre los sueldos estimados de las
industriasde servicios y de transporte, manteniendo sales y roe constantes. ¿Es
esta diferencia estadísticamentesignificativa al nivel de significancia de 1%?
ii) ¿Cuál es la diferencia porcentual aproximada entre los sueldos estimados de la
industriade productos de consumo y en el sector financiero? De una ecuación
que permita probarsi esta diferencia es estadísticamente significativa.

5.5Use el ejemplo 7.2 de Wooldridge. Sea noPC una variable binaria igual a uno si el
estudiante no posee una PC eigual a cero en caso contrario.
i) Si en la ecuación (7.6) se usa noPC en lugar de PC, .que pasa con el intercepto
de la ecuaciónestimada? ¿Cuál será el coeficiente de noPC? (Sugerencia:
escriba PC = 1 _ noPC ysustituya esto en la ecuación=0+0PC + 1hsGPA+ 2 ACT.).
ii) ¿Qué ocurre con la R-cuadrada si en lugar de PC se usa noPC?
iii) ¿Deben incluirse ambas, PC y noPC como variables independientes en el
modelo? Explique.
E J E R C I C I O S E N COM P U TADOR A
5.6 Para este ejercicio emplee los datos del archivo WAGE2.WF1.
i) Estime el modelo:
log(wage) =β0 +β1educ +β2exper +β3tenure +β4married +β5black +β6south
+β7urban + u
y de el resultado en la forma habitual. Manteniendo todos los demás factores
constantes, ¿cuál es la diferencia aproximada entre el salario mensual de
negros y no negros? ¿Es esta diferencia estadísticamente significativa?
ii) Agregue a esta ecuación las variables exper2 y tenure2 y muestre que no son
conjuntamente significativas al nivel de 20%.
iii) Amplíe el modelo original de manera que el rendimiento a la educación
dependa de la raza y pruebe si en realidad el rendimiento de la educación
depende de la raza.
iv) Partiendo nuevamente del modelo original, permita que los salarios difieran
entre cuatro grupos: casados negros, casados no negros, solteros negros y
solteros no negros. ¿Cuáles la diferencia de salario estimada entre negros
casados y no negros casados?

5.7 Para este ejercicio use la base de datos SLEEP75.WF1. La ecuación de interés es
sleep= β0+ β1totwrk + β2educ + β3age + β4age2+β5yngkid + u.
i) Estime esta ecuación por separado para hombres y mujeres y de los resultados
de la manera habitual. ¿Hay diferencias importantes entre las dos ecuaciones
estimadas?

La ecuación para mujeres:


Dependent Variable: SLEEP
Method: Least Squares
Date: 04/09/18 Time: 10:57
Sample: 1 306
Included observations: 306

Variable Coefficient Std. Error t-Statistic Prob.

C 4238.729 384.8923 11.01277 0.0000


TOTWRK -0.139950 0.027659 -5.059738 0.0000
EDUC -10.20514 9.588848 -1.064271 0.2881
AGE -30.35657 18.53091 -1.638159 0.1024
AGE*AGE 0.367941 0.223340 1.647447 0.1005
YNGKID -118.2826 93.18757 -1.269295 0.2053

R-squared 0.097678 Mean dependent var 3284.588


Adjusted R-squared 0.082639 S.D. dependent var 456.2504
S.E. of regression 436.9919 Akaike info criterion 15.01712
Sum squared resid 57288576 Schwarz criterion 15.09013
Log likelihood -2291.619 Hannan-Quinn criter. 15.04632

Para Hombres:

Dependent Variable: SLEEP


Method: Least Squares
Date: 04/09/18 Time: 11:03
Sample: 1 400
Included observations: 400
Variable Coefficient Std. Error t-Statistic Prob.

C 3648.208 310.0393 11.76692 0.0000


TOTWRK -0.182123 0.024486 -7.437990 0.0000
EDUC -13.05238 7.414218 -1.760453 0.0791
AGE 7.156591 14.32037 0.499749 0.6175
AGE*AGE -0.044767 0.168405 -0.265831 0.7905
YNGKID 60.38021 59.02278 1.022998 0.3069

R-squared 0.156228 Mean dependent var 3252.408


Adjusted R-squared 0.145520 S.D. dependent var 435.1998
S.E. of regression 402.2903 Akaike info criterion 14.84711
Sum squared resid 63763979 Schwarz criterion 14.90698
Log likelihood -2963.422 Hannan-Quinn criter. 14.87082
F-statistic 14.59014 Durbin-Watson stat 2.060775
Prob(F-statistic) 0.000000

Regresión para hombres y mujeres

Dependent Variable: SLEEP


Method: Least Squares
Date: 04/10/18 Time: 10:06
Sample: 1 706
Included observations: 706

Variable Coefficient Std. Error t-Statistic Prob.

C 3825.375 240.2585 15.92191 0.0000


TOTWRK -0.146046 0.016881 -8.651575 0.0000
EDUC -11.13772 5.890168 -1.890900 0.0591
AGE -8.123949 11.37049 -0.714477 0.4752
AGESQ 0.126287 0.135186 0.934172 0.3505
YNGKID 17.15441 50.00839 0.343031 0.7317

R-squared 0.114711 Mean dependent var 3266.356


Adjusted R-squared 0.108388 S.D. dependent var 444.4134
S.E. of regression 419.6384 Akaike info criterion 14.92513
Sum squared resid 1.23E+08 Schwarz criterion 14.96388
Log likelihood -5262.569 Hannan-Quinn criter. 14.94010
F-statistic 18.14051 Durbin-Watson stat 1.938666
Prob(F-statistic) 0.000000

ii) Realice la prueba de Chow para la igualdad entre los parámetros para hombres
y mujeres en la ecuación del sueño. Utilice la forma de la prueba en la que se
agrega male (hombre) y los términos de interacción male*totwrk, …,
male*yngkid y se usa el conjunto completode observaciones. ¿Cuáles son los
gdl pertinentes en esta prueba? ¿Debe rechazarse la hipótesis nula al nivel de
significancia de 5%?
iii) Ahora tome en consideración interceptos diferentes entre hombres y mujeres
y determine si los términos de interacción en los que parece male son
conjuntamente significativos.
iv) Dados los resultados de los incisos ii) y iii), ¿cuál es el modelo final?

5.8 Para este ejercicio emplee los datos del archivo 401KSUBS.WF1.
i) Calcule promedio, desviaciónestándar y los valores mínimo y máximo de
nettfa en lamuestra.
ii) Pruebe la hipótesis de que el nettfa promedio no difiere de acuerdo con la
elegibilidadpara un plan 401(k): emplee una alternativa de dos colas. ¿Cuál es
el monto en dólaresde la diferencia estimada?
iii) En un modelo de regresiónsimple, e401k no es exógeno: como mínimovaría de
acuerdo con el ingreso y con laedad. Estime un modelo de regresión lineal
múltiple para nettfa que como variables explicativasincluya ingreso, edad y
e401k. Las variables ingreso y edad deben apareceren forma cuadrática.
Ahora, ¿cuál es el efecto en dólares de la elegibilidad a un plan401(k)?
iv) Al modelo estimado en el inciso iii), agregue las interacciones e401k (age- 41)
ye401k (age- 41)2. Observe que en la muestra, la edad promedio es
aproximadamente41 años, de manera que en el nuevo modelo, el coeficiente
de e401k es el efecto estimadode la elegibilidad para el plan 401(k) a la edad
promedio. ¿Cuál de los términos deinteracción es significativo?
v) Compare las estimaciones de los incisos iii) y iv), ¿difieren mucho los efectos
estimadosde la elegibilidad para el plan 401(k) a la edad de 41 años? Explique.
vi) Ahora elimine del modelo los términos de interacción, pero defina cinco
variables binariaspara tamaño de la familia: fsize1, fsize2, fsize3, fsize4 y
fsize5. La variable fsize5 esuno para familias que tengan de cinco o más
miembros. Incluya las variables binarias deltamaño de familia al modelo
estimado en el inciso iii); no olvide elegir un grupo base.¿Las variables binarias
son significativas al nivel de 1%?.
vii) Ahora, realice una prueba Chow para el modelo
nettfa= β0+β1inc +β2inc2+β3age +β4age2+β5e401k + u
para las cinco categorías de tamaños de familias, considerando diferencias en
el intercepto.La suma restringida de residuales cuadrados, SSRr, se obtiene del
inciso vi) porque enesa regresión se supone que todas las pendientes son
iguales. La suma no restringida de residuales cuadrados es SSRur= SSR1+SSR2+
...+ SSR5, donde SSRf es la suma de residuales cuadrados para la ecuación
estimada usando solo el tamaño f de la familia.Debe convencerse de que en el
modelo no restringido hay 30 parámetros (5 interceptos más 25 pendientes) y
10 parámetros en el modelo restringido (5 interceptos más 5 pendientes).Por
tanto, la cantidad de restricciones que se prueban es q = 20, y los gdl para el
modelo no restringido son 9,275 - 30 = 9,245.

5.9 Para responder esta pregunta, utilice los datos del archivo APPLE.WF1.
i) Defina una variable binaria ecobuy= 1 si ecolbs > 0 y ecobuy= 0 si ecolbs= 0.
En otras palabras, ecobuy indica si, a los precios dados, una familia comprará
manzanas ecológicas. ¿Cuál es la proporción de familias que asegura que
comprará manzanas eco etiquetadas?
ii) Estime el modelo de probabilidad lineal:
ecobuy=β0 +β1ecoprc +β2regprc+β3faminc +β4hhsize+β5educ+β6age+ u,
y de los resultados de la manera habitual. Interprete cuidadosamente los
coeficientes delas variables de precio (ecoprc es el precio de las manzanas eco
etiquetadas y regprc el de las manzanas regulares).
iii) ¿Son conjuntamente significativas las variables que no corresponden a precios
en elMPL? (Emplee el estadístico F usual, aun cuando no sea válido cuando
existe heterocedasticidad.) ¿Cuál es la variable explicativa, además de las
variables relacionadas con el precio, que parece tener un efecto más
importante sobre la decisión de comprar manzanas ecológicas? ¿Le parece
que esto tiene sentido?
iv) En el modelo del inciso ii) sustituya faminc por log(faminc). ¿Qué modelo se
ajusta mejora los datos, el modelo con faminc o el modelo con log(faminc)?
Interprete el coeficiente de log(faminc).
v) En la estimación del inciso iv), ¿cuántas probabilidades estimadas son
negativas? ¿Cuántasson mayores a uno? ¿Debe preocuparle?
Algunas guías para Respuestas.
5.4i) estadístico t=-2.86, ii) =-24.7%, iii)la diferencia es 0.023. Una ecuación que podría ser
estimada para obtener el error estándar tiene como grupo base finance.
5.5i) 0= 1.26 y 0=.157. El coeficiente en noPC es -.157.
5.6 i) los hombres de raza negra ganan 18.8% menos. Ii) el estadístico F con 2 y 925 gdl es
1.49. iii) El coeficiente de la interacción es -.226. iv) escogemos soltero como el grupo
base y obtenemos una diferencia de -0.18 entre negros casados y no negros casados.
5.7ii) El estadístico F (con 6 y 694 gdl) es 2.12. iii) el estadístico F (5 y 694 gdl) es 1.26.
5.8 i) promedio es 19.072. ii) regresión entre nettfa sobre e401k: ek01k=18.858…. una
familia elegible para un plan 401(k) tiene $18,858 más de activos financieros netos. Iii)
una familia elegible para 401(k) tiene $9,705 más de riqueza que una familia no elegible.
Iv) el coeficiente de la interacción es .654. v) el efecto de e401k en iii) es el mismo para
todas las edades 9,705, el efecto en la parte iv) es 9,960 es el efecto sobre la edad
promedio (41). vi) tomando fsize1 como grupo base estimamos la ecuación y el F
estadístico es 5.44. vii) el SSR de vi) es 30,215,207.5. La SSR de ur es 29,985,400. El
estadístico de Chow es 3.54

5.9i) 0.624. ii) si ecoprc, incrementa en 10 ctvs (0.10) la probabilidad de comprar


manzanas eco etiquetadas cae por .080. iii)el Test F, con y 653 gdl es 4.43. iv) el modelo
con log(faminc) tiene un R cuadrado más alto en .112. v) el rango de probabilidades va de
0.185 a 1.051, existen dos probabilidades mayores a 1. Vi) usando la regla estándar de
predicción, se predice uno cuando i≥ .5 y cero en otro caso, nos otorga la fracción
predicha para ecobuy=0 como = .411. para ecobuy=1es del 82.5%
Para este ejercicio emplee los datos del archivo WAGE2.WF1.
Estime el modelo:
log(wage) =β0 +β1educ +β2exper +β3tenure +β4married +β5black +β6south
+β7urban + u
Permita que los salarios difieran entre cuatro grupos: casados negros, casados no negros,
solteros negros y solteros no negros. ¿Cuáles la diferencia de salario estimada entre
negros casados y no negros casados?

Dependent Variable: LWAGE


Method: Least Squares
Date: 04/23/18 Time: 10:46
Sample: 1 935
Included observations: 935

Variable Coefficient Std. Error t-Statistic Prob.

C 5.403793 0.114122 47.35093 0.0000


EDUC 0.065475 0.006253 10.47095 0.0000
EXPER 0.014146 0.003191 4.433118 0.0000
TENURE 0.011663 0.002458 4.744942 0.0000
SOUTH -0.091989 0.026321 -3.494880 0.0005
URBAN 0.184350 0.026978 6.833394 0.0000
BLACKSINGLE -0.240820 0.096023 -2.507944 0.0123
BLACKMARRIED 0.009448 0.056013 0.168682 0.8661
NONBLACKMARRIE
D 0.188915 0.042878 4.405892 0.0000

R-squared 0.252842 Mean dependent var 6.779004


Adjusted R-squared 0.246388 S.D. dependent var 0.421144
S.E. of regression 0.365599 Akaike info criterion 0.835018
Sum squared resid 123.7713 Schwarz criterion 0.881611
Log likelihood -381.3708 Hannan-Quinn criter. 0.852784
F-statistic 39.17047 Durbin-Watson stat 1.824148
Prob(F-statistic) 0.000000

ls log(wage) c educ exper tenure married black south urban black*married nonblack*married blacksingle
genr nonblack=@between(black,0,0.5)
genr single=@between(married,0,0.5)
ls lwage c educ exper tenure married black south urban blackmarried nonblackmarried blacksingle
genr nonblackmarried=nonblack*married
ls lwage c educ exper tenure south urban blacksingle blackmarried nonblackmarried

You might also like