You are on page 1of 34

UNIVERSIDAD NACIONAL DE PIURA FACULTAD DE ECONOMA

ESTIMACION DEL MODELO DE VARIABLE DEPENDIENTE BINARIA EMPLEO PARA LIMA METROPOLITANA: trimestre febrero-marzo-abril 2010

PROFESOR:

CURSO:

ALUMNA:

CUSCO-PER

12 DE septiembre DE 2011.

TITULO: UN MODELO ECONOMETRICO PARA EL EMPLEO EN EL DEPARTAMENTO DE LIMA METROPOLITANA PERIODO 2010

INTRODUCCIN

Principalmente las polticas econmicas estn basadas tanto en aspectos tericos como en la evidencia emprica relacionada con el rea en la cual se est actuando. La teora econmica aporta las relaciones entre las variables y los principios bsicos que explican tanto su comportamiento, como el posible tipo de funcin matemtica que las entrelaza. Por su parte, la evidencia emprica muestra la relacin que existe en el mundo real entre las variables estudiadas con respecto a un fenmeno econmico determinado.

La econometra es aquella ciencia que se encarga de darnos los mtodos necesarios para comunicar ambos mundos, el terico y el real, mediante bases tericas y procedimientos que facilitan la formulacin y estimacin de modelos econmicos para de esta manera explicar el comportamiento de la variable en estudio durante un perodo en referencia, asimismo nos permite hacer inferencia y pronostico de la misma con base en las variables independientes seleccionadas en el modelo. Todo este proceso contemplado en la econometra, nos permite la utilizacin del modelo siendo el sustento terico-prctico para formular polticas relacionadas con el fenmeno en estudio.

El fin de este trabajo es formular un modelo economtrico que muestre una importancia que tiene el empleo en el Per (Departamento de Lima) y logre explicar su comportamiento satisfactoriamente. La formulacin del modelo est basada en la Teora Econmica, conjuntamente con la evidencia emprica obtenida a travs de la Encuesta Nacional de Hogares ENAHO 2010.

MARCO TEORICO
CAPITULO 1: MARCO TERICO

1.1.

MARCO REFERENCIAL

POBREZA:

Siguiendo el modelo propuesto por RAVALLION (1998), donde un hogar cuyas preferencias se pueden representar por la siguiente funcin de utilidad u = u (q, x), la de gasto del consumidor es e = e (p, x, u), que se interpreta como el costo mnimo de un nivel de utilidad u para un hogar con caractersticas x cuando se enfrenta a un vector de precios p, y q representa las canastas de bienes que consume el hogar; e = e (p, x, u) cuando se evala en el nivel de utilidad real, se corresponde al gasto total real en consumo y = p*q, para un hogar que aumenta su utilidad. Si tomamos a uz como nivel de utilidad de referencia necesario para escapar de la pobreza, la lnea de sta sera igual a: z = e (p, x, uz).

La lnea de pobreza es el costo del nivel mnimo de utilidad para escapar de la pobreza a los precios corrientes y dadas las caractersticas personales del hogar. Esta ecuacin relaciona cmo ir de la pobreza en trminos de utilidad a la pobreza en trminos de dinero, pero no cmo definir el nivel de utilidad de la pobreza.

Podemos decir que un individuo no se encontrara en situacin de pobreza si posee un nivel de ingresos suficiente para cubrir una canasta de bienes bsica; esto se logra teniendo ingresos fijos provenientes de un empleo. De esta forma diremos que una persona que trabaja tiene altas posibilidades de no ser pobre.

DESEMPLEO:

Desempleo, paro forzoso o desocupacin de los asalariados que pueden y quieren trabajar pero no encuentran un puesto de trabajo. En las sociedades en 4

las que la mayora de la poblacin vive de trabajar para los dems, el no poder encontrar un trabajo es un grave problema. Debido a los costes humanos derivados de la privacin y del sentimiento de rechazo y de fracaso personal, la cuanta del desempleo se utiliza habitualmente como una medida del bienestar de los trabajadores. La proporcin de trabajadores desempleados tambin muestra si se estn aprovechando adecuadamente los recursos humanos del pas y sirve como ndice de la actividad econmica.

Polticas de Empleo La intervencin del Estado para fomentar el empleo topa con grandes dificultades. Las polticas expansivas pueden producir desagradables efectos secundarios, provocando inestabilidad monetaria y otros desequilibrios. Si lo que se busca es una oferta de empleo bien remunerado, sostenida a largo plazo, habr que actuar de forma muy cuidadosa para que no sea peor el remedio que la enfermedad. El aumento de la demanda de trabajadores puede conseguirse con medidas fiscales que reduzcan los costes salariales para las empresas, bien reduciendo las contribuciones obligatorias a la Seguridad Social (que tendran que ser substituidas por otros ingresos del Estado), bien subvencionando la

contratacin de trabajadores que por alguna circunstancia sean menos eficientes, minusvlidos, jvenes en su primer empleo, etc. La flexibilizacin de los empleos, autorizando contratos temporales y facilitando los despidos, supone de hecho abaratar los costes laborales de las empresas aunque acosta de la precarizacin del empleo. Finalmente siguen siendo muchos los partidarios de las tradicionales medidas keynesianas de aumentar la demanda agregada mediante el aumento del gasto pblico, bien mediante contratacin directa por el Estado-patrn, bien mediante la realizacin de obras o inversiones pblicas. A pesar de las argumentaciones de Friedman, los programas y gobiernos socialdemcratas siguen siendo partidarios de polticas activas de creacin de empleo especialmente en pases con tasas altas de paro.

1.2.

EVIDENCIA EMPRICA:

GALDO, JARAMILLO Y MONTALVA (2009) evalan el impacto de PROJOVEN a lo largo de la distribucin de los ingresos laborales; se concluye que el diseo de PROJOVEN no constituye solamente un mecanismo efectivo para mejorar la productividad de jvenes econmicamente desfavorecidos, sino que tambin mejora la equidad entre los grupos de diversos niveles de pobreza. Adems descubri que los impactos en ingresos como en el empleo son mayores para mujeres que para hombres, es decir PROJOVEN ayuda a reducir las brechas de gnero en el mercado laboral. Adems la intervencin en capacitacin que realiza PROJOVEN parece adecuada para producir cambios en las ganancias pero no parece funcionar del mismo modo para el empleo.

ISGUT (2002) realiza un estudio para determinar la relacin entre el empleo no agrcola y los ingresos de los individuos en Honduras, este trabajo concluye que los aos de escolaridad estn positivamente asociados a la participacin en el empleo no agrcola asalariado, y negativamente asociados a la participacin en el empleo agrcola asalariado. Esta actividad es ms comn entre los trabajadores ms jvenes, mientras que es menos probable que los jefes de familia o sus esposas sean asalariados agrcolas. Los promedios de escolaridad de los adultos en el hogar del trabajador, estn positivamente asociados a las ganancias del trabajador, esto indica que a mayor escolaridad de las familias, mayor es su capacidad de obtener informacin sobre buenas oportunidades de trabajo.

CONSTRUCCIN DE UN MODELO DE VARIABLE DEPENDIENTE BINARIA:

SECTOR: EMPLEO

Encuesta Permanente del Empleo (EPE): La EPE es una encuesta realizada por el INEI, la cual permite muestra indicadores de empleo e ingreso en el rea Metropolitana de Lima y Callao, para el seguimiento y anlisis del mercado laboral, permite desarrollar indicadores anticipatorios de la evolucin del empleo, sirve como fuente de informacin para futuras investigaciones tanto para entidades pblicas como privadas. Este tipo de encuesta tiene carcter mvil, pues sus resultados son publicados trimestralmente, para el caso de esta investigacin se tomo el I trimestre del ao 2010, y solo se cogi los datos del mes de marzo. Ao: 2010. - Marzo Departamento: Lima Metropolitana

1. ESPECIFICACIN DEL MODELO

1.1 Ecuacin Funcional Ocu= f (sexo, edad, nivestu, negocio, hrastrab, pago, buscotra, trabantes, ingreso) 1.1.1 Definicin de variables del modelo: a) Variable dependiente cualitativa dicotmica Ocu (Ocu200)= Se encuentra ocupado o empleado en algo actualmente 1= Se encuentra ocupado o empleado 0= No se encuentra ocupado o empleado

b) Variables explicativas del modelo: 1. Sexo: 1=Hombre 0=Mujer

2. Edad: Qu edad tiene en aos cumplidos? 3. Nivestu: Nivel de Estudios 1=Superior (tcnica o universitaria) 0=No superior 4. Negocio: Tiene algn negocio propio? 1=Si 0=No 5. Hrastrab: Total de horas que trabaja 6. Pago: En su ocupacin principal a usted le pagan? 1=Si 0=No 7. Buscotra: Ha hecho algo para conseguir trabajo? 1=Si 0=No 8. Trabantes: Ha trabajado antes

1=Si 0=NO 9. Ingreso: Ingreso total mensual

1.2 FUNCIN ECONOMETRICA Occupation= 0 + 1 sexo i + 2 edadi + 3nivestu i + 4 negocio i + 5 hrastrab i + 6 pagoi + 7 buscotra i + 8 trabantes i + 9 ingreso+ Ut i

Loa signos esperados de los parmetros son:

0:

Parmetro Autnomo 8

1 ><0: El grado de sensibilidad de la variable dependiente respecto sexo se espera que sea positivo. 2 <0: El grado de sensibilidad de la variable dependiente respecto a la edad se espera que sea positivo o negativo. 3 >0: El grado de sensibilidad de la variable dependiente respecto al nivestu se espera que sea positivo. 4 >0: El grado de sensibilidad de la variable dependiente respecto al negocio se espera que sea positivo. 5 >0: El grado de sensibilidad de la variable dependiente respecto a hrastrab se espera sea de signo positivo. 6 >0: El grado de sensibilidad de la variable dependiente respecto al pago se espera que sea de signo negativo. 7 >0: El grado de sensibilidad de la variable dependiente respecto a bucotra se espera que sea de signo positivo. 8 >0: El grado de sensibilidad de la variable dependiente respecto a trabantes se espera que sea de signo positivo. 9 >0: El grado de sensibilidad de la variable dependiente respecto al ingresos se espera que sea de signo positivo.

ELABORACIN DEL MODELO LOGIT Ocupacion= 0 + 1 sexo i + 2 edadi + 3nivestu i + 4 negocio i + 5 hrastrab i + 6 pagoi + 7 buscotra i + 8 trabantes i + 9 ingreso+ Ut i

1. REGRESIONES BIVARIANTES:

Rango: 1 3910 Simple: 1 3600

Yi=f(xi)

ML1: LS OCUPACION C SEXO

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 10:08 Sample (adjusted): 2 3909 Included observations: 2977 after adjustments Convergence achieved after 3 iterations Covariance matrix computed using second derivatives Variable C SEXO Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (1 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1 Coefficient 0.575616 0.001486 0.640242 0.480091 685.6989 -1944.811 -1944.811 0.000376 0.984524 1071 1906 Std. Error 0.056124 0.076587 z-Statistic 10.25613 0.019398 Prob. 0.0000 0.9845 0.480010 1.307901 1.311931 1.309351 -0.653279 9.67E-08

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared

Total obs

2977

ML2: LS OCUPACION C EDAD

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 10:08 Sample (adjusted): 2 3909 Included observations: 2977 after adjustments

10

Convergence achieved after 4 iterations Covariance matrix computed using second derivatives Variable C EDAD Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (1 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1 Coefficient 1.106341 -0.015691 0.640242 0.474567 670.0119 -1909.141 -1944.811 71.34006 0.000000 1071 1906 Std. Error 0.075385 0.001874 z-Statistic 14.67581 -8.372240 Prob. 0.0000 0.0000 0.480010 1.283938 1.287968 1.285388 -0.641297 0.018341

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared

Total obs

2977

ML3: LS OCUPACION C NIVESTU

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 10:09 Sample (adjusted): 2 3909 Included observations: 2766 after adjustments Convergence achieved after 3 iterations Covariance matrix computed using second derivatives Variable C NIVESTU Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (1 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1 Coefficient 0.614336 0.255711 0.626175 0.482934 644.6343 -1822.611 -1828.216 11.20960 0.000814 1034 1732 Std. Error 0.049843 0.078236 z-Statistic 12.32535 -3.268437 Prob. 0.0000 0.0011 0.483905 1.319314 1.323598 1.320861 -0.658934 0.003066

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared

Total obs

2766

11

ML4: LS OCUPACION C NEGOCIO

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 10:09 Sample (adjusted): 7 3904 Included observations: 947 after adjustments Convergence achieved after 3 iterations Covariance matrix computed using second derivatives Variable C NEGOCIO Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (1 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1 Coefficient 0.535303 -0.000133 0.620908 0.482521 220.0206 -622.5309 -628.4461 11.83029 0.000583 359 588 Std. Error 0.068388 4.07E-05 z-Statistic 7.827392 -3.275808 Prob. 0.0000 0.0011 0.485417 1.318967 1.329217 1.322873 -0.657372 0.009412

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared

Total obs

947

ML5: LS OCUPACION C HRASTRAB

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 10:10 Sample (adjusted): 3 3909 Included observations: 1617 after adjustments Convergence achieved after 3 iterations Covariance matrix computed using second derivatives Variable C HRASTRAB Mean dependent var S.E. of regression Sum squared resid Log likelihood Coefficient 0.581442 -0.002151 0.617192 0.486259 381.8639 -1075.614 Std. Error 0.130894 0.002492 z-Statistic 4.442074 -0.863440 Prob. 0.0000 0.3879 0.486222 1.332856 1.339521 1.335329

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter.

12

Restr. log likelihood LR statistic (1 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1

-1075.987 0.746291 0.387653 619 998

Avg. log likelihood McFadden R-squared

-0.665191 0.000347

Total obs

1617

ML6: LS OCUPACION C PAGO

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 10:11 Sample (adjusted): 5 3909 Included observations: 1288 after adjustments Convergence achieved after 4 iterations Covariance matrix computed using second derivatives Variable C PAGO Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (1 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1 Coefficient 0.067992 0.344809 0.593168 0.490835 309.8217 -868.0776 -870.2821 4.409086 0.035748 524 764 Std. Error 0.167337 0.176486 z-Statistic 0.406319 1.953751 Prob. 0.6845 0.0507 0.491434 1.351052 1.359066 1.354060 -0.673973 0.002533

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared

Total obs

1288

ML7: LS OCUPACION C BUSCOTRA

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 10:11 Sample (adjusted): 3 3909 Included observations: 1617 after adjustments Convergence achieved after 3 iterations

13

Covariance matrix computed using second derivatives Variable C BUSCOTRA Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (1 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1 Coefficient 0.492581 -0.110106 0.617192 0.486290 381.9126 -1075.715 -1075.987 0.544434 0.460601 619 998 Std. Error 0.055082 0.148827 z-Statistic 8.942746 -0.739821 Prob. 0.0000 0.4594 0.486222 1.332981 1.339645 1.335454 -0.665254 0.000253

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared

Total obs

1617

ML8: LS OCUPACION C TRABANTES

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 09:03 Sample (adjusted): 21 3904 Included observations: 499 after adjustments Convergence achieved after 4 iterations Covariance matrix computed using second derivatives Variable C TRABANTES Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (1 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1 Coefficient 3.218876 0.952944 0.979960 0.140099 9.755015 -48.03141 -48.99933 1.935841 0.164121 10 489 Std. Error 0.509902 0.655162 z-Statistic 6.312735 1.454517 Prob. 0.0000 0.1458 0.140278 0.200527 0.217411 0.207153 -0.096255 0.019754

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared

Total obs

499

14

ML9: LS OCUPACION C INGRESO

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 10:12 Sample (adjusted): 3 3909 Included observations: 1600 after adjustments Convergence achieved after 4 iterations Covariance matrix computed using second derivatives Variable C INGRESO Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (1 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1 Coefficient 0.505625 -2.49E-05 0.616875 0.486391 378.0490 -1064.697 -1064.917 0.441042 0.506620 613 987 Std. Error 0.067787 3.73E-05 z-Statistic 7.459047 -0.666377 Prob. 0.0000 0.5052 0.486300 1.333371 1.340093 1.335867 -0.665435 0.000207

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared

Total obs

1600

15

2. SELECCIN DE VARIABLES:

VARIABLE

SIGNO Esperado Estimado Significancia

R2 Mc FADENN 0.2<R2<0.6 9.67E-08 malo 0.018341 malo 0.003066 malo 0.009412 malo 0.000347 malo 0.002533 malo 0.000253malo 0.019754 malo 0.000207 malo

Selec. NO SI SI NO NO SI NO NO No

Sexo Edad Nivestu Negocio Hrastrab Pago Buscotra Trabantes Ingreso

+ + + + + + + +

+ + + + -

0.9845 No sig 0.0000 Altasig 0.0011 Alta sig 0.0011 Alta sig 0.38 No sig 0.0507 sig 0.4594 No sig 0.1458 No sig 0.5052 No sig

En el cuadro se muestra las variables que ya han sido seleccionadas en base a los critrios estadsticos. Por lo tanto el modelo queda especificado de la siguiente forma: Ocucion= 0 + 1 edad i + 2 nivestui + 3 pagoi + U

3. ANALISIS DE MULTICOLINEALIDAD: (< 0.5). En este punto se construye la matriz de correlacin, con la cual concluimos que no se eliminan ninguna variable ya que ninguna genera multicolinealidad.. MATRIZ DE CORRELACON
EDAD EDAD NIVESTU PAGO 1.000000 0.078643 0.003948 NIVESTU 0.078643 1.000000 0.054468 PAGO 0.003948 0.054468 1.000000

Por lo tanto en esta segunda etapa nuestro modelo seria

16

Ocu= f(edadi , nivestu I, pago )

LUEGO REGRECIONAMOS EL MODELO LOGIT CON LAS VARIABLES SELECCIONADAS 2. ESTIMACION DEL MODELO MULTIVARIANTE Ocucion= 0 + 1 edad i + 2 nivestui + 3 pagoi + U

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 10:13 Sample (adjusted): 5 3600 Included observations: 1151 after adjustments Convergence achieved after 4 iterations Covariance matrix computed using second derivatives Variable C EDAD NIVESTU PAGO Mean dependent var S.E. of regression Sum squared resid Log likelihood Restr. log likelihood LR statistic (3 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1 Coefficient 0.567133 -0.016414 -0.348614 0.550889 0.582103 0.487354 272.4290 -766.1505 -782.2245 32.14806 4.87E-07 481 670 Std. Error 0.233417 0.004066 0.122672 0.205233 z-Statistic 2.429695 -4.037424 -2.841827 2.684218 Prob. 0.0151 0.0001 0.0045 0.0073 0.493428 1.338228 1.355773 1.344851 -0.665639 0.020549

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Avg. log likelihood McFadden R-squared

Total obs

1151

17

3. EVALUACION DEL MODELO

1 signos Signo esperado EDAD + NIVESTU + PAGO + Signo estimado -

2 Significancia Individual variables Edad Nivestu Pago probabilidad 0.0001 0.0045 0.0073 Significancia Alta sig Alta sig. Alta sig.

3 Significancia Conjunta

H0: Bj = 0 (Los parmetros no son significativos, y en consecuencia el modelo en su conjunto no es significativo.). H1: Bj 0 (Los parmetros son significativos, y en consecuencia el modelo en su conjunto es significativo). El estadstico de prueba es: LR LR =-2(ln Chi- Cuadrado.

l (r ) ln l (ur ) )

v/s

X (20.95,3) 7.81

Entonces: lr=-2*(-782.224532220058-(-766.15050142041))= 32.14806

18

X (20.95,3) 7.81

LR >

X (20.95,3)

Se rechaza H0, por lo tanto el modelo en su conjunto es estadsticamente significativo. Por lo tanto, podemos concluir que las variables exgenas explican conjuntamente los valores de la variable dependiente cualitativa.

4 Coeficiente de Bondad de Ajuste:

R 2 Mc Fadden 1

ln LUR ln LR

r2mcf=1-(-766.15050142041/-782.224532220058)= 0.020549 El modelo es bueno ya que el McFadden R-squared esta entre 0.2<0.206712<0.6
2 RCorrelacion 0.1643

El R2 de correlacin no es aceptable dado que no se encuentra comprendido entre 0.2 y 0.6.

2 RConteo

n pred .correctas 668 0.5804 n total.observ. 1151

Por lo tanto se puede afirmar que nuestro modelo predice correctamente el 58.04% de las observaciones

Percent Gain (probabilidad=0.5): esta tabla nos permite observar que el modelo estimado esta ganando en 21.51% en capacidad predictiva con respecto al modelo de probabilidad constante.

19

Dependent Variable: OCUPACION Method: ML - Binary Logit (Quadratic hill climbing) Date: 10/09/11 Time: 17:13 Sample (adjusted): 5 3600 Included observations: 1151 after adjustments Prediction Evaluation (success cutoff C = 0.5) Estimated Equation Dep=0 Dep=1 Total P(Dep=1)<=C P(Dep=1)>C Total Correct % Correct % Incorrect Total Gain* Percent Gain** 93 388 481 93 19.33 80.67 19.33 19.33 95 575 670 575 85.82 14.18 -14.18 NA 188 963 1151 668 58.04 41.96 -0.17 -0.42 Constant Probability Dep=0 Dep=1 Total 201.01 279.99 481.00 201.01 41.79 58.21 279.99 390.01 670.00 390.01 58.21 41.79 481.00 670.00 1151.00 591.02 51.35 48.65 Constant Probability Dep=0 Dep=1 Total 0 481 481 0 0.00 100.00 0 670 670 670 100.00 0.00 0 1151 1151 670 58.21 41.79

Estimated Equation Dep=0 Dep=1 Total E(# of Dep=0) E(# of Dep=1) Total Correct % Correct % Incorrect Total Gain* Percent Gain** 208.64 272.36 481.00 208.64 43.38 56.62 1.59 2.72 272.36 397.64 670.00 397.64 59.35 40.65 1.14 2.72 481.00 670.00 1151.00 606.28 52.67 47.33 1.33 2.72

Normalidad de los residuos - H 0 Los residuos se distribuyen con una normal.

20

Se compara el Jarque-Bera contra el chi-cuadrado

X (0.95,2) 5.99 JB= 171.9668 VS Como el JB es mayor al Chi-cuadrado, se rechaza la hiptesis nula, concluyendo que los
2

residuos no se distribuyen con una normal.

6. COMPARACION DEL MODELO LOGIT Y PROBIT MODELO PROBIT Ocucion= 0 + 1 edad i + 2 nivestui + 3 pagoi + U

Dependent Variable: OCUPACION Method: ML - Binary Probit (Quadratic hill climbing) Date: 10/09/11 Time: 10:59 Sample (adjusted): 5 3600 Included observations: 1151 after adjustments Convergence achieved after 4 iterations Covariance matrix computed using second derivatives Variable C EDAD NIVESTU PAGO Mean dependent var S.E. of regression Sum squared resid Log likelihood Coefficient 0.353611 -0.010226 -0.217698 0.343216 0.582103 0.487331 272.4028 -766.0902 Std. Error 0.145569 0.002515 0.076096 0.128059 z-Statistic 2.429168 -4.066159 -2.860822 2.680134 Prob. 0.0151 0.0000 0.0042 0.0074 0.493428 1.338124 1.355668 1.344746

S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter.

21

Restr. log likelihood LR statistic (3 df) Probability(LR stat) Obs with Dep=0 Obs with Dep=1

-782.2245 32.26871 4.59E-07 481 670

Avg. log likelihood McFadden R-squared

-0.665587 0.020626

Total obs

1151

Para comparar construimos la siguiente tabla: MODELO R2MC FADDEN AKAIKE SCHWARZ HANNAN QUINN LOGIT 0.206712 MAYOR 1.338228 PROBIT 0.02062 1.338124 MENOR 1.355668 MENOR 1.344746 MENOR

1.355773 1.344851

Por el criterio del R2 el modelo Logit es el mejor modelo pues este es mayor que el R2 del modelo Probi, segn el criterio del AKAIKE, SCHWARZ y el HANNAN QUINN el mejor modelo es el Probit pues estos estimadores son menores en este modelo. Pero tales estimadores son casi iguales y la diferencia es solo de centsimas, asi que elegiremos al modelo Logia como mejor modelo. Por lo tanto el mejor modelo es el modelo Logia.

7. EFECTOS MARGINALES Para el modelo Logit

Pi EMg X j Pi (1 Pi ) X ij
Donde: - Pi: La variable endgena proyectada - Bi: El parmetro asociado a la variable exgena.

22

Efectos Promedios

a) Efecto marginal de Edad= -0.003878

b) Efecto marginal de Nivestu= -0.082370

c) Efecto marginal de Pago= 0.130163

23

MODELO DE PROBABILIDAD LINEAL a) Primero estimamos por MCO y predecimos para hallar la varianza. En el comando escribimos: Genr vau= y(1-y) genr vau=ocupacionf2*(1-ocuf2) b) Luego estimamos el modelo de probabilidad lineal

Dependent Variable: OCUPACION Method: Least Squares Date: 10/09/11 Time: 11:22 Sample (adjusted): 3606 3909 Included observations: 105 after adjustments Weighting series: 1/SQR(VAR) Variable C EDAD NIVESTU PAGO Coefficient 0.855748 -0.006678 -0.036780 0.040684 Std. Error 0.173825 0.003249 0.092502 0.160000 t-Statistic 4.923036 -2.055533 -0.397613 0.254273 Prob. 0.0000 0.0424 0.6918 0.7998

Weighted Statistics R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.085630 0.058471 0.470393 22.34825 -67.75990 1.265254 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 0.662935 0.484779 1.366855 1.467959 1.504437 0.217973

Unweighted Statistics R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat 0.035667 0.007024 0.475263 1.299452 Mean dependent var S.D. dependent var Sum squared resid 0.657143 0.476941 22.81336

24

8. PREDICCION DEL MODELO PROBIT Para este tem se evaluara la capacidad predictiva del modelo en base a los 316 ltimos datos, luego se proceder a calcular el R2 de Conteo. Rango: Sample: 1 3910 3601 3910

Utilizando el modelo Logit, para las 310 ltimas observaciones, predecimos la variable ocupacion ocupacinf1 Aplicando el siguiente criterio Ocupacionf1>0.5 1 Ocupacionf1 Ocupacionf1<=0.5 0

25

PREDICCION
obs 3601 3602 3603 3604 3605 3606 3607 3608 3609 3610 3611 3612 3613 3614 3615 3616 3617 3618 3619 3620 3621 3622 3623 3624 3625 3626 3627 3628 3629 3630 3631 3632 3633 3634 3635 3636 3637 3638 3639 3640 3641 3642 3643 3644 3645 3646 3647 OCUPACION OCUPACIONF1 NA NA NA 1.000000 NA NA NA NA 1.000000 NA 1.000000 1.000000 1.000000 1.000000 NA 1.000000 1.000000 NA 1.000000 NA 1.000000 1.000000 0.000000 NA 1.000000 NA 1.000000 1.000000 0.000000 1.000000 NA NA NA NA 1.000000 NA 0.000000 NA 1.000000 NA 1.000000 1.000000 NA 1.000000 NA NA 1.000000 NA 0.000000 NA NA NA NA NA NA NA 1.000000 NA 1.000000 1.000000 NA NA 1.000000 NA 1.000000 1.000000 0.000000 1.000000 NA NA NA NA NA NA 1.000000 NA 0.000000 0.000000 0.000000 NA NA 1.000000 NA 1.000000 NA NA 0.000000 NA 1.000000 NA 0.000000 1.000000 1.000000 NA

26

3648 3649 3650 3651 3652 3653 3654 3655 3656 3657 3658 3659 3660 3661 3662 3663 3664 3665 3666 3667 3668 3669 3670 3671 3672 3673 3674 3675 3676 3677 3678 3679 3680 3681 3682 3683 3684 3685 3686 3687 3688 3689 3690 3691 3692 3693 3694 3695 3696 3697 3698

1.000000 NA 1.000000 NA 1.000000 NA NA 1.000000 1.000000 NA NA 1.000000 0.000000 1.000000 1.000000 1.000000 1.000000 1.000000 NA 1.000000 0.000000 NA NA NA 1.000000 0.000000 1.000000 0.000000 1.000000 NA NA 1.000000 1.000000 NA NA NA 1.000000 1.000000 0.000000 1.000000 1.000000 1.000000 1.000000 NA NA 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000

1.000000 1.000000 NA NA NA 1.000000 NA NA NA NA 1.000000 NA 1.000000 NA 1.000000 NA NA 1.000000 NA NA 1.000000 NA 1.000000 NA NA 1.000000 NA 1.000000 NA 1.000000 NA NA 1.000000 1.000000 NA NA 1.000000 NA 1.000000 NA 1.000000 1.000000 NA 1.000000 NA NA 1.000000 1.000000 1.000000 1.000000 1.000000

27

3699 3700 3701 3702 3703 3704 3705 3706 3707 3708 3709 3710 3711 3712 3713 3714 3715 3716 3717 3718 3719 3720 3721 3722 3723 3724 3725 3726 3727 3728 3729 3730 3731 3732 3733 3734 3735 3736 3737 3738 3739 3740 3741 3742 3743 3744 3745 3746 3747 3748 3749

NA 0.000000 1.000000 0.000000 NA NA 1.000000 1.000000 1.000000 NA 1.000000 1.000000 NA NA 1.000000 1.000000 1.000000 NA NA 1.000000 0.000000 0.000000 1.000000 NA 0.000000 0.000000 1.000000 0.000000 0.000000 0.000000 0.000000 0.000000 1.000000 1.000000 0.000000 0.000000 NA NA NA 1.000000 1.000000 0.000000 NA NA 1.000000 1.000000 1.000000 1.000000 0.000000 0.000000 0.000000

NA NA NA 1.000000 NA NA NA 1.000000 1.000000 1.000000 NA 1.000000 0.000000 NA NA 1.000000 1.000000 1.000000 NA NA 0.000000 NA NA NA NA NA NA 0.000000 NA NA NA NA NA 0.000000 1.000000 NA NA NA NA NA 1.000000 1.000000 NA NA NA 1.000000 1.000000 1.000000 1.000000 NA NA

28

3750 3751 3752 3753 3754 3755 3756 3757 3758 3759 3760 3761 3762 3763 3764 3765 3766 3767 3768 3769 3770 3771 3772 3773 3774 3775 3776 3777 3778 3779 3780 3781 3782 3783 3784 3785 3786 3787 3788 3789 3790 3791 3792 3793 3794 3795 3796 3797 3798 3799 3800

1.000000 1.000000 1.000000 1.000000 1.000000 NA 0.000000 1.000000 1.000000 0.000000 1.000000 NA NA 1.000000 0.000000 0.000000 1.000000 NA NA 0.000000 0.000000 1.000000 1.000000 0.000000 0.000000 1.000000 0.000000 0.000000 NA 1.000000 1.000000 0.000000 1.000000 0.000000 NA 0.000000 0.000000 1.000000 0.000000 NA NA 0.000000 1.000000 1.000000 1.000000 NA 1.000000 1.000000 1.000000 NA 1.000000

NA 1.000000 1.000000 0.000000 1.000000 NA NA NA 1.000000 1.000000 0.000000 NA NA NA 1.000000 NA NA NA NA NA NA NA 1.000000 1.000000 NA NA 1.000000 NA NA NA 1.000000 1.000000 NA 1.000000 NA NA NA NA NA NA NA NA NA 1.000000 1.000000 NA NA 1.000000 1.000000 1.000000 NA

29

3801 3802 3803 3804 3805 3806 3807 3808 3809 3810 3811 3812 3813 3814 3815 3816 3817 3818 3819 3820 3821 3822 3823 3824 3825 3826 3827 3828 3829 3830 3831 3832 3833 3834 3835 3836 3837 3838 3839 3840 3841 3842 3843 3844 3845 3846 3847 3848 3849 3850 3851

0.000000 0.000000 0.000000 0.000000 1.000000 1.000000 0.000000 1.000000 1.000000 1.000000 0.000000 1.000000 NA NA 1.000000 1.000000 1.000000 0.000000 0.000000 1.000000 NA 1.000000 1.000000 NA 1.000000 0.000000 1.000000 NA NA 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 0.000000 NA 0.000000 0.000000 0.000000 0.000000 0.000000 1.000000 NA NA 0.000000 1.000000 1.000000

1.000000 NA NA NA NA 1.000000 NA NA 0.000000 1.000000 NA NA NA 1.000000 NA NA 1.000000 1.000000 0.000000 NA 0.000000 1.000000 NA 1.000000 NA NA 0.000000 NA 1.000000 NA 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 0.000000 NA 1.000000 NA 1.000000 1.000000 1.000000 1.000000 0.000000 1.000000 1.000000 1.000000 NA 1.000000 NA

30

3852 3853 3854 3855 3856 3857 3858 3859 3860 3861 3862 3863 3864 3865 3866 3867 3868 3869 3870 3871 3872 3873 3874 3875 3876 3877 3878 3879 3880 3881 3882 3883 3884 3885 3886 3887 3888 3889 3890 3891 3892 3893 3894 3895 3896 3897 3898 3899 3900 3901 3902

1.000000 1.000000 NA 1.000000 0.000000 NA 1.000000 1.000000 NA NA 0.000000 1.000000 1.000000 1.000000 NA 1.000000 1.000000 1.000000 NA 1.000000 0.000000 1.000000 0.000000 NA 1.000000 1.000000 1.000000 1.000000 NA NA 0.000000 1.000000 1.000000 NA NA NA NA 1.000000 0.000000 NA 1.000000 0.000000 1.000000 1.000000 NA 1.000000 0.000000 NA NA NA 1.000000

1.000000 1.000000 NA NA 1.000000 NA NA 1.000000 NA 1.000000 NA 1.000000 NA 1.000000 NA NA NA 1.000000 NA 1.000000 NA NA 1.000000 NA NA 1.000000 0.000000 1.000000 NA NA NA NA NA 0.000000 1.000000 NA NA 1.000000 1.000000 NA NA 1.000000 NA NA 1.000000 NA 1.000000 NA 1.000000 NA NA

31

3903 3904 3905 3906 3907 3908 3909 3910

0.000000 1.000000 NA NA NA 1.000000 1.000000 NA

1.000000 NA 1.000000 NA NA 1.000000 1.000000 NA

Luego se procede a generar la variable dife: GENR D1=OCUPACION-OCUPACIONF1


Descriptive Statistics for DIFE Categorized by values of DIFE Date: 10/09/11 Time: 11:17 Sample (adjusted): 3606 3909 Included observations: 105 after adjustments DIFE -1 0 1 All Mean -1.000000 0.000000 1.000000 -0.228571 Std. Dev. 0.000000 0.000000 0.000000 0.559140 Obs. 31 67 7 105

2 RConteo

n pred .correctas 67 0.6380 n total.observ. 105

El modelo predice bien a los individuos que no se encuentran ocupados por ahora en algn empleo o trabajo. Con un R2 de Conteo de 0.638 podemos concluir que el modelo predice bien el 63,8% de las observaciones.

32

CONCLUSION El mejor modelo resultante fue el modelo Logit, dado que cuenta con mejores estimadores y con un mejor R2 a comparacin del modelo Probit, sin embargo los resultados varan por solo centsimas, por ello se puede considerar indiferente a la hora de elegir entre uno u otro. La prediccin tambin no estn acertada pues solo predice bien el 63% de las observaciones, esto debido a la falta de valores en varias observaciones.

33

BIBLIOGRAFA

1.- ARRANZ J.; GARCA, C. (2009) Pobreza en Espaa. Universidad de Espaa. 2.- JARAMILLO, M. y MONTALVA, V. (2009) Pobreza e impactos heterogneos de las polticas activas de empleo juvenil: el caso de PROJOVEN en el Per. Documento de Trabajo N 54; Grupo de Anlisis para el Desarrollo GRADE. Lima. 3.- LANJOUW P. (1996) Empleo no agrcola y pobreza en El Salvador Rural. Banco Mundial. El Salvador. 4.- Cuadros estadsticos: De Lima Metropolitana y la Provincia Constitucional del Callao.Pgina Web (MICRODATOS INEI)

34

You might also like