Professional Documents
Culture Documents
1
2 Rodrigo F. Aranda
información cuantitativa. Sin embargo, la información nunca es totalmente predecible para concluir que las
cuantitativa, por ejemplo respecto de las elasticidades relaciones económicas nunca son determinı́sticas. Para
β 1 y β 2 en (3), es de gran importancia en la toma de enfrentar esta incertidumbre en la conducta de los
decisiones de polı́tica económica. agentes, y otras razones que se plantearán en su debido
Finalmente, la teorı́a por lo general se refiere a lo momento, la Econometrı́a incorpora un término de per-
que los economistas denominamos el largo plazo, dado turbación aleatorio o error estocástico a las ecuaciones
que nos concentramos en posiciones de equilibrio. Por como (2), tranformándola en:
ejemplo, en equilibrio tanto la demanda como la oferta m = α0 + α1 y + α2 i + ε, (5)
de dinero deben ser iguales. En esta caso es comple-
tamente justificable usar datos de series de oferta de donde ε es el término de perturbación, que puede tomar
dinero para representar la demanda por dinero. Pero el valores positivos o negativos. La inclusión de ε en (5)
problema es que el mercado monetario rara vez está en significa que los mismos niveles de y e i no siempre
equilibrio. Si no está en equilibrio ¿es justificable usar resultarán en el mismo valor exacto para la demanda
los datos observados de oferta y demanda de dinero para por dinero m. Existirá una variación completamente
representar la demandas de dinero tales como (1), (2) aleatoria en los valores de m, dependiendo del tamaño
y (3)? En términos generales, la teorı́a económica fre- y signo de la perturbación.
cuentemente tiene poco que decir respecto de cómo la La existencia de este término de perturbación sig-
economı́a o los mercados se mueven entre un equilibrio nifica que es imposible medir los parámetros α0 , α1
y otro; es decir, la teorı́a rara vez describe los procesos y α2 con exactitud. Es aquı́ donde los métodos es-
de ajuste, aun cuando esto ha tendido a cambiar con los tadı́sticos nos ayudan a obtener estimadores más pre-
desarrollos más avanzados en la teorı́a macroeconómica cisos, aunque nunca serán exáctos. Para hacer de un
y monetaria. Desafortunadamente, los datos con que modelo económico-matemático un verdadero modelo es-
los econometristas cuenta se refieren a estos procesos tadı́stico se necesita ser muy especı́ficos acerca del pro-
de ajuste y no a situaciones de equilibrio sucesivas. ceso (estocástico) mediante el cual se generan los datos;
En mayor o menor medida, la econometrı́a busca dar por ejemplo, si consideramos que los errores son el re-
respuesta a estas interrogantes que no resuelve la teorı́a. sultado de variables aleatorias no observadas, entonces
En particular, busca encontrar estimaciones numéricas necesitamos especificar las medias y varianzas de dichas
a los parámetros en ecuaciones como (2) y (3). In- variables y la distribución (de probabilidad) de la cual se
tenta, además, testear algunas de las predicciones dela originaron. Dar a los errores una interpretación aleato-
teorı́a. Por ejemplo, la teorı́a monetaria esbozada en ria convierte a un modelo matemático-económico en
(1) implica que las funciones de demanda son indepen- un modelo estadı́stico-probabilistico, que nos entrega
dientes del nivel de precios. El enfoque econométrico la base para la inferencia estadı́stica, es decir, una base
para testear estas predicciones teóricas implicarı́an la para la estimación de los parámetros desconocidos y
generalización de las ecuaciones (2) y (3), incorporando para la prueba de hipótesis sobre los mismos.
posibles efectos del nivel de precios. Ası́, podrı́amos En resumen, los ingredientes básicos son:
modificar (2) para plantear:
(1) Un modelo económico que permita identificar las
m = α0 + α1 y + α2 i + α3 P, (4) variables económicas relevantes y los parámetros
económicos de interés, y que proporcione las bases
donde P es el nivel general de precios. Sı́ α3 = 0 en- para las conclusioes económicas.
tonces el nivel de precios no tiene influencia alguna so-
bre la demanda real de dinero. Las técnicas estadı́sticas (2) Un modelo estadı́stico (modelo econométrico) que
utilizadas para estimar los parámetros α1 y α2 se especifique el proceso muestral que genera los
pueden también usar para obtener una estimación de datos e identifique los parámetros desconocidos
α3 ; si esta estimación resulta ser significativamente dis- que describen el sistema de probabilidades suby-
tinta de cero (en un sentido estadı́stico que se discutirá acente.
más adelante), entonces se contradice la predicción de
(3) Valores observados de las variables que fueron
la teorı́a.
generados junto con el proceso muestral especi-
Hasta aquı́, la forma en que hemos planteado las ficado para el modelo econométrico.
ecuaciones sugieren que las relaciones económicas son
exactas o determinı́sticas. Sin embargo, basta con con- Pero, ¿cómo usamos la información contenida en
siderar que el comportamiento de los agentes económicos (1), (2), y (3), para obtener información sobre los
Introducción al Análisis Econométrico 3
parámetros desconocidos que necesitamos para la toma Por ejemplo, a medida que el precio de un bien au-
de decisiones? Supongamos que la teorı́a económica menta, ¿en cuánto disminuirá la cantidad demandada?
la podemos expresar implı́citamente en los siguientes ¿El producto agregado aumenta en una forma lineal o
términos: no lineal cuando aumenta la mano de obra?
Afortunadamente, la teorı́a estadı́stica proporciona
y = f (x1 , . . . , xk , β 1 , β 2 , . . . , β k , ε), (6) procedimiento o reglas bien definidas para utilizar la
información muestral para obtener estimaciones pun-
donde y es la variable de interés a analizar por el tuales (un único valor) de dichos parámetros, para
econometrı́sta, x1 , . . . , xk son un conjunto nde variables comprobar la confiabilidad de las estimaciones, y para
que la teorı́a económica indica que están relacionadas testear hipótesis. Tales reglas se basan en las propiedades
con y; β 1 , β 2 , . . . , β k es un conjunto de parámetros de- de las muestras utilizadas y en las distribuciones mues-
sconocidos que permiten vincular la variable y con las trales asociadas. Ası́, las estimaciones puntuales y sus
x0 s en el modelo de economı́a matemática, y ε es el correspondientes confiabilidades pueden expresarse me-
término de perturbación estocástica. En este contexto, diante estimaciones por intervalos. También es posible
el objetivo del análisis econométrico es incrementar comprobar la compatibilidad de los datos con nuestras
el contenido de la parte sistemática o determinı́stica conjeturas mediante test de hipótesis.
(parte explicada por las variables que la teorı́a señala
También, dado que existen varias formas (reglas)
como relacionadas con y), f (x1 , . . . , xk , β 1 , β 2 , . . . , β k ),
para usar un conjunto de datos, la teorı́a estadı́stica
y reducir la importancia del componente de error . Gen-
entrega una base para comparar procedimientos de es-
eralmente no existe posibilidad de generar por antici-
timación. Por ejemplo, ¿es la regla de estimación inses-
pado en un laboratorio o mediante experimentos con-
gada, esto es, en promedio le apuntan al objetivo o es la
trolados los datos consistentes con nuestros modelos
confiabilidad de una regla de estimación superior a otra?
económicos y estadı́sticos. Ello significa que trabajamos
Además, si al desconocimiento de los parámetros le aso-
bajo la restricción de construir modelos no experimen-
ciamos una pérdida, ¿entonces una regla de estimación
tales con datos económicos que son escasos y de alto
minimiza la pérdida promedio o minimiza la máxima
costo para su obtención. En consecuencia debemos ser
pérdida posible? Dado que la información muestral es
muy eficientes en el uso de cualquier información mues-
escasa y costosa, la teorı́a estadı́stica sugiere proced-
tral y no muestral que esté disponible. Esta búsqueda
imientos que nos permiten combinar y usar tanto in-
de la eficiencia en el aprendizaje de la información mues-
formación muestral como otro tipo de información no
tral conduce al tópico de la inferencia estadı́stica.
muestral en el proceso de estimación y de realizar infer-
encias acerca de parámetros desconocidos. En resumen,
2. Inferencia Estadı́stica la teorı́a estadı́stica posibilita el uso de información
muestral para pasar desde los parámetros teóricos en
Al discutir el rol de los modelos económicos y es- los modelos económicos y estadı́sticos a sus contrapartes
tadı́sticos nos hemos concentrado en las relaciones en- empı́ricos, y para hacer declaraciones probabilı́sticas en
tre variables económicas observadas, tales como pre- relación a posibles resultados.
cios, consumo e inversión, y el deseo de obtener infor-
El paquete completo (teorı́a económica, más un mod-
mación sobre los parámetros desconocidos correspon-
elo económico, un modelo estadı́stico, la información
dientes, tales como las elasticidades y productividades
muestral y la teorı́a estadı́stica) es lo que define a la
marginales. La información sobre dichos parámetros es
econometrı́a y sienta las bases para la medición en
útil para entender las relaciones económicas y nos pone
economı́a, y la posibilidad de entender, predecir, y de
en una posición de poder discriminar entre hipótesis
tener algún control sobre los procesos económicos y las
(teorı́as) alternativas, extraer implicancias económicas,
instituciones.
o para predecir y posiblemente controlar los resultados
de importantes variables económicas. Dado este obje-
tivo y una muestra de datos recolectada consistente con 3. Muestreo Aleatorio
el proceso muestral descrito en el modelo estadı́stico, el
problema entre manos es encontrar algún procedimiento Una muestra de n observaciones para una (o más)
para la información muestral para fines de la estimación variable(s), x1 , . . . , xn , es una muestra aleatoria, sı́ las
de los parámetros e inferencia estadı́stica. Por inferen- n observaciones son extraı́das de manera independiente
cia se quiere decir que lo que se desea es usar la infor- de la misma población o distribución de probabilidad,
mación muestral para inferir algo sobre el mundo real. f (xi ; θ), donde θ es el vector de parámetros que per-
4 Rodrigo F. Aranda
miten describir el comportamiento de la población. En (en muestras repetidas) de las variables independientes
este caso, se dice que la secuencia de observaciones (Gujarati, 2004).
{xi }ni=1 está idéntica e independientemente distribuida. Como se señaló antes, el modelo económico-estadı́stico,
En la función de densidad, el vector θ contiene uno o o sı́mplemente modelo econométrico, plantea una relación
más parámetros desconocidos, de interés para el inves- entre variables para una población determinada. Esto
tigador, que deben ser estimados a partir de la muestra. lo resumimos en:
Nótese que si el proceso de muestreo se considera
como un experimento estadı́stico, la obtención de una y = f (x1 , . . . , xk , β 1 , β 2 , . . . , β k , ε).
muestra aleatoria no tiene por qué coincidir con la que
se obtendrı́a si el ejercicio de extracción se repitiera Dado que sı́ ε es una variable aleatoria, ésta puede
una vez más, dado precisamente el carácter aleatorio tomar cualquier valor de entre todos los valores posi-
del proceso. bles que su distribución de probabilidad permite. Por
ejemplo, sı́ ε se distribuye como normal, el rango posi-
Los datos que componen la muestra pueden ser de
ble de valores que puede asumir se mueve entre −∞
los siguientes tipos:
y +∞. Esto significa, como se ha señalado, que para
valores fijos de las variables independientes, es posible
1. Datos de Sección Cruzada o de Corte Transver-
obtener más de un valor probable para y, dado que y
sal (Cross-Section), en donde se obtiene un cierto
también depende de ε. Más aún, la distribución de
número de observaciones de distintos elementos
probabilidad que caracteriza a y será la misma que la
medibles, todas ellas referidas al mismo perı́odo o
distribución de probabilidad de ε. Dado esto, estare-
intervalo de tiempo, pero correspondiendo a dis-
mos interesados en analizar la media o valor promedio
tintas unidades económicas o de decisión. Por
que la variable y toma en la población, dada la infor-
ejemplo, los puntajes de ingreso de los alumnos
mación de las variables independientes, y no algún valor
de las distintas carreras que imparte una Univer-
particular que esta tome para un ε dado, sı́mplemente
sidad, en el año 2005. Otro ejemplo corresponde
porque este último es completamente aleatorio. Esto
a los distintos niveles de ingreso familiar de cada
nos permitirá concentrarnos en la parte determinı́stica
uno de los alumnos ingresados en el mismo año.
del modelo económico-estadı́stico, que es la única parte
2. Datos de Series de Tiempo (Time Series), que cor- para la cual tenemos información. Por ejemplo, sı́ con-
responden a un conjunto de datos generados por sideramos la expresión en la ecuación (5) y asumiendo
un único elemento medible a lo largo de distin- que la media o valor esperado de la perturbación es-
tos perı́odos o intervalos de tiempo, regulares o tocástica es cero, la parte determinı́stica de la ecuación
no, con cierta distribución de probabilidad. Por para la demanda de dinero es:
ejemplo, los datos correspondiente al ı́ndice de
E(m |y, i ) = α0 + α1 y + α2 i. (7)
precios al consumidor, con una periodicidad men-
sual, desde 1980 hasta el 2005. Obviamente, los valores que efectivamente toma la vari-
3. Datos de Panel (Panel Data), que corresponden a able m se distribuirán aleatoriamente en torno a esta
una combinación de datos de corte transversal y linea recta definida por (7). Dada la forma en que se
de series de tiempo, en que el número de observa- plantea esta ecuación, o en términos más generales la
ciones de corte transversal es generalmente muy relación entre la expectativa condicional de y dados los
superior a las observaciones de series de tiempo. valores para las x0 s, ésta recibe el nombre de Ecuación
de Regresión o Recta de Regresión.
Una vez más, el propósito del análisis econométrico
será estimar los parámetros poblacionales, a partir del
4. Análisis de Regresión y Causalidad
uso de información muestral, con el fin de realizar in-
Teniendo como origen la Ley de Regresión Universal ferencias sobre el comportamiento de la variable depen-
de Francis Galton, el análisis de regresión estudia la diente en la población.
dependencia de la variable dependiente respecto de una Un punto importante de destacar, y que muchas ve-
o más variables (explicativas o independientes), con el ces conduce a error, es la implicancia que ecuaciones
objetivo de estimar y/o predecir (pronosticar) la media como (6) ó (7) plantean en términos de las relaciones
condicional o valor promedio poblacional de la variable entre variables. Algunos no iniciados en el análisis
dependiente, en términos de los valores conocidos o fijos econométricos, e incluso algunos que ya han estudiado
Introducción al Análisis Econométrico 5
algo de esta disciplina, señalan que la relación que se 3. Esta información es luego ordenada en términos
da entre las variables en ambas ecuaciones es de causal- de un modelo económico de trabajo que lista los
idad; es decir, las variables del lado izquierdo causan a la supuestos subyacentes y forma la base para la ab-
variable del lado derecho. Esta visión es completamente stracción experimental. Se plantean las hipótesis
errada; la forma correcta de interpretar la relación entre de interés.
las variables de ambas ecuaciones es en términos de de-
pendencia, no de causalidad: la existencia de dependen- 4. El modelo económico de trabajo conduce a un
cia entre variables no implica necesariamente causali- modelo estadı́stico que describe el proceso me-
dad. No importa qué tan fuerte y sugestiva sea una diante el cual las observaciones muestrales y las
relación estadı́stica, esta nunca podrá establecer una ecuaciones de error se consideran generadas, la
conexión causal (Gujarati, 2004); la única forma de clasificación de las variables, y la forma funcional
plantear relaciones de causalidad es recurriendo a con- de las relaciones propuestas.
sideraciones teóricas o a priori. Es decir, la única que
nos puede indicar relaciones de causalidad entre vari- 5. Se generan u obtienen observaciones muestrales
ables es la propia teorı́a económica, no el plantemiento que sean consistentes con el modelo económico
econométrico. y con los componentes aleatorios del modelo es-
Lo anterior es sumamente importante cuando se con- tadı́stico.
sidera, además, la relación entre regresión y correlación.
La correlación entre variables no es signo alguno de 6. Dado el modelo estadı́stico y las observaciones
causalidad entre ellas, sino más bien la manifestación muestrales, se selecciona o desarrolla una regla o
de algún grado de asociación lineal entre las mismas, método de estimación que tenga buenas propiedades
que se acostumbra a medir por el coeficiente de cor- estadı́stica, tales como insesgamiento y/o menor
relación. Se debe señalar que, a pesar de la importancia variabilidad o alta precisión.
que una alta correlación entre variables pueda tener, el
análisis de regresión no está preocupado de este tipo de 7. Se obtiene estimaciones puntuales o por intervalo
medición, sino que más bien en estimar o predecir el de los parámetros desconocidos, con la ayuda de
valor promedio de una variable en base a valores fijos algún software estadı́stico (como Stata, S-Plus o
de otras variables. SPSS,); matricial (como por ejemplo, Matlab) o
Lo anterior, junto al hecho que el análisis de cor- econométrico (tales como Eviews, Rats, Limdep).
relación considera que las variables son igualmente aleato- Se implementan los pruebas de hipótesis apropi-
rias y tratadas en forma simétrica, a diferencia del adas.
análisis de regresión en que las variables son tratadas
asimétricamente (dependiente versus independientes) y 8. Las consecuencias económicas y estadı́sticas y las
no son todas aleatorias (sólo lo son la variable dependi- implicancias de los resultados empı́ricos son anal-
ente y el término de perturbación estocástico), indican izados y evaluados. Por ejemplo, se examina la
claramente que el análisis de regresión no es lo mismo significancia estadı́stica de las variables del lado
que el análisis de correlación. derecho, lo apropiado de los supuestos sobre el
término de error, etc.
5. El proceso del Análisis Econométrico
9. Si la consistencia entre los modelos económico
El siguiente listado resume los principales pasos del y estadı́stico y la muestra de datos no se logra,
análisis econométrico. ¿cuáles son los potenciales problemas que ello con-
lleva y cuales son las sugerencias para futuros
1. Todo parte con un problema - la falta de infor- análisis y evaluaciones? Por ejemplo, ¿los datos
mación o incertidumbre sobre algún resultado o utilizados eran los correctos considerando las in-
una interrogante que incluye un ¿qué pasa si...? terrogantes planteadas? ¿las variables fueron cor-
2. La teorı́a económica proporciona una forma de rectamente clasificadas y aparecı́an con el timing
pensar en los problemas: ¿qué variables están adecuado? ¿ Debió haberse incluido no lineali-
involucradas y cuál es la posible dirección de la dades en el modelo, tanto en las variables como
relación? ¿ Cómo podemos usar nueva infor- en los parámetros?
mación si la tuvieramos?
6 Rodrigo F. Aranda
Además, se puede demostrar que forma en que se ha descrito; es decir, extrayendo una
Pn gran cantidad de muestras aleatorias de una población.
2 2
i=1 xi − nx Normalmente contamos con una única muestra. Afortu-
s2x = ;
n−1 nadamente, es posible decir mucho sobre la distribución
Pn
i=1 xi yi − nxy muestral de la media sin la necesidad de tomar más
sxy = ; de una muestra. Para ello hacemos uso de nuestro
n−1
−1 ≤ rxy ≤ 1; conocimiento sobre valores esperados y varianzas de
sax = |a| sx ; variables aleatorias, para derivar las expresiones de la
media y la varianza de la distribución muestral.
sx,by = |ab| sxy, y
Un teorema que ayuda bastante es el siguiente:
ab
rax,by = rxy , a, b 6= 0.
|ab| Teorema 1. Distribución Muestral de la Media:
Si x1, x2 , . . . , xn son observaciones de una mues-
6.2. Distribución Muestral de la Media
tra aleatoria extraı́da de una población de media
Las medidas anteriores resumen una muestra aleato- μ y de varianza σ 2 , entonces x es una variable
ria. Cada una de ellas tiene una contraparte pobla- aleatoria de media μ y varianza σ 2 /n.
cional, esto es, basada en la distribución a partir de
la cual se han generado los datos; en otras palabras, B Dem.: De la definición de media muestral,
los valores muestrales se corresponden con esperanzas n n
1X 1X
poblacionales. Definamos lo que entenderemos por un x = xi ⇒ E(x) = E(xi )
”estadı́stico”: n i=1 n i=1
n
1X
Definición 1. Estadı́stico: Es cualquier función que = μ = μ.
n i=1
se calcula a partir de los datos contenidos en una
muestra. Además, si las observaciones son independientes,
entonces
Si se extrae otra muestra bajo las mismas condi-
X n
ciones, se obtendrán valores diferentes a partir de las 1
observaciones, puesto que cada muestra es una variable var(x) = var( xi )
n2 i=1
aleatoria. Esto implica que el estadı́stico también es una n n
variable aleatoria, y tiene su propia función de proba- 1 X 1 X 2
= var(xi ) = σ
bilidad: la distribución muestral. n2 i=1 n2 i=1
Suponga, entonces, que se extrae de esta población σ2
una gran cantidad de muestras aleatorias de igual tamaño = . C
n
n, cada una de las cuales tiene
P su propia media mues-
tral calculada como x = n1 ni=1 xi . Esto significa que La distribución muestral se utiliza para realizar in-
una media particular, digamos x0 puede repetirse o no ferencias sobre la población, bajo la premisa de que la
en varias muestras, por lo que tiene asociada una cierta muestra reproduce el comportamiento de la población.
frecuencia. Entonces, dado que se han tomado muchas
Este teorema permite señalar tres cosas respecto de
muestras, las frecuencias relativas pueden considerarse
la distribución muestral de x obtenida cuando se toman
como probabilidades de ocurrencia para las medias.
muchas muestras, todas de tamaño n, a partir de una
Por ejemplo, podrı́amos decir que Pr(x = x0 ) = 0.18.
población dada:
Luego, será posible construir una distribución de prob-
abilidad para x.
1. El teorema establece que sı́ calculamos E(x), el
La función de probabilidad para x se conoce como promedio de los x obtenido de las muchas mues-
distribución muestral de la media de una variable aleato- tras, encontraremos que es igual a μ, la media de
ria de tamaño n. Las distribuciones muestrales de este los x0 s en la población.
tipo son de crucial importancia en la inferencia es-
tadı́stica. 2. También establece que la variabilidad en las x0 s
2
En la práctica, sin embargo, rara vez las distribu- (medida por V ar(x) = σn ) depende de dos fac-
ciones muestrales se construyen empı́ricamente en la tores:
8 Rodrigo F. Aranda
(a) El tamaño de la muestra, n: mientras mayor la distribución normal estándar? La respuesta a esta
sea el tamaño muestral, menor será la vari- pregunta se encuentra en el siguiente teorema:
abilidad obtenida para los x0 s. En el ex-
tremo, sı́ n → ∞, V ar(x) → 0. Teorema 2. Teorema Central del Lı́mite: Si x1 ,
2 0 x2 , . . ., xn son observaciones de una variable
(b) La variabilidad (medida por σ ) de los x s
aleatoria procedente de una distribución de prob-
en la población: mientras mayor sea σ 2 en la 2
abilidad con Pnmedia finita μ y varianza finita σ , y
población original, mayor será la variabilidad
si xn = n1 i=1 xi , entonces,
de los x0 s que se obtenga a partir de muchas
muestras. √ d
n(xn − μ) → N (0, σ 2 )
3. Sı́ la población de la cual se extraen las muestras independiente de cuál sea la distribución inicial,
es normal, con media μ y varianza σ 2 - esto es, x ∼ d
donde → significa convergencia en distribución.
N (μ, σ 2 ) - entonces, dado que x es una función En otras palabras, sı́ seleccionamos aleatoriamente
lineal de los xi , x también se distribuirá como muestras grandes a partir de una población con
2
una normal con media μ pero varianza igual a σn . media μ y varianza σ2 , entonces la media muestral
Esto es, se distribuirá aproximadamente como una normal
2
σ2 con media E(x) = μ y varianza V ar(x) = σn , in-
Sı́ x ∼ N (μ, σ 2 ) ⇒ x ∼ N (μ, ). (8) dependientemente de cuál sea la forma de la dis-
n
tribución de la población original.
Consideremos el siguiente ejemplo. Supongamos que
B Dem.: Fuera del alcance de estas notas. C
el ingreso semanal de los trabajadores del calzado es
en promedio de $560, con una desviación estándar de Este teorema establece que, con tal que las mues-
$12. Podemos asumir que los ingresos semanales se tras sean lo suficientemente grandes, entonces aun sı́
distribuyen como una normal. Sı́ se extrae de esta la población no se distribuye como una normal, la dis-
población una muestra aleatoria de 100 trabajadores, tribución muestral de la media puede igualmente ser
¿cuál es la probabilidad de que el ingreso medio sem- aproximada por la distribución normal. Es más, mien-
anal en la muestra sea mayor que $562? tras más grandes sean las muestras tomadas, más cer-
Para responder esto, sea x el ingreso de un tra- cana es la aproximación. Nótese, en todo caso, que no
bajador individual; entonces, necesitamos obtener la hay una distinsión clara entre lo que es ”grande” y lo
Pr(x > 562), dado que x ∼ N (560, 144). Usando el que es ”pequeña”. Esta distinsión dependerá del tipo
2
teorema 1, E(x) = μ = 562 y V ar(x) = σn = 1.44; esto de problema que se esté analizando y de la periodicidad
es, x ∼ N (560, 1.44). A continuación transformamos de las observaciones; por ejemplo, a nivel macro, una
x en una distribución normal estándar, definiendo la muestra de 30 ó 40 observaciones puede ser considerada
variable Z como: como grande, mientras que si usamos datos financieros
una muestra será considerada grande cuando supere las
x − 560
z= ; 1500 observaciones diárias.
1.44
z tiene una distribución N (0, 1), por lo que: 7. Estimación de los Parámetros
µ ¶ Poblacionales
x − 560 562 − 560
Pr(x > 562) = Pr >
1.44 1.44 En el ejemplo anterior los parámetros poblacionales
= Pr(z > 1.67) = 1 − Pr(z < 1.67) = 0.0475, eran conocidos, lo que permitió usar el teorema 1 para
obtener la probabilidad asociada a la media muestral.
donde el último valor se obtiene de las tablas de la dis- En la práctica lo común es que los parámetros pobla-
tribución normal estandarizada. En consecuencia, la cionales sean desconocidos y que debamos usar la in-
probabilidad de obtener una media muestral mayor que formación muestral para realizar inferencias sobre ellos.
$562 es bastante baja (alrededor de 4%). La inferencia estadı́stica se divide en dos grandes áreas:
Nótese que para realizar este ejercicio simple no sólo la estimación y el testeo de hipótesis. En esta sección
nos hemos basado en el teorema 1, sino que también en discutiremos brevemente la estimación de parámetros;
el supuesto de distribución normal. Si no consideramos el testeo de hipótesis de interés se dejará para fu-
este último supuesto, ¿podremos utilizar las tablas de turas sesiones directamente relacionadas con el análisis
Introducción al Análisis Econométrico 9
Esta definición implica que los valores de la variable Teorema 6. Consistencia de la Media Muestral:
aleatoria cercanos a c, son cada vez más probables a La media de una muestra aleatoria de cualquier
medida que n aumenta. La clave de esta forma de con- población con media finita μ y varianza finita σ 2
vergencia es que toda la masa de probabilidad de la es un estimador consistente de μ.
distribución se concentrando en los valores cercanos a
c. Cuando xn converge en probabilidad a c, se escribe B Dem.: Sabemos que E(x) = μ y V ar(x) = σ 2 /n.
Por lo tanto, x converge en media cuadrática a
p lim xn = c. μ, por lo que p lim x = μ (pues cuando n → ∞,
σ 2 /n → 0). C
Un tipo especial de convergencia en probabilidad,
más utilizado, es: Corolario (Consistencia para la Media de Fun-
ciones): En una muestra aleatoria, para cualquier
Teorema 3. Convergencia Media Cuadrática: Si función g(x), si E[g(x)] y V ar[g(x)] son con-
xn tiene media μn y varianza σ 2n , tales que los stantes finitas, entonces
lı́mites ordinarios de μn y σ 2n son, respectiva-
1 Pn
mente, c y 0, entonces xn converge en media p lim g(xi ) = E[g(x)].
cuadrática a c, y p lim xn = c. n i=1
Para demostrar este teorema, son necesarios los
Definición 9. Convergencia en Distribución: La
siguientes dos teoremas complementarios:
sucesión de variables aleatorias {xn } converge en
Teorema 4. Desigualdad de Chebychev: Si xn es distribución a una variable aleatoria x con función
una variable aleatoria y c y ξ son dos constantes, de densidad acumulada (f da) F (x) si
entonces,
£ ¤ lim |Fn − F (x)| = 0
n→∞
E (xn − c)2
Pr [|xn − c| > ξ] < .
ξ2 en todos los puntos en que F (x) sea continua.
La demostración de este teorema escapa a los al-
Esta definición no tiene nada que ver con la conver-
cances de estas notas.
gencia de los valores especı́ficos que tome x, sino que se
Teorema 5. Desigualdad de Markov: Sea yn una relaciona con la distribución de proabilidad.
variable aleatoria que toma valores no negativos,
y δ una constante positiva. Entonces, Definición 10. Distribución Lı́mite: Si xn converge
en distribución a x, siendo F (x) la fda de x, en-
E(yn ) tonces F (x) es la distribución lı́mite de x. Esto
Pr [yn ≥ δ] ≤ .
δ es,
d
La demostración de este teorema escapa a los al- xn → x.
cances de estas notas.
Introducción al Análisis Econométrico 13
Y ∼ N (θ, (500)2 ). y £ ¤ 2
var(x) = σ 2 = E x2 − [E [x]] .
Sea x1 , · · · , xT una muestra aleatoria de las observa- Ası́, si igualamos los momentos muestrales a los pobla-
ciones sobre los gastos. Dado que la media es descono- cionales, tendremos:
cida, podemos plantear que
Pn x
=x=b
i
Yt = θ + εt ; t = 1, · · · , T , μ01 = θ,
i=1 n
donde la variable aleatoria εt = Yt − θ, tiene una dis- y
Pn x2 2
tribución de probabilidad dada por μ02 = i
b2 + b
=σ θ ;
i=1 n
εt ∼ N (θ, (500)2 ),
de donde se obtiene:
y representa la diferencia entre Y y su media. Tal como n x2 n x2
µ ¶2
P 2 P Pn x
−b
i
ha sido especificada, εt representa todos aquellos fac- b2
σ = i
θ = i
−
tores distintos del ingreso que afectan el nivel de gasto i=1 n i=1 n i=1 n
XT XT
dS b =0
S = (yt − β)2 ⇒ = −2 (yt − β)
t=1
dβ t=1
XT
b= 1
⇒ β yt .
T t=1