Professional Documents
Culture Documents
INFERENCIA ESTADISTICA:
Es un conjunto de mtodos mediante los cuales podemos hacer afirmaciones con respecto a una
poblacin completa a partir de nicamente la observacin de una parte de la poblacin (muestra)
FORMAS BASICAS PARA REALIZAR LA INFERENCIA ESTADISTICA:
Estimacin
Prueba de Hiptesis
ESTADISTICOS: Medidas en una muestra (media, varianza, proporcin, etc.)
PARAMETROS: Medidas en una poblacin (,
2
, P)
ESTIMADOR: Es una funcin de variables aleatorias observables usadas para estimar un
parmetro poblacional (utilizando distribucin de probabilidad de cada estimador)
POBLACION, VARIABLE, DATOS, PARAMETROS Y MUESTRA
Elementos. (Cualquier naturaleza)
Caracterstica de inters. ( Es individual, es variable) se representa por X
Datos. Son los valores realmente observados de X.
As x
i
representa la i-sima obs de X donde i = 1,2, ...
Muestra. Una parte de la poblacin (Debe ser representativa de la poblacin)
Poblacin (tamao N)
Parmetro: Son caractersticas poblacionales (constantes, se representan por letras griegas)
N
x
N
x ... x x
N
.
i
N 2 1
=
+ + +
= ,
=
N
i
x ,
N
) (x
N
.
2
i
=
2
,
2
=
Por qu se muestrea?
Para tomar decisiones con base a informacin real, completa, por tal razn se utiliza la informacin
de una muestra para estimar los parmetros.
VENTAJAS DEL MUESTREO
Rapidez y bajo costo de la informacin (Oportuna, exactitud aceptable)
Poblacin muy grande (Infinita)
Evita la destruccin de la poblacin (La medicin de la caracterstica destruye al elemento)
TIPOS DE MUESTREO
No probabilisticos Probabilisticos
i) No todos los elementos tienen posibilidad de i) Todos tienen posibilidad de integrar la
muestra
integrar la muestra
ii) Seleccin segn el criterio personal ii) Seleccin conforme las leyes del azar
iii) La precisin no se puede medir objetivamente iii) La precisin se puede medir objetivamente
TIPOS DE MUESTREOS PROB: MAS, MASIS, MAE, MAC
MAS
Cada muestra posible y cada elemento tienen igual probabilidad de integrar la muestra
Condiciones para que sea prctico:
i) o pequea y N no es muy grande
ii) Fcil acceso a los elementos y poco costoso
Cmo seleccionarla?
1) Construir el marco muestral 3) Usar una tabla de Naleatorios
2) Con o sin reposicin i) Asignar cdigos ii) Entrada iii) Direccin iv) Cdigo Elemento
MASIST
Se utiliza un intervalo uniforme que se mide en el orden o en el tiempo para garantizar que cada
elemento tuvo la misma prob de integrar la muestra
Condiciones para que sea prctico:
i) Se dispone de una lista
ii) Se tiene un proceso contnuo de produccin
Cmo seleccionarla?
1. Numerar u ordenar los elementos poblacionales
Por ejemplo: 1, 2, 3, . . . . . . . N.
2. Obtener el intervalo de muestreo
n
N
= k
3. Seleccionar al azar un punto de arranque r
k 1 s s r
4. Tomar cada k-simo elemento a partir del punto de arranque r
r, r + k, r + 2k, . . . . .
MUESTRA DE UNA V.A.
Sea X una v.a. asociada a un experimento aleatorio c
Si repetimos c n veces y hacemos que la v.a. X
i
represente la i-sima obs. de X en la i-sima
realizacin de c. Entonces las v.a. X
1,
X
2
,...,X
n
forman una muestra aleatoria de X
Estadstico
Sea X
1,
X
2
,...,X
n
una muestra aleatoria de X y h una funcin de las v.a. X
1,
X
2
,...,X
n
Definimos que Y = h(X
1,
X
2
,...,X
n
) es un estadstico
Estimador de un parmetro u (Theta)
Sea X una v.a. cuya dist. de prob. depende de u. Sea X
1,
X
2
,...,X
n
una muestra aleatoria de X y g
una funcin de las v.a. X
1,
X
2
,...,X
n
. Se define que (Theta con acento )
= g(X
1,
X
2
,...,X
n
) es un
estimador de u
La media muestral
n
X
X
n
i
= es un estimador de la media poblacional
El total muestral
X N es un estimador del total poblacional t
Varianza muestral
1 n
) x (x
S
n
2
i
2
es un estimador de o
2
Desviacin estndar muestral
2
S S = es un estimador de o
PRECISION Y EXACTITUD DE UNA ESTIMACION
El error de muestreo de una estimacin se denota y define as -
e
m
=
No son medibles pero son controlables. A menor e
m
mayor precisin
Para , - X e
m
=
Errores ajenos al muestreo
Algunas causas de estos errores son:
i) Los intrumentos de medida (cuestionarios, entrevistas, etc.) no son precisos, esto es, no miden
lo que se pretende.
ii) Entrevistados dan respuestas incorrectas.
iii) Entrevistador anota las respuestas en lugares inapropiados.
Estos errores no son medibles pero pueden ser controlados evitando la causa que los producen.
Error total. A menor error total mayor exactitud
DISTRIBUCION MUESTRAL DE UN ESTIMADOR
PROPIEDADES DE UN ESTIMADOR
1. Insesgadura. u =
u
De otra manera,
u
se llama sesgado y a la diferencia u
u
le llamaremos sesgo.
u
1
u
2
u u
u
Estimador insesgado Estimador sesgado
2. Eficiencia
Sean
u
1
y
u
2
estimadores de un mismo parmetro u
2
1
u
o <
2
2
u
o
1
u es ms eficiente que
2
u
u
1
u u
u
u
,
u
: error estndar de
, ( X ) , ( X
X X
~ ~
= =
Para un muestreo sin reposicin de una poblacin finita
l - N
n - N
n
X
=
Algunas observaciones importantes relacionadas con el
X
o son las siguientes:
i)
X
o s o
ii) A menor o menor
X
o
A mayor tamao de muestra n menor
X
o
iii) A menor
X
o mayor precisin del estimador X
Muestreo en poblaciones normales
)
n
, ( X ) , ( X
X
ormal Normal
~ ~
o
o o = =
X
N
Muestreo en poblaciones no normales
Teorema del lmite central (TLC)
)
n
X
= si la poblacin es infinita
X X N
N =
l - N
n - N
n
X
= si la poblacin es finita.
ESTIMADOR POR INTERVALO PARA Y t CUANDO o ES CONOCIDA
Cuando tomamos muestras de tamao n
(n > 30 si no Normal)
Dist poblacional de X Dist muestral de X
Normal o no Normal
Normal o aprox
Normal
o conoc
X
o
X X
Xes insesgado
X
=
Error estndar de X
n
X
= si poblacin inf
l - N
n - N
n
X
= si poblacin fin
Expresando el error de muestreo X - , en unidades del
X
o
o 1
Normal estndar
2
-
/2
z
o
0
/2
z
o
- X
Z =
X
o
Si
/2
z es un valor de Z que tiene a su derecha una rea acumulada de
2
o
y a su izquierda un
rea acumulada de
2
- 1
o
P
- 1 z
- X
z -
/2
X
/2
=
|
|
.
|
\
|
s s
P( ) - 1
x
z X - -
x
z - X -
/2 /2
= + s s ,
P( ) - 1
x
z X
x
z - X
/2 /2
= + s s
Hay una confianza del (1 - o)100% de que z X z - X
x
/2
x
/2
+ s s
O de una manera ms breve
Un estimador por intervalo de confianza del (1 - o)100% para est dado por
z X
x
/2
donde lmite inf: z - X
/2 X
o
o
y lm sup: z X
x
/2
o
o
+
Con un razonamiento similar
Un estimador por intervalo de confianza del (1 - o)100% para t est dado por
z X N
X N /2
donde
X X N
N =
Si sustituimos
X
o o
X N
o por su correspondiente frmula segn la poblacin sea infinita o finita,
llegamos a las frmulas de la pgina 23
TAMAO DE MUESTRA PARA
Queremos estimar con una confianza del (1 - o)100% de que
E - X s donde E es el mximo error permitido
Entonces hay una confianza del (1 - o)100% de que
E X E - X + s s o bien E X
Luego
x
z E
/2
=
Si sustituimos
x
o por su correspondiente frmula segn la poblacin sea infinita o finita y luego
solucionamos para n llegamos a las frmulas
ESTIMADOR POR INTERVALO PARA Y t CUANDO o ES DESCONOCIDA
Cuando tomamos muestras de tamao n
(n > 30 si no Normal)
Dist poblacional de X Dist muestral de X
Normal o no Normal
Normal o aprox
Normal
si n > 30
o desc
X
o
X X
Xes insesgado
X
=
Error estndar estimado de X
n
S
X
= si poblacin inf
l - N
n - N
n
S
X
= si poblacin fin
Expresando el error de muestreo X - , en unidades del
X
o
o 1
t de Student con n-1 g.l
2
-
/2
t
o
0
/2
t
o
t
- X
X
=
/2
t
o
es un valor de t que tiene a su derecha una rea acumulada de
2
o
Con un razonamiento similar al que hicimos con la dist Z
Un estimador por intervalo de confianza del (1 - o)100% para y t estan dados respectivamente
por
t X
X /2
y t X N
X N /2
donde
X X N
N =
Caractersticas:
1. Es una familia de distribuciones t
2. Es simtrica y de forma acampanada con
2 n ,
2 - n
n
t
y 0
t
> = o =
3.
t
o es ligeramente superior a 1
4. dist Z dist t Lim
gl
=
La dist t se parece a la distribucin Z cuando n > 30
POBLACIONES CON DIST DE BERNOULLI
Y es una variable aleatoria cualitativa con dos resultados xito (E) y fracaso (F)
Estos resultados pueden ser cuantificados as
F si 0
E si 1
Y
=
Y tiene una distribucin de Bernoulli dada por
0 y si p - 1
1 y si p
y) ( f
=
=
=
Con
Y
= p y o
Y
= ) p - 1 ( p
Parmetros:
Total poblacional lo definiremos as
t = y
N
.
i
= Ntotal de xitos en la poblacin
Proporcin poblacional
poblacin la de Tamao
poblacin la en xitos de total N
N
0
= =
t
p
Estimadores de p Y t
Proporcin muestral
muestra la de Tamao
muestra la en xitos de No.
n
X
n
Y
n
.
i
= = =
S
p
El error estndar estimado de p
S
=
finita es poblacin la si
1 N
n N
n
) p (1 p
infinita es poblacin la si
n
) p (1 p
S S
S S
p
S
donde p
S
es el estimador de p
Total muestral Error estndar estimado de N p
s
N p
s
S S
p Np
N =
Los estimadores por intervalo de confianza del ( 1 - o )100 % para p y t son
respectivamente
S
p
/2
S
z
p
y
S S
Np
/2
z
p
N
o o
S
Np
o por su correspondiente frmula, segn la poblacin sea infinita o finita,
llegamos a las frmulas de la pg 39
DETERMINACION DE n PARA p
Si en
S
p /2
z E = sustituimos
S
p
t
L
.
i
Media poblacional
=
N
t
ESTIMADOR DE Y t
Media muestral estratificada Error estndar estimado de
st
X
i
L
.
i st
X N
N
1
X
= )
N
n
(1
n
S
N
N
1
L
.
i
i
i
2
i 2
i X
st
=
Si 05 . 0
N
n
i
i
s para i = 1, 2, ... , L , podemos omitir el factor de correcin )
N
n
1 (
i
i
dentro del
radical.
Total muestral estratificado Error estndar estimado del N
st
X
i
X N X N
L
.
st i
=
st st
X X N
N =
ESTIMADOR POR INTERVALO PARA Y t
Un estimador por intervalo de confianza del 95% para y t estan dados respectivamente por
st
X st
2 X y
st
X N st
2 X N
El error mximo permitido en la estimacin de es
st
X
2 E =
El error mximo permitido en la estimacin de t es
st
X N
2 E =
SELECCIN DEL TAMAO DE LA MUESTRA PARA ESTIMAR
Hay muchas maneras para asignar un tamao de muestra n a los diversos estratos.
El mejor esquema de asignacin est influido por tres factores.
1. El nmero de elementos en cada estrato (N
i
)
2. La variabilidad de las observaciones dentro de cada estrato (o
i
)
3. El costo por obtener una observacin de cada estrato (c
i
)
Asignacin de costo mnimo y menor error de muestreo
El tamao de muestra requerido n para estimar con error mximo permitido E y un nivel de
confianza del 95% es
S N
4
E
N
c S N c / S N
n
L
2
i i
2
2
i i
L
i i
L
i i
+
|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|
= ,
c / S N
c / S N
n n
i i
L
i
i i i
i
=
Asignacin de Neyman
Si c
1
= c
2
= . = c
L
= c, entonces los trminos de costos en la frmula de asignacin de costo
mnimo se cancelan y queda as
S N
4
E
N
S N
n
L
2
i i
2
2
L
i i
2
+
|
|
.
|
\
|
|
|
.
|
\
|
= ,
=
L
i i
i i
S N
S N
n n
i
Asignacin proporcional
Si c
1
= c
2
= . = c
L
= c y S
2
1
= S
2
2
= . = S
2
L
= S
2
Se cancelan las desviaciones estndar
en la frmula de asignacin Neyman y queda
S
4
E
N
S N
n
2
2
2
+
|
|
.
|
\
|
= donde S
2
es la varianza comn ,
|
.
|
\
|
= =
N
N
n
N
N
n n
i
L
i
i
i
MUESTREO ALEATORIO POR CONGLOMERADOS
Consiste en dividir la poblacin en colecciones de elementos que llamaremos conglomerados Por
lo tanto al aplicar este mtodo se logra fcilmente la construccin de un marco que liste todos los
conglomerados y la reduccin del costo por observar un elemento.
El muestreo por conglomerados es menos costoso que el muestreo aleatorio estratificado o
simple si se cumple lo siguiente:
1. No se encuentra disponible o es muy costoso obtener un buen marco que liste los elementos
de la poblacin.
2. El costo por obtener observaciones se incrementa con la distancia que separa los elementos.
=
=
i
m
1 j
ij
x
i
t
M =
N
M
n
i
m m =
n
m
n
i
Parmetros:
Total poblacional
t =
t
N
i
Media poblacional
=
M
t
ESTIMADOR DE Y t
Media muestral por conglomerado Error estndar estimado de
c
X
m
X
n
n
i
i
c
=
) X
M n
N
n
- 1
1 - n
m -
n
(
2
c i i
2 X
c
|
|
|
.
|
\
|
=
Si
N
n
s 0.05 podemos aproximar el factor ( 1 -
N
n
) dentro del radical a 1
Total muestral por conglomerado Error estndar estimado del M
c
X
|
|
|
|
|
.
|
\
|
=
n
m
n
M
i
i
c
X M
c c
X X M
M =
M puede ser estimado con m N
~ M
ESTIMADOR POR INTERVALO PARA Y t
Un estimador por intervalo de confianza del 95% para y t estan dados respectivamente por
2
c
X c
X y
c
X M
2 X M
c
El error muestral mximo permitido en la estimacin de es
c
X
2 E =
El error muestral mximo permitido en la estimacin de t es
c
X M
2 E =
SELECCIN DEL NUMERO DE CONGLOMERADOS EN LA MUESTRA PARA
El nmero de conglomerados en la muestra n para estimar con error mximo permitido E y un
nivel de confianza del 95% es
S
4
E
M N
S N
2
c
2
2
2
c
+
|
|
.
|
\
|
= n
donde
( )
1 - n
X m -
S
n
2
c i i
2
c
t
= puede calcularse de una muestra preliminar y M puede ser
estimado por m con la misma muestra
PRUEBA DE HIPOTESIS
El problema de decisin a estudiar:
i) 2 hiptesis
ii) 2 alternativas
PROCEDIMIENTO DE LA PRUEBA ACERCA DE
1. FORMULACION DE LAS HIPOTESIS
2.
Hiptesis estadstica. Es un supuesto acerca del valor de un parmetro
Consideremos una accin y su efecto
Hiptesis nula (H
0
) Ausencia de efecto
Hiptesis alterna (H
1
) Presencia de efecto
Tipos de pruebas
Unilaterales
Cola der Cola izq
H
0
: =
0
( >
0
)
H
0
: =
0
( s
0
)
H
1
: <
0
H
1
: >
0
Bilaterales
H
0
: =
0
H
1
: =
0
2. ELEGIR UN NIVEL DE SIGNIFICACION
Error I: Seleccionar A
1
cuando H
0
es V
P ( error I ) s o o es el nivel de significacin Los ms usuales o = 0.01 o = 0.05
3. IDENTIFICAR EL ESTADISTICO DE PRUEBA Y ESTABLECER UNA REGLA DE DECISION
Como X-
0
= 47.30-44 = 3.30 qq/mz
H
0
: X-
0
no es signif
H
1
: X-
0
es signif
Cmo saber si X-
0
es signif ?
X
0
X
= Z o t Estadstico de prueba
Es Z o t es signif distinto de cero ?
Establezcamos un valor crtico de Z o t cuyo valor dependa de o as
Cola der Cola izq
0
z Z o t -
z 0
Z o t
t
Es cero Es mayor Es menor Es cero
A R R A
Dos colas Ej 2.2 Poblacin no normal, o desc, n >
30
o 1
2
= 0.05
-
/2
z
o
0
/2
z
o
Z o t 0 1.65 Z
-
/2
t
o
/2
t
o
Es cero Es mayor
Es menor Es cero Es mayor A R
R A R
Como decir que Z o t es distinto de cero equivale a rechazar H
0
y decir que Z o t es cero equivale a
"aceptar" H
0
la regla de decisin puede resumirse como aparece en la pg 89
4. TOMAR UNA MUESTRA ALEATORIA Y DETERMINAR EL VALOR DEL ESTADISTICO DE
PRUEBA
En base a una muestra valoramos que
X
0
X
que puede ser igual a Z o t
5. SELECCIONAR UNA ALTERNATIVA
Rechazo H
0
Aceptacin de H
1
No rechazo H
0
"Aceptacin" de H
0
PROCEDIMIENTO DE LA PUEBA ACERCA DE p
Ahora como la proporcin poblacional es una media poblacional, el procedimiento para probar
hiptesis acerca de p ser el mismo que se utiliz para .
Como las hiptesis sern suposiciones acerca de p, el estadstico de prueba ser naturalmente la
proporcin muestral p
S
pero estandarizada, esto es, la diferencia p
S
- p
0
expresada en unidades
del error estndar de p
S
donde p
0
es el valor supuesto de p
Si n es suficientemente grande, esto es, np
0
> 5 y n (1 p
0
) > 5
entonces el estadstico de prueba es
p - p
S
p
0 S
o
= Z donde
n
Y
p
S
o
o = =
) p - 1 ( p
n
0 0
si la poblacin es infinita
o
n
Y
p
S
o
o =
1 - N
n - N
=
) p - 1 ( p
n
0 0
1 - N
n - N
si la poblacin es finita.