Professional Documents
Culture Documents
Estimacin Puntual
Propiedades deseables de los estimadores
Estimaciones puntuales (media, proporcin, varianza)
Introduccin
Inferencia Estadstica, Estadstica Inductiva, Teora de Muestras
que describen
Existe una
Parmetros
Parmetros
Poblacionales
Poblacionales
Poblacin
Poblacin
que se usan
para estimar
de la que el
investigador
selecciona una
Muestra
Muestra
Aleatoria
Aleatoria
Simple
Simple
Estadsticos
Estadsticos
que genera unos
Datos
Datos
Numricos
Numricos
usados para
evaluar unos
Estimacin puntual
Una estimacin puntual de algn parmetro poblacional es un valor
nico del estadstico . Por ejemplo, el valor x de la estadstica X calculado
a partir de una muestra de tamao n, es una estimacin puntual del
parmetro poblacional .
El estadstico que se utiliza para obtener una estimacin puntual recibe
el nombre de estimador o funcin de decisin. Generalmente muestras
diferentes conducen a acciones o estimaciones diferentes. No se espera
que un estimador obtenga sin error el valor del parmetro poblacional,
sino que no se aleje mucho del valor real.
Es posible definir muchas estadsticas para estimar un parmetro
desconocido . Entonces, cmo seleccionar un buen estimador de ?
Cales son los criterios para juzgar cundo un estimador de es
"bueno" o "malo"?. Por ejemplo, pudo elegirse la mediana muestral o la
moda para estimar el valor de la media poblacional, en qu nos basamos
para elegir como estimador la media muestral?
Estimacin puntual
Propiedades Deseables de los Estimadores Puntuales:
Bsicamente para que un estimador sea bueno, se desea que la varianza del
estimador sea lo ms pequea posible, mientras que la distribucin de
muestreo debe concentrarse alrededor del valor del parmetro.
Estimadores Insesgados (Centrados):
Se dice que la estadstica = H(X 1, X2, ..., Xn) es un estimador insesgado del
Estimacin puntual
Estimadores Consistentes:
Es razonable esperar que un buen estimador de un parmetro , sea cada
vez mejor conforme crece el tamao de la muestra y la informacin se vuelve
ms completa.
La distribucin de muestreo de un buen estimador se encuentra cada vez
ms concentrada alrededor del parmetro . Si un estimador es consistente,
converge en probabilidad al valor del parmetro que est intentando estimar
conforme el tamao de la muestra crece. Esto implica que la varianza de un
estimador consistente disminuye conforme n crece.
Se dice que es un estimador consistente de si:
limn =
Estimacin puntual
Estimadores Eficientes (Insesgados de Varianza Mnima):
El hecho de que un estimador sea centrado no garantiza que sus
realizaciones caigan cerca del valor del parmetro, hace falta adems que
tenga la varianza pequea.
La varianza de un estimador insesgado es la cantidad ms importante para
decidir qu tan bueno es el estimador para estimar el parmetro .
Sean 1 y 2 cualesquiera dos estimadores insesgados de . Se dice que 1 es un
estimador ms eficiente de que 2, si V (1 ) V (2 )
, cumplindose la
desigualdad en el sentido estricto para algn valor de . El cociente
e=
V( 1 )
V(2 )
Estimacin puntual
Estimacin puntual
Estimacin de la Media Poblacional:
La media muestral es un estimador centrado y consistente de la media
poblacional. Este resultado es vlido sin importar la distribucin de
probabilidad de la poblacin de inters, siempre y cuando la varianza
tenga un valor finito.
E[ X ] =
V( X ) =
n
Estimacin puntual
1 n
X = xi
n i=1
n
1 n
1
1 n
1
E[ X ] = E[ xi ] = E[ xi ] = E[ xi ]= n
n i=1
n
n i=1
n
i=1
E[ X ] =
c. q. d
Es centrado
n
1 n
1
1 n
1
V( X ) = V( xi ) = 2 V( xi ) = 2 V( xi )= 2 n 2
n i=1
n
n i=1
n
i=1
1
V( X ) = 2 c. q. d.
n
2
= 0 Es consistente
limn V( X ) = limn
n
Estimacin puntual
Ejemplo:
Los datos siguientes representan los pesos en gramos del contenido de 16
cajas de cereal que se seleccionaron al azar de un proceso de llenado con
el propsito de verificar el peso promedio.
506 508 499 503 504 510 497 512 514 505 493 496 506 502
509 496
Calcular la estimacin puntual para el peso promedio.
Solucin:
1 16
X
x i 503.75
16 i 1
gramos.
Estimacin puntual
Estimacin de la Varianza Poblacional:
Cuando se desconoce la media poblacional , debemos sustituir este
parmetro por su estimador muestral, y el estimador a usar para la
varianza poblacional, que es centrado o insesgado sin importar cul sea la
distribucin de la poblacin de inters, es la cuasivarianza muestral S2.
Demostracin:
2
2
= S =
1
Xi X
n - 1 i 1
n X i2
i 1
X
i 1
n(n 1)
2 4
2 4
2
V( S ) =
con lo que limn V( S ) = limn
=0
n
n
2
Es consistente
Estimacin puntual
2
1 n
1 n
2
E[ S ] = E
(X i - ) - ( X - ) =
( X i - X ) E
(n - 1) i=1
(n - 1) i=1
n
n
n
1
=
E ( xi - )2+ ( X - )2- 2 ( xi - )( X - ) =
(n - 1) i=1
i=1
i=1
1
=
E
(n - 1)
1
E
(n - 1)
+ n( X - ) - 2( X - ) ( xi - ) =
i=1
i=1
x
i
n
i=1
1
=
E ( xi - )2 - n( X - )2 =
(n - 1) i=1
1 n
2
2
=
E[(
]
n
E[(
X
] =
)
)
x
i
(n - 1) i=1
( x - )
2
2
1
2
=
(n - n
)=
(n - 1) = 2
(n - 1)
n
(n - 1)
E[ S 2 ] = 2 c. q. d. Es centrado
Estimacin puntual
Si hubisemos utilizado como estimador, la varianza muestral (desconociendo
la media poblacional), no
sera una estimacin
insesgada o centrada:
n
n
1
( xi - X
n i=1
E[ 2 ] = E
2
1
2
) E ( xi - ) - ( X - ) =
n i 1
n
n
n
1
2
2
= E[ ( xi - ) + ( X - ) -2 ( xi - )( X - ) ] =
n
i=1
i=1
i=1
n
n
1
2
2
= E[ ( xi - ) +n( X - ) - 2( X - ) ( xi - ) ] =
n
i=1
i=1
xi
1
= E[ ( xi - )2+n( X - )2 - 2n( X - )( X - )] ya que X = i=1
n
n
i=1
n
1
2
2
= E[ ( xi - ) -n( X - ) ] =
n
i=1
n
=
=
1 n
1
[ E[( xi - )2 ] - n E[( X - )2 ]] =
n i=1
n
2
2
2
1 n
)= 1 n 2 - = 2 -
2
E[(
]
)
xi
n i=1
n
n
n
n
E[ 2 ] = 2 -
2 No es centrado y su sesgo es 2
n
n
Estimacin puntual
Ejemplo:
El cobre es un micronutriente requerido por la mayora de las plantas. Su
concentracin en una planta se mide analizando las cenizas obtenidas al
quemarla completamente. En un estudio de la variabilidad de la
concentracin de cobre en las plantas de la cuenca del Jarama, se
seleccion una muestra de 16 plantas. Se obtuvieron los siguientes datos
(en partes por milln):
5 3 34 18 27 14 8 50 38 43 35 20 70 25 60 19
Calcular una estimacin puntual para la variabilidad de la concentracin.
Solucin:
S2
1
Xi X
n 1 i 1
n
i 1
n xi2
i 1
xi
n n 1
377.2958
Estimacin puntual
Estimacin de la Proporcin:
Tenemos una poblacin dividida en dos subconjuntos, en funcin de una
caracterstica determinada, de forma que la proporcin de la poblacin
que posee la caracterstica es p, y la de los que no la poseen es 1-p.
Tratamos de estimar el valor de p. El estadstico p dado por la expresin
siguiente, es un estimador centrado y consistente de la proporcin
poblacional.
casos favorables
p
casos totales
Demostracin:
1
E[p ] = E
n
x
i
i=1
1
n E[ xi ] = p c. q. d. Es centrado
n
V(p ) =
1
2
x
i
1
2
E[p ] =
V( x )= n
i
1
1
E[X] = n p = p con la binomial
n
n
n p (1 - p) =
p(1 - p)
n
n i=1
i=1
1
p(1 - p)
p(1 - p)
X
V(p ) = V
con la binomial limn
= 0 c. q. d. Es consistente
= 2 n p (1 - p) =
n
n
n
n
n
Estimacin puntual
Ejemplo:
Los huevos de la mosca azul producen infecciones al ser depositados en la
sangre de un animal. Se efectu un experimento para controlar el
crecimiento de la poblacin de este tipo de moscas. Las pupas fueron
sometidas a radiacin al objeto de esterilizar al mayor nmero posible de
machos. Cada hembra se emparej con un nico macho. Se estudiaron 500
emparejamientos, de los cuales 415 resultaron estriles. Calcular una
estimacin puntual de la proporcin poblacional de machos estriles.
Solucin:
415
p
0.83
500
X N( , )
Z=
N(0,1)
n
n
P - z < Z < z = 1 -
2
P - z
< X - < z
= 1 -
2
2
n
n
P - z
+ X > > z
+ X = 1 -
2
2
n
n
- z <
< z = 1 -
2
2
P - z
- X < - < z
- X = 1 -
2
2
n
n
P X - z
< < X + z
= 1 -
2
2
n
n
Por tanto:
Si X es la media de una m.a.s. de tamao n de una poblacin, aproximadamente
normal, con varianza conocida 2, el intervalo de confianza de (1 - ) 100% para
la media poblacional es :
X - z
< < X + z
2
2
n
n
donde z/2 es el valor de z a la derecha del cual se tiene un rea de /2
16 i 1
L2= x z 2
5
16
= 501.3
= 503.75 + 1.96 *
= 506.2
16
n
(X -)
(2)
(X -)
S
(3)
(n-1)
grados de libertad, sobre el cual se
(
X
)
P - t <
< t = 1 -
2
2
S
y despus de
X - t
S
n
< < X + t
S
n
donde t/2 es el valor t con (n-1) grados de libertad, lo que deja un rea de /2 a
la derecha.
0.283
7
lo cual se reduce a:
0.283
7
1
2
1 2
aproximadamente en forma normal, con media
y
desviacin tpica
2
1- X 2
1 +2
n1
n2
Varianzas conocidas
Muestras grandes
Observaciones pareadas
Varianzas desconocidas
Muestras pequeas
Var. iguales
Var. distintas
Z=
( X 1 - X 2 ) - ( 1 - 2 )
2
1 +2
n1
n2
1
2
1
2
( X 1 - X 2 ) - z
+
< 1 - 2 < ( X 1 - X 2 ) + z
+
2
2
n1
n2
n1
n2
donde z/2 es el valor de z que tiene un rea de /2 a la derecha.
Si las poblaciones son normales, el grado de confianza es exacto. Para
poblaciones que no son normales, el Teorema del Lmite Central
proporciona una buena aproximacin para muestras de tamao
donde Sp es
Sp
n1
n2
( n1 - 1) S 12 + ( n2 - 1) S 2 2
=
n1 + n2 - 2
( x1 - x 2 ) - t S p
2
donde
Sp
1
n1
1
n2
< ( 1 - 2 ) < ( x1 - x 2 ) + t S p
2
1
n1
1
n2
( n1 - 1) S 12 + ( n2 - 1) S 2 2
=
n1 + n2 - 2
n1 1 s 21 n2 1 s 2 2
=
n1 n2 2
9 * 1.611 9 * 1.533
18
1.5722
Sp = 1.2538
1 1
2
(1-)100% = 95% = 0.05 /2 = 0.025
0.447
x
x
10
10
10
1
2
t0.025,18 = 2.101
= 6.71 - 4.72 = 1.99
Entonces, el intervalo de confianza al 95% para la diferencia de medias es:
x 2 t Sp
L2 =
x 2 t Sp
1 1
n1 n2
1
1
n1 n2
( X 1 - X 2 ) - ( 1 - 2 )
2
S1 + S 2
n1
n2
n + n
1
2
v=
Aproximaci on de Welch
2
S 12
S 22
n
n
1 + 2
n1 - 1
n2 - 1
Dado que v rara vez es un entero, se redondea al entero ms cercano.
( x1 - x 2 ) - t
S1 + S 2 <( - )<( - )+
x1 x 2
t
1
2
2
n1
n2
v=
S 12 S 2 2
n + n
2
1
2
S
S2
n
n
1 + 2
n1 - 1
n2 - 1
2
1
Aproximacion de Welch
S1 + S 2
n1
n2
Tiempo (min.)
103 94 110 87
98
Calcule el intervalo de confianza del 90% para la diferencia entre los tiempos
promedio de duracin de las pelculas que producen las dos compaas.
Suponga que el tiempo de duracin tiene una distribucin aproximadamente
normal.
Solucin:
n1 = 5
t0.05,7 = 1.833
x1 x 2 = 98.4 - 110.7 = -12.31
n2 = 7
(1-)100% = 90% = 0.10 /2 = 0.05
1
s12= 4 (21.16+19.36+134.56+129.96+0.16)=76.3
s2 =
2
1
4
(188.08+824.51+151.94+350.22+4132.65+515.94+53.08)=1036.07
2
s12 s2 2
76
.
3
1036
.
07
n n
5
7
2
1
2
2 2
2 2
s2
76.3
1036.07
s1
n
5
7
n1
2
4
6
n1 1
n2 1
L 1 = x1 x 2 t 2
L2= x1 x 2 t 2
15.26 148.01 2
58.217 3651.16
s1
s
2
n1
n2
2
s1
s
2 = -12.314 + 1.833*12.78= 11.11
n1
n2
26657.09
7.186 7
3709.38
1
+ 2
d =
n1
n2
Se estima d2 por Sd2, la varianza de las diferencias que constituyen la
d
muestra. El estimador puntual de d lo representa , la media de las diferencias
que constituyen la muestra. Una vez obtenidas las diferencias, su estudio se
reduce al caso de estimacin de la media desconocida de una poblacin
aproximadamente normal, desconocida su varianza (ya visto anteriormente).
T=
d - d
Sd
n
que sigue una distribucin t con (n-1) grados de libertad. Obtener el intervalo
de confianza es la rutina de siempre.
Si d y Sd son la media y la desviacin tpica de las diferencias normalmente
distribudas de n pares aleatorios de mediciones, un intervalo de confianza del
(1 - ) 100% para d = 1 - 2 es :
d - t
Sd
S
< d < d + t d
2
n
n
Antes
Despus
Diferencia
50
41
50
18
32
82
45
37
64
18
46
82
18
64
73
64
77
32
45
54
45
23
18
10
45
36
11
36
27
12
54
45
Sd
n=
Sd
15.79
40.583 - 2.201*
12
= 30.5504
15.79
12
= 50.616
xi =
0 (1 p )
X = xi B(n, p)
i=1
n
n
2
p
X
-p
n
N(0,1) para n grande
p(1 - p)
n
z=
p - p
=
pq
n
X
-p
n
N(0,1)
p (1 - p)
n
P - z <
-p
n
< z (1 - ) para n grande
2
p(1 - p)
p(1 - p)
n
p(1 - p)
X
< p < + z
2
n
n
p(1 - p)
= 1-
Por tanto los extremos del intervalo de confianza que obtenemos, dependeran
del parmetro desconocido. Cmo solucionarlo?
L1 = p - z
p (1 - p) X
= -z
2
n
n
p (1 - p)
n
L2 = p + z
p (1 - p) X
= z
2
n
n
p (1 - p)
n
P p - z
2
p (1 - p )
< p < p + z
2
n
p (1 - p )
1-
p - z
p (1 - p )
< p < p + z
2
n
p (1 - p )
n
415
0.83
500
L1 p z
L2 p z
p 1 p
0.83 * (1 0.83)
0.83 1.96
0.83 3.2926 *10 2 0.7971
n
500
p 1 p
0.83 * (1 0.83)
0.83 1.96
0.83 3.2926 * 10 2 0.8629
n
500
n2
p 1- p 2 = p1 - p 2
y varianza:
2
p 1- p 2
p1 (1 - p1 )
n1
p 2 (1 - p 2 )
n2
p 2 (1 - p 2 )
n2
Siguiendo todos los mismos pasos que en los dems casos, obtenemos:
Si p1 y p 2son las proporciones de xitos en muestras aleatorias de tamaos n1 y n2
respectivamente, un intervalo aproximado de confianza del (1- ) 100% para la
diferencia entre dos parmetros binomiales p1 - p2 es:
( p 1 - p 2 ) - z
p 1 (1 - p 1 )
n1
p 2 (1 - p 2 )
n2
< ( p1 - p 2 ) < ( p 1 - p 2 ) + z
p 1 (1 - p 1 )
n1
p 2 (1 - p 2 )
n2
p 1 1 p1 p 2 1 p 2
0.82 * 0.18 0.77 * 0.23
0.03436
n1
n2
250
300
L2 p 1 p 2 z
p 1 1 p 1 p 2 1 p 2
(n - 1) S
que, como ya sabemos, sigue una distribucin 2 con (n-1) grados de libertad
cuando las muestras se seleccionan de una poblacin normal. Siguiendo todos
los mismos pasos que en casos anteriores, obtenemos:
P < < = 1 -
1 2
1
2
(n - 1) S
<
2
<
2
= 1-
P <
1 2
(n - 1) S 2
(n - 1) S 2
< 2 = 1 -
2
2
(n - 1) S 2
(n
1)
S
P
< 2 <
= 1-
2
2
1
2
2
(n - 1) s 2
(n - 1) s 2
2
< <
2
2
1-
2
2
16
Solucin:
n x i xi
2
2
n
xi 19407
1
i 1
i 1
S
377.2958
xi
i 1
n 1 i 1
n n 1
16
n 1 S 2
2 0.05,15
15 * 377.2958
226.41
24.996
L2
n 1 S 2
2 0.95,15
x
i 1
15 * 377.2958
779.43
7.261
469
F=
S
2
1
2
2
S2/ 2
2
S 1 / 1 de libertad.
S
P f 1 ( v1,v2 ) < 12 22 < f ( v1,v2 ) = 1 -
2
2
S2 1
f 1 ( v1,v2 )
2
2
2
2
S
2
2
P f 1 ( v1,v2 ) 2 < 2 < f ( v1,v2 ) 22 = 1 -
2
2
S1 1
S1
2
2
2
1
S1 1
S1
> 2>
= 1-
2
2
S 2 2 f ( v1,v2 ) S 2
2
P
f ( v1,v2 )
2
2
2
2
S1 1
S
1
< 2 < f ( v2 ,v1 ) 2 = 1 -
2
2
S2 2
S2
1
S1
1 < S1
<
f ( v2 ,v1 )
2
2
2
S 2 f ( v1,v2 ) 2 S 2 2
2
donde f/2 (v1,v2) es el valor f con v1 = (n1 -1) y v2= (n2-1) grados de libertad con un
rea de /2 a la derecha, y f/2 (v2,v1) es un valor similar f con v2= (n2-1) y v1=(n11) grados de libertad.
Un intervalo de confianza del (1-)100% para 1/ 2 se obtiene al sacar la raz
cuadrada de cada punto extremo del intervalo para 12/ 22
v1,v 2
1
f0.05 4,6
1
0.221 f
0.05 (6,4) = 6.16
4.53
L2
S1
S2
* f
v2 ,v1
76.3
* 6.16 0.454
1035.9
estimacin
puntual
dist . muestral
del est. puntual
error estndar
del est. puntual
L = x z
2
n
Si desconocemos y la reemplazamos por S obtenemos:
Estimador puntual X
Distribucin del estimador puntual: tn-1
Varianza del estimador puntual:
S2/n
Desviacin tpica de X: S n
L = x t
S
n
Tamao de la muestra
Muchas veces estamos interesados en determinar el tamao de la muestra
necesario para obtener, con una confianza del (1-) 100%, una estimacin
del parmetro poblacional , de tal manera que el error de estimacin no
supere un determinado valor de error permitido .
Hemos comentado que la anchura del intervalo de confianza, alrededor
del estimador puntual del parmetro, nos da una medida de la precisin de
este. Por tanto, para la determinacin del tamao muestral en cuestin
basta coger la semilongitud del intervalo de confianza e igualarlo al error
mximo permitido, despejando cul ser el valor de n que verifique esa
igualdad.
Si se utiliza X como estimacin de , se puede tener una confianza del
(1-) 100% de que el error no exceder una cantidad especificada
cuando el tamao de la muestra es:
2
z
n= 2
Tamao de la muestra
Queremos que X , es decir X X
Con una confianza del (1-) 100% sabemos que
X z
n
n
2
X z
2
luego
z
2
n=
Tamao de la muestra
En la estimacin de un intervalo de confianza para la proporcin, hemos
visto que si
p X n
se utiliza como una estimacin de p, se puede tener una confianza del (1-)
100% de que el error cometido no exceder de
p (1 - p )
n
p (1 - p )
=
n
( Z )2 p (1 - p )
2
Tamao de la muestra
La expresin anterior puede resultar paradjica ya que para calcular p
debemos conocer n porque p X n . Tenemos entonces dos opciones:
ya
Tamao de la muestra
Ejemplo:
Se estudia la efectividad de un nuevo medicamento en el tratamiento de
cierta enfermedad. Se suministra el medicamento a 14 pacientes de los cuales
13 reaccionan positivamente. Dar el tamao de la muestra necesario para
obtener una confianza del 99% de que el error de estimacin de p no
exceder de 2 % (0.02)
Solucin:
Si suponemos que tenemos una buena estimacin previa de p:
p =
(1 - )100% = 99%
13
= 0.9286
14
= 0.01
z = 2.58
2
= 0.02
n=
( z )2 p (1 - p )
2
(2.28 )2 (0.9286)(0.0714)
2
(0.02 )
= 1103.33 1104
Tamao de la muestra
Si lo hacemos sin considerar la estimacin previa de p, sino considerando el
mximo:
2
( z )2
(2.58
)
n= 2 2 =
= 4160.25 4161
2
4
4 (0.02 )
Como podemos apreciar es un tamao de muestra considerablemente
superior al caso anterior.
Ejercicios
Ejercicio 6.1
Un fabricante de televisores est desarrollando un nuevo modelo de
televisor en color, y para este fin se pueden utilizar dos tipos de
esquemas transistorizados, cuyos tiempos de vida se suponen
normalmente distribuidos. El fabricante selecciona una muestra de
esquemas transistorizados del primer tipo de tamao 12, y otra del
segundo tipo de tamao 11. Los datos muestrales respecto a la vida de
cada esquema son los siguientes:
X 1 1400h
S1 30h
X 2 1500h
S2 17h
Se pide:
a) Construir un intervalo de confianza del 95% para la diferencia de
vida media de cada tipo de esquema.
b) Construir un intervalo de confianza del 90% para el cociente de
varianzas de la vida de cada tipo de esquema.
Ejercicios
Ejercicio 6.2
Una agencia de alquiler de automviles necesita estimar el nmero
medio de kilmetros diarios que realiza su flota de automviles; a tal fin,
en varios das de la semana toma los recorridos de 100 vehculos de su
flota y obtiene que la media muestral es de 165 Km/da, y la
cuasidesviacin tpica muestral de 6 Km/da. Se pide:
a) Bajo la hiptesis de normalidad de la caracterstica de estudio (n de
km por da), construir un intervalo de confianza para la media de dicha
distribucin a un nivel de confianza del 95%.
b) Bajo la misma hiptesis de normalidad que en a), construir un
intervalo de confianza del 90% para la varianza de dicha distribucin.
Ejercicios
Ejercicio 6.3
En un cruce de Melanogaster se han obtenido 60 moscas con alas
vestigiales de un total de 300. Se pide:
a) Encontrar un intervalo de confianza al 95% para la proporcin de
moscas con alas vestigiales entre los individuos resultantes de un gran
nmero de cruces como este.
b) Qu nmero de cruces hay que realizar de modo que la proporcin de
moscas con alas vestigiales entre los individuos resultantes de un gran
nmero de cruces y la de la muestra difiera en valor absoluto en menos
de 0.01 con una probabilidad del 95%?