You are on page 1of 67

Estimacin.

Estimacin Puntual
Propiedades deseables de los estimadores
Estimaciones puntuales (media, proporcin, varianza)

Estimacin por intervalos


Estimacin de la media y diferencias de medias
Estimacin de la proporcin y diferencia de proporciones
Estimacin de la varianza y cociente de varianzas

Relacin entre ambas estimaciones


Tamao de la muestra
Ejercicios

Introduccin
Inferencia Estadstica, Estadstica Inductiva, Teora de Muestras
que describen
Existe una

Parmetros
Parmetros
Poblacionales
Poblacionales

Poblacin
Poblacin

que se usan
para estimar

de la que el
investigador
selecciona una
Muestra
Muestra
Aleatoria
Aleatoria
Simple
Simple

Estadsticos
Estadsticos
que genera unos
Datos
Datos
Numricos
Numricos

usados para
evaluar unos

Estimacin puntual
Una estimacin puntual de algn parmetro poblacional es un valor
nico del estadstico . Por ejemplo, el valor x de la estadstica X calculado
a partir de una muestra de tamao n, es una estimacin puntual del
parmetro poblacional .
El estadstico que se utiliza para obtener una estimacin puntual recibe
el nombre de estimador o funcin de decisin. Generalmente muestras
diferentes conducen a acciones o estimaciones diferentes. No se espera
que un estimador obtenga sin error el valor del parmetro poblacional,
sino que no se aleje mucho del valor real.
Es posible definir muchas estadsticas para estimar un parmetro
desconocido . Entonces, cmo seleccionar un buen estimador de ?
Cales son los criterios para juzgar cundo un estimador de es
"bueno" o "malo"?. Por ejemplo, pudo elegirse la mediana muestral o la
moda para estimar el valor de la media poblacional, en qu nos basamos
para elegir como estimador la media muestral?

Estimacin puntual
Propiedades Deseables de los Estimadores Puntuales:
Bsicamente para que un estimador sea bueno, se desea que la varianza del
estimador sea lo ms pequea posible, mientras que la distribucin de
muestreo debe concentrarse alrededor del valor del parmetro.
Estimadores Insesgados (Centrados):
Se dice que la estadstica = H(X 1, X2, ..., Xn) es un estimador insesgado del

parmetro , si E . Es decir, si los valores del estimador se centran


alrededor del parmetro en cuestin.

Estimacin puntual
Estimadores Consistentes:
Es razonable esperar que un buen estimador de un parmetro , sea cada
vez mejor conforme crece el tamao de la muestra y la informacin se vuelve
ms completa.
La distribucin de muestreo de un buen estimador se encuentra cada vez
ms concentrada alrededor del parmetro . Si un estimador es consistente,
converge en probabilidad al valor del parmetro que est intentando estimar
conforme el tamao de la muestra crece. Esto implica que la varianza de un
estimador consistente disminuye conforme n crece.
Se dice que es un estimador consistente de si:

limn =

que es equivalente a limn V( ) 0

Estimacin puntual
Estimadores Eficientes (Insesgados de Varianza Mnima):
El hecho de que un estimador sea centrado no garantiza que sus
realizaciones caigan cerca del valor del parmetro, hace falta adems que
tenga la varianza pequea.
La varianza de un estimador insesgado es la cantidad ms importante para
decidir qu tan bueno es el estimador para estimar el parmetro .
Sean 1 y 2 cualesquiera dos estimadores insesgados de . Se dice que 1 es un
estimador ms eficiente de que 2, si V (1 ) V (2 )
, cumplindose la
desigualdad en el sentido estricto para algn valor de . El cociente

e=

V( 1 )
V(2 )

se llama eficiencia relativa de 1respecto a 2, y su valor est entre 0 y 1


(0 e 1). Si e est prximo a 0 1 es mejor que 2.

Estimacin puntual

Estimacin puntual
Estimacin de la Media Poblacional:
La media muestral es un estimador centrado y consistente de la media
poblacional. Este resultado es vlido sin importar la distribucin de
probabilidad de la poblacin de inters, siempre y cuando la varianza
tenga un valor finito.

E[ X ] =

V( X ) =
n

en donde y 2 son la media y la varianza de la distribucin de la


poblacin, a partir de la cual se obtuvo la muestra. Ntese que
conforme el tamao de la muestra crece, la precisin de la media
muestral para estimar la media poblacional aumenta (es un estimador
consistente).

Estimacin puntual
1 n
X = xi
n i=1
n
1 n
1
1 n
1
E[ X ] = E[ xi ] = E[ xi ] = E[ xi ]= n
n i=1
n
n i=1
n
i=1

E[ X ] =

c. q. d

Es centrado

n
1 n
1
1 n
1
V( X ) = V( xi ) = 2 V( xi ) = 2 V( xi )= 2 n 2
n i=1
n
n i=1
n
i=1
1
V( X ) = 2 c. q. d.
n
2

= 0 Es consistente
limn V( X ) = limn
n

Estimacin puntual
Ejemplo:
Los datos siguientes representan los pesos en gramos del contenido de 16
cajas de cereal que se seleccionaron al azar de un proceso de llenado con
el propsito de verificar el peso promedio.
506 508 499 503 504 510 497 512 514 505 493 496 506 502
509 496
Calcular la estimacin puntual para el peso promedio.
Solucin:

1 16
X
x i 503.75

16 i 1

gramos.

Estimacin puntual
Estimacin de la Varianza Poblacional:
Cuando se desconoce la media poblacional , debemos sustituir este
parmetro por su estimador muestral, y el estimador a usar para la
varianza poblacional, que es centrado o insesgado sin importar cul sea la
distribucin de la poblacin de inters, es la cuasivarianza muestral S2.

Demostracin:

2
2
= S =

1
Xi X
n - 1 i 1

n X i2
i 1

X
i 1

n(n 1)

2 4
2 4
2
V( S ) =
con lo que limn V( S ) = limn
=0
n
n
2

Es consistente

Estimacin puntual

2
1 n
1 n
2
E[ S ] = E
(X i - ) - ( X - ) =
( X i - X ) E

(n - 1) i=1

(n - 1) i=1

n
n
n

1
=
E ( xi - )2+ ( X - )2- 2 ( xi - )( X - ) =
(n - 1) i=1
i=1
i=1

1
=
E
(n - 1)

1
E
(n - 1)

+ n( X - ) - 2( X - ) ( xi - ) =
i=1
i=1

x
i

( xi - )2 + n( X - )2 - 2n( X - )( X - ) ya que X = i=1

n
i=1

1
=
E ( xi - )2 - n( X - )2 =
(n - 1) i=1

1 n
2
2
=
E[(

]
n
E[(
X

] =
)
)
x
i

(n - 1) i=1

( x - )

2
2
1

2
=
(n - n
)=
(n - 1) = 2
(n - 1)
n
(n - 1)

E[ S 2 ] = 2 c. q. d. Es centrado

Estimacin puntual
Si hubisemos utilizado como estimador, la varianza muestral (desconociendo
la media poblacional), no
sera una estimacin
insesgada o centrada:
n
n
1
( xi - X
n i=1

E[ 2 ] = E

2
1
2
) E ( xi - ) - ( X - ) =
n i 1

n
n
n
1
2
2
= E[ ( xi - ) + ( X - ) -2 ( xi - )( X - ) ] =
n
i=1
i=1
i=1
n
n
1
2
2
= E[ ( xi - ) +n( X - ) - 2( X - ) ( xi - ) ] =
n
i=1
i=1

xi

1
= E[ ( xi - )2+n( X - )2 - 2n( X - )( X - )] ya que X = i=1

n
n
i=1

n
1
2
2
= E[ ( xi - ) -n( X - ) ] =
n
i=1
n

=
=

1 n
1
[ E[( xi - )2 ] - n E[( X - )2 ]] =
n i=1
n

2
2
2
1 n
)= 1 n 2 - = 2 -
2
E[(

]
)

xi
n i=1
n
n
n
n

E[ 2 ] = 2 -

2 No es centrado y su sesgo es 2
n
n

Estimacin puntual
Ejemplo:
El cobre es un micronutriente requerido por la mayora de las plantas. Su
concentracin en una planta se mide analizando las cenizas obtenidas al
quemarla completamente. En un estudio de la variabilidad de la
concentracin de cobre en las plantas de la cuenca del Jarama, se
seleccion una muestra de 16 plantas. Se obtuvieron los siguientes datos
(en partes por milln):
5 3 34 18 27 14 8 50 38 43 35 20 70 25 60 19
Calcular una estimacin puntual para la variabilidad de la concentracin.
Solucin:

S2

1
Xi X

n 1 i 1
n

i 1

n xi2

i 1

xi

n n 1

377.2958

Estimacin puntual
Estimacin de la Proporcin:
Tenemos una poblacin dividida en dos subconjuntos, en funcin de una
caracterstica determinada, de forma que la proporcin de la poblacin
que posee la caracterstica es p, y la de los que no la poseen es 1-p.
Tratamos de estimar el valor de p. El estadstico p dado por la expresin
siguiente, es un estimador centrado y consistente de la proporcin
poblacional.
casos favorables
p
casos totales
Demostracin:
1
E[p ] = E
n

x
i

i=1

1
n E[ xi ] = p c. q. d. Es centrado
n

V(p ) =

1
2

x
i

1
2

E[p ] =

V( x )= n
i

1
1
E[X] = n p = p con la binomial
n
n

n p (1 - p) =

p(1 - p)
n

n i=1
i=1
1
p(1 - p)
p(1 - p)
X
V(p ) = V
con la binomial limn
= 0 c. q. d. Es consistente
= 2 n p (1 - p) =
n
n
n

n
n

Estimacin puntual
Ejemplo:
Los huevos de la mosca azul producen infecciones al ser depositados en la
sangre de un animal. Se efectu un experimento para controlar el
crecimiento de la poblacin de este tipo de moscas. Las pupas fueron
sometidas a radiacin al objeto de esterilizar al mayor nmero posible de
machos. Cada hembra se emparej con un nico macho. Se estudiaron 500
emparejamientos, de los cuales 415 resultaron estriles. Calcular una
estimacin puntual de la proporcin poblacional de machos estriles.
Solucin:
415
p
0.83
500

Estimacin por intervalos


Una estimacin por intervalo de un parmetro poblacional es un intervalo de
la forma L1 < < L2, donde L1 y L2 dependen del valor del estadstico para
una muestra particular y tambin de la distribucin muestral de . Un intervalo
de confianza al nivel de confianza (1-) 100% (donde 0 < < 1) para el
parmetro poblacional , a partir de una muestra seleccionada, es un intervalo
aleatorio tal que:
P (L1 < < L2) = 1 -
El intervalo de estimacin indica, por su longitud, la precisin de la estimacin
puntual. El intervalo L1 < < L2, que se calcula a partir de la muestra
seleccionada, se denomina entonces intervalo de confianza del (1 - ) 100%, la
fraccin (1- ) recibe el nombre de coeficiente de confianza o grado de
confianza, y los puntos extremos L1 y L2, se llaman lmites de confianza inferior y
superior.

Ya que muestras distintas generalmente dan valores distintos de y, por tanto,


de L1 y L2, estos puntos extremos del intervalo son los valores de las variables
aleatorias correspondientes L1 y L2.

Estimacin por intervalos


A partir de la distribucin muestral de ser posible determinar L1 y L2 tales
que P(L1 < < L2) sea igual para cualquier valor fraccional positivo que se
desee especificar. Si, por ejemplo, se encuentran L1 y L2 tales que,
P (L1 < < L2) = 1 -
para 0 < < 1, entonces se tiene una probabilidad de (1- ) de seleccionar
una muestra aleatoria que produzca un intervalo que contenga a .
En trminos generales, la construccin de un intervalo de confianza para un

parmetro desconocido consiste en encontrar un


estadstico
suficiente
y

relacionarlo con una v. a. X que involucre a , a , no contenga ningn otro


valor desconocido, y cuya distribucin en el muestreo sea conocida.
Entonces se seleccionan dos valores L1 y L2 tales que P(L1<X<L2) = 1 - y,
despejando, se obtiene la estimacin de

Estimacin por intervalos


Estimacin de la Media, conocida la Varianza:
Si la muestra se selecciona de una poblacin normal o, a falta de esto, si n es
lo bastante grande, se puede establecer un intervalo de confianza de
considerando la distribucin muestral de X.
De acuerdo con el Teorema del Lmite Central, es de esperarse que la
distribucin muestral de X sea aproximadamente normal con media X y
desviacin tpica
2
2
x
n
Al escribir z/2 para el valor z sobre el cual se encuentra un rea de /2, se
advierte que:
P(-z/2 < Z < z/2) = 1 -
donde si x1, x2, ..., xn es una m.a.s. de una poblacin de media y varianza
2 conocida
2
X-

X N( , )
Z=
N(0,1)

n
n

Estimacin por intervalos

P - z < Z < z = 1 -
2


P - z
< X - < z
= 1 -
2
2
n
n

P - z
+ X > > z
+ X = 1 -
2
2
n
n

- z <
< z = 1 -
2
2

P - z
- X < - < z
- X = 1 -
2
2
n
n


P X - z
< < X + z
= 1 -
2
2
n
n

Por tanto:
Si X es la media de una m.a.s. de tamao n de una poblacin, aproximadamente
normal, con varianza conocida 2, el intervalo de confianza de (1 - ) 100% para
la media poblacional es :

X - z
< < X + z
2
2
n
n
donde z/2 es el valor de z a la derecha del cual se tiene un rea de /2

Estimacin por intervalos


Ejemplo:
Los datos siguientes representan los pesos en gramos del contenido de 16
cajas de cereal que se seleccionaron al azar de un proceso de llenado con el
propsito de verificar el peso promedio.
506 508 499 503 504 510 497 512 514 505 493 496 506 502
509 496
Si el peso de cada caja de cereal es una v. a. normal con una desviacin
tpica = 5 gr., obtener el intervalo de confianza estimado del 95% para la
media de llenado de este proceso.
Solucin:
Para el coeficiente de confianza de 95%, =0.05. El valor de z0.025 se
obtiene de la tabla normal y es de 1.96, ya que P(z >1.96) = 0.025. A partir
de los datos muestrales, se obtiene que:
1 16
gramos.
X
x i 503.75

16 i 1

Estimacin por intervalos


Entonces, el intervalo de confianza al 95% para la media del proceso de
llenado es:
L1= x z = 503.75 - 1.96 *
2

L2= x z 2

5
16

= 501.3

= 503.75 + 1.96 *
= 506.2
16
n

P(L1 < < L2) = 95%

Estimacin por intervalos


Estimacin de la Media Desconociendo la Varianza:
La mayora de las veces no se conoce la varianza de la poblacin de la
cual se seleccionan las muestras aleatorias. El valor de S2 proporciona una
buena estimacin de 2. Qu le ocurre entonces al estadstico
correspondiente (2) si se reemplaza por S2?

(X -)

(2)

(X -)
S

(3)

Si la poblacin de partida era normal, (2) segua un distribucin normal


independientemente del tamao de la muestra. Si ahora sustituimos 2
por S2, aunque la poblacin de partida sea normal, la distribucin del
estadstico (3) puede desviarse de la normalidad.
En este caso, si la n 30 puede seguir suponindose que sigue una
distribucin normal sin que por ello el error cometido sea muy grande.

Estimacin por intervalos


Sin embargo, si el tamao de la muestra es pequeo, los valores de S2
fluctan considerablemente de muestra a muestra y la distribucin de la
variable aleatoria (3) se desva en forma apreciable de la normal estndar,
siguiendo entonces una distribucin t de Student con (n-1) grados de
libertad.
Al igual que habamos visto en el apartado anterior:

P(- t < T < t ) = 1 -


2

donde t/2 es el valor t con


encuentra un rea de /2.

(n-1)
grados de libertad, sobre el cual se

(
X

)
P - t <
< t = 1 -
2
2
S

Al multiplicar cada trmino de la desigualdad por S


restar X y multiplicar por (-1), se obtiene:
S
S
P( X - t
< < X + t
)= 1 -
2
2
n
n

y despus de

Estimacin por intervalos


Si X y S son la media y la cuadesviacin tpica de una muestra aleatoria de una
poblacin aproximadamente normal con varianza desconocida 2 (aproximada
por el valor de S2), un intervalo de confianza del (1 - ) 100% para es:

X - t

S
n

< < X + t

S
n

donde t/2 es el valor t con (n-1) grados de libertad, lo que deja un rea de /2 a
la derecha.

Estimacin por intervalos


Ejemplo:
Los contenidos de 7 recipientes similares de cido sulfrico son: 9.8, 10.2,
10.4, 9.8, 10, 10.2, 9.6 litros. Encuentre un intervalo de confianza del 95%
para la media de todos los recipientes, suponiendo una distribucin
aproximadamente normal.
Solucin:
La media muestral y su desviacin estndar para los datos que se dan son:
X = 10
S=0.283
t0.025 = 2.447 para 6 grados de libertad.
El intervalo de confianza para es:
10 - 2.447 *

0.283
7

< < 10 + 2.447 *

lo cual se reduce a:

0.283
7

9.74 < < 10.26

Estimacin por intervalos


Estimacin de la Diferencia de Medias:
Seleccionamos dos muestras aleatorias independientes de tamaos n1 y n2
de dos poblaciones normales con medias 1 y 2 y varianzas 21 y 22
respectivamente. El estimador puntual de 1 - 2 lo da el estadstico X 1 .X 2
X1 X
Se puede esperar que la distribucin muestral de E X 2 Xest
distribuda

1
2
1 2
aproximadamente en forma normal, con media
y
desviacin tpica
2

1- X 2

1 +2
n1
n2

Estimacin diferencia de medias

Varianzas conocidas

Muestras grandes

Observaciones pareadas

Varianzas desconocidas

Muestras pequeas

Var. iguales

Var. distintas

Estimacin por intervalos


Varianzas conocidas ( 12 Y 22)
La variable normal estndar.

Z=

( X 1 - X 2 ) - ( 1 - 2 )
2

1 +2
n1
n2

caer entre -z/2 y z/2 con una probabilidad (1 - ).


P(-z/2 < Z < z/2) = 1 -
sustituyendo Z por la expresin anterior y siguiendo los mismos pasos
queXen casos anteriores, obtenemos:
X
1
Si
y 2 son las medias de muestras aleatorias independientes de
tamaos n1 y n2 de poblaciones aproximadamente normales, con
varianzas conocidas 12 y 22 respectivamente, un intervalo de confianza
de (1 - ) 100% para 1 - 2 es:
2
2
2
2

1
2
1
2
( X 1 - X 2 ) - z
+
< 1 - 2 < ( X 1 - X 2 ) + z
+
2
2
n1
n2
n1
n2
donde z/2 es el valor de z que tiene un rea de /2 a la derecha.
Si las poblaciones son normales, el grado de confianza es exacto. Para
poblaciones que no son normales, el Teorema del Lmite Central
proporciona una buena aproximacin para muestras de tamao

Estimacin por intervalos


Varianzas desconocidas y muestras grandes (n1 + n2 30 y n1 n2)
Segn especialistas estadsticos se puede seguir utilizando la
aproximacin normal, pero utilizando S12 y S22 en lugar de las varianzas
correspondientes.
Varianzas desconocidas pero
iguales y muestras pequeas (n1 + n2 < 30)
12 22 2
Aqu tenemos que
pero se desconoce su valor. El estadstico
( X 1 - X 2 ) - ( 1 - 2 )
a usar en este caso ser: T =
Sp

donde Sp es

Sp

n1

n2

( n1 - 1) S 12 + ( n2 - 1) S 2 2
=
n1 + n2 - 2

La estimacin muestral Sp de la varianza poblacional debe ser un


promediado de las estimaciones muestrales S12 y S22, porque aunque las
varianzas poblacionales 12 y 22 se supongan iguales, sus estimaciones
muestrales no tienen por qu serlo, ya que se obtendrn valores
diferentes segn las muestras tomadas.

Estimacin por intervalos


Si X 1 y X 2 son las medias de muestras aleatorias independientes, de
tamaos n1 y n2 respectivamente, de poblaciones aproximadamente
normales, con varianzas iguales pero desconocidas, un intervalo de
confianza de (1 - ) 100% para 1 - 2 es:

( x1 - x 2 ) - t S p
2

donde

Sp

1
n1

1
n2

< ( 1 - 2 ) < ( x1 - x 2 ) + t S p
2

1
n1

1
n2

( n1 - 1) S 12 + ( n2 - 1) S 2 2
=
n1 + n2 - 2

y t/2 es el valor de t con (n1 + n2 -2) grados de libertad, con un rea /2


a la derecha.

Estimacin por intervalos


Ejemplo:
Bilogos marinos estn estudiando dos especies de moluscos. Miden la
longitud de las conchas para obtener informacin que les permita
comparar las dos especies. Desconocen la variabilidad de la longitud de
las conchas, pero tienen motivos para suponer que son iguales en ambas
especies. La informacin de muestra da los resultados:
n1= 10 n2=10 X 1 6.71 X 2 4.72 s12=1.611
s22=1.533
Construya un intervalo de confianza al 95% para la diferencia media
entre las longitudes de las conchas de las dos especies.
Solucin:
Sp

n1 1 s 21 n2 1 s 2 2

=
n1 n2 2

9 * 1.611 9 * 1.533

18

1.5722

Sp = 1.2538
1 1
2
(1-)100% = 95% = 0.05 /2 = 0.025

0.447
x

x
10
10
10
1
2
t0.025,18 = 2.101
= 6.71 - 4.72 = 1.99
Entonces, el intervalo de confianza al 95% para la diferencia de medias es:

Estimacin por intervalos


L1 =

x 2 t Sp

L2 =

x 2 t Sp

1 1

n1 n2
1
1

n1 n2

= 1.99 - 2.101*0.5607= 0.812

= 1.99 + 2.101*0.5607= 3.168

P(0.812 < ( 1 - 2) < 3.168) = 95%

Estimacin por intervalos


Varianzas desconocidas y distintas, muestras pequeas (n1 + n2 < 30)
El estadstico que con ms frecuencia se utiliza en este caso es:
T =

( X 1 - X 2 ) - ( 1 - 2 )
2

S1 + S 2
n1
n2

que sigue aproximadamente una distribucin t con v grados de


2
libertad donde
S 12 S 2 2

n + n
1
2
v=
Aproximaci on de Welch
2

S 12
S 22

n
n
1 + 2
n1 - 1
n2 - 1
Dado que v rara vez es un entero, se redondea al entero ms cercano.

Estimacin por intervalos


Si X 1 y X 2 y S12 y S22 son las medias y cuasivarianzas de muestras pequeas
independientes de tamaos n1 y n2 respectivamente, de distribuciones
aproximadamente normales con varianzas diferentes y desconocidas, un
intervalo de confianza aproximado del (1 - ) 100% para 1 - 2 est dado
por:
2

( x1 - x 2 ) - t

S1 + S 2 <( - )<( - )+
x1 x 2
t
1
2
2
n1
n2

donde t/2 es el valor t con

v=

S 12 S 2 2

n + n
2
1
2

S
S2

n
n
1 + 2
n1 - 1
n2 - 1
2
1

Aproximacion de Welch

grados de libertad, con un rea de /2 a la derecha.

S1 + S 2
n1
n2

Estimacin por intervalos


Ejemplo:
Los siguientes datos representan los tiempos de duracin de las pelculas que
producen dos compaas cinematogrficas:
Compaa
I
II

Tiempo (min.)
103 94 110 87

98

97 82 123 92 175 88 118

Calcule el intervalo de confianza del 90% para la diferencia entre los tiempos
promedio de duracin de las pelculas que producen las dos compaas.
Suponga que el tiempo de duracin tiene una distribucin aproximadamente
normal.
Solucin:
n1 = 5
t0.05,7 = 1.833
x1 x 2 = 98.4 - 110.7 = -12.31
n2 = 7
(1-)100% = 90% = 0.10 /2 = 0.05
1
s12= 4 (21.16+19.36+134.56+129.96+0.16)=76.3
s2 =
2

1
4

(188.08+824.51+151.94+350.22+4132.65+515.94+53.08)=1036.07

Estimacin por intervalos


2

2
s12 s2 2
76
.
3
1036
.
07

n n
5
7
2
1

2
2 2
2 2
s2
76.3
1036.07
s1

n
5
7

n1
2

4
6
n1 1
n2 1

L 1 = x1 x 2 t 2
L2= x1 x 2 t 2

15.26 148.01 2
58.217 3651.16

s1
s
2
n1
n2
2

= -12.314 - 1.833*12.78= -35.74


2

s1
s
2 = -12.314 + 1.833*12.78= 11.11
n1
n2

P(-35.74 < ( 1 - 2) < 11.11) = 90%

26657.09
7.186 7
3709.38

Estimacin por intervalos


Observaciones pareadas:
En este caso se estima la diferencia de dos medias cuando las muestras no son
independientes. Entonces, cada unidad experimental tiene un par de
observaciones, una para cada poblacin. Consideramos las diferencias d1,
d2, ..., dn en las observaciones pareadas. Estas diferencias son los valores de
una poblacin de diferencias que se asumir distribuida normalmente, con
2
2
media d = 1 - 2 y varianza 2

1
+ 2
d =
n1
n2
Se estima d2 por Sd2, la varianza de las diferencias que constituyen la
d
muestra. El estimador puntual de d lo representa , la media de las diferencias
que constituyen la muestra. Una vez obtenidas las diferencias, su estudio se
reduce al caso de estimacin de la media desconocida de una poblacin
aproximadamente normal, desconocida su varianza (ya visto anteriormente).

Estimacin por intervalos


El estadstico a utilizar en esta ocasin es:

T=

d - d
Sd
n

que sigue una distribucin t con (n-1) grados de libertad. Obtener el intervalo
de confianza es la rutina de siempre.
Si d y Sd son la media y la desviacin tpica de las diferencias normalmente
distribudas de n pares aleatorios de mediciones, un intervalo de confianza del
(1 - ) 100% para d = 1 - 2 es :

d - t

Sd
S
< d < d + t d
2
n
n

donde t/2 es el valor t con (n-1) grados de libertad, con un rea de /2 a la


derecha.

Estimacin por intervalos


Ejemplo:
Investigadores famosos han formulado la hiptesis de que el fuego puede
cambiar los niveles de calcio presentes en la tierra y entonces afectar la
cantidad de este mineral disponible para los venados. Se seleccion un rea
grande de terreno para un incendio controlado. Se tomaron muestras de la
tierra de 12 parcelas de la misma rea antes del incendio y despus de este
para verificar su contenido en calcio. Se obtuvieron los resultados indicados
en la tabla que sigue.
Determine un intervalo de confianza al 95% para la diferencia promedio en el
nivel de calcio presente en la tierra antes y despus del incendio. Asuma que la
distribucin de la diferencia de los niveles de calcio es aproximadamente
normal.

Estimacin por intervalos


Nivel de calcio
Parcela

Antes

Despus

Diferencia

50

41

50

18

32

82

45

37

64

18

46

82

18

64

73

64

77

32

45

54

45

23

18

10

45

36

11

36

27

12

54

45

Estimacin por intervalos


Solucin:
d = 40.583
S2d = (0.173889 + 73.668 + 12.838 + 29.344 + 548.36 + 548.36 + 19.51 + 19.51
+ 1266.15 + 21.004 + 184.5 + 19.51) = 249.357
Sd =15.79
1- = 0.95 = 0.05 /2 = 0.025
t (n-1),0.025 = t 11, 0.025 = 2.201
L1= d - t/2
L2 =

Sd

n=

Sd

15.79

40.583 - 2.201*

12

= 30.5504

15.79

+ t/2 n = 40.583 + 2.201*

12

= 50.616

Estimacin por intervalos


Estimacin de la proporcin:
Un estimador puntual de la proporcin p en un experimento binomial est
dado por el estadstico p = X/n donde X representa el n de xitos en n intentos
y sigue una distribucin binomial de parmetros n y p.

xi =

0 (1 p )

X = xi B(n, p)
i=1

y p = X es justo la media muestral de estos n valores.


n
Por el Teorema del Lmite Central, para una n lo bastante grande, p est
distribuida aproximadamente en forma normal, con media:
np
X
p = E[p ] = E = = p
n
n
y varianza:
X 2X n p q p q p (1 - p)
=
= 2= 2 =
=
n
n
n

n
n
2
p

Estimacin por intervalos


Si p no es cercano a 0 ni a 1 y n grande, X N (np, npq)
X -n p
N(0,1) y por tanto
n pq

X
-p
n
N(0,1) para n grande
p(1 - p)
n

Se puede asegurar que: P(- z 2 < z < z 2 ) = 1 -


donde

z=

p - p
=
pq
n

X
-p
n
N(0,1)
p (1 - p)
n

y z/2 es el valor de la curva normal estndar sobre la cual se encuentra un


rea de /2. Sustituyendo z obtenemos:

P - z <

-p
n
< z (1 - ) para n grande
2
p(1 - p)

Estimacin por intervalos


Multiplicando ambos trminos por

p(1 - p)
n

y despus de restar X/n y multiplicar por (-1), se obtiene:


X
- z
2
n

p(1 - p)
X
< p < + z
2
n
n

p(1 - p)
= 1-

Por tanto los extremos del intervalo de confianza que obtenemos, dependeran
del parmetro desconocido. Cmo solucionarlo?
L1 = p - z

p (1 - p) X
= -z
2
n
n

p (1 - p)
n

L2 = p + z

p (1 - p) X
= z
2
n
n

p (1 - p)
n

Cuando n es grande, se introducen muy pocos errores al sustituir la p bajo el


signo radical por su estimacin puntual p =X/n. Entonces se puede escribir:

P p - z
2

p (1 - p )
< p < p + z
2
n

p (1 - p )
1-

Estimacin por intervalos


Si p es la proporcin de xitos en una muestra aleatoria de tamao n, un
intervalo de confianza aproximado de (1-) 100% para el parmetro binomial
p es:

p - z

p (1 - p )
< p < p + z
2
n

p (1 - p )
n

donde z/2 es el valor z con un rea /2 a la derecha.


Cuando n es pequeo y se cree que la proporcin desconocida p se acerca a 0 o
a 1, el procedimiento establecido para el intervalo de confianza no es confiable
y no debe ser utilizado. Para estos casos se han desarrollado diferentes
mtodos grficos y analticos, en los que no vamos a entrar, para calcular el
intervalo de confianza de p.

Estimacin por intervalos


Ejemplo:
Los huevos de la mosca azul producen infecciones al ser depositados en la
sangre de un animal. Se efectu un experimento para controlar el crecimiento
de la poblacin de este tipo de moscas. Las pupas fueron sometidas a
radiacin al objeto de esterilizar al mayor nmero posible de machos. Cada
hembra se emparej con un nico macho. Se estudiaron 500 emparejamientos,
de los cuales 415 resultaron estriles. Construir un intervalo de confianza al
95% para la proporcin poblacional de machos estriles.
Solucin:
p

415
0.83
500

L1 p z
L2 p z

1- = 0.95 = 0.05 /2 = 0.025 z0.025 = 1.96

p 1 p
0.83 * (1 0.83)
0.83 1.96
0.83 3.2926 *10 2 0.7971
n
500
p 1 p
0.83 * (1 0.83)
0.83 1.96
0.83 3.2926 * 10 2 0.8629
n
500

Estimacin por intervalos


Estimacin de Diferencia de Proporciones:
Deseamos estimar la diferencia entre dos parmetros binomiales p1 y p2. Para
establecer un intervalo de confianza para p1-p2 consideraremos la distribucin
p p 2
muestral de 1
estn distribuidos cada uno en forma
X
X
1
2
y p 2 =
p 1 =
aproximadamente normal, con medias p1 y p2 y
n1
n2
p1 (1 - p1 )
p (1 - p 2 )
varianzas
y 2
n1

n2

respectivamente. Al seleccionar muestras independientes de las dos


p p
poblaciones, las variables p1 y p2 sern independientes y entonces 1 2 estar
distribuida aproximadamente normal con media :

p 1- p 2 = p1 - p 2

y varianza:

2
p 1- p 2

p1 (1 - p1 )
n1

p 2 (1 - p 2 )
n2

Estimacin por intervalos


Por tanto se puede asegurar que P(- z 2 < z < z 2 ) = 1 -
donde Z = ( p 1 - p 2 ) - ( p1 - p 2 )
p1 (1 - p1 )
n1

p 2 (1 - p 2 )
n2

Siguiendo todos los mismos pasos que en los dems casos, obtenemos:
Si p1 y p 2son las proporciones de xitos en muestras aleatorias de tamaos n1 y n2
respectivamente, un intervalo aproximado de confianza del (1- ) 100% para la
diferencia entre dos parmetros binomiales p1 - p2 es:
( p 1 - p 2 ) - z

p 1 (1 - p 1 )
n1

p 2 (1 - p 2 )
n2

< ( p1 - p 2 ) < ( p 1 - p 2 ) + z

p 1 (1 - p 1 )

donde z/2 es el valor de z con un rea de /2 a la derecha.

n1

p 2 (1 - p 2 )
n2

Estimacin por intervalos


Ejemplo:
El departamento de trfico ha preparado dos exmenes para conductores. Se
desea determinar la diferencia entre las proporciones de conductores que
pasan el examen 1 y los que pasan el examen 2. Su estudio revela lo siguiente:
p 2 0.77
n1=250 p1 0.82
n2=300
Construya un intervalo de confianza aproximado del 90% para la verdadera
diferencia entre las proporciones de conductores que pasan los dos exmenes.
Solucin:
Con la informacin suministrada podemos calcular:

p 1 1 p1 p 2 1 p 2
0.82 * 0.18 0.77 * 0.23

0.03436
n1
n2
250
300

Adems sabemos que 1- = 0.90 = 0.1 /2 = 0.05 z0.05 = 1.645


p 1 1 p 1 p 2 1 p 2
L1 p 1 p 2 z

0.05 1.645 * 0.03436 0.00653


2
n1
n2

L2 p 1 p 2 z

p 1 1 p 1 p 2 1 p 2

0.05 1.645 * 0.03436 0.10653


n1
n2

Estimacin por intervalos


Estimacin de la Varianza:
Si se toma una muestra de tamao n de una poblacin normal con varianza 2
y se calcula la cuasivarianza muestral S2, esta varianza calculada se puede
utilizar como estimacin puntual de 2. Para establecer una estimacin de
intervalo de 2 se utiliza el estadstico
2
2
=

(n - 1) S

que, como ya sabemos, sigue una distribucin 2 con (n-1) grados de libertad
cuando las muestras se seleccionan de una poblacin normal. Siguiendo todos
los mismos pasos que en casos anteriores, obtenemos:

P < < = 1 -
1 2

1
2

(n - 1) S

<
2

<
2

= 1-

P <
1 2

(n - 1) S 2

(n - 1) S 2

< 2 = 1 -
2

2
(n - 1) S 2
(n
1)
S
P
< 2 <
= 1-
2
2

1
2
2

Estimacin por intervalos


Si s2 es la cuasivarianza de una muestra aleatoria de tamao n de una poblacin
normal, un intervalo de confianza del (1- )100% para 2 es:

(n - 1) s 2
(n - 1) s 2
2
< <
2
2

1-
2

donde 2/2 y 21 - /2 son valores de una distribucin 2 con (n-1) grados de


libertad, con reas de /2 y 1- /2 a la derecha, respectivamente.
Un intervalo de confianza del (1-) 100% para , se obtiene sacando la raz
cuadrada de cada punto extremo del intervalo para 2

Estimacin por intervalos


Ejemplo:
El cobre es un micronutriente requerido por la mayora de las plantas. Su
concentracin en una planta se mide analizando las cenizas obtenidas al
quemarla completamente. En un estudio de la variabilidad de la
concentracin de cobre en las plantas de la cuenca del Jarama, se seleccion
una muestra de 16 plantas. Se obtuvieron los siguientes datos (en partes por
milln):
5 3 34 18 27 14 8 50 38 43 35 20 70 25 60 19
Calcular un intervalo de estimacin al 90% para la variabilidad de la
concentracin.
2
n
n

2
16
Solucin:
n x i xi
2
2
n
xi 19407
1
i 1
i 1

S
377.2958
xi
i 1
n 1 i 1
n n 1
16

1 - = 0.9 = 0.1 /2 = 0.05 1 - /2 = 0.95 n = 16


L1

n 1 S 2

2 0.05,15

15 * 377.2958

226.41
24.996

L2

n 1 S 2

2 0.95,15

x
i 1

15 * 377.2958
779.43
7.261

El intervalo es (226.41, 779.43) para 2, o bien (15.05, 27.92) para

469

Estimacin por intervalos


Estimacin de la Razn de dos Varianzas:
Una estimacin puntual del cociente de dos varianzas poblacionales 12/ 22
est dada por la razn S12/S22 de las cuasivarianzas muestrales. Si 12 y 22 son
las varianzas de poblaciones normales, se puede establecer un intervalo de
2 2
2
2
estimacin de 12/ 22 utilizando el estadstico:
2 S1 S1 / 1

F=

S
2
1

2
2

S2/ 2
2

donde S12 y S22 son las cuasivarianzas muestrales obtenidas de muestras


aleatorias independientes de tamaos n1 y n2 que se sacan de las poblaciones
normales con varianzas 12 y 22. En tal caso el estadstico F anterior, sigue
2
2
una distribucin
F de Snedecor
con (n1 -1)
y (n2 -1) grados

S 1 / 1 de libertad.

P f 1 ( v1,v2 ) < F < f ( v1,v2 ) = 1 -


2
2

S
P f 1 ( v1,v2 ) < 12 22 < f ( v1,v2 ) = 1 -
2
2
S2 1

f 1 ( v1,v2 )
2

P f 1 ( v1,v2 ) < 2 2 < f ( v1,v2 ) = 1 -


2
2
S2/ 2

2
2
2

S
2
2
P f 1 ( v1,v2 ) 2 < 2 < f ( v1,v2 ) 22 = 1 -
2
2
S1 1
S1

2
2
2
1
S1 1
S1
> 2>
= 1-
2
2
S 2 2 f ( v1,v2 ) S 2
2

P
f ( v1,v2 )
2

2
2
2
S1 1
S
1
< 2 < f ( v2 ,v1 ) 2 = 1 -
2
2
S2 2
S2

Estimacin por intervalos


Si s12 y s22 son las cuasivarianzas de muestras independientes de tamaos n1 y n2
respectivamente de poblaciones normales, entonces un intervalo de confianza
del (1- ) 100% para 12/ 22 es:2
2
2

1
S1
1 < S1
<
f ( v2 ,v1 )
2
2
2

S 2 f ( v1,v2 ) 2 S 2 2
2

donde f/2 (v1,v2) es el valor f con v1 = (n1 -1) y v2= (n2-1) grados de libertad con un
rea de /2 a la derecha, y f/2 (v2,v1) es un valor similar f con v2= (n2-1) y v1=(n11) grados de libertad.
Un intervalo de confianza del (1-)100% para 1/ 2 se obtiene al sacar la raz
cuadrada de cada punto extremo del intervalo para 12/ 22

Estimacin por intervalos


Ejemplo:
Determine un intervalo de confianza del 90% para el cociente de varianzas en
el ejercicio de las compaas cinematogrficas visto para la diferencia de
medias. Se debi suponer entonces que las varianzas eran iguales al
determinar el intervalo de confianza para la diferencia de medias?
Solucin:
n1 = 5
n2 = 7
1- = 0.90 = 0.1 /2 = 0.05
1
f

v1,v 2

1
f0.05 4,6

1
0.221 f
0.05 (6,4) = 6.16
4.53

S12 =276.3 S22 = 1035.9


S
1
76.3
L1 1 2

* 0.221 1.628 *10 2


S 2 f v ,v 1035.9
2

L2

S1

S2

* f

v2 ,v1

76.3
* 6.16 0.454
1035.9

El 1 no cae en el intervalo, por tanto no podemos suponer que las varianzas


sean iguales Bien hecho el problema de diferencia de medias

Relacin entre ambas estimaciones


Existe una distincin bastante clara entre los objetivos de las estimaciones
puntuales y las estimaciones del intervalo de confianza. Los primeros proveen
un nmero nico que se extrae a partir de un conjunto de datos
experimentales, y los ltimos proporcionan intervalos, dados los datos
experimentales, que son razonables para el parmetro, esto es, el 100 (1- )%
de tales intervalos calculados "cubren" el parmetro.
Sin embargo, a pesar de esta distincin clara, las dos aproximaciones a la
estimacin se relacionan una con otra. El "hilo comn" es la distribucin
muestral del estimador puntual.
Habamos indicado que una medicin de la calidad de un estimador insesgado
era su varianza, y el error estndar de un estimador es su desviacin tpica.
El lmite de confianza lo podemos relacionar con la estimacin puntual, de la
siguiente forma.
L1, 2

estimacin
puntual

dist . muestral
del est. puntual

error estndar
del est. puntual

Relacin entre ambas estimaciones


Para el caso de la estimacin de la media concociendo tenemos:
X
Estimador puntual:
2
Distribucin del estimador puntual:X N , n
Varianza del estimador puntual:
2/n
Desviacin Tpica del est. puntual:
n

Luego, para el caso de X el lmite de confianza calculado sera:

L = x z
2
n
Si desconocemos y la reemplazamos por S obtenemos:
Estimador puntual X
Distribucin del estimador puntual: tn-1
Varianza del estimador puntual:
S2/n
Desviacin tpica de X: S n

L = x t

S
n

Relacin entre ambas estimaciones


El intervalo de confianza no es mejor (en trminos de anchura) que la
calidad de la estimacin puntual. Esto significa que los anchos de los
intervalos de confianza se hacen menores en la medida en que mejora la
calidad de las correspondientes estimaciones puntuales.
Se puede argumentar, en definitiva, que un intervalo de confianza es tan
slo una ampliacin de la estimacin puntual para considerar la precisin
de la misma.

Tamao de la muestra
Muchas veces estamos interesados en determinar el tamao de la muestra
necesario para obtener, con una confianza del (1-) 100%, una estimacin
del parmetro poblacional , de tal manera que el error de estimacin no
supere un determinado valor de error permitido .
Hemos comentado que la anchura del intervalo de confianza, alrededor
del estimador puntual del parmetro, nos da una medida de la precisin de
este. Por tanto, para la determinacin del tamao muestral en cuestin
basta coger la semilongitud del intervalo de confianza e igualarlo al error
mximo permitido, despejando cul ser el valor de n que verifique esa
igualdad.
Si se utiliza X como estimacin de , se puede tener una confianza del
(1-) 100% de que el error no exceder una cantidad especificada
cuando el tamao de la muestra es:
2
z
n= 2

Tamao de la muestra
Queremos que X , es decir X X
Con una confianza del (1-) 100% sabemos que

X z
n
n
2

X z
2

luego

z
2

Despejando de esa expresin la n obtenemos:


2

n=

Los valores fraccionarios de n se redondean al entero superior.

Tamao de la muestra
En la estimacin de un intervalo de confianza para la proporcin, hemos
visto que si
p X n
se utiliza como una estimacin de p, se puede tener una confianza del (1-)
100% de que el error cometido no exceder de

p (1 - p )
n

Si deseamos determinar qu tan grande debe ser una muestra para


asegurar que el error al estimar p ser menor que una cantidad
especificada , tendremos que escoger una n, de tal forma que
z

p (1 - p )
=
n

y ese valor de n es:


n=

( Z )2 p (1 - p )
2

Tamao de la muestra
La expresin anterior puede resultar paradjica ya que para calcular p
debemos conocer n porque p X n . Tenemos entonces dos opciones:

ya

a) Obtener una muestra con n 30 valores, a partir de la cual calcular


la aproximacin p X n y usar esta aproximacin para calcular cuantas
observaciones seran necesarias para obtener la precisin deseada.
b) Establecer un lmite superior para el valor de n observando que
es como mximop, ya que cae entre 0 y 1. El valor
mximo de n sera entonces:
( Z )2
2
n=
42
p (1 p )

Al utilizar el mximo valor de p (1 p ) , n aumenta ms de lo necesario para


el nivel de confianza deseado, y por tanto aumenta tambin el nivel de
confianza.

Tamao de la muestra
Ejemplo:
Se estudia la efectividad de un nuevo medicamento en el tratamiento de
cierta enfermedad. Se suministra el medicamento a 14 pacientes de los cuales
13 reaccionan positivamente. Dar el tamao de la muestra necesario para
obtener una confianza del 99% de que el error de estimacin de p no
exceder de 2 % (0.02)
Solucin:
Si suponemos que tenemos una buena estimacin previa de p:
p =
(1 - )100% = 99%

13
= 0.9286
14
= 0.01

z = 2.58
2

= 0.02
n=

( z )2 p (1 - p )
2

(2.28 )2 (0.9286)(0.0714)
2

(0.02 )

= 1103.33 1104

Tamao de la muestra
Si lo hacemos sin considerar la estimacin previa de p, sino considerando el
mximo:
2
( z )2
(2.58
)
n= 2 2 =
= 4160.25 4161
2
4
4 (0.02 )
Como podemos apreciar es un tamao de muestra considerablemente
superior al caso anterior.

Ejercicios
Ejercicio 6.1
Un fabricante de televisores est desarrollando un nuevo modelo de
televisor en color, y para este fin se pueden utilizar dos tipos de
esquemas transistorizados, cuyos tiempos de vida se suponen
normalmente distribuidos. El fabricante selecciona una muestra de
esquemas transistorizados del primer tipo de tamao 12, y otra del
segundo tipo de tamao 11. Los datos muestrales respecto a la vida de
cada esquema son los siguientes:
X 1 1400h

S1 30h

X 2 1500h

S2 17h

Se pide:
a) Construir un intervalo de confianza del 95% para la diferencia de
vida media de cada tipo de esquema.
b) Construir un intervalo de confianza del 90% para el cociente de
varianzas de la vida de cada tipo de esquema.

Ejercicios
Ejercicio 6.2
Una agencia de alquiler de automviles necesita estimar el nmero
medio de kilmetros diarios que realiza su flota de automviles; a tal fin,
en varios das de la semana toma los recorridos de 100 vehculos de su
flota y obtiene que la media muestral es de 165 Km/da, y la
cuasidesviacin tpica muestral de 6 Km/da. Se pide:
a) Bajo la hiptesis de normalidad de la caracterstica de estudio (n de
km por da), construir un intervalo de confianza para la media de dicha
distribucin a un nivel de confianza del 95%.
b) Bajo la misma hiptesis de normalidad que en a), construir un
intervalo de confianza del 90% para la varianza de dicha distribucin.

Ejercicios
Ejercicio 6.3
En un cruce de Melanogaster se han obtenido 60 moscas con alas
vestigiales de un total de 300. Se pide:
a) Encontrar un intervalo de confianza al 95% para la proporcin de
moscas con alas vestigiales entre los individuos resultantes de un gran
nmero de cruces como este.
b) Qu nmero de cruces hay que realizar de modo que la proporcin de
moscas con alas vestigiales entre los individuos resultantes de un gran
nmero de cruces y la de la muestra difiera en valor absoluto en menos
de 0.01 con una probabilidad del 95%?

You might also like