You are on page 1of 51

Teora del muestreo

Ing. Csar Verano Serruto


Teora del muestreo

La teora del muestreo es un estudio de las relaciones


existentes entre una poblacin y muestras extradas de
la misma. Tiene gran inters en muchos aspectos de la
estadstica. Por ejemplo, permite estimar cantidades
desconocidas de la poblacin (tales como la media
poblacional, la varianza, etc.), frecuentemente
llamadas parmetros poblacionales o brevemente
parmetros, a partir del conocimiento de las
correspondientes cantidades muestrales (tales como la
media muestral, la varianza, etc.), a menudo llamadas
estadsticos muestrales o brevemente estadsticos.
La teora de muestreo es tambin til para determinar si las
diferencias que se puedan observar entre dos muestras son
debidas a la aleatoriedad de las mismas o si por el contrario son
realmente significativas. Tales preguntas surgen, por ejemplo, al
ensayar un nuevo suero para el tratamiento de una
enfermedad, o al decidir si un proceso de produccin es mejor
que otro. Estas decisiones envuelven a los llamados ensayos e
hiptesis de significacin, que tienen gran importancia en teora
de la decisin.

En general, un estudio de inferencias, realizado sobre una


poblacin mediante muestras extradas de la misma, junto con
las indicaciones sobre la exactitud de tales inferencias aplicadas
a la teora de la probabilidad, se conoce como inferencia
estadstica.
Ventajas de la utilizacin de las
muestras
El costo es menor y se puede obtener un mejor
rendimiento del dinero invertido.
Se obtiene una disminucin notable del tiempo
necesario para alcanzar la informacin
Cuando una muestra posee 30 o ms datos se
denomina grandes muestras y si la muestra tiene
menos de 30 observaciones se denomina pequeas
muestras. Al procedimiento utilizado para elegir una
muestra se denomina Muestreo.
Necesidad del Muestreo.

Poblacin Infinita
Poblacin uniforme
Proceso de investigacin destructiva
Economa de costos
Calidad
Muestras al azar. Nmeros aleatorios

Para que las conclusiones de la teora del muestreo e inferencia


estadstica sean vlidas, las muestras deben elegirse de forma que sean
representativas de la poblacin. Un estudio sobre mtodos de muestreo
y los problemas que tales mtodos implican, se conoce como diseo de
experimentos.
El proceso mediante el cual se extrae de una poblacin una muestra
representativa de la misma se conoce como muestreo al azar, de
acuerdo con ello cada miembro de la poblacin tiene la misma
posibilidad de ser incluido en la muestra. Una tcnica para
obtener una muestra al azar es asignar nmeros a cada miembro de la
poblacin, escritos estos nmeros en pequeos papeles, se introducen
en una urna y despus se extraen nmeros de la urna, teniendo cuidado
de mezclados bien antes de cada extraccin. Esto puede ser sustituido
por el empleo de una tabla de nmeros aleatorios
Muestreo con y sin remplazamiento

Si se extrae un nmero de una urna, se puede volver o no el nmero a la urna antes de


realizar una segunda extraccin. En el primer caso, un mismo nmero puede salir varias
veces, mientras que en el segundo un nmero determinado solamente puede salir una
vez. El muestreo, en el que cada miembro de la poblacin puede elegirse ms de una
vez, se llama muestreo con remplazamiento, mientras que si cada miembro no puede
ser elegido ms de una vez se tiene el muestreo sin remplazamiento.

Las poblaciones pueden ser finitas o infinitas. Si, por ejemplo, se extraen sucesivamente
10 bolas sin remplazamiento de una urna que contiene 100, se est tomando una
muestra de una poblacin finita, mientras que si se lanza al aire una moneda 50 veces,
anotndose el nmero de caras, se est muestreando en una poblacin infinita.

Una poblacin finita, en la que se realiza un muestreo con remplazamiento, puede


tericamente ser considerada como infinita, puesto que puede extraerse cualquier
nmero de muestras sin agotar la poblacin. En muchos casos prcticos, el muestreo de
una poblacin finita que es muy grande, puede considerarse como muestreo de una
poblacin infinita.
Distribuciones muestrales

Considrense todas las posibles muestras de tamao N que pueden


extraerse de una poblacin dada (con o sin remplazamiento). Para cada
muestra se puede calcular un estadstico, tal como la media, la desviacin
tpica, etc., que variar de una muestra a otra. De esta forma se obtiene
una distribucin del estadstico que se conoce como distribucin muestral.

Si, por ejemplo, el estadstico de que se trata es la media muestral, la


distribucin se conoce como distribucin muestral de medias o distribucin
muestral de la media. Anlogamente se obtendran las distribuciones
muestrales de las desviaciones tpicas, varianzas, medianas, proporciones,
etc. Para cada distribucin muestral se puede calcular, la media,
desviacin tpica, etc. As, pues, se puede hablar de la media y desviacin
tpica de la distribucin muestral de medias, etc.
Una distribucin muestral es una distribucin de probabilidad de un
estadstico muestral calculado a partir de todas las muestras
posibles de tamao n, elegidas al azar en una poblacin
determinada. Si la poblacin es infinita, tenemos que concebir la
distribucin muestral como una distribucin muestral terica, ya
que es imposible sacar todas las muestras aleatorias posibles de
tamao n de una poblacin infinita. Si la poblacin es finita y
moderada se puede construir una distribucin muestral
experimental, sacando todas las muestras posibles de un tamao
dado, calculando para cada muestra el valor del estadstico que
nos interesa.
Ejemplo, supongamos que se tiene una poblacin de tamao N =
10 y queremos extraer con reemplazamiento todas las
muestras posibles de tamao n = 5, para esto se utiliza la relacin
Nn , es decir, 105 = 100000 muestras de tamao n = 5.
En cambio, si el muestreo es sin reemplazamiento, el
nmero de muestras de tamao N = 5 viene dado por la
combinatoria:
Distribucin muestral de medias
Supngase que son extradas de una poblacin finita
todas las posibles muestras sin remplazamiento de
tamao N, siendo el tamao de la poblacin Np > N. Si
se denota la media y la desviacin tpica de la
distribucin muestral de medias por y y la media y

la desviacin tpica de la poblacin por ,


respectivamente, se tiene:
(1)

Si la poblacin es infinita o si el muestreo es con


remplazamiento, los resultados anteriores se convierten
La expresin es la desviacin estndar de la distribucin
muestral de medias, se le llama error tpico o estndar
de la media y nos indica la diferencia promedio entre los
diversos valores de X y . Como se observa, a medida
que el tamao de la muestra aumenta este error
disminuye, las diversas medias muestrales se hacen
ms uniforme en su valor, y en consecuencia, cualquier
media muestral es una buena estimacin de la media
poblacional .
Construccin de Distribuciones
Muestrales

De una poblacin discreta, finita, de tamao N, extraer


todas las muestras posibles de tamao n
Calcular el valor del estadstico de inters de cada
muestra
Hacer una tabla con dos columnas: en la primera los
posibles valores diferentes del estadstico y en la
segunda, la frecuencia de ocurrencia.
Distribucin Muestral de la
Media
Una poblacin consiste de 10 vendedores de una
compaa. La variable de inters, X, es la antigedad. X
= {1, 2, 3, 4, 5, 6, 7, 8, 9,10} Podemos calcular los
siguientes estadsticos:


=8.25
1. Extraemos todas las posibles muestras. Supongamos
n=2 (100 muestras).
2. Calculamos la media para cada una de esas muestras
x
3. Listar los valores diferentes del estadstico y sus
frecuencias.

Calculamos la media de la distribucin
muestral con reemplazamiento
=
Calculando la varianza de la distribucin muestral:
Distribuciones Muestrales
Cuando el muestreo se extrae de una poblacin
distribuida normalmente, la distribucin muestral de la
media muestral tiene las siguientes propiedades:
La distribucin de la media es normal,
independientemente del tamao de la muestra.
La Media de la distribucin de las medias es igual a la
media de la poblacin.
La varianza de la distribucin de las medias es igual a la
varianza de la poblacin, dividida entre n.
Teorema del Lmite Central
Dada una poblacin con media y varianza finita 2, con
cualquier distribucin, la distribucin muestral de la
media, calculada de muestras aleatorias de tamao n,
est distribuida normalmente con media y varianza
finita 2/n, cuando n es grande. La regla de oro dice que
n30.
Ejemplo:
La vida promedio de cierta herramienta es de 41.5 horas,
con una desviacin estndar de 2.5 horas. Cul es la
probabilidad de que una muestra aleatoria de tamao 50
extrada de esta poblacin tenga una media entre 40.5 y
42 horas?
DISTRIBUCIN MUESTRAL PARA LA
DIFERENCIA DE MEDIAS (X1 X2 ).-
A veces interesa hacer inferencias sobre la diferencia
poblacional de medias 1 y 2, o saber si es razonable
concluir que dos medias poblacionales no son iguales,
considerando que se tienen sendas muestras para las
poblaciones 1 y 2, respectivamente, donde:
Entonces, la diferencia de las medias muestrales X1 X2 ,
estima a 1 y 2 . La forma funcional de la distribucin muestral
de X1 X2 depende de la forma funcional de las poblaciones,
de donde se extraen las muestras tomando en cuenta:
Si ambas poblaciones son normales la distribucin muestral de
la diferencia de medias es normal.
Si una o ambas de las poblaciones no es normal, la
distribucin muestral de las diferencias de medias X1 X2 es
normal si n1 + n2 2 >30 (grandes muestras), este resultado
se deduce del teorema del lmite central
En
estos casos, los parmetros que definen esta
distribucin muestral de las diferencias de medias vienen
dados por:

- 2

El cual se aplica para dos casos especficos dependiendo


de la muestra:
a) Para grandes muestras, cuando v = n1+n2 - 2 > 30,
se trabaja con la distribucin normal. En estos casos,
estandarizando la diferencia de medias muestrales, se
tiene:
b) Para pequeas muestras, Cuando v = n1 + n2 2 < 30, se trabaja con la
Distribucin t de Student. Por lo tanto, el valor viene dado por:

donde:

Ejemplo 1: Dos compaas fabrican lubricantes de alta temperatura, para el mismo


mercado. La compaa A anuncia que en promedio, su lubricante deja de ser efectivo
a 505 F, con una desviacin estndar de 10 F. La compaa B anuncia que su
producto tiene una media de 475 F, con una desviacin estndar de 7 F. Suponga
que una muestra de tamao 20 para la primera compaa y otra independiente de
tamao 25 para la segunda son extradas aleatoriamente. Cul es la probabilidad
de que la diferencia en temperatura promedio de falla para las dos muestras est
entre 25 y 35 F?
Ejemplo 2:
En un estudio para comparar los pesos promedio de nios y nias
de sexto grado en una escuela primaria se usar una muestra
aleatoria de 20 nios y otra de 25 nias. Se sabe que tanto para
nios como para nias los pesos siguen una distribucin normal.
El promedio de los pesos de todos los nios de sexto grado de
esa escuela es de 100 libras y su desviacin estndar es de
14.142, mientras que el promedio de los pesos de todas las nias
del sexto grado de esa escuela es de 85 libras y su desviacin
estndar es de 12.247 libras. Si representa el promedio de los
pesos de 20 nios y es el promedio de los pesos de una muestra
de 25 nias, encuentre la probabilidad de que el promedio de los
pesos de los 20 nios sea al menos 20 libras ms grande que el
de las 25 nias.
Por lo tanto, la probabilidad de que el promedio de
los pesos de la muestra de nios sea al menos 20
libras ms grande que el de la muestra de las
nias es 0.1056.
Ejemplo 3:
Uno de los principales fabricantes de televisores compra
los tubos de rayos catdicos a dos compaas. Los tubos
de la compaa A tienen una vida media de 7.2 aos
con una desviacin estndar de 0.8 aos, mientras que
los de la B tienen una vida media de 6.7 aos con una
desviacin estndar de 0.7. Determine la probabilidad
de que una muestra aleatoria de 34 tubos de la
compaa A tenga una vida promedio de al menos un
ao ms que la de una muestra aleatoria de 40 tubos
de la compaa B.
Ejemplo 4:
Se prueba el rendimiento en km/L de 2 tipos de gasolina,
encontrndose una desviacin estndar de 1.23km/L
para la primera gasolina y una desviacin estndar de
1.37km/L para la segunda gasolina; se prueba la primera
gasolina en 35 autos y la segunda en 42 autos.
Cul es la probabilidad de que la primera gasolina de un
rendimiento promedio mayor de 0.45km/L que la
segunda gasolina?
Cul es la probabilidad de que la diferencia en
rendimientos promedio se encuentre entre 0.65 y
0.83km/L a favor de la gasolina 1?.
DISTRIBUCIN DE UNA
PROPORCION MUESTRAL
Se define una proporcin muestral como el cociente:
Ejemplo: Si se toma una muestra aleatoria de tamao n
= 1000 y 425 personas satisfacen un evento, entonces p
= 425 / 1000 = 0,425. Esto significa que el 42,5 % de las
personas satisfacen dicho evento.
ESTIMACION DE PARAMETROS
a) ESTIMACIN PUNTUAL
El nivel de confianza se indica por 1- y habitualmente se da en porcentaje (1-)%.
Hablamos de nivel de confianza y no de probabilidad (la probabilidad implica eventos
aleatorios) ya que una vez extrada la muestra, el intervalo de confianza estar definido al
igual que la media poblacional () y solo se confa si contendr al verdadero valor del
parmetro o no, lo que si conlleva una probabilidad es que si repetimos el proceso con
muchas medias muestrales podramos afirmar que el (1-)% de los intervalos as
construidos contendra al verdadero valor del parmetro.

Los valores que se suelen utilizar para el nivel de confianza son el 90%, 95% y 99%
1. Intervalo de confianza para medias con n
30 (grandes muestras):
2. Intervalo de confianza para medias con n < 30 (pequeas
muestras):
Contrastes de Hiptesis
Intervalo de confianza para una
proporcin
El intervalo de confianza para estimar una proporcin p,
conocida como una proporcin muestral pn de una
muestra de tamao n, a un nivel de confianza del (1-
)100% es:
Ejemplo 1.
Seis de cada diez familias de cierta ciudad poseen
ordenador. Halla el intervalo caracterstico para la
proporcin de familias con ordenador, en muestras de 35
familias de esa ciudad, correspondiente al 90%.
Solucin:
La proporcin de familias con ordenador, en muestras de
35, se distribuye segn una normal
Contraste de hiptesis para la proporcin

Ejemplo 2.
En una muestra de 250 personas en edad laboral de una
zona determinada se encuentra que el 14% esta en paro.
Los datos recogidos por el INEI para el ao anterior,
fueron de una tasa de paro del 10%. Puede asumirse la
hiptesis de estabilidad de la tasa de paro?. Contraste la
hiptesis de mantenimiento de la tasa en el 10%, dada
por la Administracin a un nivel de significancia del 5%.
PRACTICA CALIFICADA CONTRASTES
DE HIPOTESIS.
Intervalo de confianza para diferencias de medias

a) si n >30 (grandes muestras) se usa la distribucin


normal:
)

b) si n < 30 (pequeas muestras) se usa la t de


Student:
)

You might also like