You are on page 1of 24

UNIVERSIDAD CENTROAMERICANA

DEPARTAMENTO DE CIENCIAS BSICAS


ESTADSTICA II

UNIDAD I: ELEMENTOS DE MUESTREO
2

Managua, 31 de enero
2012
INTRODUCCIN
En la vida muchas veces nos hemos encontrado o nos encontraremos inmersos dentro de
un proceso de toma de decisiones, motivo por el cual procuramos tener al alcance de
nuestras manos la mayor cantidad de informacin posible. En este proceso es posible
que encontremos que nuestro banco de datos posea poca o ninguna informacin adicional
o total segn sea el caso. Necesitaremos por supuesto que la informacin que
obtengamos posea un cierto grado de confiabilidad y que los gastos en que se incurran
estn dentro de los lmites impuestos por un determinado presupuesto. De lo que se
trata entonces es de optimizar los recursos tcnicos, econmicos y humanos que
tengamos a disposicin con el objeto de colectar la mejor informacin posible. Es dentro
de este contexto que surge la necesidad de realizar una investigacin dentro de un
determinado campo (poblacin) con el objeto de estudiar o tener una idea del
comportamiento de alguna caracterstica de inters de dicha poblacin.
El conocimiento de los conceptos bsicos de estadstica es un requisito para nuestro
estudio; es por eso que revisaremos algunos de ellos:
POBLACIN
Algo difcil de definir en forma precisa con palabras, pero de fcil comprensin.
POBLACIN es sencillamente el conjunto de la totalidad de elementos de los cuales
estamos interesados en conocer una determinada caracterstica (es decir hacer alguna
inferencia). Y la representamos por N.
CARACTERSTICA DE INTERS
En una poblacin es cualquier particularidad existente en sus miembros (elementos).
EJEMPLO 1:
Consideremos el conjunto de todas las familias de la ciudad de Masaya en un momento
2
dado y supongamos que estamos interesados en investigar el ingreso mensual medio por
familia.
En este caso la poblacin consiste en todas las familias de la ciudad de Masaya en un
momento dado y la caracterstica que nos interesa es el ingreso mensual de cada
familia.
EJEMPLO 2:
Consideremos el conjunto de toda la pequea industria del cuero y calzado existente en
la zona de Granada y Masaya en Septiembre de 1993 y supongamos que estamos
interesados en investigar el nmero medio de empleados por taller y el total de
empleados.
Aqu obviamente la poblacin consiste en todos los talleres de la pequea industria del
cuero y calzado de la zona y la caracterstica de inters sera los empleados en cada
taller.
DATO ESTADSTICO
Cuando en nuestro estudio slo nos interesa una caracterstica comn, de cada una de
las unidades de la poblacin, entonces a un valor realmente observado, le llamamos
DATO ESTADSTICO.
Simblicamente x
1
, x
2
, ........ , x
n
En general, si nos interesan r caractersticas o una r-tupla ordenada de observaciones
tambin le llamamos DATO ESTADSTICO.
MUESTRA
Es un subconjunto de una poblacin. Y la representamos por n.
ENCUESTA
Es un conjunto de tcnicas encaminadas a reunir datos estadsticos sobre las
caractersticas de una poblacin.
Las encuestas pueden hacerse de dos formas:
1. A travs de un censo: Cuando la investigacin buscada se extrae de cada uno de los
elementos que conforman la poblacin bajo estudio, es decir se realiza una investigacin
exhaustiva dentro de la poblacin y recibe el nombre de encuesta por censo.
2. A travs de una muestra: Cuando la informacin que queremos la obtenemos a travs
del estudio de una parte de la poblacin y recibe el nombre de encuesta por muestreo.
Adems las muestras pueden ser probabilsticas y no probabilsticas. Las probabilsticas se dan
cuando para obtener la informacin, le damos oportunidad de aparecer en ella a todos los
elementos de la poblacin, en caso contrario recibe el nombre de no probabilstica.
VENTAJAS DEL MUESTREO
1. Costos reducidos.
2. Mayor rapidez para obtener resultados.
3. Mayor exactitud o mejor calidad de la informacin debido a los siguientes factores.
2
Volumen de trabajo reducido.
Puede existir mayor supervisin en el trabajo.
Se puede dar ms entrenamiento al personal.
Menor probabilidad de cometer errores durante el procesamiento de la
informacin.
4. Factibilidad de hacer el estudio cuando la toma de datos implica tcnicas
destructivas, por ejemplo:
Pruebas de germinacin.
Anlisis de sangre.
Control de calidad.
VENTAJAS DEL CENSO:
Sin embargo, tambin se debe mencionar que el censo tiene algunas ventajas que son
las siguientes:
1. Existe una cobertura total.
2. Tiene aceptacin pblica.
MARCO MUESTRAL o DIRECTORIO
Es una lista de unidades de muestreo.
EJEMPLO 3:
Si queremos investigar el peso promedio de los estudiantes de la UCA, entonces el
marco muestral es el listado oficial de los estudiantes que posee el Registro Central de
la Universidad.
UNIDAD DE MUESTREO
Es un conjunto de elementos de la poblacin bajo estudio, sobre los cuales se toma
alguna medida determinada.
EJEMPLO 4:
De los ejemplos 1, 2 y 3 las unidades de muestreo son:
1.- Las familias.
2.- Las pequeas industrias.
3.- Los estudiantes.
TAMAO DE POBLACIN
Es el nmero de elementos que hay en el marco muestral.
EJEMPLO 5:
Para los ejemplos 1, 2 y 3 supongan que las poblaciones son:
1. N = 10000 familias.
2. N = 150 pequeas industrias.
3. N = 8435 estudiantes.
INFERENCIA ESTADSTICA
2
Comprende los procedimientos para estimar PARMETROS de poblaciones.
PARMETRO
Es cualquier caracterstica medible en una poblacin.
ESTIMADOR DE UN PARMETRO
El procedimiento o frmula que se utiliza para realizar la estimacin de un determinado
parmetro se llama un ESTIMADOR del mismo.
A continuacin presentamos la notacin que utilizaremos para designar a los parmetros
y sus respectivos estimadores:
Parmetro Smbolo Estimador Frmula
Media poblacional x
n
x
x

Total poblacional

T

= N x
Proporcin poblacional

p
n
x
p
EJEMPLO 6:
1. Parmetro promedio poblacional.
= Nmero promedio de miembros por vivienda en un Bo.
2. Parmetro total poblacional.
T = Total de personas en un Bo.
3. Parmetro porcentual poblacional.
p = Porcentaje de estudiantes que estn de acuerdo con un nuevo plan de estudios.
MUESTREO Y SUS APLICACIONES
Con el objeto de que el estudiante tenga una visin del campo de aplicacin de las
tcnicas de muestreo, a continuacin presentamos ciertas aplicaciones.
EN EDUCACIN
Se piensa construir una escuela de primaria en cierta zona de Jinotega. Una de las
decisiones bsicas que se tomar es referente al tamao de la escuela. Dentro de la
informacin que se necesita podra estar: Nmero de nios que asistirn a la escuela por
grado, tasa de crecimiento de la poblacin, etc. Con tal finalidad se levantar una
investigacin por muestreo para medir tales caractersticas.
EN LA AGRICULTURA
La Asociacin de productores del Norte est preocupada por las posibles prdidas que
resulten de la plaga del gusano bellotero. Se tiene que decidir si llevar a cabo o no una
campaa a nivel local consistente en combatir con cierto insecticida a tal enfermedad.
La decisin depender del nmero promedio de larvas que se encuentren por manzana.
Para eso se decide tomar una muestra de 50 fincas y dependiendo de los resultados se
2
ver si implementar tal campaa o no.
EN LA INDUSTRIA
El jefe de planta siente que la productividad de los obreros bajo su responsabilidad est
por debajo de lo que normalmente se espera. Para tal fin decide observar a un nmero
determinado de obreros por un perodo de una semana. Luego analizar los resultados y
tomar la decisin que considere adecuada.
EN ESTUDIO DE MERCADO (Introduccin de nuevo producto.)
Se piensa lanzar al mercado un sustituto de cierto desinfectante, antes de iniciar la
produccin en gran escala, se sacarn al mercado 2000 unidades del nuevo producto
para estudiar su aceptabilidad por parte del pblico. Los resultados servirn para
pronosticar la participacin que se tendr en el mercado y por lo tanto el nivel de
produccin que se necesite.

EN MEDICINA
Para determinar las necesidades en concepto de medicamento que se requieren, para
dar una atencin adecuada a los afectados por cierta enfermedad en una zona
determinada del pas; se necesita saber de un estimado total de personas que requieren
ese medicamento.
Existen otras situaciones en las que resulta ventajoso utilizar las tcnicas de muestreo:
control de calidad.
inventarios, etc.
Como el resultado de una muestra no reproduce exactamente las caractersticas de la poblacin
de la que proviene, es natural que existan desviaciones (que llamaremos errores) de los
resultados muestrales con respecto a los parmetros de esa poblacin.
ERROR DE MUESTREO Y ERROR NO DE MUESTREO
Error de muestreo:
Es la diferencia entre el resultado de la muestra y del censo, cuando ambos resultados
son obtenidos utilizando los mismos mtodos de medicin, los mismos procedimientos de
entrevistas, etc.
Error no de muestreo:
Estos comprenden errores sistemticos y errores por equivocaciones. Los primeros se
dan (sistemticos) cuando los valores del estadstico indican una tendencia persistente a
desviarse en una direccin con relacin al valor del parmetro.
Los errores por equivocaciones ocurren debido a las siguientes causas:
Imperfeccin del marco muestral.
Los instrumentos de medida (cuestionarios, entrevistas, procedimientos de
conteo,
Etc.) no son precisos.
Falta de uso de un proceso aleatorio para escoger la muestra.
Adems los errores por equivocaciones pueden surgir debido a:
El entrevistador anota las respuestas inapropiadamente.
Los entrevistados dan respuestas inapropiadas.
Se hacen clculos y anotaciones incorrectas al procesar los datos.
2
DISEO MUESTRAL
Es un plan previo a la recopilacin de los datos que permite obtener una muestra
aleatoria de la poblacin de trabajo. Un determinado diseo no necesariamente es
recomendable en todos los casos y algunas veces depende de la estructura de la
poblacin misma.
Adems un diseo muestral se dice que es eficiente si arroja los mejores resultados
(mayor precisin) al menor costo posible.
TIPOS DE MUESTREO PROBABILISTICO
1. Muestreo Aleatorio Simple. (M.A.S)
2. Muestreo Sistemtico.
3. Muestreo Estratificado. (M.E). Con Asignacin ptima de Neyman y Proporcional al
tamao.
4. Muestreo por Conglomerados.
MUESTREO ALEATORIO SIMPLE
Es el diseo ms sencillo a usar. Adems el mtodo consiste en seleccionar n unidades
muestrales, de un total de N de tal forma que cada una de las muestras diferentes
tengan igual oportunidad (probabilidad) de ser seleccionada.


N

)! ( !
!
n N n
N
C
n N


Y si S = { m
1
, m
2
, ...... , m
n
} son muestras y si m
i
es la i-sima muestra, entonces:

n N
i
C
m P
1
) (
Se elige una porque todas son igualmente probables y de esta forma hacemos inferencia
estadstica. Adems el M.A.S. puede utilizarse si las unidades de muestreo se pueden
identificar fcilmente y si la poblacin es homognea.
SELECCIN DE LA MUESTRA
Suponga que ya hemos decidido que la informacin que queremos obtener ser a travs
de un estudio por muestreo, El paso siguiente que debe resolver el investigador es el
del diseo y la eleccin de la muestra. Ambas acciones est ntimamente unidas
puesto que dependiendo del diseo que utilice el investigador as ser la eleccin de
los sujetos de estudio. Los elementos, personas, fenmenos, constituyen la muestra
de la investigacin.
A continuacin presentamos el mtodo de seleccin de una muestra de tamao n
cuando se pretende usar Muestreo Aleatorio Simple.
1. Enumerar las unidades de 1 a N que conforman el marco muestral.
2. Seleccionar aleatoriamente n nmeros diferentes entre 1 y N.
(A travs de algn medio mecnico (bolas dentro de una bolsa, tablas de
nmeros aleatorios, nmeros aleatorios generados con una calculadora u
ordenador, etc) se eligen tantos sujetos como sea necesario para completar
el tamao de muestra requerido.
3
n
2
n
1
n
2
3. La muestra estar formada por las unidades correspondientes a dichos nmeros.
EJEMPLO 7:
Se trata de obtener una muestra de tamao 15 proveniente de una poblacin de tamao
650; la poblacin ya esta enumerada, es decir a cada unidad muestral le corresponde un
nico nmero entre 1 y 650. Por medio de un proceso aleatorio se seleccionaron los 15
nmeros, los cuales se presentan a continuacin:
120 007 001 650 133
032 023 428 649 068
015 630 323 257 520
Para recolectar los datos, procedemos a obtener de cada una de las unidades la medida
de inters. Posteriormente con este conjunto de medidas pasamos a su anlisis, para
luego obtener las conclusiones.
EJEMPLO 8:
Se desea determinar el nmero de nios en edad escolar residentes en un Barrio
Oriental de Managua, que comprende un total de 80 manzanas. Con tal fin se desea
tomar una muestra aleatoria simple (M.A.S) de tamao 10 mediante el uso de una
calculadora.
Solucin:
1. En primer lugar se har una lista de todas las manzanas y se les enumerar del 01,
02, ..............., 80 Es decir N = 80 y n = 10
2. Para el proceso de seleccin utilizamos una calculadora Casio fx-570MS.
(80Shift [Ran#]=), lo que genera los nmeros aleatorios siguientes [59, 1, 41, 70, 31, 12,
36, 70, 50, 37, 55]
3. Nos encontramos con el nmero 70, (se omite porque es su segunda ocurrencia) contino
con el 50... Lo que indica que los nmeros de manzana que se van a investigar son los
siguientes:
59 1 41 70 31 12 36 50 37 55
ESTRUCTURA DE ESTIMADORES EN M.A.S. CUANDO EL PARMETRO DE INTERS ES
UN PROMEDIO ().
1. Identificar el parmetro
) (
y proponer un estimador.
n
x
x

donde
x
es la caracterstica a obtener en la muestra.
N


NOTAS:
El mejor estimador es la media aritmtica, la cual cumple tres propiedades:
a. Es suficiente: quiere decir que toma en cuenta a los elementos de la muestra.
b. Es eficiente: quiere decir que no se separa mucho del parmetro.
c. Es verosmil: quiere decir que es verdico.
x
2
2. Estimador de la varianza del estimador.

,
_


N
n
n
s
x V
x
1

) (

2
2
donde
( )
2
2
1

n
x x
s
A
x

se le llama error de muestreo de desviacin estndar, este error se comete


porque se ha ido a una parte de la poblacin y no ha toda, este error si se controla es
una ventaja.
A
,
_

N
n
1
se le llama FACTOR DE CORRECCION POR FINITUD (FCF).
A
N
n
en la prctica, es llamado FRACCION MUESTRAL.
Si 05 . 0
N
n
se omite el FCF, en caso contrario 05 . 0 >
N
n
se trabaja con el
FCF.
n
N
se llama FACTOR DE EXPANSION:
Hay que hacer notar dos clases de varianzas:
a. Varianza por unidad poblacional ( )
2
s
b. Varianza del estimador ( )
2
) (
x
x V
Grficamente:
Varianza por unidad. (s
2
s)
s distancia que se separa
cada unidad del parmetro.
Varianza del estimador.
x x

2


x

distancia que se separa el


estadstico del parmetro.

Como
) (x V
depende de
2
s y sta de

, entonces
) (x V
y
2
s son parmetros y por lo
tanto hay que estimarlos.
3. Lmite para el error de estimacin

,
_


N
n
n
s
z x V z 1 ) (

2

TIPOS DE ESTIMADORES
Por la forma de su resultado, los estimadores pueden ser clasificados en dos categoras.
1. Estimador puntual.
s



s
s


.
.
2
Si a partir de las observaciones de una muestra se calcula un solo valor como estimacin
de su
parmetro de poblacin desconocida, el procedimiento se dice que es una estimacin
puntual, ya que se utiliza como estimacin un solo punto del conjunto de todos los
posibles valores.
2. Estimador por intervalo:
El procedimiento o frmula que lo define genera un par de valores L
i
y L
s
entre los
cuales el parmetro se encuentra con una confiabilidad determinada. El intervalo (L
i
, L
s
)
as generado recibe el nombre de intervalo estadstico (intervalo de confianza); L
i
es el
lmite inferior del intervalo, mientras que L
s
es el lmite superior del mismo.
NIVELES DE SIGNIFICACIN o COSTOS DE ERROR
Son los errores que estn dispuesto a soportar el dueo del estudio, sin que esto le
afecte sus intereses. Los ms usados son = 1%, 5%, 10%. Estos niveles tienen
asociados confianzas de 99%, 95% 90% y a su vez valores crticos de
2

z
=
2.575, 1.96, 1.645 respectivamente.
El intervalo estadstico usando el nivel de significacin es:
x x
z x z x + < <
o
+ < < 1 ) (
x x
z x z x P

EJEMPLO 9:
1. Investigaciones que lleven riesgos de vida humana a lo sumo soportan un 1% de error.
2. No es lo mismo soportar un error del 5% para medir la produccin de arroz del pas, que
soportar un 5% de error en la construccin de un barco.
3. No es lo mismo un 5% de error en la construccin de un automvil, que un 5% de error
en la construccin de un avin.
Es decir que de depende que la investigacin cueste ms o menos es decir:
n La investigacin es cara.
n La investigacin es barata.
Esto quiere decir que si n , esto chequea el costo de la investigacin.
DETERMINACIN DEL TAMAO VERDADERO DE MUESTRA EN M.A.S.
Cuando el parmetro de inters es un promedio ().
Sabemos que
+ < < 1 ) (
x x
z x z x P

Si llamamos
x
z d
entonces
,
_


N
n
n
s
z d 1


Elevando al cuadrado la expresin.

,
_


N
n
n
s z
d 1

2 2
2
suprimiendo parntesis y simplificando.
2
N
s z
n
s z
d
2 2 2 2
2

lo que se pretende es despejar
n
;
n
s z
N
s z
d
2 2 2 2
2

+
N
s z
d
s z
n
2 2
2
2 2

dividiendo por
2
d ;
2
2 2
2
2 2

Nd
s z
d
s z
n
+

;
2
2
1
1

,
_

,
_

d
s z
N
d
s z
n

Llamemos a
2
0

,
_

d
s z
n luego,
El procedimiento para determinar
n
es:
1. Calcular
2
0

,
_

d
s z
n
2. Determinar
N
n
0

'

+
>

)
05 . 0

05 . 0
0
0 0
0
0
n N
Nn
n
N
n
Si
grande mente suficiente
considera se poblacin La n n
N
n
Si
ESTRUCTURA DE ESTIMADORES EN M.A.S CUANDO EL PARMETRO DE INTERES ES
UNA PROPORCIN (

)
1. Identificar el parmetro
) (
y proponer un estimador.
n
x
p
donde x es el nmero de unidades en la muestra
que poseen la caracterstica de inters y
n
es el tamao de la
muestra.
2. Estimador de la varianza del estimador.

,
_


N
n
n
q p
p V
p
1
1

) (


El intervalo estadstico esta dado mediante la frmula: p p
z p z p

+ < <

3. Lmite para el error de la estimacin.

,
_

N
n
n
q p
z p V z 1
1

) (


DETERMINACIN DEL TAMAO VERDADERO DE MUESTRA EN M.A.S
Cuando el parmetro de inters es la proporcin (

)
En la prctica si

se desconoce la estimacin puede ser obtenida de encuestas similares


2
anteriores, pero si no se cuenta con informacin anterior se utiliza p = 0.5
El procedimiento para calcular
n
es:
1. Calcular
2
2
0
d
pq z
n
2. Determinar
N
n
0

'

+
>

) 1 (
05 . 0
05 . 0

0
0 0
0
0
n N
Nn
n
N
n
Si
n n
N
n
Si
MUESTREO SISTEMTICO
Este procedimiento exige, como el anterior, numerar todos los elementos de la
poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se
parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos
que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k, ... , i+(n-
1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el
tamao de la poblacin entre el tamao de la muestra: k = N/n (se le llama
COEFICIENTE DE ELEVACIN). El nmero i que empleamos como punto de partida
ser un nmero al azar entre 1 y k.
Este mtodo es muy simple de aplicar en la prctica y tiene la ventaja de que no hace
falta disponer de un marco de encuesta elaborado. Puede aplicarse en la mayora de
las situaciones. El riesgo en este tipo de muestreo est en los casos en que se dan
periodicidades en la poblacin ya que al elegir a los miembros de la muestra con una
periodicidad constante (k) podemos introducir una homogeneidad que no se da en la
poblacin.
EJEMPLO 10:
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en
los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un muestreo
aleatorio sistemtico con k = 10 siempre seleccionaramos o slo hombres o slo
mujeres, no podra haber una representacin de los dos sexos.
EJERCICIOS PROPUESTOS
1. Suponga que la base de datos que Ud. tiene representa el marco muestral de los
trabajadores de una empresa, deseamos seleccionar una muestra aleatoria simple de 10
empleados.
a. Use los siguientes nmeros aleatorios para la seleccin [260, 298, 274, 14, 43, 101,
2
234, 287, 16, 77]
b. Con la informacin obtenida en el inciso (a) estime e interprete el salario promedio
y la desviacin estndar.
c. Establezca e interprete un lmite para el error de estimacin.
d. Con una confiabilidad del 95% entre que valores se encuentra el salario
promedio de esos trabajadores.
2. Con la base de datos que Ud. tiene y que representa el marco muestral de los
trabajadores de una empresa, seleccione una muestra aleatoria simple de 15 empleados.
a. Use los siguientes nmeros aleatorios para la seleccin [286, 297, 258, 242, 176,
168,
282, 194, 276, 72, 182, 2, 57, 176, 118, 30]
b. Con la informacin obtenida en el inciso (a) estime e interprete la edad promedio y
la desviacin estndar.
c. Establezca e interprete un lmite para el error de estimacin.
d. Con una confiabilidad del 99% entre que valores se encuentra la edad
promedio de esos trabajadores.
3. La siguiente tabla muestra el nmero de personas que habitan por vivienda en una
comunidad rural.
N 0 1 2 3 4 5 6 7 8 9
0 3 10 5 5 4 7 2 9 6
1 5 7 8 1 3 5 3 6 2 4
2 2 3 11 3 5 9 7 5 2 8
3 3 8 6 4 4 9 2 6 8 7
4 7 8 4 6 5 10 9 3 5 8
5 5 4 7 9 6 8 7 3 5 7
6 2 4 6 8 9 3 5 6 4 3
7 3 5 7 9 10 12 4 6 8 2
8 3 5 4 3 5 7 9 2 4 6
9 4 6 5 4 7 3 2 4 5 3
10 8 7 3 5 4 6 5 6 6 4
11 4 5 2 6 12 9 5 7 9 4
12 5
a. Seleccione una muestra aleatoria simple de 8 viviendas use los nmeros
aleatorios [103, 111, 39, 69, 37, 32, 29, 70]
2
b. Con la informacin obtenida en el inciso (a) estime el nmero promedio de
personas por vivienda en esa comunidad.
c. Establezca e interprete un lmite para el error de estimacin.
d. Con una confiabilidad del 95% entre que valores se encuentra el nmero
promedio de personas por vivienda.
e. Seleccione una muestra sistemtica de 8 viviendas, Aplique k = N/n y tome
como punto de partida el nmero aleatorio [i = 5]
f. Con la informacin obtenida en el inciso (e) estime el nmero promedio de
personas por vivienda en esa comunidad.
4. Use la base de datos que Ud. tiene y que representa el marco muestral de los
trabajadores de una empresa, deseamos seleccionar una muestra sistemtica de 10
empleados.
a. Aplique k = N/n y tome como punto de partida el nmero aleatorio [i = 13].
b. Con la informacin obtenida en el inciso (a) estime el nmero promedio de hijos y la
desviacin estndar e interprete sus resultados
c. Establezca e interprete un lmite para el error de estimacin.
d. Con una confiabilidad del 99% entre que valores se encuentra el nmero
promedio de hijos de esos trabajadores.
5. La base de datos que Ud. tiene representa el marco muestral de los trabajadores
de una empresa, deseamos conocer la edad promedio de stos por lo que se
decide tomar
una muestra piloto de tamao n = 10 con el fin de estimar la varianza. Estime el
verdadero
tamao de muestra para estimar la edad promedio de los trabajadores de esa
empresa. Use
una confiabilidad del 95% y un error mximo tolerado del 4,5% del parmetro. Use los
siguientes nmeros aleatorios [103, 294, 164, 182, 6, 18, 139, 221, 286, 270]
6. Suponga que la base de datos que Ud. tiene representa el marco muestral de los
trabajadores
de una empresa, deseamos conocer el salario promedio de estos, por lo cual se
decide tomar
una muestra piloto de tamao n = 5 con el fin de estimar la varianza.
a. Estime el verdadero tamao de muestra para estimar el salario
promedio de los trabajadores de esa empresa. Use una confiabilidad del 95% y
un error mximo tolerado del 10% del parmetro. Use los siguientes nmeros
2
aleatorios [228, 58, 54, 109, 130]
b. Con el verdadero tamao de la muestra determine el salario promedio de
esos trabajadores. Use los nmeros aleatorios [294, 12, 289, 280, 11, 50, 181,
54, 210, 154, 147, 67, 132, 184, 171, 169, 204, 242, 236, 298, 267, 201, 72, 7,
112, 190, 15, 196, 268, 226, 170, 158, 230, 218, 97, 256, 145, 95, 161, 53]
7. Con la base de datos que Ud. tiene y que representa el marco muestral de los
trabajadores de una empresa, deseamos seleccionar una muestra aleatoria de 12
empleados.
a. Use los nmeros aleatorios para la seleccin [78, 9, 212, 82, 108, 94,
79, 36, 238, 93, 58, 153]
b. Con la informacin obtenida en el inciso (a) estime la proporcin de
trabajadores solteros de la empresa.
d. Establezca un lmite para el error de estimacin.
e. Con una confiabilidad del 95% entre que valores se encuentra la
proporcin de trabajadores solteros.
8. Se desea seleccionar una muestra aleatoria sistemtica de 10 empleados. Aplique la
base de datos que Ud. tiene y que representa el marco muestral de los trabajadores de
una empresa.
a. Aplique k = N/n y tome como punto de partida el nmero aleatorio [i = 16]
b. Con la informacin obtenida en el inciso (a) estime la proporcin de empleados
evanglicos de la empresa.
c. Establezca e interprete un lmite para el error de estimacin.
d. Con una confiabilidad del 95% entre que valores se encuentra el
porcentaje de empleados evanglicos de esta empresa.
9. Usando la base de datos que Ud. posee. y que representa el marco muestral de los
trabajadores de una empresa, deseamos seleccionar una muestra aleatoria simple de 20
empleados.
a. Use los nmeros aleatorios para la seleccin [196, 172, 211, 271, 263,
163, 128, 72, 97, 169, 195, 57, 205, 125, 210, 23, 186, 2, 120, 21]
b. Con la informacin obtenida en el inciso (a) estime e interprete la
proporcin de trabajadores catlicos de la empresa.
2
d. Establezca e interprete un lmite para el error de estimacin.
e. Con una confiabilidad del 95% entre que valores se encuentra la
proporcin de trabajadores catlicos.
10. La base de datos que Ud. tiene representa el marco muestral de los trabajadores
de una empresa, deseamos conocer la proporcin de empleados solteros por lo
cual se
decide tomar una muestra piloto de tamao 8. Use los siguientes nmeros aleatorios
para la seleccin [220, 194, 146, 75, 95, 4, 64, 250]. Luego estime el verdadero tamao
de muestra
para la proporcin de empleados solteros con una confiabilidad del 95% y un
error mximo
tolerado de ms o menos 0,04.
11. Aplique la base de datos que Ud. tiene y que representa el marco muestral de los
trabajadores
de una empresa, deseamos conocer la proporcin de empleados catlicos de la
empresa por lo
cual decide tomar muestra piloto de tamao 10.
a. Use los nmeros aleatorios para la seleccin [210, 154, 147, 67, 132, 184, 171, 169,
204, 289]. Luego estime el verdadero tamao de muestra para estimar la
proporcin
de empleados catlicos, con una confiabilidad del 95% y un error mximo
tolerado de
ms o menos 0.05.
b. Con el verdadero tamao de la muestra determine la proporcin de empleados
catlicos de la empresa. Use los siguientes nmeros aleatorios [11, 23, 34, 51,
61, 100, 135, 148, 157, 177, 189, 199, 1, 294, 209, 42, 46, 85, 98, 87, 103, 121,
125, 18, 2, 16, 37, 57, 69, 296, 282, 289, 169, 149, 144, 165, 33, 53, 66, 107,
131, 141, 150, 172, 10, 39, 45, 35, 281, 275, 277, 264, 254, 243, 228, 200, 233,
187, 188, 299, 290, 284, 12, 28, 31, 129, 115, 120, 99, 130, 142, 156, 171, 184,
198, 201, 230, 237, 252, 263, 276, 292, 288, 6, 19, 30, 174, 164, 229, 255,
280, 13, 91, 76, 80, 71, 101, 161, 108, 211, 193, 226, 253, 29, 145, 54, 73, 291,
235, 222, 77, 118, 95, 36, 248, 259, 287, 285, 273, 41, 62, 110, 135, 146, 43,
249, 258, 267, 247, 239, 219, 245, 261, 182, 207, 47, 128, 111, 152, 175, 109,
117, 208, 231, 205, 221, 55, 64, 140, 126, 162, 153, 216, 227, 234, 293, 241,
123, 60, 83, 26, 173, 213, 220, 242, 217, 24, 97, 176]
MUESTREO ESTRATIFICADO
Otro plan de muestreo que puede ser ms eficiente que el M.A.S. es el Muestreo
Estratificado (M.E.) El proceso de estratificacin requiere que la poblacin sea dividida
en subpoblaciones que no tengan elementos en comn. Estos son llamados estratos, y se
construyen de tal forma que en cada estrato estn los elementos ms parecidos con
2
respecto a la caracterstica de inters en estudio. Para cada estrato se toma una
submuestra mediante el procedimiento de M.A.S., y a la muestra resultante de combinar
las submuestras de todos los estratos, le llamaremos muestra estratificada. Este
proceso de estratificacin exige tener conocimiento previo de la poblacin. El M.E. es
ms eficaz cuando se trata de poblaciones heterogneas, en tales situaciones podemos
estratificar la poblacin de tal manera que: Dentro de cada estrato los elementos
presentan poca variabilidad entre s. (Hay homogeneidad).
EJEMPLO 11:
En un estudio de los ingresos de la familia, se puede dividir una ciudad en reas de alto,
mediano y bajo ingreso, de manera que el ingreso vare menos dentro de cada rea de lo
que lo hace en la ciudad en su totalidad. Aqu la localizacin geogrfica constituye una
base til para la estratificacin.
En este caso el ingreso medio de una muestra estratificada generalmente, se aproxima
ms al verdadero ingreso medio de la poblacin que el de una muestra aleatoria simple
del mismo tamao seleccionada de la ciudad.
Aunque el concepto de estratificar es relativamente simple, varias interrogantes surgen
al iniciar la estratificacin:
a. Cul debe ser la base de la estratificacin?
b. Cuntos estratos debemos formar?
c. Qu tamao de submuestra utilizaremos en cada estrato?
A menudo el nmero y las fronteras de los estratos se determinan segn la conveniencia
administrativa. Ciertas reas geogrficas forman fronteras naturales. Sin embargo, hay
ocasiones en que el diseador de la encuesta puede fijar el nmero de estratos. Entonces,
cuntos estratos debe fijar? Primero hay que sealar que entre ms estratos podamos
seleccionar que difieran entre s de alguna manera, mayor ser la precisin que logremos.
CLASES DE ASIGNACIN
Una muestra estratificada puede ser proporcional o desproporcional. En un muestreo
estratificado proporcional, el nmero de unidades extradas de cada estrato es
proporcional al tamao de ste. Este procedimiento es satisfactorio si no hay gran
diferencia en variabilidad de un estrato a otro. Esto nos indica que para obtener
eficiencia mxima en la estratificacin debemos asignar mayor representacin a un
estrato con una gran variabilidad.
El muestreo estratificado desproporcionado comprende los siguientes procedimientos:
1. Toma un nmero igual de unidades de cada estrato sin tener en cuenta su tamao, o da
slo una pequea representacin a uno o ms estratos, cuyos miembros son demasiados
costosos de investigar.
2. Considera la variabilidad y el tamao de cada estrato para determinar su
representacin en la muestra, y as, habremos utilizado lo que se conoce como asignacin
ptima.
Para ilustrar la idea de cmo se extrae una muestra aleatoria estratificada de una poblacin
dada, tendremos el siguiente ejemplo.
2
EJEMPLO 12:
En una industria que elabora tapas de plstico existen 400 mquinas que fabrican ese
producto. Las mquinas han sido adquiridas por la empresa segn sus condiciones a
travs de varios aos, y as existen en ella 240 que son operadas manualmente y por lo
tanto de bajo rendimiento; 100 semi-automticas y 60 completamente automticas de
alto rendimiento. Se desea investigar el nmero medio de tapas producidas por mquina
en la primera semana de un mes en particular.
Aqu podemos utilizar cono base de estratificacin: modo de operacin, esto es, manual, semi-
automtico y automtico.
Solucin:
1. Formemos tres estratos de tamao N
1
= 240, N
2
= 100 y N
3
= 60
respectivamente.
2. Si utilizamos muestreo estratificado proporcional, el tamao de la submuestra
correspondiente al estrato h, denotado por
h
n
, la encontramos por medio de la
expresin matemtica:
N
N
n n
h
h

L h ,.... 2 , 1
donde, h : Identifica al estrato.
L : Nmero de estratos.
N
h
: Nmero de unidades muestrales en el estrato h.
N : Nmero de unidades muestrales en la poblacin.

Si deseamos obtener una muestra aleatoria estratificada de tamao n = 20, entonces
el tamao de las submuestras para cada estrato es:

12
400
240
20
1
n

5
400
100
20
2
n

3
400
60
20
3
n

De manera que el tamao total de la muestra es: n
1
+ n
2
+ n
3
= 20
Luego aplicamos M.A.S. en cada estrato, para obtener los elementos de cada submuestra. De
manera que la muestra aleatoria estratificada estara dada por dichos elementos.
Dentro de cada estrato nos interesa estimar el PARMETRO PROMEDIO POBLACIONAL (). Y
la metodologa a usar es la misma que se us en el M.A.S.
ESTRUCTURA DE ESTIMADORES DENTRO DEL ESTRATO
1. Identificar el Parmetro y proponer un estimador.
h
n
i
h
h
n
x
x
i
h
i

1
2. Estimador de la Varianza del estimador.
( )

,
_


h
h
h
h
x h
N
n
n
s
x V
h
1

2
2

Si
% 5
h
h
N
n
la frmula se reduce a: ( )
h
h
h
x
h
n
s
x V
2
2


2
3. Lmite para el error de estimacin.

,
_


h
h
h
h
est
N
n
n
s
z x V z 1 ) (

2

Intervalo estadstico:
+ < < 1 ) (
x h x h
z x z x P
Hasta aqu en el estrato.
QU PASA EN TODA LA POBLACIN?
1. Identificar el Parmetro y proponer un estimador.

h h est
x w x
donde
N
N
w
h
h
y se llama peso del estrato y es la probabilidad
de que una unidad de la poblacin elegida al azar pertenezca al estrato h.
2. Estimador de la Varianza del estimador.
N
s w
n
s w
x V
L
h h
L
h
h h
x est
est


1
2
1
2 2
2
) (
Si
05 . 0
N
n
la frmula se reduce a:


L
h
h h
x est
n
s w
x V
est
1
2 2
2
) (
El intervalo estadstico es:
est est
x est x est
z x z x + < <
3. Lmite para el error de estimacin.
2
) (
est
x est
z x V z
ASIGNACIN PROPORCIONAL
La frmula para calcular el estimador de la varianza del estimador, con asignacin proporcional
es:
N
s w
n
s w
L
h h
L
h
h h
prop


1
2
1
2 2
2

Si 05 . 0
N
n
la frmula se reduce a:

L
h
h h
prop
n
s w
1
2 2
2

El intervalo estadstico es: prop est prop est


z x z x + < <

DETERMINACIN DEL TAMAO DE LA MUESTRA EN MUESTREO ESTRATIFICADO
CON ASIGNACIN PROPORCIONAL
Para determinar el tamao de muestra tomamos
prop
z d
despejando
z
d
prop
elevando
al cuadrado
2
2

,
_

z
d
prop
, si llamamos a
2

,
_

z
d
V y sustituyendo en la frmula del
estimador de la varianza del estimador con A.P., obtenemos.
N
s w
n
s w
V
h h h h

2 2

despejando
n
obtenemos.
2
N
s w
V
s w
n
h h
h h

2
2
Si
05 . 0
N
n
la frmula se reduce a:
V
s w
n
h h

2
y se le llama
tamao general de la muestra con A.P.
ASIGNACIN PTIMA
Esta asignacin toma en cuenta la variabilidad de las unidades en el campo. Para determinar el
tamao de muestra para cada uno de los estratos usamos:

h h
h h
h
s w
s w
n n

y la frmula para determinar el estimador de la varianza del estimador es:


N
s w
n
s w
L
h h
L
h h
opt

1
2
1
2
2

Si
05 . 0
N
n
la frmula se reduce a:
n
s w
L
h h
opt

1
2 2
2
)

La deduccin de la frmula general para determinar el tamao de


muestra con Asignacin Optima de Neyman es similar a la
encontrada
con A.P.
DETERMINACION DEL TAMAO DE LA MUESTRA EN M.E.
CON ASIGNACIN PTIMA
( )
N
s w
V
s w
n
h h
h h

2
2
Si 05 . 0
N
n
la frmula se reduce a
( )
V
s w
n
h h
2

, recuerde
2

,
_

z
d
V El intervalo estadstico: opt est opt est
z x z x + < <

ESTIMACIN DE UNA PROPORCIN POBLACIONAL
1. Identificar el Parmetro y proponer un estimador.

L
h h est
p w p
1
donde
h
h
h
n
x
p ,
h
x
es el nmero de unidades en el estrato
h que poseen la caracterstica de inters y h
n
es el tamao de la muestra en el
estrato h.
2. Estimador de la Varianza del estimador.

,
_

,
_


L
h
h
h
h h
h p est
N
n
n
q p
N
N
p V
est
1
2
2
2

1
1
1
) (


Si
05 . 0
h
h
N
n
la frmula se
reduce:
2

,
_


L
h
h h
h p est
n
q p
N
N
p V
est
1
2
2
2

1
1
) (


El intervalo estadstico es:
est est
p est p est
z p z p

+ < <
3. Lmite para el error de estimacin.
2

) (

est
p est
z p V z
DETERMINACIN DEL TAMAO DE MUESTRA EN MUESTREO ESTRATIFICADO PARA
LA PROPORCION

L
h h h
L
h
h h h
q p N D N
w
q p N
n
1
2
1
2


donde
N
N
w
h
h
es la fraccin de observaciones asignadas al
estrato h, h
p
es la proporcin poblacional del estrato h y
2

,
_

z
d
D donde d es el
lmite para el error de estimacin.
EJERCICIOS PROPUESTOS
1. Subdivida la poblacin de la base de datos que Ud. posee tomando como variable el
salario
de los trabajadores de la empresa con la siguiente estratificacin.
10000
10000 5000
5000
3
2
1
>
<

x
x
x
Con una muestra general de tamao n = 30 y usando Asignacin Proporcional, estime
el
salario promedio de los empleados con una confiabilidad del 95%.
Estrato N aleatorio seleccionado
I 15 36 78 53 77 47 39 69 55
II 112 7 72 93 55 11 53 95 145 128 18 109 154 100 52
III 50 58 18 14 22 54
2. Use la estratificacin del ejercicio (1).
a. Tome una muestra piloto de tamao n = 5 por estrato y estime el verdadero
tamao de muestra con A. P. de manera que no le permita separase del
parmetro
en ms de 5% y una confiabilidad del 95%.
2
b. Con el verdadero tamao de muestra, determine entre que valores se encuentra
el salario promedio con una confiabilidad del 95%.
Estrato N aleatorio seleccionado
I 53 30 6 25 84 10 36 17 15 8 75 23 81
II 29 26 73 76 71 79 33 59 82 69 134 133 24 44 87
16 149 84 121 35 63 136
III 31 45 4 59 53 44 2 40
3. Use la estratificacin del ejercicio (1).
a. Tome una muestra piloto de tamao n = 8 por estrato, estime el verdadero
tamao
de muestra con A. O. de Neyman, de manera que no le permita separarse del
parmetro en ms de un 4% y una confiabilidad del 95%.
b. Con el verdadero tamao de muestra, determine entre que valores se encuentra
el salario promedio con una confiabilidad del 95%.
Estrato N aleatorio seleccionado
I 43 53 62 39 31 23 35 77 75
II 119 73 104 28 138 19 71 111 93 42 16 38 58 54 137
130 109 87 105 51 106 29 114 88 80 148 74 2 4
III 30 47 56 6 11 18 55 49 38 58 5 12 8 53 28
3 14 22 26
4. Suponga que la siguiente tabla conforman el marco muestral del registro de deudas
pendientes en miles de $, de una empresa que est interesada en conocer
rpidamente el promedio en deudas por clientes.
100 8 17 40 160 157 38 45 76 98 120 160
10 25 9 27 200 86 12 34 80 14 14 7
8 42 29 150 7 2 6 5 78 61 4 6
Estrato N aleatorio seleccionado
I 62 26 79 21 35
II 86 97 39 3 65
III 6 25 10 36 17
Estrato N aleatorio seleccionado
I 26 70 59 24 82 28 48 19
II 93 111 71 19 2 74 148 80
III 54 10 20 39 48 53 37 59
2
90 4 75 5 6 137 50 15 75 200 132 120
5 24 3 10 4 175 142 132 22 19 8 72
70 7 9 100 42 32 7 26 4 22 111 43
110 75 19 12 15 29 45 47 97 19 65 60
56 124 17 117 133 33 197 99 8 18 41 33
133 62 21 11 16 40 68 92 10 70 8 3
59 32 21 53 113 10 18 100 20 94 72 25
105 132 98 23 23 34 54 50 45 70 120 43
23 30 23 80 39 90 130 129 56 180 85 45
56 90 140 15 150 60 50 100 45 90 100 130
a. Estratifique esta poblacin tomando como variable lo siguiente:
50 0
1
< < X

100 50
2
< X

200 100
3
X
b. Con una muestra general de tamao n = 25 y usando Asignacin Proporcional,
estime la cantidad promedio (en miles de$) adeudada a la empresa con una
confiabilidad del 95%.
c. Tome una muestra aleatoria piloto de tamao 6 por estrato. Estime el verdadero
tamao de muestra con A.O. de Neyman de tal manera que no le permita
separarse del
parmetro en ms de un 5%, con una probabilidad del 95%.
5. Una estacin de TV que da servicio a un rea de tres distritos, est interesada en
estimar el nmero promedio de horas diarias pasadas frente al televisor por familia en
los distritos de difusin. La estacin decidi seleccionar aleatoriamente una muestra del
1% del nmero total de familias en cada estrato. La siguiente tabla presenta un resumen
de los datos. Mediante un intervalo estadstico estime el tiempo promedio que pasan las
familias frente al televisor, use un nivel de confianza del 95%.
Estrato N aleatorio
I 35 18 12 71 3 9 58 30 35 70 54 16 50
II 11 34 14 29 26 13
III 5 28 20 17 27 31
Estrato N aleatorio
I 31 71 76 38 61 33
II 14 28 36 27 4 12
III 16 29 2 33 6 15
2
Nmero del
estrato
h
Nmero de familias en el
estrato h
h
N
Tamao de
muestra en el
estrato h
h
n
Media muestral en el
estrato h
h
x
Varianza muestral en el
estrato h
2

h
s
1
2
3
12473
35241
23178
125
352
232
2.92
2.14
3.63
1.96
1.21
3.20
6. Una municipalidad est interesada en ampliar las instalaciones de un centro de atencin
diurna para nios con retraso mental. La ampliacin va a incrementar los costos de
asistencia a los nios del centro. Se va a realizar una encuesta por muestreo para
estimar la proporcin de familias con nios afectados que utilizaran las instalaciones
ampliadas. Las familias estn divididas en aquellas que usan las instalaciones y aquellas
que no lo hacen. Algunas familias viven en la ciudad donde se encuentra localizado el
centro, y otras viven en el rea rural o suburbana de los alrededores. Entonces se usa
muestreo estratificado con personas en la ciudad que usan las instalaciones, personas de
los alrededores que las usan, personas en la ciudad que no las usan y personas en los
alrededores que no las usan, formando los estratos 1, 2, 3 y 4, respectivamente.
Aproximadamente 90 % de los que usan las instalaciones y 50 % de los que no las usan
van a utilizar las nuevas instalaciones.
Registros existentes dan que N
1
= 97, N
2
= 43, N
3
= 145 y N
4
= 68. Encuentre el
tamao de muestra aproximado y la asignacin necesaria para estimar la proporcin con
un lmite de 0.05 para el error de estimacin y una confiabilidad del 95%.
7. Se lleva a cabo la encuesta del ejercicio (7) y se obtiene la siguiente proporcin de
familias que usaran las nuevas instalaciones
53 . 0 60 . 0 93 . 0 87 . 0
4 3 2 1
p p p p
Estime la proporcin
poblacional y establezca un lmite para el error de estimacin con 95% de confianza.

You might also like