You are on page 1of 49

Captulo V Muestreo estratificado (borrador)- 175

V - MUESTREO ESTRATIFICADO
V.1 - Estratificacin y eficiencia de los diseos muestrales
Ya vimos que la primera gran clasificacin de los diferentes mtodos de muestreo de-
pende del conocimiento o desconocimiento de las probabilidades de seleccin de cada
muestra posible. De all que a un grupo de estos mtodos se los denomine, segn los autores,
muestreo con probabilidad conocida, muestreo con probabilidad o muestreo probabilstico,
mientras que al otro se lo conoce como muestreo sin probabilidad conocida, muestreo sin
probabilidad o muestreo no probabilstico. El muestreo probabilstico, a partir del conoci-
miento de la probabilidad de seleccin, es la nica tcnica de muestreo que brinda una medi-
da de la confianza de las estimaciones de parmetros
(1)
.
El muestreo al azar simple es el mtodo probabilstico ms sencillo. Se caracteriza
porque todas las muestra posibles de un universo determinado cuentan con la misma oportu-
nidad de ser seleccionadas. Pero la importancia del muestreo al azar simple radica ms en su
utilidad terica y como elemento introductorio de los conceptos bsicos de muestreo que en
su aplicacin prctica, ya que, pese a su sencillez, solo puede ser utilizado bajo determinadas
condiciones, lo que lo hace poco recomendable en la mayora de las investigaciones.
El muestreo al azar simple solo es aplicable cuando se dispone de un listado satisfacto-
riamente completo de los elementos de la poblacin.
El muestreo al azar simple no es aconsejable cuando el costo de recoleccin del dato
difiere en forma importante dependiendo de cuales sean los elementos seleccionados (a partir
de la dispersin geogrfica o dificultades para su ubicacin).
El muestreo al azar simple solo debera usarse cuando no se dispone de otra informa-
cin sobre la poblacin que la lista de sus componentes.
Las dos primeras observaciones son de carcter administrativo y tcnico. La ltima se
deriva de considerar su menor eficiencia estadstica con relacin a otras alternativas de
muestreo.
Qu es la eficiencia estadstica de una muestra? Un diseo muestral es, estadstica-
mente, ms eficiente que otro cuando, para el mismo tamao de muestra, se obtiene un error
estndar menor.
Podramos hablar de eficiencia estadstica cuando el grado de precisin o la magnitud
de la confianza de las conclusiones son mayores, considerando muestras con la misma canti-
Notas:
1 No debe confundirse el concepto de representatividad con el de probabilidad. Una muestra probabilstica
tiene una determinada probabilidad de no ser representativa de una poblacin o universo, mientras que una mues-
tra no probabilstica puede ser perfectamente representativa, al menos en lo que hace a una determinada cantidad
de variables. El hecho que una muestra no sea probabilstica (condicin que se da en la gran mayora de las inves-
tigaciones sociales) no desmerece su representatividad y la validez de sus resultados, contrariamente a un mito o
prejuicio muy instalado.
176 - Introduccin al muestreo para estudiantes de ciencias sociales
dad de casos. Pero lo que se conoce como eficiencia del diseo muestral depende de la tcni-
ca de seleccin empleada y su correspondiente error estndar.
Supongamos que tenemos dos muestras (A y B) con igual cantidad de casos, obtenidas
de una misma poblacin, con idnticos estadsticos y que la diferencia entre ellas radica en la
tcnica de seleccin utilizada. Con la informacin de la muestra A podemos concluir que el
porcentaje de varones de la poblacin, para un nivel de confianza determinado, es un valor
que est entre 46% y 50%, mientras que con la muestra B podemos concluir, con la misma
confianza y similares resultados, que el porcentaje de varones de esa poblacin se encuentra
entre 47% y 49%. Ello es posible porque el error estndar que obtenemos a partir de la
muestra B es menor y diremos que es, estadsticamente, ms eficiente que la muestra A.
O tambin podemos realizar estimaciones con un mismo error, pero con niveles de
confianza distintos. La muestra que nos permite realizar estimaciones con el riesgo menor es
a la que consideraremos estadsticamente ms eficiente.
Muestra
error de
estimacin
=
confianza
z
(k/2)

error
estndar
A 2 = 2 1
B 1 = 2 0,5
A 1 = 1 1
B 1 = 2 0,5
Vimos en el captulo anterior que el MASsr es ms eficiente que el MAScr. Cmo se
consigue una muestra estadsticamente todava ms eficiente? Trabajando con las unidades
de muestreo para disminuir la probabilidad que aparezcan muestras cuyos estadsticos se
alejen en demasa de los parmetros de la poblacin.
Supongamos que nos encontramos ante una pequea reunin de tres amigos que se han
conocido cursando en el mismo colegio secundario. Como tienen edades similares, ya que
provienen de la misma promocin, y han concurrido con sus parejas y algunos de sus hijos y
nietos, nos encontramos con una poblacin claramente dividida en tres grupos muy diferen-
tes en cuanto a sus edades: los "abuelos", los "hijos" y los "nietos".
En total son 36 personas. Pasemos a describirlas, atendiendo solo a sus edades:
Abuelos Hijos Nietos
60 25 31 10 6 8
58 23 32 12 6 13
65 30 26 4 9 7
60 35 23 14 8 6
57 36 30 8 11 6
60 29 31 7 5 13
Hay 6 personas que integran el grupo de los "abuelos", 12 el de los "hijos" y 18 el de
los "nietos". La media aritmtica de la edad de todos ellos es 24 aos.
Supongamos tambin que alguien desea conocer el promedio de edad de esta pobla-
cin a partir de una muestra al azar simple sin reposicin de 6 casos.
Puede suceder que la muestra extrada se componga solo por "abuelos"? Evidente-
mente s, aunque la probabilidad es baja. Si ello sucediera llegar a la conclusin (mediante
una estimacin puntual) que el promedio de edad de la poblacin es de 60 aos. Y tambin
Captulo V Muestreo estratificado (borrador)- 177
puede suceder que la muestra extrada al azar simple sin reposicin contenga a los seis "nie-
tos" de menor edad (4, 5, 6, 6, 6 y 6) arrojando un promedio de 5,5 aos. La primera de las
muestras tiene un error de 36 aos y la segunda de 18,5 aos.
Para no olvidarnos que debemos pensar en trminos de distribuciones muestrales, estamos hablan-
do de un espacio muestral de N

= N! (N-n)! = 36! (36-6)! =1.402.410.240 muestras. Solo 720


de estas muestras sin reposicin comprenden a los seis abuelos, y otras 720 muestras a los seis
nietos menores. Aunque la probabilidad de seleccionar una muestra al azar simple sin reposicin
con las seis personas de mayor edad es muy baja (apenas el 0,00005 %), y una probabilidad simi-
lar encontramos para la seleccin de una muestra con las seis personas de menor edad, ambos su-
cesos son posibles.
Pero como la persona interesada en conocer el promedio de edad de esta pequea po-
blacin observa que hay 3 grupos claramente distintos e identificables a partir de su aparien-
cia fsica, decide extraer su muestra de seis casos en forma proporcional al tamao de los
grupos, es decir, averiguar la edad de un "abuelo", de dos "hijos" y de tres "nietos" (seleccio-
nados con MASsr dentro de cada grupo).
La tcnica utilizada, el dividir previamente a la poblacin en grupos cuyos compo-
nentes son similares entre s y luego realizar una seleccionar aleatoria dentro de cada uno de
ellos se conoce como estratificacin. Como, adems, la cantidad de casos seleccionada en
cada grupo depende del peso relativo de los grupos, hablamos de un "muestreo estratificado
proporcional". Estos grupos son excluyentes (cada elemento puede pertenecer a un solo gru-
po) y exhaustivos (en su conjunto contienen a todos los componentes de la poblacin).
A diferencia del muestreo aleatorio simple, en el muestreo estratificado no todas las
muestras (o combinaciones de elementos) tienen la misma probabilidad de ser seleccionadas.
Es ms, algunas combinaciones ni siquiera son posibles. Sin embargo, esto no es un inconve-
niente. Las probabilidades de seleccin de las muestras siguen siendo conocidas y ello es lo
que permite realizar estimaciones de parmetros con errores y riesgos mensurables.
Volviendo a nuestro investigador, es posible que seleccione a los tres "nietos" ms
pequeos, a los dos "hijos" de menor edad y al "abuelo" ms joven? Otra vez la respuesta es
s. Y, a la inversa, tambin puede suceder que seleccione en cada uno de los grupos a quienes
tienen mayor edad.
Veamos la primera posibilidad, la de seleccionar a los ms jvenes en cada grupo. La
seleccin dara una muestra con casos de 4, 5, 6, 23, 23 y 57 aos, y un promedio de 19,8
aos de edad (error: - 4,2 aos).
Cualquier otra combinacin de seis casos que arroje un promedio de edad menor al de
la poblacin, no podra estar ms alejada de este que la muestra obtenida.
Y para la segunda posibilidad, la de seleccionar a los de mayor edad en cada grupo,
obtendra una muestra de 13, 13, 14, 36, 35 y 65 aos, con un promedio de 29, 3 aos (error:
+ 5,3 aos).
Cualquier otra combinacin de seis casos con un promedio de edad mayor al de la po-
blacin, no podra estar ms alejada de este que la muestra obtenida.
Aunque con poca probabilidad de aparicin, ambas selecciones son las ms extremas
que pueden aparecer. Ntese la diferencia con las muestras de valores ms extremos obteni-
bles mediante MASsr, donde los errores eran de 18,5 y 36 aos respectivamente.
178 - Introduccin al muestreo para estudiantes de ciencias sociales
Es evidente que, al utilizar este segundo procedimiento, sin modificar la cantidad de
casos seleccionados ha disminuido la posibilidad de aparicin de muestras con valores aleja-
dos de la media de la poblacin y, consecuentemente, la posibilidad de llegar a conclusiones
errneas. Aunque la demostracin no es la ms ajustada, desde el punto de vista matemtico,
sirve para una comprensin intuitiva del concepto de eficiencia estadstica del diseo mues-
tral.
Qu es lo permite al muestreo estratificado conseguir una mayor precisin con un
mismo tamao de muestra (e incluso menor) que el muestreo al azar simple? Sin profundizar
en los fundamentos, solamente diremos que la varianza total puede explicarse por la suma de
las variabilidades intra-grupos e inter-grupos. Al formar grupos lo ms dismiles entre s (y
por lo tanto con gran homogeneidad interna) se busca que este factor (la variabilidad inter-
grupos) asuma la mayor parte de la varianza total (ver apndice al final del captulo).
La eficiencia estadstica de un diseo muestral no depende del lmite inferior o supe-
rior del rango de valores que se obtienen en una distribucin muestral, sino de la variabili-
dad de esta distribucin, aunque, como consecuencia, la extensin del rango pueda disminuir.
La mayor eficiencia estadstica se expresa, refirindonos a la poblacin que usamos de ejem-
plo, en que la distribucin muestral de medias de n=6 y MASsr tiene un error estndar de po-
co ms de 7 aos, mientras que la distribucin muestral de medias de n=6 con muestreo es-
tratificado proporcional arroja un error estndar de poco menos de 2 aos.
La eficiencia estadstica del muestreo estratificado depende fundamentalmente de las
caractersticas de los estratos construidos. Cuanto ms se parezcan entre s los componentes
de un mismo estrato y ms se diferencien de los elementos de los otros estratos mayor senti-
do tiene la estratificacin.
Aunque tengan como referencia comn la variabilidad, no debe confundirse la eficiencia del dise-
o con la eficiencia del estimador que vimos en el captulo anterior. Un estimador es ms eficiente
que otro cuando, para un mismo diseo e igualdad de casos, tiene un error estndar menor. La efi-
ciencia de los diseos se establece a partir del mismo estimador, cuando, para una misma cantidad
de casos, se consigue disminuir su error estndar.
Eficiencia del estimador Eficiencia del diseo
Estimador A Estimador B Diseo A Diseo B
Insesgados
(2)
Mismo estimador
Mismo espacio muestral Diferentes espacios muestrales
+ error estndar - error estndar + error estndar - error estndar
- eficiencia + eficiencia - eficiencia + eficiencia
Una de las razones para la utilizacin del muestreo estratificado es, entonces, la de
aumentar la precisin o confiabilidad de los estimadores. Pero tambin puede optarse por
esta tcnica a partir de la necesidad de informacin especfica sobre sub-poblaciones del uni-
verso, que pueden ser consideradas como estratos y de las que se sacarn muestras indepen-
dientes, o por la intencin de desarrollar tcnicas de seleccin diferentes en cada sub-grupo.
Notas:
2 Cuando al menos uno de los estimadores es sesgado, para determinar cul es ms eficiente se aplican
clculos sencillos que contemplan tanto la magnitud de la varianza como el sesgo.
Captulo V Muestreo estratificado (borrador)- 179
Como una derivacin secundaria, tambin puede emplearse el muestreo estratificado cuando,
sin modificar la confianza o precisin de la estimacin, se desea trabajar con una menor can-
tidad de casos.
Para una adecuada estratificacin deben responderse varias preguntas:
1) Qu variables deben ser consideradas para dividir a la poblacin en estratos?
2) Cmo combinamos y categorizamos estas variables, cules son los lmites de cada
estrato?
3) Cuntos estratos deben considerarse?
4) Cuntos casos se seleccionaran dentro de cada estrato?
V.2 - Estimacin de medias, proporciones y totales con muestras estratificadas
Antes de responder a las cuatro preguntas que cierran el punto anterior, es conveniente
introducirnos en la estimacin de medias, proporciones y totales a travs de intervalos de
confianza con muestras estratificadas.
Como ya vimos, el clculo del error de estimacin no es ms que la multiplicacin del
error estndar por una magnitud que depende de la confianza elegida [ (z
(k/2)
]. El problema
radica en establecer, en cada caso y a partir de las caractersticas de la muestra, la magnitud
del error estndar. Cuando trabajamos con muestras aleatorias simples utilizamos los si-
guientes procedimientos:
frmula general ( )
( )

2 k
z

k , IC =
Poblaciones infinitas o MAScr Poblaciones finitas y MASsr
Medias
( )
( )
n
s
z x k , IC
2
2 k
= ( )
( )
N
n N
n
s
z x k , IC
2
2 k

=
Total
( )
( )
n
s N
z N x k T, IC
2 2
2 k
= ( )
( )
N
n N
n
s N
z N x k T, IC
2 2
2 k

=
Propor-
ciones
( )
1 - n
p.q
z p k) IC(P,
2 k
= ( )
( )
N
n N
1 - n
p.q
z p k P, IC
2 k

=
y
N
n N
puede reemplazarse por 1-f (siendo f = n/N)
Donde el error de estimacin est dado por la multiplicacin de la estimacin puntual
del error estndar (utilizando para su clculo los estadsticos p y s
2
como estimadores de los
parmetros P,
2
y S
2
) por la confianza elegida (expresada en puntaje z equivalente al rea
bajo la curva normal para la mitad de la confianza).
En el muestreo estratificado el concepto no vara, pero s lo hace el procedimiento para
calcular los estadsticos y estimar los parmetros y sus errores estndar, a los que llegamos
mediante sumas ponderadas de las medidas de las muestras de cada estrato, ya que las distri-
buciones muestrales derivadas de una seleccin estratificada son distribuciones muestrales de
estadsticos ponderados.
180 - Introduccin al muestreo para estudiantes de ciencias sociales
Si tenemos una muestra de 200 hogares del norte de la provincia de Buenos Aires que
arroja un promedio de 5 personas por hogar y otra muestra de 200 familias del sur con pro-
medio de 4 personas por hogar (afijacin igual, como veremos ms adelante), y sabemos que
los hogares del norte implican el 80% del total de hogares de la provincia, no podemos esti-
mar el promedio provincial de personas por hogar simplemente calculando el promedio de
ambas muestras. Debemos asignar a cada muestra el peso de la poblacin que representa.
sur sur norte norte provincia
x W x W x + = (donde W=proporcin o peso del estrato en la poblacin)
8 , 4 8 , 0 4 4 2 , 0 5 8 , 0 x
provincia
= + = + = personas por hogar
Los promedios de 5 y 4 personas por hogar variarn de una muestra a otra. Lo que se
mantiene constante es el peso de dada estrato. Los espacios muestrales son el resultado de la
combinacin de todas y cada una de las muestras posibles de un estrato con todas las mues-
tras posibles de los otros estratos y los valores de las distribuciones muestrales de medias son
los promedios ponderados de las medias de las muestras de cada estrato.
Supongamos una poblacin de 800.000 trabajadores en relacin de dependencia, divi-
da en tres estratos. El estrato A tiene 350.000 personas, el B tiene 300.000 y el C tiene
150.000.
En cada estrato se selecciona una muestra aleatoria simple, siendo el tamao de las
muestras proporcional al peso de cada estrato. Posteriormente se obtiene informacin sobre
la aprobacin de la instruccin primaria y el ingreso mensual de cada persona seleccionada,
la que est volcada en el cuadro siguiente.
En la primera columna se incluyen las medidas de la muestra global calculadas como
si esta hubiera sido extrada al azar simple sin reposicin.
Azar sim-
ple
Estrato A Estrato B Estrato C
N (poblacin) 800.000 350.000 300.000 150.000
W (peso) 0,4375 0,375 0,1875
n (muestra) 800 350 300 150
p (proporcin) primaria completa aprobada 0,31 0,15 0,25 0,80
x (media) ingreso mensual $ 588 $ 320 $ 460 $ 1470
s
2
(cuasivarianza) ingreso mensual 205.466 9.632 10.852 108.306
Comencemos estimando la media y la proporcin de la poblacin a partir del total de
la muestra, como si toda en su conjunto hubiera sido seleccionada al azar simple, para una
confianza del 95,5%. Utilizaremos las frmulas del muestreo con reposicin, en lugar de las
que deberamos utilizar (las del muestreo sin reposicin) al solo efecto de simplificar los cl-
culos. Para la estimacin mediante intervalos de la media:
( )
( )
n
s
2
2 k
z x k , IC =
Captulo V Muestreo estratificado (borrador)- 181
Remplazando...
( ) 32,05199 $588 16,02599 2 $588
800
205.466
2 $588 ,0.955 IC = = =
Y llegamos a la conclusin que, para una confianza del 95,5%, la remuneracin media
mensual es un valor que est entre $554,
94
y $620,
06
.
Solo a modo ilustrativo (para quedarnos tranquilos y comprobar que con poblaciones
grandes y fracciones de muestreo pequeas la aplicacin de una u otra frmula no cambia
demasiado la cosa), utilicemos tambin la frmula para MASsr.
( )
( )
N
n N
n
s
2
2 k
z x k , IC

=
Remplazando...
( ) 32,03596 $588
000 . 800
800 000 . 800
800
205.466
2 $588 ,0.995 IC =

=
Donde, con la misma confianza, establecemos un intervalo con lmites $555,
96
y
$620,
04
, siendo despreciable la ganancia en la precisin (por lo pequeo de la fraccin de
muestreo).
Continuemos con la estimacin de P, para la misma confianza y con el procedimiento
para MAScr:
( )
( )
1 - n
p.q
z p k P, IC
2 k
=
Y, reemplazando:
( ) 3272367 0 , 0 31 , 0
799
0,69 0,31
2 31 , 0 k P, IC =

=
, expresado en puntos porcentuales:
( ) 3,272367 31
799
69 31
2 31 k P, IC =

=
De donde concluimos, para una confianza del 95,5%, que P est dentro de un intervalo
con lmites inferior y superior de 0,2772 y 0,3428 respectivamente ( 27,72% y 34,28%, co-
mo ms nos guste expresarlo).
Veamos ahora los pasos para la estimacin de P y considerando la estratificacin.
182 - Introduccin al muestreo para estudiantes de ciencias sociales
El clculo de la media y la proporcin globales de la muestra no presenta inconve-
nientes. Es simplemente un promedio ponderado y se expresa en las frmulas...
C C B B A A ABC
x W x W x W x + + =
C C B B A A ABC
p W p W p W p + + =
W
A
,W
B
y W
C
indican los pesos de cada uno de los estratos, donde
N
N
W
i
i
= (el peso
de un estrato es el cociente entre la cantidad de elementos del estrato sobre el total de ele-
mentos de la poblacin) y 1 W
i
=

(la suma del peso de todos los estratos es igual a 1).


As, reemplazando por los correspondientes valores, tenemos, para la media de ingre-
sos...
x
ABC
= 0,4375 320 + 0,375 460 + 0,1875 1470 = $588
...y, para primario completo...
p
ABC
= 0,4375 0,15 + 0,375 0,25 + 0,1875 0,80 = 0,31

p
ABC
= 0,4375 15% + 0,375 25% + 0,1875 80% = 31%
En el caso particular del muestreo estratificado proporcional, si hubieramos podido efectual el cl-
culo de la media a partir de la matriz de datos (con la informacin desagregada caso por caso) po-
dramos habernos ahorrado la ponderacin, ya que al representar los elementos de cada muestra el
peso de su estrato, el valor final sera el mismo.
El clculo del error estndar total a partir de datos estratificados no es tan directo. No
podemos llegar a l a travs de una suma ponderada de los errores estndar de cada estrato
(como lo hicimos con la media y la proporcin) sino a travs de las varianzas de las distribu-
ciones muestrales de cada estrato.
La varianza de la distribucin muestral total es la suma de las varianzas de las distri-
buciones muestrales de cada uno de los estratos, ponderadas por los pesos cuadrados de los
estratos correspondientes:
2
i
x
2
i
2
x
W =
Si, con MAScr...
i
2
i

2
i
x
n

=
...podemos remplazar
i
2
x
2
i
2
x
W = por
i
2
i 2
i
2
x
n

W =
Captulo V Muestreo estratificado (borrador)- 183
Y, si con MAScr,
2 2
s = (insesgado), entonces podemos estimar puntualmente la va-
rianza total de la distribucin muestral a partir de la suma de las cuasivarianzas de las mues-
tras de todos los estratos, divididas por la cantidad de elementos de la muestra de cada es-
trato y ponderadas por el peso cuadrado del estrato correspondiente.

=
i
2
i 2
i
2
x
n
s
W
El paso siguiente para llegar a la estimacin puntual del error estndar es obvio: ex-
traer la raz cuadrada de la estimacin de la varianza total de la distribucin muestral.

=
i
2
i 2
i x
n
s
W
Entonces ya podemos realizar la estimacin por intervalos de la media total.
( )
( )

=
i
2
i 2
i
2 k
ABC ABC
n
s
W z x k , IC
Frmula que, aplicada a nuestro ejemplo, nos lleva (siempre con el clculo simplifica-
do del MAScr), a...
( )
( )
C
2
C
2
C
B
2
B
2
B
A
2
A
2
A
2 k
ABC ABC
n
s W
n
s W
n
s W
z x k , IC + + =
El clculo del error estndar se desarrolla en el siguiente cuadro.
Si ... entonces
Estrato W s
2
n W
2
s
2
/ n
... y el resulta-
do es
A 0.4375 9.632 350 0,4375
2
9.632

350 5,27
B 0.375 10.852 300 0,375
2
10.852

300 5,09
C 0.1875 108.306 150 0,1875
2
108.306

150 25,38
Sumamos todos los resultados ( W
2
s
2
/n), con lo que llegamos a la estimacin de la
varianza de la distribucin muestral de medias total
35,74
Y luego extraemos la raz cuadrada de la suma anterior para obtener la estimacin del
error estndar total
5,98
Ahora tenemos la informacin necesaria para realizar la estimacin global, utilizan-
do...
( )
( )
ABC
x
2 k
ABC
z x k , IC =
...que, al remplazar por los valores correspondientes, nos da
( ) $11,96 $588 $5,98 2 $588 ,0.955 IC = =
184 - Introduccin al muestreo para estudiantes de ciencias sociales
Redondeando, concluimos que, con una confianza del 95,5%, el ingreso mensual pro-
medio de nuestra poblacin es un valor que est dentro de un intervalo con lmites $576 y
$600. Recordemos que el clculo sin considerar la estratificacin estableca un intervalo (pa-
ra la misma confianza) con lmites $555 y $621, por lo que hemos reducido el error de esti-
macin de $33 a $12.
Ello implica, en trminos relativos sobre la estimacin puntual de la media aritmtica,
una reduccin del error de estimacin de 5,6 puntos porcentuales a 2 puntos porcentuales, lo
que no es poco, sobre todo si tenemos en cuenta que si deseamos una reduccin equivalente
del error de estimacin usando MASsr el tamao de la muestra debe elevarse de 800 a cerca
de 5.700 casos para los valores que usamos de ejemplo.
Avancemos ahora sobre las proporciones. La frmula para estimar el error estndar de
la distribucin muestral de proporciones de la muestra total sigue la misma lgica que la de
las medias aritmticas (raz cuadrada de la sumatoria de las estimaciones puntuales de las va-
rianzas de las distribuciones muestrales de las muestras de cada estrato multiplicadas por los
pesos cuadrados de los estratos correspondientes), y es:


=
1 n
q p
W
i
i i 2
i p
Si ... entonces
Estrato W p n W
2
p.q

/ (n-1)
... y el resulta-
do es
A 0.4375 15 350 0,4375
2
15 85

349 0,7
B 0.375 25 300 0,375
2
25 75

299 0,88
C 0.1875 80 150 0,1875
2
80

20 149 0,38
Sumamos todos los resultados ( W
2
pq/(n-1), con lo que llegamos a estimacin de la
varianza de la distribucin muestral de proporciones total
1,96
Y luego extraemos la raz cuadrada de la suma anterior para obtener la estimacin del
error estndar total
1,4
Ya podemos estimar, mediante intervalo, la proporcin de personas de la poblacin
que cuentan con estudios primarios aprobados.
( )
( )
ABC
p
2 k
ABC
z p k P, IC =
( )
( )
1 n
q p W
1 n
q p W
1 n
q p W
P
C
C C
2
C
B
B B
2
B
A
A A
2
A
2 k
ABC
z p k , IC

=
( ) 2,8 31 1,4 2 31 P,0.955 IC = =
Atendiendo a la estratificacin, el nuevo intervalo de estimacin de P (para una con-
fianza del 95,5 %) queda entre 28,2 y 33,8%, mientras que el anterior estaba dado por 27,7 y
34,3 %, o dicho de otra forma, el error de estimacin se reduce de 3,3 a 2,8 puntos porcen-
tuales. Si pretendemos obtener este error de estimacin mediante MASsr la cantidad de casos
necesarios en la muestra se eleva de 800 a cerca de 1.100, siempre y cuando podamos esti-
mar previamente con cierta aproximacin la heterogeneidad de la poblacin.
Captulo V Muestreo estratificado (borrador)- 185
Qu es lo que ha permitido reducir los errores de estimacin, mejorar la eficiencia
estadstica? Que el criterio de agrupamiento de los casos demostr ser til al construir estra-
tos con poca variabilidad, lo que llev a una disminucin del error estndar total. Recorde-
mos que se dice que un diseo muestral es ms eficiente en lo estadstico que otro cuando,
para el mismo tamao de muestra, se obtiene un error estndar (o tpico) menor.
V.2.A - Frmulas para estimacin de parmetros mediante intervalo de confianza (muestras
estratificadas)
Seleccin
intra-estrato
parmetro Frmula
( )
( )

=
i
2
i
2
i
2 k
ABC ABC
n
s W
z x k , IC
T(X) ( )
( )

=
i
2
i
2
i
2 k
ABC ABC
n
s N
z N x k , T(X) IC MAScr
P ( )
( )

=
1 n
z p k , IC
i
i i
2
i
2 k
ABC ABC
q p W
P

( )
( )
( )

=

i i
i i
2
i
2
i
2 k
ABC ABC
N n
s W
z x k , IC
n N
T(X) ( )
( )
( )

=

i
i i
2
i i
2 k
ABC ABC
n
s N
z N x k , T(X) IC
n N
MASsr
P ( )
( )

=

i i
i i i i
2
i
2 k
ABC ABC
1)N (n
z p k , IC
) n (N q p W
P
V.3 - Variables que deben ser consideradas para dividir (estratificar) a la poblacin.
Qu variables deben ser consideradas para dividir a la poblacin en estratos?
La respuesta intuitiva a la pregunta es obvia: la mejor estratificacin surge de la distri-
bucin de la variable en estudio. Pero esta respuesta, adems de obvia, puede llegar a ser ab-
surda, ya que si tenemos suficiente informacin sobre esta variable como para confeccionar
estratos a partir de ella, qu sentido tiene realizar una investigacin sobre la misma?
Afortunadamente solemos contar, a partir de relevamientos censales o investigaciones
previas, con informacin sobre variables estrechamente vinculadas con las de investigacin.
La distribucin geogrfica, el sexo, la edad, el nivel socioeconmico, los ingresos, la condi-
cin de ocupacin, los resultados electorales, la mortalidad, la fecundidad, la educacin, la
densidad poblacional, el hacinamiento, la cantidad de empleados, la distribucin y cobertura
de servicios pblicos, el grado de "bancarizacin", la exposicin a medios de comunicacin,
la participacin de una marca en el mercado, el rgimen de tenencia de la tierra, la recauda-
cin impositiva, la cobertura de salud, el grado de sindicalizacin o el monto de facturacin
186 - Introduccin al muestreo para estudiantes de ciencias sociales
anual, son algunas de las tantas variables sobre las que se cuenta con informacin (o sobre
las que se pueden realizar estimaciones confiables) y que suelen estar ntimamente relacio-
nadas con muchas de nuestras inquietudes. Es entonces a partir de ellas que se realiza la es-
tratificacin, buscando que los elementos de cada estrato sean lo ms parecidos entre s y
maximizando las diferencias con los integrantes de los otros estratos.
La calidad de la estratificacin depender, entre otros factores, del grado de asociacin
de las variables consideradas a tal efecto con las variables en estudio. Como en muchos otros
aspectos del diseo muestral, un buen juicio, experiencia y ajustado marco terico suelen ser
ms tiles que frmulas o recetas para su eleccin.
V.4 - Establecimiento de los estratos (categorizacin).
Cmo combinamos y categorizamos las variables utilizadas para estratificar, cules
son los lmites de cada estrato?
El problema radica en los lmites a partir de los cuales definir los estratos. Y se com-
plica a medida que aumenta en nivel de medicin de las variables de estratificacin. Si deci-
diramos realizar una estratificacin sencilla a partir del sexo, la regin de residencia o la
condicin de ocupacin no tendramos mayores dudas para ubicar a cada caso en alguna de
las categoras, cumpliendo los requisitos bsicos de la estratificacin: cada una de las unida-
des de muestreo est comprendida en algn estrato y solo en uno (estratos mutuamente ex-
cluyentes y en su conjunto comprensivos de la totalidad de la poblacin) y los elementos de
cada estrato sern similares entre s y diferentes a los de cualquier otro estrato (un integrante
de un estrato no debe parecerse ms a un elemento de otro estrato que a uno del propio).
Pero si la variable utilizada fuera la edad (establecida en aos cumplidos) la definicin
del lmite de cada estrato es ms difcil (y muchas veces sin solucin). Si definimos tres gru-
pos: menores de 30 aos, de 30 a 50 aos y mayores de 50 aos, cumpliramos con la primera
condicin (que cada unidad de muestreo sea incorporable a un grupo y solo a uno) pero no
con la segunda. Una persona de 29 aos pertenece al primer grupo, pero sin embargo tiene
ms semejanza con una gran cantidad de integrantes del segundo grupo que con muchos de
los miembros de su propio grupo. Se parece ms a una persona de 30 aos, que pertenece al
segundo estrato, que a otra de 22 aos con la que comparte el estrato. Este tipo de clasifica-
cin generar grupos no definibles como estratos, al menos muestralmente hablando. Incluso
cuando se realiza una estratificacin compleja de menor nivel de medicin (utilizando dis-
tintas variables), la combinacin de categoras puede generar inconvenientes similares.
Esto no significa que las variables de nivel de medicin intervalar o de razones no
puedan ser utilizadas para estratificar a la poblacin en estudio. Al margen que existen algu-
nos procedimientos matemticos para estratificar con estas variables, hay situaciones donde
los cortes se establecen naturalmente por ausencia de unidades con determinados valores in-
termedios, y muchas veces el corte no necesariamente se vincula con los valores de la varia-
ble utilizada para estratificar sino con atributos asociados a estos (aunque, estrictamente, no
estamos usando esta variable para estratificar). Cuando, por ejemplo, las variables en estudio
estn relacionadas con temas educativos, demogrficos u ocupacionales, la edad puede arro-
jar segmentaciones significativas con independencia de la cercana o no de sus valores. Con-
sideraciones similares se pueden hacer, por ejemplo con el uso de los ingresos familiares o
Captulo V Muestreo estratificado (borrador)- 187
personales como variable de estratificacin, donde establecemos cortes con mayor minucio-
sidad en los valores ms bajos, ya que a medida que aumentan los ingresos las diferencias se
vuelven menos significativas.
La determinacin de los lmites de los estratos tiene fundamentos ms tericos que
estadsticos y depende del conocimiento que los investigadores tengan sobre las caractersti-
cas de la asociacin de las variables utilizadas en la estratificacin con las variables en estu-
dio.
Cuando el investigador se encuentra con dificultades para establecer los limites de un
estrato, es conveniente evaluar la posibilidad de no subdividirlo y darle el tratamiento co-
rrespondiente a un estrato de alta variabilidad.
V.5 - Cantidad de estratos.
Cuntos estratos deben considerarse?
Una gran cantidad de estratos nos permite cumplir ms acabadamente con la condicin
que los integrantes de un estrato sean similares entre s y se diferencien de los integrantes de
los otros estratos, por lo que podramos responder que la cantidad de estratos ser la mayor
que podamos establecer con un sustento aceptable.
Pero, por grande que sea la cantidad de estratos, nunca se conseguir explicar com-
pletamente la "variabilidad" de las observaciones. A partir de cierto momento la variacin
"inexplicada" ser dominante y es pequea la ganancia que tendremos introduciendo una
mayor cantidad de estratos. Si consideramos el tema de los costos (ya sea en la seleccin
como en recoleccin del dato y en los anlisis posteriores de la informacin) tambin encon-
traremos que la creacin de una gran cantidad de estratos poco aporta con relacin a la inver-
sin total.
Siguiendo a Cochran
(3)
y pensando en trminos de "costo/beneficio", es aconsejable
no utilizar mucho ms de seis estratos cuando el objetivo es realizar estimaciones que inclu-
yen a la totalidad de los casos. Sin embargo, esta no es una regla que necesariamente debe
seguirse, dependiendo entre otras cosas del grado de asociacin de la variable estratificado-
ra con la variable de estudio y de la cantidad de casos que podemos seleccionar por estrato.
Si la asociacin es alta, ganaremos con mayor cantidad de estratos. Si la cantidad de casos a
seleccionar en cada estrato es baja, no estar de ms dividir a la poblacin en ms estratos
para asegurarnos la mayor homogeneidad posible dentro de cada uno de ellos, de forma de
que unos pocos casos por estrato puedan ser representativos sin asumir demasiados riesgos.
Una mayor cantidad de estratos ser considerada tambin cuando el objetivo sea tener infor-
macin de sub-grupos.
Notas:
3 Cochran, W.G., Tcnicas de Muestro, pg. 176, Ed. Cecsa, Mxico, 2000
188 - Introduccin al muestreo para estudiantes de ciencias sociales
V.6 - Cantidad de casos en cada estrato.
V.6.A - Asignacin proporcional y no proporcional
Cuntos casos se seleccionaran dentro de cada estrato?
Las observaciones de una muestra estratificada pueden distribuirse en forma propor-
cional al tamao o peso de los estratos en la poblacin o pueden distribuirse, por distintos
motivos, en forma no proporcional (con igual o desigual cantidad de casos en cada estrato).
En el caso que queramos comparar los resultados de sub-grupos o realizar estimacio-
nes para cada sub-grupo con una precisin mnima, con una asignacin proporcional pode-
mos quedarnos sin bases de clculo suficientes si alguno de ellos es relativamente pequeo.
De acuerdo a los datos del censo 2001, la poblacin que reside en la Patagonia repre-
senta menos del 5% de la poblacin total de la repblica argentina, mientras que los residen-
tes en el Gran Buenos Aires abarcan a casi el 32% y los de la Regin Central el 35%. Si
asignramos proporcionalmente por regin una muestra de n=2000, a la Patagonia le corres-
ponderan 100 casos, al Gran Buenos Aires 640 y a la Regin Central 700, repartindose los
casos faltantes en las restantes regiones.
Evidentemente, la precisin de las estimaciones para la Patagonia ser muy pobre. Si
nuestro inters es contar con estimaciones razonablemente precisas para cada regin, sin au-
mentar el tamao de la muestra total y sin considerar los costos de recoleccin del dato, ten-
dremos que asignarle ms casos a las regiones pequeas en menoscabo de las mayores. Ha-
cindolo con criterio, la prdida de precisin en las regiones de mayor peso ser relativa-
mente pequea en comparacin con la ganancia en las reas de menor magnitud.
En el cuadro que figura a continuacin se observan los mximos errores de estimacin
por regin para variables de nivel de medicin ordinal o menor, con una confianza del
95,5%, con asignacin proporcional y no proporcional (en este caso arbitraria), con MAScr
intra-estrato.
Asignacin
Proporcional No proporcional
Regin
n
( )
p
2 k
z
n
( )
p
2 k
z
Patagonia 100 10 % 300 5,8 %
Gran Buenos Aires 640 4 % 560 4,2 %
Regin Central 700 3,8 % 580 4,2 %
El agregarle 200 casos a la Patagonia y restarle 80 al Gran Buenos Aires y 120 a la
Regin Central implica una importante ganancia en la estimacin de parmetros para la pri-
mera regin, sin que la prdida sea significativa en las otras.
Tambin podremos optar por una asignacin igual por estrato, de manera que la preci-
sin de las estimaciones sea similar en todas las regiones. En este caso, en cada una de las 6
grandes reas de la Repblica Argentina seleccionaremos alrededor de 333 casos, siendo el
mximo error de estimacin de casi 5,5 puntos porcentuales en cada una (siempre para varia-
bles de nivel de medicin ordinal o menor y con MAScr).
Captulo V Muestreo estratificado (borrador)- 189
Si lo que nos interesa son los resultados globales y solo conocemos de los estratos su
tamao, la distribucin proporcional es recomendable. Pero, si adems contamos con una es-
timacin razonable de la variabilidad de los estratos, a los efectos de mejorar la eficiencia
estadstica, podemos realizar una distribucin no proporcional.
Para ilustrarlo, pensemos que hemos decido extraer una muestra de 200 casos de una
poblacin de 600 personas para conocer la remuneracin mensual media de los operarios de
una empresa manufacturera, y definido dos estratos de trabajadores: los no calificados y los
calificados.
De los primeros sabemos que comprenden al 60% de nuestra poblacin, tienen condi-
ciones y caractersticas de trabajo similares y remuneraciones que oscilan entre $500 y $560
mensuales. De los trabajadores calificados sabemos que tienen salarios que oscilan entre
$700 y $1400 a partir de condiciones y calificaciones laborales dismiles.
Estratos
No calificados Calificados
N 360 240
Rango salarios $ 500 / $ 600 $ 700 / $ 1400
Si el muestreo es proporcional deberamos seleccionar, para la muestra, 120 trabajado-
res no calificados y 80 calificados. Sin embargo, e invocando al sentido comn no sera un
desperdicio asignar una muestra de 120 casos al estrato de trabajadores no calificados, cuan-
do con unos pocos casos obtendramos una medida suficientemente confiable de la media de
su remuneracin mensual? No sera entonces tambin razonable asignar ms casos a los tra-
bajadores calificados, ya que dada la variabilidad de su ingreso corremos mayor riesgo de
obtener un valor de la media demasiado alejado del verdadero si trabajamos con poca infor-
macin? La respuesta es, evidentemente, s.
Pero los trabajadores no calificados son ms numerosos y un error en la estimacin de
sus parmetros tendr ms influencia en la estimacin total que un error en la estimacin de
los parmetros de los trabajadores calificados. Surge entonces una pregunta: cul es la ms
ajustada distribucin de casos por estratos? Cul es la distribucin ptima que, contemplan-
do el tamao de los estratos pero tambin su variabilidad, brinda el menor error estndar po-
sible?
V.6.A.1 - Asignacin (afijacin) ptima.
Asumiendo que la estratificacin fue correctamente establecida, que los costos de la
recoleccin de datos en cada estrato no son sensiblemente distintos y que el tamao total de
la muestra es fijo (para cualquier combinacin de estratos) la pregunta es: cuntos casos de-
ben asignarse a cada estrato si decidimos realizar una muestra estratificada no proporcional,
y esta decisin no est basada en la necesidad de conocer con determinada precisin las ca-
ractersticas de alguno o todos los estratos, sino en la pretensin de mejorar la eficiencia es-
tadstica global?
Ya sea porque las poblaciones son pequeas o, sobre todo, porque los datos tienen me-
nos variabilidad (poblaciones ms "homogneas"), sabemos que la cantidad de casos necesa-
rios en una muestra ser menor sin afectar la eficiencia estadstica. Entonces, si las muestras
190 - Introduccin al muestreo para estudiantes de ciencias sociales
estratificadas no son ms que la suma de muestras aleatorias simples independientes en cada
estrato por qu no aprovechar este conocimiento para optimizar la eficiencia estadstica
global de nuestra muestra y asignarle ms casos a los estratos ms "complejos", reduciendo
los de los estratos menos "complejos", sin dejar de considerar simultneamente el tamao de
cada estrato, disminuyendo los errores estndar parciales y llevando el error estndar total a
su mnima expresin?
Veamos distintas alternativas de muestreo utilizadas a los efectos de ir mejorando la
eficiencia estadstica. Dijimos que el tamao de la muestra ser 200 casos, con independen-
cia de la tcnica de seleccin utilizada. Supongamos que el investigador extrae una muestra
aleatoria simple, y como tiene suerte, los resultados son absolutamente representativos de la
poblacin (cosa que nosotros conocemos, pero l no).
Muestra de 200 trabajadores al azar simple sin reposicin
x = $ 712,5 s
2
= 81.465
El investigador estima ahora mediante intervalo la media de la poblacin para una con-
fianza del 95,5%. Como la poblacin es pequea, la muestra fue obtenida sin reposicin y la
fraccin de muestreo es grande, aplica la frmula:
( ) =

= =
N
n N
n
s
z x z x 0.955 , IC
2
(k/2) x (k/2)
33 5 , 12 7 479 , 16 2 5 , 12 7 $
600
200 600
200
81.465
2 5 , 12 7 = =

=
Y llega a la conclusin que la remuneracin mensual media, con una confianza del
95,5%, es un valor que est entre $ 679,5 y $ 745,5.
Pero si hubiera sabido que el 60% de los trabajadores no tienen calificacin, podra
haber extrado una muestra estratificada proporcional, la que, con un poco de buena fortuna,
arrojara la siguiente informacin:
Muestra de 200 trabajadores. Estratificado pro-
porcional
Estrato A (no ca-
lificados)
Estrato B (califi-
cados)
n 120 80
x $ 520,8 $ 1000
s
2
375 65.272
A partir de estos datos calculamos primero la media global de la muestra mediante el
promedio ponderado de las medias de las muestras de los estratos A y B.
712,5 1000 0,4 520,8 0,6 x W x W x
B B A A AB
. . = + = + =
Luego estimamos puntualmente el error estndar de la distribucin muestral de medias
de la muestra. Repasando, para ello se estiman las varianzas de la distribuciones muestrales
correspondientes a las muestras de cada estratos, se las multiplica por el peso al cuadrado del
Captulo V Muestreo estratificado (borrador)- 191
estrato, se suman los productos obtenidos para llegar a la estimacin de la varianza total de la
distribucin muestral y luego se extrae su raz cuadrada. La frmula para la estimacin del
error estndar, si MASsr intra-estrato, es:
( )


=
i i
i i
2
i 2
i x
N n
n N s
W


=
i
i i
i
2
i 2
i x
N
n N
n
s
W
Aplicada a nuestro ejemplo:
( ) ( )
B B
B B
2
B
2
B
A A
A A
2
A
2
A
AB x
N n
n N s W
N n
n N s W

=
Y remplazando:
( ) ( )
=


=
40 2 80
0 8 40 2 272 . 65 0,16
60 3 120
20 1 60 3 75 3 ,36 0

AB x
37 , 9 78 , 87 03 , 87 75 , 0 = = + =
Teniendo ya las estimaciones puntuales de la media de la poblacin y del error estn-
dar podemos calcular el error de estimacin y por lo tanto el intervalo de confianza:
( )
( )
18,74 712,5 9,37 2 712,5 z x 0.955 , IC
AB x 2 k AB
= = =
Concluyendo que la remuneracin mensual media (con una confianza del 95,5%) es un
valor que est entre $693 y $732, intervalo notablemente ms pequeo que el establecido por
la estimacin a partir de la muestra aleatoria simple ($679 / $746).
Pero supongamos que el investigador no solo conoce la cantidad de personas incluidas
en cada estrato poblacional sino que adems tiene informacin confiable sobre la variabili-
dad de la remuneracin en cada uno de ellos: sabe que la cuasivarianza del estrato A no pue-
de ser superior a 3000 y la del estrato B a 80.000.
Considera que no tiene sentido asignar tantos casos a un estrato con tan poca variabili-
dad como el primero y que podra aumentar la cantidad de casos en el segundo estrato, que
tiene una dispersin mucho mayor, aumentando la eficiencia estadstica total. Existen 199
combinaciones posibles de asignacin de 200 casos en dos estratos:
Casos por estrato Combi-
nacin A B
1 1 199
2 2 198
3 3 197
... ... ...
197 197 3
198 198 2
199 199 1
Una solucin, un tanto artesanal, es observar cul es el resultado de cada una de las
199 combinaciones y elegir la que arroje menor error estndar, pero por suerte existe un me-
192 - Introduccin al muestreo para estudiantes de ciencias sociales
canismo que nos permite conocer cul es la mejor asignacin (Frmula de Neyman) sin tener
que realizar una gran cantidad de clculos y comparaciones:
Si la seleccin intra-estrato es aleatoria con reposicin, el tamao del estrato se calcula
mediante la frmula...
i
i
i
i
i

W
W
n
n

=
El tamao de la muestra para el estrato A est dada por el peso del estrato multiplicado
por su desvo estndar y por el tamao global de la muestra (W
A
.
A
.n) y dividido por la suma
de los pesos de todos los estratos multiplicados por sus desvos estndar correspondientes
( W
i
.
i
).
...y, si la seleccin es sin reposicin, la frmula es...
i
i
i
i
i
S
W
S W
n
n

=
La frmula de Neyman tambin es aplicable a las proporciones, remplazando

i
por
i i
Q P y S
i
por ( ) 1 - N N Q P
i i i i
, quedando...
Q
P W
Q
P
i
i i
i
i i
i
n W
n

, para la seleccin con reposicin...


...y
) 1 - (N N Q P
) 1 - (N N Q P
n W
n
i i i i
i
i i i i
i
i
W

=

para la seleccin sin reposicin.


Como, para la mayora de las situaciones, el uso de
i
en lugar de S
i
y de
i i
Q P por ) 1 - (N N Q P
i i i i
no implica diferencias significativas en los resultados, usamos
la frmula ms sencilla para calcular el tamao ptimo del estrato, en esta caso la que impli-
ca usar S (el cuasi desvo estndar), ya que contamos con la magnitud de la cuasivarianza.
Entonces, si
2
S S = ...
54,7723 3000 S
A
== =
282,8427 80.000 S
B
= =
...y aplicando la frmula de Neyman...
i
i
i
i
i
S
W
S W
n
n

=
45,02
146,0005
6572,68
282,8427 0,4 54,7723 0,6
54,7723 0,6 200
n
A
= =
+

=
Captulo V Muestreo estratificado (borrador)- 193
...el investigador resuelve extraer una muestra estratificada con asignacin ptima con-
siderando el peso y la variabilidad de cada estrato, donde la cantidad de casos a seleccionar
en el estrato A es 45 y en el estrato B se seleccionaran 155 (n-n
A
).
Los resultados de esta muestra son los del siguiente cuadro:
Muestra de 200 trabajadores. Estratificado con
afijacin ptima
Estrato A (no ca-
lificados)
Estrato B (califi-
cados)
n 45 155
x $ 520 $ 997,6
s
2
365 64.832
Y repitiendo los pasos ya conocidos para la estimacin de la media aritmtica me-
diante intervalo, para una confianza del 95,5%...
Clculo de la media global de la muestra:
711 6 , 97 9 0,4 520 0,6 x W x W x
B B A A AB
. . = + = + =
Estimacin puntual del error estndar de la distribucin de medias muestrales:
( ) ( )
=

=
B B
B B
2
B
2
B
A A
A A
2
A
2
A
AB x
N n
n N s W
N n
n N s W

( ) ( )
=


=
40 2 155
55 1 40 2 64.832 0.16
60 3 45
5 4 60 3 365 0.36
5,1242 26,257 23,702 2,555 = = + =
Estimacin mediante intervalo de confianza de la media aritmtica de la poblacin
( )
( )
25 , 0 1 711 1242 , 5 2 711 z x 0.955 , IC
AB x 2 k AB
= = =
Y esta vez concluye que la remuneracin mensual media, con una confianza del
95,5%, es un valor que est entre $ 700 y $ 722.
Resumiendo, vemos que las estimaciones mediante intervalos de confianza, sin modi-
ficar el riesgo (4,5%) ni la cantidad de casos (n=200), arrojaron los siguientes resultados de-
pendiendo de la tcnica de muestreo empleada y la asignacin de casos por estrato.
MASsr
Estratificado propor-
cional
Estratificado con asig-
nacin ptima
limite
inferior
limite
superior
limite
inferior
limite
superior
limite
inferior
limite
superior
intervalo 679 746 693 732 700 722
error estndar 16,48 9,37 5,13
194 - Introduccin al muestreo para estudiantes de ciencias sociales
V.7 - El tamao de la muestra estratificada.
Nos queda ahora calcular el tamao de la muestra y de sus estratos cuando se utiliza la
estratificacin. Al igual que con el azar simple, queda a criterio del investigador establecer la
confianza y el error de estimacin deseados. Tambin deber realizar una estimacin razona-
ble de la variabilidad de todos y cada uno de los estratos.
Tomamos tres criterios de asignacin de casos: asignacin igual, asignacin propor-
cional y asignacin ptima (con igualdad de costos para todos los estratos).
Obviamente, en el caso de la asignacin igual bastar con un solo clculo, ya que to-
dos los estratos tendrn asignada igual cantidad de casos, y este resultado se multiplicar por
la cantidad de estratos para llegar al tamao total de muestra.
En el caso de la asignacin proporcional se debe calcular la cantidad de casos a selec-
cionar en cada estrato, y la suma de estos resultados arrojar la cantidad de casos totales de
la muestra.
Para la asignacin ptima primero se debe calcular el tamao de muestra, y posterior-
mente aplicar la frmula de Neyman a cada uno de los estratos para realizar la distribucin
de casos por estrato.
Se recomienda especial atencin en la lectura y uso de las frmulas que se exponen a
continuacin. Una mirada apresurada puede llevar a errores, ya que muchas de las medidas y
notaciones son parecidas. Algunas de ellas hacen referencia a informacin de los estratos (las
que tienen el subndice i) y otras al total poblacional. En la misma frmula W puede estar
elevado al cuadrado o no. Hay frmulas en donde se utiliza el desvo estndar (), en otras la
varianza (
2
), la cuasivarianza (S
2
) o el cuasi desvo estndar (S). Y en algunas se combinan
dos o ms de estas medidas.
V.7.A - Tamao de los estratos para estimacin de medias aritmticas.
Seleccin intra-estrato
MAScr MASsr
asignacin
igual
( )
2
2
k
2
i
2
i
i
z

W
n

=


( )
N
S W
z

S W
n
2
i i
2
2
k
2
i
2
i
i

=
Seleccin intra-estrato
MAScr MASsr
asignacin
proporcio-
nal
( )
2
2
k
2
i i i
i
z

W W
n

=


( )
N
S W
z

S W W
n
2
i i
2
2
k
2
i i i
i

=
Captulo V Muestreo estratificado (borrador)- 195
Seleccin intra-estrato
MAScr MASsr
( )
( )
2
2
k
2
i
z

W
n

=
i
( )
( )
N
S W
z

S W
n
2
i i
2
2
k
2
i i

=
asignacin
ptima

=
i
i

i
i
i
W
nW
n

=
i i
i i
i
S W
S nW
n
V.7.B - Tamao de los estratos para estimacin de totales.
El clculo del tamao de los estratos para la estimacin de totales se realiza utilizando
las mismas frmulas del tamao para la estimacin de medias aritmticas, dividiendo el m-
ximo error de estimacin deseado por la cantidad total de casos, transformando la expre-
sin...
( )
2
2
k
z

en
( )
2
2
k
z
N

As, por ejemplo, la frmula para determinar el tamao mnimo de la muestra de un


estrato en particular para realizar una estimacin del total con un error y una confianza de-
terminadas, mediante estratificacin proporcional con MASsr intra-estrato queda...
( )
N
S W
z
/N
S W W
n
2
i i
2
2
k
2
i i i
i

=
V.7.C - Tamao de los estratos para estimacin de proporciones.
Seleccin intra-estrato
MAScr MASsr
asignacin
igual
( )
2
2
k
i i
2
i
i
z

Q P W
n

=

( )
N
1 N
N Q P
W
z

1 N
N Q P W
n
i
i i i
i
2
2
k
i
i i i
2
i
i

=
196 - Introduccin al muestreo para estudiantes de ciencias sociales
Seleccin intra-estrato
MAScr MASsr
asignacin
proporcio-
nal
( )
2
2
k
i i i i
i
z

Q P W W
n

=

( )
N
1 N
N Q P W
z

1 N
N Q P W
W
n
i
i i i i
2
2
k
1
i i i i
i
i

=
Seleccin intra-estrato
MAScr MASsr
( )
( )
2
2
k
2
i i i
z

Q P W
n

=

( )
N
1 - N
N Q P W
z

1 N
N Q P
W
n
i
i i i i
2
2
k
2
i
i i i
i

=
asignacin
ptima

=
i i i
i i i
i
Q P W
Q P nW
n

=
1 - N
N Q P
W
1 - N
N Q P
nW
n
i
i i i
i
i
i i i
i
i
Regla prctica: Teniendo en cuenta que, para fracciones de muestreo pequeas, el
realizar operaciones con N-1 o N es prcticamente indistinto, en la mayora de los casos y
cuando la seleccin intra-estrato es al azar simple sin reposicin se pueden utilizar frmulas
simplificadas. Ellas son:
Frmulas simplificadas para determinar el tamao de los estratos (para estimacin de pro-
porciones) en el muestreo estratificado con seleccin intra-estrato MASsr
asignacin igual
(estrato)
asignacin proporcional
(estrato)
asignacin ptima
(total muestra)
( )
N
Q P W
z

Q P W
n
i i i
2
2
k
i i
2
i
i

=
( )
N
Q P W
z

Q P W W
n
i i i
2
2
k
i i i i
i

=
( )
( )
N
Q P W
z

Q P W
n
i i i
2
2
k
2
i i i

=
Veamos un ejemplo sobre el uso de las formulas exactas y las frmulas simplificadas.
Supongamos la siguiente poblacin, de la que conocemos su tamao y una estimacin razo-
nablemente del porcentaje de aparicin de un determinado atributo (P).
Captulo V Muestreo estratificado (borrador)- 197
Estratos
Total
A B C
W 1 0,32 0,43 0,25
N 2000 640 860 500
P 40% 81% 21% 21%
Si queremos establecer el tamao mnimo de los estratos para poder realizar estima-
ciones mediante intervalos con una confianza del 95% y un error de estimacin no mayor a 4
pp., bajo el supuesto que la seleccin intra-estrato se realizar mediante MASsr, podemos
usar la frmula exacta...
( )
N
1 N
N Q P W
z

1 N
N Q P W
W
n
i
i i i i
2
2
k
1
i i i i
i
i

=
...la que, aplicada al estrato A:
=

+

+

+


+

+

=
2000
499
500 79 21 0,25
859
860 79 21 0,43
639
640 19 81 0,32
1,96
4
499
500 79 21 0,25
859
860 79 21 0,43
639
640 19 81 0,32
32 , 0
n
2
A
( )
4 , 04 1
5 4,97644744
3 519,370346
6 0,81151616 9 4,16493127
3 415,581162 7 714,200465 2 493,250704 32 , 0
= =
+
+ +
=
...lo que nos da 105 casos para el estrato A. Si aplicamos la frmula para los otros dos
estratos, el resultado es 141 casos para el estrato B y 82 casos para el estrato C, siendo el ta-
mao total de la muestra de 328 casos.
Usemos ahora la frmula simplificada:
( )
N
Q P W
z

Q P W W
n
i i
2
2
k
i i i i
i

=
( )
=
+ +
+

+ +
=
2000
79 21 0,25 79 21 0,43 19 81 0,32
1,96
4
79 21 0,25 79 21 0,43 19 81 0,32 32 , 0
n
2
A
104,2
9 4,97523127
518,592
0,8103 9 4,16493127
1620,6 32 , 0
= =
+

=
198 - Introduccin al muestreo para estudiantes de ciencias sociales
...lo que nos da 105 casos para el estrato A. Si aplicamos la frmula para los otros dos
estratos, el resultado es 141 casos para el estrato B y 82 casos para el estrato C. El tamao
total de la muestra es, tambin, de 328 casos.
Solamente podramos observar la diferencia entre uno u otro resultado en las centsi-
mas. Para poblaciones de mayor magnitud la diferencia en el uso de una u otra frmula para
calcular el tamao de los estratos es todava ms irrelevante en lo que hace a la ulterior esti-
macin. Tengamos en cuenta, adems, que hemos usado a modo de ejemplo un tamao, tanto
para la poblacin total como para los estratos, desacostumbradamente pequeo en la investi-
gacin social, mientras que la confianza y el margen de error son de uso habitual.
Tambin, a los efectos prcticos y con N grande, es indistinto el uso de
i

i
S
V.7.C.1 - Asignacin ptima atendiendo al costo
Una variante de la asignacin ptima es la que considera al costo de cada caso dentro
del estrato.
No es un tema menor, ya que en lo cotidiano el tamao de la muestra suele estar con-
dicionado por los recursos disponibles. Pero debe prestarse cuidado al determinar el tamao
de los estratos atendiendo al costo, ya que presupuestos reducidos y diferencias importantes
de costo para cada estrato pueden llevar a tamaos de muestras alejados de los objetivos es-
tadsticos pretendidos.
En parte de la bibliografa se considera al costo total (C)como resultado de las funcio-
nes:

=
i i
c n C

+ =
i i f
c n C C
...donde C
f
, n
i
y c
i
representan, respectivamente, la totalidad de los costos fijos, la can-
tidad de casos por estrato y el costo por caso del estrato sin incluir los costos fijos. La rique-
za de situaciones no puede ser contemplada acabadamente por las frmulas expuestas, sobre
todo cuando los gastos generados por traslados, viajes, alojamiento y viticos son importan-
tes.
Hecha la salvedad, sin considerar a los costos fijos (o asumiento que fueron correcta-
mente imputados a cada estrato) y bajo el supuesto que el costo por caso es razonablemente
homogneo dentro de cada estrato, el tamao ptimo de la muestra global (n) se definir de-
pendiendo de si deseamos maximizar la precisin y la confianza para un costo determinado,
o disminuir el costo para una precisin y confianza determinadas. Despus de definir el ta-
mao ptimo de n, segn el objetivo, se procede al clculo de los n correspondientes a los
estratos.
Las frmulas, para ambos objetivos y dependiendo del tipo de seleccin intra-estrato,
son las siguientes:
Captulo V Muestreo estratificado (borrador)- 199
Seleccin intra-estrato
maximizar precisin a
partir de un costo total
dado
MAScr MASsr
calculo de n

=
i i i
i i i
c W
c W C
n

=
i i i
i i i
c S W
c S W C
n
clculo de n
i
(estrato)

=
i i i
i i i
i
c W
c nW
n

=
i i i
i i i
i
c S W
c S nW
n
Seleccin intra-estrato
Minimizar costos a
partir de error de esti-
macin y nivel de con-
fianza dados.
MAScr MASsr
calculo de n
( )
( )
2
2 k
i i i i i i
z

c W c W
n

=

( )
( )
N
S W
z

c S W c S W
n
2
i i
2
2 k
i i i i i i

=
clculo de n
i
(estrato)

=
i i i
i i i
i
c W
c nW
n

=
i i i
i i i
i
c S W
c S nW
n
Las mismas frmulas son aplicables para variables de nivel de medicin nominal u or-
dinal...
...reemplazando por
i

i i
Q P
i
S
1 N
N Q P
i
i i i

2
i
S
1 N
N Q P
i
i i i

y recordando que, para tamaos de N y N


i
grandes, el uso de
i

i
S es indistinto a los
efectos prcticos, as como tambin el uso de
i i
Q P
1 N
N Q P
i
i i i

V.8 - Algunas precauciones a tener en cuenta con la estratificacin.


Considerando las dificultades tericas y prcticas para su implementacin la estratifi-
cacin no es la panacea universal (mucho menos en la investigacin social). Por un lado,
comparte con el muestreo aleatorio simple la necesidad de contar con un marco muestral ra-
zonablemente completo. A ello hay que agregarle un satisfactorio conocimiento de los prin-
200 - Introduccin al muestreo para estudiantes de ciencias sociales
cipales aspectos de la poblacin y del tipo y caractersticas de la asociacin de las variables
en estudio con otras cuya distribucin nos sea conocida o calculable.
La estratificacin es una herramienta poderosa que permite mejorar sensiblemente la
precisin de las estimaciones. Y, si no pretendemos disminuir la precisin, posibilita bajar los
costos de la investigacin (y aumentar el control del error no muestral) al reducir la cantidad
de casos necesarios. Pero esta ltima ventaja es tambin, en ocasiones, una tentacin peligro-
sa.
Si la decisin de no proporcionar la muestra se basa en la necesidad de contar con es-
timaciones ms precisas para algunos de los estratos, o atiende a consideraciones operativas
o de costos, el resultado final depender de estos requisitos y no hay nada que objetar enton-
ces. Pero si lo hacemos deseando una mayor eficiencia estadstica global hay que tomar
ciertas precauciones, ya que una incorrecta asignacin de casos a cada estrato puede llevar a
resultados contrarios a los buscados.
Una estratificacin puede ser buena o mala, til o intil, y solo lo sabremos con certe-
za cuando tengamos los datos finales tabulados. Si hemos realizado una estratificacin previa
es porque tenemos slidas razones para pensar que las caractersticas de los elementos de un
estrato son relativamente similares entre s y se diferencian sensiblemente de las de los com-
ponentes de los otros estratos. Si ello no es as, la estratificacin habr sido, cuanto menos,
innecesaria.
Respetando la proporcionalidad, una mala estratificacin llevar, en la mayora de los
casos, a que los valores de la estimacin global sean similares a los que se hubieran conse-
guido a travs del azar simple. Si el investigador no se comprometi a brindar estimaciones
con menores errores o riesgos que los obtenibles mediante este ltimo mtodo, o no decidi
restringir la cantidad total de casos basado en la mayor eficiencia estadstica esperada, sim-
plemente habr perdido tiempo, esfuerzo y los costos derivados de obtener y procesar la in-
formacin necesaria para la estratificacin (los que, en su conjunto, suelen no ser desprecia-
bles).
El problema es ms serio con una muestra estratificada no proporcional. Ya sea por de-
fectos de la estratificacin o por una errnea asignacin de casos en los estratos a partir de
una mala informacin sobre la variabilidad, la eficiencia estadstica puede llegar a ser sensi-
blemente menor que la de un muestreo aleatorio simple, con las consecuencias imaginables.
Veamos el siguiente ejemplo, con una seleccin al azar simple con reposicin para ha-
cer los clculos sencillos. Se trata de una muestra de 1.000 casos que se distribuy propor-
cionalmente en dos estratos. La estratificacin es incorrecta (o al menos intil), ya que la
cuasivarianza del estrato A es apenas un poco menor que la del total y la del estrato B es su-
perior a la del total.
Captulo V Muestreo estratificado (borrador)- 201
Estratos
Total
A B A + B
W 1 0.8 0.2
n 1000 800 200
s
2
920,497879 907,152344 935,159722
n
s

2
2
x
= 0,92049788
n
s

2
x
= 0,9594
i
2
i 2
i
n
s
W 0,72572188 0,18703194

=
i
2
i 2
i
2
x
n
s
W
0,91275382

=
i
2
i 2
i x
n
s
W
0,9554
Como resultado de ello, el error estndar calculado a partir de la estratificacin
(0,9554) es similar al de una seleccin al azar simple sobre el total de casos (0,9594).
Supongamos ahora que la distribucin de casos, a partir de supuestos errneos sobre la
variabilidad de los estratos o por razones de costo, no es proporcional. Mantenemos los mis-
mos estadsticos para cada estrato, pero invertimos la asignacin de casos.
Estratos
A B A + B
W 0.8 0.2
n 200 800
s
2
907,152344 935,159722
i
2
i 2
i
n
s
W 2,9028875 0,04675799

=
i
2
i 2
i
2
x
n
s
W
2,94964549

=
i
2
i 2
i x
n
s
W
1,7175
El error estndar calculado a partir de la estratificacin (1,7175) es ahora significati-
vamente mayor al que se habra obtenido con una seleccin al azar simple sobre el total de
casos.
Y todava podemos pensar ejemplos con consecuencias peores: construir un estrato
pequeo de baja variabilidad y uno grande de alta variabilidad, asignando los casos en forma
inversa o, ms grave an, disminuir la cantidad de casos bajo la conviccin de que la estrati-
ficacin es til y la asignacin correcta, y descubrir, luego de recolectar la informacin, que
los dos supuestos eran falsos. En el ltimo cuadro, de haber reducido la muestra a la mitad
(cosa que una buena estratificacin y asignacin puede permitir), el error estndar global as-
cendera a 2,4.
202 - Introduccin al muestreo para estudiantes de ciencias sociales
Debemos tener en cuenta que la mayora de la veces las variables estratificadoras,
aunque vinculadas con el fenmeno investigado, no lo explican en su totalidad ni mucho me-
nos.
Para decirlo de otra forma y aplicando estas ideas a un sondeo pre-electoral, sabemos
que el nivel socioeconmico, la edad, el sexo, la regin de residencia y otros atributos estn
vinculados con la intencin de voto. Podemos decir, por ejemplo, que la probabilidad de ads-
cripcin a un determinado partido poltico de un varn joven, de nivel socioeconmico bajo
y residente en una zona semi-rural del noreste es mayor que la de una mujer adulta, de nivel
socioeconmico medio-alto y que reside en una gran ciudad de la regin central. Pero, co-
nocemos con precisin estas asociaciones? Estamos convencidos que las variables conside-
radas explican, al menos gran parte, lo que queremos averiguar? Sabemos tanto de su mag-
nitud y caractersticas como para arriesgarnos a disminuir significativamente el tamao de la
muestra a partir de una ajustada estratificacin y asignacin?
Si la respuesta es s, para qu hacer entonces el estudio si estamos en condiciones de
predecir los resultados a partir de las variables conocidas? Si la respuesta es no, realicemos
entonces la estratificacin bajo la conviccin de que tenemos una alta probabilidad de mejo-
rar los estimadores, pero no asumamos el riesgo de disminuir la cantidad de casos.
Seguramente, si el MASsr nos exige realizar 1.000 casos para poder realizar estima-
ciones con un intervalo de confianza determinado, no nos equivocaremos si, a ojo de buen
cubero y siguiendo con el ejemplo, decidimos que, con una buena estratificacin que consi-
dere a todas las variables mencionadas, cumpliremos holgadamente los requisitos con solo
900 o menos casos. Pero, cun significativa es esta diferencia? Se justifica la reduccin del
costo, sobre todo teniendo en cuenta que la recoleccin de los datos es solo un aspecto del
costo total y que su disminucin no afecta proporcionalmente al resto de los factores?
(4)
. La
decisin depender de cada investigacin en particular.
Adems, habitualmente hay inters en conocer el comportamiento de ms de una va-
riable y una buena estratificacin para la principal o ms importante de las variables no nece-
sariamente sirve para otras. Cuando se decide estratificar con el objetivo de mejorar la esti-
macin de ms de una variable se debe llegar a una situacin de compromiso o equilibrio pa-
ra las variables ms relevantes.
Todo ello nos lleva a la conclusin que, en lneas generales, no es conveniente utilizar
la estratificacin para disminuir la cantidad de casos de una muestra con la pretensin de no
Notas:
4 Los recursos disponibles no son un aspecto menor de la investigacin y la mayora de las veces apare-
cen como el factor no estadstico ms limitante del diseo muestral. Sin embargo, una reduccin de la cantidad de
casos no afecta sensiblemente a los otros factores. El diseo general de la investigacin, del instrumento de reco-
leccin (por ejemplo, un cuestionario), las pruebas piloto, el diseo muestral, el anlisis de los datos, la elabora-
cin de conclusiones y la confeccin del informe y su presentacin son algunos de los aspectos muchas veces no
afectados, en trminos de costo, por el tamao de la muestra. En el procesamiento estadstico suele no haber dife-
rencias sensibles a partir de cierta cantidad de casos (salvo en lo que hace al ingreso de datos). Incluso costos
ms directamente vinculados con la recoleccin, como la coordinacin y supervisin del trabajo de campo, no ne-
cesariamente guardan una relacin directa con la cantidad de casos a relevar, sin considerar la infinidad de costos
fijos e indirectos que pueden existir y que tampoco se modifican.
Captulo V Muestreo estratificado (borrador)- 203
modificar la confianza o precisin de los estimadores, salvo que estemos absolutamente con-
vencidos que la asociacin entre las variables estratificadoras y las variables a investigar es
suficientemente fuerte y teniendo un buen conocimiento terico de la caractersticas de la
relacin como para calcular y justificar la reduccin de casos.
204 - Introduccin al muestreo para estudiantes de ciencias sociales
Ejercitacin
Ejercicio 1
El siguiente cuadro contiene la distribucin de hogares de la localidad F, por nivel so-
cioeconmico, incluyendo una estimacin razonable del mximo desvo estndar posible de
ingresos mensuales por hogar para cada nivel.
Nivel socioeconmico N W mximo estimado
Bajo 5200 0,52 $ 400
Medio 3200 0,32 $ 700
Alto 1600 0,16 $ 900
Se desea realizar una investigacin mediante muestreo estratificado por nivel socioe-
conmico para determinar el promedio de ingresos por hogar de la localidad F, con un error
de estimacin que no supere los $ 65 y un riesgo mximo del 5%. Con el mismo riesgo se de-
sea, adicionalmente, conocer el grado de aceptacin de los jefes de hogar del plan de obras
pblicas propuesto por el municipio para el ao venidero, con un error de estimacin global
no superior a 5 puntos porcentuales y sabiendo que en los niveles socioeconmicos bajo y
medio la aceptacin de los jefes de hogar no es inferior al 70 %.
Bajo el supuesto de una seleccin intra-estrato aleatoria con reposicin, se debe de-
terminar el tamao del total de la muestra (y de cada estrato), para una afijacin...
(1.1.1) igual, para estimar la media de ingresos mensuales de los hogares.
(1.1.2) igual, para estimar el grado de aceptacin del plan de obras pblicas
(1.2.1) proporcional, para estimar la media de ingresos mensuales de los hogares.
(1.2.2) proporcional, para estimar el grado de aceptacin del plan de obras pblicas
(1.3.1) ptima sin considerar el costo, para estimar la media de ingresos mensuales de
los hogares.
(1.3.2) ptima sin considerar el costo, para estimar el grado de aceptacin del plan de
obras pblicas.
Captulo V Muestreo estratificado (borrador)- 205
Resolucin del ejercicio 1
(1.1.1) Clculo del tamao de los estratos con afijacin igual (seleccin intra-estrato
MAScr) para la media de ingresos...
( )
2
2
k
2
i
2
i
i
z

W
n

=


Desarrollo del dividendo
NSE W
i

i
2
W
i
2

i
2
Bajo 0,52 160000 43264
Medio 0,32 490000 50176
Alto 0,16 810000 20736
114176
103,815035
1099,80217
114176
1,96
65
114176
n
2
i
= =

=
En cada estrato se debern seleccionar (MAScr) 104 hogares, por lo que el total de la
muestra para estimar el promedio de ingresos en las condiciones solicitadas ser de 312 ho-
gares.
(1.1.2) Clculo del tamao de los estratos con afijacin igual (seleccin intra-estrato
MAScr) para el grado de aceptacin...
( )
2
2
k
i i
2
i
i
z

W
n

=

Q P
Como no tenemos datos sobre la heterogeneidad del grado de aceptacin en el nivel
socioeconmico alto, optamos por asignar la mxima heterogeneidad (P=50) a este nivel.
Desarrollo del dividendo
NSE W
i
2
P
i
Q
i
W
i
2
P
i
Q
i
Bajo 0,2704 2100 567,84
Medio 0,1024 2100 215,04
Alto 0,0256 2500 64
846,88
206 - Introduccin al muestreo para estudiantes de ciencias sociales
1 , 30 1
6,5077
88 , 846
1,96
5
88 , 846
n
2
i
= =

=
En cada estrato se debern seleccionar (MAScr) 131 hogares, por lo que el total de la
muestra para estimar el grado de aceptacin en las condiciones solicitadas ser de 393 hoga-
res.
(1.2.1)Clculo del tamao de los estratos con afijacin proporcional (seleccin intra-
estrato MAScr) para la media de ingresos...
( )
2
2
k
2
i i i
i
z

W W
n

=


Desarrollo
NSE W
i

i
2
W
i

i
2
W
i
W
i

i
2 2
) z ( (k/2)
2
2
i i i
) z (
W W
(k/2)


Bajo 0,52 160000 83200 192192 1099,80217 174,8
Medio 0,32 490000 156800 118272 1099,80217 107,5
Alto 0,16 810000 129600 59136 1099,80217 53,8
369600
En el nivel socioeconmico bajo se debern seleccionar (MAScr) 175 hogares, en el
nivel medio 108 hogares y en el nivel alto 54 hogares. Por lo tanto, el total de la muestra para
estimar el promedio de ingresos en las condiciones solicitadas ser de 337 hogares.
(1.2.2) Clculo del tamao de los estratos con afijacin proporcional (seleccin intra-
estrato MAScr) para el grado de aceptacin...
( )
2
2
k
i i i i
i
z

Q P W W
n

=

Como no tenemos datos sobre la heterogeneidad del grado de aceptacin en el nivel
socioeconmico alto, optamos por asignar la mxima heterogeneidad (P=50) a este nivel.
Captulo V Muestreo estratificado (borrador)- 207
Desarrollo
NSE W
i
P
i
Q
i
W
i
P
i
Q
i
W
i
W
i
P
i
Q
i
2
) z ( (k/2)
2
i i i i
) z (
Q P W W
(k/2)

Bajo 0,52 2100 1092 1125,28 6,5077051 172,9


Medio 0,32 2100 672 692,48 6,5077051 106,4
Alto 0,16 2500 400 346,24 6,5077051 53,2
2164
En el nivel socioeconmico bajo se debern seleccionar (MAScr) 173 hogares, en el
nivel medio 107 hogares y en el nivel alto 54 hogares. Por lo tanto, el total de la muestra para
estimar el promedio de ingresos en las condiciones solicitadas ser de 334 hogares.
(1.3.1) Clculo del tamao de los estratos con afijacin ptima (seleccin intra-
estrato MAScr) para la media de ingresos...
A diferencia de los puntos anteriores, primero se debe calcular el tamao total de la
muestra...
( )
( )
2
2
k
2
i
z

W
n

=
i

Desarrollo del dividendo


NSE W
i

i
W
i

i
Bajo 0,52 400 208
Medio 0,32 700 224
Alto 0,16 900 144
W
i

i
576
( W
i

i
)
2
331776
301,67
1099,8022
331776
1,96
65
331776
n
2
= =

=
Una vez calculado el tamao total de la muestra se realiza la distribucin por estratos
segn la frmula de Neyman.

=
i
i

i
i
i
W
nW
n
208 - Introduccin al muestreo para estudiantes de ciencias sociales
Desarrollo
NSE W
i

i
W
i

i
nW
i

i
nW
i

i
/W
i

i
Bajo 0,52 400 208 62747,1105 108,9
Medio 0,32 700 224 67573,8113 117,3
Alto 0,16 900 144 43440,3073 75,4
576
Los 303 hogares a seleccionar para estimar el promedio de ingresos en las condiciones
solicitadas se distribuyen de la siguiente forma: en el nivel socioeconmico bajo 109 hoga-
res, en el nivel medio 118 hogares y en el nivel alto 76 hogares.
(1.3.2) Clculo del tamao de los estratos con afijacin ptima (seleccin intra-
estrato MAScr) para el grado de aceptacin...
Clculo del tamao total de la muestra...
( )
( )
2
2
k
2
i i i
z

Q P W
n

=

Como no tenemos datos sobre la heterogeneidad del grado de aceptacin en el nivel
socioeconmico alto, optamos por asignar la mxima heterogeneidad (P=50) a este nivel.
Desarrollo del dividendo
NSE W
i
i i
Q P
i i i
Q P W
Bajo 0,52 45,8257569 23,8293936
Medio 0,32 45,8257569 14,6642422
Alto 0,16 50 8
i i i
Q P W 46,4936358
( )
2
i i i
Q P W

2161,65817
332,169042
6,5077
65817 , 2161
1,96
5
65817 , 2161
n
2
= =

=
Una vez calculado el tamao total de la muestra se realiza la distribucin por estratos
segn la frmula de Neyman.

=
i i i
i i i
i
Q P W
Q P nW
n
Captulo V Muestreo estratificado (borrador)- 209
Desarrollo
NSE W
i
i i
Q P
i i i
Q P W
i i i
Q P nW
i i i
i i i
Q P W
Q P nW
Bajo 0,52 45,8257569 23,8293936 7915,386838 170,2
Medio 0,32 45,8257569 14,6642422 4871,007285 104,8
Alto 0,16 50 8 2657,352332 57,2
46,4936358
Los 334 hogares a seleccionar para estimar el promedio de ingresos en las condiciones
solicitadas se distribuyen de la siguiente forma: en el nivel socioeconmico bajo 171 hoga-
res, en el Nivel medio 105 hogares y en el nivel alto 58 hogares.
Ejercicio 2
Debiendo efectuarse una sola muestra para estudiar simultneamente las dos variables
contempladas en el ejercicio 1, se debe...
(2.1) ...compatibilizar los resultados de los ejercicios (1.1.1) y (1.1.2)
(2.2) ...compatibilizar los resultados de los ejercicios (1.2.1) y (1.2.2)
(2.3) ...compatibilizar los resultados de los ejercicios (1.3.1) y (1.3.2)
...es decir, se debe obtener una sola muestra para cada tipo de asignacin (igual, pro-
porcional y ptima) que cumpla con los objetivos planteados para ambas variables.
Una vez respondido el ejercicio y cotejados los resultados, se recomienda no pasar por
alto los comentarios adicionales al final de la resolucin del ejercicio 2.
Resolucin del ejercicio 2
(2.1) Asignacin igual
Teniendo en cuenta que ambas muestras no difieren significativamente en su volumen
total y por estrato, se adopta para cada estrato el mayor tamao exigido.
Los resultados de los ejercicios (1.1.1) y (1.1.2) son:
NSE n para muestra estratificada con asignacin igual
(1.1.1) ingresos... (1.1.2) aceptacin... ambas
Bajo 104 131 131
Medio 104 131 131
Alto 104 131 131
Total 312 393 393
210 - Introduccin al muestreo para estudiantes de ciencias sociales
(2.2) Proporcional
Teniendo en cuenta que ambas muestras no difieren significativamente en su volumen
total y por estrato, se adopta para cada estrato el mayor tamao exigido.
NSE n para muestra estratificada con asignacin proporcional
(1.2.1) ingresos... (1.2.2) aceptacin... ambas
Bajo 175 173 175
Medio 108 107 108
Alto 54 54 54
Total 337 334 337
(2.3) Optima
Teniendo en cuenta que ambas muestras no difieren significativamente en su volumen
total y por estrato, se adopta para cada estrato el mayor tamao exigido.
NSE n para muestra estratificada con asignacin ptima
(1.3.1) ingresos... (1.3.2) aceptacin... ambas
Bajo 109 171 171
Medio 118 105 118
Alto 76 58 76
Total 303 334 365
Comentarios sobre el ejercicio 2
Obsrvese, a partir de los resultados del ejercicio, que una buena asignacin para una
variable no necesariamente es adecuada para otra.
Obsrvese tambien que...
...para los ingresos del hogar...
n asignacin
proporcional
>
n asignacin
igual
>
n asignacin p-
tima
...mientras que para la aceptacin del plan de obras pblicas...
n asignacin
igual
>
n asignacin
proporcional
=
n asignacin p-
tima
Habitualmente la asignacin igual es menos eficiente que la asignacin proporcional.
El que la asignacin proporcional arroje un tamao de muestra mayor que el de la asignacin
igual para los ingresos del hogar se debe a que la variabilidad estimada es menor en el estrato
de mayor peso y, a la inversa, mayor en el de menor peso, compensndose mutuamente y ha-
ciendo que la asignacin igual sea ms eficiente que la proporcional.
Con el grado de aceptacin del plan de obras pblicas sucede algo similar
(V+W/+VW) pero la diferencia de variabilidad no es tan relevante como para compensar
las diferencias de peso, y por lo tanto la asignacin igual no es ms eficiente que la propor-
cional. Por lo general, cuando de variables nominales u ordinales se trata, las diferencias de
variabilidad en los estratos deben ser grandes para tener infuencia en las asignaciones, no
Captulo V Muestreo estratificado (borrador)- 211
siendo demasiado notables los cambios entre la asignacin proporcional y la ptima en lo
que hace al total de casos.
Que un estrato tenga, en una variable intervalar, una variabilidad 10 veces mayor que
la de otro no es una situacin demasiado atpica. Pero, para una variable nominal, es extrao
que la variabilidad de un estrato sea 1,5 veces mayor que la de otro. Para los datos que usa-
mos en el ejercicio, la varianza de los ingresos de los hogares del nivel socioeconmico alto
es 810.000, cinco veces mayor que la varianza de los ingresos de los hogares de nivel socioe-
conmico bajo (160.000), mientras que la varianza del grado de aceptacin del plan de obras
pblicas (P Q) en el nivel socioeconmico alto es 2.500, solo 1,2 veces mayor que la va-
rianza en los niveles medio y bajo (2.100).
Para dar una respuesta al tamao de la muestra y sus estratos cumpliendo con los ob-
jetivos planteados para dos variables distintas, se parte del supuesto que las muestras necesa-
rias para cada variable no difieren significativamente en su volumen y distribucin interes-
trato, adoptndose una salida un tanto simple y lineal que consiste en la asignar a cada es-
trato la mayor cantidad de casos exigida en una u otra variable. Sin embargo, la afirmacin
de estar trabajando con magnitudes similares es bastante discutible y relativa, ya que depen-
de del costo de cada caso. Una diferencia pequea puede ser importante si el costo de reco-
leccin de los datos es considerable. Cuando las diferencias para distintas variables son rele-
vantes se trata de llegar a alguna solucin de compromiso que, inevitablemene, afectar en
mayor o menor medida a la precisin de la estimacin de la mayora de las variables (cuando
no a todas). De cualquier forma, cambios pequeos en la afijacin ptima no modifican se-
riamente la estimacin final.
Para una apreciacin formal sobre este problema, se puede consultar, entre otros, a
Cochran, William (Tcnicas de Muestreo, Cecsa, Mxico, 2000, Captulo 5A, puntos 5A.3 y
5A.4).
Ejercicio 3
Sabiendo que el costo de cada caso para el nivel socioeconmico bajo es $ 20, para el
nivel socioeconmico medio $ 40 y para el alto $ 80, considerando la informacin y objeti-
vos de estimacin utilizados en el ejercicio 1 y bajo el el supuesto de una seleccin intra-
estrato aleatoria con reposicin, se debe determinar el tamao del total de la muestra (y de
cada estrato), para una afijacin...
(3.1) ptima,minimizando el costo total, para estimar la media de ingresos mensuales
de los hogares.
(3.2) ptima, maximizando la precisin a partir de un costo total de $9.000, para esti-
mar para estimar la media de ingresos mensuales de los hogares.
212 - Introduccin al muestreo para estudiantes de ciencias sociales
Resolucin del ejercicio 3
(3.1) Clculo del tamao de la muestra total (y de cada estrato) con afijacin ptima
(seleccin intra-estrato MAScr), minimizando el costo total, para la media de ingresos...
Clculo del tamao total de la muestra minimizando costos a partir de error de esti-
macin y nivel de confianza dados....
( )
( )
2
2 k
i i i i i i
z

c W c W
n

=

Desarrollo
NSE W
i

i
c
i
($) W
i

i i
c
i i i
c W
i i i
c W
Bajo 0,52 400 20 208 4,47213595 930,204279 46,5102139
Medio 0,32 700 40 224 6,32455532 1416,70039 35,4175098
Alto 0,16 900 80 144 8,94427191 1287,97516 16,0996894
3634,87983 98,0274132
( )
i i i i i i
c W c W 356317,8664
( )
2
2 k
z

1099,802166
( )
( )
( )
2
2 k i i i i i i
z c W c W
323,9836014
Una vez calculado el tamao total de la muestra se realiza la distribucin por estratos.

=
i i i
i i i
i
c W
c nW
n
Desarrollo
NSE W
i

i
c
i
($)
i i i
c W
i i i
c W n

i
i i
i i i
c W
c nW
Bajo 0,52 400 20 46,5102139 15068,54661 154
Medio 0,32 700 40 35,4175098 11474,69237 117
Alto 0,16 900 80 16,0996894 5216,035365 53
98,0274132 324
Captulo V Muestreo estratificado (borrador)- 213
(3.2) Clculo del tamao de la muestra total (y de cada estrato) con afijacin ptima
(seleccin intra-estrato MAScr), maximizando la precisin a partir de un costo total dado,
para la media de ingresos...
Clculo del tamao total de la muestra maximizando la precisin a partir de un costo
total determinado....

=
i i i
i i i
c W
c W C
n
Desarrollo
NSE W
i

i
c
i
($)
i i i
c W
i i i
c W
Bajo 0,52 400 20 46,5102139 930,204279
Medio 0,32 700 40 35,4175098 1416,70039
Alto 0,16 900 80 16,0996894 1287,97516
98,0274132 3634,87983

i i i
i i i
c W
c W C
242,7168877
Una vez calculado el tamao total de la muestra se realiza la distribucin por estratos.

=
i i i
i i i
i
c W
c nW
n
Desarrollo
NSE W
i

i
c
i
($)
i i i
c W
i i i
c W n

i i i
i i i
c W
c nW
Bajo 0,52 400 20 46,5102139 11288,81437 114
Medio 0,32 700 40 35,4175098 8596,427748 88
Alto 0,16 900 80 16,0996894 3907,666514 40
98,0274132 242
214 - Introduccin al muestreo para estudiantes de ciencias sociales
Ejercicio 4
A partir de los datos dados en la formulacin y los obtenidos en el desarrollo de los
ejercicios, estimar mediante intervalos y para una confianza del 95%, la media mensual de
ingresos de los hogares (bajo el supuesto de MAScr intra-estrato) de la poblacin en estu-
dio...
(4.1) Con la muestra obtenida en el ejercicio (1.1.1).
(4.2) Con la muestra obtenida en el ejercicio (1.2.1).
(4.2) Con la muestra obtenida en el ejercicio (1.3.1).
(4.3) Con la muestra obtenida en el ejercicio (3.1).
(4.4) Con la muestra obtenida en el ejercicio (3.2).
...si los datos obtenidos fueran...
Nivel socioeconmico
i
x s
i
2
Bajo $ 625 160.000
Medio $ 1450 490.000
Alto $ 3175 810.000
Resolucin del ejercicio 4
El primer paso consiste en estimar puntualmente la media de ingresos de los hogares,
lo que haremos una sola vez para todas las muestras, ya que lo nico necesario es contar con
las medias observadas en cada estrato y su respectivo peso, los que no varan de muestra a
muestra.
A A M M B B BMA
x W x W x W x + + =
Desarrollo
Nivel socioeconmico W
i i
x
i i
x W
Bajo 0,52 $ 625 $ 325
Medio 0,32 $ 1450 $ 464
Alto 0,16 $ 3175 $ 508
= =
i i
x W
$ 1297
A continuacin debemos estimar el error estndar global de cada muestra. Como en su
frmula intervienen la cantidad de casos seleccionados en los estratos, su clculo debe reali-
zarse por separado para cada una de ellas.

=
i
2
i 2
i x
n
s
W
Captulo V Muestreo estratificado (borrador)- 215
(4.1) Para afijacin igual, n obtenido en el ejercicio (1.1.1).
Nivel socioe-
conmico
n
i
W
i
W
i
2
s
i
2
s
i
2
/n
i
W
i
2
s
i
2
/n
i
Bajo 104 0,52 0,2704 160.000 1538,46154 416
Medio 104 0,32 0,1024 490.000 4711,53846 482,461538
Alto 104 0,16 0,0256 810.000 7788,46154 199,384615
=
i
2
i
2
i
n
s W
1097,84615
=

i
2
i
2
i
n
s W
33,1337615
Una vez calculada la estimacin puntual del error estndar, se establecen los lmites
del intervalo de confianza.
( )
( )
X 2 k
BMA BMA
z x IC /k =
( ) 64,9 95,5% / 1297 $ 13 , 33 $ 96 , 1 1297 $ IC
BMA
= =
lmite inferior lmite superior
1232,1 1361,9
(4.2) Para afijacin proporcional, n obtenido en el ejercicio (1.2.1).
Nivel socioe-
conmico
n
i
W
i
W
i
2
s
i
2
s
i
2
/n
i
W
i
2
s
i
2
/n
i
Bajo 175 0,52 0,2704 160.000 914,285714 247,222857
Medio 108 0,32 0,1024 490.000 4537,03704 464,592593
Alto 54 0,16 0,0256 810.000 15000 384
=
i
2
i
2
i
n
s W
1095,81545
=

i
2
i
2
i
n
s W
33,1031033
Una vez calculada la estimacin puntual del error estndar, se establecen los lmites
del intervalo de confianza.
( )
( )
X 2 k
BMA BMA
z x IC /k =
( ) 64,9 95,5% / 1297 $ 10 , 33 $ 96 , 1 1297 $ IC
BMA
= =
lmite inferior lmite superior
1232,1 1361,9
216 - Introduccin al muestreo para estudiantes de ciencias sociales
(4.3) Para afijacin ptima sin considerar el costo, n obtenido en el ejercicio (1.3.1).
Nivel socioe-
conmico
n
i
W
i
W
i
2
s
i
2
s
i
2
/n
i
W
i
2
s
i
2
/n
i
Bajo 109 0,52 0,2704 160.000 1467,88991 396,917431
Medio 118 0,32 0,1024 490.000 4152,54237 425,220339
Alto 76 0,16 0,0256 810.000 10657,8947 272,842105
=
i
2
i
2
i
n
s W
1094,97988
=

i
2
i
2
i
n
s W
33,0904801
Una vez calculada la estimacin puntual del error estndar, se establecen los lmites
del intervalo de confianza.
( )
( )
X 2 k
BMA BMA
z x IC /k =
( ) 64,9 95,5% / 1297 $ 09 , 33 $ 96 , 1 1297 $ IC
BMA
= =
lmite inferior lmite superior
1232,1 1361,9
(4.4) Para afijacin ptima minimizando el costo, n obtenido en el ejercicio (3.1).
Nivel socioe-
conmico
n
i
W
i
W
i
2
s
i
2
s
i
2
/n
i
W
i
2
s
i
2
/n
i
Bajo 154 0,52 0,2704 160.000 1038,96104 280,935065
Medio 118 0,32 0,1024 490.000 4152,54237 425,220339
Alto 53 0,16 0,0256 810.000 15283,0189 391,245283
=
i
2
i
2
i
n
s W
1097,40069
=

i
2
i
2
i
n
s W
33,1270386
Una vez calculada la estimacin puntual del error estndar, se establecen los lmites
del intervalo de confianza.
( )
( )
X 2 k
BMA BMA
z x IC /k =
( ) 64,9 95,5% / 1297 $ 13 , 33 $ 96 , 1 1297 $ IC
BMA
= =
lmite inferior lmite superior
1232,1 1361,9
Captulo V Muestreo estratificado (borrador)- 217
(4.5) Para afijacin ptima minimizando la variabilidad con un costo total fijo, n ob-
tenido en el ejercicio (3.2).
Nivel socioe-
conmico
n
i
W
i
W
i
2
s
i
2
s
i
2
/n
i
W
i
2
s
i
2
/n
i
Bajo 114 0,52 0,2704 160.000 1403,50877 379,508772
Medio 88 0,32 0,1024 490.000 5568,18182 570,181818
Alto 40 0,16 0,0256 810.000 20250 518,4
=
i
2
i
2
i
n
s W
1468,09059
=

i
2
i
2
i
n
s W
38,3156703
Una vez calculada la estimacin puntual del error estndar, se establecen los lmites
del intervalo de confianza.
( )
( )
X 2 k
BMA BMA
z x IC /k =
( ) 1 , 5 7 1297 $ 32 , 38 $ 96 , 1 1297 $ IC 95,5% /
BMA
= =
lmite inferior lmite superior
1221,9 1372,1
218 - Introduccin al muestreo para estudiantes de ciencias sociales
Ejercicio 5
Resumir, en un cuadro, los tamaos de muestra y estratos obtenidos en los ejercicios
(1.1.1), (1.2.1), (1.3.1), (3.1) y (3.2), los errores de estimacin calculados para cada uno de
ellos en el ejercicio 4 y el costo total de cada muestra.
Resolucin del ejercicio 5.
Costo total:
i i
c n
n
afijacin
Bajo Medio Alto Total
X
z
Costo
Total
igual 104 104 104 312 64.9 14560
proporcional 175 108 54 337 64.9 12140
ptima 109 118 76 303 64.9 12980
ptima minimizando costo 154 118 53 325 64.9 12040
ptima con costo fijo total 114 88 40 242 75,1 9000
Comentarios sobre el ejercicio 5
Las s
2
del ejercicio 4 son iguales a la esperanza matemtica correspondiente si los m-
ximos desvos estndar estimados para el ejercicio 1 coinciden con los desvos estndar
reales de los estratos. Ello lleva a que los errores de estimacin sean iguales al mximo
pretendido (al margen de algn decimal fruto del redondeo hacia arriba de los diversos n).
En los comentarios sobre el ejercicio 2 habamos observado que, para la variable in-
gresos mensuales, la estratificacin igual resultaba ms eficiente que la proporcional. Sin
embargo, al ser sensiblemente ms barata la recoleccin del dato en los estratos ms bajos, la
distribucin porporcional es la recomendable en funcin de los costos globales, aun cuando
implique una mayor cantidad de casos. Para los c
i
dados, es recomendable incluso sobre la
asignacin ptima que no considera el costo.
En cuanto a las afijaciones que atienden al costo la que mantiene la precisin y la con-
fianza es la que implica un desembolso total ms bajo sin modificar los valores deseados pa-
ra la estimacin, como era de esperarse. La ltima, la que fija y distribuye la muestra limita-
da por un costo total predefinido, lo hace en perjuicio de la precisin.
Una posibilidad interesante es calcular esta afijacin (la que minimiza la varianza a
partir de un costo dado) a partir del importe final de la afijacin ptima sin atender al coste.
n
afijacin
Bajo Medio Alto Total
X
z
Costo
Total
ptima 109 118 76 303 64.9 12980
ptima con costo fijo total = proporcional 165 126 58 349 62,5 12980
Con las medidas que estamos tomando de ejemplo, para el mismo gasto obtendramos
una precisin mayor. Si bien la afijacin ptima sin atender a los gastos siempre ser la de
mayor eficiencia estadstica, desde una mirada que pondere la relacin costo/beneficio la
muestra a elegir es, sin lugar a dudas, la otra.
Captulo V Muestreo estratificado (borrador)- 219
Ejercicio 6
Se realizar una investigacin cuyo objetivo principal es conocer el porcentaje de
alumnos de una determinada facultad que desarrollan alguna actividad laboral que implique
una dedicacin superior a las 20 horas semanales y por la que reciben remuneracin.
Para ello se decide seleccionar una muestra de 500 casos, estratificada atendiendo al
turno durante el que asisten habitualmente a clases los alumnos. Se conoce que...
...el 45 % asiste a clases durante el turno maana
...el 40 % asiste a clases durante el turno tarde
...el 15 % asiste a clases durante el turno noche
La direccin de la investigacin resuelve realizar una asignacin ptima de casos bajo
el supuesto que el porcentaje de alumnos que trabajan durante ms de 20 horas semanales y
reciben remuneracin no supera...
...el 5 % entre los que asisten al turno maana
...el 15 % entre los que asisten al turno tarde
...el 50 % entre los que asisten al turno noche.
Se debe...
(6.1) Calcular el tamao de muestra para cada estrato si la distribucin se realiza pro-
porcionalmente a su tamao.
(6.2) Calcular el tamao ptimo de muestra para cada estrato considerando el tamao
del estrato y los supuestos de heterogeneidad expuestos.
(6.3) Suponiendo los datos de la muestra evidencian que el porcentaje de alumnos que
trabaja durante ms de 20 horas semanales y recibe remuneracin representa...
...el 50% de los alumnos del turno maana
...el 50% de los alumnos del turno tarde
...el 90% de los alumnos del turno noche
calcular el error de estimacin global, para una confianza del 95,5% considerando...
(6.3.1) una seleccin de casos al azar simple
(6.3.2) una seleccin de casos estratificada proporcional (punto 6.1)
(6.3.3) una seleccin de casos estratificada con asignacin ptima (punto 6.2)
(6.4) extraer conclusiones sobre la diferencia de los tres errores estndar calculados en
el punto (6.3).
(6.5) Considerando los resultados arrojados por la investigacin, cul debera haber
sido la correcta asignacin ptima?
Para simplificar los clculos se trabajar bajo el supuesto de seleccin con reposi-
cin.
220 - Introduccin al muestreo para estudiantes de ciencias sociales
Resolucin Ejercicio 6
(6.1) a (6.3.3.)
Maana Tarde Noche
W
i
(peso estrato) 0.45 0.4 0.15
(6.1) n
i
W
i
(casos por estrato) 225 200 75
P
i
(supuesto) 5 15 50
i
i
Q P
(supuesto)
21,79449472 35,70714214 50
i i i
Q P W (supuesto)
9,807522623 14,28285686 7,5

i
i i
Q P W
(supuesto)
31,59037948
(6.2)
Q
P W
n Q
P
i
i i
i i
i
i
W
n


155 226 119
p estrato 50 50 90
i
i
p W

(p total)
56
1 - n
p.q

p
= 2,222133153
(
6
.
3
.
1
)
p
2 4,444266307
W
2
0,2025 0,16 0,0225
1 - n
.q p

i
i i 2
p
i
=
11,16071429 12,56281407 12,16216216
2
p
2
i
i
W 2,260044643 2,010050251 0,273648649

2
p
2
i
i
W 4,543743543

=
2
p
2
i p
i
W 2,13160586
(
6
.
3
.
2
)
p
2 4,26321172
1 - n
.q p

i
i i 2
p
i
=
16,23376623 11,11111111 7,627118644
2
p
2
i
i
W 3,287337662 1,777777778 0,171610169

2
p
2
i
i
W 5,23672561

=
2
p
2
i p
i
W 2,288389305
(
6
.
3
.
3
)
p
2 4,576778609
Captulo V Muestreo estratificado (borrador)- 221
(6.4)
error est. proporcional < error est. azar simple < error est. asignacin ptima.
La mayor magnitud del error de estimacin generado por la asignacin ptima se debe
a la incorrecta estimacin de P utilizada en el clculo del tamao de la muestra para cada es-
trato, afectando negativamente la eficiencia de la estimacin (en especial en el estrato turno
maana).
Si bien la precisin del muestreo estratificado proporcional es mayor que la del azar
simple, la diferencia no adquiere relevancia ya que la variabilidad de los principales estratos
(que incluyen al 85% de la poblacin en estudio) es similar, lo que minimiza la potencial ga-
nancia de la estratificacin proporcional.
(6.5)
Maana Tarde Noche
W
i
0.45 0.4 0.15
P
i
50 50 90
i
i
Q P 50 50 30
i
i i
Q P W 22,5 20 4,5

i
i i
Q P W 47
Q
P W
n Q
P
i
i i
i i
i
i
W
n


239 213 48
222 - Introduccin al muestreo para estudiantes de ciencias sociales
Apndice (reduccin de la varianza)
Si dividimos a una poblacin en grupos, la varianza total puede expresarse como la suma de las
variabilidades intragrupos e intergrupos, es decir
2 2 2
e d
+ =
donde
2
d

es la variabilidad intragrupos y
2
e

es la variabilidad intergrupos.
( )
N
x

h
1 i
N
1 j
2
i ij
2
d
i

= =

=

( )
N
x N

h
1 i
2
i i
2
e

=
Estas expresiones nos indican que para obtener
2
d

debemos sumar los desvos cuadrados de cada


estrato (calculados sobre la media aritmtica del estrato y no sobre la media total), luego sumar
estas sumas de desvos cuadrados y divir la doble sumatoria por la cantidad total de casos.
Y que para obtener
2
e

debemos calcular el desvo cuadrado del promedio de cada estrato (sobre la


media total), multiplicarlo por la cantidad de casos del estrato, sumar estos productos y dividirlos
por la cantidad total de casos de la poblacin.
Desarrollemos estos clculos con un ejemplo sencillo. El cuadro siguiente expresa una poblacin
de 15 elementos, dividida en tres grupos.
a b c d e
1 Total Grupo 1 Grupo 2 Grupo 3
2 2 2 2
3 2 3 3
4 3 4 5
5 6 5 6
6 6 5
7 6
8 N 15 6 5 4
9 4 4,16666667 3,8 4
10
2
2,53333333
11
( )

i
N
1 j
2
i ij
x
20,8333333 6,8 10
12
( )

= =

h
1 i
N
1 j
2
i ij
i
x
37,6333333
13
( )
N
x

h
1 i
N
1 j
2
i ij
2
d
i

= =

=
2,50888889
14 ( )
2
i
x 0,02777778 0,04 0
15 ( )
2
i i
x N 0,16666667 0,2 0
16
( )

h
1 i
2
i i
x N 0,36666667
17
( )
N
x N

h
1 i
2
i i
2
e

=
0,02444444
18
2 2 2
e d
+ = 2,53333333
Vemos en la celda B18 que la suma de las varianzas intra (B13) e inter grupos (B17) es igual a la
varianza total (B10), pero que el peso recae en la varianza intra grupos.
Captulo V Muestreo estratificado (borrador)- 223
Si agrupamos a los elementos de la poblacin en grupos homogeneos internamente y heterogneos
entre s...
a b c d e
1 Total Grupo 1 Grupo 2 Grupo 3
2 2 4 6
3 2 5 6
4 2 5 6
5 2 5 6
6 3
7 3
8 3
9 N 15 7 4 4
10 4 2,42857143 4,75 6
11
2
2,53333333
12
( )

i
N
1 j
2
i ij
x
1,71428571 0,75 0
13
( )

= =

h
1 i
N
1 j
2
i ij
i
x
2,46428571
14
( )
N
x

h
1 i
N
1 j
2
i ij
2
d
i

= =

=
0,16428571
15 ( )
2
i
x 2,46938776 0,5625 4
16 ( )
2
i i
x N 17,2857143 2,25 16
17
( )

h
1 i
2
i i
x N 35,5357143
18
( )
N
x N

h
1 i
2
i i
2
e

=
2,36904762
19
2 2 2
e d
+ = 2,53333333
La suma de las varianzas intra (B14) e inter grupos (B18), incluida en la celda B19, sigue siendo
igual a la varianza total (B11), pero ahora el peso recae en la varianza inter-grupos, condicin que
le permite al muestreo conseguir una mayor precisin en la estimacin para el conjunto de la po-
blacin.

You might also like