You are on page 1of 20

Cap tulo 1

Muestreo estrati cado


El objetivo del dise~no de encuestas por muestreo es maximizar la cantidad de
informacion para un coste dado. El muestreo aleatorio simple suele suministrar
buenas estimaciones de parametros poblacionales a un coste bajo, pero existen
otros procedimientos de muestreo, como el muestreo estrati cado, que en
muchas ocasiones incrementa la cantidad de informacion para un coste dado.
El muestreo estrati cado es un dise~no de muestreo probabil stico en el que
dividimos a la poblacion en subgrupos o estratos. La estrati cacion puede ba-
sarse en una amplia variedad de atributos o caracter sticas de la poblacion como
edad, genero, nivel socioeconomico, ocupacion, etc.
As , consideramos una poblacion heterogenea con N unidades, y en la
que la subdividimos en L subpoblaciones denominados estratos lo mas
homogeneas posibles no solapadas, atendiendo a criterios que puedan ser
importantes en el estudio, de tama~nos N1; N2; : : : ; NL. Obviamente

N1 + N2 + : : : + NL = N;
donde N es el total de individuos de la poblacion. La muestra estrati cada de
tama~no n se obtiene seleccionando una muestra aleatoria simple de
tama~no nh (h = 1; 2; : : : ; L) de cada uno de los estratos en que se
subdivide la poblacion de forma independiente. De igual modo,

n1 + n2 + : : : + nL = n;

donde n es el tama~no de la muestra que queremos seleccionar.


Podemos expresar la formacion de estratos en la poblacion y la formacion
de la muestra estrati cada de la forma siguiente:

Poblacion = fu1; u2; : : : ; uN g ! se divide en L estratos


8 u ::: u L
u21 22 2N2 9 N = N:

> u u ::: u >


11 12 1N1
::: ::: ::: ::: h
h=1

> >
< u u ::: u
= X

>
>
L1 L2 LNL >
>

: ;

1
2

Seleccionamos una muestra de tama~no n,

fu1; u2; : : : ; ung ! se extrae en cada estrato


8 u ::: u L
u21 22 2n2 9 n = n:
> u u ::: u >
11 12 1n1
::: ::: ::: ::: h
h=1

> >
< u u ::: u
= X

>
>
L1 L2 Ln L >
>

: ;
Este muestreo se utiliza cuando la poblacion de estudio es muy heterogenea
ya que necesitar amos un gran esfuerzo muestral para obtener cierta precision
mientras que si la poblacion esta dividida en grupos, bloques o estratos que sean
internamente homogeneos, el esfuerzo en cada grupo sera m nimo resultando
globalmente un esfuerzo menor. Por ejemplo, si preguntamos en una facultad el
numero medio de horas de estudio los estratos en este estudio seran los cursos.
Las razones para el uso del muestreo estrati cado son las siguientes:
El muestreo estrati cado puede aportar informacion mas precisa de algu-
nas subpoblaciones que var an bastante en tama~no y propiedades entre
si, pero que son homogeneas dentro de si. Los estratos deber an en lo
posible estar constituidos por unidades homogeneas.
El uso adecuado del muestro estrati cado puede generar ganancia en
pre-cision, pues al dividir una poblacion heterogenea en estratos
homogeneos, el muestreo en estos estratos tiene poco error debido
precisamente a la homogeneidad.
Motivaciones de tipo geogra co ya que se requieren estimaciones para
ciertas areas o regiones geogra cas.
Las cuestiones que plantea este tipo de muestreo son:
>Que caracter sticas utilizar para dividir la poblacion en estratos?
>Como se identi caran los estratos?
>Cuantos estratos debe haber?
>Cuantas unidades seleccionar de cada estrato?

1.1. Estimadores lineales insesgados


Como comentamos en la introduccion, las unidades de la muestra se seleccio-
nan mediante muestreo aleatorio simple sin reposicion y la seleccion se realiza
de forma independiente en cada estrato. Un estimador de un parametro po-
blacional puede expresarse como suma de las estimaciones para el parametro
en los diferentes estratos mediante muestreo aleatorio simple. Consideremos el
parametro poblacional,
XX
L Nh

st =Yhi; (1.1)
h=1 i=1
3

que es estimado mediante un estimador del tipo


c L nh
XX (1.2)
= Y ! :
st hi hi
h=1 i=1
Vamos a calcular el valor de ! en la expresion (??) para que b sea un
hi
estimador insesgado de .

De nimos la variable aleatoria


ehi = 1 si uhi 2 m con probabilidad nh=Nh
0 si uhi 2= m con probabilidad 1 nh=Nh

Utilizando la variable aleatoria podemos expresar el estimador b dado en


(??) mediante la variable ehi.
b L n
XX
h L Nh
XX
= Y ! = Y ! e :
st hi hi hi hi hi
h=1 i=1 h=1 i=1
Calculamos la esperanza del estimador anterior, !
Yhi!hiehi
E( st) = E L nh ! L Nh
Yhi!hi = E
c XX XX
h=1 i=1
L Nh L Nh

h=1 i=1
nh
= Yhi!hiE[ehi] Yhi!hi :
XX XX
h=1 i=1 h=1 i=1
Nh
insesgado,
Nh L Nh
Para que este estimador cst sea L nh

Y ! Y
c XX XX

E( st) = st ) hi hi N
h
= hi
h=1 i=1 h=1 i=1
y por lo tanto Nh 1
! = = ;
hi
nh fh
donde fh es la fraccion de muestreo del estrato h = 1; 2; : : : ; L. Vamos a
aplicar este estimador b a los estimadores del total, de la media, de la
proporcion y del total de clase.
Estimacion del total poblacional

L Nh L nh
XX b XX
Nh
X )Y =X )X = h=1 i=1 Xhi
st = Xst = hi hi hi st nh
h=1 i=1
4

y por lo tanto
L 1 nh

Xst = Nh Xhi:
h=1 nh i=1
Notando que la expresion nh X
b X
1 Xhi;
nh
X
i=1

corresponde a la media muestral del estrato h, o lo que es lo mismo, el


estimador de la media poblacional del estrato utilizando un muestreo aleatorio
simple, entonces
L L
b X c Xb
Xst = NhXh = Xh: (1.3)
h=1 h=1
El estimador del total poblacional en muestreo estrati cado aleatorio es la
suma de los estimadores del total en muestreo aleatorio simple en cada estrato.

Estimacion de la media poblacional

1 L Nh L Nh
= X st = N X =
XX XX

st hi Xhi=N ) Yhi = Xhi=N


h=1 i=1 h=1 i=1
Por lo tanto,
X = L nh X N L
Nh 1 nh X = L
WhXh;
st hi h = hi
b XX X X X b
h=1 i=1 N nh N nh i=1 h=1
h=1

donde Xch representa la media muestral del estrato h, o lo que es lo mismo,


n
h
1X
Xc = X :
h nh i=1 hi

El estimador de la media poblacional en muestreo estrati cado aleatorio


es la media ponderada de los estimadores de la media en cada estrato,
siendo los coe cientes de ponderacion Wh = Nh=N que cumplen,
L L L =N = 1:
W = N
Nh P
=1 Nh
h=1 h h=1 = N
h N
X X

Estimacion del total de clase

L Nh L nh N
h
XX b XX
A )A =Y )A = h=1 i=1 A
st = Ast = hi hi hi st hi nh
h=1 i=1
5

y por lo tanto
L 1 nh L
b X X X b
Ast = Nh i=1 Ahi = NhPh;
h=1 nh h=1

donde Pbh representa la proporcion muestral para el estrato h (h = 1; 2; : : : ; L)


El estimador del total de clase en muestreo estrati cado aleatorio es la suma
de los estimadores del total de clase en cada estrato.

Estimacion de la proporcion

1 XX
L Nh L Nh
XX

st = Pst = N Ahi = h=1 i=1 Ahi=N ) Yhi = Ahi=N


h=1 i=1
Por lo tanto,
P= L nh A N L
Nh 1 nh
Ahi =
L
WhPh
hi h =
b XX X X X b
h=1 i=1 h=1 i=1 h=1
N nh N nh

El estimador de la proporcion poblacional en muestreo estrati cado


aleatorio es la media ponderada de los estimadores de la proporcion en cada
estrato, siendo los coe cientes de ponderacion Wh = Nh=N que cumplen,
L L = L =N = 1:
Nh =1 Nh
X Wh =
h=1 N
X
P
N
h N

h=1

1.2. Varianzas de los estimadores


La varianza del estimador Xbst, es igual a la suma de las varianzas de las
estimaciones de los totales en cada estrato, ya que el muestreo que supondremos
sin reposicion se realiza de forma independiente en los distintos estratos.
L ! = L
V (Xst) = V Xh 2 (1
fh ) S
2 (1.4)
b X b X N h

n : h=1 h=1 h h

Analogamente se obtendr an las varianzas para los estimadores de la media, el


total de clase y la proporcion,
! W (1 f ) :
V (Xst) = V WhXh = h h nh
L L 2
S
b X b X
2 h
(1.5)
h=1 h=1

V (Ast) = V L Ah ! = Nh
2 (1 f )
h Nh 1 nh :
L N PQ
b X X h h h
(1.6)
b
h=1 h=1
6
V (Pst) = V ! = Wh
2 (1 f) ;
WhPh h N h 1 nh
L L

b X Nh PhQh
X b (1.7)
h=1 h=1
2
donde Sh es la cuasivarianza poblacional del estrato h donde
1 Nh

S = Xi
h
2
Nh 1 (Xhi Xh) ;
2

=1

y Ph es la proporcion de clase del estrato h


1 Nh
Xi Ahi; Qh = 1 Ph:
Ph =
Nh =1
Como en el caso del muestreo aleatorio simple, las varianzas de los estimadores
dadas en (??), (??), (??)y (??) dependen de parametros poblacionales como
son la cuasivarianza poblacional del estrato
1 Nh

S = Xi
h
2
Nh 1 (Xhi Xh) ;
2

=1

o la proporcion de clase del estrato


Nh
1X
Ph = Phi:
Nh i=1

Como en la mayor a de las ocasiones estos parametros se desconocen,


se recurren a las estimaciones de los mismos resultando
L 2
bb X S
2 b
h

V (Xst) = Nh(1 fh) nh ;


h=1
L 2 2
Sh
X b

V (Xst) = Wh (1 fh) ;
bb L
nh
h=1
X P h Qh
bb

2
V (Ast) = Nh (1 fh) n 1 ;
L
h
bb

h=1

bb
X PhQh bb
2
V (Pst) = Wh (1 fh)n h 1 ;
h=1

2
donde Sbh es la cuasivarianza muestral correspondiente al estrato h-esimo
1 nh 1 nh
b Xi b b X
2 2 X ;
Sh =nh 1 (Xhi Xh) ; Xh = nh hi
=1 i=1
7

y Pbh es la proporcion muestral correspondiente al estrato h-esimo


nh
1 X
Pb = A :
h nh i=1 hi

Ejemplo 1 Las granjas de una cierta region se dividen en cuatro categor as


segun su super cie. El numero de granjas en cada categor a es 72, 37, 50 y
11. Un estudio para estimar el total de vacas productoras de leche en la
region produce una muestra estrati cada de 28 granjas. El total de vacas
productoras de leche en estas 28 granjas viene dado en la siguiente tabla
Categor a Total de vacas
Categoria I 61, 47, 44, 70, 28, 39, 51, 52, 101, 49, 54, 71
Categoria II 160, 148, 89, 139, 142, 93
Categoria III 26, 19, 21, 34, 28, 15, 20, 24
Categoria IV 17, 11
Estimar el total de vacas productoras de leche as como el error estandar
del estimador.
En este estudio se utiliza la estrati cacion para clasi car la categor a de las
granjas, dividiendo las granjas en 4 categor as o estratos con tama~nos N 1 =
72, N2 = 37, N3 = 50 y N4 = 11. De cada uno de los estratos se selecciona
una muestra de tama~nos n1 = 12, n2 = 6, n3 = 8, y n4 = 2 respectivamente.
Las fracciones de muestreo para cada uno de los estratos vienen dadas por
f1 = n1 = 12 = 0;166; f2 = n2 = 6 = 0;16;
N1 72 N2 37

f3 = n3 = 8 = 0;16; f4 = n4 = 0;18:
N3 50 N4
Las medias muestrales correspondientes a las muestras seleccionadas
de cada estrato vienen dadas por
1 n1
X
b i

X1 = n1 X
1i
= 55;5833
=1
1 n2 160 + 148 + 89 + 139 + 142 + 93
b = Xi X =
X =1 6 = 128;5
2 n2 2i

1 n3 26 + 19 + 21 + 34 + 28 + 15 + 20 + 24
b = Xi X
X3 n3 =1 3i = 8 = 23;3750
n
1 4 17 + 11
X
b = i
X4 n4 X
4i = 2 = 28=2 = 14:
=1
8

En este caso, el estimador del total de vacas productoras de leche viene


dado por:
L
X

Xbst = NhXch = 72 55;5833 + 37 128;5 + 50 23;375 + 11 14 = 10079 vacas


h=1

Calculamos el error del estimador, para ello consideramos la varianza de dicho


estimador
L 2
b X S h
2

V (Xst) = Nh (1 fh) n
h :
h=1
2
Como no tenemos datos su cientes para calcular Sh , estimamos la varianza
anterior como
L 2
bb X S b
2 h

V (Xst) = Nh (1 fh) nh ;
h=1
2
siendo Sbh , h = 1; 2; 3 la cuasivarianza muestral del estrato h-esimo. Utilizando
los resultados anteriores, se tiene que
2 1 n1 1 11 2 3860;91667
b = n1 X i c X =
S1 1 (X X )=
1i 1 11 (X1i 55;5833) 11
=1 i=1
= 350;99 351

=
2 1 n 1 6 2 4485;5
2
X Xi
S2
b
= n2 1 n
(X1i X2) =c
5 8
(X2i 128;5) = 5 = 8970;1
i=1 =1
3

2 1 X 1 Xi 2 247;875
S3 = n3 1 (X3i X3) = 7 (X3i 23;375) = 7 = 35;4107
=1
n
b c

i=1
4

b X
i
c
2 1 2 2
S
4 = n4 1 (X4i X4) = (17 14) + (11 14) = 18:
=1

Por lo tanto, la estimacion de la varianza del estimador para el total de la


poblacion viene dado por
L

bb X S2 b

N
2 h

V (Xst) = h (1 fh) nh
h=1
= 309500:

Por lo tanto, el error de muestreo estimado viene dado por

((Xbst)) = 566;3272vacas:
9

1.3. A jacion de la muestra


Se llama a jacion de la muestra al reparto o distribucion del tama~no muestral
n entre los diferentes estratos. Esto es, a la determinacion de los valores n h,
h = 1; 2; : : : ; L que veri quen

n1 + n2 + : : : + nL = n:

Pueden establecerse muchas a jaciones o \maneras" de repartir la muestra


entre los estratos, pero las mas importantes son: la a jacion uniforme, la a
jacion proporcional, la a jacion de varianza minima y la a jacion optima.

1.3.1. A jacion uniforme


Este tipo de reparto consiste en asignar el mismo numero de unidades mues-
trales a cada estrato con lo que se tomaran todos los n h iguales a k = n=L. Para
este tipo de a jacion, las varianzas de los estimadores vendran dadas por
L k 2
V (Xst) =
N2 1
Nh
S k
h

X
h=1 h

b L k S
2

V (Xs t) = h =1

X
W
h 2

1 Nh kh

b L
Nh 1 k
1 Nh
V (As t) =

h =1 h
N 2

P Q
k Nh
b X h h

1 Nh
N
V (Ps t) =
L h 1 k
h =1
W
h 2

k Nh PhQh
b X

Este tipo de a jacion da la misma importancia a todos los estratos, en cuanto


a tama~no de la muestra, con lo cual favorecer a los estratos de menor
tama~no y perjudicara a los grandes en cuanto a precision. Solo es
conveniente en pobla-ciones con estratos de tama~no similar.
Ejemplo 2 Sea X la variable salario anual en millones de unidades moneta-
rias. Al medir la variable X sobre una poblacion de 870 personas se obtiene
la siguiente distribucion de frecuencias.

X 2 3 4 7 10 12 16 20 25 30 35 50 60 100
ni 20 30 60 100 150 200 120 80 50 20 18 10 8 4
Con el objeto de establecer pautas para futuras encuestas de salarios se
estrati ca la poblacion en 3 estratos segun los criterios dados por 2 X 7, 10 X
25, 30 X 100. Para una muestra n = 100, realizar la a jacion uniforme.
10

La a jacion uniforme consiste en extraer de cada estrato el mismo numero de


unidades para realizar la muestra. En este caso,
n 100
L = 3 = 33;33:::;
donde L es el total de estratos y n es el tama~no muestral. Por lo tanto, una a
- jacion de este tipo consiste en extraer 33 individuos del un estrato, 33
individuos de otro estrato y 34 del estrato restante.

1.3.2. A jacion proporcional


Consiste en asignar a cada estrato un numero de unidades muestrales pro-
porcional a su tama~no. Las n unidades de la muestra se distribuyen proporcio-
nalmente a los tama~nos de los estratos expresados en numero de
unidades. Si el tama~no muestral es proporcional al tama~no del estrato,
entonces existe una constante k positiva tal que

nh = kNh; h = 1; 2; : : : ; L;

y para conocer el tama~no muestral es necesario conocer esa constante k.


Tenemos que:
L L
X X

nh = Nhk =) nh = Nhk = kN =) n = kN;


h=1 h=1

y por lo tanto k = n=N = f: Por lo tanto, la constante k es igual a la fraccion de


muestreo. La fraccion de muestreo en cada uno de los estratos viene dado por
fh = nh = Nhk = k = f; h = 1; 2; : : : ; L;
Nh Nh
es decir, las fracciones de muestreo son iguales y coinciden con la fraccion
global de muestreo, siendo su valor la constante de proporcionalidad. Las
ponderaciones Wh son iguales a
Wh = Nh = nh=k = nh ; h = 1; 2; : : : ; L:
N n=k n

A la vista de los anterior, los coe cientes de ponderacion W h se obtienen ex-


clusivamente a partir de la muestra, pues para su calculo solo son necesarios
valores muestrales nh y n. Utilizando las igualdades anteriores, los estimadores
para la media poblacional y el total poblacional vienen dados por:
X = N N nh
st NhXh = Xh = N
1X
b X c X b b
nhX h:
h=1 h=1 k k
h=1
N N nh
Xst = WhXh = Xh = N
X
X X 1
b c b b
nhX h:
h=1 h=1 n n
h=1
11

Para este tipo de a jacion, las varianzas de los estimadores seran:


V (X ) = L S 2= L S 2 = 1 kL 2
NS :
N2(1 f ) h N2(1 k) h
b X X h X
st h=1 hh nh h=1 kNh k h h
h=1
V (X ) = L S 2 = L n2 S2 = 1 k L 2
W 2(1 f ) h h (1 k) h WS :
b X X X

st 2
hh nh n nh n h=1 h h
h=1 h=1
L L
V (Ast) = 1 k PhQh = 1 k
2
Nh Nh Nh PhQh
b k X 1 k X 1
L

h=1 Nh h=1
L

Nh
V (Pst) = 1 k =1 k X 2
Wh Nh PhQh Nh =N PhQh:
b
n X
h=1 Nh 1 k k Nh 1
h=1
Ejemplo 3 Considerando el ejemplo ??, realizar una a jacion proporcional.
> n1 = 100 N1 = 100 210 = 24;13 = 24
100 = K 870 = K= = 870
n2 = N2 =
870 600 = 68;96 = 69

>
) )

870

100
> 870
100
870
100

>
n = N = 60
> = 6;896 = 7
8

3 870 3 870
< 100 100
>
>
>

1.3.3. A jacion de m nima varianza (o a jacion de Ney-man)

La a jacion de m nima varianza o a jacion de Neyman consiste en determi-


nar los valores de nh (numero de unidades que se extraen del estrato h-esimo
para la muestra) de forma que para un tama~no de muestra jo igual a n la
varianza de los estimadores sea m nima. El desarrollo teorico para obtener la
expresion de la a jacion en cada estrato y los estimadores correspondientes se
basa en la teor a de los multiplicadores de Lagrange obteniendose que el el
numero de unidades que se extraen del estrato h-esimo es igual a
nh = n N S ; h = 1; 2; : : : ; L; h h
(1.8)

L
X
NS
h h
h=1

donde Sh es la cuasivarianza poblacional correspondiente al estrato h-esimo


y Nh es el tama~no poblacional correspondiente al estrato h-esimo. Otra
expresion para (??) viene dada por
nh = n NS =n WS ; h = 1; 2; : : : ; L: (1.9)
h h h h
L L
P P
h=1 NhSh h=1 WhSh
12

Vemos que los valores de nh son proporcionales a los productos NhSh y en el


supuesto de que Sh = S, 8h = 1; 2; : : : ; L esta a jacion de m nima varianza
coincidir a con la proporcional como vemos a continuacion.
NhSh nNh n
Sh = S ) nh = n L = N = kNh; con k = N :
N S
h=1 h h
es mayor si hay grandes diferencias en la variabili-

La utilidad de esta a jacion P


dad de los estratos. En otros casos, la mayor sencillez y autoponderacion de
la a jacion proporcional hacen preferible el empleo de esta.
El valor de la varianza del estimador del total y de la media vienen dados
por:
1 2 1
L ! L 2
V (Xst) = n h=1
WhSh N
h=1
WhSh
d X X
L 2
1 PhQhNh 1
L
PhQhNh
!
V (Pst) = n h=1 Wh r
Nh 1 N h=1 Wh Nh 1
c X ! 2 X
1 L NhSh 1 L
V (Xst) = n h=1 N h=1
NhSh2

d X X
L 2
1 P Q N
h h h 1
L P Q N
h h h
N N
V (Ast) = n h=1 h Nh 1 ! N h Nh 1
d X X
Ejemplo 4 Considerando el Ejemplo ??, realizar una a jacion de Neyman. Como
hemos comentado anteriormente, la asignacion para cada muestra viene
dado por: NhSh
nh = n :
L
NS
P h=1 h h
Primero vamos a calcular las cuasivarianzas poblacionales para cada uno de
los estratos. Para el estrato poblacional 1,
X ni nixi
2 20 40
3 30 90
4 60 240
7 100 700
La media poblacional en el estrato 1 viene dada por
40 + 90 + 240 + 700
X
1 = 210 = 5;09;
y por lo tanto la cuasi-varianza poblacional para dicho estrato viene dado por:
2 1 (2 5;09)2 2 2 2
S1 = 20 + (3 5;09) 30 + (4 5;09) 60 + (7 5;09) 100
=
209
3;

6273:
13

Para el segundo estrato, se tiene que

X ni nixi 10
150 1500 12
200 2400 16
120 1920 20
80 1600 25 50
1250
La media poblacional en el estrato 2 viene dada por
1500 + 2400 + 1920 + 1600 + 1250
X2 = 600 = 14;45;

y por lo tanto la cuasi-varianza poblacional para dicho estrato viene dado por:
2
S2 = 20;8493:

Finalmente, para el tercer estrato,


n nx
X i i i
30 20 600
35 18 630
50 10 500
60 8 480
100 4 400
La media poblacional en el estrato 3 viene dada por
600 + 630 + 500 + 480 + 400
X3 = 60 = 43;5;

y por lo tanto la cuasi-varianza poblacional para dicho estrato viene dado por:

2
S3 = 344;3220:

De este modo, se tiene que


p p p
2 2 2
S1 = (S1 ) = 1;9045; S2 = (S2 ) = 4;5661; S3 = (S3 ) = 18;5559;

N1S1 + N2S2 + N2S3 = 1;9045 210 + 4;5661 600 + 18;5559 60 = 3576;8:


Calculamos los tama~nos muestrales
NS 399;9450
1 1
n =n = 100 4253 = 9;4038 = 9:
1 N1S1 + N2S2 + N3S3
N2S2 2739;66 = 64;4181 = 65:
n2 = n N S + N S + N S = 100 4253
1 1 2 2 3 3
n3 = n N3S3 = 100 1113;4 = 26;1218 = 26:
N1S1 + N2S2 + N3S3 4253
14

1.3.4. A jacion optima


La a jacion optima consiste en determinar los valores de nh (numero de
unidades que se extraen del estrato h-esimo para la muestra) de forma que
para un coste jo C la varianza de los estimadores sea m nima. El coste jo C
sera la suma de los costes derivados de la seleccion de las unidades
muestrales de los estratos, es decir, si Ch es el coste por unidad de muestreo
en el estrato h, el coste de seleccion de las nh unidades muestrales en ese
estrato sera Chnh. Sumando los costes Chnh para los L estratos tenemos el
coste total de seleccion de la muestra estrati cada.
Como en el apartado anterior, la expresion nh se obtiene utilizando los mul-
tiplicadores de Lagrange y vienen dados por:
p
NhSh= ch ; h = 1; 2; : : : ; L: (1.10)
nh = n L
X p
NhSh= ch
h=1
p
Vemos que los valores de nh son proporcionales a los productos NhSh= Ch
y en el supuesto de que Ch = K, 8h = 1; 2; : : : ; L (coste constante en todos
los estratos) la a jacion optima coincide con la de m nima varianza y si ademas
Sh = S, 8h = 1; 2; : : : ; L la a jacion optima coincidira con la de m nima varianza
y con la proporcional.
Bajo este tipo de a jacion, las varianzas de los estimadores de la media
poblacional, total poblacional, proporcion de clase y total de clase vienen dados por
V (X ) = L WhSh Ch! N 2
st n L WhSh= Ch ! L WhSh
1 1
X p X p X
d L h=1 L h=1
h=1
! !
V (Pst) = =
n h=1 Wh Nh 1 Ch h=1 Wh Nh 1 Ch
c 1 X PhQhNh p X PhQhNh p
P Q N
1 L h h h

N X Nh 1
V (X ) = h=1 N S = C ! ! 2
W
h

st n h h h NhSh Ch N NhSh
1 L L 1 L
X p X p X

d L h=1 L h=1

h=1
! !
V (Ast) = =
n h=1 Nh Nh 1 Ch h=1 Nh Nh 1 Ch
d 1 X PhQhNh p X PhQhNh p

1 L PhQhNh
N X Nh
Nh 1
h=1

Ejemplo 5 Para el ejemplo , realizar la a jacion optima siendo los costes por
unidad en cada estrato C1 = 1, C2 = 16 y C3 = 25.
15

p p p
En este caso, se tiene que C1 = 1, C2 = 4 y C3 = 5 y por lo tanto
p
N S = C
1 1 1 = 100 399;45 = 30;5615 = 31:
n1 = n3 1307;0358
X p
h=1 p
n2 = n N2S2= C2 = 100 684;915 = 52;4022 = 52:
3 p 1307;0358
h=1
NhSh= ch

X
p 222;6708
n3 = n N3S3= C3 = 100 = 17;0358 = 17:
3 p 1307;0358
NhSh= ch

X
h=1

1.4. Comparacion de e ciencias segun los distin-tos


tipos de a jacion
El estudio comparativo de la conveniencia de los distintos tipos de a
jacion en terminos de su e ciencia se mide a traves del error de muestreo o lo
que es lo mismo, a traves de la varianza. Por lo tanto sera mas e ciente
aquel tipo de a jacion que presente menos varianza.
Los siguientes puntos se exponen sin demostracion.
El muestreo estrati cado con a jacion proporcional es mas preciso que el
muestreo aleatorio simple, produciendose la igualdad de precisiones cuan-
do las medias de los estratos son todas iguales. Por lo tanto la ganancia en
precision del muestreo estrati cado respecto del aleatorio simple sera ma-
yor cuanto mas distintas entre s sean las medias de los estratos, es decir,
para que el muestreo estrati cado sea preciso es conveniente que los es-
tratos sean heterogeneos entre s en media, a rmacion que ya conoc amos
desde el comienzo del tema y que constituye una de las especi caciones
clasicas en el muestreo estrati cado.
El muestreo estrati cado con a jacion de m nima varianza es mas preciso
que el muestreo estrati cado con a jacion proporcional, produciendose la
igualdad de precisiones cuando las cuasidesviaciones t picas de los estra-
tos son todas iguales. Por lo tanto, la ganancia en precision del muestreo
estrati cado con a jacion de m nima varianza respecto del muestreo estra-ti
cado con a jacion proporcional sera mayor cuanto mas distintas entre s
sean las cuasidesviaciones t picas de los estratos, es decir, para que el
muestreo estrati cado sea mas preciso es conveniente que los estratos
sean heterogeneos entre si en desviacion t pica.
16

1.5. Tama~no de la muestra necesario para come-


ter un error absoluto de muestreo
Vamos a analizar ahora el tama~no de muestra estrati cada necesario para
cometer determinado error absoluto de muestreo conocido de antemano.
Supongamos que queremos calcular el tama~no de muestra estrati cada para

cometer un error de muestreo e = (b) sin coe ciente de con anza adicional.

1.5.1. A jacion uniforme


Para jacion uniforme se tienen las siguientes varianzas
L K 2
S
V (Xst) =
2
1 Nh

h
Nh
h=1 K
X

b L K 2
1 S
2 h
V (Xs t) = Nh

Wh
h=1 K
X

b L K N PQ
h h h
N 2 1
V (Ast) = h=1 h Nh Nh 1 K

b X
L
W 2 1 K Nh PhQh ;
V (Pst) = h=1 h N
h
N
h 1 K

b X

siendo K = n=L el tama~no jo de la a jacion. De las expresiones anteriores,


se tienen los siguientes resultados para el valor de n.
Estimador del total
n= L
X :
2 2
L N h Sh
h=1
L
X

2 2
e + NhSh
h=1
Estimador de la media
n= L :
X

L 2 2
Wh Sh
h=1
2 2
L X
W S
2 h h
e + Nh
h=1
17

Estimador del total


L 3
n= X
Nh PhQh :

1
L

Nh
h=1
L 2
X
Nh PhQh
2
e +
h=1 Nh 1
Estimador de la proporcion L
Wh NhPhQh
2

n= X :

1
L
N
h
h=1
L 2
X
Wh PhQh
2
e +
h=1 Nh 1

Ejemplo 6 Considerando el ejemplo ??, se quiere reducir el error en un 10 %


al estimar la media poblacional, >que tama~no de muestra ser a necesario
tomar considerando a jacion uniforme?

En este caso, el error al considerar a jacion uniforme viene dado por


2 (1
fh )
L S2
X h

V (Xbst) = Wh :
h=1 nh

Considerando que
W1 = 210 ; W2 = 600 ; W3 = 60 ; nh = 100 :
870 870 870 3

Tomando en cuenta estos datos, se tiene que V (Xbst) = 0;1801 y por tanto el p
error viene dado por e = 0;1801 = 0;4244. Si queremos reducir este error en
un 10 % el error ser a en este caso
0
e = 0;4244 0;04244 = 0;3820:

Aplicando las expresiones anteriores, se tiene que

X
L
L Wh2Sh2
n= h=1 = 3 7;4744 = 122;12= 123:
2
L
X
W 2S 2 0;3820 + 0;03767
2 h h
e + N
h=1 h

Y considerando a jacion uniforme tendr amos que utilizar n 1 = 41, n2 = 41 y


n3 = 41.
18

1.5.2. A jacion proporcional


Para este tipo de muestreo, notar quer n h = nWh, h = 1; 2; : : : ; L y por lo
tanto f = fh, h = 1; 2; : : : ; L. Supongamos que queremos calcular el tama~no
de muestra estrati cada para cometer un error de muestreo e = (b) sin coe
ciente de con anza adicional.
= V (X ) = 2 n= L
WS X

1 f L 2
WhSh
e2 + 1 W S2
2 d
X

)
e h=1 N
h h

st n h=1 h h L
X
h=1

= V (X ) = 2 n= L
NS X 2
N NS
2
1 f L
e2 +
h h
N S2
)
X

e st f h h
h=1
L
d h=1 h
h
X
h=1
1 f L
2
= V (Pst) = Wh Nh PhQh
e
N
c L
n h=1
X
h 1
X Nh
n=
Wh
P Q
Nh 1 h h
h=1
) L
2 1 Nh
e + Wh PhQh
N
1
X

h=1 Nh
L N
X h
= V (X ) = N
N
P Qn =
N Nh
PQ
2 d 1 f L h h=1 Nh 1 h h
e st
X

h h ) e2
+N
h Nh 1
PQ
h h

f h=1 Nh 1 h L
Nh
X
h=1

Ejemplo 7 Una poblacion de tama~no 1000 esta dividida en tres estratos para los
que se conocen los siguientes datos 1 = 4, 2 = 12, 3 = 80, W1 = 0;6, W2 = 0;3 y
W3 = 0;1, donde 1, 2 y 3 representan la desviacion t pica poblacional de los
estratos 1, 2, y 3. Determinar el tama~no de la muestra que con a jacion
proporcional da una varianza del estimador de la media igual a 5.

W1 = 0;6 = N1=N ) N1 = 600; 12 = 16 = (N1 1)S12=N1 ) S12 = 16;02


W2 = 0;3 = N2=N ) N2 = 300; 22 = 144 = (N2 1)S22=N2 ) S22 = 144;5
W3 = 0;1 = N3=N ) N3 = 100; 32 = 6400 = (N3 1)S32=N3 ) S32 = 6464;6
19

Y por lo tanto,
X
L
2
WhSh = 699;422;
h=1

y utilizando la expresion dada en teor a


n= L = = 122;7181 = 123;
X
2
WhSh
h=1 699;422
L 5 + 0;6994220
2 1 X 2
e + N WhSh
h=1

es decir, necesitar amos 123 unidades para conseguir ese error. Para repartir
133 unidades considerando a jacion proporcional se tiene que

nh = nWh; h = 1; 2; : : : ; L;

de manera que

n1 = nW1 = 123 0;6 = 73;8 = 74


n2 = nW2 = 123 0;3 = 36;9 = 37
n = nW = 123 0;1 = 12;3 12:

3 3 =

1.5.3. A jacion de m nima varianza


En este caso, se tiene que
2 WS 2 2 2 1 L 22
e = V (Xst) = n h h N WhSh ) n =
1 h=1 ! 1 h=1 e P L h=1 h h
L L h=1
W S
h h

X X
d L
2 L L N
P 2
WS
+
2 2 2
e = V (Xst) = NhSh NhSh ) n =
n 2 1 L 2
h=1 ! h=1 e P h=1 h h
1
NS
d X X N P

Los tama~nos de muestra en los casos de la estimacion de la proporcion y el total


2
de clase se calculan sustituyendo S por Nh PhQh en las formulas del tama~no
h Nh 1
de la muestra para la estimacion de la media y el total respectivamente.
Ejemplo 8 Considerando los datos del Ejemplo ??, determinar el tama~no de
la muestra que con a jacion de m nima varianza nos proporciona una
varianza del estimador de la media igual a 5.
En este caso, se tiene que la expresion para el tama~no muestral viene dado por:
n= 2 1
L
h h 2 2 = 34;6258 = 35:
=14;04801
e P WS
L

2
h=1
P
+ h=1 h Sh 5 + 699;416=1000
W
N
20

Para repartir estos 35 unidades utilizando a jacion de m nima varianza consi-


deramos la expresion
nh = n NhSh ;
P NhSh
obteniendose los siguientes resultados

n1 = 35 2;4015 = 5;98 = 6
14;0480
1
n2 = 35 3;60624 = 8;98 = 9
1;40480
1
8;04027
n3 = 35 14;04801 = 20:

1.5.4. A jacion optima


En este caso, se tiene que
Para el estimador de la media
( L p )( L p )
h =1 WhSh= Ch h =1 WhSh Ch
n= :
P N h P h

2 1 L 2
e + WhS
P =1
Para el estimador del total
( L p )( L p )
h =1 NhSh= Ch h =1 NhSh Ch
n= :
P N h P h

2 1
P L 2
e + =1 NhS
Para el estimador de la proporcion
q P Q N p W h h q P Q N p
L L
2

( P
h=1
Wh
h h h

e
N
+
1
= Ch )( P h=1
Wh N
h h h

1
Ch )
n= :
1 L P Q Nh
N P h
Nh 1
h=1
Para el estimador del total de clase
q p N h h q p
P P
e2 +

( L Nh P QN
h h h = Ch
)( L Nh PhQhNh Ch
)

h=1 h=1
N 1 N 1
n= 1 L P Q Nh
:
N P h
Nh 1
h=1
Ejemplo 9 Considerando el Ejemplo ?? y suponiendo que el coste para cada
estrato es igual a c1 = 1, c2 = 4 y c3 = 25, obtener el tama~no de la muestra
que proporciona una varianza para el estimador de la media igual a 5.
Utilizando la expresion anterior, el tama~no de la muestra es igual a
( L p )( L p )
h =1 WhSh= Ch h =1 WhSh Ch
n =
P
P N h

2 2
h

1 L
e + =1 WhS
81533
= 5;8126743 49; P = 50;8052
= 51:
5 + 0;699422

You might also like