Professional Documents
Culture Documents
58 MATEMÁTICAS
Población y muestra.
Condiciones de representatividad de
una muestra.
Tipos de muestreo.
Tamaño de una muestra.
24-13850-13
Temario 1993
tema 58
matemáticas
3. Tipos de muestreo
3.1. Muestreo aleatorio simple
3
tema 58
matemáticas
INTRODUCCIÓN
La Estadística tiene como objetivo recoger datos sobre la evolución de cualquier infor-
mación contenida en una muestra. Todos conocemos y podemos encontrar día a día en los
medios de comunicación algunos resultados referentes a estudios estadísticos que llevan a
cabo los estados, las empresas, los comercios o los bancos por poner algunos ejemplos.
Lo primero que se tiene que hacer es establecer el conjunto de elementos que nos interesa
estudiar, es decir, la población. La población que le interesará a un estado para su estudio
será todo el censo, en cambio una empresa privada, para llevar a cabo un estudio comercial
se conformará con obtener información de una parte de dicha población, cogiendo una
muestra.
En el presente tema se van a estudiar estos conceptos, las condiciones de representatividad
de una muestra, los tipos que existen y la forma de calcular el tamaño más adecuado para
esta.
5
tema 58
matemáticas
6
tema 58
matemáticas
7
tema 58
matemáticas
8
tema 58
matemáticas
Es decir:
XX Distribución poblacional
∑x i
µ= i =1
= media poblacional
N
N N
∑ ( xi − µ) 2 ∑x 2
i
σ2 = i =1
= i =1
− µ2 = varianza poblacional
N0 N
XX Distribución de la muestra
9
tema 58
matemáticas
n = tamaño de la muestra
n
∑x i
x= i =1
= media muestral
n
n n
∑ ( xi − x ) 2 ∑x 2
i
2
S2 = i =1
= i =1
− x = varianza muestral
n n
α
p= = proporción muestral, con α = número de individuos de la muestra
n
con una característica A.
XX Distribución muestral
∑ ( x − x)
i
2
SC2 = i =1
n −1
2 n −1 2
S = n SC
Es obvio que:
2 n
SC = n − 1 S
2
10
tema 58
matemáticas
3 Tipos de muestreo
El muestreo probabilístico se caracteriza porque puede calcularse de antemano
la probabilidad de obtener cada una de las posibles muestras, para lo cuál es ne-
cesario que la selección de la muestra pueda considerarse como un experimento
aleatorio.
Así, cada observación xi es una variable aleatoria que tiene la distribución de pro-
babilidad de la Población:
E[xi] = µ V[xi] = 2 ∀i = 1, 2, ..., n
Este tipo de muestreo es el único que tiene rigor científico, y el único que puede
darnos el error que cometemos en la inferencia.
Dentro del muestreo aleatorio, hay varios tipos:
N − 1 ( N − 1)!
n − 1 ( n − 1)! ⋅ ( N − n)! n
P(ui pertenezca a una muestra determinada) = = =
N N! N
n n! ⋅ ( N − n)
11
tema 58
matemáticas
3. Variables indicadoras:
Para k = 1, ...N, sea βk una variable aleatoria tal que
1 si uk está en la muestra
βk =
0 si uk no está en la muestra
Entonces:
n
a) P ( β k = 1) = por II.
N
n n n
b) E [ β k ] = 1 ⋅ + 0 ⋅ 1 − = .
N N N
Definimos también la variable aleatoria:
1 si ui y uk éstán en la muestra
βi ⋅ β k =
0 en caso contrario
Entonces:
N − 2 ( N − 2)!
n − 2 ( n − 2)! ⋅ ( N − n)! n ⋅ ( n − 1)
a) P ( β j ⋅ β k = 1) = = =
N N! N ⋅ ( N − 1)
n ⋅
n! N( − n )!
n ⋅ ( n − 1) n ⋅ ( n − 1) n ⋅ ( n − 1)
b) E[ β j ⋅ β k ] = 1 ⋅ + 0 ⋅ 1 − =
N ⋅ ( N − 1) N ⋅ ( N − 1) N ⋅ ( N − 1)
n
1 n
a) E[ x ] = E 1 ∑ ∑ E[ x ] = n ⋅ n ⋅ µ = µ, por la linealidad de la
1
xi = i
n i =1 n i =1
esperanza.
b)
E [ x ]= µ x + ... + xn n ⋅ µ 2
V [ x ] = E x − E[ x ]2 = E ( x − µ) 2 = E 1 − =
n n
1 n
2
1 n n
=E 2
n
∑ ( xi − µ)
= E
n 2 i =1 ∑
( xi − µ) 2 + ∑ ( x − µ) ⋅ ( x
i j − µ) =
i =1
i≠ j
n n
∑ ∑ E ( x − µ) ⋅ ( x
1 1
= E ( xi − µ) 2 + 2 i j − µ) =
n2 i =1
n i≠ j
∑ E ( β ⋅ β ) ⋅ ( x − µ) ⋅ ( x
1 1
= 2
⋅ n ⋅ σ2 + 2 i j i j − µ) =
n n i≠ j
∑ E[ β ⋅ β ] ⋅ E ( x − µ) ⋅ ( x
σ2 1
= + i j i j − µ)
n n2 i≠ j
12
tema 58
matemáticas
n ⋅ ( n − 1)
N
∑ N ⋅ ( N − 1) E ( x − µ) ⋅ ( x
σ2 1
= + i j − µ) =
n n2 i≠ j
σ 2 1 n ⋅ (nn − 1) N
= + 2⋅ E
n n N ⋅ ( N − 1) i ≠ j ∑
( xi − µ) ⋅ ( x j − µ) =
N N
2
∑ ( xi − µ) = 0 ⇒ ∑( xi − µ) = 0 ⇒
i =1 i =1
N N N N
⇒
∑ i =1
( xi − µ) +
2
i≠ j
∑
( xi − µ) ⋅ ( x j − µ) = 0 ⇒ ∑ ( x − µ) ⋅ ( x
i≠ j
i j − µ) = − ∑
i =1
( xi − µ) 2
( n − 1) N
∑
σ2
= + E − ( xi − µ) 2 =
n n ⋅ N ⋅ ( N − 1) i =1
( n − 1) N σ2 n −1
∑
σ2
= + E ( xi − µ) 2 = − ⋅ N ⋅ σ2 =
n n ⋅ N ⋅ ( N − 1) i =1 n n ⋅ N ⋅ ( N − 1)
( N − 1) σ 2 − ( n − 1) σ 2 N − n σ 2
= = ⋅
n ⋅ ( N − 1) N −1 n
N −n
se llama factor de corrección para poblaciones finitas.
N −1
5. Distribución de la varianza muestral S2:
1 n
1 N
1 n
∑ ∑ ∑ E[ x ] − E[ x ]
2
E[S ] = E
2
( xi − x ) = E
2
x −x =
2
i
2
i
2
n i =1 n i =1 n i =1
N − n σ2
1. V [ x ] = E [ x 2 ] − µ2 ⇒ E [ x 2 ] = V [ x ] + µ2 = ⋅ + µ2
N −1 n
2. V [ x ] = σ 2 = E [ x 2 ] − µ2 ⇒ E [ x 2 ] = σ 2 + µ2
Luego:
1 N − n σ2
E[S 2 ] = ⋅ n ⋅ ( σ 2 + µ2 ) − ⋅ + µ2 =
n N −1 n
N − n σ2 n ⋅ N − n − N + n σ 2 N ⋅ ( n − 1)
= σ2 − ⋅ = σ2 ⋅ = ⋅
N −1 n n ⋅ ( N − 1) n N −1
13
tema 58
matemáticas
por tanto 1 .
Nn
2. Distribución de la media muestral x:
a) E [ x ] = µ (visto antes)
1 n
v.a.i. 1 n n
∑ ∑ ∑
1 1 σ2
b) V [ x ] = V xi = 2 V [ xi ] = 2 σ2 = ⋅ n ⋅ σ 2
=
n i =1 n i =1
n i =1
n2 n
1 n
E[S 2 ] = E
n
∑ ( x − x)
i =1
i
2
n n
∑ ( x − x) = ∑ ( x − µ + µ − x)
i =1
i
2
i =1
i
2
=
n n n
= ∑ ( x − µ) + ∑ ( µ − x)
i =1
i
i =1
2
+2 ∑ ( x − µ) ⋅ ( µ − x) =
i =1
i
n n
= ∑
i =1
( xi − µ) 2 + n ⋅ ( µ − x ) 2 + 2( µ − x ) ∑ ( x − µ) =
i =1
i
= ∑ ( x − µ)
i =1
i
2
+ n ⋅ ( µ − x ) 2 + 2( µ − x ) ⋅ ( n ⋅ x − n ⋅ µ) =
n n
= ∑ ( x − µ)
i =1
i
2
+ n ⋅ ( µ − x ) + 2n ⋅ ( µ − x ) =
2 2
∑ ( x − µ)
i =1
i
2
− n ⋅ ( µ − x) 2
n n
Luego ∑ i =1
( xi − µ) 2 = ∑ ( x − x)
i =1
i
2
+ n ⋅ ( µ − x) 2
14
tema 58
matemáticas
n n
∑ ∑
σ2
E ( xi − µ) 2 = E ( xi − x ) 2 + n ⋅ E [( x − µ) 2 ] ⇒ n ⋅ σ 2 = E[n ⋅ S 2 ] + n ⋅ ⇒
i =1 i =1 n
n −1 2
n · E[S2] = n · σ2 – σ2 = (n – 1) · σ2.Luego E [S 2 ] = σ
n
En consecuencia, el valor medio de S2 es menor que σ2, aunque la diferencia tiende
a 0 al aumentar el tamaño de la muestra. Es por esto que se define la cuasivarianza
muestral Sc2, que verifica:
n n n n −1 2
E[Sc2 ] = E ⋅ S2 = ⋅ E[S 2 ] = ⋅ ⋅ σ = σ2
n −1 n −1 n −1 n
Y si n es grande S2 ≈ S2
Observación:
En el caso de ser la población infinita o el tamaño N muy grande, entonces es
prácticamente igual hacer el muestreo con o sin reemplazamiento, ya que:
Caso 1 Caso 2
N − n σ2 n→∞ σ2
V [ x] = ⋅ → V [ x] =
N −1 n n
N ⋅ ( n − 1) σ 2 n→∞ n −1 2
E[S 2 ] = ⋅ → E[S 2 ] = ⋅σ
N −1 n n
Como regla práctica se suele adoptar que si la fracción de muestreo n/N es menor
que 5/100, entonces se hace el muestreo aleatorio simple con reemplazamiento,
que es el que se utiliza con mayor frecuencia, y al ser variables aleatorias e inde-
pendientes e idénticamente distribuidas el estudio de las distribuciones de x y S2
queda mucho más sencillo como acabamos de ver.
Ejemplo:
Una variable aleatoria X tiene por distribución de probabilidad:
x 1 4
1 1
pi
3 2
a) Hallar µ y σ2
1 2
µ = 1⋅ + 4⋅ = 3
3 3
1 2
σ 2 = 12 ⋅ + 4 2 ⋅ − 32 = 11 − 9 = 2
3 3
15
tema 58
matemáticas
Muestras Pi x S2
1
(1, 1) 1 0
9
2
(1, 4) 2,5 2,25
9
2
(4, 1) 2,5 2,25
9
4
(4, 4) 4 0
9
12 + 12
S 2 (1, 1) = − 12 = 0 = S 2 ( 4, 4)
2
12 + 4 2
S 2 (1, 4) = − 2, 52 = 2, 25 = S 2 ( 4, 1)
2
Distribución de x:
x Pi
1
1
9
4
2,5
9
4
4
9
Distribución de S2:
S2 Pi
5
0
9
4
2,25
9
16
tema 58
matemáticas
σ2 n −1 2
c) Comprobar que E [ x ] = µ, V [ x ] = y E[S 2 ] = ⋅σ
n n
1 4 4
E[ x ] = 1 ⋅ + 2, 5 ⋅ + 4 ⋅ = 3 = µ
9 9 9
1 4 4
V [ x ] = 12 ⋅ + 2, 52 ⋅ + 4 2 ⋅ − 32 = 10 − 9 = 1
9 9 9
σ2 2
V [ x] = = =1
n 2
5 4
E[S 2 ] = 0 ⋅ + 2, 25 ⋅ = 1
9 9
n −1 2 1
E[S ] = n ⋅ σ = 2 ⋅ 2 = 1
2
∑Y i
i =1
n
∑ Yi n
pA ⋅ qA
b) V [ p] = V i =1 = 12 ∑ V [Y ] = n
v.a.i. 1
⋅ n ⋅ pA ⋅ qA =
n n
i 2
n
i =1
17
tema 58
matemáticas
x− µ
2. Si σ desconocida: ≡ t n−1
Sc
n
n⋅ S2 ( n − 1) ⋅ Sc2
3. ≡ ℵ2
n −1 ⇔ ≡ ℵ2n−1. Y, además, es independiente de x.
σ2 σ2
b) Caso de Poblaciones no normales:
1. Cuando no sabemos la distribución de la Población, y n ≥ 30, podemos apli-
car el Teorema Central del Límite y tenemos que:
σ
x → N µ, , si σ conocida
n
S2
x → N µ, c , si σ desconocida
n
18
tema 58
matemáticas
19
tema 58
matemáticas
20
tema 58
matemáticas
Este tipo de muestreo se utiliza sobre todo para realizar controles de calidad en los
que se debe estudiar una característica de una población cuyo estudio implica la
destrucción del elemento que se seleccione. En un muestreo secuencial las unida-
des de muestreo son examinadas progresivamente hasta llegar al punto en que se
tiene suficiente información como para dar el resultado con las probabilidades de
error previamente establecidas. Por tanto, primeramente se establecen unas pro-
piedades que debe de cumplir el elemento que se seleccione y se toma la decisión
de rechazarlo o aceptarlo y de continuar o no la inspección.
Con este tipo de muestreo se requiere una muestra de menor tamaño que en los
muestreos estudiados anteriormente aunque puede haber una ligera pérdida de
representatividad respecto a estos.
Si podemos estimar una recta de regresión entre dos variables de una población,
con una muestra de una variable (variable independiente que obtendremos por
métodos directos como muestreo aleatorio simple, muestreo por conglomera-
dos…) podemos estimar los valores de la otra variable (variable dependiente). La
representatividad de esta muestra dependerá del coeficiente de correlación entre
las dos variables que se estudien y de la representatividad de la muestra de la va-
riable independiente.
Así, por ejemplo, conocida la relación existente entre el peso del cerebro y el peso
corporal de ciertas especies de mamíferos, podemos estimar el peso del cerebro
y ahorrarnos muchas mediciones obteniendo únicamente estimaciones del peso
corporal.
21
tema 58
matemáticas
Será mayor cuanto menor sea E: el intervalo es más preciso para la estima-
ción.
Ejemplo 2:
p⋅q
Si tenemos una población binomial p ≡ N p, , y el intervalo de confian-
za de nivel 1 – α para p es: n
p⋅q
IC1− α ( p) = p ± x α ⋅
2
n
22
tema 58
matemáticas
p⋅q
El error es E = z α ⋅ . Como no tenemos n, no podemos saber p ni q, pero
2
n
1
1
si sabemos que p ⋅ q < . Así E ≤ E ′ = z α ⋅ 4 , y fijado 1 – α y E’, podemos
4 2
n
obtener el tamaño muestral mínimo para este caso:
2
1 1 1
E ′ = z ⋅ ⋅ ⇒ n = ⋅ z α ⋅ ( E ′ ) −1
2 2
α
4 n
2 2 2
P (( x − µ) 2 > ε2 ) ≤
σ2
n ⋅ ε2
⇔ P ( x − µ > ε) ≤
σ2
n ⋅ ε2
,
0, 9 ≤ P ( x − µ < 2) = 1 − P ( x − µ ≥ 2) ⇒
P ( x − µ ≥ 2) ≤
σ2 10 5
= = = 0, 1 ⇒ n = 25
2 ⋅ n 4 n 2n
2
23
tema 58
matemáticas
BIBLIOGRAFÍA
ARNÁIZ VELLANDO, G.: Introducción a la Estadística Teórica. Ed. Lex Nova, 1986.
AZORÍN poch, F.: Curso de muestreo y aplicaciones. Ed. Aguilar, 1969.
GARCÍA BARBANCHO, A.: Estadística elemental moderna. Ariel Economía, 1992.
RUEDA GARCÍA, M.M.: Técnicas de muestreo en páginas web. Plácido Cuadros, 2003.
SÁNCHEZ-CRESPO RODRÍGUEZ, J.: Curso intensivo de muestreo en poblaciones finitas. I.N.E.,
1984.
VARIOS: Introducción a la estadística. UNED, 1998.
24
tema 58
matemáticas
RESUMEN
Población y muestra.
Condiciones de representatividad de una muestra.
Tipos de muestreo.
Tamaño de una muestra.
1.
1 Población y muestra
Se denomina población a todo conjunto de elementos que tienen unas características co-
munes. Debido al hecho de que no siempre es posible analizar todos los elementos de una
población, se selecciona un subconjunto de ésta que se denomina muestra. La operación
de seleccionar una muestra se llama muestreo.
2.
2 Condiciones de representatividad de una muestra
Para poder obtener conclusiones razonables a partir de una muestra debemos prescindir de
las muestras seleccionadas según opiniones o criterios personales y cuantificar los errores
de muestreo. Es decir, una muestra debe ser representativa de la población. Esto depende
de dos aspectos fundamentales: de su tamaño y de cómo se realiza el muestreo.
3.
3 Tipos de muestreo
25
tema 58
matemáticas
4.
4 Tamaño de una muestra
Antes de realizar el muestreo hemos de fijar el tamaño de la muestra con el fin de que los
gastos económicos para su realización estén dentro de nuestro presupuesto, que el tiem-
po que necesitemos para realizar el muestreo sea corto y que los resultados sean fiables.
Determinado un error y un nivel de confianza 1- α podemos calcular el tamaño de una
muestra.
26