You are on page 1of 28

Estadística Inferencial

MUESTREO ALEATORIO

DR. CARLOS WONG LAU


INTRODUCCION
En este capitulo se define lo que es universo y
muestra. Los tipos de muestra probabilística y no
probabilística. Tamaño de la muestra y error
muestral. El capitulo termina con dos ejemplos de
obtención de muestra aplicando tanto la formula
como las tablas.
Universo
Es el conjunto de individuos de los que se desea
conocer algo en una investigación; es la totalidad
de individuos o elementos en los cuales pueden
presentarse determinada característica susceptible
de ser estudiada. El universo o población puede
estar constituida por personas, animales, registros
médicos, los nacimientos, las muestras de
laboratorio, los accidentes viales entre otros. El
universo es el grupo de elementos al que se
generalizarán los hallazgos.
Muestra

 definir en forma concreta y específica cuál


es el universo a estudiar, debe hacerse una
delimitación cuidadosa de la población en
función del problema, objetivos, hipótesis,
variables y tipos de estudio, definiendo
cuáles serán las unidades de observación y
las unidades de muestreo.
Muestra

 Es un subconjunto o parte del universo o población


en que se llevarán a cabo la investigación con el
fin posterior de generalizar los hallazgos del todo.
 Muestra probabilística, es aquella extraída de una
población de tal manera que todo miembro de esta
última tenga una probabilidad conocida de estar
incluido en la muestra.
 En las muestras se pueden destacar:
1. Permite que el estudio se realice en menor tiempo
2. Se incurre en menos gastos
3. Posibilita profundizar en el análisis de variables
4. Permite tener mayor control de las variables a
estudiar
Muestra y Muestreo
 Cualquier subconjunto de elementos de una población es una
muestra de ella.
 De cada población puede extraerse un número indefinido de
muestras
 Cuando se utiliza la muestra se pretende conocer las
características de la población.
 La muestra a estudiar, por lo tanto, debe ser representativa de
la población, pues este es requisito fundamental para poder
hacer generalizaciones válidas para la población.
 Muestra representativa es aquella que reúne en sí las
características principales de la población y guarda relación con
la condición particular que se estudia.
 Los aspectos fundamentales que se deben considerar en la
extracción de una muestra representativa son:
1. El sistema de muestreo utilizado
2. El tamaño de la muestra
Muestra y población

• Población: es el conjunto de todos los elementos que poseen una determinada


característica. En general supondremos que la población es muy grande.
• Muestra: es un subconjunto de la población.
• Muestreo: es el proceso mediante el cual se escoge una muestra de la población.
• Inferencia estadística: proceso a través del cual se obtienen conclusiones sobre una
población, a través de la información que proporciona una muestra. La confianza de
tal extrapolación dependerá de la representatividad de la muestra.
· Razones para usar muestras: economía, observación destructiva, etc.

La representatividad de la muestra depende de dos


cosas:
a) Del mecanismo de selección: que ha de
garantizar que no hay un elemento de la
población con más probabilidad que otro de
entrar en la muestra. Si no, sería una muestra
sesgada.

b) Del tamaño de la muestra: si el mecanismo


de selección es correcto, cuanto más grande
sea la muestra mayor será la probabilidad de
que se parezca a la población.
Conceptos, población y muestra

Muestra
Conjunto de elementos
que presentan una
Característica o
condición
Común que es objeto
de estudio
Extracción Parte de los elementos
Muestra o subconjuntos de una
Población que se selecciona
Para el estudio de esa
Característica o condición

Generalización
Población de hallazgos
Tipos de Muestreo
Tipos de Muestreo

Probabilístico No probabilístico

Accidental

Por cuotas
Aleatorio Simple
Intencionado
Sistemático
Conglomerado
Estratificado
Tipos de muestreo

Ejemplo. Tres empresas están investigando el nivel adquisitivo de las


personas que acuden a un determinado concierto de música clásica. Para
ello, cada una elige una muestra de la siguiente manera:

1.- 50 primeras personas que entren en el auditorio.


2.- 50 personas elegidas al azar de las que se ubican en la platea baja.
3.- 50 personas elegidas al azar de todas las asistentes.

Muestreo aleatorio Muestreo no aleatorio

Ventajas y desventajas
Tipos de muestreo aleatorio

Muestreo aleatorio simple: todos los


elementos de la población tienen la
misma probabilidad de ser elegidos
para formar parte de la muestra.

Muestreo aleatorio estratificado: la Estrato 1 Estrato 2


población se divide en grupos
homogéneos que llamamos estratos.
La proporción de cada estrato en la
población se mantiene en la muestra. Población
Cada uno de los estrato de la muestra
se obtiene por muestreo aleatorio
simple sobre el estrato
correspondiente de la población.

Muestra
Tipos de muestreo aleatorio (II)

Muestreo aleatorio sistemático: se


selecciona al azar un elemento de la
población y a partir de él se
seleccionan de k en k los elementos
siguientes.

Muestreo por conglomerados y


áreas: se divide la población en
distintas secciones o conglomerados.
Se eligen al azar unas pocas de estas
secciones y se toman todos los
elementos de las secciones elegidas
para formar la muestra.
Para dividir la población en secciones
podemos usar las provincias.
Tipos de muestreo no aleatorio

Muestras erráticas o casuales

Muestras intencionadas o racionales

Muestras por cuotas

Muestras “bola de nieve”


Tamaño de la muestra y error
muestral
• Cuando una muestra es aleatoria o probabilística es posible
calcular para ella el error muestral. Este error indica el % de
incertidumbre, o riesgo que se corre de que la muestra escogida no
sea representativa. Es decir si trabajamos con un error calculado
en un 5 % significa que existe un 95% de probabilidades de que el
conjunto muestral representa adecuadamente el universo del cual
ha sido extraído.
• Para fijar el tamaño de la muestra adecuada a cada investigación
es preciso primero determinar el % de error que estamos
dispuestos a asumir. Una vez hecho esto deberán realizarse las
operaciones estadísticas correspondientes para poder calcular el
tamaño de la muestra que nos permite situarnos dentro del margen
de error aceptado. Es decir que no se fija primero el número de
unidades de la muestra para luego proceder a determinar el riesgo
que se corre sino a la inversa, se pone un límite a este riesgo y es
en función de eso se define el tamaño de la muestra que nos
garantiza no sobrepásarlo.
Tamaños de Muestras

Considerando % de error Más menos Más menos Más menos Más menos Más menos Más menos

Población 1% 2% 3% 4% 5% 10%
márgenes de error y
Np N1 N2 N3 N4 N5 N10
confiabilidad. 500 - - - - 222 83
Tamaños de muestras 1000 - - 385 286 91

para las poblaciones 1500 - - 638 441 316 94

2000 - - 714 476 333 95


finitas para márgenes
2500 - 1,250 769 500 345 96
de error desde + - 3000 - 1,364 811 520 353 97
10%, + -1%, en la 3500 - 1,458 843 530 359 98

hipótesis de P=50% y 4000 - 1,538 870 541 364 98

4500 - 1,607 891 546 367 98


con una confiabilidad
5000 - 1,667 909 556 370 98
del 95% (óptima). 6000 - 1,765 938 565 375 99

7000 - 1,842 959 574 378 99

8000 - 1,905 976 580 381 99

9000 - 1,957 989 584 383 99

10000 5,000 2,000 1,000 588 385 99

15000 6,000 2,143 1,034 600 390 100

20000 6,667 2,222 1,053 606 392 100

25000 7,143 2,273 1,064 610 394 100

50000 8,333 2,381 1,087 617 397 100

100000 9,091 2,439 1,099 621 398 100

más de
100000 10,000 2,500 1,111 625 400 100
Tamaño de Muestra
• Para determinar el tamaño de la muestra con intervalo de
confianza del 95% y márgenes de error de + o- 1% hasta +o-
10%, se puede utilizar la siguiente fórmula.
• La siguiente fórmula es utilizada en el caso de que el universo o
población en estudio sea inferior a 100,000.
4p q N
n=
E (N-1)+4 pq
Donde :
n=tamaño de la muestra a ser determinado
N=tamaño del universo
p=50%
q=50%
E=2%
Tamaño de Muestra
• Para determinar el tamaño de la muestra con intervalo de
confianza de 95,5% y márgenes de error de +-1%,+-2%,+-3%,+-
4%,+-5% se pueden utilizar las siguientes fórmulas:
Para una población infinita es decir, superior a las 100,000
unidades de observación:
Z p.q
n= =
E
Donde :
n= tamaño de la muestra
Z=desviación estándar (para un intervalo de confianza de 95,55 es
1,96)
p=proporción de la población que posee la característica (cuando
se desconoce esa proporción se asume p=50 )
q=1-p
E= margen de error que se está dispuesto a aceptar
EJEMPLO DE OBTENCION DE MUESTRA
UTILIZANDO FORMULA Y TABLA
• Problema 1.
Se pretende realizar un estudio de las actitudes hacia la experiencia
prematrimonial de los estudiantes de una universidad que cuenta
con una población estudiantil de 10,000 alumnos.
Hallar el tamaño de la muestra, aplicando la formula y con las
tablas, en el supuesto que se desea trabajar a un nivel de confianza
del 95%, con un margen de error permitido del 2 por 100 (2%).

1)la siguiente formula es utilizada en el caso de que el universo o


población en estudio sea Inferior a 100,000.
4p q N
n =
E2 (N-1)+4 pq
Donde :
n=tamaño de la muestra a ser determinado
N=tamaño del universo = 10,000
p=50% q=100-p
q=50% q=100-50=50%
E=2%
Reemplazando los valores en la formula se tiene:

n = 4 x 50 x 50 x 10,000
22 (10,000-1)+ 4x50x50

n = 100’000,000
4(9,999)+ 10,000
n = 100’000,000
39,996 + 10,000
n = 100’000,000
49,996
n = 2,000.16

n = 2,000 aprox.

UTILIZANDO LA TABLA

Se puede comprobar que la intersección de la fila del tamaño


del universo 10,000 con la columna correspondiente al error del
2 por 100 (2%) elegida, da como tamaño al mismo que fue
obtenido con la formula 2,000.
• Problema 2.
Suponiendo que un Programa Académico de Derecho y Ciencias
Políticas tiene 1,000 alumnos, de los cuales 500, se orientan hacia
el derecho y el resto hacia las Ciencia Sociales.
Calcular el tamaño de la muestra para conocer cuantos elementos
debe tener la muestra en una investigación sobre actitudes hacia
el estudio; al nivel de confianza del 95 % y con un error permitido
del 5%.
RESPUESTA:
4p q N
n =
E2 (N-1)+4 pq

n = 285,9185

n = 286 ( que coincide con el valor con el


valor dado en la tabla)
Distribución en el muestreo de la media

Supongamos que en una población una variable aleatoria se distribuye con media μ y
desviación típica σ.
• Al tomar diferentes muestras de igual tamaño en la población y calcular sus medias
y sus desviaciones típicas, obtendremos x–1, x–2, ..., x–n y s1, s2, ... , sn
• Los distintos valores de –xi dan lugar a una variable aleatoria que representamos
– –
por X y se llama media muestral. La distribución de los valores de X se llama
distribución en el muestreo de la media.


La variable aleatoria X tiene las siguientes características:
1. Media : 

2. Desviación típica:
n

3. A medida que n crece, la distribución de X se aproxima a la normal.

Si σ es desconocida, se aproxima con s ·√n / √(n – 1)  Apuntes


Distribución en el muestreo de la media

Se supone que la distribución de la temperatura del cuerpo humano en la


población tiene una media μ = 37º y una desviación típica σ = 0,85º. Se elige
una muestra de 105 personas. Se desea obtener la probabilidad de la media
de la muestra sea menor que 36,9º.

Al ser n = 105, consideramos que la variable aleatoria media muestral es normal.


– 
La variable aleatoria X se distribuye como una N( ) = N (37, 0,083)
n

Por tanto:
– 
– X –37 36,9 –37
p( X  36,9) =p  0,083 0,083  = p( Z – 1,20) = 1– p(Z  1,20) = 1– 0,8849 =
= 0,115

Se debe recordar que para una variable aleatoria continua se tiene que:
p(Z  a) = p(Z < a)
Teorema central del límite: idea intuitiva

• Muchos fenómenos se pueden considerar como suma de efectos parciales


independientes, pudiendo ocurrir que aunque los efectos no se ajusten a la normal, el
fenómeno resultante tienda asintóticamente a la normal.
• Una simulación con ordenador nos puede ayudar a entender esto:

1000 lanzamientos de un dado 1000 medias de dos dados

1000 medias de 4 dados 1000 medias de 10 dados


Teorema central del límite

Ya dijimos que…

Sea X una variable aleatoria de una población de media  y desviación típica ,


entonces se verifica que
1. La variable aleatoria media muestral (con muestras de tamaño n) tiene

media  y desviación típica
n
2. La variable aleatoria media muestral se aproxima a una normal a medida
que crece el tamaño de la muestra n

¿Qué se entiende por "cuando crece n"?

• Si la población de partida es normal, la distribución de las medias


muestrales es normal, cualquiera que sea n.
• Si la distribución de partida no es normal, la distribución de las medias
muestrales es normal si n  30.
Teorema central del límite: visión gráfica

Normal Uniforme Sesgada

Distribución
de la
población de
partida

Distribución
de las medias
muestrales
para n = 5

Distribución
de las medias
muestrales
para n = 10

Distribución
de las medias
muestrales
para n = 30
Distribución en el muestreo de una proporción

• Supongamos que en una población la proporción de elementos con una determinada


característica es p.
^
• En una muestra cualquiera la proporción de individuos con dicha característica será p.
^
• Los distintos valores de p^ dan lugar a una variable aleatoria que representamos por P, y
^
que recibe el nombre de proporción muestral. La distribución de P se llama distribución
en el muestreo de una proporción.

^
La variable aleatoria P tiene las siguientes características:
1. Media : p
p(1 – p)
2. Desviación típica:  n
^
3. A medida que n crece, la distribución de P se aproxima a la normal,
siempre que p no se acerque ni a 0 ni a 1. En cualquier caso, se considera
normal si n ≥ 30.
Distribuciones en el muestreo de una proporción

Un nuevo medicamento ha curado al 85 % de los enfermos a los que se les ha


aplicado. Determinar las distribuciones en el muestreo de la proporción de enfermos
curados para muestras de tamaño 30, 100 y 1000 personas.

En nuestro caso p = 0,85

Tamaño Distribución
Desviación típica:
de la Media: muestral
p(1 – p)
muestra: p  p(1 – p)
n n N(p, )
n

30 0,85 0,85(1 – 0,85) N(0,85; 0,065)


= 0,065
30

100 0,85 0,85(1 – 0,85) N(0,85; 0,036)


= 0,036
100
Conviene observar cómo, a medida que el
1000 0,85 0,85(1 – 0,85) N(0,85; 0,011) tamaño de la muestra crece, la desviación
= 0,011
1000 típica disminuye.

You might also like