You are on page 1of 63

Clculos Muestra y Muestreo

Dr. Cristian Daz Vlez


Mdico Epidemilogo Clnico y Auditor Mdico.
Profesor de la Facultad de Medicina de la Universidad San Martn de Porres-Filial Norte
MUESTRA
En las investigaciones muchas veces es
imprescindible realizar un clculo de tamao de
muestra para saber la precisin o la potencia del
estudio.
Conceptos primarios
Poblacin
Muestra
Parmetro
Estadstico
Varianza poblacional
Inferencia estadstica
Error muestral o Tolerancia de error
Nivel de confianza.
Conceptos primarios
Poblacin: conjunto de individuos o elementos que
cumplen ciertas propiedades comunes.

Muestra: subconjunto representativo de una
poblacin.

Conceptos primarios
Parmetro : Son las medidas o datos que se
obtienen sobre la distribucin de probabilidades de
la poblacin, tales como la media, la varianza, la
proporcin, etc.

Estadstico. Los datos o medidas que se obtienen
sobre una muestra y por lo tanto una estimacin de
los parmetros, es decir es igual al parmetro pero de
la muestra.
Conceptos primarios
Varianza Poblacional. Cuando una poblacin es
ms homognea la varianza es menor. Generalmente
es un valor desconocido y hay que estimarlo a partir
de datos de estudios previos.

Inferencia estadstica. Inferencias acerca de la
poblacin a partir de una muestra extrada de la
poblacin.
Conceptos primarios
Error Muestral o Tolerancia de error: de
estimacin o estndar. Es la diferencia entre un
estadstico y su parmetro correspondiente.
Generalmente 5%, en estudios con frmacos 1%.
La tolerancia debe ir de la mano de la prevalencia
del estudio en cuestin.

Nivel de Confianza. Probabilidad de que la
estimacin efectuada se ajuste a la realidad.
Conceptos primarios
Ejemplo:
Si por ejemplo estudiamos la prevalencia de asma
bronquial en un estudio donde se clculo la muestra
con tolerancia de error del 5% y nivel de significancia
del 95% y se encontr que la prevalencia es de 20%.

Interpretacin: hay un 95% de probabilidad que la
prevalencia real este entre 15 y 25%.
Que ocurre si las prevalencias son muy bajas, por ejemplo 2%??
Factores que influyen
Tipo de diseo.
Tipo de muestreo utilizado.
Comparacin de muestras
independientes o pareadas.


Circulo vicioso del clculo
Clculo muestral
Frecuencia del
Problema en estudio
La frecuencia se
obtendr en el estudio
x
%
r
OR



Muestra para la media de poblacin
El nivel de confianza o seguridad (1-). El nivel de confianza prefijado da lugar
a un coeficiente (Z). Para una seguridad del 95% = 1.96; para una seguridad
del 99% = 2.58.
d : error mximo permisible o Tolerancia de error (mayormente 5%)
S2: varianza poblacional

Poblacin conocida Poblacin no conocida
Las variables son numricas
Muestra para la media de poblacin
es la varianza de la poblacin.

es la varianza de la muestra, la cual podr determinarse en
trminos de probabilidad como

es error estndar que est dado por la diferencia entre () la media
poblacional y la media muestral.

es el error estndar al cuadrado, que nos servir para determinar
, por lo que = es la varianza poblacional.
Variables Nominales
siendo
Muestra para la media de poblacin
Ejemplo:
En un rea sanitaria, la distribucin del peso al nacer de
nios que cumplen su perodo de gestacin de 40 sem. es
aproxim. normal con una media de m=3500 g. y una
DS=430 g.
Un investigador planea llevar a cabo un estudio para
estimar el peso medio al nacer de los nios que llegan al
trmino del embarazo y cuyas madres fumaron durante ese
perodo, asumiendo que la DS es la misma. Si el
investigador desea que el error (precisin) sea de 50 g con
una confianza del 95%, qu tamao de muestra se requiere
en este estudio?

Muestra para la proporcin de poblacin
n: Tamao muestral
N: Tamao de la poblacin, nmero total de historias.
Z: Valor correspondiente a la distribucin de Gauss 1,96 para =0,05
p: Prevalencia del fenmeno en estudio.
Q: 1-p
i o d: Tolerancia de error (mayormente 5%)*.
Si las prevalencias son bajas, las tolerancias de error lo debe ser aun ms. Ejemplo de la tasa
de prevalencia, se puede suponer que la proporcin que ha de estimarse se mover
probablemente entre un 5% y un 15%, y es razonable aspirar a que no se incurra en un error
mayor del 1%.
Poblacin conocida Poblacin no conocida
Las variables son nominales
Muestra para la proporcin de poblacin
Si la seguridad Z fuese del 90% el coeficiente sera 1.645
Si la seguridad Z fuese del 95% el coeficiente sera 1.96
Si la seguridad Z fuese del 97.5% el coeficiente sera 2.24
Si la seguridad Z fuese del 99% el coeficiente sera 2.576

Muestra para la proporcin de poblacin
En estudio se quiere identificar las frecuencia de
retencin de restos placentarios como parte de la
morbilidad materna extrema durante el embarazo,
parto y puerperio en los hospitales MINSA-
Lambayeque, en el periodo 1enero 2010-
31diciembre 2011. Si se desea trabajar con una
precisin del 3%, nivel de confianza del 95%, y se
sabe que segn estudios previos la proporcin de
restos placentarios es 15%.
Calcule la muestra necesaria para el estudio.


Clculo del tamao muestra en estudios de casos y
controles
p2: probabilidad de exposicin entre los controles
W: es el OR previsto
P1: la frecuencia de exposicin entre los casos,

As, el problema del clculo del tamao muestral podr abordarse mediante
las frmulas habituales empleadas en la comparacin de dos proporciones,
asumiendo aqu que las proporciones esperadas son p1 y p2

Clculo del tamao muestra en estudios de casos y
controles
p1: La frecuencia de la exposicin entre los casos.
p2: La frecuencia de la exposicin entre los controles.
: La seguridad con la que se desea trabajar, o riesgo de cometer un error de
tipo I. Generalmente se trabaja con una seguridad del 95% ( = 0,05).
1-: El poder estadstico que se quiere para el estudio, o riesgo de cometer un
error de tipo II. Es habitual tomar = 0,2, es decir, un poder del 80%.

Clculo del tamao muestra en estudios de
casos y controles
son valores que se obtienen de la distribucin normal estndar en funcin de
la seguridad y el poder elegidos para el estudio. En particular, para una
seguridad de un 95% y un poder estadstico del 80% se tiene que.

Donde:
Clculo del tamao muestra en estudios de casos y
controles
n = nmero de sujetos sin prdidas
R = proporcin esperada de prdidas

Clculo del tamao muestra en estudios de
casos y controles
Ejemplo: Un estudio de casos y controles
emparejado sobre tabaquismo y cncer de laringe
utilizando controles poblacionales.
Suponiendo que la prevalencia del hbito
tabquico en la poblacin es del 45% y que el OR
esperado es aproximadamente es 3
cuntos pares de casos y controles necesitar para
estimar el OR con una potencia de 80% y un nivel
de confianza del 95%?


Clculo del tamao muestra en estudios de
Cohortes
n : sujetos necesarios en cada una de las muestras
Z : Valor Z correspondiente al riesgo deseado
Z : Valor Z correspondiente al riesgo deseado
S2 : Varianza de la variable cuantitativa que tiene el grupo control o de
referencia.
d : Valor mnimo de la diferencia que se desea detectar (datos cuantitativos).

Clculo del tamao muestra en estudios de
Cohortes
Un epidemilogo proyecta un estudio sobre la posibilidad
de que cierta enfermedad pulmonar est favorecida por la
exposicin a un contaminante atmosfrico recin detectado
cuyo efecto no ha sido examinado previamente.
Qu tamao tendr que tener la muestra de cada grupo (el
de expuestos y el de no expuestos) si se desea estimar el
riesgo relativo con una potencia 80% y un 95% de
confianza?
La enfermedad se manifiesta en el 20% de las personas no
expuestas y 30% en las expuestas al contaminante
atmosfrico y los dos grupos sern de igual tamao.


Tamao muestra del coeficiente correlacin
lineal
Siendo el error estndar de z aproximadamente igual a

r: magnitud de la correlacin que se desea detectar. Esto se obtiene de
estudios anteriores entre las dos variables a estudio.
1: la seguridad con la que se desea trabajar o riesgo de cometer un error
de tipo I. Generalmente se trabaja con una seguridad del 95% ( = 0,05 ).
1: el poder estadstico que se quiere para el estudio, o riesgo de cometer
un error de tipo II. Es habitual tomar = 0,2 o, equivalentemente, un poder
estadstico del 80%.

A. Planteamiento bilateral B. Planteamiento Unilateral
Tamao muestra del coeficiente correlacin lineal
Tamao muestra del coeficiente correlacin
lineal
se obtienen de la distribucin normal estndar en funcin de la seguridad
y el poder elegidos para el estudio. En particular, para una seguridad del
95% y un poder estadstico del 80% se tiene que

A
B
Tamao muestra del coeficiente correlacin
lineal
Supngase que la correlacin entre el volumen
espiratorio forzado en un segundo y la capacidad
vital forzada en individuos sanos es
aproximadamente de 0,60.
Supngase, adicionalmente, que un grupo de
pacientes con una enfermedad de pulmn est
accesible en una clnica, e interesa contrastar si hay
correlacin entre ambas medidas en esos
pacientes. Con un nivel de confianza del 95% y una
potencia del 90%, cuntos sujetos se necesitan en
la muestra?


Ensayos Clnicos
La formula depender del tipo de medida que se este
calculando en el ensayo clnico.
Ejemplo: un ensayo clnico sobre el uso de una droga en
embarazos gemelares, un gineco-obstetra desea demostrar
que hay un aumento significativo en la duracin del
embarazo al usar la droga frente a un placebo.
El toclogo estima que la media de la duracin de los
embarazos es de 1,75 semanas. Cuntos embarazos debe
observar como mnimo en cada grupo si considera que una
semana es un aumento clnicamente importante en la
duracin del embarazo y quiere trabajar con una confianza
del 95% y una potencia del 80%?


MUESTREO
(Escoger la muestra)
Tipo de Muestreo
Muestreo aleatorio simple
Es aquel en que cada elemento de la poblacin tiene
la misma probabilidad de ser seleccionado para
integrar la muestra.
Existen dos formas de extraer una muestra de una
poblacin: con reposicin y sin reposicin.
Muestreo aleatorio simple
Muestreo con reemplazo: un elemento puede
ser seleccionado ms de una vez en la muestra para
ello se extrae un elemento de la poblacin se
observa y se devuelve a la poblacin, por lo que de
esta forma se pueden hacer infinitas extracciones
de la poblacin aun siendo esta finita.
Muestreo sin reemplazo: No se devuelve los
elementos extrados a la poblacin hasta que no se
hallan extrados todos los elementos de la
poblacin que conforman la muestra.
Muestreo aleatorio simple
Ejemplo:
Supngase que se quiere obtener una MAS de 120
descansos mdicos de un registro de 973 emitidos
durante el mes de diciembre del 2009.



Muestreo sistemtico en fases
Tambin otorga igual probabilidad de integrar la
muestra a todas las unidades de anlisis de la
poblacin.
Se usa para los casos en los que no se cuenta con una
base de datos con el caso del muestreo aleatorio
simple.
Para su calculo se debe saber el tamao de la
poblacin y que porcentaje es la muestra de la
poblacin.
Muestreo sistemtico en fases
Ejemplo:
Supngase que se quiere obtener una muestra
sistemtica que contenga aproximadamente al 12%
de los estudiantes de un centro universitario que
tiene 966 alumnos registrados.

Muestreo aleatorio estratificado
Un muestreo aleatorio estratificado es aquel en el
que se divide la poblacin de N individuos, en k sub-
poblaciones o estratos, atendiendo a criterios que
puedan ser importantes en el estudio, de tamaos
respectivos.
N1, . . . , Nk,

Muestreo aleatorio estratificado
Ejemplo:
Supngase que se quiere obtener una muestra de
120 estudiantes de un centro universitario que
tiene 966 alumnos registrados, distribuidos en
cuatro reas acadmicas con los siguientes
tamaos:
Ingeniera: 264
Ciencias econmicas: 284
Ciencias salud: 182
Letras: 236
Muestreo por conglomerados monoetpico
No se pueda disponer de un listado total de las
unidades de anlisis, solo se sabe de cuantas estn
conformadas cada unidades de anlisis y/o
Dispersin geogrfica de las unidades de anlisis a lo
largo del territorio en que se halla ubicada la
poblacin.
Muestreo por conglomerados monoetpico
Cuando solo se tienen identificados los
conglomerados y sus tamaos; en este caso se debe
conformar un archivo con tantos registros como
conglomerados, con un campo que identifique el
conglomerado y otro campo que contenga su tamao
(nmero de unidades de que consta).
Muestreo por conglomerados monoetpico
Ejemplo:
Supngase que se quiere obtener una muestra de
aproximadamente 120 estudiantes de un centro
universitario que tiene 966 alumnos registrados y
que los alumnos estn distribuidos en 52 grupos de
tamaos variables y conocidos.
Muestreo por conglomerados bietpico
Este procedimiento de seleccin muestral se utiliza
cuando hay gran variabilidad entre los tamaos de
los conglomerados.
Se usa para escoger ms conglomerados, claro esta
mantenindose la misma cantidad de la muestra.
Muestreo por conglomerados bietpico
Ejemplo:
Supngase que se quiere obtener una muestra de
120 estudiantes de un centro universitario que
tiene 966 alumnos registrados. Supngase adems
que los alumnos estn distribuidos en 52 grupos de
tamaos variables y conocidos y que se ha decidido
seleccionar 12 de esos grupos, o equivalentemente,
10 alumnos por grupo.
Muestreo por conclomerados bietpico
estratificado
Este procedimiento de seleccin muestral se utiliza
cuando se quiere aplicar un muestreo bietpico pero
habiendo separado antes las Unidades de Primera
Etapa segn estratos.
Se trata de un mtodo cuyo uso est muy extendido
en la prctica.
Muestreo por conclomerados bietpico
estratificado
Ejemplo:
Supngase que se quiere obtener una muestra de
120 estudiantes de un centro universitario que
tiene 966 alumnos registrados. Supngase
adems que hay cuatro reas acadmicas y que
en cada una existe cierto nmero de grupos de
alumnos (14, 14, 11 y 13 grupos respectivamente)
de modo que los alumnos estn distribuidos en
52 grupos de tamaos variables y conocidos.
Considrese, finalmente, que se ha decidido
seleccionar 12 de esos grupos y 10 alumnos por
grupo.

You might also like