You are on page 1of 15

DETERMINACIÓN DEL TAMAÑO MUESTRAL

Notas

Índice

1. INTRODUCCIÓN 1
2. TAMAÑO MUESTRAL EN ESTUDIOS PARA DETERMINAR PARÁMETROS 2
2.1. Tamaño muestral para estimar una proporción 2
2.2. Tamaño muestral para estimar una media 3
3. TAMAÑO MUESTRAL EN ESTUDIOS PARA CONTRASTE DE HIPÓTESIS 4
3.1. Tamaño muestral para comparación de dos proporciones 4
3.2. Tamaño muestral en estudios en que se compararán dos proporciones por la prueba de Fisher-Irwin de
probabilidades exactas 4
3.3. Tamaño muestral para la comparación de dos medias 5
4. TAMAÑO MUESTRAL EN ESTUDIOS BIOMÉDICOS 7
4.1 Cálculo del tamaño muestral en estudios de casos y controles 7
4.2. Tamaño muestral en estudios en que se indagará sobre una prevalencia 10
4.3. Tamaño muestral en estudios en que se investigará una prueba diagnóstica 11
4.4. Tamaño muestral en estudios de cohortes 13
4.5. Tamaño muestral en estudios de concordancia 13
5. BIBLIOGRAFÍA 15

1. Introducción
Todo estudio epidemiológico lleva implícito en la fase de diseño la determinación del tamaño muestral
necesario para la ejecución del mismo. El no realizar dicho proceso, puede conducir a dos situaciones
diferentes: primera que se realice el estudio sin el número adecuado de pacientes, con lo cual no se podrá
ser precisos al estimar los parámetros y además no se encontraran diferencias significativas cuando en
realidad sí existen. La segunda es que se podría estudiar un número innecesario de pacientes, lo cual lleva
implícito no solo la pérdida de tiempo y de recursos innecesarios sino que además la calidad del estudio, a
causa de dicho exceso, puede verse afectada en sentido negativo.
Para determinar el tamaño muestral de un estudio, deben considerar diferentes situaciones:
(a) Estudios para determinar parámetros, es decir, cuando se pretende hacer inferencias de valores
poblacionales (proporciones, medias…) a partir de una muestra (figura 1);
(b) Estudios para contraste de hipótesis, es decir, cuando se pretende comparar si proporciones o las
medias de las muestras son diferentes.

1
Población
p < 0,0…

Seguridad Muestra

Observación
Estimación (experimento,
medición)

Intervalo de
Confianza
Resultados

Figura 1. Elementos de la Inferencia Estadística

2. Tamaño muestral en estudios para determinar parámetros


Con estos estudios se pretende hacer inferencias de valores poblacionales (proporciones, medias) a partir
de una muestra.

2.1. Tamaño muestral para estimar una proporción


Si se desea estimar una proporción, debe conocerse:
(a) El nivel de confianza o seguridad (1− α ) . El nivel de confianza prefijado da lugar a un coeficiente

( z ) . Para un nivel de seguridad del 95 % α =1,96 , para un nivel de seguridad del 99 % α = 2,58 ;
α

(b) La precisión que se desea para el estudio;


(c) Una idea del valor aproximado del parámetro que se quiere medir (en este caso, una proporción). Esta
idea se puede obtener revisando la literatura o mediante estudio pilotos previos. En caso de no tener
dicha información se utilizará el valor p = 0,5 (50 %).
Por ejemplo, ¿a cuántas personas tendría que estudiarse para conocer la prevalencia de diabetes?
Seguridad = 95 %;
Precisión = 3 %;
Proporción esperada = asumiendo que puede ser próxima al 5 %; si no se tuviese ninguna idea de dicha
proporción se utilizaría el valor p = 0,5 (50 %) que maximiza el tamaño muestral:

z 2α × p × q
n =
d2
donde: z α = 1,96 = 3,84 ya que la seguridad buscada es del 95 %;
2 2

p es la proporción esperada (en este caso 5 % ó 0,05);


q =1 − p (en este caso 1 – 0,05 = 0,95);
d es la precisión deseada (en este caso un 3 %):
1,962 × 0, 05 × 0,95
n = = 203
0, 032

2
Si la población es finita, es decir se conoce el total de la población y se desea saber cuántos individuos hay
que estudiar, la respuesta sería:
N × z 2α × p × q
n =
d 2 × ( N − 1) + z 2α × p × q
donde: N es el total de la población;

2
z 2α es 1,96 si la seguridad deseada es del 95 %;

p es la proporción esperada (en este caso 5 % ó 0,05);

q =1 − p (en este caso 1 − 0, 05 = 0,95 );

d es la precisión (en este caso se desea un 3 %).

¿A cuántas personas de una población de 15.000 habitantes tendría que estudiarse para conocer la
prevalencia de diabetes?
Seguridad = 95 %;
Precisión = 3 %;
Proporción esperada = asumiendo que puede ser próxima al 5 %; si no se tuviese ninguna idea de dicha
proporción se utilizaría el valor p = 0,5 (50 %) que maximiza el tamaño muestral:

15000 ×1,962 × 0, 05 × 0,95


n = = 200
0, 032 × (15000 − 1) + 1,962 × 0, 05 × 0,95

El coeficiente de z α varía según diferentes niveles de seguridad, así:

• Si la seguridad z α fuese del 90 % el coeficiente sería 1,645;

• Si la seguridad Zα del 95 % el coeficiente sería 1,96;


• Si la seguridad z α fuese del 97,5 % el coeficiente sería 2,24;

• Si la seguridad z α fuese del 99 % el coeficiente sería 2,576.

2.2. Tamaño muestral para estimar una media


Si se desea estimar una media habrá que conocer:
(a) El nivel de confianza o seguridad (1− α ) . El nivel de confianza prefijado da lugar a un coeficiente

( z ) . Para un nivel de seguridad del 95 %, α =1,96 , para un nivel de seguridad del 99 % α = 2,58 ;
α

(b) La precisión con que se desea estimar el parámetro ( 2 × d es la amplitud del intervalo de confianza);
2
(c) Una idea de la varianza s de la distribución de la variable cuantitativa que se supone existe en la
población
z 2α s 2
n =
d2
Por ejemplo, si se desea conocer la media de la glucemia basal de una población, con una seguridad del 95
% y una precisión de ± 3 mg/dl y se tiene información a través un estudio piloto o de una revisión
bibliográfica que la varianza es de 250 mg/dl:
1,962 × 250
n = = 106, 7
32

3
Si la población es finita, como previamente se señaló, es decir se conoce el total de la población y se
desearía saber cuántos individuos debería estudiarse, la respuesta sería:
N z 2α s 2
n =
d 2 ( N − 1) + z 2α s 2

3. Tamaño muestral en estudios para contraste de hipótesis


Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes.
Habitualmente, el investigador pretende comparar dos tratamientos. Para el cálculo del tamaño muestral se
precisa conocer:
(a) Magnitud de la diferencia a detectar que tenga interés clínicamente relevante. Se pueden comparar dos
proporciones o dos medias;
(b) Tener una idea aproximada de los parámetros de la variable que se estudia (a través de la bibliografía o
de estudios previos);
(c) Seguridad del estudio (riesgo de cometer un error α );
(d) Potencia estadística (1 −β ) (riesgo de cometer un error β );
(e) Definición de si la hipótesis va a ser unilateral o bilateral:
• Bilateral: cualquiera de los dos parámetros a comparar (medias o proporciones) puede ser mayor o
menor que el otro. No se establece ninguna dirección;
• Unilateral: cuando se considera que uno de los parámetros debe ser mayor que el otro, indicando
por tanto una dirección de las diferencias.
La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de cometer un error de tipo I
(rechazar la H 0 cuando en realidad es verdadera).

3.1. Tamaño muestral para comparación de dos proporciones


2
 z 2 p (1 − p ) + z p (1 − p ) + p (1 − p ) 
n =  
α β 1 1 2 2

 p1 − p 2 
 
donde: n es el número de sujetos necesarios en cada una de las muestras;
z α es el valor z correspondiente al riesgo α ;
z β es el valor z correspondiente al riesgo β ;
p1 es el valor de la proporción en el grupo de referencia, placebo, control o tratamiento habitual;
p 2 es el valor de la proporción en el grupo del nuevo tratamiento, intervención o técnica;
p es la media de las dos proporciones p1 y p 2 :

Los valores z α según la seguridad y z β según la potencia del test se indican en la tabla I.

3.2. Tamaño muestral en estudios en que se compararán dos proporciones por la prueba
de Fisher-Irwin de probabilidades exactas
En ocasiones, se puede presumir que en la investigación se incluirá una muestra pequeña y se compararán
dos grupos por la mencionada prueba de hipótesis.

4
Se dispone de tablas que proporcionan el tamaño muestral por grupo requerido para satisfacer los errores
alfa y beta planteados frente a la comparación de dos proporciones. A modo de ejemplo, véase los datos
que se proporcionan en la tabla II.
El cálculo del tamaño muestral para estudiar la diferencia entre dos proporciones en una tabla de 2 x 2, con
hipótesis unilateral, incluye las dos proporciones y los errores α y β . Debe contemplarse una proporción
p1 como "control" o valor "patrón" y la otra p 2 como "experimental". En tales condiciones:
2
 zα + zβ 
n = 1, 64 × 1, 6 ×  
 arcsin
 ( )
p1 − arcsin ( p2 ) 

donde: z α es 1,64 si α es 0,05 para una prueba unilateral y 1,96 si es bilateral;

zβ es 0,84 si β es 0,20, tanto para una prueba unilateral como bilateral;

arcsin ( p1 ) es el “arco seno” (corresponde "al ángulo cuyo seno es el valor dado"1) de la raíz
cuadrada de la primera proporción;

arcsin ( p2 ) es el “arco seno” (corresponde "al ángulo cuyo seno es el valor dado") de la raíz
cuadrada de la segunda proporción;

p2 p1
0,80 0,70 0,60 0,50 0,40 0,30 0,20
0,60 73
0,50 36 84
0,40 23 41 85
0,30 15 23 42 84
0,20 10 15 23 36 73
0,10 8 10 13 19 30 56 67
0,05 6 9 11 14 20 34
Tabla I. Tamaño muestral necesario por grupo, según proporciones que se comparan p 1 y p 2 , para
hipótesis unilateral, dado error α de 0,05 y β de 0,20.

La prueba de hipótesis que se supone se empleará con los resultados del estudio es ji cuadrado.

3.3. Tamaño muestral para la comparación de dos medias

2 ( z α + z β ) s2
2

n =
d2
donde: n son los individuos necesarios en cada una de las muestras;
zα es el valor z correspondiente al riesgo deseado;

zβ es el valor z correspondiente al riesgo deseado;

s2 es la varianza de la variable cuantitativa que tiene el grupo control o de referencia;


d es el valor mínimo de la diferencia que se desea detectar (datos cuantitativos).

1
En una calculadora “ arcsin ” sería “ sin ” elevado a –1.

5
Los valores z α según el nivel de seguridad y z β según la potencia se indican en la tabla II:


α test unilateral test bilateral
0,200 0,842 1,282
0,150 1,036 1,440
0,100 1,282 1,645
0,050 1,645 1,960
0,025 1,960 2,240
0,010 2,326 2,576
potencia
β (1-β) Zβ
0,01 0,99 2,326
0,05 0,95 1,645
0,10 0,90 1,282
0,15 0,85 1,036
0,20 0,80 0,842
0,25 0,75 0,674
0,30 0,70 0,524
0,35 0,65 0,385
0,40 0,60 0,253
0,45 0,55 0,126
0,50 0,50 0,000
Tabla II. Valores de z α y z β más frecuentemente utilizados.

Ejemplo de comparación de dos medias


Se desea utilizar un nuevo fármaco antidiabético y se considera que sería clínicamente eficaz si lograse un
descenso de 15 mg/dl respecto al tratamiento habitual con el antidiabético estándar. Por estudios previos
sabemos que la desviación típica de la glucemia en pacientes que reciben el tratamiento habitual es de 16
mg/dl. Se acepta un riesgo de 0,05 y se desea una potencia estadística del 90 % para detectar diferencias,
si es que existen:

2 ( z α + z β ) s2
2

n =
d2
2 (1, 645 + 1, 282 ) 162
2

n = = 19, 49
152
se precisan, pues, 20 pacientes en cada grupo.

Ejemplo de comparación de dos proporciones

Se desea evaluar si el tratamiento T 2 es mejor que el tratamiento T1 para el alivio del dolor para lo que se
diseña un ensayo clínico. Se sabe por datos previos que la eficacia del fármaco habitual está alrededor del
70 % y se considera clínicamente relevante si el nuevo fármaco alivia el dolor en un 90 %. El nivel de riesgo
se fija en 0,05 y se desea una potencia estadística de un 80 %.

6
2
 z 2 p (1 − p ) + z p (1 − p ) + p (1 − p ) 
n =  
α β 1 1 2 2

 p1 − p 2 
 
0, 7 + 0,9
p = = 0,8
2
2
 1, 645 2 × 0,8 × (1 − 0,8 ) + 0,842 0, 7 × (1 − 0, 7 ) + 0,9 × (1 − 0,9 ) 
 
 0, 7 − 0,9 
 
n = 48 pacientes
El tamaño muestral ajustado a las pérdidas
En todos los estudios es preciso estimar las posibles pérdidas de pacientes por razones diversas (pérdida
de información, abandono, no respuesta…) por lo que se debe incrementar el tamaño muestral respecto a
dichas pérdidas. El tamaño muestral ajustado a las pérdidas se puede calcular:
 1 
muestra ajustada a las pérdidas = n  
 1− R 
donde: n es el número de individuos sin pérdidas;
R es la proporción esperada de pérdidas.
Así por ejemplo, si en el estudio anterior se espera tener un 15 % de pérdidas, el tamaño muestral
necesario sería:
 1 
48   = 56
 1 − 0,15 
pacientes en cada grupo.

4. Tamaño muestral en estudios biomédicos

4.1 Cálculo del tamaño muestral en estudios de casos y controles


Supóngase que se quiere llevar a cabo un estudio de casos y controles con el fin de determinar si existe
una relación significativa entre la exposición a un factor y la presencia de una determinada enfermedad. A
continuación se explica cómo calcular el tamaño de muestra necesario para contrastar la hipótesis de que el
odds ratio (OR) sea igual a 1.
Si se conoce la probabilidad de exposición entre los controles p 2 , y se prevé que el OR asociado al factor
de estudio es w , el valor de p 1 , la frecuencia de exposición entre los casos, puede obtenerse fácilmente:

p1 (1 − p 2 )
OR = w = ⇒
p 2 (1 − p1 )
w p 2 (1 − p1 ) = p1 (1 − p 2 ) ⇒
p1 (1 − p 2 + w p 2 ) = w p 2 ⇒
w p2
p1 =
(1− p ) + w p
2 2

donde: p1 y p2 son las proporciones esperadas;


w valor aproximado del OR que se desea estimar.

7
Así, el problema del cálculo del tamaño muestral podrá abordarse mediante las fórmulas habituales
empleadas en la comparación de dos proporciones.
Recurriendo a las fórmulas habituales para determinar el tamaño muestral mínimo necesario para la
comparación de dos proporciones, se precisará conocer:
(a) La magnitud de la diferencia a detectar, que tenga interés clínicamente relevante. En este caso, como
ya se vio, bastaría con conocer dos de los siguientes tres parámetros:
• Una idea del valor aproximado del OR que se desea estimar ( w ) ;

• La frecuencia de la exposición entre los casos (p ); 1

• La frecuencia de la exposición entre los controles ( p ) . 2

(b) El nivel de seguridad α o riesgo de cometer un error de tipo I, con que se desea trabajar.
Generalmente con un nivel de seguridad del 95 %, α = 0,05 .

(c) La potencia estadística o riesgo de cometer un error de tipo II (1−β ) que se desea para el estudio,. Es
habitual tomar β = 0, 2 , es decir, una potencia del 80 %.
Con estos datos, y para un planteamiento bilateral, para el cálculo del tamaño muestral se utilizará la
expresión:
2
 z α 2 p (1− p ) + z p1 (1− p1 ) + p 2 (1− p 2 ) 
n =  
1− 2 1−β
[ecuación 1]
 p1 − p 2 
 
p1 + p2
donde: p = ;
2
w es una idea del valor aproximado del OR que se desea estimar;
p1 es la frecuencia de la exposición entre los casos;

p2 es la frecuencia de la exposición entre los controles; y

z 1− α 2 y z 1−β son valores que se obtienen de la distribución normal estándar en función de la


seguridad y la potencia seleccionadas para el estudio. En particular, para un nivel
de seguridad de un 95 % y una potencia estadística del 80 % se tiene que
z 1− α =1,96 y z 1−β = 0,84 .
2

Hasta ahora se ha asumido un tamaño muestral igual para casos y controles. En caso de que el número de
casos y controles no esté equilibrado, la expresión anterior deberá ser ligeramente modificada:

( )
2
z 1− α 2 ( c +1) p (1− p ) + z 1−β c p1 (1 − p1 ) + p 2 (1− p 2 )
n = [ecuación 2]
c ( p1 − p 2 )
2

donde: n es el número de casos;


m es el número de controles; y

c=m es el número de controles por cada caso.


n
Así, el número de controles vendría dado por m = c × n .
Debe precisarse que se ha tratado en el presente trabajo de exponer del modo lo más sencillo posible el
procedimiento a seguir en el cálculo del tamaño de la muestra en un estudio de casos y controles. No
obstante, en ocasiones se utilizan para este cálculo expresiones más complejas basadas en una corrección
de la fórmula del cálculo del tamaño muestral para la comparación de dos proporciones. Así mismo, existen
fórmulas específicas para el cálculo del tamaño de la muestra en el caso de que el diseño corresponda a un
estudio de casos y controles apareados.

8
Ejemplo del cálculo del tamaño muestral en un estudio de casos y controles
Como ejemplo, supóngase que se desea estudiar la existencia de una asociación entre el consumo de
tabaco y el hecho de sufrir un infarto de miocardio. Para poner en evidencia dicha asociación y cuantificar
su magnitud, se diseña un estudio de casos y controles en el que se investigará el consumo de tabaco de
una serie de pacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos
(controles). Se cree que alrededor de un 40 % de los controles son fumadores y se considera como
diferencia importante entre ambos grupos un OR de 4. Con estos datos, se puede calcular el tamaño de
muestra necesario en cada grupo para detectar un OR de 4 como significativamente diferente de 1 con una
seguridad del 95 % y una potencia del 80 %. De acuerdo con lo expuesto anteriormente, y conociendo los
siguientes parámetros:
(a) Frecuencia de exposición entre los controles: 40 %;
(b) OR previsto: 4;
(c) Nivel de seguridad: 95 %;
(d) Potencia estadística: 80 %.
La frecuencia de exposición entre los casos vendrá dada por:
w p2
p1 = =
(1− p ) + w p
2 2

4 × 0, 40
= =
(1− 0, 40 ) + 4 × 0, 40
1,6
= = 0,73
0,60 + 1,6
Esto es, se estima que aproximadamente un 73 % de los casos son fumadores.
Aplicando la ecuación 1, se obtiene:
2
 1,96 2 × 0,565× (1− 0,565 ) + 0,84 0,73× (1− 0,73) + 0, 4 × (1− 0, 4 ) 
n =   ≈ 35
 0,73 − 0, 4 
 
Es decir, se necesitaría estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35
controles) para detectar como significativo un valor del OR de 4.
Si se reduce el tamaño del efecto a detectar, asumiendo que el OR es aproximadamente igual a 3, se
obtiene:
w p2
p1 = =
(1− p ) + w p
2 2

3 × 0, 40
= = 0,67
(1− 0, 40 ) + 3× 0, 40
y, de acuerdo con la ecuación 1, serían necesarios n = 54 pacientes por grupo para llevar a cabo el estudio.
En algunos estudios, el investigador reúne un número mayor de controles que de casos con el objeto de
incrementar la potencia estadística. Supóngase que en este ejemplo se planea obtener dos controles por
caso, y se asume que el OR a detectar es aproximadamente igual a 3. Aplicando la ecuación 2:

( )
2
z 1− α 2 ( c +1) p (1− p ) + z 1−β c p1 (1 − p 1 ) + p 2 (1− p 2 )
n =
c ( p1 − p 2 )
2

(1,96 )
2
( 2 +1) × 0,565× (1− 0,565) + 0,84 2 × 0,73× (1− p1 ) + 0, 4 × (1− 0, 4 )
n = ≈ 40
2 ( 0,73 − 0, 4 )
2

9
Por tanto, se necesitará un grupo de n = 40 casos (pacientes con infarto de miocardio) y m = 2 × 40 = 80
controles para llevar a cabo la investigación.
El cálculo del tamaño muestral en los estudios de casos y controles debe formar parte del diseño
metodológico, ya que la ejecución de este tipo de estudios es costosa. El iniciar un estudio sin conocer la
potencia estadística y la seguridad para detectar diferencias, si es que existen, podría ser motivo de incurrir
en un error de tipo II en el sentido de no detectar diferencias cuando realmente las hay.

casos controles
expuestos a b a+b
no expuestos c d c+d
a+c b+d n
Tabla III. Disposición de los sujetos incluidos en un estudio de casos y controles. Tabla de 2 x 2.

4.2. Tamaño muestral en estudios en que se indagará sobre una prevalencia


En estos se requiere conocer el tamaño de la población, la precisión deseada (%), la prevalencia esperada,
el efecto del diseño y el error α .
En este caso se debe tener una idea aproximada de la prevalencia que se está investigando, a continuación
se debe establecer cuánto se aceptaría que varíe (precisión), seguidamente el nivel de confianza deseado
para la indagación y, finalmente, el efecto de diseño de la investigación. Este es igual a 1 (no hay efecto de
diseño) si se ha empleado un procedimiento de muestreo aleatorio simple o bien sistemático y corresponde
a un error sistemático.
La fórmula:
N z 12−α p (1 − p )
n =
d 2 ( N − 1) + z 12−α p (1 − p )
donde: n es el tamaño de la muestra;
N es la población total;
z 1−α es el valor de z para el nivel de confianza (1− α ) ;
p es la proporción esperada en la población; y
d es la precisión absoluta.
El tamaño de la muestra es, en definitiva, igual a n por el efecto de diseño. El tamaño de la población de la
que se extraerá la muestra es habitualmente desconocido, pero no es muy importante tener un
conocimiento exacto, basta con una aproximación razonable.
Por ejemplo, supóngase que se estima una proporción p en la población a estudiar de 7 % y se desea un
tamaño muestral que permita, con una seguridad de 95 % (entonces z = 1,96 ), una variación alrededor de 7
% de hasta 3 %. Ello significa que si la proporción poblacional es de 7 % se espera, con 95 % de confianza,
obtener un valor entre 4–10 %. Para estos requisitos, si la población es de 500.000 personas, la muestra
requerida es de 278 casos, si es de 10.000 personas, 271 casos, si sólo son 5.000 personas 264 y si son
1.000 personas, 218 casos.
Si se desconoce valor de p aún es posible estimar el tamaño muestral: en la fórmula, la expresión
p (1 − p ) tiene un valor creciente a medida que la proporción p se va acercando a 0,50, alcanza su máximo
en ese punto y luego va descendiendo nuevamente. Entonces, cuando p = 0,50 la mencionada expresión
vale 0,25 y con esa cifra se calculará en la fórmula el tamaño muestral, que será el más elevado para las
condiciones establecidas. Ese tamaño de muestra será, entonces, el apropiado.

10
4.3. Tamaño muestral en estudios en que se investigará una prueba diagnóstica
Para estos estudios se requiere conocer: error alfa, error beta, proporción esperada de falsos positivos o la
especificidad, razón de verosimilitud considerada digna de ser detectada, intervalo de confianza deseado
para la sensibilidad y la prevalencia esperada de la patología en estudio. (No se comenta con detalle el
procedimiento de cálculo).
Las razones de verosimilitud (likelihood ratios, LR), índices fijos como sensibilidad y especificidad ofrecen
una relación entre las cuatro celdas (a, b, c, d) de la tabla 2 x 2, en que se estudia una prueba diagnóstica:
Es así como, si se considera un LR+, se verá que tal resultado se obtiene de la razón entre las proporciones
a y b de modo que
(a + c) (b + d )
a
LR + =
(a + c)
b
(b + d )
En esta división, el numerador corresponde a la sensibilidad de la prueba y el denominador a la proporción
de falsos positivos (1-especificidad).
Es posible, entonces, plantear la búsqueda del tamaño muestral a partir de una comparación de dos
proporciones (LR), en prueba unilateral (puesto que se espera que el numerador será mayor que el
denominador, LR+ veces), para lo cual se requeriría estimar los falsos positivos (o la especificidad)
probables en esa prueba y la prevalencia esperada del trastorno en estudio dentro de la muestra. Al mismo
tiempo, se debe elegir un valor de LR+ digno de ser detectado, contemplando el nivel de error alfa y beta
que se considere adecuado. Tal comparación es entre dos proporciones independientes (aunque
intrínsecamente relacionadas) y de tamaño casi siempre diferente, con una proporción de verdaderos
enfermos habitualmente inferior a 50 %.
La estimación de los falsos positivos determina en parte el LR+ elegible, puesto que, si los primeros
constituyen un 5%, es poco probable que interese un LR+ de 3 si se considera que 5 % x 3 indicará la
sensibilidad de la prueba en tal caso, es decir, 15% y esta seguramente no resultaría de mucho interés al
investigador como nivel inicial de detección. Del mismo modo, si la proporción de falsos positivos fuera muy
alta, LR+ puede tener como límite un valor sorprendentemente bajo. Por ejemplo, una cifra de falsos
positivos del 30 % (0,30) tiene un LR+ límite posible de 3,33, ya que una cifra mayor supondría una
sensibilidad de la prueba superior al 100 %. Como sea, es generalmente aceptado que LR+ en el margen
de 2 a 5 suele ser de importancia en el sentido que el cambio de la probabilidad previo a la prueba a aquella
después de la prueba cuando LR+ está en esos valores, sería de una magnitud de consideración.
El poder estimar algunos valores, como la proporción de falsos positivos, requiere algún conocimiento
previo de la situación o efectuar un estudio piloto para obtenerlo.
Aceptando que se cumplen los requisitos para efectuar la correspondiente prueba de hipótesis, de acuerdo
con Fleiss se tendría:
2
N ′  2 ( r + 1) 

N = 1+ 1+
4  N ′ r p 2 − p1 
 

( )
2
zα ( r + 1) p q − z β r p1 q1 + p 2 q 2
donde: N ′ =
r ( p 2 − p1 )
2

N es uno de los tamaños muestrales; y


Nr el otro;
r es la fracción que representa la muestra más pequeña respecto a la mayor;

p1 = a es la sensibilidad de la prueba, y que es igual a p 2 × LR + ;


(a + c)
q1 =1 − p1 ;

11
p2 = b es la proporción de falsos positivos (1-especificidad);
(b + d )
q 2 =1 − p 2 ;
z 1−α para hipótesis unilateral es 1,645 (para un error α de 0,05) ó 2,326 (para α de
0,01);
zβ es –0,842 (para un error β de 0,20), –1,29 (para β 0,10) o –1,645 (para β de
0,05);
p1 + r p 2
p= ;y
r +1
q =1 − p .
Como es de esperar una prevalencia inferior a 50 %, la muestra que corresponde a verdaderos enfermos
según estándar ideal será N r y la de verdaderos no afectados N .
Ahora bien, se puede indicar que para detectar un LR+ de 2,5 o mayor (en hipótesis unilateral), con un error
α de 5 % y β de 10 %, es decir, una potencia del estudio de 90 %, contemplando una prevalencia de
afectados por la patología de interés de 25 % en la muestra y falsos positivos de 22 %, se requiere estudiar
un total de 111 casos. Estos se encontrarán distribuidos como 28 y 83 casos. Si la estimación de falsos
positivos fuera más alta o más baja requerirían, respectivamente, menos y más casos integrando la
muestra, si no se modifica la LR+ escogida.
Efectuada esta primera fase del cálculo, se puede perfeccionar estableciendo el intervalo de confianza (IC)
que se considere apropiado o aceptable para la sensibilidad. El intervalo de confianza del 95 % (IC 95 %) de
p1 0,55 o 55 % puede establecerse, por ejemplo, en ± 10 %.

El error estándar deseado sería 10 = 5,10 .


1,96
Se puede calcular el número de casos necesarios para generar ese error estándar, contemplando que el
procedimiento se modifica si la proporción se aleja mucho de 0,50. El siguiente cálculo es adecuado para
muestras no muy pequeñas y proporción no menor de 0,30 o mayor de 0,70. Varios programas informáticos
proporcionan este cálculo. Como sea, para los fines perseguidos, no se requiere una precisión extrema.
Entonces

5,10 =
(100 − 55) × 55
n
despejando n se obtienen 95 casos.
Esto significa que para lograr el intervalo de confianza deseado el número de afectados por la patología de
interés debe ser de 95 en vez de 28 casos y por lo tanto, conservando la prevalencia estimada, el segundo
grupo debería ser de 285 casos en vez de 83. Esto da un N total definitivo de 383 casos.
Es de destacar que si el nivel de sensibilidad encontrado (0,55), tan cercano a 0,50, fuese mayor o menor,
el número de casos encontrado (95) generaría un intervalo de confianza más estrecho. Dicho de otro modo,
en tales circunstancias se requeriría una muestra menor.
Por otro lado, el intervalo de confianza de p 2 será al menos tan estrecho como el de la sensibilidad si la
prevalencia es menor que 0,50, como es usual. Pero si no es así y la prevalencia supera 0,50, para la
muestra calculada el intervalo de confianza de p 2 será más ancho de lo deseado.
Es necesario tener presente que el tamaño de la muestra, para un mismo LR+, cambiará substancialmente
con la proporción de falsos positivos. Así, si se establece un LR+ deseable de detectar igual o mayor que 3
y p 2 es 0,20, consecuentemente p 1 será 0,60 y la diferencia a detectar 0,40 (40 %). Para ello se requerirá
una muestra pequeña por tratarse de una gran diferencia. Sin embargo, si p 2 fuese 0,05, debiera ser 0,15
y la diferencia a detectar sólo de 0,10 (10 %), por lo que se requerirá una muestra mucho mayor.

12
Si se comenzara con la sensibilidad p 1 y su intervalo de confianza para conocer el respectivo tamaño de la
muestra para esa proporción, según " r " sería posible conocer la segunda muestra parcial. Sin embargo, de
todas maneras se requiere verificar que el N total no es insuficiente para los errores α y β establecidos,
particularmente si el valor de p 1 se aleja de 0,50, donde se encontrará un n más pequeño para el mismo
IC y asimismo si la prevalencia supera 0,50, donde la muestra de no afectados sería menor que la de
enfermos, con un IC mayor que el deseado para el grupo de afectados.

4.4. Tamaño muestral en estudios de cohortes


La siguiente fórmula proporciona el número de expuestos requeridos y, naturalmente, el de no expuestos
como c × N :
2
n′  1 + 2 ( c + 1) 

N = 1+
4  n′ c p 0 ( RR − 1 ) 
 

(z )
2

α ( c + 1) p (1 − p ) + z β c p 0 (1 − p 0 ) + p RR (1 − p 0 RR )
donde: n′ =
c ( p 0 (1 − RR ) )
2

p =
(p 0 RR ) + ( p 0 + c )
;
1+ c
q =1 − p ;
p0 es la frecuencia de la condición en estudio en la población no expuesta, expresada en forma
decimal: 0,05 (5 %);
RR es el riesgo relativo que se considere digno de ser detectado (o mayor): RR = 1 significa que
el factor de exposición no se encuentra asociado a un aumento del riesgo, puesto que este es
igual en expuestos y no expuestos;
c es la relación numérica de expuestos/no expuestos (muestra si las cohortes son de igual
tamaño o no);
α es el error α y z α es su respectivo valor z ;

β es el error β y z β es su respectivo valor z ;


Un ensayo clínico controlado puede ser considerado un seguimiento de dos cohortes, una expuesta al
tratamiento experimental y la otra no. La similitud se puede comprobar también en el cálculo del tamaño de
la muestra, que genera iguales resultados si se emplea RR de 3, como en el ejemplo recién presentado, o
se calcula con el resultado en la forma de dos proporciones, 0,10 en los no expuestos y 0,30 en los
expuestos.

4.5. Tamaño muestral en estudios de concordancia


En estudios de concordancia conviene recordar que el índice kappa ( κ ) tiene una distribución normal si el
efectivo de la muestra es mayor que 2 g 5 , siendo g el número de categorías en investigación. En tales
circunstancias se puede verificar la hipótesis k = 0 . La comparación de dos κ requiere un tamaño muestral
2
mínimo de 3 g para poder intentarla. Otro tema es establecer cuántos casos se requiere estudiar en una
situación específica para detectar un κ como diferente de cero o para comparar dos índices. Lo usual es
tener que efectuar un estudio piloto. Supóngase que en un estudio de 50 casos dos observadores clínicos
califican los casos como con o sin una determinada manifestación clínica como se señala en la Tabla IV.

13
observador A
con sin total
con 25 10 25
observador B
sin 5 20 25
total 20 30 50
Tabla IV. Estudio de concordancia entre dos observadores según presencia de una manifestación clínica.

En esta, la prevalencia del hallazgo según el observador A fue de 20 = 40 % con IC 95 % (26,7–54,8 %)


50
y la prevalencia del hallazgo según observador B fue de 25 = 50 % con IC 95% (35,7–64,3 %).
50
Recuérdese que si se desea establecer el número de casos necesario para detectar un κ como
significativamente diferente de cero ( p < 0, 05 ) se requiere calcular primero el error estándar de κ=0:

pc
EE κ = 0 =
n (1 − pc )
donde: p c es la proporción de concordancia dada por el azar; y
n es el número de casos a estudiar.
El valor p c se puede determinar según el intervalo de confianza de la prevalencia del hallazgo clínico para
cada observador, de la manera siguiente: Tomando las prevalencias menores, sabiendo que el total de la
tabla es "1" o 100%, de tal manera que, conociendo los marginales 0,357 y 0,267, se puede calcular los
faltantes, como se muestra en la Tabla V.

observador A
con sin total
con 0,095 0,357
observador B
sin 0,471 0,643
total 0,567 0,733 1
Tabla V. Estudio de concordancia entre dos observadores según presencia de una manifestación clínica.
Determinación de p c (explicación en el texto).

Ahora, teniendo los marginales correspondientes a las celdas "a" y "d", se puede calcular a su vez los
valores esperados en esas celdas (0,095 resulta de 0,357 por 0,267, dividido por el total, 1). Finalmente, p c
es igual a la suma de 0,095 y 0,471, es decir 0,566. Por este procedimiento se alcanza a saber que p c
fluctuará entre 0,43 y 0,56. Entonces, si se desea detectar como significativamente diferente de cero un κ
de 0,25 o mayor, se puede decir que el error estándar de κ igual a cero debe ser de 0,25/ 1,96, es decir
0,127. Disponiendo del valor p c y del error estándar de κ = 0 se resolverá n a partir la fórmula indicada
anteriormente. Así, se obtendrá que n fluctúa entre 47 y 79 casos. El tamaño muestral será entonces de 79
casos.

14
5. Bibliografía
Lwanga SK, Lemeshow S. Sample size determination in health studies. A practical manual. Geneva: World
Health Organisation, 1991.
www.fisterra.com/mbe/investiga/9muestras/9muestras.htm
www.itch.edu.mx/academic/industrial/estadistica1/toc.html
www.fisterra.com/mbe/investiga/index.asp
www.seh-lelha.org/stat1.htm
www.isciii.es/htdocs/redes/investen/publicaciones/calculo_muestra.pdf
www.sportsci.org/resource/stats/ssdetermine.html
www.statsdirect.com/help/sample_size_and_methods/ss.htm
www.brodgar.com/PowerAnalysis.pdf
www.uic.edu/classes/epid/epid401/lectures/sampling.pdf
http://myphliputil.pearsoncmg.com/student/bp_berenson_bbs_9/chap06.ppt
www.ilir.uiuc.edu/courses/lir593/chap71999.ppt
http://www.pnl.gov/main/publications/external/technical_reports/PNNL-13434.pdf
www.hqlo.com/content/2/1/26

15

You might also like