Está en la página 1de 15

DETERMINACIN DEL TAMAO MUESTRAL

Notas
ndice
1. INTRODUCCIN
2. TAMAO MUESTRAL EN ESTUDIOS PARA DETERMINAR PARMETROS

1
2

2.1. Tamao muestral para estimar una proporcin


2.2. Tamao muestral para estimar una media

2
3

3. TAMAO MUESTRAL EN ESTUDIOS PARA CONTRASTE DE HIPTESIS

3.1. Tamao muestral para comparacin de dos proporciones


4
3.2. Tamao muestral en estudios en que se compararn dos proporciones por la prueba de Fisher-Irwin de
probabilidades exactas
4
3.3. Tamao muestral para la comparacin de dos medias
5

4. TAMAO MUESTRAL EN ESTUDIOS BIOMDICOS

4.1 Clculo del tamao muestral en estudios de casos y controles


4.2. Tamao muestral en estudios en que se indagar sobre una prevalencia
4.3. Tamao muestral en estudios en que se investigar una prueba diagnstica
4.4. Tamao muestral en estudios de cohortes
4.5. Tamao muestral en estudios de concordancia

7
10
11
13
13

5. BIBLIOGRAFA

15

1. Introduccin
Todo estudio epidemiolgico lleva implcito en la fase de diseo la determinacin del tamao muestral
necesario para la ejecucin del mismo. El no realizar dicho proceso, puede conducir a dos situaciones
diferentes: primera que se realice el estudio sin el nmero adecuado de pacientes, con lo cual no se podr
ser precisos al estimar los parmetros y adems no se encontraran diferencias significativas cuando en
realidad s existen. La segunda es que se podra estudiar un nmero innecesario de pacientes, lo cual lleva
implcito no solo la prdida de tiempo y de recursos innecesarios sino que adems la calidad del estudio, a
causa de dicho exceso, puede verse afectada en sentido negativo.
Para determinar el tamao muestral de un estudio, deben considerar diferentes situaciones:
(a) Estudios para determinar parmetros, es decir, cuando se pretende hacer inferencias de valores
poblacionales (proporciones, medias) a partir de una muestra (figura 1);
(b) Estudios para contraste de hiptesis, es decir, cuando se pretende comparar si proporciones o las
medias de las muestras son diferentes.

Poblacin
p < 0,0
Seguridad

Muestra

Estimacin

Observacin
(experimento,
medicin)

Intervalo de
Confianza
Resultados
Figura 1. Elementos de la Inferencia Estadstica

2. Tamao muestral en estudios para determinar parmetros


Con estos estudios se pretende hacer inferencias de valores poblacionales (proporciones, medias) a partir
de una muestra.

2.1. Tamao muestral para estimar una proporcin


Si se desea estimar una proporcin, debe conocerse:
(a) El nivel de confianza o seguridad (1 ) . El nivel de confianza prefijado da lugar a un coeficiente

( z ) . Para un nivel de seguridad del 95 % =1,96 , para un nivel de seguridad del 99 % = 2,58 ;

(b) La precisin que se desea para el estudio;


(c) Una idea del valor aproximado del parmetro que se quiere medir (en este caso, una proporcin). Esta
idea se puede obtener revisando la literatura o mediante estudio pilotos previos. En caso de no tener
dicha informacin se utilizar el valor p = 0,5 (50 %).
Por ejemplo, a cuntas personas tendra que estudiarse para conocer la prevalencia de diabetes?
Seguridad = 95 %;
Precisin = 3 %;
Proporcin esperada = asumiendo que puede ser prxima al 5 %; si no se tuviese ninguna idea de dicha
proporcin se utilizara el valor p = 0,5 (50 %) que maximiza el tamao muestral:

n =

z 2 p q
d2

donde: z = 1,96 = 3,84 ya que la seguridad buscada es del 95 %;


2

es la proporcin esperada (en este caso 5 % 0,05);

q =1 p
d

(en este caso 1 0,05 = 0,95);

es la precisin deseada (en este caso un 3 %):

n =

1,962 0, 05 0,95
= 203
0, 032
2

Si la poblacin es finita, es decir se conoce el total de la poblacin y se desea saber cuntos individuos hay
que estudiar, la respuesta sera:

n =
donde: N

N z 2 p q

d 2 ( N 1) + z 2 p q

es el total de la poblacin;
2

z 2

es 1,96 si la seguridad deseada es del 95 %;

es la proporcin esperada (en este caso 5 % 0,05);

q =1 p
d

(en este caso 1 0, 05 = 0,95 );

es la precisin (en este caso se desea un 3 %).

A cuntas personas de una poblacin de 15.000 habitantes tendra que estudiarse para conocer la
prevalencia de diabetes?
Seguridad = 95 %;
Precisin = 3 %;
Proporcin esperada = asumiendo que puede ser prxima al 5 %; si no se tuviese ninguna idea de dicha
proporcin se utilizara el valor p = 0,5 (50 %) que maximiza el tamao muestral:

n =

15000 1,962 0, 05 0,95


= 200
0, 032 (15000 1) + 1,962 0, 05 0,95

El coeficiente de z vara segn diferentes niveles de seguridad, as:

Si la seguridad z fuese del 90 % el coeficiente sera 1,645;

Si la seguridad Z del 95 % el coeficiente sera 1,96;

Si la seguridad z fuese del 97,5 % el coeficiente sera 2,24;

Si la seguridad z fuese del 99 % el coeficiente sera 2,576.

2.2. Tamao muestral para estimar una media


Si se desea estimar una media habr que conocer:
(a) El nivel de confianza o seguridad (1 ) . El nivel de confianza prefijado da lugar a un coeficiente

( z ) . Para un nivel de seguridad del 95 %, =1,96 , para un nivel de seguridad del 99 % = 2,58 ;

(b) La precisin con que se desea estimar el parmetro ( 2 d es la amplitud del intervalo de confianza);
(c) Una idea de la varianza s
poblacin

de la distribucin de la variable cuantitativa que se supone existe en la

n =

z 2 s 2
d2

Por ejemplo, si se desea conocer la media de la glucemia basal de una poblacin, con una seguridad del 95
% y una precisin de 3 mg/dl y se tiene informacin a travs un estudio piloto o de una revisin
bibliogrfica que la varianza es de 250 mg/dl:

n =

1,962 250
= 106, 7
32

Si la poblacin es finita, como previamente se seal, es decir se conoce el total de la poblacin y se


deseara saber cuntos individuos debera estudiarse, la respuesta sera:

n =

N z 2 s 2

d 2 ( N 1) + z 2 s 2

3. Tamao muestral en estudios para contraste de hiptesis


Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes.
Habitualmente, el investigador pretende comparar dos tratamientos. Para el clculo del tamao muestral se
precisa conocer:
(a) Magnitud de la diferencia a detectar que tenga inters clnicamente relevante. Se pueden comparar dos
proporciones o dos medias;
(b) Tener una idea aproximada de los parmetros de la variable que se estudia (a travs de la bibliografa o
de estudios previos);
(c) Seguridad del estudio (riesgo de cometer un error );
(d) Potencia estadstica (1 ) (riesgo de cometer un error );
(e) Definicin de si la hiptesis va a ser unilateral o bilateral:

Bilateral: cualquiera de los dos parmetros a comparar (medias o proporciones) puede ser mayor o
menor que el otro. No se establece ninguna direccin;

Unilateral: cuando se considera que uno de los parmetros debe ser mayor que el otro, indicando
por tanto una direccin de las diferencias.
La hiptesis bilateral es una hiptesis ms conservadora y disminuye el riesgo de cometer un error de tipo I
(rechazar la H 0 cuando en realidad es verdadera).

3.1. Tamao muestral para comparacin de dos proporciones

z 2 p (1 p ) + z p (1 p ) + p (1 p )
1
1
2
2

n =

p1 p 2

donde: n

es el nmero de sujetos necesarios en cada una de las muestras;

z es el valor z correspondiente al riesgo ;

z es el valor z correspondiente al riesgo ;


p1 es el valor de la proporcin en el grupo de referencia, placebo, control o tratamiento habitual;
p 2 es el valor de la proporcin en el grupo del nuevo tratamiento, intervencin o tcnica;
p es la media de las dos proporciones p1 y p 2 :

Los valores z segn la seguridad y z segn la potencia del test se indican en la tabla I.

3.2. Tamao muestral en estudios en que se compararn dos proporciones por la prueba
de Fisher-Irwin de probabilidades exactas
En ocasiones, se puede presumir que en la investigacin se incluir una muestra pequea y se compararn
dos grupos por la mencionada prueba de hiptesis.

Se dispone de tablas que proporcionan el tamao muestral por grupo requerido para satisfacer los errores
alfa y beta planteados frente a la comparacin de dos proporciones. A modo de ejemplo, vase los datos
que se proporcionan en la tabla II.
El clculo del tamao muestral para estudiar la diferencia entre dos proporciones en una tabla de 2 x 2, con
hiptesis unilateral, incluye las dos proporciones y los errores y . Debe contemplarse una proporcin

p1 como "control" o valor "patrn" y la otra p 2 como "experimental". En tales condiciones:

n = 1, 64 1, 6
arcsin

z + z

p1 arcsin

p2

donde: z

es 1,64 si es 0,05 para una prueba unilateral y 1,96 si es bilateral;

es 0,84 si es 0,20, tanto para una prueba unilateral como bilateral;

arcsin
arcsin

(
(

p1
p2

)
)

es el arco seno (corresponde "al ngulo cuyo seno es el valor dado"1) de la raz
cuadrada de la primera proporcin;
es el arco seno (corresponde "al ngulo cuyo seno es el valor dado") de la raz
cuadrada de la segunda proporcin;

p2
0,80
0,60
0,50
0,40
0,30
0,20
0,10
0,05

0,70

p1
0,50

0,60

0,40

0,30

0,20

67

73
36

84

23

41

85

15

23

42

84

10

15

23

36

73

10

13

19

30

56

11

14

20

34

Tabla I. Tamao muestral necesario por grupo, segn proporciones que se comparan p 1 y p 2 , para
hiptesis unilateral, dado error de 0,05 y de 0,20.
La prueba de hiptesis que se supone se emplear con los resultados del estudio es ji cuadrado.

3.3. Tamao muestral para la comparacin de dos medias

2 ( z + z ) s2
2

n =
donde: n

d2

son los individuos necesarios en cada una de las muestras;

es el valor z correspondiente al riesgo deseado;

es el valor z correspondiente al riesgo deseado;

s2
d

es la varianza de la variable cuantitativa que tiene el grupo control o de referencia;


es el valor mnimo de la diferencia que se desea detectar (datos cuantitativos).

En una calculadora arcsin sera sin elevado a 1.


5

Los valores z segn el nivel de seguridad y z segn la potencia se indican en la tabla II:

Z
test unilateral

test bilateral

0,200
0,150
0,100
0,050
0,025
0,010

0,842
1,036
1,282
1,645
1,960
2,326

1,282
1,440
1,645
1,960
2,240
2,576

potencia

(1-)

0,01
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50

0,99
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50

2,326
1,645
1,282
1,036
0,842
0,674
0,524
0,385
0,253
0,126
0,000

Tabla II. Valores de z y z ms frecuentemente utilizados.

Ejemplo de comparacin de dos medias


Se desea utilizar un nuevo frmaco antidiabtico y se considera que sera clnicamente eficaz si lograse un
descenso de 15 mg/dl respecto al tratamiento habitual con el antidiabtico estndar. Por estudios previos
sabemos que la desviacin tpica de la glucemia en pacientes que reciben el tratamiento habitual es de 16
mg/dl. Se acepta un riesgo de 0,05 y se desea una potencia estadstica del 90 % para detectar diferencias,
si es que existen:

2 ( z + z ) s2
2

n =

d2

2 (1, 645 + 1, 282 ) 162


n =
= 19, 49
152
2

se precisan, pues, 20 pacientes en cada grupo.


Ejemplo de comparacin de dos proporciones
Se desea evaluar si el tratamiento T 2 es mejor que el tratamiento T1 para el alivio del dolor para lo que se
disea un ensayo clnico. Se sabe por datos previos que la eficacia del frmaco habitual est alrededor del
70 % y se considera clnicamente relevante si el nuevo frmaco alivia el dolor en un 90 %. El nivel de riesgo
se fija en 0,05 y se desea una potencia estadstica de un 80 %.

z 2 p (1 p ) + z p (1 p ) + p (1 p )

1
1
2
2

n =

p1 p 2

0, 7 + 0,9
= 0,8
p =
2

1, 645 2 0,8 (1 0,8 ) + 0,842 0, 7 (1 0, 7 ) + 0,9 (1 0,9 )

0, 7 0,9

n = 48 pacientes

El tamao muestral ajustado a las prdidas


En todos los estudios es preciso estimar las posibles prdidas de pacientes por razones diversas (prdida
de informacin, abandono, no respuesta) por lo que se debe incrementar el tamao muestral respecto a
dichas prdidas. El tamao muestral ajustado a las prdidas se puede calcular:

1
muestra ajustada a las prdidas = n

1 R
donde: n

es el nmero de individuos sin prdidas;

R es la proporcin esperada de prdidas.


As por ejemplo, si en el estudio anterior se espera tener un 15 % de prdidas, el tamao muestral
necesario sera:
1
48
= 56
1 0,15
pacientes en cada grupo.

4. Tamao muestral en estudios biomdicos


4.1 Clculo del tamao muestral en estudios de casos y controles
Supngase que se quiere llevar a cabo un estudio de casos y controles con el fin de determinar si existe
una relacin significativa entre la exposicin a un factor y la presencia de una determinada enfermedad. A
continuacin se explica cmo calcular el tamao de muestra necesario para contrastar la hiptesis de que el
odds ratio (OR) sea igual a 1.
Si se conoce la probabilidad de exposicin entre los controles p 2 , y se prev que el OR asociado al factor
de estudio es w , el valor de p 1 , la frecuencia de exposicin entre los casos, puede obtenerse fcilmente:

OR

p1 (1 p 2 )

= w =

p 2 (1 p1 )

w p 2 (1 p1 ) = p1 (1 p 2 )
p1 (1 p 2 + w p 2 ) = w p 2
p1 =

w p2

(1 p ) + w p
2

donde: p1 y p2 son las proporciones esperadas;


w
valor aproximado del OR que se desea estimar.
7

As, el problema del clculo del tamao muestral podr abordarse mediante las frmulas habituales
empleadas en la comparacin de dos proporciones.
Recurriendo a las frmulas habituales para determinar el tamao muestral mnimo necesario para la
comparacin de dos proporciones, se precisar conocer:
(a) La magnitud de la diferencia a detectar, que tenga inters clnicamente relevante. En este caso, como
ya se vio, bastara con conocer dos de los siguientes tres parmetros:

Una idea del valor aproximado del OR que se desea estimar ( w ) ;

La frecuencia de la exposicin entre los casos

(p );
La frecuencia de la exposicin entre los controles ( p ) .
1

(b) El nivel de seguridad o riesgo de cometer un error de tipo I, con que se desea trabajar.
Generalmente con un nivel de seguridad del 95 %, = 0,05 .
(c) La potencia estadstica o riesgo de cometer un error de tipo II (1 ) que se desea para el estudio,. Es
habitual tomar = 0, 2 , es decir, una potencia del 80 %.
Con estos datos, y para un planteamiento bilateral, para el clculo del tamao muestral se utilizar la
expresin:

z 2 p (1 p ) + z
p1 (1 p1 ) + p 2 (1 p 2 )
1
1 2

n =

p1 p 2

donde: p =

p1 + p2
2

[ecuacin 1]

w
p1

es una idea del valor aproximado del OR que se desea estimar;

p2

es la frecuencia de la exposicin entre los controles; y

z 1 2 y z 1

son valores que se obtienen de la distribucin normal estndar en funcin de la

es la frecuencia de la exposicin entre los casos;

seguridad y la potencia seleccionadas para el estudio. En particular, para un nivel


de seguridad de un 95 % y una potencia estadstica del 80 % se tiene que
z 1 =1,96 y z 1 = 0,84 .
2

Hasta ahora se ha asumido un tamao muestral igual para casos y controles. En caso de que el nmero de
casos y controles no est equilibrado, la expresin anterior deber ser ligeramente modificada:

n =

z 1 2

c p1 (1 p1 ) + p 2 (1 p 2 )

c ( p1 p 2 )

donde: n

[ecuacin 2]

es el nmero de casos;

c=m

( c +1) p (1 p ) + z 1

es el nmero de controles; y

es el nmero de controles por cada caso.

As, el nmero de controles vendra dado por m = c n .


Debe precisarse que se ha tratado en el presente trabajo de exponer del modo lo ms sencillo posible el
procedimiento a seguir en el clculo del tamao de la muestra en un estudio de casos y controles. No
obstante, en ocasiones se utilizan para este clculo expresiones ms complejas basadas en una correccin
de la frmula del clculo del tamao muestral para la comparacin de dos proporciones. As mismo, existen
frmulas especficas para el clculo del tamao de la muestra en el caso de que el diseo corresponda a un
estudio de casos y controles apareados.
8

Ejemplo del clculo del tamao muestral en un estudio de casos y controles


Como ejemplo, supngase que se desea estudiar la existencia de una asociacin entre el consumo de
tabaco y el hecho de sufrir un infarto de miocardio. Para poner en evidencia dicha asociacin y cuantificar
su magnitud, se disea un estudio de casos y controles en el que se investigar el consumo de tabaco de
una serie de pacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos
(controles). Se cree que alrededor de un 40 % de los controles son fumadores y se considera como
diferencia importante entre ambos grupos un OR de 4. Con estos datos, se puede calcular el tamao de
muestra necesario en cada grupo para detectar un OR de 4 como significativamente diferente de 1 con una
seguridad del 95 % y una potencia del 80 %. De acuerdo con lo expuesto anteriormente, y conociendo los
siguientes parmetros:
(a) Frecuencia de exposicin entre los controles: 40 %;
(b) OR previsto: 4;
(c) Nivel de seguridad: 95 %;
(d) Potencia estadstica: 80 %.
La frecuencia de exposicin entre los casos vendr dada por:

p1 =

w p2

(1 p ) + w p
2

=
2

4 0, 40
=
(1 0, 40 ) + 4 0, 40

1,6
= 0,73
0,60 + 1,6

Esto es, se estima que aproximadamente un 73 % de los casos son fumadores.


Aplicando la ecuacin 1, se obtiene:
2

1,96 2 0,565 (1 0,565 ) + 0,84 0,73 (1 0,73) + 0, 4 (1 0, 4 )


35
n =

0,73 0, 4

Es decir, se necesitara estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35
controles) para detectar como significativo un valor del OR de 4.
Si se reduce el tamao del efecto a detectar, asumiendo que el OR es aproximadamente igual a 3, se
obtiene:

p1 =

w p2

(1 p ) + w p
2

=
2

3 0, 40
= 0,67
(1 0, 40 ) + 3 0, 40

y, de acuerdo con la ecuacin 1, seran necesarios n = 54 pacientes por grupo para llevar a cabo el estudio.
En algunos estudios, el investigador rene un nmero mayor de controles que de casos con el objeto de
incrementar la potencia estadstica. Supngase que en este ejemplo se planea obtener dos controles por
caso, y se asume que el OR a detectar es aproximadamente igual a 3. Aplicando la ecuacin 2:

n =

n =

z 1 2

(1,96

( c +1) p (1 p ) + z 1

c p1 (1 p 1 ) + p 2 (1 p 2 )

c ( p1 p 2 )

( 2 +1) 0,565 (1 0,565) + 0,84

2 0,73 (1 p1 ) + 0, 4 (1 0, 4 )

2 ( 0,73 0, 4 )

40

Por tanto, se necesitar un grupo de n = 40 casos (pacientes con infarto de miocardio) y m = 2 40 = 80


controles para llevar a cabo la investigacin.
El clculo del tamao muestral en los estudios de casos y controles debe formar parte del diseo
metodolgico, ya que la ejecucin de este tipo de estudios es costosa. El iniciar un estudio sin conocer la
potencia estadstica y la seguridad para detectar diferencias, si es que existen, podra ser motivo de incurrir
en un error de tipo II en el sentido de no detectar diferencias cuando realmente las hay.

expuestos
no expuestos

casos

controles

a+b

c+d

a+c

b+d

Tabla III. Disposicin de los sujetos incluidos en un estudio de casos y controles. Tabla de 2 x 2.

4.2. Tamao muestral en estudios en que se indagar sobre una prevalencia


En estos se requiere conocer el tamao de la poblacin, la precisin deseada (%), la prevalencia esperada,
el efecto del diseo y el error .
En este caso se debe tener una idea aproximada de la prevalencia que se est investigando, a continuacin
se debe establecer cunto se aceptara que vare (precisin), seguidamente el nivel de confianza deseado
para la indagacin y, finalmente, el efecto de diseo de la investigacin. Este es igual a 1 (no hay efecto de
diseo) si se ha empleado un procedimiento de muestreo aleatorio simple o bien sistemtico y corresponde
a un error sistemtico.
La frmula:

n =
donde: n

N z 12 p (1 p )

d 2 ( N 1) + z 12 p (1 p )

es el tamao de la muestra;
es la poblacin total;

z 1 es el valor de z para el nivel de confianza (1 ) ;


p

es la proporcin esperada en la poblacin; y

es la precisin absoluta.

El tamao de la muestra es, en definitiva, igual a n por el efecto de diseo. El tamao de la poblacin de la
que se extraer la muestra es habitualmente desconocido, pero no es muy importante tener un
conocimiento exacto, basta con una aproximacin razonable.
Por ejemplo, supngase que se estima una proporcin p en la poblacin a estudiar de 7 % y se desea un
tamao muestral que permita, con una seguridad de 95 % (entonces z = 1,96 ), una variacin alrededor de 7
% de hasta 3 %. Ello significa que si la proporcin poblacional es de 7 % se espera, con 95 % de confianza,
obtener un valor entre 410 %. Para estos requisitos, si la poblacin es de 500.000 personas, la muestra
requerida es de 278 casos, si es de 10.000 personas, 271 casos, si slo son 5.000 personas 264 y si son
1.000 personas, 218 casos.
Si se desconoce valor de p an es posible estimar el tamao muestral: en la frmula, la expresin

p (1 p ) tiene un valor creciente a medida que la proporcin p se va acercando a 0,50, alcanza su mximo
en ese punto y luego va descendiendo nuevamente. Entonces, cuando p = 0,50 la mencionada expresin
vale 0,25 y con esa cifra se calcular en la frmula el tamao muestral, que ser el ms elevado para las
condiciones establecidas. Ese tamao de muestra ser, entonces, el apropiado.

10

4.3. Tamao muestral en estudios en que se investigar una prueba diagnstica


Para estos estudios se requiere conocer: error alfa, error beta, proporcin esperada de falsos positivos o la
especificidad, razn de verosimilitud considerada digna de ser detectada, intervalo de confianza deseado
para la sensibilidad y la prevalencia esperada de la patologa en estudio. (No se comenta con detalle el
procedimiento de clculo).
Las razones de verosimilitud (likelihood ratios, LR), ndices fijos como sensibilidad y especificidad ofrecen
una relacin entre las cuatro celdas (a, b, c, d) de la tabla 2 x 2, en que se estudia una prueba diagnstica:
Es as como, si se considera un LR+, se ver que tal resultado se obtiene de la razn entre las proporciones

(a + c)

y b

(b + d )

de modo que

a
LR + =

(a + c)
(b + d )

En esta divisin, el numerador corresponde a la sensibilidad de la prueba y el denominador a la proporcin


de falsos positivos (1-especificidad).
Es posible, entonces, plantear la bsqueda del tamao muestral a partir de una comparacin de dos
proporciones (LR), en prueba unilateral (puesto que se espera que el numerador ser mayor que el
denominador, LR+ veces), para lo cual se requerira estimar los falsos positivos (o la especificidad)
probables en esa prueba y la prevalencia esperada del trastorno en estudio dentro de la muestra. Al mismo
tiempo, se debe elegir un valor de LR+ digno de ser detectado, contemplando el nivel de error alfa y beta
que se considere adecuado. Tal comparacin es entre dos proporciones independientes (aunque
intrnsecamente relacionadas) y de tamao casi siempre diferente, con una proporcin de verdaderos
enfermos habitualmente inferior a 50 %.
La estimacin de los falsos positivos determina en parte el LR+ elegible, puesto que, si los primeros
constituyen un 5%, es poco probable que interese un LR+ de 3 si se considera que 5 % x 3 indicar la
sensibilidad de la prueba en tal caso, es decir, 15% y esta seguramente no resultara de mucho inters al
investigador como nivel inicial de deteccin. Del mismo modo, si la proporcin de falsos positivos fuera muy
alta, LR+ puede tener como lmite un valor sorprendentemente bajo. Por ejemplo, una cifra de falsos
positivos del 30 % (0,30) tiene un LR+ lmite posible de 3,33, ya que una cifra mayor supondra una
sensibilidad de la prueba superior al 100 %. Como sea, es generalmente aceptado que LR+ en el margen
de 2 a 5 suele ser de importancia en el sentido que el cambio de la probabilidad previo a la prueba a aquella
despus de la prueba cuando LR+ est en esos valores, sera de una magnitud de consideracin.
El poder estimar algunos valores, como la proporcin de falsos positivos, requiere algn conocimiento
previo de la situacin o efectuar un estudio piloto para obtenerlo.
Aceptando que se cumplen los requisitos para efectuar la correspondiente prueba de hiptesis, de acuerdo
con Fleiss se tendra:

2 ( r + 1)
N
1+ 1+
N =
4
N r p 2 p1

donde: N =

( r + 1)

p q z r p1 q1 + p 2 q 2
r ( p 2 p1 )

es uno de los tamaos muestrales; y

Nr

el otro;

es la fraccin que representa la muestra ms pequea respecto a la mayor;

p1 = a

(a + c)

es la sensibilidad de la prueba, y que es igual a p 2 LR + ;

q1 =1 p1 ;

11

p2 = b

(b + d )

es la proporcin de falsos positivos (1-especificidad);

q 2 =1 p 2 ;
para hiptesis unilateral es 1,645 (para un error de 0,05) 2,326 (para de

z 1

0,01);
es 0,842 (para un error de 0,20), 1,29 (para 0,10) o 1,645 (para de

0,05);

p=

p1 + r p 2
r +1

;y

q =1 p .
Como es de esperar una prevalencia inferior a 50 %, la muestra que corresponde a verdaderos enfermos
segn estndar ideal ser N r y la de verdaderos no afectados N .
Ahora bien, se puede indicar que para detectar un LR+ de 2,5 o mayor (en hiptesis unilateral), con un error
de 5 % y de 10 %, es decir, una potencia del estudio de 90 %, contemplando una prevalencia de
afectados por la patologa de inters de 25 % en la muestra y falsos positivos de 22 %, se requiere estudiar
un total de 111 casos. Estos se encontrarn distribuidos como 28 y 83 casos. Si la estimacin de falsos
positivos fuera ms alta o ms baja requeriran, respectivamente, menos y ms casos integrando la
muestra, si no se modifica la LR+ escogida.
Efectuada esta primera fase del clculo, se puede perfeccionar estableciendo el intervalo de confianza (IC)
que se considere apropiado o aceptable para la sensibilidad. El intervalo de confianza del 95 % (IC 95 %) de
p1 0,55 o 55 % puede establecerse, por ejemplo, en 10 %.
El error estndar deseado sera 10

1,96

= 5,10 .

Se puede calcular el nmero de casos necesarios para generar ese error estndar, contemplando que el
procedimiento se modifica si la proporcin se aleja mucho de 0,50. El siguiente clculo es adecuado para
muestras no muy pequeas y proporcin no menor de 0,30 o mayor de 0,70. Varios programas informticos
proporcionan este clculo. Como sea, para los fines perseguidos, no se requiere una precisin extrema.
Entonces

5,10 =

(100 55) 55
n

despejando n se obtienen 95 casos.


Esto significa que para lograr el intervalo de confianza deseado el nmero de afectados por la patologa de
inters debe ser de 95 en vez de 28 casos y por lo tanto, conservando la prevalencia estimada, el segundo
grupo debera ser de 285 casos en vez de 83. Esto da un N total definitivo de 383 casos.
Es de destacar que si el nivel de sensibilidad encontrado (0,55), tan cercano a 0,50, fuese mayor o menor,
el nmero de casos encontrado (95) generara un intervalo de confianza ms estrecho. Dicho de otro modo,
en tales circunstancias se requerira una muestra menor.
Por otro lado, el intervalo de confianza de p 2 ser al menos tan estrecho como el de la sensibilidad si la
prevalencia es menor que 0,50, como es usual. Pero si no es as y la prevalencia supera 0,50, para la
muestra calculada el intervalo de confianza de p 2 ser ms ancho de lo deseado.
Es necesario tener presente que el tamao de la muestra, para un mismo LR+, cambiar substancialmente
con la proporcin de falsos positivos. As, si se establece un LR+ deseable de detectar igual o mayor que 3
y p 2 es 0,20, consecuentemente p 1 ser 0,60 y la diferencia a detectar 0,40 (40 %). Para ello se requerir
una muestra pequea por tratarse de una gran diferencia. Sin embargo, si p 2 fuese 0,05, debiera ser 0,15
y la diferencia a detectar slo de 0,10 (10 %), por lo que se requerir una muestra mucho mayor.

12

Si se comenzara con la sensibilidad p 1 y su intervalo de confianza para conocer el respectivo tamao de la


muestra para esa proporcin, segn " r " sera posible conocer la segunda muestra parcial. Sin embargo, de
todas maneras se requiere verificar que el N total no es insuficiente para los errores y establecidos,
particularmente si el valor de p 1 se aleja de 0,50, donde se encontrar un n ms pequeo para el mismo
IC y asimismo si la prevalencia supera 0,50, donde la muestra de no afectados sera menor que la de
enfermos, con un IC mayor que el deseado para el grupo de afectados.

4.4. Tamao muestral en estudios de cohortes


La siguiente frmula proporciona el nmero de expuestos requeridos y, naturalmente, el de no expuestos
como c N :

n
1+
N =
4

donde: n =

p =

(z

(p

( c + 1) p (1 p )

1 + 2 ( c + 1)

n c p 0 ( RR 1 )

+ z c p 0 (1 p 0 ) + p RR (1 p 0 RR )
c ( p 0 (1 RR ) )

RR ) + ( p 0 + c )
1+ c

q =1 p ;
p0

es la frecuencia de la condicin en estudio en la poblacin no expuesta, expresada en forma


decimal: 0,05 (5 %);

RR es el riesgo relativo que se considere digno de ser detectado (o mayor): RR = 1 significa que
c

el factor de exposicin no se encuentra asociado a un aumento del riesgo, puesto que este es
igual en expuestos y no expuestos;
es la relacin numrica de expuestos/no expuestos (muestra si las cohortes son de igual
tamao o no);

es el error y z es su respectivo valor z ;

es el error y z es su respectivo valor z ;

Un ensayo clnico controlado puede ser considerado un seguimiento de dos cohortes, una expuesta al
tratamiento experimental y la otra no. La similitud se puede comprobar tambin en el clculo del tamao de
la muestra, que genera iguales resultados si se emplea RR de 3, como en el ejemplo recin presentado, o
se calcula con el resultado en la forma de dos proporciones, 0,10 en los no expuestos y 0,30 en los
expuestos.

4.5. Tamao muestral en estudios de concordancia


En estudios de concordancia conviene recordar que el ndice kappa

( ) tiene una distribucin normal si el

efectivo de la muestra es mayor que 2 g 5 , siendo g el nmero de categoras en investigacin. En tales


circunstancias se puede verificar la hiptesis k = 0 . La comparacin de dos requiere un tamao muestral
2

mnimo de 3 g para poder intentarla. Otro tema es establecer cuntos casos se requiere estudiar en una
situacin especfica para detectar un como diferente de cero o para comparar dos ndices. Lo usual es
tener que efectuar un estudio piloto. Supngase que en un estudio de 50 casos dos observadores clnicos
califican los casos como con o sin una determinada manifestacin clnica como se seala en la Tabla IV.

13

observador A
con
sin total
observador B

con
sin

total

25

10

25

20

25

20

30

50

Tabla IV. Estudio de concordancia entre dos observadores segn presencia de una manifestacin clnica.
En esta, la prevalencia del hallazgo segn el observador A fue de 20
y la prevalencia del hallazgo segn observador B fue de 25

50

= 40 % con IC 95 % (26,754,8 %)
50
= 50 % con IC 95% (35,764,3 %).

Recurdese que si se desea establecer el nmero de casos necesario para detectar un como
significativamente diferente de cero

( p < 0, 05 ) se requiere calcular primero el error estndar de


pc

EE = 0 =
donde: p c

=0:

n (1 pc )

es la proporcin de concordancia dada por el azar; y

n
es el nmero de casos a estudiar.
El valor p c se puede determinar segn el intervalo de confianza de la prevalencia del hallazgo clnico para
cada observador, de la manera siguiente: Tomando las prevalencias menores, sabiendo que el total de la
tabla es "1" o 100%, de tal manera que, conociendo los marginales 0,357 y 0,267, se puede calcular los
faltantes, como se muestra en la Tabla V.

observador A
con
sin total
observador B

con 0,095
sin
total 0,567

0,357
0,471

0,643

0,733

Tabla V. Estudio de concordancia entre dos observadores segn presencia de una manifestacin clnica.
Determinacin de p c (explicacin en el texto).
Ahora, teniendo los marginales correspondientes a las celdas "a" y "d", se puede calcular a su vez los
valores esperados en esas celdas (0,095 resulta de 0,357 por 0,267, dividido por el total, 1). Finalmente, p c
es igual a la suma de 0,095 y 0,471, es decir 0,566. Por este procedimiento se alcanza a saber que p c

fluctuar entre 0,43 y 0,56. Entonces, si se desea detectar como significativamente diferente de cero un
de 0,25 o mayor, se puede decir que el error estndar de igual a cero debe ser de 0,25/ 1,96, es decir
0,127. Disponiendo del valor p c y del error estndar de = 0 se resolver n a partir la frmula indicada
anteriormente. As, se obtendr que n flucta entre 47 y 79 casos. El tamao muestral ser entonces de 79
casos.

14

5. Bibliografa
Lwanga SK, Lemeshow S. Sample size determination in health studies. A practical manual. Geneva: World
Health Organisation, 1991.
www.fisterra.com/mbe/investiga/9muestras/9muestras.htm
www.itch.edu.mx/academic/industrial/estadistica1/toc.html
www.fisterra.com/mbe/investiga/index.asp
www.seh-lelha.org/stat1.htm
www.isciii.es/htdocs/redes/investen/publicaciones/calculo_muestra.pdf
www.sportsci.org/resource/stats/ssdetermine.html
www.statsdirect.com/help/sample_size_and_methods/ss.htm
www.brodgar.com/PowerAnalysis.pdf
www.uic.edu/classes/epid/epid401/lectures/sampling.pdf
http://myphliputil.pearsoncmg.com/student/bp_berenson_bbs_9/chap06.ppt
www.ilir.uiuc.edu/courses/lir593/chap71999.ppt
http://www.pnl.gov/main/publications/external/technical_reports/PNNL-13434.pdf
www.hqlo.com/content/2/1/26

15

También podría gustarte