Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tamaño Muestral
Tamaño Muestral
Notas
ndice
1. INTRODUCCIN
2. TAMAO MUESTRAL EN ESTUDIOS PARA DETERMINAR PARMETROS
1
2
2
3
7
10
11
13
13
5. BIBLIOGRAFA
15
1. Introduccin
Todo estudio epidemiolgico lleva implcito en la fase de diseo la determinacin del tamao muestral
necesario para la ejecucin del mismo. El no realizar dicho proceso, puede conducir a dos situaciones
diferentes: primera que se realice el estudio sin el nmero adecuado de pacientes, con lo cual no se podr
ser precisos al estimar los parmetros y adems no se encontraran diferencias significativas cuando en
realidad s existen. La segunda es que se podra estudiar un nmero innecesario de pacientes, lo cual lleva
implcito no solo la prdida de tiempo y de recursos innecesarios sino que adems la calidad del estudio, a
causa de dicho exceso, puede verse afectada en sentido negativo.
Para determinar el tamao muestral de un estudio, deben considerar diferentes situaciones:
(a) Estudios para determinar parmetros, es decir, cuando se pretende hacer inferencias de valores
poblacionales (proporciones, medias) a partir de una muestra (figura 1);
(b) Estudios para contraste de hiptesis, es decir, cuando se pretende comparar si proporciones o las
medias de las muestras son diferentes.
Poblacin
p < 0,0
Seguridad
Muestra
Estimacin
Observacin
(experimento,
medicin)
Intervalo de
Confianza
Resultados
Figura 1. Elementos de la Inferencia Estadstica
( z ) . Para un nivel de seguridad del 95 % =1,96 , para un nivel de seguridad del 99 % = 2,58 ;
n =
z 2 p q
d2
q =1 p
d
n =
1,962 0, 05 0,95
= 203
0, 032
2
Si la poblacin es finita, es decir se conoce el total de la poblacin y se desea saber cuntos individuos hay
que estudiar, la respuesta sera:
n =
donde: N
N z 2 p q
d 2 ( N 1) + z 2 p q
es el total de la poblacin;
2
z 2
q =1 p
d
A cuntas personas de una poblacin de 15.000 habitantes tendra que estudiarse para conocer la
prevalencia de diabetes?
Seguridad = 95 %;
Precisin = 3 %;
Proporcin esperada = asumiendo que puede ser prxima al 5 %; si no se tuviese ninguna idea de dicha
proporcin se utilizara el valor p = 0,5 (50 %) que maximiza el tamao muestral:
n =
( z ) . Para un nivel de seguridad del 95 %, =1,96 , para un nivel de seguridad del 99 % = 2,58 ;
(b) La precisin con que se desea estimar el parmetro ( 2 d es la amplitud del intervalo de confianza);
(c) Una idea de la varianza s
poblacin
n =
z 2 s 2
d2
Por ejemplo, si se desea conocer la media de la glucemia basal de una poblacin, con una seguridad del 95
% y una precisin de 3 mg/dl y se tiene informacin a travs un estudio piloto o de una revisin
bibliogrfica que la varianza es de 250 mg/dl:
n =
1,962 250
= 106, 7
32
n =
N z 2 s 2
d 2 ( N 1) + z 2 s 2
Bilateral: cualquiera de los dos parmetros a comparar (medias o proporciones) puede ser mayor o
menor que el otro. No se establece ninguna direccin;
Unilateral: cuando se considera que uno de los parmetros debe ser mayor que el otro, indicando
por tanto una direccin de las diferencias.
La hiptesis bilateral es una hiptesis ms conservadora y disminuye el riesgo de cometer un error de tipo I
(rechazar la H 0 cuando en realidad es verdadera).
z 2 p (1 p ) + z p (1 p ) + p (1 p )
1
1
2
2
n =
p1 p 2
donde: n
Los valores z segn la seguridad y z segn la potencia del test se indican en la tabla I.
3.2. Tamao muestral en estudios en que se compararn dos proporciones por la prueba
de Fisher-Irwin de probabilidades exactas
En ocasiones, se puede presumir que en la investigacin se incluir una muestra pequea y se compararn
dos grupos por la mencionada prueba de hiptesis.
Se dispone de tablas que proporcionan el tamao muestral por grupo requerido para satisfacer los errores
alfa y beta planteados frente a la comparacin de dos proporciones. A modo de ejemplo, vase los datos
que se proporcionan en la tabla II.
El clculo del tamao muestral para estudiar la diferencia entre dos proporciones en una tabla de 2 x 2, con
hiptesis unilateral, incluye las dos proporciones y los errores y . Debe contemplarse una proporcin
n = 1, 64 1, 6
arcsin
z + z
p1 arcsin
p2
donde: z
arcsin
arcsin
(
(
p1
p2
)
)
es el arco seno (corresponde "al ngulo cuyo seno es el valor dado"1) de la raz
cuadrada de la primera proporcin;
es el arco seno (corresponde "al ngulo cuyo seno es el valor dado") de la raz
cuadrada de la segunda proporcin;
p2
0,80
0,60
0,50
0,40
0,30
0,20
0,10
0,05
0,70
p1
0,50
0,60
0,40
0,30
0,20
67
73
36
84
23
41
85
15
23
42
84
10
15
23
36
73
10
13
19
30
56
11
14
20
34
Tabla I. Tamao muestral necesario por grupo, segn proporciones que se comparan p 1 y p 2 , para
hiptesis unilateral, dado error de 0,05 y de 0,20.
La prueba de hiptesis que se supone se emplear con los resultados del estudio es ji cuadrado.
2 ( z + z ) s2
2
n =
donde: n
d2
s2
d
Los valores z segn el nivel de seguridad y z segn la potencia se indican en la tabla II:
Z
test unilateral
test bilateral
0,200
0,150
0,100
0,050
0,025
0,010
0,842
1,036
1,282
1,645
1,960
2,326
1,282
1,440
1,645
1,960
2,240
2,576
potencia
(1-)
0,01
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,99
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
2,326
1,645
1,282
1,036
0,842
0,674
0,524
0,385
0,253
0,126
0,000
2 ( z + z ) s2
2
n =
d2
z 2 p (1 p ) + z p (1 p ) + p (1 p )
1
1
2
2
n =
p1 p 2
0, 7 + 0,9
= 0,8
p =
2
0, 7 0,9
n = 48 pacientes
1
muestra ajustada a las prdidas = n
1 R
donde: n
OR
p1 (1 p 2 )
= w =
p 2 (1 p1 )
w p 2 (1 p1 ) = p1 (1 p 2 )
p1 (1 p 2 + w p 2 ) = w p 2
p1 =
w p2
(1 p ) + w p
2
As, el problema del clculo del tamao muestral podr abordarse mediante las frmulas habituales
empleadas en la comparacin de dos proporciones.
Recurriendo a las frmulas habituales para determinar el tamao muestral mnimo necesario para la
comparacin de dos proporciones, se precisar conocer:
(a) La magnitud de la diferencia a detectar, que tenga inters clnicamente relevante. En este caso, como
ya se vio, bastara con conocer dos de los siguientes tres parmetros:
(p );
La frecuencia de la exposicin entre los controles ( p ) .
1
(b) El nivel de seguridad o riesgo de cometer un error de tipo I, con que se desea trabajar.
Generalmente con un nivel de seguridad del 95 %, = 0,05 .
(c) La potencia estadstica o riesgo de cometer un error de tipo II (1 ) que se desea para el estudio,. Es
habitual tomar = 0, 2 , es decir, una potencia del 80 %.
Con estos datos, y para un planteamiento bilateral, para el clculo del tamao muestral se utilizar la
expresin:
z 2 p (1 p ) + z
p1 (1 p1 ) + p 2 (1 p 2 )
1
1 2
n =
p1 p 2
donde: p =
p1 + p2
2
[ecuacin 1]
w
p1
p2
z 1 2 y z 1
Hasta ahora se ha asumido un tamao muestral igual para casos y controles. En caso de que el nmero de
casos y controles no est equilibrado, la expresin anterior deber ser ligeramente modificada:
n =
z 1 2
c p1 (1 p1 ) + p 2 (1 p 2 )
c ( p1 p 2 )
donde: n
[ecuacin 2]
es el nmero de casos;
c=m
( c +1) p (1 p ) + z 1
es el nmero de controles; y
p1 =
w p2
(1 p ) + w p
2
=
2
4 0, 40
=
(1 0, 40 ) + 4 0, 40
1,6
= 0,73
0,60 + 1,6
0,73 0, 4
Es decir, se necesitara estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35
controles) para detectar como significativo un valor del OR de 4.
Si se reduce el tamao del efecto a detectar, asumiendo que el OR es aproximadamente igual a 3, se
obtiene:
p1 =
w p2
(1 p ) + w p
2
=
2
3 0, 40
= 0,67
(1 0, 40 ) + 3 0, 40
y, de acuerdo con la ecuacin 1, seran necesarios n = 54 pacientes por grupo para llevar a cabo el estudio.
En algunos estudios, el investigador rene un nmero mayor de controles que de casos con el objeto de
incrementar la potencia estadstica. Supngase que en este ejemplo se planea obtener dos controles por
caso, y se asume que el OR a detectar es aproximadamente igual a 3. Aplicando la ecuacin 2:
n =
n =
z 1 2
(1,96
( c +1) p (1 p ) + z 1
c p1 (1 p 1 ) + p 2 (1 p 2 )
c ( p1 p 2 )
2 0,73 (1 p1 ) + 0, 4 (1 0, 4 )
2 ( 0,73 0, 4 )
40
expuestos
no expuestos
casos
controles
a+b
c+d
a+c
b+d
Tabla III. Disposicin de los sujetos incluidos en un estudio de casos y controles. Tabla de 2 x 2.
n =
donde: n
N z 12 p (1 p )
d 2 ( N 1) + z 12 p (1 p )
es el tamao de la muestra;
es la poblacin total;
es la precisin absoluta.
El tamao de la muestra es, en definitiva, igual a n por el efecto de diseo. El tamao de la poblacin de la
que se extraer la muestra es habitualmente desconocido, pero no es muy importante tener un
conocimiento exacto, basta con una aproximacin razonable.
Por ejemplo, supngase que se estima una proporcin p en la poblacin a estudiar de 7 % y se desea un
tamao muestral que permita, con una seguridad de 95 % (entonces z = 1,96 ), una variacin alrededor de 7
% de hasta 3 %. Ello significa que si la proporcin poblacional es de 7 % se espera, con 95 % de confianza,
obtener un valor entre 410 %. Para estos requisitos, si la poblacin es de 500.000 personas, la muestra
requerida es de 278 casos, si es de 10.000 personas, 271 casos, si slo son 5.000 personas 264 y si son
1.000 personas, 218 casos.
Si se desconoce valor de p an es posible estimar el tamao muestral: en la frmula, la expresin
p (1 p ) tiene un valor creciente a medida que la proporcin p se va acercando a 0,50, alcanza su mximo
en ese punto y luego va descendiendo nuevamente. Entonces, cuando p = 0,50 la mencionada expresin
vale 0,25 y con esa cifra se calcular en la frmula el tamao muestral, que ser el ms elevado para las
condiciones establecidas. Ese tamao de muestra ser, entonces, el apropiado.
10
(a + c)
y b
(b + d )
de modo que
a
LR + =
(a + c)
(b + d )
2 ( r + 1)
N
1+ 1+
N =
4
N r p 2 p1
donde: N =
( r + 1)
p q z r p1 q1 + p 2 q 2
r ( p 2 p1 )
Nr
el otro;
p1 = a
(a + c)
q1 =1 p1 ;
11
p2 = b
(b + d )
q 2 =1 p 2 ;
para hiptesis unilateral es 1,645 (para un error de 0,05) 2,326 (para de
z 1
0,01);
es 0,842 (para un error de 0,20), 1,29 (para 0,10) o 1,645 (para de
0,05);
p=
p1 + r p 2
r +1
;y
q =1 p .
Como es de esperar una prevalencia inferior a 50 %, la muestra que corresponde a verdaderos enfermos
segn estndar ideal ser N r y la de verdaderos no afectados N .
Ahora bien, se puede indicar que para detectar un LR+ de 2,5 o mayor (en hiptesis unilateral), con un error
de 5 % y de 10 %, es decir, una potencia del estudio de 90 %, contemplando una prevalencia de
afectados por la patologa de inters de 25 % en la muestra y falsos positivos de 22 %, se requiere estudiar
un total de 111 casos. Estos se encontrarn distribuidos como 28 y 83 casos. Si la estimacin de falsos
positivos fuera ms alta o ms baja requeriran, respectivamente, menos y ms casos integrando la
muestra, si no se modifica la LR+ escogida.
Efectuada esta primera fase del clculo, se puede perfeccionar estableciendo el intervalo de confianza (IC)
que se considere apropiado o aceptable para la sensibilidad. El intervalo de confianza del 95 % (IC 95 %) de
p1 0,55 o 55 % puede establecerse, por ejemplo, en 10 %.
El error estndar deseado sera 10
1,96
= 5,10 .
Se puede calcular el nmero de casos necesarios para generar ese error estndar, contemplando que el
procedimiento se modifica si la proporcin se aleja mucho de 0,50. El siguiente clculo es adecuado para
muestras no muy pequeas y proporcin no menor de 0,30 o mayor de 0,70. Varios programas informticos
proporcionan este clculo. Como sea, para los fines perseguidos, no se requiere una precisin extrema.
Entonces
5,10 =
(100 55) 55
n
12
n
1+
N =
4
donde: n =
p =
(z
(p
( c + 1) p (1 p )
1 + 2 ( c + 1)
n c p 0 ( RR 1 )
+ z c p 0 (1 p 0 ) + p RR (1 p 0 RR )
c ( p 0 (1 RR ) )
RR ) + ( p 0 + c )
1+ c
q =1 p ;
p0
RR es el riesgo relativo que se considere digno de ser detectado (o mayor): RR = 1 significa que
c
el factor de exposicin no se encuentra asociado a un aumento del riesgo, puesto que este es
igual en expuestos y no expuestos;
es la relacin numrica de expuestos/no expuestos (muestra si las cohortes son de igual
tamao o no);
Un ensayo clnico controlado puede ser considerado un seguimiento de dos cohortes, una expuesta al
tratamiento experimental y la otra no. La similitud se puede comprobar tambin en el clculo del tamao de
la muestra, que genera iguales resultados si se emplea RR de 3, como en el ejemplo recin presentado, o
se calcula con el resultado en la forma de dos proporciones, 0,10 en los no expuestos y 0,30 en los
expuestos.
mnimo de 3 g para poder intentarla. Otro tema es establecer cuntos casos se requiere estudiar en una
situacin especfica para detectar un como diferente de cero o para comparar dos ndices. Lo usual es
tener que efectuar un estudio piloto. Supngase que en un estudio de 50 casos dos observadores clnicos
califican los casos como con o sin una determinada manifestacin clnica como se seala en la Tabla IV.
13
observador A
con
sin total
observador B
con
sin
total
25
10
25
20
25
20
30
50
Tabla IV. Estudio de concordancia entre dos observadores segn presencia de una manifestacin clnica.
En esta, la prevalencia del hallazgo segn el observador A fue de 20
y la prevalencia del hallazgo segn observador B fue de 25
50
= 40 % con IC 95 % (26,754,8 %)
50
= 50 % con IC 95% (35,764,3 %).
Recurdese que si se desea establecer el nmero de casos necesario para detectar un como
significativamente diferente de cero
EE = 0 =
donde: p c
=0:
n (1 pc )
n
es el nmero de casos a estudiar.
El valor p c se puede determinar segn el intervalo de confianza de la prevalencia del hallazgo clnico para
cada observador, de la manera siguiente: Tomando las prevalencias menores, sabiendo que el total de la
tabla es "1" o 100%, de tal manera que, conociendo los marginales 0,357 y 0,267, se puede calcular los
faltantes, como se muestra en la Tabla V.
observador A
con
sin total
observador B
con 0,095
sin
total 0,567
0,357
0,471
0,643
0,733
Tabla V. Estudio de concordancia entre dos observadores segn presencia de una manifestacin clnica.
Determinacin de p c (explicacin en el texto).
Ahora, teniendo los marginales correspondientes a las celdas "a" y "d", se puede calcular a su vez los
valores esperados en esas celdas (0,095 resulta de 0,357 por 0,267, dividido por el total, 1). Finalmente, p c
es igual a la suma de 0,095 y 0,471, es decir 0,566. Por este procedimiento se alcanza a saber que p c
fluctuar entre 0,43 y 0,56. Entonces, si se desea detectar como significativamente diferente de cero un
de 0,25 o mayor, se puede decir que el error estndar de igual a cero debe ser de 0,25/ 1,96, es decir
0,127. Disponiendo del valor p c y del error estndar de = 0 se resolver n a partir la frmula indicada
anteriormente. As, se obtendr que n flucta entre 47 y 79 casos. El tamao muestral ser entonces de 79
casos.
14
5. Bibliografa
Lwanga SK, Lemeshow S. Sample size determination in health studies. A practical manual. Geneva: World
Health Organisation, 1991.
www.fisterra.com/mbe/investiga/9muestras/9muestras.htm
www.itch.edu.mx/academic/industrial/estadistica1/toc.html
www.fisterra.com/mbe/investiga/index.asp
www.seh-lelha.org/stat1.htm
www.isciii.es/htdocs/redes/investen/publicaciones/calculo_muestra.pdf
www.sportsci.org/resource/stats/ssdetermine.html
www.statsdirect.com/help/sample_size_and_methods/ss.htm
www.brodgar.com/PowerAnalysis.pdf
www.uic.edu/classes/epid/epid401/lectures/sampling.pdf
http://myphliputil.pearsoncmg.com/student/bp_berenson_bbs_9/chap06.ppt
www.ilir.uiuc.edu/courses/lir593/chap71999.ppt
http://www.pnl.gov/main/publications/external/technical_reports/PNNL-13434.pdf
www.hqlo.com/content/2/1/26
15