Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tamaño Muestral PDF
Tamaño Muestral PDF
Notas
ndice
1. INTRODUCCIN 1
2. TAMAO MUESTRAL EN ESTUDIOS PARA DETERMINAR PARMETROS 2
2.1. Tamao muestral para estimar una proporcin 2
2.2. Tamao muestral para estimar una media 3
3. TAMAO MUESTRAL EN ESTUDIOS PARA CONTRASTE DE HIPTESIS 4
3.1. Tamao muestral para comparacin de dos proporciones 4
3.2. Tamao muestral en estudios en que se compararn dos proporciones por la prueba de Fisher-Irwin de
probabilidades exactas 4
3.3. Tamao muestral para la comparacin de dos medias 5
4. TAMAO MUESTRAL EN ESTUDIOS BIOMDICOS 7
4.1 Clculo del tamao muestral en estudios de casos y controles 7
4.2. Tamao muestral en estudios en que se indagar sobre una prevalencia 10
4.3. Tamao muestral en estudios en que se investigar una prueba diagnstica 11
4.4. Tamao muestral en estudios de cohortes 13
4.5. Tamao muestral en estudios de concordancia 13
5. BIBLIOGRAFA 15
1. Introduccin
Todo estudio epidemiolgico lleva implcito en la fase de diseo la determinacin del tamao muestral
necesario para la ejecucin del mismo. El no realizar dicho proceso, puede conducir a dos situaciones
diferentes: primera que se realice el estudio sin el nmero adecuado de pacientes, con lo cual no se podr
ser precisos al estimar los parmetros y adems no se encontraran diferencias significativas cuando en
realidad s existen. La segunda es que se podra estudiar un nmero innecesario de pacientes, lo cual lleva
implcito no solo la prdida de tiempo y de recursos innecesarios sino que adems la calidad del estudio, a
causa de dicho exceso, puede verse afectada en sentido negativo.
Para determinar el tamao muestral de un estudio, deben considerar diferentes situaciones:
(a) Estudios para determinar parmetros, es decir, cuando se pretende hacer inferencias de valores
poblacionales (proporciones, medias) a partir de una muestra (figura 1);
(b) Estudios para contraste de hiptesis, es decir, cuando se pretende comparar si proporciones o las
medias de las muestras son diferentes.
1
Poblacin
p < 0,0
Seguridad Muestra
Observacin
Estimacin (experimento,
medicin)
Intervalo de
Confianza
Resultados
( z ) . Para un nivel de seguridad del 95 % =1,96 , para un nivel de seguridad del 99 % = 2,58 ;
z 2 p q
n =
d2
donde: z = 1,96 = 3,84 ya que la seguridad buscada es del 95 %;
2 2
2
Si la poblacin es finita, es decir se conoce el total de la poblacin y se desea saber cuntos individuos hay
que estudiar, la respuesta sera:
N z 2 p q
n =
d 2 ( N 1) + z 2 p q
donde: N es el total de la poblacin;
2
z 2 es 1,96 si la seguridad deseada es del 95 %;
A cuntas personas de una poblacin de 15.000 habitantes tendra que estudiarse para conocer la
prevalencia de diabetes?
Seguridad = 95 %;
Precisin = 3 %;
Proporcin esperada = asumiendo que puede ser prxima al 5 %; si no se tuviese ninguna idea de dicha
proporcin se utilizara el valor p = 0,5 (50 %) que maximiza el tamao muestral:
( z ) . Para un nivel de seguridad del 95 %, =1,96 , para un nivel de seguridad del 99 % = 2,58 ;
(b) La precisin con que se desea estimar el parmetro ( 2 d es la amplitud del intervalo de confianza);
2
(c) Una idea de la varianza s de la distribucin de la variable cuantitativa que se supone existe en la
poblacin
z 2 s 2
n =
d2
Por ejemplo, si se desea conocer la media de la glucemia basal de una poblacin, con una seguridad del 95
% y una precisin de 3 mg/dl y se tiene informacin a travs un estudio piloto o de una revisin
bibliogrfica que la varianza es de 250 mg/dl:
1,962 250
n = = 106, 7
32
3
Si la poblacin es finita, como previamente se seal, es decir se conoce el total de la poblacin y se
deseara saber cuntos individuos debera estudiarse, la respuesta sera:
N z 2 s 2
n =
d 2 ( N 1) + z 2 s 2
p1 p 2
donde: n es el nmero de sujetos necesarios en cada una de las muestras;
z es el valor z correspondiente al riesgo ;
z es el valor z correspondiente al riesgo ;
p1 es el valor de la proporcin en el grupo de referencia, placebo, control o tratamiento habitual;
p 2 es el valor de la proporcin en el grupo del nuevo tratamiento, intervencin o tcnica;
p es la media de las dos proporciones p1 y p 2 :
Los valores z segn la seguridad y z segn la potencia del test se indican en la tabla I.
3.2. Tamao muestral en estudios en que se compararn dos proporciones por la prueba
de Fisher-Irwin de probabilidades exactas
En ocasiones, se puede presumir que en la investigacin se incluir una muestra pequea y se compararn
dos grupos por la mencionada prueba de hiptesis.
4
Se dispone de tablas que proporcionan el tamao muestral por grupo requerido para satisfacer los errores
alfa y beta planteados frente a la comparacin de dos proporciones. A modo de ejemplo, vase los datos
que se proporcionan en la tabla II.
El clculo del tamao muestral para estudiar la diferencia entre dos proporciones en una tabla de 2 x 2, con
hiptesis unilateral, incluye las dos proporciones y los errores y . Debe contemplarse una proporcin
p1 como "control" o valor "patrn" y la otra p 2 como "experimental". En tales condiciones:
2
z + z
n = 1, 64 1, 6
arcsin
( )
p1 arcsin ( p2 )
donde: z es 1,64 si es 0,05 para una prueba unilateral y 1,96 si es bilateral;
arcsin ( p1 ) es el arco seno (corresponde "al ngulo cuyo seno es el valor dado"1) de la raz
cuadrada de la primera proporcin;
arcsin ( p2 ) es el arco seno (corresponde "al ngulo cuyo seno es el valor dado") de la raz
cuadrada de la segunda proporcin;
p2 p1
0,80 0,70 0,60 0,50 0,40 0,30 0,20
0,60 73
0,50 36 84
0,40 23 41 85
0,30 15 23 42 84
0,20 10 15 23 36 73
0,10 8 10 13 19 30 56 67
0,05 6 9 11 14 20 34
Tabla I. Tamao muestral necesario por grupo, segn proporciones que se comparan p 1 y p 2 , para
hiptesis unilateral, dado error de 0,05 y de 0,20.
La prueba de hiptesis que se supone se emplear con los resultados del estudio es ji cuadrado.
2 ( z + z ) s2
2
n =
d2
donde: n son los individuos necesarios en cada una de las muestras;
z es el valor z correspondiente al riesgo deseado;
1
En una calculadora arcsin sera sin elevado a 1.
5
Los valores z segn el nivel de seguridad y z segn la potencia se indican en la tabla II:
Z
test unilateral test bilateral
0,200 0,842 1,282
0,150 1,036 1,440
0,100 1,282 1,645
0,050 1,645 1,960
0,025 1,960 2,240
0,010 2,326 2,576
potencia
(1-) Z
0,01 0,99 2,326
0,05 0,95 1,645
0,10 0,90 1,282
0,15 0,85 1,036
0,20 0,80 0,842
0,25 0,75 0,674
0,30 0,70 0,524
0,35 0,65 0,385
0,40 0,60 0,253
0,45 0,55 0,126
0,50 0,50 0,000
Tabla II. Valores de z y z ms frecuentemente utilizados.
2 ( z + z ) s2
2
n =
d2
2 (1, 645 + 1, 282 ) 162
2
n = = 19, 49
152
se precisan, pues, 20 pacientes en cada grupo.
Se desea evaluar si el tratamiento T 2 es mejor que el tratamiento T1 para el alivio del dolor para lo que se
disea un ensayo clnico. Se sabe por datos previos que la eficacia del frmaco habitual est alrededor del
70 % y se considera clnicamente relevante si el nuevo frmaco alivia el dolor en un 90 %. El nivel de riesgo
se fija en 0,05 y se desea una potencia estadstica de un 80 %.
6
2
z 2 p (1 p ) + z p (1 p ) + p (1 p )
n =
1 1 2 2
p1 p 2
0, 7 + 0,9
p = = 0,8
2
2
1, 645 2 0,8 (1 0,8 ) + 0,842 0, 7 (1 0, 7 ) + 0,9 (1 0,9 )
0, 7 0,9
n = 48 pacientes
El tamao muestral ajustado a las prdidas
En todos los estudios es preciso estimar las posibles prdidas de pacientes por razones diversas (prdida
de informacin, abandono, no respuesta) por lo que se debe incrementar el tamao muestral respecto a
dichas prdidas. El tamao muestral ajustado a las prdidas se puede calcular:
1
muestra ajustada a las prdidas = n
1 R
donde: n es el nmero de individuos sin prdidas;
R es la proporcin esperada de prdidas.
As por ejemplo, si en el estudio anterior se espera tener un 15 % de prdidas, el tamao muestral
necesario sera:
1
48 = 56
1 0,15
pacientes en cada grupo.
p1 (1 p 2 )
OR = w =
p 2 (1 p1 )
w p 2 (1 p1 ) = p1 (1 p 2 )
p1 (1 p 2 + w p 2 ) = w p 2
w p2
p1 =
(1 p ) + w p
2 2
7
As, el problema del clculo del tamao muestral podr abordarse mediante las frmulas habituales
empleadas en la comparacin de dos proporciones.
Recurriendo a las frmulas habituales para determinar el tamao muestral mnimo necesario para la
comparacin de dos proporciones, se precisar conocer:
(a) La magnitud de la diferencia a detectar, que tenga inters clnicamente relevante. En este caso, como
ya se vio, bastara con conocer dos de los siguientes tres parmetros:
Una idea del valor aproximado del OR que se desea estimar ( w ) ;
(b) El nivel de seguridad o riesgo de cometer un error de tipo I, con que se desea trabajar.
Generalmente con un nivel de seguridad del 95 %, = 0,05 .
(c) La potencia estadstica o riesgo de cometer un error de tipo II (1 ) que se desea para el estudio,. Es
habitual tomar = 0, 2 , es decir, una potencia del 80 %.
Con estos datos, y para un planteamiento bilateral, para el clculo del tamao muestral se utilizar la
expresin:
2
z 2 p (1 p ) + z p1 (1 p1 ) + p 2 (1 p 2 )
n =
1 2 1
[ecuacin 1]
p1 p 2
p1 + p2
donde: p = ;
2
w es una idea del valor aproximado del OR que se desea estimar;
p1 es la frecuencia de la exposicin entre los casos;
Hasta ahora se ha asumido un tamao muestral igual para casos y controles. En caso de que el nmero de
casos y controles no est equilibrado, la expresin anterior deber ser ligeramente modificada:
( )
2
z 1 2 ( c +1) p (1 p ) + z 1 c p1 (1 p1 ) + p 2 (1 p 2 )
n = [ecuacin 2]
c ( p1 p 2 )
2
8
Ejemplo del clculo del tamao muestral en un estudio de casos y controles
Como ejemplo, supngase que se desea estudiar la existencia de una asociacin entre el consumo de
tabaco y el hecho de sufrir un infarto de miocardio. Para poner en evidencia dicha asociacin y cuantificar
su magnitud, se disea un estudio de casos y controles en el que se investigar el consumo de tabaco de
una serie de pacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos
(controles). Se cree que alrededor de un 40 % de los controles son fumadores y se considera como
diferencia importante entre ambos grupos un OR de 4. Con estos datos, se puede calcular el tamao de
muestra necesario en cada grupo para detectar un OR de 4 como significativamente diferente de 1 con una
seguridad del 95 % y una potencia del 80 %. De acuerdo con lo expuesto anteriormente, y conociendo los
siguientes parmetros:
(a) Frecuencia de exposicin entre los controles: 40 %;
(b) OR previsto: 4;
(c) Nivel de seguridad: 95 %;
(d) Potencia estadstica: 80 %.
La frecuencia de exposicin entre los casos vendr dada por:
w p2
p1 = =
(1 p ) + w p
2 2
4 0, 40
= =
(1 0, 40 ) + 4 0, 40
1,6
= = 0,73
0,60 + 1,6
Esto es, se estima que aproximadamente un 73 % de los casos son fumadores.
Aplicando la ecuacin 1, se obtiene:
2
1,96 2 0,565 (1 0,565 ) + 0,84 0,73 (1 0,73) + 0, 4 (1 0, 4 )
n = 35
0,73 0, 4
Es decir, se necesitara estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35
controles) para detectar como significativo un valor del OR de 4.
Si se reduce el tamao del efecto a detectar, asumiendo que el OR es aproximadamente igual a 3, se
obtiene:
w p2
p1 = =
(1 p ) + w p
2 2
3 0, 40
= = 0,67
(1 0, 40 ) + 3 0, 40
y, de acuerdo con la ecuacin 1, seran necesarios n = 54 pacientes por grupo para llevar a cabo el estudio.
En algunos estudios, el investigador rene un nmero mayor de controles que de casos con el objeto de
incrementar la potencia estadstica. Supngase que en este ejemplo se planea obtener dos controles por
caso, y se asume que el OR a detectar es aproximadamente igual a 3. Aplicando la ecuacin 2:
( )
2
z 1 2 ( c +1) p (1 p ) + z 1 c p1 (1 p 1 ) + p 2 (1 p 2 )
n =
c ( p1 p 2 )
2
(1,96 )
2
( 2 +1) 0,565 (1 0,565) + 0,84 2 0,73 (1 p1 ) + 0, 4 (1 0, 4 )
n = 40
2 ( 0,73 0, 4 )
2
9
Por tanto, se necesitar un grupo de n = 40 casos (pacientes con infarto de miocardio) y m = 2 40 = 80
controles para llevar a cabo la investigacin.
El clculo del tamao muestral en los estudios de casos y controles debe formar parte del diseo
metodolgico, ya que la ejecucin de este tipo de estudios es costosa. El iniciar un estudio sin conocer la
potencia estadstica y la seguridad para detectar diferencias, si es que existen, podra ser motivo de incurrir
en un error de tipo II en el sentido de no detectar diferencias cuando realmente las hay.
casos controles
expuestos a b a+b
no expuestos c d c+d
a+c b+d n
Tabla III. Disposicin de los sujetos incluidos en un estudio de casos y controles. Tabla de 2 x 2.
10
4.3. Tamao muestral en estudios en que se investigar una prueba diagnstica
Para estos estudios se requiere conocer: error alfa, error beta, proporcin esperada de falsos positivos o la
especificidad, razn de verosimilitud considerada digna de ser detectada, intervalo de confianza deseado
para la sensibilidad y la prevalencia esperada de la patologa en estudio. (No se comenta con detalle el
procedimiento de clculo).
Las razones de verosimilitud (likelihood ratios, LR), ndices fijos como sensibilidad y especificidad ofrecen
una relacin entre las cuatro celdas (a, b, c, d) de la tabla 2 x 2, en que se estudia una prueba diagnstica:
Es as como, si se considera un LR+, se ver que tal resultado se obtiene de la razn entre las proporciones
a y b de modo que
(a + c) (b + d )
a
LR + =
(a + c)
b
(b + d )
En esta divisin, el numerador corresponde a la sensibilidad de la prueba y el denominador a la proporcin
de falsos positivos (1-especificidad).
Es posible, entonces, plantear la bsqueda del tamao muestral a partir de una comparacin de dos
proporciones (LR), en prueba unilateral (puesto que se espera que el numerador ser mayor que el
denominador, LR+ veces), para lo cual se requerira estimar los falsos positivos (o la especificidad)
probables en esa prueba y la prevalencia esperada del trastorno en estudio dentro de la muestra. Al mismo
tiempo, se debe elegir un valor de LR+ digno de ser detectado, contemplando el nivel de error alfa y beta
que se considere adecuado. Tal comparacin es entre dos proporciones independientes (aunque
intrnsecamente relacionadas) y de tamao casi siempre diferente, con una proporcin de verdaderos
enfermos habitualmente inferior a 50 %.
La estimacin de los falsos positivos determina en parte el LR+ elegible, puesto que, si los primeros
constituyen un 5%, es poco probable que interese un LR+ de 3 si se considera que 5 % x 3 indicar la
sensibilidad de la prueba en tal caso, es decir, 15% y esta seguramente no resultara de mucho inters al
investigador como nivel inicial de deteccin. Del mismo modo, si la proporcin de falsos positivos fuera muy
alta, LR+ puede tener como lmite un valor sorprendentemente bajo. Por ejemplo, una cifra de falsos
positivos del 30 % (0,30) tiene un LR+ lmite posible de 3,33, ya que una cifra mayor supondra una
sensibilidad de la prueba superior al 100 %. Como sea, es generalmente aceptado que LR+ en el margen
de 2 a 5 suele ser de importancia en el sentido que el cambio de la probabilidad previo a la prueba a aquella
despus de la prueba cuando LR+ est en esos valores, sera de una magnitud de consideracin.
El poder estimar algunos valores, como la proporcin de falsos positivos, requiere algn conocimiento
previo de la situacin o efectuar un estudio piloto para obtenerlo.
Aceptando que se cumplen los requisitos para efectuar la correspondiente prueba de hiptesis, de acuerdo
con Fleiss se tendra:
2
N 2 ( r + 1)
N = 1+ 1+
4 N r p 2 p1
( )
2
z ( r + 1) p q z r p1 q1 + p 2 q 2
donde: N =
r ( p 2 p1 )
2
11
p2 = b es la proporcin de falsos positivos (1-especificidad);
(b + d )
q 2 =1 p 2 ;
z 1 para hiptesis unilateral es 1,645 (para un error de 0,05) 2,326 (para de
0,01);
z es 0,842 (para un error de 0,20), 1,29 (para 0,10) o 1,645 (para de
0,05);
p1 + r p 2
p= ;y
r +1
q =1 p .
Como es de esperar una prevalencia inferior a 50 %, la muestra que corresponde a verdaderos enfermos
segn estndar ideal ser N r y la de verdaderos no afectados N .
Ahora bien, se puede indicar que para detectar un LR+ de 2,5 o mayor (en hiptesis unilateral), con un error
de 5 % y de 10 %, es decir, una potencia del estudio de 90 %, contemplando una prevalencia de
afectados por la patologa de inters de 25 % en la muestra y falsos positivos de 22 %, se requiere estudiar
un total de 111 casos. Estos se encontrarn distribuidos como 28 y 83 casos. Si la estimacin de falsos
positivos fuera ms alta o ms baja requeriran, respectivamente, menos y ms casos integrando la
muestra, si no se modifica la LR+ escogida.
Efectuada esta primera fase del clculo, se puede perfeccionar estableciendo el intervalo de confianza (IC)
que se considere apropiado o aceptable para la sensibilidad. El intervalo de confianza del 95 % (IC 95 %) de
p1 0,55 o 55 % puede establecerse, por ejemplo, en 10 %.
5,10 =
(100 55) 55
n
despejando n se obtienen 95 casos.
Esto significa que para lograr el intervalo de confianza deseado el nmero de afectados por la patologa de
inters debe ser de 95 en vez de 28 casos y por lo tanto, conservando la prevalencia estimada, el segundo
grupo debera ser de 285 casos en vez de 83. Esto da un N total definitivo de 383 casos.
Es de destacar que si el nivel de sensibilidad encontrado (0,55), tan cercano a 0,50, fuese mayor o menor,
el nmero de casos encontrado (95) generara un intervalo de confianza ms estrecho. Dicho de otro modo,
en tales circunstancias se requerira una muestra menor.
Por otro lado, el intervalo de confianza de p 2 ser al menos tan estrecho como el de la sensibilidad si la
prevalencia es menor que 0,50, como es usual. Pero si no es as y la prevalencia supera 0,50, para la
muestra calculada el intervalo de confianza de p 2 ser ms ancho de lo deseado.
Es necesario tener presente que el tamao de la muestra, para un mismo LR+, cambiar substancialmente
con la proporcin de falsos positivos. As, si se establece un LR+ deseable de detectar igual o mayor que 3
y p 2 es 0,20, consecuentemente p 1 ser 0,60 y la diferencia a detectar 0,40 (40 %). Para ello se requerir
una muestra pequea por tratarse de una gran diferencia. Sin embargo, si p 2 fuese 0,05, debiera ser 0,15
y la diferencia a detectar slo de 0,10 (10 %), por lo que se requerir una muestra mucho mayor.
12
Si se comenzara con la sensibilidad p 1 y su intervalo de confianza para conocer el respectivo tamao de la
muestra para esa proporcin, segn " r " sera posible conocer la segunda muestra parcial. Sin embargo, de
todas maneras se requiere verificar que el N total no es insuficiente para los errores y establecidos,
particularmente si el valor de p 1 se aleja de 0,50, donde se encontrar un n ms pequeo para el mismo
IC y asimismo si la prevalencia supera 0,50, donde la muestra de no afectados sera menor que la de
enfermos, con un IC mayor que el deseado para el grupo de afectados.
(z )
2
( c + 1) p (1 p ) + z c p 0 (1 p 0 ) + p RR (1 p 0 RR )
donde: n =
c ( p 0 (1 RR ) )
2
p =
(p 0 RR ) + ( p 0 + c )
;
1+ c
q =1 p ;
p0 es la frecuencia de la condicin en estudio en la poblacin no expuesta, expresada en forma
decimal: 0,05 (5 %);
RR es el riesgo relativo que se considere digno de ser detectado (o mayor): RR = 1 significa que
el factor de exposicin no se encuentra asociado a un aumento del riesgo, puesto que este es
igual en expuestos y no expuestos;
c es la relacin numrica de expuestos/no expuestos (muestra si las cohortes son de igual
tamao o no);
es el error y z es su respectivo valor z ;
13
observador A
con sin total
con 25 10 25
observador B
sin 5 20 25
total 20 30 50
Tabla IV. Estudio de concordancia entre dos observadores segn presencia de una manifestacin clnica.
pc
EE = 0 =
n (1 pc )
donde: p c es la proporcin de concordancia dada por el azar; y
n es el nmero de casos a estudiar.
El valor p c se puede determinar segn el intervalo de confianza de la prevalencia del hallazgo clnico para
cada observador, de la manera siguiente: Tomando las prevalencias menores, sabiendo que el total de la
tabla es "1" o 100%, de tal manera que, conociendo los marginales 0,357 y 0,267, se puede calcular los
faltantes, como se muestra en la Tabla V.
observador A
con sin total
con 0,095 0,357
observador B
sin 0,471 0,643
total 0,567 0,733 1
Tabla V. Estudio de concordancia entre dos observadores segn presencia de una manifestacin clnica.
Determinacin de p c (explicacin en el texto).
Ahora, teniendo los marginales correspondientes a las celdas "a" y "d", se puede calcular a su vez los
valores esperados en esas celdas (0,095 resulta de 0,357 por 0,267, dividido por el total, 1). Finalmente, p c
es igual a la suma de 0,095 y 0,471, es decir 0,566. Por este procedimiento se alcanza a saber que p c
fluctuar entre 0,43 y 0,56. Entonces, si se desea detectar como significativamente diferente de cero un
de 0,25 o mayor, se puede decir que el error estndar de igual a cero debe ser de 0,25/ 1,96, es decir
0,127. Disponiendo del valor p c y del error estndar de = 0 se resolver n a partir la frmula indicada
anteriormente. As, se obtendr que n flucta entre 47 y 79 casos. El tamao muestral ser entonces de 79
casos.
14
5. Bibliografa
Lwanga SK, Lemeshow S. Sample size determination in health studies. A practical manual. Geneva: World
Health Organisation, 1991.
www.fisterra.com/mbe/investiga/9muestras/9muestras.htm
www.itch.edu.mx/academic/industrial/estadistica1/toc.html
www.fisterra.com/mbe/investiga/index.asp
www.seh-lelha.org/stat1.htm
www.isciii.es/htdocs/redes/investen/publicaciones/calculo_muestra.pdf
www.sportsci.org/resource/stats/ssdetermine.html
www.statsdirect.com/help/sample_size_and_methods/ss.htm
www.brodgar.com/PowerAnalysis.pdf
www.uic.edu/classes/epid/epid401/lectures/sampling.pdf
http://myphliputil.pearsoncmg.com/student/bp_berenson_bbs_9/chap06.ppt
www.ilir.uiuc.edu/courses/lir593/chap71999.ppt
http://www.pnl.gov/main/publications/external/technical_reports/PNNL-13434.pdf
www.hqlo.com/content/2/1/26
15