P. 1
Tamaño_muestral

Tamaño_muestral

|Views: 10|Likes:
Publicado porCristian Max

More info:

Published by: Cristian Max on Aug 07, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

11/25/2014

pdf

text

original

DETERMINACIÓN DEL TAMAÑO MUESTRAL

Notas
Índice 1. INTRODUCCIÓN 2. TAMAÑO MUESTRAL EN ESTUDIOS PARA DETERMINAR PARÁMETROS
2.1. Tamaño muestral para estimar una proporción 2.2. Tamaño muestral para estimar una media

1 2
2 3

3. TAMAÑO MUESTRAL EN ESTUDIOS PARA CONTRASTE DE HIPÓTESIS

4

3.1. Tamaño muestral para comparación de dos proporciones 4 3.2. Tamaño muestral en estudios en que se compararán dos proporciones por la prueba de Fisher-Irwin de probabilidades exactas 4 3.3. Tamaño muestral para la comparación de dos medias 5

4. TAMAÑO MUESTRAL EN ESTUDIOS BIOMÉDICOS
4.1 Cálculo del tamaño muestral en estudios de casos y controles 4.2. Tamaño muestral en estudios en que se indagará sobre una prevalencia 4.3. Tamaño muestral en estudios en que se investigará una prueba diagnóstica 4.4. Tamaño muestral en estudios de cohortes 4.5. Tamaño muestral en estudios de concordancia

7
7 10 11 13 13

5. BIBLIOGRAFÍA 1. Introducción

15

Todo estudio epidemiológico lleva implícito en la fase de diseño la determinación del tamaño muestral necesario para la ejecución del mismo. El no realizar dicho proceso, puede conducir a dos situaciones diferentes: primera que se realice el estudio sin el número adecuado de pacientes, con lo cual no se podrá ser precisos al estimar los parámetros y además no se encontraran diferencias significativas cuando en realidad sí existen. La segunda es que se podría estudiar un número innecesario de pacientes, lo cual lleva implícito no solo la pérdida de tiempo y de recursos innecesarios sino que además la calidad del estudio, a causa de dicho exceso, puede verse afectada en sentido negativo. Para determinar el tamaño muestral de un estudio, deben considerar diferentes situaciones: (a) Estudios para determinar parámetros, es decir, cuando se pretende hacer inferencias de valores poblacionales (proporciones, medias…) a partir de una muestra (figura 1); (b) Estudios para contraste de hipótesis, es decir, cuando se pretende comparar si proporciones o las medias de las muestras son diferentes.

1

¿a cuántas personas tendría que estudiarse para conocer la prevalencia de diabetes? Seguridad = 95 %.96 . Para un nivel de seguridad del 95 % α =1. medición) Resultados Figura 1. (en este caso 1 – 0. debe conocerse: (a) El nivel de confianza o seguridad (1 − α ) . medias) a partir de una muestra. α (b) La precisión que se desea para el estudio.84 ya que la seguridad buscada es del 95 %.5 (50 %) que maximiza el tamaño muestral: n = 2 2 z2 α × p × q d2 donde: z α = 1. El nivel de confianza prefijado da lugar a un coeficiente ( z ) . Tamaño muestral para estimar una proporción Si se desea estimar una proporción. para un nivel de seguridad del 99 % α = 2.Población p < 0.96 = 3.05).1. (c) Una idea del valor aproximado del parámetro que se quiere medir (en este caso. 2.05 = 0.58 . p d es la proporción esperada (en este caso 5 % ó 0.95 = 203 0. En caso de no tener dicha información se utilizará el valor p = 0.962 × 0. Esta idea se puede obtener revisando la literatura o mediante estudio pilotos previos. Por ejemplo. 05 × 0. Tamaño muestral en estudios para determinar parámetros Con estos estudios se pretende hacer inferencias de valores poblacionales (proporciones. si no se tuviese ninguna idea de dicha proporción se utilizaría el valor p = 0.5 (50 %). Elementos de la Inferencia Estadística 2. Proporción esperada = asumiendo que puede ser próxima al 5 %.95). Precisión = 3 %. q =1 − p es la precisión deseada (en este caso un 3 %): n = 1. una proporción). 032 2 .0… Seguridad Muestra Estimación Intervalo de Confianza Observación (experimento.

2. es la proporción esperada (en este caso 5 % ó 0.576.645. la respuesta sería: n = donde: N es el total de la población. (c) Una idea de la varianza s población 2 de la distribución de la variable cuantitativa que se supone existe en la 2 z2 α s n = d2 Por ejemplo. d 2 × ( N − 1) + z 2 α × p×q N × z2 α × p×q z2 α es 1. α (b) La precisión con que se desea estimar el parámetro ( 2 × d es la amplitud del intervalo de confianza). 032 × (15000 − 1) + 1. con una seguridad del 95 % y una precisión de ± 3 mg/dl y se tiene información a través un estudio piloto o de una revisión bibliográfica que la varianza es de 250 mg/dl: n = 1. si no se tuviese ninguna idea de dicha proporción se utilizaría el valor p = 0.96 .05).24. 7 32 3 .5 % el coeficiente sería 2.95 = 200 0.96. Si la seguridad z α fuese del 99 % el coeficiente sería 2. es decir se conoce el total de la población y se desea saber cuántos individuos hay que estudiar.000 habitantes tendría que estudiarse para conocer la prevalencia de diabetes? Seguridad = 95 %. así: • • • • Si la seguridad z α fuese del 90 % el coeficiente sería 1.95 ).58 . para un nivel de seguridad del 99 % α = 2. ¿A cuántas personas de una población de 15.Si la población es finita. (en este caso 1 − 0. Para un nivel de seguridad del 95 %.962 × 0.962 × 250 = 106. El nivel de confianza prefijado da lugar a un coeficiente ( z ) . 05 = 0. 05 × 0.962 × 0.5 (50 %) que maximiza el tamaño muestral: n = 15000 ×1.95 El coeficiente de z α varía según diferentes niveles de seguridad.96 si la seguridad deseada es del 95 %. 05 × 0. Si la seguridad Zα del 95 % el coeficiente sería 1.2. Precisión = 3 %. Tamaño muestral para estimar una media Si se desea estimar una media habrá que conocer: (a) El nivel de confianza o seguridad (1 − α ) . α =1. 2 p q =1 − p d es la precisión (en este caso se desea un 3 %). Si la seguridad z α fuese del 97. Proporción esperada = asumiendo que puede ser próxima al 5 %. si se desea conocer la media de la glucemia basal de una población.

Tamaño muestral para comparación de dos proporciones  z 2 p (1 − p ) + z p (1 − p ) + p (1 − p )  1 1 2 2 α β  n =    p p −   1 2   donde: n es el número de sujetos necesarios en cada una de las muestras. 3. p1 es el valor de la proporción en el grupo de referencia. p 2 es el valor de la proporción en el grupo del nuevo tratamiento. La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de cometer un error de tipo I (rechazar la H 0 cuando en realidad es verdadera). (d) Potencia estadística (1 −β ) (riesgo de cometer un error β ). la respuesta sería: n = 2 d 2 ( N − 1) + z 2 α s 2 N z2 α s 3. p es la media de las dos proporciones p1 y p 2 : Los valores z α según la seguridad y z β según la potencia del test se indican en la tabla I. 2 z α es el valor z correspondiente al riesgo α . (b) Tener una idea aproximada de los parámetros de la variable que se estudia (a través de la bibliografía o de estudios previos). (e) Definición de si la hipótesis va a ser unilateral o bilateral: • • Bilateral: cualquiera de los dos parámetros a comparar (medias o proporciones) puede ser mayor o menor que el otro. Unilateral: cuando se considera que uno de los parámetros debe ser mayor que el otro. z β es el valor z correspondiente al riesgo β . Para el cálculo del tamaño muestral se precisa conocer: (a) Magnitud de la diferencia a detectar que tenga interés clínicamente relevante. placebo. es decir se conoce el total de la población y se desearía saber cuántos individuos debería estudiarse. Tamaño muestral en estudios en que se compararán dos proporciones por la prueba de Fisher-Irwin de probabilidades exactas En ocasiones. 4 . el investigador pretende comparar dos tratamientos. indicando por tanto una dirección de las diferencias. como previamente se señaló. Tamaño muestral en estudios para contraste de hipótesis Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes.2. intervención o técnica. se puede presumir que en la investigación se incluirá una muestra pequeña y se compararán dos grupos por la mencionada prueba de hipótesis. No se establece ninguna dirección. control o tratamiento habitual. Se pueden comparar dos proporciones o dos medias.1. 3.Si la población es finita. (c) Seguridad del estudio (riesgo de cometer un error α ). Habitualmente.

6 ×   arcsin  donde: z α ( zα + zβ p1 − arcsin ) ( p2 )     2 es 1.40 0. es 0. es el valor mínimo de la diferencia que se desea detectar (datos cuantitativos).70 0. es el valor z correspondiente al riesgo deseado. zβ arcsin arcsin ( ( p1 p2 ) ) es el “arco seno” (corresponde "al ángulo cuyo seno es el valor dado"1) de la raíz cuadrada de la primera proporción. según proporciones que se comparan p 1 y p 2 .20. es el valor z correspondiente al riesgo deseado.05 y β de 0. La prueba de hipótesis que se supone se empleará con los resultados del estudio es ji cuadrado. con hipótesis unilateral. p2 0.20 0.20 84 36 19 14 73 30 20 56 34 67 Tabla I.50 0. Debe contemplarse una proporción p1 como "control" o valor "patrón" y la otra p 2 como "experimental". para hipótesis unilateral.50 0. 3. véase los datos que se proporcionan en la tabla II.64 si α es 0.84 si β es 0.05 para una prueba unilateral y 1. es la varianza de la variable cuantitativa que tiene el grupo control o de referencia.30 0.20.60 p1 0. tanto para una prueba unilateral como bilateral. zα zβ s2 d 1 En una calculadora “ arcsin ” sería “ sin ” elevado a –1.60 0. Tamaño muestral necesario por grupo. El cálculo del tamaño muestral para estudiar la diferencia entre dos proporciones en una tabla de 2 x 2.Se dispone de tablas que proporcionan el tamaño muestral por grupo requerido para satisfacer los errores alfa y beta planteados frente a la comparación de dos proporciones.3.05 73 36 23 15 10 8 6 84 41 23 15 10 9 85 42 23 13 11 0. En tales condiciones:  n = 1.10 0. 5 . dado error α de 0.40 0.80 0.96 si es bilateral. Tamaño muestral para la comparación de dos medias n = donde: n 2 ( z α + z β ) s2 2 d2 son los individuos necesarios en cada una de las muestras.30 0. A modo de ejemplo. es el “arco seno” (corresponde "al ángulo cuyo seno es el valor dado") de la raíz cuadrada de la segunda proporción. 64 × 1. incluye las dos proporciones y los errores α y β .

60 0.674 0.95 0.05 y se desea una potencia estadística del 90 % para detectar diferencias. El nivel de riesgo se fija en 0.50 Zβ 2. 645 + 1.050 0. Se acepta un riesgo de 0.40 0.85 0.282 1. Ejemplo de comparación de dos proporciones Se desea evaluar si el tratamiento T 2 es mejor que el tratamiento T1 para el alivio del dolor para lo que se diseña un ensayo clínico.10 0.75 0.645 1.200 0.842 1.150 0.80 0.960 2.036 0. Ejemplo de comparación de dos medias Se desea utilizar un nuevo fármaco antidiabético y se considera que sería clínicamente eficaz si lograse un descenso de 15 mg/dl respecto al tratamiento habitual con el antidiabético estándar.Los valores z α según el nivel de seguridad y z β según la potencia se indican en la tabla II: α 0.645 1. 282 ) 162 n = = 19.05 y se desea una potencia estadística de un 80 %.282 1.01 0.253 0.385 0.70 0. pues. Se sabe por datos previos que la eficacia del fármaco habitual está alrededor del 70 % y se considera clínicamente relevante si el nuevo fármaco alivia el dolor en un 90 %.50 (1-β) 0.90 0.99 0.524 0. 49 152 se precisan.35 0.960 2.15 0.326 test bilateral 1.05 0. 6 .240 2. 20 pacientes en cada grupo.645 1.25 0.126 0.842 0.45 0. Valores de z α y z β más frecuentemente utilizados.30 0.440 1. si es que existen: n = 2 ( z α + z β ) s2 2 d2 2 2 (1.326 1.65 0.55 0.025 0.036 1.576 potencia β 0. Por estudios previos sabemos que la desviación típica de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl.282 1.20 0.000 Tabla II.010 Zα test unilateral 0.100 0.

7 + 0.9 )      0. la frecuencia de exposición entre los casos. Tamaño muestral en estudios biomédicos 4. w valor aproximado del OR que se desea estimar.9 × (1 − 0. 4. el valor de p 1 . El tamaño muestral ajustado a las pérdidas se puede calcular:  1  muestra ajustada a las pérdidas = n    1− R  donde: n es el número de individuos sin pérdidas.1 Cálculo del tamaño muestral en estudios de casos y controles Supóngase que se quiere llevar a cabo un estudio de casos y controles con el fin de determinar si existe una relación significativa entre la exposición a un factor y la presencia de una determinada enfermedad. si en el estudio anterior se espera tener un 15 % de pérdidas. no respuesta…) por lo que se debe incrementar el tamaño muestral respecto a dichas pérdidas. abandono. puede obtenerse fácilmente: OR = w = p1 (1 − p 2 ) p 2 (1 − p1 ) ⇒ w p 2 (1 − p1 ) = p1 (1 − p 2 ) ⇒ p1 (1 − p 2 + w p 2 ) = w p 2 ⇒ p1 = w p2 2 (1− p ) + w p 2 donde: p1 y p2 son las proporciones esperadas. y se prevé que el OR asociado al factor de estudio es w . Si se conoce la probabilidad de exposición entre los controles p 2 . Así por ejemplo.8 × (1 − 0. R es la proporción esperada de pérdidas. 645 2 × 0.9 = 0. A continuación se explica cómo calcular el tamaño de muestra necesario para contrastar la hipótesis de que el odds ratio (OR) sea igual a 1.8 ) + 0.842 0.8 p = 2 2  1. 7 − 0.9   n = 48 pacientes El tamaño muestral ajustado a las pérdidas 2 En todos los estudios es preciso estimar las posibles pérdidas de pacientes por razones diversas (pérdida de información. 7 .15  pacientes en cada grupo. 7 ) + 0. 7 × (1 − 0. el tamaño muestral necesario sería:  1  48   = 56  1 − 0. z 2 p (1 − p ) + z p (1 − p ) + p (1 − p )  α β 1 1 2 2  n =    p1 − p 2     0.

2 w p1 p2 z 1− α 2 y z 1−β Hasta ahora se ha asumido un tamaño muestral igual para casos y controles. Generalmente con un nivel de seguridad del 95 %.. el problema del cálculo del tamaño muestral podrá abordarse mediante las fórmulas habituales empleadas en la comparación de dos proporciones. En particular. 2 . ) 2 [ecuación 2] m es el número de controles. existen fórmulas específicas para el cálculo del tamaño de la muestra en el caso de que el diseño corresponda a un estudio de casos y controles apareados. y son valores que se obtienen de la distribución normal estándar en función de la seguridad y la potencia seleccionadas para el estudio.96 y z 1−β = 0. α = 0.05 . La frecuencia de la exposición entre los casos 1 2 (b) El nivel de seguridad α o riesgo de cometer un error de tipo I. Debe precisarse que se ha tratado en el presente trabajo de exponer del modo lo más sencillo posible el procedimiento a seguir en el cálculo del tamaño de la muestra en un estudio de casos y controles. Es habitual tomar β = 0. Así. 8 . para el cálculo del tamaño muestral se utilizará la expresión:  z α 2 p (1− p ) + z p1 (1− p1 ) + p 2 (1− p 2 )  1−β 1− 2  n =    p1 − p 2     donde: p = 2 [ecuación 1] p1 + p2 2 .84 . una potencia del 80 %. y para un planteamiento bilateral. (c) La potencia estadística o riesgo de cometer un error de tipo II (1 −β ) que se desea para el estudio. el número de controles vendría dado por m = c × n . que tenga interés clínicamente relevante. como ya se vio. La frecuencia de la exposición entre los controles ( p ) . es la frecuencia de la exposición entre los controles. es decir. Con estos datos. para un nivel de seguridad de un 95 % y una potencia estadística del 80 % se tiene que z 1− α =1. la expresión anterior deberá ser ligeramente modificada: n = donde: n ( z 1− α 2 ( c +1) p (1− p ) + z 1−β c p1 (1 − p1 ) + p 2 (1− p 2 ) 2 c ( p1 − p 2 ) es el número de casos. Así mismo.Así. En caso de que el número de casos y controles no esté equilibrado. se precisará conocer: (a) La magnitud de la diferencia a detectar. es la frecuencia de la exposición entre los casos. bastaría con conocer dos de los siguientes tres parámetros: • • • Una idea del valor aproximado del OR que se desea estimar ( w ) . No obstante. (p ). y c=m n es el número de controles por cada caso. Recurriendo a las fórmulas habituales para determinar el tamaño muestral mínimo necesario para la comparación de dos proporciones. es una idea del valor aproximado del OR que se desea estimar. En este caso. en ocasiones se utilizan para este cálculo expresiones más complejas basadas en una corrección de la fórmula del cálculo del tamaño muestral para la comparación de dos proporciones. con que se desea trabajar.

6 = 0. (d) Potencia estadística: 80 %.6 Esto es.73 0. 40 y.73× (1− 0. (b) OR previsto: 4. 40 ) + 3× 0. y conociendo los siguientes parámetros: (a) Frecuencia de exposición entre los controles: 40 %. de acuerdo con la ecuación 1. el investigador reúne un número mayor de controles que de casos con el objeto de incrementar la potencia estadística. se obtiene: 2 p1 = (1− p ) + w p 2 w p2 = 2 = 3 × 0. 4 × (1− 0.96 c ( p1 − p 2 ) ) 2 ( 2 +1) × 0. 4 × (1− 0. En algunos estudios.73× (1− p1 ) + 0. 40 = (1− 0. 40 ) + 4 × 0.96 2 × 0.84 2 × 0.565× (1− 0. Con estos datos. Supóngase que en este ejemplo se planea obtener dos controles por caso. 4 ) 2 ) 2 2 ( 0.565) + 0. se estima que aproximadamente un 73 % de los casos son fumadores. y se asume que el OR a detectar es aproximadamente igual a 3. Aplicando la ecuación 1. (c) Nivel de seguridad: 95 %.67 (1− 0.565 ) + 0.84 0. serían necesarios n = 54 pacientes por grupo para llevar a cabo el estudio. Si se reduce el tamaño del efecto a detectar. se diseña un estudio de casos y controles en el que se investigará el consumo de tabaco de una serie de pacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos (controles). De acuerdo con lo expuesto anteriormente.73 − 0. 4 ) ≈ 40 9 . La frecuencia de exposición entre los casos vendrá dada por: p1 = = = (1− p ) + w p 2 w p2 = 2 4 × 0.73) + 0.73 − 0. se obtiene:  1. asumiendo que el OR es aproximadamente igual a 3.565× (1− 0.60 + 1. 4   Es decir. Se cree que alrededor de un 40 % de los controles son fumadores y se considera como diferencia importante entre ambos grupos un OR de 4. Aplicando la ecuación 2: n = ( z 1− α 2 ( c +1) p (1− p ) + z 1−β c p1 (1 − p 1 ) + p 2 (1− p 2 ) 2 n = (1.Ejemplo del cálculo del tamaño muestral en un estudio de casos y controles Como ejemplo. supóngase que se desea estudiar la existencia de una asociación entre el consumo de tabaco y el hecho de sufrir un infarto de miocardio. 40 = 0. 4 )   ≈ 35 n =    0. se necesitaría estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35 controles) para detectar como significativo un valor del OR de 4. Para poner en evidencia dicha asociación y cuantificar su magnitud. 40 1. se puede calcular el tamaño de muestra necesario en cada grupo para detectar un OR de 4 como significativamente diferente de 1 con una seguridad del 95 % y una potencia del 80 %.

271 casos. con 95 % de confianza. Disposición de los sujetos incluidos en un estudio de casos y controles. El tamaño de la población de la que se extraerá la muestra es habitualmente desconocido. p d es la proporción esperada en la población.50. igual a n por el efecto de diseño. supóngase que se estima una proporción p en la población a estudiar de 7 % y se desea un tamaño muestral que permita. entonces. obtener un valor entre 4–10 %. Por ejemplo. si es que existen. se necesitará un grupo de n = 40 casos (pacientes con infarto de miocardio) y m = 2 × 40 = 80 controles para llevar a cabo la investigación. el efecto de diseño de la investigación. finalmente. en definitiva. 2 d 2 ( N − 1) + z 1 −α p (1 − p ) 2 N z1 −α p (1 − p ) N z 1−α es el valor de z para el nivel de confianza (1 − α ) . El iniciar un estudio sin conocer la potencia estadística y la seguridad para detectar diferencias. el apropiado.2.000 personas 264 y si son 1. la muestra requerida es de 278 casos. El tamaño de la muestra es.25 y con esa cifra se calculará en la fórmula el tamaño muestral. pero no es muy importante tener un conocimiento exacto. Tamaño muestral en estudios en que se indagará sobre una prevalencia En estos se requiere conocer el tamaño de la población. que será el más elevado para las condiciones establecidas. si la población es de 500.Por tanto. el efecto del diseño y el error α . con una seguridad de 95 % (entonces z = 1. Si se desconoce valor de p aún es posible estimar el tamaño muestral: en la fórmula.96 ). basta con una aproximación razonable. Ello significa que si la proporción poblacional es de 7 % se espera. Este es igual a 1 (no hay efecto de diseño) si se ha empleado un procedimiento de muestreo aleatorio simple o bien sistemático y corresponde a un error sistemático. si sólo son 5. seguidamente el nivel de confianza deseado para la indagación y. podría ser motivo de incurrir en un error de tipo II en el sentido de no detectar diferencias cuando realmente las hay. casos expuestos no expuestos a c a+c controles b d b+d a+b c+d n Tabla III. a continuación se debe establecer cuánto se aceptaría que varíe (precisión).50 la mencionada expresión vale 0. 218 casos. Ese tamaño de muestra será.000 personas. una variación alrededor de 7 % de hasta 3 %. si es de 10.000 personas. El cálculo del tamaño muestral en los estudios de casos y controles debe formar parte del diseño metodológico. Para estos requisitos. la prevalencia esperada.000 personas. es la población total. ya que la ejecución de este tipo de estudios es costosa. la expresión p (1 − p ) tiene un valor creciente a medida que la proporción p se va acercando a 0. En este caso se debe tener una idea aproximada de la prevalencia que se está investigando. alcanza su máximo en ese punto y luego va descendiendo nuevamente. y es la precisión absoluta. cuando p = 0. la precisión deseada (%). La fórmula: n = donde: n es el tamaño de la muestra. 10 . Tabla de 2 x 2. Entonces. 4.

Por ejemplo. si se considera un LR+. Como sea. es generalmente aceptado que LR+ en el margen de 2 a 5 suele ser de importancia en el sentido que el cambio de la probabilidad previo a la prueba a aquella después de la prueba cuando LR+ está en esos valores. Tal comparación es entre dos proporciones independientes (aunque intrínsecamente relacionadas) y de tamaño casi siempre diferente. (No se comenta con detalle el procedimiento de cálculo). se debe elegir un valor de LR+ digno de ser detectado. requiere algún conocimiento previo de la situación o efectuar un estudio piloto para obtenerlo. Tamaño muestral en estudios en que se investigará una prueba diagnóstica Para estos estudios se requiere conocer: error alfa. es la fracción que representa la muestra más pequeña respecto a la mayor.33.4. Aceptando que se cumplen los requisitos para efectuar la correspondiente prueba de hipótesis. ya que una cifra mayor supondría una sensibilidad de la prueba superior al 100 %. es decir. c.30) tiene un LR+ límite posible de 3. para lo cual se requeriría estimar los falsos positivos (o la especificidad) probables en esa prueba y la prevalencia esperada del trastorno en estudio dentro de la muestra. LR+ veces). razón de verosimilitud considerada digna de ser detectada. es poco probable que interese un LR+ de 3 si se considera que 5 % x 3 indicará la sensibilidad de la prueba en tal caso. El poder estimar algunos valores. Al mismo tiempo. Del mismo modo. una cifra de falsos positivos del 30 % (0. si la proporción de falsos positivos fuera muy alta. y que es igual a p 2 × LR + . el numerador corresponde a la sensibilidad de la prueba y el denominador a la proporción de falsos positivos (1-especificidad). sería de una magnitud de consideración. y el otro. si los primeros constituyen un 5%. La estimación de los falsos positivos determina en parte el LR+ elegible. Es posible. 15% y esta seguramente no resultaría de mucho interés al investigador como nivel inicial de detección. se verá que tal resultado se obtiene de la razón entre las proporciones a (a + c) y b (b + d ) de modo que a LR + = b (a + c) (b + d ) En esta división. con una proporción de verdaderos enfermos habitualmente inferior a 50 %. LR). como la proporción de falsos positivos.3. intervalo de confianza deseado para la sensibilidad y la prevalencia esperada de la patología en estudio. error beta. es la sensibilidad de la prueba. Nr r p1 = a (a + c) q1 =1 − p1 . índices fijos como sensibilidad y especificidad ofrecen una relación entre las cuatro celdas (a. Las razones de verosimilitud (likelihood ratios. de acuerdo con Fleiss se tendría: 2 ( r + 1) N′  1 + 1 + N = 4  N ′ r p 2 − p1  donde: N ′ =     2 ( zα ( r + 1) p q − z β r p1 q1 + p 2 q 2 r ( p 2 − p1 ) 2 ) 2 N es uno de los tamaños muestrales. proporción esperada de falsos positivos o la especificidad. en prueba unilateral (puesto que se espera que el numerador será mayor que el denominador. contemplando el nivel de error alfa y beta que se considere adecuado. entonces. LR+ puede tener como límite un valor sorprendentemente bajo. puesto que. en que se estudia una prueba diagnóstica: Es así como. 11 . plantear la búsqueda del tamaño muestral a partir de una comparación de dos proporciones (LR). b. d) de la tabla 2 x 2.

el segundo grupo debería ser de 285 casos en vez de 83. para la muestra calculada el intervalo de confianza de p 2 será más ancho de lo deseado. para los fines perseguidos. si se establece un LR+ deseable de detectar igual o mayor que 3 y p 2 es 0. por ejemplo. El intervalo de confianza del 95 % (IC 95 %) de p1 0. tan cercano a 0.29 (para β 0.10 = despejando n se obtienen 95 casos. por lo que se requerirá una muestra mucho mayor. Como sea.50. para un mismo LR+. Por otro lado. (100 − 55) × 55 n Esto significa que para lograr el intervalo de confianza deseado el número de afectados por la patología de interés debe ser de 95 en vez de 28 casos y por lo tanto. Se puede calcular el número de casos necesarios para generar ese error estándar. una potencia del estudio de 90 %. es decir. si p 2 fuese 0.50. Esto da un N total definitivo de 383 casos. con un error α de 5 % y β de 10 %. Ahora bien. . fuese mayor o menor. debiera ser 0. Sin embargo. Como es de esperar una prevalencia inferior a 50 %.10) o –1. q 2 =1 − p 2 .96 = 5. se puede indicar que para detectar un LR+ de 2. conservando la prevalencia estimada.50. no se requiere una precisión extrema. Pero si no es así y la prevalencia supera 0. contemplando que el procedimiento se modifica si la proporción se aleja mucho de 0.10 . consecuentemente p 1 será 0. 12 .10 (10 %).05).05.70. en ± 10 %. Efectuada esta primera fase del cálculo. –1. contemplando una prevalencia de afectados por la patología de interés de 25 % en la muestra y falsos positivos de 22 %. El siguiente cálculo es adecuado para muestras no muy pequeñas y proporción no menor de 0. Estos se encontrarán distribuidos como 28 y 83 casos. Entonces 5. respectivamente.60 y la diferencia a detectar 0. Así. si no se modifica la LR+ escogida.40 (40 %).5 o mayor (en hipótesis unilateral). Varios programas informáticos proporcionan este cálculo. es –0. como es usual.y q =1 − p . la muestra que corresponde a verdaderos enfermos según estándar ideal será N r y la de verdaderos no afectados N . El error estándar deseado sería 10 1.55). menos y más casos integrando la muestra. cambiará substancialmente con la proporción de falsos positivos. z 1−α zβ p= p1 + r p 2 r +1 para hipótesis unilateral es 1.p2 = b (b + d ) es la proporción de falsos positivos (1-especificidad).55 o 55 % puede establecerse. el intervalo de confianza de p 2 será al menos tan estrecho como el de la sensibilidad si la prevalencia es menor que 0.20.326 (para α de 0.842 (para un error β de 0.05) ó 2.645 (para un error α de 0. Si la estimación de falsos positivos fuera más alta o más baja requerirían. el número de casos encontrado (95) generaría un intervalo de confianza más estrecho.30 o mayor de 0. Es de destacar que si el nivel de sensibilidad encontrado (0. en tales circunstancias se requeriría una muestra menor. Para ello se requerirá una muestra pequeña por tratarse de una gran diferencia.01).15 y la diferencia a detectar sólo de 0.50. se requiere estudiar un total de 111 casos. Es necesario tener presente que el tamaño de la muestra. Dicho de otro modo.20).645 (para β de 0. se puede perfeccionar estableciendo el intervalo de confianza (IC) que se considere apropiado o aceptable para la sensibilidad.

4. La similitud se puede comprobar también en el cálculo del tamaño de la muestra. Tamaño muestral en estudios de concordancia En estudios de concordancia conviene recordar que el índice kappa ( κ ) tiene una distribución normal si el efectivo de la muestra es mayor que 2 g 5 . donde se encontrará un n más pequeño para el mismo IC y asimismo si la prevalencia supera 0. es la relación numérica de expuestos/no expuestos (muestra si las cohortes son de igual tamaño o no).50. Lo usual es tener que efectuar un estudio piloto.10 en los no expuestos y 0. Otro tema es establecer cuántos casos se requiere estudiar en una situación específica para detectar un κ como diferente de cero o para comparar dos índices. 2 13 . donde la muestra de no afectados sería menor que la de enfermos. como en el ejemplo recién presentado. β Un ensayo clínico controlado puede ser considerado un seguimiento de dos cohortes. particularmente si el valor de p 1 se aleja de 0. que genera iguales resultados si se emplea RR de 3. puesto que este es igual en expuestos y no expuestos. es el error β y z β es su respectivo valor z . siendo g el número de categorías en investigación.5.Si se comenzara con la sensibilidad p 1 y su intervalo de confianza para conocer el respectivo tamaño de la muestra para esa proporción. de todas maneras se requiere verificar que el N total no es insuficiente para los errores α y β establecidos. Supóngase que en un estudio de 50 casos dos observadores clínicos califican los casos como con o sin una determinada manifestación clínica como se señala en la Tabla IV. expresada en forma decimal: 0. naturalmente. 0. RR es el riesgo relativo que se considere digno de ser detectado (o mayor): RR = 1 significa que c α el factor de exposición no se encuentra asociado a un aumento del riesgo. o se calcula con el resultado en la forma de dos proporciones.50. En tales circunstancias se puede verificar la hipótesis k = 0 . con un IC mayor que el deseado para el grupo de afectados. el de no expuestos como c × N : n′  1 + N = 4   donde: n′ = 1 + 2 ( c + 1)   n′ c p 0 ( RR − 1 )   2 (z α ( c + 1) p (1 − p ) RR ) + ( p 0 + c ) 1+ c + z β c p 0 (1 − p 0 ) + p RR (1 − p 0 RR ) c ( p 0 (1 − RR ) ) 2 ) 2 p = (p 0 .4. según " r " sería posible conocer la segunda muestra parcial. p0 es la frecuencia de la condición en estudio en la población no expuesta. Tamaño muestral en estudios de cohortes La siguiente fórmula proporciona el número de expuestos requeridos y. q =1 − p . una expuesta al tratamiento experimental y la otra no. es el error α y z α es su respectivo valor z .05 (5 %). 4.30 en los expuestos. La comparación de dos κ requiere un tamaño muestral mínimo de 3 g para poder intentarla. Sin embargo.

095 resulta de 0.567 0.observador A con sin total observador B total con sin 25 5 20 10 20 30 25 25 50 Tabla IV. de la manera siguiente: Tomando las prevalencias menores. Estudio de concordancia entre dos observadores según presencia de una manifestación clínica.8 %) 50 = 50 % con IC 95% (35. En esta. Finalmente. sabiendo que el total de la tabla es "1" o 100%. es decir 0.471 0.357 0. es decir 0.3 %). 05 ) se requiere calcular primero el error estándar de EE κ = 0 = n (1 − pc ) pc donde: p c es la proporción de concordancia dada por el azar.267. es igual a la suma de 0.357 por 0. teniendo los marginales correspondientes a las celdas "a" y "d".267. Estudio de concordancia entre dos observadores según presencia de una manifestación clínica. Entonces.643 1 Tabla V.095 sin total 0.127. κ=0: Recuérdese que si se desea establecer el número de casos necesario para detectar un κ como ( p < 0.25/ 1. si se desea detectar como significativamente diferente de cero un κ de 0. como se muestra en la Tabla V.357 y 0.96. Ahora. El valor p c se puede determinar según el intervalo de confianza de la prevalencia del hallazgo clínico para cada observador. dividido por el total. Por este procedimiento se alcanza a saber que p c 14 . Determinación de p c (explicación en el texto). observador A con sin total observador B con 0.471.095 y 0.733 0. se puede decir que el error estándar de κ igual a cero debe ser de 0. de tal manera que.56.43 y 0. se obtendrá que n fluctúa entre 47 y 79 casos. 1). se puede calcular los faltantes. p c fluctuará entre 0.7–64. se puede calcular a su vez los valores esperados en esas celdas (0. conociendo los marginales 0. Disponiendo del valor p c y del error estándar de κ = 0 se resolverá n a partir la fórmula indicada anteriormente.25 o mayor. El tamaño muestral será entonces de 79 casos. la prevalencia del hallazgo según el observador A fue de 20 y la prevalencia del hallazgo según observador B fue de 25 significativamente diferente de cero 50 = 40 % con IC 95 % (26. y n es el número de casos a estudiar.566.7–54. Así.

com/student/bp_berenson_bbs_9/chap06.htm www.sportsci.com/mbe/investiga/9muestras/9muestras.fisterra.pearsoncmg.com/content/2/1/26 15 .org/stat1.pdf www.com/help/sample_size_and_methods/ss.5. www.uic.html www.org/resource/stats/ssdetermine. Geneva: World Health Organisation.fisterra.html www.uiuc. A practical manual. Sample size determination in health studies. Bibliografía Lwanga SK.pdf http://myphliputil.ppt http://www.pdf www.hqlo.isciii.gov/main/publications/external/technical_reports/PNNL-13434.pnl.edu/courses/lir593/chap71999.edu.statsdirect.asp www.com/mbe/investiga/index.itch.edu/classes/epid/epid401/lectures/sampling.mx/academic/industrial/estadistica1/toc.es/htdocs/redes/investen/publicaciones/calculo_muestra.pdf www.htm www.htm www.com/PowerAnalysis.seh-lelha. Lemeshow S.ppt www. 1991.ilir.brodgar.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->