Está en la página 1de 8

92

Educación Médica

Cómo estimar el tamaño de la muestra


en investigaciones con humanos

R. Dennis

Los trabajos de investigación que involucran apropiada, el desarrollo de nuestro potencial


seres humanos deben ir precedidos, en su etapa investigativo. ¿Cuántas observaciones (o pacien-
de planeación, de un estimativo del tamaño de tes) necesitamos para que nuestras conclusiones
la muestra necesario para obtener conclusio- sean válidas? ¿Cuál es la diferencia entre tener 15
nes valederas. Los conceptos de: error alfa, pacientes? ¿o 30? ¿o 100? ¿Cómo hacemos para
error beta, poder, variabilidad de los resulta- tener una idea, al diseñar un estudio (aunque sea
dos y mínima diferencia, importantes de aproximada), del número de pacientes necesario y
detectar clínicamente justifican este cálculo. del tiempo que podemos tardar en llevarlo a cabo?
Se discuten estos conceptos y la manera de Estas y muchas otras preguntas similares nos pue-
utilizarlos en fórmulas de uso fácil para calcu- den detener en los umbrales de una investigación
lar el tamaño apropiado de la muestra. promisoria por cuanto, en términos generales,
nuestros estudios de pregrado y postgrado nos han
INTRODUCCION proporcionado los elementos necesarios para re-
La curiosidad científica, entendida como el solverlas.
deseo de aumentar nuestros conocimientos, es una Día a día llegan a la unidad de epidemiología
característica propia de los profesionales de la Clínica de nuestra U n i v e r s i d a d , diferentes
medicina. Estos conocimientos pueden aumentar- investigadores en salud con excelentes hipótesis
se mediante la memorización de lecturas y confe- de trabajo, buscando información sobre cuántos
rencias, sistema tradicional en nuestras escuelas individuos son necesarios en el estudio que pien-
de Medicina; o a través de una actitud científica san desarrollar. La mayoría de estos investigado-
validando experimentalmente hipótesis propias res no desean una explicación detallada de cómo
derivadas de estas lecturas o de nuestro trabajo fueron derivadas estas fórmulas, ni de los finísi-
clínico diario. mos detalles de áreas debajo de curvas de distribu-
Estas hipótesis por lo general abarcan temas ción. Sólo desean tener una idea de cómo calcular
como utilidad de un examen diagnóstico, factores el número aproximado de pacientes para su estu-
de riesgo para el desarrollo de una enfermedad, dio particular.
utilidad de una estrategia de tratamiento o el curso Hasta hace algunos años no se había estableci-
natural de una enfermedad. Con frecuencia, sin do la necesidad de calcular el tamaño de la mues-
embargo, nuestras inquietudes investigativas tro- tra en un estudio clínico y no teníamos una idea
piezan con escollos que nos pueden parecer clara de su vital importancia. Freiman, más que
insalvables y limitan, por falta de información nadie, ha contribuido a demostrar el rol crítico que
tiene el tamaño de la muestra en las conclusiones
Rodolfo J Dennis MD., MSc.: Departamento de Medicina Interna y Unidad que se deriven de un estudio. El estudio de Frei-
de Epidemiología Clínica, Pontificia Universidad Javeriana. man (1) demostró que aun en las revistas médicas
Solicitud de separatas al Dr. Dennis. de más alto prestigio por la exigencia de sus edito-

Acta Médica C o l o m b i a n a Vol 14 N°2 - M a r z o - A b r i l - 1989


Tamaño de la muestra en investigaciones con humanos 93

res, se encuentran publicados trabajos cuya defi- error tipo alfa o simplemente un error de tipo falso
ciente planeación indujo a conclusiones equivoca- positivo (Tabla 1). Obviamente, cuando estamos
das. El error consistió en considerar que los trata- evaluando un tratamiento con graves efectos
mientos no diferían entre sí por sus efectos sobre secundarios o una terapia invasiva o una terapia
los grupos tratados. La causa principal de este error cara y de potencial iatrogénico, es no solamente
fue el tamaño inapropiado de las observaciones indeseable sino abiertamente peligroso incurrir en
(muestra) efectuadas. error de tipo I por un tamaño de muestra in-
Pensando en esto y en que los conceptos de error suficiente.
tipo I o tipo II son en ocasiones difíciles de asimi- Hoy en día en la literatura mundial hay una
lar (especialmente este último) elaboré este artícu- prevención general contra los errores alfa; nadie
lo. Pretendiendo únicamente hacer una revisión acepta ya un resultado c o m o positivo si la p está
breve de las razones y de la necesidad de calcular por encima de 0.05. Sin embargo, todavía existe
el tamaño de la muestra y de los recursos metodo- poca preocupación por el efecto de llevar a cabo
lógicos a disposición del investigador para calcu- múltiples análisis estadísticos con los resultados
larla. Aquellos lectores con un interés más profun- de un estudio; entre más pruebas de este tipo se
do en el tema pueden consultar varios libros exce- hagan, con un nivel de significación de 0.05, hay
lentes (2-4). mayor probabilidad de obtener un resultado falso
positivo. Cuando hemos hecho en el transcurso
ERROR Y VARIABILIDAD del análisis de un estudio, 10 exámenes estadísticos
Existen tres razones básicas por las cuales se independientes, la probabilidad de un error de tipo
debe obtener un tamaño aproximado de la muestra: falso positivo (alfa) es del 4 0 % (5). En estos casos
el error de tipo I, el error de tipo II y la variabilidad se puede entonces ser más rígido, y desde el punto
del resultado. de vista clínico práctico, sólo aceptar como váli-
Error tipo I y II. En general, cuando un inves- dos resultados con p menor de 0.01.
tigador se propone comparar, por ejemplo, la efi- El valor p es en realidad una probabilidad; es la
cacia de un tratamiento, formula una hipótesis de probalidad de obtener un resultado tanto ( o más)
trabajo que pueda rebatir o desechar, y que en len- extremo que el observado si la diferencia entre los
guaje estadístico se denomina hipótesis nula. Esta diferentes grupos fuese enteramente debida a
se expresaría más o menos en los siguientes tér- variabilidad del intrumento de medición, o de la
minos: " N o hay una diferencia en eficacia entre el respuesta del paciente, o para abreviar, simple-
tratamiento A y el tratamiento B". Existe también mente por azar (6). Otra forma de expresarlo es
una hipótesis alterna que aceptaríamos al rechazar aquella probabilidad por encima de la cual dire-
la hipótesis nula y se expresaría como: "el trata-
miento A es más efectivo que el tratamiento B".
Cuando el investigador somete a un análisis esta-
dístico sus resultados y obtiene un valor p m e n o r
de 0.05, dice que la diferencia es estadísticamente
significativa, rechaza la hipótesis nula y, por ende,
acepta la hipótesis alterna.
Cuando estamos analizando los resultados de
un estudio como el enunciado, es posible que
aunque en realidad no haya diferencia alguna entre
los grupos estudiados (hipótesis nula verdadera),
concluyamos falsamente que sí la hay y rechacemos
erróneamente la hipótesis nula y aceptemos la
alterna. A esto se le ha llamado error de tipo I,

Acta Med Colomb Vol 14 N°2 - 1989


94 R. Dennis

mos que las diferencias que nos interesan entre los sirve. También es abiertamente indeseable concluir
grupos en estudio, muy probablemente se deben al que dos esquemas de tratamiento son comparables
azar y que m u y problamente son diferencias no en efectividad y en efectos colaterales, cuando en
verdaderas. realidad uno de ellos tiene efectos colaterales
La manera de evaluar (antes de desarrollar el mucho más graves. Estas dos situaciones también
estudio) la probabilidad de obtener un error tipo I tienen implicaciones éticas serias.
es a través del m á x i m o nivel alfa que estamos La manera de evaluar, la probabilidad de obtener
dispuestos a tolerar. El nivel alfa es aquel valor de un error de tipo beta, antes de llevar a cabo el
p por encima del cual nos proponemos rechazar la estudio, es mediante el máximo nivel beta que
hipótesis nula de no diferencia entre los grupos estamos dispuestos a tolerar. Esto equivale a fijar
(tratamientos, factores de riesgo, etc) en estudio. un nivel por debajo del cual un resultado negativo
Por consenso en la literatura médica se ha estable- es un verdadero negativo, y no un resultado
cido una p=0.05 como el máximo nivel alfa tolera- falsamente negativo. Arbitrariamente, al igual que
ble. con el nivel alfa, se ha establecido el máximo nivel
En torno a este uso de p existe una gran polémi- beta aceptable en 0.20; si un estudio tiene una
ca hoy en día. Así por ejemplo, Rothman (6) probabilidad m a y o r del 20% de que su resultado
argumenta que las revistas de medicina deberían sea un falso negativo, se deben tener reservas con
estimular el uso de intervalos de confianza para el sus conclusiones. Al igual que con el error de tipo
informe de resultados en experimentos clínicos en I, a niveles más bajos de beta (0.1, 0.05) menos
vez de niveles de significación Rothman basa su probabilidad de un error de tipo II. Al igual que
afirmación en que los intervalos de confianza con el error de tipo I, a niveles más bajos de beta,
mostrarían tendencias, no un simple punto de corte mayor número de pacientes se necesitan en el
dicotómico positivo o negativo. Los intervalos de estudio (2).
confianza definirían los límites entre los cuales, El valor de la fórmula 1 -beta se ha llamado poder
con una probalidad del 90 o 95%, se encuentra el o sensibilidad del estudio; esto es, la capacidad de
resultado que obtuvimos del estudio. un estudio de encontrar una diferencia significati-
A menores valores de alfa, habrá entonces una va si en realidad la hubiere (Tabla 1). Otra forma
m e n o r posibilidad de incurrir en un error tipo I; de expresar este concepto es que a niveles más
dicho de otra manera, entre menos error alfa que- bajos de beta, el poder del estudio para encontrar
ramos tolerar, más pacientes debemos tener: si una diferencia significativa, si en realidad la hay,
deseamos ser rígidos y sólo tolerar una probabili- aumenta.
dad de error alfa de 0.01, necesitaremos más pa- El concepto de p oder de un estudio es
cientes en el estudio que si vamos a tolerar una de relativamente nuevo, y aún no está ampliamente
0.05. difundido en la literatura médica. Sin embargo,
Cuando estamos analizando el resultado de un cada día más y más informes anotan el poder que
estudio, es posible que aunque verdaderamente tenía el estudio para detectar un resultado positivo
haya diferencias entre los grupos que se estudian si en verdad lo había (7-8), especialmente si
(hipótesis alterna verdadera), concluyamos erró- analizan un resultado negativo en sus conclusiones.
neamente que no la hay y equivocadamente Aunque no se ha determinado una cifra mínima
aceptemos la hipótesis nula y descartemos la aceptable de poder o sensibilidad para calcular el
hipótesis alterna (Tabla 1). A esto se le ha llamado tamaño de las muestras, no se debe usar menos del
error de tipo II, error beta, o simplemente un error 80% (e. g., una probabilidad de error beta del 20%).
de tipo falso negativo. En el análisis crítico de la literatura médica, se
Es indeseable que si estamos evaluando un tra- deben considerar inconclusos aquellos estudios con
tamiento efectivo o más barato o más corto, lo un resultado negativo y con poder o sensibilidad
descartemos como inútil cuando en realidad sí menor del 60%.
Tamaño de la muestra en investigaciones con humanos 95

Para mostrar la profusión de estudios en la lite- vas, pero sin mayor utilidad en la práctica clínica.
ratura mundial con resultados negativos Un ejemplo sería al evaluar dos esquemas antihi-
posiblemente debidos a bajo poder, volvamos al pertensivos. Hipotéticamente, con un número gran-
estudio de Freiman et al (1), en el que analizaron de de pacientes, podemos encontrar que el esque-
71 ensayos clínicos aleatorizados, de múltiples ma A disminuyó la presión arterial diastólica has-
tratamientos que resultaron "negativos" o "sin ta 84 mm de Hg y el esquema B hasta 87 mm de
diferencias". Ellos encontraron que 50 de los 71 Hg, y que esta diferencia f u e estadísticamente
estudios no tenían el suficiente poder para encon- significativa. Para el clínico, 3 mm de Hg no son
trar diferencias incluso d e l 5 0 % entre los tratamien- una diferencia de utilidad práctica y puede con-
tos de los grupos en estudio. Este estudio recalca cluir que las drogas son comparables. Esta es la
el concepto de que los términos poder y error de diferencia básica entre un resultado estadística-
tipo II no son una curiosidad estadística y que son mente significativo pero clínicamente no signifi-
una necesidad en el planeamiento de la investiga- cativo ni importante.
ción médica seria (9). Young et al (8) han public- Al igual que con los errores de tipo I y II, para
ado además un artículo con tablas fáciles de usar poder tener la capacidad de detectar diferencias
para evaluar trabajos con resultados negativos y pequeñas entre los grupos a estudiar, se necesitará
determinar la utilidad del estudio dependiendo del un mayor número de pacientes en los grupos. Otra
número de pacientes y de 1a mínima difercncia entre forma de expresar este concepto es que, si sola-
grupos considerada útil de detectar. mente estamos interesados en explorar diferencias
Variabilidad: La tercera razón básica por la grandes entre los grupos del estudio, necesitaremos
cual calculamos el tamaño adecuado de la muestra menor cantidad de pacientes. El corolario obvio
en un estudio es el concepto de variabilidad de los de esto es que el castigo a pagar será el de no en-
resultados (10). Las medidas de dispersión de una contrar diferencias significativas entre los grupos,
muestra (varianza, desviación estándar) y el pro- si en realidad existe una diferencia menor de la
medio de la misma muestra, guardan una relación que estipulamos. Una alegoría que usamos con
inversa con el tamaño de la muestra usada para frecuencia con nuestros estudiantes de medicina y
obtener esos valores. Los estudios con muestras que facilita 1a explicación de este concepto es la de
pequeñas usualmente no pueden ser informados un pescador y su red. Si el pescador está solamente
con la suficiente precisión como para que sus interesado en pescar tiburones (diferencias gran-
resultados sean útiles. Un ejemplo es el resultado des) tejerá una red poco tupida que le representará
hipotético de un estudio en el cual el riesgo de poco trabajo (tamaño de muestra pequeño). El
contraer cáncer de endometrio cuando una mujer castigo a pagar radicará en no poder pescar sardi-
menopáusica ha estado expuesta a estrógenos es 7 nas (diferencias pequeñas) ya que para eso necesi-
veces más alto que el de una mujer no expuesta; tará una red más tupida (mayor tamaño de mues-
pero con un intervalo de confianza del resultado tra).
que v a r í e entre 1.5 (mínima asociación) y 1.8 Este concepto se amplía en el siguiente ejemplo:
(asociación extrema). Se quiere evaluar un esquema nuevo y promisorio
de preparación del colon para cirugía electiva del
Mínima diferencia clínicamente importante. Las mismo. Se comparará este nuevo esquema contra
fórmulas para el cálculo del tamaño de la muestra el esquema q u e se utiliza de rutina en el hospital
utilizan, además de un estimativo de los errores (grupo control). Al investigador le parece que la
alfa y beta, un estimativo de la mínima diferencia mínima diferencia que clínicamente se justifica
que, como clínicos, pensamos que es útil detectar encontrar (en porcentaje de sobreinfección en el
entre los grupos que se evaluarán (4). postoperatorio) entre los dos esquemas es del 15%,
Con tamaños de muestra grandes, podremos para concluir que el esquema propuesto es mejor
encontrar diferencias estadísticamente significati- que el conocido. Le parece razonable 2 0 % de so-

Acta Med Colomb Vol 14 N°2 - 1989


96 R. Dennis

breinfección en el grupo control según estadísticas Vale decir que cada grupo requiere 72 pacientes
locales, y 5% en el grupo del nuevo esquema, ba- para realizar el estudio propuesto.
sado en la literatura. Con base a este razonamiento
calcula el tamaño de la muestra. Corre el riesgo de
que si en realidad hay diferencias entre los dos
esquemas, pero la diferencia real es de menos del
15% de sobreinfección (por ejemplo 10% o 5%),
el número de pacientes calculado puede no permi- Donde:
tirle encontrar esa m e n o r diferencia, y concluirá n: número de pacientes en cada grupo
falsamente que el nuevo esquema no ofrece nin- c): la diferencia esperada c o m o verdadera entre
guna ventaja y que ambos esquemas son compara- los dos grupos, y que el investigador desea detectar
bles. como importante (clínicamente).
S: Estimativo de la desviación estándar del pro-
FORMULAS DE "BOLSILLO" PARA medio de las observaciones (asumiendo homoge-
CALCULAR EL T A M A Ñ O DE LAS neidad de varianzas y por ende similares desvia-
MUESTRAS ciones estándar entre los grupos). Este estimativo
Varias de estas fórmulas son útiles en más de un puede obtenerse fácilmente de otros estudios en la
tipo de diseño metodológico, pero pensamos que revisión bibliográfica previa al diseño, o de un
didácticamente esmejor dividirlas según el diseño estudio piloto.
que se quiere utilizar para cada uno de los estudios f (alfa y beta): Estimativo de cómputo de los
que tenemos en mente ( 1 1 , 1 2 ) . niveles alfa y beta usados, ver Tabla 2 ( 1 1 ) .

Ejemplo: Se quiere evaluar un antibiótico nue-


vo para el tratamiento de las exacerbaciones infec-
ciosas de la bronquitis crónica y se comparará con
un antibiótico c o m ú n m e n t e usado para esta enti-
dad. Los investigadores piensan que la variable
más importante a investigar es el número de días
Donde: en promedio hasta la mejoría. La diferencia que en
n: número de pacientes necesario en cada grupo
del estudio.
p 1 : estimativo probable de respuesta en el grupo
control, en porcentaje.
p 2 : estimativo probable de respuesta en el grupo
de tratamiento, que el investigador quiere detectar
como diferente d e p 1 .
f (alfa y beta): estimativo de cómputo de los
niveles alfa y beta dispuesto a tolerar y que el
investigador quiere usar, ver Tabla 2 ( 1 1 ) .
La evaluación de una o dos colas difiere con respecto a la interpretación
Ejemplo: Siguiendo con el estudio del protoco- *
de una conclusión estadísticamente significativa. Cuando se usa una
lo de preparación del colon ya anunciado y con P 1 cola, la inferencia es que el valor real que buscamos está por encima
de aquel especificado en la hipótesis nula; cuando evaluamos dos
de 2 0 % y p 2 de 5%, usando un nivel alfa de 0.05 colas, la inferencia es que el valor real puede estar por encima o por
evaluando dos colas y beta de 0.20, tenemos: debajo de lo especificado en la hipótesis nula (14). Con relación al
ejemplo de la preparación del colon, el nuevo esquema bien puede
disminuir la incidencia de infección en el post-operatorio, pero también
puede aumentarla (con respecto al grupo control). En esta situación
se debe usar la columna de dos colas.
Tamaño de la muestra en investigaciones con humanos 97

promedio hasta la mejoría se estimó como clínica- expuesto (e igual cantidad en el no expuesto)
mente importante es de dos días (6 para el nuevo P 1 : probabilidad de desarrollar la enfermedad
antibiótico y 8 para el antibiótico control), con una (blanco) en los no expuestos.
desviación estándar de dos días. Debido a que se p 2 : probabilidad de desarrollar la enfermedad
quiso evitar al m á x i m o la posibilidad de un error (blanco) en los expuestos, obtenida de multiplicar
de tipo I o II, se usó un nivel alfa (dos colas) de P 1 por el RR considerado c o m o útil de detectar.
0.01 y un nivel beta de 0.10: Ejemplo:Se está planeando un estudio para
determinar si hay asociación entre exposición a
analgésicos y el desarrollo de anemia aplásica.
Basado en la literatura, el investigador piensa que
En este caso cada grupo deberá contar con 30 la probabilidad de desarrollar anemia aplásica
pacientes. (incidencia) si no se ha estado expuesto a
B. estudios de cohortes: analgésicos antiinflamatorios no esteroideos es del
En este tipo de diseño se empieza típicamente 0.5%. ¿Cuántos pacientes expuestos y no expues-
con un grupo de individuos expuestos o no tos necesitaría para tener una probabilidad del 80%
expuestos a un factor de riesgo X y sin enfermedad, (poder) de detectar un riesgo relativo de 2 o más
y se siguen prospectivamente en el tiempo hasta usando un nivel alfa de 0.05?
que desarrollan la enfermedad (o el resultado)
blanco que se quiere estudiar. La medida de
asociación clave en este tipo de estudios es el riesgo
relativo (RR). El RR es definido como el riesgo de
desarrollar la enfermedad o el resultado que se
busca en el grupo expuesto, con respecto al riesgo En este caso el investigador deberá conformar
de desarrollar la enfermedad en el grupo no dos cohortes de 4.670 personas cada una.
expuesto a los factores de riesgo identificados. c. E s t u d i o s de casos y c o n t r o l e s :
Ejemplo: el riesgo de desarrollar cáncer de pul- En este tipo de diseño se empieza típicamente
m ó n es de 9 en 100.000 si la persona fue un fuma- con un grupo de personas que han sufrido la
dor moderado, mientras que es sólo de 1 en 100.000 enfermedad blanco, y un grupo de personas que no
si no lo ha sido. El riesgo de desarrollar cáncer de la tienen (grupo control, por lo general asignado
pulmón si la persona ha fumado, con respecto a no por el investigador). Retrospectivamente, se
haberlo hecho, es de 9. Dicho de otra manera: es 9 determina a qué factores de riesgo estuvieron
veces más frecuente el desarrollar cáncer de pul- expuestos ambos grupos, en el lapso considerado
m ó n si se ha f u m a d o que si no se ha fumado. como importante por el investigador. La medida
Para el cálculo del tamaño de la muestra en este de asociación clave en este tipo de estudios es el
tipo de estudios se necesita estimar: riesgo relativo (RR), obtenido de manera indirecta
a) El máximo nivel alfa dispuesto a tolerar; b) el (3).
máximo nivel beta dispuesto a tolerar; c) el míni- Para el Cálculo de tamaño de muestra se necesita
mo riesgo relativo considerado como clínicamen- estimar:
te útil de detectar; d) la incidencia (probabilidad) a) El máximo nivel alfa dispuesto a tolerar; b) el
de la enfermedad en el grupo no expuesto. máximo nivel beta dispuesto a tolerar; c) el mí-
La fórmula es: nimo RR considerado como útil o importante de
detectar; d) la prevalencia (probabilidad) de la
exposición en el grupo sin enfermedad (contro-
les).
Donde: La fórmula a usar es similar a las vistas ante-
n: número de pacientes necesarios en el grupo riormente (11):

Acta Med Colomb Vol 14 N°2 - 1989


98 R. Dennis

análisis estadístico complicado (estudios con apa-


reo de casos y controles, con más de dos grupos,
con diseños de "crossover", o análisis de sobrevi-
Donde:
da, por citar unos cuantos) deben consultarse libros
n: número de pacientes necesarios en cada gru-
o artículos especializados sobre el t e m a (2, 3 , 4 ) o
po.
idealmente contar con la ayuda de un bioestadístico.
p 1 : probabilidad de exposición (prevalencia) en
En ocasiones, se desea demostrar "equivalencia"
el grupo control.
de las intervenciones. Calcular tamaños de mues-
p 2 : probabilidad de exposición en los enfermos,
tra asumiendo que no hay diferencias entre los
calculada del siguiente modo:
grupos resultaría en un n ú m e r o infinito de
pacientes, con las fórmulas antes descritas. La es-
trategia en estos casos es especificar algún valor
X, tal que, intervenciones con diferencias entre ellas
Ejemplo: U s e m o s la misma situación anterior
menores que este valor X puedan ser consideradas
en el diseño de cohortes. Basado en la literatura, el
"igualmente efectivas" o "equivalentes". El espe-
investigador documenta que la probabilidad de
cificar este valor puede ser difícil, pero sin él nin-
exposición a analgésicos en pacientes sin anemia
gún estudio de este tipo podría ser diseñado (3).
aplásica (grupo control) en los 15 días anteriores
Otra forma de enfocar este problema es desde el
al ingreso, es del 20%.
punto de vista de validación de hipótesis: la hipó-
En este caso, p 1 2 0 %
tesis nula sería que las dos intervenciones difieren
en menos de este valor X y la hipótesis alterna
sería el demostrar que sí difieren.
En la práctica, el investigador usualmente tiene
más de una variable en los resultados de los que
quisiera sacar conclusiones válidas. Esto es parti-
cularmente importante en los estudios de casos y
controles en los que se va de "expedición de pes-
Ahora; el investigador debe hacer grupos de 177 ca". Lo indicado en estos casos es calcular el ta-
pacientes, lo cual, desde el punto de vista de maño de la muestra para cada una de estas varia-
eficiencia y costos, con las probabilidades usadas bles y saber en cuáles tiene poder suficiente para
como ejemplo, indica el diseño de casos y contro- sacar conclusiones valederas (12).
les en esta situación.

LIMITACIONES DE LOS CALCULOS DE ABSTRACT


TAMAÑOS DE MUESTRAS Medical Research in h u m a n beings should be
Las fórmulas enunciadas aquí sólo dan una preceded by calculation of the sample size needed
aproximación (aunque cercana) al número real de to obtain valid results. T h e concepts of alpha er-
pacientes necesarios. La atracción que ejerce una ror, beta error, power, result variability, and of the
cifra exacta como las que resultan de estas fórmulas, minimal difference worth finding, are identified
revisten a estos cálculos de un rigor falso que puede not only as the main factors that justify these cal-
prestarse a engaño (6). En lo que sí hay acuerdo en culartions but as elements to be used in easy to
la literatura es que si hay tiempo y los costos lo follow sample size formulas.
permiten, es m á s adecuado sobreestimar los
cálculos del tamaño de la muestra, y si es el caso, REFERENCIAS
acabar temprano el estudio (3, 6). 1. Freíman JA. T h e importance of Beta, the type II error, and sample size in
the design and interpretation of the randomized clinical trial. New Engl J
Para estudios con diseños más sofisticados y de Med 1978; 299: 690-694.
Tamaño de la muestra en investigaciones con humanos 99

2. Schlesselman JJ. Case control Studies; Desing, conduct, analysis. New for administration of metaproterenol in hospitalized patients. Journal of
Y o r k : Oxford University Press; 1982: 144-170. Asthna 1985; 22: 87-92.
3. Friedman LM, Furberg CD, Demets DL. Fundamentals of clincal trials. 8. Young MS, Bresnitz EA, Strom BL. Sample size nomograms for inter-
2a ed, Littleton. PSG Publishing Company Inc; 1985: 83-107. preting negative clinical studies. Ann Int Med 1983; 99:248-251.
4. Fleiss JL. Statistical methods for rates and proportions. 2a ed. New York: 9. Ingelfinger JA, Mosteller F, Thibodeau LA, Ware JH. Biostatistics in
John Wiley and Sons;1982 clinical medicine. New York: Macmillan Publishing Co Ine; 1983.
5. Galen R, Gambino SR. Beyond normality: The predictive value and effi- 10. Fletcher RH, Fletcher RH, Wagner EH. Clinical epidemiology the es-
ciency of medical diagnoses. New York: John Wiley & Sons; 1975:2-3. sentials. Baltimore: Williams & Wilkins 1982; 154:17-37.
6. Rothman KJ. Modem Epidemiology. Boston: Little, Brown and Com- 11. Dobson A J. Calculating sample size. Transactions of the Menzies Foun-
pany; 1986: 79-82,115-125. dation 1984; 7 : 7 5 - 7 9 .
7. Berenberg MJ, Baigelman W, Cupples LA, et al. Comparison of me- 12. Colton T. Statistics in medicine. Boston: Little, Brown and Company;
tered dose ubgaker attached to and aerochamber with an updraft nebulizer 1974:147-161.

Acta Med Colomb Vol 14 N°2 - 1989

También podría gustarte