de la muestra Vctor F. Sales Carmona Jos Antonio Orozco Montero CASO CLINICO U na mujer de 50 aos acude a la consulta externa del servicio de cardiologa; refiere que es hlpertensa desde hace cinco aos y que no ha podido ser controlada con diversos medicamentos. En el momento de la consulta, la paciente presenta tensin arterial de 160/110 mmHg. El mdico le prescribe un nuevo medicamento, Privinil, 10 mg al da durante 15 das. Al cabo de dicho lapso de tiempo, la mujer refiere mejora en cuanto a los sntomas y su tensin arterial es de 150/95 mmHg. Ante resultado tan favorable, al mdico le Inquieta saber si esto se debe al azar o en realidad el frmaco funciona mejor que otros hipotensores. Decide realizar un estudio y se pregunta cuntos pacientes necesita incluir y qu diferencia le interesa demostrar. INTRODUCCION En este captulo se describen los conceptos relacionados con la obtencin del tamao de la muestra en los proyectos de investigacin experimental. Esto Incluye mltiples trminos estadsticos que con frecuencia resultan confusos para el mdico. Con una terminologa sencilla se pretende proporcionar respuesta a una de las Interrogantes que con ms frecuen- cia se hace el investigador clnico que se encuentra en la fase de planeacln de un ensayo clnico controlado, quien trata de demostrar que existe una verdadera diferencia entre dos tratamientos. Dicha pre- gunta es: cuntos pacientes se requiere Incluir en el estudio para que, al finalizarlo, ste tenga validez desde el punto de vista estadstico, es decir, que los resultados obtenidos no se deban al azar? 261 262 EPIDEMIOWGIA Tambin se tratan conceptos en cuanto a la determinacin de tamao de la muestra de estudios de prevalencia o Incidencia. Al respecto la determinacin del tamao de la muestra no se efecta con el fin de obtener representatlvidad o validez externa para sta; ello se logra tanto con una definicin adecuada de la poblacin de estudio como con una seleccin apropiada de la muestra (p. ej., con mecanismos aleatorios Independientes de las preferencias personales de los sujetos que condu- cen el estudia) y la muestra es ajena a l nmero de Individuos seleccio- nado para estudiar. TAMAO DE LA MUESTRA EN ENSAYOS CLINICOS CONTROLADOS En este caso, las preguntas sobre el tamao de la muestra se plantean en situaciones en que generalmente un nuevo procedimiento teraputico Va a evaluarse en forma prospectlva y su respuesta constituye uno de los aspectos ms Importantes relacionados con la factibilidad de un estudia; ello no slo en lo que se refiere a la disponibilidad del nmero de pacientes, sino en cuanto a los costos materiales del estudio en
En ocasiones, por falta de un adecuado clculo del tamao de la muestra, puede suceder que los resultados finalmente obtenidos carez- can de signlficancla estadistlca, aun cuando la diferencia clnica que se pretende demostrar sea importante. Esto se debe a que el llamado poder o potencia de la prueba, concepto que se explica ms adelante, no se calcul de manera adecuada o simplemente no se estim. En otras condiciones, el estudio se ha seguido durante mucho tiempo, con inclusin de un nmero Importante de pacientes; cuando se realiza el anlisis de los resultados se demuestra amplia diferencia Incluso desde el punto de vista estadstico. Tal diferencia probablemente hubiera podido demostrarse con un nmero menor de sujetos de estudio, con lo cual se habran requerido menos pacientes en el grupo control y,Sde este modo, haltria disminuido la cifra de Individuos expuestos a recibir un tratamiento menos efectivo, asi como la utilizacin de recursos valiosos. Es importante mencionar que aun cuando existen procedimientos estadisticios vlidos por completo para efectuar el clculo del tamao de la muestra, el nmero obtenido slo proporciona una estimacin apro- ximada de la cantidad necesaria de pacientes. Junto a esto hay que considerar el hecho de que, dadas las caractersticas de estos estudios, siempre se tiene que contar con un excedente, ya que normalmente una cantidad importante de Individuos no puede Incluirse porque stos no cumplen los criterios de inclusin o, en ocasiones, abandonan el trata- miento, o bien porque durante el experimento se cometen violaciones al protocolo, lo que obliga a excluir del estudio a ciertos sujetos. Es decir, el clculo del tamao de la muestra slo brinda una Idea del mnimo de pacientes necesarios para el estudio. CALCULO DEL TAMAO DE LA MUESTRA 263 UTILIDAD CLINICA EN LA TOMA DE DECISIONES Cuando los clnicos se enfrentan a situaciones en las que tienen que decdlr sobre la alternativa de un tratamiento sustentado en estudios publ1cados en revistas mdicas, deben estar seguros de que los resulta- dos de dichos estudios tuvieron como base, adems de un cuidadoso diseo de estudio, una conclusin apropiada en funcin de la significan- cia de la diferencia observada, es decir, si sta fue a favor del tratamiento considerado como control, o bien, del tratamiento experimental. Todos estos aspectos estn determinados por el nmero de pacientes incluidos en el estudio. En otras circunstancias, cuando se obtiene un resultado negativo en un estudio prospectivo se pregunta: el estudio il'cluy el nmero suficiente de Individuos para demostrar que efectivamente no existi diferencia entre los tratamientos probados? Todos los aspectos antes enunciados y los siguientes: las respues- tas a las preguntas planteadas; los errores tipo 1 o 11 para aseverar que existe o no diferencia entre los grupos control y experimental: valores alfa y beta para definir las magnitudes o probabilidades de los errores tipo 1 y n, respectivamente; valores conocidos como }J I y }J2 o " 1 y"" o tambin como "T o "e, para expresar los valores de la variable de inters (}J denota valores promedio, "seala proporciones) en los grupos expe- rimental y control. respectivamente; la importancia de la diferencia clnica, que tambin se conoce como delta (t.) o diferencia entre los grupos control o experimental. que se expresa con la diferencia de promedios o proporciones, y la decisin de utilizar uno o los dos extremos de la curva de distribucin normal de probabll1dades, se describen en este capitulo y se proporciona en detalle su significado por medio de ejemplos prcticos. DIFERENCIA CLINICA O VALOR DE DELTA En cada caso, el valor de delta depende de la enfermedad en cuestin. Suponga el lector que es el consultante del mdico que atendi a la paciente hipertensa del caso clnico inicial; para tratar de establecer la diferencia que quiere demostrarse, se pregunta al responsable del estudio si es Importante la reduccin en promedio de 1 mmHg en la tensin diastlica. Lo ms probable es que el experto de esta rea mdica seale que no lo es y considere que para una reduccin tan pequea no vale la pena Invertir recursos humanos y materiales, ya que los resulta- dos, si fueran positivos, careceran de inters desde el punto de vista clnico. Pero qu sucedera si, por el contrario, la diferencia Investigada fuera la reduccin de la tensin diastlica de 30 mmHg? De nuevo. el experto del rea quiz dira que una reduccin de esa magnitud, para esta enfermedad en especial, es exagerada, tambin carece de valor clnico y muy probablemente genera un nmero Importante de efectos secunda- 264 EPIDEMIOLOGIA rios. En una circunstancia como la ejemplificada, es probable que la r educcin en promedio de 5 mmHg constituya una cifra razonable. La especificacin de la reduccin promedio, que es en realidad la diferencia debida al tratamiento (<l.), es importante desde el punto de vista clnico y, en consecuencia, tambin en cuanto a la planeacin del diseo del estudio. En el ejemplo anterior, el resultado que intere- sa analizar se expresa en forma de promedios; es importante recono- cer esta circunstancia, ya que tanto el clculo del tamao de la muestra como el anlisis de los resultados requiere de frmulas estadistica s especificas. En otras ocasiones, el inters del estudio est centrado en que el efecto del tratamiento produzca la r educcin de sntomas y signos, o bien el incremento de las proporciones d una respuesta clnicamente evaluable. Un ejemplo de estas situaciones lo constituye el estudio de algun a enfermedad neoplsica en el que se quiere saber la cantidad de pacientes para realizarlo. La finalidad principal sera obtener un mayor nmero de pacientes que entren en remisin, es decir, incrementar la proporcin de enfermos que despus de ser tratados muestren curacin. En primer trmino, es importante reconocer 'cul es la proporcin de sujetos en quienes se logra obtener remisin con el tratamiento estndar; es decir, el que es se utiliza regularmente, que ha sIdo validado a travs de estudios clnicos controlados bien diseados y que, adems de producir el mayor nmero de remisiones, provoque el menor nmero de efectos secunda- rios. Por tanto, el primer paso para el clculo del tamao de la muestra es la cuidadosa revisin de la literatura mdica con objeto de Indagar con cul teraputica se ha obtenido la mayor proporcin de remisiones y. desde luego, con el menor nmero de efectos adversos. Si el mejor tratamiento (que se denominar estndar) , muestra que 60% de los pacientes obtiene remisin o desaparicin de todo dato de enfermedad, este dato constituye el punto de partIda del estudio y se llamar efecto observado o proporcin observada en el tratamiento control. que tambin se conoce como "1 o "c. El siguiente paso es la propuesta de la proporcin esperada con ofro tratamiento, el cual se denomina experimental, regU- larmente llama\:lp "1 o "T, cuyos resultados se basan en estudios piloto conocidos tamblen como estudios de fase 11. Es decir, dichos estudios no se han evaluado en trabajos clnicos comparativos, pero no obstante sugieren la posibilidad de un buen resultado, que desde luego haya sido objeto de evaluacin en fases preclnicas y que ahora deba validarse a travs de un ensayo clnico controlado con diseo efectivo. Si se consi- deran las caractersticas de este segundo tratamiento, as como los resultados obtenidos con su uso, y si se supone que existen datos (de acuerdo con los estudios previos) de que se produce una proporcin de remisiones del orden de 75%, la diferencia entre ambas teraputicas (que en este caso, dada su magnitud, s sera clnicamente importante), representa una diferencia de 15% en las proporciones y se conoce con el nombre de delta (A). Cabe aclarar que a mayor diferencia de las respues- tas buscadas, entre los tratamientos control y experimental, la muestra es menor y, por el contrario, una diferencia ms pequea entre ambos grupos requiere una muestra mayor. CALCUW DEL TAMAO DE LA MUESTRA 265 ERRORES TIPOS 1 Y n y NIVELES ALFA Y DELTA Una vez que se han defirudo cules son los valores que interesan, en relacin con la proporcin o con los promedios que se desea mejorar mediante un estudio experimental de acuerdo con la importancia desde el punto de vista clinico, esto es, "1. '" (en el caso de proporciones del grupo control y experimental, respectivamente) o 1'1, 1'2" Y 6., el paso siguiente consiste en plantear una hiptesis o respuesta tentativa por probar. En el caso de proporciones se establece que no existe diferencia entre los tratamientos control y experimental (Ho: "1 - ",) en comparacin con la alternativa de que s hay distincin entre los tratamientos (H 1: "1 ",). Imagine que existe un mecanismo basado en una muestra para tomar una decisin sobre las alternativas que ofrece. la hiptesis; el mecanismo de decisin se basa esencialmente en la diferencia o sustrac- cin de proporciones de los dos grupos. No es dificil darse cuenta que si se toma una decisin slo hay dos posibles tipos de error. Estos errores surgen al responder las siguientes preguntas: si se encuentra diferencia entre ambos tratamientos, qu tan seguro se puede estar de que sta no ocurre nicamente por casualidad? o bien, si no se halla diferencia entre las dos teraputicas, qu tan seguro se puede estar de que efectivamente no la hay? Estas preguntas se plantean con la finalidad de evitar concluir en forma errnea la existencia o ausencia de diferencias entre ambos tratamientos. Esta situacin, en el caso de la primera pregunta, tambin se conoce como error tipo 1; dicho en otra forma, consiste en asegurar de manera errnea que existe diferencia desde el punto de vista estadstico, cuando en realidad no la hay. En el segun- do caso, el llamado error tipo II sucede cuando se asegura, tambin equivocadamente, que no existe diferencia estadstica entre los tra- tamientos cuando en verdad s se presenta. En ambas situaciones, muestras pequeas significan mayor poslb!lldad de cometer uno u otro tipo de error. En otras palabras, el error tipo I consiste en rechazar Hl cuando en realidad es verdadera. El error tipo II consiste en aceptar H 1 cuan- do en realidad es falsa. Este proceso de decisin se presenta en la figura 18-1. . Se denomina alfa (a) al ruvel de slgnlficancia (el nivel aceptado gene- ralmente para considerar que existe diferenCia) que no es dada por casualidad o por el azar, es decir, que al menos 19 en 20 veces el resultado sea favorable al de los dos tratamientos; dicho de otra manera, 95 veces en lOO, o bien, como estadisticamente se expresa, que el valor de p sea Inferior a 0.05 (p<0.05). Este ruvel de slgnlficancla propuesto puede ser ms rgido, por ejemplo de 0.01 o de 0.001. etctera, dependiendo del inters del Investigador. A medida que disminuye el valor de p, aumenta el nivel de slgnlficancla. En ocasiones al error tipo I tambin se le ha llamado error de tipo alfa; en realidad esta denominacin se refiere a que el nivel para no cometer el error tipo 1, ha sido sealado en 0.05 o 0.01. En el caso del error tipo n, depender de la seguridad que se quiera tener para concluir que no hay diferencia cuando, en efecto, la hay y la magnitud desde el punto de vista estadstico que se desea atribuir a este .' 266 Resultado del estudio EPIDEMIOLOGIA HI verdadera Se acepta HI Correcto Se rechaza HI Error tipo I Realidad HI falsa Error tipo 11 Correcto Fig. 18-1. El error tipo I consiste en rechazar Hl cuando en realidad es verdadera. El error tipo 11 consiste en aceptar H 1 cuando en realidad es falsa. valor es conocido como beta (J), valor que al restarse de 1, se denomln'l como poder o potencia de la prueba. En ocasiones, el error tipo n se le llama error tipo beta (J); en realldad, beta (J) se refiere a la magnitud que se desea dar a la posibilidad de concluir que no existe diferencia cuando en realldad s la hay. El poder de la prueba se expresa como 1 - f3, y por lo regular un poder de 80 o 90%, dependiendo de las circunstancias, se considera suficiente, es decir, un valor para beta de 0.20 o 0.10. Mientras mayor sea el nivel de slgnificancia (a) que se busca y mayor el poder que se desea de la prueba (J), ms grande ser el tamao de la muestra (fig. 18-2). Para ejemplificar los errores tipo 1 y tipo n, se retoma el caso de un estudio de las enfermedades neoplslcas. Suponga que al trmino del estudio se reclutaron 50 pacientes evaluables por grupo y que en el grupo experimental la proporcin de remisiones fue de 65% y en el grupo control, de 55% (note que esta cifra es 5% Inferior a la que se haba encontra(io en varios estudios previos). Aun cuando el grupo experimen- tal parece ser superior en sus resull::!-dos, ello no puede asegurarse, ya que al hacerlo probablemente se estara cometiendo un error tipo 1; esto es, que cuando se hace el anllsls estadstico, se encuentra una diferen- cia significativa, cuando en realldad no hay tal desde el punto de vista clnico, lo que equivale a sealar que los resultados pueden estar dados nlcamente'.por casualldad. ..) Cuando ri, se encuentra diferencia estadstica entre dos gruposr\!,qu tan seguro se puede estar de que en real!dad no existe dferencla entre los tratamientos utilizados? Una alternativa es analizar el poder de la prueba. El poder de la prueba es la capacidad de rechazar la mptesls nula cuando sta es verdadera. Al llevar a cabo los clculos correspon- dientes, se encuentra que con los datos proporcionados en el ejerclclO anterior, el poder de la prueba es de 43%; esto significa que proba- blemente se est asegurando que no existe diferencia cuando en realidad puede haberla. Qu sucedi en este estudio? Los datos obtenidos en el grupo control y los del grupo experimental fueron de 60 y 75%, respec- tivamente, por tanto, la diferencia, o delta, es de 15% y la mnima diferencia que se acepta para concluir que los tratamientos son dstintos es de 0.05 o 5%, es decir, el valor de alfa (a) de 0.05 o 5%, y el valor de beta (J) de 0.10 o 10%; esto significa que el poder de la prueba ser de 90% y que se seleccionarn los dos extremos de la curva de posibili- dades de la distribucin normal o gausslana. De acuerdo con todos los 0.2 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 O 84 CALCUW DEL TAMAO DE lA MUESTRA 267 ~ .- f \ / \ / \ / \ / \ \ / ~ \ L alfa & \. ./ hl.. beta '-.. 86 88 9'0 92 94 96 98 100 1-- Media 2 = 90 - Media 1 = 95 Fig. 18-2. Representacin grfica de los errores tipos 1 y 11. valores enunciados y al efectuar el clculo del tamao de la muestra, se sugiere que sta sea de 203 pacientes por grupo, cifra muy diferente a los 50 Individuos por grupo previamente enunciada (cuadro 18- 1). As, es posible explicnr con mayor claridad los resultados del estudio: muy probablemente, si ste se hubiera seguido por ms tiempo o si de alguna forma se hubiera incluido un nmero mayor de sujetos, se habra encontrado que la diferencia entre los dos grupos era estadsticamente significativa. Esto tambin explica en cierta forma por qu en el grupo control el resultado fue Inferior ,: los descritos con anterioridad. De Igual modo, si no se hubiera demostraao diferencia entre los dos grupos, con un poder de la prueba de 90% se habra podido asegurar que la diferencia en realidad no era significativa; en consecuencia se reducira la posibilidad de cometer error tipo n. Qu habra sucedido si los Investigadores hubieran conocido cul deba ser el tamao de la muestra necesario para el estudio? Tal vez habran optado por no realizar ste, ya que los resultados, aun cuando fueran favorables al grupo experimental, desde el punto de vista estadstico no habran sido significativamente impor- tantes, o bien como alternativa se habra elegido efectuar el estudio con la participacin de varios centros hospitalarios. En el caso ejemplificado se utilizaron proporciones tanto para el clculo del tamao de la muestra como para el anlisis de los resultados. Los mismos conceptos se usan al calcular muestras con promedios, con la salvedad de que en esta circunstancia es necesario conocer stos, as como la desviacin estndar de estudios anteriores. 268 EPIDEMIOLOGIA Cuadro 18-1. Tamao de muestras por grupo para la comparacin de dos proporciones en dos conjuntos independientes de pacientes. Niveles de alfa de 0.05 y poder de 0.90 (1-/31 en uno (Al y otros (Bl extremos de la curva de probabilidades de distribucin gaussiana Grupa control Grupo experimental lA) lB) ~ 1r2 0.75 0.60 165 203 0.60 0.50 421 518 0.60 0.30 46 56 0.60 0.20 24 30 0.50 0.40 421 518 0.50 0.25 63 77 0.50 0.20 42 51 0.40 0.30 387 476 0.40 0.25 165 203 0.40 0.20 88 108 0.20 0.15 981 1207 0.20 0.10 212 261 0.20 0.05 76 92 Por ltimo, se coment que en el clculo del tamao de la muestra. en este caso especifico, se utilizan los dos extremos de la curva normal de probabilidades (hIptesis de dos colas); esto se explica porque en el estudio que se propuso, el Inters desde el punto de vista clnico consisti en observar si exista diferencia en los casos que entraran en remisin. sin que trp.portara cul tratamiento era mejor. En general, se s"\Igiere que los dos \;xtremos de la curva de probabilidades se usen en el 6i.lculo del tainao 'de la muestra; ello, cuando va a utilizarse un procedimiento nuevo y exista la posibilidad de que brinde un beneficio, pero tambin que sus efectos puedan ser nocivos. En el caso de las enfermedades neoplslcas. el ejemplo sera que el tratamiento experimental fuera desconocido y que las probabilidades de que los resultados fueran iguales al tratamiento control o Incluso peores. De hecho, excepto en muy contadas ocasiones, el Investigador debe tener siempre en mente que el tratamiento experimental puede tener mayores efectos nocivos que la teraputica estndar. Ahora bien, en qu forma repercuten estos valores en el tamao de la muestra? En el caso de que se use un solo extremo de la curva (esto es, cuando el Inters es demostrar la superioridad de un tratamiento con respecto a otro, sin que baste que sean diferentes), el tamao de la muestra es menor que en el caso de que se utilicen los dos extremos de la curva de distribucin. CALCULO DEL TAMAO DE lA MUESTRA 269 Estas Ideas fundamentales se aplican en general a cualquier tipo de estudio comparativo; en la seleccin de un mtodo adecuado para la determinacin del tamao de la muestra han de considerarse los siguien- tes puntos: 1. Debe determinarse si la variable de Inters es una proporcin o un valor promedio, as como la diferencia clnicamente Importante (<l.). 2. Hay que reconocer el tipo de relacIn de los grupos por comparar, es decir, sI stos son IndependIentes o no. El tipo de relacIn depende del dIseo del estudio; en general se puede afirmar que los grupos no son IndependIentes sI se estudian grupos cruzados (crossover) o pareados. En los ejemplos de este captulo se manejan grupos IndependIentes. , 3. Ha de determInarse la dIreccIn de la hiptesis. En el ejemplo, el Inters consIste en probar silos efectos del tratamIento son alter- nativamente dIferentes (no Importa cul es mejor); esto conoce como hiptesis de dos colas. Exlsten ocasiones en que el Inters se basa en demostrar que un tratamIento es superior con respecto a otro; esto se denomIna hIptesis de una cola. 4. Hay que considerar los valores mxlmos tolerables de los tamaos de los errores, especificando los valores de alfa y beta. 5 Se requiere conocer la variabilIdad Intrnseca de la variable por medIr; es necesario saber la desviacin estndar de la variable de Inters. Este dato puede obtenerse a partir de un estudio piloto o de la literatura. Es probable que anotar las frmulas que habitualmente se utilizan para el clculc.- del tamao de la muestra complique los conceptos que se espera hayan sIdo claros hasta aqu. En todo caso, es ms convenIente proporcionar tablas en que los tamaos de las muestras ya se han calculado, segn los valores de tratamIentos y controles ("1 y "2) y los nIveles de slgnlflcancla deseados (ay (J). En estas tablas slo se muestran algunos de lo.s valores que se usan con mayor frecuencIa. Sin duda, ' ay quien est Interesado en saber ms detalles de cmo calcular el tamao de la muestr,,', o bien quIere conocer dIferentes valores de acuerdo. con las proporcIones deseadas; en tal sItuacIn, las alternativas son remItir al lector a las referencIas que se sealan al final de este captulo O dar una explicacIn ms detallada con el uso de la frmula que regularmente se utiliza en este tipo de situaciones, que es como sigue: N 2 (Za+Zp) + 2it(I-1i) I grupo = <1.2 en donde: NI grupo representa el tamao de la muestra en cada grupo; por tanto, 2N es el tamao total de la muestra. Z. corresponde al valor de p dentro de la curva normal de probabi- lidades; as, por ejemplo, 0.05 corresponde a un valor de Z Igual a 1.645 en un solo extremo de la curva, ya 1.960 en los dos extremos. 270 EPIDEMIOLOGlA Z ~ representa el valor de p, tambin dentro de la curva de probabi- lidades. En este caso, el valor es de 0.10 que corresponde a un valor de 1.282, lo cual da un poder de prueba de 1 - ti, o sea, 0.90. Ji corresponde al promedio de n:l y "2. ~ , corresponde a la diferencia entre "1 y "2. "1, corresponde a la proporcin del grupo control. "2, corresponde a la proporcin del grupo experimental. Al sustituir los valores del mismo ejemplo de las enfermedades neopl- slcas en la frmula se tiene: N/grupo = 2 (1.960 + 1.282)2 0 . 67 5(0.325) = 205 (0.15)2 El tamao de la muestra es de 205 pacientes por grupo. es decir. 410 en total. En el caso de la determinacin del tamao de la muestra, cuando los valores estn expresados en promedios y el diseo es de grupos Independientes, la frmula para calcular aqul es diferente; no obstante, el principio es el mismo. La frmula que regularmente se usa en estos casos es; N 2 (Za + Zp) el- /grupo = t. en donde los valores son los mismos que en la frmula anterior para Z, y Zp; a - desviacin estndar (valor que debe provenir de un estudio previo); t. - la diferencia entre .JI y .J2; .JI, corresponde al promedio del grupo de control, y .J2 - corresponde al promedio del grupo experimental. Para dar un ejemplo de esta situacin se utiliza de nuevo el ejemplo del hlpertensivo para el tratamiento de la hipertensin arterial esencial. Se supone que la diferencia que Interesa demostrar entre el grupo lxperimental y el grupo control es de 5 mmHg, la cual, como ya se seal, ~ I ? clnicamente Importante. SI se considera qu valor.es de la tensin iastllca, en estudios previos bien diseados, muestra'n que la varianza obtenida en una muestra de pacientes hlpertensos fue descrita como de 3.86 mmHg, como es fcil suponer, al Igual que en el ejemplo previo de las enfermedades neoplslcas, a mayor diferencia entre los valores del grupo experimental y control, el tamao de la muestra ser mayor. Asimismo, a mayor valor de la varianza, mayor es el tamao de la muestra. Los valores de alfa (a) y el poder de la prueba se eligen con el mismo criterio que para los ejemplos previos; nuevamente ser de alfa de 0.05, es decir de Za - 1.960 (se toman las dos colas de la distribucin normal); beta ({J) de 0.10 o sea, Zp - 1.282, esto es, un poder de la prueba de 0.90. Sustituyendo estos dos valores en la frmula: N/ 2 (1.969 + 1.282) z (3.86)2 grupo = . 5 13 CALCULO DEL TAMAO DE LA MUESTRA 271 Es decir, se requieren 26 pacientes en total. o sea, 13 por grupo. La varianza se puede estimar a partir de una muestra de valores como el resultado de la suma de las diferencias, elevadas al cuadrado, entre los valores de cada su.Jeto y el valor promedio de la muestra. La raiz cuadrada de la varianza se conoce como desviacin estndar. Al igual que en el calculo del tamao de la muestra con proporciones, tambin en el caso de promedios es factible utilizar tablas que se han elaborado para este propsito. La tabla que aparece en el cuadro 18-1. puede usarse para el clculo del tamao de la muestra usando prome- dios, y los grupos son independientes. En el cuadro 18-2 se seala el valor de delta estandarizado y el tamao de la muestra correspondiente de acuerdo con los valores sealados para alfa (a) y beta ({J), es decir, 14 pacientes por grupo, canti,dad muy similar a la que se obtiene con la frmula antes descrita. DETERMINACION DEL TAMAO DE MUESTRA PARA ESTUDIOS DE PREVALENCIA O ESTIMACION DE VALORES MEDIOS POBLACIONALES En este tipo de estudios formalmente no existe hiptesis por probar; el inters principal radica en la determinacin (o estimaCin) de un porcen- taje de inters de cierta poblacin (p, eJ., la prevalencia de seropositividad de VlH en la poblacin de donadores de sangre de cierto hospital). Cuando la variable de inters es cuantitativa, el valor de Inters puede ser un valor promedio (cual es la tensin arterial diastlica promedio en adultos sanos en la ciudad de Mxico?). En ambos casos, debe quedar claro que no existe una hiptesis como tal. sino que e! problema se reduce a estimar con precisin la medida de Inters (la proporcin de VlH o e! valor medio de tensin arterial). Para entender la manera en que el tamao de la muestra influye en la precisin de! clculo, si la distribucin de la medida de int.ers es normal o gaussiana, el efecto que se logra al incrementar dichoJamao es que se ':obtienen curvas menos dispersas. La flgura 18-3 mue!,tra el efecto en la forma de curvas normales al incrementar el tamao de. la muestra de una poblacin hipottica de 10 a 20 sujetos para la determinacin de un valor medio de inters (dado que se quiere mostrar el efecto de N en la forma de las curvas, stas se pueden suponer centradas alrededor del valor O, sin que ello afecte de ninguna manera el argumento; en realidad, deban estar centradas alrededor de! verdadero, pero desconocido, valor media). En las curvas normales es posible interpretar el rea bajo la curva como probabilidades. As, para la curva correspondiente a un tamao de N - lO, se puede calcular que la probabilidad de que el verdadero valor medio de inters se encuentre entre -6.20 y 6.20 es de 95%; en cambio, para la curva correspondiente a N 20, para la misma probabilidad de 95%, el Intervalo se reduce; -4.38 a 4.38 (el clculo de dichas probabi- lidades est muy relacionado con la estimacin por medio de intervalos de confianza). En general, si se incrementa el tamao de la muestra, entonces el intervalo disminuye. La idea fundamental es definir un error 272 EPIDEMIOWGIA Cuadro 182. Se seala el valor de delta estandarizado y el tamao de la muestra correspondiente de acuerdo con los valores para alfa (a) y beta (J) Nivel de significancia Una cola a = 0.025 a = 0.05 Dos colas a = 0.05 a = 0.1 Delta estandarizado p = 0.01 0.05 0.1 0.2 P = 0.01 0.08 59 42 34 26 50 0.85 52 37 31 23 45 0.90 47 34 27 21 40 0.95 40 30 25 19 36 1.00 38 27 23 17 33 1.10 32 23 19 14 27 1.20 27 20 16 12 23 1.30 23 17 14 11 20 1.40 20 15 12 10 17 1.50 18 13 11 9 15 El valor de delta estandarizado se obtiene con la siguiente f6rmula: Delta estandarizado .. /JI - P2 a 0.05 0.1 35 28 31 25 28 22 25 20 23 18 19 15 16 13 14 11 12 10 11 9 en donde: PI, es el promedio en el grupo control; pz. el promedio en el grupo experimental; d, es la desviacin estnoar. Sustituyendo con valores la frmula se tiene: Delta estandarizado .. 9 ~ ~ : O .. 1.30, resultado del mecanismo de decisin. 0.2 21 18 16 15 14 11 10 9 8 7 mximo permisible (un Intervalo de error mximo tolerable) e Incremen tar el tamao de la muestra (n) hasta no alcanzar este error. En trminos estadsticos, al Incrementar el tamao de la muestra se obtiene una reduccin en la varlanza o varlabllidad de la medida de Inters, lo que Implica una estimacin ms precisa de esta medida. Debe quedar claro que para llevar a cabo dicho proceso es necesario tener una Idea de la varlabilldad de la curva curfudo n - 1 (o formalmente, de la desviacin estndar poblaclonal); esta vartabllidad es Inherente al proceso de medicin y se debe tanto a factores biolgicos como a caractersticas del Instrumento de medicin. Este valor se puede obtener a travs de un estudio piloto o de una bsqueda en la literatura. Por ejemplo, se desea estimar el tiempo medio de supervivencia a partir del diagnstico de pacientes con cncer en un sitio y estadio particular. Por medio de un estudio piloto en 10 sujetos, se sabe que la desviacin estndar del tiempo de supervivencia es de 43.3 meses. Se quiere calcular el tiempo medio de supervivencia con un error mximo de 4 meses y con una confianza de 95%. En este caso, la frmula para determinar el tamao de la muestra est dada por: I I I CALCULO DEL TAMAfl'O DE lA MUESTRA en donde: e - error mximo a tolerar - cuatro meses u - desviacin estndar - 43.3 meses Z. - limite asociado a la confianza deseada - 1.96 273 Hay que mencionar que, en el ejemplo, se supone una distribucin normal en los tiempos de supervivencia; si ste no fuera el caso, debe modificarse la frmula correspondiente, aunque la Idea fundamental es la misma. CONCLUSION El clculo del tamao de la muestra constituye una parte' fundamental tanto de los estudios en que alguna Intervencin teraputica va a realizarse (esto es, esencialmente en los ensayos clnicos controlados) como de aqullos de prevalencia o incidencia. Aun cuando existen diversos mtodos para su clculo, los principios en general son muy sImilares; esto, al tomar en cuenta los resultados en promedios o proporciones de los estudios previamente realizados, que deben ser el punto de partida de dicho tipo de trabajos. De Igual modo, son Impor- tantes los niveles alfa (a) y beta ({J), con la flnalldad de llegar a conclu- siones vlidas, as como los valores esperados tanto del grupo control, habitualmente conocido, como del grupo experImental, del que existe 0.2 0.18 / 1"\ 0.16 0.14 !.' .12 .. 0.1 0.08 0.06 0.04 0.02 o / \ / .,... 1-..\ J // '\..\ " , f '\ // \\ 77 \\. // \"- . - / ~ ~ ' - I I I I I I I I -10 -8 -4 -2 o 2 4 6 8 10 Fig. 18-3. Distribucin de la media de muestra. n ; nmero de casos. 274 EPIDEMIOLOGIA casi siempre un antecedente que tiene que ser validado para poder generalizar los resultados. Por ltimo. es Importante mencionar que el clculo del tamao de la muestra tiene una estrecha relacin con la factibilidad de la ejecucin del estudio; despus de conocer el nmero necesario de pacientes, una opcin razonable seria no efectuar el estudio si ste rebasa la capacidad del sitio donde pretende llevarse a cabo o las posibilidades de organiza- cin de un trabajo multlcntrlco. Para los lectores interesados en pro- fundizar en ello, se proporciona una amplia serie de referencias en las que el tema se aborda con mayor complejidad. REFERENCIAS Bradford Hlll A: Texto bsico de estadstica mdJca. BuenosAires: El Ateneo. 1980;220229. Bulpitt C: Confldence Intervals. Lancet 1987;28:494-497. eoItan T: Statlstlcs In medicine. Bostan: Little Brown and Company. 1974. Daniel W: Bloestadstica. Mxico: Llmusa. 1982;91-95. Freyman J. Chalmers T. Smlth H: The lmportance oC beta. the type 11 error and sample slze In the design and interpretatJon o the randomized control tria!' N Eng J Med 1978;299;690-694. Frledman L: Fundamentals oC cl1n1caI trlals. 2nd ed. Uttleton. Massachusetts: PSG PubUs- hing Company. 1985. Haybtttle JL, Fowler JF. Emery EW: The number of patlents requlred In a cUntea! tria!. Br J Rad 1971;44;122-125. LanchIn JM: Introductlon to sample size determinatlon and power analysis for cUruca! trials. Contr Clin Trtals 1980;2:93- 103. Levtn J: Fundamentos de estadstica en la Investigacin social. Mxico: Harla. 1977;94-98. Sackett D: CUntcal epidemiology. Am J EpldemJol1969;89:125-128. Sackett D: Rules of ev1dence and cUrucal recommendatIons on the use of antlthrombotlc agents. Chest 1986;89: 125- 128. Schlesselman J: Plannlng a longitudinal study: I. Sample size determination. J Chronlc DJs 1973;26;553-560. ~ .