Está en la página 1de 312

1

UNIVERSIDAD DE CHILE
FACULTAD DE MEDICINA DEPARTAMENTO DE PEDIATRA NORTE

BIOESTADSTICA PARA MEDICINA BASADA EN EVIDENCIAS.

Duffau T. Profesor Titular de Pediatra Universidad de Chile

Dr. Gaston

2002

Las pginas que siguen estn dedicadas a cubrir, en forma general, los temas desarrollados en el Departamento de Pediatra para Tutores de investigacin y para becarios de Pediatra, inicialmente en 1977 y luego en los ltimos 10 aos como parte de su Unidad de Investigacin sobre una base de cursos anuales. Asimismo, ha constituido parte del material docente en seis Cursos Internacionales de Introduccin a la Medicina Basada en Evidencias impartidos los aos 1996-19971998-1999-2000-2001. La idea central es refrescar algunos conocimientos bsicos adquiridos tempranamente y agregar otros de mucho inters. Aunque no hay propiamente una estadstica exclusiva para Medicina Basada en Evidencias, los conceptos asociados al desarrollo y prctica de sta, exigen en lo referente al Anlisis Crtico de la Literatura, un nivel de manejo de ciertos mtodos que permitan detectar las fallas probablemente mas manifiestas y comunes en estudios clnicos. An cuando la mayor parte del material que se ha incluido se puede encontrar en textos tradicionales de bioestadstica, se podr apreciar que la orientacin es algo diferente y, por otra parte, que se ofrecen desarrollados ciertos temas que no se encuentran siempre con facilidad: verificacin de compatibilidad de una distribucin muestral parcialmente olvidados, as como

con la normal, intervalo de confianza de diagnsticas

la desviacin estndar,

estadstico phi ,clculo del tamao muestral en estudios de pruebas y otros, anlisis de la aplicacin de las razones de verosimilitud, el nmero de pacientes necesarios a tratar(NNT), revisin de esquemas de enfoque crtico de la literatura biomdica, alerta ante el empleo de paquetes estadsticos para el computador personal (particularmente el muy difundido EpiInfo), prueba de Ji cuadrado en la comparacin de m proporciones, clculo del tamao muestral para mas de dos grupos, para estudios de equivalencia, comentario sobre validez y tica de la investigacin clnica, as como nuevos problemas. Adems , se cre una nueva seccin dedicada a ejercicios de anlisis crtico de la literatura biomdica. La reiteracin de ciertas ideas en diferentes secciones se ha hecho en beneficio de la mejor comprensin del lector quien, puede lograr una visin mas completa si se ofrecen ngulos distintos de un mismo asunto. Por ltimo, como en ediciones anteriores, se encontrar un conjunto de problemas resueltos y otro por resolver, de utilidad en el desarrollo de sesiones de ejercicios, con o sin apoyo del computador y un docente, sobre los temas que involucran.

Cuarta edicin. Corregida y aumentada. Ao 2002. Registro de Propiedad intelectual primera edicin Inscripcin N 107.120-1999.

Programas Estadsticos mencionados en el texto:


EPIINFO ARCUS MEDCALC WIN EPISCOPE PRIMER POWER BMDP PS

Indice.
INTRODUCCIN PROGRAMAS ESTADSTICOS MENCIONADOS EN EL TEXTO 4 SECCIONES I GENERALIDADES Y DEFINICIN 8 II POBLACIN, VARIABLES, MUESTRAS, CENSO 9 III AZAR, SESGO 9 IV TIPOS DE VARIABLES 11 V TABLA DE DISTRIBUCIN DE FRECUENCIAS 12 VI MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIN 14 VII ESTADGRAFOS, PARMETROS, INFERENCIA 17 VIII DISTRIBUCIN NORMAL 18 IX TEOREMA DEL LMITE CENTRAL 20 X ESTIMADOR ESTADSTICO 20 XI ERROR ESTNDAR 21 XII INTERVALOS DE CONFIANZA 23 XIII PRUEBA DE HIPTESIS 29 XIV BASES DE UNA EXPERIENCIA CLNICA 33 XV DISEO DE UNA EXPERIENCIA CLNICA 35 ALEATORIZACION 37 MINIMIZACIN 38 XVI PRUEBA DE t DE STUDENT PARA MUESTRAS INDEPENDIENTES 41 XVII PRUEBA DE t DE STUDENT PARA MUESTRAS RELACIONADAS 42 XVIII PRUEBAS DE HIPTESIS DE TIPO NO PARAMTRICO Y PARAMTRICO 43 XIX PRUEBAS NO PARAMTRICAS Y SU INDICACIN 44 Ji cuadrado Binomial Kolmogorov-Smirnov n una muestra. Mc Nemar Wilcoxon Signo Pgina 2

6 Fisher-Irwin Ji cuadrado con correccin de Yates Mediana U de Mann-Whitney Kolmogorov-Smirnov, dos muestras. Wald-Wolfowitz Prueba de aleatorizacin. PRUEBA DE JI CUADRADO. Mc NEMAR. 46 Prueba de Ji cuadrado en la comparacin de m proporciones 53 55 (C) r Phi 60 Otras medidas: Riesgo Relativo, Riesgo Atribuible, OR. 61 XXIV ANALISIS DE MATERIAL Y MTODO 63 XXV VERIFICACIN DE COMPATIBILIDAD DE UNA DISTRIBUCIN MUESTRAL CON LA NORMAL 66 XXVI TABLA DE 2 X 2 68 Dos grupos independientes, comparacin de proporciones Dos grupos independientes. Comparacin de variables que no tienen distribucin normal. Estudio de medianas como medidas de tendencia central. Un grupo. Estudio de independencia de dos variables. Estudio de proporciones en dos grupos pareados o un grupo que es su propio control. Estudio de un grupo para analizar discrepancia de dos observadores o dos exmenes Estudio del grado de acuerdo o concordancia entre dos observadores o exmenes. Estudio de una prueba diagnstica. Estudio de cohortes. Estudio caso-control.

XX

52 XXI PRUEBA DE FISHER- IRWIN DE PROBABILIDADES EXACTAS XXII PRUEBA DE WALD- WOLFOWITZ( RUNS TEST) XXIII MEDIDAS DE ASOCIACIN BASADAS EN JI CUADRADO 58 Coeficiente de contingencia 59 Correlacin de atributos 60

7 XXVII EL NMERO DE PACIENTES NECESARIO A TRATAR (NNT). 84 XXVIIITAMAO MUESTRAL EN ESTUDIOS BIOMDICOS 87 Elementos de la estimacin del tamao muestral. Error alfa Error beta Diferencia clnicamente significativa. Hiptesis uni o bilateral. Estudios en que se indagar una prevalencia. Estudios en que se compararn dos proporciones. Estudios en que se compararn dos proporciones por Prueba de Fisher-Irwin de probabilidades exactas. Estudios en que se investigar una prueba diagnstica. Estudios en que se compararn dos promedios. Estudios en que un grupo ser su propio control. Estudios de concordancia. Estudios de cohortes. Estudios caso-control. Estudios que incluyen mas de dos grupos de tratamiento. Estudios de equivalencia XXIX ESTIMACION DEL TAMAO MUESTRAL EN ESTUDIOS BIOMEDICOS EMPLEANDO DIFERENTES PROGRAMAS DE COMPUTACIN 109 XXX ESTADSTICA EN EL PROGRAMA EPIINFO 6.0 113 XXXI MEDICINA BASADA EN EVIDENCIAS(MBE) 121 XXXII MEDICINA BASADA EN EVIDENCIAS: ASPECTOS DEL ANLISIS CRTICO DE LA LITERATURA BIOMDICA 127 Guas de anlisis revisadas: Terapia,Pruebas diagnsticas,Dao. XXXIIIDETERMINACIN DEL GRADO DE ACUERDO ENTRE DOS METODOS DE MEDICION CLINICA 140 XXXIV ANEXO: TABLAS JI CUADRADO, DISTRIBUCION NORMAL , F ,t . 142 Probabilidades de Ji cuadrado segn grados de libertad y valor del estadgrafo. Distribucin normal. Area desde c hasta +c. Distribucin normal.Area desde infinito hasta c o +c Distribucin de Student. Distribucin F. XXXV COMENTARIOS EDITORIALES 149

8 XXXVI ELEMENTOS INTEGRANTES DE UNA PROPUESTA DE PROYECTO DE INVESTIGACIN. 151 XXXVII VALIDEZ Y ETICA DE LA INVESTIGACIN CLINICA 152 XXXVIII EJERCICIOS CON SU SOLUCIN 158 XXXIX RESPUESTAS 164 XXXX EJERCICIOS PARA ANALIZAR CON EL DOCENTE 177-248 XXXXI EJERCICIOS DE ANLISIS CRTICO DE LA LITERATURA 249-270.

Generalidades y definicin. El mtodo experimental, como mtodo cientfico, descansa enteramente en la verificacin experimental de una hiptesis (Bernad C. 1813 1878). Hasta que los fenmenos de cualquier rama del conocimiento son sometidos a medidas y nmeros, ella no puede asumir el estado y dignidad de una ciencia (Galton F. 1822 1911). La estadstica de ninguna manera puede desplazar la importancia de la observacin clnica ni tampoco alterar el juicio personal del investigador frente a determinado fenmeno. La estadstica es y debe ser considerada como un instrumento de trabajo que mdico e investigador deben usar con criterio acertado, con precisin y espritu crtico (Silva C.R. 1952). Diversas definiciones se han dado para caracterizar la estadstica, su mbito y propsito: Es la ciencia de tomar decisiones en base a las observaciones (Sprowls C.). Es el conjunto de mtodos para efectuar decisiones adecuadas frente a la incertidumbre (Wallis & Roberts). El objetivo fundamental de la teora estadstica consiste en investigar la posibilidad de extraer de los datos estadsticos inferencias vlidas, elaborando los mtodos mediante los cuales pueden obtenerse dichas inferencias (Cramer H.). Es una ciencia que aplica las matemticas al mundo real, que recolecta y analiza datos para la toma de

10

decisiones y que sirve de apoyo a la investigacin cientfica y tecnolgica. Estadstica es un conjunto de datos cuantitativos afectados por multiplicidad de causas y mtodos estadsticos son aquellos destinados a la dilucidacin de datos cuantitativos afectados por multiplicidad de causas (Yule).

II. Poblacin, variables, muestras, censo En el estudio estadstico de un problema se debe tener claro que: Poblacin o Universo: es cualquier conjunto amplio de integrantes cuyas caractersticas pueden ser medidas. Por ejemplo: automviles producidos por una fbrica, escolares de la educacin bsica, asistentes a un espectculo pblico,fumadores, adultos mayores, etc.. En una poblacin se pueden medir muchas propiedades pero las que interesan a la estadstica son aquellas que pueden variar y por eso se llaman variables. Son variables comnmente estudiadas: edad, gnero, estado nutricional,nivel socioeconmico, etc.. Cuando en una poblacin se desea investigar una variable es posible efectuar un Censo en donde se analiza la totalidad de los integrantes de esa poblacin o universo. Como habitualmente esto es muy difcil de realizar se recurre a tomar entonces una muestra representativa de la poblacin. Esto significa que en cada ocasin TODOS los miembros de la poblacin deben haber tenido la misma oportunidad de ser elegidos y adems se debe satisfacer un cierto tamao muestral. Una muestra muy pequea con seguridad NO ser representativa. Se debe aclarar, adems , que siendo el universo

11

frecuentemente inabarcable, es usual definir una porcin de l de donde ,en definitiva, se obtendr la muestra. Tal es el universo muestral.

III. Azar, sesgo Se define azar como el conjunto de factores desconocidos e imponderables que determinan la imposibilidad de predecir el resultado de una experiencia. Desde el momento que Ud. sabe el resultado que se producir, puede asegurar que no est realizndose la experiencia conforme al azar. As, como ejemplo, si en un ensayo clnico se asignan los casos a ser tratados segn dos esquemas, no puede ser al azar una asignacin alternante de modo tal que si ya se indic un tratamiento el investigador sabe que el prximo caso debe recibir el otro tratamiento. Se entiende por sesgo la menor o mayor probabilidad que algunos miembros de la poblacin tienen de ser elegidos para integrar la muestra. Por ejemplo en una ciudad se deseaba realizar una encuesta de opinin para lo cual se tom una muestra utilizando el gua de telfonos local. Se efectu la mencionada encuesta llamando por telfono. Como es posible observar, la muestra estuvo sesgada notablemente porque aquellos que no disponan de telfono tenan anulada su probabilidad de ser elegidos para conformar la muestra. Cuando en una esquina se aborda al automovilista para hacerle una encuesta, supongamos relativa a estos vehculos,la muestra resultante no es al azar, aunque podra aceptarse sin plan previo, como no sea encuesto al que se detenga.De cualquier modo , hay una proporcin ,al parecer importante, que evita la encuesta.La proporcin de no respondedores es de gran inters porque aquellos son distintos de los que participan y si la cuanta que representan del total de casos es grande, definitivamente la experiencia no generar resultados tiles.En estudios clnicos ,una prdida de mas del 10% suele considerarse

12

seriamente atentatoria sobre la validez de la investigacin.Mas adelante veremos una forma de resolver esto. El sesgo puede ser evitado tomando las muestras al azar entre todos los integrantes de la poblacin. Hay varias formas de hacer esto: Tablas de nmeros al azar, programas computacionales, tmbola, etc. En la actualidad, la eleccin al azar se efecta infrecuentemente con tablas ,cumpliendo esta funcin la mayora de los paquetes estadsticos de computacin. Tambin se puede definir sesgo como el conjunto de factores que durante cualquier etapa de la inferencia estadstica pueden alejar sistemticamente los resultados de la verdad.Mas adelante volveremos sobre el concepto de inferencia estadstica. Otro aspecto importante es el siguiente: La asignacin al azar para constituir grupos en estudios clnicos, frecuentemente se supone que da por terminado el asunto, quedando los grupos comparables producto de la asignacin al azar. Esto no es as, puesto que la etapa siguiente es comprobar que la asignacin al azar de los grupos fue exitosa, generando conjuntos realmente comparables.Ello significar que las posibles y naturales diferencias observadas sean explicables por variaciones de muestreo generadas por azar con una probabilidad (usualmente) mayor de 5%.

IV. Tipos de Variables Algunas caractersticas que pueden variar de un individuo a otro tambin pueden mostrar variabilidad dentro

13

de un mismo sujeto. As, por ejemplo, si uno desea saber cuanto pesa, va a obtener cambios pequeos y a veces no tanto al emplear balanzas diferentes e incluso al repetir la operacin con una misma balanza. Factores que pueden influir son de orden subjetivo, del instrumento utilizado y otros. Es muy importante reconocer que las variables no son todas de la misma naturaleza. As, es fcil aceptar que unas sern discretas como el nmero de hijos, que podrn ser ninguno, uno, dos, tres... pero nunca 1,5 2,75 hijos y otras sern continuas, como el peso o la estatura, que aceptan toda la gama de valores entre un nmero y otro. En trminos ms generales, las variables pueden ser: Nominales: Aqu est por ejemplo el sexo, color de la piel, los diagnsticos, origen geogrfico, etc.. Ordinales: Incluye las calificaciones como ms que, menor que, leve, moderado e intenso, etc.. El nivel socioeconmico o el estado nutricional son buenos ejemplos de variables ordinales.Pertenecen a este grupo todas las escalas de puntaje para valorar personas:Glasgow, Apgar,cuociente intelectual, Tal, etc. Estas escalas no permiten decir, por ejemplo, que un recin nacido con Apgar 4 est la mitad de bien que otro con Apgar 8 o que est el doble de bien que uno con puntaje dos. Escala de intervalo: Son variables que permiten un ordenamiento como en el caso anterior pero en donde los intervalos o distancias entre dos puntos son de tamao conocido e iguales El punto cero y la unidad de medida son arbitrarios. Ejemplo: la temperatura. Hay varias escalas y el cero no indica ausencia de variable.As , conviene recordar que el cero absoluto es el de la escala Kelvin, indica efectivamente ausencia de temperatura y corresponde a 273 grados bajo cero de la escala centgrada. Esto significa que si tomamos la temperatura con termmetro de ste ltimo tipo,

14

40 grados no es el doble de 20 grados, ya que el cero no es verdadero. Efectivamente, 20 grados corresponde a 273 + 20 =293 grados Kelvin, cuya dimensin es igual a la del grado centgrado.El doble, entonces ser 586 grados Kelvin que corresponden a 586-273 =313 grados centgrados. En definitiva: El doble de la temperatura de 20 grados es 313 grados. Otro ejemplo en el que el cero es arbitrario sera considerar el ao calendario en el que nos encontramos. As el ao 2002 , corresponde al 2755 segn calendario romano, 6238 segn el primer calendario egipcio y 5121 para el calendario maya. Escala de razn: Corresponde a lo anterior ms un punto cero verdadero. Ejemplos comunes son el peso corporal y la estatura. Aqu, el doble de 50 cm. son 100 cm. y el de 15 kg. es 30 kg., cosa que no sucede con la temperatura porque el cero es arbitrario. Ahora, porqu nos interesa precisar y reconocer el tipo de escala de las variables que se estudian?. La razn es que las operaciones estadsticas tienen relacin con el tipo de variable. En lo descriptivo ,por ejemplo, Ud. no puede obtener promedio en una escala nominal, pero tampoco en una escala ordinal ,aunque s podra y de hecho algunos autores muestran este error al sealar algo as comoen el grupo A el promedio de Apgar fue 5,3.Como se ver el promedio es un estadstico descriptivo que debe emplearse en escala de razn o de intervalo. V. Tabla de Distribucin de Frecuencias Para manejar la variabilidad se requiere hace una buena descripcin de ella. Imaginemos la variable ordinal Estado nutricional de una poblacin de 433 nios de 1 mes a 4 aos de edad, catalogado segn criterio peso/talla de acuerdo a cnones especificados. Para la descripcin podemos utilizar una tabla de distribucin de frecuencias (Tabla 1).

15

Es importante sealar que la frecuencia relativa es una probabilidad dentro de la poblacin en estudio. As,.la probabilidad de encontrar un nio con estado nutricional normal es 0,5312 ( 53,12%).

Tabla 1. Tabla de Distribucin de Frecuencias. Variable Estado Nutricional 0 SP N DI DII DIII N de Casos 38 90 230 60 10 5 % 8,77 20,78 53,12 13,86 2,31 1,16 Frecuencia Relativa 0,0877 0,2078 0,5312 0,1386 0,0231 0,0116

Totales: 433 100,00 1,0000 0 = Obesidad; SP = Sobrepeso; N = Normal; DI, DII, DIII = Desnutricin de intensidad leve, moderada o mxima.

Histograma La presentacin grfica ms adecuada de la distribucin de frecuencias de una variable es el histograma. Supongamos que en la enfermedad X tenemos las siguientes frecuencias segn edad de comienzo:
Edad de comienzo (aos) % de casos

16
Menores de 1 25

1a4 5a9 10 a 14

40 20 15

Entonces, enfermedad X?

qu

edad

es

ms

comn

la

En apariencia pudiera considerarse que la edad de comienzo ms comn de la enfermedad en estudio es de 1 a 4 aos, donde se encuentra el 40% de los casos. Sin embargo, es necesario reconocer que los intervalos de edad son diferentes. As, el primer % corresponde al lapso de un ao pero el segundo a 4 aos y los restantes a 5 aos. En la construccin del histograma se debe respetar el nmero de casos por lapso, lo que corresponde a nmero de casos por ao, con el objeto de presentar la informacin con un nico criterio. En tales condiciones queda perfectamente claro que la edad ms comn de inicio de la enfermedad X es en el primer ao de vida.

VI. Medidas de tendencia central y medidas de dispersin Una manera ms resumida de presentar los datos y describir la Variabilidad nos lleva a emplear las medidas de Tendencia Central como la Media o Promedio aritmtico, el Promedio geomtrico(se explica mas adelante), la Mediana y la Moda, y Medidas de Dispersin como la Varianza y la Desviacin estndar, as como el puntaje Z(se explica mas adelante). La media o promedio aritmtico es muy conocida por los estudiantes, que permanentemente estn determinando su promedio de calificaciones. La media estadstica es el centro de gravedad de los valores de una

17

variables y no necesariamente coincide con alguna de las cifras observadas en la poblacin. Por ejemplo: media o promedio de los siguientes nmeros. 1, 2, 3, 4, 5, 9, 13, 16, 19, 25, 30, 35, 36, 37, 38, 39, 40, 45, 46, 47, 48, 49, 50. La suma de valores es 637 y el conjunto est constituido por 23 casos. Entonces el promedio es 637/23 = 27,69, cifra que no coincide con ninguna de las observadas. As, podemos describir los datos diciendo: x (promedio) = 27,69 y Margen o Rango = 1 a 50(aunque en estricto sentido debe expresarse como la diferencia entre el valor mayor y el menor de la serie.En ste caso 50 - 1 = 49). Esta ltima es una sencilla medida de dispersin pero no contribuye a conocer como estn agrupados los datos entre 1 y 50. Las cifras extremas hacen que la media o promedio difiera mucho de los valores ms comunes. La mediana obvia este problema por ser la cifra central despus de ordenar la serie de menor a mayor. Observemos que en el conjunto: 1, 2, 3, 4, 5, 6, 5, 3, 4, 2, 3, 2, 1, 9, 9, 15, 17, 19, 19, 20, 20, 21. el promedio es 190/22 = 8,63, pero si agregamos un resultado extremo como 98, por ejemplo, la media es 288/23 = 12,52. En cambio, al determinar la mediana, ordenando los datos de menor a mayor, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5, 6, 9, 9, 15, 17, 19, 19, 20, 20, 21, 98. se incluya o no el resultado extremo 98, la mediana (valor central) es 5. La Moda, corresponde al valor mas frecuente de la serie. Esta, puede tener una o varias modas. Poblaciones muy diferentes pueden tener igual promedio, por ello se requieren medidas de dispersin, como

18

el mencionado Margen (poco usado), la Varianza y la Desviacin estndar. Tomemos una serie: 1 2 3 1 2 6 7 8 9 ------45

Su media es = 5

Ahora, la diferencia de cada valor con la media es: -4 -3 -2 -1 0 +1 +2 +3 +4 -------0 La suma de estas desviaciones es cero, por ello se elevan al cuadrado: 16 9 4

19

1 0 1 4 9 16 --------60 El promedio de esta desviaciones al cuadrado es la varianza y su raz cuadrada es la desviacin estndar. Entonces, varianza = 60/9 = 6,66 y la desviacin estndar (DE) = raz cuadrada de 6,66 = 2,58. Cuando la serie o muestra consta de menos de 30 casos (n menor que 30), al calcular la varianza se usa n-1 en vez de n. Los resultados definitivos en nuestra serie de 9 elementos son entonces:
Varianza (v) = 60/8 = 7,5 y DE = Raz cuadrada de 7,5 = 2,73. n-1

Debemos aclarar que muchos emplean el criterio de dividir por n-1 toda vez que estamos tratando con una muestra, dividiendo por n slo si estamos trabajando con una poblacin o universo. Sealaremos tambin que la varianza muestral es una estimacin no sesgada de la varianza poblacional, aunque es particularmente sensible al requisito que la variable en estudio tenga una distribucin normal. Ya volveremos sobre esto. Otra medida de dispersin interesante es el puntaje estndar (puntaje Z , Z score)porque permite comparar peras con manzanas, es decir elementos que pertenecen a distribuciones distintas que tienen sus respectivos promedios y desviaciones estndar. La comparacin es en trminos de posicin de cada elemento dentro de su conjunto.As, una manzana determinada es relativamente mayor que una determinada pera porque la manzana(respecto de su conjunto ) se encuentra a 2,3 DE sobre el promedio de peso y la pera

20

se encuentra a 1,1 DE sobre el promedio de peso del conjunto de peras. Este puntaje estndar, tiene aplicacin en estudios clnicos.(ver Duffau G. 1984 ) El promedio aritmtico es reemplazado en algunas ocasiones por el promedio geomtrico. Este se calcula como la raz n de n valores que se multiplican entre s. Por ejemplo: El promedio aritmtico de 5-7-9-10-11-13-15-19-20 es =109/9 =12,11 y el promedio geomtrico es igual a 5x7x9x10x11x13x15x19x20 =2.567.565.000 y luego se extrae la raiz 9 de sa cantidad.El resultado es = 11,10 El promedio o media geomtrica se suele usar ante variables de incremento porcentual constante o bien cuando se desea expresar un porcentaje medio de crecimiento o de decrecimiento. Tambin se le aplica cuando se considera adecuado dar mayor importancia a los valores pequeos de la variable en estudio.Ntese que el promedio aritmtico de una serie es mayor que el geomtrico. La media geomtrica presenta el inconveniente serio que si uno de los valores de la serie es cero, la media tambin resultar cero.Tampoco se puede usar si hay valores negativos. VII. Estadgrafos, Parmetros, Inferencia Ahora, supongamos que deseamos saber la edad promedio de las personas que tienen telfono en Santiago. Hacer un censo, guindonos por el directorio telefnico, parece muy poco prctico. Entonces, se puede tomar una muestra al azar de esa poblacin y tratar de inferir el promedio del total. El proceso de inferencia estadstica es de la mayor importancia e inters, puesto que consiste en el conjunto de procedimientos que nos conducen a obtener conocimiento de las variables del universo a partir de informacin sobre stas, proporcionada por la muestra. Si tomamos muestras aleatorias (al azar) de unas 50 personas, veremos que tienen promedio variable.

21

En este momento debemos establecer que se denominan estadgrafos los valores que caracterizan una muestra y que se llaman parmetros los valores que caracterizan la poblacin. Los estadgrafos son, a su vez, variables. Si quisiramos medir los promedios de edad de todas las muestras de tamao 50 posibles, resultara con seguridad peor que hacer un censo ya que el nmero de combinaciones que pueden generar muestras de 50 suscriptores es inmensa. Si las muestras son integradas cada vez por mayor nmero de sujetos, los promedios son, a su vez, ms parecidos hasta que el promedio poblacional y de la muestra coinciden cuando ambas tienen el mismo nmero de sujetos.

VIII. Distribucin Normal Los promedios de las muestras de igual tamao extradas de una poblacin tienen una distribucin normal. Muchas variables biolgicas tienen una distribucin normal. Esta se caracteriza por mostrar muy pocos casos para los valores ms pequeos de la variable, aumentado progresivamente al crecer sta, alcanzando el mximo de casos a nivel del promedio, para descender simtricamente la frecuencia al seguir creciendo la variable. Esto da una configuracin como la silueta de una campana. Los valores de los estadgrafos promedio (media), mediana, proporcin de iguales caractersticas,etc., tienen una distribucin normal. Esto es de gran inters porque es posible calcular probabilidades del estadgrafo.

22 Figura 1. Curva de distribucin normal

Si tomamos la Figura 1: el rea bajo la curva incluye todos los casos, de modo que la probabilidad de encontrar un individuo determinado entre los valores de inicio y fin de la curva es 100%, o sea, 1,0. De igual forma se puede preguntar cul es la proporcin o probabilidad comprendida entre dos puntos de la campana. Para ello se usa la desviacin estndar(DE). As, el rea que se encuentra desde una DE antes del promedio hasta una DE despus del promedio es 68,26% (p = 0,6826). Si fueran 2 DE tendramos abarcada el 95,44% del rea (p = 0,9544), con 1,96 DE el 95% y si fuesen 3 DE sera 99,73% (p = 0,9973). (Lo sealado supone que la curva est construda con una poblacin con infinitos integrantes. Cuando el nmero es menor, la forma de la campana cambia en el sentido de tener las colas mas altas, lo cual significar-por ejemplo- que para circunscribir el 95% de la curva se requerir mas que 1,96 DE a izquierda y

23

derecha del promedio. La distribucin en tal caso- se llama Distribucin de Student como veremos mas adelante). Esto tiene gran importancia ya que, si consideramos una poblacin de supuestos normales imaginemos en glicemia- si determinamos sus valores y construimos la curva, veremos que la cifra promedio de glicemia + 1,96 DE comprender al 95,00%(aprox.) de estos supuestos normales. Esto significa que glicemias distintas sern convencionalmente estimadas como anormales. Entonces, si un individuo realmente sano se efecta un perfil bioqumico con una muestra de sangre, que incluya, digamos 20 exmenes diferentes, la probabilidad de aparecer dentro de los valores normales en el primero es 0,95(aprox.). En los dos primeros: 0,95 por 0,95 = 0,90. As, en los primeros 5 procedimientos, la probabilidad que todos sean considerados normales ya ha bajado a 0,77 y en los 20 exmenes ha descendido a 0,36 (36%).

IX. Teorema del lmite central. Este teorema establece : Dada una poblacin con promedio y desviacin estndar s, la distribucin muestral del promedio ,basada en muestras tomadas al azar, repetidas y de tamao n, tiene las siguientes propiedades: 1.-El promedio de la distribucin muestral o promedio de promedios es igual al promedio de la poblacin. 2.-La desviacin estndar en la distribucin muestral de promedios, llamada, para sta situacin, error estndar del promedio, tiene una funcin importante en numerosos procedimientos estadsticos. 3.-Si la distribucin de la poblacin es normal, la distribucin muestral tambin lo es.Debemos agregar que con muestras de tamao

24

grande(mayor de 30), la distribucin muestral de promedios es aproximadamente normal aunque la distribucin de la poblacin original no lo sea. X. Estimador estadstico Volviendo al problema del promedio de edad de los suscriptores en el directorio telefnico, lo que parece ms prctico es efectuar una estimacin a partir de una muestra tomada al azar. Esto requiere definir lo que se entiende por estimador estadstico. Un estimador es toda forma de manejo de los valores en una muestra aleatoria con el fin de acercarlo al respectivo parmetro poblacional. Usando los trminos definidos anteriormente, el asunto es estimar un parmetro a partir del respectivo estadgrafo. XI. Error estndar El error estndar es un estadgrafo de gran importancia. Corresponde al valor que se obtiene de dividir la desviacin estndar (DE) por la raz cuadrada del nmero de observaciones (n)(Para otros estadgrafos el error estndar se calcula de otro modo). El promedio de la muestra ( x) + 1,96 errores estndar (EE) nos proporciona un margen dentro del cual, con un 95% de confianza, se encuentra el promedio poblacional. (Tabla 2).

25

Tabla 2. De una poblacin de nmeros de 1 a 50 trataremos de obtener una estimacin de la media verdadera por medio del estudio de una muestra al azar (operacin que repetiremos cinco veces) Media verdadera es 25,50 Mrgenes DE
n-1

Nmeros al azar

(EE) N X

en que debe encontrarse la media poblacional con 95% de confianza (X 1,96 EE)

48,40,49,15,2, 10,25,38,26,44, 24,29,45,33,27, 19,20,50, 41,3 32,26,8,39,41,4 57,22,17,12,21, 46,36,35,20,31, 4,37,47,10 15,16,2,9,25,11, 3,14,8,7,37,26,

20

29,4

14,93 ( 3,33)

22,87 - 35,92

20

26,80

14,00 ( 3,13)

20,66 32,93

26
36,39,22,47,17, 20,27,23 21,22,20,45,13, 16,29,47,17,8, 39,31,44,4,25, 38,4,26,12,28 44,29,27,24,3,2, 13,17,9,42,12,1 1,15,21,5,22, 46,16,32,35

20

20,20

12,50 ( 2,79)

14,73 25,66

20

24,45

13.26 ( 2,96)

18,64 30,25

20

21,25

13,43 ( 3,00)

15,37 27,13

Como se ve, la media o promedio verdadero (25,50), en el ejemplo, resulta contenida dentro de todos los mrgenes donde deba estar, con un 95% de seguridad. Esto significa que si en la tabla se hubiese hecho la experiencia 100 veces ( y no slo 5 veces) , lo esperable habra sido que en 95 ocasiones la media de 25,5 estuviese contenida en los m,rgenes que se dan a la derecha y en 5 oportunidades, no.

Supongamos que en una muestra al azar del directorio telefnico, de 1.000 suscriptores, se encuentra una edad promedio de 38,46 aos con una DE de 9,98. El EE resulta de la divisin siguiente, 9,98/31,62 = 0,31. Entonces, el intervalo de confianza del 95% para el promedio es 38,46 + 1,96 por 0,31. Esto nos da 37,85 a 39,06 aos, intervalo dentro del cual tenemos un 95% de seguridad que se encuentra el promedio de edad del total de suscriptores telefnicos. Para aclarar ms lo dicho sealaremos que en un conjunto con distribucin normal, los mrgenes que da el promedio (media) sumndole y restndole 1,96 desviaciones estndar del promedio (error estndar) indicarn donde se encuentra con un 95% de seguridad el promedio (media) de la poblacin o universo del que se extrajo el mencionado conjunto. Aqu hay que enfatizar lo ltimo: en una muestra en que se estudia una variable con distribucin normal, la desviacin estndar nos permite, al aplicarla en mas y en

27

menos a partir del promedio, decir qu proporcin de la muestra queda abarcada o comprendida .El error estndar, en cambio, es una medida que nos habla de caractersticas del universo del cual se extrajo la muestra. As, aplicando el error estndar en mas y en menos a partir del promedio de la muestra nos indicar los valores entre los cuales se encontrar, con una probabilidad determinada, el promedio del universo del que se extrajo la muestra en estudio.Ya que habitualmente se trabaja con la probabilidad o proporcin del 95%, el promedio de una variable en una muestra mas menos 1,96 DE comprende el 95% de la muestra, pero aplicando el EE en la misma forma tenemos el intervalo de valores donde, con una probabilidad de 95%, se encuentra el promedio del universo del cual se obtuvo la muestra.Tal sera, para el promedio en cuestin, su intervalo de confianza del 95%. Los intervalos de confianza tienen gran importancia y volveremos sobre ellos a continuacin.

XII. Intervalos de confianza. (El lector puede evitar, en ste momento , la seccin XII y pasar a la siguiente). La expresin de resultados numricos en una investigacin , con su respectivo intervalo de confianza (IC) es actualmente una exigencia comn en los rganos de difusin de la informacin biomdica.Esto tiene bastante importancia porque tiende a moderar algunos impulsos de entusiasmo que suelen verse reflejados en las conclusiones. As, el hallazgo de una variable con una frecuencia de 4% en una muestra de 25 casos no parecer necesariamente rara si sealamos que el % verdadero en la poblacin de la que se extrajo la muestra, con un 95% de seguridad,se encuentra en el intervalo 0,2 a 22,3% La mejor estimacin es el valor encontrado, de 4%, pero bien pudiera ser una cifra bastante mas alta. Es importante destacar que aunque hay una probabilidad de 95%

28

que en ese intervalo se encuentre el valor poblacional, la distribucin de probabilidades de acuerdo a cada valor es normal, de suerte que las cifras extremas de 0,2 y 22,3% son las menos probables. Si no se hubiere encontrado caso alguno con la variable (0/25),an los datos seran compatibles con su existencia en la poblacin en el intervalo 0 a 16%, naturalmente para se tamao muestral. Las ideas expresadas adquieren un inters especial cuando se est estudiando una prueba diagnstica y sus propiedades. Si imaginamos una de ellas con valor predictivo positivo de 100%-es decir una probabilidad de presencia de la enfermedad o condicin en estudio de 100% cuando la prueba es indicadora de tal- resulta indispensable tener la sana precaucin de organizar la tabla correspondiente de modo de incluir los intervalos de confianza. As, en el caso de haber estudiado un efectivo de 45 pacientes con los resultados que se sealan: Estndar Ideal Enfermedad presente ausente (+) 19 0 Prueba diagnstica (-) 1 20 veremos lo siguiente: Sensibilidad = 95% pero Especificidad = 100% Valor predictivo positivo =100% Valor predictivo negativo = 96,2 IC 95% =73,1 83,4 79,1 78,4 - 99,7% - 100% - 100% - 99,8% 25 25 26

19

45

El Valor predictivo positivo o la Especificidad de 100% resultan poder ser tanto mas bajas- en el universo del que se obtuvo la muestra estudiada-como inferior a 80% y 85%, respectivamente.

29

En trminos generales, el intervalo de confianza del 95% (IC 95%), por ejemplo de un % o de un promedio, en una muestra, est definido por se % o promedio + 1,96 veces su error estndar.La cifra 1,96 crecer en la medida que en vez de utilizar la distribucin normal deba, por tratarse de muestras relativamente pequeas, recurrirse a la distribucin de t(de Student). Recordaremos que el error estndar es una medida de variacin que no nos informa propiamente acerca de los integrantes de la muestra sino mas bien acerca de la poblacin de la cual se obtuvo esa muestra.Su clculo, para el caso de un promedio cuyo error estndar deseamos conocer, se efecta dividiendo la desviacin estndar por la raz cuadrada del nmero de observaciones. El IC puede ser determinado con diversos grados de confianza y as, aun cuando lo usual es utilizar el nivel de 95%, no hay inconveniente ,si el investigador lo desea, en emplear el grado de 99%. Naturalmente, en ste ltimo caso el intervalo ser mas amplio, para un mismo grupo de datos. Es importante indicar que una crtica comn al uso de p (probabilidad que los hallazgos en anlisis sean explicados por efecto del azar) es que no tiene mucho inters en s , puesto que diferencias con escaso sentido clnico pueden aparecer significativas si el nmero de casos es lo suficientemente elevado. Esta crtica presupone que el investigador desconoce la importancia de definir previamente a su estudio, una diferencia clnicamente significativa , como as mismo los efectos del tamao de la muestra. El aserto ,por otro lado, hace pensar que quien lo formula no tendra los problemas del clnico que hace investigacin, uno de los cuales es lograr disponer del suficiente nmero de casos para satisfacer las exigencias de un tamao de muestra adecuado a los errores alfa y beta determinados as como a una diferencia clnicamente significativa. Destacaremos

30

que, si tomamos el ejemplo de la diferencia de dos medias o proporciones, hay al menos dos aspectos que no se pueden evitar: Si bien el IC muestra un conjunto de valores plausibles en la poblacin de la que se extrajeron los grupos, la mejor estimacin es precisamente el hallazgo del estudio. Por otro lado, si el recorrido del IC pasa por o incluye cero diferencia entre los valores plausibles, la diferencia encontrada entre los grupos no podr ser considerada significativa. Ante comparaciones mltiples, donde el azar puede explicar algunas de las diferencias detectadas, se suele recomendar hacer acopio de buen juicio para decidir.Igualmente, se insta a tener precaucin si las desviaciones estndar difieren considerablemente. El intervalo de confianza no permite , simplemente, establecer una comparacin entre dos muestras, con la hiptesis nula que pertenecen al mismo universo o poblacin. No pocas personas piensan que si comparamos dos promedios bastara con mirar si uno de ellos est comprendido en el intervalo de confianza del otro para poder afirmar que no difieren significativamente y que se acepta, entonces, la hiptesis nula. Por otro lado, esto sugiere que si ocurre lo contrario ambas muestras difieren claramente. En realidad, la situacin no es as de clara. De hecho, en el problema planteado se dan tres variantes: Se muestra promedios(x) 1 y 2 + 1,96 veces los respectivos errores estndar, generando as los IC 95%. 1.2.3.||||||||||||||||||||||||||||||x1|||||||||||||||||||||||||||||| |||||||||||||||||||||||||||||x2|||||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||x1||||||||||||||||||||||||||||||| |||||||||||||||||||||||||||||||x2||||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||x1||||||||||||||||||||||||||||||||| |||||||||||||||||||||||||||x2|||||||||||||||||||||||||||

En el primer caso los intervalos de confianza no se superponen.En este caso se tiene al menos una

31

seguridad de 95% que los promedios difieren si realiza una prueba de hiptesis tradicional para 2 promedios. En el tercer caso ,donde se superponen los intervalos de confianza y al menos un promedio est contenido en el intervalo de confianza del otro, se puede decir que ambos estadgrafos son comparables. En la situacin 2 hay superposicin slo de intervalos.En tal caso se requiere una prueba de hiptesis sobre los promedios para poder emitir un juicio acerca del asunto, porque el resultado depender de como se d la situacin. Un ejemplo de lo ltimo sera el siguiente:
Comparar: 183/269 = 0,680= 68,0% con IC 95% de 62 a 73,5% y 129/218 = 0,592 = 59,2% con IC 95% de 52,3 a 65,7%

52,3|||||||||||||||||59,2||||||||||||||||||||65,7 62,0|||||||||||||||68,0||||||||||||||||73,5 Como se puede observar, hay superposicin de los intervalos de confianza. Efectuando una comparacin de proporciones encontramos en prueba de Z un valor de 1,924 y p=0,054, lo que debe interpretarse como dos proporciones que no son significativamente diferentes. Procedimiento que responde mas directamente es la determinacin del IC de la diferencia de los estadgrafos. As,por ejemplo, si tal intervalo de la diferencia de promedios incluye cero, como ya se mencion, deber considerarse que dichos promedios no difieren significativamente pues,dentro de la serie de diferencias plausibles en el universo del cual proceden las dos muestras se encuentra justamente cero.Claro que,esto supone que el manejo de los datos originales fue apropiado. Por ello, continuemos con dos grupos individualmente. Un aspecto frecuentemente slo mencionado es que al comparar dos muestras es posible que difieran

32

notablemente en la dispersin de los valores. Esto crea un problema puesto que si las varianzas difieren entonces los grupos tambin lo hacen. Sin embargo,se suele afirmar que la prueba de t es bastante robusta, indicando con esto que si el nmero de casos es lo suficientemente grande y no muy diferente en los dos grupos de estudio , se puede obviar el hecho que las varianzas sean diferentes. Esto puede crear una idea falsa, restando valor a la comparacin de varianzas como parte de la comparacin de los grupos. Es bastante comn que se den por satisfechos los requisitos de las pruebas de hiptesis (es frecuente, por ejemplo, que no se indique expresamente si se ha cumplido la exigencia de normalidad para algunas pruebas).En general y como reglas para recordar, se puede decir que si las varianzas difieren por un factor de 2 o mas y los tamaos muestrales por 4 o mas no ser suficiente la robustez de la prueba. Es posible encontrar datos como los que se exponen a continuacin, que seguramente no llamen la atencin en forma especial:
Comparacin de promedios:

Grupo A B

Promedio 46,50 50,00

EE 0,50 2,23

n 100 50

Usando para el grupo B un valor t de 2,00 (49 grados de libertad) |||||||||||||||||||||||||||||||||||||||||||||||||| x1|||||||||||||||||||||||||||||||||||||||||||||||||| IC95% del grupo B 45,54 50,00 54,46 | x2 grupo A 46,50 Ahora, si los datos son analizados por Epitable de Epi Info 6.04(1996), obtenemos que p= 0,044. Entonces, aunque el promedio del grupo A est contenido en el intervalo de

33

confianza del promedio significativamente.

del

grupo

B,

difieren

Si el anlisis lo efectuamos por el programa Primer 1.0 (1988) ,obtenemos: IC 95% para la diferencia de promedios = 0,09 - 6,91 t = 2,030 con 148 grados de libertad y p = 0,044 Valor de t crtico (prueba bilateral y error alfa de 5%) =1,9761 para 148 grados de libertad. Aparentemente, entonces, hay una diferencia significativa entre los dos promedios.Pero si observamos el nmero de grados de libertad que fueron declarados por Primer- 148 - es claro que no hubo correccin por varianzas distintas. Sealaremos que Epitable no corrige tampoco si el nmero de casos estudiado es mayor de 30 por grupo. Empleando la correccin de Satterthwaite o la de Welch(Ver la seccin de problemas desarrollados) se obtiene que el nmero de grados de libertad efectivos se reduce a 54 y en tal caso el valor crtico de t cambia a 2,0049 pero an as la cifra encontrada previamente de 2,030 es mayor y en consecuencia se debe concluir que los promedios difieren. Debemos aclarar que con una disminucin de la gran diferencia entre las varianzas, los promedios dejan de aparecer como significativamente diferentes.Entonces,la prueba de t puede realizarse, por ser robusta, muchas veces que hay diferencias en el tamao de las muestras y en las varianzas;en otras deber efectuarse una correccin como las nombradas pero habr casos en que por existir diferencias extremas la prueba no deber efectuarse. A lo sealado cabe agregar que no siempre se dispondr de un IC. De hecho, para citar un ejemplo mencionaremos que estudiando una proporcin cualquiera, digamos 4/56 el IC95% ser:
IC95% 2,31 - 18,12% 1,98 - 17,29% 2,31 - 16,33% Mtodo Amplitud del IC. Cuadrtico de Fleiss, 15,81 Binomial exacto 15,31 Media probabilidad.(Mid-p) 14,02

34

Si comparamos con la proporcin 10/56, es decir 17,85% vemos que se encuentra dentro del IC95% segn Fleiss pero fuera del calculado por los otros dos mtodos. En tales condiciones, no es posible decidir si hay una diferencia significativa, por lo que se debe hacer la respectiva prueba de hiptesis.La comparacin de estas proporciones, directamente, por Ji2 o por Fisher indica que no difieren significativamente. De lo expuesto parece claro que no es conveniente considerar en forma excluyente el uso de pruebas de hiptesis o intervalos de confianza, como parecieran sugerir algunos. Por el contrario,deben estimarse como procedimientos complementarios en la exposicin de los resultados de una investigacin. Referencias.
-Duffau G, Osorio P. Modificaciones de algunas variables antropomtricas en el lactante segn estado de hidratacin. Rev Pediatra (Santiago) 1984; 27: 81-84. -Gardner MJ, Altman DG. Intervalos de confianza y no valores p: Estimacin en vez de pruebas de hiptesis. Bol Of Sanit. Panam 1993;114:536-549. -Duffau G. Intervalos de confianza. Rev Chil Pediatr 1997; 68: 194-203. -Dawson-Saunders B, Trapp RG. Bioestadstica Mdica.Edit. Manual Moderno,SA,Mxico. p:115-139. -Essex-Sorlie D. Medical Biostatistics & Epidemiology.Prentice Hall International Ltd., London 1995:166-180. -Centers for Disease Control and Prevention (CDC) U.S.A. W.H.O.,Geneva, Switzerland. Epi Info 6.04, 1996. -Glantz J. Primer 1.0 ,McGraw - Hill Inc., 1988. -Fleiss JL. Statistical Methods for Rates and Proportions. 2nd Edition, J Wiley & sons, New York, 1981:14-151.

XIII Prueba de hiptesis Supongamos que una fbrica de ampolletas produjo

35

el mes pasado 128.572 ampolletas de 75 W. de las que 827 estaban defectuosas y no funcionaban. En el presente mes, para saber cul es la situacin, se tom una muestra al azar de lo producido hasta el momento y se obtuvo que de 18.956 ampolletas, 128 estaban defectuosas. En el primer caso la proporcin de producto de mala calidad era de 0,6432% y en el segundo de 0,6752%. La pregunta es acaso la diferencia puede ser explicada como variacin debida al azar o hay un problema que indagar. Es necesario realizar una prueba de hiptesis, donde el asunto central es establecer hasta que punto variaciones atribuibles al azar podran justificar la diferencia observada y entonces se plantean dos posibilidades: Recordaremos que, en trminos generales, se entiende por hiptesis una suposicin o conjetura verosmil, de relaciones entre hechos o fenmenos, sujeta a comprobacin. Hiptesis nula: No hay diferente tasa o proporcin de ampolletas defectuosas. Hiptesis alterna: Actualmente la tasa en cuestin es mayor. El principio es determinar el error estndar de la diferencia entre dos tasas o porcentajes. Por azar ese EE estar contenido menos de 1,96 veces en la diferencia detectada y ello con un 95% de seguridad. Como la pregunta a resolver es unilateral, es decir, acaso la nueva tasa es mayor (y no slo diferente), por azar el error estndar de la diferencia estar contenido hasta 1,64 veces en la diferencia de tasas o porcentajes. Aqu hay que tener cuidado porque el clculo que haremos comparar las tasas 827/128.572 = 0,006432 y 128/18.956 = 0,006752. Al hacerlo con los porcentajes respectivo, 0,6432 y 0,6752, la operacin cambia ligeramente como veremos ms adelante. Diferencia de dos tasas. Esto requiere explicar que la diferencia de dos tasas

36

en un nmero grande de muestras de un Universo o Poblacin tiene una distribucin normal de suerte que la diferencia promedio + 1,96 DE abarcar el 95% de las muestras.Las restantes sern consideradas como improbablemente procedentes del mismo Universo y por lo tanto se estimar que la diferencia que muestran no debe considerarse producto del azar, con un error igual o menor que 0,05 (5%). Este es el sentido de sealar p igual o menor que 0,05. En la curva de distribucin normal ya hemos sealado que el rea fuera de los lmites indicados por el x + 1,96 DE es del 5% del total (2,5% en cada cola). Cuando se analiza slo un lado de la campana, como al tratar de verificar no una diferencia a secas, sino establecer mayor que o menor que, se requiere 1,64 DE para dejar fuera un rea de 5%. En el caso en anlisis se compara la tasa del Universo mes anterior con una muestra actual. Por ello se trabaja con el EE de la tasa 0,006432 para una muestra de 18.956 ampolletas. En el caso presentado, el estadgrafo de la prueba se llama Z y nos dar la distancia a la cual se encuentra la diferencia de tasa determinada, del punto cero diferencia promedio, que sera lo esperable si ambas tasas proceden del mismo universo o poblacin.
Z= _ Tasa en la muestra tasa en el mes anterior ___________________________________________________ ___________________________________________________ tasa en el mes anterior (1-tasa en el mes anterior) _________________________________________________ n 0,006752 0,006432 ______________________________ = 0,551 ______________________________ 0,006432 (1 0,006432) ____________________________ 18.956

Z= _

37

Luego, se debe aceptar la hiptesis nula. Al hacer el clculo con los respectivos porcentajes, la segunda acuacin quedara as:
0,6752 0,6432 ______________________________ = 0,551 ______________________________ 0,6432 (100 0,6432) ____________________________ 18.956

Z= _

Se debe, entonces, considerar que la proporcin de ampolletas que resultan defectuosas no ha cambiado significativamente. La variacin est dentro de lo que se considera explicable por el azar.

Diferencia de promedios. Ahora, un ejemplo trabajando con promedios. Supongamos que, examinando todos los lugares de expendio en la ciudad del artculo MM se encontr hace un mes que, por unidad, el precio medio era de 1.457 pesos. En ste momento se desea saber si ha habido alza en el precio. Entonces: Hiptesis nula (H0) descendido. mayor. Mtodo: Se toma una muestra al azar. Imaginemos que en 80 sitios de expendio se detecta lo siguiente:
Precio promedio (x) por unidad : 1.528 pesos

= El precio se mantiene o ha

Hiptesis alterna (H1) = El precio promedio ahora es

38 Desviacin estndar : 112 pesos

En este caso, el estadgrafo Z sera:


Z = promedio en la muestra - promedio anterior EE

1.528 1.457 Z = ___________________ = 5,6 112 _______________ ______ 80

Por lo tanto, debemos aceptar la hiptesis alterna (H1): el precio del artculo en cuestin es ahora mayor. Error estndar de la diferencia de dos promedios. Para explicar mejor el EE de la diferencia entre dos promedios haremos lo siguiente: Si en el conjunto de nmeros de 0 al 50 tomamos muestras al azar en cantidad suficiente y vemos el promedio de cada una y formamos parejas tambin al azar, lo esperable es que la diferencia entre los promedios tenga una distribucin normal, con un promedio de diferencia tendiendo a ser cero. Obteniendo la dispersin (DE) de este promedio de diferencias y aplicndola 1,96 veces en ms y 1,96 veces en menos delimitaremos los mrgenes dentro de los cuales debern encontrarse con un 95% de seguridad las diferencias de promedios de dos muestras cualesquiera tomadas de ese conjunto de nmeros de 0 a 50. Repitiendo el concepto ya sealado anteriormente,los mrgenes encontrados indicarn hasta que magnitud de diferencia entre promedios podra ser explicada por el azar( con un 95% de seguridad).Entonces,el

39

hallazgo de una diferencia mayor en una pareja de muestras ser interpretado como algo efectivo, no atribuible a variaciones dadas por el azar. (Tabla 3)

XIV Bases de una experiencia clnica. Hasta el momento, los dos ejemplos analizados permiten ver cmo se compara una proporcin y luego un promedio con lo que se toma por parmetro de la poblacin en un momento dado. Esto, con el objeto de establecer hasta qu punto la diferencia observada puede ser producto del muestreo (azar) o hay que aceptar la existencia de un cambio tal que se deba considerar que la muestra pertenece a otra poblacin o universo. Lo usual en clnica es un tanto distinto. La informacin del universo es desconocida y se dispone de dos o ms muestras que al ser tomadas adecuadamente (representativas del universo al que pertenecen) no deben diferir en forma manifiesta: deben ser, entonces, comparables (las diferencias observadas deben ser posibles de explicar por variaciones debidas al azar). Introducido un elemento que puede generar una diferencia, como podra ser un nuevo tratamiento, los grupos son nuevamente comparados y aquello que aparezca diferente, como no explicable por azar, podr ser atribuido a los efectos del nuevo tratamiento. Esto en forma muy breve.

40

Tabla 3. Error estndar (EE) de la diferencia de dos promedios 60 muestras tamao 5 del conjunto de nmeros del 0 al 50:
Muestras al azar Promedio I Muestras al azar Promedio II I II

2,46,45,14,18 36,30,11,21,48 40,22,1121,48 17,22,22,25,46 43,4,43,24,12 46,37,44,8,6 11,30,17,47,8 37,45,46,6,19 35,22,13,4,37 29,34,21,2,32 30,50,11,47,3 26,12,31,46,20 19,31,26,36,20 15,44,20,48,25 18,21,1,32,41 7,46,41,6,38 12,39,16,27,7 24,47,13,16,43 49,42,39,36,35 1,27,44,7,3 6,42,40,9,11 42,13,14,17,39 7,6,3,7,42 5,29,13,28,25 15,5,13,24,9 41,30,49,7,10 12,47,31,15,13 30,21,47,25,12 50,2,27,22,22 16,36,28,47,13

25,0 19,2 28,4 26,4 25,2 28,2 22,6 30,6 22,2 23,6 28,2 27,0 26,4 30,4 22,6 27,6 20,2 28,6 40,2 16,4 21,6 25,0 19,0 20,0 13,2 27,4 23,6 27,0 24,6 28,0

20,38,6,35,26 37,24,21,41,33 17,25,39,21,16 3,19,47,6,28 34,39,24,10,16 5,41,35,3,41 16,32,17,35,30 49,37,45,44,42 23,31,3,20,42 4,24,33,13,39 4,18,45,40,6 37,8,42,22,44 4,8,23,45,44 34,0,33,45,15 43,46,30,3,41 11,3,44,43,20 21,2,27,19,5 26,39,35,37,1 19,43,25,50,50 27,8,17,8,1, 16,26,7,41,27 22,17,5,19,38 4,15,2,7,20 12,0,16,40,23 33,18,18,19,23 45,37,17,20,31 25,1338,42,43 32,9,40,26,16 18,16,49,40,14 28,38,17,12,13

25,0 31,2 23,6 20,6 24,6 25,0 26,2 43,4 23,8 22,6 22,6 30,6 24,8 25,4 32,6 24,2 14,8 27,6 37,4 12,2 23,4 20,2 9,6 18,2 22,2 30,0 32,2 24,6 27,4 24,6

0,0 -12,0 4,8 5,8 0,6 3,2 -3,6 -12,8 -1,6 1,0 5,6 -3,6 1,6 5,0 -10,0 3,4 5,4 1,0 2,8 4,2 -1,8 4,8 9,4 1,8 -9,4 -2,6 -8,6 2,4 -2,8 6,4

Para estas 30 parejas de datos, la diferencia entre los promedios indica a su vez un x de 0,0133 y una DE de 5,69. Entonces, en los mrgenes dados por 0,0133 + 1,96 (5,69) es decir, desde 11,13 hasta +11,16 se encontrarn las diferencias de promedio, en el ejemplo, explicables por azar, con 95% de seguridad. De hecho, en esta serie 2/30, el 6%, cae fuera de los mrgenes.

41

XV. Diseo de una experiencia clnica Una experiencia clnica puede incluir modalidades variadas de trabajo, pero en trminos generales persigue desde el estudio de las propiedades de un conjunto de individuos hasta realizar lo necesario con el fin de verificar un principio o fenmeno cientfico. Para disear una experiencia correctamente, se requiere detectar un problema y formularlo adecuadamente. El diseo propiamente tal consta de ciertas etapas indispensables: 1.- Debe existir un problema. 2.- Es necesario formular el problema y plantear una hiptesis. 3.- Determinar las variables a estudiar y aquellas que se van a controlar. 4.- Establecer la poblacin que se va a analizar. 5.- Determinar el tamao de la muestra a investigar. 6.- Efectuar una evaluacin, una revisin de lo proyectado. Mencionaremos, sin entrar en mucho detalle, que la determinacin del tamao de la muestra a investigar est afectada, o debe considerar al menos los siguientes factores(El lector puede profundizar sobre esto en el acpite respectivo): Diferencia clnicamente significativa: Entre dos grupos que esperamos muestren un diferente comportamiento debemos sealar la magnitud de diferencia que nos interesara poder detectar. Cabe destacar que mientras ms pequea sea la diferencia real entre los grupos, mayor tendr que ser la muestra para poder detectarla.

42

Para tener una cierta idea mencionaremos que diferencias de 10%, 15% o ms, se consideran usualmente como importantes. Nivel de error alfa o de tipo I. La probabilidad que la diferencia observada sea explicable por el azar nos aclara este tipo de error: as, cuando esa probabilidad es, convencionalmente, menor que 5% (lo que se expresa como p menor que 0,05) el investigador decide que lo encontrado NO se debe al azar ya que es tan poco probable que se deba a l. Si uno quisiera estar an ms seguro podra, por ejemplo, aceptar como verdaderas, diferencias cuya probabilidad de ser explicadas por slo azar fuera menos del 1% (p menor que 0,01). Sin embargo, se debe tener presente que al disminuir el error alfa inevitablemente se tiende a un aumento del error que comentaremos enseguida. Nivel de error beta o de tipo II. La probabilidad de NO detectar una diferencia que SI existe constituye el error beta o tipo II. Aqu es bueno decir que cuando en una investigacin se verifica una diferencia (con su correspondiente nivel de error alfa), bien, all est. Pero, cuando no se verifica una diferencia que se haba planteado en la hiptesis, quedar la duda si con un estudio ms potente, bsicamente con ms casos, hubiera sido posible verificarla. Convencionalmente, en estudios clnicos de trabaja con un error beta de 20% o menor. La potencia de un estudio, entendida como la probabilidad de detectar una diferencia especificada es = (1error beta). Entonces, la potencia usual sera (1 0,20) o sea 0,80 u 80%. Un ejemplo que ponga en operacin los rubros de un diseo, de acuerdo a lo discutido, podra ser algo as: El control farmacolgico de la fiebre en menores de 1 ao con el medicamento A tiene algunos inconvenientes.

43

Se requerira un producto capaz de descender ms la temperatura y que no provocar vmitos. Hiptesis:: El frmaco B es ms efectivo y mejor tolerado que el A. Variables a estudiar:: Despus de una dosis teraputica se compararn las temperaturas corporales a los 30, 60, 90 y 120 minutos post ingesta precisando la proporcin, en cada momento, de nios cuya temperatura corporal se encuentra bajo 38C rectal as como de aquellos que presentan vmitos. Variables a controlar:: Los grupos en estudio (con medicamentos A y B) sern comparables en edad, estado nutricional, das de enfermedad al inicio del estudio, gnero, patologa originaria del cuadro febril, tratamiento preexperiencia y temperatura al inicio de la investigacin. Las variables a controlar son aquellas que el investigador establece como importantes elementos en los cuales no deben diferir los grupos que constituyen la investigacin.Esencialmente, son variables que se considera pueden influir en el resultado final, de modo que los grupos pudieran resultar diferentes no slo por efecto del distinto tratamiento . A primera vista se podra pensar que es buena idea controlar un gran nmero de tales variables, sin embargo se debe tener presente que los resultados que se obtengan en la investigacin sern razonablemente extrapolables slo a grupos similares. Si estos son muy especficos ,los resultados sern aplicables slo a una fraccin muy pequea de la poblacin.Estos estudios pueden tener gran validez interna pero escasa externa. Sobre aleatorizacin: Si se desea asignar al azar nios para constituir no dos grupos sino mas,por ejemplo 3 grupos, puede hacerse de la siguiente manera: La probabilidad de cada caso de integrar el grupo A o B o C debe ser la misma(0,33 ,porque son tres grupos). Entonces , si se dispone de una calculadora que genera nmeros al azar, se observar que al pedir uno proporciona una cifra que es

44

cero coma y 3 nmeros.De hecho, lo que hace es dar al azar nmeros entre 0 y 1. En un ejemplo cualquiera, el primer nmero puede ser 0,649. Luego 0,809 - 0,538 - 0,597 - 0,744 - 0,413 - 0,004 - 0,801 - 0,286 -0,073 etc. Entonces , si son tres grupos los nmeros de 0 a 0,329 van al tratamiento A. De 0,333 a 0,659 van al B y de 0,666 a 0,999 van al C. De los 10 nmeros(casos) al azar que tenemos de ejemplo se asignaran al grupo A el sptimo(0,004), noveno(0,286) y dcimo caso(0,073), o sea 3 casos . Al grupo B , el primero,tercero , cuarto y sexto, es decir 4 casos y finalmente, los dems pertenecen al grupo C. Este mtodo es bueno pero tiene el inconveniente que los grupos no salen de igual tamao y a veces difieren desagradablemente.Esto no constituye problema para el anlisis pero disminuye poder y es poco esttico, aunque legal. El mayor riesgo se corre cuando son pocos casos ya que cuando no es as, los grupos tienden a ser de igual tamao. La solucin puede ser la siguiente: Asignacin al azar en bloques: Supongamos que se tiene 18 casos que se estudiarn en tres grupos ,deseando que cada grupo contenga 6 pacientes. Entonces , el investigador dice: los tres primeros casos pueden integrarse a los grupos A B C de las siguientes formas: 1.2.3.4.5.6.A A B B C C B C A C A B C B C A B A

Esto significa que los tres primeros casos pueden ir, por ejemplo, en la opcin 4. Entonces: El primer nio va al grupo B , el segundo nio va al grupo C y el tercer nio va al grupo A. Se elige al azar la opcin que corresponde tomar de las 6 posibles y cada tres nios se va viendo a que grupo debe

45

incorporarse cada uno. As, si corresponde al azar la opcin 2, entonces , siguiendo, el nio cuarto debe ir al grupo A, el quinto de la serie debe ir al C y el sexto debe ir al grupo B. Minimizacin: La asignacin al azar de los integrantes de una investigacin no garantiza que los grupos resulten perfectamente comparables en las variables a controlar.Esto crea un serio problema. Una propuesta relativamente reciente(1974) para no tener que enfrentar tal dificultad es la minimizacin.En este procedimiento la asignacin de los participantes a un determinado grupo no depende exclusivamente del azar sino que est diseado para reducir cualquier diferencia en la distribucin de las variables a controlar, de modo que sea posible atribuir a la intervencin teraputica los efectos observados. Para hacer operar el mtodo es necesario definir claramente que factores o variables debieran estar igualmente representadas endigamos- los dos grupos de tratamiento. Luego, en el momento que un caso definitivamente va a entrar al estudio se hace una lista de estos factores de inters. La asignacin a un grupo es determinada ahora luego de establecer a qu grupo habra que asignar el caso para reducir la diferencia de estos factores en los grupos. El inicio puede ser al azar y luego hacer intervenir la minimizacin Poblacin a estudiar:: Consultantes en la Unidad de Emergencia, 1 a 11 meses de edad, con temperatura rectal superior a 38C, de menos de 48 horas de duracin, sin medicamentos antitrmicos en las ltimas 8 horas, en los que el diagnstico sea: resfro comn, gripe, faringitis aguda, amigdalitis aguda o bronquitis aguda. Sern asignados al azar, empleando una tabla de nmeros aleatorios, para integrar los grupos A o B. El estudio ser ciego, de modo que quien proporcione y quien evale no estar al tanto del frmaco recibido por el paciente. Para ello, en farmacia se codificar cada medicamento y se procurar en ambos una presentacin en todo similar.

46

Tamao de la muestra. Diferencia clnicamente significativa:: Se considerar como tal el que en dos controles sucesivos, como mnimo, el grupo B muestre una proporcin de nios con temperatura rectal bajo 38C un 20% mayor que el grupo A. Si no sabemos con suficiente seguridad cules son los porcentajes de nios en el grupo A esperables que cumplan los requisitos de respuesta en cada control tenemos que utilizar el nmero ms elevado de casos que pudiera ser requerido. Esto exige explicar que para detectar una diferencia de 20% entre los grupos, el N de casos necesario vara, por ejemplo, al comparar 10% vs 30% 40% vs 60%. En el estudio presente, el nmero de pacientes por grupo, para una diferencia de 20%, con error alfa de 0,05 y beta de 0,20 variar aproximadamente entre 70 y 110. Por ello, se investigarn dos conjuntos de 110 nios cada uno. Para la diferencia en tolerancia al medicamento, presencia de vmitos, se espera un cambio superior a 30%, de manera que ser suficiente el nmero escogido de casos. En la estadstica, lo central ser analizado por estudio de diferencia entre porcentajes, en prueba bilateral(por las razones que se sealan en la seccin sobre tamao de la muestra) pese a que se espere que B resulte ser mejor que A. Se estudiaron, entonces, 220 casos en total, 110 por grupo. Ambos resultaron comparables en todas las variables a controlar y las proporciones de nios considerados con respuesta favorable, en cada control, fueron:

Porcentaje de casos con TC rectal bajo 38C Control (min.)

47
Medicament o

Inicio 30 60 90 120

A B

110 110

0 0

9,0 7,2

27,3 36,4

31,8 52,7

33,6 53,6

En cada control se busca el estadgrafo Z segn:

Z= _

diferencia de porcentajes ____________________________________________________________ ____________________________________________________________ % en A (100 - % en A) % en B (100 - % en B) ____________________________ + __________________________

nA

nB

As, se encuentra Z a los 30 mn. = 0,48 p = 0,635 60 mn. = 1,45 p = 0,152 90 mn. = 3,21 p = 0,001 120 mn. = 3,05 p = 0,002

En otra parte veremos que esta forma de clculo, bastante sencilla, debe complicarse algo si deseamos que opere bien con porcentajes o proporciones muy alejados de 50% o 0,50 , respectivamente y grupos de distinto tamao. Entonces, se estima verificado que el frmaco B es ms efectivo para bajar la temperatura. La proporcin de nios que vomit fue comparable. Recordemos que el valor de p corresponde a la probabilidad que, en ese momento, la diferencia observada pudiera ser explicada por el azar. Supongamos que en el estudio que acabamos de presentar, en vez de comparar en cada control ciertos porcentajes, directamente lo hacemos con temperaturas promedio de cada grupo, en ese momento, y sus respectivas desviaciones estndar (DE) (aceptando que la variable presenta una distribucin normal). El estadgrafo Z se calculara, entonces, de la siguiente manera en cada

48

momento: Diferencia de promedios Diferencia de promedios Z = ---------------------------------------------------------------------------------------------------Rc[(DEen A/ Rc(nA)) + (DE en B/ Rc(nB))] =

Rc

[EEA

EEB]

Rc = Raiz cuadrada

En el denominador se encuentran los errores estndar en los grupos, al cuadrado, y sumados para luego extraer raz cuadrada de esta suma.

XVI. Prueba t de Student para muestras independientes Lo explicado hasta el momento deja subentendido que hemos trabajado con muestras grandes. Es relativo el lmite de una muestra pequea, aunque anteriormente ya sugerimos que para menos de 30 casos el clculo de la DE debera modificarse de modo de utilizar la expresin n-1 en vez de n (ver ms atrs). Cuando se trata de muestras grandes, los valores de las desviaciones relativas, por ejemplo, diferencia de promedio/EE de la diferencia de promedios; tienen una distribucin normal. Cuando las muestras estudiadas son pequeas, no puede utilizarse la aproximacin representada por la curva normal. Pero, si la

49

distribucin de la poblacin es normal, en las pequeas muestras se puede recurrir a la distribucin de t. Esta es simtrica como la normal aunque en las colas hay un rea mayor que en la primera. El valor de la distribucin de t que se deber emplear para cada situacin depender del efectivo de las muestras, de modo que se entender por grado de libertad el nmero que resulte de n-1 si se trata de una muestra, o n1 + n2 2 si se trata de dos muestras. Supongamos que vamos a comparar dos promedios en muestras de 20 casos cada una. Lo primero es calcular una desviacin estndar combinada de las dos series:
_ DEc = _________________________ (x1 x1)+ (x2 x2) _________________________ n1 + n2 - 2

Donde, DEc x1 x1 x2 x2 = = = = = = Desviacin estndar combinada. Cada valor de la serie 1 Promedio de los valores de la serie 1 Sumatoria Cada valor de la serie 2 Promedio de los valores de la serie 2

Una vez obtenida DEc podemos calcular los respectivos errores estndar del promedio de cada muestra en la forma usual, slo que empleando aqu la misma DE, DEc, en todo momento. El estadgrafo t alcanzar el valor que corresponda a:
t= _ x 1 x2 ___________________ ____________________ DEc2 DEc2 ______ + _______ n1 n2

Enseguida se deber consultar una tabla de t para

50

ver la probabilidad que el azar tiene de explicar el valor obtenido, que en el presente ejemplo sera para 38 grados de libertad. En una tabla de Z, para que p sea menor que 0,05 debemos tener una cifra mayor que 1,96. En t para igual fin, en 40 grados de libertad se requiere un valor de 2,021 y para 30, 2,042. Diremos ahora que esta prueba de t es llamada tambin como t de Student. XVII. Prueba t de Student para muestras relacionadas En este momento, mencionaremos que lo analizado corresponde a muestras independientes. Una variante que es necesario conocer, porque se da bastante en clnica, es la situacin de un antes versus un despus para un mismo enfermo. Esto significa que cada paciente es su propio control. En tal caso la prueba de t para muestras relacionadas es menos exigente para detectar una diferencia real. En este caso, se determinan las diferencias entre las variables antes y despus, considerndolas siempre en la misma direccin. Las diferencias obtenidas son sometidas a clculo usual de promedio y DE, as como error estndar. Si la diferencia se designa por d entre antes y despus:
d t = _________ EE d

Como cada enfermo o caso es su propio control en realidad es una serie y el nmero de grados de libertad ser n-1. Con ello y la cifra obtenida de t se buscar la probabilidad correspondiente en la tabla t.

51

XVIII. Pruebas de paramtrico hiptesis de tipo no paramtrico y

La expresin inferencia estadstica fue sugerida anteriormente como el proceso de estimar parmetros poblacionales a partir de estadgrafos muestrales. Ahora bien, adems de lo dicho, esa expresin tiene el sentido de verificar hiptesis. En el fondo, el asunto es extraer conclusiones acerca de un gran nmero de sucesos teniendo como base las observaciones de slo una parte de ellos. Las primeras tcnicas de inferencia estadstica que estuvieron disponibles fueron aquellas que hacen una serie de presunciones acerca de las caractersticas de la poblacin origen de la(s) muestra(s). Como los rasgos poblacionales son denominados parmetros, stas tcnicas recibieron el nombre de paramtricas. Exigencias comunes de las pruebas paramtricas para poder utilizarlas con propiedad son, por ejemplo, que las muestras hayan sido obtenidas de una poblacin en que la variable a estudiar est normalmente distribuida as como que un par de conjuntos de datos proceda de poblaciones con igual varianza en la mencionada variable. Las pruebas denominadas No paramtricas tienen, en general, menos exigencias. Lo ltimo que hemos expresado es de gran importancia porque resulta un lugar comn el detectar investigaciones en las cuales la totalidad de los requisitos de las pruebas de hiptesis se dan por cumplidos, sin disponer de argumentos que permitan sostener ello. Toda vez que es posible aplicar una prueba paramtrica, tambin podr utilizarse una no paramtrica. Sin embargo, hay situaciones en que slo podr estar indicado el empleo de estas ltimas, como por ejemplo cuando la variable en anlisis tiene un carcter nominal o bien ordinal. Vale lo dicho para el caso en que el tamao de la muestra sea verdaderamente pequeo (Ej. N = 6) en donde no cabe usar

52

una prueba paramtrica a menos que se sepa exactamente la distribucin poblacional. Como sea, hay que decir que si se cumplen todas las condiciones, lo esperable es que la prueba paramtrica sea capaz en mejor forma de extraer la informacin de un conjunto de datos y as tenga mayor poder. Es importante reiterar que el aspecto si se cumplen todas las condiciones para efectuar una prueba de hiptesis de tipo paramtrico, habitualmente no parece ser investigado. Como sea, si, por ejemplo, vamos a comparar promedios en dos grupos, lo mnimo y por lo dems sencillo es precisar si las varianzas pueden ser consideradas iguales o no. Para ello, la razn varianza mayor/varianza menor junto al nmero de casos por grupo nos permitir, revisando la tabla ad-hoc, sealar hasta qu punto una variacin del muestreo pudiera explicar lo encontrado. Si la decisin es que las varianzas son distintas: el azar explica menos de 5 veces en 100 una razn como la encontrada, entonces los grupos investigados son distintos. Mas adelante el lector encontrar una proposicin para determinar si la distribucin de su muestra es compatible con la normal(Ver seccin correspondiente) XIX. Pruebas no paramtricas y su indicacin Hasta el momento, las pruebas de hiptesis que hemos visto son de tipo paramtrico. Ahora mencionaremos algunas no paramtricas y su indicacin usual: Ji cuadrado. Se la utiliza como prueba de asociacin as como de ajuste entre valores encontrados y una distribucin terica. Cuando se trata de una muestra en la cual se encuentran dos o ms categoras, se desea saber si existe una diferencia significativa entre el nmero de sucesos o individuos que se observan en cada categora de la muestra y las cifras tericas esperadas bajo la hiptesis nula.

53

Binominal (una muestra). Se desea saber si es razonable sostener que las proporciones de dos clases (hombre-mujer, escolares-no-escolares, etc.) que se observan en una muestra, pudieran proceder de una poblacin con determinados valores de esas proporciones. Kolmogorov-Smirnov (una muestra). En una muestra, se desea saber si la distribucin de valores que la caracterizan se ajusta a la distribucin terica que se atribuye a la poblacin. Es muy importante sealar que esta prueba estudia frecuencias acumulativas. Mc Nemar (para la significacin de los cambios). En un grupo, se compara una situacin de un antes y un despus en cada miembro, de modo que cada caso es su propio control. La variable se mide en escala nominal u ordinal y se determina hasta donde el azar pudiera explicar el cambio observado. Wilcoxon. Dos muestras pareadas o mejor una muestra, donde se estudia el efecto de una intervencin. La diferencia observada es analizada considerando la magnitud y direccin del cambio. Signo. Como la situacin anterior, si no es posible establecer magnitud sino slo direccin del cambio. Fisher-Irwin(de probabilidad exacta). Dos muestras independientes, que suman habitualmente menos de 20 casos, con valores estudiados en escala nominal u ordinal, donde todos caen en dos clases mutuamente excluyentes. Esto significa que cada sujeto en ambos grupos obtiene slo uno de dos posibles resultados. Se pretende determinar si los grupos difieren en las proporciones que muestran. Ji cuadrado, con correccin de Yates. La misma situacin anterior(Tabla de 2 x 2), para muestras que suman generalmente ms de 40 casos.

54

La limitacin que impone el nmero de casos es,en realidad, en el sentido de la inconveniencia de efectuar la prueba de Ji cuadrado si la muestra es pequea, pero se debe tener presente que el nico impedimento para efectuar la prueba de Fisher-Irwin con muchos casos lo impone la posibilidad de calcular grandes cantidades. Hoy en da, los computadores personales resuelven tal problema sin dificultad. Para una situacin intermedia se puede emplear la prueba de Fisher, o Ji2 si ningn valor esperado es menor de 5 y no hay cero en ningn casillero. Correccin de Yates cuando corresponda(1 grado de libertad). Mediana. Se busca determinar si dos muestras independientes han sido extradas de poblaciones con igual mediana. Asimismo, se puede decir que se desea verificar si dos grupos independientes difieren en tendencia central. U de Mann-Whitney. Se pretende verificar si dos muestras independientes han sido extradas de la misma poblacin. Esta es la prueba de eleccin cuando no se cumplen los requisitos para una prueba t. Kolmogorov-Smirnov (dos muestras). Como en el caso anterior, se busca verificar acaso dos grupos independientes han sido extrados de la misma poblacin. La prueba bilateral detectar cualquier clase de diferencia en las distribuciones de donde proceden las muestras: tendencia central, dispersin, asimetra, etc.. La prueba unilateral permitir decidir si los resultados en un grupo experimental son mejores que en el grupo control. Wald-Wolfowitz. Esta prueba compara dos muestras para verificar si proceden de poblaciones que difieren en cualquier aspecto. Prueba de aleatorizacin (Randomization). Se busca comparar promedios de dos pequeas muestras independientes. La variable en cuestin tiene que haber sido

55

medida por lo menos en escala de intervalo.Est indicada si no es posible usar la prueba t.

XX. Prueba de Ji cuadrado. Mc Nemar. La prueba de Ji cuadrado es, probablemente, la prueba de hiptesis no paramtrica ms conocida y utilizada. En principio, usualmente se la emplea como prueba de conformidad o ajuste entre una distribucin encontrada, para una variable nominal u ordinal y una distribucin terica esperable, segn alguna ley conocida o segn relaciones que se supone existen entre las variables estudiadas. Conviene sealar que cualquier variable puede ser llevada a un anlisis por Ji2 pero hay que tener presente que en ella hay un error beta de importancia, es decir se trata de una prueba donde es ms probable que en otras no detectar una diferencia que si existe. La aritmtica de Ji2 requiere disponer de una serie de valores encontrados (u observados) y los respectivos valores tericos esperables. Imaginemos que una muestra de 80 semillas de una planta determinada distribuye ciertas caractersticas as:
Caracterstica a b c d Total N de semillas que la presenta 30 25 18 8 80

De acuerdo con la gentica mendeliana supongamos que la proporcin esperada a:b:c:d es 9.3:3:1. Entonces, efectuamos la distribucin del efecto de 80 semillas

56

en sta proporcin, con el objetivo de obtener los valores tericos esperados.

80 _________ 9+3+3+1 Ahora, 5 5 5 5 x x x x 9 3 3 1 = = = = 45 15 15 1 80

80 __________ = 5 16

Total

Despus de hacer esta particin proporcional, continuamos comparando los valores observados con los esperados. Las diferencias son elevadas al cuadrado, se dividen por los valores tericos y luego se suman para obtener el estadgrafo Ji2.
Valor observado Valor terico Diferencia absoluta
terico Diferencia/Valor

30 25 18 8

45 15 15 5

15 10 3 3

5,00 6,66 0,60 1,80

Ji2 = 14,06

Enseguida, debemos establecer el nmero de trminos independientes de la distribucin, es decir, el nmero de grado de libertad. En el caso presente se comprende fcilmente que es n-1, ya que para un total de 4 trminos que suman 80, tres pueden variar libremente pero el ltimo debe ser lo que falta para que el resultado sea efectivamente 80. Tenemos, entonces, 3 grados de libertad y si vemos la tabla de Ji2 encontraremos que p es menor que

57

0,01. Esto significa que diferencias como las observadas entre los valores encontrados y esperados podrn ocurrir por azar menos que una vez en 100 ocasiones que se efecte la experiencia. La consecuencia prctica es que consideraremos que la distribucin detectada en las 80 semillas no se ajusta a la respectiva ley de Mendel. En resumen, para obtener el estadgrafo Ji2:
0T Ji2 =

_________ T

= El parntesis recto significa que 0-T es una diferencia absoluta. Ms adelante se evidencia la importancia de esto. O= Valores observados (encontrados). T = Valores tericos (esperados).

Debemos decir que lo explicado hasta ahora no es la situacin ms comn, puesto que lo usual es que los valores tericos deban ser estimados. Tomemos, por ejemplo, datos agrupables en una tabla de 2 x 2. Podra tratarse de la proporcin de fallecidos en dos grupos de enfermos, sometidos a los tratamientos A y B.
Fallecidos A Tratamiento B Total 38 57 82 181 120 238 19 Sobreviven 99 Total 118

Como no disponemos de resultados tericos esperables segn alguna ley o norma, se estiman de acuerdo a como seran si la hiptesis nula (de no diferencia entre los

58

tratamientos) fuese cierta. Para ello, la cifra terica en cada casillero se obtiene de multiplicar los totales marginales que corresponden a ese casillero y luego dividindolo por el total de la tabla. As, donde hay 19 fallecidos, lo esperable sera:
57 x 118 _________ 238 = 28,26

En el resto, los valores seran : 89,73, 28,73 y 91,26. Al calcular Ji cuadrado se obtendr 7,9. Tal es el procedimiento general, pero en tablas 2 x 2 se considera recomendable efectuar la correccin de Yates que pretende reducir las consecuencias de aproximarse a una distribucin discreta, la de la muestra, por medio de una continua, la de Ji cuadrado. En lo aritmtico, esta correccin consiste en reducir la diferencia 0-T en 0,5 unidades. Entonces, el clculo emplear la frmula:
( 0T Ji2 = - 0,5)

_______________ T

La correccin por continuidad (Yates) se aplica en circunstancias que exista 1 grado de libertad en la prueba de Ji2. En el ejemplo, el estadgrafo con correccin tendra un valor de 7,07. Grados de libertad: en tablas, se determina como (N de columnas 1) x (N de filas 1). En el ejemplo anterior sera: (2 - 1) x (2 1) = 1 x 1 = 1 grado de libertad. Para un grado de libertad, el valor crtico de Ji2 con un error alfa de 5% es de 3,84. Se concluira, por tanto, que con el tratamiento A la letalidad es menor. Es interesante recordar que en la especial situacin de tabla de 2 x 2, la raz cuadrada de Ji2 proporciona el valor del estadgrafo Z, visto con anterioridad. As, la raz cuadrada de 7,07 genera Z = 2,65. El rea bajo la curva

59

normal desde 2,65 hasta +2,65 desviaciones estndar es 0,99195, de modo que la zona exterior, p es 1 0,99195 = 0,008. Con la prueba de Ji cuadrado es posible analizar tablas de cualquier tamao, tomando en cuenta ciertas limitaciones: En ninguna celda debe haber cero casos y en todas slo nmero enteros. En no ms del 20% (1 de 5) de las celdas debe haber un valor terico inferior a 5. Para un correcto anlisis, puede ser necesario reagrupar los datos. Por ejemplo, deseamos precisar qu relacin puede haber entre el estado de hidratacin al ingreso y la duracin de la internacin en nios con la enfermedad NM.

Estado de hidratacin Normal Dh(+) (++) (+++) Totales

Duracin de la hospitalizacin(ds) <7 7-14 >14 10 20 5 1 36 3 25 3 0 31 2 5 3 2 12

Totales 15 50 11 3 79

Tenemos un cero y si el lector efecta el clculo respectivo ver que en 5 celdas hay un valor terico inferior a 5. Una reagrupacin posible sera:
Estado de hidratacin Normal Duracin de la hospitalizacin (ds.) <7 7 y mas 10 5 Totales 15

60 Dh (+) 20 (++) o (+++) 6 Totales 36 30 8 43 50 14 79

En esta forma no hay ningn cero y ninguna cifra terica inferior a cinco. El valor de Ji2 que se obtiene es de 3,35 y para dos grados de libertad la cifra crtica es de 5,99, para un error alfa de 5%. En consecuencia, la interpretacin sera aceptar la hiptesis de no relacin entre ambas variables. An sera posible agrupar ms la informacin presentndola as:
Estado de hidratacin Normal Dh Totales Duracin de la hospitalizacin (ds.) <7 7 y mas 10 26 36 5 38 43 Totales 15 64 79

En este caso, se obtiene Ji2 , con correccin de Yates, de 2,35 en circunstancias que el valor crtico, como vimos antes, es de 3,84. En las tablas incluidas al final se proporciona probabilidades segn grados de libertad y cifra obtenida de Ji2. Ji cuadrado tambin es aplicable a problemas que, en ltimo trmino, involucran slo 2 celdas. As ocurre, por ejemplo, en la prueba de Mc Nemar que examina el significado de los cambios en muestras relacionadas. Imaginemos que dos mdicos examinan independientemente a 2.500 recin nacidos y se desea saber si difieren en lo referente a detectar signos clnicos de displasia de caderas. Los resultados podran ser de la siguiente naturaleza:
Mdico A Displasia

61 (+) (+) 48 Mdico B .Displasia (-) Totales 50 98 2.378 2.402 2.428 2.500 (-) 24 Totales 72

En 2.378 casos ambos mdicos estn de acuerdo en que no hay evidencias de displasia de caderas, en 48 nios coinciden en lo opuesto, en 50 ocasiones discreparon en un sentido y en 24 en el otro. La prueba de Mc Nemar responde hasta qu punto las opiniones divergentes pudieran ser explicadas por el azar. Por ello slo toma en cuenta las dos celdas que corresponden a opinin discrepante. Lo esperable sera que las diferencias de opinin se repartieran en partes iguales si el factor mdico que examina no influyera. La aritmtica de la prueba busca Ji cuadrado, para un grado de libertad, de la manera que sigue:
Ji ( 50 24 - 1) = ______________________ 50 + 24 = 8,44

y p < 0,01 para 1 grado libertad.

Entonces, la diferencia absoluta entre los casilleros donde A y B discrepan, menos 1 y elevado al cuadrado, se divide por la suma de los casilleros donde difieren A y B. En la situacin presentada cul de los examinadores diagnostica ms acertadamente?. No se sabe, puesto que no tenemos identificados por un estndar ideal los recin nacidos sanos y aquellos con displasia. La prueba nos permite decir que la diferencia de opinin entre los dos mdicos no debe considerarse explicable por azar, que el examinador A diagnostica ms displasias que su colega y que no es comn que estn en desacuerdo: 74 / 2.500 = 2,96% de las veces.

62

En muchas oportunidades la prueba de Mc Nemar se emplear para comparar una muestra en situacin de antes y despus de una determinada intervencin. Prueba de Ji proporciones. cuadrado en la comparacin de m

La prueba de Ji cuadrado se puede emplear en la comparacin de un grupo de proporciones para establecer si difieren significativamente. Tomemos el siguiente ejemplo de tres proporciones:

n N de casos proporcin(p) I.- 100 20 0,20 II.- 200 30 0,15 III.- 250 25 0,10 -------------------------------------------------------------------------------------550 75 0,1364( p ) q = 1-p

grados de libertad = m - 1 clculo: Ji cuadrado = (1 / pq )


m

n
i

(p
i

- p

Entonces, para 2 grados de libertad:


Ji cuadrado = ( 1

/ 0,1364 x

0,8636 )

100(0,20-0,1364) + 200(0,15

63 0,1364) + 250(0,25 0,1364)

= 6,51 y p = 0,03

XXI. Prueba de Fisher-Irwin de probabilidades exactas. Esta es una prueba no paramtrica, que se emplea en el anlisis de datos de dos grupos independientes presentados en tabla de dos por dos. Su gran valor est en proporcionar la probabilidad exacta de que el azar explique una distribucin determinada en la tabla que se investiga, as como hacerlo con un nmero de casos donde una prueba de Ji cuadrado no sera aplicable.
Antes de avanzar ms recordaremos la notacin factorial. Cuando se escribe, por ejemplo, 5!, esto quiere decir = 5 x 4 x 3 x 2 x 1 = 120. De la misma manera 10! = 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 y esto es igual a 3.628.800. Por ltimo, 0! = 1.

Imaginemos un ensayo sobre dos grupos de 7 animales cada uno, en que se probar el efecto protector de una droga respecto a una determinada noxa:
A (+) 1 Efecto protector (-) Totales 6 7 0 7 6 14 Grupo B 7 Totales 8

De acuerdo con la prueba de Fisher, la probabilidad de una distribucin como la mostrada en la tabla, originada bajo la hiptesis nula de no efecto de la droga en estudio, sera exactamente:

8! x 6! x 7! x 7!

64 p = ____________________ 1! x 7! x 6! x 0! x 14! = 0,0023

Esto significa, entonces, que el clculo se realiza colocando como numerador el producto de los factoriales de los totales marginales y como denominador el producto de los factoriales de las cifras en el interior de la tabla y el total de casos. Es importante dejar establecido que cuando los resultados en las 4 celdas de la tabla no incluyen un cero, la probabilidad real de la distribucin encontrada es aquella calculada con los datos obtenidos ms las probabilidades de todas las distribuciones ms extremas. Para aclarar mejor esto retomemos el ejemplo suponiendo que los resultados fueron:
Grupo A (+) 2 Efecto protector (-) Totales 5 7 1 7 6 14 B 6 Totales 8

En este caso p = 0,048, sin embargo debemos sumar al resultado el valor de p para las distribuciones ms extremas, hasta llegar a cero en la celda correspondiente. As tendramos, conservando constantes los totales marginales:
Grupo A B (+) 1 7 Efecto protector (-) Totales 6 7 0 7 6 14

Totales 8

65

Ahora p = 0,0023 que, sumado al valor obtenido anteriormente, nos da p 0,048 + 0,0023 = 0,0503.

XXII. Prueba de Wald Wolfowitz (runs test) Esta una prueba de hiptesis no paramtrica capaz de detectar cualquier tipo de diferencia existente entre dos grupos: sea en tendencia central o en dispersin, por mencionar las ms comunes. La nica presuncin que se debe aceptar es que la variable en anlisis tiene una distribucin continua, de modo que las mediciones deben ser efectuadas al menos en escala ordinal. Para aplicar la prueba, a dos muestras independientes de tamao n1 y n2, manteniendo la identidad de grupo de cada caso, establece un orden creciente de puntajes o de valores en el conjunto n1 + n2. En seguida se contabiliza el nmero de secuencias de puntajes o valores que corresponden a cada grupo (veremos enseguida como se hace esto). La idea es que si ambos grupos pertenecen al mismo Universo el entrelazamiento de puntajes ser grande y grande ser tambin el nmero de secuencias que se podr contabilizar como pertenecientes a uno y otro conjunto. Si n1 o n2 contienen ms de 20 casos, entonces la artimtica de la prueba nos permite obtener el estadgrafo Z como en otras oportunidades. Con menos casos es necesario consultar una tabla ad-hoc. Como ejemplo compararemos los grupos A y B que muestran los siguientes puntajes respecto de una variable en estudio:

Grupo A (n1 =22)

Grupo B (n2 = 22)

66

1-1-1 3-3 5 7 10-12-14-18 25-27-29-35-36-37 40-42-43 44-44

2-2-2 4-4-4 6-6 8-9 11-11-11 15-15 16-17-19-20-21-23-24

Si identificamos los casos del grupo B con un asterisco, el orden, una vez mezclados los dos conjuntos, quedara como sigue:

1 1 1 2* 2* 2* 3 3 4* 4* 4* 5 6* 6* 7 8* 9* 1 11* 11* 11* 14 15* 15* 16* 17* 18 19* 20* 21* 23* 24* 25 27 29

12

35 36 37 40 42 43 44

67 44 El nmero de secuencias( r) sera en total de 15 (r = 15). Ahora bien, 2n1 n2 + 1 ) - 0,5 n1 + n2 ______________________________________ r___ ____________________________________ 2 n1 n2 (2 n1 n2 n1 - n2) _________________________ (n1 + n2)2 (n1 + n2 1)

Z= 0,05).

2,28

(p<

Esta expresin tiene una distribucin aproximadamente normal, con promedio cero y varianza de uno. La prueba se maneja como unilateral porque el planteamiento es que r es menor que los valores esperados bajo la hiptesis nula. El resultado obtenido debe ser interpretado en el sentido que los grupos A y B son diferentes. La prueba no establece en qu difieren, por lo que se requiere mayor indagacin. As, podramos utilizar la prueba de la mediana para verificar si la diferencia est en la tendencia central o en otro aspecto. Para realizar la mencionada prueba en los dos grupos se debe buscar la mediana del conjunto n1 + n2 y luego separar en cada grupo el nmero de casos, valores o puntajes que se encuentran por encima o en y bajo la mediana comn. Enseguida se aplicar Ji cuadrado o la prueba de Fisher a la tabla as obtenida. En el ejemplo que estamos analizando, la mediana comn es 13 (entre 12 y 14).
Grupo A B Totales

68 Sobre 13 En o Bajo 13 Totales 13 9 22 9 13 22 22 22 44

p por prueba de Fisher = 0,18 p por Ji cuadrado con correccin de Yates = 0,36

En consecuencia, los grupos son comparables desde el punto de vista de la tendencia central y la diferencia debe estar en la forma como se dispersan los datos. Al examinar A y B podemos notar que el primero tiene una larga secuencia del puntaje 25 al 44. Si hacemos un corte a nivel de 25 puede aparecer la diferencia que buscamos:
= 25 < 25 Totales Grupo A B 11 0 11 22 22 Totales 11 33 44

22

Entonces, los grupos difieren en dispersin.

p por prueba de Fisher = 0,00009.

XXIII. Medidas de asociacin basadas en Ji cuadrado. Anteriormente mencionamos que Ji cuadrado nos permita tener una idea de la existencia de asociacin entre variables. Vemos en una tabla de 2 x 2:

Variable A Presente Ausente (+ ) 19 9

Totales 28

69 Resultado (-) Totales 10 29 20 29 30 58

Ji cuadrado con correccin de Yates = 5,59 y p = 0,01.

Se podra decir, entonces, que hay una asociacin entre variable A y resultado con una probabilidad que el azar explique la distribucin de valores encontrada en la tabla de 0,01. Si cada uno de los valores numricos fuese 3 veces mayor:

Variable A Presente Ausente (+ ) 57 27 Resultado (-) Totales 30 87 60 87

Totales 84 90 174

Ji cuadrado con correccin de Yates = 19,35 y p = 0,00001.

Esto podra hacer pensar que ahora la asociacin es mayor. Sin embargo, el valor de p cambi como consecuencia del incremento en el tamao de la muestra estudiada. La fuerza de la asociacin es lo que nos interesa medir y sta naturalmente ser la misma entre variable y resultado- independientemente del efectivo de la muestra. Una idea general se puede conseguir con el Coeficiente de contingencia cuyo clculo es:
__ C = _______ Ji2 _______

70 Ji2 + n donde n es el efectivo de la muestra.

El valor mximo que puede alcanzar esta medida de asociacin es dado por:
__ _______ k-1 _______ k

tabla k

donde k es el nmero de filas o columnas de la k.

En el ejemplo presentado ms arriba, obtendramos un coeficiente de contingencia de 0,29 en la primera tabla y de 0,31 en la segunda, cifra parecida pero no igual. El valor mximo alcanzable en una tabla de 2 x 2 sera de 0,70. El coeficiente de contingencia no suele emplearse mucho debido a ciertos inconvenientes que presenta: En trminos generales una medida de correlacin debe mostrar las siguientes caractersticas: a.- Cuando hay falta absoluta de asociacin, el coeficiente debiera ser cero. b.- cuando las variables muestran completa dependencia entre si- es decir estn perfectamente correlacionadas- el coeficiente respectivo debiera ser 1. El coeficiente de contingencia tiene la primera caracterstica pero no la segunda. El limite superior del coeficiente de contingencia es funcin del numero de categoras, lo que significa que dos coeficientes no se pueden comparar a menos que procedan de tablas de contingencia de igual tamao. Otra limitacin es que los datos de la tabla en anlisis deben ser apropiados para efectuar Ji cuadrado, ya que esa prueba nos dir si el coeficiente es significativamente diferente de cero. Cuan bueno es un resultado no podemos decirlo de seguro ya que no hay acuerdo sobre el punto.

71

Una ultima limitacin del coeficiente de contingencia es que no se puede comparar directamente con ninguna otra medida de correlacin como las estadsticas respectivas de Pearson,Spearman o Kendall. A pesar de todo, se puede decir que cuando no se puede aplicar otra medida de asociacin, se recurre al coeficiente de contingencia . La Correlacin de atributos, que vara entre cero y la unidad es otra forma de estudiar la asociacin que nos interesa:
_______ Ji2 ________ n (k 1)

__ r =

En el ejemplo analizado r tendra un valor de 0,31 en la primera tabla y 0,33 en la segunda. El llamado coeficiente phi permite estimar el grado de asociacin entre las variables, tambin derivado de Ji cuadrado pero con la particularidad de ser independiente del tamao total de la muestra, n.
_______ Ji2 ________ n

__ Phi =

En el numerador est Ji cuadrado sin correccin de Yates.

OTRAS MEDIDAS DE ASOCIACIN. Cuando se dispone de un estudio de seguimiento en el que se investigar la aparicin de un resultado en dos

72

grupos de acuerdo a la presencia o ausencia de un factor de riesgo, es posible hacer un buen examen de la supuesta asociacin factor de riesgo-resultado:
Factor de riesgo presente Grupo A (+) 35 Resultado (-) Totales 965 1.000 990 1.000 1.955 2.000 Factor de riesgo ausente Grupo B Totales 10 45

Como es fcil apreciar, fueron sometidos a seguimiento 2.000 casos, mil de ellos que presentaban un determinado factor de riesgo de generar un resultado (+). En la tabla se puede ver que este riesgo en el grupo A es de 35/1.000 y en el grupo B de 10/1.000 , 0,035 y 0,010, respectivamente. El riesgo relativo (RR), es decir cuntas veces ms probable es el resultado (+) cuando el factor de riesgo est presente que cuando no lo est, es proporcionado por la razn 0,035/0,010 = 3,5. Ahora, el riesgo atribuible (RA) a la presencia del factor en anlisis, ya que tambin se producen resultados (+) en ausencia del supuesto factor de riesgo, se puede obtener de la siguiente manera:

RA

0,035 0,010 ______________ 0,035

100 = 71,42%

Una aproximacin al riesgo relativo (RR), que es necesaria en los estudios retrospectivos, es estudiar las razones de resultados (+)/resultados (-) en vez del total marginal (1.000 en el ejemplo). Al hacer esto obtendramos 35 / 965 = 0,036 y 0,010 al dividir 10 por 990. La mencionada aproximacin al RR sera 0,036/0,010 = 3,6, cifra bastante similar a la verdadera. Su denominacin, que no tiene una buena traduccin al Espaol, es odds ratio (OR), tiene

73

similar interpretacin que el RR y se obtiene trabajando solamente en las cifras de las celdas, sin utilizar los totales marginales. A veces se usa el nombre de razn de productos cruzados porque es una forma de calcular estos odds ratio. En el ejemplo sera 990 x 35 / 965 x 10 = 3,59. Para resumir, al estudiar 2.000 casos para ver si hay asociacin entre la existencia de un determinado factor de riesgo y el resultado (+) se encuentra que s la hay ya que se obtiene un Ji cuadrado, para la distribucin encontrada, de 13,09 y p = 0,00031. La fuerza de esta asociacin es dada por el RR de 3,5 o el OR de 3,6 (en caso de tratarse de una investigacin retrospectiva). Para completar la informacin sera necesario establecer los respectivos intervalos de confianza. Para el caso del OR una buena aproximacin se logra de la siguiente forma:
Sean: L el logaritmo natural del OR calculado, nA, nB, nC y nD las cifras de las respectivas celdas de la tabla de 2 x 2. ________________________________________ 1 1 1 1 _________ + _________ + _________ +

EE de L _________ 0,5

nA + 0,5

nB + 0,5

nC + 0,5

nD +

Intervalo de confianza del 95%: Lmite inferior de OR = antilogaritmo natural (L 1,96 x EE de L). Lmite superior de OR = antilogaritmo natural (L + 1,96 x EE de L). En el caso analizado OR = 3,59: L = 1,27815 y EE de L = 0,35419 Entonces: Lmite inferior de OR = antilogaritmo natural (1,27815 1,96 x 0,35419) = 1,79 Lmite superior de OR = antilogaritmo natural (1,27815 + 1,96 x 0,35419) = 7,18. Para el RR el IC95% se estima de la siguiente manera:

74 IC 95%= (RR) exp[+ 1,96

Rc

(1-a /(a+c) )/a + ((1-b /(b+d))/b

Rc= Raiz cuadrada exp =Base de los log naturales elevada a la cantidad entre parntesis.

XXIV. Anlisis de material y mtodo. A continuacin presentaremos un ejercicio que consiste en encontrar los principales errores u omisiones en la seccin Material y Mtodo de un estudio que se propone realizar. En ejemplos que hemos puesto con anterioridad la descripcin se ha centrado en proporcionar los elementos necesarios para una comprensin bsica del problema y para justificar el anlisis estadstico a efectuar. Aqu, en cambio, se espera que el lector pueda detectar la mayora de los defectos que presenta el texto a revisar. Se desea comparar la eficacia y seguridad de una solucin hidratante para nios hospitalizados con diagnstico de diarrea aguda y deshidratacin, que es en todo similar a la propuesta por la O.M.S. en 1984 pero conteniendo 30 mEq/l menos de sodio (Na 60) y cloro (Cl 50). Material y mtodo. Ingresarn al estudio 130 nios menores de 20 meses hospitalizados con diagnstico de diarrea aguda y deshidratacin leve o moderada. Los pacientes sern asignados al azar para recibir hidratacin oral con solucin glucoelectroltica conteniendo 90 60 mEq/ l de sodio (grupos Na 90 y Na 60,

75

respectivamente). La composicin de estas soluciones es la siguiente:

Na 90 Na K Cl Citrato Glucosa Osmolaridad (mmol/l) (mmol/l) (mmol/l) (mmol/l) (mmol/l) (mOsmol/l) 90 20 80 10 111 311

Na 60 60 20 50 10 111 251

La primera de ellas corresponde a la composicin que promueve la Organizacin Mundial de la Salud para el manejo del sndrome diarreico agudo en los niveles de prevencin y reparacin de la deshidratacin as como para fines de mantenimiento del equilibrio hidroelectroltico. El manejo de rutina de los enfermos se ajustar a las normas vigentes en el Servicio de Pediatra. El aporte de volumen variar, segn intensidad de la deshidratacin, entre 220 y 260 ml/kg/24 horas, proporcionando la mitad en las primeras seis horas (fase de rehidratacin). La cantidad restante, de la que deber deducirse 40 a 60 ml/kg/da de alimentacin, se proporcionar en las siguientes 18 horas (fase de mantenimiento). Las soluciones se administrarn por gastroclisis en goteo continuo y en la realimentacin se emplear frmula lctea II. En esta ltima fase, al grupo Na 90 se ofrecer a beber agua pura en forma libre. El estado nutricional ser catalogado segn criterio peso/talla, con paciente bien hidratado. La informacin obtenida ser vaciada a un

76

formulario ad-hoc para cada enfermo. En todos los nios se determinar al ingreso electrolitos plasmticos, sodio, potasio y cloro as como estudio de equilibrio cido-base en sangre venosa. Asimismo, se iniciar investigacin etiolgica del cuadro diarreico, en dos muestras de deposiciones recin emitidas, incluyendo bsqueda de Salmonella, Shigella, ECEP serotipo clsico, Rotavirus, Campylobacter, Cryptosporidium sp., Entamoeba hystoltica, Giardia lambia y otros parsitos. La tolerancia al procedimiento de hidratacin, el cumplimiento de las indicaciones y la evolucin del estado de hidratacin sern controlados a intervalos frecuentes y regulares. Una vez constatada la normalidad del estado de hidratacin del caso, se iniciar la fase de mantenimiento. En este momento, en todos los enfermos se determinar electrolitos plasmticos, sodio, potasio y cloro, as como estudio de equilibrio cido-base en sangre venosa para conocer la situacin humoral del nio bien hidratado. En un grupo elegido al azar dentro de la muestra, constituido por 20 pacientes (10 hidratados con Na 90 e igual nmero con Na 60), se tomar muestra de orina para electrolitos, sodio, potasio y cloro. En ellos, se medir el ndice relacin de concentracin orina-plasma (O/P) de sodio para evaluar el manejo del catin segn tipo de solucin glucoelectroltica empleado. En la investigacin etiolgica de Salmonella, Shigella y E. coli, se utilizar la siembra en agar SS y Mac Conkey. Para la identificacin de los serotipos clsicos de E. coli enteropatgena se emplearn reacciones de aglutinacin con los antisueros pertinentes. La bsqueda de Campylobacter se realizar por examen microscpico de heces teidas con Violeta-bicarbonato de Hucker y la de Cryptosporidium sp por medio de la tincin de Ziehl Neelsen modificada. La deteccin de Rotavirus se efectuar por medio de la electroforesis del cido nucleico viral.

77

Los resultados numricos sern sometidos a anlisis estadstico de significacin aceptando un error alfa de 5%. Para ello se dispondr de un paquete estadstico BMDP y computador IBM/PC. Resultado de la revisin. No se encuentra explcita una hiptesis. No se justifica el tamao de la muestra. No se expresa nivel de error alfa, beta, potencia del estudio ni diferencia que se considerar clnicamente significativa. Las variables a estudiar y a controlar no estn precisadas como tales. No hay ninguna referencia bibliogrfica. No se explica procedimiento de asignacin al azar de los pacientes. No se indica qu composicin tiene la frmula lctea II. No se seala cun ciego ser el estudio. No se establece qu patrn de comparacin y qu criterio de clasificacin segn relacin peso/talla se aplicar. No se expresa el detalle de la informacin que contendr el formulario ad-hoc. No se explica qu se deber entender por controles a intervalos frecuentes y regulares. No se seala cmo se constatar la normalidad del estado de hidratacin. No se indica cmo ser elegida la submuestra de 20 nios. No se detalla procedimiento de deteccin de

78

parsitos en las heces. El manejo al que sern sometidos los resultados no es en absoluto explicado. Un computador y un paquete estadstico no son garanta de un anlisis correcto. Recin en esta parte final se habla de error alfa de 5%. Seguramente el lector podr identificar otros defectos adicionales.
Referencias.
-LAMOTTE M. Estadstica biolgica. Barcelona: Toray - Masson S. A., 1965: 83-156. -BANCROFT M. Introduccin a la bioestadstica. 215. -SIEGEL S. Non parametric statistics. New York:: Mc Graw-Hill Book Co., 1956: 61-136. -MATTHEWS D., FAREWELL V. Estadstica mdica. Barcelona: Salvat S. A., 1988: 1-55. -FRIEDMAN L., FURBERG C., DE METS D. Fundamentals of clinical trials. 2nd edition, Massachusetts: PSG Publishing Co., 1985: 11 135. -RIEGELMAN R. Studying a study and testing a test. Boston: Little, Brown and Co., 1981: 93- 243. -STEEDL R., TORRIEJ. Bioestadstica: principios y procedimientos. Madrid: Mc GrawHill -Book Co., 1988: 83 116. -FLEISS J. Statistical methods for rates and proportions, 2 nd edition, New York: Wiley & sons. 1980: 19 50. -COLTON TH. Estadstica en medicina. Barcelona: Salvat S. A., 1979: 11 190. -SACKETT D., HAYNES R., GUYATT G., TUGWELL P. Clinical epidemilogy, 2nd edition, Boston: Little, Brown and Co., 1991: 3 153. John Buenos Airres: EUDEBA, 1961: 145-

79

XXV Verificacin de compatibilidad de una distribucin muestral con la normal. Ya hemos sealado la importancia de establecer si la distribucin de la muestra en estudio cumple los requisitos para aplicar una prueba de hiptesis paramtrica. Supongamos el siguiente conjunto de valores que constituye una muestra en la que deseamos establecer si es compatible con la existencia de esta misma variable distribuida normalmente en la poblacin de la cual se extrajo. Valores adoptados por la variable: 5-5-5-5-5-5-5-5-5-5-6-6-6-6-6-6-6-6-7-7-8-8-9-9-9-9-12-12-1212-12-15-15-15-15-15-15-16-17-18-18-18-18-18-19-19-23-2426-26-26-26-26-27-27-27-28-29-30-35-36-38-38-38-39-40-4041-41-42-42-43-44. Observaciones(n): 73 Ahora determinamos promedio y desviacin estndar. Obtenemos: Promedio=18,86 DE= 12,64
n-1

Si tenemos una distribucin normal, la muestra debera repartirse consecuentemente:


- 6,42 - 2DE
Proporcin esperada

6,22 - 1DE

18,86 PROMEDIO
68,26% 24,91

31,50 +1DE

44,14 +2DE

13,59%
1,67 9,92 24,91

13,59%
9,92 1,67

N esperado N observado

18

26

15

14

Reestructurando la tabla para que no tenga ceros o valores esperados menores que 5:

80

N esperado N observado

11,59 18

24,91 26

24,91 15

11,59 14

Totales. 73 73

Ji cuadrado = 8,02 g.l. = 3 p = 0,046 Debemos concluir que la distribucin de la muestra difiere significativamente de la normal. Otros procedimientos estn basados en la prueba de Kolmogorov -Smirnov. Paquetes computacionales permiten efectuar esta verificacin de ajuste a la distribucin normal(Arcus).

XXVI TABLA DE 2 X 2. La tabla de 2 x 2 es muy frecuentemente usada para informar resultados de una investigacin. Puede ser empleada ante variables de cualquier tipo: nominales, ordinales, de intervalo y de razn pero es mas apropiadamente aplicada a aquellas nominales y ordinales, aunque lo que se requiere es poder dicotomizar los resultados. De esa forma ser factible dar su significado a cada casilla del total de cuatro. Descripcin:Las partes constituyentes de la tabla 2 x 2 son las siguientes: a c b d a+b c+d

81

a+c a,b,c,d = las 4 casillas a...d = diagonal principal b....c = diagonal secundaria a+b, c+d, a+c, b+d = Totales marginales N : a+b+c+d = Total

b+d

Revisaremos usos comunes de este tipo de tabla: 1.-Dos grupos independientes,comparacin de proporciones. Si estudiamos dos grupos y pretendemos establecer si la variable en anlisis en cada uno muestra una proporcin diferente, entonces,en las cuatro casillas a, b, c ,d las cifras se distribuirn de un modo no explicable por azar. Por lo tanto, lo que debemos hacer es determinar cun probable es que el ste explique la distribucin encontrada. Para ello ,dependiendo del numero de casos se utilizar la prueba de Ji cuadrado con correccin de Yates o bien la prueba de Fisher-Irwin de probabilidades exactas. Si la distribucin encontrada, es explicable por el azar mas de 5 veces en 100 ocasiones que se repitiera la experiencia ( p > 0,05) deberemos concluir que la variable no tiene diferente frecuencia en ambos grupos. Supongamos el siguiente caso: El conjunto A muestra complicaciones en 10/50 casos(0,20 o 20%) y el B en 6/50 casos( 0,12 o 12%); entonces: Grupo Tratamiento A B si Complicaciones no 40 50 44 50 84 100 10 6 16

82

En la tabla ,analizada por Ji cuadrado, obtenemos: Ji2 con correccin de Yates = 0,67 y p = 0,41. Debemos concluir entonces que no es posible indicar que la existencia de complicaciones sea mas comn en un grupo que en el otro. En cambio, si la tabla muestra los resultados siguientes: Grupo Tratamiento A B si Complicaciones no 35 50 45 50 80 100 15 5 20

En este caso tendremos, Ji2 con correccin de Yates =5,06 y p = 0,024 y se tendr que concluir que para la presencia de la variable "complicaciones" no es indiferente que se trate del grupo A o B ya que aquellas se dieron con clara mayor frecuencia en el primero. Recordaremos que en la tabla de 2 x 2 y slo en ella, se da la situacin, conveniente de recordar,que la raz cuadrada del valor de Ji2 sin correccin de Yates, genera un valor que corresponde a "Z", de la prueba de igual nombre. 2.-Dos grupos independientes. Comparacin de variables que no tienen distribucin normal. Estudio de medianas como medidas de tendencia central. En estos casos, se dispone del estudio de una variable no normalmente distribuida y al comparar dos series de casos se recurrir a la comparacin de medianas. El procedimiento consiste en reunir ambos grupos y buscar la

83

mediana del conjunto. Enseguida , se separan los dos grupos y cada uno es dividido en dos partes: aquella que se encuentra sobre la mediana general y aquella que se encuentra en o bajo esa mediana. Se genera as una tabla de 2 x 2 en la que aplicaremos una prueba de Ji2 o de Fisher-Irwin segn el tamao del conjunto. 3.- Un grupo. Estudio de independencia de dos variables. En ste caso se desea analizar la posible relacin entre dos variables. Supongamos que en 150 casos estudiamos si se relacionan las variables "A" y "B" de modo que la presencia de una coincide con la otra y as mismo la ausencia, o bien, si ocurre lo contrario. En el primer caso podramos esperar concentracin de casos en la diagonal principal de la tabla y en el segundo una concentracin en la diagonal secundaria. Variable "A" Presente Ausente Presente Variable "B" Ausente 45 70 60 80 105 150 25 20 45

Ji2 con correccin de Yates=1,56 y p=0,21 De donde debera concluirse que ambas variables no estn relacionadas .

84

4.-Estudio de proporciones en dos grupos pareados o un grupo que es su propio control. Al tratarse de dos grupos pareados se debe analizar el resultado segn la respuesta obtenida en cada pareja. Supongamos 96 casos que constituyen 48 parejas.En cada una recibe tratamiento A uno de los integrantes y B el otro. Asignacin al azar. La respuesta se califica como positiva(+) o negativa(-). Entonces, las combinaciones posibles de resultados son para cada pareja: (+) (+) (-) (-) (-) (+) (-) (+)

La tabla correspondiente recoger la informacin as: Tratamiento A Respuesta (+) (-) (+) 29 8 Tratamiento B. Respuesta (-) 1 30 10 18 11 48

37

Como se puede ver, las parejas que coinciden teniendo respuesta positiva(n:29) o negativa(n:10), no contribuyen a diferenciar la efectividad de los 2 tratamientos. Pero s lo hacen los resultados discrepantes( (-)(+); n:1 y (+)(-); n:8 ). Si estas parejas discrepantes no existieran tendramos en el ejemplo Tratamiento A Respuesta (+) (-) (+) 30 0 30 Tratamiento B. Respuesta (-) 0 30 18 18 18 48

85

En donde, la proporcin de parejas con respuesta positiva sera 30/48 para A y B. De modo entonces, que las parejas con resultados discordantes son las que nos interesarn para comparar las respuestas a los tratamientos A y B.. Volviendo a la tabla anterior, las parejas discordantes estn en nmero de 1 y 8. La distribucin bajo la hiptesis nula, de no diferencia entre las respuestas a los tratamientos A y B, sera de 4,5 y 4,5 en vez de 1 y 8, es decir igualdad de probabilidad de respuesta (+)(-) y (-)(+) (p = 0,50 en ambos casos).Con tales valores esperados, inferiores a 5, no est indicado efectuar una prueba de Ji cuadrado(como Ji cuadrado de Mc Nemar) sino una prueba exacta que nos d la probabilidad de la distribucin encontrada u otra mas extrema, contemplando que sea bilateral. Ello significa sumar la probabilidad de ocurrencia de 0,1,8 y 9.Las probabilidades en las casillas discordantes son 0,50 y 0,50 bajo la hiptesis nula. Entonces, para nueve sucesos el desarrollo del binomio (0,50 + 0,50)^ 9 nos permitir conocer la probabilidad de cada combinacin posible. El desarrollo es:

a^9+9a^8b+36a^7b^2+84a^6b^3+126a^5b^4+126a^4b^5+84a^3b^ 6+36a^2b^7+9ab^8+b^9
(^ = elevado a..)

Recordaremos que los coeficientes de cada trmino se pueden obtener del tringulo de Pascal:
Si el exponente es: 1 2 3 4 5 6 7 8 9 Los coeficientes son: 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 1 6 15 20 15 6 1 1 7 21 35 35 21 7 1 1 8 28 56 70 56 28 8 1 1 9 36 84 126 126 84 36 9 1

En la combinacin encontrada de 1-8 , los valores mas extremos son 0 y 9. Ahora bien, a es 0 en el trmino b^9

86

a es 1 en el trmino 9 ab^8 a es 8 en el trmino 9 a^8b a es 9 en el trmino a^9 La suma de estas probabilidades corresponde a (0,50)^9 + 9(0,50)(0,50)^8 + 9(0,50)^8 (0,50)+ (0,50)^9 = 0,039 Este resultado significa que los dos tratamientos en estudio deben considerarse diferentes. Si pese a lo comentado efectuamos una prueba de Mc Nemar obtenemos: (| 1 - 8| - 1) 2 (1 + 8) lo que es igual a 4 y entonces p<0,05. Vemos que de todas maneras se encuentra una diferencia significativa 5.-Estudio de un grupo para analizar discrepancia de dos observadores o dos exmenes. En esta situacin, se trata de comparar dos exmenes u observadores ante un mismo conjunto de casos. Lo esperable, deseable, sera que no se produjeran discrepancias en el resultado del examen o en la opinin de los observadores ante un hecho clnico, por ejemplo. De ocurrir stas es necesario saber si son explicables por azar o los observadores o exmenes difieren significativamente, aunque sin poder decir cual lo hace mejor. Veamos un ejemplo: Examen 1. Resultado

87

(+) (+) Examen 2. Resultado (-) 16 62 46

(-) 5 98 103 51 114 165

En ste caso, el anlisis queda reducido a las cifras de la diagonal secundaria 5 y 16 porque son los sitios de discrepancia. Entonces,en 165 resultados no dieron el mismo resultado los exmenes en 21 ocasiones, de las cuales en 5 el examen 1 fue negativo y el 2, positivo. Lo inverso ocurri en 16 oportunidades.La probabilidad que 21 discrepancias se repartan por azar en 5 y 16 es lo que nos permite conocer la prueba de Mc Nemar, que opera como Ji2 con 1 grado de libertad y una correccin de 1 en vez de 0,5. ( | 5 - 16 | - 1 )^ 2 ( 5 + 16 ) 0,029. Esta fraccin es = 100/21= 4,76 y p=

La interpretacin de este resultado es que el grado de discordancia en los resultados de los exmenes 1 y 2 no puede ser atribuido al azar y debe concluirse que operan de diferente manera, naturalmente sin que podamos decir, con estos datos, cual es mas acertado. Hay que destacar el nulo inters, en ste momento, por las cifras 46 y 98 ,que corresponden a los resultados en que hubo acuerdo. Como veremos mas adelante ello es motivo de preocupacin cuando lo que se desea responder concierne precisamente al nivel de concordancia entre los dos exmenes u observadores.

88

6.-Estudio del grado de acuerdo o concordancia entre dos observadores o exmenes. Aqu la pregunta que se desea responder es hasta qu punto un observador, o puede ser un examen de laboratorio, puede subrogar a otro y para ello es necesario determinar cun coincidentes son en sus resultados frente a un caso. Nos interesarn primariamente, entonces, de la tabla 2 x 2, los valores numricos de la diagonal principal. En el ejemplo anterior, 46 y 98.La proporcin de acuerdo sera (46 + 98)/ 165 = 0,87 u 87%. Sin embargo, ste enfoque no contempla la cuanta en que por slo azar puede haber coincidencia de resultados. Por ello se emplea mas bien el ndice kappa(7) que s toma en cuenta ese hecho: La tabla que estamos comentando muestra (+) (+) 46 (-) 5 98 103 165
en donde una distribucin compatible con la hiptesis nula de no concordancia (+) podra generar:

(+) 19,16 42,84 62

(-) 31,84 71,16 103 165

( - ) 16 62

(-)

Recordemos la aritmtica para obtener en cada casilla el valor esperado bajo la hiptesis nula: Se multiplican los totales marginales correspondientes a cada casilla y el resultado se divide por el efectivo de la muestra

Proporcin de acuerdo =0,87 por azar =0,54

Proporcin de acuerdo

Si por azar la concordancia puede ser de 54%, la contribucin que hace el que los exmenes u observadores efectivamente coincidan sera la diferencia que

89

hay entre 0,87 y 0,54 , es decir 0,33. Esta ltima proporcin debe ser valorada en el tramo que deja el azar hasta 1,0.Es decir, cunto de la concordancia que pudiera haber, independientemente de la influencia del azar, es dado por los observadores o exmenes propiamente tales. Entonces: Concordancia perfecta= 1,0 o 100% Concordancia explicada por azar =0,54 o 54% Diferencia=-0,46 o 46%. De sta proporcin o % los observadores o exmenes contribuyen con una parte, 0,33. Esta, representa de 0,46 : 0,33/0,46 = 0,72 o 72%. Tal es el ndice kappa: 0,72.De acuerdo con la apreciacin usual ste valor indicara un grado substancial de concordancia(kappa 0-0,20:ligera concordancia; 0,21 - 0,40: regular; 0,41 0,60:moderada; 0,61 - 0,80: substancial; 0,81 y mayor: casi perfecta, o perfecta si alcanza 1,0). 7.-Estudio de una prueba diagnstica No entraremos en el detalle de los mltiples requisitos para analizar apropiadamente una prueba diagnstica. Sin embargo, puntualizaremos que es indispensable poder dicotomizar los miembros del grupo en estudio entre aquellos afectados por el proceso en anlisis y quienes n.Se requiere entonces un criterio diagnstico confiable, idealmente perfecto, un patrn de oro ("Gold standard").Si ste elemento de juicio clasifica los casos en enfermos, dudosos y no enfermos , no servir para evaluar una prueba diagnstica.Esto es muy importante de tener en cuenta. Igualmente, la eleccin del grupo en el que se probar el test diagnstico es un factor crtico,en donde, entre otros intervendrn factores como: tamao del grupo , presencia del espectro completo de la enfermedad o situacin patolgica de inters, ponderacin de cada subgrupo del espectro, etc.. La organizacin de los datos es como sigue:

90

Estndar Ideal Entidad en estudio Presente Ausente (+) a b a+b Prueba diagnstica (-) c d c+d a+c b+d a+b+c+d

De sta tabla se puede obtener variada informacin aunque principalmente la siguiente: Sensibilidad: es la proporcin de casos con el trastorno en los que la prueba resulta positiva. Se expresa, entonces, como a / (a+c). Especificidad: es la proporcin de casos sin el trastorno en que la prueba resulta negativa. Se expresa como d / (b+d). Estos dos ndices se consideran caractersticas invariables de la prueba diagnstica, aunque de hecho no es tan as. Valor predictivo positivo: Representa cuan probable es que un caso con la prueba diagnstica positiva realmente tenga el trastorno. Se expresa como a / (a+b). Valor predictivo negativo: Seala la probabilidad que un caso con la prueba negativa se encuentre realmente libre del trastomo en estudio. Corresponde a d / (c+d) Validez: Es la razn del conjunto de casos en que la prueba indic un resultado acertado, respecto del total estudiado. Se expresa como (a+d) / (a+b+c+d). Prevalencia: Es la frecuencia de la enfermedad segn el Estndar ideal. Corresponde a (a+c) / (a+b+c+d).

91

Razones de verosimilitud(likelihood ratios)(LR): Corresponden a ndices considerados fijos como la sensibilidad y la especificidad.Se emplean como LR+ y LR-.El primero seala cuanto mas verosmil es que un resultado positivo de una prueba diagnstica proceda de un caso con la condicin patolgica en estudio que de un no enfermo. LRindica cuanto menos verosmil es que un resultado negativo de la prueba proceda de un enfermo que de un no enfermo. Se calculan de la siguiente forma: a / (a+c) LR+ = -------------b / (b+d) c / (a+c) LR- = -------------d / (b+d)

Aqu es inevitable sealar que para el sentido del LRprobablemente sera mas apropiado calcularlo en su valor inverso, de modo que significara cuanto mas probable es que un resultado negativo de la prueba proceda de un no enfermo que de un enfermo. En el anlisis de una prueba diagnstica a partir de la tabla de 2 x 2 de rigor, se derivan los ndices mencionados, fijos y variables. La principal fuente de variacin de los ndices no fijos, es la prevalencia, que en la tabla - y definidos los enfermos o portadores del problema en cuestin por un estndar ideal- corresponde a (a+c) / (a+b+c+d). Este valor se denomina tambin,probabilidad pre.prueba. De hecho, corresponde a la probabilidad de ser enfermo en el grupo en estudio que muestra la tabla. Ella, raramente coincide con la prevalencia en la poblacin general, ya que habitualmente las pruebas diagnsticas son evaluadas en grupos que de algn modo se les considera mas probablemente afectados por la patologa de inters. Esto tiene gran importancia porque- como se dijola prevalencia afecta notoriamente a los valores predictivos de la prueba en anlisis. Es frecuente encontrar como relacionados los trminos o expresiones probabilidad pre.prueba(prevalencia) y probabilidad post.prueba, sugiriendo esta ltima la contribucin del examen o prueba diagnstica. En verdad, si

92

la probabilidad pre.prueba (prevalencia) es igual a (a+c) / (a+b+c+d), es decir: casos de la patologa de inters segn estndar ideal respecto al efectivo de la muestra estudiada, bien se podra esperar o suponer que la probabilidad post.prueba correspondiese a la prevalencia en el grupo segn la prueba, es decir (a+b) / (a+b+c+d). Sin embargo no es as, ya que la probabilidad post. prueba no se refiere a prevalencia en el sentido comentado sino a cuan probable es la existencia de la enfermedad ante una prueba positiva :a/ (a+b), o cuan probable es la ausencia de ella ante un resultado negativo de la prueba: d/(c+d). Es importante notar que la probabilidad post.prueba positiva es lo mismo que el valor predictivo positivo de la prueba. Esto es claro de la definicin a/(a+b) y tambin lo es si introducimos ciertos elementos de clculo habitualmente asociados a los LR. As: LR+ x Odds pre.prueba = Odds post.prueba y Odds post.prueba 1 - Odds post.prueba es igual a Probabilidad post.prueba

En la tabla: LR+ = [ a / (a+c)] / [b / (b+d)] = [a / (a+c)] x [(b+d) / b] Como los Odds Pre.prueba son = (a+c) / (b+d) el producto con LR+ nos dar los Odds Post.prueba(+): a(b+d) (a+c) (a+c)b (b+d) y esto es = a / b. Enseguida ,como Odds Post.prueba (+) / (1+Odds Post.prueba(+) = Probabilidad Post.prueba(+) el clculo sera (a/b) / [1+ (a/b)] = (a/b) /[1+(a/b)] = (a/b) x [b / (a+b)] = a/(a+b)

93

Entonces, el valor predictivo positivo es lo mismo que la probabilidad post.prueba positiva. Asimismo, la probabilidad post.prueba negativa coincide con el valor predictivo negativo. Los ndices odds pre y post.prueba no parecen tener mucho empleo, de modo que se trabajara esencialmente con LR+ y LR-. Si consideramos, por ejemplo, que LR+ significa, como se ha sealado, cuanto mas probable es que un resultado positivo de la prueba provenga de un enfermo que de un no enfermo, veremos que no sabremos si un valor de 4,0 se origin de la razn 0,40 / 0,10 o de 0,92 / 0,23, u otra ( que genere el mismo resultado) , lo que tendra un inters muy diferente puesto que los valores 0,40 y 0,92 corresponden a la sensibilidad de la prueba. Por otro lado parecera muy adecuado disponer de intervalos de confianza de los LR ,ya que, por ejemplo, la estimacin del valor 4,0 que hemos visto no puede tener igual confiabilidad si el estudio se realiz en 50 o en 350 casos como efectivos de la muestra. Un LR de valor 1 nos indicara que es igualmente probable que el test ,ya sea positivo o negativo, proceda de un enfermo o un no enfermo.Ello ocurrir toda vez que el numerador sea igual al denominador cuando se calcule LR. Una aproximacin sencilla estara dada por la comparacin de las dos proporciones cuya razn constituye el LR. Si no son significativamente diferentes aceptaremos que LR bien puede ser 1. Mas visualmente podra ser colocar en el numerador y denominador los respectivos intervalos de confianza del 95% de ambas proporciones y compararlas. Si se superponen apropiadamente(ver seccin Intervalos de confianza), se deber aceptar que es razonablemente probable que ambas puedan tener en un momento dado el mismo valor y dar un LR de 1.Tambin podemos estudiar la diferencia entre las dos proporciones y su intervalo de confianza. Si ste incluye el cero, deberemos considerarlas no diferentes. En una tabla organizada como las anteriores, ante valores en a,b,c,d como los siguientes:
20 9 29 tendramos LR+ = (20/23) / (9/16) = 0,869/0,562. Los intervalos de

94 confianza del 95% para esas proporciones son(Mtodo cuadrtico de Fleiss) 23 16 39 0,653 a 0,965 en el numerador y 0,305 a 0,792 en el denominador. Hay discreta superposicin que exige comparacin directa de las proporciones. Al hacerlo se encuentra p= 0,07 , no significativo. Si la tabla contiene francamente mas casos(x 10) 200 90 290 tendramos LR+ = (200/230) / (90/160) = 0,869/0,562 = 1,54. Los intervalos de 30 70 100 confianza del 95% para las proporciones son en ste caso 230 160 390 0,817 a 0,909 en el numerador y 0,482 a 0,640 en el denominador. No hay superposicin y p< 0,05 . De hecho p= 0,000000. As entonces, aunque en ambos casos LR+ es igual a 1,54 , en el primer ejemplo, con una muestra de 39 casos no se puede considerar que difiera de 1.En el segundo ejemplo s es posible hacerlo. 3 7 10

Ahora bien,la existencia de un cero en alguna de las cuatro celdas de la tabla crea problemas ya que en la mitad de las combinaciones se concluir que LR es igual a cero o infinito. As, cuando a = 0, LR + = 0 b = 0, LR + = infinito c = 0, LR + = (b+d)/b d = 0 , LR+ = a/(a+c)es decir, coincide con Sensibilidad de la prueba. a.= 0, b.= 0, c.= 0, d.= 0, LRLRLRLR= = = = (b+d)/d es decir ,coincide con 1/Especificidad de la prueba. c/(a+c) 0 infinito

Las caractersticas descritas de los LR no parecen,entonces agregar informacin importante sobre la que ya se dispona con los dems ndices. Sin embargo un rasgo adicional de los LR , que les confiere un inters especial, es la posibilidad de analizar una prueba diagnstica cuando sta proporciona resultados no dicotmicos, lo que, naturalmente generar una tabla de dos columnas pero mas de dos filas.

95

En un estudio sobre evaluacin clnica por mdico del estado de hidratacin en lactantes hospitalizados por sndrome diarreico agudo encontramos en 225 nios: Estndar Ideal Deshidratacin Presente Ausente 89 16

Presente Mtodo Clnico Deshidratacin Ausente

105

27 116

93 109

120

225

Sensibilidad 0,77 Especificidad 0,85 Valor predictivo positivo 0,85 (probabilidad post.prueba positiva) Valor predictivo negativo 0,77 (probabilidad post.prueba negativa) LR+ 5,23 LR- 0,27 Prevalencia 116/225= 0,515(probabilidad pre.prueba) Odds pre.prueba= 116/109= 1,064 Odds post.prueba positiva=89/16=5,56 Como sabemos que el mtodo clnico no responde solamente(como prueba diagnstica de deshidratacin)en forma dicotmica, ya que puede decidir entre la presencia de deshidratacin leve moderada o intensa, recurriendo al empleo de los LR podremos ver la probabilidad post.prueba asociada a cada decisin por el mtodo que se comenta. As, desplegando los resultados de la prueba diagnstica calificacin del estado de hidratacin por mdico,mtodo clnico obtenemos en el mismo grupo de 225 nios:
Estndar Ideal* Deshidratacin Presente Ausente Probabilidad

Odds

96 Calificacin segn n Proporcin n Proporcin LR post.prueba Post.prueba Mtodo Clnico (-) 27 0,232 93 0,853 0,271 0,288 0,225(22,5%) (.+ ) 45 0,388 14 0,128 3,031 3,225 0,762(76,2%) ( ++ ) 39 0,336 2 0,018 18,371 19,546 0,951(95,1%) ( +++ ) 5 0,043 0 0,000 infinito -----

Total

116

109

Para el clculo de LR debemos explicar que cada nivel de calificacin segn mtodo clnico es contrastado con el conjunto restante, de modo que se conforma de todas maneras una tabla de 2x2 para cada nivel. As, para estudiar el estrato (++) la tabla sera : Deshidratacin Calificacin segn Presente Ausente Mtodo Clnico (++) 39 2 41 Resto 77 107 184 116 109 205 y ,entonces, LR+ = (39/116) / (2/109) = 0,3362 / 0,0183 = 18,371 *El estndar ideal es la ganancia de peso una vez hidratado. Las variaciones de peso inferiores a un 2% en 24 horas se consideran indicativas de ausencia de deshidratacin.

Ahora, con esta nueva presentacin, es posible notar que en ausencia de signos clnicos de deshidratacin, en el grupo estudiado, la probabilidad de deshidratacin, (es decir la probabilidad de error) era de 22,5%. Con signos leves, era de esperar que un 76,2% de los nios estuviese verdaderamente deshidratado, cifra que asciende al 95,1% con signos moderados y a una cuanta indeterminada, muy elevada, cuando la signologa indica deshidratacin intensa. El cambio de los LR segn signologa presente es notable. As, LR positivo para signos leves es 3,03 pero para signos moderados de deshidratacin asciende a 18,36 y pasa a ser una cifra muy alta ante signos intensos del trastorno. 8.-Estudio de cohortes. Aqu tenemos una investigacin prospectiva, desde el antecedente o factor que se estudiar como probable causa de una enfermedad al desarrollo de la patologa de inters. La estadstica propia es el riesgo relativo( RR ):El grupo

97

con el factor considerado importante se espera que tenga ,en el seguimiento,mayor riesgo de hacer la enfermedad que el grupo donde no se encuentra presente.Para los fines de anlisis, normalmente la tabla se estructura as: Antecedente del factor Si No Desarrollo de la enfermedad Si No a c
Cohorte con factor

b d
Cohorte sin factor

De la cohorte con el factor de inters(a+c) desarrollan la enfermedad o situacin en estudio "a" casos, de modo que el riesgo en este conjunto es a/(a+c).En la cohorte de comparacin, el riesgo es b/(b+d) y, por lo tanto, el riesgo relativo-RR- se puede expresar como: a/(a+b) b/(b+d) En estudios de cohortes la proporcin de enfermos que resulta es verdadera en cada una. Esto tiene inters para lo que contina. 9.-Estudio Caso-control . En varias circunstancias no podr utilizarse el diseo anterior y deber recurrirse a un estudio caso-control que es un diseo retrospectivo, es decir,

98

desde el resultado, enfermedad, hacia la(s) posible(s) causa(s) o factor(es)(exposicin). En tales oportunidades se organizar la tabla de la siguiente manera:

si Exposicin no

Casos a c

Controles b d

En estas circunstancias slo se trabaja con los valores de las 4 casillas. Existe un antecedente(exposicin)que se cree relacionado con la condicin patolgica en estudio de modo que en su presencia debera haber una relacin casos/controles mayor que en su ausencia, de suerte que a/b > c/d. La relacin a/b o ,lo que es igual , ad/bc se denomina odds ratio c/d y se abrevia OR.Es un valor que puede ser interpretado en el sentido de cuntas veces es mas probable ser un caso que un control cuando est presente el antecedente o exposicin. En sentido estricto, puesto que se tom un grupo de casos y otro de controles y se averigu en cada grupo cuntos haban tenido la exposicin o antecedente considerado de inters, se debera decir entonces: la relacin casos con exposicin / casos sin exposicin (a/c) se espera que sea mayor que la relacin controles con exposicin / controles sin exposicin (b/d). Entonces, a/c > b/d , y a/c es igual tambin a ad/bc. Aqu diramos: Se espera que en los b/d

99

casos la exposicin sea mas comn que en los controles.Es destacable que cuando se trata de una patologa muy poco comn OR se aproxima bastante a RR. 10.-Regresin logstica binaria. Una importante razn por la que no se emplea mas ampliamente la regresin lineal reside en que de la variable resultado de una investigacin mdica frecuentemente se ignora o no se puede suponer razonablemente que tenga una distribucin normal. Para una variable de respuesta binaria(sino , presenteausente, etc.)existe este modelo especial de regresin.No entraremos en ella por estar fuera del mbito de sta seccin.Desarrollo detallado se puede encontrar en la literatura pertinente Referencias
-Siegel S. Nonparametric Statistics.McGraw-Hill Book Company, New York,1956:95-110 -Schwartz D. Mtodos estadsticos para mdicos y bilogos.Editorial Herder, Barcelona,1985:96-103. -Steel RG, Torrie JH. Bioestadstica:Principios y procedimientos.McGrawHill Book Company, Mexico, 1988:482-504. -Colton Th. Estadstica en Medicina. Salvat Editores S.A., Madrid,Espaa,1979:159-190. -Essex-Sorlie D. Medical Biostatistics and Epidemiology.Appleton and Lange,Norwalk,Connecticut, U.S.A.1995:206-238. -Lamotte M. Toray-Masson, Barcelona, Espaa 1965:33-37. -Kramer MMS, Feinstein AR. Clinical Biostatistics.LIV.The biostatistics of concordance. Clin Pharmacol Ther 1981;29:111-123. -Sackett DL, Haynes RB, Guyatt GH,Tugwell P. Clinical Epidemiology,2nd edition, Little, Brown and Company, Boston,U.S.A.,1991:3-153.

100 -Duffau G. Estndar ideal imperfecto y variable. Rev Chil Pediatr 1996;67:97-98. -Fletcher RH, Fletcher SW, Wagner EH. Clinical Epidemiology.2nd edition, Williams and Wilkins, Baltimore U.S.A.,1988:42-75. -Fleiss JL. Statistical methods for rates and proportions.2nd edition, John Wiley and Sons,New York,U.S.A. 1980:33-49. -Duffau G, Mihovilovic C, Barrera O, Guerrero C.Evaluacin materna y por tcnicos paramdicos del estado de hidratacin en nios con diarrea aguda.Empleo del mtodo propuesto por la Organizacin Mundial de la Salud. Acta Pediatr Esp 1996;54:580-582. -Herrera P, Duffau G. Estudio Caso-Control.Publicaciones tcnicas Mediterrneo, Santiago,Chile, 1997:7-120. -Silva AL. Excursin a la regresin logstica en ciencias de la salud.Ediciones Diaz de Santos S.A. Madrid, Espaa 1995:3-92.

XXVII El nmero de pacientes necesario a tratar ( NNT). En los ensayos clnicos donde se comparan dos formas de manejo de los integrantes de la investigacin se pueden describir varias maneras de expresar los resultados. Desde luego , si se ordenan los valores numricos en una tabla de 2 x 2 podramos comparar la distribucin obtenida con la terica bajo la hiptesis nula de no diferencia de los grupos en comparacin: Ji cuadrado , entonces. Ello nos dar en forma general la informacin de cuan probable es que los resultados que se han vaciado en la tabla tengan una distribucin atribuible o explicable por el azar.Si no se cumplen los requisitos que exige esta prueba de hiptesis se pueden analizar los datos empleando la prueba de Fisher-Irwin de

101

probabilidades exactas.Igualmente, se puede manejar como la comparacin de dos proporciones por una aproximaxin a Z as como analizarlo de acuerdo a sus intervalos de confianza respectivos.Como sea, se obtendr p, es decir el error alfa. Hasta aqu no se tendr mas informacin.Sin embargo ,para cada grupo tenemos a disposicin el total de casos y la parte que tuvo el resultado en estudio. De tal manera,veremos que la informacin logra ir bastante mas lejos que lo indicado hasta este instante.Si consideramos los dos grupos sugeridos, sometidos a tratamiento experimental y control, esperando un resultado determinado, tendramos: Resultado esperado si no Grupo experimentala Grupo control c b d a+b c+d

Total a+c b+d a+b+c+d Asignando valores para uso posterior, supongamos que: a = 12 b = 104 c = 28 d = 101 El riesgo corresponder a la probabilidad de ocurrencia de un suceso(generalmente no deseado). De este modo ,si del grupo experimental se espera que tenga con menor frecuencia un resultado negativo, es decir que el tratamiento experimental tenga efecto benfico, la presentacin de la informacin puede ser como a continuacin: Riesgo absoluto (RA) en el grupo control = c/(c+d) = 28 / 129 = 0,217 Riesgo absoluto(RA) en el grupo experimental = a/(a+b) = 12 / 116 = 0,103

102

Riesgo relativo(RR) = RA del grupo control / RA del grupo experimental = 0,217 / 0,103 = 2,106 ( IC 95% = 1,12 - 3,93 por Statcalc de EpiInfo) El riesgo relativo (RR) seala cuanto mas probable es el efecto o resultado en el grupo control que en el grupo experimental. Al valor obtenido se puede agregar su intervalo de confianza, generalmente del 95%, que nos indicar los valores entre los cuales se encontrara, con un 95% de probabilidad, el RR del universo del que proceden los casos estudiados.Para que el RR encontrado en la investigacin pueda considerarse de inters, su IC no debe incluir el valor 1 puesto que esa cifra indica riesgos absolutos iguales. La llamada reduccin del riesgo absoluto (RRA) es simplemente la disminucin del riesgo observada del grupo control al grupo experimental y corresponde entonces a RA del grupo control - RA del grupo experimental = RRA 0,217 0,103 = 0,114 IC 95% de la RRA = 0,0239-0,2041( por MedCalc) Otra expresin de inters es la reduccin relativa del riesgo(RRR)(No se equivoque!, esta no es reduccin del riesgo relativo) que es la proporcin que representa la reduccin del riesgo absoluto(RRA) respecto del riesgo basal, que sera el del grupo control. Entonces (RRA / RA del grupo control) x 100 = RRR Si tenemos el valor de la reduccin del riesgo absoluto y esta es de ,como se estableci en el ejemplo , 11,4% podemos interpretarla en el sentido que de cada 100 sujetos tratados con el esquema experimental 11,4 de ellos obtendrn el beneficio (adicional)que representa el nuevo tratamiento. Ahora, 1 de ellos obtendr el beneficio adicional por cada 100/11,4 = 8,77 tratados(la cifra se redondea al entero superior, de modo que quedara en 9 casos). Esto representa el llamado nmero necesario a tratar(NNT) para obtener 1 caso adicional beneficiado. Habitualmente se le

103

expresa como el valor inverso de la reduccin del riesgo absoluto.Para el ejemplo planteado, en que el tratamiento experimental reduce el riesgo de un suceso indeseado,9 pacientes deben ser tratados en el grupo experimental para evitar un episodio adicional no deseado. El intervalo de confianza del NNT no parece ser un asunto definitivamente resuelto, pero se le puede estimar utilizando los valores inversos de los extremos del intervalo de confianza del RRA : 1/0,0239 = 41,8 ,es decir 42 casos a 1/ 0,2041 = 4,89, es decir 5 casos.Entonces, para la situacin propuesta, NNT es 9 pacientes con un IC del 95% de 5 a 42. Puesto que los casos de un grupo son heterogneos en su nivel de riesgo, se podra hacer un intento (un tanto dificil) de caracterizar el paciente individual en cuanto a su probabilidad especfica(expresada como una fraccin) de un evento respecto al valor medio con el que se obtuvo el NNT del grupo.Una vez estimada esta fraccin para un caso determinado, se divide NNT por ella y se obtendr el NNT para se tipo de paciente. Cuando el tratamiento experimental aumenta la probabilidad de un suceso favorable los ndices se modifican un tanto y as tendremos el aumento relativo del beneficio(ARB) en que se comparar el incremento de frecuencia de sucesos favorables con la frecuencia basal dada por el grupo control.As, si en ste ltimo la frecuencia es 30% y en el grupo experimental 40%,el incremento de 10% se expresar en relacin al 30% del grupo control y obtendremos (10% /30%) x 100 =33,33%.Este valor es en definitiva el ARB.El aumento absoluto del beneficio(AAB) se expresa como la diferencia simple entre los dos grupos respecto a la frecuencia de sucesos beneficiosos considerados. En el ejemplo AAB sera de 10%.Su valor inverso corresponde al NNT, que aqu sera 100/15 = 6,66 es decir 7 casos deben recibir el tratamiento experimental para obtener la ocurrencia de un suceso favorable adicional, comparado con el grupo control. Si el tratamiento experimental causa cierto dao, es decir cuando aumenta la probabilidad de un suceso no deseado, comparado con el tratamiento control, nuevamente

104

la situacin cambia algo en el anlisis de los resultados. As, el aumento relativo del riesgo(ARR) se calculara del mismo modo que el ARB, slo que en vez de referirse al aumento del beneficio lo hace respecto al aumento del riesgo. Nuevamente tenemos aqu la opcin de medir el cambio del riesgo absoluto, en ste caso aumento del mismo(ARA), lo que corresponde a la diferencia de riesgo en ambos grupos de tratamiento. Como en los casos anteriores,el valor inverso de ARA proporcionar el nmero de pacientes con tratamiento experimental necesarios para generar un caso adicional de dao comparado con la situacin del grupo control(NND).

Referencias.

-Sackett DL, Deeks JJ, Altman DG.Evidence based medicine 1996;1:164. -Altman DG. Evidence based medicine. 1996;1:102-104.

XXVIII Tamao muestral en estudios biomdicos. Establecer el tamao muestral apropiado para una investigacin es a la vez frecuentemente complicado, representa solo una aproximacin a la realidad y sin embargo, es muy necesario. Una falla en detectar una diferencia entre tratamientos con bastante frecuencia se relaciona con un tamao inadecuado del estudio.Se suele advertir sobre el riesgo de efectuar estudios con muestras muy grandes, donde puede ocurrir que pequeas diferencias ,probablemente sin trascendencia clnica, sern detectadas como significativas. Este no es el problema que enfrenta el clnico, quien

105

habitualmente tiene dificultades para reunir una muestra del tamao necesario para detectar una diferencia definida como clnicamente significativa An cuando los clculos proporcionan datos aproximados, stos son importantes porque permiten tener una idea de cuantos sujetos deberan participar en el estudio y adems, cuando se dispone slo de un nmero fijo de stos, nos puede indicar si realmente vale la pena emprender la investigacin. Dentro de varias cuestiones que podrn ser investigadas en un estudio, seguramente ser posible definir la principal. Entonces, se establecer que clase de datos debern ser obtenidos y la forma como sern, en definitiva, analizados. Esto tiene mucha importancia, puesto que el tamao de la muestra depende del mtodo de anlisis a emplear. Elementos en la estimacin del tamao muestral. Un conjunto de variables debern ser consideradas en esta estimacin: 1.- Error alfa: Corresponde, segn la definicin usual a la probabilidad de rechazar la hiptesis nula cuando esta es verdadera. El investigador deber establecer hasta que punto estar dispuesto a aceptar que los hallazgos de inters pudieran ser justificados por variaciones explicables por el azar. Convencionalmente, se considera en estudios clnicos un error alfa aceptable de 5% o menor, aunque mas precisamente inferior a 5%. Ello significa que si bien los resultados pudieran ser explicados por el azar en 5 o menos de cada 100 veces que se repitiera la experiencia, se decidir interpretarlos, en tales circunstancias, como no atribuibles al azar( significativos , entonces). La eleccin de un error alfa mas pequeo( por ejemplo 1%) proporciona mayor probabilidad que los resultados de inters correspondan a una situacin real. Sin embargo, aumenta el riesgo de atribuir al azar hallazgos que no debieran ser interpretados de tal modo( puesto que slo seria significativo un valor de p igual o menor a 0,01(1%). En los clculos se emplea el valor Z de alfa(Za) que corresponde en la curva normal estandardizada al nmero de

106

desviaciones estndar que aplicadas en mas y en menos a partir del promedio cero, dejan fuera un rea de 5% (correspondiente al error alfa elegido)(en cada cola queda entonces un 2,5%).Za para alfa 5%(0,05) en prueba bilateral es igual a 1,96 y para prueba unilateral es 1,64 (3). 2.-Error beta: Este error corresponde a la probabilidad de no detectar un hallazgo como importante y atribuirlo al azar. Habitualmente se le define como la probabilidad de no rechazar la hiptesis nula cuando esta es falsa( 2 ).En estudios clnicos se considera apropiado un nivel de error beta de 20%. Naturalmente, se puede utilizar un nivel menor. Como sea, el poder del estudio, es decir la probabilidad de rechazar la hiptesis nula cuando es falsa, es igual a 100 menos el error beta. Esto significa que habitualmente se trabaja con un poder de 80%. Es importante destacar que la reduccin del error beta invariablemente va acompaada de aumento del error alfa, para un mismo tamao muestral. Una reduccin de ambos errores slo es posible aumentando el tamao de la muestra. As, la muestra por grupo para detectar una diferencia de 15% entre los valores de 20% y 35% con error alfa de 5% y beta de 20% es de 151 casos. Si bajamos el error beta a 10% y lo dems no varia, se necesitan 198 casos por grupo. Si slo rebajamos el error alfa a 1% los casos deben ser 219 y si, simultneamente, deseamos dejar los errores en 10% y 1%, respectivamente, se requerirn 275 casos por grupo (Fleiss , EpiInfo 6.04) En los clculos se emplea el valor Z de beta (Z)que corresponde al nmero de desviaciones estndar de la curva normal estandardizada que deja fuera, unilateralmente, un rea igual al error beta escogido, 20% si empleamos poder de 80%. Z en ste caso es igual a 0,84 y si el error beta es 10%(0,10) el valor es 1,28 . 3.-Diferencia clnicamente significativa: Aqu se puede suponer una comparacin entre dos grupos en un ensayo clnico, donde se espera poder detectar una diferencia en los resultados. Esta diferencia no es cualquiera sino una igual o mayor a cierto nivel que desde un punto de vista clnico sea de relevancia.Es as como ,si un grupo tiene una proporcin

107

de complicaciones de 30% y se espera una reduccin con un tratamiento nuevo, con seguridad no se considerara un cambio significativo el descenso a 28%. Por otra parte, si esa diferencia es real, para detectarla se requerira el estudio de un muy grande nmero de casos. Es frecuente que una diferencia de inters sea catalogada como superior a 10% y comnmente, alrededor de 15%. Un criterio similar se utiliza para elegir detectar razn de ventaja (OR), Riesgo relativo (RR) o razn de verosimilitud (LR). Es importante tener presente que una misma diferencia inducir a tamaos de muestra variables de acuerdo con los valores entre los que tal diferencia se establece. As, un 15% no opera igual si es entre 20% y 35% o entre 45% y 60%. Por ello, no basta con plantear en qu magnitud sern diferentes los resultados. Si no se dispone de mas informacin respecto a ste asunto, la solucin es ensayar diferentes clculos y utilizar el tamao muestral que resulte mayor. Si la falta de informacin no es solucionable con relativa facilidad, se puede efectuar un estudio piloto para obtener una aproximacin. En tales circunstancias se recurrira a los intervalos de confianza de los estadgrafos de inters para obtener tamao mnimo y mximo probable requerido para el estudio. Mas adelante volveremos sobre esto. Mucho inters tiene la orientacin que se requiere al pretender verificar igualdad de resultados. Esta situacin podra corresponder a la comparacin de un tratamiento ya aceptado con otro que tiene varias ventajas(requiere menos dosis al da, es menos costoso, etc.) aunque se supone que genera resultados iguales. Si se establece cero como diferencia a detectar, el tamao de la muestra ascendera a infinito. Por ello, es necesario plantear la deteccin de la diferencia mas grande que no sea clnicamente significativa. As, si se plantea que cualquier diferencia igual o menor a 6% se considerar como sin importancia, el estudio ser diseado como capaz de pesquisar esta ltima cifra. Entonces, si ambos tratamientos aparecen como comparables (p>0,05), se podr pensar que o son iguales o difieren en una cuanta igual o menor que 6%, lo que ya fue declarado como sin importancia clnica. Mas adelante veremos que es necesario considerar,

108

adems, otros aspectos de gran inters cuando se plantea un estudio de equivalencia. 4.-Hiptesis uni o bilateral. Un aspecto muy importante a considerar es si el tamao de la muestra se est estimando para la verificacin de una hiptesis uni o bilateral. Esto se refiere si al comparar dos grupos la hiptesis es que los resultados difieren sin poder decir de seguro cual grupo resulta mejor o mas favorable(bilateral, porque A puede ser mejor que B o viceversa) o , definitivamente,se postula que especficamente, uno de los grupos dar mejores resultados. El problema planteado corresponde a lo siguiente: Si se realiza un ensayo clnico controlado para probar un nuevo tratamiento, comparndolo con aquel generalmente aceptado, slo es ticamente aceptable que el investigador, aunque tenga sus esperanzas puestas en que el nuevo tratamiento es mejor, no sabe si ello es as y por tanto la hiptesis debe contemplar la posibilidad que el nuevo tratamiento resulte comparable o an inferior al generalmente utilizado. Se entiende que si el investigador est razonablemente convencido que el nuevo tratamiento es mejor, simplemente no puede someter al grupo control a una terapia que considera inferior, menos efectiva. Puesto que una prueba de hiptesis bilateral es mas exigente que una unilateral, podra alguien, a posteriori, y en vista de un resultado insuficiente para una prueba bilateral pero suficiente para una unilateral, verse tentado a cambiar la hiptesis, pero esto no es aceptable. En que casos sera razonable utilizar hiptesis unilaterales?En algunas situaciones ,algo distintas de lo comentado, parece apropiado hacerlo. Por ejemplo en un estudio de balance donde se compara dos grupos de nios, en que el mayor aporte de lquido a un grupo se espera que tenga como efecto un mayor volumen de orina. Si ello no se verifica, se interpretar como retencin(Ver Mendez B, Duffau G 1998). Otro elemento importante de tener presente es la posible prdida de casos dentro del estudio: no siguieron las indicaciones, se cambiaron a domicilio desconocido, u otra

109

causa. Como sea, sin mayores consideraciones, se debera hacer una estimacin por adelantado para corregir el tamao de la muestra. As, en caso de esperar un 10% de prdida, el ajuste implicara multiplicar el tamao de la muestra por el factor 100% / 90% = 1,11 . Tal correccin no resuelve todo el problema todas las veces ya que es importante recordar que quienes abandonan un estudio o por alguna razn no se incorporan a l , se deben considerar distintos de aquellos que s lo hicieron. De este modo no es indiferente tal acontecimiento. Particularmente en el caso de abandono de un estudio, si la prdida es muy numerosa puede invalidar la investigacin. Como no hay un criterio uniforme para decidir cuanta prdida debe ser considerada grande, se puede hacer lo siguiente: Si en el estudio clnico apareciera una diferencia significativa entre los grupos investigados, slo se podr considerar esto una vlida conclusin si los casos perdidos al seguimiento son asignados al peor resultado y an as se mantiene la diferencia de inters. El ejercicio de estimar el tamao muestral aparentemente necesario en diferentes estudios, confiere al investigador un saludable grado de cautela sobre el asunto cuando lee artculos que le interesan y , adems, arroja luz sobre los posibles efectos o consecuencias de esperar en investigaciones fundadas en muestras escasas. Estos incluyen: a.- Insuficiente poder y por ello una baja probabilidad de detectar una diferencia planteada, si existe. b.-Al disminuir el tamao del estudio se reduce la efectividad de la aleatorizacin de los integrantes de la muestra. c.-La posibilidad de anlisis estratificado se aleja , puesto que si los casos son pocos ya de entrada, al estratificar el d efecto de muestra escasa se manifestar mas intensamente. No pocas personas, al iniciar un estudio prefieren no averiguar cuantos casos deben estudiar para verificar lo que les interesa. Esto se debe, al menos en parte, a que se han llevado anteriormente una desagradable sorpresa al hacerloconstatando que requieren bastantes mas casos que los imaginados-y probablemente tambin porque en el fondo

110

parecen pensar que todo el proceso es una real exageracin.Tienen el aparente apoyo de la literatura que estudian, puesto que un clculo del tamao muestral no est habitualmente incluido en los artculos y por otro lado no son raras las investigaciones que dan resultados significativos con muy pocos casos gracias a que la diferencia encontrada experimentalmente fu inesperadamente grande o que en comparacin de promedios, la dispersin de los valores en cada grupo fue, sorpresivamente, muy pequea. Como veremos mas adelante, no siempre se pueden satisfacer todos los requisitos que hemos analizado hasta el momento.En ocasiones convendr recordar que a partir de la prueba de hiptesis que se utilizar es posible un acercamiento al tamao muestral particular. Por ltimo, mencionaremos una idea que a veces surge relativa a todo este asunto y se refiere a qu conducta se puede adoptar si no se dispone de ningn dato de los que requiere el clculo del tamao muestral. Una posibilidad, como ya se ha mencionado , es efectuar un estudio piloto, la otra es considerar que si no se tiene dato alguno sobre el problema que se desea estudiar probablemente no se justifica iniciar una investigacin sobre cuyo tema no se tiene experiencia alguna. A continuacin analizaremos diferentes escenarios donde el clculo del tamao de la muestra, se plantea. Naturalmente no se pretende cubrir todas las situaciones pero s probablemente las mas comunes. I.-Estudios en que se indagar sobre una prevalencia: Requisitos: -Tamao de la poblacin. -Precisin deseada(%) -Prevalencia esperada. -Efecto del diseo. -Error alfa En ste caso se debe tener una idea aproximada de la prevalencia que se est investigando,luego se debe establecer cuanto se aceptara que vare(precisin), luego el

111

nivel de confianza deseado para la indagacin y finalmente el efecto de diseo de la investigacin.Este es igual a 1(no hay efecto de diseo) si se ha empleado un procedimiento de muestreo aleatorio simple o bien sistemtico y corresponde a un error sistemtico Frmula: N x Zx p ( 1-p ) n = --------------------------------d x (N-1) + Z x p(1-p)

n=tamao de la muestra N=poblacin total Z= valor de z para el nivel de confianza(1- alfa) p=proporcin esperada en la poblacin d=precisin absoluta El tamao de la muestra es,en definitiva igual a n por el efecto de diseo. Es posible que se desconozca la proporcin p. En tal caso es bueno recordar que p(1-p) alcanza el mayor valor posible cuando p=0,50 , en donde la expresin p(1-p) sera igual a 0,50 x 0,50 = 0,25. Empleando esa cifra se obtiene el n mas alto, que es el que debera ser empleado. El tamao de la poblacin de la que se extraer la muestra es habitualmente desconocido, pero no es muy importante tener un conocimiento exacto bastando con una aproximacin razonable. En un ejemplo veremos que esto es as. Supongamos que estimamos una proporcin en la poblacin a estudiar (p) de 7% y deseamos un tamao muestral que permita ,con una seguridad de 95%(Z entonces de 1,96), una variacin alrededor de 7% de hasta 3%. Ello significa que si la proporcin poblacional es de 7% esperamos, con un 95% de confianza, obtener un valor entre 4% y 10%. Para estos requisitos si la poblacin es de 500.000 personas la muestra requerida es de 278 casos, si es de 10.000 personas 271 casos, si slo son 5.000 personas 264 y si son 1.000 personas, 218 casos. Este tamao muestral se puede obtener trabajando con el programa Epitable de EpiInfo.

112

II.-Estudios en que se compararn dos proporciones. Requisitos: -Razn grupo 1/ grupo 2 -Proporcin en grupo 1 -Proporcin en grupo 2 -Error alfa -Error beta. Formula:

N= ( N/4) (1 + {1 + 2(r +1)/Nr | p2 - p1| }0,5 )2


en donde, N= [( Z {(r + 1)pq}0,5 ) - Z {r p1q1 + p2q2}0,5]2 / r(p2-p1)2 N es uno de los tamaos muestrales y Nr el otro. r es la fraccin que representa la muestra mas pequea respecto a la mayor. = Elevado a. p1 = Proporcin del grupo 1 q1. = 1 - p1 p2 = Proporcin del grupo 2. q2 es = 1 - p2
Valores de Z para hiptesis unilateral: Z = 1,645 para un error alfa de 0,05

2,326 para un error alfa de 0,01 Z = - 0,842 para un error beta de 0,20 - 1,29 para un error beta de 0,10 - 1,645.para un error beta de 0,05 p = (p1 + rp2) / (r + 1) q = 1-p De acuerdo con Sndecor y Cochran , se puede obtener la informacin por la siguiente va para grupos de igual tamao: N = ( (Z + Z ) / (p1 - p2) )^ ( p1 q1 + p2 q2) Donde,

113

N = Nmero de casos por grupo. p1 =Proporcin en grupo1 p2 =Proporcin en grupo2 q1 =(1 - p1) q2 =(1 - p2) Para una diferencia determinada, el tamao muestral requerido no es constante y depende de las proporciones entre las cuales se establece la diferencia. As, podemos ver al mismo tiempo que los resultados tambin dependen del programa empleado, suponiendo que dejamos fijo el error alfa en 0,05 y el error beta en 0,20:.

Proporciones 0,05 y 0,20 0,10 y 0,25 0,15 y 0,30 0,20 y 0,35 0,25 y 0,40 0,30 y 0,45 0,35 y 0,50 0,40 y 0,55 0,45 y 0,60 0,50 y 0,65 0,55 y 0,70

Diferencia 0,15 0,15 0,15 0,15 0,15 0,15 0,15 0,15 0,15 0,15 0,15

Casos necesarios por grupo segn programa: EpiInfo 6.04 Win Episcope 1.0 88 113 134 151 165 176 183 186 186 183 176 74 98 119 137 151 161 168 172 172 168 161

Las cifras continan reducindose en espejo luego de haber ascendido a un mximo. El programa EpiInfo emplea la frmula de Fleiss y el Win Episcope 1,0 declara la de Sndecor y Cochran(1986). En la eventualidad de poder establecer slo la diferencia que interesa detectar entre proporciones o porcentajes y los errores respectivos,la eleccin de la muestra deber

114

corresponder ,entonces a la cifra mayor como ya sealramos anteriormente. III.-Estudios en que se compararn dos proporciones por prueba de Fisher-Irwin de probabilidades exactas. En ocasiones,se puede presumir que la investigacin incluir una muestra pequea y se compararn dos grupos por la mencionada prueba de hiptesis.Un ejemplo se puede encontrar en Duffau G. 1992. Se dispone de tablas que proporcionan el tamao muestral por grupo requerido para satisfacer los errores alfa y beta planteados frente a la comparacin de dos proporciones(Haseman J 1978). A modo de ejemplo sealaremos lo siguiente, modificado del autor mencionado: Para error alfa de 5%, beta de 20%, tamao muestral por grupo necesario segn proporciones que se comparan, para hiptesis unilateral:

P1
0,80 0,70 0,60 0,50 0,40 0,30 0,20

P2
0,60 0,50 0,40 0,30 0,20 0,10 0,05 73 36 23 15 10 8 6 84 41 23 15 10 9 85 42 23 13 11

84 36 19 14

73 30 20

56 34

67

El clculo del tamao muestral para estudiar la diferencia entre dos

115

proporciones en tabla de 2 x 2, con hiptesis unilateral, incluye las dos proporciones y los errores alfa y beta.Debe contemplarse una proporcin como "control" o valor "patrn" (pl) y la otra sera "experimental"(p2).En tales condiciones: n = 1.641,6 [ ( Za + Z ) / (arcsen Rc p1 - arcsen Rc p2)] ^ 2 Za, si alfa es 0,05 = 1,64 para prueba unilateral y 1,96 si es bilateral Z,, si beta es 0,20 = 0,84 para prueba uni o bilateral arcsen Rc p1 =se obtiene la raz cuadrada(Rc) de la proporcin 1 y luego se determina el arcsen, que corresponde "al ngulo cuyo seno es el valor dado". En su calculadora sera el sen^ -1. La prueba de hiptesis que se supone se emplear con los resultados del estudio es Ji2. IV.-Estudios en que se investigar una prueba diagnstica. Requisitos: -Error alfa -Error beta -Proporcin esperada de falsos positivos o la especificidad. -Razn de verosimilitud considerada digna de ser detectada. -Intervalo de confianza deseado para la sensibilidad. -Prevalencia esperada de la patologa en estudio. El procedimiento de clculo en detalle se puede encontrar en :Duffau G.1998 . Las razones de verosimilitud(likelihood ratios)(LR),ndices fijos como sensibilidad y especificidad ofrecen una relacin entre las cuatro casillas de la tabla de 2 x 2,en que se estudia una prueba diagnstica: a, b, c ,d. Es as como, si consideramos un LR+, veremos que tal resultado se obtiene de la razn entre las proporciones a/(a+c) y b/(b+d) de modo que

116

a/(a+c) LR+ = ------------b/(b+d) En esta divisin, el numerador corresponde a la sensibilidad de la prueba y el denominador a la proporcin de falsos positivos( 1-especificidad). Es posible ,entonces, plantear la bsqueda del tamao muestral a partir de una comparacin de dos proporciones (LR), en prueba unilateral(puesto que se espera que el numerador ser mayor que el denominador, LR+ veces), para lo cual se requerira estimar los falsos positivos (o la especificidad) probables en sa prueba y la prevalencia esperada del trastorno en estudio dentro de la muestra. Al mismo tiempo, elegir un valor de LR+ digno de ser detectado, contemplando el nivel de error alfa y beta que se considere adecuado. Tal comparacin es entre dos proporciones independientes( aunque intrnsecamente relacionadas) y de tamao casi siempre diferente, con una proporcin de verdaderos enfermos habitualmente inferior a 50%. La estimacin de los falsos positivos determinar ,en parte,el LR+ elegible puesto que , si los primeros constituyen un 5%, es poco probable que interese un LR+ de 3 si se considera que 5% x 3 indicar la sensibilidad de la prueba en tal caso, es decir, 15% y sta seguramente no resultara de mucho inters al investigador como nivel inicial de deteccin. Del mismo modo, si la proporcin de falsos positivos fuera muy alta, LR+ puede tener como lmite un valor sorprendentemente bajo. Por ejemplo, una cifra de falsos positivos del 30%(0,30) tiene un LR+ lmite posible de 3,33 ya que una cifra mayor supondra una sensibilidad de la prueba superior al 100%. Como sea, es generalmente aceptado que LR+ en el margen de 2 a 5 suele ser de importancia en el sentido que el cambio de la probabilidad pre.prueba a aquella post.prueba cuando LR+ est en esos valores, sera de una magnitud de consideracin.

117

El poder estimar algunos valores, como la proporcin de falsos positivos, requiere algn conocimiento previo de la situacin o efectuar un estudio piloto para obtenerlo. Aceptando que se cumplen los requisitos para efectuar la correspondiente prueba de hiptesis, de acuerdo con Fleiss ,tendramos,

N= ( N/4) (1 + {1 + 2(r +1)/Nr | p2 - p1| }0,5 )2


en donde, N= [( Z {(r + 1)pq}0,5 ) - Z {r p1q1 + p2q2}0,5]2 / r(p2-p1)2
N es uno de los tamaos muestrales y Nr el otro. r es la fraccin que representa la muestra mas pequea respecto a la mayor.Como lo esperable es una prevalencia inferior a 50% , la muestra que corresponde a verdaderos enfermos segn estndar ideal ser Nr y la de verdaderos no afectados, N = Elevado a. p1 es = a/(a+c)=Sensibilidad de la prueba=p2 x LR+. q1.es = 1 - p1 p2 es = b/(b+d)=proporcin de falsos positivos = (1-especificidad) q2 es = 1 - p2 Valores de Z para hiptesis unilateral: Z = 1,645 para un error alfa de 0,05 2,326 para un error alfa de 0,01 Z = - 0,842 para un error beta de 0,20 - 1,29 para un error beta de 0,10 - 1,645.para un error beta de 0,05 p = (p1 + rp2) / (r + 1) q = 1-p

Ahora bien, podemos indicar que para detectar un LR+ de 2,5 o mayor(en hiptesis unilateral), con un error alfa de 5% y beta de 10%, es decir, una potencia del estudio de 90%,contemplando una prevalencia de afectados por la patologa de inters de 25% en la muestra y falsos positivos de 22%, se requiere estudiar un total de 111 casos. Estos se encontrarn distribuidos como 28 y 83 casos.Si la estimacin de falsos positivos fuera mas alta o mas baja se requerira ,respectivamente menos y mas casos integrando la muestra, si no se modifica la LR+ escogida.

118

Efectuada esta primera fase del clculo, podemos perfeccionarla estableciendo el intervalo de confianza(IC) que se considere apropiado o aceptable para la sensibilidad.El intervalo de confianza del 95%(IC95%) de p1, 0,55 o 55% puede establecerse, por ejemplo, en +10%. El error estndar deseado sera = 10/1,96 = 5,10 Se puede calcular el nmero de casos necesarios para generar se error estndar, contemplando que el procedimiento se modifica si la proporcin se aleja mucho de 0,50.El siguiente clculo es adecuado para muestras no muy pequeas y proporcin no menor de 0,30 o mayor de 0,70. Varios programas computacionales proporcionan ste clculo.Como sea, para los fines perseguidos, no se requiere extrema precisin. Entonces, 5,10 = ((100-55)x 55 / n) 0,5 Despejando n obtenemos n=95 casos. Esto significa que para obtener el intervalo de confianza deseado el nmero de afectados por la patologa de inters debe ser de 95 en vez de 28 casos y por lo tanto, conservando la prevalencia estimada, el segundo grupo debera ser de 285 casos en vez de 83. Esto nos da un N total final, de 383 casos. Hay que destacar lo siguiente: Si el nivel de sensibilidad encontrado, (0,55) tan cercano a 0,50 , fuese mayor o menor, el nmero de casos encontrado, 95, generara un intervalo de confianza mas estrecho.Dicho de otro modo, en tales circunstancias se requerira una muestra menor. Por otro lado, el intervalo de confianza de p2 ser al menos tan estrecho como el de la sensibilidad si la prevalencia es menor que 0,50 , como es usual. Pero, si ello no es as y la prevalencia supera 0,50 ,para la muestra calculada el intervalo de confianza de p2 ser mas ancho que lo deseado. Es necesario tener presente que el tamao de la muestra ,para un mismo LR+ cambiar substancialmente con la proporcin de falsos positivos. As, si se establece un LR+ deseable de detectar igual o mayor que 3 y p2 es 0,20 ,

119

consecuentemente p1 ser 0,60 y la diferencia a detectar 0,40(40%).Para ello se requerir una muestra pequea por tratarse de una gran diferencia. Sinembargo, si p2 fuese 0,05 , p1 debiera ser 0,15 y la diferencia a detectar slo de 0,10(10%), por lo que se requerir una muestra mucho mayor. Si se comenzara con la sensibilidad(p1) y su intervalo de confianza para conocer el respectivo tamao de la muestra para esa proporcin, segn r sera posible conocer la segunda muestra parcial.Sin embargo, de todas maneras se requiere verificar que el N total no es insuficiente para los errores alfa y beta establecidos , particularmente - como se seal - si el valor de p1 se aleja de 0,50, donde se encontrar un n mas pequeo para el mismo IC y asimismo si la prevalencia supera 0,50 , donde la muestra de no afectados sera menor que la de enfermos, con un IC mayor que el deseado para el grupo de afectados. V.-Estudios en que se compararn dos promedios. Aunque lo mas corriente es que se trabaje con los elementos que se sealan a continuacin, es posible que se exija estimar las desviaciones estndar de los grupos adems de las diferencia de promedios y los errores. Requisitos: -Establecer el valor del promedio esperado de la variable en el grupo 1 -Establecer el valor promedio esperado de la variable en el grupo 2. -Estimar un valor para la desviacin estndar de la variable. -Error alfa -Error beta Frmula:

N =2 ( ( (Za + Z ) X DE ) / ( x1 - x2) )^

120

Es posible ver que en ste clculo no se requiere conocer cada promedio pudiendo plantearse establecer slo la diferencia clnicamente significativa.La dispersin de los valores, la desviacin estndar, es frecuente que no se conozca o bien que se disponga de un valor obtenido en un estudio piloto u otra investigacin con pocos casos.Aqu es de inters poder calcular el intervalo de confianza de la desviacin estndar que se disponga, con el fin de establecer un margen de valores con los cuales determinar el tamao muestral mayor y menor.Supongamos que en un estudio piloto sobre 20 casos se encuentra la variable de inters con promedio de 254 y desviacin estndar de 31.Se desea poder detectar una diferencia entre promedios de 18. En estas condiciones, el intervalo de confianza del 95% para la desviacin estndar es de 23,7 a 44,6 y el tamao muestral va desde 28 a 96 casos por grupo. Puesto que la desviacin estndar de la muestra es un estimador sesgado de la desviacin estndar del universo del cual procede el grupo, sealaremos los factores de correccin apropiados para obviar el sesgo y luego aquellos que establecen el intervalo de confianza del 95%. N 10 15 20 25 30 35 40 45 50 55 60 80 90 100 Factor de correccin del sesgo de DE 1,025 1,016 1,012 1,010 1,008 1,007 1,006 1,005 1,005 1,004 1,004 1,003 1,002 1,002 IC 95% de DE Factores. 0,69 - 1,75 0,74 - 1,54 0,76 - 1,44 0,78 - 1,38 0,80 - 1,34 0,81 - 1,30 0,82 - 1,23 0,83 - 1,26 0,84 - 1,24 0,84 - 1,23 0,85 - 1,22 0,87 - 1,18 0,87 - 1,17 0,88 - 1,16

121

Recordaremos que en la comparacin de promedios se presume que las muestras proceden de poblaciones con igual varianza y distribucin normal de la variable de inters. Es necesario tener cuidado de no caer en lo siguiente al estimar el tamao de la muestra si se van a comparar dos promedios: Ud. puede efectuar el clculo sealando que espera detectar una diferencia entre promedios, de igual magnitud que la desviacin estndar.Ello originar por grupo siempre el mismo tamao de modo que de hecho,entonces, no est efectuando un clculo del tamao muestral. Una observacin adicional de inters es la siguiente: cuando la informacin disponible se refiere a un grupo considerado normal, la desviacin estndar ,como referencia para el clculo del tamao de la muestra no es muy acertada si consideramos que enfermos de esa misma poblacin mostrarn casi de seguro una varianza mayor. Ello tiene su inters, puesto que al comparar promedios en dos grupos, uno sano y otro enfermo , van a diferir seguramente por las varianzas y la comparacin de promedios no se podr efectuar sin recurrir a correcciones como Welch o Satterthwaite
De cualquier manera, aunque no discutiremos la conveniencia de utilizar como medidas de resultado los promedios de una variable, hay circunstancias en que su indicacin no es la ptima , particularmente si se desea hacer clculo del nmero de casos necesario de tratar (NNT)(Ver seccin correspondiente) y, derivado de ello, una estimacin econmica.En tales situaciones se requiere establecer en los grupos estudiados usualmente la proporcin que mejora,que sufre dao, etc. Por otro lado para algunas variables, donde no se analiza resultados de un tratamiento, podr ser apropiado el estudio de promedios: Tal sera la situacin de comparar, por ejemplo gasto energtico en reposo de eutrficos y obesos

VI.-Estudios en que un grupo ser su propio control. Cuando cada caso ser su propio control y se emplear la t de Student para muestras relacionadas, se requiere conocer o estimar: -Diferencia a detectar( dif.) -Varianza esperada de las diferencias experimentadas por el grupo en los dos momentos estudiados(DEd). -Error alfa

122

-Error beta Frmula: N =[ (Za + Z ) x DEd]/ dif VII.-Estudios de concordancia. En estudios de concordancia conviene recordar que el ndice kappa tiene una distribucin normal si el efectivo de la muestra es mayor que 2 g, siendo g el nmero de categoras en investigacin.En tales circunstancias se puede verificar la hiptesis de k=0.La comparacin de dos ndices kappa requiere un tamao muestral mnimo de 3 g para poder intentar la comparacin. Otro asunto es establecer cuantos casos se requiere estudiar en una situacin especfica para detectar un ndice kappa como diferente de cero o para comparar dos ndices. Lo usual es tener que efectuar un estudio piloto. Supongamos que en un estudio de 50 casos dos observadores clnicos califican los casos como con o sin una determinada manifestacin clnica:

Observador A con sin con Observador B sin 5 20 20 30 25 50 15 10 25

Prevalencia del hallazgo segn observador A = 20/50 = 40% con IC 95% = 26,7% - 54,8% Prevalencia del hallazgo segn observador B = 25/50 = 50% con IC 95% = 35,7% - 64,3%

123

Recordaremos que si se desea establecer el nmero de casos necesario para detectar un ndice kappa como significativamente diferente de cero( p< 0,05) se requiere calcular primero el error estndar de kappa=0, donde EE
k=0

= ( pc / N ( 1 - pc) )^

donde ^ = elevado a pc = proporcin de concordancia dada por el azar N = nmero de casos a estudiar. El valor de pc se puede determinar segn el intervalo de confianza de la prevalencia del hallazgo clnico,para cada observador, de la manera siguiente: Tomemos las prevalencias menores:El total de la tabla es 1 o 100% , de tal manera que, conociendo los marginales 0,357 y 0,267 podemos calcular los faltantes. Observador A con sin con 0,095 Observador B sin 0,267 0,471 0,733 0,643 1

0,357

Ahora, teniendo los marginales correspondientes a las casillas a y d , podemos calcular a su vez los valores esperados en esas casillas( 0,095 resulta de 0,357 por 0,267 , dividido por el total 1).Finalmente, pc es igual a la suma de 0,095 y 0,471 ,es decir 0,566. Por este procedimiento podemos llegar a saber que pc fluctuar entre 0,43 y 0,56.Entonces, si se desea detectar como significativamente diferente de cero un ndice kappa de 0,25 o mayor, podemos decir que el error estndar de kappa igual a cero debe ser de 0,25/ 1,96 , es decir , 0,127. Disponiendo del valor pc y del error estndar de kappa=0 podemos resolver N de la frmula indicada mas arriba. As , obtenemos que N fluctuar entre 47 y 79 casos. El tamao muestral ser,entonces de 79 casos.

124

VIII.-Estudios de cohortes Requisitos: 1.-p0 ,que corresponde a la frecuencia de la condicin en estudio en la poblacin no expuesta. Se expresa como decimales : 0,05 (5%). 2.-RR, el riesgo relativo que se considere digno de ser detectado( o mayor).Recordaremos que un RR de uno significa que el factor de exposicin no se encuentra asociado a un aumento del riesgo ,puesto que ste es igual en expuestos y no expuestos. 3.-c, relacin numrica de expuestos/ no expuestos. Muestra si las cohortes son de igual tamao o no. 4.-Error alfa y su respectivo Za 5.-Error beta y su respectivo Z. Frmula: La frmula proporciona el nmero de expuestos requeridos y, naturalmente, el de no expuestos como c x N

N =( n/4) x [ 1 + Rc ( 1+2(c+1) /{ n c p0 x (RR - 1)}) ]


donde [ Za x Rc{( c+1) p (1-p)} + Z Rc{cp0(1-p0) + pRR(1-p0RR)} ] n= -----------------------------------------------------------------------------------c [ p0(1-RR)] Rc= Raz cuadrada p = [ (p0 x RR ) + (p0 + c)] / (1 + c) q = 1-p Un ensayo clnico controlado puede ser considerado un seguimiento de dos cohortes, una expuesta al tratamiento experimental y la otra no. La similitud se puede comprobar tambin en el clculo del tamao de la muestra, que genera iguales resultados si se emplea RR de 3 ,como en el material recin presentado , o se calcula con el resultado en la forma

125

de 2 proporciones, 0,10 en los no expuestos y 0,30 en los expuestos. IX.-Estudios Caso - control. Un desarrollo detallado del problema se puede encontrar en Herrera P y Duffau G. 1997. Consideraremos la situacin de los estudios no pareados, en donde los requisitos sern: 1.-La frecuencia relativa de exposicin entre los controles, p0. Este valor puede resultar difcil de conocer.Por otra parte, puesto que la investigacin implica una situacin de muy baja prevalencia, la frecuencia de exposicin en controles y en la poblacin total resultarn muy similares. 2.-La razn de riesgos -OR- de una magnitud digna de ser detectada por considerarse que tiene inters para el investigador.Aunque no hay una norma general para la eleccin, se suele considerar que OR inferior a 2 muy probablemente carece de inters bien definido, por ello habitualmente se escoge una cifra de 2 o mas, aunque no muy alejada (3 , 3,5 o valor similar). 3.-Error alfa. 4.-Error beta. Frmula: Estudios no pareados. N = [ Za Rc(2 p q) + Z Rc(p1q1 + p0q0) ] / (p1 - p0) Donde p1 =p0 OR / [ 1 + p0(OR - 1)] p = (p1 + p0)/ 2 q=1-p q1= 1- p1 q0 = 1 - p0

X.-Estimacin del tamao muestral cuando la investigacin

126

clnica incluye mas de dos grupos de tratamiento. Los ensayos clnicos que comparan tres o mas tratamientos son mas complejos ,tanto desde el punto de vista del diseo como del ulterior anlisis. Si la medida de resultado ser el promedio de una variable,con su respectiva medida de dispersin, el mtodo inicial de anlisis ser el anlisis de varianza y a continuacin se emplearn pruebas t de Student para comparacin especfica de las parejas en el estudio. Consideraremos la situacin de tres grupos. En estas circunstancias, aunque el problema de clculo est resuelto, para el clnico la dificultad est en la eleccin de las cifras que caracterizarn a las medidas de resultado. As, se requiere disponer de los promedios que tendrn los grupos y de la desviacin estndar, que se supone igual para todos ellos . Esto puede ser difcil de tener. As, por ejemplo, existir un grupo control que segn las circunstancias, corresponder a aquellos que reciban un placebo (siempre que corresponda) o un tratamiento estndar. Al menos de ste es necesario tener informacin del resultado esperable ,en trminos de promedio de la variable de inters y su desviacin estndar. Para los restantes dos grupos se supondr que la desviacin estndar es la misma y respecto de los promedios en el resultado de la variable de inters, ser necesario adelantar los valores de inters clnico. El nmero de casos por grupo depender del error alfa elegido y del poder esperado, pero ser muy importante saber que la relacin entre la desviacin estndar del grupo control y su promedio- el coeficiente de variacin- ser muy determinante, de modo que mientras menor sea la dispersin alrededor del promedio (CV mas pequeo) se requerir una muestra menor. Como siempre, a mayor diferencia a detectar entre los grupos, menor deber ser la muestra. Una medida estndar de diferencia entre los grupos es que corresponde a la razn entre la desviacin estndar calculada con los promedios de los grupos y la desviacin estndar comn de los grupos.

127

A continuacin proporcionaremos una tabla de n por grupo para tres grupos con las siguientes presunciones: 1.-Error alfa de 5% 2.-Error beta de 20%(Poder 80%) 3.-El promedio del grupo control aumenta un 10% en el grupo experimental-1(GE-1) y el promedio del grupos experimental2(GE-2) es 10% mayor que el del grupo experimental-1. Esto, por considerar que una diferencia de 10% en el promedio ,es digna de ser detectada. En la tabla se ofrece tambien la situacin inversa, es decir que el promedio del grupo control disminuye en 10% en el grupo experimental-1 y luego ste promedio, en el grupo experimental-2, disminuye un 10%. 4.-Se ofrecen resultados que dependen de la magnitud de la dispersin de los resultados: coeficiente de variacin(CV) en el grupo control. Tamao de la muestra para tres grupos en ensayo clnico. I.- Promedio del GC + 10% de promedio GC= promedio GE-1 y Promedio GE-1+ 10% de promedio GE-1 = promedio GE-2 CV-GC 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,30 0,35 0,70 0,65 0,62 0,58 0,55 0,52 0,50 0,48 0,46 0,44 0,42 0,35 0,30 n (por grupo) 12 13 14 15 16 17 18 20 22 24 27 37 46

128

0,40 0,45 0,50

0,26 0,23 0,21

65 90 105

II.- Promedio del GC - 10% de promedio GC = promedio GE-1 y Promedio GE-1 10% del promedio GE-1 = GE-2 CV-GC 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,30 0,35 0,40 0,45 0,50 n (por grupo) 14 15 16 17 18 22 24 27 30 31 33 45 60 90 105 150

0,63 0,59 0,56 0,53 0,50 0,47 0,45 0,43 0,41 0,39 0,38 0,32 0,27 0,23 0,21 0,19

Consideremos un ejemplo: En un grupo representativo de hipertensos previamente estudiados, el tratamiento tradicional es esperable que haga descender la presin arterial sistlica a un promedio de 112,5 mmHg con DE de 16,6 mmHg.El tratamiento experimental-1 , descendiendo el promedio en 10%, lo llevara a 101,25( es decir 112,5 11,25) y el tratamiento experimental-2 lo

129

reducira nuevamente en 10%, es decir a 91,125 ( 101,25 10,125). La DE de 11,7 se presume igual para todos los grupos. El coeficiente de variacin sera 16,6/ 112,5 = 0,147. Por grupo se requeriran 14 pacientes. Por anlisis de varianza, la comparacin de los tres promedios(si fuese tal el resultado) nos indicara, segn EpiInfo 6.04: p = 0,005 pero significativo y significativo y GC vs. GE-2 , p = 0,0018 Entonces, el tamao muestral de 14 casos por grupo es suficiente para detectar la existencia de una diferencia en el conjunto, pero para comparacin de parejas de tratamientos deberamos reconsiderar la muestra. As, con 18 casos por grupo se detecta como significativa (p=0,049) la diferencia planteada entre los grupos control y experimental-1. Con 22 casos por grupo se detecta como significativa (p= 0,0489) la diferencia planteada entre los grupos experimentales. GC vs. GE-1 , p = 0,08 es decir, no GE-1 vs. GE-2 , p = 0,11 es decir no

XI.-Tamao muestral en estudios de equivalencia. Ya hemos adelantado algo en la parte inicial del captulo sealando que se consideraran equivalentes dos tratamientos que difieran menos que una cifra crtica. En la prueba de hiptesis se obtendra un valor de p> 0,05 . Sin embargo , al establecer que la diferencia entre los dos tratamientos no debe superar un valor determinado estamos planteando lo siguiente: a.-al ser equivalentes ambas terapias la diferencia es cero, pero aceptaramos una diferencia real menor que ,digamos, d. Entonces, esperamos que el intervalo de confianza de la diferencia entre ambos tratamientos est contenido en el rango de valores desde (-) d hasta (+)d (Este rango no constituye un intervalo de confianza, son valores arbitrarios).

130

b.-no bastara con una prueba de hiptesis que indique p>0,05 al comparar los dos grupos, ya que al contrastar el rango de valores aceptables (-)d hasta (+)d con el intervalo de confianza encontrado de la diferencia entre los grupos , puede resultar que ste intervalo no est totalmente contenido en el rango aceptable, por lo que no sera posible asegurar la equivalencia de los tratamientos.

Los posibles resultados se muestran a continuacin: 1.2.-d |||||||||||||||||||||||||||||| 0 |||||||||||||||||||||||||||||| No hay equivalencia +d ||||||||||||||||||x||||||||||||||||

||||||||||||||||||||||||||||||0||||||||||||||||||||||||||||||| Equivalencia incierta ||||||||||||||x|||||||||||||||| -d +d |||||||||||||||||||||||||||||| 0 ||||||||||||||||||||||||||||||||| ||||||||||||||||x|||||||||||||||| Equivalencia incierta -d ||||||||||||||||||||||||||||||0||||||||||||||||||||||||||||||| ||||||||||||||x|||||||||||||||| Equivalencia +d

3.-

4.-

5.-

-d +d |||||||||||||||||||||||||||||| 0 ||||||||||||||||||||||||||||||||| ||||||||||||||||||||||||x||||||||||||||||||||||||||| Equivalencia

-d +d 6.|||||||||||||||||||||||||||||||0||||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||||||x2|||||||||||||||||||||||||||||||| Equivalencia incierta

131

La situacin ideal, repetimos, sera aquella donde la totalidad del intervalo de confianza encontrado para la diferencia entre los tratamientos est contenido entre los valores (-)d hasta (+)d. Los requisitos para el clculo del tamao muestral son: Si se van a comparar dos promedios: 1.-Desviacin estndar de los grupos en estudio, que se presume igual para ambos:DE. 2.-Diferencia d aceptable entre los promedios. 3.-Error alfa. 4.-Error beta. Los grupos se presume sern de igual tamao y cada uno = N.

N = (2 DE / d ) /2)
Si se van a comparar dos porcentajes:

(Z + Z

1.-Porcentaje global de xitos en los grupos a comparar(si son equivalentes):p. 2.-Diferencia d aceptable entre las dos proporciones. 3.-Error alfa. 4.-Error beta.

Los grupos se presume sern de igual tamao y cada uno= N N= (2p( 100 p) / d)
x

( Z + Z /2)

XXIX

132

Estimacin del tamao muestral en estudios biomdicos empleando diferentes programas de computacin. Para mostrar los resultados de estimaciones del tamao muestral y su variacin, se emplearon 6 programas de uso relativamente frecuente, en estudios de medias, proporciones, cohortes y caso-control. Estos programas no cubren habitualmente todos los problemas de tamao de muestra mas frecuentemente planteados Fueron: EPIINFO 6.04a y b EPIDAT 2.0 WIN EPISCOPE 1.0 MEDCALC POWER PS A todos ellos se les plantearon problemas de calculo del tamao de la muestra en comparacin de proporciones medias estudio de cohorte estudio caso-control y se observaron las diferencias generadas ante un mismo problema En la tabla se observa que hay diferencias a veces muy manifiestas en los clculos realizados por los distintos programas En el estudio de medias, EpiDat 2.0 sugiere un tamao que corresponde a la mitad de los otros programas.Esto corresponde directamente a un error de programacin no detectado oportunamente. Realmente la cifra que genera corresponde al nmero de casos por grupo pero est errnea.En proporciones, MedCalc versin 4.16, calcula una muestra cuyo tamao es el 58% del mayor propuesto.No seala el procedimiento de clculo empleado pero en una versin posterior(Medcalc 4.20 win 95) alcanza

133

las cifras de los programas que utilizan el procedimiento de Fleiss.Se debe tomar en cuenta que EpiInfo 6.04 incrementa en un 10% el tamao muestral inicialmente estimado por el programa, para dar cuenta de una cierta prdida de casos. En cohortes y caso-control, con grupos de igual tamao, la variacin no es tan manifiesta, aunque no despreciable y depende de la prueba de hiptesis que se emplear.EpiDat 2.0 en el estudio de cohortes,(que no se muestra en la tabla), para detectar un riesgo relativo preestablecido, no ofrece la opcin de grupos de tamao diferente(razn expuestos/no expuesto slo 1) y por otra parte,no opera como le interesa al clnico , a saber cuantos casos debe investigar para detectar un RR determinado o mayor.El programa genera tamao muestral para deteccin de un cierto RR mas menos cierto error. En caso-control con 4 controles por caso, la diferencia puede ser muy notoria entre los subprogramas Statcalc y Epitable de EpiInfo y entre estos y EpiDat. Power muestra tamaos diferentes segn la prueba de hiptesis planeada usar, refirindose al empleo de Ji cuadrado sin correccin de Yates o a la misma prueba con la correccin, as como FisherIrwin. PS, en ste punto, opera de modo similar aunque no indica contemplar la opcin de Ji cuadrado corregido.

Muestras independientes. Dos colas.N por grupo.


Errores: alfa: 5%, beta:20%
EpiInfo 6.04 EpiDat 2.0 Win Episcope 1.0 Medcalc 4.16e Power PS 1.0.12

Medias(M) M1=50, M2=40, DE=20 Proporciones(p) p1=0,30, p2=0,45

--176

31 163

65 162

63 103

63

63

162* 162*

134 175** 175** Cohorte Exp./no exp=1 frec. en no exp.=5% RR= 3,0 159(S) 160(E) ------140* 140* 159** 159**

Caso-control no pareado 199(S) Controles/caso=1, OR=3,0 200(E) Exposic. en controles=5% Igual ,excepto Controles/caso=4

177

177

---

177* 177* 199** 199* 388/97* 388/97*

444/111(S) 388/97 536/134(E)

---

---

444/111**444/111**

S=Statcalc E=Epitable *= Empleando Ji cuadrado sin correccin. **=Empleando Ji cuadrado corregido o Fisher-Irwin segn Power y Fisher-Irwin segn PS.

Queda claro, entonces, que 1.-Existen errores en los programas.As, como hemos visto, EpiDat en estudio de medias o EpiInfo 6.04("a" o "b") en los subprogramas Statcalc y Epitable. 2.-No todos los programas muestran las frmulas empleadas en las estimaciones. 3.-Los programas no suelen abordar todos los diseos mas comunes. 4.-EpiInfo incrementa en 10% el tamao muestral determinado, para compensar posibles prdidas. Se debe aclarar de inmediato que no se puede solucionar la prdidas de casos aumentando la muestra. 5.-El investigador, ante esto, debiera informar al lector del procedimiento empleado para estimar la muestra en su estudio. Finalmente,importante ayuda se puede esperar de los programas que permiten estimar el tamao de la muestra a investigar en diferentes situaciones, pero es indispensable disponer del manejo necesario de los conceptos bioestadsticos que subyacen a tales estimaciones para mejor

135

decidir. Adems, el investigador debiera elegir y estar familiarizado con las caractersticas de un programa especfico. Referencias.

-Edmiston ChE, Josephson A, Pottinger J, Ciacco-Tsivitis M, Palenik Ch. The numbers game: Sample-size determination. AJIC 1993;21:151-154. -Essex-Sorlie D. Medical Biostatistics & Epidemiology.Appleton & Lange, Norwalk,USA, 1995:124-126. -Duffau G, Emilfork M.Solucin hipotnica para hidratacin oral. Acta Peditr Esp 1992;50:235-244. -Mendez B, Duffau G.Neumona grave en lactantes: Balance de agua. Acta Pediatr Esp 1998;56:437-443. -Snedecor GW, Cochran L. Statistical methods. 7th edition ,The Iowa State University Press, 1986:89-122. -Haseman JK Exact sample size for use with the Fisher-Irwin test for 2 x 2 tables. Biometrics1978;34:106-109. -Welch BL. Introduction to statistics, in: Scientific tables, 8th edition ,Basle, Geigy, 1982: 209. -Matthews DE, Farewell VT. Estadstica Mdica. Salvat Editores SA, Barcelona, Espaa, 1988:93-107. -Fleiss JL. Statistical methods for rates and proportions. 2nd edition, John Wiley & Sons, 1981: 38-48. -Herrera P, Duffau G. Estudio Caso-Control. Editorial Mediterrneo, Santiago de Chile,1997:61-70. -Jones B, Jarvis P, Lewis JA, Ebbutt A. Trials to assess equivalence:The importance of rigorous methods. BMJ 1996;313:36-39.

136

XXX. Estadstica en el programa Epiinfo 6.0 EPIINFO es la denominacin de un conjunto definido como "programa procesador de palabras , base de datos y estadstico para Salud Pblica". Tiene un grado de difusin elevado por ser de gran utilidad, estar avalado por la Organizacin Mundial de la Salud as como por el Centro de Control de Enfermedades de Atlanta (U.S.A.) y porque se obtiene en las oficinas respectivas sin costo para el interesado. Este tipo de instrumento de trabajo va asociado a la idea de cierta infalibilidad en todo desempeo, lo que puede inducir a su utilizacin sin prevencin alguna. Sealaremos a continuacin algunos rasgos del programa que es conveniente tener presente al emplearlo. STATCALC, en tabla de 2 x 2 , indica odds ratio( razn de productos cruzados) "OR" y entrega los resultados de la prueba de Ji cuadrado con correccin de Yates y sin ella. Si hay una frecuencia esperada menor de 5 , recomienda efectuar la prueba de Fisher-Irwin de probabilidades exactas, pero cuando la tabla es 2 x 3 o mas grande, el usuario puede encontrar que en algunas donde hay cifras esperadas menores de 5 el programa advierte sobre este hecho e indica que la prueba de Ji cuadrado no es vlida, pero en otras tablas no ocurrir esto y se entregar el resultado de la prueba. As por ejemplo, en la siguiente
0 2 9 8 14 1 1 7 9 0

se encuentran 5 celdas con valores esperados inferiores a 5 y el programa no calcula Ji cuadrado, expresando que "hay un valor esperado menor que 5 en una celda". Sin embargo , en esta otra

137 0 2 9 8 15 1 1 7 9 0

hay 4 celdas con cifras esperadas inferiores a 5 y pese a ello se indica que Ji cuadrado es 12,94 con 4 grados de libertad y p= 0,011. Esta misma tabla analizada por EPITABLE seala , en cambio, "invalid input" porque ningn valor esperado puede ser inferior a 1. EPITABLE en tabla de 2 x 2 entrega los resultados sin correccin por continuidad, excepto cuando la cifra esperada en una celda es inferior a 5( ver opcin"Help"(Ayuda)), lo que resulta sorprendente porque la correccin de Yates no persigue resolver este problema. Si hay una cifra esperada menor que la unidad, no efecta la prueba y seala "invalid input". Para tablas mayores muestra el porcentaje de valores esperados inferiores a 5 y calcula Ji cuadrado. Ante cifras esperadas inferiores a 1, como se explic, no realiza la prueba . La correccin de Yates se considera importante en tablas de 2 x 2 , al aproximar la distribucin de Ji cuadrado a la normal . Una situacin similar se da con la distribucin binomial. Es cierto que la correccin hace la prueba mas conservadora y tambin lo es que no todos la aplican, pero lo claro es que EPIINFO 6.0 la incluye o no segn el subprograma que est corriendo. Sealaremos que para la ejecucin de la prueba de Ji cuadrado es generalmente aceptado lo siguiente: a.-No debe haber ningn valor esperado menor que 1. b.-No debe haber mas de un 20% de celdas con valor esperado inferior a 5 (entonces, en tabla de 2 x 2 no puede haber ninguna). La solucin aqu es reagrupar categoras vecinas. Pese a lo sealado, EPITABLE ,en comparacin de proporciones, en que utiliza Ji cuadrado, al presentar un problema de 2 proporciones construye una tabla("r x c ")con cifras que pueden sumar un total inferior a 20 y no recomienda la prueba de Fisher de probabilidades exactas.Es mas, acepta que en la totalidad de las celdas existan valores

138

esperados inferiores a 5 y la nica reaccin observada es que aplica correccin de Yates. Tal es la situacin frente a:
0 4 5 0

donde indica Ji cuadrado con correccin de Yates = 5,41 y p = 0,020 debiendo obtener por Fisher p=0,007 Los "OR*" son calculados en STATCALC y se entregan sus lmites de confianza segn Cornfield, aunque se pueden obtener tambin valores exactos. Cuando en la tabla hay un cero , el programa entrega resultados de "OR" o no lo hace ( declarando OR "indefinido") dependiendo de la posicin del cero. As, si ste est ubicado en la celda "a" o "d" muestra valores, cosa que no hace si el cero se encuentra en las celdas "b" o "c". Es ms, si se ponen dos ceros ,uno en "a" y el otro en "d", tambin da un resultado. Esto es raro si consideramos que para el clculo de "OR" enpresencia de un cero se han propuesto soluciones que no justificaran -----------------------------------------------------------------------------------------------------------------*Esta expresin ha sido traducida de muy diversas maneras y no parece existir acuerdo acerca de aquella mas apropiada:"razn de desigualdades","razn de productos cruzados,""desigualdad relativa","razn de la diferencia","razn de la probabilidad","razn de ventaja","razn de disparidad","razn de momios","posibilidades relativas","razn de posibilidades" y otras.

expresarlo como "indefinido". Por otra parte, el problema persiste independientemente de la localizacin del cero ya que "OR" resultara un valor incalculable ( a x d / b x 0 o a x d / 0 x c ) o cero ( a x 0 / b x c o 0 x d / b x c ) y por ltimo, con dos ceros se dan situaciones que no siempre tienen sentido.

Cuando se desea efectuar un anlisis estratificado de datos, STATCALC determina la totalidad de las etapas pero no incluye la muy importante prueba de homogeneidad de Mantel y Haenszel. EPITABLE , en la rutina studycase.control proporciona el clculo de odds ratio pero no origina el mismo resultado que STATCALC. As, en la tabla

139

71 29

52 48

ste ltimo indica OR=2,26 con IC 95% de 1,21 - 4,23 pero EPITABLE para situacin de no pareo seala OR=2,26 con IC 95% de 1,26 - 4,05. EPITABLE , para el clculo del intervalo de confianza( 95%) de una proporcin, mtodo cuadrtico de Fleiss, propone una frmula en la opcin "Ayuda", que slo se ve completa imprimindola, porque el signo "raz cuadrada" no aparece desarrollado, frmula que no permite establecer que el lmite superior es 100% y el inferior 0% en la eventualidad que la muestra analizada indique ,respectivamente, un resultado de 100% o 0%. Sin embargo, el programa en tales casos muestra correctamente los lmites sealados cuando corresponde. El programa, entonces , no emplea en esas oportunidades la solucin sugerida en la opcin "Ayuda".Esto se podra ver apoyado ,adems, por el hecho que cuando la proporcin es 0% o 100% la respuesta no demora mucho pero cuando es cercana a esas cifras el programa puede quedar bloqueado calculando y no responder a Quit ,Cancel , F10 o Esc. EPITABLE , para el clculo del intervalo de confianza ( 95%) de un promedio pide el tamao de la poblacin de la que se extrajo la muestra, adems del tamao muestral, promedio y desviacin estndar. Esto es bastante inusual ya que raramente se dispone del tamao de la poblacin. De todos modos , el programa, al faltar el dato supone una poblacin de 99. 999. 999 efectivos. La idea es que si la muestra tiene un tamao mas cercano al de la poblacin, el intervalo de confianza del promedio es mas estrecho que si ocurre lo opuesto. EPITABLE, calcula el intervalo de confianza(95%) de la mediana en una serie estableciendo como requisitos que la variable tenga distribucin normal y el efectivo de la muestra sea mayor que 60 observaciones. Si se dan las condiciones

140

mencionadas, no parece en absoluto necesario trabajar con la mediana, que por lo dems debiera coincidir con el promedio.Aunque hay una variedad de operaciones estadsticas que pueden realizarse con la mediana, no son tcnicas particularmente empleadas por investigaciones en el rea mdica.En inferencia estadstica parece improbable que pueda desplazar al promedio para distribuciones en que ste se encuentre indicado. Para el anlisis de concordancia en la evaluacin por dos observadores, el programa calcula el estadstico kappa corregido (para efecto del azar) y el error estndar para la eventualidad que kappa=0. Adems seala el valor de "p" asociado. Estos clculos los efecta de la misma manera en tabla de 2 x 2 y otras mayores. De hecho, no toma en consideracin la importancia del grado de discordancia , que tiene slo una expresin si la tabla es 2 x 2 puesto que dos de las cuatro celdas corresponden a acuerdo entre los observadores y las restantes dos a desacuerdo. Sin embargo , en una tabla mayor , existen grados de desacuerdo que el programa no contempla. De hecho , en una tabla como la que se muestra a continuacin
20 2 0 0 5 30 3 0 0 3 40 5 0 0 2 10

kappa corregido = 0,76

se obtiene un ndice kappa prcticamente igual a la siguiente, pese a que la discordancia, siendo igual el nmero de casos, es absolutamente diferente
20 0 0 10 0 30 0 0 0 0 40 0 10 0 0 10

kappa corregido = 0,77

Para resolver esto , se debe calcular el estadstico kappa ponderado que reflejar mejor la situacin, ya que en el

141

primer caso sealar un valor de 0,83 y en el segundo slo 0,56 . Por otra parte, tampoco se entrega el error estndar de kappa encontrado , lo que hace engorroso para el usuario el comparar dos de estos estadsticos, debiendo efectuar el clculo por s mismo. Recordaremos que el error estndar que entrega slo permite decir cuan diferente de cero es el valor encontrado de kappa. Al comparar una distribucin determinada con otra terica , por medio de Ji cuadrado en la opcin "bondad del ajuste" ("Goodness of fit" ) el nmero de grados de libertad no aparece correctamente si hay cifras esperadas inferiores a 5 y si se coloca un cero simplemente el programa se devuelve al comienzo de EPIINFO 6.0 Si se desea comparar promedios no aparece otra posibilidad que el anlisis de varianza que "Help" explica es, para dos muestras, una prueba equivalente a "t" de Student y que para poder efectuarla en propiedad se requiere que las varianzas no sean estadsticamente diferentes.Si lo son, emplear el procedimiento de Sattherwaite que corrige los grados de libertad, haciendo mas exigente el mtodo, esto es, requiriendo un valor de "t" mayor para declarar diferentes los promedios.Sobre esto hay que aclarar que cuando se dan las circunstancias, aparece en pantalla que las varianzas son diferentes, se indica el "p" asociado y luego viene la comparacin de promedios.Queda sealado, adems, que se emplear el mtodo de Sattherwaite. Sin embargo, aunque las varianzas sean diferentes , cosa comprobable con la rutina "comparacin de varianzas", si los grupos en estudio tienen 30 o mas casos , no aparece ninguna de las indicaciones sealadas y slo se destaca la comparacin de promedios. Esto no est bien , ya que dos grupos pueden ser diferentes por sus varianzas , sus promedios o ambos. Lo que nos llevara, entonces, al punto de partida correcto es decir, a la rutina ofrecida como comparacin de varianzas, prueba "F". Si la razn varianza mayor/varianza menor indica que stas son significativamente distintas, tambin lo son los grupos que se estn comparando. Si se insiste en contrastar los promedios,

142

se requerir una correccin de los grados de libertad , que pudiera ser la propuesta o aquella sugerida por Welch. En el estudio de eficacia de vacunas por medio de cohortes se calcula el riesgo relativo, RR, pero se incluye tambin odds ratio ,OR, lo que no corresponde hacer. Esto mismo se observa en otras rutinas(study-cohort ,as como en compare-proportion-trend quantitative data) Recordaremos que OR representa una aproximacin al RR cuando la situacin estudiada tiene una frecuencia baja y se trata de un diseo caso-control, precisamente porque una investigacin de cohortes no ha sido posible. La eficacia de una vacuna aparece definida como ( 1 - RR ) x 100 o bien, para estudio caso-control , ( 1 - OR) x 100. En cohortes, "Help" presenta:

Enfermedad (+) (-) (+) Vacunados (-) c a+c d b+d c+d N a b a+b

En donde, el riesgo de enfermar en los vacunados es a/ (a+b) y en los no vacunados c/ (c+d).El RR ser la razn a / (a+b) cuyo valor, inferior a uno, se utiliza b / (c+d) justamente para determinar eficacia de vacunas en la frmula sealada mas arriba. Ahora bien, en "Help" se

143

propone calcular RR de la siguiente manera: ax(b+d) . bx(a+c) lo que es claramente un error. Como sea , si se construye un ejemplo , el programa genera un resultado correcto pero la instruccin para hacerlo da un valor diferente y equivocado. En la rutina sample-sample size-single proportion,en que es posible tener una estimacin del tamao muestral apropiado para estudiar una prevalencia en una poblacin determinada, se requiere conocer : *Tamao de la poblacin de la cual se extraer la muestra, lo que puede ser un serio problema. *La precisin deseada. *La prevalencia esperada en esa poblacin.Si no se tiene una cierta idea no se puede efectuar el clculo y si es muy equivocada el tamao de la muestra propuesto tambin lo ser. *El nivel de confianza de la estimacin. *El efecto del diseo.Este se conoce aproximadamente para la situacin que se estudie. En la opcin "Ayuda" aparece la frmula utilizada en el clculo, pero hay que destacar que la forma en que se deben emplear los datos numricos difiere de la solicitada por la pantalla del programa.As, respectivamente sera para datos hipotticos:

Precisin deseada Prevalencia esperada Nivel de confianza

Frmula 0,03 0,15 95

Pantalla 3 15 1,96

En el nivel de confianza, la frmula emplea el valor "Z"(1,96) que corresponde a 95% de confianza, pero la pantalla pide el riesgo de 5%.

144

Para calcular el tamao de la muestra en un diseo caso-control no pareado, se puede recurrir a Statcalc o Epitable pero se obtendrn resultados distintos. As, con los siguientes datos: Relacin controles/casos: 1 OR mas pequeo que interese detectar: 2,5 % de exposicin entre los controles: 5,0 Error alfa: 5% Poder: 80% sern necesarios en Statcalc 301 casos e igual cifra de controles pero en Epitable 118 casos y 118 controles. Este error est corregido en la versin 6.04 de Epiinfo, donde se obtiene como resultado 301 casos y 301 controles en ambos programa En la rutina sample-power calculation-cohort study, sorprendentemente se puede llegar a un error beta de cero y por tanto a un poder de 100%. As, dos muestras de 750 casos con relacin expuestos/no expuestos de 1:1, un riesgo relativo de inters para el investigador de 2,74 o mayor, una tasa de ataque en no expuestos de 4,3% y error alfa de 5%, tendra un poder de cien por ciento es decir sera, para esa muestra, nula la probabilidad de no detectar un riesgo relativo de 2,74 o mayor. En la rutina study- screening, se analizan las propiedades de una prueba diagnstica en trminos de sensibilidad, especificidad y valores predictivos, todos con sus lmites de confianza segn Fleiss(1) pero no se mencionan elementos tan importantes como: Estndar ideal (Gold standard), Prevalencia del problema en estudio ni Validez de la prueba. Los nmeros al azar en sample-random number son ofrecidos en dos formas: como tabla o como una lista de nmeros al azar. En sta ltima , se puede solicitar un

145

conjunto de nmeros a ser elegidos de un grupo mayor ,pero no se puede obtener el ordenamiento al azar, por ejemplo, del 1 al 50 ,sin reposicin.Si se hace, dando como posibilidad la eleccin de cifras del 1 al 55, aparece un nmero muy elevado de grupos en unas pocas"corridas": 1-2-3-4-5-6-7-8-9-10-11 13-14-15-16-17-18-19-20 22-23-24-25-26-27-28-29-30-31-32-33-34-35-36-37 39-40-41 43-44-45-46-47-48-49-50-51-52 54-55. Aplicando el runs test para una muestra, el hallazgo resulta muy improbablemente explicable por el azar.

Referencias.
-Fleiss J. Statistical methods for rates and proportions. 2nd. edition, New York: John Wiley & Sons, 1980: 56-82. -Matthews D , Farewell V. Estadstica mdica. Aplicacin e interpretacin. Barcelona: Salvat Editores , S.A.,1988 : 11-66. -Siegel S. Nonparametric statistics for the behavioral sciences. New York : McGraw-Hill Book Co., 1956: 95-110. -Saunders BD, Trapp R. Bioestadstica mdica. Mxico DF: Manual Moderno, S.A.,1993: 173-180. -Colton T. Estadstica en medicina. Barcelona: Salvat Editores, S.A., 1979: 183-190. - Schwartz D. Mtodos estadsticos para mdicos y bilogos. Barcelona : Herder, 1985: 87-105. -Kramer M, Feinstein A. Clinical biostatistics. LIV. The biostatistics of concordance. Clin Pharmacol Ther ,1981;29:111-123. .-Lamotte M. Estadstica biolgica. Barcelona : Toray-Masson S.A., 1965:92 - 100. -Steel R , Torrie J . Bioestadstica: Principios y procedimientos. Madrid: McGraw - Hill , 1990: 102 - 105. -Lentner C. Introduction to statistics in: Scientific tables, 8th edition , Switzerland: Ciba - Geigy Ltd., 1982: 209. -Duffau G. Estadstica en el programa Epiinfo 6.0. Rev Chil Pediatr 1995;66:60. -Bautista LE. "Razn relativa" y "tasa relativa" como traducciones de odds ratio y hazard ratio.

146 Bol Oficina Sanit Panam 1995;119:278-279. -Ingelfinger J, Mosteller F, Thibodeau L, Ware J. Biostatistics in clinical medicine.2nd edition, New York: Macmillan Publishing Co., 1987: 168180. -Valenzuela C. Dos soluciones para la estimacin de odds ratios con ceros. Rev Md Chile 1993;121:1441 - 1444.

XXXI.

Medicina Basada en Evidencias(MBE)..


Este es un tema de mucho inters, que ha sido tratado en los ltimos aos desde diferentes puntos de vista. Su principio motor es procurar en todo momento lo mejor para quienes buscan atencin mdica. Con todo, para formarse una idea relativamente clara de los aspectos mas importantes que involucra tal propuesta es apropiado empezar por una definicin de lo que se entender por evidencia. En el original , en idioma Ingls, evidence corresponde a 1.Aquello que sirve para probar que algo es verdadero o falso, 2.-Aquello que sirve de base para conocer algo con certeza o creer algo con conviccin. Esto dara la impresin que la palabra evidencia se refiere a hechos irrefutables para apoyar una idea. Sin embargo su uso no apunta en tal direccin puesto que lo que se pretende y esto se seala repetidamente, es conseguir la mejor evidencia en un momento dado. Si nos referimos a los orgenes, la MBE surge como el resultado de incorporar a la prctica clnica el anlisis crtico, que a su vez aplica normas o reglas de evidencia a los datos clnicos, elementos de laboratorio, as como publicaciones, para determinar su validez y aplicabilidad (respectivamente, su aproximacin a la verdad y utilidad en la prctica clnica

147

personal).Puesto que la verdad no es conocida, slo es dable suponer que la informacin disponible se encontrar mas cercana a ella cuanto mas rigurosa sea la metdica seguida para obtenerla. Lo nuevo, consiste entonces en la incorporacin estructurada y formal de un cuerpo de reglas, normas o procedimientos que al aplicarlos exigen a la informacin disponible el mostrar ciertas caractersticas, consideradas indispensables, para que puedan constituir cimiento slido sobre el cual construir una conducta clnica. El mdico se enfrenta ,desde el momento de finalizar sus estudios formales, al riesgo de obsolescencia de sus conocimientos a no ser que , de alguna forma ,logre mantenerse al da. Este mantenerse al da se refiere a estar al tanto de las modificaciones ,cambios, que sufre el conjunto de verdades transitorias que han fundamentado su accionar hasta se momento. Como medida de circunscribir el rea de su responsabilidad, podramos considerar la adopcin de una especialidad mdica primaria y luego una derivada. Como veremos, aunque esto ayuda, no resuelve totalmente el problema. La asistencia frecuente a cursos de su especialidad slo permite obtener opiniones de los conferencistas como expertos, en la medida que lo sean y lograr una cierta sensacin de seguridad. El autoaprendizaje de post-ttulo, tan indispensable, no se puede entender de sta manera El acudir a las fuentes de informacin nueva, los artculos publicados en revistas de diseminacin del conocimiento biomdico, enfrenta al interesado con un problema de volumen de informacin, prcticamente inasible. Entonces que leer?.Podran ser los artculos pertinentes publicados en rganos de corriente principal que tengan un elevado ndice de impacto?. Definitivamente esta no es la solucin, si se considera que revistas con altos ndices tambin contienen material que no contribuye a obtener la mejor evidencia acerca de un asunto especfico. Ser, entonces, el lector interesado quien deber estar en condiciones de efectuar una seleccin empleando las tcnicas del anlisis crtico de la literatura biomdica. Mencionaremos que al recurrir a los libros como fuente de conocimiento nuevo, precisamente se encuentra con el perodo , a veces bastante largo, desde que

148

el o los autores finalizaron el escrito y ste aparece a la luz pblica. La informacin ya no es, por tanto, nueva. Sometida a anlisis crtico, menos an ya que quienes escriben uno o mas captulos de un libro o el libro entero no estn sujetos a la aprobacin de un comit de pares. De modo que, la lectura de libros slo proporciona opiniones de expertos y lamentablemente, no muy recientes. Esto ltimo es generalmente cierto, pero en los rganos de difusin del conocimiento biomdico, revistas, donde existe una fecha de recepcin del material, luego una fecha de aceptacin de ste y finalmente otra de publicacin, el lapso de autor a lector puede y muchas veces lo es, mayor a un ao. Las verdades tradicionales sobre los requisitos para proporcionar una informada atencin a los enfermos han sido :1.- La llamada experiencia clnica, no sistematizada, permite obtener conocimientos slidos y mantenerlos, sobre los aspectos de inters en el manejo de los enfermos. 2.-Es suficiente para la prctica clnica que el mdico est enterado de los mecanismos bsicos de la enfermedad y su fisiopatologa. 3.-El sentido comn y una enseanza clnica cuidadosa permiten una correcta valoracin de las nuevas tcnicas de diagnstico as como de los tratamientos. 4.-Son guas vlidas para la prctica clnica la propia experiencia y las opiniones de expertos. 5.-En la lectura de artculos publicados de inters, no hay ningn inconveniente en evitar la seccin material y mtodos o pacientes y mtodos para obtener la informacin importante que dichos artculos puedan contener. De acuerdo con lo expuesto, entonces, las opciones del clnico para resolver los problemas que a diario enfrenta con sus pacientes incluiran: su propia experiencia, el conocimiento que tenga de la biologa de la condicin patolgica, la consulta a expertos y los libros y artculos sobre el asunto. En ste esquema de pensamiento, gran importancia relativa tienen los conceptos y manejo tradicionalmente aceptado de las enfermedades: entindase aqu las opiniones de expertos vertidas verbalmente o a travs de escritos como libros o artculos.

149

Los cambios operados en la investigacin clnica han sido muy profundos y a la vez recientes. En efecto, los ensayos clnicos con el formato y exigencias como los conocemos ahora, tienen menos de 40 aos. Por otra parte, el desarrollo de la Epidemiologa Clnica, as como el crecimiento y generalizacin del empleo de la Bioestadstica han conducido a un punto en que las verdades aceptadas tradicionalmente para el accionar mdico han debido dar paso a un nuevo conjunto de proposiciones. En sntesis stas incluyen lo siguiente: 1.-La experiencia clnica es til como fuente de conocimiento y base de decisiones en la medida que deriva de la observacin rigurosa y sistemtica. En caso contrario la probabilidad que conduzca a caminos errados aumenta notablemente. 2.-El conocimiento de los mecanismos fundamentales de enfermedad son claramente insuficientes para guiar al mdico en su prctica clnica y de hecho pueden conducir a inexactitudes referentes a efectos de terapias o evolucin y pronstico. 3.-La interpretacin correcta de la literatura mdica, en las reas fundamentales de diagnstico, evolucin y pronstico, tratamientos y dao, as como causalidad, requiere del manejo bsico de las normas que rigen el anlisis crtico de la literatura biomdica. De aqu surge naturalmente la propuesta de obtener la mejor evidencia sobre el asunto de inters por medio de la lectura crtica de material original, en donde el centro ser el anlisis de las secciones pacientes y mtodos y los resultados. 4.Puesto que slo se puede aspirar a obtener la mejor evidencia y no la verdad sobre el asunto, es necesario que el mdico reconozca que debe trabajar y resolver con un grado de incertidumbre inevitable, particularmente sobre el efecto de sus decisiones. 5.-Es importante reducir el valor que tradicionalmente se ha asignado a la autoridad en la materia. Esto est fundado en la idea que el mdico puede y debe aprender a evaluar en forma independiente las evidencias y decidir el nivel de credibilidad de los expertos frente a una situacin especfica. En ningn caso se pretende crear una actitud de beligerancia ante los planteamientos de otros mdicos con mas aos de experiencia quienes, en todo caso, han tenido una maduracin mayor en aspectos que no se

150

pueden alcanzar leyendo artculos de investigacin. 6.-Por ltimo, se considera que los mdicos podrn proporcionar mejor atencin a sus pacientes en la medida que fundamenten slidamente su accionar en evidencias contenidas en la informacin disponible y correctamente ponderadas. Se suele creer, como se mencion, que los principios de la MBE desestiman la importancia de aquellas caractersticas, favorables para el manejo de los enfermos, que los aos de experiencia o rasgos muy individuales suelen conferir a algunos clnicos. Esto es un error, ya que por el contrario lo que se persigue es objetivar y hacer transmisibles, en la mayor medida posible, tales caractersticas y rasgos que hacen mas hbil un clnico que otro. Igualmente, algunos piensan que en el desempeo de la MBE no parecera tener mucho inters el aporte que significa la adecuada comprensin de la investigacin en fisiopatologa de las enfermedades, lo cual es otra malinterpretacin de las cosas. Este tipo de conocimiento es indispensable en la comprensin global de las patologas y su manejo. Por ltimo , se ha planteado que , de algn modo, la MBE minimiza la importancia de elementos como la anamnesis y el examen fsico de los pacientes. Definitivamente esto no es as y an mas, la informacin que proporciona tanto la anamnesis como el examen fsico debe ser investigada y sometida a las reglas de evidencia que se aplican a todos los elementos de juicio que emplear el mdico en su accionar. La diseminacin de todo lo propuesto no ha sido siempre bien recibida por los potenciales usuarios, por lo que, a veces, se ha recurrido a proporcionar versiones un tanto simplificadas del asunto , que resultan menos atemorizantes. As, por ejemplo, considerando el casi generalizado rechazo a los procedimientos bioestadsticos, se ha sugerido y ocasionalmente afirmado que es posible efectuar un apropiado anlisis crtico de la literatura sin estadstica. Claramente esto no es as y menos an pensar que para resolver aquello estn los programas computacionales pertinentes. Sin embargo, hay que destacar el hecho que los escritos sobre el tema efectivamente tratan de dar esa

151

impresin y , cuando resulta ya inevitable, colocan como pi de pgina la necesaria explicacin estadstica. Al aplicar los principios de la MBE, se espera que el mdico acte como sigue: 1.-En primer lugar, debe detectar la existencia de un problema y luego debe plantearlo en forma precisa, generalmente en la forma de una pregunta. 2.-A continuacin debe efectuar una bsqueda de artculos publicados sobre el asunto. Aqu es muy probable que se encuentre con dos tipos de artculos: Aquellos que constituyen propiamente contribuciones originales y aquellos que son revisiones o puestas al da, basadas justamente en artculos del primer tipo. 3.-Por ltimo, la parte que requiere mayor entrenamiento del mdico, establecer la validez y aplicabilidad (utilidad) de la informacin obtenida. Aqu es donde se torna indispensable un manejo razonable de las tcnicas de anlisis crtico de la literatura. Para ello se han dictado cursos y publicado documentos de gran utilidad, que incluyen guas para que el lector crtico siga una orientacin adecuada segn sea el tipo de artculo que est analizando. Estas guas permiten hacer una primera seleccin, especialmente apropiada para el caso de tener que revisar muchas publicaciones y luego , en un segundo paso , entrar en el estudio mas profundo de las comunicaciones cientficas de inters. Como sea, lo esperable es que la incorporacin de la metdica de la MBE slo se produzca en forma importante en el desempeo mdico en la medida que forme parte del curriculum de quienes estn en la condicin de alumnos y sea, por tanto, material exigible. En el intertanto, para el mdico en actividad el mantenerse al da y dentro del respectivo marco tico, bsicamente significar tomar una de dos opciones: O bien hace el esfuerzo por adquirir o perfeccionar las destrezas requeridas y estimula a sus colegas a practicar el anlisis crtico colectivo regular en su lugar de trabajo( dado que el trabajo individual se estima sometido a mayor probabilidad de error), o bien reemplaza los principios autoritarios tradicionales por otros, constituidos por las recomendaciones de publicaciones e instituciones que

152

se han creado para predigerir el conocimiento y progreso biomdico segn los nuevos principios( nosotros lo hacemos por usted).En cierto modo, esto ltimo encuentra fundamento en lo siguiente: La aplicacin de los principios y reglas del anlisis crtico alcanza el nivel mayor de profundidad en la bsqueda de la mejor evidencia cuando quien efecta el anlisis es experto en la materia analizada. Efectivamente, mas all de la aplicacin de las respectivas pautas de estudio recomendadas hay amplio campo no abarcado por estas, donde se requiere experiencia en el tema para detectar falencias en la evidencia presentada. De esta manera, se puede ver que hay un cierto retorno a la situacin existente previamente. No era la idea, pero as esta ocurriendo.

Referencias:
1.- Funk & Wagnalls. Standard Encyclopedic Dictionary. 4th Edition, RDB, Inc.USA., 1970. 2.- Herrera P. Introduccin a la Medicina basada en evidencias. Rev Pediatra (Santiago) 1998;41:11-20. 3.- Duffau G. Medicina basada en evidencias: Aspectos del anlisis crtico de la literatura biomdica. Rev Chil Pediatr 1998;69: 110-115. 4.- Herrera P. Una nueva perspectiva para la prctica y la docencia en Medicina clnica: La Medicina basada en evidencias. Rev Pediatra(Santiago) 1997;40: 32-37. 5.- Oxman AD, Sackett DL, Guyatt HG Users guide to the medical literature. I. How to get started. JAMA 1993; 270:2093-2095. 6.- Guyatt GH, Sackett DL, Cook DJ Users guide to the medical literature. II. How to use an article about therapy or prevention. A. Are the results of the study valid?. JAMA 1993; 270:2598-2601. 7.- Guyatt GH, Sackett Dl, Cook DJ, Users guide to the medical literature. II How to use an article about therapy and prevention. B. What were the results and will they help me in caring of my patients?. JAMA 1994; 271:59-63. 8.- Jaeschke R, Guyatt GH, Sackett DL, Users guide to the medical literature. How to use an article about a diagnostic test. A. Are the results valid?. JAMA 1994; 2271:389-391. 9.- Jaesche R, Guyatt GH, Sackett DL Users guide to the medical literature. III. How to use an article about a diagnostic test. B.What are the results

153
and will they help me in caring my patients?. JAMA 1994; 271:703-707. 10.-Levine M, Walter S, Lee H, Haines T, Holbrook A, Moyer V, Users guide to the medical literature. IV. How to use an article about harm. JAMA 1994; 271;1615-1619. 11.-Laupacis A, Wells G, Richardson WS, Tugwell P Users guide to the medical literature. V.How to use an article about prognosis. JAMA 1994; 272:234-237. 12.-Oxman AD, Cook DJ, Guyatt GH. Users guide to the medical literature. VI. How to use an overview. JAMA 1994; 272:1367-1371. 13.-Richardson WS, Detsky AS. Users guide to the medical literature. VII. How to use a clinical decision analysis. A. Are the results of the study valid?. JAMA 1995; 273:1292-1295. 14.-Richardson WS, Detsky AS. Users guide to the medical literature. VII. How to use a clinical decision analysis. B. What are the results and will they help me in caring for my patients?. JAMA 1995; 273:1610-1612. 15.-Hayward RSA, Wilson MC, Tunis SR, Bass EB, Guyatt GH. Users guide to the medical literature. VIII. How to use clinical practice practice guidelines. A. Are recommendations valid?. JAMA 1995; 274:570-574. 16.-Guyatt GH, Sackett DL, Sinclair JC, Hayward R, Cook DJ, Cook RJ "Users guide to the medical literature. IX. A method for grading health care recommendations. JAMA 1995; 1800-1804.

154

XXXII MEDICINA BASADA EN EVIDENCIAS: ASPECTOS DEL ANALISIS CRITICO DE LA LITERATURA BIOMEDICA* Una importante masa de literatura relativa al tema da fundamento a la necesidad de ayudar al clnico a resolver el problema de reconocer lo posiblemente valioso dentro del inmenso volumen de material para leer y estudiar que se publica diariamente y su posterior aplicacin, si la tiene, a su prctica junto al enfermo y los suyos. Para que esto pueda ocurrir se requiere que el clnico est verdaderamente interesado en formar su propio criterio en independencia de la(s) opinin(es) de autoridades en la materia a analizar, incluyendo entre las ltimas eventuales personas o grupos que ofrezcan entregar digerida la posible solucin al problema. Se proponen , entonces,niveles de seleccin, el primero de los cuales correspondera a una rpida eliminacin de aquellos artculos que no cumplen ciertos principios mnimos para interesar al lector. Este dispone de escaso tiempo para dedicarlo a revisar artculos y es muy probable, adems, que no cuente con las destrezas que requiere un anlisis crtico completo. Debera ,entonces, adquirirlas a travs de un proceso educativo formal ,o en su defecto, tener la posibilidad de consultar aspectos especficos a quienes s cuenten con ellas Existen guas de orientacin que plantean la esperanza que cualquier interesado pueda usar la investigacin adecuadamente aunque no necesariamente la haga .No parece muy probable que quien no se haya involucrado en actividades de investigacin pueda cumplir

155

bien esa funcin. Como sea, se propone calificar los estudios de inters empleando ciertas pautas generales que en ocasiones, intentando facilitar la cuestin, dejan fuera algunos aspectos de muchsima significacin. Estos son usualmente del mbito de la metodologa y bioestadstica y tienen una naturaleza difcilmente soslayable, por lo que creemos deben ser agregados o, al menos aclarados en algunos casos, en las pautas respectivas. La primera seleccin de los artculos candidatos a ser leidos contempla detenerse brevemente en analizar: el ttulo, los autores, el resumen y el lugar donde fu efectuado( 2 ). Luego, segn el propsito de la investigacin ser catalogada en: estudio sobre terapia, sobre prueba diagnstica, evolucin y pronstico, dao y causalidad. En sta fase es donde se aplicarn pautas especiales confeccionadas para cada tipo de estudio y donde la nica revisin aceptable ser aquella completa. Enseguida indicaremos las observaciones que nos han parecido de inters segn naturaleza del estudio.Los comentarios o propuestas han tomado en cuenta el principio que es al menos tan importante disponer de los resultados numricos de la investigacin como de los procedimientos por los cuales sos valores fueron obtenidos. No en trminos generales sino ,a sta altura de la revisin, con todo el detalle necesario para descubrir la mejor evidencia.Este nivel de revisin no es necesariamente el ltimo, ya que se podra continuar tratando de obtener informacin no lograda por los autores, a travs del metanlisis Una advertencia a tomar en cuenta es que los items sealados para revisar no son los nicos sino los que se ha considerado necesario agregar o aclarar de aquellos propuestos por otros.Nos hemos limitado en esta oportunidad a las investigaciones sobre terapia o pronstico, pruebas diagnsticas y dao. Por ltimo, una adicin general a las guas de anlisis que consultan si se efectu o n un procedimiento o si se contempl o n algn factor ,etc.,es

156

sealar no slo si la accin se emprendi sino si fu bien efectuada.


ESTUDIOS SOBRE TERAPIA: OBSERVACIONES( Tabla 1)

Tabla 1
GUIA ADICIONAL PARA REVISION DE ARTICULOS SOBRE TERAPIA.
I.-SE ENCUENTRA DEFINIDO EL UNIVERSO Y EL PROCEDIMIENTO DE MUESTREO? II.-HAY UNA HIPTESIS CLARAMENTE PLANTEADA O AL MENOS FCILMENTE EXTRAIBLE DEL TEXTO?. III.-SE EXPRESA CUAL FUE EL PROCEDIMIENTO DE ASIGNACIN AL AZAR DE LOS INTEGRANTES DEL ESTUDIO,EN LOS GRUPOS RESPECTIVOS? ESTE ES CORRECTO?.FU EXITOSA LA ASIGNACIN AL AZAR? IV.-SE ESTABLECIO EL NIVEL DE ERROR ALFA DEL ESTUDIO? V.-SE ESTABLECI EL NIVEL DE ERROR BETA DEL ESTUDIO Y POR LO TANTO SU PODER? VI.-SE PLANTE UNA DIFERENCIA CLINICAMENTE IMPORTANTE DE DETECTAR? ESTA DIFERENCIA ES RAZONABLE? VII.-SE DETERMIN, ENTONCES, EL TAMAO DE LA MUESTRA A ESTUDIAR? ESTE ES APROPIADO?. VII.-SE EXPRESA CON CLARIDAD LA ESTADISTICA A APLICAR A LOS RESULTADOS? VIII.-LOS RESULTADOS FUERON ANALIZADOS EMPLEANDO LA ESTADSTICA PROPUESTA EN LA SECCIN MATERIAL Y MTODO? IX.-LA ESTADISTICA PROPUESTA ES APROPIADA A LA NATURALEZA DE LAS VARIABLES ANALIZADAS EN LA INVESTIGACIN?. X.-LOS DATOS PROPORCIONADOS EN LA SECCIN RESULTADOS PERMITEN QUE EL LECTOR REPRODUZCA LOS CLCULOS Y LOS VERIFIQUE?.

1.-El lector requiere saber no slo las caractersticas del conjunto de enfermos con la patologa que se investigar y en qu forma se constituy el grupo de estudio, sino una clara

157

definicin del Universo del que se extrajo la muestra y la tcnica de muestreo utilizada. 2.-La ausencia de una hiptesis, especialmente en un estudio experimental, donde un grupo recibir un tratamiento y otro un placebo u otro tratamiento, es una carencia particularmente seria. En ocasiones puede no estar tan claramente expresada pero del texto se deriva fcilmente. 3.-Con frecuencia los estudios sealan que los pacientes fueron asignados al azar para recibir los tratamientos A o B, pero no detallan el procedimiento. Por otra parte no es tan raro que se diga los pacientes fueron asignados a los grupos A y B segn orden de llegada (!).Es muy importante recordar que la asignacin al azar debe ser posteriormente comprobada para establecer si fue exitosa o n.En algunos estudios ello no es posible en todos los rubros de inters porque el tratamiento comienza inmediatamente despus de la asignacin de los pacientes, sin que se verifique que los grupos son comparables en el estado basal(por ejemplo, magnitud de prdidas por heces o por orina) debido a que ello puede tomar varias horas. 4.-Frecuentemente el error alfa es el nico que se indica y a veces no se le menciona, dando por establecido que debe estar en el valor 5%. 5.-El error beta y el poder o potencia del estudio no son comnmente discutidos en Material y Mtodo ,lo que significa que los autores realmente no tenan una idea clara de cuanto podan esperar de la investigacin. Cuando sta resulta negativa, a posteriori suele surgir el inters por conocer estos aspectos. El hacerlo anticipadamente seguramente ahorrara esfuerzo y dinero a muchos investigadores puesto que ,por citar un ejemplo, no pocos abandonaran la empresa al saber que la probabilidad de detectar lo buscado es de 40% ,v. gr.

158

6.-Una diferencia clnicamente importante de detectar debe haber sido planteada en forma explcita y antes de iniciar la investigacin.En algunas guas de anlisis la discusin de ste asunto se plantea a partir de los resultados, lo que no parece apropiado. Cuando en un estudio se encuentra que la diferencia buscada es mucho mayor que lo razonable, es posible pensar que primero se realiz el estudio y posteriormente, al redactarlo, fu necesario ajustar la mencionada diferencia y seguramente el error beta al tamao de la muestra, en se momento no modificable 7.-El tamao de la muestra debe estar apropiadamente fundamentado y ser comprobable por el lector interesado. 8.-La estadstica que se aplicar a los resultados debe encontrarse detallada en la seccin Material y Mtodo. No podrn ser aceptables expresiones como los resultados fueron sometidos a anlisis estadstico de significacin. Tampoco son aceptables las menciones al instrumento (computador) o programas estadsticos utilizados, sin mas explicacin. El que se haya utilizado un ordenador y un programa no es garanta de un anlisis correcto. 9.-Los mtodos estadsticos aplicados deben ser apropiados a la naturaleza de las variables en estudio. Mtodos no paramtricos deben ser usados ante variables de tipo nominal u ordinal. Esto no se respeta siempre y es as que no resulta sorprendente encontrar que en una serie de puntajes (scores) (variable ordinal) se emplea promedio, desviacin estndar y error estndar, donde lo apropiado sera mediana , rango, percentiles. 10.-En ocasiones el lector es sorprendido por el hecho que en el anlisis de los resultados se emplearon mtodos no previstos anteriormente.

159

11.-Los datos que se analizan en la seccin Resultados deben ser presentados de modo que el lector interesado pueda verificar por si mismo las operaciones principales. A lo dicho es necesario agregar que el lector debe poder interpretar algunos resultados, como por ejemplo: En un estudio hipottico, propuesto como ensayo clnico en dos grupos de 100 pacientes, donde cada uno recibe los tratamientos A o B, se encontr que la proporcin de fallecidos fue 20% en el grupo control y 15% en el experimental. Naturalmente p tena que ser > 0.0 5 si se tiene presente que una diferencia clnicamente significativa de 15% con un error alfa de 5% y beta de 20%( cifras de uso relativamente comn) y por tanto una potencia del estudio de 80% requiere una muestra de 304 casos(152 por grupo)( 8 ). En la situacin comentada, para condiciones como las sealadas pero con una diferencia de solo 5%, se requerira mas de 800 casos por grupo para tener una razonable probabilidad de detectar esa diferencia. Ese estudio con 100 casos por grupo tena un poder inferior a 50% para detectar como significativa la diferencia de 5%

ESTUDIOS SOBRE PRUEBAS DIAGNOSTICAS: OBSERVACIONES (Tabla 2 )

Tabla 2
GUIA ADICIONAL PARA PRUEBAS DIAGNSTICAS REVISIN DE ARTICULOS SOBRE

I.-HAY FUNDAMENTO PARA LA ELECCIN DEL ESTANDAR IDEAL PROPUESTO? II.-LOS RESULTADOS DE LA APLICACIN DEL ESTANDAR IDEAL SON DICOTMICOS? III.-SE DEFINI EL UNIVERSO Y EL PROCEDIMIENTO DE MUESTREO? IV.-SE DA UNA JUSTIFICACION DEL TAMAO MUESTRAL? V.-HAY EVIDENCIAS QUE SE ENCUENTRA BIEN REPRESENTADO EL

160
ESPECTRO DE LA ENFERMEDAD EN ESTUDIO, TANTO CUALITATIVA COMO CUANTITATIVAMENTE? VI.-LOS CASOS CON Y SIN LA PATOLOGA DE INTERES SON RECONOCIBLES PREVIO A LA APLICACIN DEL ESTANDAR IDEAL? VII.-SE PRESENTA LA RESPECTIVA TABLA 2 X 2 O 2 X n CON LOS VALORES CORRESPONDIENTES QUE PERMITAN CALCULAR LOS INDICES ESCOGIDOS? VIII.-SE PROPORCIONAN LOS INTERVALOS DE CONFIANZA DE LOS NDICES, CUANDO CORRESPONDE?

1.-La eleccin del estndar ideal es un asunto crucial en la evaluacin de una prueba diagnstica. Es claro que para muchas entidades patolgicas est perfectamente definido cual debera emplearse para probar una prueba diagnstica .Sin embargo, en otras ocasiones la situacin no es tan clara, dejando un margen mas o menos amplio para que el investigador decida.Aqu es donde se puede cometer un error de magnitud. 2.-En cualquier estudio donde el estndar ideal clasifique los pacientes en mas de 2 grupos(con y sin la patologa de inters), se podr estar seguro que aquel no era el adecuado. 3.-Es muy importante que el Universo del cual se extraer la muestra a estudiar sea perfectamente definido. Es claro que la situacin ser muy diferente si se realiza la investigacin en poblacin general, consultorio externo o en consultorio de especialidad o an en hospitalizados. 4.-El estudio de una prueba diagnstica no se realiza con cualquier cifra de casos. Por ello es esperable que los autores den una adecuada justificacin al nmero de integrantes de la muestra a estudiar. Imaginemos que una prueba diagnstica se estudi en un conjunto de 620 nios. A primera vista puede parecer muy adecuado. Sin embargo se origin la siguiente tabla(Tabla 3).

161

Tabla 3.
TAMAO DE LA MUESTRA EN ESTUDIO DE DIAGNSTICAS. IMPORTANCIA DE LA PREVALENCIA. PRUEBAS

Estndar Ideal Enfermedad Presente ausente (+) 19 50 P.Diagnstica (-) 1 550 620 95% 91,6% 27,5% 99,8% 11,4 IC 95% :73,0-

Sensibilidad 99,7 Especificidad :89,0-93,7 Valor predictivo positivo :17,8-39,8 Valor predictivo negativo :98,8-99,9 Razones de verosimilitud: LR(+) LR(-) 0,054

----------------------------------------------------------------------------------------------IC 95% =Intervalo de confianza del 95%. De acuerdo con Fleiss.

Debido a una prevalencia notablemente baja, (20/620 = 3,22%) el grupo que segn el estndar ideal se encuentra afectado por la patologa de inters es muy reducido y el intervalo de confianza de la Sensibilidad y del Valor predictivo positivo es particularmente amplio. Si la escasa prevalencia refleja la situacin de la patologa en el universo donde se aplicar la prueba, bien. Pero, si ello no es as y la prevalencia mas probable de encontrar es francamente mayor, las cifras

162

de los valores predictivos cambiarn mucho. El probar una prueba diagnstica, entonces, sin tener una idea aproximada de la prevalencia puede resultar en un serio problema si la muestra es pequea porque los casos con la patologa de inters sern francamente insuficientes. Ello no ocurre cuando el investigador estructura la muestra con una prevalencia que l maneja. Ello no es necesariamente recomendable, puesto que lo realmente importante de esto es conocer la prevalencia (probabilidad pre-prueba) en el conjunto donde se aplicara en definitiva la prueba. 5.-Es muy importante tener presente que la prueba diagnstica debe ser capaz de diferenciar quienes se encuentran afectados por la patologa de inters de aquellos no estn en sa situacin, a partir de un conjunto formado por casos con la patologa y sin ella pero que bien pudieran tenerla. Estos ltimos no son ,entonces, personas reconocidamente sanas.Los afectados debern tener adecuadamente representado, cualitativamente y cuantitativamente el espectro completo de la patologa en estudio.. 6.-Si antes de aplicar el estndar ideal se sabe quienes no tienen la patologa en estudio, se est cometiendo un serio error,como se adelant en el punto anterior. 7.-Es posible que un investigador no desee hacer referencia a todos los ndices (fijos y variables)que caracterizan las condiciones de operacin de una prueba diagnstica pero debe proporcionar los datos numricos que permitan su clculo por el lector interesado.Son ndices caractersticos Sensibilidad , Especificidad, Valor predictivo positivo, Valor predictivo negativo, Prevalencia y Validez. Las Razones de Verosimilitud(likelihood ratios) proporcionan informacin nueva bsicamente cuando el resultado de la prueba diagnstica no genera resultados dicotmicos.

163

8.-La entrega de los intervalos de confianza de los principales ndices aclarar al lector la verdadera situacin de ellos en relacin al tamao de la muestra y cuanta de los ndices. En la Tabla 4 se detalla un ejemplo.

Tabla 4.
INTERVALOS DE CONFIANZA DE LOS INDICES EN ESTUDIOS DE PRUEBAS DIAGNSTICAS.

Estndar Ideal Enfermedad (+) (-) (+) 10 Prueba Diagnstica (-) Sensibilidad 57,1 - 99,5 Especificidad: 58,7 - 92,4 Valor predictivo 38,7 - 87,0 90,9% 1 IC 20 36 95% 80,0% positivo: 66,66 5

164

Valor predictivo negativo: 95,2% 74,1 - 99,7 Razones de verosimilitud: LR(+) :4,54 LR(-): 0,11 Prevalencia(probabilidad pre.prueba):30,5% ----------------------------------------------------------------------------------------------IC 95% = Intervalo de confianza del 95%.De acuerdo con Fleiss.

Es posible ver que la Sensibilidad verdadera (cuya estimacin ha sido 90,9%)se encuentra con un 95% de probabilidad entre cifras tan diferentes como 57,1 y 99,5% y que el valor predictivo positivo puede corresponder a una cifra entre 38,7,0 y 87,0%. Es muy importante, entonces, que los autores informen sobre los intervalos de confianza. Agregaremos que al comparar numeradores con denominadores en las LR del ejemplo encontramos que la probabilidad que los resultados fueran explicados por el azar result inferior a 5% en ambos casos.

ESTUDIOS SOBRE DAO.


OBSERVACIONES (Tabla 5).

Tabla 5.
GUIA ADICIONAL PARA ESTUDIO DE ARTICULOS SOBRE DAO.
I.-SE DEFINIO ADECUADAMENTE EL UNIVERSO Y EL PROCEDIMIENTO DE MUESTREO? II.-FUE BIEN ESCOGIDO EL TIPO DE ESTUDIO?

165
III.-ESTA EXPRESADA LA HIPTESIS SOMETIDA A VERIFICACIN? IV.SE DEFINIERON LOS NIVELES DE ERROR ALFA,BETA,DIFERENCIA CLINICAMENTE SIGNIFICATIVA,RIESGO RELATIVO(RR) U ODDS RATIO(RAZN DE VENTAJA(OR) DIGNO DE DETECTAR Y TAMAO DE LA MUESTRA? V.-ESCOGE ADECUADAMENTE LOS ESTADIGRAFOS RR U OR, CUANDO CORRESPONDE, PARA EL ESTUDIO? VI.-HAY EVIDENCIAS QUE SE TOMARON MEDIDAS TENDIENTES A EVITAR SESGOS ? VII.-HAY EVIDENCIAS QUE SE PRACTIC CONTROL DE CONFUNDIDORES?.

1.-Ya sea que se escogi efectuar un ensayo clnico controlado randomizado, un estudio de cohortes o uno caso-control,ser de mxima importancia informar sobre el universo origen de la muestra. Probablemente el diseo donde es mas probable cometer un error de magnitud es en el caso-control ya en los inicios, al configurar los grupos de casos y controles. 2.-Aqu es importante que el lector evale apropiadamente la eleccin que hicieron los autores del tipo de diseo, no dando por establecido que aquella fue correcta. Como es fcil imaginar, serios problemas ticos pueden acompaar a un ensayo clnico controlado para detectar dao. 3.-De lo comentado anteriormente, parece innecesario enfatizar la importancia de haber planteado adecuadamente la hiptesis que ser sometida a verificacin. 4.-Las caractersticas bsicas del estudio escogido deben estar establecidas y justificado el tamao de la muestra. 5.-La eleccin de los estadgrafos Riesgo Relativo(RR) y Odds Ratio(Razn de ventaja)(OR) parece sencilla, sin embargo no pocos errores se cometen en ste sentido, como por ejemplo usando OR cuando corresponde RR Recordaremos que OR proporciona una aproximacin al riesgo relativo cuando se trata de entidades que tienen una muy baja prevalencia. 6.-La cantidad de sesgos que pueden afectar estos estudios, en especial aquellos diseos caso - control son numerosos, de

166

modo que los autores deben dar cuenta de las medidas tomadas para evitar ,al menos, los principales. 7.-En el anlisis de los resultados se establecern los posibles confundidores presentes y las medidas de control adoptadas.

GUAS DE ANLISIS REVISADAS. Ahora presentaremos las guas de anlisis de artculos con los cambios sugeridos.
GUIA PARA REVISIN DE ARTICULOS SOBRE TERAPIA.
I.-SE ENCUENTRA DEFINIDO EL UNIVERSO Y EL PROCEDIMIENTO DE MUESTREO? II.-HAY UNA HIPTESIS CLARAMENTE PLANTEADA O AL MENOS FCILMENTE EXTRAIBLE DEL TEXTO?. III.-FUERON LOS PACIENTES EN LOS TRATAMIENTOS, ASIGNADOS AL AZAR? III.-SE EXPRESA CUAL FUE EL PROCEDIMIENTO DE ASIGNACIN AL AZAR DE LOS INTEGRANTES DEL ESTUDIO,EN LOS GRUPOS RESPECTIVOS? ESTE ES CORRECTO?.FU EXITOSA LA ASIGNACIN AL AZAR? IV.-SE ESTABLECIO EL NIVEL DE ERROR ALFA DEL ESTUDIO? V.-SE ESTABLECI EL NIVEL DE ERROR BETA DEL ESTUDIO Y POR LO TANTO SU PODER? VI.-SE PLANTE UNA DIFERENCIA CLINICAMENTE IMPORTANTE DE DETECTAR? ESTA DIFERENCIA ES RAZONABLE? VII.-SE DETERMIN, ENTONCES, EL TAMAO DE LA MUESTRA A ESTUDIAR? ESTE ES APROPIADO?. VIII.-SE EXPRESA CON CLARIDAD LA ESTADISTICA A APLICAR A LOS RESULTADOS? IX.-LOS RESULTADOS FUERON ANALIZADOS EMPLEANDO LA ESTADSTICA PROPUESTA EN LA SECCIN MATERIAL Y MTODO? X.-LA ESTADISTICA PROPUESTA ES APROPIADA A LA NATURALEZA DE LAS VARIABLES ANALIZADAS EN LA INVESTIGACIN?. XI.-LOS DATOS PROPORCIONADOS EN LA SECCIN RESULTADOS PERMITEN QUE

167
EL LECTOR REPRODUZCA LOS CLCULOS Y LOS VERIFIQUE? XII.-FUERON EVALUADOS AL FINAL DEL ESTUDIO TODOS LOS PACIENTES QUE INGRESARON? XIII.-FUERON INFORMADOS TODOS LOS HECHOS CLNICOS DE INTERS? XIV.-LOS PACIENTES ESTUDIADOS SON SIMILARES A LOS QUE USTED ATIENDE?. XV.-EL TRATAMIENTO QUE SE PROPONE ES UTILIZABLE EN SU PRCTICA CLNICA?.

GUIA PARA REVISIN DIAGNSTICAS

DE

ARTICULOS

SOBRE

PRUEBAS

I.-CUAL ES EL OBJETIVO DE LA PRUEBA? II.-HAY UN ESTANDAR DIAGNSTICO IDEAL? III.-HAY FUNDAMENTO PARA LA ELECCIN DEL ESTANDAR IDEAL PROPUESTO? IV.-LOS RESULTADOS DE LA APLICACIN DEL ESTANDAR IDEAL SON DICOTMICOS? V.-SE DEFINI EL UNIVERSO Y EL PROCEDIMIENTO DE MUESTREO? VI.-SE DA UNA JUSTIFICACION DEL TAMAO MUESTRAL? VII.-HAY EVIDENCIAS QUE SE ENCUENTRA BIEN REPRESENTADO EL ESPECTRO DE LA ENFERMEDAD EN ESTUDIO, TANTO CUALITATIVA COMO CUANTITATIVAMENTE? VIII.-SE INCLUYERON PACIENTES CON Y SIN LA ENFERMEDAD EN ESTUDIO PERO CON CLNICA SIMILAR? IX.-LOS CASOS CON Y SIN LA PATOLOGA DE INTERES SON RECONOCIBLES PREVIO A LA APLICACIN DEL ESTANDAR IDEAL? X.-SE EFECTU UNA COMPARACIN INDEPENDIENTE Y CIEGA CON EL ESTNDAR DIAGNSTICO IDEAL? XI.-SE DESCRIBI EL MEDIO DONDE SE DASARROLL EL ESTUDIO Y EL FILTRO POR EL QUE PASARON LOS CASOS? XII.-SE DESCRIBI LA REPRODUCIBILIDAD DE LA PRUEBA(PRECISIN) Y DE SU INTERPRETACIN(CONCORDANCIA INTEROBSERVADOR)? XIII.-SE DEFINI CLARA Y ADECUADAMENTE EL TRMINO NORMAL? XIV.-SE PRESENTA LA RESPECTIVA TABLA 2 X 2 O 2 X n CON LOS VALORES CORRESPONDIENTES QUE PERMITAN CALCULAR LOS INDICES ESCOGIDOS?

168
XV.-SE PROPORCIONAN LOS INTERVALOS DE CONFIANZA DE LOS NDICES, CUANDO CORRESPONDE? XVI.-SI LA PRUEBA ES PARTE DE UN GRUPO O SECUENCIA DE PRUEBAS, SE DETERMIN SU CONTRIBUCIN A LA VALIDEZ GLOBAL? XVII.-LA PRUEBA ESTA SUFICIENTEMENTE DESCRITA COMO PARA REPRODUCIRLA? XVIII.-SE ESTABLECI LA UTILIDAD DE LA PRUEBA?

GUIA PARA REVISIN DE ARTICULOS SOBRE DAO.


I.-SE DEFINIO ADECUADAMENTE EL UNIVERSO Y EL PROCEDIMIENTO DE MUESTREO? II.-FUE BIEN ESCOGIDO EL TIPO DE ESTUDIO? III.-ESTAN CLARAMENTE IDENTIFICADOS LOS GRUPOS A COMPARAR Y SON SIMILARES EN CUANTO A DETERMINANTES DE OTROS DESENLACES, ADEMS DEL DE INTERS? IV.-ESTA EXPRESADA LA HIPTESIS SOMETIDA A VERIFICACIN? V.SE DEFINIERON LOS NIVELES DE ERROR ALFA,BETA,DIFERENCIA CLINICAMENTE SIGNIFICATIVA,RIESGO RELATIVO(RR) U ODDS RATIO(RAZN DE VENTAJA(OR) DIGNO DE DETECTAR Y TAMAO DE LA MUESTRA? VI.-ESCOGE ADECUADAMENTE LOS ESTADIGRAFOS RR U OR, CUANDO CORRESPONDE, PARA EL ESTUDIO? VII.-EL DESENLACE Y LA EXPOSICIN FUERON MEDIDOS DE IGUAL MANERA EN LOS GRUPOS INVESTIGADOS?. VIII.-EL SEGUIMIENTO PUEDE CONSIDERARSE SUFICIENTEMENTE LARGO Y COMPLETO? IX.-LA RELACIN TEMPORAL ES CORRECTA? X.-HAY UNA GRADIENTE DOSIS-RESPUESTA? XI.-LA ASOCIACIN ENTRE EXPOSICIN Y RESULTADO ESPERADO ES

169
FUERTE?. XII.-LA ESTIMACIN DEL RIESGO DE OCURRENCIA DE DAO ES PRECISA? XIII.-LOS RESULTADOS DEL ESTUDIO SON APLICABLES A SU PRCTICA? XIV.-LA MAGNITUD DEL RIESGO ES IMPORTANTE? XV.-HAY EVIDENCIAS QUE SE TOMARON MEDIDAS TENDIENTES A EVITAR SESGOS ? XVI.-HAY EVIDENCIAS QUE SE PRACTIC CONTROL DE CONFUNDIDORES?. XVII.-SE DEBER DETENER LA EXPOSICIN EN VISTA DE LOS HALLAZGOS?

Referencias
- Oxman AD, Sackett DL, Guyatt GH. User`s guide to the medical literature. I. How to get started. JAMA, 1993;270:2093-2095. - Calva JJ, Ponce de Len S, Vargas F. Cmo leer revistas mdicas. Rev Invest (Mxico) 1988;40:65-106 - Guyatt GH,Sackett DL,Cook DJ. User`s guides to the medical literature.II. How to use an article about therapy or prevention. A. Are the results of the study valid? JAMA,1993;270:2598-2601. -Guyatt GH, Sackett DL, Cook DJ. User`s guides to the medical literature.II. How to use an article about therapy or prevention.B. What were the results and will they help me caring for my patients. JAMA, 1994;271:59-63. - Jaeschke R, Guyatt GH, Sackett DL. User`s guide to the medical literature.III. How to use an article about a diagnostic test. A. Are the results of the study valid?. JAMA 1994;271:389-391. - Jaeschke R, Guyatt GH, Sackett DL. User`s guide to the medical literature.III. How to use an article about a diagnostic test. B. What are the results and will they help me in caring for my patients?. JAMA 1994;271:703-707. - Duffau G. Estadstica en el Programa EPIINFO 6.0 Rev Chil Pediatr 1995;66: 341-344

170

- Fleiss JL. Statistical methods for rates and proportions.2nd Edition, J Wiley & Sons, New York.1981: 140-151. - Duffau G. Estndar ideal imperfecto y variable. Rev Chil Pediatr 1996;67:125-126. - Herrera P, Duffau G. Pruebas diagnsticas:Algunos aspectos cuantitativos para su desarrollo e interpretacin. Rev Chil Pediatr 1995;66:335-340. -Duffau G. Tabla de 2 x 2 en el anlisis de pruebas diagnsticas por razones de verosimilitud y otros usos. Rev Chil Pediatr 1997;68:194-203 -Herrera P, Duffau G. El diseo caso-control.Una introduccin para mdicos clnicos. Publicaciones tcnicas Mediterrneo Ltda.Santiago de Chile 1997:19-45. -Levine M, Walter S, Lee H, Haines T. User`s guides to the medical literature.IV. How to use an article about harm. JAMA 1994;271:1615-1619.

XXXIII DETERMINACION DEL GRADO DE ACUERDO ENTRE DOS METODOS DE MEDICION CLINICA. Este captulo describe un procedimiento apropiado para decidir en que medida un examen -generalmente de laboratorio-puede ser sustituido por otro nuevo que ofrezca ventajas interesantes. La situacin ideal podra definirse como aquella en que ambos arrojan el mismo resultado frente

171

a un caso clnico.Esto, naturalmente , no es esperable que ocurra sino ocasionalmente.Los estudios de concordancia se aplican mas bien al anlisis de situaciones en que observadores clasifican a pacientes en varias opciones mas que valores numricos individuales.As, por ejemplo, si va a comparar el desempeo de dos clnicos para decidir quienes de un grupo de pacientes tienen o no una determinada manifestacin, utilizar un anlisis de concordancia. Pero si en el grupo de pacientes dispone para cada uno de ellos de dos resultados de un exmen ,uno realizado por un mtodo nuevo y el otro por el tradicionalmente empleado y desea saber si es apropiado instaurar el mtodo nuevo en reemplazo del habitual, le conviene recurrir al procedimiento sugerido por Bland y Altman en 1985. Antes de entrar en l , mencionaremos que un error comn es considerar como apropiado el efectuar un estudio de correlacin entre los datos disponibles.En ste sentido debemos recordar que: 1.-el coeficiente de correlacin mide la fuerza de una relacin entre dos variables y no el grado acuerdo entre ellas.El acuerdo slo es perfecto si r es igual a uno y la recta pasa por el origen en 45 grados. Sin embargo r es igual a uno para cualquier recta donde caigan todos los puntos. 2.-la correlacin depende del rango numrico en el que se extiende la variable. Mientras mayor sea el rango, mas probable es encontrar una buena correlacin. 3.-una prueba de hiptesis puede mostrar que los dos mtodos estn relacionados.Lo raro sera que no resultase as entre dos mtodos diseados para medir lo mismo. 4.-claramente un conjunto de datos puede mostrar pobre grado de acuerdo y sin embargo un significativo coeficiente de correlacin. En el mtodo de Bland y Altman se grafica la diferencia promedio de los dos procedimientos y su desviacin estndar, de modo que el 95% de las diferencias encontradas queda comprendida en los lmites dados por promedio mas menos 1,96 DE. El mdico deber decidir hasta que grado de discrepancia podr ser tolerable de encontrar y adems en el grfico ver cuantos casos caen fuera de los lmites

172

tolerables.Se podr inferir la situacin en el universo del que procede la muestra calculando el error estndar del promedio de diferencias

Rc(DE/n)
donde DE es desviacin estndar y n es tamao de la muestra. Y tambin el error estndar del lmite superior e inferior promedio de diferencias mas menos 1,96 DE, cuyo valor es

Rc(3DE/n)

Rc=raiz cuadrada

173

XXXIV. Anexo: Probabilidades de Ji cuadrado segn grados de libertad y valor del estadgrafo
Valor de Ji cuadrado 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.82 3.84 3.86 3.88 3.9 4.0 4.1 4.2 4.3 4.4 4.5 Valor de Ji cuadrado 4.9 5.0 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6.0 6.1 6.2 6.3 6.4 6.5 6.6 6.63 6.64 6.66 7.0 7.1 7.2 7.3 7.4 7.5 7.6 7.7

A = 1 grado de libertad

p 0.1572 0.1472 0.1380 0.1293 0.1213 0.1138 0.1068 0.1003 0.0942 0.0880 0.0832 0.0782 0.0736 0.0692 0.0651 0.0610 0.0577 0.0544 0.0512 0.0506 0.0500 0.0494 0.0488 0.0482 0.0455 0.0428 0.0404 0.0381 0.0359

p 0.0268 0.0253 0.0239 0.0225 0.0213 0.0201 0.0190 0.0179 0.0169 0.0160 0.0151 0.0143 0.0135 0.0127 0.0120 0.0114 0.0107 0.0101 0.0100 0.0099 0.0098 0.0081 0.0077 0.0072 0.0068 0.0065 0.0061 0.0058 0.0055

174 4.6 4.7 4.8 0.0338 0.0319 0.0301 0.0284 7.8 8.0 9.0 10.0 0.0052 0.0046 0.0026 0.0015

B = 2 grados de libertad Valor de Ji cuadrado 4.0 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 5.99 6.0 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 7.0 p 0.1353 0.1287 0.1224 0.1164 0.1108 0.1053 0.1002 0.0953 0.0907 0.0862 0.0820 0.0780 0.0742 0.0762 0.0672 0.0639 0.0608 0.0578 0.0550 0.0523 0.0500 0.0497 0.0473 0.0450 0.0428 0.04707 0.0387 0.0368 0.0350 0.0333 0.0317 0.0301 Valor de Ji cuadrado 7.0 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 8.0 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 9.0 9.1 9.2 9.3 9.4 9.5 10.0 10.5 11.0 12.0 13.0 13.5 13.70 p 0.0.287 0.0273 0.0259 0.0247 0.0235 0.0223 0.0212 0.0202 0.0192 0.0183 0.0174 0.0165 0.0157 0.0149 0.0142 0.0135 0.0129 0.0122 0.0119 0.0111 0.0105 0.0100 0.0095 0.0090 0.0086 0.0067 0.0052 0.0040 0.0024 0.0015 0.0011 0.0010

175

C= 3 grados de libertad Valor de Ji cuadrado 5.0 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 6.0 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 7.0 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.81 7.814 7.82 7.9 8.0 P 0.1717 0.1646 0.1577 0.1511 0.1447 0.1386 0.1327 0.1271 0.1217 0.1116 0.1068 0.1022 0.0978 0.0936 0.0896 0.0858 0.0821 0.0785 0.0751 0.0718 0.0687 0.0657 0.0629 0.0601 0.0575 0.0550 0.0526 0.0503 0.0501 0.0500 0.0498 0.0481 0.0460 Valor de Ji cuadrado 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.9 9.9 10.0 10.1 10.2 10.3 10.4 10.5 10.6 10.7 10.8 10.9 11.0 11.1 11.2 11.3 11.34 P 0.0439 0.04220 0.0402 0.0384 0.0367 0.0351 0.0335 0.0320 0.0306 0.0279 0.0267 0.0255 0.0244 0.0233 0.0222 0.0212 0.0203 0.0194 0.0185 0.0177 0.0169 0.0161 0.0154 0.0147 0.0140 0.0134 0.0128 0.0122 0.0117 0.0111 0.0106 0.0102 0.0100

176

D= 4 grados de libertad Valor de Ji cuadrado 7.0 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 8.0 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 9.0 9.1 9.2 9.3 9.4 9.45 9.485 9.49 9.5 9.6 9.7 9.8 9.9 P 0.1358 0.1256 0.1208 0.1162 0.1117 0.1073 0.1032 0.0991 0.0953 0.0915 0.0879 0.0845 0.0811 0.0779 0.0748 0.0719 0.0690 0.0682 0.0636 0.0610 0.0586 0.0582 0.0540 0.0518 0.0507 0.0500 0.0499 0.0497 0.0477 0.0457 0.0439 0.0421 Valor de Ji cuadrado 10.0 11.0 12.0 13.0 13.1 13.2 13.27 13.28 13.3 13.5 14.0 15.0 16.0 17.0 18.45 P 0.0404 0.0265 0.0173 0.0112 0.0107 0.0103 0.0100 0.0099 0.0098 0.0090 0.0072 0.0047 0.0030 0.0019 0.0010

177

Distribucin Normal Area desde - c hasta + c


c DE 0,50 0,60 0,70 0,80 0,90 1,00 1,10 1,20 1,30 1,40 1,50 1,60 1,70 1,80 1,90 1,96 2,00 2,10 2,20 2,30 2,40 2,50 2,60 2,70 2,80 2,90 3,00 Area 0,3829 0,4515 0,5160 0,5762 0,6318 0,6829 0,7286 0,7698 0,8064 0,8384 0,8664 0,8904 0,9108 0,9281 0,9226 0,9500 0,9545 0,9643 0,9722 0,9785 0,9836 0,9876 0,9907 0,9931 0,9949 0,9962 0,9973

178

Distribucin Normal Area desde - infinito hasta c


o

+c
c -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 -0,2 -0,1 0,0 + + + + + + + + + + + + + + Area 0,001 0,006 0,022 0,066 0,158 0,308 0,420 0,460 0,500 0,1 0,539 0,2 0,579 0,3 0,617 0,4 0,655 0,5 0,691 0,6 0,725 0,7 0,758 0,8 0,788 0,9 0,815 1,0 0,841 1,5 0,933 2,0 0,977 2,5 0,993 3,0 0,998

179

Distribucin de Student.
Grados de libertad 0,05 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 1,812 1,753 1,724 1,708 1,697 1,689 1,683 1,679 1,675 1,673 1,670 1,668 1,666 1,665 1,664 1,663 1,662 2,22 2,131 2,086 2,059 2,042 2,030 2,021 2,014 2,008 2,004 2,000 1,997 1,994 1,992 1,990 1,988 1,986 Valor crtico de t para p = Unilateral Bilateral

V1 y V2 = Grados de libertad p = 0,05 V1 V2 10 20 30 40 50 60 2,97 2,34 2,16 2,07 2,02 10 2,77 2,12 1,93 1,83 1,78 20 2,69 2,04 1,84 1,74 1,68 30 2,66 1,99 1,79 1,69 1,63

Distribucin F

40 2,63 1,96 1,76 1,66 1,59

50 2,62 1,94 1,73 1,63 1,57

60 2,61 1,93 1,72 1,62 1,55

70 2,60 1,92 1,71 1,60 1,54

80 2,58 1,90 1,69 1,59 1,52

100

1,99 1,74 1,65 1,59 1,56 1,53 1,52 1,50 1,48

180 70 80 90 100 110 120 130 140 150 1,96 1,95 1,93 1,92 1,72 1,70 1,68 1,67 1,62 1,60 1,58 1,57 1,56 1,54 1,53 1,51 1,53 1,51 1,49 1,48 1,50 1,48 1,46 1,45 1,48 1,46 1,44 1,43 1,42 1,41 1,40 1,39 1,38 1,47 1,45 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,45 1,43 1,40 1,39 1,38 1,37 1,36 1,35 1,34

1,92 1,66 1,56 1,50 1,46 1,44 1,91 1,6581,55 1,49 1,45 1,43 1,90 1,6511,5471,4871,4481,42 1,8981,6461,5401,4801,4411,41 1,8941,6411,53 1,47 1,43 1,40

Referencias.
-Duffau G. Notas de Estadstica. Rev Pediatra(Santiago) 1993,33.28 - 49. -Welch BL. Introduction to statistics, in: Scientific tables, 8th edition ,Basle, Geigy, 1982: 209. -Fleiss JL. Statistical Methods for Rates and Proportions. 2nd Edition, J Wiley & sons, New York, 1981:14-151. -LAMOTTE M. Estadstica biolgica. Barcelona: Toray - Masson S. A., 1965: 83-156

XXXV COMENTARIOS EDITORIALES. Duffau G. Antiglosario(Editorial). Rev Pediatra(Santiago) 1990;33:121-122. Duffau G. Abreviaciones (Editorial). Rev Pediatra (Santiago) 1990;33:65-66. Duffau G. Falta por omisin (Editorial). Rev Pediatra (Santiago) 1990;33:183 Duffau G. Presentar y publicar o slo presentar? Rev Pediatra (Santiago) 1991;34:3-4.

181

Duffau G. Slo publicar! Rev Pediatra(Santiago) 1991; 34:135. Duffau G. Preparacin de escritos.(Editorial). Rev Pediatra(Santiago)1991;34:195. Duffau G. + Qu?.(Editorial) Rev Pediatra (Santiago) 1992;35: 67 Duffau G. Significacin, diferencia, tendencia. (Editorial). Rev Pediatra (Santiago) 1992;35: 3. Duffau G. Resmenes de trabajos.(Editorial) Rev Pediatra (Santiago) 1992; 35:123. Duffau G. Que Estadstica?(Editorial). Rev Pediatra (Santiago) 1993;36:67 Duffau G. Casos clnicos.(Editorial). Rev Pediatra (Santiago) 1993;36:121 Duffau G. Cursos, Seminarios, Talleres y otros. (Editorial). Rev Pediatra (Santiago) 1994;37:3. Duffau G. Congresos y Jornadas.(Editorial). Rev Pediatra(Santiago) 1996;39:63. Duffau G. Diseo de la investigacin biomdica. (Editorial) Rev Chil Pediatr 1997;68:1-2 Duffau G. Evaluacin de la investigacin en el curriculum individual.(Editorial) Rev Pediatra (Santiago) 1999;42:56-57.

182

XXXVI ELEMENTOS INTEGRANTES DE UNA PROPUESTA DE PROYECTO DE INVESTIGACION. Los proyectos de investigacin en esencia contienen todos los mismos datos, aunque , dependiendo de la institucin ante la cual ser presentado , las exigencias pueden variar un poco, enfatizando aspectos distintos. 1.-TITULO DEL PROYECTO 2.-INVESTIGADORES: PRINCIPAL O RESPONSABLE COINVESTIGADORES. NORMALMENTE ,SE DEBE NOMBRAR UN COINVESTIGADOR COMO AQUEL QUE TOMARA LA DIRECCIN DEL PROYECTO SI FALTARE POR ALGUN MOTIVO EL INVESTIGADOR PRINCIPAL COLABORADORES.

183

3.-CARTA DEL COMIT DE ETICA QUE CORRESPONDA Y FORMATO DE SOLICITUD DE CONSENTIMIENTO INFORMADO. 4.-RESUMEN DEL PROYECTO 5.-INVESTIGACION PROPUESTA FORMULACION GENERAL DEL PROYECTO HIPOTESIS DISCUSION BIBLIOGRAFICA OBJETIVOS ESPECIFICOS METODOLOGIA: TIPO DE DISEO UNIVERSO, UNIVERSO MUESTRAL TAMAO DE LA MUESTRA. JUSTIFICACION. METODOS DE ANALISIS. PLAN DE TRABAJO 6.-DURACION DE LA INVESTIGACION 7.-CRONOGRAMA DEL PROYECTO. 8.-RECURSOS DISPONIBLES 9.-RECURSOS SOLICITADOS 10.-TRABAJO ADELANTADO POR LOS AUTORES DEL PROYECTO. 11.-DATOS CURRICULARES DE LOS INVESTIGADORES. XXXVII

Validez y tica de la investigacin clnica.


Las caractersticas que definen una investigacin ticamente satisfactoria corresponden a lo que en trminos muy generales podra entenderse como bien hecha y cumpliendo los requisitos generalmente exigidos. Sin embargo, importantes aspectos se pueden escapar a una visin panormica del asunto y aunque no se escapen y se conozcan , no siempre se da a cada uno la importancia que realmente tiene. En ste sentido se puede decir que son reconocidos siete requisitos aquellos que involucra una investigacin clnica bien hecha desde un punto de vista tico(1):

184

1.-Valor cientfico o social, 2.-Validez, 3.-Seleccin equitativa de los sujetos de experimentacin, 4.-Relacin riesgo / beneficio favorable, 5.-Revisin independiente, en la etapa de proyecto, 6.-Consentimiento informado, 7.-En todo momento, respeto por los sujetos enrolados en el estudio. El anlisis del cumplimiento de estos requisitos, en la etapa de proyecto de investigacin ha sido descrito en un importante documento del Ministerio de Salud (2) donde se establece la necesidad de la existencia de comits de Evaluacin Etico-Cientfico Institucional.La separacin conceptual de lo cientfico y lo tico no parece apropiado, en ste punto, porque puede conducir y conduce al anlisis por diferentes comits de un mismo problema: establecer si es tico un estudio que est en el carcter de propuesta. De los requisitos mencionados es frecuente que se tenga particularmente presente el consentimiento informado, muchas veces como si fuese ste el nico o al menos el mas importante de ellos. Acuerdos internacionales establecen que nadie podr ser sometido sin su libre consentimiento a experimentos mdicos o cientficos. Pero, naturalmente, esto en ocasiones puede ser interpretado en el sentido que es suficiente con el consentimiento informado. Claramente ello no es as y el investigador debe cumplir con las otras 6 exigencias, sin excusa. Como sea, de los 7 rubros a considerar, probablemente el menos autoexplicativo sea el referido a la validez de la investigacin. Esta se debe entender como la medida en que los resultados de la investigacin se acercan a la verdad. Puesto que la verdad no es

185

conocida, la validez estar dada efectuado ajustndose al rigor

por el nivel de rigurosidad de la metodolgico, no puede ser

metodologa empleada. Entonces, un estudio que no ha sido considerado tico. Esto, en trminos generales aparece como satisfactorio pero yendo a lo concreto mismo, no es comn que se cuestione un estudio, por ejemplo, porque los autores escogieron un riesgo relativo o una diferencia de proporciones, etc. a detectar, como significativa una diferencia o un inusitadamente grandes. Esto quiere decir que con el diseo propuesto, se pesquisar riesgo relativo como el planteado o mayor que l, pero si el valor verdadero es menor aparecer como que los grupos no difieren. O, por otro lado, una investigacin con error beta elevado indudablemente: 0,40 o 0,50 , por sealar cifras difcilmente discutibles. Ello, a su vez quiere decir que los autores estn dispuestos a tener una probabilidad de 40 o 50% de no detectar una diferencia real. O, presentar un tamao muestral que a simple vista, para un ojo entrenado, es escaso o emplear pruebas de hiptesis unilaterales sin el debido fundamento. El uso de pruebas de hiptesis unilaterales est raramente indicado en investigacin clnica y definitivamente puede considerarse que no procede en ensayos teraputicos, donde aunque el investigador espera que el tratamiento nuevo sea mejor, de hecho no lo puede asegurar y, por otra parte, an pudiera ser peor que el manejo estndar. Es tambin importante sealar que cuando un estudio resulta negativo puede ser debido a falta de poder de la investigacin y que cuando resulta lo contrario y se detecta lo esperado se estima que no hay mucho que discutir sobre el punto. Sin embargo, es interesante y necesario verificar con qu poder

186

de estudio fue detectado un determinado hallazgo, puesto que no resulta aceptable haber efectuado una indagacin con un bajo poder. Aspectos de tal naturaleza no suelen aparecer como ticamente cuestionables. Sobre el poder de los estudios clnicos frecuentemente se olvida que se trabaja habitualmente con un nivel de 80%, es decir con un error beta de 20%, lo que significa que tal es la probabilidad de fracaso en la deteccin de un hallazgo planificado detectar si es real. La no eleccin de un poder mayor generalmente est determinada por el deseo o necesidad de evitar requerir una muestra mas numerosa, con todo lo que ello implica. Es tambin importante sealar que, siendo efectivo que el clculo del tamao muestral constituye una aproximacin razonable basada habitualmente en datos no necesariamente slidos, deber efectuarse toda vez que corresponda, pero adems debe recordarse que existen tcnicas bioestadsticas que permiten, adecuadamente, efectuar evaluaciones sobre la marcha, que pueden sugerir la conveniencia de una finalizacin adelantada de la investigacin as como una reevaluacin del tamao muestral. Es importante sealar que los aspectos ticos del proceso de investigar no permanecen fijos , rgidos y muy por el contrario son bastante dinmicos. Es as como ,con toda seguridad, en poco tiempo mas se incorporar como requisito tico de todo proyecto que signifique indagacin en humanos , la obligacin del registro del mismo. Esto se refiere a lo siguiente: Los proyectos son manejados habitualmente en secreto, lo que eventualmente significa que por una parte pocos saben de su existencia y pocos saben del resultado, a

187

menos que sea publicado, lo que no necesariamente ocurrir (3). Este tipo de manejo se puede prestar para repeticiones innecesarias, gastos evitables, a un desconocimiento de posibles efectos adversos y otros aspectos. Es por ello que se ha considerado indispensable establecer un registro general, nacional donde corresponda, de ensayos clnicos, desde proyecto hasta resultados y ello ya se est poniendo en prctica en algunos pases(4). Esto permitira tener acceso, por ejemplo, a estudios que no fueron publicados, no precisamente por falta del investigador, sino por ser vctima del sesgo de publicacin, que determina que investigaciones no concluyentes o negativas tienen menor probabilidad de ser aceptadas por los rganos de difusin. Tal como lo indicado hasta el momento, deberamos mencionar tambin la responsabilidad individual de cada investigador, que debe considerar como muy serio el entregar a otros la decisin de qu, como y cuando se efectuar una investigacin. Esta situacin se da particularmente en los casos en que el investigador es un mero ejecutor de un estudio multicntrico generado en otra parte y por otros, quienes han tenido la idea, planteado la hiptesis, planificado el proyecto, lo han financiado y la participacin del ejecutor es slo sa, an bajo supervisin del ente motor del estudio, ya que no tiene propiedad sobre los resultados, no participa del anlisis de estos ni interviene en la publicacin de lo investigado. Es an posible que no se publique la investigacin, por desinters, de quien financia, en lo que finalmente result. Conflictos de intereses son esperables, adems, toda vez que el ejecutor ha recibido algunos beneficios como viajes a reuniones o asistencia a congresos o jornadas de la

188

especialidad y otros. Es importante, entonces, sealar que la Comisin de Etica de la Facultad de Medicina de la Universidad de Chile ha establecido recientemente ciertos criterios para la aprobacin de tal tipo de proyectos con el objeto, precisamente, inconvenientes como los mencionados*.
Criterios para la aprobacin de proyectos multicntricos de investigacin. 1.-Rigurosidad metodolgica,2.-Claridad en todos los criterios para seleccionar los sujetos de investigacin,3.-Conocimiento de todos los centros que participan en el estudio,4.- Acceso del investigador responsable ante la Facultad, en el curso de la investigacin, a toda la informacin y resultados de los dems centros participantes, especialmente a aquellos que se refieren a los efectos adversos que pueden presentarse con las intervenciones experimentales,5.Comunicacin sobre el procedimiento y presentacin de los documentos de consentimiento informado adecuados a la realidad cultural de nuestro medio y sujetos a la aprobacin por la Comisin de Etica,6.-Declaracin del investigador principal del propsito de publicar los resultados y libertad del investigador local para presentar o para publicar su experiencia,7.Informacin sobre todos los beneficios de la participacin en el proyecto para los sujetos incorporados, los centros participantes y para los investigadores locales,8.-Aprobacin del Director de Departamento o Programa respectivo con un informe en el cual se apruebe la participacin del acadmico y se establezca la relevancia del estudio.

de subsanar

Referencias.

1.-Ezequiel JE, Wendler D, Grady C . What makes clinical research ethical? JAMA 2000;283: 2701-2711. 2.-Grupo de Trabajo Ministerial Ad Hoc. Depto. de Programas de las Personas. Ministerio de Salud. Regulacin de la Ejecucin de Ensayos Clnicos que utilizan medicamentos en seres humanos.1997. 3.-Yamey G. Scientists who do not publish trials results are unethical. BMJ 1999;319:939. 4.-Tonks A. Registering clinical trials.

189 BMJ 1999;319:1565-1568

XXXVIII Ejercicios con su solucin. Ejercicio N 1 En una muestra tomada al azar de n = 100, Ud. encuentra un promedio de 22,64 y una desviacin estndar de 4,24. Seale dentro de qu mrgenes espera, con un 95% de seguridad, se encuentre el promedio de la poblacin o universo del cual fue extrada la muestra.

Ejercicio N 2

190

Ud. conoce el valor promedio de la poblacin o universo de la que se extrae una muestra. Con la informacin que se proporciona indique si la muestra difiere "significativamente de la poblacin, desde el punto de vista del promedio: Promedio poblacional = 245 Muestra: n = 150 x = 257, 4 DE = 5,0

Ejercicio N 3 Ud. sabe que la eleccin de un determinado nivel de significacin para una prueba de hiptesis es un asunto arbitrario. Al sealar cada uno de los siguientes niveles de significacin indique cuntas veces por mil est, en cada caso, dispuesto el investigador a aceptar que lo encontrado sea explicado por el azar. I. 0,001 II. 0,014 III. 0,005 IV. 0,050 V. 0,052 VI. 0,095 VII. 0,100 VIII. 0,009 IX. 0,066 X. 0,110

Ejercicio N 4 En dos grupos en estudio, uno experimental y uno control, despus de la intervencin planificada sobre la variable M Ud. obtiene los siguientes resultados:

191

Grupo Experimental n1 = 15 casos x1 = 35,40 EE1 = 0,45 x2

Grupo Control n2 = 15 casos = 40,10 EE2 = 0,80

Seale qu inconveniente vera Ud. para efectuar una comparacin de promedios. Ejercicio N 5 En un ensayo clnico controlado para comparar los efectos de las drogas A y B, se encuentra que esta ltima manifiesta un porcentaje de xito un 15% mejor que A, con un error alfa (p) de 0,07. Comente, tanto si concluye que la droga B es superior como si decide que ambas son comparables en esta investigacin.

Ejercicio N 6 Al comparar la respuesta renal de dos grupos de 120 lactantes cada uno que reciben, el grupo A una solucin con 70 mEq/L de sodio y el grupo B 90 mEq/L de ese catin, se observan los siguientes volmenes y osmolaridades urinarias: Grupo A x DE Grupo B x DE

192

Osmolaridad uninaria 540 191 (mOsm/Kg) Volumen urinario 39 12 (ml/kg/d) Existen diferencias significativas grupos?

490 210 48 entre 13 ambos

Ejercicio N 7 En un estudio experimental que contempl 10 animales, se constituyeron dos grupos: A y B, de cinco ejemplares cada uno, al azar. El grupo A recibi una droga considerada probablemente protectora de la maniobra experimental en investigacin, en el sentido de evitar muertes. Resultado de la experiencia: Grupo A, no fallece ningn animal. Grupo B, fallecen 4 ejemplares. Qu podra concluir Ud. respecto a la capacidad protectora de la droga administrada al grupo A?

Ejercicio N 8 Dos mdicos examinan a 1.500 lactantes buscando la presencia de hepatomegalia. Ambos coinciden en que 1.465 nios tienen tamao normal de hgado, as como que en 10 existe hepatomegalia. Discrepan en 25 ocasiones: en 18 de ellas el mdico que llamaremos A estima que no hay elementos para sostener el diagnstico, pero el mdico B considera lo contrario, y en 7 oportunidades ocurre lo

193

opuesto. Qu podra establecer Ud. con la informacin proporcionada? Ejercicio N 9 Dos grupos de enfermos, en todo comparables al inicio, son sometidos a las terapias A y B, respectivamente. Se contabilizan las complicaciones preespecificadas y se obtiene el siguiente conjunto de resultados: Con complicaciones 29 Grupo con tratamiento B 30 Totales 59 14 45 3 27 Totales 11 18 Sin complicaciones Grupo con tratamiento A

Indique su eleccin en cuanto a prueba de hiptesis adecuada para verificar que con el tratamiento B se presentaron menos complicaciones. Calcule el estadstico de su prueba. Ejercicio N 10 En un grupo de pacientes hipertensos Ud. est investigando el efecto hipotensor de un medicamento. Para

194

ello, controla la presin arterial sistlica (PAs)del grupo antes y despus de una dosis teraputica del frmaco. Los resultados son: PAS ANTES (mm Hg) 220 170 140 155 182 148 178 198 200 210 205 147 189 160 178 198 155 160 175 180 178 145 150 160 190 150 168 157 216 160 PAS DESPUES (mm Hg) 170 175 130 160 175 152 178 167 190 200 210 156 200 130 129 135 145 160 120 182 130 110 129 135 140 135 188 159 180 160

195

230 280 179 178 180 156 145 125 166 180 170 150 200 180 170 215 198 180 190 189 167 166 200 250 170 175 Qu puede concluir Ud.?

Ejercicio N 11 Con el objeto de determinar el efecto de una droga sobre la velocidad de reaccin, se formaron dos grupos para investigar esto: grupo A, al que se administr la droga en cuestin y grupo B, al que se administr un placebo (grupo control). Los resultados obtenidos en milisegundos indicaron lo siguiente: Grupo A = 10-8-12-16-5-9-7-11-6-14-10-16-9-8-710-9-10-12-9. Grupo B = 5-20-17-11-12. Qu debera concluir respecto a lo planteado? 12-15-20-18-9-13-14-11-9-9-17-11-5-

Ejercicio N 12

196

En un estudio retrospectivo sobre el valor antecedente L en la aparicin de la enfermedad E, se estudiaron 100 casos con esta ltima e igual nmero sin ella, muestras adecuadamente obtenidas. Se extrajeron los siguientes resultados:

Casos con enfermedad E E Totales (+) 44 Antecedente L (-) 156 Totales 200 69 100 31

Controles sin enfermedad 13 87 100

Seale si es ms probable la patologa mencionada cuando el antecedentes L est presente. Ejercicio N 13 En una muestra de 100 lactantes hospitalizados se determin al ingreso albuminemia y se trat de relacionar los valores de 3 g/dl o menores con la existencia de desnutricin aguda por criterio peso/talla. Los resultados fueron: Albmina plasmtica < 3 g/dl > 3 g/dl (+) 9 20 Desnutricin aguda (-) 80 Totales 100 5 14 75 86 Totales 11

197

Intente un anlisis de los datos numricos y seale sus conclusiones.

XXXIX. RESPUESTAS
Ejercicio N 1 Si deseamos inferir el promedio de una poblacin a partir del valor encontrado en una muestra representativa debemos recordar que si tomamos un gran nmero de muestras de un universo, verificaremos que las medias tienen una distribucin normal con su propio promedio y desviacin estndar. El promedio del universo tendr un 95% de probabilidad de encontrarse en el tramo determinado por el valor encontrado de la media + 1,96 desviaciones estndar. Cuando se trata de una muestra nica, como en el ejercicio, calculamos la desviacin estndar del promedio con el nombre de error estndar del promedio, de la siguiente manera:

Desviacin estndar encontrada

________________________________ 0,424

4,24 ____ =

Raz cuadrada del N de observaciones

10

198

Esta razn aplicada 1,96 veces en ms y luego en menos a la media nos indicar dentro de qu valores, con un 95% de probabilidad, se encuentra el promedio del universo. En el problema stos son 21,808 y 23,471 y resultan de 22,64 + 1,96 x 0,424.

Ejercicio N 2 En este problema hay que notar que se conoce el valor promedio de la poblacin o universo de la que se extrajo una muestra. Esta diferir significativamente de la poblacin desde el punto de vista de la media toda vez que la cifra poblacional no est contenida dentro del margen: promedio muestral + 1,96 por error estndar del promedio. Este ltimo sera igual a 5,0 / raz cuadrada de 150. Esto da 0,4082. Entonces, la media de la muestra; 257,4 + 1,96 x 0,4082 nos da los mrgenes 256,59 y 258,200. La conclusin es que la muestra s difiere significativamente ya que el promedio poblacional es 245. Otra manera de plantear lo mismo es decir que la muestra ser diferente del universo desde el punto de vista de la media si la diferencia de ambas es mayor que dos veces el error estndar del promedio calculado para la muestra. En el ejercicio sera dividir la diferencia de 245 y 257,4 es decir 12,4 (en trminos absolutos) por 0,4082, lo que da bastante ms que 1,96. En este problema la expresin significativo se ha usado en el sentido de establecer a partir de qu nivel de error alfa consideraremos que los hallazgos no son explicados por variacin debida al azar. En el caso presente, 5%. Ejercicio N 3 Las cifras que seala el problema como niveles de significacin corresponde al error alfa, valor de p. Como se pide indicar por mil las respuestas son, respectivamente,

199

una vez, catorce veces, cinco, cincuenta y dos, noventa y cinco, cien, nueve, sesenta y seis, ciento diez veces. Ejercicio N 4 La comparacin de promedios de dos grupos tiene varios supuestos, como cualquier prueba paramtrica, pero hay que destacar aqu que en primer trmino tenemos que comparar las varianzas, que presumiblemente son iguales. Si son signficativamente diferentes entonces los grupos tambin lo son. __ Varianza del grupo 1 = (EE1 x n1 ) = 3,035. En el grupo 2 resulta 9,595. Ahora, se busca la razn varianza mayor/varianza menor, es decir, 9,595/3,035 lo que nos da 3,16. Consultando la tabla respectiva, p es menor que 0,05 por lo que los grupos son entonces diferentes. La comparacin de medias es posible hacerla recurriendo a la proposicin de Welch como se explica en el ejercicio N 6. Ejercicio N 5 Si el nivel de significacin estadstica es el usual, 5%, entonces 0,07 (7%) no nos permite decir que las drogas son diferentes. Es necesario, sin embargo, considerar que existiendo una diferencia real el estudio puede haber tenido insuficiente poder para detectarla. Ello est determinado fundamentalmente por el nmero de casos estudiados. Ejercicio N 6 En este problema no se seala el muy importante antecedente que los dos grupos en comparacin no diferan antes de iniciar la experiencia. Suponiendo que as fue y que se dan las condiciones para aplicar una prueba de hiptesis paramtrica, es interesante recordar que los conjuntos A y B, como resultado de la intervencin (administracin de

200

solucin con 70 90 mEq/L de sodio)pueden mostrar, en osmolalidad y/o volumen urinario, diferencia en el promedio o en la dispersin, varianza. Lo primero es comparar esto ltimo ya que si las varianzas son diferentes los grupos lo son tambin y, en principio, no procedera seguir con la comparacin de promedios, que requiere igualdad de varianzas. Si nos centramos en la osmolalidad urinaria veremos que la varianza en el grupo A es 36.481 (191) y en el B es 44.100 (210). Para compararlas se busca la razn varianza mayor/varianza menor que aqu es 1,2088. Al revisar la tabla correspondiente encontramos que ambas dispersiones pueden ser consideradas iguales porque la variacin es explicada por el azar en ms del 5% de las ocasiones (p mayor que 0,05). En el volumen urinario se produce el mismo fenmeno porque la razn de varianza es 1,17 y tambin p es mayor que 0,05. Ahora, podemos comparar procedimiento ya aprendido. Diferencia de promedios Raiz cuadrada de ( EEA + EEB ) =Z promedios por el

En osmolalidad urinaria obtenemos: 540 490 _______________________ 17,43 + 19,17 y p mayor que 0,05 En volumen urinario obtenemos: 48 39 9 _______________________ = _______ = 5,62 = Z 50 = _______ = 1,93 = Z 25,90

201

1,09 + 1,18 y p menor que 0,01.

1,60

La conclusin sera entonces que entre los grupos A y B hay una diferencia significativa en volumen urinario pero no en osmolalidad de la orina. Es interesante sealar que an en el caso que las varianzas hubieren resultado diferentes, es posible efectuar una comparacin de promedios. En tal caso se recurre a la correccin propuesta por Welch. En forma sencilla, sta determina los grados de libertad que tiene el ensayo para buscar p en una tabla de t de Student. Esto significa que opera bsicamente ante muestras de pequeo tamao. Recordaremos que un valor del estadgrafo Z mayor que 1,96 corresponde a un p menor que 0,05 siempre que el nmero de casos (grados de libertad) sea elevado. Para pocos casos, la distribucin de Student es ms ajustada, pudiendo considerarse que est normalizada cuando el efectivo de la muestra es mayor de 60 casos (grados de libertad). La aritmtica de la correccin de Welch considera: Grados de libertad (G.l.)de cada grupo: G.l.A = 120 1 = 119 G.l.B = 120 1 = 119 G.l.total 1 = ______________________ k/G.l.A + (1 k)/G.l.B

siendo k nB DEA k = _____________________ nB DEA + nA DEB

202

Haciendo el clculo para osmolalidad urinaria, que no es necesario hacerlo, obtendramos un total de 236 grados de libertad en vez de 238 (119 + 119), lo que es muy cercano. La diferencia crece ms ante varianzas significativamente distintas y pocos casos. As, en el Ejercicio N 4 encontraramos que los grados de libertad disminuyen de 28 a 22 al efectuar la correccin de Welch. Esto significa que t crtico para p = 0,05 exige una cifra sobre 2,074 en vez de 2,048 (ver tabla de t). Ejercicio N 7 Con los datos proporcionados en el problema se puede construir una tabla de 2 x 2 como la siguiente: Grupo A Totales Sobreviven Fallecen Totales 5 0 5 1 4 5 6 4 10

Como el nmero de casos es muy pequeo slo procede efectuar una prueba de Fisher-Irwin de probabilidades exactas para responder hasta qu punto al azar pudiera explicar una distribucin como la que muestra la tabla: 6! 4! 5! 5! p = __________________ = 0,0238 5! 1! 0! 4! 10! Con la informacin obtenida debe concluirse que la droga proporcionada al grupo A s tuvo un efecto protector en

203

el sentido de evitar muertes, puesto que la probabilidad que los resultados sean explicados por el azar es menor que 0,05 (5%). Adems de lo pequea de la muestra, no podramos utilizar un Ji cuadrado por que tenemos un casillero con cero y la cifra esperada es menor que cinco en todos ellos. La ocurrencia de esto ltimo se tolera hasta en el 20% de las celdas. Ejercicio N 8 Este problema se presta para varias consideraciones, pero empezaremos con lo que sera la respuesta esperada de acuerdo con lo aprendido hasta el momento. Se tratara de precisar hasta qu punto pudiera el azar explicar la discrepancia diagnstica entre los dos mdicos. Para ello aplicaramos la prueba de Mc Nemar colocando apropiadamente los datos en una tabla de 2 x 2:

Mdico A Hepatomegalia (+) Totales (+) 28 Mdico B.Hepatomegalia (-) 1.472 Totales 1.500 17 7 10

(-) 18 1.465 1.483

( 18 - 7- 1) Ji = ----------------------- = 4 , con 1 grado de libertad (18 + 7) y p = 0,0455

204

Aqu debera concluirse que si bien los mdicos participantes en la experiencia disienten pocas veces (25 en 1.500 exmenes = 1,66%), cuando lo hacen no es producto de una variacin explicada por el azar sino ms bien porque tuvieron un planteamiento diagnstico realmente diferente frente a esos nios. Al no disponer de un estndar ideal que nos permita identificar los nios con hepatomegalia, no podremos decidir cul mdico lo hizo ms acertadamente. Otro aspecto interesante del problema sera preguntarse sobre el grado de concordancia que tuvieron los dos mdicos al calificar los nios. Aqu nos preocupa, entonces, la otra diagonal de la tabla, a saber, aquella en que se encuentran las cifras 10 y 1.465. Estas representan las ocasiones en que ambos mdicos opinaron igual. La forma ms simple sera expresar que el nivel de concordancia fue de (10 + 1.465)/1.500 = 0,9833, es decir, 98,33%. Esto se ve magnfico pero tiene una debilidad importante y es que no descuenta el grado de concordancia que sera esperable por simple azar. Ahora bien, los valores esperados por el azar en los casilleros que nos interesan seran 17 x 28/1.500 = 0,3173 y 1.483 x 1.472/1.500 = 1.455,3173. Por lo tanto, la concordancia que podra generar el azar estara dada por (0,3173 + 1.455,3173)/1.500 = 0,9704. Para un ajuste perfecto entre los dos mdicos queda un espacio de 1-0,9704 = 0,0296 y de ste, los observadores contribuyeron con 0,9833 0,9704 = 0,0129, cifra que del mencionado espacio representa 0,0129/0,0296 = 0,4358; es decir 43,58%. La razn 0,4358 es el estadstico kappa. Lo que indica es que si la concordancia es total tendramos una razn de 1 referida al espacio que hay entre la concordancia que justifica el azar y lo mximo posible. En el problema, kappa (corregida por azar) es, como ya vimos, 0,43 43%, lo que es un ajuste bueno pero en ningn caso tan alto como pareci al comienzo.

205

Ejercicio N 9 Se puede elegir efectuar una prueba de Ji2, ya que en la tabla no hay ninguna celda con cero y todas las cifras esperadas en ellas son superiores a 5. Haciendo el clculo del estadgrafo, con correccin de Yates, se obtiene un valor de 4,90 y p = 0,02. En consecuencia, debemos concluir que efectivamente hay menos complicaciones en el grupo que recibi el tratamiento B. Si el lector escoge la prueba de Fisher-Irwin puede llegar a la misma conclusin, con p = 0,01. Tambin puede comparar las proporciones 11/29 (37,9%) y 3/30 (10%) llegando a lo mismo. Para un anlisis mas avanzado, estableciendo el nmero de casos que se deben tratar para que un paciente adicional del grupo B obtenga el beneficio de no tener complicaciones(NNT) ver seccin correspondiente. Ejercicio N 10 En este problema, si consideramos que se dan las condiciones para la aplicacin de una prueba paramtrica, la eleccin sera una t de Student para muestras relacionadas, porque cada enfermo es su propio control. Lo primero es anotar la diferencia antes despus para cada caso, siempre en la misma direccin. En nuestro ejercicio tomemos antes - despus. Esto nos da: 50 (mm Hg) - 5 10 - 5 7 - 4 0 31 10

206

10 5 - 9 - 11 30 49 63 10 0 55 - 2 48 35 21 25 50 15 - 20 - 2 36 0 - 50 1 24 20 - 14 20 20 - 45 18 1 1 - 50 - 5 En esta serie de 43 casos, el promedio de variacin es 10,069 con una desviacin estndar de 25,749 y un error estndar de 3,926. Recordaremos que el valor de la t para muestras relacionadas se obtiene de la razn entre el

207

promedio de variacin o diferencias y su error estndar. Entonces, t = 10,069/3,926 = 2,5646 para 43-1 = 42 grados de libertad. Con estas cifras, en la tabla respectiva podemos encontrar que p es menor que 0,02 y debemos concluir que la droga en estudio es de efecto claramente hipotensor desde un punto de vista estadstico. Mencionamos lo ltimo porque el valor clnico de lo observado lo debe decidir el criterio mdico. Si no desea o no se pueden aceptar los supuestos de una prueba paramtrica, lo recomendable en este problema es la T de Wilcoxon que considerar la direccin en que cambia la presin arterial de los enfermos as como la magnitud del cambio. La prueba del signo no estara indicada porque contempla slo direccin pero no magnitud, de modo que en nuestro problema se perdera informacin innecesariamente. La prueba de Wilcoxon para muestras relacionadas comienza anotando la diferencia de cada pareja de datos examinndola siempre en la misma direccin e indicando el signo que le corresponde (+ o -). A continuacin, las diferencias son ordenadas por rango de menor a mayor, sin tomar en cuenta los signos. As, los rangos para 1, -3, +4 seran 1, 2 y 3. Si hay diferencias de valor cero, se retiran esos casos del anlisis y correspondientemente se reduce la cifra de n en igual cuanta. Otro aspecto interesante que se recomienda tomar en cuenta es que cuando existen varias diferencias iguales, se les asigna a todas el rango promedio que correspondera si fuesen ligeramente distintas. Las diferencias 1,1, 1, 1 no tendran todas el rango uno, ya que si se acepta que no son iguales los rangos seran 1, 2, 3, 4 y su promedio 1 + 2 + 3 + 4/4 = 10/4 = 2,5. Al caso siguiente se le asignar el rango 5 porque los cuatro primeros ya fueron usados. Veamos ahora cmo resulta la prueba de Wilcoxon en nuestro problema:

208

Diferencias (mm Hg) 50 - 5 10 - 5 7 - 4 0 31 10 10 - 5 - 9 - 11 30 49 63 10 0 55 - 2 48 35 21 25 50 15 - 20 - 2 36 0 - 50 1 25

Rangos 35,5 8,4 14,5 8,4 11 6 28 14,5 14,5 8,4 12 17 27 33 39 14,5 38 4,5 32 29 24 26 35,5 18 21,5 4,5 30 35,5 2 25

209

20 - 14 20 20 - 45 18 1 1 - 50 - 5

21,5 17 21,5 21,5 31 19 2 2 35,5 8,4

Lo siguiente es sumar los rangos procedentes de diferencias negativas y luego los que vienen de diferencias positivas. La cifra menor es el estadgrafo T. Si la hiptesis nula fuese correcta, lo esperable sera que ambas sumas de rangos fueren similares. En nuestro problema resultan: 218,1 y 578,5. Cuando el nmero de parejas es mayor que 25 (en nuestro caso son 43-3 = 40) el estadgrafo T tiene distribucin casi normal, con un promedio n (n + 1) 40 (40 + 1) xT = ___________ = ____________ = 410 4 4 y una desviacin estndar n(n+1)(2n+1) ______________ 24 40(40+1) (80+1) ___________________ 24

DET= = 74,39

donde T - xT 218,1 - 410 Z = ___________ = _________________ = 2,57 DET 74,39

210

y p es menor que 0,05

Ejercicio N 11 En este ejercicio, con pocos casos y una variable cuya distribucin se desconoce, lo ms adecuado es intentar una prueba no paramtrica. Podemos utilizar la prueba de la mediana que busca determinar si dos grupos independientes difieren en tendencia central. Lo primero es precisar cul es la mediana general, tomando los dos conjuntos como uno. Ordenando las cifras de menor a mayor tendramos. 5-5-5-6-7-7-8-8-9-9-9-9-9-9-9-10-10-10-10-11-11-1111-12-12-12-12-13-14-14-15-16-16-17-17-18-20-20 En esta serie de 38 casos, la mediana general es el valor central que ocupa la posicin entre la nmero 19 y 20. La primera es de 10 milisegundos y la segunda de 11, de modo que la mediana sera de 10,5. Ahora, en una tabla de 2 x 2 separaremos cada grupo en dos partes: aquellos sobre la mediana general y aquellos en o bajo ella: Grupo A Totales Sobre mediana 19 En o bajo mediana 19 Totales 38 20 18 14 5 6 13

211

Ahora podemos hacer un Ji2 en esta tabla ya que ninguna celda tiene cero y en ninguna la cifra esperada es inferior a cinco. Con la correccin de Yates obtenemos que Ji2 = 5,17 (para un grado de libertad) y p = 0,02. Se concluira que la droga en estudio aument la velocidad de reaccin en el grupo A. Otra forma de resolver la misma tabla es por medio de una prueba de Fisher-Irwin, que indica igual conclusin aunque con p = 0,009. Ejercicio N 12. Si el antecedente que se estudia no tuviera ninguna influencia en el desarrollo de E, su existencia en casos y controles debiera ser similar. Se pueden comparar las proporciones 31/100 y 13/100, as como realizar una prueba de Ji cuadrado con correccin de Yates en la tabla de resultados. En tal caso, se obtendra un valor de 8,42 para el estadgrafo, con un grado de libertad y p menor que 0,005. Concluiramos que L debe ser considerado importante, aunque no hemos respondido cunto mas probable es E en presencia del antecedente L. Para aproximarnos a ello calculamos los OR (odds ratio) y resulta: OR = 3,00 con IC del 95% de 1,47 a 6,12. Entonces, la enfermedad puede considerarse 3 veces mas probable cuando existe el antecedente estudiado y p es menor que 0,05 , puesto que el intervalo de confianza del 95% no incluye 1 Ejercicio N 13. Efectuando una prueba de Ji cuadrado con correccin de Yates(Tabla de 2 x 2) podemos establecer si hay relacin entre la existencia de desnutricin aguda y la presencia de albuminemia normal o baja: Ji cuadrado con

212

correccin de Yates = 16,86 y p es menor que 0,0005 .De donde podemos concluir que la relacin existe, de modo que los valores en nivel de hipoalbuminemia se asocian con desnutricin aguda en el tipo de pacientes estudiados. Se recuerda que entre los requisitos para efectuar la prueba de hiptesis empleada se encuentra el que en no mas del 20% de las celdas debe haber una cifra esperada inferior a 5 y justamente en el casillero en que hay un 9 , la cifra esperada es 20 x 14/100 = 2,8. Como se trata de una tabla de 2 x 2 , ya con eso debiera recurrirse a otra prueba. La de Fisher- Irwin de probabilidades exactas, puede realizarse sin problemas y genera p = 0,000098. La conclusin, en este caso, no cambia en relacin a lo indicado. Para establecer la fortaleza de esta asociacin se puede determinar cunto mas probable es encontrar hipoalbuminemia si el paciente tiene una desnutricin aguda, por medio del estadgrafo OR. Obtendramos , OR = 12,27 con IC 95% =3,62 a 41,55 . Por tanto, p < 0,0 XXXX. Problemas y ejercicios para ser comentados con el docente

213

QUE ES UN PARMETRO? QUE ESTABLECE EL TEOREMA DEL LMITE CENTRAL? DEFINA INTERVALO DE CONFIANZA DEL 95% QUE ES INFERENCIA? QUE REPRESENTA: PROMEDIO MUESTRAL + ERRORES ESTNDAR? QUE REPRESENTA : PROMEDIO MUESTRAL + 1,96 DESVIACIONES ESTNDAR?

214

QUE FORMA DEBE TENER UNA DISTRIBUCIN EN LA QUE COINCIDEN PROMEDIO Y MEDIANA? QUE AREA DE LA CURVA DE DISTRIBUCION NORMAL EST CONTENIDA EN LOS LMITES: + 1,96 DESVIACIONES ESTNDAR? QUE AREA DE LA CURVA DE DISTRIBUCIN NORMAL QUEDA A LA DERECHA DEL PROMEDIO?

QUE CLASE DE VARIABLE ES EL CUOCIENTE INTELECTUAL? DE UN EJEMPLO DE VARIABLE NOMINAL Y ORDINAL QUE FRECUENCIA RELATIVA TIENE LA TOTALIDAD DE LA MUESTRA? COMO DENOMINARA: A/B? COMO DENOMINARA : A/(A+B)? QUE ES UNA MUESTRA?

215

QUE ES UN CENSO? DEFINA AZAR QUE TEMPERATURA ES LA MITAD DE 50 GRADOS CENTGRADOS? QUE ES SESGO?

CADA PUNTO REPRESENTA UN ACONTECIMIENTO, QUE EN EL TIEMPO SE DISTRIBUYE DE LA SIGUIENTE MANERA: SEALE LA QUE LE PAREZCA MAS AJUSTADA A UNA DISTRIBUCIN AL AZAR. 1.-O O O O O O O O O O O O O O O O O O O O O O O O O O O 2.-OO OO OO OO OO OO OO OO OO OO OO OO OO OO OO OO OO O 3.-OOO O OOO O OOO OO OOO OO OOO OO OOO O OOO O OOO O O

216

4.-O O O O O OOOOOO O O O O O OOOOOOOO O O O O O OOOOO O O 5.-O O O OO O OO O O O OOO O O O O O 6.-O OOOOO O O OOOOO O OO O O OO OOO O O O O O

O O O OOOOOOOOO O O O

SI SE PRETENDE EFECTUAR UN ENSAYO CLNICO CON UN FRMACO, QU INCONVENIENTE VE UD. EN LA SIGUIENTE FORMA DE ASIGNAR LOS CASOS?: UNO RECIBE EL MEDICAMENTO EXPERIMENTAL Y EL SIGUIENTE RECIBE EL TRATAMIENTO USUAL, LUEGO EL QUE SIGUE RECIBE EL MEDICAMENTO EXPERIMENTAL Y

217

EL PRXIMO EL TRATAMIENTO USUAL Y AS SUCESIVAMENTE

USTED ESTUDIA UNA VARIABLE CUYA DISTRIBUCIN ES NORMAL.

218

EN UNA MUESTRA DE n = 100 ENCUENTRA, PARA LA VARIABLE MENCIONADA, PROMEDIO DE 5,72 Y DESVIACIN ESTNDAR DE 1,94.

QU VALORES INCLUIRAN AL 5% DE LA MUESTRA?

CUL SER EL VALOR PROMEDIO DE LA VARIABLE EN EL UNIVERSO DEL QUE SE OBTUVO LA MUESTRA?

219

USTED COMPARA LA DURACIN DE UNA ENFERMEDAD CON DOS TRATAMIENTOS. DURACIN CON TRAT. A TRAT. B N DE DAS
23 23 23 24 24 27 28 28 29 29 29 30 31 32 33 34 34 38 40 40 41 45 47 47 50 50 51 55 56 60 68 1 79 80 80 80 81 90 90

DURACIN CON
15 17 24 25 25 26 29 30 30 31 40 41 41 41 44 46 48 49 49 49 55 56 59 60 64 65 68 69 69 75 78 79 80 80 80 89 89 90 90

220

1.-OBTENGA EL PROMEDIO DE LOS SIGUIENTES VALORES: 1.a.-VALOR DE LAS ACCIONES CLASE B DE LA EMPRESA Z , EN LA LTIMA SEMANA: 55 - 55,5 - 53,9 56 55 - 55,4 56,2 1.b.- ESCALA DE GLASGOW, MODIFICADA PARA LACTANTES: EN 10 NIOS SE ENCUENTRAN LOS SIGUIENTES PUNTAJES: 8467878763 1.c.-ESTADO NUTRICIONAL EN 10 NIOS: DI DIII DI DII DI DI DI DIII DI DII

2.-OBTENGA EL PROMEDIO ARITMTICO Y LA MEDIANA DE LA SIGUIENTE SERIE NUMRICA: 7 9 4 1 2 3 4 2 9 10 12 9 8 7 8 9 13 14 15 12 11 5 6 7 85. n = 25 Suma= 272

221

USTED TIENE UNA MUESTRA CORRECTAMENTE OBTENIDA DE UN UNIVERSO. EN ELLA ENCUENTRA QUE EL PESO PROMEDIO DE LOS CASOS ES DE 12,450 KG. CON UNA DESVIACIN ESTNDAR DE 1,740 KG. EL TAMAO DE LA MUESTRA ES DE 100 CASOS.
INDIQUE UNA APROXIMACIN AL PESO PROMEDIO EN EL UNIVERSO DEL QUE PROCEDE LA MUESTRA

222

INDIQUE CUAL ES LA PROBABILIDAD QUE EL AZAR EXPLIQUE LA SIGUIENTE DISTRIBUCIN:

5 1

0 5

SE ENTREGA LA SIGUIENTE INFORMACIN: Factorial de 0 = 1 1 = 1 5 = 120 6 = 720 11 = 39.916.800

223

EN UNA SERIE DE AUTOPSIA CONSTITUIDA POR 66 NIOS UD. ENCUENTRA QUE LA PATOLOGA PULMONAR QUSTICA AFECT LOS LBULOS DE LA SIGUIENTE MANERA: N DE CASOS LSD LMD LID LSI LII TOTAL 26 12 14 6 8 66

UD CONCLUYE QUE EL LBULO SUPERIOR DERECHO ES EL MAS COMNMENTE COMPROMETIDO.Es esto correcto?

224

SI EN UNA MUESTRA POBLACIONAL DE n = 180 Ud. ENCUENTRA 46% DE VARONES CUL ES LA PROBABILIDAD QUE ELLO SEA EXPLICADO POR EL AZAR SI LO ESPERABLE FUESE UN 50% DE VARONES?.

225

EN DOS GRUPOS DE NIOS QUE ENTRARN A UN ESTUDIO ENSAYO CLNICO CONTROLADO RANDOMIZADO, DOBLE CIEGO PARA PROBAR LOS TRATAMIENTOS A Y B , USTED ENCUENTRA AL EMPEZAR LA EXPERIENCIA Y UNA VEZ CONSTITUIDOS LOS GRUPOS DE 100 NIOS CADA UNO, LAS SIGUIENTES CARACTERSTICAS EN LOS CONJUNTOS QUE LLAMAREMOS TAMBIN A Y B . INDIQUE SI LOS GRUPOS SON COMPARABLES PARA UN ERROR ALFA DE 5% O MENOS. FUNDAMENTE. GRUPO A VERSUS GRUPO B P EDAD SEXO ESTADO NUTRICIONAL PROCEDENCIA DIAS DE ENFERMEDAD 0,0099 ENFERMEDAD EN LOS PADRES 0,012 0,045 0,092 0,025 0,068

HERMANO FALLECIDO POR LA MISMA ENFERMEDAD 0,201

226

TRATAMIENTO PREVIO AL ESTUDIO

0,028

COMPARE ESTOS DOS GRUPOS: GRUPO N PROMEDIO ERROR ESTNDAR A 36 18,5 0,89 B 36 21,4 0,42

227

UN TEOREMA PARA RECORDAR TEOREMA DEL LIMITE CENTRAL DADA UNA POBLACION CON PROMEDIO(MEDIA) Y DESVIACION ESTANDAR ,LA DISTRIBUCION MUESTRAL DEL PROMEDIO(MEDIA), BASADA EN MUESTRAS AL AZAR REPETIDAS Y DE TAMAO n , TIENE LAS SIGUIENTES PROPIEDADES: 1.-EL PROMEDIO(MEDIA) DE LA DISTRIBUCION MUESTRAL O PROMEDIO DE PROMEDIOS (MEDIA DE MEDIAS)ES IGUAL AL PROMEDIO(MEDIA) DE LA POBLACION. 2.- LA DESVIACION ESTANDAR EN LA DISTRIBUCION MUESTRAL DE PROMEDIOS(MEDIAS), LLAMADA ERROR ESTANDAR DEL PROMEDIO(MEDIA) TIENE UNA FUNCION IMPORTANTE EN NUMEROSOS PROCEDIMIENTOS ESTADISTICOS. 3.-SI LA DISTRIBUCION DE LA POBLACION ES NORMAL, LA DISTRIBUCION MUESTRAL TAMBIEN LO ES.
CON MUESTRAS DE TAMAO GRANDE( MAYOR DE 30), LA DISTRIBUCION MUESTRAL DE PROMEDIOS(MEDIAS) ES APROXIMADAMENTE NORMAL AUNQUE LA DISTRIBUCION DE LA POBLACION ORIGINAL NO LO SEA.

228

EL MODELO ESTADSTICO: ASOCIADO A CADA TEST ESTADSTICO SE ENCUENTRA UN MODELO MATEMTICO Y UN CONJUNTO DE REQUISITOS PARA LAS MEDICIONES. EL TEST ES VLIDO, ENTONCES, SOLO BAJO CIERTAS CONDICIONES. EN OCASIONES PODEMOS VERIFICAR SI SE CUMPLEN O N LAS EXIGENCIAS QUE UN PARTICULAR TEST TIENE, PERO LA MAYORA DE LAS VECES SE DEBE SUPONER QUE TALES EXIGENCIAS SE CUMPLEN. PARA UNA PRUEBA TAN EMPLEADA COMO LA t DE STUDENT SE DEBEN CUMPLIR CONDICIONES COMO LAS SIGUIENTES: 1.- LAS OBSERVACIONES DEBEN SER INDEPENDIENTES. 2.- LAS OBSERVACIONES DEBEN SER EXTRAIDAS DE UNA POBLACIN CON DISTRIBUCIN NORMAL PARA LA VARIABLE ESTUDIADA. 3.-LAS POBLACIONES COMPARADAS DEBEN TENER LA MISMA VARIANZA. 4.-LAS VARIABLES INVOLUCRADAS NO PUEDEN SER NOMINALES U ORDINALES PORQUE SE REQUIEREN

229

OPERACIONES COMO PROMEDIOS, ETC.

DIVIDIR,

ENCONTRAR

AUNQUE EVIDENCIA EMPRICA MUESTRA QUE LIGERAS DESVIACIONES RESPECTO AL CUMPLIMIENTO DE LOS REQUISITOS PARA UNA PRUEBA PARAMTRICA PUEDEN NO TENER EFECTOS RADICALES EN LA CIFRA FINAL DE p , HASTA EL MOMENTO NO HAY ACUERDO REFERENTE A QU SE DEBEENTENDER POR LIGERA DESVIACIN.

UNA PRUEBA PARAMTRICA ES AQUELLA CUYO MODELO ESPECIFICA CIERTAS CONDICIONES ACERCA DE LOS PARMETROS EN LA POBLACIN DE LA QUE SE OBTENDR LA MUESTRA. UNA PRUEBA NO PARAMTRICA ES AQUELLA CUYO MODELO NO ESPECIFICA CONDICIONES ACERCA DE LOS PARMETROS POBLACIONALES. CIERTAS PRESUNCIONES, SIN EMBARGO, ESTN ASOCIADAS A LAS PRUEBAS NO PARAMTRICAS, COMO POR EJEMPLO QUE LAS OBSERVACIONES DEBEN SER INDEPENDIENTES Y QUE LA VARIABLE EN ESTUDIO TIENE CONTINUIDAD SUBYACENTE, PERO ESTAS PRESUNCIONES SON MENOS Y MAS DBILES QUE LAS EXIGIDAS POR PRUEBAS PARAMTRICAS. PUEDEN EMPLEARSE TESTS NO PARAMTRICOS PARA VARIABLES DE ESCALA NOMINAL U ORDINAL.

TOMANDO LAS MEDIDAS APROPIADAS, EN UN ESTUDIO EXPERIMENTAL QUE CONTEMPL 10 ANIMALES, SE CONSTITUYERON DOS GRUPOS DE CINCO EJEMPLARES CADA UNO, AL AZAR. EL GRUPO A RECIBI UNA DROGA CONSIDERADA PROBABLEMENTE PROTECTORA DE LA MANIOBRA EXPERIMENTAL EN INVESTIGACIN, EN EL SENTIDO DE EVITAR MUERTES. RESULTADO DE LA EXPERIENCIA

230

GRUPO A NO FALLECE NINGN ANIMAL GRUPO B FALLECEN CUATRO EJEMPLARES. QU PODRA CONCLUIR UD. RESPECTO A LA CAPACIDAD PROTECTORA DE LA DROGA ADMINISTRADA AL GRUPO A?

CON EL OBJETO DE DETERMINAR EL EFECTO DE UNA DROGA SOBRE LA VELOCIDAD DE REACCIN NEUROMUSCULAR, SE CONSTITUYERON DOS GRUPOS EN LOS QUE SE INVESTIG ESTE ASUNTO:

231

GRUPO A, AL QUE SE ADMINISTR LA DROGA EN CUESTIN Y GRUPO B, AL QUE SE ADMINISTR UN PLACEBO (GRUPO CONTROL). LOS RESULTADOS, EN MILISEGUNDOS, FUERON PARA CADA INDIVIDUO Y GRUPO: GRUPO A: 10 8 12 16 5 9 7 11- -6 14 10 16 9 8- -7 10 9 10 12 9. GRUPO B: 12- -15- -20 18 9 13 14 11 9 9 17 11 5 5 20 17 11 5 5 20 17 11 12 19 20. QU PODRA CONCLUIR DESPUS DE ANALIZAR LOS DATOS?

232

EN UNA FABRICA SE DESEA SABER LA PROPORCIN DE TRABAJADORES QUE TIENE TRASTORNOS VISUALES. PARA ELLO SE TOMA UNA MUESTRA REPRESENTATIVA DE 112 PERSONAS Y EN ELLOS SE ENCUENTRA QUE EL 12,5% TIENE ALTERACIONES DE ESTA NATURALEZA. QU PORCENTAJE DE TRABAJADORES DE LA FBRICA TIENE TRASTORNOS VISUALES?.

233

PROBLEMA DESEAMOS SABER LA PROPORCION DE NIOS DE 6 A 14 AOS DE EDAD CON TUBERCULOSIS (TBC)ACTIVA EN UNA POBLACION DE 7.500 ESCOLARES DE ESA EDAD. SE TOMA UNA MUESTRA REPRESENTATIVA DE 750 NIOS Y SE ENCUENTRA QUE 45 TIENEN UNA TBC ACTIVA. ESTIME EL PORCENTAJE CON TBC ACTIVA EN LA POBLACION DE LA CUAL SE EXTRAJO LA MUESTRA.

234

BIOESTADSTICA.
UD. COMPARA LA DURACION DE UNA ENFERMEDAD CON DOS TRATAMIENTOS. DURACION CON TRAT. A N de dias 23 23 23 24 24 27 28 28 29 29 29 30 31 32 33 34 34 38 40 40 41 45 47 47 50 50 51 55 56 60 68 78 79 80 80 80 81 90 DURACION CON TRAT.B. 15 17 24 25 25 26 29 30 30 31 40 41 41 41 44 46 48 49 49 49 55 56 59 60 64 65 68 69 69 75 78 79 80 80 80 89 89 90

235 90 90

BIOESTADISTICA
TRANSFORMACION DE VARIABLES. EJEMPLO:DILUCION DE SUEROS. 31 EJEMPLARES. ENTREPARNTESIS EL NUMERO DE CASOS. Promedio DE (2)1/8(5)1/16(10)1/32(9)1/64(4)1/128(1) SI CONSIDERAMOS LOS DENOMINADORES 25,76 EL 95% DE LOS CASOS DEBEN ENCONTRARSE ENTRE DISTRIBUCION NO ES NORMAL ENTONCES. AHORA EL LOGARITMO DE LOS DENOMINADORES 0,60(2)0,90(5)1,20(10)1,50(9)1,80(4)2,10(1) 1,30 0,36 28,38

-22,11 Y 78,86. LA

LA VARIABLE FUE TRANSFORMADA POR MEDIO DEL USO DEL LOGARITMO DEL VALOR. SE OBSERVA QUE LA DISTRIBUCION TIENDE A SER MAS COMPATIBLE CON LA NORMAL. EL 95% DE LOS CASOS DEBEN ENCONTRARSE ENTRE DISTRIBUCION ES MAS PROBABLEMENTE NORMAL

0,59 Y 2,00

LA

EL PROMEDIO DE LOS LOGARITMOS AL RETRANSFORMARLO USANDO LA FUNCION ANTILOG GENERA UN VALOR QUE CORRESPONDE AL PROMEDIO GEOMTRICO.EN ESTE CASO

ANTILOG DE 1,30 = 19,95 = PROMEDIO GEOMETRICO. AQU HAY QUE TENER PRECAUCION.
CUANDO SE HACE UNA TRANSFORMACION DE VARIABLE, TODAS LAS COMPARACIONES O LOS INTERVALOS DE CONFIANZA DEBEN HACERSE EN LA ESCALA NUEVA (TRANSFORMADA).LA PRESENTACION DE LOS RESULTADOS DEBE SER EXPLICADA AL LECTOR. EL PROMEDIO PUEDE SER RETRANSFORMADO(PROMEDIO GEOMTRICO) PERO NO SE RECOMIENDA TRANSFORMAR VARIANZAS O DESVIACIONES ESTANDAR VOLVIENDOLAS A LA ESCALA ORIGINAL.

236

UD. HA REALIZADO UN ESTUDIO EN BRONCONEUMONA CON SNDROME BRONQUIAL OBSTRUCTIVO DEL LACTANTE Y HA ENCONTRADO LOS SIGUIENTES VALORES DE PO2 EN UN GRUPO DE NIOS AL INGRESO. CONSTRUYA LA PRESENTACIN DE ESTOS RESULTADOS EN LA FORMA QUE ESTIME MAS APROPIADA. PO2 AL INGRESO EN MM DE HG 45 47 63 71 79 45 48 63 72 80 45 49 63 73 80 45 50 63 73 80 45 55 64 73 80 45 56 64 74 81 46 57 64 74 82 46 46 46 46 46 47 47 47 47 47 47 58 59 60 60 60 60 61 62 63 63 63 64 64 64 65 66 67 68 69 70 71 71 75 75 75 75 76 77 77 77 78 79 79 85 85 86 86 86 87 88.

237

BIOESTADISTICA EN UNA MUESTRA DE 100 CPSULAS DE AMOXICILINA + CIDO CLAVULNICO ETIQUETADAS COMO DE 250 MG., SE ENCUENTRA UN CONTENIDO PROMEDIO DEL MEDICAMENTO DE 246,58 MG. CON UNA DESVIACIN ESTNDAR DE 8,79 MG. SEALE SI LA ETIQUETA ES APROPIADA.

238

DE ACUERDO CON LOS SIGUIENTES RESULTADOS: LOS EXMENES IFI Y PCR DIFIEREN EN SUS RESULTADOS (CON ERROR ALFA DE 5%)?.

IFI
(+) (-) (+) 16 250 234

PCR
(-) 545 550 239 561 5

800

239

EN UNA EXPERIENCIA SE COMPARAN DOS GRUPOS DE 125 NIOS HOSPITALIZADOS CON SNDROME DIARREICO AGUDO. SE OBTIENEN LOS SIGUIENTES RESULTADOS:
GRUPO EXPERIMENTAL CONTROL PRDIDAS POR DEPOSICIONES (G/KG/24 HORAS) GRUPO

PROMEDIO ERROR ESTNDAR

135 3,6

147 4,1

CALCULE E INTERPRETE EL INTERVALO DE CONFIANZA DEL 95% DE LA DIFERENCIA DE PRDIDAS ENTRE AMBOS GRUPOS.

240

BIOESTADISTICA.
CALCULE POR EL PROCEDIMIENTO HABITUAL EL INTERVALO DE CONFIANZA DEL 95% DE 6% PARA 50 CASOS.
COMENTE EL HALLAZGO.

241

EN UN DIARIO LOCAL APARECE LA SIGUIENTE NOTICIA: HA CREADO CIERTA ALARMA EN LAS AUTORIDADES LA INFORMACIN QUE EL 40% DE LOS ESCOLARES EXAMINADOS TIENE UNA ESTATURA BAJO EL PROMEDIO NORMAL.

242

EN UN ESTUDIO EN QUE SE AVALU EL ESTADO NUTRICIONAL DE NIOS HOSPITALIZADOS, EL INVESTIGADOR SE SORPRENDIO DE ENCONTRAR QUE POR CRITERIO PESO/TALLA EL 35% DE LOS PACIENTES SE ENCONTRABA BAJO EL PROMEDIO MENOS UNA DESVIACiN ESTNDAR Y ERAN CATALOGADOS COMO DESNUTRIDOS PERO POR PLIEGUE TRICIPITAL SLO EL 14% SE ESTIMABA DESNUTRIDO ,POR ESTAR BAJO EL PERCENTIL 5. COMENTE.

243

PROBLEMA
EN UN GRUPO DE 25 NIOS DE 12 A 14 AOS, SUPUESTOS NORMALES, EN REPOSO, SE MIDIO LA FRECUENCIA CARDIACA Y SE OBTUVIERON LOS SIGUIENTES VALORES:

CASO N
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

FRECUENCIA CARDIACA (pulsaciones por minuto)


67 70 66 81 80 78 66 65 70 64 65 65 76 84 85 76 68 79 77 67 69 80

244 23 24 25 81 70 69

ENCUENTRE EL INTERVALO DE CONFIANZA DEL 95% (IC 95%) PARA EL PROMEDIO DE PULSACIONES.

BIOESTADISTICA.
CUAL ES LA PRESION ARTERIAL MEDIA DE NIOS PRESUMIBLEMENTE SANOS DE 8 A 10 AOS DE EDAD SI EN UNA MUESTRA REPRESENTATIVA DE 124 NIOS SE ENCONTRO: PRESION ARTERIAL PROMEDIO :96 MM HG DESVIACION ESTANDAR : 5,2 MM HG. ?

245

INDIQUE SI LAS VARIABLES A Y B SON INDEPENDIENTES. VARIABLE A 45 VARIABLE B 33


TOTALES TOTALES

56 41 97

101 74 175

78

246

INDIQUE SI LOS SIGUIENTES GRUPOS PERTENECEN AL MISMO UNIVERSO. PROMEDIO GRUPO I GRUPO II 1255 1435 DESVIACIN ESTNDAR 172 128 N 25 35

247

INDIQUE SI LA SIGUIENTE DISTRIBUCIN ES COMPATIBLE CON LA NORMAL. 20 20 20 21 21 21 21 22 22 23 23 23 25 25 26 27 28 28 29 30 32

248

33 35 38 41 44 44 45 47 49 50 59 65 N = 33 PROMEDIO = 32,03 DE = 12,06 BIOESTADISTICA. DURACIN DE LA HOSPITALIZACIN EN 162 NIOS CON DIAGNSTICO DE INGRESO DE BRONCONEUMONA. 1 1 3 4 5 5 5 6 6 7 8 9 11 13 17 1 3 4 5 5 5 6 6 7 8 9 11 13 18 1 3 4 5 5 5 6 6 7 8 9 11 14 18 2 4 4 5 5 5 6 6 7 8 9 11 14 19 2 4 4 5 5 5 6 6 7 8 9 12 14 20 2 4 4 5 5 5 6 6 7 8 9 12 15 21 2 4 4 5 5 5 6 6 7 8 10 12 15 22 3 4 5 5 5 5 6 6 7 8 10 12 15 23 3 4 5 5 5 5 6 6 7 8 10 12 16 3 4 5 5 5 5 6 6 7 8 10 13 16 3 4 5 5 5 5 6 6 7 9 10 13 17 3 4 5 5 5 5 6 7 7 9

DURACIN PROMEDIO = 7,074 DAS


DESVIACIN ESTNDAR= 4,399 DAS

DAS DE HOSPITALIZACIN

FRECUENCIA

249

0.4 5.9 10.14 15.19 20.24 25.29

32 95 21 10 4 0

PROBLEMA: VERIFICAR AJUSTE DE ESTA DISTRIBUCIN A LA NORMAL

EN UN GRUPO DE PERSONAS OBESAS SE DESEA COMPROBAR LA EFECTIVIDAD DE UN TRATAMIENTO PARA ESTA SITUACIN PATOLGICA. LA INFORMACIN DISPONIBLE ES EL PESO CORPORAL AL INICIO Y 30 DIAS DESPUS. INDIQUE SI EL TRATAMIENTO PODRIA SER CONSIDERADO EFECTIVO. PESO AL INICIO (KG) 118 119 144 103 126 150 132 134 147 143 129 127 134 PESO A LOS 30 DIAS. 114 117 140 103 122 146 132 128 148 138 130 124 132

250

140 127 142 141 1 118 117 122 131 144 121 126 109 113 118 131

137 131 136 139 132 118 114 122 135 140 123 119 109 114 110 125

UN LABORATORIO FABRICANTE DE UN NUEVO ANTIMALRICO SOSTIENE QUE STE MEDICAMENTO ES CAPAZ DE CURAR EL TRASTORNO EN EL 90% DE LOS CASOS. En una muestra de 75 pacientes, despus del tratamiento, se considera curados a 48 sujetos. Puede decir si el fabricante exager la efectividad del medicamento?.

251

BIOESTADSTICA. UD. ESTUDIA UNA MUESTRA DE 40 NIOS CON AMIGDALITIS ESTREPTOCCICA. SON TRATADOS CON CEFADROXILO 30 MG/KG/DA DURANTE 10 DAS. EN TODOS LOGRA ERRADICACIN DEL AGENTE BACTERIANO Y EN CONSECUENCIA UD. CONCLUYE QUE ESTE TRATAMIENTO ES MUY RECOMENDABLE, YA QUE SU EFICACIA ES DE 100% . ES CORRECTA TAL CONCLUSIN?. FUNDAMENTE.

252

EN UNA EXPERIENCIA PARA COMPARAR LOS EFECTOS DE LA DROGA A CON LOS DE LA DROGA B, LOS AUTORES ENCUENTRAN UNA DIFERENCIA, EN PORCENTAJE DE XITO, A FAVOR DE LA DROGA B, DE UN 15%, CON UN NIVEL DE SIGNIFICACIN DE p=0,07 INDIQUE: SI HUBO O N DIFERENCIAS EN LA TASA DE XITO CON AMBOS TRATAMIENTOS. FUNDAMENTE.

253

SI CONCLUYE QUE NO LAS HUBO, SEALE ALGUNAS CAUSAS QUE PODRAN JUSTIFICAR LO ENCONTRADO

EN UNA POBLACIN DE 220.000 PERSONAS, UD. DESEA SABER LA PROPORCIN DE PORTADORES DE MENINGOCOCO. SU ESTIMACIN ES DE APROXIMADAMENTE 6%. DETERMINE EL TAMAO MUESTRAL PARA TENER UN ERROR DE HASTA 3% EN LA PROPORCIN DE PORTADORES, CON UN 95% DE SEGURIDAD.

254

EN UN ESTUDIO DE PREVALENCIA DE UNA CONDICIN PATOLGICA DE iNTERS EN LA POBLACIN DE NIOS DE 5 A 14 AOS DE EDAD, UD. DESEA SABER CUANTOS NIOS DEBE INCLUIR LA MUESTRA SI NO TIENE NINGUNA INFORMACIN ACERCA DEL VALOR APROXIMADO DE DICHA PREVALENCIA Y DESEA QUE LA CIFRA ENCONTRADA NO DIFIERA MAS DE UN 2%

255

ALREDEDOR DE LA VERDADERA, CON UN NIVEL DE CONFIANZA DEL 95%.

RESUELVA EL MISMO PROBLEMA CONSIDERANDO QUE EN UN ESTUDIO PILOTO CON 50 NIOS, 5 DE ELLOS PRESENTABAN LA CONDICIN EN ESTUDIO.

256

UD. PUEDE REUNIR 80 CASOS DE ILEO PARALTICO SECUNDARIO A INFECCIN DIGESTIVA GRAVE EN LACTANTES. COMO CONSIDERA HACER UN ESTUDIO CASO-CONTROL CON EL FIN DE ESTUDIAR ALGUNOS FACTORES QUE PUEDEN TENER IMPORTANCIA, EFECTUA UNA ESTIMACIN DE CUANTOS CONTROLES POR CASO LE PERMITIRAN SATISFACER LOS REQUISITOS DE ERROR ALFA 5% Y BETA 20%. LA FRECUENCIA DE EXPOSICIN AL FACTOR MENOS COMUN LA ESTIMA EN 10% EN LOS CONTROLES Y DESEA PODER DETECTAR UN OR DE 2,7 O MAYOR.

EN UN ENSAYO CLINICO CONTROLADO SOBRE LA UTILIDAD DE ANTIINFLAMATORIOS NO ESTEROIDALES

257

EN ARTRITIS REACTIVA, SE SABE QUE EL TRATAMIENTO TRADICIONAL PROPORCIONA MEJORA AL 35% DE LOS PACIENTES (GRUPO A). Ud. desea ser capaz de detectar una diferencia de 10% al utilizar un medicamento nuevo (grupo B).Error alfa 5% y poder del estudio 80%. Determine tamao muestral. Ambos grupos de igual tamao.

258

DETERMINE EL TAMAO MUESTRAL NECESARIO PARA SATISFACER LOS SIGUIENTES REQUISITOS EN UNA COMPARACIN DE DOS GRUPOS INDEPENDIENTES DE UN ENSAYO CLNICO CONTROLADO: LA VARIABLE A COMPARAR TIENE DISTRIBUCIN NORMAL, SE DESEA PODER DETECTAR UNA DIFERENCIA ENTRE PROMEDIOS IGUAL A UNA DESVIACIN ESTNDAR (SUPONIENDO QUE LAS DESVIACIONES ESTNDAR SON IGUALES EN LOS GRUPOS) Y EL ERROR ALFA ES 0,05 Y BETA 0,20. Comente esta forma de calcular el tamao de la muestra. Puede emplear los programas estadsticos Medcalc o Power.

259

BIOESTADISTICA. USTED DESEA EFECTUAR UN ENSAYO CLINICO CONTROLADO PARA PROBAR UN MEDICAMENTO NUEVO. SIN EMBARGO, TIENE LA LIMITACION DE DISPONER DE DOSIS SUFICIENTE PARA 26 TRATAMIENTOS. ANALICE LA CONVENIENCIA DE REALIZAR EL ENSAYO CLINICO , SABIENDO QUE SEGN LA LITERATURA DISPONIBLE, EL TRATAMIENTO VIGENTE TUVO XITO EN 56 DE 145 CASOS TRATADOS HACE UN AO.

260

BIOESTADISTICA
INDIQUE EL TAMAO DE LA MUESTRA QUE ESCOGERIA PARA UN ENSAYO CLINICO EN EL QUE ESPERA QUE UN MEDICAMENTO NUEVO MEJORE LA PROPORCIN DE CURACION EN UN 15%. NO DISPONE DE MAS INFORMACION QUE EL NIVEL DE LOS ERRORES SEGN SU CRITERIO.

261

BIOESTADISTICA
EN LA PLANIFICACION DE UN ESTUDIO UD. HA LLEGADO A LA CONCLUSION QUE REQUIERE UNA MUESTRA DE 52 NIOS Y DESEA CONFIGURAR 2 GRUPOS DE IGUAL TAMAO DISTRIBUYENDO AL AZAR ESTOS 52 CASOS. UTILICE EL PROGRAMA EPIINF0 6.04

262

BIOESTADSTICA. El tratamiento estndar de una enfermedad muestra mejora del 85% de los casos al dcimo da de terapia. Un nuevo medicamento se postula como igualmente efectivo pero con ventajas de costo y aceptacin por parte de los enfermos. Se estima que una diferencia entre ambos de hasta 8% en la proporcin de mejorados al dcimo da, puede ser aceptada y an considerarlos equivalentes. Empleando el programa PS, se calcula el tamao muestral para 85% vs. 77%(diferencia,entonces, de 8%), con error alfa de 5% y poder del estudio de 80% : 401 casos por grupo. Resultado: Mejora al 10 da : Grupo Control = 82% (329/401 casos) Grupo Experimental = 77% (309/401 casos) Diferencia encontrada de 5%. Comparados por EpiInfo 6.04 , p = 0,09 Son equivalentes los tratamientos? (La diferencia encontrada de 5% tiene un IC95% = -0,6 a 10,6 por Medcalc).

263

EN UN ENSAYO CLNICO SE COMPARARON LOS TRATAMIENTOS A Y B, INVESTIGANDO 152 PACIENTES POR GRUPO, MUESTRA SUFICIENTE PARA DETECTAR UNA DIFERENCIA CLNICAMENTE SIGNIFICATIVA DE 15% EN LA VARIABLE ESCOGIDA, CON ERROR ALFA DE 5% Y BETA DE 20%. 1.-CUL ES LA PROBABILIDAD DE DETECTAR UNA DIFERENCIA DE 15% EN LA VARIABLE ESCOGIDA, SI ESTA DIFERENCIA REALMENTE EXISTE? 2.-CUL ES LA PROBABILIDAD DE QUE LA DIFERENCIA ENCONTRADA COMO SIGNIFICATIVA SEA EXPLICADA POR EL AZAR? 3.-SI LA DIFERENCIA ENTRE LOS TRATAMIENTOS A Y B ES DISTINTA DE 15%, CON LA INVESTIGACIN PLANTEADA, SER MAS PROBABLE DETECTAR UNA DIFERENCIA REAL DE 13% O DE 17%?. 4.-SI CON ESTA INVESTIGACIN NO APARECEN DIFERENTES LOS TRATAMIENTOS A Y B, CMO INTERPRETARA TAL HALLAZGO?.

264

SE EFECTU UN ESTUDIO DE COHORTE PARA ESTABLECER LA RELACIN ENTRE SUPLEMENTO DE CALCIO EN LA DIETA Y APARICIN DE FRACTURA DE CADERA EN MUJERES POST.MENOPASICAS.

100 MUJERES CON SUPLEMENTO DE CALCIO Y 100 MUJERES SIN SUPLEMENTO DE CALCIO. EL PERODO DE SEGUIMIENTO FUE DE 5 AOS, DURANTE EL CUAL 5 MUJERES DEL GRUPO CON SUPLEMENTO DE CALCIO PRESENTARON FRACTURA Y 10 DEL GRUPO SIN SUPLEMENTO. CUL ES EL RIESGO DE FRACTURA EN EL GRUPO CON SUPLEMENTO DE CALCIO?. CUL ES EL RIESGO EN EL GRUPO SIN SUPLEMENTO? CUL ES EL RIESGO RELATIVO(RR)? LA INTERPRETACIN CORRECTA DE ESTE RESULTADO (RR) ES QUE EL SUPLEMENTO DE CALCIO: ES PROTECTOR DELETREO NEUTRAL NO SE PUEDE DECIR. EL IC95% DEL RR ES 0,18 2,41. LA INTERPRETACIN CORRECTA ES QUE:

265

A.-HAY UNA ASOCIACIN ESTADSTICAMENTE SIGNIFICATIVA ENTRE ADMINISTRACIN DE CALCIO Y REDUCCIN DEL RIESGO DE FRACTURA DE CADERA. B.-HAY UNA ASOCIACIN ESTADSTICAMENTE SIGNIFICATIVA ENTRE ADMINISTRAR CALCIO Y AUMENTO DEL RIESGO DE FRACTURA DE CADERA. C.-EL RIESGO DE FRACTURA CON CALCIO NO ES SIGNIFICATIVAMENTE DIFERENTE DEL RIESGO SIN SUPLEMENTACIN. D.-SE PUEDE CONCLUIR CON 95% DE CONFIANZA QUE EL SUPLEMENTO DE CALCIO PROTEGE CONTRA LAS FRACTURAS DE CADERA. E.-SE PUEDE CONCLUIR CON 95% DE CONFIANZA QUE EL SUPLEMENTO DE CALCIO AUMENTA EL RIESGO DE FRACTURA DE CADERA EN UNA UNIDAD DE TRATAMIENTO INTENSIVO SE COMPARA LA MEDICIN DE PRESION ARTERIAL DE CO2 CON LA MEDICIN TRANSTUBO DE VENTILACIN MECANICA. ESTUDIA LA SITUACIN EN 192 NIOS Y SE ENCUENTRA QUE: Se acepta que los tramos sealados implican diferentes decisiones clnicas. PaCO2

MM HG

MENOS DE 25 MM HG 46 Y MAS MM HG

25 35 MM HG

36 45

PET CO2
MENOS DE 25 MM HG 29 1 1 0

266

25-35 1 36-45 1 46 Y MAS 45

1 1 0

48 2 1

2 58 1

192
SERIA APROPIADO UTILIZAR EL NUEVO PROCEDIMIENTO?

UN ENSAYO CLNICO CONTROLADO DE 304 PACIENTES, QUE CONSTITUYEN DOS GRUPOS DE 152 CASOS: GRUPO EXPERIMENTAL Y GRUPO CONTROL. Se estudiar la frecuencia de complicaciones con tratamiento habitual (grupo control) y con un nuevo esquema teraputico (grupo experimental) en un lapso de 30 das. EN EL GRUPO CONTROL APARECEN COMPLICACIONES EN 37 CASOS Y EN EL GRUPO EXPERIMENTAL EN 19.

267

INDIQUE SI DIFIEREN SIGNIFICATIVAMENTE LOS GRUPOS EN LA FRECUENCIA DE COMPLICACIONES. CALCULE EL RIESGO DE COMPLICACIONES PARA CADA GRUPO Y SU INTERVALO DE CONFIANZA. CALCULE EL RIESGO RELATIVO DE COMPLICACIONES Y SU INTERVALO DE CONFIANZA. DETERMINE LA REDUCCIN ABSOLUTA DEL RIESGO EN EL GRUPO EXPERIMENTAL Y SU INTERVALO DE CONFIANZA. CALCULE LA REDUCCIN RELATIVA DEL RIESGO (RRR) CON EL NUEVO TRATAMIENTO. CALCULE EL NMERO DE CASOS QUE SE DEBEN TRATAR( NNT)PARA QUE UNO DE ELLOS OBTENGA EL BENEFICIO DEL NUEVO TRATAMIENTO. ESTABLEZCA EL INTERVALO DE CONFIANZA.

268

EXISTE RELACIN ENTRE DURACIN ANAMNSTICA DE LOS SNTOMAS EN NIOS HOSPITALIZADOS CON DIAGNSTICO DE BRONCONEUMONA Y CONCENTRACIN PLASMTICA DE ALBMINA, DE ACUERDO CON LA SIGUIENTE TABLA?

DURACIN ANAMNSTICA DE LOS SNTOMAS(DAS) <5 10 Y MAS < 3,0 38 ALBUMINEMIA 27 (G/DL) 19 3,0 3,4 3,5 Y MAS 13 77 44 40 10 24 59

292

269

BIOESTADSTICA. Dos mdicos examinan 1600 teleradiografas de torax de nios para determinar la existencia de cardiomegalia. Ambos coinciden en que 1565 estn libres del problema, tambin coinciden en que 10 muestran cardiomegalia, pero discrepan en 25 oportunidades:En 18 de ellas el mdico I estima que no hay bases para plantear el diagnstico de cardiomegalia pero el mdico II considera lo contrario.En 7 ocasiones ocurre lo opuesto Qu podra concluir con la informacin proporcionada?.Comente.

270

ESTUDIOS CASO CONTROL. Supongamos una comunidad formada por 500.000 personas. Se dispone de la informacin que el 15% de los habitantes estuvo expuesto a un factor de riesgo de la enfermedad E. Entonces EXPUESTOS EXPUESTOS 15% DE 500.000=75.000 PERSONAS 500.000=425.000 PERSONAS De los expuestos enferma un 3% expuestos enferma un 0,5% Es decir 2.250 habitantes 2.125 habitantes Entonces, el riesgo de enfermar es riesgo de enfermar es 3% NO 85% DE De los No es decir Y aqu el 0,5%

EL RIESGO RELATIVO DE ENFERMAR EN EXPUESTOS Y NO EXPUESTOS ES 3% / 0,5% = 6 ESTO SE DEBE ENTENDER EN EL SENTIDO QUE ES 6 VECES MAS PROBABLE ENFERMAR SI SE HA ESTADO EXPUESTO.

271

Imaginemos ahora que sin saber lo anterior, se efecta un estudio CASO-CONTROL tendiente a averiguar la influencia que pudiera tener la exposicin al factor de inters sobre la incidencia de la enfermedad. Se toman al azar 1.000 casos incidentes, enfermos y 1.000 controles, sanos.Si el azar oper adecuadamente, de los 1.000 casos es esperable que procedan 514 del grupo expuestos y 486 del conjunto de no expuestos(particin proporcional de 1.000 entre 2.250 y 2.125). Por otra parte,de los 1.000 controles debemos realizar una particin proporcional entre 75.000-2.250=72.750(que corresponden a los expuestos que no enfermaron) y 425.0002.125=422.875. Esto genera 147 y 853 controles, respectivamente. Construyendo ahora la correspondiente tabla de 2 x 2: Exposicin Casos 1.000 Controles 1.000 (+) 514 147 (-) 486 853

OR = 6,3 Prevalencia de la enfermedad en la comunidad: (2.250+2.125)/500.000=0,875%. Es posible notar que el OR resulta muy cercano al riesgo relativo en ste ejemplo. Sin embargo esto se debe a que la prevalencia de la enfermedad es baja. Si por el contrario, De los expuestos enferma un 20% expuestos enferma un 3% Es decir 15.000 habitantes 12.750 habitantes El RR en tal situacin es 20 / 3 = 6,66 y De los No es decir,

272

Si repetimos el estudio Caso- control obtendramos Exposicin (+) (-) 540 460 125 873

Casos 1.000 Controles 1.000 OR=8,07

Prevalencia de la enfermedad en la comunidad: (15.000+12.750) /500.000= 5,55% Se puede observar ahora que hay una notable diferencia entre RR y OR.

INTERVALO DE PROPORCIN

CONFIANZA

DE

UNA

APROXIMACIN CUADRTICA DE FLEISS (VLIDA AN SI P EST CERCA DE 0 O DE 1)

273

________________ ________ ( 2 NP + Z - 1) Z - ( 2 + 1/N ) + Z 4P (NQ + 1) Lmite inferior= -----------------------------------------------------------------------2 ( N + Z ) + + + + -

+ Lmite superior=----------------------------------------------------------------------+ Z= 1,96 para alfa = 0,05 N=Total de observaciones P=Proporcin con el factor de inters. Q= 1 - P

274

EN MENINGITIS BACTERIANA UD. DESEA ESTABLECER SI EXISTE UNA RELACIN ENTRE SECUELAS AUDITIVAS Y RETARDO EN INICIAR EL TRATAMIENTO APROPIADO DESDE LAS PRIMERAS MANIFESTACIONES.

LAPSO ENTRE PRIMERAS MANIFESTACIONES E INICIO DEL TRATAMIENTO(DAS). 2 3 4 5 mas das TOTAL

DAO AUDITIVO (+) (-) n n % con dao 2 2 5 9 7 25 29 20 32 40 30 151 6,89 10,00 15,62 22,50 23,33 16,55

275

PROBLEMA. Ud. dispone de la siguiente informacin: El cultivo de orina tiene una Sensibilidad de 100% y una Especificidad de 70%para detectar infeccin urinaria . Calcule el valor Predictivo Positivo del examen en una muestra donde la prevalencia de ITU es de 5%. Respuesta: En la tabla de 2 x 2 , el total sera 100 o 1.Entonces, ITU (+) (+) a UROCULTIVO (-) c a+c d b+d c+d 1 (-) b a+b

Puesto que la prevalencia es 5% ,es decir 0,05 , entonces a+c = 0,05 y b+d = 0,95 ya que la suma debe dar 1 que es el total de la tabla. ITU (+) (+) a UROCULTIVO (-) c 0,05 d 0,95 c+d 1 (-) b a+b

Ahora, la Sensibilidad de 100% significa que a/(a+c) , es decir a/ 0,05 debe ser igual a 1(o 100%). Ello quiere decir que a es igual a 0,05. Por

276

otra parte, la Especificidad de 70% o 0,70 quiere decir que d/(b+d)= 0,70. Puesto que (b+d)= 0,95 , entonces d/0,95 = 0,70 .En consecuencia, d = 0,95 x 0,70 = 0,665. Completando la tabla tenemos ITU (+) (+) 0,05 UROCULTIVO (-) c 0,05 0,665 0,95 c+d 1 (-) b a+b

c debe ser forzosamente = 0 c+d debe ser = 0,665 b debe ser = 0,95 0,665 = 0,285 a+b debe ser=0,285+0,05=0,335 Finalmente, la tabla queda ITU (+) (+) 0,05 UROCULTIVO (-) 0 0,05 0,665 0,95 0,665 1 (-) 0,285 0,335

El Valor Predictivo Positivo buscado es 0,05/0,335 = 0,149 o 14,9%. Entonces con la informacin proporcionada podemos decir que la probabilidad que un urocultivo positivo corresponda a una UTI es de slo 14,9% , para la prevalencia dada.

277

BIOESTADISTICA
DOS MAQUINAS DE IGUAL MARCA, TIEMPO DE USO Y CARACTERISTICAS, CUYA FUNCION ES LLENAR ENVASES DE LECHE LIQUIDA CON EL VOLUMEN DE UN LITRO SON COMPARADAS CON EL FIN DE ASEGURAR QUE NO DIFIEREN EN LOS VOLUMENES ENTREGADOS.EN CADA UNA SE TOMAN 20 MUESTRAS POR MAQUINA,CUYOS RESULTADOS SON: (SUPONGA NORMALIDAD EN LAS DISTRIBUCIONES) COMPARE LOS RESULTADOS. MAQUINA 1 MAQUINA 2 VOLUMEN DE LECHE EN CADA MUESTRA (ML POR ENVASE) 999 1002 995 1003 992 1006 991 1008 1000 1000 989 1012 1003 992 1000 991 989 1000 1003 992 998 1000 997 1001 1002 996 1003 1001 1000 1000 1006 997 1000 999 1002 992 1005 1003 995 993

278

BIOESTADSTICA. GRADO DE ACUERDO ENTRE DOS MTODOS DE MEDICIN CLNICA. FLUJO ESPIRATORIO MXIMO.
PACIENTE 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 MTODO USUAL MTODO NUEVO LITROS / MINUTO 494 512 395 430 516 520 434 428 476 500 478 189 178 423 427 557 413 442 650 433 417 656 267 330 478 389 365 290 347 400 299 407 279 405 279 477 259 249 350 451 600 364 380 658 445 432 626 260 420 477 360 400 285 330 408 310 380 302 390 367

279 REEMPLAZARA EL MTODO USUAL POR EL NUEVO MTODO?. CONSIDERE QUE STE LTIMO ES MAS SENCILLO Y MAS BARATO QUE EL ANTERIOR.

280

281

282

BIOESTADISTICA
EN 85 PACIENTES CON SIDA SE ENSAYAN 2 MEDICAMENTOS(A Y B)QUE PRESUMIBLEMENTE TIENEN UN EFECTO PREVENTIVO SOBRE EL DESARROLLO DE TBC.LUEGO DE 12 MESES SE OBSERVAN LO SIGUIENTES RESULTADOS.ANALICE Y CONCLUYA. TRATAMIENTO A TBC(+) TBC(-) TOTAL 12 33 45 B 5 35 40 17 68

85

BIOESTADISTICA.

283 INDICE KAPPA DE CONCORDANCIA. ERROR ESTANDAR DE KAPPA = 0 EE


K=0

= R. C ( p azar / N( 1 - p azar))

R C = RAIZ CUADRADA. ERROR ESTANDAR DE KAPPA ENCONTRADO. EE


K

= R C ( pe ( 1 - pe)

N ( 1 - p azar )2 )

COMPARACION DE DOS INDICES KAPPA


2
K1 K2

Z = ( K1 - K2 ) / RC ( EE + EE )

284

BIOESTADISTICA.
EN 100 RECIEN NACIDOS DE BAJO PESO AL NACER SE ENCONTRO QUE 28 DE ELLOS ERAN HIJOS DE MADRES MENORES DE 20 AOS DE EDAD. EN 200 RECIEN NACIDOS CON PESO ENTRE 3000 Y 3500 GR, 32 DE ELLOS TENAN EL MENCIONADO ANTECEDENTE. * IDENTIFIQUE EL TIPO DE ESTUDIO. ** CONSTRUYA LA TABLA RESPECTIVA *** SEALE EL ESTADIGRAFO A EMPLEAR , CALCULELO Y DETERMINE SU IC 95%. ****SON MAS COMUNES LAS MADRES MAS JOVENES EN AQUELLOS QUE TUVIERON BAJO PESO AL NACER?. *****CALCULE EL PODER DEL ESTUDIO Y COMENTE EL HALLAZGO.

DR. GASTON DUFFAU T.

(Los numeros de telfono o fax deben ser precedidos por el cdigo de pais y el de la ciudad) EN HOSPITAL ROBERTO DEL RO: RESIDENCIA: DIRECCIN: SIMN BOLIVAR 3127 DEPTO. 501 PROFESOR ZAARTU 1085 UOA DEPTO. DE PEDIATRA SANTIAGO FONOFAX: 7371047 FONOFAX 3412624 E- MAIL xv-gd@ ctcinternet.cl

285

BIOESTADISTICA.
ANALISIS ESTRATIFICADO.
EN 135 NIOS QUE TUVIERON MENINGITIS BACTERIANA AGUDA 102 PUDIERON SER CONSIDERADOS SIN SECUELAS APARENTES AL ALTA Y 33 PRESENTABAN PROBLEMAS DE DIVERSA INTENSIDAD,CONSIDERADOS SECUELAS NEUROLGICAS. SE PLANTEA LA HIPOTESIS QUE EXISTE UNA RELACION ENTRE LA PRESENCIA DE SECUELAS Y LA TARDANZA EN EL DIAGNOSTICO. ENTONCES: EXPOSICION SERIA TARDANZA O PRECOCIDAD DEL DIAGNOSTICO Y RESULTADO: PRESENCIA O AUSENCIA DE SECUELAS DETECTABLES AL EGRESO

SECUELAS NEUROLOGICAS SI SI EXPOSICION (TARDANZA) NO 9


X

NO 70

24

32
7=

ENTONCES, OR = 24/70 / 9/32 = 24 X 32 / 70

135 1,219 ( IC 95% :

AHORA BIEN, EL GRUPO DE 135 NIOS ESTABA CONSTITUIDO POR ENFERMOS DE DOS PERIODOS ANUALES Y RESULTO DE INTERES SABER SI LOS DOS GRUPOS POR SER DE PERIODOS DIFERENTES ERAN COMPARABLES O N.

GRUPO 1
15 1 37 22

GRUPO 2
9 8 33 10

75 OR = 8,92 ( ) OR = 0,34 (

60 )

PRUEBA DE HOMOGENEIDAD:
2 2

= ( Ln OR 1 - LnOR 2 )

/
2

( Varianza 1 + varianza 2)
+ 0.366 ) = 10,6738/1,505 = 7.09

( 2,18829 - ( - 1,0788) ) / ( 1,139 y para 1 g.l. p= 0,0078 (varianza(ln OR) es = ( 1/a + 1/b + 1/c + 1/d )

EN CONSECUENCIA: AMBOS GRUPOS HISTORICOS SON SIGNIFICATIVAMENTE DIFERENTES, MOSTRANDO DIFERENTE RIESGO DE SECUELAS DE MENINGITIS BACTERIANA SEGUN TARDANZA EN EL DIAGNOSTICO.

BIOESTADISTICA

286

IC 95% PARA EL RIESGO RELATIVO ( RR)


EXPUESTOS NO EXPUESTOS si RESULTADO no C D A B

IC 95% = (RR) exp [ + 1,96 Rc ( 1- A / (A+C)) +


A

( 1- B / ( B + D)) B

Rc = RAIZ CUADRADA exp = BASE DE LOS LOG NATURALES ELEVADA A LA CANTIDAD ENTRE PARENTESIS.

UN PROCEDIMIENTO MAS BREVE: ( 1 + 1,96 Rc [ 2] )

IC 95% = RR

Rc = RAIZ CUADRADA 2= Ji CUADRADO. SE COLOCA EL VALOR DE Ji CUADRADO CON CORRECCION DE YATES OBTENIDO DE LA TABLA DE 2 X 2.

287

IC 95% PARA ODDS RATIO ( OR )

Casos
SI A

Controles
B

EXPOSICION
NO C D

IC 95% = Ln OR + 1,96 Rc [ 2 ]

Ln = Log natural

2 = Ji cuadrado con correccion de Yates obtenido de la tabla de 2 x 2.


Rc = Raiz cuadrada

TAMBIEN SERA:

( 1,96 Rc ( 1/A + 1/B + 1/C + 1/D ) ) IC95% = (OR) exp.


exp. = BASE DE LOGARITMOS NATURALES ELEVADA A LA CANTIDAD ENTREPARNTESIS. Rc. = Raiz cuadrada.

288

Diagrama de flujo para determinar un procedimiento estadistico apropiado para inferencia sobre proporciones

La muestra es grande o pequea?

/
Muestra pequea < 5 casos esperados por celda

\
Muestra grande => 5 casos esperados por celda.

|
N de muestras

|
N de muestras

/
Una

/
Dos independientes

|
Mas de dos independientes

/
Una

/
Dos pareadas

|
Dos independientes

\
Mas de dos independientes

|
La prop. difiere de lo teorico?

|
Las prop. difieren?

|
Las prop. difieren?

|
Las prop. difieren?

La prop. Las proporciones Las proporciones difiere difieren? difieren? de lo teorico?

|
Calcule probabilidad segn distribucion subyacente

|
Fisher exacta

|
Q de Cochran

|
Ji2 bondad del ajuste

|
McNemar

|
Ji2 (tabla 2x2) Z

|
Ji2 (tabla r x c)

289

Diagrama de flujo para determinar un procedimiento estadistico apropiado para inferencia sobre promedios.

La muestra es grande o pequea?

/
Grande => 30 casos por grupo

\
Pequea < 30 casos por grupo

|
Cuantas muestras?

|
Cuantas muestras?

/
Una dos

|
independientes

\
> dos
independientes

/
Una

/
dos

|
dos

\
> dos

relacionadas independientes independientes

|
difiere el promedio del valor terico?

|
difieren los promedios o varianzas

|
difieren los promedios o varianzas?

|
difiere el promedio del valor terico

|
difieren los promedios?

|
difieren los promedios o varianzas?

|
difieren los promedios o varianzas?

|
ANOVA

|
F t para muestras independientes

|
ANOVA

F Z Z (La distribucin debe ser normal)

t para t para un promedio muestras relacionadas

290

XXXXI. EJERCICIOS DE ANLISIS CRTICO DE LA LITERATURA.

CALCULO DEL TAMAO MUESTRAL. Pediatrics, 1998;101:229-235. BIRTH OUTCOME FROM A PROSPECTIVE, MATCHED STUDY OF PRENATAL CRACK/COCAINE USE: I. INTERACTIVE AND DOSEEFFECTS ON HEALTH AND GROWTH. Se trata de un estudio prospectivo diseado para determinar los efectos del contacto prenatal con cocaina(por consumo materno) sobre el resultado del embarazo y desarrollo del nio. Diseo del estudio: Para minimizar sesgos posibles en el enrolamiento de los sujetos y obtener la mas temprana historia posible de drogas, se intent enrolar prospectivamente un amplio margen de consumidoras con controles pareados cuando contactaron por primera vez el sistema de salud, ya fuera la clnica obsttrica o el hospital. Para permitir una posible prdida de sujetos- estimada en 33% durante el seguimiento- y an mantener el poder estadstico, con p=0.05, para detectar un efecto del tamao de 1/3 de desviacin estndar sobre los resultados de desarrollo infantil(DE para las escalas de Bayley=15), se determin que se requerira enrolar 150 consumidoras y 150 controles pareados. Las muestras son independientes? Cual es el poder del estudio? Que opina de una posible prdida de casos en el seguimiento de 33%?.Esto se resuelve aumentando los sujetos que ingresan al estudio? El correcto el tamao muestral?

291

CALCULO DEL TAMAO MUESTRAL Arch Dis Child 1998;79:405-410. ENSAYO CONTROLADO RANDOMIZADO DE AMINOFILINA PARA EL ASMA AGUDO GRAVE. Este estudio pretende responder a la pregunta Los nios con asma severa aguda que no responden a dosis frecuentes de beta agonistas, ipratropio y esteroides, se benefician de la adicin de aminofilina , proporcionada por va intravenosa? Las medidas de resultado fueron: La principal: Duracin de la hospitalizacin. La secundaria: Espirometra con espirmetro porttil

Los clculos de tamao muestral se efectuaron usando el programa .PC Size. De acuerdo con datos recientes de la institucin para pacientes con asma grave, el promedio de hosptalizacin es de 2,3 das con una desviacin estndar de 1,0 da. Una reduccin en la duracin de la internacin de 12 horas fu considerada la diferencia mnima clnicamente importante. Para detectar una reduccin de estada de medio da con poder de 90% y error alfa de 5%, se estim necesario estudiar 86 nios por grupo y en total 172. Verifique el tamao muestral

292

CALCULO DEL TAMAO MUESTRAL Pediatr Infect Dis J. 1999;18:403-409. UNA DOSIS DE CEFTRIAXONE VERSUS 10 DAS DE TRATAMIENTO CON AMOXICILINA/CLAVULANATO PARA OTITIS MEDIA AGUDA:EFICACIA CLINICA Y CAMBIO DE LA FLORA NASOFARNGEA. Objetivo: Comparar la eficacia y seguridad de una sola dosis intramuscular de ceftriaxone, 50 mg/kg., vs. un curso de 10 das de amoxic/clav. ,80mg/kg/d de amoxicilina:10 mg/kg/d de clavulanato en 3 dosis ,en nios con otitis media aguda y evaluar los cambios en la flora nasofarngea despus del tratamiento. Estadstica: El anlisis estadstico se llev a cabo para verificar equivalencia. La mxima diferencia que se tolerara entre los dos grupos de tratamiento para aceptar equivalencia era 10%. La hiptesis de equivalencia unilateral fu: Ps=frecuencia de xito con el tratamiento estndar (amoxicilina/clavulanato). Pn=frecuencia de xito con la droga experimental,ceftriaxone) H0= hiptesis de no equivalencia= Ps - Pn = mayor que 10%. H1=hiptesis de equivalencia= Ps - Pn = o < 10%. Error alfa=0.05 Error beta 0.20 Los investigadores incluyeron un total de 513 pacientes , que constituyeron al azar dos grupos: 255 y 258 casos. Comentario: En este estudio se da por sentado que el tratamiento estndar con amoxicilina/clavulanato es mejor que el experimental , ceftriaxone, en un nivel que si la diferencia en los xitos es menor o igual a 10% , se declarar que los tratamientos son equivalentes y si es mayor se dir que es superior el tratamiento estndar. Como se ve, no se contempla

293

la posibilidad que ceftriaxone resulte superior.Si los investigadores estn a tal punto convencidos que ceftriaxone es inferior, puesto que no contemplan siquiera que la equivalencia sea en el sentido que ceftriaxone supere al tratamiento tradicional en una proporcin de xitos de 10% o menos, entonces no es tico someter al grupo experimental a un tratamiento que se reconoce como inferior. Tras esto se encuentra muy probablemente el problema de alcanzar el tamao muestral requerido ,puesto que si se va a estudiar una diferencia de 10% entre dos terapias(80% de xitos vs. 70%), con opcin bilateral, para error alfa de 5% y beta de 20%(poder 80%), se requieren(segn programa Power) 293 casos por grupo si se emplear como prueba de hiptesis Ji cuadrado no corregido y 313 casos por grupo si se utilizar Ji cuadrado con correccin de Yates o Fisher -Irwin. En el estudio se dispuso de 255 nios y 258.

294

EMPLEO DE PLACEBO. Pediatrics 1998;102:531-537. PALIVIZUMAB, A HUMANIZED RESPIRATORY SYNCYTIAL VIRUS MONOCLONAL ANTIBODY, REDUCES HOSPITALIZATION FROM RESPIRATORY SYNCYTIAL VIRUS INFECTION IN HIGHRISK INFANTS. Objetivo:Determinar seguridad y eficacia de la profilaxis con palivizumab en reducir la incidencia de hospitalizacion debida a infeccin por VRS en lactantes de alto riesgo. En ste estudio se emple placebo vs. palivizumab existiendo una recomendacin de la Academia Americana de Pediatra de emplear Inmunoglobulina en los casos que investiga el estudio en cuestin. Cuando hay un tratamiento estndar, y en ste caso se puede considerar que s lo hay, la comparacin de una nueva teraputica no debe hacerse con placebo sino con el manejo estndar.

295

EMPLEO DE PLACEBO. Epilepsia 1999;40:973-979. Lamictal (Lamotrigine) monotherapy for typical absence seizures in children. Propsito del estudio:Investigar si la monoterapia con lamotrigine en la patologa de inters es efectiva y segura en nios de 3 a 15 aos de edad. Se estudiaron 45 pacientes recien diagnosticados y se les administr el medicamento en dosis crecientes-con un lmite preestablecido-hasta obtener respuesta, consistente en la desaparicin total de las manifestaciones neurolgicas. Los respondedores fueron ingresadosentonces a un ensayo clnico controlado con placebo ,randomizado ,doble ciego. Se defini como xito la mantencin del estado sin convulsiones.Quienes recibieron placebo-entonces- fueron aquellos que habiendo respondido al medicamento, les correspondi en la aleatorizacin,pertenecer al grupo placebo. Esta fase del estudio se plane para durar 4 semanas. En el clculo del tamao muestral-para esta fasese sela que 13 casos porgrupo proveern un poder de 0,86 para una prueba bilateral ,con error alfa de 5%, suponiendo que el 20% de aquellos con placebo se mantendrn libres de convulsiones y un 80% del grupo con lamotrigine. Finalmente, se compararon dos grupos de 14 nios respondedores y encontraron una diferencia significativa entre ellos en la variable de inters.Las conclusiones son que el medicamento es efectivo y generalmente bien tolerado. En este estudio se pueden hacer varias observaciones pero mencionaremos slo algu nas: 1.-El empleo de placebo no est justificado. Los autores declaran que existen tratamientos altamente efectivos para esta patologa y en tal caso la comparacin de una nueva terapia debe realizarse contra el manejo considerado estndar o uno de ellos si son varios. 2.-El estudio de seguridad del nuevo medicamento- con slo 45 casosresulta muy insuficiente. Por ejemplo, el no hallazgo de ningn paciente con algun efecto grave(0/45) es compatible con una cifra verdadera en el universo del cual procedi la muestra, de hasta 9,79%(Fleiss).

296

3.-En el clculo del tamao muestral se supone una hiptesis bilateral pero el planteamiento es unilateral al decir que la proporcin de xito se espera sea de 80% en el medicamento y 20% en el placebo. Esto significa que para los autores ya es mejor el medicamento y en consecuencia estn tratando a aquellos con placebo, con una terapia inferior, lo que no es aceptable. Por otra parte la diferencia establecida como de inters para detectar es de 60%(80-20), lo que es tambin inaceptable puesto que ello tienne el significado que en la eventualidad que la diferencia real fuera inferior a 60%-digamos 50%-ya no les interesara detectarla y de hecho as ocurrira con el tamao muestral planteado(Se recuerda que el clculo del tamao muestral establece las condiciones para detectar la diferencia planteada o una mayor pero n menor). En tal caso la conclusin sera que no hay una diferencia significativa entre placebo y el medicamento nuevo. 4.-La eficacia del medicamento debera ser establecida incluyendo los fracasos en la primera etapa,para identificar los respondedores, donde se estableci que 11/45= 24,4% era la proporcin de fracaso

297

ESTUDIANDO EQUIVALENCIA DE RESULTADOS. Intensive Care Med ,2001;27:660-664. EQUAL ASPIRATION RATES IN GASTRICALLY TRANSPYLORICALLY FED CRITICALLY ILL PATIENTS. AND

Objetivo del estudio:Determinar la diferencia en la frecuencia de aspiracin entre pacientes alimentados por sonda nasogstrica vs. transpilrica, en una Unidad de tratamiento intensivo. Diseo:Estudio prospectivo randomizado de pacientes crticamente enfermos(para recibir alimentacin por sonda gstrica o transpilrica). Medicin isotpica de la presencia de aspiracin. Medidas y Resultados: En 27 enfermos alimentados por sonda nasogstrica 2 (7%) mostraron evidencias de aspiracin ,comparados con 3 de 24 (13%) alimentados por sonda transpilrica.Diferencia no significativa. Conclusin:No hubo diferencia en la frecuencia de aspiracin en pacientes crticamente enfermos alimentados popr sonda gstrica o transpilrica. Observaciones: 1.-Los autores sealan que el tamao muestral fue establecido en 54 pacientes, suficiente para detectar una diferencia de 30% en la frecuencia de aspiracin, con un poder de 80% y error alfa inferior a 5%, lo que es correcto. El ttulo del artculo no coincide con esto, ya que se est planteando detectar una diferencia de 30% o mayor en la frecuencia de la complicacin buscada y no una posible equivalencia, al respecto, entre los tratamientos estudiados. En ste ltimo caso no sera aceptable como diferencia 30%, puesto que debera plantearse una mucho menor para decidir igual frecuencia de complicacin aspirativa.Como sea, los autores concluyen que no existe diferencia. 2.-La diferencia encontrada es de 6%(13% - 7%) y no es significativa. Sin embargo, ello no permite concluir como lo hacen los autores ,ya que el IC95% de tal diferencia es ancho y se extiende desde 10,5% hasta 22,5%, naturalmente pasando por cero, ya que no haba diferencia

298

significativa entre los grupos PERO, la diferencia en el Universo del que proceden los casos estudiados tiene un 95% de probabilidad de encontrarse entre 10,5% y +22,5%, de modo que difcilmente se podra aceptar la afirmacin que los tratamientos generan resultados equivalentes. 3.-Mencionaremos que la diferencia encontrada de 6%, para el tamao muestral tena una probabilidad de ser detectada como real (poder del estudio) de slo 10% (error beta de 90%, en consecuencia.).

299

ESTUDIO DE EQUIVALENCIA. J. of Pediatrics 2000;136:298:303. A SINGLE DOSE OF INTRAMUSCULARLY ADMINISTERED DEXAMETHASONE ACETATE IS AS EFFECTIVE AS ORAL PREDNISONE TO TREAT ASTHMA EXACERBATIONS IN YOUNG CHILDREN. Frecuentemente se prescribe para nios con exacerbaciones leves o moderadas de asma, tratamientos cortos con prednisona administrada por va oral. Desagraciadamente, estos preparados tienen mal sabor y muchos nios rehusan tomarlos, lo que se traduce en persistencia de las molestias respiratorias y en ocasiones en necesidad de hospitalizacin. Una opcin ante este panorama lo constituye el empleo de corticoides intramusculares de liberacin lenta. Objetivo: Evaluar si una dosis nica i.m. de acetato de dexametasona (IM. DEX.) es tan segura y efectiva como un tratamiento de 5 das con prednisona oral(PO. PRED.) en el tratamiento de la patologa mencionada. Diseo del estudio: En un centro terciario de atencin se realiz este estudio, randomizado,prospectivo,ciego para el investigador , en nios de 6 m a 7 aos de edad, que requeran corticoides para tratar exacerbaciones leves o moderadas de asma bronquial, ambulatoriamente. Los pacientes fueron randomizados para recibir una dosis nica de 1,7 mg/kg de IM.DEX o bien 2 mg/kg por 5 das de PO. PRED. Se consign en el hogar: Puntaje clnico de asma, cambios conductuales, empleo de albuterol y tolerancia al medicamento, por 7 das. La relacin cortisol/creatinina en primera miccin de la maana se determin en el da 14. Las medidas primarias de resultado fueron: Cambio en el puntaje clnico de asma al da 5 y tolerancia al medicamento. Estadstica: El tamao muestral requerido para obtener un poder de 80% en el estudio, con el fin de detectar una diferencia de 2 puntos en el puntaje clnico al da 5, con un error alfa de 5% y una desviacin estndar estimada de 2, fue de 16 sujetos por grupo. Resultados: 15 pacientes del grupo IM. DEX y 17 del grupo PO. PRED. completaron el estudio.El puntaje clnico de asma mejor

300

significativamente en ambos grupos durante los primeros 5 das de tratamiento y no se observ una diferencia significativa en la frecuencia de mejora entre los dos grupos. Tres nios rehusaron mas del 75% de sus dosis de prednisona y otros 4 perdieron del 30 al 50% de las dosis, pese a los esfuerzos de sus padres. La inyeccin intramuscular no caus complicaciones y aproximadamente 70% de los padres en ambos grupos establecieron que ellos escogeran MI. DEX para tratar la siguiente exacerbacin de asma de sus nios. Conclusin: En este grupo de nios una inyeccin nica intramuscular de dexametasona fue tan efectiva como un tratamiento de 5 das de prednisona oral para el manejo ambulatorio de exacerbaciones leves o moderadas de asma bronquial. Observaciones: Nos centraremos en ciertos elementos fundamentales: 1.-Este es un estudio de equivalencia clnica de dos formas de tratamiento. 2.-El puntaje clnico es una variable ordinal y no procedera calculo de promedio y desviacin estndar. 3.-Aunque se acepte lo anterior, no hay justificacin plausible para la estimacin de una desviacin estndar de puntaje clnico de 2, para detectar una diferencia de promedios al quinto da, tambin de 2. En tales circunstancias , para poder de 80% y error alfa de 5%, el nmero de casos por grupo siempre es 16. Tratndose de un estudio de equivalencia, debera establecerse la mxima diferencia aceptable(para an poder considerar que los tratamientos son equivalentes) a partir del punto cero diferencia. Esto no se hizo y la proporcin de nios sin sntomas al quinto da fue de 73% y 65% en los dos grupos. Tal diferencia no es significativa PERO su IC95% va de 23,9% hasta + 39,9% por lo que difcilmente se podra sostener que los tratamientos son equivalentes. Por otra parte, para detectar como significativa la diferencia encontrada de 8% , el estudio tiene un poder inferior a 10%.

301

TRATAMIENTO DE SEPSIS. NEJM 2001;344:699 705. EFFICACY AND SAFETY OF RECOMBINANT HUMAN PROTEIN C FOR SEVERE SEPSIS. El producto en estudio tiene propiedades antitrombticas, antiinflamatorias y fibrinolticas. En una investigacin previa, produjo reducciones dependientes de la dosis e los marcadores de coagulacin en pacientes con sepsis grave. En la presente investigacin se establece acaso el tratamiento con el producto reduce la frecuencia de fallecimiento por cualquier causa entre los enfermos de sepsis grave. Mtodo: Estudio multicntrico.Doble ciego randomizado,controlado con placebo. Los pacientes con inflamacin sistmica y falla orgnica debida a infeccin aguda, fueron enrolados y asignados para recibir una infusin intravenosa de placebo o proteina C(drotrecogin alfa,activada), durante 96 horas.La medida primaria de resultado fue frecuencia de muerte por cualquier causa en los 28 das que siguieron al finalizar la infusin. Adems, se consignaron efectos adversos,cambios en los signos vitales,variables de laboratorio y desarrollo de anticuerpos contra proteina C activada. Resultados:1690 enfermos fueron randomizados: 840 en el grupo placebo y 850 en el grupo experimental.Con criterio preestablecido se suspendi la investigacin cuando se haban estudiados 1520 casos , momento en que la diferencia entre ambos grupos era aparente (p=0.005). (RRR=19.4%) (RAR=6.1%). La incidencia de hemorragia grave fue mayor en el grupo experimental(aunque no significativamente), 3.5% vs. 2% y p= 0.06. Conclusiones: El tratamiento con drotrecogin alfa activado reduce significativamente la mortalidad en pacientes con sepsis severa y puede asociarse con un riesgo aumentado de sangramiento. Observaciones: 1.-En este estudio hay conflicto de intereses si consideramos que los primeros 5 autores declaran ser consultores o empleados del laboratorio que fabrica el medicamento en prueba.

302

2.-La investigacin involucr a 11 paises y 164 centros, de modo que cada centro contribuy en promedio con algo mas de 10 pacientes.Esto supone una variabilidad de criterios muy grande. 3.-No hay una hiptesis formalmente planteada. 4.-No hay clculo del tamao muestral. 5.-Las caractersticas basales de los dos grupos mostraron una diferencia significativa en el rubro tiempo desde la primera disfuncin orgnica hasta el inicio de la infusin teraputica(varianza). Esta diferencia se mantiene an despus de efectuar la correccin de Bonferroni. Entonces, los grupos no eran comparables al inicio. 6.-NNT para evitar un fallecimiento fue de 16,4 pero con un IC95% de 9,61 a 52,6. Si consideramos el riesgo de un evento hemorrgico grave de 2% (IC95% =1,2 3,3) vs. 3,5% (IC95%= 2,4 5,06%), est dentro de lo probable una diferencia de 1,76 (entre las cifras mayores: 5,06-3,3), lo que generara un NNT de 56,8.Esto nos llevara a pensar que est dentro de lo probable que el nmero necesario a tratar para evitar un fallecimiento (hasta 53) se acerque mucho al nmero necesario a tratar para generar un evento hemorrgico grave adicional (57), lo que debera ser tomado en cuenta.

303

HIPTESIS DE EQUIVALENCIA DE RESULTADOS, QUE NO SE PLANTE. Pediatr Infect Dis J 2000;19:1060-1067. ORAL CIPROFLOXACIN VS. INTRAMUSCULAR CEFTRIAXONE AS EMPIRIC TREATMENT OF ACUTE INVASIVE DIARRHEA IN CHILDREN. Debido a la creciente resistencia de los patgenos entricos a los antibiticos orales comnmente empleados,la ceftriaxone intramuscular ha llegado a ser una droga de rutina en el tratamiento de la diarrea aguda invasiva que acude a Servicios de Emergencia. Los inconvenientes de ste regimen parenteral han creado una necesidad creciente de formulaciones peditricas orales para estos tratamientos. Objetivos:Evaluar la eficacia y seguridad de una suspensin de ciprofloxacin en el tratamiento de diarrea aguda invasora en lactantes y nios mayores. Pacientes y mtodos: 201 nios evaluables ,de 6 meses a 10 aos de edad, con diarrea aguda invasiva fueron randomizados para recibir ciprofloxacina en suspensin+ placebo im.(n=95) o ceftriaxone im. +placebo en suspensin(n=106), durante tres das, de modo doble ciego. Resultados:Se aislaron 127 patgenos de 121 pacientes(60%): Shigella, Salmonella, E.Coli y Campylobacter. Entre el cuarto y quinto da se constat erradicacin bacteriolgica comparable en ambos grupos, as como % de curacin o mejora(100% y 99%).Eventos posiblemente relacionados con las drogas empleadas fueron leves y transitorios, con frecuencia de 8% en ciprofloxacino y 4,7% en ceftriaxone. Conclusin:La ciprofloxacina oral es tan segura y efectiva como la ceftriaxona intramuscular para el tratamiento emprico de la diarrea aguda invasiva en pacientes peditricos ambulatorios que requieren visita al Servicio de Emergencia.

Observaciones:

304

1.-No hay una hiptesis formalmente planteada, aunque debera entenderse que realmente es una hiptesis de equivalencia de resultados entre los dos tratamientos sometidos a estudio. 2.-No hay clculo de tamao muestral. 3.-La situacin real con los integrantes del estudio fue as: 221 casos enrolados. * 111al grupo cipofloxacino:Se excluyen 16 (6 por vmitos y DH) 110 al grupo ceftriaxone :Se excluyen 4 (0 por vmitos y DH) [16 vs. 4 , p=0,0085] y [6 vs. 0 , p=0,029] Entonces, ya difieren los grupos. * * Quedan 221 casos disponibles para anlisis. * 95 ciprofloxacino --106 ceftriaxone 4.-Si consideramos la proporcin de nios considerados curados al cuarto-quinto da de tratamiento, tenemos 81%(77/95) en el grupo con ciprofloxacino y 69%(73/106) en el grupo con ceftriaxone. La diferencia no es significativa(p=0,07) pero claramente no se puede concluir que los tratamientos son equivalentes. Si consideramos el IC95% de la diferencia de resultados(81% vs 69%) encontramos por Medcalc y por EpiDat, respectivamente: IC95% = -0,2% - 23,8% -0,4% - 24,4% Entonces,est dentro de lo probable que la diferencia en la proporcin de curacin llegue a ser tan grande como mas del 20%, lo que no sera aceptable para una hiptesis de equivalencia de tratamientos. En consecuencia, la conclusin que expresa el estudio no es correcta.

305

CONCORDANCIA. BMJ 1995;310:624-627. PROSPECTIVE STUDY OF COMBINED USE OF BRONCHIAL ASPIRATES AND BIOPSY SPECIMENS IN DIAGNOSIS AND TYPING OF CENTRALLY LOCATED LUNG TUMORS. En sta investigacin se obtuvo en cada paciente resultados de citologa por aspirado bronquial y por biopsia. E una primera tabla se muestra la clasificacin de 1225 parejas de exmenes. Positiva CITOLOGA Positiva Negativa M. no satisf. Total 424 55 7 486 BIOPSIA Negativa Muestra no satisfactoria 96 11 612 7 12 1 720 19

Total 531 674 20 1225

Los autores indican que hay una concordancia exacta entre resultados de citologa y biopsia en el 87.3% de las muestras satisfactorias. Ud. estara de acuerdo con lo expresado? En realidad el concepto de concordancia se refiere a la medida en que uno de los procedimientos podra subrogar(reemplazar) al otromas all del grado de acuerdo que pudieran mostrar por azar. En ste sentido la tabla completa, tal como es mostrada en el artculo,( con un % bruto de acuerdo como el declarado, de 87,3 ), nos proporciona un ndice kappa de concordancia de 0,69 (IC95% =0,64 - 0,74)..que se encuentra en la categora de substancial(0,61 hasta 0,80). Se requerira decidir si ese nivel es lo suficientemente elevado ,considerando la gravedad de la patologa en estudio. Ahora , si eliminamos los casos con muestra insatisfactoria, como hacen los autores, el ndice kappa sube slo a 0,74 (IC95%= 0,68 - 0,79). En ste caso, si nos centramos en el % bruto de desacuerdo, veremos que es de 13%. Para mayor informacin, en la tabla 2 del artculo se presenta la concordancia de los procedimientos para clasificar los hallazgos en 424 tumores detectados y se encuentra un ndice kappa para ello de slo 0,59 (IC95% = 0,52 - 0,65):

306

Ca cel.escamosas, AdenoCa, o Ca poco diferenciado. Ca cel. escamosas, 295 adenoCa o Ca poco diferenciado

Resultados de Biopsia Ca cel. Ca cel. grandes pequeas. 19 1 0 4 24 4 0 51 13 68

Ca indiferenc. 10 0 6 6 22

C I T O L

Ca cel. grandes. Ca cel. pequeas. Ca indiferenc. TOTALES

3 2 10 310

307

NEJM ,2000;343: 463 467. RACECADOTRIL IN THE TREATMENT OF ACUTE WATERY DIARREA IN CHILDREN. Resumen:Racecadotril(acetorphan) es un inhibidor de encefalinasa, con acciones antisecretoras y antidiarreicas que ha probado ser seguro y efectivo en el tratamiento de diarrea aguda en adultos y nios. Se desconoce si el tratamiento con racecadotril y terapia de rehidratacin oral es mas efectivo que sta ltima sola en nios hospitalizados con diarrea aguda. Mtodos: Se trataron 135 nios-varones-de 3 a 35 meses de edad que tenan diarrea acuosa de 5 o menos das de duracin, con racecadotril (1,5 mg /kg de peso ,oral, cada 8 horas) o placebo, adems de solucin para rehidratacin oral. Las medidas primarias de resultado fueron: - prdidas por deposiciones en 48 horas, - prdidas totales por heces, - duracin de la diarrea y - cantidad total de solucin oral ingerida. Resultados:Las prdidas por heces en 48 horas (promedio y error estndar fueron 92 g/kg + 12 g en el grupo con racecadotril y 170 g/kg + 15 g en el grupo placebo(p<0,001).Esto represent una disminucin de 46% en el grupo con racecadotril.Los resultados fueron similares en 73 nios con rotavirus, mostrando 157 + 27g por kg en el grupo con racecadotril y 331 + 39 g por kg en el grupo placebo (p<0,001). La mediana de duracin de la diarrea fue significativamente menor(p<0,001) en quienes recibieron racecadotril (28 horas, independientemente de la presencia de rotavirus), que en los tratados con placebo (72 y 52 horas, respectivamente, para los casos con y sin rotavirus). La ingesta de solucin hidratante oral fue significativamente menor en el grupo con racecadotril(p<0,001) Slo 7 pacientes de aquellos con racecadotril tuvieron efectos adversos ,los que fueron leves y transitorios. Conclusiones:En nios pequeos con diarrea aguda acuosa, el tratamiento con racecadotril es seguro y efectivo.

Observaciones:

308

1.-Ingresaron al estudio 135 nios hospitalizados por deshidratacin debida a diarrea aguda. Fueron observados por 4-6 horas para confirmar diarrea y rehidratarlos con solucin OMS 90. 2.-No hay hiptesis formalmente planteada. 3.-No hay clculo de tamao muestral. 4.-No se seala procedimiento de asignacin al azar de los pacientes a dos grupos. 5.-No se indica procedimiento de evaluacin del estado de hidratacin al ingreso. 6.-No se presenta en la tabla de estado basal, una clasificacin segn estado de hidratacin.Tampoco segn estado nutricional, aspecto que en la introduccin del artculo es muy destacado, sealando que en nios con mejor estado nutricional ste tratamiento ya ha sido investigado.

309

META ANLISIS. Pediatrics 2000;105. SYSTEMIC CORTICOSTEROIDS IN INFANT META-ANALYSIS. BRONCHIOLITIS:A

Objetivo:Determinar si el empleo de corticoides es eficaz en el tratamiento de lactantes hospitalizados por bronquiolitis. Mtodos:Se busc en bases de datos-Medline-Embase y Registro Cochrane de ensayos clnicos: 1.-bronquiolitis o virus respiratorio sincicial y 2.-corticosteroides o glucocorticoides o agentes antiinflamatorios esteroidales u hormonas corticosuprarrenales. Del listado obtenido se seleccionaron por dos observadores los ensayos randomizados, doble ciego, controlados con placebo. De 12 publicaciones relevantes, 6 cumplieron los criterios de seleccin y tenan disponibles datos relevantes. Se extrajeron de ellos 3 medidas de resultado: duracin de la hospitalizacion, duracin de los sntomas y puntajes clnicos. Resultados:En el anlisis acumulado, los lactantes que recibieron corticoides tuvieron un promedio de hospitalizacin o duracin de los sntomas que fue 0,43 das menos que quienes recibieron placebo(IC95% = -0,81 a - 0,05 das). Igualmente el promedio de puntaje clnico fue -1,60 (IC95% = -1,92 a -1,28), favoreciendo al tratamiento activo. Un anlisis secundario en 5 ensayos clnicos que claramente establecan el procedimiento de randomizacin, en 5 que midieron la duracin de la hospitalizacin y en 4 que excluyeron lactantes con obstruccin respiratoria previa, dieron resultados similares a los del anlisis primario pero no fueron estadsticamente significativos. Conclusiones:Los reportes combinados sobre el efecto de corticoides sistmicos en el curso de la bronquiolitis sugieren una mejora significativa de las manifestaciones clnicas. Observaciones:Es su tarea.

310

Acta Obstet Gynecol Scand 2001;80:126 129. DOES EXPOSURE TO MAGNESIUM SULFATE IN UTERO DECREASE THE RISK OF NECROTIZING ENTEROCOLITIS IN PREMATURE INFANTS . Antecedentes:El objetivo de este estudio es establecer si la exposicin antenatal al sulfato de magnesio disminuye el riesgo de enterocolitis necrotizante en nios pretrmino. Mtodos: Comparamos la frecuencia de exposicin al sulfato de magnesio antes del nacimiento en 23 nios consecutivos en quienes se diagnostic enterocolitis necrotizante ,con la de 46 controles pareados por edad gestacional y gnero. Las variables obsttricas y neonatales relevantes fueron comparadas entre los dos grupos usando Ji cuadrado y la prueba exacta de Fisher para datos categricos, as como anlisis de varianza para variables continuas, con un valor de p de 0,05 ,considerado significativo. Resultados: No se encontraron diferencias significativas entre los dos grupos en: -tipo de parto -Apgar a los 5 minutos -exposicin prenatal a indocina , esteroides o surfactante -SDR, hemorragia intraventricular, sepsis. Los nios con enterocolitis necrotizante tuvieron una hospitalizacin mas prolongada y mayor tiempo de intubacin. La frecuencia de exposicin a sulfato de magnesio fue similar en casos y controles: 30% vs 39% y p=0,4. El anlisis de poder demostr que se habran requerido 385 nios por grupo para alcanzar significacin estadstica(alfa=0,05 y beta= 0,20). Conclusin: En este estudio retrospectivo caso control, la administracin materna de sulfatop de magnesio previa al parto no pareci conferir un efecto protector significativo para la ocurrencia neonatal de enterocolitis necrotizante.

Observaciones: En este estudio no se plante formalmente una hiptesis a investigar y en consecuencia, no hubo estimacin del tamao muestral. Lo que resulta

311

mas sorprendente es que despus de efectuada la investigacin se indica un tamao muestral suficiente para detectar como significativo el hallazgo, tamao que es muchas veces mayor que el utilizado.

312