Manual Epidemiologico

Manual Docente de la Escuela Nacional de Sanidad
Madrid, octubre de 2009
MTODO
EPIDEMIOLGICO
MINISTERIO
DE CIENCIA
E INNOVACIN
Instituto
de Salud
Carlos III
ENS
Escuela
Nacional
de Sanidad
Escuela Nacional de Sanidad (ENS)

Instituto de Salud Carlos III
Ministerio de Ciencia e Innovacin
Sinesio Delgado, 8
28029 MADRID (ESPAA)
Tels.: 91 822 22 74
Fax: 91 387 78 56
Catlogo general de publicaciones oficiales:

http://publicaciones.administracion.es
EDITA: ESCUELA NACIONAL DE SANIDAD

Instituto de Salud Carlos III Ministerio de Ciencia e Innovacin
N.I.P.O.: 477090199
I.S.B.N.: 9788495463562
Imprime: Agencia Estatal Boletn Oficial del Estado.
Avda. de Manoteras, 54. 28050 MADRID
ENS Octubre 2009
Coordinadores
Miguel ngel Royo Bordonada
Javier Damin Moreno
Autores
Beatriz Prez Gmez.
Centro Nacional de Epidemiologa. Instituto de Salud Carlos III.
Fernando Rodrguez Artalejo.
Departamento de Medicina Preventiva y Salud Pblica. Facultad de Medicina.
Universidad Autnoma de Madrid.
Fernando Villar lvarez.
Departamento de Programas de Salud. Escuela Nacional de Sanidad.
Instituto de Salud Carlos III.
Gonzalo Lpez-Abente.
Centro Nacional de Epidemiologa.
Iaki Imaz Iglesia.
Agencia de Evaluacin de Tecnologas Sanitarias.
Javier Damin.
Centro Nacional de Epidemiologa.
Javier Jimnez Jimnez.
Departamento Mdico. AstraZeneca.
Jess Castilla Cataln.
Servicio de Epidemiologa, Prevencin y Promocin de la Salud.
Instituto de Salud Pblica de Navarra.
Jess Gonzlez Enrquez.
Agencia de Evaluacin de Tecnologas Sanitarias.
Jose Mara Martn Moreno.
Universidad de Valencia.
Jose Ramn Banegas Banegas.
Universidad Autnoma de Madrid.
Juan de Mata Donado Campos.
Marina Polln Santamara.
Miguel Angel Royo Bordonada.
Escuela Nacional de Sanidad. Instituto de Salud Carlos III.
Miguel Delgado Rodrguez.
Departamento de Medicina Preventiva y Salud Pblica. Universidad de Jan.
Nuria Aragons Sanz.
ENS Octubre 2009
Para citar este manual

Escuela Nacional de Sanidad (ENS)
Instituto de Salud Carlos III - Ministerio de Ciencia e Innovacin.
Miguel ngel Royo Bordonada, Javier Damin Moreno, Mtodo epidemiolgico. Madrid: ENS - Instituto de
Salud Carlos III, Octubre de 2009.
Este texto puede ser reproducido siempre que se cite su procedencia.
ENS Octubre 2009
Mtodo Epidemiolgico
NDICE
I.
CONCEPTO Y USOS DE LA EPIDEMIOLOGA ...........................................
Fernando Rodrguez Artalejo y Jose Ramn Banegas Banegas

II.
MEDIDAS DE FRECUENCIA Y DE EFECTO .................................................
19
Javier Damin
III.
DISEO Y TIPOS DE ESTUDIOS EPIDEMIOLGICOS .................................
31
Jess Castilla Cataln

IV. SESGOS Y FACTORES DE CONFUSIN ...................................................
47
Fernando Villar lvarez

V.
ANLISIS DE DATOS EPIDEMIOLGICOS .................................................
75
Javier Damin y Nuria Aragons

VI. ESTUDIOS DE COHORTES .......................................................................
93
Marina Polln y Beatriz Prez

VII. ESTUDIOS DE CASOS Y CONTROLES ......................................................
117
Javier Jimnez Jimnez

VIII. ESTUDIOS DE PREVALENCIA ...................................................................
125
Juan de Mata Donado Campos

IX. ESTUDIOS ECOLGICOS ........................................................................
137
Gonzalo Lpez-Abente
X.
ESTUDIOS EXPERIMENTALES....................................................................
149
Miguel Angel Royo Bordonada y Jos Mara Martn Moreno

XI. EPIDEMIOLOGA CLNICA .......................................................................
169
Iaki Imaz Iglesia y Jess Gonzlez Enrquez

XII. REVISIN SISTEMTICA Y METAANLISIS ...............................................
187
Miguel Delgado Rodrguez

XIII. INFERENCIA CAUSAL EN EPIDEMIOLOGA ..............................................
207
Jose Ramn Banegas Banegas y Fernando Rodrguez Artalejo
ENS Octubre 2009
Mtodo Epidemiolgico
PRLOGO
La epidemiologa, cuyos primeros antecedentes datan de la poca de Hipcrates
(siglo IV a.C.) ha ido evolucionando a lo largo del tiempo. Entre los siglos XVII y XX ya se
haban realizado de forma aislada algunos estudios de investigacin de enfermedades siguiendo
un mtodo cientfico que sentara las bases del moderno mtodo epidemiolgico. La investigacin
de John Snow, en 1849, sobre la transmisin del clera por contaminacin fecal del agua de
consumo, puede considerarse como uno de los ms carismticos de esa poca. No obstante, la
epidemiologa se ha consolidado como una disciplina cientfica independiente y con identidad
propia durante el siglo XX, especialmente a partir del importante despegue en su desarrollo
iniciando en la dcada de los 50. Algunos de los estudios epidemiolgicos que han tenido
mayor trascendencia pblica datan de esa poca. Por ejemplo, las investigaciones de Doll y Hill
sobre la asociacin entre el tabaco y el cncer de pulmn; los estudios de Keys y Grande Covin
sobre la relacin entre las grasas de la dieta y los lpidos plasmticos, que demostraron los
efectos perjudiciales de los cidos grasos saturados y empezaron a sentar las bases de la moderna
epidemiologa nutricional; los ensayos de intervencin comunitaria para evaluar la eficacia de
los suplementos de flor a travs de la red de agua de consumo en la prevencin de la caries
dental; y, por ltimo, el Framingham Study, un estudio de seguimiento diseado por el Servicio
de Salud Pblica de los Estados Unidos en la dcada de los 40 para investigar los factores
implicados en la cardiopata isqumica que, todava hoy, est proporcionando importantes
resultados. La aplicacin del mtodo epidemiolgico a la investigacin de servicios de salud y
a la gestin de la prctica clnica es reciente y est llena de oportunidades de desarrollo.
El presente volumen incluye trece temas elaborados por diferentes autores, todos ellos
expertos en salud pblica y profesores de la Escuela Nacional de Sanidad, con la orientacin
fundamental de servir de apoyo a la docencia del mtodo epidemiolgico. As, partiendo de la
definicin de epidemiologa y de la descripcin de sus usos potenciales, se describen los
conceptos bsicos de este mtodo cientfico, sus principales diseos de investigacin, los
mtodos bsicos de anlisis de datos, las tcnicas de control de sesgos y factores de confusin,
las bases de la inferencia causal y los aspectos fundamentales de la epidemiologa clnica en el
escenario actual.
La consulta de diferentes fuentes bibliogrficas es especialmente importante en el proceso de
aprendizaje del mtodo epidemiolgico, una disciplina joven y en pleno desarrollo, con
planteamientos y terminologas en ocasiones variables y sujetas a discusin. En este sentido, este
manual de apoyo a la docencia incluye, al final de cada captulo, una seleccin de lecturas
consideradas de referencia, recomendadas como fuentes de consulta para complementar lo
expuesto sobre el tema correspondiente.
Miguel ngel Royo Bordonada y Javier Damin
ENS Octubre 2009
Concepto y Usos de la Epidemiologa
I. CONCEPTO Y USOS DE LA EPIDEMIOLOGA

Fernando Rodrguez Artalejo.
Jose Ramn Banegas Banegas
1.
CONCEPTO DE EPIDEMIOLOGA
La epidemiologa es la disciplina cientfica que estudia la frecuencia y distribucin de

fenmenos relacionados con la salud y sus determinantes en poblaciones especficas, y la
aplicacin de este estudio al control de problemas de salud.
El trmino disciplina alude a un cuerpo de conocimientos que han sido recogidos en libros.
El trmino cientfico se refiere a que dichos conocimientos fueron obtenidos a travs de un
camino sistemtico o mtodo, que pretende garantizar cierta validez y fiabilidad. El estudio
incluye las investigaciones caracterizadas por la simple vigilancia y observacin de fenmenos
para medir su magnitud y sugerir hiptesis sobre su origen. Este tipo de investigaciones reciben
el calificativo de descriptivas. Pero tambin incluye las investigaciones dirigidas a contrastar
estas hiptesis mediante estudios observacionales y experimentales. Estas investigaciones
reciben el nombre de analticas. Distribucin significa la medida de la frecuencia y variacin
de un fenmeno en grupos de poblacin a lo largo del tiempo, en diferentes lugares o formados
por diferentes tipos de personas.
La epidemiologa no slo estudia enfermedades sino todo tipo de fenmenos relacionados
con la salud, entre los que se encuentran causas de muerte como los accidentes o suicidios,
hbitos de vida como el consumo de tabaco o la dieta y el uso de servicios de salud o la calidad
de vida relacionada con la salud, entre otros. Los determinantes de estos fenmenos son todos
los factores fsicos, biolgicos, sociales, culturales y de comportamiento que influyen sobre la
salud. Los fenmenos relacionados con la salud y sus posibles determinantes dan lugar a algunas
de las clasificaciones de las ramas de la epidemiologa. As, cuando el eje de clasificacin son
los fenmenos sanitarios surgen ramas como la epidemiologa cardiovascular, del cncer, o de
los servicios sanitarios. Cuando el eje son los determinantes, surgen la epidemiologa nutricional,
laboral, o social.
Por ltimo, la epidemiologa es una disciplina bsica de la salud pblica y de la medicina
clnica, porque sus conocimientos pueden y deben ser aplicados al control de problemas de
salud en ambos campos. Estas aplicaciones de la epidemiologa permiten su clasificacin en
dos ramas. La epidemiologa general o de salud pblica y la epidemiologa clnica. La distincin
entre ambas ramas no estriba tanto en las tcnicas utilizadas como en la porcin de la historia
natural de la enfermedad que es estudiada por cada una de ellas. La historia natural de una
enfermedad es el conjunto de sucesos que van desde que un sujeto o grupo de sujetos resulta
expuesto a las primeras causas de una enfermedad hasta que sta se desarrolla y finalmente se
resuelve con la curacin total, la curacin con secuelas o la muerte (figura 1-1). La epidemiologa
de salud pblica estudia la primera parte de esta cadena de sucesos, es decir, la frecuencia y
distribucin de la enfermedad y sus determinantes, factores de riesgo o proteccin. Para ello se
fija en sujetos sanos, generalmente viviendo en la comunidad, a los que sigue para observar
como enferman. La epidemiologa clnica estudia la frecuencia y distribucin de las consecuencias
de la enfermedad y sus determinantes, los factores pronsticos. Para ello, suele fijarse en sujetos
enfermos en los que mide posibles factores pronsticos y los sigue para observar la evolucin
de la enfermedad.
ENS Octubre 2009
Figura 1-1. Representacin esquemtica de las relaciones habituales de estudio por la epidemiologa de
salud pblica y la epidemiologa clnica a lo largo de la historia natural de la enfermedad.
Sin embargo el rasgo que ms diferencia a la epidemiologa de otras disciplinas biolgicas

es el estudio de la frecuencia de fenmenos en grupos de sujetos, en poblaciones. Mientras que
las ciencias experimentales en el laboratorio estudian, sobre todo, relaciones deterministas o
no estocsticas, la epidemiologa se centra en relaciones probabilsticas o estocsticas. En
epidemiologa, los potenciales factores etiolgicos pueden, en un caso concreto, producir o no
producir una enfermedad. As, una persona que fuma puede o no desarrollar un infarto agudo
de miocardio, siendo la segunda posibilidad algo ms frecuente que la primera. Nuestros
factores causales aumentan la frecuencia o probabilidad de desarrollar una enfermedad -son
factores de riesgo- pero no aseguran su desarrollo. Para poner de manifiesto su efecto se
necesitan grupos de personas en los que medir la frecuencia de la enfermedad y compararla
entre los expuestos y no expuestos al factor etiolgico. En los estudios experimentales de
laboratorio se suelen abordar relaciones deterministas. En ellas el factor causal es suficiente
para producir su efecto. Siempre que alguien se exponga a l sufrir su efecto. Para ponerlo de
manifiesto bastar con estudiar un slo sujeto.
La distincin entre relaciones probabilistas y deterministas es conocida desde antiguo. Un
ejemplo ilustrativo, que es utilizado con frecuencia para describir este aspecto, se encuentra en
el estudio de los efectos de las radiaciones ionizantes, uno de los factores etiolgicos ms
investigados por la ciencia, tanto en el laboratorio como fuera del mismo. Dosis altas con
elevadas tasas de exposicin producen efectos deterministas. Dosis muy bajas recibidas de
forma crnica dan lugar a efectos probabilsticos. Las caractersticas de estos tipos de efectos
se presentan en la tabla 1-1. Esta tabla tambin sugiere que los efectos deterministas suelen
tener tiempos de induccin cortos. Ello permite que un experimento para medirlos requiera slo
minutos, horas o algunos das, a diferencia de lo que ocurre en epidemiologa, donde los estudios
pueden durar aos.
ENS Octubre 2009
10
Tabla 1-1. Resumen de las principales diferencias entre los efectos estocsticos y los no estocsticos
EFECTOS ESTOCSTICOS
EFECTOS NO
ESTOCSTICOS
Probabilidad del efecto
Probabilidad del efecto NO
depende de la dosis de
exposicin.
exposicin. La probabilidad es
cero o uno.
Intensidad del efecto NO
exposicin.
exposicin.
Efecto SIN umbral de
dosis de exposicin.
-
Intensidad del efecto
Frecuentemente tiempo de
induccin LARGO.
Efecto CON umbral de

de dosis de exposicin.
Frecuentemente tiempo de
induccin CORTO.
Tpicamente los cientficos de laboratorio exploran los numerosos mecanismos patognicos

o de resistencia de la enfermedad. Los mecanismos, a modo de los componentes de un engranaje,
tienen un carcter inmediato o cercano entre s y, por tanto, las relaciones de inters pueden verse
como deterministas. Por su parte, el epidemilogo estudia de una sola tacada la relacin entre
variables ms o menos distales y la aparicin de enfermedad y su evolucin (figura 1-2). Las
variables son tan lejanas entre s que sus efectos tardan ms tiempo en producirse -tiempo de
induccin largo- y slo se concretan en presencia de terceras variables causales e intermedias. Por
ello, las relaciones entre dichas variables son probabilistas. Cuanto ms se alejan las variables de
resultado de las de exposicin, las relaciones se hacen adems menos especficas. Un ejemplo de
ello se encuentra en la epidemiologa social, donde los factores de exposicin, habitualmente
variables socioeconmicas, tiene un efecto variable y con tiempos de induccin tambin diferentes
sobre un amplio espectro de enfermedades. Junto a estos abordajes extremos, tambin observamos
otros intermedios y complementarios, en los que las variables de exposicin en epidemiologa se
acercan, en la cadena causal, a las variables resultado. Es el caso de la epidemiologa molecular.
Por ltimo los dos abordajes de estudio son complementarios. La mayora de los agentes nocivos
para la salud que hoy conocemos y que son modificables han sido identificados por estudios
epidemiolgicos. Es el caso del tabaco, la hipertensin arterial, la hipercolesterolemia, etc.. La
epidemiologa representa a menudo la nica posibilidad de estudiar directamente en humanos los
efectos sobre la salud de potenciales factores etiolgicos, evitando la extrapolacin de resultados
desde animales y otros modelos de investigacin al hombre. Sin embargo, estos estudios enriquecen
sus resultados con la plausibilidad biolgica derivada de los abordajes de laboratorio.
ENS Octubre 2009
11
Figura 1-2. Representacin esquemtica de las relaciones habituales de estudio por la epidemiologa y
las disciplinas de laboratorio a lo largo de la historia natural de la enfermedad.
2.
USOS DE LA EPIDEMIOLOGA EN EL CONTROL DE LOS PROBLEMAS DE SALUD
El fin ltimo de la epidemiologa es controlar los problemas de salud. Para ello la

epidemiologa genera informacin en tres campos.
Tabla 1-2. Algunos tipos de informacin que se deriva de estudios epidemiolgicos
CONOCIMIENTO DE LA HISTORIA NATURAL DE LAS ENFERMEDADES O PROBLEMAS
DE SALUD
-
Sugerir hiptesis sobre los posibles factores de riesgo de una enfermedad.

Identificar y medir el efecto de dichos factores sobre la aparicin de la enfermedad.
Medir el tiempo de induccin de la accin de algn factor de riesgo.
Medir la evolucin (supervivencia, tiempo hasta la desaparicin de discapacidad o de
secuelas) de una enfermedad.
Identificar y medir el efecto de dichos factores pronsticos.
Evaluar la eficacia y efectividad de un abordaje diagnstico o teraputico de una
enfermedad.
CONOCIMIENTOS PARA EL CONTROL DE PROBLEMAS DE SALUD EN LAS

POBLACIONES, INFORMANDO Y EVALUANDO LOS DISTINTOS PASOS DE LO QUE
GENERICAMENTE SE CONOCE COMO PLANIFICACION SANITARIA
-
Medir la importancia sociosanitaria de un problema de salud, con alusin especial a la

exposicin a factores de riesgo o sus consecuencias de morbilidad, discapacidad o
muerte.
Formular objetivos de salud cuantificables y con una referencia temporal.
Medir recursos sanitarios disponibles, su utilizacin y los recursos necesarios para
satisfacer necesidades de salud.
Establecer prioridades de actuacin.
Establecer el beneficio esperado de una intervencin sanitaria.
Evaluar el progreso en el control de una enfermedad a nivel comunitario.
Evaluar un programa de salud o intervencin sanitaria.
Validar un sistema de informacin sanitaria.
CONOCIMIENTOS PARA EL CONTROL DE PROBLEMAS DE SALUD EN LOS

INDIVIDUOS, MEJORANDO EL MANEJO CLINICO DE LOS PACIENTES ENFERMOS O
DE LOS SANOS DE ALTO RIESGO
-
Establecer la idoneidad de una prueba diagnstica y el orden en que debe aplicarse en el

contexto de otras pruebas.
Establecer la prueba diagnstica o el tratamiento ms til para un sujeto concreto.
Elaborar protocolos clnicos.
ENS Octubre 2009
12
Primero, sobre la historia natural de las enfermedades y la eficacia de medidas preventivas y

curativas que pretenden modificar dicha historia de forma ms favorable para el ser humano. Segundo,
para formular, ejecutar y evaluar planes y programas de salud que mejoren el nivel de salud de las
poblaciones. Tercero, para mejorar el proceso de toma de decisiones clnicas, dirigidas a mejorar la
salud de sujetos enfermos y al desarrollo de protocolos o guas clnicas (tabla 1-2).
2.1.
Conocimiento de la historia natural de la enfermedad
La epidemiologa permite conocer muchos elementos de la historia de la enfermedad. Slo

destacaremos algunos de los ms importantes. La epidemiologa identifica la/s causa/s de la
enfermedades. El estudio Framingham permiti conocer que el tabaquismo, la presin arterial,
la colesterolemia, la intolerancia a la glucosa o la hipertrofia ventricular izquierda son algunos
de los principales factores de riesgo de la cardiopata isqumica. Para ello, se sigui a un grupo
de personas inicialmente libres de la enfermedad y se observ que a mayor valor de las anteriores
variables ms alta era la frecuencia con que se desarrollaba una enfermedad coronaria a lo largo
del seguimiento.
La epidemiologa puede medir el tiempo de induccin o incubacin de la enfermedades. En
las enfermedades infecciosas basta calcular la diferencia entre el momento en que aparece la
enfermedad y aqul en el que se produjo el contagio por el agente de la infeccin. El tiempo de
incubacin es til, entre otros propsitos, para establecer la cuarentena o tiempo durante el que
las personas potencialmente infectadas por un agente de la infeccin deben mantenerse fuera
del contacto con el resto de la comunidad para evitar el contagio. La cuarentena ha de durar
como mnimo el tiempo de induccin de la enfermedad. Si en ese periodo la persona no ha
desarrollado la enfermedad puede ya convivir de forma ms cercana con el resto de la comunidad
sin peligro de transmisin de la enfermedad, pues realmente no est infectado. En el caso de las
enfermedades crnicas no infecciosas, en las que la exposicin al factor de riesgo dura muchos
aos, la medida del tiempo de induccin es algo ms difcil. Rose observ que la correlacin de
la colesterolemia con la mortalidad por cardiopata isqumica en las cohortes del estudio de
siete pases, aumentaba progresivamente de los 5 a los 10 aos, y de stos a los 15 aos de
seguimiento. Concluy que el tiempo de induccin del efecto de la colesterolemia sobre la
mortalidad coronaria es al menos de 15 aos.
Medir el pronstico de una enfermedad es relativamente fcil. Basta con seguir a lo largo
del tiempo a un grupo de sujetos para estimar su supervivencia. As, Marrugat y cols. siguieron
una cohorte de enfermos coronarios y registraron el nmero de muertos que se producan en la
misma a lo largo del tiempo. Ello, les permiti establecer que, en nuestro medio, la supervivencia
del infarto agudo de miocardio a los 10 aos era aproximadamente el 55%. La creacin de
registros, por ejemplo de enfermedades cardiovasculares, facilita la informacin peridica sobre
la supervivencia de las mismas y su mejora a lo largo de los aos, como consecuencia
principalmente de los avances tecnolgicos y la mejor asistencia sanitaria.
La epidemiologa tambin permite medir la eficacia de medidas preventivas y teraputicas,
es decir, sus beneficios cuando se administran en las mejores condiciones posibles de trabajo en
el sistema sanitario, con pacientes que renen en grado sumo las indicaciones de tratamiento y
un grado de cumplimiento teraputico ptimo. As un ensayo clnico, un diseo epidemiolgico
de tipo experimental, ha permitido comprobar que la administracin de simvastatina, un frmaco
hipocolesterolemiante, a sujetos con elevaciones moderadas de la colesterolemia y con
enfermedad coronaria previa, reduce la frecuencia de infartos de miocardio y la mortalidad
general. En concreto, el tratamiento con simvastatina durante 5 aos reduce aproximadamente
un 30% la mortalidad general. Tambin es posible estimar la efectividad de las intervenciones
sanitarias, es decir, sus beneficios cuando se administran en las condiciones usuales de prctica
ENS Octubre 2009
13
clnica. Esta actividad de investigacin recibe el nombre de outcomes research o investigacin

sobre las consecuencias de la prctica clnica. Por este tipo de investigacin sabemos que el
grado de conocimiento, tratamiento y control de la presin arterial en Espaa es todava muy
mejorable, que hay una gran variabilidad en la mortalidad intrahospitalaria por cardiopata
isqumica en Espaa, o que la calidad de vida de los pacientes tratados mediante derivacin
aortocoronaria mejora sustancialmente al ao de la intervencin, a pesar de que el control de los
factores de riesgo de estos pacientes es subptimo. Tambin este tipo de investigacin ha
mostrado que algunos avances teraputicos (antiagregantes plaquetarios, betabloqueantes, etc..)
han reducido la letalidad del infarto agudo de miocardio en Espaa en el periodo comprendido
entre 1978 y 1993.
2.2.
Control de problemas de salud en las poblaciones
La epidemiologa proporciona informacin para responder a las tres preguntas

hipocrticas de la prevencin.
2.2.1.
La enfermedad o problema de salud, es prevenible o controlable?
La epidemiologa ha demostrado que muchas enfermedades son prevenibles o controlables.

Asimismo, ha identificado los determinantes de los problemas de salud y ha comprobado que
la intervencin es posible y adems eficaz. Por todo ello, es considerada una ciencia bsica de
la medicina preventiva y la salud pblica. La epidemiologa cardiovascular ha experimentado
un gran desarrollo tras la Segunda Guerra Mundial y constituye un buen ejemplo para ilustrar
muchas de las contribuciones, y tambin alguna limitacin, de esta ciencia para el control de las
enfermedades.
Las evidencias sobre la controlabilidad de las enfermedades cardiovasculares proceden
de estudios sobre las variaciones geogrficas de la mortalidad por esta enfermedad, sus cambios
en una misma comunidad a lo largo del tiempo y los estudios en emigrantes, en los que stos
adoptan las tasas de mortalidad cardiovascular (y presumiblemente tambin los hbitos de vida)
de las comunidades que los acogen. En ausencia de cambios en la composicin gentica de los
sujetos, estos estudios atribuyen la variacin en la mortalidad a factores ambientales sobre los
que es posible intervenir. Asimismo informan sobre la magnitud potencial del descenso de la
mortalidad tras la intervencin y el tiempo mximo necesario para obtener este beneficio. La
gran variacin en la distribucin provincial de la mortalidad cardioisqumica y cerebrovascular
en Espaa sugiere que es tericamente posible reducir a cerca de la mitad la mortalidad en las
provincias que la tienen ms elevada. Un paso ms all lo da un estudio reciente que muestra
que la ingesta de folatos puede estar estar relacionada con la distribucin geogrfica de la
enfermedad coronaria en Espaa. Un argumento similar al construido para Espaa puede hacerse
a nivel europeo, donde las variaciones geogrficas en la mortalidad cardiovascular tienen una
gran magnitud; la mortalidad cardiovascular de algunas regiones europeas es 4 5 veces
superior a la de las regiones con menor mortalidad. Continuando con las evidencias de la
controlabilidad de la enfermedad cardiovascular, el descenso de la mortalidad por cardiopata
isqumica en Canad en las ltimas cuatro dcadas demuestra que ha sido posible reducir la
mortalidad por estas enfermedades entre los varones en un 50% en un plazo tan corto como 20
aos. Evidencias similares a esta ltima existen para Japn, Finlandia, Estados Unidos de
Amrica y otros pases desarrollados.
2.2.2.
Si la enfermedad es prevenible, Cuales son las estrategias de prevencin y control

ms adecuadas?
Esta pregunta se ha respondido en el caso de las enfermedades cardiovasculares a travs de

dos grandes tipos de estudios: los observacionales y los experimentales. Histricamente apareci
ENS Octubre 2009
14
primero una cohorte de estudios observacionales que, desde el final de los aos 40 hasta la
mitad de los 60, generaron grandes avances en la identificacin de los llamados factores de
riesgo mayores de estas enfermedades. De hecho el trmino, y probablemente tambin el
concepto, de factor de riesgo fue utilizado por vez primera por William Kannel en 1961 en una
de las publicaciones del estudio Framingham. De forma similar, fue Ancel Keys el que primero
sugiri que los estilos de vida eran factores de riesgo de las enfermedades crnicas, en
concreto las cardiovasculares, con motivo de las investigaciones que dieron posteriormente
lugar al estudio de los siete pases.
A partir de la dcada de los 60 se realizaron estudios experimentales de la eficacia de
diversas intervenciones sobre los hbitos de vida para el control de las enfermedades
cardiovasculares. Estos estudios tienen ms validez que los observacionales y adems pueden
proporcionar evidencia directa sobre dos aspectos relevantes para la prevencin de las
enfermedades: primero, demuestran que la intervencin es factible, segundo, demuestran que es
eficaz.
Los estudios anteriores, realizados tanto sobre individuos como poblaciones, crearon las
condiciones para que Geoffrey Rose propusiera dos estrategias polares de prevencin de
enfermedades. La primera de ellas consiste en identificar a sujetos en alto riesgo de enfermar,
para reducir en ellos la exposicin a los factores de riesgo. La segunda acta sobre toda la
poblacin de inters y pretende trasladar hacia la izquierda el conjunto de la distribucin de los
factores de riesgo. Esta estrategia tiene sentido porque los primeros estudios observacionales
demostraron que los principales factores de riesgo tienen una relacin gradual y continua con el
riesgo cardiovascular. Asimismo, y porque se ha demostrado que los distintos factores de riesgo
cardiovascular interaccionan para producir su efecto, parece conveniente que la reduccin del
riesgo cardiovascular, que es el objetivo principal de las estrategias de prevencin, requiera la
actuacin simultnea sobre todos los factores. Por ltimo, y aunque ambas estrategias de riesgo
no son excluyentes sino complementarias, es la poblacional la que presumiblemente reportar
ms beneficios. Ello se debe a que la mayor parte de los casos de enfermedad no ocurren entre
los relativamente pocos sujetos de alto riesgo de una poblacin, sino entre los mucho ms
numerosos que tienen unos valores de los factores de riesgo que, a efectos didcticos, podramos
calificar de normales o ligeramente elevados.
2.2.3.
Cual es la magnitud del beneficio de las estrategias de prevencin?
Es quizs esta informacin la ms importante para conseguir que una estrategia de prevencin
pueda llevarse a la prctica una vez formulada. A partir de informacin de la literatura internacional
y de datos de prevalencia de los principales hbitos de vida en Espaa, Banegas y cols. calcularon
la proporcin de la mortalidad cardiovascular en nuestro pas que es atribuible a la exposicin
simultnea a los principales factores de riesgo conocidos. De acuerdo con sus resultados, cerca
del 50% de la mortalidad cardiovascular es potencialmente prevenible en Espaa, si se controla
la colesterolemia, la presin arterial, el hbito tabquico, la obesidad y el sedentarismo. Este
mismo grupo ha calculado el beneficio potencial del control de la colesterolemia en Espaa
realizado de forma realista a travs de estrategias individual y de poblacin. A corto plazo la
estrategia poblacional podra reducir la mortalidad cardioisqumica en un 10% frente a un 3,3%
de reduccin debida a la estrategia individual. La reduccin de esta mortalidad potencialmente
debida a la aplicacin conjunta de ambas estrategias sera de un 12,5%.
Por ltimo, otra pieza de informacin importante es la distribucin de los beneficios de
prevencin a lo largo del tiempo. As, se ha simulado la reduccin de la mortalidad por diversas
enfermedades que es posible obtener ao a ao, desde el presente hasta el 2020, a travs del
control del hbito tabquico en Espaa. El resultado ms llamativo de este trabajo es que una
ENS Octubre 2009
15
reduccin del 40% del hbito tabquico a lo largo del periodo 1992 a 2000 se traducira en una
ganancia de aproximadamente 60.000 aos de vida en el ao 2020.
Una vez se ha respondido afirmativamente a estas tres cuestiones, se est en condiciones
de llevar a cabo una estrategia o plan para el control de la enfermedad o problema de salud en
la poblacin. Un plan consiste en la formulacin de unos objetivos de salud y las acciones para
conseguirlos. La epidemiologa proporciona informacin para la elaboracin de un plan. La
definicin de objetivos se produce una vez medidas las necesidades de salud de la poblacin y
establecido cules de ellas se deben atender de forma prioritaria. La medida de necesidades se
realiza por procedimientos epidemiolgicos, como la obtencin de indicadores de salud
(sociodemogrficos, sanitarios, de utilizacin de servicios de salud o de recursos sanitarios
disponibles) y de encuestas de salud, que miden la morbilidad percibida por la poblacin, sus
hbitos de vida con relevancia para la salud, y el uso de servicios de salud. Se dispone adems
de indicadores como los aos de vida potencialmente perdidos, que miden el impacto de un
determinado problema sobre la salud de las poblaciones.
Las prioridades se establecen en funcin de la intensidad y extensin de las necesidades y
de los medios disponibles para satisfacerlas. La magnitud de un problema de salud medido por
la incidencia de una enfermedad y su evolucin a lo largo del tiempo, su gravedad medida por
la letalidad o las discapacidades que produce, y su extensin medida por la distribucin en
grupos de personas o de lugares, son elementos que junto a la sensibilidad del problema de
salud a la intervencin sanitaria, los costes y factibilidad de la misma, los valores de las personas
que toman las decisiones y la coyuntura social y econmica contribuyen a la priorizacin de un
problema.
Hay dos formas principales por las que la epidemiologa es til para formular objetivos
cuantificados y con un marco temporal. Primero, proyectando la tendencia de un indicador en
el futuro para establecer cul ser el valor probable del mismo en ausencia de intervencin.
Segundo, modificando el valor del mismo en funcin de la eficacia que han demostrado las
intervenciones sanitarias sobre ese valor.
La epidemiologa tambin es til para evaluar las acciones desarrolladas para conseguir los
objetivos de salud. En primer lugar, permite establecer por medio de estudios de vigilancia y
monitorizacin en qu medida las acciones se han ejecutado de la forma en que estaba previsto
(evaluacin de proceso). En segundo lugar, por estudios descriptivos y fundamentalmente
analticos valora si los objetivos formulados han sido alcanzados (evaluacin de resultados). Un
ejemplo de evaluacin llevada a cabo por tcnicas descriptivas es el progreso realizado en la
consecucin de los 38 objetivos de la estrategia de Salud para Todos, uno de los cuales
corresponde a las enfermedades cardiovasculares. Un ejemplo de evaluacin realizada por
tcnicas analticas a nivel individual es la determinacin de la factibilidad y eficiencia del
programa de cribado de familiares de casos ndice de hipercolesterolemia familiar o la calidad
de la asistencia a los pacientes coronarios. Otro ejemplo de evaluacin, esta vez a nivel
comunitario (estudio cuasi-experimental), es la observacin de una reduccin en la mortalidad
por enfermedad cardiovascular (y de cncer), asociada a una disminucin de la prevalencia de
sus factores de riesgo biolgicos (dislipemia, hipertensin) y de una mejora en los hbitos de
vida (reduccin del tabaquismo y de la ingesta de grasas saturadas) en la regin de Karelia del
norte (sometida a intervencin de control de riesgo cardiovascular) por comparacin con lo
ocurrido en la regin de Kuopio (no sometida a intervencin). La evaluacin de programas de
reduccin de riesgo cardiovascular adquirir gran auge en los prximos aos, al generalizarse
los programas integrados de atencin cardiovascular, a nivel de organizaciones, regiones o
pases enteros.
ENS Octubre 2009
16
Por ltimo, relacionado con la formulacin y ejecucin de programas est el establecimiento

de estndares de calidad de la atencin cardiovascular y la monitorizacin, mediante tcnicas
epidemiolgicas, del progreso en la consecucin de dichos estndares. Tambin es muy
importante la validacin de los sistemas de informacin sanitaria que son tiles para la
evaluacin.
2.3.
Control de problemas de salud en los individuos
Quizs el objetivo ms importante de la actividad asistencial es mejorar el curso clnico de

los enfermos. Ello se consigue con un diagnstico y tratamiento correctos. Sin embargo, son
varias las posibilidades que se le ofrecen al mdico para cada paciente. Estas posibilidades
incluyen utilizar o no algn procedimiento diagnstico o teraputico y, de hacerlo, elegir el ms
adecuado entre varios posibles. Del acierto de estas decisiones depender en buena medida
restablecer la salud del enfermo o mejorar el pronstico del sujeto sano con alto riesgo de
enfermar.
Se dispone de un grupo de tcnicas, como las basadas en los umbrales de probabilidad o
los rboles de decisin, agrupadas genricamente bajo el nombre de tcnicas de anlisis de
decisin, que pueden ayudar al mdico clnico a mejorar su trabajo en beneficio de sus pacientes.
A partir de ellas, y complementadas con las revisiones sistemticas de la literatura (metaanlisis), se pueden elaborar los llamados protocolos o guas clnicas, que son un conjunto de
recomendaciones para el manejo clnico de grupos de pacientes similares. Probablemente, pocas
reas de la medicina estn mejor preparadas que la medicina cardiovascular para el ejercicio de
la Medicina Basada en la Evidencia, debido al gran desarrollo de la investigacin en este campo
en los ltimos aos, que ha dado lugar a evidencias de alta calidad.
3.
REFERENCIAS BIBLIOGRFICAS
GMEZ LPEZ LI, RABANAQUE HERNNDEZ MJ, AIBAR REMN C. Diseo de programas de salud. En:
Medicina Preventiva y Salud Pblica. Barcelona: Masson, 2001: 1047-1062.
LAST JM, ED. A dictionary of epidemiology. 4 ed. Nueva York: Oxford University Press, 2000.
MARRUGAT J, SALA J. Registros de morbimortalidad en cardiologa: metodologa. Rev Esp Cardiol 1997; 50: 48-57.
PINEAULT R, DAVELUY J. La planificacin sanitaria: conceptos, mtodos, estrategias. Barcelona: Masson-SG, 1990:
43-211.
REGIDOR E, GUTIRREZ-FISAC JL. Indicadores de Salud. Cuarta evaluacin en Espaa del programa regional
europeo Salud para Todos. Madrid: Ministerio de Sanidad y Consumo, 2000.
REY CALERO J. Epidemiologa y epidemiologa clnica. En: Rey Calero J, Herruzo Cabrera R, Rodrguez Artalejo F.
Fundamentos de epidemiologa clnica. Madrid: Sntesis, 1996: 25-35.
RODRGUEZ ARTALEJO F, FIGAREDO ALVARGONZLEZ C, HERNNDEZ VECINO R. Investigacin de
resultados. En: del Llano Searis J, Ortn Rubio V, Martn Moreno JM, Milln Nez-Corts J, Gen Bada J, eds.
Gestin Sanitaria: Innovaciones y desafos. Barcelona: Masson-MSD, 1997:529-542.
RODRGUEZ ARTALEJO F, GUTIRREZ-FISAC JL. El estado de salud y sus determinantes. Evaluacin de los
objetivos 1 a 12. En: Alvarez Dardet C, Peir S, eds. La salud pblica ante los desafos de un nuevo siglo. Informe
SESPAS 2000. Granada: Escuela Andaluza de Salud Pblica, 2000: 43-50.
RODRGUEZ ARTALEJO F, ORTN RUBIO V, BANEGAS JR, MARTN MORENO JM. La epidemiologa como
instrumento para una poltica de salud racional. Med Clin (Barc) 1989; 93: 663-666.
ROSE G. Incubation periods of coronary heart disease. BMJ 1982; 284: 1600-1601.
ROSE G. La estrategia de la medicina preventiva. Barcelona: Salvat-Masson, 1994.
ENS Octubre 2009
17
Medidas de Frecuencia y de Efecto
II. MEDIDAS DE FRECUENCIA Y DE EFECTO

Javier Damin
1.
MEDIDAS DE FRECUENCIA DE ENFERMEDAD
Existen dos grupos de medidas segn la consideracin del tiempo: medidas de incidencia y
de prevalencia. Las medidas de incidencia de enfermedad tienen en cuenta los casos nuevos que
se producen en poblaciones. Las medidas de prevalencia consideran los casos de enfermedad
existentes en una poblacin en un momento o periodo.
1.1.
Incidencia
Existen dos tipos importantes de medidas de incidencia: la incidencia acumulada (o

proporcin de incidencia) y la tasa de incidencia. La incidencia acumulada (IA) relaciona el
nmero de casos con el tamao poblacional al comienzo de un periodo de tiempo (t):
IA
n de casos nuevos en 't

.
n de personas al inicio del periodo (t0 )
Esta medida por tanto supone la proporcin de personas que han enfermado en ese
periodo.
En la Figura 2-1 se observa una poblacin de 9 personas al inicio del seguimiento. Durante
el seguimiento se van produciendo ocurrencias de enfermedad. La incidencia acumulada para
un periodo de t1 es de 3 casos nuevos /9 personas al inicio del seguimiento = 0,33.
Como toda proporcin no tiene unidades y sus posibles valores estn entre 0 y 1. Otra
caracterstica de las proporciones es que pueden interpretarse en trminos de probabilidad: la
probabilidad de desarrollar una enfermedad en un periodo de tiempo. Tambin se usa el trmino
riesgo. Pero para que pueda estimarse el riesgo es necesario que las personas del grupo al inicio
de seguimiento puedan desarrollar la enfermedad (sean susceptibles). Si quisiramos medir la
incidencia acumulada de sarampin en las 9 personas del ejemplo anterior y una tuviera inmunidad
deberamos excluirla del denominador, siendo la incidencia acumulada de 3/8 = 0,37.
Figura 2-1. Seguimiento de una cohorte de 9 personas.
t0
t1
tiempo
ENS Octubre 2009
19
Otra asuncin que hay que hacer para poder estimar adecuadamente el riesgo es que no haya
muertes por otra causa que no sea el evento que se est midiendo (riesgos competitivos), ya que
si esto ocurre no se sabr si las personas hubieran desarrollado la enfermedad caso de no haber
muerto. En general se tiene que cubrir el periodo en riesgo. Por tanto la incidencia acumulada
puede entenderse como una estimacin de la probabilidad condicional de desarrollar el evento en
un tiempo determinado.
Para interpretar adecuadamente un riesgo es necesario mencionar el tiempo de seguimiento
ya que el valor de la incidencia acumulada tiende a aumentar (tiende a 1) conforme este tiempo
es mayor. Si pasa tiempo suficiente la probabilidad de ocurrencia de cualquier evento aumenta.
No tiene sentido informar de una incidencia acumulada de, por ejemplo, 12% ya que puede ser
muy grande si se refiere a un mes o pequea si se refiere a 10 aos.
La incidencia acumulada se mide sobre una cohorte que es, estrictamente hablando, una
poblacin fija o cerrada. Este tipo de poblaciones se caracterizan por no permitir entradas de
nuevos miembros, slo salidas: porque mueren, porque desarrollan la enfermedad, y por otros
motivos.
Otro problema es que en los estudios es habitual que haya sujetos que se incorporen ms
tarde por lo que los tiempos de seguimiento son diferentes.
La tasa de incidencia, I, basada en denominadores de persona-tiempo permite analizar
datos obtenidos del seguimiento de poblaciones dinmicas (permiten entradas y salidas). La
tasa de incidencia se define como el nmero de casos nuevos por cada unidad persona-tiempo
de observacin:
I
n de casos nuevos
.
n de personas-tiempo en observacin
El nmero de personas-tiempo se obtiene sumando los tiempos en observacin que cada

sujeto de estudio est en riesgo de ocurrencia del evento que se trata de medir. Ntese que el
denominador de la tasa de incidencia es bidimensional, compuesto no slo por el tamao
poblacional sino tambin por la cantidad de tiempo de observacin. La inclusin de la dimensin
temporal nos ofrece una medida de la velocidad con que ocurre una enfermedad en una
poblacin.
Figura 2-2. Poblacin dinmica de 8 personas a lo largo de 20 aos.
La lnea discontinua representa consumo moderado de alcohol. La continua consumo cero.
Las aspas representan casos nuevos de infarto de miocardio. Los puntos negros son muertes.
1
2
3
4
5
6
7
8
ENS Octubre 2009
20
En la Figura 2-2, se representa el seguimiento durante 20 aos a una hipottica poblacin

dinmica de 8 personas para medir tasas de incidencia de infarto de miocardio, representado
por un aspa. La cantidad persona-tiempo de observacin que aporta la persona n 1 es de 10
aos; la persona n 2 est en riesgo 20 aos. La 3, 17,5 aos; la 4, 12,5 aos. La persona n 5
aporta 7,5 aos en riesgo; la 6, 5 aos; la 7, 10 aos; la persona n 8 aporta 7,5 aos. Todo
suma 90 aos de observacin en riesgo, por lo que la tasa de incidencia es de 5/90 = 0,056
ao-1 o 5,6 casos por cada 100 personas-ao.
Al contrario que la incidencia acumulada la tasa de incidencia s tiene unidades: el inverso
del tiempo (1/tiempo, o tiempo-1). Consecuentemente el inverso de la tasa se interpreta como el
tiempo medio hasta la ocurrencia de enfermedad. Adems tiene un rango de valores entre 0 e
infinito (no tiene un lmite superior terico).
La tasa de incidencia tambin ha sido denominada como densidad de incidencia. Esta idea
se aprecia bien en la Figura 2-3, tomada de Morgenstern y cols., que representa los casos que se
producen en un mar poblacin-tiempo. Es fcil apreciar la idea de densidad y tambin que en
una poblacin estable se pueden medir la tasas de incidencia, es decir el nmero de casos
nuevos por unidad de rea, o cantidad persona-tiempo, con informacin demogrfica secundaria
(censos, movimiento natural de la poblacin, registros...).
Lo importante en el cmputo de personas-tiempo es que, al igual que en el caso de la
incidencia acumulada, sea en riesgo de ocurrencia de casos nuevos. Adems debe representar
adecuadamente a la poblacin de inters. A diferencia de la poblacin cerrada una misma persona
puede aportar tiempo en riesgo a, o ser parte de, ms de una poblacin diferente, por ejemplo
cambiando de grupo de edad o de exposicin (pasar a ser ex-fumador). En el ejemplo anterior
(Figura 2-2) la parte discontinua representa consumo moderado de alcohol y la parte continua
consumo cero. Hay personas que aportan tiempo en riesgo a ambas poblaciones (3, 4, 7 y 8).
Figura 2-3. Poblacin dinmica seguida en el tiempo. Los puntos son casos nuevos de eventos de inters.
Poblacin
t1
t2
Tiempo
Normalmente el inters fundamental es la medicin de primeros episodios aunque no
siempre. Ejemplos como cadas o resfriados pueden requerir la contabilizacin de ms de un
episodio por persona aunque los mtodos en estos casos suelen requerir mayor complejidad
analtica.
ENS Octubre 2009
21
1.2.
Relaciones entre tasa de incidencia e incidencia acumulada
La incidencia acumulada se mide sobre una cohorte fija. En la Figura 2-4 se representa el
tamao de una cohorte fija. Con el paso del tiempo la poblacin inicial, de tamao N0, va
enfermando, quedando una poblacin susceptible en un momento t de tamao Nt. Este nmero
de personas existentes al final del seguimiento de inters depende directamente del nmero de
personas inicial, siendo adems funcin (exponencial decreciente) de la fuerza de
morbilidad representada por la tasa de incidencia y del tiempo:
Figura 2-4. Grfico de los susceptibles de enfermar de una cohorte (poblacin fija) en el tiempo
N0
Nt
t0
t1
Nt
Nt N0
N 0 exp( I't ) *
exp( I't )
[1]
[*: exp (x) es otra forma de expresar ex (nmero e: 2,718... base de los logaritmos naturales)]
Por otra parte la incidencia acumulada o riesgo de enfermar en un periodo t (de t0 a t) es:
IA
N0 Nt
N0
1
Nt
;
N0
por tanto, sustituyendo con [1]:

IA = 1exp(It)
Para valores bajos (< 0,1) de I t se puede aproximar a:
IA It
Se ha asumido que la tasa de incidencia es constante en el periodo. Si no se puede asumir
esto (normalmente si los periodos son muy largos la poblaciones envejecen, estando por tanto
sujetas a riesgos crecientes) conviene realizar estimaciones parciales del riesgo en subperiodos
(ti) ms cortos. Si se dispone de estimaciones de tasas de incidencia de los subperiodos la
frmula anterior se generaliza a:
IA = 1 exp ( Ii ti)
ENS Octubre 2009
22
Ejemplo: En el seguimiento realizado a 1.101.669 mujeres durante 19 aos (Polln y

Gustavsson) se obtuvieron las siguientes tasas de incidencia de cncer de mama por
edad:
Edad
Tasa (ao-1)
25-44
0,00052
45-59
0,00166
60-79
0,00238
El riesgo de desarrollar cncer de mama en 50 aos de una mujer con 30 aos ser:
1 exp [(0,00052 15) + (0,00166 15) + (0,00238 20)] = 8%.
1.3.
Prevalencia
La prevalencia se define como la proporcin de sujetos con una determinada caracterstica,

normalmente enfermedad, en un momento o periodo.
Nmero de personas enfermas

.
Total poblacin
Se trata de una medida con un carcter esttico. Es como una fotografa dnde se refleja la
magnitud de un problema en una poblacin en un momento dado. Normalmente se utiliza la
prevalencia puntual, cuando se hace referencia a un momento concreto. La prevalencia de
periodo hace referencia a las personas que en algn momento del periodo correspondiente
estuvieron enfermas.
Como proporcin puede expresarse en trminos de probabilidad. En este caso la probabilidad
de estar enfermo en un momento.
1.4.
Relacin entre prevalencia e incidencia
La prevalencia puede considerase como un subconjunto (Figura 2-5) compuesto por

personas con la enfermedad; al subconjunto se entra enfermando y se sale por muerte o curacin.
El flujo de entradas est determinado por la tasa de incidencia de enfermedad (I); el flujo de
salida est determinado por la tasa de incidencia de terminaciones de enfermedad (I). Esta es
equivalente al inverso de la duracin media de la enfermedad 1/ D (se recuerda que el inverso
de una tasa de incidencia es el tiempo medio hasta la ocurrencia). En una situacin estable, sin
migraciones, el nmero de entradas al subconjunto de prevalencia es igual al numero salidas.
Siendo Cp el n de casos prevalentes y N el tamao de la poblacin:
N Cp 't I
Cp 't 1 D
entradas
salidas
Cp/NCp es la razn entre los casos y los no casos, equivalente a P/1P. Esta medida se
denomina odds de prevalencia. Por tanto:
P/1-P = I D
ENS Octubre 2009
23
Como P = odds/ 1+odds:
I D
.
1 I D
Si la prevalencia es baja (< 0,1): P I D

Las medidas de prevalencia suelen tener limitaciones para su utilizacin en estudios cuyo
objetivo es comprobar hiptesis causales (estudios analticos). Esto se debe a que estn, como
se ha visto, afectadas por la duracin de la enfermedad. Por otra parte se produce el efecto de la
modificacin de las exposiciones ocasionadas por la propia enfermedad. Por ejemplo, si se
quiere estudiar la relacin entre ejercicio fsico y enfermedad cardiaca, la utilizacin de casos
prevalentes ocasionar que personas con enfermedad presenten valores muy reducidos de
ejercicio fsico debido a la enfermedad, obtenindose probablemente una asociacin en sentido
contrario. Otro ejemplo es la alteracin de los niveles de colesterol despus de un infarto de
miocardio. Si se estudia la relacin entre el colesterol y el riesgo de infarto basndose en casos
prevalentes se obtendrn estimaciones sesgadas. Se recomienda el libro de Szklo y Nieto para
el estudio de estos sesgos.
Figura 2-5. Prevalencia e incidencia. Representacin de los flujos de enfermedad de una poblacin estable
1/D
Cp
N - Cp
1.5.
Otras medidas
Odds. Es la razn entre una proporcin y su complementaria. Expresa cunto ms probable es la

ocurrencia de un fenmeno en relacin con la no-ocurrencia. Su rango est entre cero e infinito. Cuanto
menor es el valor de la probabilidad ms se acerca al valor de la odds. Son muy utilizadas cuando se
comparan entre s mediante razn (odds ratio).
odds
p
1 p
odds
.
1 odds
Tasa de letalidad. Es la proporcin de muertes entre los enfermos. Es la incidencia

acumulada de muerte en un grupo de enfermos.
Tasa de ataque. Es la proporcin de casos que se producen en una poblacin cerrada y en
un tiempo muy determinados. Es una incidencia acumulada. Normalmente se utiliza esta
terminologa en el estudio de brotes epidmicos. La tasa de ataque secundaria representa la
ENS Octubre 2009
24
probabilidad de enfermar en un sujeto expuesto a un caso primario, siendo por tanto el nmero
de enfermos entre los contactos de un caso.
2.
MEDIDAS DE EFECTO
Para poder estimar el efecto que tiene la exposicin a un factor de riesgo en la ocurrencia de
una enfermedad es necesario conocer la parte de la tasa de incidencia en poblacin expuesta que
no se debe a la exposicin, es decir, se debe restar la tasa de incidencia que hubiera tenido esta
misma poblacin expuesta caso de no haber estado expuesta. Medir esto no es posible. Lo que
ms se puede aproximar a este planteamiento terico (llamado contrafctico o contrafactual)
ocurre en los estudios cruzados en los que las mismas personas estn expuestas unas veces y no
expuestas otras (por ejemplo, a un tratamiento paliativo); an en estos casos las circunstancias
no son las mismas. Se puede obtener una buena aproximacin calculando la tasa de incidencia
de enfermedad en una poblacin no expuesta muy parecida a la expuesta. En otras palabras, si
se pudiera asumir que dos poblaciones son iguales en todo excepto en una variable exposicin
o no exposicin las diferencias que se encontraran en sus tasas de incidencia se atribuiran
necesariamente a la exposicin.
2.1.
Medidas absolutas. Riesgo atribuible
La diferencia de tasas (DT) de incidencia representa una medida del efecto absoluto
atribuible al factor de riesgo. Si las medidas de frecuencia comparadas son incidencias
acumuladas se habla de diferencia de riesgos. Ambas medidas son denominadas clsicamente
como riesgo atribuible.
Ejemplo: Deseamos conocer el efecto de la exposicin a radiaciones en el desarrollo de
leucemia. La tasa de incidencia de leucemia en una poblacin expuesta a radiacin (I1) fue
de 15,8 por 105 personas-ao. La tasa equivalente en una poblacin no expuesta (I0) fue
de 3,6 por 105 personas-ao. El efecto absoluto atribuible a la radiacin es:
DT = I1 I0 ; DT = 15,8 /105/ao 3,6 /105/ao = 12,2 por 105 personas-ao
Si las poblaciones de expuestos y no expuestos no difieren en otros factores relevantes se
puede considerar que la radiacin es responsable de esa cantidad de casos.
El rango de valores que puede tener una diferencia de tasas est entre y +; las unidades
de medida son las mismas que tengan las tasas implicadas: ao1, mes1... Si se trata de una
diferencia de riesgos, el rango est entre 1 y +1 y sin unidades ya que es una diferencia de
proporciones. El valor que expresa la ausencia de efecto, el llamado valor nulo, es 0 para ambas
medidas.
2.2.
Medidas relativas. Riesgo relativo
El riesgo atribuible es una medida cuya compresin y manejo son importantes en

epidemiologa y en salud pblica pero, como medida absoluta, no expresa adecuadamente la
fuerza de la asociacin si no se relaciona con alguna medida de la magnitud basal de la enfermedad
(la incidencia en los no expuestos). Es importante conocer cuntas veces ms frecuente es la
enfermedad en un grupo con respecto al otro. Una medida del efecto relativo es:
ER
I1 I 0
I0
RT 1 .
ENS Octubre 2009
25
Normalmente se elimina la constante y se utiliza como medida relativa la razn entre las
dos tasas (RT). Siguiendo con el ejemplo anterior:
I1
; RT
I0
RT
15,8 / 105 / ao
3,6 / 105 / ao
4,4 .
La incidencia en los expuestos supone 4,4 veces la incidencia en los no expuestos al factor de
riesgo. Tambin es habitual utilizar el valor del efecto relativo (que vale 4,4 1 = 3,4) expresado en
porcentaje: La incidencia es un 340% superior en los expuestos con respecto a los no expuestos.
Cuanto mayor es este valor mayor es la fuerza de la asociacin entre el factor de riesgo y
la enfermedad. Las razones de tasas carecen de unidades y sus posibles valores oscilan entre 0
e infinito.
En este caso el valor nulo es 1.
Si el valor es >1
la exposicin incrementa el riesgo de adquirir la

enfermedad.
Si el valor es <1
la exposicin disminuye el riesgo de adquirir la

enfermedad (exposicin preventiva)
Si en lugar de tasas se utilizan incidencias acumuladas se habla de razn de riesgos. Tanto

razn de tasas como razn de riesgos son conocidas genricamente como riesgo relativo (RR).
2.3.
Proporciones atribuibles
La diferencia de tasas (o riesgo atribuible) puede ser expresada como parte del total de la
incidencia en expuestos. Tal medida se conoce como proporcin atribuible en expuestos (PAE),
tambin porcentaje de riesgo atribuible y fraccin etiolgica.
Grficamente:
I1
I1 I0
I0
PAE
I1 I 0
.
I1
Siguiendo con el ejemplo anterior:
PAE
15,8 3,6
15,8
0,77 .
Es decir, el 77% de los enfermos expuestos a radiacin deben su enfermedad al hecho de

estar expuestos. En otros trminos: Si se acta sobre la poblacin expuesta eliminando tal
exposicin se previene un 77% de los casos en los expuestos.
ENS Octubre 2009
26
Esta proporcin expresa la probabilidad de que el factor de riesgo sea la causa de la

enfermedad en una persona expuesta. Esta probabilidad depende nicamente de la fuerza de la
asociacin (el riesgo relativo):
I1 I 0
I1
PAE
1
RR 1
.
RR
1
RR
Conforme aumenta el valor del riesgo relativo la probabilidad se acerca a 1.

Una medida similar puede ser calculada para la poblacin total (expuestos y no expuestos),
la proporcin atribuible poblacional (PAP):
IT I 0
IT
PAP
[1]
Donde IT es la tasa de incidencia en la poblacin total.

El valor de la PAP tambin est en funcin del riesgo relativo, pero adems depende de la
cantidad de poblacin que est expuesta (la prevalencia de exposicin). Por muy patgeno (RR
muy alto) que sea un factor de riesgo producir pocos casos en una poblacin si muy pocas
personas estn expuestas --y al revs. Dado que la IT puede expresarse como el promedio ponderado
(por la proporciones P1 y P0 de cada grupo) de las incidencias en expuestos y no expuestos:
IT
P1 I1 P0 I 0 ,
y considerando que P0 = 1 P1 podemos sustituir en [1] y simplificando llegar a:

PAP
RR 1
RR 1
1
P1
Si por ejemplo los expuestos suponen el 2% del total de la poblacin:

PAP
4,4 1
1
4,4 1
0,02
0,06 .
Es decir, en una poblacin conjunta de expuestos y no expuestos el 6% de todos los casos

de enfermedad son atribuibles al factor de riesgo.
Este parmetro tiene gran importancia en Salud Pblica ya que el nmero de casos
atribuibles (potencialmente prevenibles) puede variar mucho en funcin del grado de exposicin
de la poblacin. Por ejemplo, un factor de riesgo cuya asociacin con la enfermedad sea dbil
(RR bajo) puede ser responsable de un nmero de casos mayor que un factor con una asociacin
fuerte, si la exposicin est suficientemente extendida en la poblacin.
Ejemplo: Queremos evaluar el efecto de otro factor de riesgo (FR) para leucemia. La
fuerza de la asociacin es bastante menor que en el caso de radiacin: riesgo relativo
de 1,5. La proporcin atribuible en expuestos ser:
PAE
1,5 1
0,33 .
1,5
ENS Octubre 2009
27
Considerablemente ms baja que en el caso de la exposicin a radiacin. Sin embargo,

el FR est presente en gran parte de la poblacin: el 40% de la poblacin est expuesta al FR
(P1 = 0,4) por lo que la proporcin atribuible poblacional es:
1,5 1
PAP
1
1,5 1
0,4
0,16 .
En contraste con el 6% atribuible a radiacin, el segundo FR es responsable del 16% de los

casos.
Si la exposicin es preventiva (I1 < I0) se puede calcular la proporcin prevenida en
expuestos (PPE), que es la proporcin de casos prevenidos del total de casos prevenibles por la
exposicin. Se calcula de forma similar a la PAE:
PPE
I 0 I1
I0
1 RT .
Si la poblacin expuesta tuviera una incidencia igual que la no expuesta, tendra que
haberse registrado un nmero de casos mayor que el actual. El n de casos que fueron
prevenidos por la exposicin es la diferencia entre este n de casos potenciales y los casos
actualmente registrados; la parte que suponen los casos prevenidos del total de casos
potenciales es la proporcin prevenida por la exposicin.
Ejemplo: Un hipottico estudio de intervencin trata de determinar el efecto que tiene una
nueva vacuna de varicela. Finalizado el seguimiento las incidencias acumuladas son:
IA1
9
1.200
0,0075 ; IA0
RR
0,0075
0,065
130
2.000
0,065
0,115 .
Es decir, los expuestos a la vacuna tienen un riesgo menor de enfermedad que los no
expuestos. Si la poblacin expuesta abandonara tal exposicin se registraran un nmero
adicional de casos hasta contabilizar una incidencia acumulada igual a la de la poblacin no
expuesta:
n de casos prevenibles
1200
0,065 ;
n casos prevenibles = 78.

La diferencia entre los casos ocurridos (9) y los potencialmente prevenibles por la
exposicin es el n de casos que han sido prevenidos: 78 9 = 69.
La proporcin prevenida es:
69/78 = 0,88.
Se obtiene el mismo resultado mediante la frmula descrita anteriormente:

PPE = 1 RR = 1 0,115 = 0,88.
ENS Octubre 2009
28
En estos casos la proporcin prevenida se denomina eficacia vacunal y suele expresarse en

porcentaje (88%). Hay que recordar que estas medidas tienen sentido si se asume que las
poblaciones de expuestos y no expuestos difieren poco en otros factores relevantes.
2.4.
Medida del efecto en estudios de casos y controles
El diseo de casos y controles no permite que se realice una medicin directa de las tasas
de incidencia y por tanto no se pueden calcular medidas de efecto como la diferencia de tasas o
el riesgo relativo. La estrategia en estos estudios consiste en comparar el nivel de exposicin en
los enfermos (casos) con el equivalente en un grupo de no enfermos (controles). Una medida
que relaciona el grado de exposicin en ambos grupos es la odds ratio (OR) o razn de odds. Se
ha demostrado que la OR es un buen estimador del riesgo relativo.
Exposicin
Casos
a
c
Si
No
Controles
b
d
La odds de exposicin entre los casos es:

probabilidad de estar expuesto
probabilidad de no estar expuesto
a ac
c ac
a
;
c
b bd
d bd
b
.
d
y la odds de exposicin entre los controles:

probabilidad de estar expuesto
probabilidad de no estar expuesto
Por tanto la odds ratio:
OR
a
c
b
d
ad
.
bc
El valor de la OR se utiliza como medida de magnitud de la asociacin exactamente igual

que el riesgo relativo ya que se ha demostrado que en la mayora de las situaciones, es una
buena aproximacin del mismo. Por tanto, todas las consideraciones acerca del riesgo relativo
son vlidas para la OR: carece de unidades, el rango de valores est entre cero e infinito y el
valor nulo que expresa no asociacin es 1.
Ejemplo: Los resultados de un estudio que pretende evaluar la asociacin entre antecedentes
familiares de cncer colorrectal y cncer colorrectal son:
Antecedentes familiares
OR
Si
No
Casos
112
1.472
Controles
108
2.771
112 1.472 112 2.771

1,95 .
108 2.771 1.472 108
ENS Octubre 2009
29
Este valor es la estimacin del riesgo relativo y se interpreta de la misma forma: el riesgo
de cncer colorrectal de las personas con antecedentes familiares es un 95% mayor que el
de las personas que carecen de tales antecedentes.
En los estudios de casos y controles al no poder medir incidencias no se puede hallar el
riesgo atribuible pero s se pueden obtener estimaciones de la proporcin atribuible en expuestos
y de la proporcin atribuible poblacional:
PAE
OR 1
;
OR
PAP
OR 1
OR 1
1
Pe
Siendo Pe la proporcin de expuestos en la poblacin general (si no se dispone de este dato la

proporcin de expuestos entre los controles ofrece una buena estimacin).
3.
GORDIS L. Epidemiology. Filadelfia: Saunders, 1996.
HENNEKENS CH, BURING JE. Measures of disease frequency and association. En: Epidemiology in Medicine.
Boston: Little, Brown and Company, 1987.
KAHN HA, SEMPOS CT. Attributable risk. En: Statistical Methods in Epidemiology. Nueva York: Oxford University
Press, 1989.
KAHN HA, SEMPOS CT. Relative risk and odds ratio. En: Statistical Methods in Epidemiology. Nueva York: Oxford
University Press, 1989.
KLEINBAUM DG, KUPPER LL, MORGENSTERN H. Measures of association. En: Epidemiologic Research.
Principles and Quantitative Methods. Nueva York: Van Nostrand Reinhold, 1982.
KLEINBAUM DG, KUPPER LL, MORGENSTERN H. Measures of disease frequency: Incidence. En: Epidemiologic
Research. Principles and Quantitative Methods. Nueva York: Van Nostrand Reinhold, 1982.
KLEINBAUM DG, KUPPER LL, MORGENSTERN H. Measures of potential impact and other summary measures. En:
Epidemiologic Research. Principles and Quantitative Methods. Nueva York: Van Nostrand Reinhold, 1982.
MORGENSTERN H, KLEINBAUM D, KUPPER LL. Measures of disease incidence used in epidemiologic research.
Int J Epidemiol 1980; 9: 97-104.
NIETO GARCA FJ, PERUGA URREA A. Riesgo atribuible: Sus formas, usos e interpretacin. Gac Sanit 1990; 18:112-117.
POLLN M, GUSTAVSSON P. High-risk occupations for breast cancer in the Swedish female working population. Am
J Public Health 1999; 89: 875-881.
ROTHMAN KJ, GREENLAND S. Measures of disease frequency. En: Rothman KJ, Greenland S. Modern Epidemiology.
Filadelfia: Lippincott-Raven, 1998.
ROTHMAN KJ. Medidas del efecto. En: Epidemiologa Moderna. Madrid: Daz de Santos, S.A. 1987.
SZKLO M, NIETO FJ. Epidemiology; beyond the basics. Gaithersburg: Aspen, 2000.
SZKLO M, NIETO FJ. Measuring associations between exposures and outcomes. En: Epidemiology beyond the basics.
Gaithersburg: Aspen, 2000.
ENS Octubre 2009
30
Diseo y Tipos de Estudios Epidemiolgicos
III. DISEO Y TIPOS DE ESTUDIOS EPIDEMIOLGICOS

Jess Castilla
En un sentido amplio, estudio epidemiolgico es cualquier actividad en la que se recurre al

mtodo epidemiolgico para profundizar en el conocimiento de temas relacionados con la salud.
En la prctica, la mayora de los estudios epidemiolgicos tienen como fin aportar informacin
que sirva de apoyo a la toma de decisiones en la planificacin o gestin de actividades
relacionadas con la salud. No obstante, tienen especial inters aquellos dirigidos a ampliar el
conocimiento cientfico sobre un tema concreto y, cuando cumplen condiciones adecuadas para
ello, pueden considerarse verdaderos estudios de investigacin.
El mtodo de investigacin epidemiolgica, como variante del mtodo cientficoexperimental, consta de las siguientes etapas: observacin y descripcin de la realidad,
elaboracin de hiptesis, verificacin de la hiptesis, y resolucin e inferencia causal.
El paradigma de la investigacin es el experimento cientfico, que consiste en realizar
observaciones bajo circunstancias controladas, en las cuales el investigador modifica las
condiciones con el fin de establecer el efecto que tiene dicha modificacin sobre las observaciones.
De forma ideal el experimento compara conjuntos de circunstancias que slo difieren en la
presencia o ausencia del factor objeto de estudio. En la prctica, se considera aceptable si la
variabilidad de otros factores distintos del que es objeto de estudio es suficientemente pequea
como para no afectar a los resultados de forma importante.
1.
DISEO
Cuando hablamos de la arquitectura o diseo de un estudio nos referimos a los procedimientos

y mtodos por los cuales se seleccionan los sujetos, se recoge y analiza la informacin y se
interpretan los resultados. En otras palabras, el diseo es la estrategia que elegimos para cumplir
los objetivos planteados.
Un estudio epidemiolgico es un proceso que consta de varias fases: definicin del problema
de investigacin, eleccin de la estrategia o diseo del estudio y planificacin de las
actividades.
Toda investigacin debe partir del conocimiento profundo y actualizado del tema que va a
ser objeto de estudio. La primera fase consiste en definir el problema a investigar, que ha de
incluir la justificacin del estudio, el propsito general, los objetivos especficos y la definicin
de la hiptesis operativa, que ha de ser contrastable por mtodos epidemiolgicos.
En la segunda fase se decide el diseo o estrategia general que se va a emplear para dar
respuesta a los objetivos y contrastar la hiptesis de investigacin. Esta decisin debe realizarse
partiendo de un buen conocimiento de las caractersticas y ventajas de los distintos tipos de
estudios epidemiolgicos, primando aquellos que garanticen una mayor validez y adecuacin al
objetivo, pero teniendo tambin en cuenta los recursos humanos, econmicos y de tiempo
disponibles.
Una vez decidido el objetivo y el diseo se han de planificar las distintas actividades del
estudio, que incluyen la definicin de la poblacin de estudio, la determinacin del tamao
muestral, el mtodo de seleccin de la muestra, los criterios de inclusin y exclusin, el periodo
ENS Octubre 2009
31
de estudio, la seleccin y definicin de las variables, las fuentes de informacin que se van a
utilizar, y cmo se van a desarrollar el procesamiento y anlisis de los datos.
2.
CRITERIOS DE CLASIFICACIN DE LOS ESTUDIOS EPIDEMIOLGICOS
El inters de la clasificacin de los estudios epidemiolgicos es indudable. Proporciona

una terminologa concisa para la comunicacin entre los profesionales y un esquema que facilita
la transmisin del conocimiento. A la vez, ayuda a prever los posibles sesgos y limitaciones que
pueden aparecer en funcin del tipo de estudio e identificar el diseo ms adecuado para cada
objetivo.
Existen muchas clasificaciones de los estudios epidemiolgicos, pero la mayora se basan
en algunos criterios bsicos comunes: la finalidad del estudio, la unidad de anlisis, la
direccionalidad, la forma de seleccin de la muestra, la relacin temporal y el control de la
asignacin del factor a estudio por parte del investigador. A continuacin se describen de forma
sucinta cada uno de estos criterios.
2.1.
Finalidad
Los estudios epidemiolgicos se clasifican segn su finalidad en descriptivos y

analticos. Los estudios descriptivos son los que estudian la frecuencia y distribucin de los
fenmenos de salud y enfermedad, mientras que los analticos se dirigen a evaluar presuntas
relaciones de causa-efecto. En otras palabras, los estudios descriptivos tratan de dar respuesta
a preguntas sobre el dnde?, cundo?, quines? y cmo?; mientras que los estudios
analticos tienen por objeto responder al por qu? de los fenmenos de salud y enfermedad
(Figura 3-1).
Entre la epidemiologa descriptiva y analtica existen mltiples conexiones. Aunque la
observacin y descripcin de la realidad en muchos casos es un fin en si mismo, tambin puede
ser el primer paso del mtodo cientfico experimental. En los estudios analticos es frecuente
que haya un componente descriptivo inicial.
Entre los estudios descriptivos suelen incluirse tambin aquellos que exploran presuntas
relaciones de causa-efecto, pero que debido a sus limitaciones en el diseo, sus resultados no
son aceptados como concluyentes. Algunos autores se refieren a estos estudios como diseos
observacionales incompletos o de cribado de hiptesis.
2.2.
Unidad de anlisis
Todos los estudios epidemiolgicos tienen en comn analizar problemas de salud en la

poblacin; no obstante, la unidad de anlisis puede ser:
el individuo, cuando se utilizan datos desagregados de cada sujeto, o
poblaciones, cuando se utilizan datos agregados de grupos de individuos (pases,
regiones, ciudades, distritos, familias, colegios, empresas, etc). Estos suelen llamarse
estudios ecolgicos.
Algunos estudios no se quedan en el nivel del individuo y tienen en cuenta la distinta
situacin que puede tener cada sujeto respecto al tema de estudio en distintos periodos de
tiempo.
ENS Octubre 2009
32
2.3.
Direccionalidad
Kramer y Boivin proponen clasificar los estudios segn su direccionalidad atendiendo al

orden en que se investiga la asociacin entre la causa y el efecto. Consideran tres
posibilidades:
Hacia delante, o secuencia desde la causa al efecto. Se seleccionan los sujetos en
funcin de la exposicin, y tanto en las personas expuestas como en las no expuestas
se evala la aparicin del efecto. Esta es la caracterstica principal de los estudios de
cohortes.
Hacia atrs, o secuencia desde el efecto a la causa. Se seleccionan personas, unas que
presentan el efecto y otras no, y se evala la presencia de la exposicin en todos. Un
ejemplo de ello seran los estudios de casos y controles.
Simultnea o sin direccionalidad. La exposicin y el efecto son evaluados a la vez.
Estos seran los estudios transversales.
Las dos primeras situaciones, en las que s hay direccionalidad, se engloban bajo el trmino
de estudios longitudinales y permiten establecer el orden en el que se producen los acontecimientos
en el tiempo, que es un argumento fundamental para demostrar relaciones de tipo causal. No
obstante, este argumento slo puede considerarse cumplido cuando el tiempo entre la exposicin
y el efecto tiene en cuenta el periodo de induccin correspondiente.
2.4.
Seleccin de la muestra
Segn el criterio utilizado para elegir a partir de la poblacin diana a los sujetos que
conformarn la muestra a estudiar, existen dos posibilidades:
Muestreo representativo. Consiste en seleccionar una muestra representativa de la
poblacin diana.
Muestreo de conveniencia. Cuando el efecto que se quieren estudiar es poco frecuente
puede ser ms eficiente muestrear personas que presentan el efecto, y despus, buscar
el grupo de comparacin ms adecuado. Por el contrario, cuando la exposicin a
estudiar es rara, puede interesar ir a buscar directamente personas expuestas y
compararlas con un grupo de personas no expuestas. Esta ltima situacin se produce
en el estudio de exposiciones que ocurren en determinadas actividades laborales.
2.5.
Relacin temporal o proximidad
El tiempo transcurrido desde que se produjeron los hechos que se analizan hasta el momento
en el que se realiza el estudio puede influir en la validez de la informacin. En funcin de esta
relacin temporal los diseos se clasifican en:
Histricos o retrospectivos. Estudian hechos ocurridos antes del comienzo del estudio.
La informacin puede obtenerse a partir de registros existentes, como por ejemplo en
el caso de los estudios de cohortes retrospectivas, o indagando en las entrevistas sobre
hechos ocurridos en el pasado.
Concurrentes o prospectivos. Consideran nicamente eventos que se producen a partir
del momento de inicio del estudio.
Mixtos. Estudian tanto hechos histricos como concurrentes.
Conviene no confundir la relacin temporal y la direccionalidad. As por ejemplo, un
estudio de casos y controles puede ser prospectivo, si se realiza sobre casos incidentes, o
retrospectivo, si incluye casos prevalentes.
ENS Octubre 2009
33
2.6.
Control de la asignacin de los factores de estudio
Los estudios experimentales son aquellos en los que el investigador controla la asignacin
de la exposicin a estudio. Todos ellos son de tipo analtico, y por razones ticas, suelen limitarse
exclusivamente a evaluar intervenciones teraputicas o preventivas.
Estudios observacionales son todos aquellos en los que el investigador no controla la
asignacin de la exposicin, limitndose a analizar factores cuya presencia o ausencia en los
individuos se ha producido por un motivo independiente a la investigacin.
3. CLASIFICACIN DE LOS ESTUDIOS EPIDEMIOLGICOS
Existen muchas clasificaciones de los estudios epidemiolgicos, la mayora de las cuales se
basan en los criterios mencionados en el apartado anterior. En las Tablas 3-1, 3-2 y 3-3, y en la
Figura 3-1 se muestran varios ejemplos. Las principales diferencias entre las diversas
clasificaciones radican en la importancia y prioridad que dan a cada criterio y en discrepancias
en la terminologa utilizada. Esto pone de manifiesto la dificultad para establecer un esquema que
permita clasificar la enorme diversidad de estudios posibles. Por otra parte, no es raro que en una
misma investigacin haya ms de un objetivo y coexistan varios diseos diferentes. Adems,
existen diseos mixtos, hbridos y situaciones intermedias que rompen la generabilidad de las
clasificaciones.
3.1.
Estudios descriptivos
Los estudios descriptivos son los que tienen por objeto observar y describir la realidad en
funcin de las variables de tiempo, lugar y persona. Son con diferencia los estudios ms
frecuentes y la aplicacin ms habitual de la epidemiologa.
La gran mayora de estos estudios se realizan con la finalidad de aportar informacin sobre
aspectos concretos de la realidad, que sirva de apoyo a la toma de decisiones en los distintos mbitos
relacionados con la salud: actividad asistencial, planificacin sanitaria, gestin de recursos de salud,
intervenciones en salud pblica y polticas de salud. En la medida que los estudios descriptivos
suponen la observacin y descripcin de la realidad, ofrecen tambin una fuente de hiptesis para la
investigacin epidemiolgica.
Los estudios descriptivos pueden utilizar informacin existente (fuentes secundarias) o
plantearse la recogida de informacin a tal efecto. Entre las posibles fuentes de datos estn las
historias clnicas, cuestionarios especficos, resultados de analticas de laboratorio, sistemas de
vigilancia, estadsticas vitales, bases de datos de actividad asistencial, registros de morbilidad,
datos de consumos de recursos sanitarios, etc.
Algunos estudios descriptivos tienen como unidad de anlisis el individuo, entre los que
estn la descripcin de un caso, la serie de casos y los estudios transversales. Otros tienen como
unidad de anlisis la poblacin o el grupo de individuos y son los llamados estudios
ecolgicos.
ENS Octubre 2009
34
Tabla 3-1. Clasificacin de los estudios epidemiolgicos.
x Estudios descriptivos
-
Estudio de una serie de casos

- Transversal
- Longitudinal: anlisis descriptivo de una cohorte
Estudios descriptivos de datos agregados

- Anlisis geogrficos
- Anlisis de series temporales
- Anlisis en funcin de otras variables
Estudios descriptivos de prevalencia
x Estudios observacionales de cribado de hiptesis. Diseos incompletos

-
Estudios ecolgicos de correlacin
Diseos proporcionales
- Estudios de mortalidad proporcional
- Estudios de morbilidad proporcional
x Estudios analticos observacionales

-
Estudios transversales
Estudios de casos y controles

- Con casos prevalentes
- Con casos incidentes
Estudios de cohortes
- Cohortes histricas (retrospectivas)
- Cohortes concurrentes (prospectivas)
- Cohortes mixtas
Diseos hbridos
- Estudio de cohorte-casos
- Estudio de casos y controles anidado en una cohorte
x Estudios experimentales
-
Estudios cuasi-experimentales o de intervencin no aleatorizados
Ensayo controlado y aleatorizado

- Ensayo clnico
- Ensayo de campo
- Ensayo comunitario
ENS Octubre 2009
35
Tabla 3-2. Clasificacin de los estudios observacionales (modificada a partir de Kleinbaum y cols.)
Diseos bsicos
- Cohortes
- Caso-control
- Transversales
Diseos incompletos
- Estudios ecolgicos
- Estudios de mortalidad o morbilidad proporcional
- Estudios de agregacin temporo-espacial
Diseos hbridos
- Estudios de casos y controles anidados en una cohorte
- Estudios de caso-cohorte
Tabla 3-3. Clasificacin de los estudios epidemiolgicos en funcin del

control de la exposicin,el objetivo y la unidad de anlisis.
Unidad de anlisis
Segn el control de la Objetivo
exposicin
Individuo
Ensayo clnico
Ensayo de campo
Experimentales
Analticos
Observacionales
Cohortes
Analticos
(comprobacin de Casos y controles
hiptesis)
Transversales analticos
Diseos
incompletos
(cribado de
hiptesis)
Descriptivos
Poblacin
Ensayo comunitario
Estudios de mortalidad o
morbilidad proporcional
Estudios ecolgicos de
correlacin
Encuestas de prevalencia
descriptivas
Series de casos
Estudios descriptivos
con datos agregados
ENS Octubre 2009
36
Figura 3-1. Clasificacin de los estudios epidemiolgicos.

QU ?
CUANTOS ?
MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD
QUIN ?
DNDE?
CUNDO?
DISTRIBUCIN
DE LA ENFERMEDAD
DETERMINANTES
DE LA ENFERMEDAD
POR QU?
HIPTESIS
ESTUDIOS DESCRIPTIVOS
POBLACIONES
COMO UNIDADES
DE ESTUDIO
ESTUDIOS
ECOLGICOS
ESTUDIOS ANALTICOS
INDIVIDUOS
COMO UNIDADES
DE ESTUDIO
SERIE DE
CASOS
ESTUDIOS
TRANVERSALES
ESTUDIOS
OBSERVACIONALES
ESTUDIOS DE
INTERVENCIN
ESTUDIO DE
COHORTES
ENSAYO
CLNICO
ESTUDIO DE
CASOS Y
CONTROLES
ENSAYO
COMUNITARIO
Esquema adaptado a partir de materiales docentes de J. M. Martn-Moreno.
ENS Octubre 2009
37
3.1.1.
Descripcin de un caso o de una serie de casos
Describen la experiencia de un nico paciente o de un grupo de pacientes con diagnstico

similar, que presentan alguna caracterstica o curso clnico inusual. Pueden ser el punto de
partida para una nueva hiptesis. Estos estudios pueden generarse a partir de la actividad
asistencial o de la notificacin a los sistemas de vigilancia epidemiolgica. El paso fundamental
en ellos es establecer la definicin de caso y los criterios de inclusin y exclusin. Su principal
limitacin es la falta de un grupo control, lo que impide evaluar hiptesis de tipo causal.
Estos estudios suponen una tercera parte de las publicaciones biomdicas. En muchos
casos quedan en la bibliografa como la descripcin de una rareza, pero en algunas ocasiones
han sido el primer paso para la identificacin de una enfermedad emergente o para un nuevo
avance cientfico. La descripcin de una serie de casos puede ser la primera constancia de un
brote epidmico o de una nueva epidemia. Un ejemplo de ello fue la descripcin en 1981 en
Los ngeles de 5 casos de neumona por Pneumocystis carinii en hombres homosexuales
previamente sanos. Esta serie de casos fue la primera descripcin del sida y el primer paso
para el descubrimiento del virus de la inmunodeficiencia humana. Otro ejemplo fue la
descripcin en Espaa de un aumento de casos de neumona atpica que no respondan al
tratamiento y que ms tarde permiti la identificacin del sndrome por consumo del aceite
txico.
La descripcin de un caso o serie de casos puede plantearse de forma transversal o
longitudinal. Series longitudinales son la cohorte de sujetos a riesgo con el fin de cuantificar la
incidencia de una enfermedad, o la cohorte de sujetos enfermos para describir su historia
natural.
3.1.2.
Estudios descriptivos con datos agregados
Tambin son llamados estudios ecolgicos descriptivos. Describen la frecuencia de un

determinado evento relacionado con la salud en la poblacin, su tendencia en el tiempo, su
distribucin en el espacio o en funcin de otras caractersticas de las personas como el sexo,
edad, profesin, nivel educativo, clase social, etc. Son abordajes muy frecuentes en el campo de
la salud pblica, como apoyo a actividades de planificacin y gestin sanitarias.
Las posibilidades de estos estudios estn condicionadas a la existencia de sistemas de
informacin y a la calidad de sus datos. Las fuentes de informacin pueden ser las estadsticas
de mortalidad, los registros de morbilidad, los sistemas de vigilancia epidemiolgica u otros
sistemas de informacin sanitaria. Permiten obtener medidas de frecuencia absolutas y relativas,
de incidencia, prevalencia o mortalidad, pudiendo establecer comparaciones entre grupos. Los
cambios en la frecuencia del evento estudiado a lo largo del tiempo, las diferencias geogrficas
o las diferencias en funcin de las caractersticas de las personas, son fuentes de hiptesis para
estudios analticos posteriores.
El planteamiento general de estos estudios es sencillo y requiere pocos medios y tiempo
para su ejecucin. Sus aplicaciones prcticas estn experimentando un rpido crecimiento al
disponerse de mejores sistemas de informacin sanitaria y herramientas metodolgicas. Los
estudios descriptivos en funcin de la variable tiempo han encontrado un amplio desarrollo a
travs de los anlisis de series temporales y de edad-periodo-cohorte. Los estudios en funcin
de la variable espacio han expandido sus posibilidades gracias a los sistemas de informacin
geogrfica.
En este apartado tambin se incluyen los estudios que exploran posibles agregaciones
temporales y/o espaciales de casos. Cuando se detecta una agregacin de casos de una
enfermedad en el tiempo o en el espacio, por encima de lo esperable por el azar, es muy
ENS Octubre 2009
38
sugerente de un foco etiolgico comn, probablemente infeccioso o ambiental. La deteccin

de una agregacin de casos puede aportar hiptesis para la investigacin etiolgica, y puede
ayudar a identificar el foco comn para actuar sobre l y controlar la aparicin de nuevos
casos.
3.1.3.
Estudios descriptivos de prevalencia
Las encuestas de prevalencia, tambin llamadas estudios transversales, pueden realizarse

con una finalidad analtica, pero en muchos casos se limitan a objetivos meramente descriptivos.
Por ello, dependiendo de cada caso, podran ser clasificados como estudios descriptivos o
analticos, e incluso algunos autores han llegado a incluirlos en una categora intermedia de
estudios mixtos. Su caracterstica principal es que no tienen direccionalidad, es decir, toda la
informacin recogida hace referencia a un mismo momento en el tiempo. Con frecuencia la
seleccin de la muestra se hace de forma representativa de la poblacin diana, lo que facilita el
que los resultados sean generalizables a dicha poblacin. Ofrecen una visin instantnea de lo
que ocurre en la poblacin en un momento dado. La medida de frecuencia que proporcionan es
la prevalencia.
A este tipo de estudios pertenecen las encuestas que se realizan como apoyo a las actividades
de planificacin sanitaria de diversa ndole, como las encuestas de salud, las encuestas de
satisfaccin de los usuarios, etc. En ocasiones las variables de estudio son resultados de
determinaciones de laboratorio, como es el caso de las encuestas seroepidemiolgicas, cuyo
objeto es conocer la prevalencia de marcadores serolgicos de distintas infecciones en la
poblacin diana.
Entre los estudios descriptivos transversales se incluyen los que evalan mtodos
diagnsticos, comparando los resultados de una tcnica con los de la tcnica de referencia, y
tambin, los estudios que evalan la concordancia entre tcnicas o entre observadores.
3.2.
Diseos observacionales incompletos o estudios de cribado de hiptesis
En este apartado nos referimos a algunos estudios epidemiolgicos que se dirigen a explorar
presuntas relaciones de causa-efecto, si bien, debido a las limitaciones de su diseo, sus
resultados no son aceptados como concluyentes. Entre stos podran incluirse los estudios
ecolgicos y los de morbilidad o mortalidad proporcional. Muchos manuales de epidemiologa
incluyen este grupo de estudios en el apartado de los descriptivos. Sin embargo, Rothman y
Greenland se refieren a stos como estudios de cribado de hiptesis, ya que cumpliran la
funcin de preseleccionar hiptesis de trabajo para posteriores estudios analticos. Kleinbaum
y colaboradores utilizan el trmino de diseos observacionales incompletos.
3.2.1.
Estudios ecolgicos de correlacin
Los estudios ecolgicos se caracterizan porque las unidades de anlisis son grupos de
individuos o poblaciones. Utilizan una medida de la frecuencia de la enfermedad en cada una
de las poblaciones de estudio y evalan su relacin con algn factor de inters como la edad, la
fecha de estudio, la utilizacin de servicios de salud, el consumo de determinados alimentos, de
medicamentos o de otros productos. La medida de asociacin que se obtiene es el coeficiente
de correlacin y por ello tambin se les llama estudios de correlacin.
Los grupos de individuos que se utilizan como unidad de estudio son habitualmente los
habitantes de distintos pases, regiones o ciudades, pero tambin pueden compararse cohortes
de nacimiento o grupos ms pequeos como colegios, empresas o familias. Cuando se compara
la poblacin de un mismo lugar en distintos momentos del tiempo se habla de estudios de
tendencia ecolgica.
ENS Octubre 2009
39
Un ejemplo de estudio ecolgico es el anlisis de la correlacin a nivel de pases entre el

consumo per cpita de cigarrillos y la tasa de mortalidad por enfermedad coronaria.
La principal ventaja de estos diseos es que se realizan sobre fuentes de informacin
secundarias, ya disponibles, lo que hace que sean rpidos de ejecucin y econmicos. Su
principal limitacin es la imposibilidad de establecer la relacin entre la exposicin y el efecto
a nivel de los individuos. Puede ocurrir que se observe una asociacin cuando se analizan
poblaciones, sin que exista realmente en el nivel de los individuos, situacin que se denomina
falacia ecolgica. La segunda limitacin importante es la dificultad para controlar el efecto de
potenciales factores de confusin, porque no siempre se dispone de la informacin sobre estos
factores y adems puede resultar imposible separar el efecto de variables que se correlacionan
muy estrechamente a nivel poblacional.
3.2.2.
Estudios de morbilidad o mortalidad proporcional
Son estudios que tratan de evaluar la asociacin entre un factor y un evento, que puede ser
la morbilidad o la mortalidad por una determinada causa. Se clasifican en:
Estudios de mortalidad proporcional, si el efecto es la mortalidad.
Estudios de morbilidad proporcional, si el efecto es la incidencia de una enfermedad.
Se realizan a partir de informacin de registros de mortalidad, o de registros de morbilidad
como los de cncer, de sida, de enfermedades de declaracin obligatoria, de altas hospitalarias,
etc. En un estudio de mortalidad proporcional la comparacin se establece entre la proporcin
de las muertes en sujetos expuestos que es debida a una determinada causa, con la misma
proporcin en los sujetos no expuestos. Para algunos autores los estudios proporcionales son un
tipo particular de estudios de casos y controles (Rothman y Greenland, 1998), donde los
controles son enfermos o fallecidos por otras causas.
La aplicabilidad de estos estudios est limitada en funcin de las variables que se recogen
en los registros. La medida de efecto que se obtiene es la razn de mortalidad (o morbilidad)
proporcional. Esta medida es un buen estimador de la razn de tasas cuando se cumple la
asuncin de que la morbilidad o mortalidad por las restantes causas es independiente de la
exposicin; no obstante, esta asuncin es difcil de demostrar. Otra limitacin de los estudios de
mortalidad proporcional es que no permiten diferenciar si la exposicin se asocia a la enfermedad
o a la evolucin fatal en los que la padecen.
3.3
Estudios analticos observacionales
Los estudios analticos son aquellos que renen condiciones adecuadas para evaluar
hiptesis y responder al por qu de los fenmenos de salud y enfermedad. En funcin de la
actitud que adopta el investigador los estudios analticos se clasifican en dos grandes grupos:
los estudios observacionales y los experimentales. En los observacionales el investigador se
limita a comparar sujetos en funcin de su exposicin al factor objeto de estudio, sin haber
intervenido en dicha exposicin.
La mayor parte de los autores distinguen tres tipos de diseos observacionales bsicos: los
de corte transversal, los de casos y controles, y los de cohortes. Adems hay diseos hbridos
que combinan elementos de distintos diseos bsicos. En la figura 3-2 se muestran de forma
esquemtica un ejemplo de los tres diseos bsicos y en la tabla 3-4 un anlisis comparativo de
las ventajas e inconvenientes de los principales diseos analticos.
ENS Octubre 2009
40
3.3.1.
Estudios de corte transversal
Los estudios de corte transversal o de prevalencia se utilizan en ocasiones para evaluar

hiptesis de tipo causal. La seleccin de la muestra suele ser representativa de la poblacin de
estudio, lo que facilita que los resultados sean generalizables a la poblacin. Se caracterizan
por no tener direccionalidad: tanto la evaluacin de la exposicin como la del efecto hacen
referencia a un mismo momento en el tiempo (Figura 3-2). Esto impide establecer la relacin
temporal entre ambos, limitando la aportacin de este diseo en la investigacin de relaciones
de tipo causal. Otros posibles problemas son que ante una asociacin puede no ser fcil
distinguir entre un factor de riesgo y un factor pronstico, y que los casos con mayor duracin
tienden a estar sobrerrepresentados. Por todos estos motivos se atribuye a los estudios
transversales menor valor que a los otros diseos analticos a la hora de evaluar asociaciones
causales. No obstante, los estudios transversales pueden ser adecuados para evaluar
exposiciones que no cambian en el tiempo, como el tipo sanguneo, o cuando la exposicin
actual es un buen indicador de la exposicin relevante respecto al posible efecto, lo cual es
ms probable si la exposicin es constante en el tiempo. En algunos temas, la investigacin
etiolgica suele hacerse sobre casos prevalentes por la dificultad de establecer el comienzo de
los procesos, como ocurre con las enfermedades congnitas, la hipertensin arterial, la
diabetes, etc.
3.3.2.
En los estudios de casos y controles se seleccionan dos grupos de sujetos, unos con el
efecto que se estudia (casos) y otros sin l (controles). La direccionalidad del estudio se establece
hacia atrs, ya que en un segundo paso se indaga en cules de los sujetos estuvo presente la
exposicin que se estudia (Figura 3-2).
En funcin de la relacin temporal puede ser:
retrospectivo o histrico, si se incluyen casos prevalentes,
prospectivo o concurrente, si se incluyen slo casos incidentes, y
mixto, si se incluyen ambos tipos de casos.
Los casos prevalentes estn ms expuestos a posibles sesgos de superviviencia selectiva y
de memoria. En los estudios de casos y controles no es posible obtener medidas de incidencia
y se recurre a la odds ratio como medida de asociacin que estima la razn de tasas de
incidencia.
Los estudios de casos y controles son especialmente eficientes para el estudio de
enfermedades poco frecuentes o con largos periodos de latencia.
ENS Octubre 2009
41
Figura 3-2. Esquema de un ejemplo de diseos de corte transversal, de casos y controles y de cohortes.
Estudio de corte transversal

Medicin
Enfermos expuestos
Seleccin
Poblacin
Enfermos no expuestos
Muestra
No enfermos expuestos
No enfermos no expuestos
Estudio de casos y controles

Medicin
Seleccin
Expuestos
Enfermos
(casos)
No expuestos
Expuestos
No enfermos
(controles)
No expuestos
Estudio de cohortes
Enfermos
Seleccin
Poblacin
Expuestos
Medicin
Enfermos
No enfermos
No enfermos
Enfermos
No expuestos
No enfermos
ENS Octubre 2009
42

- Rpidos de realizar y baratos.
- Adecuados para enfermedades con
largo periodo de latencia.
- ptimos para enfermedades raras.
- Permiten analizar varios factores
etiolgicos de la enfermedad.
- Ineficientes para exposiciones raras.

- No permiten obtener tasas de
incidencia.
- Puede ser difcil establecer la
relacin temporal de los eventos.
- Tendencia a sesgos de seleccin y de
memoria.
- Especialmente indicados en
enfermedades crnicas
- Resultados fcilmente generalizables
a la poblacin.
- Rpidos de realizar y baratos.
- Aportan medida de la prevalencia,
til para tareas de administracin
sanitaria.
- Permiten analizar simultneamente
varios efectos.
- No permiten establecer la relacin

temporal entre causa y efecto.
- No permiten distinguir entre factores
de riesgo y factores pronsticos.
- Posibles sesgos en la medida de la
exposicin.
- No tiles en enfermedades raras.
- Permiten establecer la secuencia

temporal entre exposicin y efecto..
- Permiten un mayor control de la
exposicin, de sesgos y de
potenciales confusores.
Estudios experimentales
ENS Octubre 2009
- Ineficientes para enfermedades raras. - Limitados a evaluar medidas

- Los prospectivos son costosos y de
preventivas o teraputicas, por
larga duracin.
razones ticas.
- Las cohortes histricas requieren la - Menor generabilidad de los
existencia de registros disponibles.
resultados por realizarse en
- La validez puede afectarse por
poblaciones muy seleccionadas.
prdidas de seguimiento.
- Slo estudian una intervencin.
- Elevado coste.
- ptimos para exposiciones raras.

- Permiten estudiar varios efectos de
una misma exposicin.
- Establecen la relacin temporal de
los acontecimientos.
- Permiten medir incidencia.
- En las cohortes concurrentes se
minimizan los sesgos en la medida
de la exposicin.
Tabla 3-4. Ventajas e inconvenientes de distintos diseos epidemiolgicos analticos.
Estudios de corte transversal
VENTAJAS
DESVENTAJAS
43
3.3.3.
La caracterstica que los distingue es que la direccionalidad va desde la exposicin hasta el

efecto. Los acontecimientos se estudian en la misma secuencia en la que se produjeron, lo que
hace que este diseo sea ms intuitivo y fcil de entender. La seleccin de la muestra puede
hacerse de forma representativa de la poblacin diana o en funcin de la exposicin, como por
ejemplo en las cohortes ocupacionales. Esta ltima posibilidad es especialmente til cuando se
estudian exposiciones raras. En funcin de la relacin temporal entre los hechos que se estudian
y el momento de realizacin de la investigacin, los estudios de cohortes pueden ser histricos,
concurrentes o mixtos.
Los estudios de cohortes histricas, tambin son llamadas retrospectivas, se basan en
informacin recogida en registros.
Los estudios de cohortes concurrentes o prospectivos slo tienen en cuenta los eventos
que se producen a partir del comienzo del estudio.
Los estudios de cohortes mixtas son los que combinan informacin prospectiva y
retrospectiva.
Inicialmente todos los sujetos estn libres del efecto y se diferencian segn la exposicin.
A partir de ese momento se requiere contemplar el seguimiento de todos los sujetos durante un
intervalo de tiempo suficiente para dar margen al periodo de induccin del efecto que se analiza.
Al final del seguimiento se evala la aparicin del efecto en los dos grupos (Figura 3-2).
Los estudios de cohortes permiten establecer la relacin temporal entre la exposicin y el
efecto, y obtener medidas de incidencia. Adems si las cohortes son concurrentes se minimizan
los sesgos en la medida de la exposicin.
3.3.4.
Diseos hbridos
Bajo este epgrafe se incluyen los estudios de cohorte-casos y los estudios de casos y
controles anidados en una cohorte. En ambos se parte de un estudio de cohortes. En el anlisis
se incluyen todos los casos y, como grupo de comparacin, se toma una submuestra de la
cohorte. De esta forma se reduce considerablemente el nmero de sujetos que es necesario
estudiar, sin que ello suponga una disminucin importante de la potencia del estudio. Estos
diseos consiguen mejorar mucho la eficiencia cuando la medicin de la exposicin o de otras
variables de anlisis es costosa.
3.4.
Estudios experimentales
Los estudios experimentales son aquellos en los que la exposicin es asignada por el
investigador en funcin de lo establecido previamente en el protocolo. Cuando la asignacin se
realiza en funcin de otros criterios, como por ejemplo, la aplicacin de un tratamiento siguiendo
criterios teraputicos, podremos estar ante un estudio observacional, pero no experimental.
Con el fin de garantizar la mayor comparabilidad entre los grupos y evitar sesgos, lo ideal es
que la asignacin de la exposicin se realice de forma aleatorizada, aunque esto no siempre
es posible. Muchos autores consideran estudios experimentales exclusivamente a aquellos
realizados de forma aleatorizada: ensayos clnicos, ensayos de campo y ensayos comunitarios.
Por razones ticas estos estudios nicamente tienen aplicacin para evaluar el efecto de
exposiciones potencialmente teraputicas o preventivas. Adems, las alternativas que se
comparan deben ser a priori igualmente aceptables en funcin del conocimiento que se tiene
sobre el tema; por ejemplo, el mejor tratamiento existente debe ser la referencia de comparacin
para cualquier nuevo tratamiento.
ENS Octubre 2009
44
3.4.1.
Estudios cuasi-experimentales o de intervencin no aleatorizados
Se utiliza el trmino de estudios cuasi-experimentales para referirse a aquellos en los que

hay asignacin controlada de la exposicin sin seguir un procedimiento aleatorio. Las unidades
de asignacin del factor de estudio pueden ser los individuos o tambin las poblaciones. Dentro
de los estudios cuasi-experimentales tambin se incluyen los estudios en los que la comparacin
se establece entre los mismos sujetos antes y despus de aplicar la intervencin.
Este tipo de estudios se utilizan frecuentemente para la evaluacin de la eficacia de
actividades preventivas y de educacin para la salud.
3.4.2.
Ensayo clnico
En los ensayos clnicos, tambin llamados ensayos aleatorizados controlados, las unidades
de estudio son pacientes. Su objetivo suele concretarse en evaluar nuevos tratamientos o
estrategias de prevencin secundaria. Sobre la poblacin diana se aplican los criterios de
inclusin y exclusin, previamente protocolizados, y se obtienen los sujetos elegibles. Existe un
acuerdo universal de que la asignacin aleatoria del tratamiento es el mejor mtodo para
garantizar la comparabilidad inicial de los grupos respecto a todas las caractersticas. Cuando
es posible, conviene emplear enmascaramiento, es decir, que el paciente, la persona que asigna
la exposicin y la que evala el resultado, desconozcan qu pacientes reciben el tratamiento
nuevo y cules el tratamiento habitual (o el placebo). Finalizado el seguimiento de los pacientes
se procede a comparar los resultados de la intervencin entre los grupos.
3.4.3.
Ensayo de campo
Los ensayos de campo evalan medidas de prevencin primaria y, por tanto, se aplican en
sujetos sanos. Como la incidencia de la mayora de enfermedades en poblacin sana es muy
baja, se requiere que estos estudios tengan un elevado nmero de participantes, para poder
obtener resultados concluyentes. Esto limita la aplicabilidad de los ensayos de campo a medidas
de prevencin en enfermedades frecuentes o muy graves y hace que sean estudios econmicamente
muy costosos. En ejemplo sera la evaluacin del suplemento vitamnico en poblacin sana para
prevenir ciertas enfermedades.
3.4.4.
Ensayo de intervencin comunitaria
Los ensayos de intervencin comunitaria evalan tambin medidas de prevencin primaria,

pero se caracterizan porque la unidad de asignacin del factor de estudio y de anlisis son
grupos de individuos o comunidades. Algunos ejemplos de posibles intervenciones comunitarias
son la fluoracin de las aguas de abastecimiento pblico, los programas de educacin utilizando
medios de comunicacin de masas, o la intervencin medioambiental en el lugar de trabajo. La
asignacin puede hacerse de forma aleatoria entre los grupos o comunidades, pero lo ms
frecuente es que no sea as y en este caso pasaran a ser estudios cuasi-experimentales.
4.
ESTUDIOS EPIDEMIOLGICOS Y GRADO DE EVIDENCIA CIENTFICA
Rara vez se atribuye a un nico estudio la evidencia cientfica definitiva respecto a un

tema; sin embargo, son muchos los estudios epidemiolgicos que aportan algn grado de
evidencia, a favor o en contra de presuntas asociaciones de tipo causal. An asumiendo la
validez de los estudios, no todos aportan un mismo grado de evidencia. Segn Maclure las
caractersticas de los estudios epidemiolgicos que permiten alcanzar una mayor validez son
por orden de importancia: la aleatorizacin y enmascaramiento, la desagregacin del anlisis a
ENS Octubre 2009
45
nivel del individuo, el diseo longitudinal y el planteamiento prospectivo. Por tanto, estas
caractersticas en los estudios les conferiran un mayor grado de evidencia cientfica.
En la tabla 3-5 se ordenan los principales diseos en funcin del grado de evidencia que
proporcionan. A los ensayos controlados con enmascaramiento se les atribuye el mayor grado
de evidencia cientfica dentro de la investigacin epidemiolgica. El resto de ensayos controlados
y los estudios de cohortes, siempre que la metodologa se haya aplicado correctamente y se
descarten sesgos importantes, se les reconoce el muy alto grado de evidencia. A los estudios de
casos y controles y transversales, cuando se han descartado sesgos importantes, se les atribuye
un grado de evidencia elevado. Por ltimo, a los estudios proporcionales, ecolgicos y
descriptivos en general, se les atribuye un valor orientativo, pero no concluyente.
Tabla 3-5. Clasificacin de los diseos epidemiolgicos segn el grado de evidencia cientfica
que se les atribuye en la investigacin. Ordenados de mayor a menor evidencia.
1. Ensayo controlado aleatorizado con enmascaramiento.

2. Ensayo controlado aleatorizado sin enmascaramiento.
3. Ensayo controlado no aleatorizado, estudio de intervencin
4. Estudio de cohortes concurrentes (prospectivas)
5. Estudio de cohortes histricas (retrospectivas)
6. Estudio de casos y controles con casos incidentes
7. Estudio de casos y controles con casos prevalentes
8. Estudio de corte transversal
9. Estudio de mortalidad o morbilidad proporcional
10. Estudio ecolgico de correlacin
5.
ARGIMN PALLS JM, JIMNEZ VILLA J. Mtodos de investigacin clnica y epidemiolgica (Segunda edicin).
Barcelona: Harcourt, 1997.
BOLUMAR MONTRULL F, REBAGLIATO RUSO M, TORRES CANTERO AM. Estrategias de diseo en
epidemiologa. Tipos de estudios. En: Piedrola Gil (Ed.) Medicina Preventiva y Salud Pblica (10 Edicin). Barcelona:
Masson, 2000. pp. 79-86.
FEINSTEIN AR. Clinical epidemiology: the architecture of clinical research. Philadelphia: WB Saunders, 1985. pp. 12-24.
GUALLAR EM. Alternativas al diseo tradicional de los estudios de cohortes: estudios de casos y controles hbridos, y
estudios de cohortes y casos. Rev Salud Pblica 1991;2:151-165.
HENNEKENS CH, BURING JE. Epidemiology in medicine. Boston: Little Brown and Company, 1987.
KELSEY JL, PETITTI DB, KING AC. Key methodologic concepts and issues. En: Brownson RC, Petitti DB (Eds.).
Applied epidemiology: theory to practice. New York: Oxford University Press, 1998. pp. 35-48.
KLEINBAUM DG, KUPPER LL, MORGENSTERN H. Epidemiologic research. Principles and quantitative methods.
New York: Van Nostrand Reinhold, 1982.
KRAMER MS, BOIVIN JF. Towards an unconfounded classification of epidemiologic research design. J Chronic Dis
1987;40:683-688.
MACLURE M. Taxonomic axes of epidemiological study designs: a refutationist perspective. J Clin Epidemiol
1991;44:1045-1053.
ROTHMAN KJ, GREENLAND S. Types of epidemiologic studies. En: Rothman KJ, Greenland S. (Eds.) Modern
epidemiology (Second edition). Philadelphia: Lippincott Raven Publisher, 1998. pp.67-78.
ENS Octubre 2009
46
Sesgos y Factores de Confusin
IV. SESGOS Y FACTORES DE CONFUSIN

Fernando Villar lvarez
Si se entiende que los estudios epidemiolgicos son ejercicios de medicin cuyo objetivo
es estimar valores de frecuencia de enfermedad o medidas de efecto de una exposicin sobre
una enfermedad, se puede apreciar fcilmente que la meta fundamental ser conseguir la
exactitud (accuracy en ingls) en esa medicin: estimar el valor del parmetro estudiado con el
menor error posible. Existen dos tipos de error que pueden afectar a la medicin: error aleatorio
y error sistemtico.
1.
PRECISIN Y VALIDEZ
El error aleatorio (o al azar) produce una desviacin del resultado obtenido respecto del
verdadero valor en un determinado estudio, pero si el estudio se repitiera un nmero infinito
de veces con la misma metodologa y no hubiera sesgos, se obtendra un valor medio igual al
valor real. El error aleatorio surge debido a que los estudios se basan en un nmero limitado de
observaciones. Por ello, el error aleatorio disminuye al aumentar el tamao del estudio. El
error aleatorio no es constante en cada medicin, ni ocurre siempre en el mismo sentido. De
forma aleatoria, se obtienen valores a veces mayores y a veces menores que el valor real.
Rothman resume el error aleatorio como esa parte de nuestra experiencia que no podemos
predecir.
El error sistemtico se produce consistentemente en cada medicin y ocurre siempre en el
mismo sentido (se obtienen valores siempre mayores o siempre menores que el valor real). Por
tanto, el error sistemtico tambin produce una desviacin del resultado obtenido respecto del
verdadero valor en un determinado estudio. Sin embargo, cuando hay un error sistemtico si el
estudio se repitiera un nmero infinito de veces con la misma metodologa, se obtendra un
valor medio distinto del valor real. Por ello, el error sistemtico, a diferencia del error aleatorio,
no depende del tamao del estudio, con lo cual no se reduce aumentando su tamao. En presencia
de error sistemtico, el aumento del tamao del estudio nicamente conseguira aumentar la
precisin de la estimacin pero no su validez. Es decir, para un determinado nivel de seguridad,
el aumento del tamao del estudio conseguira disminuir el intervalo de confianza (aumento de
la precisin), pero el valor estimado estara igual de alejado del valor real (igual error
sistemtico).
La ausencia de error aleatorio o debido al azar se denomina precisin o fiabilidad. Por su
parte, la ausencia de error sistemtico se denomina validez.
La precisin se puede valorar examinando los intervalos de confianza de las estimaciones.
A mayor precisin, menor amplitud del intervalo de confianza.
Como se ha visto, los estudios epidemiolgicos se basan en la medicin de variables y estas
variables son aleatorias, es decir, su valor est determinado por un fenmeno aleatorio (regido por la
casualidad, no determinado completamente por otros factores). Por ello, la principal fuente de error
aleatorio es el proceso de seleccin de los sujetos estudiados, denominado error muestral. Se debe
entender que en todo estudio epidemiolgico hay un error muestral, ya que, tal como seala Rothman,
an en los estudios en que se pueda considerar que no hay en sentido estricto una seleccin de una
muestra o muestreo, como puedan ser los de seguimiento, siempre se deben considerar a los sujetos
ENS Octubre 2009
47
estudiados como una muestra de la experiencia biolgica de una poblacin ms amplia. Habitualmente,
las diferencias observadas en los resultados obtenidos en distintos estudios realizados en una misma
poblacin se deben al error aleatorio.
Ejemplo: En un estudio de prevalencia de la hipertensin arterial en una zona determinada
se extrae una muestra A y se obtiene una prevalencia del 20%. Si se extrajera en esa misma
zona una muestra B se podra obtener una prevalencia del 22%. Suponiendo que no hay
error sistemtico, esta diferencia se debera al error aleatorio. Esta variabilidad disminuir
si el tamao del estudio aumenta.
Otra fuente de error aleatorio es la propia variabilidad (varianza) del parmetro que se
mide.
Teniendo en cuenta que la precisin es la capacidad de obtener valores replicados que difieren
poco entre s. El error aleatorio va a originar una escasa reproducibilidad de los resultados y una
imprecisin de los estimadores de la frecuencia de la enfermedad o del efecto de la exposicin
sobre la enfermedad. Sin embargo, el error aleatorio no afecta en s a la validez, ya que influye por
igual en todos los grupos y subgrupos estudiados, pero s dificulta la posibilidad de encontrar una
asociacin entre dos variables por la imprecisin de las medidas.
El error aleatorio es un concepto estadstico, en cuya valoracin, lgicamente, tambin
deben considerarse elementos de juicio informado. Sin embargo, en la valoracin del error
sistemtico intervienen fundamentalmente elementos de juicio.
En la Tabla 4.1. se muestran las principales diferencias entre el error aleatorio y el error
sistemtico.
La validez o ausencia de error sistemtico se divide en dos componentes: validez interna (validez de
inferencia para las propias personas del estudio) y validez externa o generalizacin (validez de inferencia
a personas que estn fuera de la poblacin de estudio).
1.1.
Validez interna
La validez interna tiene relacin con la capacidad de inferir los resultados desde el grupo
de personas estudiadas hasta la poblacin base, poblacin elegible o poblacin de referencia
(conjunto de personas de donde proceden directamente las personas incluidas en el estudio).
Respondera a la pregunta: los resultados que se observan en el estudio son aplicables a la
poblacin base?
Ejemplo: En el estudio de seguimiento de Doll y Hill (1964) sobre la relacin del consumo
de tabaco y el cncer de pulmn realizado en los mdicos britnicos, los resultados
obtenidos tendrn validez interna si la relacin encontrada en los mdicos britnicos
estudiados es cierta en el conjunto de todos los mdicos britnicos (poblacin base o
elegible).
1.2.
Validez externa
La validez externa tiene relacin con la capacidad de generalizacin de los resultados desde el
grupo de personas estudiadas hasta la poblacin diana o poblacin general (conjunto de personas que
estn fuera de la poblacin de estudio y para los que se pretende obtener conclusiones vlidas de los
resultados obtenidos). Respondera a la pregunta: los resultados qu se observan en el estudio son
aplicables a cualquier grupo?
ENS Octubre 2009
48
Valoracin
Afecta a
Disminuye al aumentar el tamao del

estudio
Causa
SISTEMTICO
(SESGO)
Validez
Intervienen fundamentalmente elementos de
juicio informado
Precisin
Concepto estadstico unido a elementos
de juicio informado
ENS Octubre 2009
No
- Diseo, ejecucin y anlisis:

Seleccin de los sujetos del estudio
Obtencin de la informacin
Presencia de variables externas
distorsionadoras
ERROR
- Muestreo
- Variabilidad del parmetro
ALEATORIO
Tabla 4.1.- Principales diferencias entre el error aleatorio y el error sistemtico.
49
Para poder valorar la validez externa es necesario recurrir a criterios e informacin externos
al propio estudio. Para ello se utilizarn los criterios de causalidad (consistencia, plausibilidad
biolgica, etc.). En ltima instancia, la validez de una generalizacin es una cuestin de juicio
informado.
de tabaco y el cncer de pulmn realizado en los mdicos britnicos, los resultados
obtenidos tendrn validez externa o podrn ser generalizados si la relacin encontrada en
los mdicos britnicos estudiados es cierta en el conjunto de toda la poblacin inglesa o de
otros lugares (poblacin diana o general). Es decir, si el consumo de tabaco es un factor de
riesgo del cncer de pulmn en cualquier grupo de personas que fumen.
Es muy importante establecer claramente que en ausencia de validez interna la validez
externa de un estudio carece de sentido. La validez interna es un prerrequisito para que pueda
darse la validez externa. Por tanto, lo prioritario en un estudio epidemiolgico es que tenga
validez interna, lgicamente, adems tambin ser necesario tener en cuenta la validez externa.
de tabaco y el cncer de pulmn realizado en los mdicos britnicos, si la relacin encontrada
en los mdicos britnicos estudiados ni siquiera fuera vlida para el conjunto de todos los
mdicos britnicos de donde proceden, difcilmente va a ser vlida para otras poblaciones
ms amplias (poblacin diana o general).
Los errores sistemticos afectan a la validez interna de un estudio y, por lo tanto,
indirectamente tambin a la validez externa del mismo.
2.
2.1.
SESGOS
Concepto de sesgo
Una primera aproximacin al concepto la puede proporcionar el diccionario de la Real

Academia Espaola, que define el sustantivo sesgo como oblicuidad o torcimiento de una cosa
hacia un lado, o en el corte, o en la situacin, o en el movimiento. Para precisar el concepto
epidemiolgico se puede recurrir al Diccionario de Epidemiologa, que define el sesgo como
desviacin de la verdad de los resultados o inferencias, o los procesos que llevan a esa desviacin.
Cualquier tendencia en la recogida, anlisis, interpretacin, publicacin o revisin de los datos
que pueden conducir a conclusiones que son sistemticamente diferentes de la verdad.
Se entiende por sesgo cualquier error sistemtico que afecte a la validez de un estudio, es
decir, que aleje el valor observado del valor real o verdadero. Recurdese que se denomina
validez a la ausencia de sesgo sistemtico. Como habitualmente no se conoce el valor real y
nicamente se dispone del valor observado, en la mayora de las ocasiones no se tendr la
certeza de la presencia del sesgo ni de su magnitud. Por ello, slo ser posible prevenir o
minimizar los sesgos en el diseo y ejecucin del estudio mediante una adecuada seleccin de
los sujetos estudiados, una correcta obtencin de la informacin sobre los mismos, y la
prevencin en el diseo o control en el anlisis de las variables externas distorsionadoras.
Adems, se podr argumentar razonadamente acerca de su presencia y efecto sobre el parmetro
estimado. Por tanto, en la valoracin de un sesgo intervienen fundamentalmente elementos de
juicio informado.
Como se ha sealado, el error sistemtico, a diferencia del error aleatorio, no depende del
tamao del estudio, con lo cual no se reduce aumentando su tamao. En presencia de error
sistemtico, el aumento del tamao del estudio nicamente conseguira aumentar la precisin
ENS Octubre 2009
50
de la estimacin pero no su validez, ya que el valor estimado seguir estando igual de alejado
del valor verdadero.
2.2.
Tipos de sesgos
Existen distintos tipos de sesgos que pueden disminuir la validez interna de un estudio, es
decir, la inferencia de los resultados obtenidos a la poblacin base. Sackett (1979) ha descrito
docenas de posibles sesgos capaces de distorsionar la estimacin de una medida epidemiolgica,
pero para simplificar su exposicin se pueden agrupar en tres tipos generales:
Sesgo de seleccin.
Sesgo de informacin.
Sesgo de confusin.
El sesgo de seleccin se puede producir en las fases de diseo y ejecucin del estudio
debido a una inadecuada seleccin de los sujetos estudiados. Por su parte, el sesgo de informacin
se puede originar en las fases de diseo y ejecucin del estudio debido a una incorrecta obtencin
de la informacin sobre las personas estudiadas. Finalmente, el sesgo de confusin aparecer
cuando no se haya evitado en el diseo la presencia de variables externas distorsionadoras o no
se haya controlado su efecto en el anlisis.
Aunque as definidos, aparentemente estn claramente diferenciados, en la realidad, en
ocasiones es difcil poder distinguir entre estos tres tipos de sesgos, ya que no siempre aparecen
tan claramente delimitados. Hay sesgos de informacin / seleccin combinados, que tienen
componentes de informacin y de seleccin. Tambin, puede haber factores que parecen ser
responsables de un sesgo de seleccin y que, sin embargo, bajo determinadas circunstancias,
podran considerarse como factores de confusin. Se puede dar una gua til para poder distinguir
en la prctica entre el sesgo de confusin y el resto de los sesgos. Un sesgo es de confusin si
puede ser controlado en la fase de anlisis de los datos. Igualmente, cabe sealar las similitudes
entre algunos sesgos de seleccin y los sesgos de clasificacin errnea diferencial, como se ver
ms adelante.
Por tanto, esta clasificacin de los sesgos es una simplificacin de la realidad, que se hace
con prpositos fundamentalmente didcticos. Por este motivo, como sealan Szklo y Nieto, no
debe entenderse como una taxonomia rgida y mutuamente excluyente.
Adems, de los sesgos producidos en las fases de diseo y ejecucin de un estudio, tambin
pueden darse sesgos en la fase de difusin o publicacin de los resultados. Es lo que se denomina
sesgo de publicacin. En su sentido ms amplio, el sesgo de publicacin se puede entender
como cualquier influencia que reduzca la cantidad de ciencia vlida que aparece en la literatura
cientfica, es decir, cuando lo que se publica no es representativo de lo que se investiga.
Habitualmente se debe a la tendencia a publicar ms los estudios que obtienen resultados
positivos (encuentran diferencias estadsticamente significativas) frente a los negativos (no
encuentran diferencias estadsticamente significativas). Esto produce una visin incompleta y
sesgada de la evidencia disponible.
El sesgo de publicacin no es especfico del mbito sanitario. La mayor parte de la
investigacin sobre este sesgo se ha hecho en el campo de la psicologa y la educacin. Fue
Sterling quien en 1959 public el primer trabajo sobre el posible efecto de las decisiones de las
publicaciones. El sesgo de publicacin es la primera fuente de sesgo de seleccin en los
metanlisis (vase captulo 12).
Es de destacar algunas iniciativas para minimizar el sesgo de publicacin. En la actualizacin
de noviembre de 2003 de los Requisitos de uniformidad para la redaccin y edicin de
ENS Octubre 2009
51
manuscritos presentados a revistas biomdicas, elaborados por el Comit Internacional de

Directores de Revistas Mdicas, entre los aspectos editoriales relativos a la publicacin en
revistas biomdicas, se seala la obligacin de publicar estudios con resultados negativos. Se
dice que las revistas deberan considerar seriamente para su publicacin cualquier estudio que
haya sido rigurosamente realizado sobre cuestiones que sean importantes y relevantes para los
lectores, tanto si los resultados son negativos (aquellos que permiten de forma convincente
aceptar la hiptesis nula) como si son positivos (aquellos que permiten rechazar la hiptesis
nula). La publicacin de estudios con resultados negativos, en particular, contribuyen a evitar
sesgos de publicacin. Algunos estudios que pretenden ser negativos son, de hecho, poco
concluyentes. La publicacin de este tipo de estudios es problemtica, ya que aaden poco
conocimiento biomdico y consumen recursos de las revistas.
2.3.
Efectos de los sesgos
Cualquiera de los sesgos (seleccin, informacin y confusin), en funcin del efecto que
producen al distorsionar la estimacin de una medida epidemiolgica, pueden clasificarse en
positivos o negativos. Se denominan positivos cuando el parmetro epidemiolgico presenta un
valor superior al que realmente tiene (sobrestima o exagera el efecto), es decir, lo aleja de la
hiptesis nula (RR=1). Se denominan negativos cuando el parmetro presenta un valor inferior
al real (subestima o atena el efecto), es decir, lo aproxima a la hiptesis nula. En funcin de la
magnitud de la distorsin producida por la accin del sesgo, un efecto que existe en la realidad
puede llegar a anularse por el sesgo o incluso, si la distorsin es an mayor, puede llegar a
invertirse, cambiando el sentido de la asociacin, produciendo una modificacin cualitativa del
efecto. De esta forma, un sesgo sera capaz de hacer que un factor de riesgo apareciera como
factor de proteccin o al revs. Este fenmeno tan peligroso, que en el sesgo de confusin
recibe el nombre de Paradoja de Simpson, afortunadamente es muy poco frecuente y, para
que se produzca se requiere que la magnitud del efecto real sea pequea y que la distorsin
producida por el sesgo sea grande. Se suelen preferir los sesgos negativos a los positivos, ya que
si a pesar de haber un sesgo negativo se encuentra un efecto debido a una exposicin, es que esa
asociacin realmente existe, aunque sea de una magnitud algo mayor que la observada.
Habitualmente, no se va a tener la certeza de si un sesgo est presente o no, y slo se podr
argumentar sobre su presencia, sentido y magnitud, con la sola excepcin del sesgo de confusin,
que a diferencia del resto de los sesgos (seleccin e informacin), s se puede cuantificar y
controlar en el anlisis.
Este hecho nos pone sobre la pista de una de las ideas clave en el tema de los sesgos. Como
se ver ms adelante, la presencia de algn tipo de sesgo es prcticamente inevitable en cualquier
estudio epidemiolgico, aunque es cierto que unos tipos de diseo de estudio son ms vulnerables
que otros a la presencia de sesgos. Los estudios experimentales, como el ensayo clnico
aleatorizado, por el propio hecho de la aleatorizacin (no confundir con el muestreo aleatorio),
que tericamente controla todos los factores de confusin, conocidos y desconocidos, sobre
todo en estudios grandes, son poco susceptibles a que se introduzcan en ellos sesgos de confusin.
Dentro de los estudios observacionales, es bien conocido que los estudios de casos y controles
son ms proclives a la presencia de sesgos que los de cohortes. Hay sesgos que son inherentes
al propio tipo de diseo del estudio y no se puede impedir su presencia. Se puede sealar como
ejemplo, los estudios de casos y controles que utilicen una pregunta anamnsica para obtener la
informacin sobre la exposicin, que casi inevitablemente van a producir un sesgo de informacin
denominado sesgo de memoria. Por ello, la importancia de los sesgos no viene dada tanto por
el hecho de que estn presentes o no, ya que casi siempre van a actuar, sino por su magnitud y
especialmente cuando el efecto estudiado tiene una magnitud pequea, porque es entonces
ENS Octubre 2009
52
cuando el sesgo puede llevar a extraer conclusiones errneas. Cuando la asociacin estudiada
es fuerte, es ms difcil que el sesgo sea capaz de justificar completamente esa asociacin.
Tngase en cuenta a este respecto que uno de los criterios de Austin Bradford Hill (1965) para
valorar la posible causalidad de una asociacin es la fuerza o magnitud del efecto. A pesar de
ello, una asociacin dbil puede ser causal, ya que los criterios de Hill, y el de fuerza tambin,
pueden tener excepciones. La valoracin de la magnitud de la asociacin es una cuestin de
juicio informado, al que ayuda el conocer lo consistentemente grande que es el efecto en distintos
estudios sobre la misma relacin. La consistencia es otro de los criterios de causalidad y, para
algunos autores, es el ms importante, ya que es poco probable que distintos estudios sobre una
misma relacin, que tendrn sesgos diferentes, obtengan un mismo efecto si este no existe
realmente. El tema de causalidad ser expuesto detalladamente en el Captulo 13, que trata de
la Inferencia Causal en Epidemiologa.
2.4.
Diferencias entre los sesgos de seleccin e informacin y el sesgo de confusin
Aunque, tal como se ha sealado, el sesgo de confusin es un sesgo, tiene algunas

particularidades que lo diferencian del resto de los sesgos de seleccin e informacin. Por ello,
es frecuente que cuando se mencione simplemente sesgo, se est refiriendo exclusivamente a
los sesgos de seleccin e informacin. Y que cuando se refiera al sesgo de confusin se mencione
simplemente confusin. Para tener siempre presente que la confusin es un sesgo, es decir, es
un error sistemtico, es bueno anteponer al trmino de confusin la palabra sesgo.
Es necesario mencionar en este punto que hay autores que no comparten este criterio. Por
ejemplo, en los libros de Lilienfeld y Stoley, de Gordis, y de Szklo y Nieto se diferencia entre
asociaciones espurias debidas a sesgo y asociaciones indirectas (o estadsticas) debidas a
la confusin. Por tanto, conceptualizan la confusin como algo diferente a un sesgo, por cuanto
aunque en la confusin la relacin no sea causal, s es real. Sin embargo, aqu se seguir el
criterio propugnado, entre otros, por Rothman y Greenland, que consideran que la confusin es
un sesgo, ya que una asociacin confundida puede entenderse como un estimado sesgado de
una asociacin causal.
Los sesgos de seleccin e informacin son un problema de diseo y ejecucin del estudio
que da lugar a una estimacin errnea, distorsionada del efecto. Pueden aumentar, disminuir o
anular el efecto real. Por tanto, afectan a la validez del estudio. Habitualmente, no se pueden
cuantificar ni se pueden controlar en la fase de anlisis. Por tanto, deben evitarse mediante un
diseo cuidadoso. Frecuentemente son el punto dbil del estudio.
Por su parte, la confusin tambin es un sesgo, pero en este caso est producido por la
presencia de una variable externa, denominada factor de confusin, que da lugar a una mezcla
de efectos y, por tanto, a una distorsin en la estimacin del efecto que se quiere estudiar. Al
igual que los sesgos de seleccin e informacin, el sesgo de confusin puede aumentar o
disminuir el efecto, llegando incluso a anularlo o a invertir su sentido. Por tanto, tambin afecta
a la validez del estudio. Pero a diferencia de lo que ocurre con los sesgos de seleccin e
informacin, el sesgo de confusin se puede cuantificar y, sobre todo, siendo este el gran hecho
diferencial, se puede controlar en el anlisis. Es decir, si no se ha podido prevenir en el diseo,
el sesgo de confusin se puede controlar en la fase de anlisis.
2.5.
Sesgo de seleccin
El sesgo de seleccin es una distorsin del efecto medido producido por una seleccin
incorrecta de las personas que forman los grupos del estudio. Por ello, la relacin entre exposicin
y enfermedad es diferente para los que participan y para aquellos elegibles, pero que no participan
ENS Octubre 2009
53
en el estudio. Esto lleva a una estimacin del efecto en los sujetos incluidos en el estudio
distinta de la que se obtendra en la poblacin entera.
Aunque el sesgo de seleccin es ms frecuente en los estudios de casos y controles que en
los de cohortes, en cualquier estudio epidemiolgico existe la posibilidad terica de que est
presente un sesgo de seleccin. Este sesgo debe reconocerse mediante una reflexin razonada
sobre la poblacin base en funcin de la hiptesis del estudio.
Existen numerosos tipos de sesgos de seleccin, aunque todos tienen en comn que la
relacin entre exposicin y enfermedad es diferente para los que participan y para aquellos que
siendo elegibles no participan. A continuacin, sin nimo exhaustivo y teniendo en cuenta que
no se trata de una taxonoma rgida ni mutuamente excluyente, se comentan algunos de los
distintos tipos de sesgos, con el objetivo de mostrar las distintas posibilidades en que un sesgo
de seleccin puede aparecer. La denominacin de cada tipo de sesgo es tema de discusin. Por
ello, el inters fundamental ms que en poner nombre a cada sesgo, debe centrarse en considerar
la posibilidad de que est presente el sesgo, en qu medida puede estar actuando y en valorar su
sentido (positivo o negativo).
a) Voluntarios.
b) No respuesta.
c) Abandonos del estudio.
d) Trabajador sano.
e) Sesgo de Berkson.
f) Sesgo de prevalencia o sesgo de supervivencia (sesgo de Neyman).
g) Sesgo de deteccin.
h) Sesgo por inclusin / exclusin.
A) VOLUNTARIOS
La autoseleccin va a producir un sesgo de seleccin. Los voluntarios (autoseleccionados)

suelen presentar caractersticas particulares que les convierten en un grupo diferenciado.
Algunas de estas caractersticas pueden estar asociadas con la exposicin, la enfermedad o con
ambas.
Ejemplo: En el estudio sobre la leucemia entre los militares expuestos en la prueba atmica
de Smoky, realizada en 1957 en Nevada (Estados Unidos), se consigui estudiar al 76% de
todos los expuestos. Los investigadores localizaron al 82% de los estudiados y el 18%
restante contactaron por propia iniciativa (autoderivacin). Hubo cuatro casos de leucemia
en el 82% de las personas reclutadas por los investigadores y otros cuatro casos en el 18%
que se haban autoderivado.
Si las razones de la autoderivacin estn asociadas con el fenmeno que se estudia, bien
porque su salud sea mala o porque estn particularmente expuestos, la validez del estudio se va
a ver afectada.
B) NO RESPUESTA
El problema de los que no responden es muy frecuente. La ausencia puede deberse a que
no se haya podido encontrar al sujeto seleccionado o a su negativa a contestar. En ambos casos,
los que no responden pueden constituir un grupo muy diferente a la poblacin estudiada. Puede
que no se encuentre a una persona porque haya fallecido o se encuentre enferma; y si se niega
a contestar puede que lo haga por estar afectada por el fenmeno estudiado. En definitiva, se
puede producir un sesgo por las diferencias entre los participantes y los no participantes.
ENS Octubre 2009
54
El sesgo de no respuesta se puede contrarrestar o disminuir realizando varios intentos de

captar a los sujetos elegidos para participar, reduciendo al mnimo el nmero de no respuestas.
En ltimo extremo se recoger informacin de quienes no contestan, para describir sus
caractersticas principales (edad, sexo, etc.) y compararlas con las de los que s contestan. Esto
va a permitir valorar la comparabilidad de los sujetos participantes y no participantes
C) ABANDONOS DEL ESTUDIO
Las prdidas, ausencias o abandonos del estudio constituyen un caso particular de

autoseleccin. Se trata de personas que inicialmente entraron dentro de un estudio de
seguimiento, pero que posteriormente, cuando se realiza el seguimiento de la cohorte el propio
sujeto decide no continuar, ha fallecido por un problema no relacionado con la investigacin,
ha cambiado de domicilio, o no se le pueda localizar por cualquier otro motivo. Este fenmeno
es ms frecuente cuanto ms largo es el periodo de observacin y el problema ser tanto mayor
cuantas ms prdidas se produzcan. La primera consecuencia de la disminucin del tamao del
estudio ser la disminucin de su potencia o poder (complementario del error beta o probabilidad
de detectar como estadsticamente significativo / rechazar la hiptesis nula cuando realmente
existe una asociacin en la poblacin). La validez interna del estudio no se ver afectada si las
prdidas ocurren por igual en expuestos y no expuestos, ya que la tasa de enfermedad de las
personas perdidas ser la misma que la de las personas del grupo del que procedan. Sin
embargo, cuando los abandonos del estudio no ocurren al azar en los dos grupos de seguimiento
(expuestos y no expuestos) y se relacionan con la respuesta, es decir, las prdidas estn
relacionadas con la exposicin y con la enfermedad, la tasa de enfermedad en las prdidas ser
distinta de la que tiene la cohorte donde se encontraban y, en este caso, la validez interna se
ver afectada.
Las prdidas durante el seguimiento se pueden valorar fcilmente respecto a la exposicin,
ya que se conoce la distribucin de los factores de riesgo en las prdidas y se puede comparar
orientativamente la frecuencia de las distintas variables entre los sujetos que permanecen en el
estudio y las prdidas. Sin embargo, es ms difcil valorar cmo se van a comportar las prdidas
frente a la enfermedad, por la dificultad de conocer la tasa de enfermedad en un grupo
de personas que ya no est bajo vigilancia. Por ello, al igual que en la no respuesta,
hay que esforzarse por reducir al mnimo el nmero de ausencias, intentando encontrarlos
nuevamente.
El sesgo de las prdidas es caracterstico de los estudios de seguimiento.
D) TRABAJADOR SANO
Incluso antes de que los sujetos sean seleccionados para el estudio se puede producir una
autoseleccin. Un ejemplo es el denominado efecto del trabajador sano. Los trabajadores suelen
tener mejor salud que la poblacin general, ya que se habran autoseleccionado aquellas personas
con mejor salud para obtener un puesto de trabajo y poder mantenerlo, mientras que la poblacin
general tambin incluye enfermos incapaces de desempear un trabajo. Este efecto es tanto
mayor cuanto ms difciles sean las condiciones de trabajo y, por tanto, requiera ms capacidades
singulares.
Se da siempre y cuando el estado de salud previo a entrar en una empresa pueda estar
relacionado con la enfermedad. Se podra evitar mediante una definicin ms restringida de la
poblacin base, por ejemplo, si se toma como poblacin no expuesta a trabajadores de la misma
empresa o de otra de caractersticas similares (restriccin de la poblacin base).
Este sesgo habitualmente va a producir una infraestimacin del efecto estimado.
ENS Octubre 2009
55
E) SESGO DE BERKSON
Descrito por Berkson en 1946, el llamado sesgo o paradoja (trmino preferido por el autor)
de Berkson se puede producir cuando los sujetos del estudio se obtienen del hospital (casos y
controles hospitalarios). Las personas hospitalizadas pueden diferir de manera sistemtica de la
poblacin general, de la que se pretende sean representivas, en muchos aspectos, y particularmente
en cuanto a la exposicin a los factores de riesgo estudiados, debido a diversos factores que
influyen en la probabilidad de hospitalizacin.
El sesgo de Berkson se produce cuando la probabilidad de hospitalizacin de los casos y
de los controles, o de los expuestos y no expuestos es distinta. En este caso, si no se consideran
las distintas probabilidades de hospitalizacin, se pueden producir asociaciones espurias entre
una exposicin y una enfermedad. No se va a producir el sesgo de Berkson cuando la exposicin
que se estudia no influye en la hospitalizacin, ni cuando las poblaciones de las que se obtienen
los casos y los controles sean mutuamente excluyentes (por ejemplo cuando los casos son
hospitalarios y los controles son comunitarios).
El sesgo de Berkson es un sesgo de seleccin caracterstico de los estudios de casos y
controles.
Ejemplo: En el clsico estudio de casos y controles de Doll y Hill (1950) sobre la relacin
del consumo de tabaco y el cncer de pulmn se utilizaron controles hospitalarios. El
consumo de tabaco produce numerosas patologas, algunas de ellas de elevada prevalencia
como la enfermedad pulmonar obstructiva crnica, que pueden precisar ingreso hospitalario.
Esto hace que los controles no sean representativos en cuanto a la exposicin al factor de
riesgo (consumo de tabaco) de la poblacin de donde proceden los casos, incumplindose
la condicin central para que un estudio de casos y controles sea vlido, que los controles
sean seleccionados independientemente de su estatus de exposicin. En este estudio, dado
que la relacin entre el consumo de tabaco y el cncer de pulmn es muy fuerte, a pesar de
la presencia del sesgo de Berkson, que subestima el efecto, se pudo poner de manifiesto
una asociacin.
F) SESGO DE PREVALENCIA O SESGO DE SUPERVIVENCIA (SESGO DE NEYMAN)
Descrito por Neyman en 1955, se produce cuando se eligen casos prevalentes en lugar de
casos incidentes, si la exposicin es un factor pronstico de la enfermedad. Los casos prevalentes
no representan la historia natural de la enfermedad, los casos muy graves (mueren) y los leves
(sanan pronto) tienen menor probabilidad de ser seleccionados. Por tanto, los casos prevalentes
son supervivientes de la enfermedad y no tienen porqu tener una distribucin similar de los
distintos factores de riesgo de la enfermedad con respecto al total de casos.
El sesgo de prevalencia se puede evitar con la utilizacin exclusiva de casos incidentes en
los estudios de casos y controles.
G) SESGO DE DETECCIN
Se produce cuando el estatus de exposicin influye en la seleccin. En las personas que por
estar expuestas o por presentar una clnica relacionada con la exposicin, tienen una vigilancia
mayor, se va a facilitar la deteccin de la enfermedad. De esta forma se va a producir un sesgo
de seleccin.
Ejemplo: En los estudios de casos y controles sobre la administracin de estrgenos en
mujeres y cncer de endometrio, dado que los estrgenos pueden producir metrorragias
esto llevara a las mujeres a solicitar atencin sanitaria. Como la metrorragia es un signo
del cncer de endometrio, se incrementara su bsqueda en el grupo que toma estrgenos,
detectndose ms casos de enfermedad, no tanto porque los estrgenos los produjeran sino
ENS Octubre 2009
56
porque facilitaran su diagnstico. De esta forma se producira un sesgo de seleccin, ya

que los casos del estudio estaran ms expuestos y se sobreestimara el efecto. Para paliar
el problema se propuso que los controles fueran mujeres con enfermedades ginecolgicas
benignas que estuvieran tambin sujetas al sesgo de deteccin.
H) SESGO POR INCLUSIN / EXCLUSIN
Este sesgo puede darse cuando se incorporan o excluyen sistemticamente otras

enfermedades que estn relacionadas con la exposicin que se estudia. Este sesgo se produce
por la multiefectividad de la exposicin (un factor de riesgo se asocia a varias enfermedades).
El sesgo por inclusin / exclusin es un sesgo de seleccin caracterstico de los estudios de
casos y controles.
Ejemplo: Los anticonceptivos orales se asocian a numerosos procesos (cncer de endometrio,
cncer de ovario, mastopatas benignas, etc.). En un estudio de casos y controles sobre los
anticonceptivos orales y el cncer de mama si se seleccionan los controles entre las mujeres
atendidas en una consulta de ginecologa que no tengan cncer de mama, se producir un
sesgo de inclusin que infraestimar el efecto, ya que los anticonceptivos orales se asocian
con numerosas patologas. Sin embargo, si del grupo control se excluyen todos los procesos
relacionados con los anticonceptivos orales, se producir un sesgo de exclusin si esos
procesos no se eliminan tambin del grupo de los casos. Es decir, si se excluyen todos los
casos de cncer de mama que padezcan tambin un proceso relacionado con los
anticonceptivos orales. Si no se procede de esta forma, habr un sesgo de exclusin, que
ser proporcional a la frecuencia con que se asocia el cncer de mama con otras patologa
derivadas del consumo de anticonceptivos orales.
Habr que proceder con equilibrio para evitar el sesgo de inclusin y el de exclusin.
Habitualmente, se admite mejor el sesgo por exclusin que el de inclusin, ya que el error
introducido por el sesgo de exclusin es de menor magnitud.
2.6.
Sesgo de informacin
El sesgo de informacin es una distorsin del efecto medido producido por un error en la
obtencin de la informacin, es decir, en la recogida de datos. Ocurre entre personas ya incluidas
en el estudio, a la hora de medir las variables de inters.
El sesgo de clasificacin suele ser el sesgo de informacin ms frecuente. El sesgo de
clasificacin se puede producir por un:
Error en el procedimiento de medida (problemas de calibracin del instrumento,
problemas de recuerdo, uso de la historia clnica, etc.).
Error por usar variables sucedneas (proxy en ingls) que se aproximan a la variable de
inters. Por ejemplo, usar el peso y la talla autodeclarados para calcular el ndice de
masa corporal en lugar del peso y talla medidos.
Error en la definicin de las variables, algunas de ellas por su propia dificultad intrnseca
como la clase social.
El sesgo de clasificacin se va a producir siempre que haya errores en la clasificacin de la
enfermedad y/o de la exposicin de las personas ya incluidas en el estudio. Los errores en la
valoracin de la exposicin suelen ser ms frecuentes que los de la enfermedad. Su magnitud
va a depender de la sensibilidad y especificidad del mtodo empleado para medir las variables,
pero sus consecuencias van a diferir segn si el error de clasificacin es diferencial o no.
ENS Octubre 2009
57
2.6.1.
Clasificacin errnea no diferencial
Se producir una clasificacin errnea no diferencial cuando la clasificacin errnea de los

sujetos en las categoras de enfermedad (o de exposicin) se realiza de la misma manera en los
expuestos y no expuestos (o enfermos y no enfermos), es decir, si la sensibilidad y especificidad
son iguales entre los grupos a comparar. Dicho de otra manera, cuando los errores cometidos en
la recogida de la informacin relativa a la enfermedad (o a la exposicin) -en un eje- son
independientes del estado de exposicin (o de enfermedad) -el otro eje-.
En los estudios de casos y controles, el sesgo de clasificacin errnea no diferencial se
debe sobre todo a la medicin de la exposicin y produce siempre un sesgo hacia el valor nulo
(infraestima el efecto). El sesgo de clasificacin errnea no diferencial del estatus de enfermedad
tambin introduce un sesgo hacia el valor nulo.
En la Tabla 4.2. se muestra un ejemplo hipottico del efecto de la clasificacin errnea no
diferencial de la exposicin en un estudio de casos y controles, que infraestima el efecto
disminuyendo la OR real de 4 a una OR sesgada de 3,5.
Tabla 4.2. Ejemplo hipottico del efecto de la clasificacin errnea no diferencial
de la exposicin en un estudio de casos y controles.
Para casos y controles

Sensibilidad: 100%
Especificidad: 100%
Expuestos
No expuestos
Casos
100
50
Controles
50
100
Expuestos
No expuestos
Casos
90
60
Controles
45
105
OR = 4
Sensibilidad: 90%
Especificidad: 100%
OR = 3,5
En los estudios de cohortes el efecto del sesgo de clasificacin errnea no diferencial

depende de la medida del efecto que se estime (RA o RR) y de la direccin en que ocurra la
clasificacin incorrecta (sobredimensionando o, ms frecuentemente, infraestimando). Si
slo se reconocen y contabilizan una proporcin de los casos reales (infracontabilizacin de
los casos), pero esta proporcin es igual para los expuestos que para los no expuestos y,
adems no hay sobrecontabilizacin, el RA estar sesgado hacia el valor nulo (valor del RA
sin sesgo multiplicado por la proporcin de casos contabilizados) (RA sesgado = RA sin sesgo x
proporcin de casos contabilizados), mientras que el RR no se ver afectado.
En la Tabla 4.3 se muestran los valores de las medidas de efecto (RA y RR) de un
ejemplo hipottico de un estudio de cohortes con clasificacin correcta, es decir, sin sesgo
de clasificacin. Por su parte, en la Tabla 4.4. se muestra un ejemplo hipottico del efecto de
la clasificacin errnea no diferencial en ese estudio de cohortes, infracontabilizando un 10 %
ENS Octubre 2009
58
de los casos expuestos y no expuestos. Se aprecia, en comparacin con los valores de la

tabla 4.3 que el RA est sesgado hacia el valor nulo, lo infraestima disminuyendo el RA real
de 0,2 a un RA sesgado de 0,18 (valor del RA sin sesgo - 0,2 - multiplicado por la proporcin
de casos contabilizados - 0,90- )(0,2 x 0,90 = 0,18). Mientras que el RR no est afectado, RR
de 1,5.
Si en un estudio de cohortes se sobrecontabilizan los casos, aadiendo como casos sujetos
adicionales que no padecen la enfermedad, pero estos sujetos se aaden con proporcionalidad
a los tamaos totales de los denominadores de expuestos y no expuestos, el RA no se ver
afectado, mientras que el RR estar sesgado hacia el valor nulo.
Tabla 4.3. Ejemplo hipottico de un estudio de cohortes con clasificacin correcta (sin sesgo de clasificacin).
Expuestos
No expuestos
Casos
60
40
100
No casos
40
60
100
100
100
200
Ie =
a
60
=
= 0,6
a + c 100
Io =
b
40
=
= 0,4
b + d 100
RA = Ie - Io = 0,6 - 0,4 = 0,2
RR =
Ie 0,6
=
= 1,5
Io 0,4
ENS Octubre 2009
59
Tabla 4.4. Ejemplo hipottico de un estudio de cohortes con clasificacin errnea no diferencial
(infracontabilizando un 10% de los casos expuestos y no expuestos).
Casos
No casos
Expuestos
No expuestos
60 - 6 = 54
40 - 4 = 36
90
46
64
110
100
100
200
Ie =
54
= 0,54
100
Io =
36
= 0,36
100
RA = Ie - Io = 0,54 - 0,36 = 0,18

RA sesgado hacia el valor nulo
RA = 0,2 x 0,9 = 0,18

RA = valor sin sesgo (0,2) x proporcin de casos contabilizados (0,9) = 0,18
RR =
Ie 0,54
=
= 1,5
Io 0,36
RR no se afecta
ENS Octubre 2009
60
En la Tabla 4.5. se muestra un ejemplo hipottico del efecto de la clasificacin errnea no

diferencial en un estudio de cohortes, sobrecontabilizando los casos un 10 % sobre el tamao
total de los denominadores de expuestos y no expuestos. Se aprecia, en comparacin con los
valores de la tabla 4.3, que no tienen sesgo, que el RA no est afectado, RA de 0,2. Mientras que
el RR est sesgado hacia el valor nulo, lo infraestima disminuyendo el RR real de 1,5 a un RR
sesgado de 1,4.
Tabla 4.5. Ejemplo hipottico de un estudio de cohortes con clasificacin errnea no diferencial
(sobrecontabilizando los casos un 10% sobre el tamao total de los denominadores de expuestos y de no expuestos).
Casos
No casos
Expuestos
No expuestos
60 + 10 = 70
40 + 10 = 50
120
30
50
80
100
100
200
Ie =
70
= 0,7
100
Io =
50
= 0,5
100
RA = Ie - Io = 0,7 - 0,5 = 0,2

RA no se afecta
RR =
Ie 0,7
=
= 1,4
Io 0,5
RR sesgado hacia el valor nulo
2.6.2.
Clasificacin errnea diferencial
Se producir una clasificacin errnea diferencial cuando la clasificacin errnea de los

sujetos en las categoras de enfermedad (o de exposicin) se realiza de manera diferente segn
el sujeto est expuesto o no expuesto (o enfermo o no enfermo), es decir, si la sensibilidad y
especificidad difieren entre los grupos a comparar. Dicho de otra manera, cuando los errores
cometidos en la recogida de la informacin relativa a la enfermedad (o a la exposicin) -en un
eje- no son independientes del estado de exposicin (o de enfermedad) -el otro eje-.
El sesgo de clasificacin errnea diferencial puede producir un sesgo en cualquier direccin
aumentando o disminuyendo la asociacin real.
En la Tabla 4.6. se muestra un ejemplo hipottico del efecto de la clasificacin errnea
diferencial de la exposicin en un estudio de casos y controles, que bien puede sobreestimar el
ENS Octubre 2009
61
efecto aumentando la OR real de 4 a una OR sesgada de 4,7 o infraestimarlo disminuyendo

la OR de 4 a una OR sesgada de 3.
Tabla 4.6. Ejemplo hipottico del efecto de la clasificacin errnea
diferencial de la exposicin en un estudio de casos y controles.

Sensibilidad: 100%
Especificidad: 100%
Expuestos
No expuestos
Casos
100
50
Controles
50
100
OR = 4
Casos:
Controles:
Sensibilidad: 90%
Especificidad: 100%
Sensibilidad: 100%
Especificidad: 100%
Expuestos
No expuestos
Casos
100
50
Controles
45
105
OR = 4,7
Casos:
Controles:
Sensibilidad: 100%
Especificidad: 100%
Sensibilidad: 90%
Especificidad: 100%
Expuestos
No expuestos
Casos
90
60
Controles
50
100
OR = 3
La clasificacin errnea no diferencial se considera una amenaza para la validez menor

que la diferencial, ya que va siempre en una direccin predecible (hacia la condicin nula) y es
ms aceptable subestimar los efectos que sobrestimarlos.
La clasificacin errnea no diferencial, que acta prcticamente en todo estudio
epidemiolgico, es crucial en estudios que indican poco o ningn efecto. Este sesgo explicara
muchas discrepancias entre estudios epidemiolgicos.
2.6.3.
Tipos de sesgos de clasificacin
Existen numerosos tipos de sesgos de clasificacin. A continuacin, sin nimo exhaustivo

y teniendo en cuenta que no se trata de una taxonoma rgida ni mutuamente excluyente, se
comentan algunos de los distintos tipos de sesgos, con el objetivo de mostrar las distintas
ENS Octubre 2009
62
posibilidades en que un sesgo de clasificacin puede aparecer. La denominacin de cada tipo de

sesgo es tema de discusin. Por ello, el inters fundamental ms que en poner nombre a cada
sesgo, debe centrarse en considerar la posibilidad de que est presente el sesgo, en qu medida
puede estar actuando y en valorar su sentido (positivo o negativo).
a) Sospecha de diagnstico o sesgo de diagnstico.
b) Sospecha de exposicin.
c) Sesgo de memoria o de recuerdo.
d) Sesgo de codificacin y registro de datos.
e) Sesgo de realizacin de mediciones o diagnsticos.
f) Sesgo protoptico o de latencia de enfermedad.
g) Sesgo por el efecto vigilancia o Hawthorne.
f) Desenmascaramiento.
A) SOSPECHA DE DIAGNSTICO O SESGO DE DIAGNSTICO
El sesgo de sospecha de diagnstico se produce cuando se hace un mayor esfuerzo

diagnstico para detectar una enfermedad en el grupo expuesto que en el grupo no expuesto.
Esto va a ocasionar una clasificacin errnea diferencial, que va a sobreestimar el efecto.
El sesgo de sospecha de diagnstico es caracterstico de los estudios de seguimiento.
Cabe sealar las similitudes entre este sesgo de clasificacin errnea diferencial y el sesgo
de seleccin. Sin embargo, como ocurre entre sujetos ya incluidos en el estudio, se considera de
clasificacin.
El sesgo de diagnstico se puede evitar asegurando un seguimiento comparable.
Ejemplo: En un estudio de seguimiento para comparar la incidencia de enfisema en
fumadores y no fumadores, si los fumadores tienen una mayor atencin mdica que los no
fumadores, se diagnosticar con ms frecuencia el enfisema en los fumadores por el mero
hecho de hacer un mayor esfuerzo diagnstico para detectar una enfermedad en el grupo
expuesto que en el grupo no expuesto. De esta forma se va a producir un subdiagnstico
ms frecuente en no fumadores. Esto va a ocasionar una clasificacin errnea diferencial,
que va a sobreestimar el efecto.
B) SOSPECHA DE EXPOSICIN
El sesgo de sospecha de exposicin se produce cuando se hace un mayor esfuerzo en

buscar en los casos la exposicin a factores de riesgo conocidos de la enfermedad. Esto va a
ocasionar una clasificacin errnea diferencial, que va a sobreestimar el efecto.
El sesgo de sospecha de exposicin es caracterstico de los estudios de casos y controles.
C) SESGO DE MEMORIA O DE RECUERDO
El sesgo de memoria, de recuerdo o anamnsico se puede producir siempre que se utilice

una pregunta anamnsica, es decir, cuando la exposicin dependa de la memoria, ya que puede
haber un recuerdo inexacto de la exposicin. Si el error de recuerdo es similar en los casos y en
los controles, se producir una clasificacin errnea no diferencial. Sin embargo, es frecuente
que los casos recuerden mejor la exposicin que los controles, por haber estado rumiando
sobre las posibles causas de su enfermedad. Esto va a ocasionar una clasificacin errnea
diferencial, que va a sobreestimar el efecto.
A veces, puede ocurrir a la inversa, el enfermo puede mostrar tendencia (inconscientemente
o no) a minusvalorar una exposicin si se siente responsable de su enfermedad. Un ejemplo
ENS Octubre 2009
63
clsico de ello lo constituyen los bebedores de alcohol. En este caso se va a producir una
clasificacin errnea diferencial, que va a infraestimar el efecto.
Otro elemento que afecta al sesgo de memoria es el tiempo transcurrido entre la
exposicin y el recuerdo. Por ello, si el tiempo medio transcurrido desde que se produjo la
exposicin fuese distinto en los casos que en los controles, se podra producir un sesgo de
memoria.
El sesgo de memoria es caracterstico de los estudios de casos y controles, aunque tambin
puede darse en los estudios de seguimiento, al inicio del estudio a la hora de categorizar a los
participantes en funcin de su nivel de exposicin.
Este sesgo se puede evitar o aminorar con el doble ciego (ni los participantes ni los
encuestadores conocen la asociacin que se investiga), la comprobacin de las respuestas con
datos ms objetivos o el uso de controles hospitalarios.
Ejemplo: En un estudio de casos y controles sobre el consumo de frmacos durante el
embarazo y la aparicin de malformaciones congnitas, las madres de nios malformados
van a recordar su exposicin de forma ms completa que las madres que tuvieron un hijo
sano.
D) SESGO DE CODIFICACIN Y REGISTRO DE DATOS
Tambin puede producirse un sesgo en la codificacin o registro de los datos. Puede ser
frecuente el subregistro de datos sobre factores de riesgo en las historias clnicas, por ejemplo
del consumo de tabaco.
Produce un sesgo de clasificacin errnea no diferencial, que infraestimar el efecto.
E) SESGO DE REALIZACIN DE MEDICIONES O DIAGNSTICOS
El sesgo de realizacin de mediciones o diagnsticos es debido a errores en los aparatos de

medida (falta de calibracin) o en la realizacin de las determinaciones. Esto va a ocasionar una
clasificacin errnea no diferencial, que va a infraestimar el efecto.
Tambin puede ocurrir que se tienda a clasificar ms como enfermos a las situaciones
lmite cuando estn expuestos a un posible factor de riesgo de la enfermedad estudiada. Produce
una clasificacin errnea diferencial, que sobreestimar el efecto.
F) SESGO PROTOPTICO O DE LATENCIA DE ENFERMEDAD
El sesgo protoptico o de latencia de la enfermedad se puede producir cuando las

manifestaciones precoces de la enfermedad, que no ha sido an detectada, condicionan un
cambio en la exposicin de los casos. Este sesgo puede hacer que los factores de riesgo aparezcan
como factores de proteccin.
Algunos autores consideran el sesgo protoptico como un sesgo de confusin o de seleccin,
pero como es controlable mediante una historia cronolgica correcta, se incluye como sesgo de
clasificacin errnea diferencial.
El sesgo protoptico es caracterstico de los estudios de casos y controles.
Ejemplo: En un estudio entre consumo de alcohol y colelitiasis se podra observar un
efecto protector el consumo de alcohol debido al sesgo protoptico. Las personas con
colelitiasis, antes de que les sea diagnosticada, pueden tender a beber menos alcohol que
la poblacin general por las molestias que sienten.
Un caso similar podra darse en un estudio sobre la relacin del consumo de salicilatos y
la lcera grastroduodenal.
ENS Octubre 2009
64
G) SESGO POR EL EFECTO VIGILANCIA O HAWTHORNE
El sesgo por el efecto vigilancia o Hawthorne se produce por la modificacin de la conducta

habitual de una persona cuando se siente observada. Recibe este nombre por las investigaciones
realizadas en la central elctrica Western Electrics Hawthorne de Chicago de 1927 a 1937
sobre la satisfaccin de los trabajadores y su productividad, que tuvieron gran influencia en la
psicologa industrial. En este estudio, la manipulacin de las condiciones ambientales de los
trabajadores aumentaban el rendimiento hasta que se extingua la novedad de sentirse parte de
un estudio.
Este sesgo puede darse, por ejemplo, en los pacientes que participan en un ensayo clnico.
Se puede evitar si se incluye un grupo placebo o control, en el que tambin se d el efecto
vigilancia y, por tanto, la comparacin no se ver afectada por este sesgo.
H) DESENMASCARAMIENTO
Se produce cuando un posible factor de riesgo de una enfermedad produce un efecto

secundario semejante a un signo de la enfermedad. Este hecho, puede hacer que se intensifique
la bsqueda de la enfermedad en el grupo con el factor de riesgo y, por ello, detectar ms casos
de enfermedad en los expuestos. Esto produce una clasificacin errnea diferencial, que
sobrestimar el efecto.
Ejemplo: En un estudio sobre la administracin de estrgenos en mujeres posmenopusicas
y cncer de endometrio, dado que los estrgenos pueden producir metrorragias, que son un
signo del cncer de endometrio, puede que se incremente la bsqueda del cncer de
endometrio en el grupo con toma estrgenos y, por ello, detectar ms casos de enfermedad.
Esto produce una clasificacin errnea diferencial, que sobrestimar el efecto.
2.7.
Sesgo ecolgico o falacia ecolgica
El sesgo ecolgico ( o sesgo de agregacin) es un sesgo de informacin que se produce

cuando la estimacin del efecto ecolgico esperado no representa necesariamente el efecto que
existe a nivel individual. El sesgo ecolgico constituye la principal limitacin del anlisis
ecolgico para hacer inferencias causales. Fue descrito por primera vez por Robins en 1950 en
el campo de la sociologa.
Cabe recordar la grfica definicin de la falacia ecolgica dada por Michael, para quien la
falacia ecolgica es un astuto y sigiloso animal de dos caras, que est al acecho en las esquinas
oscuras de los estudios ecolgicos, y engaa a los lectores incautos hacindoles aceptar
conclusiones injustificadas, ya que presenta conclusiones que pueden ser vlidas o pueden ser
falsas, dependiendo de la boca por la que hable.
Ejemplo: El socilogo francs Emile Durkheim (1858-1917) encontr una relacin entre la
proporcin de protestantes y la tasa de suicidio en las provincias de Prusia entre 1883
y 1890. Este hallazgo no puede interpretarse como que hay una relacin entre ser
protestante y suicidarse, ya que podra ser que en las regiones de mayora protestante
fuesen los catlicos los que se suicidasen.
El sesgo ecolgico ser expuesto detalladamente en el Captulo 9, que trata de los Estudios
Ecolgicos.
3.
SESGO DE CONFUSIN
La confusin es un concepto clave en epidemiologa. Incluso, podra llegar a entenderse la

epidemiologa como la ciencia que se encarga del control de los factores de confusin.
ENS Octubre 2009
65
3.1.
Concepto de confusin
Nuevamente, podemos tener una primera aproximacin al concepto de confusin a travs

del diccionario de la Real Academia Espaola, que define el verbo confundir como mezclar,
fundir cosas diversas, de manera que no puedan reconocerse o distinguirse. En su tercera
acepcin lo define como equivocar, tomar una cosa por otra. Esta definicin proporciona la
clave del fenmeno, hay una mezcla que conduce a una equivocacin.
En trminos epidemiolgicos, se puede definir el sesgo de confusin (confounding en
ingls) como la distorsin del efecto estimado de la exposicin sobre la enfermedad debido a
la interposicin de un efecto nuevo producido por un factor extrao (factor de confusin,
variable confusora o confusor), que no se quiere estudiar, y que origina una mezcla de
efectos.
Ejemplo: Supngase que se quiere estudiar el efecto de la exposicin al consumo de caf
sobre el cncer de pncreas y que esta relacin estuviera afectada por la mezcla con el
efecto de la exposicin al consumo de tabaco. Teniendo en cuenta que en este estudio slo
se quiere analizar el efecto del consumo de caf, se habra introducido un factor extrao
o de confusin (consumo de tabaco), que no se quiere estudiar y que distorsiona el
efecto.
3.2.
Tipos de efectos de la confusin
Siempre hay que tener presente que la confusin es un sesgo, en este caso producido por
la presencia de una variable externa, denominada factor de confusin, que da lugar a una
mezcla de efectos y, por tanto, a una distorsin en la estimacin del efecto que se quiere
estudiar. El sesgo de confusin puede aumentar o disminuir el efecto, llegando incluso a
anularlo o a invertir su sentido. Se denomina confusin positiva cuando el parmetro
epidemiolgico presenta un valor superior al que realmente tiene (sobreestima o exagera el
efecto), es decir, lo aleja de la hiptesis nula (RR=1). Se denomina confusin negativa cuando
el parmetro presenta un valor inferior al real (infraestima o atena el efecto), es decir, lo
aproxima a la hiptesis nula. Se denomina paradoja de Simpson cuando la presencia de una
variable de confusin cambia el sentido de una asociacin (confusin cualitativa). De esta
forma, la confusin sera capaz de hacer que un factor de riesgo apareciera como factor de
proteccin y al revs. Aunque como seala Rothman, este fenmeno no es realmente una
paradoja (hecho o dicho aparentemente contrario a la lgica), ya que no se contravienen ni la
lgica ni ninguna de sus premisas, sino que es la consecuencia de no reconocer la presencia de
variables de confusin.
La confusin afecta a la validez del estudio. Pero a diferencia de lo que ocurre con los
sesgos de seleccin e informacin, el sesgo de confusin se puede cuantificar y, sobre todo,
siendo este el gran hecho diferencial, se puede controlar en la fase de anlisis. Es decir, si no
se ha podido evitar en el diseo, el sesgo de confusin se puede controlar en el anlisis.
3.3.
Requisitos
Una vez que se ha definido el concepto de sesgo de confusin y se han expuesto sus caractersticas
principales, hay que sealar que para que una variable o factor extrao se pueda considerar como un
factor de confusin debe cumplir tres requisitos:
a) Estar asociado con la exposicin.
b) Estar asociado con la enfermedad.
c) No ser un paso intermedio en la secuencia causal entre exposicin y enfermedad.
ENS Octubre 2009
66
A continuacin se van a analizar con ms detalle estos tres requisitos o caractersticas que
debe reunir una variable extraa para que se la pueda denominar factor de confusin.
A) EL FACTOR DE CONFUSIN DEBE ESTAR ASOCIADO CON LA EXPOSICIN.
El factor de confusin debe distribuirse de forma diferente en los expuestos y los no expuestos.
La asociacin entre el potencial factor de confusin y la exposicin no debe ser secundaria a una
asociacin entre el factor de confusin y la enfermedad. Por ello, se estudiar la asociacin del factor
de confusin con la exposicin en los no enfermos.
Ejemplo: En el estudio sobre el consumo de caf y cncer de pncreas, donde el consumo
de tabaco puede ser un hipottico factor de confusin. El consumo de tabaco debe estar
asociado con el consumo de caf en los no casos si fuera un estudio de cohortes (RR distinto
de 1) o en los controles si se tratara de un estudio de casos y controles (OR distinto de 1).
B) EL FACTOR DE CONFUSIN DEBE ESTAR ASOCIADO CON LA ENFERMEDAD.
Para que un factor extrao confunda debe producir un efecto, debe ser predictivo de la
ocurrencia de enfermedad, es decir, debe ser un factor de riesgo de la enfermedad estudiada,
pero no es necesario que sea causal (por ejemplo la edad). La asociacin entre el potencial
factor de confusin y la enfermedad no debe ser secundaria a una asociacin entre el factor de
confusin y la exposicin. Por ello, se estudiar la asociacin del factor de confusin con la
enfermedad en los no expuestos.
de tabaco puede ser un hipottico factor de confusin. El consumo de tabaco debe estar
asociado con el cncer de pncreas en los que no consumen caf (RR u OR distinto de 1).
Es decir, en los no consumidores de caf, el consumo de tabaco es un factor de riesgo del
cncer de pncreas.
C) EL FACTOR DE CONFUSIN NO DEBE SER UN PASO INTERMEDIO EN LA SECUENCIA CAUSAL
ENTRE EXPOSICIN Y ENFERMEDAD.
El hipottico factor de confusin no debe ser un paso intermedio en la cadena causal entre
exposicin y enfermedad. Por este motivo se la llama variable extraa. Esto implica que la
capacidad predictiva del riesgo de enfermedad contemple un mecanismo diferente del que se
est investigando. Todo factor que sea un paso intermedio en la secuencia causal no podr ser
un factor de confusin. Determinar este criterio requiere un conocimiento previo de las causas
de la relacin estudiada, basndose en el conocimiento existente sobre la relacin estudiada y
el juicio experto.
de tabaco puede ser un hipottico factor de confusin. Conforme al conocimiento
actualmente disponible, el consumo de tabaco no es un paso intermedio en la va causal
entre el consumo de caf y el cncer de pncreas.
Para que a una variable extraa se la considere como factor de confusin debe cumplir los
tres requisitos. Si la variable extraa slo est asociada a la exposicin o slo est asociada a la
enfermedad, no ser un factor de confusin. Los dos primeros criterios se podrn comprobar
con los datos del propio estudio. Sin embargo, el tercer criterio requiere informacin externa a
los datos.
3.4.
Cuantificacin
Una de las peculiaridades del sesgo de confusin, que lo diferencia de los sesgos de
seleccin e informacin, es que se puede cuantificar. Por ello, lo importante no es tanto
determinar su presencia o ausencia como el poder cuantificar su efecto.
ENS Octubre 2009
67
La evaluacin de la magnitud de la confusin se realizar mediante la comparacin directa

de la estimacin bruta del efecto y la estimacin no confundida o ajustada. Supngase un estudio
de casos y controles en el que, a partir de los datos brutos, primero se calcula el ORbruto de la
relacin estudiada. A continuacin, los datos se dividen (estratifican) en dos categoras de un
hipottico factor de confusin (presente o ausente) y se calcula el ORe de la relacin estudiada
en cada estrato y el ORajustado. De esta forma se podra cuantificar el efecto de la confusin. Si
el ORbruto es mayor que el ORajustado, se calcular el porcentaje de exceso de riesgo explicado
(ERE) por la variable ajustada, mediante la frmula:
% ERE =
ORbruto - ORajustado
x 100
ORbruto - 1
El mecanismo representado por la variable de ajuste (factor de confusin) se puede

considerar responsable del porcentaje de exceso de riesgo explicado (ERE) de la asociacin
estimada, o lo que es lo mismo, la distorsin del factor de confusin es responsable del porcentaje
de exceso de riesgo explicado (ERE) de la asociacin estimada.
Cuando el ORbruto es menor que el ORajustado, se calcular el porcentaje de defecto de riesgo
explicado (DRE) por la variable ajustada, mediante la frmula:
% DRE =
ORajustado - ORbruto
x 100
ORbruto - 1
El mecanismo representado por la variable de ajuste (factor de confusin) se puede

considerar responsable del porcentaje de defecto de riesgo explicado (DRE) de la asociacin
estimada, o lo que es lo mismo, la distorsin del factor de confusin es responsable del porcentaje
de defecto de riesgo explicado (DRE) de la asociacin estimada.
de tabaco cumple los criterios como para ser considerado un factor de confusin y se ha
descartado previamente la presencia de interaccin. El efecto estimado a partir de los datos
brutos del consumo de caf sobre el cncer de pncreas proporciona un ORbruto de 2,5. Sin
embargo, cuando se estratifica en dos categoras (fumadores y no fumadores), el efecto
estimado del consumo de caf sobre el cncer de pncreas tanto en los fumadores como en
los fumadores proporciona un ORe, y consecuentemente el ORajustadoes de 2. En este caso,
al ser el ORbruto es mayor que el ORajustado, se calcula el porcentaje de exceso de riesgo
explicado (ERE) por la variable ajustada, mediante la frmula:
% ERE =
ORbruto - ORajustado
2,5 - 2
x 100 =
x 100 = 33,3%
ORbruto - 1
2,5 - 1
El mecanismo representado por la variable de ajuste (factor de confusin, en este ejemplo

el consumo de tabaco) se puede considerar responsable del 33,3% de la asociacin estimada, es
decir, la distorsin del consumo de tabaco es responsable del 33,3% de la asociacin estimada
Como se acaba de ver en las frmulas de clculo anteriores, la comparacin del ORbruto se
hace con el ORajustado. Este ORajustado es un estimador global de la relacin estudiada, que ya no
estara distorsionado por el factor de confusin, sino ajustado por l. El clculo del ORajustado
puede hacerse por un mtodo exacto de mxima probabilidad o verosimilitud (maximum
likelihood en ingls) o por el mtodo aproximado propuesto por Mantel y Haenszel (1959), que
ENS Octubre 2009
68
proporciona un resultado casi idntico al estimado de mxima probabilidad pero que es

enormemente ms sencillo de calcular.
Aunque la comparacin entre la estimacin bruta y la ajustada no se realiza mediante tests
estadsticos, sino mediante la comparacin directa, con frecuencia se considera que la confusin
es suficientemente importante como para tener que controlarla cuando el OR bruto difiere del
ajustado en ms de 10 %.
En definitiva, como seala Rothman, la decisin sobre si un factor es de confusin o no
debe tomarse basndose en la mejor informacin disponible, sazonado con un poquito de juicio
experto. La confusin nunca debe valorarse mediante pruebas estadsticas.
3.5.
Procedimiento para detectar y evaluar la confusin
Para poder detectar la presencia de un factor de confusin, lo primero que habra que hacer
es sospechar su presencia mediante la pregunta: existe alguna explicacin plausible alternativa
a la presunta asociacin causa-efecto objeto de estudio?
En segundo lugar, se procedera a la identificacin del hipottico factor de confusin
mediante la recogida de los datos disponibles sobre todos los factores de riesgo conocidos de
la enfermedad estudiada. Como el factor de confusin tiene que ser un factor de riesgo de la
enfermedad, la forma ms operativa de empezar la bsqueda de un factor de confusin puede ser
a travs del estudio del resto de los factores de riesgo que no son objeto de la investigacin.
En tercer lugar, se comprobar que el hipottico factor de confusin cumple los tres
requisitos de condicionalidad.
Finalmente, se evaluar la confusin mediante la comparacin directa de la estimacin
bruta del efecto y la estimacin de este no confundida. Cuando se considere necesario, se
aplicarn los procedimientos analticos disponibles (anlisis estratificado y anlisis
multivariable), que se vern a continuacin, para controlar el efecto de la confusin sobre la
relacin estudiada.
3.6. Control de la confusin
Se dispone de distintos procedimientos que permiten prevenir la presencia de la confusin
en la fase de diseo (aleatorizacin, restriccin o especificacin y emparejamiento) o controlarla
en la fase de anlisis (estratificacin y anlisis multivariable).
3.6.1.
En el diseo
Se emplean tres mtodos para prevenir la presencia de la confusin en la fase de diseo: la

aleatorizacin, la restriccin o especificacin y el emparejamiento. La aleatorizacin solo se
puede aplicar en los estudios experimentales. La restriccin y el emparejamiento se pueden
utilizar en los estudios experimentales y en los observacionales. Estos dos procedimientos
implican una alteracin en la seleccin de los sujetos estudiados para asegurar que slo se
comparan grupos similares de las potenciales variables de confusin. Esta es una decisin que
se toma a priori y que es irreversible. Por ello, aunque estos dos mtodos son efectivos en la
prevencin de la confusin, se deben usar con sumo cuidado ya que van limitar los resultados
obtenidos de forma irreversible.
A) ALEATORIZACIN
La aleatorizacin o asignacin aleatoria consiste en distribuir a cada participante en los

grupos del estudio aleatoriamente, de modo que cada persona tenga exactamente la misma
probabilidad de formar parte de un grupo u otro. Su principal ventaja es que todos los potenciales
ENS Octubre 2009
69
factores de confusin conocidos y desconocidos son controlados, ya que se distribuyen de forma

homognea en todos los grupos del estudio. Para que esto sea cierto se requiere que el tamao
del estudio sea grande, siendo menos efectiva en los estudios pequeos. Adems, tiene la
limitacin de que slo es posible realizarla en los estudios experimentales.
B) RESTRICCIN O ESPECIFICACIN
La restriccin o especificacin consiste en seleccionar en el estudio nicamente a las

personas que presenten un valor determinado del posible factor de confusin. Entre sus ventajas
destaca que es un procedimiento eficaz, econmico y cmodo, que es muy fcil de comprender.
Sin embargo, proporciona una imagen parcial de la realidad, que limita la generalizacin de los
resultados. En ocasiones puede hacer difcil obtener un tamao del estudio apropiado.
Ejemplo: En el estudio sobre el caf y el cncer de pncreas, donde el consumo de tabaco
pudiera ser un factor de confusin, se podra especificar que slo se incluyese en el estudio
a los no fumadores. De esta forma, si se observase una asociacin entre el caf y el cncer
de pncreas, evidentemente no podra ser debida al consumo de tabaco.
C) EMPAREJAMIENTO
El emparejamiento (matching en ingls) se usa principalmente en los estudios de casos y

controles, pero puede emplearse en los dems tipos de diseos de estudios. En los estudios de
seguimiento se utiliza pocas veces porque es demasiado costoso. En un estudio de casos y
controles consistira en seleccionar, para cada caso, un control que tuviese el mismo valor del
posible factor de confusin. Esto permite comparar slo a casos y controles que presentan el
mismo nivel del posible factor de confusin. Este procedimiento puede evitar la aparicin de
confusin asociada a factores constitucionales (edad, sexo) o a factores que no pueden medirse
ni controlarse de otra forma (emparejar hermanos para controlar factores genticos y familiares).
En algunas ocasiones puede facilitar la seleccin de los controles. El emparejamiento mantiene
la capacidad de generalizar. Sin embargo, frecuentemente suele ser ms difcil, lento, caro y
menos eficiente. La decisin de emparejar debe tomarse al inicio del estudio y es irreversible.
Impide estudiar el efecto de las variables emparejadas. Existe el peligro de sobreemparejamiento,
es decir, emparejar por un factor que no es un factor de confusin, esto va a producir una
disminucin del poder del estudio.
Los estudios que utilizan el emparejamiento requieren un anlisis especfico, que tenga en
cuenta el hecho de que los datos estn emparejados.
pudiera ser un factor de confusin, podra compararse el consumo de caf de un caso que
fumase un paquete al da con el consumo de caf de un control que fumase la misma o
parecida cantidad de cigarrillos al da.
3.6.2.
En el anlisis
Posteriormente, en la fase de anlisis se puede controlar la confusin mediante la

estratificacin y el anlisis multivariable. Se trata de procedimientos que son ms verstiles e
igual de efectivos que la restriccin y emparejamiento. Es importante sealar que aunque estos
dos procedimientos se aplican en el anlisis, ya en el diseo se tuvo que determinar qu posibles
factores de confusin podran afectar a la relacin estudiada, para recoger la informacin sobre
ellos, ya que no se podr controlar en el anlisis ninguna variable que no se haya medido
previamente.
A) ESTRATIFICACIN
La estratificacin consiste en distribuir a los sujetos en estratos de acuerdo con el nivel del
posible factor de confusin, analizando por separado la relacin entre la exposicin y la enfermedad
ENS Octubre 2009
70
en cada estrato. Este procedimiento proporciona resultados fcilmente interpretables y es flexible

y reversible. Sin embargo, slo permite controlar simultneamente un nmero limitado de
variables, ya que el tamao de cada estrato se ver reducido con cada variable por la que se
estratifique. Por ejemplo, para poder realizar una estratificacin por cinco variables, aunque slo
tuviesen dos categoras cada una, se necesitaran 32 (25) estratos. Con tantos estratos, el nmero
de personas disponibles para el anlisis en cada uno puede resultar demasiado pequeo.
Adems, cuando los estratos son demasiado grandes puede que no se controle adecuadamente
la confusin si se produjese confusin dentro de cada estrato (confusin residual). Las variables
a controlar deben haber sido medidas con antelacin, es decir, en la fase de diseo se debe
decidir que variables hipotticamente podran actuar como factores de confusin. Posteriormente,
en el anlisis se valorar en qu medida producen confusin.
pudiera ser un factor de confusin, se podran considerar por separado los fumadores y los
no fumadores (estratificando segn el hbito de fumar). Se estudiara la asociacin entre el
caf y el cncer de pncreas por una parte en fumadores y por otra en no fumadores. De
esta forma, se eliminan los posibles efectos de la confusin creados por el consumo de
tabaco en la asociacin entre el caf y el cncer de pncreas.
B) ANLISIS MULTIVARIABLE
El anlisis multivariable es un mtodo analtico que permite el estudio simultneo de dos

o ms variables independientes. Su principal ventaja es que permite controlar simultneamente
mltiples factores de confusin. Adems, permite utilizar toda la informacin obtenida con las
variables continuas y es flexible y reversible. Como inconvenientes pueden sealarse que en
ocasiones puede proporciona resultados difciles de interpretar. Adems, el modelo puede no
ser adecuado, bien por un control incompleto de los factores de confusin o por una estimacin
inexacta de la magnitud del efecto. Tambin exige que las variables a controlar hayan sido
medidas con antelacin.
3.7.
Confusin residual
Se denomina confusin residual a la confusin que persiste tras los intentos infructuosos
por controlarla. Es decir, cuando el ajuste no es capaz de eliminar completamente el efecto de
confusin. Las fuentes ms importantes de confusin residual o ajuste incompleto son:
Falta de ajuste por algn factor de confusin.
Definicin inadecuada de las categoras de la variable de confusin, que hace que
alguna de estas categoras sea tan amplia que no se pueda asumir la ausencia de
confusin dentro de cada estrato, por lo que se produce un ajuste imperfecto.
Utilizacin de un sucedneo imperfecto como variable de ajuste para controlar un
factor de confusin. Es decir, cuando hay problemas en la validez por constructo (grado
en que la variable que se utiliza en el ajuste representa al factor de confusin). La
utilizacin de la educacin como variable de ajuste cuando se pretende controlar el
efecto como factor de confusin de la clase social puede constituir un buen ejemplo.
Clasificacin errnea de la variable de confusin.
4.
INTERACCIN O MODIFICACIN DEL EFECTO
Una vez que se han expuesto los sesgos y particularmente el sesgo de confusin, es
importante introducir otro concepto, como es el de interaccin, que tambin puede producir una
ENS Octubre 2009
71
modificacin del efecto estimado, pero, a diferencia de los anteriores, no lo hace de forma
errnea. Tanto la interaccin como el sesgo de confusin, aunque son conceptualmente muy
distintos, comparten la necesidad de valorar variables externas para poder interpretar
correctamente el efecto estudiado.
La interaccin se da cuando el efecto de la exposicin sobre la enfermedad es diferente a
distintos niveles de una tercera variable. Se trata de un fenmeno natural, que existe
independientemente del diseo del estudio. El sesgo de confusin, por contra, es una distorsin
errnea del efecto, que puede estar presente o no, dependiendo del diseo del estudio.
Recibe el nombre de sinergismo cuando la presencia de un factor aumenta el efecto de otro.
El opuesto del sinergismo es el antagonismo, es decir, cuando la presencia de un factor disminuye
el efecto de otro. Una interaccin se considera cuantitativa cuando slo cambia la magnitud de
los efectos, pero no su sentido. Sin embargo, cuando una interaccin cambia el sentido de la
asociacin se denomina cualitativa. Por ejemplo, cuando el efecto de la exposicin sobre la
enfermedad es protector en unos niveles de una tercera variable y en otros niveles es un factor
de riesgo.
La interaccin s se evala mediante un test estadstico (test de homogeneidad de efectosmtodo de Woolf), junto con la valoracin subjetiva de su relevancia. Tngase en cuenta que
este test como todo test de significacin estadstica se ve afectado por el tamao del estudio. Por
ello, si el tamao del estudio es reducido, puede que haya interaccin y no se ponga de manifiesto.
Sin embargo, como se ha sealado con anterioridad, el sesgo de confusin nunca debe valorarse
mediante pruebas estadsticas, sino mediante la comparacin directa de la estimacin bruta del
efecto y la estimacin de este no confundido.
Aunque la interaccin es un fenmeno natural, no debe ignorarse, ya que si se combinaran
los datos se perdera informacin valiosa de posible significacin biolgica. La presencia de
interaccin impide la obtencin de un estimador global del efecto, por lo que se deben considerar
los efectos separadamente en cada nivel de interaccin. La interaccin una vez detectada se
debe describir. Sin embargo, el sesgo de confusin debe evitarse en la fase de diseo del estudio
o controlarse en el anlisis, ya que es un error.
Ejemplo: Supngase un estudio sobre la relacin del consumo de tabaco y el cncer boca
y faringe (Rothman y Keller, 1972). El RR del consumo de tabaco con el cncer oral en los
que no beben alcohol es de 1,53 y en los que beben alcohol el RR es de 5,71. Se aprecia
que la relacin que se quiere estudiar (consumo de tabaco-cncer oral) es distinta en los
bebedores de alcohol que en los abstemios. Esto es debido a la presencia de una interaccin
entre el consumo de tabaco y el consumo de alcohol en la relacin estudiada. Por ello, se
deber describir separadamente la relacin consumo de tabaco-cncer oral en los bebedores
(RR=5,71) y en los abstemios (RR=1,53).
En la Tabla 4.7. se recogen las principales diferencias entre el sesgo de confusin y la
interaccin.
En la estrategia general de anlisis de un estudio epidemiolgico, antes de valorar la
posible existencia de confusin se debe detectar la presencia de interaccin, ya que en presencia
de interaccin el anlisis puede concluirse presentando separadamente los estimadores
especficos de cada nivel de interaccin o estrato, junto con sus intervalos de confianza. En
caso de que existiera tambin confusin, esta slo se manifestara en la medida cruda del
efecto. Por tanto, al describir la interaccin se estara controlando la posible confusin (vase
captulo 5).
ENS Octubre 2009
72
Tabla 4.7. Principales diferencias entre el sesgo de confusin y la interaccin.
5.
SESGO DE CONFUSIN
INTERACCIN
Es un sesgo
No es un sesgo
Perturbacin errnea del efecto
Fenmeno natural
Puede o no estar presente, dependiendo del

diseo del estudio
Independiente del diseo del estudio
No se evala mediante un test estadstico
Se evala mediante un test estadstico
Se puede obtener un estimador global del

efecto
No se puede obtener un estimador global

del efecto
Se debe evitar
Se debe describir
COBO E, BUEKENS P. Necesidad y limitaciones del ajuste. Med Clin (Barc) 1990;95:702-708.
HULLEY SB, CUMMINGS SM, BROWNER WS, GRADY DG, NEWMAN TB. Diseo de investigaciones clnicas. 3
Ed. Filadelfia: Lippincott, Williams & Wilkins; 2007.
IRALA J, MARTNEZ-GONZLEZ MA, GUILLN GRIMA F. Qu es una variable modificadora del efecto? Med
Clin (Barc) 2001;117(10):297-302.
IRALA J, MARTNEZ-GONZLEZ MA, GUILLN GRIMA F. Qu es una variable de confusin? Med Clin (Barc)
2001;117(10):377-385.
MANTEL N, HAENSZEL W. Statistical aspects of the analysis of data from retrospective studies of disease. J Natl
Cancer Inst 1959;22:719-748.
MARTNEZ NAVARRO F, ANT JM, CASTELLANOS PL, GILI M, MARSET P, NAVARRO V. Salud Pblica.
Madrid: McGraw-Hill; 1998.
PORTA M. Dictionary of epidemiology. 5 Ed. Nueva York: Oxford University Press; 2008.
ROTHMAN KJ, GREENLAND S. Modern epidemiolgy. 2 ed. Filadelfia: Lippincott-Raven; 1998.
SACKETT DL. Bias in analytic research. J Chron Dis 1979;32:51-63.
SACKETT DL, HAYNES RB, GUYATT GH, TUGWELL P. Epidemiologa Clnica. Ciencia bsica para la medicina
clnica. Madrid: Panamericana; 1995.
SIERRA A, SENZ MC, FERNNDEZ-CREHUET J, SALLERAS L, CUETO A, et al, editores. Medicina Preventiva
y Salud Pblica. 11 ed. Barcelona: Elsevier-Masson; 2008.
SZKLO M, NIETO FJ. Epidemiologa Intermedia. Conceptos y Aplicaciones. Madrid: Ed. Daz de Santos; 2003.
ENS Octubre 2009
73
Anlisis de Datos Epidemiolgicos
V.
ANLISIS DE DATOS EPIDEMIOLGICOS

Javier Damin
Nuria Aragons
1.
INTRODUCCIN
El anlisis consiste bsicamente en la obtencin de medidas resumen de los datos que ayuden
a realizar inferencias. Normalmente el inters reside en la estimacin de parmetros (puntual y por
intervalos de confianza) y en el contraste de hiptesis.
En este captulo se presentan algunos procedimientos estadsticos aplicados al anlisis de datos
de estudios epidemiolgicos cuyo objetivo es evaluar la asociacin entre un determinante
(caracterstica, exposicin, hbito...) y la ocurrencia de una enfermedad. En primer lugar se aborda
el contraste de hiptesis y la estimacin de efectos para el caso del anlisis crudo o simple. En
segundo lugar se considera el anlisis estratificado, en el que se tienen en cuenta variables adicionales
a las de exposicin y efecto.
Los clculos dependen del modelo estadstico que se utilice. En general, y debido a su facilidad,
se utilizarn modelos basados en la distribucin normal. Estos mtodos, tambin denominados
aproximados o asintticos, son apropiados en el caso de muestras grandes. Con muestras pequeas,
los clculos deben realizarse con mtodos exactos.
Cuando el objetivo del anlisis es obtener informacin cuantitativa sobre algn parmetro
poblacional como una media o un riesgo relativo, se habla de estimacin, que a su vez puede
ser de dos tipos, puntual y por intervalo. Mediante la estimacin puntual se obtiene un nico
valor del parmetro desconocido (por ejemplo, un RR de 2,43). Una estimacin puntual es la
mejor estimacin numrica de un efecto a partir de nuestros datos, pero dado que es un punto
de una escala continua con un nmero infinito de valores, existen muy pocas posibilidades de
que sea enteramente correcta. Por ello necesitamos disponer de una medida de su precisin (del
error aleatorio que hay en los datos). La estimacin por intervalo persigue obtener un rango de
los valores ms compatibles con el estimador puntual. Los intervalos de confianza se construyen
de tal forma que incluyen el verdadero valor con una cierta frecuencia llamada nivel de confianza.
El nivel de confianza es seleccionado por el investigador, utilizndose generalmente el 95%.
Por otra parte es habitual que el objetivo del anlisis sea contrastar la hiptesis nula. Para
ello se calcula el valor P asociado a la hiptesis nula. Si este valor es menor o mayor de un
nivel, preestablecido en el esquema de decisin, se rechaza o no la hiptesis nula.
1.1.
Fundamentos del anlisis
Los elementos bsicos del anlisis que se utilizan habitualmente en inferencia se pueden
obtener a travs de la llamada funcin de valores P. Se trata de una distribucin de valores que
estiman la compatibilidad del resultado obtenido (p.e. un riesgo relativo) con todo el rango de
hiptesis del parmetro (Figura 5-1). Esta funcin de valores P adems de ofrecer una idea del
error aleatorio de la estimacin (de la precisin de la estimacin), permitir calcular algunos
valores con inters especial para la inferencia, como el valor P asociado a la hiptesis nula o los
lmites de los diferentes intervalos de confianza. Un intervalo de confianza al 100(1-)% incluye
todos los valores para los cuales su valor P bilateral excede el valor del nivel de confianza, es
decir, es un rango de los valores ms compatibles con el estimador puntual.
ENS Octubre 2009
75
0,5
0,0
0,4
0,2
0,3
0,4
0,2
0,6
0,1
0,8
Nivel de confianza
P de 1 lado
Figura 5-1. Funcin de valores P correspondiente a los datos del ejemplo 5-1. El pico de la curva corresponde
al estimador puntual. Zona ampliada: El valor P unilateral (exacto) bajo H0 es 0,057 (0,114 bilateral).
Los lmites (exactos) del intervalo de confianza al 95% son 0,71 y 18,5.
1
1
20
RT
0,057
0,025
0,71
2.
ANLISIS CRUDO
Se entiende como anlisis crudo aquel que tiene en cuenta solo las variables principales,
normalmente exposicin y efecto. Este anlisis se aplica cuando no es necesario tener en cuenta
ningn factor ms aparte de la exposicin y de la enfermedad de inters, como ocurre a menudo
en estudios experimentales en los que la asignacin aleatoria suele prevenir la confusin.
Adems, el anlisis crudo debe ser un primer paso antes de realizar anlisis que contemplen
otras variables, siendo el caso de los estudios no experimentales, que normalmente requieren
anlisis estratificado o modelaje multivariante para poder tener en cuenta el papel de otros
factores adems de las variables principales (factores de confusin y variables de
interaccin).
Para facilitar su exposicin, los mtodos de anlisis que se presentan a continuacin se limitan
al caso de una variable de exposicin y una de resultado, ambas dicotmicas.
ENS Octubre 2009
76
2.1.
Datos en forma de personas-tiempo
En un estudio de seguimiento con personas-tiempo como unidades bsicas de observacin

la informacin utilizada en el anlisis se presenta en la siguiente tabla:
Casos
Personas-tiempo
2.1.1.
Expuestos
a
N1
No expuestos
b
N0
M1
T
Contraste de hiptesis
Con este tipo de datos puede asumirse como fijado (sin variabilidad aleatoria) el nmero
total de casos, M1. El modelo estadstico para el contraste de hiptesis de los datos de personatiempo es la distribucin binomial, siendo el estadstico el nmero de casos expuestos (a). Si la
hiptesis nula fuera cierta, la media (el nmero de casos expuestos que cabra esperar, el valor
esperado para a ser M1 (N1 / T). La varianza de esta distribucin binomial es: M1 (N1 / T)
(1-[N1 / T]), o simplificando: M1N1 N0/T2. Esta distribucin puede aproximarse a una normal (si
ambos M1 (N1 / T) y M1(1-[N1 / T]) son >5) con media y varianza iguales a las de la distribucin
binomial. Por tanto, se puede calcular el estadstico llamado bajo la hiptesis nula como:
N1M 1
T
N1 N 0 M 1
2
T
a
Observado Esperado
Varianza
Y se calculan los valores apropiados en las tablas de la distribucin normal estndar N(0, 1).
2.1.2.
Estimacin puntual y por intervalo de confianza
Diferencia de tasas de incidencia: DT
I1 I 0
La frmula para obtener el intervalo de confianza del 95%:
DT r 1,96 EE DT
siendo el error estndar de la diferencia de tasas:
EE( DT )
Razn de tasas: RT
a
N
2
1
b
N 02
I1
I0
La razn de tasas de incidencia no tiene una distribucin muestral simtrica (Figura 5-2)
por lo que es conveniente emplear una transformacin logartmica, que s es normal. De esta
forma se calculan lmites de confianza simtricos para el logaritmo de la razn de tasas,
invirtiendo luego la transformacin mediante la funcin exponencial:
exp>ln RT r 1,96 EEln RT @
siendo
EE(ln RT )
1 1

a b
ENS Octubre 2009
77
Ejemplo 5.1. En el estudio de seguimiento del NHANES II (National Health and Nutrition
Examination Survey), se han obtenido los siguientes datos de mortalidad cardiovascular en
el grupo de edad de 30 a 49 aos:
Casos
Personas-ao
Hipertensos
3
2.868
DT = 80 por 105 personas-ao; IC 95%:
Normotensos
7
28.309
Total
10
31.177
801,9661= -40 a 200
Figura 5-2. Rango de valores del riesgo relativo en escala original y en escala logartmica.
Escala del riesgo relativo
ff
0
ff
ff
0
-f
Escala del Ln del riesgo relativo
3/2.868
RT =
= 4,23 ;
IC 95%: exp>1,44 r 1,96 0,69@ 1,09 a 16,36
7/28.309
Contraste de hiptesis:
Observado Esperado
Varianza
2.868 10
31.177
2.868 28.309 10
3
2,28
31.177 2
que corresponde a un valor P bilateral de 0,02. Sin embargo en este ejemplo no se
deben utilizar los mtodos basados en la aproximacin normal ya que M1 (N1 / T) < 5
(102.868/31.177=0,92). El valor P calculado por mtodos exactos es 0,114 (ver Figura 5-1)
con lo que no se rechazara la hiptesis nula si se utilizara el nivel del 0,05.
2.2.
Datos de recuento
La informacin bsica tanto para estudios de cohortes con denominadores en forma de

personas en riesgo como para estudios de casos y controles o de prevalencia puede organizarse
en forma de una tabla de 22, en la que las 4 celdas son frecuencias de sujetos clasificados de
ENS Octubre 2009
78
acuerdo con la presencia o ausencia de exposicin y de enfermedad, siendo adems iguales los
mtodos de contraste de hiptesis.
Casos
No casos
2.2.1.
Expuestos
a
c
N1
No expuestos
b
d
N0
M1
M0
T
Contraste de hiptesis
En este caso igualmente se asumen como fijos los marginales M1, M0, N1, N0, y el estadstico
es igualmente el numero de casos expuestos, a. Bajo hiptesis nula, el valor esperado de a
ser M1 (N1 / T). La varianza es ligeramente diferente a la anterior, ya que el modelo utilizado
en este caso es de dos binomiales:
N1 M 1
a

Observado Esperado
T
Varianza
N1 N 0 M 1 M 0
T 2 T 1
Igualmente se utiliza la distribucin normal estndar para obtener los valores P
apropiados.
2.2.2.
Estimacin puntual y por intervalo de confianza
Diferencia de riesgos:
DR
IA1 IA0
Para conseguir lmites aproximados de datos de seguimiento con denominadores compuestos

por personas, utilizamos frmulas ligeramente diferentes a la hora de estimar los errores
estndar:
DR r 1,96 EEDR
EE( DR )
Razn de riesgos o riesgo relativo:
RR
a N 1 a b N 0 b

3
3
N1
N0
IA1
IA0
Como en el caso de las razones de tasas de incidencia, en el caso de la razn de riesgos

tambin es deseable emplear la transformacin logartmica para el clculo de los intervalos de
confianza.
exp>ln RR r 1.96 EEln RR @
EE(ln RR )
c
d

a N1 b N 0
Para datos de casos y controles, la medida de inters central es la odds ratio:

OR
ad
bc
ENS Octubre 2009
79
En este caso, el clculo del error estndar y del intervalo de confianza del 95% se realiza
mediante las siguientes operaciones (utilizando tambin la transformacin logartmica para el
clculo de los intervalos de confianza):
exp>ln OR r 1,96 EEln OR @
1 1 1 1

a b c d
EE(ln OR )
Tabla 5-1. Anlisis crudo de datos. Frmulas para dos grupos de estudio con muestras grandes
(mtodos aproximados).
Datos persona-tiempo
Contraste de
hiptesis nula
N1 M 1
T
N1 N 0 M 1
a
Estimacin de
efectos
I1 I 0
EE( DT )
a
b
2
2
N1 N 0
x Razn de tasas (RT)

I1
1 1

a b
IC 95% :
exp>ln RT r 1.96 EEln RT @
N1 M 1
T
N1 N 0 M 1 M 0
T 2 (T 1)
a
Diferencia de riesgos
EE( DR )
IA1 IA0
a N 1 a b N 0 b

3
3
N1
N0
IC 95% :
DR r 1.96 EEDR
x Razn de riesgos (RR)

RR
I0
EEln RT
x
DR
IC 95% :
DT r 1.96 EEDT
RT
x Diferencia de tasas
DT
Datos de recuento: personas
IA1
IA0
c
d

a N1 b N 0
EE ln RR
IC 95% :
exp>ln RR r 1.96 EEln RR @
x Odds Ratio (OR)

OR
ad
bc
EE(ln OR )
1 1 1 1

a b c d
IC 95% :
exp>ln OR r 1.96 EEln OR @
ENS Octubre 2009
80
3.
ANLISIS ESTRATIFICADO
El anlisis estratificado engloba un conjunto de mtodos que se basan en la creacin de

subgrupos (estratos) con el objeto de abordar determinados problemas. Entre las utilidades ms
habituales se encuentran la identificacin y el control de factores de confusin y la evaluacin
de la modificacin del efecto.
La confusin es una distorsin en la medida de asociacin entre una exposicin y una
enfermedad resultante del efecto de otra variable que se asocia de forma independiente tanto
con la enfermedad como con la exposicin.
La modificacin del efecto (o interaccin), por su parte, se refiere al cambio en la magnitud
de la asociacin entre la exposicin y la enfermedad en funcin de los valores de una tercera
variable (variable modificadora de efecto). Tambin se habla de heterogeneidad del efecto.
La estrategia general consiste en crear subgrupos (estratos) formados por las categoras de la
tercera variable (confusora o modificadora de efecto) y medir el efecto (riesgo relativo, odds ratio
(OR), diferencia de tasas...) en esos subgrupos: p.e. calcular el RR en hombres y en mujeres; o en
los grupos de clase social baja, media y alta. Si se observan diferencias relevantes en el efecto en
los estratos es posible que se trate de una variable modificadora de efecto. Si el valor promedio del
efecto en los estratos es diferente del valor crudo es posible que se trate de un factor de confusin.
Una de las diferencias ms importantes entre confusin y modificacin del efecto es que la
confusin es un sesgo y, por tanto, hay que identificarlo y controlarlo, por lo que proceder
calcular el promedio del efecto uniforme observado en los estratos. La modificacin del efecto
es un atributo del fenmeno que se estudia, por lo que el objetivo es describirlo y evaluarlo. Si
se aprecia modificacin de efecto lo esencial es describir el patrn observado en los estratos,
teniendo poco sentido calcular un estimador promedio.
La obtencin de estimadores ajustados o conjuntados (pooled) se basa en el clculo del
promedio ponderado de los estimadores de los estratos. Existen varios mtodos en funcin de la
eleccin de las ponderaciones que se asignarn a cada estrato. Aqu se presentan los tres mtodos
ms habituales: la estandarizacin, el mtodo de Woolf, y el mtodo de Mantel y Haenszel.
La estandarizacin utiliza unos pesos comunes para los grupos que se comparan que
pueden ser incluso externos a los datos. El mtodo de Woolf asigna un peso proporcional al
inverso de la varianza en cada estrato: estratos con gran error aleatorio (menos informativos)
aportarn menos al estimador conjuntado (pesarn menos). El mtodo de Mantel-Haenszel
utiliza un grupo especial de pesos basados en los datos de cada estrato, con un componente
igualmente proporcional al error aleatorio. A continuacin se describen estos mtodos.
3.1.
Estandarizacin
La estandarizacin es un procedimiento de control de factores de confusin que se basa en

la sustitucin de las distribuciones de los factores de confusin de las poblaciones que se
comparan por otras distribuciones estndar (o comunes).
Grupo de edad
15-49
50-64
65 +
Total
N de casos
Ni
N1
N2
N3
Nt
Personas-tiempo
Pi
P1
P2
P3
Pt
Tasa de Incidencia
(Ii = Ni/ Pi)
I1
I2
I3
It
ENS Octubre 2009
81
La tasa de incidencia total (o tasa cruda) es una media ponderada de las tasas especficas
por subgrupos. En el caso de la edad:
I P
P
Nt
Pt
It
Si se sustituyen los pesos Pi (la distribucin por edad) de esta poblacin por los de otra
poblacin (wi) normalmente llamada estndar o de referencia se obtiene una tasa
estandarizada:
w I
w
i i
IE
Una tasa estandarizada es una medida hipottica. Corresponde a la tasa cruda que
tendra la poblacin de estudio si en lugar de tener su distribucin por edad tuviera la
distribucin por edad estndar. Por tanto esta tasa hipottica no tiene utilidad si no es para ser
comparada con otras tasas que hayan sido estandarizadas utilizando la misma distribucin por
edad.
Si calculamos la tasa estandarizada para otra poblacin utilizando el mismo grupo de pesos
(la misma distribucin estndar) las diferencias entre las dos tasas estandarizadas no podrn ser
atribuidas a una diferente distribucin por edad. As, las tasas estandarizadas de dos poblaciones,
una de expuestos (I1) y otra de no expuestos (I0), utilizando la misma distribucin por edad (wi),
sern:
w I
w
i 1i
I 1E
w I
w
i 0i
I 0E
Ntese que ambas tasas estandarizadas han utilizado el mismo grupo de pesos (wi). Estos
pesos pueden venir de diversas fuentes: de la distribucin de una de las dos poblaciones que se
comparan, de la suma de las dos poblaciones, o de otra distribucin (real o no). En principio lo
importante es que la distribucin sea la misma para ambas poblaciones.
Para obtener medidas de efecto estandarizadas por edad, se calcula la razn o la diferencia
entre las dos tasas estandarizadas:
RTE
w I
w
i 1i
i
DTE
w I
w
i 0i
i
w I
w
i 1i
i
w I
w I
i 1i
i 0i
w I
w
i 0i
i
w I RT
w I
i 0i
i 0i
w DT
w
i
En estos ejemplos se ha utilizado la edad como variable de estandarizacin pero el mismo

proceso puede utilizarse para estandarizar por cualquier otra variable: por sexo, por clase social;
por edad y sexo; por edad, sexo y clase social...
ENS Octubre 2009
82
Ejemplo 5-2: Mortalidad por enfermedad cardiovascular en el estudio de seguimiento

NHANES II. 7.801 personas libres de enfermedad cardiovascular basal seguidas un
promedio de 15 aos.
Hipertensos
casos Personas-ao
3
2.868
80
13.867
253
14.842
336
31.577
Edad
30-49
50-69
70+
Total
Normotensos (<140 mmHg)

casos
Personas-ao
7
28.309
67
31.016
172
15.348
246
74.673
Las tasas crudas son:

I1= 336/31.577 = 1.064 /105/ao
Y la razn de tasas crudas:
I0= 246/74.673 = 329 /105/ao
RT = 3,2
Las tasas especficas por edad junto con las razones de tasas especficas son:
I1 30-49 =
3/2.868 = 105
I1 50-69 = 80/13.867 = 577
I1 70+ = 253/14.842= 1.705
I0 30-49 = 7/28.309 = 25 (RT30-49 = 4,2)

I0 50-69 = 67/31.016 = 216 (RT50-69 = 2,7)
I0 70+ = 172/15.348 = 1.121 (RT70+ = 1,5)
Tomando como grupo de pesos estndar la suma de ambas poblaciones:
w 30-49 = 2.868 + 28.309 = 31.177

w 50-69 = 13.867 + 31.016 = 44.883
w 70+ = 14.842 + 15.348 = 30.190
Las tasas estandarizadas son:
I 1E
w I
w
i
1i
I 0E
w I
w
105 31.177 577 44.883 1.705 30.190

31 .177 44 .883 30 .190
i 0i
25 31.177 216 44.883 1.121 30.190
31.177 44.883 30.190
5
759 /10 /ao
5
417 /10 /ao
y la razn de tasas estandarizadas: RTE = 1,8

Que se interpreta como la razn de tasas esperable si ambas poblaciones tuvieran la misma
distribucin por edad (la distribucin estndar). En todo caso hay que recordar la importancia
de describir cualquier patrn observado en los estratos. En este ejemplo se observa con claridad
que el efecto de la exposicin es importante en los ms jvenes y muestra una tendencia
decreciente con la edad.
3.1.1.
Razn de mortalidad estandarizada
Cuando se utiliza como estndar la distribucin de una de las dos poblaciones que se
comparan (normalmente la de la poblacin expuesta) la tasa cruda de la poblacin expuesta
ENS Octubre 2009
83
coincide con la tasa estandarizada por lo que la razn de tasas estandarizadas se convierte en la
razn entre un nmero de casos observados (en la poblacin expuesta) y un nmero de casos
esperados (los casos que sera esperable obtener en la poblacin no expuesta si su distribucin
por edad fuera la de la poblacin expuesta). Esta razn ha sido denominada Razn de Mortalidad
(o morbilidad) Estandarizada (RME):
RME
w I
w
w I
w
i 1i
i 0i
w I
w I
i 1i
i 0i
casos observados
casos esperados
Normalmente dos o ms RMEs no son comparables entre s debido a que las distribuciones
estndar son diferentes en el clculo de cada RME, aunque en la mayora de la situaciones el
sesgo que se produce es pequeo. Por otra parte el error aleatorio es menor por lo que habr
situaciones en las que ser preferible utilizar RMEs.
La estrategia consistente en utilizar unas tasas estndar para obtener la RME suele
denominarse estandarizacin indirecta, aunque el procedimiento es idntico al anterior
(tambin llamado estandarizacin directa). Por ejemplo, la mortalidad por cncer en
trabajadores se compara con la correspondiente a la poblacin general activa, que aporta las
tasas estndar, calculndose la razn de tasas estandarizadas utilizando la distribucin por
edad de los trabajadores como estndar.
Ejemplo 5-3: En un estudio se analiza la incidencia de cncer de mama en diversas
ocupaciones (Polln y Gustavsson) y se comparan con la poblacin activa de mujeres. En
el caso de las mdicas se han obtenido los siguientes datos:
Edad
25-44
45-59
60-79
Total
casos
Mdicas
Personas-ao
11.554
12.878
4.994
59
w 25-44= 11.554;
RME
Poblacin de referencia
Tasas ao-1 (IRi)
0,00052
0,00166
0,00238
w I
w
i 1i
i
w 45-59 = 12.878;
w I
w
i Ri
i
w I
w I
i 1i
i Ri
w 60-79 = 4.994
casos observados
casos esperados
59
(0,00052 11.554) (0,00166 12.878) (0,00238 4.994)
59
39
1,50
La incidencia en el grupo de mdicas es un 50% mayor que en la poblacin activa de

mujeres, si ambos grupos tuvieran la misma distribucin por edad (la de las mdicas). Como se
aprecia, el mtodo empleado es el mismo que anteriormente excepto por el grupo de pesos
estndar.
En el caso de las enfermeras y auxiliares la RME fue de 0,99. En teora no se puede realizar
una comparacin directa con las mdicas ya que ambas RMEs han sido obtenidas con
distribuciones estndar diferentes (quizs no muy diferentes).
ENS Octubre 2009
84
3.2.
Mtodo de Woolf
Supongamos que queremos evaluar el efecto de una variable de exposicin principal dicotmica
(expuestos y no expuestos) sobre el desarrollo de una enfermedad (casos de la enfermedad y
controles) utilizando la odds ratio (OR) como medida de asociacin. Se desea valorar el papel de
una tercera variable que es un potencial factor de confusin o de modificacin de efecto.
Ejemplo 5-4. En el estudio EURAMIC, queremos evaluar el efecto de tener un ndice
cintura/cadera, WHR (Waist to hip ratio) por encima de la mediana (expuestos: WHR por
encima de la mediana; no expuestos: WHR por debajo de la mediana) sobre el riesgo de
infarto de miocardio (casos y controles), controlando el efecto del consumo de tabaco,
agrupado en 3 categoras: nunca fumadores; ex-fumadores y fumadores actuales.
La variable de estratificacin es siempre categrica; si se quiere estratificar por una variable
continua, es necesario agruparla en categoras. Asimismo, si queremos estratificar por ms de
una variable, es necesario crear tantos estratos como combinaciones de las categoras de las
variables de estratificacin: si el primer factor de estratificacin tiene, por ejemplo, 3 categoras
y el segundo 4, ser necesario crear 12 estratos. El anlisis estratificado puede sistematizarse en
las siguientes etapas:
1. Dividir la muestra en estratos exhaustivos y mutuamente excluyentes.
2. Calcular la medida de asociacin especfica para cada estrato (en este ejemplo
utilizaremos la OR, aunque el proceso es anlogo para el clculo de riesgos relativos y
de diferencias de riesgos).
3. Comprobar si las medidas de efecto son similares en todos los estratos mediante la
realizacin de un test de homogeneidad. Si los resultados en los estratos son diferentes
(es decir, si la variable de estratificacin modifica el efecto de la variable de exposicin
principal), se describirn las medidas de asociacin en cada estrato como resultado
final del anlisis. Si los resultados en los estratos son lo suficientemente homogneos
se entender que en todos los estratos se est estimando una OR nica y que las
diferencias encontradas son debidas a variabilidad aleatoria. En este caso procederemos
a combinarlas, obteniendo un estimador ajustado de la OR, libre de confusin por esa
variable ya que se calcula a partir de los estimadores especficos de cada estrato, que a
su vez estn libres de confusin. Posteriormente se calcula el intervalo de confianza
para la OR (y, si se desea, el test de significacin).
Notacin:
Expuestos
No expuestos
Total
ak
ck
N1k
bk
dk
N0k
M1k
M0k
Tk
Casos
Controles
Total
A partir de esta tabla se calcula la OR del estrato k (ORk), su logaritmo natural (lnORk) y la
varianza del logaritmo natural (Var(lnORk)). Debido a la distribucin asimtrica de la OR es
preferible realizar los clculos en la escala logartmica:
ORk
ak d k
bk ck
lnORk
Var(lnORk) =
1
1
1
1

a k bk ck d k
ENS Octubre 2009
85
La varianza del estrato k, est relacionada con la informacin que aporta ese estrato:
cuanto mayor sea var(lnORk) menor ser la informacin que nos aporta (es decir, ms
incertidumbre tiene nuestra estimacin). Este concepto se formaliza definiendo el peso del
estrato k (wk), como el inverso de la varianza para ese estrato:
1
wk
Var( ln ORk )
Ejemplo 5-4: En la evaluacin de la asociacin entre el WHR y el riesgo de infarto de
miocardio en el estudio EURAMIC, se obtuvo la siguiente tabla de 22 cruda:
WHR alto WHR bajo

386
124
301
299
Casos
Controles
ORc
386 299
124 301
3,09
Para cada uno de los 3 estratos de hbito tabquico se obtienen las siguientes tablas de 22:
Estrato 1: No fumadores
Casos
Controles
OR1
39 86
17 65
WHR alto WHR bajo

39
17
65
86
3,04
lnOR1 = ln 3,04 = 1,11

1
1
1
1
Var( ln OR1 )

39 65 17 86
1
8,97
w1
0,111
0,111
Estrato 2: Ex fumadores
Casos
Controles
OR2
108 102
27 110
WHR alto WHR bajo

108
27
110
102
3,71
lnOR2 = ln 3,71 = 1,31

Var( ln OR2 )
w2
1
0,065
1
1
1
1

108 110 27 102
0,065
15,34
ENS Octubre 2009
86
Estrato 3: Fumadores
WHR alto WHR bajo

239
80
126
111
Casos
Controles
OR3
239 111
80 126
2,63
lnOR3 = ln 2,63 = 0,97

Var( ln OR3 )
w3
1
0,034
1
1
1
1

239 126 80 111
0,034
29,736
Tabla resumen:
No fumadores
Ex-fumadores
Fumadores
3.2.1.
ORk
3,04
3,71
2,63
lnORk
1,11
1,31
0,97
Var(ln ORk)
0,111
0,065
0,034
wk [1/ Var(ln ORk)]

9,0
15,3
29,7
Anlisis de homogeneidad de los estimadores de efecto de los distintos estratos
La evaluacin de la homogeneidad inter-estrato consiste en determinar hasta qu punto las

diferencias observadas en las ORs son compatibles con la hiptesis (nula) de que son iguales.
Para contrastar esta hiptesis es necesario realizar un test de homogeneidad entre los estratos.
El test de homogeneidad de Woolf evala la diferencia entre las ORs especficas de cada estrato
y su media: cuanto ms heterogneas sean las ORs, ms alejadas estarn de su media y mayor
ser el estadstico de homogeneidad. Los pasos detallados para calcular este estadstico se
presentan a continuacin:
Calcular la media ponderada de los logaritmos naturales de las ORs de cada estrato,
utilizando como factores de ponderacin los pesos de cada estrato:
ln OR
w ln OR
w
k
Calcular el estadstico de homogeneidad:

w
2
k 1
( ln ORk ln OR ) 2
k Var (ln OR )
k
Para evaluvcar la hiptesis nula de homogeneidad de las ORs especficas (H0: OR1 = OR2
= = ORk), contrastar el valor obtenido con los percentiles de la distribucin 2 con k-1 grados
de libertad, obtener el valor P y decidir en funcin del nivel de significacin elegido.
ENS Octubre 2009
87
Ejemplo. La evaluacin de la homogeneidad entre las distintas categoras de hbito

tabquico en la asociacin entre WHR e infarto agudo de miocardio dara como
resultado:
ln OR
8,97 1,11 15,34 1,31 29,74 0,97

8,97 15,34 29,74
1,11 1,09 2 1,31 1,09 2 0,97 1,09 2

0,111
0,065
0,034
1,09
1,2
Este valor se ha de contrastar con los percentiles de la distribucin 2 con k - 1 = 2 grados

de libertad, lo que da un valor P = 0,55. Este valor es bastante compatible con la hiptesis
nula de homogeneidad. Si se establece un nivel de significacin de, por ejemplo 0,15, el
resultado es no significativo: No admitimos interaccin entre tabaco y el ndice cintura/
cadera en el riesgo de desarrollar infarto de miocardio, asumiendo por tanto que las
diferencias entre los estratos se deben a variabilidad aleatoria.
Si se encuentra interaccin, el anlisis puede concluirse presentando los estimadores de
cada estrato y sus intervalos de confianza, junto con el valor P del test de homogeneidad. Hay
que resaltar que los test estadsticos de homogeneidad son poco potentes, por lo que si se
aprecia algn patrn evidente puede ser conveniente describirlo (por ejemplo algn orden o
tendencia).
3.2.2.
Obtencin de un estimador ajustado de la OR
Si no existe interaccin, el proceso final del anlisis estratificado consiste en la obtencin

de un estimador global, no influenciado por el efecto del factor de confusin (es decir, ajustado
por el factor de confusin).
w
Anteriormente se obtuvo ln OR como la media ponderada de los logaritmos naturales de

las ORs especficas. El estimador de la OR ajustada por el mtodo de Woolf se calcula
como:
ORa
exp (ln OR )
El error estndar de ln OR :
w
EE(lnOR )
1
wk
k
Estas frmulas permiten calcular un intervalo de confianza para ORa, as como un valor P
para contrastar la H0 de que ORa = 1.
IC del 95% para ORa:
w
exp[ ln OR 1,96EE( ln OR )]
ENS Octubre 2009
88
Para el contraste de hiptesis para H0: ORa = 1, calcular

ln OR
w
w
EE(ln OR )
y contrastar el resultado obtenido con los percentiles de la distribucin normal estandarizada,
N (0, 1).
Ejemplo: Siguiendo con el ejemplo de estudio EURAMIC, la OR cruda y la ajustada

difieren poco (ORc = 3,09 y ORa = exp(1,09) = 2,97). El consumo de tabaco no parece ser
un factor de confusin importante para la asociacin entre el ndice cintura/cadera y el
riesgo de infarto de miocardio en este estudio. El intervalo de confianza al 95% para la OR
ajustada es: exp[1,09 (1,960,136) = 2,28-3,88, y el estadstico z = 1,09/0,136 = 8,01,
que da un valor P < 0,0001.
3.3.
Mtodo de Mantel-Haenszel
Mantel y Haenszel propusieron una frmula sencilla de calcular la OR ajustada. Se considera

el mejor mtodo en la mayora de las situaciones:
a d
k kT k
k
ORMH
b c
k kT k
k
El error estndar del lnORMH (Robins et al):
EEln ORMH
donde Pk
ak d k
, Qk
Tk
P R
k
2 Rk
bk ck
, Rk
Tk
P S
k
Qk Rk
2 Rk S k
k
k
ak d k
y Sk
Tk
Q S
k
2 S k
k
bk ck
.
Tk
As, el intervalo de confianza para ORMH y la prueba de hiptesis para H0: ORMH = 1 se
calculan como:
IC 95% ORMH:
exp[lnORMH r 1,96EE(lnORMH)]
Para el contraste de la hiptesis nula H0: ORMH = 1, se calcula:
ln ORMH
EE(ln ORMH )
Ejemplo: La estimacin de la OR combinada por el mtodo de Mantel-Haenszel en el

ejemplo es:
39 86 108 102 239 111

207
347
556
ORMH
2,99
17 65 27 110 80 126

207
347
556
que es similar a la obtenida por el mtodo de Woolf (ORa = 2,97).
ENS Octubre 2009
89
El error estndar del lnORMH: 0,136, con el que podemos calcular intervalos de confianza
y valores P: IC 95% ORMH = 2,29 3,90; z = 8,09, P < 0,0001.
3.4.
Frmulas de Mantel-Haenszel y Miettinen
Para contrastar la hiptesis nula (H0: ORMH = 1) se puede utilizar la frmula de de MantelHaenszel, que bajo la hiptesis nula sigue una distribucin normal estandarizada. Esta frmula
es til adems para calcular posteriormente los intervalos de confianza de Miettinen (basados
en el test).
N M
k ak k 1k T 1k
k
F MH
N 1k M 1k N 0k M 0k
Tk2 (Tk 1)
Para calcular los intervalos de confianza de Miettinen:
OR
zD / 2
1r
F MH
MH
En el ejemplo: MH = 8,19; P < 0,0001. Y el IC95% de Miettinen = 2,30 - 3,88

Los intervalos de confianza de Miettinen son aproximados pero son bastante exactos para
valores no muy alejados del nulo.
3.5.
Estimadores de Mantel-Haenszel en otros diseos
Existen formulas equivalentes para otros estimadores combinados de Mantel-Haenszel

(diferencia de tasas, razn de tasas, diferencia de riesgos, razn de riesgos) y sus varianzas. Se
recomienda consultar estas frmulas en Greenland y Rothman.
3.6.
Diferencias entre los mtodos de anlisis estratificado.
Los mtodos de clculo de estimadores ajustados de Woolf y de Mantel-Haenszel asumen

homogeneidad del efecto. Esta asuncin no es tan clara en el caso de la estandarizacin ya que
la eleccin de los pesos puede ser arbitraria. Si se aprecia modificacin del efecto lo esencial es
presentar y describir los estimadores de los estratos, pero si adems se desea obtener una medida
global del efecto de neto de la exposicin es preferible obtener estimadores combinados
utilizando la estandarizacin (tambin en los diseos de casos y controles se puede utilizar
estandarizacin. Ver Greenland y Rothman).
En cuanto a las diferencias entre el mtodo de Woolf y el de Mantel-Haenszel cabe resaltar
que el mtodo de Woolf requiere que todas las celdas de cada estrato incluyan alto nmero de
efectivos; si no es as, como ocurre en la mayora de las ocasiones, resulta fcil que las
estimaciones sea errneas. Esta limitacin es el principal problema del anlisis estratificado:
cuando el nmero de factores de confusin es alto los estratos van teniendo menos efectivos y
las celdas van quedando vacas. Supongamos, en una situacin muy comn, que disponemos de
un tamao muestral de 800 personas en un estudio de casos y controles, y que deseamos controlar
por edad en 3 categoras, por sexo en 2, por clase social en 3, y por consumo de tabaco en 3. El
nmero de estratos es de: 3233 = 54. En el caso (por otra parte muy raro) de que las 800
personas se distribuyeran equitativamente en los estratos, stos tendran de promedio 14,8
personas. Lo ms habitual es que hubiera algunos estratos sin casos o sin controles. Si adems
consideramos conveniente ajustar por hipertensin en dos categoras, el nmero total ser
de: 542 = 108, reducindose el promedio a 7,4. Este problema es menor si se utiliza el mtodo de
ENS Octubre 2009
90
Mantel-Haenszel, que permite obtener estimaciones vlidas con muy pocos efectivos en cada
estrato. Esta y otras propiedades hacen de ste el mtodo de eleccin, aadiendo a sus ventajas
la facilidad de clculo. An as, en muchas situaciones el nmero de estratos en relacin con el
tamao de la muestra ser excesivo y se recurrir entonces a la utilizacin de modelos de
regresin (regresin logstica en el caso de variables respuesta categricas). An en el caso de
que sea finalmente necesario utilizar modelos de regresin, es muy conveniente realizar anlisis
estratificado incluyendo aquellas variables con mayor importancia, bien cientfica o de salud
pblica, ya que esto permite conocer mejor los datos, lo cual es ms complicado en el caso de
modelos de regresin multivariantes.
3.7.
Confusin residual
Se habla de confusin residual cuando por alguna razn no se ha controlado toda la potencial
confusin en un estudio, bien por que no se ha ajustado por alguna/as variables de confusin o
porque se categorizan variables de confusin continuas en pocos estratos por lo que no se puede
asumir ausencia de confusin dentro de cada estrato. Por ejemplo, si se desea controlar el efecto
de la edad en una poblacin entre 15 y 65 aos y se crean slo dos estratos (p.e.: 15-35 aos
y 36-65) puede producirse confusin dentro de cada estrato (el caso extremo es un solo estrato,
es decir datos crudos). Normalmente con pocos estratos se controla bien la confusin en la
mayora de las situaciones, siendo la estrategia ms adecuada comprobar cual es el nmero
mnimo de estratos que garantice un nivel de control que se considere adecuado.
3.8.
Aplicacin al anlisis de datos emparejados
En los estudios de casos y controles emparejados normalmente es necesario controlar por

las variables de emparejamiento ya que si no es as se introducir un sesgo. El anlisis de un
estudio de casos y controles emparejado se realiza estratificando por parejas; es decir cada
pareja caso-control forma un estrato. El anlisis entonces se realiza mediante la frmula de
Mantel-Haenszel, apropiada para datos esparcidos. Los estratos pueden clasificarse en 4 tipos:
dos en los que la pareja es concordante (T y W) en relacin con la exposicin y dos tipos en los
que son discordantes (U y V):
T
caso
control
caso
control
caso
control
caso
control
Exp
No exp
ai d i
Ti
bi ci
Ti
ai d i
Ti
1/ 2
bi ci
Ti
1/ 2
ai d i
Ti
bi ci
Ti
Los estratos concordantes no aportan informacin a la OR combinada por lo que la frmula

se simplifica a la razn entre el nmero de parejas discordantes en la que el caso est expuesto
(U) y en la que lo est el control (V):
OR MH
ai d i
Ti
b c
iT i
i
ORMH
U 1/2
V 1/2
U
V
ENS Octubre 2009
91
4.
GREENLAND S, ROTHMAN KJ. Introduction to stratified analysis. En: Rothman KJ, Greenland S. Modern
Epidemiology. Filadelfia: Lippincott-Raven, 1998.
HENNEKENS CH, BURING JE. Analysis of epidemiologic studies: Evaluating the role of confounding. En: Epidemiology
in Medicine. Boston: Little, Brown and Company, 1987.
KAHN HA, SEMPOS CT. Statistical Methods in Epidemiology. Nueva York: Oxford University Press, 1989
KLEINBAUM DG, KUPPER LL, MORGENSTERN H. Stratified analysis. En: Epidemiologic Research. Principles and
Quantitative Methods. Nueva York: Van Nostrand Reinhold, 1982.
MANTEL N, HAENSZEL WH. Statistical aspects of the analysis of data fron retrospective studies of disease. J Natl
Cancer Inst 1959; 22: 719-748.
MARTN ANDRS A, LUNA DEL CASTILLO JD. Bioestadstica para las Ciencias de la Salud. Madrid: Ediciones
Norma S. A., 1994.
POLLN M, GUSTAVSSON P. High-risk occupations for breast cancer in the Swedish female working population. Am
J Public Health 1999; 89: 875-881.
ROBINS J, GREENLAND S, BRESLOW N. A general estimation for the variance of the Mantel-Haeszel odds ratio. Am
J Epidemiol 1986; 124: 719-723.
SZKLO M, NIETO FJ. Stratification and adjustment: Multivariate analysis in epidemiology. En: Epidemiology beyond
the basics. Gaithersburg: Aspen, 2000.
ENS Octubre 2009
92
Estudios de Cohortes
VI. ESTUDIOS DE COHORTES

Marina Polln
Beatriz Prez-Gmez
Los estudios de cohortes se caracterizan por la identificacin y seguimiento de uno o ms

grupos de individuos con un determinado nivel de exposicin, para detectar y cuantificar la
aparicin del evento o enfermedad de inters a lo largo del tiempo.
La palabra cohorte deriva del vocablo latino cohors cohortis, que designaba a una
unidad tctica de infantera dentro de las legiones romanas. En epidemiologa, el trmino
cohorte fue incorporado en 1935 y sirve en la actualidad para referirse a un conjunto de
personas que comparten una determinada exposicin y/o evolucionan juntas a lo largo del
tiempo.
La esencia de los estudios de cohortes es el seguimiento. En el diseo de cohortes est
implcita la recogida de informacin, a nivel individual, sobre la exposicin de uno o varios
grupos de personas (cohortes), y el establecimiento de un mecanismo para seguir a los miembros
de estas cohortes con objeto de detectar la aparicin del evento de inters y tambin la posible
salida o abandono del estudio. El seguimiento sirve para cuantificar no slo la frecuencia de
enfermedad en las distintas cohortes (incidencia acumulada), sino el ritmo o dinmica de la
enfermedad en cada una de ellas (tasa de incidencia). Adems, durante el seguimiento es posible
considerar e incorporar en el anlisis los cambios en el nivel de exposicin as como las
variaciones del resto de factores de riesgo relevantes.
Por tanto, los estudios de cohortes valoran el estado de exposicin antes de que se produzca
la enfermedad y permiten registrar los cambios ocurridos en el tiempo a nivel individual. La
mayor parte de las enfermedades crnicas son el resultado de un proceso que se extiende a lo
largo de dcadas, en el que intervienen diferentes exposiciones o factores de riesgo. La
naturaleza dinmica de la exposicin a estos factores y su interrelacin a lo largo del tiempo
slo puede ser estudiada adecuadamente en un diseo de cohortes. Esta dinmica temporal est
ausente de los estudios transversales y es difcilmente investigable en los estudios de casos y
controles.
1.
ALGUNOS EJEMPLOS DE ESTUDIOS DE COHORTES
A continuacin se presentan 6 estudios de cohortes que servirn de ejemplo para ilustrar

los aspectos bsicos del diseo desarrollados ms adelante.
Ejemplo 1: Cohorte de mdicos britnicos
El estudio prospectivo de los efectos del tabaco sobre la salud comenz en 1951. En 1964
los autores publicaron un artculo con el diseo de su estudio y los resultados correspondientes
a los primeros diez aos de seguimiento. El estudio invitaba a participar a los mdicos de Reino
Unido, rellenando un cuestionario que fue enviado el 31 de octubre de 1951 a 59.600 mdicos
de ambos sexos que figuraban en el Registro de Mdicos. Los investigadores optaron por un
cuestionario corto que favoreciese la participacin. Se pidi a los mdicos que se clasificasen
como: fumadores actuales, exfumadores o no fumadores (definidos como aquellos que no han
llegado a fumar un cigarrillo al da durante 1 ao). A los fumadores o exfumadores se les pidi
que informasen sobre la edad de inicio y la cantidad de cigarrillos/da que fumaban en ese
momento o antes de abandonar el hbito.
ENS Octubre 2009
93
Un total de 40.637 mdicos (34.445 hombres y 6.192 mujeres) contestaron el cuestionario

inicial. Durante el seguimiento se les enviaron otros tres cuestionarios a los hombres y otros dos
a las mujeres para estimar los cambios en el patrn de consumo.
El seguimiento se realiz mediante el Registro Nacional de Defuncin. En 1964 se
publicaron los resultados de los diez primeros aos de seguimiento y posteriormente los
correspondientes a veinte y veintids aos de seguimiento en hombres y en mujeres
respectivamente. Se contabilizaron 467 muertes por cncer de pulmn como causa bsica de
defuncin, y otras 20 citaban dicha enfermedad como causa contribuyente. Para estas 487
muertes se busc confirmacin del diagnstico a partir del mdico que rellen el certificado de
defuncin. Como evento de inters se estudi tambin la mortalidad por otros tumores,
enfermedades respiratorias, enfermedades cardiovasculares y otras.
Ejemplo 2: Estudio Prospectivo Europeo de Dieta y Cncer (EPIC)
El EPIC (European Prospective Investigation into Cancer and Nutrition) es un estudio
prospectivo multinacional coordinado desde la Agencia Internacional de Investigacin del
Cncer (IARC). Este estudio ha sido diseado para investigar la relacin entre diferentes factores
nutricionales y la incidencia de cncer y otras enfermedades crnicas. Se han reclutado 520.000
participantes en diez pases europeos: Alemania, Dinamarca, Espaa, Francia, Grecia, Holanda,
Italia, Noruega, Reino Unido y Suecia. El carcter internacional del estudio aumenta la
heterogeneidad diettica de los participantes, lo que permite comparar patrones de alimentacin
muy diversos. El reclutamiento se inici en 1992. Aunque, por lo general, la fuente de
reclutamiento de los participantes ha sido la poblacin general, la forma de seleccionar y seguir
a los participantes vara de unos pases a otros. La informacin sobre dieta se obtuvo mediante
un cuestionario diettico que fue adaptado y validado en todos los pases participantes. Se
obtuvieron tambin muestras de sangre, que fueron almacenadas para anlisis posteriores. El
estudio se plantea un seguimiento mnimo de 10 aos. Los casos de cncer que se van produciendo
en la cohorte son detectados mediante los registros de cncer poblacionales de las reas del
estudio. Espaa contribuye en este estudio con 41.440 participantes, reclutados por los Registros
de Cncer de Granada, Murcia, Oviedo, Pamplona y San Sebastin. El centro coordinador
espaol est en Barcelona.
Ejemplo 3: El estudio de las enfermeras americanas NHS (Nurses Health Study)
El primer estudio se inici en 1976, y su objetivo principal era investigar los efectos a largo
plazo del consumo de anticonceptivos. Se eligieron las enfermeras debido a su alto nivel
educativo y a su capacidad para contestar las preguntas relevantes del estudio. El diseo inicial
se centr en la poblacin de enfermeras casadas, con edades entre 30 y 55 aos en 1976 que
vivan en 11 estados de USA, en los que fue posible obtener los listados de las enfermeras y su
direccin. Se consider incluidas en la cohorte a todas las enfermeras que contestaron el
cuestionario inicial, (122.000 enfermeras de un total de 170.000 a las que se haba enviado
dicho cuestionario).
Cada dos aos, las enfermeras de la cohorte han de rellenar un cuestionario de seguimiento
incluyendo preguntas sobre su salud, consumo de tabaco, uso de anticonceptivos, hormonas y
estatus menopusico.
A partir de 1980 se incluyeron cuestionarios dietticos con una periodicidad cuatrienal.
Adems, para tener en cuenta aspectos dietticos difcilmente investigables a travs de
cuestionario, se pidi a las enfermeras que enviasen cortes de las uas de los pies. En 1989 se
recogieron muestras de sangre de una submuestra de la cohorte (32.826 mujeres). Finalmente
ENS Octubre 2009
94
en 1992 se aadi un cuestionario de calidad de vida, que se cumplimenta tambin cada cuatro
aos.
Al NHS-I se ha sumado el NHS-II en 1989, cuyo objetivo es estudiar el efecto de los
anticonceptivos orales, la dieta y los estilos de vida en una poblacin ms joven, con edades
comprendidas entre los 25 y los 42 aos al inicio del estudio. Esta generacin incluye mujeres
que empezaron a tomar anticonceptivos durante la adolescencia y por ello han tenido una
mayor exposicin a lo largo de la vida. En esta cohorte se han incluido casi 117.000
enfermeras.
Ejemplo 4: La cohorte MACS (Multicentric Aids Cohort Study)
Esta cohorte multicntrica americana se constituy para investigar la historia natural de la
infeccin por VIH. EN 1984 se reclutaron 4.954 hombres homosexuales en Baltimore, Chicago,
Los ngeles y Pittsburg, a los que se sumaron otros 668 varones entre 1987-1991,
fundamentalmente para representar a las minoras no suficientemente consideradas en la muestra
inicial (minoras tnicas y usuarios de drogas parenterales).
En el momento del reclutamiento inicial, se saba que el SIDA era una enfermedad
infecciosa, pero no se haba descubierto el agente causal ni se dispona de las tcnicas serolgicas
para su determinacin. Cuando dichas tcnicas estuvieron disponibles, el anlisis de las
muestras de sangre almacenadas de forma sistemtica cada 6 meses permiti determinar el
estatus serolgico de los participantes. Se comprob que el 39% de los participantes eran
seropositivos en el momento del reclutamiento (seroprevalentes), mientas que entre los 3.427
pacientes seronegativos, entre 1984 y 1997 se observaron 551 seroconversiones. Esta cohorte
ha permitido investigar diferentes aspectos de la historia natural de la enfermedad, incluyendo
la prevalencia y la incidencia del VIH, la inmunosupresin, el periodo de incubacin, los
marcadores de progresin de la enfermedad, la supervivencia desde el diagnstico de SIDA,
los factores de riesgo de la progresin rpida en los seropositivos, la efectividad de las nuevas
terapias, etc.
Ejemplo 5: La cohorte de poblacin activa sueca
En los pases nrdicos, la existencia de registros poblacionales de gran calidad ha permitido
la reconstruccin de cohortes histricas mediante el procedimiento de enlace de registros
(record-linkage). Un ejemplo de este tipo de estudios es la cohorte de poblacin activa sueca,
identificada a travs del censo de poblacin de ese pas de 1970, que ha sido seguida un total
de 19 aos (1971-1989) mediante enlace de registros, utilizando los registros nacionales
suecos de mortalidad y de cncer. La cohorte incluy nicamente a los trabajadores de 1970 que
estuviesen ya presentes en el pas, aunque no trabajasen, en 1960. El enlace de registros se
realiz utilizando el nmero de identificacin personal, un cdigo de 10 dgitos que identifica
de forma inequvoca a cada ciudadano sueco.
La cohorte de trabajadores con edades comprendidas entre los 25 y los 64 aos al inicio del
seguimiento, incluy 1.779.646 hombres y 1.066.346 mujeres. En el estudio inicial se presentaba
la asociacin entre la ocupacin desempeada en 1970 y la incidencia de 30 tipos de cncer. De
forma ms especfica, se ha investigado la incidencia de cncer de mama y posteriormente de
otras localizaciones.
Frente a otras cohortes histricas similares, la cohorte sueca presenta las siguientes
peculiaridades: 1) estudio de ambos sexos y no slo de los trabajadores varones, 2) clculo
exacto de la contribucin de personas-ao de cada participante del estudio, y 3) consideracin
de la ocupacin referida en el censo de 1960 para definir subcohortes ms especficas para cada
ENS Octubre 2009
95
ocupacin, incluyendo slo a los trabajadores clasificados bajo ese cdigo ocupacional en
ambos censos.
Ejemplo 6: Cohortes hospitalarias: Estudio de factores pronsticos de cncer de pulmn
no microctico
Los estudios de factores pronsticos frecuentemente utilizan cohortes hospitalarias de
pacientes. El ejemplo que planteamos es un estudio multicntrico sobre factores pronsticos de
pacientes con cncer de pulmn no microctico (CPNM) resecable, llevado a cabo de forma
prospectiva en 13 hospitales espaoles. En el estudio se incluyeron a todos los pacientes con
cncer de pulmn no microctico, intervenidos en los centros participantes, que cumpliesen los
criterios de inclusin: casos con tumor resecable con confirmacin histolgica, no fallecido
como consecuencia directa del procedimiento quirrgico y sin quimioterapia o radioterapia prequirrgica. En total, el estudio incluy 465 pacientes.
El objetivo del estudio era evaluar el posible papel como factor pronstico de determinados
biomarcadores: niveles sricos preoperatorios de algunos antgenos relacionados con el cncer
como el antgeno carcinoembrionario (CEA) y CA125, y la sobre-expresin en el tejido
tumoral de algunas protenas como p53 y c-erbB-2. Todas las determinaciones se hicieron de
forma centralizada para minimizar la variabilidad debida al laboratorio. Adems, en aquellos
pacientes que aceptaron participar, se obtuvo informacin detallada sobre el consumo de
tabaco y la historia ocupacional completa. Se investig tambin el posible efecto pronstico
del consumo de tabaco, utilizando la informacin procedente de los ltimos 5 aos previos al
diagnstico.
El momento de la operacin quirrgica supone el inicio del seguimiento. Los pacientes
fueron citados con un intervalo mnimo de 6 meses entre las visitas mdicas. Los eventos de
inters fueron la muerte por cncer de pulmn y la aparicin de recidiva. Tambin se utiliz el
telfono para localizar a los pacientes que no acudan al hospital y confirmar su estado de salud.
Algo original en este estudio ha sido la investigacin de la relacin entre los factores pronsticos
y el tipo de recidiva, diferenciando entre recidiva locorregional y aparicin de metstasis a
distancia.
2.
CLASIFICACIN DE LOS ESTUDIOS DE COHORTES
Considerando la referencia temporal del investigador respecto del seguimiento, los estudios
de cohortes se clasifican en:
1. Estudios prospectivos: El diseo se realiza a priori, de forma que todo el seguimiento
de los miembros de la(s) cohorte(s) se sita cronolgicamente dentro del periodo del
estudio. El estudio de los mdicos britnicos, el EPIC, el estudio de las enfermeras
(NHS) y el estudio de factores pronsticos de CPNM son estudios prospectivos.
2. Estudios retrospectivos o cohortes histricas: El estudio se inicia a posteriori. Se trata
de reconstruir el seguimiento de los miembros de la cohorte a travs de la informacin
recogida en registros histricos (ej: censos, padrones, registros de cncer, historias
clnicas, etc.). Lgicamente en estos estudios no ser posible obtener informacin que
no est recogida en los registros utilizados. Por ello, el factor limitante es la calidad de
las fuentes de informacin utilizadas. El estudio de la cohorte ocupacional sueca es un
ejemplo de cohorte histrica.
3. Estudios ambispectivos: Es una mezcla de los dos anteriores. En el momento de iniciar
el estudio, parte del seguimiento de todos o de algunos de los miembros de la cohorte
ENS Octubre 2009
96
ya ha transcurrido, por lo que se hace necesario incorporar esta informacin histrica

al resto de los datos recogidos de forma prospectiva. Los estudios de cohortes
ocupacionales frecuentemente son ambispectivos. Cuando se decide iniciar el estudio,
algunos de los miembros de la cohorte llevan bastante tiempo trabajando en la industria
de inters, mientras que los nuevos contratados se incorporan al estudio de forma
totalmente prospectiva. El estudio MACS es un ejemplo mixto. Con respecto a la
seroconversin, el estudio es prospectivo en los seronegativos y retrospectivo en los
positivos.
Por otra parte, en funcin del grupo de comparacin o referencia utilizado se pueden
considerar tres tipos de estudios:
1. Estudios con dos cohortes: expuesta y no expuesta: Una vez definida la cohorte
expuesta, los investigadores seleccionan e incorporan en el estudio una cohorte no
expuesta.
2. Estudios de comparacin con la poblacin general: El estudio identifica y sigue a una
determinada cohorte de exposicin. La frecuencia de aparicin de la enfermedad en
dicha cohorte es comparada con la observada en la poblacin general. Para ello es
necesario disponer de registros poblacionales que suministren dicha informacin.
3. Comparaciones internas: La cohorte a estudio supone una mezcla de personas expuestas
y no expuestas. Las comparaciones se realizan dentro de la propia cohorte.
3.
VENTAJAS E INCONVENIENTES DE LOS ESTUDIOS DE COHORTES FRENTE A LOS

ESTUDIOS DE CASOS Y CONTROLES
Frente a los estudios caso-control, los estudios de cohortes presentan las siguientes
ventajas:
Permiten obtener informacin ms detallada de los efectos de una determinada
exposicin. Posibilitan la inclusin en el estudio de uno o ms eventos de inters
relacionados con dicha exposicin.
Presentan menor propensin a los sesgos de recuerdo y de seleccin. Por un lado, la
relacin exposicin-enfermedad es estudiada respetando la secuencia temporal. La
valoracin de la exposicin es anterior al evento de inters. Por otro lado, la poblacin
origen del estudio est mejor definida y es fcilmente identificable. El sesgo de
seleccin es el punto crtico de los estudios de casos y controles, cuya validez radica en
la adecuada inclusin de controles realmente representativos de la poblacin origen de
los casos.
Facilitan el estudio de exposiciones infrecuentes, difciles de incluir en estudios de
casos y controles.
Favorecen un uso adecuado de las muestras biolgicas, que son recogidas antes de que
aparezca la enfermedad.
Posibilitan la medicin de la exposicin de forma repetida en el tiempo. Con ello
permiten valorar los cambios que se producen en la exposicin y tambin calibrar los
posibles errores de medicin.
Permiten estudiar la incidencia de la enfermedad en la poblacin a estudio y tambin el
riesgo (incidencia acumulada).
Entre los inconvenientes de los estudios de cohortes, respecto a los casos y controles,
figuran los siguientes:
ENS Octubre 2009
97
En general requieren mucho ms tiempo. El seguimiento puede durar muchos aos, lo

que encarece el estudio y dificulta la retencin de los participantes. Los estudios de
cohortes histricas no sufren dicho inconveniente, pero su calidad est determinada
por las fuentes de informacin utilizadas.
Cuando el evento de inters es infrecuente (enfermedades de baja incidencia) es
necesario incluir en el estudio un nmero elevado de participantes.
Los estudios de cohortes basadas en grupos especficos de exposicin, como pueden
ser determinados sectores ocupacionales, no permiten estimar directamente la fraccin
de enfermedad atribuible a la exposicin. Para ello, es necesario conocer cual es la
frecuencia de exposicin en la poblacin general.
Vistos los pros y contras, podemos concluir que los estudios de cohortes y los caso-control
son dos herramientas complementarias. Los estudios de cohortes proporcionan una poblacin
bien definida en la que identificar los casos de forma no sesgada y con informacin disponible
de la secuencia temporal del seguimiento. Los caso-control concentran el esfuerzo en los
individuos informativos. Por eso muchos estudios de cohortes incorporan la estrategia de
utilizar diseos de caso-control dentro de la cohorte.
4.
ASPECTOS BSICOS DEL DISEO DE LOS ESTUDIOS DE COHORTES
A la hora de disear un estudio de cohortes es importante definir de forma clara los

siguientes aspectos:
5.
Seleccin de la cohorte: Criterios de inclusin

Fecha de entrada y de salida de los participantes en el estudio
Seguimiento
Eventos finales de inters
La exposicin
Factores de confusin
Confidencialidad
Estrategias de anlisis
Potencia estadstica
Optimizacin de recursos: estudios de caso-control sobre una cohorte
SELECCIN DE LA COHORTE
La seleccin de la(s) cohorte(s) viene motivada por la naturaleza de la exposicin, las

caractersticas de la enfermedad estudiada y la posibilidad de seguimiento del grupo elegido.
Respecto a la exposicin, es importante que la cohorte elegida incluya personas con un
grado de exposicin suficiente como para desarrollar el/los eventos de inters. En este sentido,
el NHS-II incluye un colectivo nuevo de enfermeras en las que la posible exposicin a hormonas
contraceptivas ha sido mucho mayor que la de la cohorte inicial. Por otra parte, si el estudio
pretende establecer comparaciones internas dentro de la cohorte, sta debe ser suficientemente
heterognea en cuanto a niveles de exposicin. As, el carcter multinacional del estudio EPIC
permitir investigar la influencia de patrones dietticos que normalmente presentan poca
variabilidad en una regin o incluso en un pas.
ENS Octubre 2009
98
Respecto al evento o enfermedad de inters, cohortes como el MACS fueron diseadas

para investigar los factores de riesgo de enfermedades de origen desconocido. En este sentido,
interesa incluir en la(s) cohorte(s) colectivos con una elevada incidencia. Por este motivo, el
reclutamiento inicial en el estudio MACS incluy 5.000 varones homosexuales, colectivo que
sufri el primer impacto de la epidemia de SIDA en Estados Unidos.
Teniendo en cuenta el seguimiento, es importante que el colectivo sea fcil de seguir a lo
largo del estudio y que el porcentaje de abandonos del estudio (prdidas esperadas) sea bajo. Ello
ha motivado la creacin de cohortes de mdicos y de enfermeras para investigar exposiciones no
relacionadas directamente con su trabajo, como son el consumo de tabaco y de anticonceptivos
orales. Estos colectivos tienen un mayor grado de motivacin y estn, adems, altamente
cualificados a la hora de proporcionar informacin sobre la exposicin e incluso sobre los eventos
de inters.
Finalmente, la principal ventaja de cohortes histricas como la cohorte de poblacin activa
sueca es su carcter poblacional, lo que elimina los sesgos de seleccin y permite estimar la
incidencia de cncer y el riesgo relativo en ocupaciones de baja frecuencia.
La base poblacional de un estudio de cohortes se define como la experiencia de personastiempo incluida en ese estudio concreto. Los resultados del mismo se refieren precisamente a
esa base poblacional. Para que dicha base poblacional sea fcilmente identificable, las reglas de
inclusin y exclusin deben ser claras.
6.
FECHAS DE ENTRADA Y SALIDA: CONTRIBUCIN DE CADA MIEMBRO DE LA

COHORTE AL ESTUDIO
La fecha de entrada supone el inicio de la contribucin de cada miembro de la cohorte al

estudio, en trminos de personas ao. La fecha de entrada puede, y de hecho suele, no coincidir
con el inicio de la exposicin, ni con la fecha en la que dicha persona ha completado lo que
podramos considerar como dosis mnima de exposicin relevante.
La fecha de salida est condicionada por tres factores: 1) el desarrollo del evento o
enfermedad de inters, en caso de que dicho evento sea nico; 2) el cierre del estudio, y 3) el
abandono del estudio por la causa que sea.
A la hora de establecer el nivel de exposicin, es importante considerar la informacin
anterior a la inclusin del sujeto en el estudio. Sin embargo, ese periodo no debe contribuir en
el cmputo de personas ao. Dicha inclusin supondra un sesgo de seleccin, ya que el diseo
del estudio ha dejado fuera a aquellos miembros de la poblacin objeto del estudio que ya no
estn presentes (no son reclutables) al inicio del mismo, ya sea por haber fallecido, haber
desarrollado la enfermedad previamente o haber abandonado dicha poblacin.
En la tabla 6-1 se presenta la informacin sobre la entrada y salida y el tiempo biolgicamente
relevante en cada uno de los ejemplos citados al inicio de este captulo.
ENS Octubre 2009
99
Tabla 6-1: Periodo biolgicamente relevante y periodo de estudio en los estudios de cohortes citados.
Estudio
Incluye el
Entrada en el
estudio todo el
estudio
PBR?
Mdicos
britnicos
Del inicio del consumo de tabaco a

la muerte por cncer de pulmn u
otras causas
Primer
cuestionario
No
EPIC
Del inicio de consumo de

Primer
determinado nutriente a la aparicin cuestionario
de un det. tumor
y toma de
muestras
biolgicas
Del inicio del consumo de
Primer
anticonceptivos a la aparicin de
cuestionario
uno de los eventos de inters
No
MACS
Seroconversin - desarrollo de
SIDA y posteriormente muerte
Primer
cuestionario y
muestra de
sangre
Slo en sujetos
seronegativos
Cohorte sueca
Del inicio de una determinada

ocupacin a la aparicin de un
determinado tumor
1-Enero-1971
No
Factores
pronsticos
CPNM
Ciruga - recidiva tumoral muerte Fecha ciruga
NHS
7.
Periodo biolgicamente relevante

(PBR)
No
Si
SEGUIMIENTO
La calidad del seguimiento es el principal factor para definir la calidad de un estudio de

cohortes. En general, los objetivos del seguimiento son tres:
Identificar la aparicin del evento.
Identificar las prdidas del estudio y el momento en que se producen.
Identificar cambios relevantes en la exposicin y, si es necesario, en otros factores de
riesgo relevantes.
El tipo de seguimiento es diferente segn los estudios. En algunos, el seguimiento es pasivo,
basado exclusivamente en la informacin disponible en los registros poblacionales, como el caso
de los mdicos britnicos o la cohorte sueca. En otros, los sujetos participantes deben acudir de
forma peridica al hospital o centro correspondiente, como es el caso del MACS y del estudio de
factores pronsticos de CPNM. En otros casos, el seguimiento se realiza por correo, a travs de
encuestas (ejemplo: NHS).
La periodicidad del seguimiento viene determinada por la dinmica de la enfermedad y la
necesidad de mantener a los participantes dentro del estudio. Aunque las tcnicas de anlisis
estadstico permiten considerar la informacin parcial proporcionada por las personas que
abandonan el estudio, un alto porcentaje de abandonos o prdidas puede comprometer
seriamente la generabilidad de los resultados. Por ello, muchos estudios de cohortes han
desarrollado estrategias para mantener la tasa de participacin de los sujetos incluidos (ver
tabla 6-2).
ENS Octubre 2009
100
Tabla 6-2: Estrategias para maximizar la adherencia.
En el reclutamiento:
- Investigar la intencin de permanecer en la cohorte
- Hacer que el participante complete con xito las tareas que se requerirn de
l en el seguimiento
- Informar ampliamente de los requerimientos de su participacin en el
estudio
- Recoger informacin para el seguimiento: direccin, telfono, nmero SS,
lugar y fecha de nacimiento, etc
- Recoger informacin similar de contactos
Identificacin con el estudio:
- Crear un logo y un lema
- Mandar cartas, felicitaciones, informacin sobre la marcha del estudio, etc.
Frecuencia de contacto:
- Contactos regulares cada 6-24 meses
- Recoger como mnimo informacin sobre el evento
- Disear un sistema de rastreo
Responsables del seguimiento:
- Entrenados y entusiastas
- Que faciliten la comunicacin
- Que sean flexibles en las citacin de los participantes
Uso de incentivos
- Distribuir entre los participantes objetos con el logotipo del estudio
- Cubrir los gastos de los envos por correo
- Informar peridicamente a los participantes de los resultados del estudio
Es importante que el seguimiento cuente con un dispositivo capaz de detectar los abandonos
del estudio y el momento en que se producen. En situaciones de seguimiento pasivo, cuando el
diagnstico de la enfermedad se realiza a travs de registros, el investigador puede estar
considerando dentro del estudio a sujetos que de hecho estn ya fuera de l, lo que se traduce
en una subestimacin de la incidencia real. Por ejemplo, la cohorte de poblacin activa sueca
fue seguida mediante los registros suecos de cncer y de defuncin. Todas las personas que
refirieron una ocupacin concreta en 1970 se consideraron dentro del estudio mientras no
figurase su fecha de defuncin en el registro de mortalidad. Sin embargo, algunos trabajadores
han podido salir del pas y por ello abandonar el estudio. En este caso concreto, la imprecisin
cometida al considerar a estas personas dentro de la cohorte es pequea, dado que la tasa de
emigracin en Suecia en los aos 70 y 80 fue menor del 1 por mil.
8.
EVENTOS FINALES DE INTERS
Durante el seguimiento es necesario disponer de un sistema que identifique en qu momento

se produce el evento o enfermedad a estudio. En estudios de mortalidad, como la cohorte de
mdicos britnicos, el momento en que se produce el evento es fcil de constatar. Lo que resulta
ms problemtico en estos estudios es considerar la causa de defuncin. La calidad de los
certificados de defuncin es heterognea segn el tipo de enfermedad considerada. En el caso
de la mortalidad por cncer, diferentes estudios han mostrado que la informacin contenida en
los certificados de defuncin es razonablemente vlida.
En los estudios de incidencia basados en registros poblacionales, la fecha del evento es la
fecha de diagnstico que figura en el registro. En el estudio MACS, como fecha de seroconversin
se consider la media entre la ltima visita con serologa negativa y la primera con serologa
positiva. En el estudio de factores pronsticos de CPNM, se consider como fecha de recidiva
la primera visita o exploracin positiva.
ENS Octubre 2009
101
La mayor parte de enfermedades crnicas plantean la necesidad de periodos extensos de

seguimiento, debido a la magnitud de los periodos de induccin y latencia. Aunque algunos
autores usan ambos trminos como sinnimos, el periodo entre la exposicin y la aparicin de
los sntomas de la enfermedad puede dividirse en dos partes (ver figura 6-1). El periodo de
induccin es el intervalo de tiempo necesario para que el agente causal (slo o con la concurrencia
de otros factores) sea suficiente para iniciar el dao. A partir de este punto comenzara el periodo
de latencia, durante el cual la enfermedad progresa hasta el momento en el que es diagnosticable.
Este periodo se reduce, por ejemplo, con programas de screening que detectan la enfermedad
presintomticamente. Si, una vez que se inicia el proceso patolgico, la enfermedad puede
revertir sin haber sido diagnosticada, ambos periodos se solapan; si ste no es el caso, el periodo
de induccin y el de latencia son consecutivos. Tras el inicio de la enfermedad, la exposicin
puede seguir existiendo: en algunos casos la presencia del agente ya no tiene efecto sobre la
evolucin de la misma, mientras que en otros puede potenciar su progreso (agente promotor).
Figura 6-1: Relacin temporal entre exposicin y enfermedad.
Periodo de
Periodo
de induccin
induccin
Inicio de
de la
la
exposicin
exposicin
Inicio del
dao
Induccin
Induccin
propiamente
propiamente
dicha
Cese de
de la
la
exposicin
exposicin
Comienzo de de
Diagnstico
la enfermedad
la
enfermedad
Periodo no
Periodo
no
relacionado
relacionado
con la
exposicin
exposicin
Periodo de
Periodo
de latencia
latencia
Tiempo
Tiempo
Actualmente se investiga la posibilidad de utilizar biomarcadores como eventos intermedios

o marcadores de efecto precoz, que permitiran disminuir la duracin del estudio e instaurar
medidas preventivas antes de que la enfermedad avance (ver figura 6-4). Por ejemplo, en el
estudio de la historia natural de infeccin por VIH, la cada de linfocitos CD4+ es un determinante
de progresin de enfermedad. Para las enfermedades cardiovasculares se han utilizado los
niveles de colesterol y de lipoprotenas, como eventos intermedios. En relacin al cncer, los
marcadores de efecto precoz utilizados incluyen cambios genticos en las clulas, como son la
aparicin de aberraciones cromosmicas y microncleos.
9. VALORACIN DE LA EXPOSICIN
La medida de la exposicin es un punto crucial en cualquier estudio epidemiolgico. Al
hablar de exposicin, sin embargo, no nos referimos slo al posible contacto con un agente de
inters, sino tambin a todos aquellos factores relacionados con el sujeto que pueden influir en
la relacin entre el agente y la enfermedad. Una adecuada recogida de informacin sobre hbitos
de vida, indicadores de situacin socioeconmica, problemas de salud u otras caractersticas
que varen la susceptibilidad personal a los agentes de inters y puedan modificar el efecto que
se desea analizar, es casi tan importante como la misma valoracin de la exposicin al factor
que motiva la realizacin del estudio.
ENS Octubre 2009
102
En general, los estudios de cohortes son un diseo muy atractivo para estimar la exposicin
ya que garantizan que la medicin se realiza antes de que se produzca la enfermedad. As se
cumple uno de los principios bsicos en causalidad: la causa precede al efecto. Esta secuencia
temporal tiene otras ventajas aadidas:
1. La medida de la exposicin no est condicionada por la enfermedad ni por los
tratamientos que se puedan aplicar para ella. Este aspecto es muy importante si se usan
marcadores biolgicos para estimar la exposicin.
2. Las variables de confusin (por ejemplo, aspectos relacionados con la dieta, ejercicio
o hbitos de vida) se miden tambin antes de la aparicin de la enfermedad. As se
evitan tanto el sesgo de recuerdo, como el posible efecto que el diagnstico de la
enfermedad puede tener sobre las respuestas y conductas de los sujetos. Como
contrapartida, sin embargo, hay que sealar que lo habitual es que la informacin sobre
variables asociadas se recoja con menos detalle que en un estudio de casos-controles,
en el que se puede focalizar ms la atencin hacia los aspectos relacionados con el
evento de inters. Existe, adems, otro problema derivado del momento de recogida de
los datos: no podremos tener en cuenta nuevos factores de riesgo que se identifiquen
posteriormente, porque no dispondremos de informacin sobre los mismos. La
modificacin del instrumento de medida (e.j cambios en el cuestionario) puede permitir
tener dicha informacin a partir de un momento dado. Por ejemplo, el Nurses Health
Study incorpor un cuestionario diettico a partir del cuarto ao de seguimiento.
Aunque muchas veces es difcil conocer la fecha de la exposicin inicial, el diseo de la
cohorte permite disponer al menos de una estimacin de la exposicin en un momento concreto
para todos sus miembros. Si el seguimiento de la cohorte es largo, dispondremos de un rango
muy amplio de tiempos diferentes entre el momento de la medicin y el momento de aparicin
del proceso de inters. Esto puede permitir investigar hiptesis relacionadas con diferentes
periodos de latencia entre exposicin y enfermedad.
10.
LA ESTIMACIN DE LA EXPOSICIN
Un estudio de cohortes es esencialmente un estudio analtico; la estimacin de la exposicin,

por tanto, se realiza con un fin: estudiar la asociacin entre aqulla y unos efectos determinados.
Esto hace que el investigador tenga que plantearse a priori la relacin entre ambas y cules son
los aspectos a tener en cuenta para representar la dosis de exposicin relevante en el contexto
de esa enfermedad. Para entender a que nos referimos vamos a usar como ejemplo el estudio del
efecto a largo plazo de una dosis excesiva de radiaciones ionizantes ocurrida accidentalmente
en trabajadores de una central nuclear. La estrategia de medida ser diferente en funcin de las
asunciones previas, por ejemplo: a) si presumo que slo se producirn efectos dainos en caso
de que la radiacin haya superado un determinado dintel, b) si lo que presupongo es que todos
los trabajadores pueden sufrir consecuencias adversas por este accidente y que a mayor
exposicin el riego de alteraciones es mayor, o c) si considero que el efecto de esta exposicin
va a estar determinado tambin por la exposicin a radiacin que el sujeto acumule a lo largo
de su vida. Si precisamente lo que se pretende es caracterizar esta relacin, es necesario tener
presentes todas estas posibilidades y recoger la informacin necesaria.
Tras haber pensado cul es la mejor manera de aproximarse a esa terica medida de dosis
ideal, el investigador tiene que identificar qu exposiciones incluyen el agente de inters, definir
los tems que necesita recoger para obtener informacin sobre la duracin, frecuencia e
intensidad de la exposicin en el periodo especfico de riesgo que se ha determinado, y desarrollar
el algoritmo que combina dichas variables para llegar al constructo de dosis elegido.
ENS Octubre 2009
103
Aunque en este captulo vamos a tratar dosis y exposicin prcticamente como si ambos
trminos fuesen sinnimos, hay que sealar que muchos autores diferencian claramente entre
exposicin, referida a medidas tomadas en el ambiente, es decir fuera del sujeto, y dosis, que se
mide bien en tejidos humanos o en el punto de contacto entre sujeto y medio. Ott, en la
Enciclopedia de Salud y Seguridad en el Trabajo de la OIT, define la exposicin como la
concentracin de un agente en la frontera entre individuo y medioambiente, y la dosis como el
depsito o absorcin de un agente por unidad de tiempo, y se estima combinando datos de
mediciones ambientales con hiptesis tipificadas o con medidas directas. La diferencia entre las
dos depende de caractersticas fisiolgicas, de los patrones de actividad de los sujetos y de las
variaciones en la concentracin de los agentes en el tiempo y el espacio. En general se considera
que las medidas externas son ms tiles que las internas cuando las exposiciones estn muy
extendidas y las diferencias entre grupos son ms importantes que las interindividuales.
10.1
Cmo medimos la exposicin? Exposicin y tiempo
En el estudio de cohortes ms sencillo, la exposicin sera una condicin permanente y

fcilmente identificable, por lo que asignar individuos al grupo de expuestos sera prcticamente
una tarea rutinaria. Sin embargo, en la realidad las exposiciones de inters rara vez son constantes
y a menudo son difciles de medir. Otros factores de riesgo presentan tambin este problema:
existen caractersticas que no cambian en el tiempo, como el sexo, pero otras pueden variar
durante el seguimiento, como por ejemplo la ocupacin o la residencia habitual.
El primer aspecto a definir es el periodo de exposicin que consideramos relevante: una
medida de la exposicin actual es suficiente o se necesita una medida pasada? Casi todas las medidas
de laboratorio (objetivas) son actuales, aunque algunas, como las derivadas de rasgos heredados,
son fijas. Sin embargo, a menudo es necesario tener en cuenta la posible existencia de periodos de
induccin y de latencia, es decir, los periodos de tiempo que se consideran necesarios para que el
agente pueda producir el dao (induccin) y para que ste sea detectable (latencia). En la figura 6-1
se muestra un esquema de la posible relacin entre un txico y una enfermedad. Si estamos
estudiando, por ejemplo, tabaquismo y cncer de pulmn en mujeres, debemos suponer que ha de
pasar algn tiempo desde que la mujer empez a fumar para que el tabaco pueda generar dao y se
origine el cncer. Al principio, adems, el tumor que empieza a desarrollarse en el pulmn es
prcticamente indetectable, y ha de pasar un tiempo hasta que produzca sntomas y sea
diagnosticado.
Otra pregunta importante es durante que periodo se recoger la medida de la exposicin:
es suficiente con una nica medida, necesitamos medidas repetidas para aumentar la precisin
o es preferible actualizar la informacin con medidas repetidas del marcador en diferentes
momentos desde la medida inicial? De nuevo es fundamental el esquema terico del investigador
para determinar cul es la estrategia adecuada. En muchos anlisis epidemiolgicos se usa una
medida resumen, asumiendo implcitamente que es ste el nico aspecto de la exposicin que
determina el riesgo actual. Las medidas resumen ms habituales son el nivel de exposicin en
el momento de la medida, la exposicin media o mediana si existen medidas repetidas, la
exposicin mxima registrada o la exposicin acumulada, es decir la suma de exposicin en
cada categora por el tiempo que el individuo pasa en la misma. El seguimiento en el tiempo de
los individuos, sin embargo, conlleva el problema aadido de clasificar la experiencia de un
individuo en diferentes categoras de exposicin en distintos momentos del tiempo. Por ejemplo:
en la figura 6-2 podemos ver cmo se podra categorizar la exposicin acumulada al tabaco de
un sujeto, que podra pertenecer a la cohorte de mdicos britnicos previamente mencionada, y
que fuma sin interrupcin entre 1953 y 1995. Inicialmente el sujeto fuma entre uno y 5 cigarrillos
al da, y hasta 1970 no acumula las 1000 cajetillas-vida que hemos definido como lmite para
ENS Octubre 2009
104
ser fumador moderado. Si, adems, tenemos en cuenta un posible periodo de latencia de 5 aos,
consideraramos que las personas-ao que aporta este sujeto entre 1953 y 1975 corresponden al
estrato de poco fumador. Nuestro individuo incrementa algo su consumo de cigarros y en solo 10
aos alcanza las 2000 cajetillas-vida que determinan el paso a gran fumador. Las personas-ao
correspondientes al periodo 1975-85 corresponden a fumador moderado y, a partir de aqu, a
gran fumador hasta que el sujeto muera, se pierda o se abandone el seguimiento.
Figura 6-2: Categorizacin de la exposicin acumulada al tabaco.
CONTRIBUCIN AL RIESGO
Poco fumador
1953
1953
10.2
Gran
fumador
Fumador
moderado
1975
1970
EXPOSICIN
1985
1980
1995
1995
Herramientas para estimar la exposicin
La calidad en la medida de la exposicin determinar en muchos casos la validez de los

resultados del estudio. Por este motivo deben usarse instrumentos de medida correctamente
validados, y es conveniente probarlos en una pequea muestra, revisarlos y probarlos de nuevo en
un estudio piloto. En la tabla 6-3 se recogen las posibles fuentes de error que hay que tener
presentes en la estimacin de la exposicin. La precisin y el grado de detalle con el que se recoge
la informacin es otro aspecto importante. En general hay que intentar, en la medida de lo posible,
cuantificar. La informacin cuantitativa permite estudiar la relacin dosis-respuesta y la dosis de
exposicin mnima necesaria. Es necesario recoger adems toda la informacin sobre las
condiciones en las que se produce la exposicin si se cree que pueden modificar la misma.
Tabla 6-3: Posibles fuentes de error en la medida de la exposicin
x
x
x
x
Error en el instrumento de medida o en su protocolo

o
Falta de exhaustividad en cubrir todas las fuentes
de exposicin
o
Inclusin de exposiciones que no tienen el agente activo
o
Periodo evaluado distinto del periodo relevante
o
Preguntas ambiguas o mal entendidas.
Errores en el protocolo de uso del instrumento
o
Poca especificacin de las instrucciones
o
Imprevisin sobre la forma de manejar situaciones
y respuestas no previstas
Cambios en la precisin a lo largo del tiempo
o
Cambio del instrumento de medida
o
Cansancio del entrevistador
o
Ausencia de estandarizacin del procedimiento
o
Degradacin de muestras biolgicas
Errores en el procesado de los datos
o
Errores en la grabacin
o
Errores en la conversin de la exposicin al agente activo
o
Variable indicadora o resumen de la exposicin inadecuada
ENS Octubre 2009
105
Teniendo presentes todos estos aspectos, el investigador debe elegir un instrumento de

medida atendiendo a dos puntos bsicos: el factor a estudiar y la factibilidad de su uso en el
estudio concreto que se plantea. Entre las formas ms habituales de medir la exposicin
podramos citar las siguientes:
Entrevistas, cuestionarios o, con menor frecuencia, diarios estructurados. Son
fundamentales sobre todo a la hora de disponer informacin relativa a hbitos o
conductas. Permiten tener informacin cuando no existen registros objetivos, aunque
pueden estar sujetos a errores difciles de controlar. Por ejemplo, las contestaciones a
determinadas preguntas pueden depender de la consideracin social del comportamiento
sobre el que se pregunta.
Medidas en el ambiente del sujeto, bien procedentes de registros existentes o bien
obtenidas expresamente para el estudio (p. ej, registros de contaminacin ambiental en
una ciudad).
Medidas en el entorno inmediato del individuo (por ejemplo, monitores ambientales en
una estancia determinada de una empresa).
Dosis individual (por ejemplo, monitorizacin personal).
Medidas de concentracin en tejidos humanos o productos metablicos
(biomarcadores).
Marcadores de efectos fisiolgicos (biomarcadores de dosis efectiva).
Muchas veces, en los estudios se combinan varios instrumentos de medida, como se
puede comprobar en las cohortes que se han citado como ejemplo. Cada vez es ms
habitual incorporar recogida de materiales biolgicos (sangre, DNA...), acompaados
de una encuesta, que resulta imprescindible para tener informacin sobre otros factores
de riesgo o posibles factores de confusin. En la tabla 6-4 se resumen las estrategias
que se han utilizado para medir la exposicin en las cohortes que se estn usando como
ejemplo.
Un punto elemental a tener en cuenta si hablamos de cohortes grandes es el coste en dinero
y en esfuerzo. Entre las estrategias posibles para realizar estudios de cohortes con costes
reducidos podramos destacar las siguientes:
Los estudios basados en enlaces de registros, como la cohorte de poblacin activa sueca,
en los que bases de datos que contienen informacin sobre exposicin se asocian a travs de
nmeros de identificacin personales con registros que contienen la informacin sobre
enfermedad. Es bastante habitual y ms econmico recurrir a registros preexistentes (listados
de ocupaciones, etc...), aunque muchas veces esto hace que se disponga de poca informacin
sobre posibles variables de confusin
Los estudios que reclutan la cohorte y recogen la informacin sobre exposicin a travs de
cuestionarios que se envan por correo, que han de ser necesariamente breves y concisos. Esta
es la estrategia que se ha usado, por ejemplo, en el Nurses Health Study. En este caso,
adems, se solicit a los mismos miembros de la cohorte el envo de muestras biolgicas
(uas).
Los que miden la exposicin slo en una muestra de la cohorte. Usan diseos que
permiten reducir costes, minimizando la prdida de informacin, como veremos ms
adelante.
ENS Octubre 2009
106
Tabla 6-4: Instrumento de medida de la exposicin y periodicidad de la misma

en algunos de los estudios de cohortes citados como ejemplo.
Estudio
Instrumento de
medida de exposicin
Periodicidad de la
medida de la
exposicin
EPIC
Cuestionarios postales o Cuestionario reducido

a los 3-4 aos del
en entrevista
reclutamiento
Examen fsico para
medidas
antropomtricas
Muestras biolgicas:
sangre
NHS-I
Cuestionarios postales
Cada 2 aos la
informacin sobre uso
hormonal, estatus
menopausico y
tabaco.
Cada 4 aos
informacin sobre
dieta y calidad de vida
Toma nica
Muestras biolgicas:
Recogida de uas de los Prevn repetir la
dedos de los pies a los 6 muestra en el ao
2000
aos del inicio
(68.000 mujeres)
Muestra de sangre
domiciliaria a los 13
aos del inicio (33.000
mujeres aprox.)
MACS
Cuestionario
autoadministrado
Entrevista personal
Examen clnico y de
laboratorio
10.3
Encuesta
Muestras biolgicas
El estudio incluy una

exhaustiva investigacin
metodolgica para garantizar
la validez de los
cuestionarios y medidas
utilizados que ha sido
publicada
independientemente.
Ha ido incorporando
cuestionarios sobre nuevos
aspectos a lo largo del
estudio (dieta en 1980,
calidad de vida en 1992)
Algunas tomas de muestras

han sido realizadas por los
mismos miembros de la
cohorte
Se repite todo cada 6

meses
Cohorte sueca Enlace de registros de

Cncer, Mortalidad y
censos de 1970 y 1960
Factores
pronsticos
CPNM
Algunos aspectos
interesantes del estudio
Se puede combinar con

matrices de ocupacinexposicin expresamente
diseadas para esta cohorte
Medida nica al inicio
del estudio
Algunos instrumentos de medida interesantes
Matrices de Ocupacin-exposicin
El entorno laboral es una fuente muy rica para el estudio de txicos en humanos. En una
ocupacin, sin embargo, suele haber exposicin a mltiples substancias; y por otra parte existen
muchas ocupaciones que tienen exposiciones comunes. En muchos casos, la informacin
relevante es la exposicin a la sustancia de inters y no la ocupacin desempeada.
Una matriz de ocupacin-exposicin (Job-Exposition Matrix: JEM) (figura 6-3) es una
herramienta para convertir las ocupaciones en exposiciones potenciales. En su forma ms sencilla,
los puestos de trabajo se clasifican en expuestos o no expuestos. La estimacin de la exposicin
en un trabajo concreto puede basarse en medidas directas o en opiniones de expertos basadas en la
descripcin de los puestos de trabajo, y ser ms acorde con la exposicin real cuanto ms especfica
sea la definicin del mismo. Si definimos categoras ocupacionales (p.ej. empleados de tiendas),
ENS Octubre 2009
107
el error en la estimacin ser superior al que se tendr si se estudia cada ocupacin de forma
independiente en cada sector industrial (p.ej. empleadas de tiendas en gasolineras y empleados de
tiendas en un centro comercial). An as, no todos los sujetos pertenecientes a una misma
combinacin ocupacin-industria estn expuestos a las substancias de inters. A veces, la
clasificacin de la exposicin se basa en la proporcin estimada de personas en ese empleo que
soportan niveles de exposicin por encima de un nivel determinado. No obstante, las JEMs no
recogen toda la variabilidad que puede existir entre los trabajadores de una misma ocupacin, ni
la debida a factores personales, por lo que siempre habr errores de clasificacin.
Figura 6-3: Esquema de una matriz de ocupacin-exposicin (JEM).
Ocupacin
JEM general
Tiempo
JEM especfica
Exposicin
Cualitativa (si/no)
Ordinal (no/baja/alta)
Combinado con probabilidad de exposicin
En algunos pases, como Suecia, se han elaborado JEMs generales de exposicin a qumicos
o a campos electromagnticos, que se han aplicado a la cohorte de poblacin activa citada como
ejemplo. De esta manera se consigue estudiar la exposicin a estos agentes en cohortes muy
grandes (nacionales) de una forma barata y eficiente.
Biomarcadores
Un biomarcador de exposicin (figura 6-4) es un estimador de dosis de un determinado agente
medido en muestras o sistemas biolgicos. Puede ser un compuesto exgeno al individuo, un
metabolito de aqul o un producto interactivo exo-endgeno, como las combinaciones de txicos
con protenas del sujeto. Resultan especialmente tiles si hay varias vas posibles de exposicin
(p.ej, ingesta y absorcin drmica), cuando se usan medios de proteccin o en condiciones de
exposicin imprevisibles. Otros biomarcadores relevantes para los estudios de cohortes son los
marcadores de susceptibilidad gentica: diferencias en la velocidad de acetilacin heptica, por
ejemplo, hacen que vare la probabilidad de padecer una enfermedad concreta tras la exposicin a
un txico que se inactiva por esta va. Modifican por tanto el efecto de la exposicin (interaccin).
Figura 6-4: Tipos de biomarcadores.
MEDIO EXTERNO
INDIVIDUO
Marcadores
de Susceptibilidad
Susceptibilidad
MARCADORES DE EXPOSICIN
Exposicin
Dosis
Interna
Dosis
Bilgica
Efectiva
Efecto
Efecto
Bilgico
Bilgico
Precoz
Precoz
Alteracin
Funcional o
Estructural
Enfermedad
ENS Octubre 2009
108
Tabla 6-5: Biomarcadores en estudios de cohortes: ventajas y desventajas
Ventajas del uso de biomarcadores:

1. Puede permitir la integracin de varias vas de exposicin.
2. No hay necesidad de estimar el efecto de las medidas de proteccin.
3. Aunque aparentemente dos sujetos estn expuestos a concentraciones
similares de una sustancia, en realidad pueden existir diferencias
individuales de ingesta
x Por diferencias en exposiciones medioambientales no conocidas.
x Por diferencias en la biotransformacin de la sustancia.
4. Los biomarcadores pueden dar una idea ms real de la exposicin
concreta de un individuo.
5. Si varios agentes tienen un metabolito comn puedo estudiar su efecto
conjunto.
6. Si la variabilidad intra e inter-individuos es menor que la del medio,
puede ser una estrategia muy eficiente de medicin de la exposicin.
Desventajas del uso de biomarcadores
1. No siempre hay buena correlacin con la exposicin ambiental. Es muy
importante por tanto validar previamente el marcador.
2. Cuidado con el periodo al que se refieren: no siempre encontraremos
biomarcadores que se correlacionen con el momento de exposicin que
queremos estudiar.
3. Los procesos toxicocinticos y de eliminacin modifican las
concentraciones de las sustancias de inters y pueden verse alterados por
muchas causas (p.ej. exposicin simultanea a otro agente no controlado)
4. Si las diferencias interindividuales por variaciones en la entrada,
biotransformacin y excrecin del txico son mayores que las
medioambientales, pueden ser mejores las segundas
5. Muchas veces no son especficos de un agente concreto: hay que
descartar factores de confusin o exposiciones combinadas.
6. Debemos disponer de niveles base o de referencia para interpretarlos y
conocer muy bien sus posibles fuentes de variabilidad
7. Puede que no toda la cohorte est dispuesta a proporcionar muestras, con
lo que tendramos poca potencia. Esto es ms evidente para las medidas
repetidas, sobre todo si la muestra es invasiva.
Los biomarcadores presentan un innegable atractivo para los investigadores; sin embargo,
como todos los instrumentos de medida, han de ser especficos, fiables y precisos. Sus ventajas
y desventajas se resumen en la tabla 6-5. La adecuada seleccin del biomarcador debe tener en
cuenta: a) con qu periodo de exposicin se relaciona el biomarcador seleccionado, b) cmo
afectan los factores metablicos u otros factores personales del husped a los niveles del
biomarcador, y c) las caractersticas de la muestra que se precisa (invasiva o no, cantidad de
sustrato, posibilidad de degradacin en el tiempo, coste, posibilidad de tomas seriadas si es
preciso...), ya que determinan la logstica del estudio.
11. OTROS FACTORES DE RIESGO: CONFUSIN E INTERACCIN
La necesidad de obtener informacin sobre exposicin a otros factores viene motivada
por dos razones: 1) la naturaleza multicausal de la etiologa de la mayor parte de las
enfermedades, 2) los factores que determinan la presencia o ausencia de la exposicin de
inters.
ENS Octubre 2009
109
El estudio de cohortes es de carcter observacional, es decir, el investigador estudia la

exposicin en aquellos grupos de poblacin en los que sta se produce. Normalmente, la mayor
parte de los factores de riesgo no se distribuyen de forma aleatoria en la poblacin, por lo que
con frecuencia los determinantes de la enfermedad estn asociados, positiva o negativamente,
con la exposicin bajo estudio. Esta asociacin hace necesario identificar y recoger informacin
sobre los posibles factores de confusin para controlar su efecto en el anlisis.
Adems, en el estudio de la dinmica de la enfermedad es interesante constatar si existen
sinergias entre la exposicin bajo estudio y la presencia de otros factores de riesgo (presencia
de interacciones).
12.
CONFIDENCIALIDAD
El establecimiento de una cohorte implica prever un seguimiento para los individuos que
la componen. Esto hace imprescindible que exista un identificador para cada sujeto, que permita
asignarle la informacin sobre su exposicin o su estatus vital. Sin embargo, como en el resto
de los estudios epidemiolgicos, asegurar la confidencialidad de la informacin es un requisito
fundamental para cumplir con los principios ticos exigibles a toda investigacin. En Espaa,
el tratamiento de los datos personales se rige por la ley Orgnica 15/1999 de Proteccin de
Datos de Carcter Personal, que establece las garantas que deben observarse durante la
obtencin, custodia y cesin, si es el caso, de los mismos. En esta norma, los datos relativos a
la salud son protegidos especialmente, con restricciones y controles ms estrictos que con otro
tipo de informaciones. En el caso de incluir datos sobre enfermedades, es habitual tener que
recurrir a las historias clnicas de los sujetos, siendo entonces tambin de aplicacin la
ley 41/2002, reguladora de la Autonoma del Paciente y de los Derechos y Obligaciones en
Materia de Informacin y Documentacin Sanitaria y la Ley 14/1986, General de Sanidad, que
permiten el acceso a la informacin con fines epidemiolgicos o de investigacin, aunque
explicitan que, como regla general, dicho acceso debe realizarse de forma que quede asegurado
el anonimato. En cualquier caso, es responsabilidad del investigador garantizar la confidencialidad
de la informacin que est a su cargo.
13.
ESTRATEGIAS DE ANLISIS
El anlisis de los estudios de cohortes ha de tener en cuenta la dimensin temporal del

estudio. La existencia de prdidas y la diferente duracin del seguimiento de los distintos
miembros de la cohorte implican la necesidad de tcnicas analticas especiales que, a la vez,
permitan considerar toda la informacin aportada por los integrantes de la cohorte. Las estrategias
de anlisis ms usadas desintegran el tiempo de observacin de cada uno de los participantes.
La medida de frecuencia ms adecuada es la tasa de incidencia. La unidad de anlisis ya no es
el individuo, sino la unidad temporal de observacin. Existen dos estrategias diferentes de
anlisis en los estudios de cohortes: el anlisis supervivencia y el anlisis personas-tiempo, pero
ambas requieren disponer de:
Informacin precisa sobre el inicio y el final del seguimiento de cada participante.
Definicin de una escala temporal adecuada (edad, ao calendario, tiempo tras la
intervencin, etc).
Estatus del participante en el momento de salida del estudio (desarrollo o no de la
enfermedad).
ENS Octubre 2009
110
Es importante tener en cuenta, que en el anlisis, todos los individuos con informacin
incompleta, es decir, aquellos que no desarrollan el evento de inters, son tratados de la misma
manera. Conceptualmente, sin embargo, cabe establecer diferencias entre los participantes que
estn presentes en el momento del cierre del estudio y aquellos que han abandonado el mismo
a lo largo del seguimiento. Las tcnicas de anlisis consideran que las prdidas son aleatorias,
pero las personas que abandonan el estudio pueden hacerlo por razones o factores relacionados
con la enfermedad estudiada o con la exposicin de inters. Tambin es importante tener en
cuenta la mortalidad competitiva, que impide llegar a diagnosticar la enfermedad en aquellos
individuos que mueren por otras causas. Por ello, los estudios de cohortes deben proporcionar
informacin sobre el porcentaje y el tipo de prdidas observadas a lo largo del seguimiento.
13.1
Las tcnicas de anlisis de supervivencia
Utilizan la informacin individual de cada participante de la cohorte. Las tcnicas ms

conocidas son las curvas de supervivencia de Kaplan-Meier, cuya significacin estadstica es
comprobada a travs del test de logrank, y los modelos semiparamtricos de Cox. La popularidad
de ambos mtodos se basa en la ausencia de asunciones sobre la evolucin de la tasa de incidencia
en el tiempo. Sin embargo, en ambos casos (logrank y Cox) se asume que la medida del efecto,
es decir, la razn de tasas de incidencia (denominada Hazard Ratio en los estudios de
supervivencia) es constante a lo largo del tiempo (asuncin de proporcionalidad). De todas
formas, el modelo de Cox permite parametrizar la falta de proporcionalidad dentro del propio
modelo. Tambin es posible incluir dentro del modelo exposiciones cambiantes en el tiempo.
En la figura 6-5 se muestra, como ejemplo, la comparacin entre las curvas de supervivencia
obtenidas en la cohorte de CPNM en enfermos con niveles preoperatorios bajos de antgeno
carcinoembrionario (CEA) y en pacientes con niveles elevados. La diferencia entre ambas es
estadsticamente significativa.
Para el anlisis de supervivencia es importante que la unidad temporal est referida al
tiempo biolgicamente relevante, que puede o no coincidir con la cronologa del estudio. Por
ejemplo, en el estudio MACS no tiene mucho sentido considerar el inicio del estudio como
origen en el anlisis de supervivencia, ya que los individuos seroprevalentes se encuentran en
una fase diferente de la enfermedad, mientras que en los seronegativos el momento de la
serconversin es el momento relevante.
Proporcin de pacientes vivos
Figura 6-5: Comparacin de las curvas de supervivencia postoperatoria entre los pacientes
del estudio de factores pronsticos del cncer de pulmn no microctico
segn niveles sricos preoperatorios de antgeno carcinoembrionario.
1.0
p=0.011
0.9
0.8
CEA < 5ng/ml
0.7
0.6
CEA > 5ng/ml
0.5
6
12 18 24 30 36 42 48 54 60
Meses desde la ciruga
ENS Octubre 2009
111
13.2
Las tcnicas de personas-ao
Utilizan como unidad de anlisis estratos o grupos homogneos en los que es razonable
asumir una misma tasa de incidencia. Esto requiere colapsar la informacin individual por
estratos de inters. Estas tcnicas son utilizadas en los grandes estudios poblacionales, como la
cohorte de poblacin activa sueca. Las variables que definen los estratos de inters son,
lgicamente, la exposicin y el resto de factores de riesgo (factores de confusin) a considerar.
Algunas de estas variables, como el sexo, pueden ser fijas, mientras que otras (la edad o el
periodo de observacin, por ejemplo) cambian a lo largo del tiempo. La existencia de estas
variables cambiantes en el tiempo hacen necesario dividir el tiempo de observacin de cada
persona para considerar su contribucin a cada uno de los estratos (grupos de edad, por ejemplo)
por los que va pasando. Si tomamos un sujeto de la cohorte sueca con 43 aos en 1971 (ver
figura 6-6) y que es diagnosticado de cncer de mama en 1978, podemos ver, por ejemplo, que
su contribucin en personas-ao correspondiente al periodo 71-75 debe ser dividida en dos
porciones: una parte corresponde al grupo de edad de 40-44 aos y otra parte al grupo de
edad 45-49. En la cohorte sueca este proceso fue realizado en cada sujeto de la misma.
Figura 6-6: Contribucin de un individuo a diferentes estratos en el clculo de las personas ao.
Edad
50-54
45-49
40-44
71-75 76-80 81-85 86-89
Periodo
P
eriodo
En cohortes histricas poblacionales, generalmente los estratos a considerar vienen

determinados por las variables para las que se dispone de informacin. En estos estudios, como
ocurre en los estudios descriptivos de grandes colectivos de poblacin, con frecuencia el
denominador de las tasas no se calcula de forma exacta, contabilizando la contribucin de cada
individuo, sino considerando la poblacin a mitad del periodo multiplicada por la duracin del
periodo.
Las tcnicas clsicas de anlisis personas tiempo incluyen la comparacin de tasas, la
estandarizacin directa y las razones estandarizadas de incidencia o mortalidad (denominadas
en la literatura RIE o SIR, para la incidencia y RME o SMR para la mortalidad). RIE y RME
comparan el nmero de casos observados con el nmero esperado teniendo en cuenta la
frecuencia de enfermedad en la poblacin utilizada como referencia. La tcnica multivariante
por excelencia para la modelizacin de las tasas es la regresin de Poisson, que utiliza la
distribucin de Poisson para modelizar la variabilidad aleatoria del numerador de las tasas.
14.
POTENCIA ESTADSTICA
El alto coste de los estudios de cohortes en trminos de esfuerzo, tiempo y dinero hace
necesario la estimacin previa del tamao muestral requerido en relacin al efecto que se
pretende observar. En muchas situaciones, sin embargo, es ms prctico proceder al revs. Es
decir, considerar en primer lugar el nmero de participantes que es posible incluir en el estudio,
bien sea por restricciones econmicas o de otro tipo, y calcular la potencia estadstica disponible.
ENS Octubre 2009
112
Por ejemplo, en el estudio sobre factores pronsticos de CPNM, el volumen de pacientes

atendidos en los hospitales participantes indicaba la posibilidad de incluir alrededor de 400
casos durante el reclutamiento. Teniendo en cuenta la proporcin de muestras p53 positivas en
series previas de pacientes, dicho tamao muestral supona, con un periodo de seguimiento
mnimo de dos aos, la posibilidad de detectar significacin estadstica (potencia superior
al 80%) para riesgos relativos (hazard ratios) iguales o superiores a 1,50.
Una vez concluido el estudio, el clculo de la potencia estadstica a posteriori es
particularmente importante para enjuiciar los resultados negativos, es decir, la ausencia de
asociacin entre la exposicin y la enfermedad. Los mtodos estadsticos no permiten nunca
demostrar la hiptesis nula (falta de asociacin) sino slo rechazarla o no con un margen de
error determinado. Por ello, cuando la incidencia del evento de inters es similar en expuestos
y no expuestos, es importante tener en cuenta las siguientes consideraciones:
Cul es la potencia estadstica real del estudio? Cul es el mnimo RR que sera
posible detectar teniendo en cuenta las caractersticas del mismo?
Existen diferencias reales de exposicin en los grupos de comparacin?
El periodo de seguimiento ha sido suficiente? Hay que tener en cuenta el periodo de
latencia necesario (ver figura 6-1).
Cmo encajan los resultados del estudio en el marco general del conocimiento
existente sobre dicha enfermedad?
15.
15.1
PROBLEMAS DE INTERPRETACIN DE LOS ESTUDIOS DE COHORTES

Representatividad de la cohorte seleccionada
Este problema puede estar presente cuando se seleccionan grupos especficos, por su
disponibilidad o su mayor tasa de participacin, para representar a toda la poblacin (el estudio
de los mdicos britnicos, o de las enfermeras americanas, por ejemplo). La inclusin en los
estudios de voluntarios, es decir, personas que aceptan participar, tambin puede conllevar
problemas de representatividad (adems de los estudios citados anteriormente, el EPIC y
el MACS utilizan voluntarios). Los voluntarios suelen ser personas con mayor nivel de educacin,
ms preocupados por su salud y con hbitos de vida ms saludables. Esto puede implicar una
infraestimacin de exposiciones nocivas y una menor incidencia de la enfermedad.
15.2 Eleccin del grupo de comparacin
Las personas expuestas y no expuestas pueden diferenciarse respecto a otros factores
relevantes para la enfermedad de inters. Cuando estos factores son conocidos, el estudio debe
recoger informacin sobre ellos y obtener estimadores del efecto de la exposicin, eliminando
el posible efecto de confusin de estas variables. En estudios que utilizan grupos externos de
comparacin, esta informacin no suele estar disponible.
15.3
Prdidas durante el seguimiento
Como ya se ha comentado, las tcnicas de anlisis consideran todos los individuos que no
llegan a desarrollar la enfermedad como un grupo homogneo, pero las causas de esta falta de
informacin son diversas. El principal problema radica en los sujetos que abandonan el estudio
y en aquellos que mueren por otras causas. Las tcnicas analticas asumen que las prdidas son
aleatorias y no estn relacionadas con la enfermedad o la exposicin de inters. Por ello, es
importante comprobar que las personas que permanecen en el estudio y aquellas que lo han
ENS Octubre 2009
113
abandonado son realmente similares. Cuando las prdidas no son aleatorias se produce un sesgo
de seleccin a lo largo del tiempo y la cohorte deja de representar a la poblacin de base inicial.
15.4
Sesgos introducidos por los errores de medida
Ya se ha hablado de ellos en el apartado dedicado a la exposicin (ver tambin la tabla 6-3).

Es importante que dichos errores sean de tipo no diferencial, es decir, que el error esperado
sea similar en los distintos grupos de exposicin.
15.5
El problema de las comparaciones mltiples
Este problema se presenta en aquellos estudios de cohortes que valoran mltiples

exposiciones o mltiples eventos de inters. Por ejemplo, en la cohorte de poblacin activa
sueca, el inters se centra en conocer la incidencia relativa de un determinado tipo de cncer en
cada grupo ocupacional. Esto supone la realizacin de mltiples contrastes, comparando cada
una de las 270 ocupaciones con el resto de la poblacin activa. En estos estudios, la posibilidad
de encontrar, por azar, asociaciones estadsticamente significativas aumenta considerablemente.
Recientemente se han propuesto nuevos procedimientos para recalcular la significacin
estadstica teniendo en cuenta el nmero de comparaciones realizadas, minimizando la tasa de
hallazgos falsos (False Discovery Rate).
16. CASOS Y CONTROLES BASADOS EN ESTUDIOS DE COHORTES
Se trata de diseos de estudios caso-control que pretenden maximizar la informacin obtenida
a partir de los estudios de cohortes minimizando el coste. Los principales diseos son dos: los
casos y controles anidados a una cohorte y los estudios caso-cohorte. Estos diseos son
especialmente importantes cuando el estudio incluye determinaciones analticas costosas o
muestras difciles de obtener, como por ejemplo, biomarcadores de exposicin o susceptibilidad.
16.1
Estudios de casos y controles anidados
Son estudios caso-control que incluyen todos los casos observados en la cohorte y uno o
ms controles emparejados con los casos por tiempo de seguimiento. Este apareamiento implica
considerar la informacin disponible para los controles slo hasta la fecha de diagnstico de su
caso correspondiente. Adems, un control puede llegar a convertirse en caso, a medida que
avanza el seguimiento. El anlisis de los datos debe respetar el apareamiento y comparar cada
caso con su grupo de controles.
16.2
Estudios caso-cohorte
Bajo este diseo se seleccionan como controles, de forma aleatoria, una fraccin de todos
los componentes de la cohorte original. Este tipo de diseo supone la consideracin de la
informacin proporcionada por la subcohorte seleccionada ms la de todos los casos ocurridos
fuera de dicho grupo. En este tipo de diseo, los mtodos de anlisis deben tener en cuenta el
carcter diferencial de los casos incluidos y no incluidos en la subcohorte seleccionada.
17.
ESTUDIOS DE COHORTES Y LOS ENSAYOS CLNICOS
La diferencia entre estos dos diseos es la asignacin aleatoria de la exposicin, propia de

los ensayos clnicos. Dicha asignacin aleatoria, o randomizacin, garantiza la comparabilidad
de los grupos de exposicin siempre que el tamao muestral sea adecuado.
ENS Octubre 2009
114
Por razones ticas obvias, los ensayos clnicos slo se utilizan para valorar exposiciones o
intervenciones potencialmente beneficiosas. En estas circunstancias, los ensayos clnicos son
preferibles a los estudios de cohortes. La randomizacin sita a los ensayos clnicos en el marco
de investigacin propio de los estudios experimentales, donde el investigador puede controlar
las condiciones en las que se produce el experimento.
Sin embargo, cuando se investiga la utilidad de nuevos tratamientos, los criterios de
inclusin utilizados en los ensayos clnicos suelen implicar una gran seleccin de los pacientes.
Con frecuencia, los grupos ms vulnerables (pacientes con otras patologas subyacentes, edades
avanzadas, grupos sociales desfavorecidos, etc) no forman parte de estos estudios. Adems, las
condiciones de aplicacin del tratamiento, el seguimiento y el manejo de los casos dentro de un
ensayo clnico pueden no ser representativos del contexto clnico general en el que se diagnostica
y trata a los pacientes. Estas diferencias explican los resultados paradjicos encontrados, por
ejemplo, cuando se evalu la utilidad de los primeros agentes antirretrovirales. Mientras los
ensayos clnicos mostraban un efecto beneficioso, la mortalidad de los casos con SIDA de
estudios de cohortes como el MACS no mostraban diferencias sustanciales entre los pacientes
tratados y no tratados. Hubo que esperar a la llegada de la nueva terapia potente antiriretroviral
para que el impacto de dichos tratamientos fuese realmente visible en las cohortes de pacientes
con SIDA.
Teniendo en cuenta lo anterior, es interesante matizar que los ensayos clnicos determinan
la eficacia terica de un determinado tratamiento. Como contrapartida, los estudios de cohortes
representativas de pacientes juegan un papel importante en el estudio de la efectividad, es decir,
el efecto real de dicho tratamiento aplicado en las condiciones normales de la prctica clnica.
En otro tipo de contexto, la aleatorizacin resulta inviable al existir grupos naturalmente
expuestos y grupos no expuestos en la poblacin. Los estudios de cohortes son, en este caso, la
mejor aproximacin de que dispone el epidemilogo para acercarse a la calidad de la informacin
generada por los ensayos clnicos.
18.
CONCLUSIONES
Como se ha comentado en este captulo, los estudios de cohortes suponen una herramienta
esencial en la investigacin epidemiolgica. En ellos, la relacin temporal causa-efecto est
asegurada, siendo posible adems investigar e incorporar en el anlisis los cambios que se
producen en la cohorte a lo largo del tiempo.
El diseo y desarrollo de un estudio de cohortes es generalmente un reto que conlleva
muchas dificultades. Es necesario valorar la exposicin y los cambios que se producen a lo
largo del tiempo, retener a los participantes en la cohorte y mantener un sistema de seguimiento
que permita determinar la incidencia de la enfermedad o enfermedades estudiadas.
Los estudios de cohortes han demostrado ser tiles no slo a la hora de investigar los
factores etiolgicos ms importantes de muchas enfermedades, sino tambin para caracterizar
la evolucin de epidemias como el SIDA, predecir el riesgo de enfermar a nivel individual (por
ejemplo, las frmulas que valoran el riesgo de enfermedad cardiovascular proceden de la cohorte
Framingham y de estudios similares), investigar el efecto sinrgico de dos o ms exposiciones,
determinar el periodo de latencia, investigar la validez de los marcadores precoces de enfermedad,
etc. Finalmente los estudios de cohortes complementan a los ensayos clnicos a la hora de
valorar la utilidad de los nuevos agentes teraputicos. Los estudios de cohortes han servido
adems de estmulo en el planteamiento de nuevas hiptesis y el desarrollo de nuevos mtodos
de anlisis. La riqueza de la informacin aportada por estos estudios, la capacidad que han
ENS Octubre 2009
115
demostrado para incorporar nuevas hiptesis y ayudar a clarificar el papel desempeado por
diferentes factores de riesgo en la gnesis de enfermedades complejas sitan a estos estudios
como marco de referencia en la investigacin epidemiolgica.
19. BIBLIOGRAFA
BENJAMINI Y, HOCHBERG Y. Controlling the false discovery rate: a practical and powerful approach to multiple
testing. J Royal Stat Soc B 1995; 57:289300.
BRESLOW NE, DAY NE. Statistical Methods in Cancer Research Volume II : The design and analysis of cohort studies.
IARC Scientific Publications No. 82. International Agency for Research on Cancer. Lyon, 1987.
COLDITZ GA, MANSON JE, HANKINSON SE: The Nurses Health Study: 20-year contribution to the understanding
of health among women. J Womens Health 1997; 6: 49-62.
DOLL R, HILL AB. Mortality in relation to smoking: ten years observations of British doctors. Br Med J 1964; 1:
1399-1410.
GUALLAR EM. Alternativas al diseo tradicional de los estudios de cohortes: estudios de casos y controles hbridos y
estudios de cohortes y casos. Rev Salud Pblica 1991; 2: 151-165.
HUNTER, D.J. Methodological issues in the use of biological markers in cancer epidemiology: cohort studies. En Toniolo
P. y cols.. Ed. Application of Biomarkers in Cancer Epidemiology. IARC Scientific Publications N142. International
Agency for Research on Cancer. Lyon, 1997.
KAUPPINEN T, TOIKKANEN J Y PUKKALA E. From cross-tabulations to multipurpose exposure information
systems: a new job-exposure matrix. Am J Ind Med 1998; 33:409-417
LYLES RH, MUNOZ A, YAMASHITA TE, BAZMI H, DETELS R, RINALDO CR, MARGOLICK JB, PHAIR JP,
MELLORS JW. Natural history of human immunodeficiency virus type 1 viremia after seroconversion and proximal to AIDS
in a large cohort of homosexual men. Multicenter AIDS Cohort Study. J Infect Dis. 2000;181:872-80.
MUOZ A, HOOVER DR. Use of cohort studies for evaluating AIDS therapies. En: Finkelstein DM, Schoenfeld DA
(eds). AIDS Clinical Trials. Wily and Sons. NY 1995. pp: 423-446.
NIETO-GARCA FJ. Los Estudios de cohorte. En: Martnez-Navarro F, Ant JM, Castellanos PL, Gili M, Marset P,
Navarro V (eds). Salud Pblica. McGraw-Hill y Interamericana. Madrid, 1999.
Organizacin Internacional del Trabajo. Enciclopedia de Salud y Seguridad en el Trabajo. 3 Ed. Ministerio de Trabajo y
Asuntos Sociales 2001. http://www.mtas.es/insht/EncOIT/Index.htm.
POLLN M, GUSTAVSSON P. Cancer and Occupation in Sweden: 1971-1989. EPC-Rapport 1999:1.The National Board
of Health and Welfare, Sweden, 1999. Disponible en: http://www.sos.se/fulltext/9918-001.pdf.
POLLN M. Ocupacin, exposicin laboral a radiaciones electromagnticas y cncer de mama. Instituto de Salud
Carlos III. Madrid, 2001. Disponible en: http://193.146.50.130/cancer/cem-cancer.pdf.
POLLN M, VARELA G, TORRES A, DE LA TORRE M, LUDEA MD, ORTEGA MD, PAC J, FREIXENET J,
GMEZ G, SEBASTIN F, DEZ M, ARRABAL R, CANALS E, GARCA-TIRADO J, ARNEDILLO A, RIVAS JJ,
MINGUELLA J, GMEZ A, GARCA M, ARAGONS N, PREZ-GMEZ B, LPEZ-ABENTE G, GONZLEZSARMIENTO R, ROJAS JM. Clinical value of p53, c-erbB-2, CEA and CA125 regarding relapse, metastasis and death
in resectable non-small cell lung cancer. Int J Cancer 2003; 107: 781-90.
RIBOLI E, KAAKS R. The EPIC Project: rationale and study design. European Prospective Investigation into Cancer
and Nutrition. Int J Epidemiol 1997 26: S6-S14.
ROTHMAN KJ, GREENLAND S. Cohort Studies. En: Modern Epidemiology. Second Edition. Lippincott-Raven.
Philadelphia, 1998. pp 79-91.
SAMET JM, MUOZ A (EDS). Cohort Studies. Epidemiologic Reviews 1998; 20, 1.
SCHOTTENFELD D, FRAUMENI FJ, JR. Cancer Epidemiology and Prevention. Second Edition. Oxford University
Press. Oxford, 1996.
TARWATER PM, MELLORS J, GORE ME, MARGOLICK JB, PHAIR J, DETELS R, MUNOZ A. Methods to assess
population effectiveness of therapies in human immunodeficiency virus incident and prevalent cohorts. Am J Epidemiol.
2001;154: 675-81.
ENS Octubre 2009
116
Estudios de Casos y Controles
VII. ESTUDIOS DE CASOS Y CONTROLES

F. Javier Jimnez Jimnez
1.
INTRODUCCIN
Un estudio de casos y controles es un estudio analtico observacional que comienza con la

identificacin de un grupo de casos (individuos con una particular enfermedad o condicin) y
un grupo de controles (individuos sin la enfermedad o condicin). Entonces, el nivel o prevalencia
de la exposicin a un factor se mide en los dos grupos y se compara. Bsicamente, si la
prevalencia de la exposicin es mayor en casos que en controles, la exposicin podra ser un
factor de riesgo, mientras que si es menor, la exposicin podra ser un factor protector.
Aunque tradicionalmente los estudios de casos y controles se conocan tambin como
estudios retrospectivos, debido a que el muestreo se realiza a partir de la situacin caso/control
de los participantes, como se ha sealado en un captulo precedente estos estudios pueden ser
tanto prospectivos como retrospectivos. Esta terminologa, sin embargo, puede dar lugar a
confusin con los estudios de cohorte retrospectivos, por lo que su uso tiende a abandonarse.
El papel de los estudios de casos y controles en la evaluacin de hiptesis epidemiolgicas
ha estado limitado por dificultades en cuanto a la interpretacin del tipo de evidencia aportada.
Frecuentemente se considera que los estudios de casos y controles recogen la evidencia de
forma contraria a lo que sucede en la vida real y que son, en cierto modo, anti-naturales. Esto
es as porque, al contrario que los estudios de cohortes, abordan el proceso de enfermar partiendo
del estado final (enfermedad) para llegar a la fase inicial (exposicin). Actualmente est ms
extendida la idea de que los estudios de casos y controles son, en realidad, una forma eficiente
de muestrear una cohorte subyacente.
Para entender los estudios de casos y controles, la aproximacin ms til es considerar que
existe una poblacin de base, a partir de la cual obtenemos los casos y en la que muestreamos
entre las personas a riesgo para obtener los controles. As, los casos aportan informacin con
respecto a la exposicin en las personas que desarrollan la enfermedad, mientras que los
controles aportan informacin acerca de la exposicin en la poblacin de la que proceden los
casos.
Aunque los estudios de casos y controles estn sujetos a algunas fuentes de sesgos diferentes
de los estudios de cohorte (por ejemplo, el hecho de que la enfermedad modifique la exposicin
es un problema fundamentalmente en los estudios de casos y controles), desde el punto de vista
lgico, no se diferencian de los estudios de cohorte.
2.
USOS DE LOS ESTUDIOS DE CASOS Y CONTROLES. VENTAJAS Y DESVENTAJAS
Los estudios de casos y controles se han utilizado principalmente en la investigacin de los

factores asociados con el desarrollo de enfermedades crnicas (cncer, enfermedades
cardiovasculares), aunque cada vez son ms utilizados tambin en el estudio de enfermedades
transmisibles y en la evaluacin de intervenciones y programas de salud.
A continuacin se detallan las principales ventajas y desventajas de los estudios de casos y
controles, sobre todo en comparacin a los estudios de cohorte.
ENS Octubre 2009
117
Ventajas de los estudios de casos y controles

Los estudios de casos y controles son ms baratos y rpidos que los estudios de cohorte. En
los estudios de casos y controles se obtienen todos los casos que aparecen en una poblacin de
base terica en el momento de sufrir la enfermedad. En este sentido, no es necesario realizar el
seguimiento de esta poblacin, por lo que los estudios de casos y controles son ms sencillos
desde el punto de vista logstico y no estn sujetos a problemas de prdidas en el seguimiento.
Los estudios de casos y controles son especialmente tiles en enfermedades raras o con
largos periodos de latencia. En este caso, los estudios de cohorte son ineficientes, ya que es
necesario seguir a un nmero elevado de personas durante bastante tiempo para obtener un nmero
suficiente de casos. En muchas ocasiones, los estudios de casos y controles son la nica opcin
realista. De hecho, existen numerosas enfermedades con incidencias inferiores a 1 caso / 10.000
personas-ao. En esos casos, si deseramos investigar las causas de una de esas enfermedades
mediante un estudio de cohortes, habra que seguir a 100.000 personas durante 2 aos para obtener
menos de 20 casos de enfermedad por trmino medio, lo que resulta muy ineficiente.
Los estudios de casos y controles permiten estudiar una amplia variedad de posibles
exposiciones. Aunque esto es tambin posible en estudios de cohorte, en stos habra que determinar
la exposicin en todos los participantes de la cohorte, lo que puede ser ineficiente o, sencillamente
muy caro. De hecho, estas consideraciones sobre la eficiencia en los estudios de cohorte llevaron
al desarrollo de los diseos de casos y controles anidados y a otros diseos hbridos de muestreo
dentro de una cohorte.
Desventajas de los estudios de casos y controles
Los estudios de casos y controles no son adecuados cuando el desarrollo de la enfermedad
altera los niveles de las exposiciones que se estn intentando determinar. En ocasiones, puede
ser dfcil determinar si la exposicin ha causado la enfermedad, o si la enfermedad ha modificado
la exposicin. Por ejemplo, durante la fase aguda de un infarto de miocardio, los niveles de
colesterol total en sangre disminuyen. Por lo tanto, si se realiza un estudio de casos y controles
comparando los niveles de colesterol en casos incidentes de infarto agudo de miocardio con
controles sin la enfermedad, los niveles de colesterol total sern ms bajos en los casos, a pesar
de que numerosos estudios prospectivos han establecido que los sujetos con niveles ms
elevados de colesterol total tienen un mayor riesgo de padecer un infarto de miocardio.
Los estudios de casos y controles son ms propensos a sesgos de seleccin y de informacin.
Por un lado, la seleccin de la muestra puede afectar la asociacin resultante. De hecho, una de
las dificultades principales en los estudios de casos y controles es la seleccin de un grupo
control adecuado (ver seleccin de controles ms adelante). Por otro lado, la informacin sobre
la exposicin se recoge despus de que los casos hayan desarrollado la enfermedad, por lo que
frecuentemente los sujetos de estudio y los investigadores saben qu participantes son casos y
quienes controles y pueden recoger o recordar la informacin de forma diferente.
Los estudios de casos y controles no son eficientes para estudiar exposiciones raras. En
este caso, tan slo un nmero reducido de casos y de controles estarn expuestos, por lo que las
estimaciones sern imprecisas.
Los estudios de casos y controles permiten estudiar tan slo una enfermedad (o muy pocas)
a la vez. En los estudios de cohorte, una vez reclutada la cohorte y seguida en el tiempo, es
posible registrar la ocurrencia de mltiples enfermedades, por lo que se puede investigar la
asociacin entre las exposiciones determinadas en el estudio y numerosas condiciones. Los
estudios de casos y controles, por el contrario, disponen habitualmente de tan slo una serie de
ENS Octubre 2009
118
casos, por lo que ser necesario hacer un estudio de casos y controles para cada enfermedad que
queramos investigar.
En los estudios de casos y controles no es posible, en general, obtener estimadores de la
incidencia de la enfermedad. Tan slo proporcionan medidas relativas de efecto (en concreto,
odds ratios).
En los estudios de casos y controles no es posible actualizar la medida de la exposicin
(tomar medidas repetidas). En los estudios de cohortes es frecuente realizar varias visitas a los
participantes durante el seguimiento, por lo que se puede volver a medir la exposicin y utilizar
esta informacin en el anlisis del estudio.
3.
PLANIFICACIN Y DISEO
Como todo estudio, un estudio de casos y controles requiere una planificacin y organizacin
cuidadosas. Ser necesario definir claramente los objetivos y las hiptesis, detallar la metodologa,
establecer un cronograma realista y preparar un manual de operaciones para que el equipo de
investigadores trabaje con criterios consistentes.
3.1.
Definicin de poblacin de base
La poblacin de base corresponde a la cohorte terica de la que van a surgir tanto los casos
como los controles. Debe ser concreta hasta donde sea razonable (edad, sexo, lmites
geogrficos, etc.). Se han de establecer unos criterios de elegibilidad (inclusin/exclusin) que
se deben aplicar tanto a casos como controles y que permiten restringir el estudio a las personas
potencialmente en riesgo de la exposicin. En el estudio EURAMIC sobre antioxidantes e
infarto de miocardio, la poblacin de base fueron los varones de menos de 70 aos, nativos de
los pases del estudio, residentes en las zonas de captacin, que hablaran la lengua oficial, y que
no tuvieran historia previa de infarto de miocardio.
3.2.
Definicin y seleccin de casos
Al igual que en otros diseos epidemiolgicos, es esencial tener criterios precisos para la
definicin de caso. Los criterios pueden estar basados en resultados de pruebas diagnsticas o
de laboratorio (por ejemplo, ciertos datos histolgicos para establecer el diagnstico de un tipo
de cncer) o pueden estar basados en la historia clnica o en encuestas. Segn la definicin de
los casos, se diferencian dos tipos importantes de estudios de casos y controles:
Estudios de casos y controles con casos incidentes. Los casos del estudio se limitan a
los casos nuevos de la enfermedad que aparecen durante el periodo de estudio. Siguiendo
con el concepto de la equivalencia lgica entre los estudios de cohorte y los de casos y
controles, esta situacin reproduce lo que encontraramos en un estudio de cohortes, y
ser, por tanto, el mtodo de eleccin para la seleccin de casos en los estudios de
casos y controles.
Estudios de casos y controles con casos prevalentes. Los casos son todos aquellos
pacientes que tienen la enfermedad en un momento determinado. El problema de los
casos prevalentes es que la prevalencia depende tanto de la ocurrencia de la enfermedad
(incidencia) como de su duracin, que a su vez depende del tratamiento y de otros
factores pronsticos. Por tanto, cuando se estudian series con casos prevalentes, es
difcil saber si los factores que se asocian a la condicin de casos han modificado la
incidencia de la enfermedad o tan slo su pronstico. Adems, los casos prevalentes no
son representativos de los casos incidentes, ya que estn sobre-representados los casos
ENS Octubre 2009
119
de mayor duracin. Desde el punto de vista del estudio de factores de riesgo (o

protectores), los estudios de casos y controles con casos prevalentes son similares a los
estudios transversales.
Adems del tipo de casos (incidentes o prevalentes), es necesario considerar de dnde
proceden los casos. Algunas alternativas son:
Estudio de casos hospitalarios, en el que los casos se obtienen de los pacientes que
cumplen los criterios de la definicin de caso y que son atendidos en un determinado
hospital. En este contexto habr que tener en cuenta el conocido como sesgo de
Berkson, que se refiere a que los pacientes con varias enfermedades tienen una mayor
probabilidad de ser hospitalizados que aquellos que slo padecen una, por lo que los
casos seleccionados tendrn una mayor proporcin de pacientes con una segunda
enfermedad que un grupo extrado de la poblacin general.
Estudio de casos poblacionales, en el que los casos se toman de una poblacin definida,
habitualmente a partir de un registro poblacional de la enfermedad en estudio.
En cualquier caso, es importante considerar si los casos elegidos son representativos de
todos los casos en la poblacin de base. Existe siempre un cierto grado de seleccin, y por tanto
el papel del sesgo de seleccin en un estudio de casos y controles es particularmente importante.
Debe asegurarse que la seleccin de casos (e igualmente de controles) se realice
independientemente de su estatus de exposicin. En el caso concreto de la seleccin de casos es
importante asegurarse que la situacin de expuesto no determina una bsqueda ms exhaustiva
de la enfermedad en estudio.
3.3.
Definicin y seleccin de controles
Los controles deben cumplir los criterios de definicin de casos excepto los relativos a la
enfermedad. En general un control debe ser una persona que si hubiera desarrollado la enfermedad
hubiera sido seleccionado como caso. Por ejemplo, si los casos son hospitalarios, un control
ser un sujeto que de haber desarrollado la enfermedad hubiese ido a parar al hospital del que
proceden los casos.
La poblacin de base de los controles debe ser la misma que la de casos y tanto los casos
como los controles deben ser seleccionados concurrentemente. Adems, es necesario tener en
cuenta que el tiempo durante el cual un individuo es susceptible de ser seleccionado como
control debe ser el tiempo durante el que ese individuo es susceptible de ser seleccionado como
caso. De esta forma, un individuo que desarrolla la enfermedad en estudio o que muere no
puede ser ya seleccionado como control. Igualmente, la probabilidad de seleccionar cualquier
potencial control debe ser proporcional al tiempo que dicho control aportara al denominador
del calculo de una tasa si se realizara un estudio de cohortes.
Segn su procedencia, los controles pueden ser:
Poblacionales. En este caso, los controles son una muestra aleatoria directamente
obtenida de la poblacin de base. En teora, los controles poblacionales proporcionan
la mejor representacin de la exposicin en la poblacin de la que proceden los casos,
aunque la menor participacin de los mismos puede limitar la credibilidad del estudio.
Hospitalarios. En ocasiones, la poblacin de base no es fcilmente identificable, de
forma que una muestra aleatoria de la poblacin general no representa necesariamente
una muestra de la poblacin fuente de los casos (especialmente, si los casos son
hospitalarios). Adems, en muestreos poblacionales es frecuente obtener bajas tasas de
respuesta, sobre todo si se realiza alguna medida invasiva. En estos casos es conveniente
ENS Octubre 2009
120
la seleccin de controles a partir de los mismos hospitales de los que surgen los casos.
El principal problema surge al intentar seleccionar los controles de manera independiente
de la exposicin (a menudo, los sujetos expuestos tienen diferente probabilidad que los
no expuestos de acudir al hospital por diferentes enfermedades). Con objeto de evitar
este sesgo se deben seleccionar como controles individuos afectos de enfermedades
que, en principio, no estn asociadas con la enfermedad, as como seleccionar un amplia
variedad de enfermedades como control.
Sujetos fallecidos. Si los casos utilizados en el estudio se definieran como muertes por
cierta causa, o si algunos casos fallecieran entre el diagnstico y el momento de ser
entrevistado, se podra plantear la seleccin de controles fallecidos para buscar una
mayor comparabilidad. Sin embargo, el uso de controles fallecidos puede llevar a una
evaluacin sesgada de la exposicin en la poblacin de la que surgen los casos si dicha
exposicin causa o previene la mortalidad o se asocia con otros factores que actan
sobre la mortalidad. La principal justificacin para el uso de controles fallecidos es la
conveniencia, como en el caso de estudios basados completamente en sujetos fallecidos
(estudios de mortalidad proporcional).
Vecinos. El muestreo de vecinos como controles puede ser una alternativa a la seleccin
de controles poblacionales cuando no es posible realizar un muestreo probabilstico de
la poblacin. En este caso, es posible que los casos y controles, adems de vecindario,
compartan exposiciones similares, lo que podra resultar en sesgos.
Sujetos nombrados por los casos (compaeros o amigos). Este tipo de seleccin
determina la existencia de un emparejamiento individual. Adems de las ventajas e
inconvenientes inherentes al emparejamiento, la seleccin de amigos o vecinos como
controles presenta como inconvenientes que la seleccin puede estar asociada con la
exposicin (por residencia cercana o por hbitos similares) y que la decisin de la
seleccin de controles puede depender en exceso de los casos (amigos).
En la seleccin de controles hay que evitar los sesgos de seleccin, es decir, evitar que la
seleccin de controles est determinada por el estatus de exposicin, ya que es fcil elegir
inadvertidamente un grupo control con una prevalencia de exposicin mayor o menor que la
poblacin general. As, en los estudios de la asociacin entre el alcohol y el cncer de mama, el
uso de controles a partir de pacientes que acuden a urgencias (del mismo hospital que los casos)
puede producir un sesgo dado que este grupo tiene un mayor consumo de alcohol que la
poblacin general (los pacientes acuden a urgencias por accidentes relacionados frecuentemente
con el consumo de alcohol).
3.4.
Medida de la exposicin en casos y en controles
Los datos referentes a la exposicin pueden ser obtenidos de diversas maneras, destacando
la entrevista (personal, postal o telefnica), entrevistas con parientes, examen de registros mdicos,
ocupacionales o de otro tipo, o la realizacin de exploraciones o toma de muestras biolgicas.
Independientemente del mtodo de recogida de la informacin, es necesario tener en cuenta
dos aspectos. Por un lado, la informacin recogida no debe estar influenciada por el hecho de
que un individuo sea caso o control. Por otro lado, es importante asegurar la validez del mtodo
utilizado para evaluar la exposicin.
La falta de comparabilidad en la informacin de casos y controles pueda dar lugar a la
presencia de sesgos de informacin, entre los que destacan:
Sesgo del observador. Se produce cuando los datos correspondientes a la exposicin
son recogidos de manera diferente para los casos que para los controles. Los casos
ENS Octubre 2009
121
pueden ser entrevistados de manera ms exhaustiva sobre la exposicin que los

controles. Es conveniente que el investigador no conozca las hiptesis del estudio o,
mejor todava, si el paciente es un caso o un control. La informacin referente a la
exposicin debe recogerse de igual manera en casos y controles y usando los mismos
instrumentos en ambos.
Sesgo de respuesta. Este sesgo se refiere al proceso por el cual la informacin
aportada con respecto a la exposicin es diferente en casos y controles. Un ejemplo
es el sesgo de memoria, tener una determinada enfermedad puede hacer que se
recuerden mejor las posibles exposiciones. Este sesgo se intenta controlar evitando
que los participantes en el estudio conozcan las hiptesis del mismo e intentando
conseguir que casos y controles tengan el mismo incentivo para recordar exposiciones
pasadas.
La falta de validez en los mtodos de medida de la exposicin, no asociada al status
caso/control, da lugar a un error de clasificacin no diferencial que, en general, tender a
sesgar los resultados del estudio hacia el valor nulo, es decir hacia la falta de asociacin entre
la exposicin y la enfermedad o condicin evaluada.
4.
ANLISIS E INTERPRETACIN DE LOS RESULTADOS
4.1. Odds ratio y riesgo relativo

El anlisis de los estudios de casos y controles se basa en los conceptos de odds y odds
ratios y se realiza mediante la comparacin de casos y controles con respecto a la frecuencia de
exposicin a travs del odds ratio de la exposicin, que es el odds de la exposicin entre los
casos dividido por el odds de la exposicin entre los controles.
Sin embargo, para evaluar la relacin de una determinada exposicin con el desarrollo de
una enfermedad es ms fcil entender la asociacin a partir de la posibilidad de desarrollar la
enfermedad segn se est expuesto o no, que a partir de la probabilidad de estar expuesto segn
se tenga la enfermedad o no. As, si seguimos dos poblaciones (expuesta y no expuesta) durante
un determinado tiempo (t), podemos calcular la asociacin de la exposicin con el desarrollo de
la enfermedad mediante el riesgo relativo, como la razn entre la tasa de incidencia en expuestos
(probabilidad de desarrollar la enfemedad en el tiempo t entre los expuestos) y la tasa de
incidencia en no expuestos.
Tal y como se ha comentado anteriormente, los estudios de casos y controles pueden ser
vistos como un esquema de muestreo eficicente de la experiencia de la enfermedad de una
cohorte subyacente, lo que permite una visin integrada de los estudios de casos y controles y
de cohortes.
Consideremos, por ejemplo, una poblacin dinmica que se encuentra en un una situacin
estable durante una cierta fraccin de tiempo en la que es observada. En este tiempo, xe individuos
expuestos y xne individuos no expuestos sern diagnosticados por primera vez de una determinada
enfermedad. Si conocemos el tiempo que cada individuo (expuesto o no expuesto) que se
encontraba sano al inicio del periodo de observacin ha permanecido en riesgo de desarrollar la
enfermedad, podremos calcular la tasa de incidencia de la enfermedad entre los expuestos y la
tasa de incidencia de la enfermedad entre los no expuestos, y por tanto el riesgo relativo. Sin
embargo, esta informacin no se puede obtener en los estudios de casos y controles. Para
calcular la densidad o tasa de incidencia, es necesario conocer el nmero de personas-tiempo a
riesgo tanto para expuestos como para no expuestos. Si consideramos e el total de personas
ENS Octubre 2009
122
tiempo aportado por los individuos expuestos y ne el total de personas tiempo aportado por los
individuos no expuestos, el riesgo relativo de la enfermedad se calculara como (xe/e)/(xne/ne),
que puede ser escrito igualmente como (xe/xne)/( e/ne).
En un estudio de casos y controles basado en la misma poblacin, la seleccin adecuada
de los casos, de manera que sean representativos del total de casos ocurridos en ese tiempo,
permite determinar directamente el ratio xe/xen. Por otro lado, la razn e/ne se puede estimar
de manera no sesgada y sin necesidad de asunciones sobre la frecuencia de la enfermedad a
partir de la razn del nmero medio de individuos a riesgo expuestos versus no expuestos en
la poblacin de base. Tanto e como ne se pueden estimar como el producto del periodo de
observacin por el nmero medio de personas a riesgo. Dado que el periodo de observacin
es el mismo para expuestos que para no expuestos, la razn e/en es equivalente a la razn
entre el nmero medio de personas expuestas a riesgo y el nmero medio de personas no
expuestas a riesgo. De esta forma, en un estudio de casos y controles, la seleccin de un grupo
control que refleje adecuadamente el ratio entre el nmero medio de personas expuestas a
riesgo y el nmero medio de personas no expuestas a riesgo permitira que el odds de la
exposicin en los controles pudiera verse como una estimacin no sesgada de la razn de
personas-tiempo expuestas versus no expuestas, y el estudio de casos y controles como un
proceso de muestreo eficiente para estudiar el riesgo relativo de la enfermedad en la cohorte
subyacente.
4.2.
Estrategia para el anlisis de un estudio de casos y controles
El anlisis estadstico de un estudio de casos y controles se corresponde al anlisis de datos

binarios (dicotmicos): la variable dependiente (caso o control) se estudia en funcin de una
serie de variables independientes (exposiciones de inters, factores de confusin y modificadores
de efecto). De forma sistemtica, el anlisis de un estudio de casos y controles y la presentacin
de sus resultados puede desarrollarse segn el siguiente esquema:
Comparacin de las variables demgrficas, exposiciones y otras variables entre casos
y controles, utilizando procedimientos estadsticos simples (t de Student, 2).
Estudio de la asociacin entre la variable de exposicin principal y las otras variables
en el grupo control (que representa a la poblacin de la que proceden los casos),
utilizando tcnicas de regresin lineal, correlacin o tablas de contingencia). Este
anlisis permite identificar potenciales factores de confusin que debern ser tenidos
en cuenta en anlisis posteriores.
Anlisis estratificado de la asociacin entre el desarrollo de la enfermedad y la variable
de exposicin principal (anlisis de tablas de contingencia).
Anlisis multivariante de la asociacin entre el desarrollo de la enfermedad y la variable
de exposicin principal (regresin logstica en estudios de casos y controles no
emparejedos y regresin logstica condicional en estudios de casos y controles
emparejados).
En resumen, los estudios de casos y controles permiten abordar prcticamente cualquier
investigacin abordable por un estudio de cohortes (salvo aquellas situaciones en las que la
enfermedad en estudio puede influenciar la exposicin evaluada. No obstante, los estudios de
casos y controles requieren un cuidadoso diseo para evitar los sesgos de seleccin e informacin
a los que es ms propenso que los estudios de cohortes.
ENS Octubre 2009
123
5.
BIBLIOGRAFA
BRESLOW NE, DAY NE. Statistical methods in cancer research. Vol. 1. The analysis of case-control studies. Lyon:
International Agency for Research on Cancer, 1980.
CORREA A, STEWART WF, YEH H-C, SANTOS-BURGOA C. Exposure measurement in case-control studies:
reported methods and recommendations. Epidemiol Rev. 1994;16:18-32.
LASKY T, STOLLEY PD. Selection of cases and controls. Epidemiol Rev 1994;16:6-17.
MACMAHON B, TRICHOPOULOS D. Epidemiology. Principles & Methods. 2 ed. Boston: Little, Brown and
Company, 1996.
ROTHMAN KJ, GREENLAND S. Modern Epidemiology. 2 ed. Filadelfia: Lippincott-Raven; 1998.
SCHLESSELMAN JJ. Case-Control Studies. Design, Conduct, Analysis. Nueva York: Oxford University Press, 1982.
SZKLO M, NIETO FJ. Epidemiology. Beyond the basics. Gaithersburg: ASPEN, 2000
THOMPSON WD. Statistical analysis of case-control studies. Epidemiol Rev 1994;16:33-50.
ENS Octubre 2009
124
Estudios de Prevalencia
VIII. ESTUDIOS DE PREVALENCIA

Juan de Mata Donado Campos
1.
INTRODUCCIN
El estudio de las enfermedades en las poblaciones humanas se lleva a cabo de dos

maneras.
1. Describiendo la forma en que la enfermedad se distribuye en la comunidad. Para ello
intentamos responder a las siguientes preguntas:
Cundo aparece la enfermedad? Estudio del Tiempo

Por dnde se distribuye? Estudio del lugar
A quin afecta? Estudio de las personas.
2. Analizando las causas o los factores de riesgos que hacen que aparezca la enfermedad.
Es decir, intentamos responder a las preguntas
Por qu aparece la enfermedad en una determinada poca del ao o por qu

aparece durante todo el ao?
Por qu aparece en unas reas y no en otras?
Por qu afecta slo a unas determinadas edades o afecta a un determinado sexo?
La forma en que respondemos a estas preguntas es mediante la realizacin de estudios

epidemiolgicos.
1. La respuesta al cundo, al dnde y al quin la realizan los estudios descriptivos.
Si estudiamos a poblaciones utilizamos los estudios ecolgicos.
Si estudiamos a personas utilizamos los estudios de prevalencia o transversales.

2. La respuesta a los porqus la realizan los estudios analticos.
2.
Si podemos influir sobre las causas o los factores de riesgo (o de proteccin) de la

enfermedad utilizamos los estudios de intervencin comunitaria.
Si no podemos influir sobre estos factores utilizamos los estudios observacionales:
cohortes y de casos y controles. Bajo ciertas condiciones, que veremos a lo largo
de este captulo, tambin se incluyen a los estudios de prevalencia o
transversales.
CARACTERSTICAS DEL DISEO
Los estudios de prevalencia son un tipo de investigacin observacional descriptiva y

analtica, bajo ciertos supuestos que veremos, en el que en un nico momento temporal medimos
la frecuencia de la exposicin y del efecto (prevalencia). El tipo de diseo epidemiolgico que
se utiliza es el transversal, por lo que los trminos transversal y prevalencia se suelen utilizar
como sinnimos. Estos estudios son considerados por algunos autores, en los casos de
exposiciones que varan con el tiempo, como estudio de casos y controles en los que se asume
que el tiempo que media entre la exposicin y el inicio de la enfermedad es nulo.
ENS Octubre 2009
125
Las diferencias principales con los otros estudios observaciones son las siguientes.
1. Estudios de cohortes o de seguimiento
Existen dos poblaciones: expuestos y no expuestos

Existe un seguimiento: prospectivo o retrospectivo
Se miden incidencias y por tanto se pueden estimar riesgos. La medida del efecto
es el riesgo relativo.
2. Estudios de casos y controles
Existen dos poblaciones: casos y controles

No existe seguimiento, aunque se pueden estudiar casos incidentes.
No se pueden estimar riesgos. La medida del efecto es la odds ratio.
3. Estudios de prevalencia o transversales
Seleccionamos una muestra de una poblacin determinada. Las tcnicas de

muestreo mas utilizadas son el muestreo aleatorio simple o el muestreo por
conglomerados. Se pueden utilizar cualquier otro mtodo: listn telefnico u otras
listas, casos consecutivos, etc. En cualquier caso debemos controlar que el hecho
de presentar o no el fenmeno que queremos analizar no influya sobre la
probabilidad de ser seleccionado.
En la muestra seleccionada desconocemos quines estn expuestos o no o quines
que estn enfermos o sanos.
Sin realizar ningn seguimiento se interroga a los individuos sobre su estado de
exposicin y enfermedad y se clasifican en las distintas categoras: enfermosexpuestos, enfermos-no expuestos, sanos-expuestos, sanos-no expuestos.
Se estiman la frecuencia (prevalencia) de cada categora. Las medidas de los
efectos son dos: la razn de prevalencia (aproximacin al riesgo relativo de los
estudios de cohortes) o la odds ratio de prevalencia (aproximacin a la odds ratio
de los estudios de casos y controles)
Un ejemplo tpico de un estudio de prevalencia o transversal es la Encuesta Nacional de

Salud de Espaa. A continuacin resumimos la metodologa utilizada en la Encuesta realizada
en 2006.
La Encuesta Nacional de Salud de Espaa 2006/2007 (ENSE-06) fue una investigacin, de
carcter bienal, sobre la salud en su sentido ms amplio y sus factores determinantes desde la
perspectiva de los ciudadanos. La ENSE-06 tuvo como objetivo general proporcionar la
informacin necesaria sobre la salud de la poblacin para poder planificar y evaluar las
actuaciones en materia sanitaria. Los objetivos especficos fueron: 1. Proporcionar informacin
sobre la valoracin del estado de salud general, fsica y psquica, e identificar los principales
problemas que sienten los ciudadanos (enfermedades crnicas, dolencias, accidentes,
limitaciones para realizar las actividades de la vida diaria) 2. Conocer el grado de acceso y
utilizacin de los servicios de salud y sus caractersticas. 3. Conocer los factores determinantes
de la salud: caractersticas del medio ambiente (fsico y social) y hbitos de vida que suponen
riesgo para la salud. 4. Realizar el anlisis de la salud desde la perspectiva de gnero. 5. Conocer
las desigualdades en salud.
La ENSE-06 aport informacin esencial sobre trabajo reproductivo (slo para personas
adultas), estado de salud y enfermedades crnicas, accidentes, restriccin de la actividad,
consumo de medicamentos, salud mental, estrs laboral (slo para personas adultas), acceso y
ENS Octubre 2009
126
utilizacin de los servicios sanitarios, hbitos de vida, prcticas preventivas, agresiones,

discriminacin, caractersticas fsicas y sensoriales, limitaciones para realizar las actividades de
la vida diaria, apoyo afectivo y personal (slo para personas adultas), y funcin familiar (slo
para personas adultas). Tambin se investigaron las condiciones y entorno fsico de la
vivienda.
Adems, para las personas menores de 16 aos se obtuvo informacin sobre calidad de
vida relacionada con la salud, tipo de lactancia (menores de 5 aos) y tiempo dedicado a ver la
televisin, Internet y vdeo-juegos. Con objeto de poder analizar los determinantes sociales de
la salud, se obtuvo informacin sobre caractersticas sociodemogrficas de la persona
seleccionada, de su pareja (si convive con ella) y de la persona de referencia del hogar (persona
que ms aporta al presupuesto del hogar) La realizacin del estudio realiz en dos fases: 1. La
primera se identifica con el Cuestionario de Hogar. Se intent captar a todas las personas
residentes en el hogar, solicitando a todos sus miembros informacin sobre algunas variables
sociodemogrficas fundamentales. Se seleccion la persona adulta que debe contestar el
cuestionario de salud de adultos y si en el hogar reside alguna persona menor de 16 aos se
seleccion a de ellas para responder el cuestionario de salud de menores. Se solicit para la
persona adulta seleccionada y, en su caso, la persona menor seleccionada informacin sobre
variables sociodemogrficas adicionales y a su pareja (si convive con ella) y a la persona de
referencia del hogar (si no coincide con alguna de las anteriores) otros datos tambin de carcter
sociodemogrfico. Por ltimo se pregunt por caractersticas de la vivienda y del hogar.
2. La segunda fase se identific por Cuestionario de Adultos (personas de 16 y ms aos)
y el Cuestionario de Menores (personas de 0 a 15 aos) En esta fase se recogi informacin de
una nica persona de 16 y ms aos, seleccionada aleatoriamente dentro del hogar, a travs del
Cuestionario de Adultos y de una nica persona menor (personas de 0 a 15 aos) de cada hogar
si las hubiere, seleccionada aleatoriamente dentro del hogar a travs del Cuestionario de
Menores. La investigacin se diriga al conjunto de personas que resida en viviendas familiares
principales. Cuando una misma vivienda estaba constituida por dos o ms hogares, el estudio se
extiende a todos ellos, pero de manera independiente para cada hogar. La Encuesta se realiz en
todo el territorio nacional. El perodo de recogida de la informacin se extendi a lo largo de un
ao, desde junio de 2006 hasta junio de 2007.
El tipo de muestreo utilizado es un muestreo polietpico estratificado. El mtodo de
recogida de informacin fue el de entrevista personal la cul poda ser complementada, en casos
excepcionales, mediante entrevista telefnica. En cada vivienda se realizaron las visitas
necesarias para obtener la informacin requerida. El trabajo de campo fue organizado a travs
de las 52 Delegaciones Provinciales del INE. Respecto al informante del cuestionario de adultos
no se permiti informacin proxy salvo que la persona seleccionada no pudiese contestar por
problemas de enfermedad, discapacidad o por estar internada en un centro sanitario y no vaya
a regresar al hogar durante el tiempo que dure el trabajo de la seccin.
Otro ejemplo de estudio de prevalencia es el proyecto EPINE. Este proyecto consiste en
desarrollar una vez al ao una encuesta transversal en los hospitales de enfermos agudos con
objeto de determinar la prevalencia de infeccin nosocomial.
3.
VENTAJAS
1. Como en un estudio de cohorte, podemos calcular la probabilidad de que una persona
expuesta a un determinado factor de riesgo presente la enfermedad en un determinado
momento.
ENS Octubre 2009
127
2. Como en un estudio de casos y controles, podemos estimar la probabilidad de que una

persona que est enferma tenga, o haya tenido, la exposicin de nuestro inters.
3. Como en un estudio de cohortes, podemos estudiar varias enfermedades.
4. Se pueden realizar en un corto perodo de tiempo. Lo que implica un ahorro de tiempo
y dinero. Dependiendo del tipo de muestreo realizado, se puede conseguir un buen
control de la seleccin de los sujetos de estudio.
5. Suelen estudiar muestras representativas de la poblacin. Esto favorece la extrapolacin
de los resultados a la poblacin general como hemos visto en la Encuesta Nacional de
Salud de Espaa.
6. Son el primer paso en el diseo de un estudio de cohortes.
7. Proporcionan estimadores de prevalencia.
4.
LIMITACIONES
1. Al estudiar slo casos prevalentes, no tenemos seguridad de que sean representativos
de la poblacin general. Ya que los factores de riesgo asociados a los casos prevalentes
pueden ser distintos a los asociados a los casos incidentes.
2. Podemos cometer un sesgo si utilizamos muestras procedentes de poblaciones no
representativas de todos los casos. Por ejemplo, si deseamos estudiar la prevalencia de
hepatitis B y seleccionamos una muestra de la poblacin general y no incluimos a los
usuarios de drogas ilegales podemos obtener una infraestimacin de la prevalencia de
dicha enfermedad.
3. Son ineficientes para estudiar enfermedades poco frecuentes, agudas o letales ya que la
probabilidad de encontrar un caso en un momento dado (prevalencia) es muy baja.
4. Como lo que estudiamos es lo que ocurre en una determinada poblacin en un momento
determinado no podemos determinar si la exposicin precede o es una consecuencia de
la enfermedad.
5. Como no sabemos cuantas personas han pasado la enfermedad, no podemos distinguir
entre factores de riesgo (causas) y factores pronstico, factores relacionados con la
probabilidad de que la enfermedad se haga crnica y pueda ser detectada. No proporciona
estimadores de incidencia o de riesgo relativo.
6. Posible sesgo de supervivencia: los casos observados pueden tener una mayor
supervivencia.
5.
ANLISIS
Antes de empezar con el anlisis hay que hacer notar que como en todo estudio
observacional y analtico hay que prestar atencin en los siguientes aspectos:
1. El clculo del tamao de la muestra
2. El anlisis de las interacciones o de los factores modificadores del efecto
3. El control de los factores de confusin.
Sin embargo, al ser estos aspectos comunes a los estudios de cohortes y de casos y testigos,
y para no repetir lo mismo expuestos ya en otros captulos de este libro, no sern estudiados en
este apartado.
ENS Octubre 2009
128
5.1.
Estimaciones puntuales.
Enfermo
Sano
Expuesto
N1
No Expuesto
N0
M1
M0
Como hemos comentado los estudios de prevalencia tienen caractersticas comunes con
los estudios de cohortes y de casos y testigos, por lo tanto podemos analizarlos utilizando
ambos mtodos.
a) Aproximacin de un estudio transversal a un estudio de cohortes de incidencias
acumuladas
Razn de proporciones (RP)
P1
P0
RP
a
c
N1
N0
P1: Prevalencia en expuestos

P0: Prevalencia en no expuestos
Varianza(ln RP)
1 1 1
1

a c N1 N 0
Cundo podemos utilizar esta aproximacin?

1. Cuando la enfermedad no influye en el hecho de estar en el estudio.
2. Cuando la enfermedad no influye en el hecho de estar expuesto.
b) Aproximacin de un estudio transversal a un estudio de casos y controles
Poblacin estable en estado de equilibrio.
OR
Prevalencia de exposicin en enfermos
ad
cb
a
ac
b
bd
1 1 1 1
Varianza(ln OR)

a b c d
Prevalencia de exposicin en sanos
ENS Octubre 2009
129
c) Relacin entre RP y OR:

OR
RP
1 Px
1 Px
Px- = Prevalencia de la enfermedad en el grupo no expuesto; c /N0

Px+ = Prevalencia de la enfermedad en el grupo de expuesto; a / N1
Si la prevalencia de la enfermedad es baja (menor del 20%), 1-Px- y 1-Px+ valdrn
prcticamente 1, y OR ser muy similar a RP. Por tanto, para enfermedades poco frecuentes OR
ser prcticamente igual a RP.
5.2.
Estimacin por intervalos.
Se pueden utilizar cualquiera de los mtodos utilizados en los anlisis de cohortes o de casos y
testigos. Ponemos como ejemplo, el mtodo de las series de Taylor. Este mtodo es idntico para los
estudios de casos y controles, slo se debe sustituir RR por la OR
IC95%
5.3.
RR exp r 1,96 varianza RR
Medidas de impacto
Son las mismas que se utilizan en los estudios analticos. As, cuando el RR o la OR es
mayor de 1 tenemos: la Proporcin Atribuible en Expuestos (PAE) y la Proporcin Atribuible
en la Poblacin (PAP).
PAE
RR 1
RR
PAP
a RR 1
M 1 RR
Casos atribuidos a la exposicin = PAE x a = PAP x M1

Si la OR o el RR es menor de 1 tenemos: Proporcin Prevenida por la Exposicin (PPE) y
la Proporcin Prevenida en la Poblacin (PPP).
PPE 1 RR
PPP
N1
1 RR
N
Casos evitados por la exposicin = PPE x a / (1-PPE)

Se pueden calcular los intervalos de confianza de estas medidas a partir de los obtenidos
con la OR y el RR.
5.4.
Prueba de significacin estadstica. Igual con la OR

H0 : RR = 1
H1: RR 1
ENS Octubre 2009
130
Tenemos que la raz cuadrada de la ji-cuadrado de Mantel-Haenszel es igual a
M 1 N1
N
M 1 M 0 N1 N 0
N 2 ( N 1)
a
ad bc
M 1 M 0 N1 N 0
N 1
Si N-1 es sustituido por N, tenemos la 2 de Pearson. La raz cuadrada de la 2 de M-H se

distribuye segn N(0 , 1) o de una t, dependiendo del tamao de la muestra, el valor de P se
busca en una tabla de la normal; el valor de la P de la 2 se busca en la tabla de la 2 con un
grado de libertad.
6.
APLICACIONES
1. Cuando se desea estimar la prevalencia de una enfermedad para:
Distribuir recursos.
Saber qu probabilidad hay de que un paciente tenga una determinada
enfermedad.
2. Para sugerir hiptesis etiolgicas entre exposicin y enfermedad que puedan ser
confirmadas o rechazadas en estudios de cohortes o de casos o testigos
3. Para estimar la distribucin de los valores de diferentes variables en diversos grupos de

la poblacin. Por ejemplo, la informacin obtenida en la Encuesta Nacional de Salud de
Espaa.
4. En enfermedades de larga duracin e inicio lento es difcil saber cundo empieza. Por
ejemplo, bronquitis, enfermedades mentales, etc. En estos casos el diseo ms til es el de
prevalencia
5. Cuando no se pueden realizar estudios de incidencia. Por ejemplo, el estudio de las
malformaciones congnitas. Estos estudios son de prevalencia, sobre todo si se estudian al
nacimiento, ya que slo vemos aquellas malformaciones que sobreviven al embarazo. Para que
fuera un estudio de incidencia adems de estudiar stas deberamos estudias aquellas que son
causas de un aborto teraputico y las que provocan un aborto espontneo.
6. Como primera etapa de un estudio de cohortes, ya que nuestro objetivo en este caso es
seleccionar a personas sanas.
7. Estudios de Seroprevalencia. Si la prevalencia de un marcador serolgico se estima en
momentos diferentes, se obtiene una medida de los cambios temporales del estado del mismo.
Estos estudios sirven para estudiar los niveles de proteccin y la cobertura de las vacunas.
7.
COMUNICACIN DE LOS RESULTADOS DE LOS ESTUDIOS TRANSVERSALES.

LA DECLARACIN STROBE (Strengthening the Reporting of Observational studies
in Epidemiology)
La Declaracin STROBE est constituida por una lista de puntos a tener en cuenta en la
comunicacin de los estudios realizados con los 3 diseos ms importantes de la epidemiologa
analtica observacional: los estudios de cohortes, los estudios de casos y controles y los estudios
ENS Octubre 2009
131
transversales. La nica intencin de esta declaracin es ofrecer una gua sobre la forma adecuada
de comunicar los estudios de investigacin observacionales: estas recomendaciones no
representan una receta para el diseo o la realizacin de los estudios. La Declaracin STROBE
fue desarrollada para ayudar a los autores a redactar sus estudios observacionales analticos,
para ayudar a los editores y los revisores que consideran la posible publicacin de estos artculos,
y para ayudar a los lectores que evalan de forma crtica los artculos publicados. A continuacin
aparece la lista referida las estudios transversales. La lista est en ingls ya que a la fecha de
redaccin de este captulo (septiembre 2009) era la nica versin disponible.
ENS Octubre 2009
132
STROBE StatementChecklist of items that should be included in reports of cross-sectional studies
Title and abstract
Item
No
1
Introduction
Background/rationale
Objectives
Methods
Study design
Setting
Participants
Variables
Data sources/
measurement
8*
Bias
Study size
Quantitative variables
10
11
Statistical methods
12
Results
Participants
13*
Recommendation
(a) Indicate the studys design with a commonly used
term in the title or the abstract
(b) Provide in the abstract an informative and
balanced summary of what was done and what was
found
Explain the scientific background and rationale for the
investigation being reported
State specific objectives, including any prespecified
hypotheses
Present key elements of study design early in the
paper
Describe the setting, locations, and relevant dates,
including periods of recruitment, exposure, follow-up,
and data collection
(a) Give the eligibility criteria, and the sources and
methods of selection of participants
Clearly define all outcomes, exposures, predictors,
potential confounders, and effect modifiers. Give
diagnostic criteria, if applicable
For each variable of interest, give sources of data and
details of methods of assessment (measurement).
Describe comparability of assessment methods if
there is more than one group
Describe any efforts to address potential sources of
bias
Explain how the study size was arrived at
Explain how quantitative variables were handled in the
analyses. If applicable, describe which groupings were
chosen and why
(a) Describe all statistical methods, including those
used to control for confounding
(b) Describe any methods used to examine subgroups
and interactions
(c) Explain how missing data were addressed
(d) If applicable, describe analytical methods taking
account of sampling strategy
(e) Describe any sensitivity analyses
(a) Report numbers of individuals at each stage of
studyeg numbers potentially eligible, examined for
eligibility, confirmed eligible, included in the study,
completing follow-up, and analysed
(b) Give reasons for non-participation at each stage
(c) Consider use of a flow diagram
ENS Octubre 2009
133
Descriptive data
14*
Outcome data
15*
Main results
16
Other analyses
17
Discussion
Key results
18
Limitations
19
Interpretation
20
Generalisability
21
Other information
Funding
22
(a) Give characteristics of study participants (eg

demographic, clinical, social) and information on
exposures and potential confounders
(b) Indicate number of participants with missing data
for each variable of interest
Report numbers of outcome events or summary
measures
(a) Give unadjusted estimates and, if applicable,
confounder-adjusted estimates and their precision (eg,
95% confidence interval). Make clear which
confounders were adjusted for and why they were
included
(b) Report category boundaries when continuous
variables were categorized
(c) If relevant, consider translating estimates of relative
risk into absolute risk for a meaningful time period
Report other analyses doneeg analyses of
subgroups and interactions, and sensitivity analyses
Summarise key results with reference to study
objectives
Discuss limitations of the study, taking into account
sources of potential bias or imprecision. Discuss both
direction and magnitude of any potential bias
Give a cautious overall interpretation of results
considering objectives, limitations, multiplicity of
analyses, results from similar studies, and other
relevant evidence
Discuss the generalisability (external validity) of the
study results
Give the source of funding and the role of the funders
for the present study and, if applicable, for the original
study on which the present article is based
*Give information separately for exposed and unexposed groups.

Note: An Explanation and Elaboration article discusses each checklist item and gives methodological background and published
examples of transparent reporting. The STROBE checklist is best used in conjunction with this article (freely available on the Web sites
of PLoS Medicine at http://www.plosmedicine.org/, Annals of Internal Medicine at http://www.annals.org/, and Epidemiology at
http://www.epidem.com/). Information on the STROBE Initiative is available at www.strobe-statement.org.
ENS Octubre 2009
134
8.
BIBLIOGRAFA
ARGIMN PALLAS JM, JIMNEZ VILLA J. Mtodos de investigacin clnica y epidemiolgica. 2 edicin: Harcourt..
Madrid 2000.
KLEINBAUM DG, KUPPER LL, MORGESTERN H. Epidemiologic research: principles and quantitative methods.
Van Nostrand Reinhold Company. New York . 1982
Ministerio de Sanidad y Poltica Social. Encuesta Nacional de salud de Espaa. http://www.msps.es/estadEstudios/
estadisticas/encuestaNacional/ense.htm
NORELL S. Diseo de estudios epidemiolgicos: Madrid. Siglo XXI de Espaa editores. 1994.
ROCA ANTONIO J, MUOZ VILLEGAS A. Los estudios de prevalencia. En: Martnez Navarro F, Ant JM, Castellanos
PL, Gili M, Marset P, Navarro V. Salud Pblica: McGraw Hill Interamericana. Madrid 1998. Captulo 11 pp.179-198.
SCHIAFFINO A, RODRGUEZ M, PASARN MI, REGIDOR E, BORRELL C, FERNNDEZ E. Odds ratio o razn
de proporciones?. Su utilizacin en estudios transversales. Gac Sanit 2003; 17(1): 70-4
Declaracin STROBE (Strengthening the Reporting of Observational studies in Epidemiology) http://www.strobestatement.org/
VAQU J (EDITOR). Prevalencia de las infecciones nosocomiales en los hospitales espaoles. Proyecto EPINE. http://
w w w. s e m p s p h . c o m / s e m p s p h / i n d e x . p h p ? o p t i o n = c o m _ c o n t e n t & v i e w = a r t i c l e & i d = 2 6 7 : e p i n e 2009&catid=1:general&Itemid=10
ENS Octubre 2009
135
Los Estudios Ecolgicos
IX. LOS ESTUDIOS ECOLGICOS

Gonzalo Lpez-Abente
1.
INTRODUCCIN
En el captulo 3 se han revisado los diferentes tipos de estudios epidemiolgicos, que en su

mayor parte tienen sus races en los conceptos de la experimentacin cientfica. Cuando los
experimentos en epidemiologa (ensayos clnicos, ensayos de intervencin comunitaria, etc) no
son factibles, los epidemilogos disean estudios denominados observacionales (estudios de
cohortes, de casos y controles, transversales) que intentan simular lo que se habra obtenido si
se hubiese realizado un experimento. Existe un tipo de estudio en el que la unidad de observacin
son grupos de individuos, los estudios ecolgicos, que van a ser el objeto de este captulo.
Los estudios ecolgicos se diferencian de un estudio observacional convencional en que
los niveles de exposicin individual no se miden, o bien la informacin sobre la exposicin, si
se mide, no se vincula con la frecuencia de la enfermedad a nivel individual. La unidad tpica
de anlisis estadstico es un rea geogrfica, como puede ser una seccin censal, una provincia
o un pas. Para cada grupo o rea, es posible estimar la distribucin de exposiciones o al menos
el nivel promedio de exposicin, y podemos estimar la tasa de enfermedad general, pero
carecemos de la informacin conjunta de medidas de niveles de exposicin y estatus de
enfermedad a nivel de individuos. Por ello, es imposible obtener la tasa de incidencia en los
grupos expuestos y no expuestos a partir de datos ecolgicos, debiendo recurrir a estimaciones
indirectas. La estimacin indirecta de efectos en los estudios ecolgicos y temas claves como el
control de variables de confusin, contienen complicaciones metodolgicas que hacen de los
mismos un rea de la epidemiologa con una alta especializacin.
La necesidad de abordar este tipo de estudios surge de la dificultad de obtener datos de alta
calidad sobre exposiciones ambientales y las variables relacionadas con ellas. Por este motivo,
los estudios ecolgicos han sido y son utilizados frecuentemente en diversas reas de
investigacin. Hace aos los estudios ecolgicos se encuadraban bajo el epgrafe de simples
estudios descriptivos en los que el anlisis de las tasas de enfermedad se estratificaban por lugar
y tiempo para explorar diferentes hiptesis prestando escasa atencin a los mtodos estadsticos
de inferencia.
En la tabla 9-1 se muestra un ranking de los diferentes tipos de estudios ordenados segn
el grado de validez que se acepta en al mbito epidemiolgico, aunque segn el contenido del
estudio el orden podra ser diferente. En general los estudios ecolgicos son colocados en la
parte ms baja de la escala. Sin embargo, los diseos de los estudios ecolgicos puden incluir
componentes que los hagan ascender varios niveles y son los diseos ms utilizados para
orientar los proyectos en muchos mbitos.
ENS Octubre 2009
137
Tabla 9-1. Validez de los diferentes diseos para la inferencia etiolgica.
Validez
Tipos de diseos
La ms alta
Ensayo clnico aleatorizado

Estudio de cohortes prospectivo
Estudio de cohortes retrospectivo
Estudio caso-control anidado
Anlisis de series temporales
Estudios de seccin-transversa
Estudio ecolgico
Anlisis de agregaciones
Estudio de casos
La ms baja
Ancdota
Tomado de Knzli y Tager. Environ Health Perspect 1997; 105:1078-83
Los objetivos de este captulo son: 1) despertar el inters del lector en los estudios
ecolgicos, 2) revisar su metodologa insistiendo en su diseo y en la interpretacin de los
resultados y 3) proporcionar informacin sobre el camino que est tomando el desarrollo de los
nuevos mtodos en este rea.
Para ilustrar los contenidos tericos de este tema nos apoyaremos en los siguientes
ejemplos:
1. Instalaciones nucleares y cncer. Las instalaciones de produccin de energa nuclear y
las de obtencin de su combustible producen una contaminacin en su entorno que podra ser
origen de diversas patologas en la poblacin que vive en su proximidad. Inicialmente no se
dispone de buenas mediciones o estimaciones de los niveles de exposicin de estas poblaciones
derivados del funcionamiento de la instalacin. No obstante, se dispone de informacin
individual sobre las defunciones en los municipios de su entorno. En esta situacin se puede
utilizar la distancia del municipio a la instalacin como indicador de exposicin y obtener una
estimacin del riesgo relativo de muerte en funcin de la distancia.
2. Tipo de cultivos e incidencia de cncer de encfalo. La provincia de Navarra muestra
una mayor mortalidad e incidencia de cncer de encfalo que otras provincias espaolas. Se
sabe que los agricultores en Espaa (al igual que en otros paises) tienen mayor riesgo de morir
por cncer de encfalo que otras ocupaciones. Se cree que ello es debido a la exposicin a
diferentes sustancias qumicas (productos fitosanitarios). Podran estar los tipos de cultivo
presentes en Navarra asociados con la mayor incidencia de este tumor?.
2.
CONCEPTOS BSICOS DE LOS ESTUDIOS ECOLOGICOS
Se define como ecolgico, todo estudio en el que las unidades de anlisis son poblaciones
o grupos de personas ms que individuos (Last).Es habitual considerar que si la variable de
exposicin central en un estudio epidemiolgico, cualquiera que sea su diseo, est referida a
un grupo de individuos, el estudio se define como ecolgico. Sin embargo, hay quien define
ENS Octubre 2009
138
como estudio ecolgico en sentido estricto, slo aqul en el que tanto la variable resultado
(outcome) como la exposicin, son medidas agregadas.
2.1.
Mediciones ecolgicas.
El diseo y las posibilidades analticas de los estudios ecolgicos vienen determinadas por
la disponibilidad de informacin y/o por la dificultad de obtener datos a nivel individual.
Ejemplo: Se quiere determinar la influencia de la contaminacin atmosfrica en la mortalidad
por patologa respiratoria en diferentes distritos de una ciudad. Las defunciones y el lugar de
residencia se obtienen del registro de mortalidad (informacin individual) y los niveles de
contaminantes de las estaciones de vigilancia ambiental (informacin referida a un rea).
Lo que define a un estudio como ecolgico es que incluya observaciones sobre grupos,
lugares u organizaciones. El ejemplo anterior incluye variables sobre los individuos (edad,
sexo, etc) y variables (ecolgicas) sobre la exposicin referidas a un rea.
Las mediciones ecolgicas pueden clasificarse en 3 tipos:
1. Medidas agregadas. Se trata de resumir las observaciones sobre individuos en cada
grupo expresndolas como medias o proporciones. Por ejemplo la proporcin de
fumadores, de agricultores o de parados.
2. Mediciones ambientales. Son caractersticas generalmente del lugar en el que los
miembros del grupo viven o trabajan (ejemplo: niveles de contaminacin ambiental).
Cada medicin ambiental tiene su anlogo a nivel individual y la exposicin individual
puede variar dentro del grupo. A esta categora pertenecera las obtenidas de las matrices
de exposicin-ocupacin (ver captulo de epidemiologa ocupacional) o la variable
referida al tipo de cultivo en el ejemplo del cncer de encfalo en Navarra.
3. Mediciones globales. Son caractersticas de grupos, organizaciones o reas para las que
no existe una analoga con el nivel individual (al contrario que las mediciones
ambientales). (ejemplo: densidad de poblacin, tipo de sistema de salud, orientacin
del partido gobernante)
2.2.
Niveles de anlisis
La unidad de anlisis es el nivel comn al que se reducen todas las variables del estudio.
Por ejemplo, en el estudio comentado al principio sobre la incidencia de cncer de encfalo y
usos del suelo, la unidad de anlisis es el municipio. En los estudios que se analizan a nivel
individual se dispone de informacin de exposicin para cada sujeto, pero en epidemiologa
ambiental es habitual que algunas de las variables explicativas sean medidas ecolgicas.
En un anlisis ecolgico completo, todas las variables son medidas ecolgicas (exposicin
o exposiciones, enfermedad u otras variables incluidas), ya que la unidad de anlisis es el grupo.
Ello implica que desconocemos la distribucin conjunta de cualquier combinacin de variables
a nivel individual.
En un anlisis ecolgico parcial de tres o ms variables puede tenerse informacin de la
distribucin conjunta de alguna de las variables en cada grupo. Por ejemplo, en el estudio de
incidencia de cncer de encfalo se conocen la edad y el sexo de los casos (informacin
individual) pero la exposicin derivada de la residencia en un rea concreta (municipio) es
informacin ecolgica.
El anlisis multinivel es un tipo especial de modelizacin que combina el anlisis efectuado
a dos o ms niveles. Ejemplo: la modelizacin de la incidencia de cncer de encfalo incluyendo
el sexo y la edad como variables explicativas, adems de variables socio-demogrficas
ENS Octubre 2009
139
(proporcin de parados, analfabetos), variables de exposicin como el tipo de cultivo y variables

de localizacin espacial de cada municipio.
2.3.
Niveles de Inferencia
Para distinguir entre inferencia biolgica y ecolgica usaremos un ejemplo: Hacemos un

estudio sobre la eficacia en la prevencin de accidentes mortales del uso de casco en motoristas.
Si el objetivo es estimar el efecto individual de utilizar el casco la inferencia causal es biolgica
(efectos en el riesgo individual). Si el objetivo es cuantificar la tasa de mortalidad entre los
motoristas en pases con y sin obligatoriedad de uso de casco, la inferencia es ecolgica (efectos
en las tasas del grupo). Ha de tenerse en cuenta que la magnitud del efecto ecolgico (efectos en
el riesgo, o tasa, del grupo) depende, no slo del efecto biolgico (efectos en el riesgo individual)
del uso del casco sino del grado de cumplimiento de la legislacin en cada pas. Adems, la
validez de la estimacin del efecto ecolgico depender de nuestra habilidad para controlar las
diferencias entre estados en la distribucin conjunta de variables de confusin, incluyendo
variables a nivel individual como la edad y magnitud del uso de motos. Por ltimo, el efecto
contextual valora la influencia sobre el riesgo individual de una exposicin ecolgica.
2.4.
Justificacin de los estudios ecolgicos
Existen numerosas razones que justifican la necesidad o conveniencia de llevar a cabo

estudios ecolgicos. A continuacin sealamos algunas de las ms destacadas:
1. Bajo coste. Utilizacin de diferentes fuentes de datos secundarias, que se enlazan para
hacer el estudio de forma agregada. Por ejemplo, los datos de mortalidad de los
municipios se juntan con los datos censales y de otras encuestas.
2. Limitaciones en las mediciones de los estudios individuales. En algunas situaciones y
sobre todo en epidemiologa ambiental, los estudios ecolgicos son los nicos posibles.
Ejemplo: El riesgo de cncer en el entorno de focos contaminantes. Es muy difcil
disponer de mediciones de exposicin individuales. Los indicadores ecolgicos de
exposicin, como por ejemplo la distancia, son los nicos utilizables en muchas
circunstancias.
3. Limitaciones en el diseo de los estudios individuales. Si una exposicin tiene una
escasa variabilidad en el rea de estudio, un estudio individual no tiene inters prctico.
Disear un estudio ecolgico comparando reas puede ser una solucin.
4. Inters de los efectos ecolgicos. Ejemplo: tratar de entender las diferencias en las
tasas de enfermedad entre dos poblaciones, supone apuntar hacia un objetivo de
inferencia ecolgica. Esta es la situacin habitual en la evaluacin del impacto de
procesos sociales o de polticas de intervencin (ej.: legislacin o programas de
prevencin).
5. Simplicidad de anlisis y presentacin de resultados. En la explotacin de grandes
encuestas peridicas (ej.: encuestas de salud) es habitual que, aunque los datos han sido
obtenidos con cuestionarios individuales, el anlisis y/o resultados se muestren de forma
agregada, con presentacin por aos, provincias o regiones como unidad de anlisis.
3.
DISEO DE ESTUDIOS ECOLGICOS
Los estudios ecolgicos pueden clasificarse por: 1) el mtodo de medicin de la exposicin

(exploratorios y analticos) y 2) el mtodo de agrupamiento utilizado (diseos multi-grupo,
tendencias temporales, diseos mixtos).
ENS Octubre 2009
140
3.1.
Diseos multi-grupo
Estudios exploratorios multi-grupo. Comparacin de tasas de enfermedad entre muchas

regiones en un mismo periodo. Dentro de esta categora se incluiran todos los estudios de
patrones espaciales que tratan de sugerir hiptesis centradas generalmente en etiologas
ambientales. Un ejemplo podra ser el Atlas de mortalidad por cncer en Espaa, 1976-1992
(http://www2.uca.es/hospital/atlas92/www/introdu.html). Este atlas muestra la distribucin
provincial de la mortalidad por diferentes tumores malignos y otras causas. Muchos tumores
malignos muestran un patrn geogrfico fcilmente identificable. Los tumores que comparten
factores de riesgo muestran una distribucin similar (cncer de pulmn, esfago, vejiga, laringe).
El cncer de estmago muestra un patrn nico y muy diferente del resto de localizaciones
tumorales. La existencia de patrones apunta hacia determinantes ambientales de la enfermedad.
Hay otras causas de muerte que muestran una escasa variabilidad geogrfica (no muestran un
patrn), como las leucemias o el cncer de mama en mujeres. Ello puede orientar hacia el menor
peso de factores de riesgo ambientales aunque en el caso del cncer de mama puede indicar una
distribucin amplia y homognea de ellos.
En los estudios geogrficos, la simple comparacin de tasas entre reas a menudo se ve
complicada por dos problemas estadsticos. El primero es que cuando se estudian enfermedades
poco frecuentes o las reas elegidas son muy pequeas, el nmero de casos es muy bajo, y los
datos muestran una gran variabilidad en la tasa estimada. De hecho las tasas ms extremas las
presentarn las reas con menos poblacin y con menos casos. El segundo problema es que las
reas ms prximas tienden a tener tasas ms parecidas que reas distantes, porque factores de
riesgo no medidos o no identificados tienden a agruparse en el espacio. Esto supone la presencia
de fenmenos de autocorrelacin. Afortunadamente ya se dispone de mtodos estadsticos que
aportan soluciones a ambos problemas, ajustando modelos espaciales autorregresivos a los
datos y utilizando tcnicas de suavizacin que permiten revelar los patrones presentes en los
mapas. En la Figura 9-1 podemos ver un ejemplo de esto ltimo. En el mapa de la izquierda se
representa la Razn de Incidencia Estandarizada de cncer de encfalo por municipios en
Navarra y Comunidad Autnoma Vasca. Dada la gran variabilidad aleatoria de los datos es muy
difcil apreciar algn patrn. El mapa del medio muestra los riesgos relativos municipales
estimados utilizando un modelo autorregresivo espacial y apunta a que las reas de mayor
riesgo se agrupan en el interior de Navarra.
Figura 9-1. Incidencia de cncer de encfalo por municipios en Navarra y Comunidad Autnoma Vasca, 1986-93.
Razones de Incidencia Estandarizada (izquierda, mapa sin suavizar), riesgos relativos estimados (centro, mapa suavizado),
y probabilidades posteriores de RR>1 (derecha). El nmero de municipios en cada categora entre parntesis)
Estudios analticos multi-grupo. Estudio de la asociacin entre un nivel de exposicin

medio y la prevalencia o la tasa de una enfermedad entre muchos grupos. Este tipo de estudios
supone una extensin del diseo anterior mediante la inclusin de variables explicativas en los
modelos. Es el diseo ms comn de estudio ecolgico. El ejemplo que hemos comentado al
principio del captulo sobre instalaciones nucleares y mortalidad por cncer contiene elementos
ENS Octubre 2009
141
analticos, al evaluar el efecto de la distancia a la instalacin nuclear en el riesgo de muerte por

cncer. En el ejemplo sobre la incidencia de cncer de encfalo en Navarra la inclusin de la
variable uso del suelo y la estimacin del riesgo relativo asociado a ella tambin es un elemento
que permite calificarlo como analtico.
3.2.
Diseos de tendencias temporales
Estudios exploratorios de tendencias temporales. Comparacin de tasas en el tiempo en

una poblacin definida geogrficamente. Los anlisis edad-periodo-cohorte, tan utilizados en
diferentes mbitos, constituyen un diseo de este tipo. Bsicamente consisten en estimar el peso
de los tres componentes en la tendencia temporal observada. Cada uno de los componentes
permite una interpretacin especfica y de utilidad en la formulacin de hiptesis.
La monografa sobre tendencias de la mortalidad en Espaa editada por el ISCIII, accesible
en http://cne.isciii.es/cancer/publi3.htm, representa un ejemplo ilustrativo de este tipo de diseo.
Estudios analticos de tendencias temporales. La inclusin de niveles de exposicin medios
u otras variables explicativas en un diseo de tendencias temporales lo convertiran en un
estudio analtico.
3.3.
Diseos mixtos
Morgenstern establece una tercera categora de diseo que incluye ambos componentes de
los dos anteriores, el espacial y el temporal. Los denomina diseos mixtos. En definitiva se trata
de estudios que combinan ambas informaciones y estos modelos tratan de mostrar si una
asociacin que se observa en un estudio multigrupo se mantiene en el tiempo, o viceversa, si un
patrn de tendencia temporal se mantiene entre diferentes grupos. A esta categora perteneceran
todos los estudios de tendencias temporales en los que se introduce un componente espacial o
los estudios de grupos mltiples en los que se explora la evolucin temporal de los patrones. La
inclusin de variables explicativas relacionadas con diferentes exposiciones convertiran el
diseo de exploratorio en analtico.
3.4. Estimacin del Efecto
En estudios con datos individuales los efectos se determinan comparando las tasas o el
riesgo de enfermar (o morir) entre grupos expuestos y no expuestos. En los estudios ecolgicos
multigrupo no se pueden estimar los efectos de cada exposicin directamente, ya que carecemos
de la informacin de la distribucin conjunta dentro de los grupos. La forma ms habitual de
anlisis es utilizar modelos de regresin lineal o modelos log-lineales. Estos modelos permiten
estimar el efecto para cada grupo y con un significado distinto dependiendo del tipo de modelo.
Los modelos lineales tienen la siguiente forma
Y = B0 + B1 X
Sea Y la tasa de enfermedad y X la exposicin en los grupos. La tasa predicha (Yx=1) en el
grupo expuesto es B0 + B1(1) = B0 + B1 y la tasa en el grupo no-expuesto (Yx=0) es B0 + B1(0) = B0.
La diferencia de tasas ser B0 + B1 B0 = B1 y la razn de tasas ser (B0 + B1)/B0 = 1 + B1/B0.
Los modelos log-lineales tienen la siguiente forma
ln[Y] = B0 + B1 X
en estos modelos la razn de tasas es exp[B1]. La ventaja de estos modelos es que la
variable dependiente no puede tomar valores negativos, mientras que en el modelo lineal si. Es
por ello que en la actualidad son los ms utilizados.
ENS Octubre 2009
142
3.5.
Variables de confusin y modificadoras del efecto
El tratamiento de las posibles variables de confusin en estos modelos es el habitual. Las

variables ecolgicas han de incluirse en el modelo como covariables para obtener una
estimacin ajustada del efecto en cuestin. Otra posibilidad de tratamiento de las variables de
confusin es la obtencin de tasas estandarizadas para esas variables. As, en el ejemplo de la
incidencia del cncer de encfalo lo que se modeliza es la RIE (Razn de Incidencia
Estandarizada). Ello supone que la variable edad ya se tiene en cuenta en el modelo mediante
el proceso de estandarizacin. Sin embargo, la reduccin del sesgo inducido por las variables
de confusin no ser completa si el resto de las variables predictoras no se ajustan tambin
por las mismas variables (Greenland 1992). En la prctica esto ltimo es muy difcil de hacer
ya que requiere conocer la distribucin conjunta de las covariables y la exposicin dentro de
los grupos, lo que suele ser inviable en los estudios ecolgicos.
4.
PROBLEMAS METODOLGICOS
La inferencia causal en estos estudios se encuentra seriamente limitada por problemas

metodolgicos que van a limitar especialmente la inferencia la biolgica.
4.1.
El sesgo ecolgico (falacia ecolgica)
El sesgo ecolgico es el error que se produce cuando la estimacin del efecto ecolgico
esperado no coincide con el verdadero valor del efecto biolgico a nivel individual. Hemos
comentado que en los estudio ecolgicos carecemos de informacin sobre la distribucin
conjunta de las variables. La falacia ecolgica consiste en atribuir a todos los miembros del
grupo las caractersticas que no poseen los individuos.
Un ejemplo muy utilizado para ilustrar este fenmeno es el del incremento de la tasa de
suicidio en funcin de la religin (Durkheim 1951). Ese estudio muestra que el riesgo relativo
es cercano a 8 en la regin predominantemente protestante comparado con la no protestante.
Sin embargo, desconocemos la religin de los que se han suicidado. Podra suceder que los que
se han suicidado en la regin con predominio protestante fuesen precisamente los catlicos.
Otro ejemplo nos muestra que a pesar de la gran correlacin existente entre la mortalidad por
cncer de mama y la ingesta per capita de grasa por pases, no est claro que las mujeres que
han fallecido por cncer de mama tengan una mayor ingesta de grasas a nivel individual.
El sesgo ecolgico surge a partir de tres fuentes cuando se utiliza un anlisis mediante
regresin lineal para estimar el efecto crudo:
1. Sesgo intra-grupo. El sesgo ecolgico puede ser originado por la presencia de sesgos
intra-grupo debido a confusin, seleccin o informacin, aunque los efectos intragrupo no se estimen. Ejemplo: si existe en cada grupo un efecto de confusin ser de
esperar que la estimacin ecolgica del efecto tambin est sesgada.
2. Confusin por grupo. Si la tasa de enfermedad basal en la poblacin no expuesta vara
en los grupos, especialmente si la correlacin ecolgica entre el nivel de exposicin
medio y la tasa basal es distinta de cero, se producir un sesgo ecolgico.
3. Modificacin del efecto por grupo (escala aditiva). Puede producirse un sesgo ecolgico si
la diferencia de tasas para el efecto de la exposicin a nivel individual vara en los grupos.
Para ver en la prctica las consecuencias del sesgo ecolgico es til comparar los resultados
de un anlisis con datos individuales y con datos agregados. En la tabla 9-2 se muestra uno de
estos ejemplos en el que existe un fuerte sesgo ecolgico debido a la heterogeneidad de la
ENS Octubre 2009
143
diferencia de tasas entre los grupos (modificacin del efecto por el grupo). Ntese que la tasa en
no expuestos es idntica en los tres grupos por lo que no hay efecto de confusin por grupo.
Tabla 9-2. Nmero de casos nuevos, personas-ao de seguimiento y tasa de enfermedad (Y por 100.000/aos) por
grupo y status de exposicin (x); distribucin para cada grupo y resultados del anlisis individual y ecolgico. Datos
hipotticos que muestran el sesgo ecolgico debido a la modificacin del efecto por grupo [Morgenstern 1998]
Exposicin
Grupo 1
Casos P-ao
Grupo 2
Tasa Casos
P-ao
Grupo 3
Tasa
Casos
P-ao
Tasa
Expuestos
20
7000
286
20
20000
200
20
13000
154
No-expuestos
13
13000
100
10
10000
100
7000
100
Total
33
20000
165
30
20000
150
27
20000
135
% expuestos
35
50
65
Diferencia de tasas (x10 )
186
100
54
Razn de tasas
2,9
2,0
1,5
Anlisis individual
Anlisis ecolgico: modelo lineal
Razon tasas cruda = 2,0
Y = 200 -100X
Razon tasas ajustada= 2,0
Razn de tasas = 0,50
En la siguiente tabla se muestra un ejemplo sinttico de inexistencia de sesgo ecolgico. Al

ser la diferencia de tasas uniforme entre grupos (aunque la razn de tasas vara) y no existir
correlacin entre el porcentaje de expuestos y la tasa en no expuestos, no se produce el sesgo
ecolgico coincidiendo la estimacin de efecto individual y ecolgica.
Tabla 9-3. Nmero de casos nuevos, personas-ao de seguimiento y tasa de enfermedad (Y por 100.000/aos) por
grupo y status de exposicin (x); distribucin para cada grupo y resultados del anlisis individual y ecolgico. Datos
hipotticos que muestran la inexistencia de sesgo ecolgico [Morgenstern 1998]
Exposicin
Grupo 1
Casos P-ao
Grupo 2
Tasa Casos
P-ao
Grupo 3
Tasa
Casos
P-ao
Tasa
Expuestos
16
8000
200
30
10000
300
24
12000
200
No-expuestos
12
12000
100
20
10000
200
8000
100
Total
28
20000
140
50
20000
250
32
20000
160
% expuestos
40
50
60
Diferencia de tasas (x105)
100
100
100
Razn de tasas
2,0
1,5
2,0
Anlisis individual
Anlisis ecolgico: modelo lineal
Razon tasas cruda = 1,8
Y = 133 + 100X
Razon tasas ajustada= 1,8
Razn de tasas = 1,8
ENS Octubre 2009
144
Desafortunadamente es imposible comprobar la validez de la estimacin efectuada en un

estudio ecolgico porque las condiciones de validez se definen en trminos de asociacin a
nivel individual. Esta es una seria limitacin de los estudios ecolgicos para hacer inferencia
biolgica. Adems, al ajustar un modelo de regresin ecolgico no hay ningn parmetro que
nos indique la presencia, direccin y magnitud del sesgo. Un modelo puede ofrecer un excelente
ajuste a los datos y estar sesgado y otro puede tener peor ajuste y no estarlo. Si se han hecho
anlisis en paralelo de datos individuales y ecolgicos. Estos estudios muestran que la inclusin
de componentes espaciales en los modelos acercan ambas estimaciones lo que da pie al siguiente
apartado.
Efecto de confusin debido a la localizacin (Bernardinelli & Clayton 1992). Un amplio
sector de los estudios ecolgicos se centra en las comparaciones mltiples de reas geogrficas.
Si el patrn de variacin de una covariable es similar a la del riesgo de enfermar, la localizacin
(geogrfica) pude actuar como una variable de confusin. En la figura 9-2 podemos mostrar
este fenmeno. En el mapa el signo (+) indica un rea con alta exposicin y (-) indica baja
exposicin. En el mapa hay una clara tendencia a una mayor frecuencia de exposicin en el
sur. Si existiese un gradiente norte-sur en el riesgo de enfermar, podra existir un efecto de
confusin por localizacin, o de forma ms precisa, por alguna influencia no medida responsable
de la variacin geogrfica de la enfermedad. Este efecto de confusin podra ser minimizado
estratificando el mapa en regiones en las que haya menor variacin geogrfica tanto en la
exposicin como en las tasas. El efecto (ajustado) se estima por comparaciones locales de
areas expuestas y no expuestas dentro de cada region (exactamente igual que en un anlisis
estratificado). Sin embargo, aunque este anlisis tiene la virtud de la simplicidad, en la prctica
puede ser difcil de hacer. El marco de los modelos multinivel que comentaremos ms adelante
ofrece una solucin tcnica a este problema, mediante la inclusin de trminos espaciales en
los modelos. La inclusin de los trminos espaciales (variable indicadora de cada rea y de sus
reas vecinas) entre otras virtudes provoca la eliminacin del efecto de confusin debido a la
localizacin.
Figura 9-2. Efecto de confusin por localizacin
+
- - + - + --- - - - -- - + - + -+
+- - - - +
- - +- + +
+
+ + - - +
-- - + - +- +
- + + - ++
+
+ + ++
+- + - +
+- - - +
+
+
-
4.2.
El control de variables de confusin
Las condiciones para que una covariable sea un factor de confusin son diferentes en los
estudios individuales y los ecolgicos. Mientras que a nivel individual un factor de riesgo debe
ENS Octubre 2009
145
estar asociado con la exposicin para ser una variable de confusin, en un estudio ecolgico
multigrupo un factor de riesgo, puede producir confusin aunque no est asociado con la
exposicin en cada grupo, especialmente si el factor de riesgo est asociado ecolgicamente
con la exposicin a travs de los grupos. A la inversa, un factor de riesgo que es un factor de
confusin dentro de los grupos puede no producir sesgo ecolgico si no est asociado
ecolgicamente con la exposicin a travs de los grupos.
El control de los factores de confusin es ms problemtico en los estudios ecolgicos que
en los individuales. Morgenstern (1998) proporciona las condiciones suficientes para que no se
produzca sesgo ecolgico en un estudio de comparaciones mltiples. Sin embargo, disponiendo
nicamente de los datos ecolgicos es imposible comprobar si se cumplen esas condiciones,
siendo impredecibles la naturaleza y magnitud del sesgo al hacer inferencias biolgicas a partir
de anlisis ecolgicos. Ante tantas dificultades Morgenstern proporciona un consejo general
para el necesario control de las variables de confusin. La mejor aproximacin para reducir el
sesgo ecolgico es incluir variables para categoras de su distribucin conjunta dentro de los
grupos. Por ejemplo, para controlar ecolgicamente por raza y sexo, lo convencional sera
controlar por las proporciones de hombres (o mujeres) y blancos (o no-blancos), pero tambin
podra controlarse por la proporcin de mujeres blancas, hombres no-blancos y mujeres
no-blancas (utilizando como referencia a los hombres blancos).
4.3.
Errores de clasificacin intra-grupo
Los principios de los errores de clasificacin con los que los epidemilogos estamos
familiarizados y utilizamos en la interpretacin de los resultados de los estudios observacionales
no son aplicables a los estudios ecolgicos. En los estudios individuales con errores de
clasificacin no-diferencial sabemos que el sesgo induce a que la estimaciones se acerquen
hacia la no existencia de efecto (ver captulo 5). En los estudios ecolgicos multi-grupo, esto no
es as cuando la variable de exposicin es una medida agregada. En los errores de clasificacin
no-diferencial de una exposicin dicotmica afectando a diferentes grupos, la estimacin del
efecto puede alejarse de la hiptesis nula (Brenner 1992).
4.4. Estrategias para reducir el sesgo ecolgico
Las principales estrategias que podemos utilizar para prevenir o mitigar los efectos del
sesgo ecolgico se relacionan a continuacin:
1. Utilizar unidades geogrficas lo ms pequeas posibles (mejor provincias que estados,
mejor municipios que provincias). Esto hace las unidades de anlisis ms homogneas
respecto a la exposicin aunque no siempre es posible por la disponibilidad de los
datos.
2. Otro aspecto lgico en la reduccin del sesgo sera estudiar unidades mutuamente
comparables respecto a covariables, y si esto no es posible, ha de establecerse un
sistema de control de las variables de confusin en el anlisis.
3. Si existen algunas regiones con resultados poco usuales respecto al resultado, exposicin
o combinacin de covariables, ha de examinarse el efecto de excluir esas regiones del
anlisis (anlisis de influencia).
4. Inclusin de componentes espaciales en los modelos.
Greenland (1992) proporciona, adems de las bases tericas para comprender los diferentes
tipos de sesgos, una gua para minimizar estos sesgos utilizando diseos ms apropiados
ENS Octubre 2009
146
5.
MODELOS MULTINIVEL
En el ejemplo de la incidencia de cncer en Navarra disponemos de informacin individual

de los casos nuevos como es la edad, el sexo y el municipio de residencia. Imaginemos que
disponemos de informacin individual del resto de la poblacin respecto a estas mismas
variables. Ello nos permite construir modelos de regresin para representar la variacin del
riesgo por municipio de residencia. La forma de modelizar esto ms eficiente sera mediante
modelos de regresin de Poisson con datos agregados. A esta informacin podemos aadir
variables agregadas referidas a cada municipio como son la proporcin de analfabetos, de
parados y algn indicador de nivel socio-econmico. El hecho de residir en un municipio supone
la exposicin a diferentes componentes contextuales como sufrir una determinada gestin
municipal, respirar el mismo aire, beber la misma agua, tener unos hbitos de vida ms parecidos
o estar expuesto a factores ambientales especficos. Las existencia de factores contextuales
como los citados pueden abarcar a diferentes municipios ya que muchos de ellos estn muy
prximos. Hay exposiciones que son compartidas por municipios que estn prximos o
municipios vecinos. Los municipios vecinos presentan caractersticas ambientales que no son
independientes lo que implica la existencia de autocorrelacin.
En este ejemplo identificamos variables que pertenecen a diferentes jerarquas. El nivel
1 seran los datos individuales (edad y sexo), el nivel 2 seran los datos agregados referidos a
los municipios y un tercer nivel sera los datos contextuales y espaciales (ubicacin del municipio
y sus vecinos que constituyen un grupo). Reconocer que los distintos individuos pertenecen a
distintos grupos tiene consecuencias importantes a la hora de analizar los datos. La similitud de
los individuos (o de su entorno) pertenecientes a un grupo establece una estructura de correlacin
intracontextual que dificulta el cumplimiento de la hiptesis de independencia sobre la que
estn basados los modelos de regresin tradicionales. El esfuerzo hecho en los ltimos aos
para adaptar esta estructura jerrquica de los datos al marco de los modelos lineales generalizados
ha dado como resultado los llamados modelos multinivel o modelos jerrquicos (en la literatura
tambin se conocen como modelos mixtos o modelos GLMM Generalised Linear Mixed
Models). La calificacin de modelos mixtos implica la posibilidad de construir modelos que
incluyen trminos de efectos fijos y trminos de efectos aleatorios.
En el ejemplo que nos ocupa, los datos referidos a la informacin espacial (cada municipio
con sus vecinos), esto es, la informacin de grupo (clustering en la literatura anglosajona) ha
de ser introducida en el modelo como trmino de efectos aleatorios. Ello tiene considerables
ventajas. Una de ellas es que la inclusin de estos trminos de efectos aleatorios, cuando los datos
muestran una distribucin que no se corresponde exactamente con la distribucin de probabilidad
utilizada (sobredispersin), dan cuenta de los fenmenos de sobredispersin corrigiendo la
varianza de los parmetros. Otra es la ya comentada superacin de la hiptesis de independencia
de las observaciones. Otra es el control del efecto de confusin por localizacin que comentamos
en el apartado anterior por la inclusin del trmino espacial en el modelo. Y por ltimo hay que
comentar el filtro que supone a la gran variabilidad aleatoria de las observaciones cuando se
trabaja con reas pequeas, permitiendo obtener unas estimaciones suavizadas del efecto por
reas.
En este apartado hemos hecho una mera introduccin a la idoneidad de los modelos
multinivel, ya que la explicacin en profundidad de las tcnicas supera el contexto de este libro.
Actualmente la aplicacin de estos modelos est facilitado por la existencia de diferentes
programas de ordenador.
En resumen, los modelos multinivel ofrecen distintas ventajas sobre los modelos
tradicionales y el precio a pagar es una mayor complejidad tanto del marco terico como de los
ENS Octubre 2009
147
modelos propuestos para analizar los datos y por tanto de la comunicacin de los resultados. Sin
embargo, en los estudios ecolgicos, lo habitual es enfrentarse con estructuras jerrquicas, con
lo que la demanda de utilizacin de estos modelos est en aumento.
6.
NOTA
Para la redaccin de este captulo hemos seguido muy de cerca el texto de Hal Morgenstern
ya que consideramos que contiene un notable esfuerzo de sntesis y sistematizacin en la
explicacin de este tipo de estudios (Morgenstern 1998).
7.
BIBLIOGRAFA
BRENNER H, GREENLAND S, SAVITZ DA. The effects of nondifferential confounder misclassification in ecologic
studies. Epidemiology. 1992 Sep;3(5):456-9.
CLAYTON DG, BERNARDINELLI L, MONTOMOLI C. Spatial correlation in ecological analysis. Int J Epidemiol.
1993 Dec;22(6):1193-202.
GOLDSTEIN, H., RASBASH, J., PLEWIS, I., DRAPER, D., ET AL. (1998). A users guide to MLwiN. London, Institute
of Education.
GREENLAND S. Divergent biases in ecologic and individual-level studies. Stat Med. 1992 Jun 30;11(9):1209-23.
GREENLAND S, MORGENSTERN H. Ecological bias, confounding, and effect modification. Int J Epidemiol. 1989
Mar;18(1):269-74. Review. Erratum in: Int J Epidemiol 1991 Sep;20(3):824.
KENNETH J. ROTHMAN. Methodologic Frontiers in Environmental Epidemiology. Environmental Health Perspectives
Volume 101, Supplement 4, December 1993
KNZLI N, TAGER IB. The semi-individual study in air pollution epidemiology: a valid design as compared to ecologic
studies. Environ Health Perspect. 1997 Oct;105(10):1078-83. Review.
LAGARDE F, PERSHAGEN G. Parallel analyses of individual and ecologic data on residential radon, cofactors, and
lung cancer in Sweden. Am J Epidemiol 149, 268-274, 1999.
LPEZ-ABENTE G, ARAGONS N, POLLN M. Solid-tumor mortality in the vicinity of uranium cycle facilities and
nuclear power plants in Spain. Environ Health Perspect. 2001 Jul;109(7):721-9.
LPEZ-ABENTE G, POLLN M, ARDANAZ E, ERREZOLA M.Geographical pattern of brain cancer incidence in
the Navarre and Basque Country regions of Spain. Occup Environ Med. 2003 Jul;60(7):504-508.
MORGENSTERN H. Ecologic studies in modern epidemiology. In: Modern Epidemiology (Rothman K, Greenland S,
eds). 2nd ed. Lippincott Raven Publishers, 1998;459-480.
PINHEIRO JC AND BATES DM. Mixed-Effects Models in S and S-PLUS. Statistics and Computing Series, SpringerVerlag, New York, NY, 2000.
PRENTICE RL, KAKAR F, HURSTING S, SHEPPARD L, KLEIN R, KUSHI LH. Aspects of the rationale for the
Womens Health Trial. J Natl Cancer Inst. 1988 Aug 3;80(11):802-14.
RICHARDSON S, STUCKER I, HEMON D. Comparison of relative risks obtained in ecological and individual studies:
some methodological considerations. Int J Epidemiol 16, 111-120, 1987.
SNCHEZ-CANTALEJO E, OCAA-RIOLA R. Los modelos multinivel o la importancia de la jerarqua. Gaceta
Sanitaria 13(5):391-398, 1999.
SPIEGELHALTER D, THOMAS D, BEST N, ET AL. BUGS: Bayesian inference using Gibbs sampling. Version 0.50.
Cambridge, MRC. Biostatistics Unit. 1996.
ENS Octubre 2009
148
Estudios Experimentales
X.
ESTUDIOS EXPERIMENTALES
Miguel ngel Royo Bordonada
Jos Mara Martn Moreno
La Real Academia de la Lengua Espaola establece que un experimento consiste en hacer

operaciones destinadas a descubrir, comprobar o demostrar determinados fenmenos o principios
cientficos. Para la mayora de los cientficos, esta definicin abarca cualquier conjunto de
observaciones, realizadas bajo condiciones controladas, que permitan contrastar una hiptesis
cientfica previamente planteada. Por ejemplo, Otto Von Guericke (1602-1686) propuso la
teora del giro de los cometas alrededor del sol en una rbita elptica excntrica y un ao despus
de su muerte, Newton estableci la Ley de Gravitacin Universal. En 1682, Halley descubri el
cometa que lleva su nombre y se propuso comprobar la hiptesis de Otto. A partir de las leyes
de Newton calcul que el Halley recorra su rbita en 76 aos, por lo que afirm que era el
mismo cometa que se haba visto en ocasiones anteriores (cada 75-76 aos antes) y postul que
se volvera a ver en 1758. Lamentablemente, Halley no vivira lo suficente como para poder
contrastar su hiptesis personalmente. No obstante, Joham Georg Palitzch, un terrateniente
alemn aficionado a la astronoma, estuvo observando el firmamento a la espera del cometa
durante 1758. Por fin, el 25 de diciembre de 1758 observ el cometa Halley en el firmamento,
confirmando la hiptesis cientfica planteada por Otto. Desde esta perspectiva, los diseos
vistos en los captulos precedentes (cohortes y casos-control) constituiran estudios
experimentales. Sin embargo, en epidemiologa el estudio experimental implica un aspecto
adicional: el investigador manipula las condiciones del estudio, con el objeto de averiguar el
efecto que tal manipulacin (intervencin) tiene sobre las observaciones realizadas. Por ejemplo,
un investigador se dispone a analizar el posible efecto cancergeno de las dioxinas y para ello
suministra altas concentraciones de estas sustancias a un grupo de ratones a travs de la
alimentacin.
Aunque el elemento central que define un estudio experimental sea la introduccin de una
intervencin que altera las condiciones del mismo y es asignada a los participantes por el
investigador, para que podamos hablar de un experimento vlido desde el punto de vista
cientfico, es preciso que adems se cumplan las siguientes condiciones:
1. La nica razn por la que los sujetos reciben la intervencin bajo estudio es el
cumplimiento del protocolo del estudio.
2. En el estudio existe una serie de sujetos, denominados grupo control, que no reciben la
intervencin cuyo efecto se desea analizar.
3. La asignacin de la intervencin a una serie de sujetos, grupo de intervencin, se lleva
a cabo por un mecanismo debido al azar.
Como explicaremos con ms detalle a lo largo de este captulo, estos requisitos representan
condiciones sine qua non para descartar que los efectos observados puedan deberse a factores
desconocidos o no controlados y, de esta forma, poder atribuir con seguridad esos resultados a
la intervencin bajo estudio. Para lograr este objetivo es necesario controlar todos los factores
que pueden afectar de forma relevante la condicin bajo estudio; es decir, necesitamos crear
unas condiciones tales que el nico factor que presente variacin entre los grupos de comparacin
sea la intervencin cuyo efecto pretendemos evaluar.
Por desgracia, en ciencias sociales y biomdicas el nmero de factores que afectan a la
mayora de las condiciones de inters es tan numeroso, complejo y en muchos casos oculto o
ENS Octubre 2009
149
desconocido, que es imposible hacerlo uniforme. Por ejemplo, en la investigacin de las causas
del cncer es imposible crear un conjunto de condiciones que conduzcan de forma invariable
al desarrollo de un cncer en un periodo fijado de tiempo, incluso an cuando la poblacin bajo
estudio sea un grupo de ratones clonados en el laboratorio. Inevitablemente, siempre va a
existir la denominada variacin biolgica, es decir, la variacin que se produce en el conjunto
de factores que contribuyen a que se desarrolle la condicin bajo estudio. Aunque consiguiramos
mantener las mismas condiciones de temperatura, humedad, hbitat e iluminacin, lo cual es
bastante poco probable, es imposible hacer que todos los animales coman exactamente la
misma cantidad o realicen ejercicio fsico con idntica frecuencia e intensidad, por no hablar
de diferencias individuales en el metabolismo basal. En resumidas cuentas, en la investigacin
epidemiolgica la idea de crear un duplicado exacto de un conjunto de circunstancias, en el
que slo vara un factor relevante, no es realista. No obstante, puede afirmarse que un
experimento es aceptable si la variacin de los factores extraos es demasiado pequea como
para afectar la condicin bajo estudio de forma importante en comparacin con el efecto de la
intervencin bajo estudio. En el ejemplo de las causas del cncer, si la alimentacin de los
ratones influye en el desarrollo del cncer, lo cual parece bastante verosmil, el control
inadecuado de la misma puede suponer un problema. Si la variacin en la alimentacin es muy
pequea, es mucho menos probable que pueda influir sobre los resultados del experimento de
forma importante.
Por tanto, cuando los estudios experimentales son factibles, su diseo est guiado por
principios que reducen la variacin de los factores extraos en comparacin con el factor de
inters. Sin embargo, como ya se ha mencionado en captulos precedentes, los estudios
experimentales no siempre son factibles, por razones de tipo tico o logstico. En estos casos,
los epidemilogos disean estudios analticos observacionales para simular lo que podra
haberse obtenido si se hubiese llevado a cabo un estudio experimental. Es decir, los principios
utilizados en el diseo de estudios observacionales son los mismos que en el caso de los
experimentales: reducir la variacin de los factores extraos en comparacin con el factor de
inters. Para ello se utilizan tanto tcnicas de diseo del estudio como de anlisis de los
datos.
1.
ESTUDIOS CUASI-EXPERIMENTALES
Para algunos, nicamente podemos hablar con propiedad de estudio experimental cuando
existe un grupo control que no recibe la intervencin bajo estudio y sirve como grupo de
referencia para establecer las comparaciones, siempre que la asignacin de los participantes en
el estudio a uno u otro grupo se haya llevado a cabo mediante un mecanismo debido al azar. Sin
embargo, existen muchas situaciones en las que nos encontramos con que el investigador
manipula las condiciones del estudio (introduce una intervencin) sin que se den las condiciones
previamente mencionadas (Tabla 10-1). El problema con este tipo de estudios es que carecen
del grado de validez interna que se precisa para atribuir el efecto observado a la intervencin
bajo estudio.
ENS Octubre 2009
150
Tabla 10-1. Clasificacin de los estudios experimentales.
x Estudios cuasi-experimentales
- Estudios no controlados
- Estudios con controles histricos
- Estudios controlados no aleatorizados
x Estudios controlados y aleatorizados
- Ensayos de prevencin primaria
x Ensayo de campo
x Ensayo de intervencin comunitaria
- Ensayo clnico
x De grupos paralelos
x Cruzado
x Factorial
1.1
Estudios no controlados
Un grupo control es un conjunto de personas que comparte con el grupo de sujetos tratados
todos los predictores de las variables resultado excepto el tratamiento a evaluar. Por tanto, su
papel consiste en controlar la accin de los otros predictores en el efecto de la intervencin que
se est ensayando. Es decir, el grupo control informa del valor de la variable resultado en
ausencia de intervencin.
Los estudios no controlados, tambin denominados estudios antes-despus, comparan los
resultados del efecto estudiado en el mismo grupo de individuos antes y despus de recibir la
intervencin. En este tipo de investigacin no existe ninguna garanta de que el efecto observado
sea debido a la intervencin bajo estudio, tambin puede ser un debido a un efecto placebo, a
un efecto perodo, a la propia historia natural de la enfermedad o a fenmenos puramente
estadsticos, como la regresin a la media. El efecto perodo se refiere a todos aquellos factores
que pudiendo tener alguna influencia sobre la condicin de inters (clima, hbitat, estilos de
vida, etc.), se hayan modificado a lo largo del perodo de estudio. A modo de ejemplo, supongamos
que se lleva a cabo un estudio en Madrid entre los meses de marzo y junio para comparar un
nuevo frmaco diurtico en la terapia antihipertensiva con el tratamiento diurtico estndar. La
mejora del clima durante el perodo de estudio se asocia con un incremento en la prctica de
ejercicio fsico, que a su vez tiene un efecto beneficioso sobre las cifras de la tensin arterial,
efecto que podra atribuirse de forma indebida al nuevo frmaco. El efecto placebo consiste en
que el slo hecho de administrar una intervencin produce un efecto sobre el individuo,
independientemente del principio activo que contenga la intervencin.
1.2.
Estudios con controles histricos
En este tipo de estudio, se compara un grupo de pacientes que estn recibiendo la

intervencin cuyo efecto se pretende determinar con pacientes que recibieron una intervencin
diferente en el pasado. En este caso, el problema es que no podemos garantizar la comparabilidad
entre los dos grupos, es decir, no podemos asegurar que los sujetos de ambos grupos son
similares en todo excepto en la intervencin estudiada. Con el paso del tiempo, nos podemos
encontrar con diferencias en los procedimientos de seleccin de los pacientes susceptibles de
ser intervenidos (edad, estado clnico o anatomo-patolgico, gravedad, patologas asociadas, ),
en los tratamientos auxiliares aplicados, en los criterios diagnsticos y de valoracin de la
ENS Octubre 2009
151
respuesta al tratamiento, etc. En estos casos, nada nos permite afirmar que el efecto observado
sea debido a la intervencin estudiada y no a cualquier otra caracterstica en la que difieren los
grupos comparados. En 1997 Chalmers y cols. realizaron una revisin de los ensayos publicados
sobre el efecto de la terapia anticoagulante en la mortalidad tras infarto de miocadio y
comprobaron que la reduccin media de la tasa de mortalidad fue del 54% en los ensayos con
controles histricos frente al 21% en los ensayos controlados y aleatorizados.
Lamentablemente, los estudios no controlados o con controles histricos tienden a exagerar
el valor de un nuevo tratamiento, creando un estado de confusin que provoca que los mdicos
sean reacios a poner en marcha un ensayo clnico randomizado una vez que estn (falsamente)
convencidos de la eficacia del nuevo tratamiento.
1.3.
Estudios controlados sin aleatorizar
En este tipo de estudios, la asignacin de los sujetos participantes a los grupos de

comparacin se realiza siguiendo un mecanismo no aleatorio, que puede ser sistemtico (en
funcin del orden de entrada en el estudio o de la fecha de nacimiento) o simplemente a criterio
del investigador. En ambos casos, el investigador conoce a priori la intervencin que recibir el
individuo, lo que puede afectar tanto su decisin de incluirlo en el estudio como la de asignarlo
a uno u otro grupo. La presencia de grupos de tamao muy desequilibrado nos debera hacer
sospechar de la existencia de intencionalidad a la hora de ubicar los sujetos en uno u otro grupo
y de un posible sesgo de asignacin asociado. En un estudio de prevencin secundaria tras
infarto de miocardio para evaluar la eficacia de una dieta determinada o de la prctica de
ejercicio fsico en la tasa de mortalidad, el investigador que confa en la bondad de esas
intervenciones tender (de forma consciente o inconsciente) a asignar los pacientes que considera
ms motivados y cumplidores y menos graves al grupo de intervencin. De forma similar, en
un ensayo teraputico para comparar el efecto de las versiones genrica y patentada de un
frmaco, el mdico encargado de asignar la intervencin podra tener la tentacin de dar a sus
pacientes ricos a la versin patentada y a los pobres a la versin genrica. En ambos casos, el
problema es que se han constituido dos grupos no comparables, ya que difieren no slo en la
intervencin estudiada sino en muchas otras caractersticas conocidas o no (nivel socioeconmico,
gravedad, hbitos de vida, predisposicin gentica, ) que podran influir sobre el efecto
investigado. Lo mismo puede ocurre si el investigador deja elegir al paciente entre las diferentes
alternativas en funcin de sus propias preferencias. Por tanto, si no existe asignacin aleatoria
resulta difcil atribuir los resultados del estudio a la intervencin, pudiendo deberse a diferencias
en otros factores (conocidos o no) introducidas por el investigador en el momento de asignar la
intervencin.
Como ya hemos mencionado previamente, en los estudios experimentales propiamente
dichos, tambin denominados ensayos, existe un grupo control y la intervencin bajo estudio se
asigna mediante un mecanismo debido al azar (aleatorio). Antes de pasar a analizar este tipo de
estudios, es preciso describir los fundamentos de este mecanismo aleatorio de asignacin,
comnmente denominado aleatorizacin, y la metodologa desarrollada para su correcta
aplicacin.
2.
ALEATORIZACIN
La aleatorizacin consiste en la asignacin de las unidades experimentales (sujetos

participantes) a dos o ms intervenciones utilizando un mecanismo aleatorio de forma que ni el
investigador ni el sujeto investigado conozcan la intervencin que va a ser asignada en el
momento de la inclusin de ste ltimo en el estudio, una vez obtenido su consentimiento
ENS Octubre 2009
152
informado para participar en el estudio. Aunque un estudio aleatorizado es necesariamente

controlado, el grupo control podr recibir una intervencin activa, que habitualmente ser la
utilizada en condiciones normales para la condicin bajo estudio, inactiva e inocua (placebo) o
simplemente no recibir intervencin alguna.
La aleatorizacin elimina el sesgo del investigador en la asignacin de los sujetos, garantiza
la validez de los niveles de significacin de las pruebas estadsticas que se aplicarn en el
anlisis de los datos y tiende a producir grupos comparables respecto de caractersticas conocidas
y desconocidas que pudieran afectar al desenlace de inters (factores pronsticos). Existen
mltiples formas en las que se pueden producir sesgos en la asignacin. A modo de ilustracin,
supongamos que un grupo de mdicos pone en marcha un ensayo para evaluar la eficacia de un
nuevo frmaco para la esclerosis mltiple, en comparacin con el tratamiento estndar
(interfern ). Si estos mdicos, que con probabilidad tendern a ser unos entusiastas de la
posible eficacia del nuevo tratamiento, participan en la asignacin de los pacientes, podran
influir en el proceso favoreciendo que sus propios pacientes o los pacientes de menor gravedad
fuesen asignados al nuevo tratamiento. Por otro lado, las pruebas de significacin estadstica
que se utilizan en los ensayos estn basadas precisamente en la asuncin de que el mtodo de
asignacin ha sido aleatorio. Finalmente, frente a otros mtodos de control de factores de
confusin utilizados en las fases de diseo (muestreo estratificado, emparejamiento) o anlisis
(ajuste de tasas, regresin mltiple), la aleatorizacin presenta la gran ventaja de que controla
tanto factores conocidos como desconocidos.
La eficacia de la aleatorizacin depende del tamao muestral del estudio. Cuando ste no
es lo suficientemente grande, a modo de orientacin estableceremos el punto de corte en 100
sujetos aunque esto tambin depende del nmero de grupos analizados, no se puede garantizar
el equilibrio en el tamao de los grupos ni la distribucin homognea de los factores de confusin.
Por ello, a la hora de presentar los resultados de un ensayo el primer paso debe consistir en
mostrar una tabla con la distribucin de los factores pronsticos conocidos en los grupos de
intervencin y control. Una distribucin homognea del nmero de sujetos y de los factores
conocidos en ambos grupos constituye una prueba de que la aleatorizacin ha sido eficaz y nos
indica que, con toda probabilidad, los grupos tambin sern comparables respecto de posibles
factores pronsticos que por ser desconocidos no se hayan podido medir, permitiendo atribuir
con seguridad el efecto observado a la intervencin bajo estudio.
Un buen mtodo de aleatorizacin debe de cumplir los siguientes requisitos para garantizar
la calidad del mismo y la eficacia del proceso:
1. La asignacin tiene que ser ciega, es decir, desconocida por el investigador hasta el
momento en que el sujeto da su autorizacin para participar en el estudio. Desde el
punto de vista operativo, es recomendable utilizar sobres opacos y sellados para evitar
un posible sesgo en caso de que se descubra antes de tiempo la intervencin a la que va
a ser asignado el prximo sujeto que entre a formar parte del estudio.
2. La secuencia de asignacin debe resultar impredecible, es decir, el investigador debera
ser incapaz de adivinar con antelacin la intervencin a la que va a ser asignado el
prximo sujeto. En ciertas ocasiones, adivinar la secuencia de aleatorizacin se
convierte en un reto para la investigador.
3. El proceso debe estar basado en propiedades matemticas conocidas y ser reproducible.
Los mtodos de aleatorizacin sistemticos (asignacin segn el orden de incorporacin
al estudio, la fecha de nacimiento, etc.) no son vlidos ya que, aunque son aleatorios,
tambin son predecibles y, adems, no estn basados en un modelo matemtico ni son
reproducibles.
ENS Octubre 2009
153
2.1.
Mtodos de aleatorizacin
Los mtodos de aleatorizacin se dividen en dos grandes grupos. Por un lado, los mtodos
de asignacin fija, en los que la probabilidad de ser asignado a uno u otro grupo no vara a lo
largo del el perodo de inclusin de pacientes en el ensayo. Por otro lado, los mtodos de
asignacin adaptativa, en los que esa probabilidad varia con el tiempo en funcin de la existencia
de desequilibrios en el nmero de sujetos o en la distribucin de los factores pronsticos en los
grupos comparados o de la respuesta producida ante la intervencin en los sujetos previamente
incluidos en el ensayo.
Dentro de los mtodos de asignacin fija, la aleatorizacin simple constituye el
procedimiento ms elemental, intuitivo y fcil de aplicar. Para ilustrar este mtodo nos
referiremos al ejemplo mencionado previamente sobre la investigacin de una nueva terapia
para la esclerosis mltiple. Un mtodo de aleatorizacin simple consistira en lanzar una moneda
al aire para cada nuevo paciente incluido en el ensayo y asignarle el nuevo tratamiento cuando
apareciese cara y el interfern cuando fuera cruz. El mismo mtodo puede llevarse a cabo de
forma menos rudimentaria con una tabla de nmeros aleatorios o, con mayor nivel de
sofisticacin, mediante la generacin de nmeros aleatorios por medio de un programa
informtico, tcnica muy conveniente cuando el tamao de la muestra es elevado, en estudios
multicntricos y cuanto mayor es el nmero de intervenciones a aplicar.
La ventaja de la aleatorizacin simple es su sencillez. La desventaja, que ya hemos sealado
previamente, es que si el nmero de sujetos del ensayo no es lo suficientemente grande, no se
puede garantizar el equilibrio en el tamao de los grupos ni la distribucin homognea de los
factores de confusin. El distinto tamao de los grupos puede afectar negativamente a las
pruebas de significacin estadstica. Para evitar este inconveniente puede utilizarse la
aleatorizacin por bloques, que consiste en definir bloques de sujetos de un tamao
predeterminado en los que por diseo se fuerza a que el nmero de sujetos asignados a cada una
de las intervenciones bajo estudio sea el mismo. Por ejemplo, si en el estudio de la esclerosis
mltiple hacemos bloques de 8 pacientes, en cada bloque habr necesariamente 4 pacientes
asignados al nuevo tratamiento y otros 4 al interfern . Supongamos que al lanzar la moneda
por primera vez obtenemos una cara: el primer sujeto de ese bloque es asignado al nuevo
tratamiento. Continuamos lanzando la moneda y por efectos del azar obtenemos 4 cruces
seguidas: los 4 siguientes pacientes del bloque son asignados al interfern. A partir de ese
momento ya no volveramos a lanzar la moneda, sino que asignaramos por decreto a los 3
pacientes restantes para completar ese bloque al nuevo tratamiento. El problema con este mtodo
es que el investigador podra adivinar con antelacin el tratamiento al que van a ser asignados
los 3 ltimos pacientes del bloque, lo que podra provocar un sesgo de asignacin si el
investigador evitase incluir en ese momento a los pacientes ms graves favoreciendo que los
pacientes menos graves fuesen asignados al nuevo tratamiento cuya eficacia se quiere demostrar.
Una forma de evitar este problema consiste en hacer bloques de distinto tamao cuyo orden
tambin se asigna de forma aleatoria.
El problema derivado del posible desequilibrio en los factores pronsticos puede ser
abordado a travs de tcnicas analticas de ajuste o mediante la aleatorizacin estratificada.
Para aplicar esta tcnica es preciso medir previamente los factores pronsticos por los que se
desea estratificar. El nmero de estratos es el producto del nmero de categoras de cada uno
de los factores considerados; por ejemplo, si las variables a considerar son sexo (hombremujer) y estado civil (soltero-casado-separado-viudo), el nmero total de estratos es igual a
ocho. Cuando un nuevo sujeto es incorporado al ensayo se le incluye en el estrato que le
corresponda en funcin del sexo y estado civil (ej.: hombre soltero) y dentro de cada estrato
se lleva a cabo un proceso de aleatorizacin independiente. La tcnica de aleatorizacin dentro
ENS Octubre 2009
154
de cada estrato puede ser simple o, ms comnmente, para evitar desequilibrios en el tamao
de los grupos de intervencin dentro de cada estrato, se realiza una aleatorizacin por
bloques.
3.
ENSAYOS DE PREVENCIN PRIMARIA
Los ensayos de prevencin primaria, como su propio nombre indica, tienen la finalidad de
evaluar la eficacia de intervenciones preventivas aplicadas en sujetos sanos. La complejidad
logstica de este tipo de ensayos es enorme, ya que al no padecer ninguna enfermedad los
sujetos no buscan atencin sanitaria y, en consecuencia, es preciso visitarlos a nivel de campo
(trabajo, escuela) o establecer centros desde los que llevar a cabo el estudio y a los que los
participantes puedan acudir. Por otro lado, el riesgo de que se produzca el efecto de inters es
muy bajo, por lo que requieren un tamao muestral muy elevado para conseguir que se
desenlace se desarrolle en un nmero de casos suficiente. Ambas caractersticas explican por s
solas el alto coste de este tipo de estudios, que se dividen en ensayos de campo y ensayos de
intervencin comunitaria.
3.1.
Ensayos de campo
Los ensayos de campo son estudios experimentales de prevencin primaria en los que la
intervencin se aplica a nivel individual; es decir, cada sujeto que entra en el ensayo es
randomizado de forma individual a una de las intervenciones estudiadas. Los elevados costes
de los ensayos de campo limitan su uso al estudio de factores preventivos de enfermedades bien
muy frecuentes, bien extremadamente graves. En general se centran en intervenciones dietticas
para prevenir deficiencias de algn nutriente (flor, yodo, calcio) o dirigidas a modificar los
estilos de vida (actividad fsica, tabaco, dieta, obesidad) relacionados con enfermedades crnicas
muy prevalentes (caries, bocio, osteoporosis, cardiovasculares).
El mayor experimento llevado a cabo hasta ahora en humanos fue un ensayo de campo
realizado en 1954, en el que se administr vacuna Salk o placebo a 800.000 escolares
estadounidenses. A pesar de la baja incidencia de la poliomielitis (1/2.000 anual), la gravedad
de la misma justific los esfuerzos y los recursos que fue necesario poner encima de la mesa
para realizar el ensayo. Los resultados fueron concluyentes: la incidencia de poliomielitis y de
enfermedad paraltica en el grupo de intervencin se redujeron un 50% y las 4 muertes por
poliomielitis se produjeron en el grupo control.
3.2.
Ensayos de intervencin comunitaria
El ensayo comunitario de intervencin es una extensin del ensayo de campo, con la

particularidad de que la intervencin se asigna a grupos de personas en lugar de hacerlo de
forma individual. El nivel de agregacin de los grupos depende de la factibilidad de exponer
todos sus miembros a la intervencin de forma simultnea, como la familia para intervenciones
dietticas, la escuela para programas educativos o la empresa para intervenciones de carcter
medioambiental. En otros casos, la pertenencia a un determinado grupo, como hospitales,
unidades del ejrcito o comunidades religiosas, puede favorecer un mayor nivel de cumplimiento
de la intervencin en estudio.
Este tipo de ensayos permitieron demostrar la eficacia del suministro de suplementos de
flor a travs de la red de agua de consumo en la prevencin de caries dental. En los aos 30,
diversos estudios ecolgicos en los Estados Unidos encontraron una asociacin inversa entre
la concentracin de flor en el agua de abastecimiento de la comunidad y el ndice CAOD en
nios de 12 a 14 aos. Una vez que se determin que 1 ppm. era la concentracin de flor
ENS Octubre 2009
155
ptima y segura, se realiz un ensayo comunitario (sin grupo control) en tres comunidades
en 1945, observndose una reduccin del 50-60% de la prevalencia de caries en las tres
comunidades. Estudios posteriores con grupo control confirmaron los resultados
observados.
La eficacia de la aleatorizacin en este tipo de ensayos depende del tamao del grupo de
aleatorizacin en relacin con el tamao total del estudio: cuanto menor sea esta fraccin ms
probable ser que la aleatorizacin de lugar a que los factores pronsticos se distribuyan de
forma similar en los grupos de intervencin. El mejor escenario posible se produce cuando hay
tantos grupos como individuos (ensayo de campo) y el peor cuando slo hay dos grupos, en
cuyo caso da lo mismo aleatorizar o no.
4.
ENSAYO CLINICO
Un ensayo clnico es un experimento planificado en el que, de forma prospectiva, se

comparan dos o ms intervenciones (o intervencin y placebo) preventivas, curativas o
rehabilitadoras, que son asignadas de forma individualizada y aleatoria a un grupo de pacientes
para determinar su eficacia. Adems, tanto la seleccin de los sujetos como los perodos de
tratamiento y seguimiento han de tener lugar simultneamente en todos los grupos. Dado que
los participantes en un ensayo clnico son, por definicin, sujetos enfermos (pacientes), las
intervenciones preventivas a las que nos referimos son secundarias, dirigidas a evitar las
secuelas de la enfermedad, incluyendo la muerte. Por ejemplo, una dieta rica en fibra para
prevenir la recurrencia de plipos adenomatosos de coln o una dieta rica en cido -linolnico
para reducir la tasa de mortalidad post-infarto de miocardio.
En 1935 Sir Austin Bradford Hill formul los principios de los ensayos clnicos
controlados y aleatorizados en medicina, principios que se mantienen totalmente vigentes
hoy en da. El primer ensayo clnico con un grupo control randomizado de forma apropiada
se llev a cabo en 1948 para evaluar la eficacia de la estreptomicina en el tratamiento de la
tuberculosis pulmonar. Desde entonces, los ensayos clnicos han proporcionado pruebas
empricas de la eficacia de muchas intervenciones mdicas, contribuyendo enormemente a la
mejora de la prescripcin y la utilizacin de medicamentos y otro tipo de intervenciones
mdicas.
Los ensayos clnicos evalan las intervenciones en condiciones muy diferentes a las de su
aplicacin habitual, ya que los pacientes estn sometidos a un estrecho seguimiento y vigilancia
mdica y no suelen ser representativos de todo el espectro de posibles sujetos que padecen la
enfermedad en cuestin. Por lo tanto, un ensayo est evaluando el efecto de la intervencin en
condiciones ideales (eficacia). Sin embargo, no puede evaluar como se comportar esa misma
intervencin en condiciones reales de uso (efectividad) ni su relacin coste-beneficio
(eficiencia), aspectos que se contemplan en el marco de la investigacin de resultados. Los
pacientes seleccionados para realizar un ensayo representan habitualmente al grupo ms
accesible al equipo investigador, con menos patologas asociadas y con mayores probabilidades
de cumplir con el protocolo del estudio. Adems, los pacientes que aceptan participar son en
general sujetos motivados y ms concienciados con su estado de salud, por lo que es probable
que el grado de adhesin a una terapia concreta o a una modificacin diettica sea mayor del
que observaramos en el resto de pacientes. Por otro lado, la estrecha vigilancia a la que estn
sometidos estos pacientes mientras dura el estudio hace que los incumplimientos o abandonos
del tratamiento sean menos probables que en condiciones habituales.
ENS Octubre 2009
156
Al principio de este apartado hemos sealando que un ensayo clnico nunca se debe
improvisar, sino que debe surgir siempre a partir de un proceso de planificacin que se plasme
en un protocolo escrito, que es el que determina las acciones a seguir. En la tabla 10-2 se sealan
los apartados que de forma general debera contemplar el protocolo de cualquier ensayo clnico.
Este listado representa una gua orientativa, que puede ser adaptada a cada ensayo particular en
funcin de las circunstancias del mismo. En el caso concreto de los ensayos clnicos con
medicamentos, la legislacin espaola ha establecido mediante Real Decreto el procedimiento
a seguir y los apartados que se deben incluir en el protocolo del mismo (RD 223/2004, de 6 de
febrero, por el que se regulan los ensayos clnicos con medicamentos). En las siguientes
secciones vamos a profundizar sobre algunos de los aspectos ms importantes de la planificacin
y desarrollo de un ensayo clnico.
Tabla 10-2.y Protocolo de un ensayo clnico
1. Antecedentes y estado actual del tema

2. Objetivos generales y especficos
3. Diseo del ensayo
4. Criterios de seleccin de los pacientes
5. Reclutamiento y aleatorizacin de los pacientes
6. Descripcin de la intervencin
7. Mtodos de evaluacin de la respuesta
8. Tamao de la muestra requerido
9. Monitorizacin del ensayo
10. Impresos de recogida y manejo de datos: manual de operaciones
11. Desviaciones del protocolo
12. Anlisis estadstico previsto
13. Aspectos ticos: consentimiento informado
14. Aspectos administrativos
4.1.
4.1.1.
Diseo
Ensayo clnico de grupos paralelos
El ensayo de grupos paralelos constituye, por su sencillez, el diseo bsico para realizar
un ensayo clnico. En este modelo, cada paciente es asignado al mismo tiempo y de forma
aleatoria a una intervencin diferente y tras un perodo de seguimiento variable, se procede
a medir la respuesta (Figura 10-1). En general, se incluyen dos grupos de comparacin,
dada la dificultad de reclutar suficiente nmero de pacientes por grupo cuando se aumenta
el nmero de tratamientos a comparar. A veces, este diseo puede contemplar un perodo de
preinclusin previo a la aleatorizacin, que tiene por objeto disminuir las tasas de no
cumplimiento de la intervencin o de abandono del estudio y, en ocasiones, estabilizar los
ENS Octubre 2009
157
valores de las variables a travs de las cuales se va a medir la respuesta. Durante el perodo
de preinclusin, todos los individuos son sometidos a la misma intervencin, habitualmente
la del grupo control, excluyendo del estudio a los sujetos no cumplidores. Mensink y cols.
realizaron un ensayo clnico de grupos paralelos para comparar el efecto de los cidos
grasos monoinsaturados y poliinsaturados sobre el perfil lipdico plasmtico. Para ello,
establecieron un periodo de preinclusin durante el que los sujetos fueron asignados a una
dieta rica en cidos grasos saturados, permitiendo valorar el grado de cumplimiento de la
dieta y estabilizar los lpidos sanguneos. Una vez finalizado este periodo los sujetos
cumplidores fueron asignados de forma aleatoria a una dieta rica en cidos grasos mono o
poliinsaturados respectivamente.
Figura 10-1. Ensayo clnico de grupos paralelos
Poblacin
Intervencin 1
Enfermo
No enfermo
Intervencin 2
placebo
no intervencin
Enfermo
No enfermo
Muestra
Criterios de inclusin
4.1.2.
Ensayo clnico cruzado
El problema principal de los ensayos de grupos paralelos es que habitualmente los pacientes
presentan una gran variacin en el estado inicial de la enfermedad, las variables pronsticas y
en su respuesta a la intervencin. Esto implica que se necesita un nmero importante de pacientes
en cada brazo del ensayo para poder estimar de forma fiable la magnitud de la diferencia de
efecto de las intervenciones estudiadas. Una forma de abordar este problema consiste en disear
un ensayo cruzado, en el que cada paciente es sometido a todas las intervenciones durante
periodos de tiempo sucesivos, realizndose despus una comparacin de tratamientos intrapaciente. Estas comparaciones son ms eficientes, ya que se reduce la variablilidad intra-grupo
al servir cada individuo como su propio control, por lo que se obtienen resultados ms precisos
con tamaos muestrales reducidos. Como contrapunto, una muestra pequea puede condicionar
la eficacia de la aleatorizacin para distribuir las variables de inters de forma homognea en
los grupos a comparar.
En este diseo cada individuo es asignado aleatoriamente a una secuencia temporal de dos
o ms tratamientos, al objeto de controlar el posible efecto perodo derivado de posibles cambios
en otras variables predictoras a lo largo del tiempo (figura 10-2). Es decir, lo que se aleatoriza
no es el grupo de intervencin al que va a ser asignado el paciente, sino el orden en el que va a
recibir las intervenciones del estudio.
ENS Octubre 2009
158
Figura 10-2. Ensayo clnico cruzado
Poblacin
Muestra
A
L
E
A
T
O
R
I
Z
A
C
I
O
N
Intervencin
Placebo
Placebo
Intervencin
La principal limitacin de este diseo es que las condiciones de aplicacin del mismo son
muy restrictivas: nicamente est indicado en enfermedades estables con tratamientos no
curativos de respuesta rpida y transitoria, requisitos que se dan en algunos procesos crnicos
y recidivantes como algunas de las enfermedades reumticas y alrgicas. Adems, asume
ausencia de efectos residuales de la medicacin (carry-over), por lo que habitualmente es
necesario intercalar fases de lavado (sin medicacin activa) entre los diferentes periodos de
tratamiento para poder cumplir este requisito. Las variables resultado suelen tener carcter
intermedio (no incluyen la curacin o la muerte), por lo que este diseo es ms til en evaluaciones
iniciales de la eficacia de los tratamientos -ensayos fase II-, siendo de eleccin en el estudio de
bioequivalencia de diferentes formulaciones o dosis del mismo frmaco en voluntarios sanos.
Por ltimo, otra limitacin destacable de este diseo se deriva de la complejidad de su anlisis
estadstico (figura 10-3).
4.1.3.
Ensayo clnico factorial
Cuando se desea evaluar varias intervenciones en un mismo estudio, una alternativa

consiste en disear un ensayo de grupos paralelos con un brazo diferente del ensayo para cada
una de las intervenciones y otro brazo para el placebo. Por ejemplo, un ensayo de prevencin
cardiovascular que pretendiese evaluar de forma conjunta una intervencin diettica (sustitucin
de alimentos ricos en AGS por aceite de oliva), un programa de actividad fsica y una intervencin
educativa sobre tcnicas psicolgicas para afrontar el estrs. Una forma de reducir de forma
drstica el elevado tamao muestral que se necesitara en este estudio consiste en disear un
ensayo paralelo de dos grupos y aplicar todas las intervenciones en el mismo brazo del ensayo,
dejando el otro brazo para el placebo. Esta alternativa tiene la ventaja adicional de que al
aplicar varias intervenciones a la vez , habitualmente aumentar la magnitud del efecto global,
con el consiguiente incremento de la potencia del estudio y disminucin del tamao muestral
requerido. Obviamente, la desventaja de este diseo es que no podemos evaluar los efectos de
las diferentes intervenciones por separado. Adems, en el caso poco probable de que alguna
intervencin tuviese el efecto contrario al esperado, podramos encontrarnos con un efecto
global nulo como resultado de la suma de los efectos contrapuestos de diferentes
intervenciones.
La forma de abordar la necesidad de reducir el tamao muestral cuando se desea evaluar
varios tratamientos (con mecanismos de accin y efectos independientes) a la vez, consiste en
realizar un ensayo clnico factorial. En este diseo cada paciente es asignado aleatoriamente a
una combinacin de dos o ms tratamientos o a una combinacin de diferentes dosis de un
ENS Octubre 2009
159
grupo de tratamientos. De esta forma se incrementa de forma extraordinaria la eficiencia del

estudio, ya que permite evaluar varios tratamientos con el mismo nmero de individuos que
hubieran sido necesarios para evaluar uno slo. Por ejemplo, un grupo de investigacin finlands
dise un ensayo factorial para evaluar de forma simultnea la eficacia de los suplementos
dietticos de -caroteno y -tocoferol en la prevencin del cncer de pulmn. Si se hubiese
utilizado un diseo paralelo con tres brazos, cada intervencin hubiese sido aplicada en un
tercio de los individuos, mientras que con el diseo factorial tanto el -caroteno como
el -tocoferol fueron suministrados a la mitad de los sujetos del estudio.
El diseo factorial sirve tambin para evaluar posibles interacciones entre los efectos de las
intervenciones estudiadas. Cuando se utiliza con este objeto este diseo pierde su atractivo en
trminos de eficiencia, ya que la interpretacin de los resultados se complica y son precisos
tamaos muestrales ms elevados para evaluar dicha interaccin.
Figura 10-3. Ensayo clnico factorial
Poblacin
Muestra
A
L
E
A
T
O
R
I
Z
A
C
I
O
N
E-caroteno y D -tocoferol
E-caroteno
D -tocoferol
placebo
4.2.
Seleccin de los participantes
La seleccin de los sujetos que participarn en el estudio debe llevarse a cabo de forma
cuidadosa. Para ello, hay que empezar por definir de forma precisa el perfil de los sujetos
susceptibles de participar en el estudio, por ej.: sujetos de ambos sexos, de 25 a 40 aos de edad,
con sobrepeso (IMC entre 25 y 30) y residentes en Madrid. A continuacin se deben definir los
criterios de exclusin, en funcin de aspectos que pudieran comprometer la participacin en el
estudio (ej.: enfermedades incapacitantes fsica o mentalmente) o que pudieran interaccionar
con la intervencin bajo estudio y afectar la variable de inters. En cualquier caso, hemos de
intentar ser lo menos restrictivos posible a la hora de establecer los criterios de inclusin y
exclusin, al objeto de evitar que tengamos problemas para reclutar un nmero apropiado de
sujetos. Un ensayo clnico con un nmero pequeo de pacientes conlleva un riesgo considerable
de fracasar en el intento de demostrar una diferencia entre las intervenciones que se estn
comparando cuando sta realmente existe. Un aspecto adicional a tener en cuenta al definir el
perfil de los participantes es el de la representatividad de la muestra. Aunque a efectos de
comparabilidad entre los grupos de intervencin la representatividad no es relevante, cuando
diseamos un ensayo clnico no slo deseamos demostrar la eficacia de la intervencin en los
pacientes del ensayo, sino en todos aquellos sujetos o pacientes susceptibles de recibir la
intervencin en el futuro. Por ello, dentro de las posibilidades del equipo investigador, y an a
costa de reducir la extensin o calidad de las observaciones realizadas a los participantes, es
ENS Octubre 2009
160
necesario intentar que la muestra sea lo ms representativa posible de aqulla poblacin a la que
se pretende aplicar la intervencin.
4.3.
Enmascaramiento
El enmascaramiento, o carcter ciego de un ensayo clnico, es el conjunto de medidas o

precauciones que se toman con el fin de que los que intervienen en el mismo (paciente, mdico,
evaluador, ..) desconozcan el tratamiento al que el paciente ha sido asignado, ya que este
conocimiento podra introducir sesgos en el desarrollo, anlisis y evaluacin de un ensayo
clnico. La presentacin de las intervenciones enmascaradas deber ser idntica, diferencindose
nicamente por la sustancia activa que contienen. Hay que tener en cuenta varios aspectos que
tienen que ser idnticos en ambas intervenciones: va y pauta de administracin , forma, tamao,
color, sabor, textura, etc..
El enmascaramiento del responsable de evaluar la respuesta (paciente, mdico o un tercero)
a la intervencin es particularmente importante cuando la variable resultado es subjetiva (ej:
valoracin de la intensidad del dolor, anlisis de una radiografa, ..), ya que el conocimiento de
la intervencin asignada puede afectar la percepcin sobre la variable respuesta. Los resultados
ms objetivos, como la muerte, son relativamente insensibles a este tipo de sesgo. Por ej: si uno
de los mdicos participantes en el estudio, es un entusiasta de la eficacia del nuevo tratamiento
bajo estudio, podra transmitir este entusiasmo a sus pacientes, y esto sin duda podra alterar la
valoracin de la variable respuesta, tanto por parte del mdico como por parte del paciente.
Lamentablemente, no siempre es posible aplicar el enmascaramiento, por ej. en el caso de
que la intervencin sea una dieta o una intervencin quirrgica. Por otro lado, en ocasiones un
tratamiento puede tener efectos secundarios bien conocidos que pueden permitir al paciente
realizar la identificacin del mismo. Por ej.: la rifampicina tie de rojo la orina. Adems, nunca
deben enmascararse los tratamientos si por ello sometemos a algn tipo de riesgo a los pacientes.
Por todo ello, para poder hacer una valoracin lo ms objetiva y realista posible de los resultados
del ensayo clnico en relacin con la eficacia de la intervencin, el investigador debe describir
no solo el mtodo de enmascaramiento y las violaciones del mismo, sino tambin los aspectos
comentados previamente, en relacin con la imposibilidad de aplicarlo o los posibles riesgos de
que no sea eficaz.
En funcin del grado de enmascaramiento decimos que un ensayo clnico es abierto cuando
el paciente y el investigador conocen la intervencin asignada, simple ciego, cuando el paciente
es el nico que desconoce la intervencin asignada y doble ciego, cuando el paciente, el
responsable de su cuidado (equipo de tratamiento) y el evaluador de la variable respuesta
(investigador) desconocen el grupo de tratamiento asignado. Aunque en el doble ciego hay en
realidad tres agentes implicados (paciente, equipo de tratamiento y evaluador), se mantiene sa
denominacin porque en muchas ocasiones el mdico que trata al paciente es asimismo el
responsable de la evaluacin de la variable respuesta.
4.4.
El placebo
La administracin de una intervencin produce un efecto teraputico sobre el individuo,

denominado efecto placebo, independientemente del principio activo que contenga la misma.
Es decir, incluso la administracin de un principio inactivo inocuo produce un efecto medible.
El simple hecho de ser observado, de participar en un estudio, produce una modificacin positiva
en el estado clnico de los pacientes, denominada efecto Hawthorne. A esto hay que aadir el
poder de sugestin derivado del hecho de recibir una terapia, aunque sta sea farmacolgicamente
inactiva, y el de la presencia de un mdico, o investigador, que aplica la misma.
ENS Octubre 2009
161
El efecto global de cualquier intervencin tiene dos componentes: el efecto placebo y el

efecto especfico de la misma (Figura 10-4). Por ello, al estudiar la eficacia de una nueva
terapia, es preciso aplicar una intervencin alternativa al grupo control, que permita controlar
el efecto placebo y discernir el efecto especfico de la nueva terapia. Por razones ticas,
cuando exista una terapia eficaz disponible para la condicin bajo estudio no aplicaremos un
placebo a los pacientes del grupo control, sino ese tratamiento habitual. La razn principal
para utilizar el placebo consiste en conseguir que la actitud de los individuos ante la
investigacin en los grupos de intervencin y control sea la misma. Asimismo, proporciona
la oportunidad de realizar ensayos doble ciegos y evitar de esa forma que se produzcan
sesgos en el desarrollo, anlisis y evaluacin del ensayo, tal como hemos sealado en el
apartado anterior.
Respuesta a la terapia
Figura 10-4. El efecto placebo
Efecto
especfico
Efecto
especfico
Efecto
placebo
Nueva
terapia
4.5.
Efecto
placebo
Terapia
habitual
Efecto
placebo
Placebo
Evaluacin de la respuesta y presentacin de los resultados
El protocolo de un ensayo clnico debe distinguir claramente entre la variable principal

de respuesta, que va a determinar el tamao muestral y la posible eficacia de la intervencin,
y las variables de valoracin secundarias. En un ensayo sobre los efectos para la salud de una
dieta vegetariana, las variables de mayor inters seran aquellas que midieran el efecto sobre
la mortalidad general o la debida a enfermedades crnicas como cncer o cardiovasculares.
Sin embargo, para poder detectar un nmero aceptable de defunciones sera necesario
seleccionar una muestra muy numerosa y de alto riesgo y mantener el ensayo por un largo
perodo de tiempo, condiciones que pueden limitar la factibilidad del estudio. A ms corto
plazo, pueden utilizarse otras variables de valoracin principal como la tensin arterial, el
ndice de masa corporal o el nivel de oxidacin de determinadas sustancias.
ENS Octubre 2009
162
En general, el anlisis principal de un ensayo clnico debe basarse en el principio de

intencin de tratar, que incluye a cada paciente en su grupo de aleatorizacin independientemente
de los cambios que pudieran ocurrir a posteriori: incumplimiento de la intervencin, cambio de
tratamiento, etc.. Aunque este tipo de anlisis tiene una mayor tendencia a obtener resultados
nulos, aumentando las dificultades para demostrar la eficacia de cualquier nueva intervencin,
existen dos poderosas razones para llevarlo a cabo. Por un lado, con este tipo de anlisis se
pretende preservar lo conseguido con la aleatorizacin, que los grupos sean comparables, lo
cual constituye el fundamento para poder obtener conclusiones vlidas (no sesgadas) sobre la
eficacia de una intervencin. Por otro lado, se trata de evaluar el efecto de la intervencin en
condiciones lo ms parecidas posibles a las de la vida real (efectividad) y no slo teniendo en
cuenta las condiciones ideales (eficacia) que proporcionan el subgrupo de pacientes que han
seguido el protocolo de forma estricta.
Tradicionalmente, la medicin del efecto de una intervencin poda llevarse a cabo
mediante medidas absolutas, como la reduccin del riesgo atribuible, o relativas, como la
reduccin porcentual del riesgo relativo. De forma ms reciente han surgido otras medidas de
carcter complementario, que ponen el nfasis en facilitar la tarea del clnico a la hora de
orientar el tratamiento de sus pacientes. Estas medidas de carcter ms pragmtico incluyen el
porcentaje de pacientes libres de la condicin bajo estudio y el nmero necesario de pacientes
a tratar (NNT). El NNT constituye el nmero de pacientes que tendramos que tratar para evitar
que se produjera un caso con la enfermedad o condicin estudiada y se calcula como el inverso
de la reduccin del riesgo atribuible. La presentacin de los resultados mediante un nico
indicador, como la reduccin porcentual del riesgo relativo, puede producir una impresin
magnificada sobre el efecto del tratamiento, por lo que actualmente se recomienda que al
presentar los resultados de un ensayo clnico se utilice la reduccin porcentual del riesgo
relativo acompaada de alguna magnitud que mida la reduccin del riesgo en trminos absolutos,
particularmente el NNT. Para ilustrar esta ltima afirmacin, nos basaremos en el ejemplo
descrito por Cook y Sacket, a partir de una revisin de ensayos clnicos sobre tratamientos
farmacolgicos para la hipertensin arterial realizada por Collins y cols.. Los estudios fueron
divididos en dos grupos mutuamente exclusivos: aqullos en los que todos los pacientes tenan
una presin diastlica al inicio del ensayo menor de 110 mmHg (hipertensin ligera) y aqullos
en los que todos los pacientes tenan una presin diastlica al inicio del estudio menor de 115
mmHg (hipertensin moderada). Como puede apreciarse en la tabla 10-3, la reduccin
porcentual del riesgo relativo de padecer un ACV durante los 5 aos siguientes con tratamiento
farmacolgico fue similar en los dos grupos, del 40%, lo que podra inducir a pensar que la
estrategia teraputica debera ser igual en ambos grupos. Sin embargo, la reduccin absoluta
del riesgo fue mucho menor en los sujetos con hipertensin ligera, dado que este grupo de
pacientes tena una tasa de ACV en ausencia de tratamiento mucho ms baja que el grupo con
hipertensin moderada. Traducido en trminos de NNT, mientras en un caso se necesitaba
tratar 13 pacientes para evitar un ACV, en el otro era preciso tratar a 167 pacientes para obtener
el mismo resultado. En consecuencia, parece que la estrategia teraputica debera ser diferente
en esos dos grupos de pacientes.
ENS Octubre 2009
163
15.165
* Tomado de BMJ 1995; 310: 452-454
0,015
16.778
0,20
Grupo control
15.238
0,009
16.898
0,12
Grupo tratamiento
ACV en 5 aos
0,40
0,40
(Pc Pt) / Pt
Reduccin del RR
0,006
0,08
Pc Pt
Reduccin del RA
Tabla 10-3. Clculo de la reduccin del riesgo y del NNT para evitar un caso de ACV en pacientes con hipertensin
Tasa de ACV (P)
Ligera
Tasa de ACV (P)
Moderada
Hipertensin
ENS Octubre 2009
167
13
1 / (Pc Pt)
NNT
164
Por ltimo, la importancia de una adecuada presentacin de los resultados de los ensayos
clnicos ha llevado a la elaboracin de la Declaracin CONSORT, un informe con
recomendaciones para mejorar la calidad de la presentacin de los resultados de ensayos clnicos
elaborado por investigadores, estadsticos, epidemilogos y editores biomdicos y apoyado por
numerosas revistas biomdicas y grupos editoriales. La declaracin recoge los aspectos (22
tems) que han de ser contemplados y la forma de presentarlos en los diferentes apartados (ttulo
y resumen, introduccin, mtodos, resultados y discusin) del informe sobre un ensayo clnico
de dos grupos paralelos (tabla 10-4). La declaracin, junto con las extensiones de la misma para
los diferentes tipos de ensayos clnicos (en funcin de datos, intervenciones o diseos
alternativos) se pueden consultar en la siguiente direccin: http://www.consort-statement.org/
consort-statement.
Tabla 10-4. Declaracin CONSORT: Lista de tems a incluir en el informe sobre un ensayo clnico
Apartado
tem Descripcin
Titulo y resumen
Mtodo utilizado para asignar los pacientes a las intervenciones (ej.: asignacin aleatoria,
aleatorizado o asignado aleatorizadamente).
Introduccin
Fundamento
Fundamento cientfico y explicacin del objetivo principal.
Participantes
Criterios de inclusin-exclusin. rea de referencia y lugar donde se recogern los datos.
Intervenciones
Informacin precisa y detallada de la intervencin de cada grupo y de cmo y cuando fueron
Mtodos
realmente administradas.
Objetivos
Hiptesis y objetivos especficos
Respuesta
Definir claramente las variables de respuesta principales y secundarias y, en su caso, cualquier

mtodo utilizado para mejorar la calidad de las mediciones (ej.: observaciones mltiples,
entrenamiento de los evaluadores, etc.).
Tamao muestral
Mtodo de determinacin del tamao muestral y, en su caso, descripcin de anlisis interinos y

criterios para parar el ensayo.
Aleatorizacin
Mtodo utilizado para generar la secuencia de asignacin aleatoria, incluyendo detalles de
- Generacin de la
secuencia
Mtodo utilizado para aplicar la secuencia de asignacin aleatoria (ej.: sobres numerados o central
- Enmascaramiento de la
asignacin
cualquier restriccin aplicada (ej.: estratificacin, aleatorizacin por bloques).
telefnica), aclarando si la secuencia estuvo enmascarada hasta que las intervenciones fueron
asignadas.
-Aplicacin
10
Personas encargadas de generar la secuencia de asignacin, reclutar a los participantes y

asignarlos al grupo correspondiente.
Enmascaramiento
11
Grado de enmascaramiento de los participantes y de los encargados de aplicar la intervencin y

evaluar la respuesta y forma de evaluar el xito del mismo.
Mtodos estadsticos
12
Mtodos estadsticos utilizados para comparar las variables principales de respuesta en los grupos:
mtodos para anlisis adicionales, como anlisis de subgrupos y anlisis ajustados.
ENS Octubre 2009
165
Apartado
tem Descripcin
Resultados
Flujo de participantes
13
Flujo de participantes a travs de cada etapa (un diagrama es intensamente recomendado).

Especficamente, declarar para cada grupo el nmero de participantes que han sido asignados
aleatoriamente, que han recibido el tratamiento asignado, que han cumplido el protocolo y que han
participado en el anlisis de la variable principal. Describir las desviaciones del protocolo y sus
razones.
Reclutamiento
14
Fechas de los perodos de reclutamiento y seguimiento.
Datos basales
15
Caractersticas basales demogrficas y clnicas de cada grupo.
Nmero analizado
16
Nmero de participantes (denominador) de cada grupo incluidos en cada anlisis. Declarar si el

anlisis fue por intencin de tratar. Proporcionar los resultados en nmeros absolutos siempre
que sea posible.
Respuesta y Estimacin
17
Para cada variable de respuesta principal o secundaria, presentar un resumen de los resultados para
cada grupo, el tamao estimado del efecto y su precisin (ej.: 95% CI).
Anlisis auxiliares
18
Abordar la multiplicidad declarando cualquier otro anlisis realizado, incluyendo anlisis de

subgrupos y ajustados, e indicando si stos eran predeterminados o exploratorios.
Efectos adversos
19
Todos los efectos adversos importantes o efectos secundarios en cada grupo de intervencin.
20
Interpretacin de los resultados, teniendo en cuenta la hiptesis del estudio, las fuentes de
Discusin
Interpretacin
imprecisin o de sesgos potenciales y los peligros asociados con la multiplicidad de anlisis y

respuestas.
Generalizabilidad
21
Generalizabilidad (validez externa) de los hallazgos del ensayo.
Evidencia global
22
Interpretacin general de los resultados en el contexto de la evidencia actual.
Traducido y adaptado de Lancet 2001; 357:1191-1194
ENS Octubre 2009
166
5.
BAKKE OM, CARN X, GARCA ALONSO F. Ensayos clnicos con medicamentos. Fundamentos bsicos, metodologa
y prctica. Barcelona: Doyma, 1994.
FRIEDMAN LM, FURBERG C, DEMETS DL. Fundamentals of clinical trials. 2 ed. Littleton: PSG Publishing
Company, 1985.
GALENDE I, SACRISTN JA, SOTO J. Cmo mejorar la calidad de los ensayos clnicos. Med Clin (Barc) 1983; 80:
768-771.
GUALLAR E, ROYO-BORDONADA MA. Directrices del Commitee propietary medicinal products: Estadstica. En
Ergn ed. II Reunin de Actualizacin de ensayos clnicos con medicamentos. Madrid, 1996.
MARRUGAT J. Los Estudios Experimentales. En: Martinez Navarro F. Salud Pblica, ed. McGraw-Hill Interamericana,
1997: 239-258.
MOHER D, SCHULZ K, ALTMAN D. The CONSORT Statement: revised recommendations for improving the quality
of reports of parallel-group randomised trials. Lancet 2001; 357: 1191-1194.
POCOCK SJ. Clinical trials. A practical approach. Chichester, GB: John Willey & Sons, 1983.
PORTA M, IBEZ LI, CARN X, LAPORTE JR. Principios del ensayo clnico. Med Clin (Barc) 1983; 80: 768-771.
REAL DECRETO 223/2004, de 6 de abril, por el que se regulan los ensayos clnicos con medicamentos - BOE nm. 33,
de 7 de febrero de 2004: 5429-5443.
ENS Octubre 2009
167
Epidemiologa Clnica
XI. EPIDEMIOLOGA CLNICA.

Iaki Imaz Iglesia
Jess Gonzlez Enrquez
1.
INTRODUCCIN. CONCEPTO DE EPIDEMIOLOGA CLNICA Y APLICACIONES.
Los conceptos, herramientas y mtodos de la epidemiologa se han aplicado al estudio de

la prctica clnica dando lugar a la Epidemiologa Clnica. Esta disciplina pretende dar respuesta
a las preguntas que surgen del contacto mdico-paciente (observaciones, decisiones y
evaluaciones clnicas) mediante un abordaje poblacional y no exclusivamente individual. El
mtodo clnico tradicional por el que un mdico/a se plantea los problemas de su consulta
considerando a cada paciente de forma individual y cada caso clnico igualmente relevante es
superado mediante una metodologa ms generalizable.
La prctica clnica es el origen, fuente de preguntas y destino final de la Epidemiologa
Clnca. Se trata de aplicar el mtodo cientfico a la resolucin de problemas clnicos. La
Epidemiologa Clnica se ha definido de varias formas:
Estudio de los determinantes y consecuencias de las decisiones mdicas.
Estudio de las decisiones diagnsticas, pronsticas y teraputicas que se toman con
respecto a los enfermos.
Estudio de las variaciones en los desenlaces de la enfermedad y de las razones que
conducen a ello.
Ciencia y mtodo de estudiar las decisiones ptimas en la medicina clnica, teniendo en
cuenta las caractersticas epidemiolgicas del paciente y su ambiente clnico externo,
la patologa que le concierne y los factores y maniobras a que se ve expuesto en su
ambiente clnico, en especial las acciones mdicas.
La Epidemiologa Clnica surge como una disciplina autnoma de la mano de tres
Universidades. En la Universidad de Yale de los EEUU con Alvan Feinstein, en la Universidad
de Carolina del Norte (EEUU) con Fletcher y en la Universidad canadiense McMaster con
Sackett.
Entre las mltiples reas de la prctica clnica que aborda la Epidemiologa Clnica
(diagnstico, tratamiento, pronstico, prevencin) en este manual se exponen la evaluacin de
pruebas diagnsticas y las decisiones clnicas. Tambin se propone un anlisis del caso del
cribado poblacional de cncer de mama mediante mamografa.
2.
LA EVALUACIN DE LAS PRUEBAS DIAGNSTICAS.
Una buena prueba diagnstica es aquella que es capaz de discriminar o clasificar

correctamente a los miembros de la poblacin en que se aplica, ofreciendo un resultado positivo
en los enfermos o portadores de la condicin clnica buscada, y negativo en los sanos o no
portadores. La capacidad de la prueba de diagnosticar adecuadamente se evala fundamentalmente
estudiando su validez y fiabilidad.
2.1.
Validez de una prueba diagnstica.
La validez es el grado en que una prueba mide lo que se supone debe medir y corresponde
a la exactitud diagnstica. Es la capacidad de la prueba de discriminar entre los casos y los no
ENS Octubre 2009
169
Epidemiologa Clnica
casos para una enfermedad o condicin clnica. La validacin de una prueba diagnstica se
realiza mediante la comparacin de sus resultados con los obtenidos mediante el mejor
instrumento de medida del fenmeno estudiado, o con el verdadero resultado si ste es conocido,
o sea mediante la comparacin del test con un estndar de oro.
Algunas veces el estndar de oro es una prueba diagnstica relativamente simple y
econmica, como por ejemplo el cultivo de garganta para estreptococo hemoltico del grupo
A para validar la impresin clnica de faringitis estreptoccica. Sin embargo, ms frecuentemente
debe recurrirse a exmenes complejos, costosos o arriesgados (biopsia, radiologa con contraste,
autopsia).
En la tabla 11-1 se exponen los principales indicadores para evaluar la validez de una
prueba diagnstica. La sensibilidad de una prueba es la probabilidad de que un sujeto con la
enfermedad sea adecuadamente clasificado. Una prueba ser tanto ms sensible cuanto menos
falsos negativos (FN) proporcione. En las pruebas de cribado generalmente se utilizan test de
alta sensibilidad para captar a casi todos los enfermos. Tambin en enfermedades graves
tratables, en las que no debe permitirse la prdida de ningn caso.
Tabla 11-1. Relacin entre una prueba diagnstica y un estndar de oro.
Enfermedad
+
+
a+b
c+d
a+c
b+d
a+b+c+d
VP FP
Prueba
FN VN
Sensibilidad
a
ac
Especifidad
Valor Pr edictivoPositivo(VPP)
a
ab
Valor Pr edictivoNegativo(VPN )
Pr evalencia
d
bd
d
cd
ac
abcd
La especificidad de una prueba es la probabilidad de que un sujeto sano sea clasificado

correctamente. Una prueba ser tanto ms especfica cuanto menos falsos positivos (FP)
proporcione. En general, las pruebas de confirmacin diagnstica deben tener una elevada
especificidad, as como en la identificacin de enfermedades graves no tratables, en las que un
resultado falso positivo puede producir serios trastornos al individuo.
ENS Octubre 2009
170
Epidemiologa Clnica
El valor predictivo positivo de una prueba diagnstica es la probabilidad de que un sujeto

con un resultado positivo sea un individuo enfermo. El valor predictivo negativo es la
probabilidad de que un sujeto con un resultado negativo en la prueba sea un individuo sano.
La seguridad de una prueba diagnstica se valora mediante el valor predictivo positivo y
negativo, ya que nos dice en qu grado los resultados positivos y negativos de la prueba son
correctos. Los clnicos necesitan saber, antes de actuar y tratar, con qu seguridad el paciente
tiene la enfermedad cuando la prueba diagnstica es positiva.
2.1.1.
La influencia de la prevalencia en los resultados de una prueba diagnstica.
Una prueba diagnstica de calidad debe tener una sensibilidad y especificidad altas
(prximas al 100%), pero para garantizar buenos resultados tambin deben tenerse en cuenta las
condiciones de aplicacin de la prueba. La prevalencia de enfermedad en la poblacin en la que
se aplica el test, aunque no modifica la sensibilidad y especificidad puede modificar los valores
predictivos positivos y negativos convirtiendo a una prueba de calidad en una intervencin
diagnstica intil. A continuacin se expone un ejemplo.
Si se aplica una prueba con una alta sensibilidad y especificidad, como el test de ELISA
para la deteccin del virus del SIDA, en una poblacin con una prevalencia de seropositividad
al VIH muy baja (por ejemplo la poblacin que acude a un determinado centro comercial), se
examinar a muchos sujetos sin la enfermedad dando lugar a varios falsos positivos. En la
tabla 11-2 se muestran los resultados de la aplicacin del test ELISA, en una poblacin con una
prevalencia de 1 por mil.
Tabla 11-2. Resultados del test ELISA en una poblacin con baja prevalencia de VIH +.
VIH +
+
+
19
200
219
19.780
19.781
20
19.980
20.000
VP FP
ELISA
FN VN
Sensibilidad
19
19 1
Pr evalencia
VPP
0,95
Especificidad
20
19 200 1 19780
19
19 200
0,086
VPN
19780
19780 200
20
20.000
0,001
19780
1 19780
0,99
0,99
Si por el contrario, se aplica el mismo test en una poblacin con alta prevalencia de la
enfermedad (39%) aumenta el valor predictivo positivo (tabla 11-3).
ENS Octubre 2009
171
Epidemiologa Clnica
Tabla 11-3. Resultados del test ELISA en una poblacin con alta prevalencia de VIH +.
VIH +
+
+
63
ELISA
FN VN
Sensibilidad
63
3 63
Pr evalencia
VPP
2.1.2.
64
VP FP
63
1 63
99
66
100
0,95
Especificidad
66
63 1 3 99
0,98
VPN
66
166
102
166
99
1 99
0,99
0,39
99
3 99
0,97
Las razones de mxima verosimilitud.
Un indicador til para discriminar entre pruebas diagnsticas por su valor informativo es
la likelihood ratio que puede traducirse como razn de mxima verosimilitud. Este indicador
no tiene un umbral que establezca cuando la prueba diagnstica tiene poco valor, pero puede ser
til para conocer los resultados que aportar la realizacin de la prueba.
La razn de mxima verosimilitud del resultado positivo de una prueba diagnstica se
calcula mediante la siguiente frmula:
LikelihoodRatio
sensibilidad
1 especificidad
Cuanto ms elevado es el resultado de la frmula anterior mejor es la prueba. Por ejemplo,

se ha estimado que una tomografa computerizada abdominal para el diagnstico de una lesin
esplnica tiene una sensibilidad del 95% y una especificidad del 96%, resultando una razn de
mxima verosimilitud de un resultado positivo de 23,8. Sin embargo, los termogramas para la
deteccin del cncer de mama en la mujer tienen una sensibilidad del 61% y una especificidad
del 74%, dando una razn de mxima verosimilitud de un resultado positivo baja (2,35).
La representacin grfica del numerador y denominador de la razn de mxima verosimilitud
puede servir de ayuda para discriminar cul es el punto que ofrece mejores resultados. El
siguiente apartado se dedica a la curva ROC, grfico estndar que representa los puntos de
equilibrio entre sensibilidad y especificidad.
La razn de mxima verosimilitud del resultado negativo de una prueba se calcula mediante
la siguiente frmula
LikelihoodRatio
1 sensibilidad
especificidad
ENS Octubre 2009
172
Epidemiologa Clnica
En este caso, cuanto menor sea el resultado de la Likelihood Ratio mejor es la prueba
diagnstica.
2.1.3. El umbral de positividad de una prueba. La curva de caractersticas operativas
(curva ROC).
La aplicacin de una prueba diagnstica implica tomar una serie de decisiones que tendrn
consecuencias en su evaluacin. Un test no aporta la misma informacin diagnstica si el umbral
para considerar la prueba positiva es bajo que si es muy exigente. La glucemia como prueba
diagnstica de diabetes presenta distintos valores de sensibilidad y especificidad segn el
umbral diagnstico sea 100 mg/dl 180 mg/dl. Si se considera este ltimo umbral, ciertamente
casi todas las personas con una prueba positiva (>180 mg/dl.) estarn enfermas. Sin embargo,
muchas otras personas con diabetes no sern calificadas como enfermas con una prueba tan
rigurosa. La prueba sera entonces muy especfica.
Situndose en el otro extremo, y considerando que todos los pacientes con una glucemia
mayor de 70 mg/dl. fueran diagnosticados como diabticos, muy pocas personas con la
enfermedad dejaran de ser diagnosticadas, pero la mayora de la gente normal sera etiquetada
como diabtica. La prueba sera entonces muy sensible pero poco especfica. Este balance entre
sensibilidad y especificidad debe considerarse a la hora de definir el umbral adecuado para
considerar positiva la prueba. La construccin de una curva ROC (Receiver Operator
Characteristic Curve) es una herramienta muy til en esa decisin.
Esta curva se construye con los diferentes resultados que se obtienen en una prueba
diagnstica al colocar el umbral de positividad en diferentes puntos. En la curva se representan
en un grfico los pares sensibilidad y 1-especificidad, que en definitiva son las razones de
mxima verosimilitud de un resultado positivo. El eje de abscisas crece conforme disminuye la
especificidad y el eje de ordenadas crece conforme aumenta la sensibilidad. En la figura 11-1 se
muestra un ejemplo de curva ROC para una prueba diagnstica de nefropata diabtica, el
cociente albmina/creatinina en orina.
Figura 11-1. Curva ROC del cociente albmina/creatinina.
El eje de abscisas (1-especificidad) corresponde a la tasa de falsos positivos y el eje de

ordenadas (sensibilidad) corresponde a la tasa de verdaderos positivos. Los mejores resultados
corresponden a los puntos ms cercanos al ngulo superior izquierdo, en el que hay una alta tasa
de verdaderos positivos y una baja tasa de falsos positivos. La curva con peor resultado sera
una lnea diagonal que uniera el extremo inferior izquierdo (valor 0-0) con el superior derecho
(valor 100-100), indicando que siempre hay los mismos resultados positivos verdaderos que
falsos. En ese caso, la razn de mxima verosimilitud de resultado positivo es 1 en todos los
puntos de la curva.
ENS Octubre 2009
173
Epidemiologa Clnica
La figura 11-1 muestra los diferentes pares de datos sensibilidad/1-especificidad del

Cociente Albuminuria/Creatinina para cada uno de los puntos de corte establecidos. El punto de
corte o umbral de positividad que ms se aproxima al extremo superior izquierdo es el que ms
rea deja debajo de la curva, y corresponde con el de mayor razn de mxima verosimilitud. En
el caso de las mujeres el mejor punto de corte es 2,4 g/mol, y corresponde con una sensibilidad
de 90% y una especificidad de 97%. En el caso de los hombres es 1,4 g/mol (sensibilidad 89%
y especificidad 92%).
Adems de poder realizar un anlisis cualitativo visualmente, las curvas ROC permiten un
anlisis cuantitativo preciso para la evaluacin de la exactitud de una prueba diagnstica. El
punto que deja mayor rea debajo de la curva es el de mayor razn de mxima verosimilitud, y
por lo tanto en el que se ofrece una mayor exactitud global.
Visualmente se puede discriminar cul es el punto que se aproxima ms al extremo superior
izquierdo, pero para mayor exactitud se calcula el rea debajo de la curva. sta se interpreta
como la probabilidad de clasificar correctamente un par de individuos sano y enfermo,
seleccionados al azar de la poblacin objeto de estudio, al aplicarles la prueba diagnstica en
cuestin. Es decir, la probabilidad de que el resultado de la prueba resulte ms anormal en el
sujeto enfermo que en el sano.
El rea debajo de la curva es una medida global de la exactitud que permite la comparacin
estadstica entre pruebas diagnsticas. Los valores estn comprendidos entre 0,5, el peor
resultado posible y 1, el mejor. Un rea debajo de la curva de 0,72 significa que un individuo
seleccionado aleatoriamente del grupo de enfermos obtendr el 72% de las veces un valor
mayor en la prueba diagnstica que un individuo elegido al azar del grupo no enfermo.
2.2.
Fiabilidad de una prueba diagnstica.
Los resultados de las mediciones y observaciones clnicas estn influidos por multitud de
factores como el medio ambiente en el que se realiza la medicin o la persona que realiza la
observacin. Hay un cierto grado de variabilidad o error intrnseco en cualquier procedimiento
de medicin, particularmente cuando el componente principal del proceso es la apreciacin
subjetiva de un observador. La variabilidad raramente puede ser eliminada totalmente, pero el
conocimiento de sus causas y su evaluacin cuantitativa es necesario para garantizar que la
informacin que proporciona la prueba es de calidad.
El grado de variabilidad puede ser evaluado determinando su validez o exactitud, aspecto
abordado anteriormente, y adems mediante la evaluacin de la fiabilidad. La fiabilidad es la
capacidad de una prueba diagnstica de obtener resultados comparables si se utiliza en
condiciones idnticas. Las pruebas diagnsticas deben tener una elevada fiabilidad, de tal forma
que haya consistencia o ausencia de desacuerdo en repetidas observaciones o mediciones. La
evaluacin de la fiabilidad de una prueba diagnstica se realiza valorando cada una de las
fuentes de variabilidad.
Las diferentes fuentes de variacin en las observaciones clnicas pueden resumirse como sigue:
La variabilidad intraobservador: el mismo profesional sanitario puede obtener diferentes
resultados al repetir una medicin en el mismo paciente debido al cambio en el estado
fsico del profesional, en el grado de atencin u otras condiciones ambientales o psicolgicas
(por ejemplo: presin por parte de los familiares para emitir rpidamente el diagnstico).
La variabilidad interobservador: las mediciones realizadas por diferentes profesionales
suelen ser diferentes, lo cual puede estar motivado por la formacin del profesional, la
experiencia, la motivacin, la agudeza visual o auditiva y otras caractersticas personales
que pueden afectar en los resultados de las observaciones.
ENS Octubre 2009
174
Epidemiologa Clnica
La variabilidad biolgica inherente a la caracterstica que se desea medir. Por ejemplo,

la tensin arterial est sujeta a cambios en dependencia de la situacin en que se encuentre
el paciente en el momento de la toma (ingesta previa, estrs, condicin fsica, etc.).
La variabilidad del instrumento de medida. El propio aparato de medicin est sometido
a un grado de variacin diverso, que puede estar motivado por la calidad de la
calibracin, las unidades en que se mide o la influencia sobre el propio instrumento de
factores ambientales como el nivel de ruido o la iluminacin.
La variabilidad aleatoria. Es el grado de variacin que no puede atribuirse a los factores
anteriores. La repeticin de una prueba suele aumentar la fiabilidad al disminuir el
error aleatorio. Otro fenmeno reseable es el denominado regresin a la media que
es el efecto de disminucin de los valores extremos que se produce al realizar
repetidamente una prueba, de tal forma que los valores se van aproximando cada vez
ms a su valor medio real.
La reduccin de la variabilidad hasta valores aceptables debe hacerse actuando sobre las
diferentes fuentes de variacin identificadas. La estandarizacin del procedimiento de medicin
puede contribuir a reducir la variabilidad homogeneizando las condiciones de aplicacin del
procedimiento diagnstico o entrenando de forma similar a los distintos observadores. Otra
forma de reducir la variabiliadad es repitiendo la medicin en varias ocasiones para tomar la
media de las mismas como valor verdadero del sujeto estudiado.
La evaluacin de la fiabilidad de una prueba diagnstica se realiza valorando cada una de
las fuentes de variabilidad. Si lo que se pretende es evaluar la variabilidad interobservador se
compararn la concordancia entre los resultados obtenidos por los distintos profesionales,
manteniendo constantes el resto de los factores que pueden influir en los resultados.
En dependencia del carcter de la variable que se mide se utilizar un mtodo de
evaluacin de la variabilidad o concordancia diferente. Cuando se trate de variables nominales
o binarias (enfermo/sano, grupo sanguneo A/AB/B/O) se utilizar el coeficiente Kappa. Si
las variables son ordinales se utilizar el coeficiente Kappa ponderado (leve/moderado/
grave). Finalmente, cuando las variables sean cuantitativas se utilizar el coeficiente de
correlacin intraclases.
2.2.1.
El coeficiente de concordancia Kappa.
Para desarrollar el concepto se utilizar un ejemplo ilustrativo basado en la evaluacin de

una prueba diagnstica de deteccin de sangre oculta en heces. Los resultados de la prueba
pueden ser negativos (0) o positivos (+). La prueba fue realizada por dos mdicos (A y B)
en 110 pacientes (tabla 11-4).
Tabla 11-4. Resultados de las observaciones de dos mdicos sobre un mismo test de deteccin de sangre oculta en heces.
Sangre en heces
0
TOTAL
Mdico A:
N de lecturas en los pacientes
48
62
110
Mdico B:
N de lecturas de los pacientes
47
63
110
La prueba parece perfectamente fiable al presentar resultados aparentemente concordantes

entre los distintos observadores. Sin embargo, no sabemos si las observaciones son las mismas
ENS Octubre 2009
175
Epidemiologa Clnica
en los distintos pacientes. Si se describen las lecturas mediante una tabla cruzada (tabla 11-5),
se observa la concordancia no es completa. La proporcin de acuerdo se calcula mediante el
ndice de Acuerdo Global (IAG), sumando los valores de las celdas en la que los observadores
han coincidido, dividido por el nmero total de observaciones.
Tabla 11-5. Lecturas completas de la prueba de sangre oculta en heces.
Mdico A
En la tabla 11-5 el
Total
Mdico
37
10
47
11
52
63
Total
48
62
110
37 52
110
0,81 .
IAG =
Lo que significa que hay coincidencia entre los dos mdicos en el 81% de los casos.
Sin embargo no sabemos cul habra sido la coincidencia por azar. El clculo del coeficiente de
concordancia Kappa sirve para conocer el nivel de acuerdo que se obtendra si descontamos el debido
solamente al azar. En la tabla 11-6 se procede a calcular cules seran los resultados si la nica relacin
entre las conclusiones de los mdicos A y B fuese el azar, o lo que es lo mismo si los sucesos fuesen
independientes. El resultado es el ndice de Acuerdo atribuible al Azar (IAA) que resulta un 0,51.
Tabla 11-6. Frecuencias esperadas por azar de la prueba de sangre oculta en heces.
Mdico A
0
Total
Mdico
20,51
26,47
47
27,49
35,51
63
Total
48
62
110
Se obtiene de la multiplicacin de los marginales de la fila y la columna en cuestin,

dividido por el nmero total de observaciones (110).
IAA
20,51 35,51
110
0,51
Si al ndice de Acuerdo Global (IAG) le descontamos el ndice de Acuerdo atribuible al

Azar (IAA) quedara slo el nivel de concordancia que no puede ser atribuida al azar. En nuestro
ejemplo sera 0,81-0,51=0,30. Este 30% es el acuerdo observado no debido al azar y constituye
el numerador del coeficiente Kappa. Para estimar el denominador se calcula la cantidad mxima
de acuerdo que podra alcanzarse no debido al azar, es decir el opuesto del IAA. De este modo,
el coeficiente Kappa se expresara:
ENS Octubre 2009
176
Epidemiologa Clnica
Kappa =
IAS IAA
1 IAA
En nuestro ejemplo Kappa = 0,30 / 0,49 = 0,61. Por tanto, el 61% de las observaciones son
coincidentes una vez eliminado el componente del azar.
Los resultados del coeficiente Kappa varan desde 1, que corresponde con el mayor
desacuerdo, a +1, que corresponde con el acuerdo perfecto. El valor 0 correspondera al acuerdo
debido al azar. La fiabilidad se considera escasa si el coeficiente Kappa es menor de 0,4; buena
si se sita entre 0,4 y 0,75 y excelente si es superior a 0,75.
El coeficiente Kappa Ponderado se utiliza cuando las variables son ordinales, de tal forma
que haya ms de dos categoras de valoracin con un orden jerrquico entre ellas. Se calcula de
forma anloga al coeficiente Kappa Simple, pero multiplicando el valor de cada casilla por un
peso que pondere la magnitud del desacuerdo, ya que no es lo mismo discrepar entre leve y
moderado, que entre leve y grave.
2.2.2.
El Coeficiente de Correlacin Intraclases.
El Coeficiente de Correlacin Intraclases (CCI) se utiliza para valorar la coincidencia

cuando las variables medidas son cuantitativas. Es incorrecto utilizar el Coeficiente de
Correlacin de Pearson (CCP) u otros ndices de tendencia para evaluar la fiabilidad.
El siguiente ejemplo ilustra las diferencias entre el CCP y el CCI. En el ejemplo dos mdicos
toman la tensin arterial sistlica de forma consecutiva y con el mismo esfigmomanmetro a 10
pacientes. Como puede apreciarse en la tabla 11-7, las mediciones de los dos mdicos son
diferentes. Los valores registrados por el mdico B son en todos los casos superiores a los
registrados por el mdico A, y adems la diferencia es de igual magnitud casi siempre (en 8 de las
10 ocasiones la diferencia es de 5 mm de Hg, y en las dos restantes la diferencia es de 10 mm de
Hg). Las diferencias son sistemticas, van siempre en la misma direccin y son de similar magnitud.
En este caso el CCP detecta una alta correlacin, concretamente de 0,95. Sin embargo, el CCI s
que detecta que las diferencias son sistemticas y el resultado refleja una concordancia de 0,64.
Tabla 11-7. Medicin de la tensin arterial sistlica.
Paciente
Mdico A
Mdico B
(mm Hg)
(mm Hg)
Diferencia
(B-A)
135
140
140
145
130
135
145
150
140
145
150
160
10
140
145
135
140
140
145
10
135
145
10
Media
139
145
Desviacin
Estndar
5,68
6,67
2,11
ENS Octubre 2009
177
Epidemiologa Clnica
El clculo del CCI se basa en un modelo de anlisis de la varianza de medidas repetidas.

Se descompone la variacin total observada (varianza) en los siguientes componentes: la
variabilidad debida a las diferencias entre pacientes o individuos observados (Varianza entreindividuos = E); la varianza intra-individuos (I), en este caso debida a diferencias en mediciones
repetidas realizadas por distintos observadores, y por ltimo la varianza residual (R), que es la
parte de variabilidad inexplicable y que atribuimos al azar. El CCI se define como el cociente
entre la variabilidad entre-individuos y la variabilidad total
CCI
VE
V E V I V R
Cuando una prueba diagnstica sea muy fiable o cuando la concordancia entre dos
observadores sea muy alta, los resultados de las mediciones repetidas sobre un mismo individuo
sern muy parecidas y, en consecuencia, la varianza intra-individuos (I) ser muy baja y el
valor del CCI ser alto. Cuanto ms se aproxime a 0 el valor de la varianza intra-individuos,
ms se acercar a 1 el valor del CCI y viceversa. Puesto que es una proporcin, los valores
del CCI pueden variar de 0 a 1, donde 0 indica ausencia de concordancia, y 1 concordancia o
fiabilidad absoluta. Como norma general, valores inferiores a 0,4 indican escasa fiabilidad,
entre 0,4 y 0,75 la fiabilidad es buena, y valores superiores a 0,75 reflejan un grado excelente
de fiabilidad.
3.
ANLISIS DE DECISIONES CLNICAS.
En cualquier contacto clnico el mdico o profesional sanitario se enfrenta a la responsabilidad

de decidir. Un razonamiento habitual en la prctica es el heurstico. ste se utiliza cuando se
piensa y se valora una situacin integrando los conocimientos y las experiencias adquiridas de
forma espontnea. Sin embargo, existen tcnicas, agrupadas bajo el epgrafe de Tcnicas de
Anlisis de Decisin, que estructuran y facilitan la toma de decisiones mediante mecanismos
explcitos que permiten evaluar y hacer ms racional la actividad clnica.
El Anlisis de Decisin puede definirse como una herramienta cuantitativa que evala el
valor relativo de cada una de las opciones existentes en una decisin. Divide los problemas
complejos en partes ms sencillas, los analiza en detalle y los combina de nuevo de manera que
se pueda identificar la mejor estrategia. Trata de evitar los errores producidos al establecer
juicios clnicos basados fundamentalmente en la intuicin clnica o en la experiencia personal.
El anlisis de decisin es un procedimiento de apoyo a la toma de decisiones, basado en la
utilidad esperada de cada opcin desde una determinada perspectiva. A la vez, constituye un
mtodo sistemtico de identificacin de opciones, cuantificacin de expectativas o probabilidades,
asignacin de valores a resultados y comparacin entre opciones. En medicina se utiliza tanto
para facilitar la toma de decisiones en la prctica clnica, ante pacientes concretos, como para
disear estrategias globales aplicables a un amplio grupo de pacientes o a la poltica sanitaria.
El abordaje de un problema mediante una tcnica de anlisis de decisin est indicado
cuando se dan las siguientes circunstancias:
Existe un conjunto de alternativas reales bien definidas entre las que escoger.
Se detecta incertidumbre sobre las consecuencias de las alternativas.
La persona o personas que deciden tienen preferencias acerca de los posibles
resultados.
ENS Octubre 2009
178
Epidemiologa Clnica
Existen una o ms restricciones que limitan el conjunto de alternativas. Por ejemplo, el

coste de oportunidad de vacunar a toda la poblacin escolar de hepatitis B es tan grande
que nos impide realizar otras actuaciones sanitarias con una mejor relacin costeefectividad.
El problema precisa que se tome una decisin.
En algunos estudios que abordan una situacin clnica complicada, el anlisis de decisin
revela la necesidad de obtener nuevas evidencias cientficas que permitan tomar decisiones con
base cientfica. En otros casos puede indicar que las diferencias entre los resultados de las
distintas estrategias son muy pequeas, lo que suele deberse a errores del mtodo. Incluso
cuando resulta potencialmente til, puede no ser factible completar los clculos o el anlisis de
sensibilidad precisos por limitaciones de tiempo o de recursos. No obstante, el valor del enfoque
analtico del proceso de decisin radica en que integra los datos disponibles, obliga a un
razonamiento riguroso y expone las reas de incertidumbre o ignorancia.
3.1.
Los rboles de Decisin.
Los rboles de Decisin son las tcnicas ms usadas entre la amplia gama de tcnicas de
anlisis de decisin existentes. Son tiles para explicitar la secuencia temporal y lgica de las
diferentes alternativas de un problema, de tal manera que sea fcil comprender todas sus posibles
decisiones y consecuencias. La figura 11-2 muestra un ejemplo de rbol de decisin para decidir si
tratar con un determinado frmaco tromboltico intravenoso a los pacientes en los que se sospecha
infarto agudo de miocardio.
Figura 11-2. rbol de decisin sobre la trombolisis en pacientes con sospecha de infarto agudo de miocardio.
Fuente de la figura 11-2: Mundet X, et al. Utilidad del cociente albmina/creatinina en el diagnstico
de la nefropata en pacientes con diabetes mellitus tipo 2. Med Clin (Barc) 2001; 116: 732-733.
Imagen reproducida con autorizacin del titular de los derechos de explotacin de la misma.
La estructura y smbolos (cuadrado y crculo) de los rboles de decisin estn

estandarizados. Utilizando como marco el ejemplo de la figura 11-2 se explican a continuacin
ENS Octubre 2009
179
Epidemiologa Clnica
los significados y la forma de elaborar e interpretar los rboles de decisin. El cuadrado o

ncleo marcado con la letra A indica la decisin que el mdico debe tomar. Los crculos,
marcados de B a O, indican los diferentes resultados. Cada uno de ellos proviene de una rama
en la que se debe escribir la probabilidad conocida que tiene de producirse ese resultado. Cada
una de las evoluciones finales posibles recibir una utilidad o preferencia, o sea, una valoracin
cuantitativa de lo apreciado que resulta ese resultado en relacin con los dems. El valor de
cada resultado final se obtiene multiplicando todas las probabilidades de cada una de las ramas
por la utilidad asignada a ese final de rama. Por ltimo, para obtener el valor final de decidir
tratar con trombolisis frente al valor de no hacerlo, se suman los valores relativos de todas las
puntas de rama resultado de esas dos decisiones, y posteriormente se elegir la opcin que
muestre el mayor valor. La tabla 11-8 describe los pasos del anlisis basado en rboles de
decisin.
Tabla 11-8. Fases del diseo de un anlisis basado en un rbol de decisin.
1.
IDENTIFICAR Y LIMITAR EL PROBLEMA, de tal manera que se establezcan

todas las alternativas de decisin y los resultados a que pueden dar lugar. Se deben
incluir los aspectos ms relevantes que puedan determinar los resultados y la utilidad
de los cursos de accin, definir claramente la perspectiva del anlisis, identificar
todas las alternativas y el horizonte temporal de anlisis.
2.
CONSTRUIR UN RBOL DE DECISIN QUE ESTRUCTURE EL

PROBLEMA. Seleccin de las opciones, nodos de decisin y nodos finales. Debe
mantenerse el equilibrio entre complejidad y simplicidad, logrando que los
elementos esenciales, tanto en lo que se refiere a opciones de accin como a
valores estn incluidos en el modelo.
3.
ESTIMACIN DE PROBABILIDADES Y ASIGNACIN A LOS CURSOS DE

ACCIN. Recopilar informacin mediante una revisin sistemtica de la literatura,
consulta a expertos o bsqueda de datos primarios, para estimar las probabilidades
que van a ser asignadas a cada uno de los componentes del rbol. La probabilidad
final de que ocurra el suceso definido por una rama se halla multiplicando todas
las probabilidades de todos los trayectos de rama necesarios para llegar a ese
resultado clnico final.
4.
ASIGNACIN DE VALORES Y UTILIDADES A LAS CONSECUENCIAS O

RESULTADOS FINALES. Los resultados clnicos finales pueden expresarse de
diversas formas: aos de vida, aos de vida ajustados por calidad, esperanza de
vida ajustada por calidad, casos de enfermedad evitados o complicaciones
evitadas, o utilidades. La utilidad es una medida de la preferencia relativa,
perspectiva, que tiene alguien respecto de un determinado resultado. Se expresa
en una escala entre 0 y 1, de tal manera que al resultado de menor utilidad, la
muerte sera el caso extremo, se le asigna el valor 0; y al de mayor utilidad, la
salud plena sera el otro extremo, el valor 1.
5.
INTERPRETACIN DE LOS RESULTADOS Y VALORACIN DE LA

INCERTIDUMBRE. Conociendo la probabilidad de que ocurra cada suceso, o rama
del rbol, y su utilidad se dispone de todos los datos para interpretar los resultados y
poder elegir el curso de accin ms favorable. Por ltimo, es aconsejable realizar un
anlisis de sensibilidad que nos confirme la estabilidad de nuestros resultados en
diferentes circunstancias.
Respecto al diseo de rboles de decisin se han realizado recomendaciones generales para

evitar errores e incorrecciones en su construccin, entre las que se incluyen las siguientes:
Procurar el balance entre riesgos y beneficios de la intervencin en las distintas
ramas.
ENS Octubre 2009
180
Epidemiologa Clnica
Situar preferentemente dos ramas en cada nodo de decisin.

Las ramas deben incorporar informacin sobre las probabilidades de ocurrencia de
cada una de las opciones en que se dividen. Esta informacin debe estar basada en la
evidencia cientfica.
Asegurar la simetra.
Incluir todas las condiciones determinantes que pueden afectar a los resultados.
Las utilidades pueden ser estimadas por diversos procedimientos: juicio de expertos; opinin
de las personas que realizan el estudio; bsqueda en la literatura cientfica o estudio ad hoc.
El rbol de decisin es la tcnica principal y ms empleada en los anlisis de decisin.
Otras tcnicas son el anlisis de umbrales de decisin y el proceso de Markov (que se describen
a continuacin); los modelos de simulacin de Monte-Carlo, y los mtodos de medicin de
preferencias entre estados de salud standard gamble, time trade-off y category scaling.
El anlisis de umbrales de decisin es un tipo de anlisis de decisin que utiliza la teora
de Bayes para valorar, por ejemplo, la conveniencia de realizar una prueba diagnstica a un
paciente. Parte del concepto de que realizar un test a un paciente es intil si no sirve para
modificar la estrategia teraputica o el manejo clnico global de ese paciente. El umbral es el
nivel de probabilidad en el que el beneficio previsible de tomar una decisin iguala al de no
tomarla o al de tomar una alternativa.
Las cadenas de Markov, o el proceso de Markov, son un mtodo cuantitativo dinmico que
toma en consideracin la probabilidad de que un paciente cambie de un estado de salud a otro
en un determinado perodo de tiempo, es decir, la probabilidad de transicin para ese determinado
estado. En este modelo es necesario definir por adelantado cules son los estados de salud de
inters y especificar todas las posibles transiciones o caminos entre estados.
4.
EL CASO DE LA EVALUACIN DE UNA PRUEBA DIAGNSTICA APLICADA EN

CRIBADO POBLACIONAL. EL CRIBADO POBLACIONAL DE CNCER DE MAMA
MEDIANTE MAMOGRAFA.
4.1. Conceptos bsicos sobre cribado poblacional

El cribado es un proceso de identificacin y seleccin de sujetos con una enfermedad o
caracterstica definida en una poblacin. Si se trata de una enfermedad, en ocasiones, el cribado
proporciona un diagnstico precoz de la misma.
El cribado puede ser organizado y sistemtico, dirigido a toda la poblacin, habitualmente
mediante un procedimiento de citacin y recitacin basado en listados exhaustivos de la
misma (Ej.: Cribado poblacional de cncer de mama mediante mamografa en mujeres de
50-65 aos). Puede dirigirse a subgrupos especficos, como cribado prescriptivo en grupos de
alto riesgo (Ej.: Endoscopia en personas con historia familiar de poliposis intestinal). O puede
realizarse de forma oportunista, tambin llamado bsqueda de casos (Ej.: Cribado de fumadores
en atencin primaria independientemente del motivo de consulta). El cribado puede ser
ocasional o peridico, dirigirse a la identificacin de una o varias condiciones (enfermedades,
factores de riesgo, caractersticas), utilizar una sola prueba o un conjunto de pruebas
secuenciales.
El objetivo del cribado poblacional de una enfermedad es reducir la carga de morbilidad y
mortalidad asociada a la misma enfermedad. Su potencial utilidad se basa en el hecho demostrable
de que en la historia natural de dicha enfermedad existe una oportunidad (mediante la aplicacin
ENS Octubre 2009
181
Epidemiologa Clnica
de una prueba diagnstica valida, reproducible sencilla, aceptable) de adelantarnos en el

momento del diagnstico, y este hecho permite que la aplicacin del tratamiento disponible
ofrezca un curso ms favorable de la historia natural de la enfermedad (menor morbilidad,
mayor supervivencia, mejora de la funcin o calidad de vida).
El conjunto de factores que tienen que concurrir para que desde una perspectiva social est
justificada la utilizacin de un prueba diagnstica en cribado (contexto de baja prevalencia) son
mltiples. Intervienen factores del conocimiento de la propia historia natural de la enfermedad,
de la disponibilidad de una prueba adecuada para su uso en este contexto, de la factibilidad del
programa (organizacin, registro, participacin, calidad de todos los aspectos del programa,
recursos, costes).
Dada la complejidad, recursos necesarios y efectos adversos potenciales de los programas
de cribado poblacional es exigible la disposicin de evidencias del ms alto nivel de calidad
sobre la eficacia, efectividad y eficiencia de la intervencin propuesta.
Cuando no se dispone de informacin suficiente sobre la eficacia, o esta procede de
estudios de baja calidad por su diseo (estudios observacionales) las medidas de efecto de las
intervenciones de cribado suelen estar sobrevaloradas debido a una serie de sesgos (de
participacin voluntaria personas con mejor pronstico-; de adelanto en el momento del
diagnstico- el cribado permite conocer antes el diagnstico pero no es capaz de alterar la
historia natural de la enfermedad; de duracin de la enfermedad- ms probable sobrerepresentacin de casos con fase preclnica detectable de mayor duracin y mejor
pronstico).
Por estas razones, la decisin de poner en marcha un programa de cribado de una enfermedad
o factor de riesgo debe basarse en la mejor evidencia cientfica disponible (ensayos aleatorios
controlados, estudios de efectividad poblacional, estudios de coste-efectividad) y un proceso de
evaluacin exhaustivo de todos los aspectos que determinan el logro de los objetivos planteados
(eficacia, efectividad, eficiencia, aceptabilidad, recursos disponibles, organizacin, etc.).
4.2.
Cribado de cncer de mama mediante mamografa
El caso del cribado de cncer de mama mediante mamografa ha sido controvertido en

distintos aspectos, sobre todo desde la perspectiva de la salud pblica, como intervencin no
suficientemente focalizada en las posibles beneficiarias de la misma. Las estimaciones del
nmero necesario de mujeres a cribar para reducir una muerte/ao obtenidas tanto de los
resultados de los ensayos como de las experiencias de algunos programas estn en el rango
de 5.000 a 10.000.
La extensin de la realizacin de cribado de cncer de mama, ha provocado un aumento en
el nmero de mamografas, de pruebas diagnsticas complementarias y de biopsias mamarias
de lesiones detectadas. El salto de una prueba diagnstica de su uso en contexto clnico de alta
prevalencia a su utilizacin poblacional en mujeres asintomticas (contexto de baja prevalencia)
plantea los problemas de manejo de los falsos positivos, el sobre-diagnstico y el sobretratamiento.
Actualmente todas las CCAA espaolas cuentan con programas de cribado de cncer de
mama. La cobertura poblacional es variable, dado que muchas CCAA han optado por el previo
desarrollo de proyectos piloto o la implantacin inicial en poblaciones limitadas de su mbito
territorial. Los programas se dirigen a mujeres de 50 a 65 aos, si bien algunos programas
incluyen a mujeres de 45 a 65 aos. Todos han optado por la mamografa como prueba
diagnstica, en proyeccin nica o doble, con una periodicidad de 2 aos.
ENS Octubre 2009
182
Epidemiologa Clnica
4.3.
Validez diagnstica de la mamografa de cribado.
La mamografa de cribado se ha consolidado como la prueba ms idnea para su utilizacin

en los programas de deteccin precoz de cncer de mama. La amplia experiencia en su uso y las
continuas mejoras en su perfil de precisin diagnstica y seguridad han reafirmado su
posicionamiento frente a otras pruebas diagnsticas alternativas o complementarias. Su elevada
aceptabilidad, sencillez y bajo coste relativo son caractersticas que apoyan su uso en amplios
grupos de poblacin.
La sensibilidad de la mamografa de cribado a 1 ao obtenida en distintos ensayos y
programas demostrativos vara entre el 83% y el 95%. La especificidad obtenida es tambin
aceptable y vara entre el 93% y el 99%. El problema fundamental, comn a otros mbitos de
aplicacin de pruebas diagnsticas de aceptable validez en contextos de baja prevalencia (en el
caso del cncer de mama prxima a 3 por 1000), es el relativamente bajo valor predictivo
positivo de la mamografa inicial de cribado. En distintos ensayos y programas demostrativos
el valor predictivo de un resultado positivo, muy asociado a la prevalencia del cncer de mama
y a la especificidad de la mamografa, se sita entre un 5% y un 20%. Lo que supone la realizacin
de pruebas diagnstico-teraputicas innecesarias en el 80 al 95% de las mujeres a las que se da
un resultado positivo en la mamografa.
4.4.
Eficacia de la intervencin
La evidencia cientfica proporcionada por los ensayos controlados y aleatorios realizados

desde los aos sesenta a los ochenta en Europa, Canad y los Estados Unidos permite esperar
que los programas de cribado contribuyan a reducir el riesgo absoluto de mortalidad por cncer
de mama en las mujeres que inician la participacin en los programas con 50 a 64 aos de edad
en un 20% a un 30%. En este grupo de edad se ha mostrado en los ensayos la obtencin de
mayor potencial de beneficio (Tabla 11-9). Estos ensayos contaron con la participacin y
seguimiento de ms de medio milln de mujeres comprendidas entre 40 y 74 aos, en las que
se evalu el efecto de distintas intervenciones (una o dos proyecciones mamogrficas, con o sin
examen clnico y con periodicidad variable entre 12 meses y 3 aos). Se trata de ensayos de
campo sobre el efecto de una intervencin preventiva cuyo resultado final es la mortalidad por
cncer de mama. Los sujetos incluidos en los estudios son representativos de la poblacin a la
que tericamente se dirigira la intervencin, los criterios de inclusin mnimamente restrictivos
y los protocolos de aplicacin reproducen lo que seran componentes de los programas de
cribado, facilitando la generalizabilidad de los resultados.
Tabla 11-9. Eficacia de la mamografa de cribado para reducir la mortalidad por cncer de mama.
Riesgo relativo de mortalidad por cncer de mama en grupo de intervencin comparado con grupo control.
Estudio
Riesgo Relativo (IC 95%)
HIP de Nueva York
0,79 (0,61-0,95)
Edimburgo
0,87 (0,70-1,08)
stergotland (Two-county)
0,76 (0,61-0,95)
Kopparberg (Two-county)
0,58 (0,45-0,76)
Estocolmo
0,73 (0,50-1,06)
Malm
0,96 (0,68-1,35)
Gteborg
0,55 (0,31-0,95)
Canada
1,08 (0,84-1,40)
ENS Octubre 2009
183
Epidemiologa Clnica
Numerosos meta-anlisis de los ensayos disponibles fueron publicados en los aos noventa
confirmando la evidencia de efecto de reduccin de mortalidad en el conjunto de edades
consideradas, siendo ms relevante el efecto en las mujeres que inician la participacin en los
programas a los 50 aos. Por el contrario, en las mujeres que inician el cribado a los 40-49 aos
no se puede descartar la hiptesis de efecto nulo y se concluye que el efecto no puede ser
detectado o es muy limitado, y claramente inferior al observado en mujeres postmenopasicas.
La forma de presentacin y comunicacin de los resultados de los ensayos ha contribuido
en cierta medida a una percepcin sobredimensionada del efecto del cribado. Se han utilizado
las razones de la mortalidad acumulada por cncer de mama observadas en el grupo de
intervencin y el grupo control, medidas al final del periodo de seguimiento y expresadas en
trminos relativos (riesgo relativo). As un riesgo relativo de 0.79 se expresa como una
reduccin de la mortalidad por cncer de mama de un 21% atribuible a la intervencin de
cribado. Los resultados de los ensayos tambin se pueden presentar como el nmero necesario
de mujeres a cribar para evitar una muerte al ao, o la reduccin del riesgo absoluto de morir
por cncer de mama en un periodo y grupo de edad determinado. Una mujer de 50 aos
asintomtica podra estar interesada en conocer su riesgo estimado de muerte por cncer de
mama en los prximos 15 aos y en cuanto se reducira potencialmente dicho riesgo absoluto
en caso de participar en el programa de cribado. En el caso hipottico de que este riesgo fuera
un 5 por 10.000, segn las evidencias cientficas publicadas se podra esperar que con la
intervencin este riesgo individual se redujera hasta un valor de 4 por 10.000. La diferencia
absoluta sera de un 1 por 10.000.
Recientemente, Gotzsche y Olsen, publicaron en Lancet y en la Cochrane Library los
resultados de sendas revisiones sistemticas sobre la eficacia de la mamografa para reducir la
mortalidad por este tumor. En su primer trabajo, los autores daneses analizan la calidad de los
ocho ensayos disponibles segn el mtodo de randomizacin y asignacin ciega de las
participantes al grupo de intervencin y control, el uso de asignacin individual, la efectividad
de la asignacin aleatoria en la obtencin de grupos comparables, la justificacin de exclusiones
y la fiabilidad de la medicin del resultado final (la asignacin de muertes por cncer de mama
en el grupo de estudio y control). El uso excluyente de criterios de calidad lleva a los autores de
la revisin a considerar slo dos de los estudios disponibles (Canad y Malm), valorados como
de mediana calidad.
La medida sumarizada del efecto de la intervencin sobre la mortalidad por cncer de
mama estimada en estos estudios es 1,04 (IC 95%: 0,84-1,27) y sobre la mortalidad total es 0,99
(IC 95%: 0,94 -1,05), en ambos casos interpretadas como nulidad de efecto. Los autores
concluyen adems que la mamografa de cribado no es eficaz para la reduccin de la mortalidad
por todas las causas, nico resultado que puede ser valorado en los estudios disponibles de
forma fiable, y que los programas de cribado existentes no estaran suficientemente justificados.
Se puede decir que los autores daneses se sitan en una posicin extrema, no compartida por los
propios investigadores autores de los ensayos, que minusvalora la contribucin de ensayos
relevantes y no considera otra informacin relevante disponible sobre la eficacia y efectividad
de la intervencin (estudios observacionales).
Existen un conjunto de factores que condicionaran la variabilidad de los resultados
obtenidos por los ensayos y que pueden tener un peso relevante en la sobreestimacin o
infraestimacin del efecto en cada uno de los estudios. Estos factores no estaran exclusivamente
relacionados con el diseo y calidad del estudio, aspectos en los que centran la atencin los
autores daneses y que utilizan como criterios excluyentes en el anlisis, sino que estaran
asociados a las caractersticas diferenciales de las poblaciones estudiadas, el ao de inicio del
estudio (contexto de incidencia, actualizacin diagnstica y teraputica, conocimiento pblico
ENS Octubre 2009
184
Epidemiologa Clnica
del efecto), las distintas modalidades de intervencin, y la variedad en las periodicidades y tipos
de anlisis desarrollados.
4.5.
Efectos adversos
La realizacin de la mamografa de cribado implica tambin ciertos riesgos,

fundamentalmente punciones, biopsias y otras pruebas diagnsticas. La realizacin de la
mamografa provoca molestias de intensidad variable y un riesgo reducido de cncer de mama
atribuible a la irradiacin. Los riesgos ms importantes se relacionan con los resultados falsos
positivos y su manejo clnico. Los falsos negativos tambin pueden generar una falsa seguridad
que se traduzca en un retraso en el diagnstico clnico y aparicin de cnceres de intervalo. Se
ha comprobado que la mamografa de cribado positiva puede afectar psicolgicamente a la
mujer por la ansiedad que origina, a lo que se unen los posibles efectos adversos de nuevas
exploraciones.
La mamografa de cribado y el conjunto de actividades del programa deben marcarse la
excelencia y garantizar una alta calidad que permita minimizar los efectos adversos de la
aplicacin masiva de la prueba. Por otra parte, la mujer debe ser informada de los beneficios e
inconvenientes de la realizacin de la mamografa y debe participar libremente en la decisin
de someterse peridicamente a la prueba.
Un porcentaje muy reducido de mamografas de cribado positivas son confirmadas
finalmente como cncer de mama (5-20%). Por lo tanto, el 80-95% de las mujeres con
mamografa positiva inician estudios diagnsticos (examen clnico, mamografas adicionales,
ecografa, citologa, puncin, biopsia) que finalmente no confirman el diagnstico de cncer de
mama. Se ha observado un incremento significativo del riesgo de mastectomas y tumorectomas
entre las mujeres a las que se realiza mamografa frente al grupo control (sin mamografa) (1,31
(IC 95%:1,2-1-42)) y tambin un aumento de la probabilidad de tratamiento con radioterapia
(1,24 (1,04-1,49), lo que a su vez se ha asociado a un incremento de la mortalidad
cardiovascular.
4.6.
Efectividad del cribado poblacional de cncer de mama
Resulta muy difcil atribuir a la deteccin precoz obtenida en los programas de cribado los
cambios observados en la mortalidad que tambin estn determinados por numerosos factores,
entre los que destacan las mejoras en el manejo clnico y la actualizacin teraputica. La reciente
reduccin en las tasas de mortalidad por cncer de mama en mujeres de 20-69 aos observada
en el Reino Unido y los EE.UU. en la dcada de los noventa se atribuye fundamentalmente a la
actualizacin teraputica (tratamiento sistmico y ciruga).
A pesar de la difusin de los programas de cribado, algunos con cobertura nacional y ms
de 15 aos en desarrollo, es muy limitada la evidencia sobre el impacto de los mismos en la
evolucin de las tasas de mortalidad por cncer de mama. Algunas valoraciones de resultados
intermedios o finales de programas de amplia cobertura realizados en pases como el Reino
Unido, Holanda o Finlandia arrojan resultados inicialmente positivos o prometedores. Sin
embargo, el efecto observado en otros pases es muy limitado (Suecia).
Es necesario reconocer que los programas de cribado estn teniendo un efecto global sobre
la mejora en la organizacin de la asistencia al cncer de mama, concentrando recursos en la
atencin a este tumor, reduciendo la demora diagnstica y teraputica, actualizando los
tratamientos, facilitando la estandarizacin de la prctica clnica, mejorando la calidad de la
atencin general e incrementando la equidad y accesibilidad al tratamiento ms adecuado.
ENS Octubre 2009
185
Epidemiologa Clnica
La evidencia cientfica, an basada en estudios de alta calidad, rara vez resulta

suficientemente clara, consistente y determinante como para dar respuesta a todos los
interrogantes e incertidumbres planteados y representar una gua no sujeta, a su vez, a
interpretacin. La misma evidencia cientfica ha servido tanto para justificar la aplicacin y
difusin de programas nacionales como para el rechazo de los mismos a cualquier nivel
poblacional en distintos pases desarrollados.
El factor ms relevante a valorar es si desde la perspectiva social, o de salud pblica, los
beneficios potenciales de la intervencin superan a los costes y riesgos asumidos por el conjunto
de las mujeres, en cunto los superan y en qu condiciones se puede lograr este objetivo
(organizacin, calidad y excelencia de los programas de cribado). Las mujeres convocadas a
participar peridicamente en los programas deben conocer de forma razonable la informacin
disponible sobre los beneficios potenciales ms relevantes, en trminos absolutos (potencial de
reduccin de su riesgo personal real) y relativos, as como los riesgos y efectos adversos
asociados ms relevantes y su frecuencia.
5.
FLETCHER RH, FLETCHER SW, WAGNER EH. Epidemiologa Clnica. Barcelona: Ediciones Consulta, SA, 1989.
GOTZSCHE PC, OLSEN O. Is screening for breast cancer with mammography justifiable? Lancet 2000; 355:129-34.
JENIZEK M. Epidemiologa. La lgica de la medicina moderna. Barcelona: Masson, SA editores, 1996.
JONNSON H, NYSTROM L, TORMBERG S, LENNER P. Service screening with mammography of women aged 50-69
years in Sweden: effects on mortality from breast cancer. J Med Screen 2001; 8:152-60.
MUSHLIN AI, KOUIDES RW, SHAPIRO DE. Estimating the accuracy of screening mammography: a meta-analysis.
Am J Prev Med 1998;14(2):143-153.
REY CALERO J, HERRUZO CABRERA R, RODRGUEZ ARTALEJO F. Fundamentos de Epidemiologa Clnica.
Madrid: Editorial Sntesis, S.A,; 1996.
RODRGUEZ ARTALEJO F, BANEGAS BANEGAS JR, GONZLEZ ENRQUEZ J, MARTN MORENO JM,
VILLAR LVAREZ F. Anlisis de decisiones clnicas. Med Clin (Barc) 1990; 94: 348-354.
SACKETT DL, HAYNES RB, GUYATT G, TUGWELL P. Epidemiologa Clnica. Ciencia bsica para la medicina
clnica (2 edicin). Buenos Aires: Editorial Mdica Panamericana S.A., 1994.
SACKETT DL, RICHARDSON WS, ROSENBERG W, HAYNES RB. Medicina Basada en la Evidencia. Cmo ejercer
y ensear la MBE. Madrid: Churchill-Livingstone, 1997.
ENS Octubre 2009
186
Revisin Sistemtica y Metaanlisis
XII. REVISIN SISTEMTICA Y METAANLISIS

Miguel Delgado Rodrguez
1.
INTRODUCCIN
El trmino metaanlisis precede cronolgicamente al concepto de revisin sistemtica. Lo

acu el psiclogo Glass en 1976 para definir un conjunto de tcnicas que se utilizan para
cuantificar la informacin contenida en estudios similares que valoran una misma pregunta de
investigacin. Surge ante la abundancia de informacin existente, muchas veces con resultados
contradictorios, como una tcnica eficiente y reproducible, en la que la unidad de anlisis no es
el individuo sino el estudio de investigacin.
Para que la extrapolacin de resultados a la poblacin tenga sentido es necesario que se
haga sobre el mayor nmero posible de investigaciones y ello da origen al concepto de revisin
sistemtica. La revisin sistemtica es definida por la colaboracin Cochrane como una sntesis
de los resultados de varios estudios primarios mediante tcnicas que limitan los sesgos y el error
aleatorio. En la actualidad el trmino metaanlisis se reserva para denominar las tcnicas
estadsticas de combinacin de resultados, mientras que en el pasado inclua tambin la nocin
de revisin sistemtica.
La idea de combinar los resultados de estudios pequeos para llegar a conclusiones ms
firmes no es reciente. Por ejemplo, Karl Pearson en 1904 agrup datos de instalaciones militares
de Sudfrica y la India y concluy que la vacunacin contra la fiebre intestinal no era eficaz;
Joseph Goldberger, el investigador de la pelagra, en 1907 public una sntesis de la frecuencia
de infeccin urinaria en la fiebre tifoidea. Pero no es hasta finales de los aos 1970 cuando se
empiezan a realizar metaanlisis a gran escala. Inicialmente se consider que slo deba
aplicarse para la combinacin de estudios de intervencin, preferiblemente aleatorizados (la
colaboracin Cochrane mantiene este criterio), aunque su uso se ha extendido a cualquier tipo
de diseos.
2.
OBJETIVOS
La revisin sistemtica se puede aplicar a cualquier pregunta de investigacin, ya sea sobre

la etiologa (por ejemplo, factores del estilo de vida como causa de enfermedad), diagnstico
(por ejemplo, sensibilidad y especificidad de la TAC en lesiones neoplsicas), pronstico (por
ejemplo, valor de la p53 en el cncer) o de intervencin, ya sea de prevencin (por ejemplo,
eficacia de una vacuna) o de tratamiento (por ejemplo, los fibrinolticos en el tratamiento del
infarto de miocardio). Los objetivos que se pueden perseguir en estos planos son: (a) valorar la
consistencia (o su ausencia, la heterogeneidad) entre los diferentes estudios reunidos; (b) obtener
un estimador global de la relacin entre las variables objeto de la investigacin; (c) identificar
los subgrupos que son particularmente susceptibles a la exposicin que se estudia; y (d) valorar
la calidad de cada una de las investigaciones individuales y ofrecer un esquema de la metodologa
a seguir en futuros estudios.
ENS Octubre 2009
187
3.
PROTOCOLO
El esquema general de diseo es el siguiente:
1. Hiptesis de trabajo.
2. Revisin sistemtica
a) Seleccin de la poblacin de estudio: fuentes de informacin, criterios de bsqueda
de la informacin y criterios de inclusin de una investigacin.
b) Recogida de datos: valoracin de la validez de los estudios primarios y extraccin
de la informacin relevante de cada estudio.
3. Metaanlisis: mtodos estadsticos empleados para la combinacin de resultados,
valoracin de la heterogeneidad y del sesgo de publicacin.
4.
ORIGEN DE LA HIPTESIS
Lo ideal es que se origine con una informacin diferente de la que luego se utilizar. Por
ejemplo, comprobar en ratones que la dieta rica en ajo disminuye el riesgo de cncer inducido
por carcingenos puede ser el detonante de una revisin sistemtica de estudios humanos sobre
esa asociacin. No obstante, lo habitual es que la hiptesis de una revisin sistemtica se origine
tras la lectura de varios informes, que luego formarn parte de la poblacin de estudio. Esto
constituye una debilidad bajo la lgica formal de la investigacin, ya que para verificar una
hiptesis no se puede utilizar la misma informacin con la que se genera. Hacer una revisin
sistemtica sobre todos los tratamientos de una enfermedad para ver lo que sale, en la que no
hay una hiptesis a priori, es un estudio exploratorio en el que no se puede sacar nada, como no
sea realizar un nuevo ensayo clnico para verificar las ideas generadas por la revisin.
5.
SELECCIN DE LA POBLACIN DE ESTUDIO
5.1. Bsqueda de la informacin

5.1.1.
Estrategias
La poblacin de referencia en una revisin sistemtica est configurada por todos los
estudios realizados sobre un tema concreto. Existen varias estrategias:
a) Buscar toda la informacin disponible, publicada y no publicada. Para aproximarse a
la no publicada se pueden buscar las tesinas de licenciatura y tesis doctorales, becas
concedidas y solicitadas, contratos de investigacin, actas de congresos y el contacto
con especialistas en el tema. El problema es encontrar bases de datos que contengan
esta informacin con una perspectiva internacional, lo que exige tiempo y dinero. Otro
problema es su calidad, que puede ser muy variable, y diferir la de los estudios no
publicados de la de los publicados. Frente a estos inconvenientes, esta estrategia
presenta la ventaja de que intenta evitar el sesgo de publicacin.
b) Utilizar slo estudios publicados: es lo ms frecuente. Ahorra tiempo y dinero con
respecto a la opcin anterior. Presenta el problema del sesgo de publicacin: lo publicado
no tiene porqu representar todo lo realizado.
c) Utilizar las bases originales de datos de los estudios que se combinan: cada vez se
difunde ms su uso. El primer estudio de este tipo se public en 1990: 12 grupos se
unieron para examinar la hiptesis de dieta y cncer de mama a travs de sus 12 estudios
ENS Octubre 2009
188
de casos y controles. No fue exhaustivo, ya que en ese momento existan muchos ms

estudios. Las ventajas de la combinacin de bases de datos son que permite el anlisis
de exposiciones raras y que se pueden examinar mejor las relaciones de confusin e
interaccin. Entre sus inconvenientes estn que es menos factible que otras estrategias,
ya que los autores deben dar los datos (mayor posibilidad de sesgo de seleccin) y que
requiere ms tiempo.
5.1.2.
Mtodos de bsqueda
Los mtodos de bsqueda de informacin que se pueden utilizar son:

a) Uso de repertorios informatizados: El ms usado es MEDLINE, que tiene el
inconveniente del sesgo hacia las revistas anglosajonas, 55% del total. Slo cubre
un 20% de las revistas publicadas. Se recomienda en el momento actual que se consulten
cuantas ms bases de datos mejor; no obstante, se siguen viendo revisiones que slo
utilizan Medline. Las estrategias de bsqueda no deben confiar slo en las palabras
clave, tambin debe buscarse por sinnimos en la opcin de bsqueda libre. El principal
inconveniente de los repertorios es que no son exhaustivos de todas las revistas que
existen y que no incluyen libros (tambin en ellos aparecen estudios originales) ni
literatura gris.
b) Consulta de la bibliografa de cada uno de los artculos localizados: siempre ha de
hacerse. Con ello el investigador se beneficia de las revisiones hechas por otros
investigadores y facilita la localizacin de artculos en revistas no recogidas en los
repertorios de consulta o errores en la indexacin de artculos.
c) Consulta con investigadores que hayan estudiado el problema: ayuda a la identificacin
de estudios no publicados, con el inconveniente de que la informacin proporcionada
puede ser subjetiva.
d) Revisin de los ndices de las revistas: No todas las preguntas de investigacin estn
bien codificadas por palabras clave en los repertorios. Adems, y por regla general, los
artculos centrados en un tema se suelen publicar en un rango limitado de revistas,
como ensea la bibliometra.
f) Otras fuentes: actas de congresos, repertorios de tesis, etc. Esto normalmente se hace
para identificar estudios no publicados.
5.1.3.
Sesgo de publicacin
Por las dificultades enumeradas con anterioridad lo ms frecuente es que los investigadores
se basen en estudios publicados y aunque intenten sacar a la luz los no publicados, los publicados
tienen ms probabilidad de ser localizados. El sesgo de publicacin se origina cuando lo que se
publica no es representativo de lo que se investiga. La trascendencia de este sesgo es grande
para investigadores y lectores: si lo que aparece no representa la realidad, se est distorsionando
el propio proceso de aprendizaje. Por eso es muy importante saber si este sesgo se presenta y
cules son las razones que favorecen su presencia.
La culpa de la presencia del sesgo no slo reside en los evaluadores y comits editoriales
de las publicaciones cientficas, tambin reside en los autores, que en muchas ocasiones son los
primeros en decidir no enviar sus investigaciones por diversas razones: por la falta de inters de
los resultados, por no tener la propiedad de los datos (estudios financiados por la industria, que
puede tener inters en que los resultados que no la favorezcan permanezcan en el anonimato),
o por problemas de diseo o ejecucin de un estudio que impidieron la obtencin de resultados
vlidos.
ENS Octubre 2009
189
Los hechos que se conocen que influyen en la presencia del sesgo de publicacin son:
a) Significacin estadstica del resultado. Es el ms importante y en el que se basan los
procedimientos estadsticos para identificar la presencia del sesgo y que se vern al
final del tema. Se document ya en la dcada de 1950. Los resultados significativos
suelen ser los primeros en publicarse.
b) Caractersticas de la investigacin realizada: algunas de ellas se asocian con una
probabilidad diferencial de publicacin: los estudios aleatorizados y los multicntricos
se publican ms. El tamao de muestra tambin influye. Los estudios grandes suponen
un mayor esfuerzo en su diseo y ejecucin y los autores ponen un mayor inters en
que los resultados no permanezcan ignorados, ya sean positivos o negativos.
c) La fuente de financiacin se asocia con la publicacin. El conflicto de inters puede dar
lugar a publicaciones engaosas o maquilladas y dar pie a que cierta documentacin
tenga ms probabilidad de ser publicada. Un ejemplo de ello es el de la industria
tabaquera con los efectos del tabaquismo pasivo (se recoge la informacin que resulta
menos perjudicial para la industria).
d) El prestigio de la institucin puede jugar un papel en el sesgo de publicacin. Un
ejemplo histrico de esto es el artculo de Levin sobre la relacin entre el tabaco y el
cncer de pulmn, retenido por el director de JAMA ante la desconfianza surgida por
lo novedoso del diseo (uno de los primeros estudios de casos y controles de la historia),
hasta que lleg a sus manos un estudio similar (de Wynder y Graham), firmado por un
cirujano de prestigio mundial (Graham), conocido por sus innovaciones. Public los
dos estudios en el mismo nmero, pero primero el de Wynder y Graham.
e) Prejuicio: aqu el proceso editorial tiene ms responsabilidad. Por ejemplo, en la
relacin entre el consumo de cocana en el embarazo y riesgo fetal se ha comprobado
que los trabajos que no hallan un efecto nocivo sobre el feto se rechazan con ms
frecuencia, a pesar de que su calidad es similar a los restantes: as se est juzgando la
metodologa por los resultados, si stos no son crebles el evaluador piensa que algo
debe andar mal en los mtodos.
f) Regresin a la media: El sesgo de publicacin se ha intentado justificar parcialmente
como un fenmeno de regresin a la media. Los primeros artculos sobre una misma
pregunta de investigacin, por su mayor novedad, son ms fcilmente aceptados, que
los que a continuacin se remiten para su publicacin, y en los que se puede manifestar
con mayor intensidad los aspectos mencionados con anterioridad y que influyen en la
publicacin.
Para controlar el sesgo de publicacin se debe vigilar el proceso de revisin de los
manuscritos. Se prefiere la evaluacin enmascarada (el revisor desconoce a los autores del
artculo), aunque hay dudas acerca de si los autores deben conocer la identidad del revisor o sta
debe mantenerse annima.
El uso de cuestionarios estructurados en el proceso de evaluacin facilita la valoracin y la
hace ms reproducible, pero limita la expresividad de los autores y no todos los aspectos de un
estudio pueden contemplarse en un listado de preguntas. No obstante, el metaanlisis ha supuesto
la implantacin en muchas revistas de las normas CONSORT, para los que quieran publicar un
estudio de intervencin, y posiblemente ocurrir lo mismo con las normas STARD para pruebas
diagnsticas.
Debieran hacerse esfuerzos para que toda investigacin con un mnimo de calidad se
publicara, con independencia de la significacin de sus resultados, pero el papel se vende caro.
Una opcin futura es la edicin electrnica (internet).
ENS Octubre 2009
190
El registro de investigaciones, como la base de ensayos perinatales de Oxford o la

Colaboracin Cochrane, que intentan monitorizar todo ensayo clnico en marcha, tiene sus
limitaciones. Puede haber un conflicto de intereses, por ejemplo, si un organismo privado
prefiere que se ignore que un estudio est en marcha (no infrecuente en salud laboral) o cuando
se esperan beneficios econmicos en el desarrollo de nuevos frmacos. Tambin hay ventajas:
valorar el sesgo de publicacin, defender los derechos en ser el primero en investigar un tema,
conocer a otros que trabajan en temas relacionados, etc.
5.2.
Han de establecerse sin conocer los resultados de los distintos estudios. As se disminuye
el sesgo de seleccin. Los estudios identificados con la bsqueda constituyen la serie inicial,
pero no todos ellos sern incluidos en el anlisis. Es necesario definir mediante unos criterios
de inclusin los que permanecern y los que sern desechados.
a) Idioma: es muy frecuente restringir el idioma, ya que es imposible dominar todos.
Sera aceptable si la finalidad fuera, por ejemplo, la valoracin metodolgica de un
determinado tpico en un cierto mbito, como un anlisis de la calidad de los estudios
coste-eficacia en las revistas cientficas publicadas en ingls o castellano. Es ms
discutible la validez externa de metaanlisis sobre asociaciones de causalidad basadas
slo en estudios en ingls, y es frecuente verlo en estudios anglosajones. La calidad
superior de las investigaciones en ingls no es un argumento vlido. Es ms, en el
caso de los ensayos clnicos una investigacin ha comprobado que las publicaciones
en otros idiomas no son peores que las escritas en ingls y que los ensayos clnicos
en ingls contienen con ms frecuencia resultados estadsticamente significativos.
Esto puede suponer un sesgo de seleccin. Si se quieren limitar los idiomas y mantener
una perspectiva poblacional, se puede acotar por lugar de realizacin del estudio
primario, por ejemplo, al mundo occidental. Qu probabilidad hay de que un
americano, un espaol o un francs, por ejemplo, publiquen sus resultados en
chino?
b) Tipo de diseo: en la combinacin de ensayos clnicos es habitual centrarse slo en los
aleatorizados (porque tienen un mayor control de los errores). En metaanlisis de
estudios de observacin es frecuente eliminar los estudios ecolgicos por el efecto
impredecible de la falacia ecolgica.
c) Caractersticas de la exposicin y del efecto: se han de precisar las que se desean segn
los objetivos de cada investigacin.
d) Tipo de publicacin: se centra en los informes originales y se eliminan las revisiones,
cartas y editoriales. El problema se suscita cuando en una carta se encuentran datos
originales; su extensin no permite una correcta evaluacin.
e) Calidad: este aspecto se discutir con detalle en el epgrafe siguiente.
6.
RECOGIDA DE DATOS
Antes de recoger los datos que se combinarn hay que valorar la calidad de una investigacin.
Las tres preguntas bsicas en la valoracin de la calidad son: hasta que punto importa?, cmo
se puede medir? y qu utilidad presenta?
ENS Octubre 2009
191
6.1.
Importancia de la valoracin de la calidad
Ayuda a situar la robustez de la informacin existente. Los ensayos clnicos aleatorizados

se prefieren a los no aleatorizados y stos a los estudios de observacin, pero no todos los
estudios con un mismo diseo estn ejecutados con la misma escrupulosidad. Los estudios de
alta calidad reducen la existencia de sesgos y tienen una mayor precisin en el estimador del
efecto que calculan. Si se planea hacer metaanlisis, debe hacerse con estudios en los que sea
menor la probabilidad de que haya un sesgo.
6.2.
Forma de medir la calidad
Hay que confeccionar un cuestionario de evaluacin y seguir una estrategia cuidadosa que
evite el sesgo del observador, y que podra acabar en un sesgo de inclusin o de puntuacin de
la calidad, garantizando la reproducibilidad intraobservador y entre observadores. El cuestionario
debe aplicarse con enmascaramiento frente a ciertas caractersticas: la institucin ejecutora, el
nombre de los autores (su prestigio puede ejercer un cierto grado de presin) y el sentido de la
asociacin, ya que su conocimiento podra influir tambin en la seleccin. Es recomendable el
uso del scanner para las secciones de Mtodos y Resultados, tachando los epgrafes indicativos
de los grupos de pertenencia de los sujetos; uniformiza fcil y rpidamente los formatos
reconocibles de las revistas y estandariza la evaluacin.
Se recomienda que los evaluadores no sean los que recogen los datos de la magnitud del
efecto. La familiarizacin con los resultados, junto a una posible opinin propia (que puede
formarse conforme se lee), pueden contribuir a la aparicin de sesgos del observador. Se
considera que es suficiente que sean dos evaluadores independientes. Compararn sus
conclusiones y si existen discrepancias, debern intentar solucionarlas entre ellos, y si se
mantienen, la decisin final se tomar por un tercer investigador.
Los cuestionarios de evaluacin tienen el inconveniente de su validacin. No existen
cuestionarios ideales para ser aplicados en toda situacin. En el caso del ensayo clnico se han
publicado muchos cuestionarios y se ha comprobado que no todos los protocolos puntan igual
a los mismos estudios. Otro inconveniente es que con frecuencia se aprecia que no se pueden
responder a todas las preguntas de un cuestionario con la informacin dada en un artculo. En
epidemiologa de observacin no existe ningn cuestionario maestro, y debe adaptarse a cada
situacin. Con independencia de que se utilice un cuestionario publicado es conveniente que se
adapte a la hiptesis sobre la que se trabaja, aadiendo cuestiones sobre los errores particulares
que amenazan a la asociacin en estudio. Tambin se puede solicitar a los grupos de investigacin
originales aclaracin de aspectos confusos de los Mtodos.
6.3.
Utilidad de la calidad
Puede tener una triple funcin:
a) Funcin cualitativa o discriminar si el resultado final de un estudio est probablemente
sesgado. Con ello se valora la inferencia en funcin de la mejor prueba disponible.
Aunque existen algunas dudas, los estudios con sesgos probables no deben ser incluidos.
Esta funcin puede ser esencial en el anlisis, por disminuir la heterogeneidad entre
estudios. Hay que ser cuidadoso en la exclusin de estudios, puesto que puede introducir
un sesgo de seleccin si los criterios no son objetivos. Por ello el proceso de aceptacin
tiene que estar enmascarado frente a las variables que luego puedan tener repercusin
en la combinacin final de las evidencias. Se recomienda que sea realizado por dos
investigadores de manera independiente.
ENS Octubre 2009
192
b) Incorporacin de la calidad como criterio de ponderacin: En la actualidad no se

recomienda, aunque pueda parecer recomendable dar ms peso a los mejores estudios;
entre otras razones, porque diferentes cuestionarios dan un orden de calidad diferente
a los mismos estudios.
c) Recogida de las caractersticas del estudio: tipo de poblacin, criterios de inclusin y
exclusin, forma de recogida de datos, tcnicas de control de errores, etc. En el caso de
que exista heterogeneidad, esta informacin se puede utilizar para intentar tipificar las
caractersticas asociadas a un cierto resultado.
7.
MTODOS DE COMBINACIN
Se pueden combinar los resultados publicados o combinar las bases de datos. En este
ltimo caso, el anlisis estadstico es convencional, salvo que es conveniente incluir en los
modelos multivariables una variable que identifique al estudio. Este apartado se dedicar a la
combinacin de datos procedentes de informes publicados.
Las tcnicas estadsticas de metaanlisis generan varios problemas:
Se puede asumir que el efecto producido por la exposicin sea constante de estudio
en estudio (modelo de efectos fijos, MEF) o, por el contrario, tenga una distribucin
al azar a lo largo de los distintos estudios (modelo de efectos aleatorios, MEA).
Todos los estudios incluidos en un metaanlisis no son formalmente independientes
ya que los ltimos pueden iniciarse tras conocer los resultados de los primeros. Esto
s es un autntico problema: la investigacin actual se apoya en la del pasado.
Existe una tendencia a encontrar resultados estadsticamente significativos
conforme el nmero de estudios aumenta, aunque no favorezcan la asociacin. Por
ello, se recomienda que el nivel de significacin sea como mnimo del 1%. No
obstante, la mayora de los metaanlisis publicados calculan intervalos de confianza
del 95%.
Sea cual sea el procedimiento que se aplique, cada estudio proporcionar el mismo parmetro,i, que luego se combinarn utilizando un criterio de ponderacin wi : Tp = (6 wiTi)/6 wi.
7.1.
Mtodos para variables dicotmicas: modelo multiplicativo
Son mtodos que se basan en la nocin de riesgo relativo (RR). Este modelo es generalmente
ms adecuado que el aditivo para las relaciones entre una exposicin y un efecto. En el caso
de que se prefiera aplicar un modelo aditivo, basado en la diferencia de riesgos, se puede
aplicar el mtodo del inverso de la varianza que a continuacin se describe.
7.1.1.
Mtodo del inverso de varianza
Se usa como criterio de ponderacin el inverso de la varianza. El procedimiento se resume

en la tabla 12-1. Como ejemplo se expone el caso de la odds ratio (OR). Cada estudio
proporciona una OR y su varianza. Para la combinacin de resultados, dado que la OR (al
igual que el RR) no sigue una distribucin normal, se transformar logartmicamente:
ENS Octubre 2009
193
Tabla 12-1. Resumen de la ponderacin por inverso de la varianza (modelo de efectos fijos).
Objetivo
Ponderacin resumen, Tp
Estimacin
wiT i
Tp
1
Var (T i )
wi
Error estndar de Tp
1
wi
EE (T p )
T p u zD / 2 EE (T p )
Intervalo de confianza de Tp
Significacin estadstica de Tp
Tp
Heterogeneidad, Q
EE (T p )
w T
T p
2
F con k 1 grados de libertad.
k = nmero de estudios
Si se ponderan RD, qp = RDp, qi = RDi y wi = 1/Var(RDi) (ver tabla 12-2)

Si se ponderan RR, qp = ln(RRp), qi = ln(RRi) y wi = 1/Var(ln RRi) (ver tabla 12-2)
ln ORp
w u ln OR
w
i
wi
1
V (ln ORi )
siendo ORp la odds ratio ponderada. Para calcularlo ser necesario realizar la transformacin
antilogartmica. La forma de estimar los parmetros crudos se encuentra resumida en la
tabla 12-3, basndose en la distribucin de la tabla 12-2. En el caso de que se ofrezcan
estimaciones ajustadas (controlando por uno o ms factores de confusin), los autores suelen
proporcionar el intervalo de confianza de la OR. En esta situacin, para calcular la varianza de
la OR se aplicar la ecuacin V (ln OR)= [(ln ORs - ln ORi)/3,92]2, siendo ORs y ORi los lmites
superior e inferior del intervalo de confianza del OR.
Tabla 12-2. Estructura y notacin de un estudio i
Efecto s
Efecto no
Total
Expuestos
a1
bi
n1i
No expuestos
ci
di
n0i
Total
ni
Tabla 12-3. Medidas de magnitud de efecto (con la notacin de la tabla 12-1).

Medida
Estimacin
Riesgo relativo (RR) ai/n1i/(ci/n0i)
Varianza
Intervalo de confianza
V (ln RR) = 1/ai + 1/ci RR u e r1,96u
V (ln RR )
- 1/n1i - 1/n0i
Odds ratio (OR)
aidi/(bici)
V (ln OR) = 1/ai +
OR u e r1,96u
V (ln OR )
1/bi + 1/ci + 1/di

Diferencia de riesgos ai/n1i - ci/n0i
R1i(1-R1i)/n1i + R0i(1-
(DR)
R0i)/n0i
DRi 1,96Vi
ENS Octubre 2009
194
La varianza del logaritmo natural de la ORp es igual al inverso de la suma de los pesos de
cada OR, V(ln ORp)= 1/( wi). El intervalo de confianza de la ORp es = ORpEXP [ z/2V (ln
ORp)], siendo z/2 = 1,96 si se quiere una confianza del 95%.
La significacin global del parmetro se puede estimar dividiendo el logaritmo natural del
ORp por su error estndar, asoc = ln ORp/[V(ln ORp)], que sigue una distribucin Normal (0,1).
El grado de homogeneidad se valora mediante el estadstico Q = wi(ln ORi - ln ORp)2,
que sigue una distribucin 2 con (k - 1) grados de libertad, siendo k el nmero de estudios. El
punto de corte para detectar heterogeneidad se sita en el 10% (p = 0,1) y no en el clsico 5%.
Se puede incorporar explcitamente la variabilidad entre estudios y asumir un MEA, en vez
de un MEF, como hasta ahora se ha hecho. El MEA se resume en la tabla 12-4. Hay que calcular
la varianza entre estudios:
Tabla 12-4. Resumen de la ponderacin por inverso de la varianza (modelo de efectos aleatorios).
Objetivo
Ponderacin resumen, Tp
Estimacin
wi*T i
Tp
*
i
wi*
1
Var (T i ) W 2
Q K 1
W 2 max 0,
wi2
w
i wi
Q, wi y k como en la tabla 13-3.

1
EE (T p )
wi*
Error estndar de Tp
T p u zD / 2 EE (T p )
Intervalo de confianza de Tp
Significacin estadstica de Tp
Tp
EE (T p )
Heterogeneidad, Q
w T
*
i
T p
2
F con k 1 grados de libertad
W2
mx.0,
Q K 1
wi wi2 / wi
El peso de cada investigacin vendra dado ahora por: w*i= 1/(Vi + 2). Esto supondra que
la ORp* = (w*iORi)/ w*i. La varianza y el intervalo de confianza se estiman como en el caso
anterior, cuando no se tuvo en cuenta la variabilidad entre estudios. En el presente caso se
sustituira wi por w*i.
El procedimiento anterior se ilustra con un ejemplo sobre el efecto del descenso del colesterol
por dieta y frmacos sobre la mortalidad (tabla 12-5). Hay que calcular la varianza de la OR de cada
estudio (ver tabla 12-3). Para el estudio LA Veterans es 1/174 + 1/250 + 1/177 + 1/245. En la
tabla 12-6 se resumen las varianzas de cada estudio, sus pesos, y los nuevos pesos tras la comprobacin
de que 2 = 0,0231. La ORp, su IC, y la Q valen:
ENS Octubre 2009
195
Tabla 12-5. Descenso de la colesterolemia por dieta y medicacin y mortalidad: estudios de prevencin primaria
Estudio
Tto. experimental / tto.
Gr. experimental
Grupo control
OR
Viven
Mueren
Viven
Mueren
(b)
(a)
(d)
(c)
250
174
245
177
0,96 (0,73-1,28)
2039
158
2044
153
1,04 (0,82-1,31)
control
LA Veterans
Dieta especial /
convencional
Minnesota
Dieta especial /
convencional
OMS
Clofibrato / placebo
5203
128
5209
87
1,47 (1,11-1,96)
Upjohn
Colestipol / placebo
531
17
519
27
0,62 (0,31-1,19)
Lipids
Colestiramina + dieta /
1838
68
1829
71
0,95 (0,67-1,36)
Gemfibrozil + dieta / placebo 2006
45
1988
42
1,06 (0,68-1,66)
placebo + dieta
Helsinki
+ dieta
Fuente: Muldoon et al. BMJ 1990;301:309-14.
Tabla 12-6. Varianzas y pesos del ejemplo de la tabla 12-6 en la aplicacin del mtodo del inverso de la varianza (t2 =
0.0231).
Estudio
V (ln OR)
Peso (1/V)
Peso* [1/(V+W2)]
LA Veterans
0.0195
51,3
23,4
Minnesota
0.0138
72,5
27,1
OMS
0.0197
50,8
23,4
Upjohn
0.0997
10,0
8,1
Lipids
0.0299
33,4
18,9
Helsinki
0.0470
21,3
14,3
ln ORp
ORp
51,3 u 0,96 ... 21,3 u 1,06

51,3 ... 21,3
e 0,063
V (ln ORp)
0,0630
1,065
1
51,3 ... 21,3
IC 95% OR 1,045 u e r1,96
0,00419
0 , 00419
0,94 a 1,21
ENS Octubre 2009
196
Q 51,3(ln 0,96 ln 1,045) 2 ... 21,3(ln 1,06 ln 1,045) 2

p = 0,096 (hay heterogeneidad entre los estudios).
9,35 , con 5 grados de libertad,
Como ya se ha mencionado, 2 > 0 y se puede aplicar el MEA. Se recalculan los pesos

(tabla 12-6). En primer lugar se aprecia que los pesos son menores que en el MEF, lo que se
traducir en una mayor varianza (recuerde, el inverso de la suma de los pesos) y un intervalo de
confianza mayor. Se comprueba tambin que las diferencias en la importancia de los estudios
se han amortiguado: con los pesos originales el estudio Minnesota era siete veces ms influyente
que el de Upjohn (72,5 frente a 10,0), mientras que con la nueva ponderacin, es algo superior
a tres (27,1 frente a 8,1). Se concede con el MEA una mayor importancia relativa a los estudios
pequeos.
Con el MEA, la ORp = 1,045 y un intervalo de confianza ms amplio que con el MEF, e
igualmente no significativo (0,87-1,25). Al descender el valor de los pesos, la prueba de
homogeneidad Q se hace ms pequea, Q = 5,36, p = 0,37. Es ms difcil encontrar heterogeneidad
con el MEA.
7.1.2.
Mtodo de Mantel-Haenszel
Este procedimiento se recomienda para los estudios experimentales, ya que trabaja con los
datos crudos, por lo que el diseo debe utilizar tcnicas que eliminen el sesgo de confusin
(como la aleatorizacin). El procedimiento se resume en la tabla 12-7. La OR global (ORMH) se
estimar ponderando la OR cada estudio (ORi) por el coeficiente cibi/ni
Tabla 12-7. Resumen de la ponderacin de Mantel- Haenszel de OR.
Objetivo
Ponderacin resumen, ORMH
Estimacin
a1i b0i
n i
b1i a0i
i n
i
ORMH
Error estndar de ORMH
PR
i
SE (ln ORMH )
Pi
2 Ri
i
a1i b0i
a 0i b1i
; Qi
ni
ni
Intervalo de confianza de ORMH
ORMH u e zD / 2 EE (ln ORMH )
Significacin estadstica de
ORMH
F MH
Heterogeneidad, Q
P S Q R Q S

2 R S
2 S
1 Pi ; Ri
a1i b0i
; Si
ni
a 0i b1i
ni
a1 m1i n1i / ni

m1i m0i n1i n0i
n2i ni 1
w ln OR
i
ln ORMH
F con k 1 grados de libertad

1
1
wi
1
1
1
1
Var (ORi )

a1i a0i bi1 b0i
ENS Octubre 2009
197
ai d i
ni
i
bc
i ni i
i
ORMH
La varianza del parmetro resumen ser:
PR
i
V (ln ORMH )
Pi
i
2
ci bi
ni
Intervalo de confianza de ORMH =
2 Ri
ai ci
; Qi
ni
P S Q R Q S

2 R S
2 S
ai d i
; Si
ni
1 Pi ; Ri
ci bi
ni
ORMH u EXP r 1.96 u V (ln ORMH
Para la valoracin de la heterogeneidad se pueden utilizar varias opciones. El ms usual es

el estadstico Q = wi ln ORi ln ORMH 2 , siendo wi el inverso de la varianza del ln OR. El
procedimiento de Mantel-Haenszel se ilustra con los datos del ejemplo de la tabla 12-5.
ORMH
174 u 275
45 u 1988
...
846
4081
177 u 250
42 u 2006
...
846
4081
1,066
La frmula de su varianza es tediosa en su clculo manual y no se reproduce (est

implementada en muchos paquetes estadsticos), da un valor de 0,00414. El IC del 95% es
1.066 u EXP(r1.96 0,00414 0,94 a 1,29 , valores muy parecidos a los del procedimiento del
inverso de la varianza.
Hay otros procedimientos que se derivan del de Mantel-Haenszel, como el de Peto, muy
utilizado. No se comenta porque es un procedimiento sesgado, sobre todo cuando hay
desequilibrio en el tamao de la muestra entre los grupos que se comparan y/o cuando la OR es
claramente distinta de la unidad.
7.1.3.
Estrategia general de anlisis
La eleccin entre una medida basada en el RR o en la diferencia de riesgos depende de los

objetivos de la investigacin. En los estudios de observacin el mtodo del inverso de la varianza
permite combinar parmetros ajustados. El mtodo de Mantel-Haenszel y derivados (mtodo de
Peto) obliga a utilizar la distribucin cruda de los datos, donde es probable que haya sesgo de
confusin. Este hecho supone que estos mtodos de combinacin se recomienden en general
para los estudios experimentales.
Con respecto a la disyuntiva de utilizar el MEF o el MEA, se insiste en que la eleccin
debe especificarse antes y no tras conocer los resultados. Es muy comn empezar por un MEF
(mucho ms restrictivo a la hora de considerar la heterogeneidad, ya que es ms fcil detectarla
con este procedimiento) y esto basta si no hay heterogeneidad; por el contrario, si hay
heterogeneidad se recurre al MEA. A priori se recomienda el MEA cuando el nmero de estudios
es pequeo (< 20).
ENS Octubre 2009
198
El MEA asume que se tiene una muestra de los estudios existentes, asuncin ms realista
que tener todo el universo de estudios, como subyace en el MEF. No obstante, conviene saber
que la estimacin ponderada procedente de un MEA no tiene interpretacin poblacional, ya que
la distribucin del error aleatorio de la muestra no tiene justificacin biolgica o epidemiolgica,
al no existir un modelo de distribucin conocido, ni un proceso de muestreo subyacentes (un
grave inconveniente). El MEA introduce un trmino de variabilidad adicional y aumenta la
varianza del estimador resumen, con un mayor intervalo de confianza. Esto no es una ventaja
desdeable, ya que uno de los inconvenientes que se han sealado en el metaanlisis es la
facilidad de obtener resultados estadsticamente significativos. Sin embargo, el mismo
coeficiente de variabilidad se aade por igual a cada estudio, lo que concede una mayor
importancia relativa a los estudios pequeos frente a los grandes, lo que supone que el MEA se
influye ms por los errores que afectan a los estudios pequeos, como el sesgo de publicacin.
Algunos autores recomiendan que se haga un anlisis de sensibilidad, siempre y cuando
sea posible, y combinar los resultados de las distintas investigaciones por ms de un mtodo. Si
los distintos anlisis coinciden, esto reforzar la inferencia a realizar de los resultados.
7.2.
Mtodos para variables continuas
Las variables de efecto continuas se utilizan con frecuencia en epidemiologa (por ejemplo,
dieta y reduccin de las cifras de colesterol srico). Se puede aplicar el mtodo de inverso de la
varianza. En este caso el parmetro que se pondera es una media (por ejemplo, la media de
reduccin de colesterol tras una intervencin diettica) y el peso es el inverso del cuadrado del
error estndar de la media (su varianza). Tambin se puede aplicar el anlisis de la varianza y
diferentes modelos de regresin (ponderados o no); la prueba de homogeneidad es el factor
estudio o la interaccin estudio-exposicin.
7.3.
Metaanlisis acumulado
Consiste en aadir cada vez un estudio en la estimacin del parmetro resumen segn una
variable cuantitativa que permite la ordenacin de las distintas investigaciones. Los resultados
se presentan en forma de grfico, representando el valor del estimador resumen (RR, OR, etc.)
y su intervalo de confianza despus de cada adicin. El ms habitual es el realizado segn la
fecha de publicacin: cada vez se aade un estudio ms reciente. Sirve para valorar cul es la
contribucin que tiene cada estudio sobre el grado de evidencia disponible en ese momento. Un
ejemplo se observa en la figura 12-1. Tambin se pueden realizar segn otras variables: calidad
global de cada estudio, frecuencia del efecto en el grupo de referencia, etc.
ENS Octubre 2009
199
Figura 12-1. Ejemplo de metaanlisis acumulado sobre la asociacin entre la delecin

del gen de la enzima convertidora de la angiotensina e infarto de miocardio.
Cambien 92
Bohn 93
Leatham 94
Zhao 94
Ruiz 94
Nakai 94
Beohar 95
Katsuya 95
Fujisawa 95
Lindpaintner 95
Keavney 95
Friedl 95
Anhve 95
Ludwig 95
Samani 96
1.2
Odds ratio
1.4
1.6
(Fuente: Samani et al. Circulation 1996; 94:708-12)
8.
ESTUDIO DE LA HETEROGENEIDAD
Siempre debe realizarse un anlisis de la heterogeneidad. La sntesis de estudios realizados

en diferentes lugares y tiempos, sobre distintas poblaciones y con diseos diferentes, con
frecuencia da lugar a que los resultados sean estadsticamente diferentes entre s. Esta
heterogeneidad no puede ignorarse. Supngase que todos los resultados de los estudios
individuales son ciertos, sin sesgos, y existe una marcada heterogeneidad; aqu el clculo de una
medida resumen de los diferentes estudios no aporta nada (ms bien confunde). El conocimiento
de la media entre los diferentes estudios no permite apreciar la riqueza de la variabilidad
existente y lo ms acertado sera investigar cules son las razones para que se produzcan
resultados contradictorios. El metaanlisis slo debe sacar un denominador comn cuando de
verdad ste existe.
Un inconveniente grave del anlisis de la heterogeneidad es que la mayora de sus pruebas
estadsticas no tienen una potencia estadstica adecuada; por ello, el no rechazar la hiptesis de
homogeneidad no implica que no exista heterogeneidad. En el anlisis de la heterogeneidad se
debe partir de una reflexin de cules pueden ser las variables que pueden ejercer una influencia
diferencial: variables de diseo, exposicin, efecto, otros factores de riesgo, variables de
persona, tiempo y lugar, etc.). A continuacin se puede proceder de varias maneras:
a) Anlisis estratificado: se repite el metaanlisis en cada uno de los estratos. Si desaparece
la heterogeneidad es razonable pensar que esa variable influye. El inconveniente que
presenta esta estrategia es que puede resultar poco eficiente si hay muchos estratos y el
nmero total de estudios es pequeo.
b) Metarregresin: Suele ser ms eficiente que la tcnica anterior. En ella se utiliza como
variable dependiente la magnitud del efecto que se valora con una o varias variables
independientes: ln OR = 0 + ixi. Las tcnicas de metarregresin trabajan con datos
agregados y por lo tanto estn sometidas a los problemas de la falacia ecolgica.
ENS Octubre 2009
200
c) Metaanlisis acumulado: es menos sensible que las anteriores para la identificacin de

la heterogeneidad.
d) Anlisis de influencia: El anlisis de la heterogeneidad, en ocasiones, no revela ninguna
causa, sino que parece ser debida a un error aleatorio, motivado porque una o varias
investigaciones encuentran valores que difieren de la media. Son valores extremos sin
ninguna razn aparente. Un anlisis de influencia puede ser aconsejable: repetir el
anlisis con y sin ellos. Si el resultado significativo depende de ellos, hay que ser cauto
en la inferencia. Tambin puede cambiarse el peso de esos estudios y comprobar qu
sucede.
e) Anlisis de sensibilidad: puede hacerse de varias maneras: con un cambio en los
criterios de inclusin de los estudios que se combinan (generalmente caractersticas
metodolgicas) y si se han utilizado criterios de correccin de errores, variando los
mismos.
9.
SESGO DE PUBLICACIN
El sesgo de publicacin es el primer sesgo de seleccin en el metaanlisis de estudios

publicados. Hay que cuantificarlo y existen varios procedimientos:
a) Representacin del ln RR y su intervalo de confianza frente al tamao de muestra del
estudio: mismo comentario que en el caso anterior. Si se coloca el ln RR en el eje de
ordenadas, se obtendr la imagen de un embudo, con la parte ms estrecha dirigida a la
derecha (ms precisin cuando el tamao de muestra es mayor). La existencia una
figura simtrica alrededor de un eje que pasa por el valor ponderado del RR habla en
favor de la ausencia de este error (figura 12-2). Cuando se coloca el ln RR en el eje de
abscisas se obtiene una imagen similar a un rbol de navidad. A esta imagen se le puede
hacer una recta de regresin, entre el tamao de muestra y la fuerza de la asociacin
(variable dependiente); es el mtodo de Macaskill. Si la pendiente es estadsticamente
significativa (distinta de cero), se considera que hay sesgo. Obsrvese en la figura 12-3
que faltan estudios pequeos con RR alrededor de la unidad; si se hace una recta de
regresin la pendiente ser negativa, reflejando la asimetra del grfico (mientras que
en la figura 12-2 la pendiente sera cero). Se ha comprobado que es mejor en la regresin
utilizar el inverso del tamao de muestra (procedimiento de Peters). Con un ejemplo
real, en las figuras 12-4 y 12-5 se aprecia la diferencia entre los mtodos de Macaskill
y Peters, es mucho ms sugestiva de sesgo la imagen con el inverso del tamao de
muestra.
ENS Octubre 2009
201
Figura 12-2. Grfico en embudo; riesgo relativo (RR) y tamao de muestra, resultados hipotticos
(RR ponderado = 2). Con una recta de regresin la pendiente sera 0.
ln RR
10
5
3
2
1
0.5
0
200
400
600
800
1000
1.5
1
-.92
0.4
ln RR
10
Figura 12-3. Grfico en embudo asimtrico; riesgo relativo (RR) y tamao de muestra,resultados hipotticos
(RR ponderado = 2). Con una recta de regresin la pendiente sera distinta de 0.
200
400
600
800
1000
ENS Octubre 2009
202
Figura 12-4. Ejemplo de presencia de sesgo de publicacin por el mtodo de regresin sobre el grfico en embudo
con n mtodo de Macaskill- en un metaanlisis sobre el polimorfismo de la enzima convertidora
de la angiotensina y la reestenosis coronaria (Bonnici et al. BMJ 2002; 325: 517-20)
10
OR
3
2
OR ponderada = 1.22
1
E1 = -0.0005, p = 0.009
0.5
0
500
1000
1500
Tamao de muestra
Figura 12-5. Mismo supuesto que la figura 12-4, pero utilizando 1/n como variable independiente
(mtodo de Peters)
10
5
OR
E1 = 70,8, p = 0.01
2
OR ponderada = 1.22
0,5
0
.005
.01
.015
.02
Inverso del tamao de muestra
b) Representacin del logaritmo natural del RR frente a su error estndar. En este caso el
embudo es ms estrecho por la izquierda, cuando el error estndar es menor. Si se
coloca el RR en las abscisas, en las ordenadas se toma el inverso del error estndar,
para que la imagen parezca un rbol.
c) Clculo del nmero probable de estudios no publicados: requieren asunciones ms o
menos subjetivas en su aplicacin. Todos los procedimientos slo tienen en cuenta un
factor como responsable de la no publicacin (lo que no es cierto): la ausencia de
significacin estadstica en los resultados. Se puede estimar el nmero de estudios con
resultados no significativos que se necesitaran para hacer que una asociacin global
significativa se hiciera no significativa estadsticamente (mtodo de Rosenthal).
Tambin se pueden aplicar estrategias de remuestreo asumiendo que los estudios
encontrados con resultado no significativo son una muestra representativa de todos los
que se han hecho (publicados o no).
ENS Octubre 2009
203
10.
SIGNIFICACIN SANITARIA DEL METAANLISIS
La revisin sistemtica (o ms propiamente el metaanlisis que la precedi) ha supuesto

una serie de cambios en el terreno cientfico. Las revisiones tradicionales incorporan cada vez
ms las caractersticas de sistematicidad, con consulta de un repertorio bibliogrfico
informatizado y con ms discusin de la metodologa. Si en un tema hay controversia, la revisin
sistemtica es una alternativa razonable para ver la contribucin que tendra un nuevo estudio y
las caractersticas que debiera reunir.
El metaanlisis no es una estrategia cara y sus conclusiones pueden ayudar. Contribuye a la
toma de decisiones sobre la asociacin entre una exposicin y un efecto: (a) si en un metaanlisis, en
el que al menos un estudio alcanz significacin estadstica, se obtiene un resultado significativo, el
metaanlisis fortalece la evidencia global; (b) si un metaanlisis, en el que ningn estudio alcanz
significacin estadstica, obtiene un resultado estadsticamente significativo, no es recomendable
actuar segn su resultado, no es prudente concluir algo significativo cuando no se observa nada claro
en las unidades que la componen; (c) si en un metaanlisis en el que al menos un estudio mostr
significacin estadstica se alcanza un resultado no significativo, habr que reconsiderar los criterios
de seleccin de los distintos estudios o realizar nuevos.
El metaanlisis ayuda a la enseanza. La comprobacin de que los resultados de distintas
investigaciones no coinciden, apreciar que ciertas caractersticas metodolgicas se asocian con
el resultado, conocer que los resultados que aparecen en la literatura cientfica pueden estar
sometidos al sesgo de publicacin, etc., tiene consecuencias muy tiles para ensear el mtodo
cientfico y sus limitaciones. Pero el metaanlisis tiene tambin errores. Las preguntas bsicas
que debe responder la metodologa de un metaanlisis, antes de plantearse la aplicacin de sus
resultados, se encuentran resumidas en la tabla 12-8.
Tabla 12-8. Directrices para la valoracin de revisiones de artculos publicados.

1.
Estn claramente establecidos los objetivos y mtodos?
2.
Se utilizaron mtodos de bsqueda completos para localizar los estudios relevantes?
3.
Se detallaron los mtodos para determinar los artculos que se incluyeron en la

revisin?
4.
Se valor la validez de los estudios primarios? (Anlisis de la calidad)
5.
Fue reproducible y estuvo libre de sesgos la valoracin de los estudios primarios?
6.
Se analiz la variacin en los hallazgos de los estudios relevantes? (Anlisis de la

heterogeneidad)
7.
Se combinaron apropiadamente los hallazgos de los estudios primarios?
8.
Se sustentaron las conclusiones de los revisores por las evidencias citadas?

ENS Octubre 2009
204
Es necesario dejar claro un hecho: el metaanlisis es tan vlido como lo son los diferentes
estudios que se combinan. Es imposible inferir nada si los estudios incluidos en el anlisis
adolecen de graves deficiencias. Aunque todos los estudios que se incluyan en un metaanlisis
sean absolutamente vlidos, la inferencia puede presentar problemas (aunque no haya
heterogeneidad). Hay que asegurarse que los distintos estudios que se combinan pueden
resumirse en un solo parmetro.
11.
COLLABORATION COCHRANE. www.cochrane.org
DELGADO RODRGUEZ M. Revisiones Sistemticas de Estudios. Metaanlisis. En: JM Domnech : Diseo de Estudios
Sanitarios, Barcelona: Ed. Signo SA, 2008:1-245.
EASTERBROOK PJ, BERLIN JA, GOPALAN R, MATTHEWS DR. Publication bias in clinical research. Lancet
1991;337:867-872.
EGGER M, SMITH GD, ALTMAN D. Systematic reviews in health care. Meta-analysis in context. Londres: BMJ
Books, 2001.
GREENLAND S, SALVAN A. Bias in the one-step method for pooling study results. Stat Med 1990;9:247-252.
GREENLAND S. Meta-analysis. En: KJ Rothman y S Greenland. Modern Epidemiology. 2 ed. Boston: LippincottRaven, 1998: 643-673.
JNI P, WITSCHI A, BLOCH R, EGGER M. The hazards of scoring the quality of clinical trials for meta-analysis.
JAMA 1999;282:1054-1060.
MACASKILL P, WALTER SD, IRWIG L. A comparison of methods to detect publication bias in meta-analysis. Stat
Med. 2001; 20: 641-54.
MOHER D, JADAD AR, NICHOL G, PENMAN M, TUGWELL P, WALSH S. Assessing the quality of randomized
controlled trials. Control Clin Trials 1995;16:62-73.
PETERS JL, SUTTON AJ, JONES DR, ABRAMS KR, RUSHTON L. Comparison of two methods to detect publication
bias in metaanalysis. JAMA. 2006; 295: 676-80.
VARIOS. Point/counterpoint: meta-analysis of observational studies. Am J Epidemiol 1994;140:771-791.
ENS Octubre 2009
205
Inferencia Causal en Epidemiologa
XIII. INFERENCIA CAUSAL EN EPIDEMIOLOGA

Jos Ramn Banegas
Fernndo Rodrguez Artalejo
1.
INTRODUCCIN
En el siglo V a.C. Hipcrates de Cos sugiri que el desarrollo de la enfermedad humana

podra estar relacionado con factores de estilos de vida y con el medio ambiente externo. Es
decir, enunci que las enfermedades tenan causas. Desde Sexto Emprico (200 d.C.) a Hume
en 1740, muchos filsofos han reducido la cuestin de la causalidad a la de regularidad o
legalidad; observamos que a un acontecimiento especfico suele seguir regularmente otro, pero
no observamos un nexo necesario entre ambos.
Para el filsofo Popper s hay vnculo causal (necesario o probable) entre dos sucesos A y
B: ste es la hiptesis general que postula que la relacin debe darse (o darse con mayor
probabilidad) en toda circunstancia, lugar y tiempo. Lo postula la hiptesis, pero no se dice que
la realidad deba ser as; por eso hay que investigar desafiando la hiptesis, aunque con la
esperanza de que se confirme. As, en trminos epidemiolgicos, la hiptesis de que el colesterol
alto (A) es causa de cardiopata isqumica (B) no podemos justificarla racionalmente (ni lgica
ni empricamente) pues no podemos observar todos los sujetos, poblaciones o circunstancias en
que podran aparecer contraejemplos. A pesar de ello, formulamos la hiptesis (general) de
relacin entre A y B; que es tanto ms satisfactoria, verosmil, cuanto ms y mejor se vea
corroborada en sucesivos y variados estudios (comprobacin ayudada por ciertos criterios que
luego veremos).
John Stuart Mill propuso en 1843 una serie de mtodos con la pretensin de descubrir y
demostrar relaciones causales. En realidad no lo logran y han sido muy criticados. Pero son
mtodos eliminatorios: sirven para mostrar que una determinada circunstancia no es la causa
de un fenmeno dado (llamado posteriormente criterio de exclusin de factores alternativos).
Y en este sentido son instrumentos para someter a ensayo una hiptesis causal; sus enunciados
anticipan y describen los mtodos experimentales y observacionales de la ciencia moderna.
En medicina en la segunda mitad del siglo XIX, la desmedida bsqueda de agentes
infecciosos con la pretensin de ser la causa de enfermedades llev a Koch y Henle a proponer
criterios que delimitasen cules agentes desempeaban realmente un papel etiolgico. Este
episodio lo podemos transferir de los cazadores de microbios a los actuales cazadores de factores
de riesgo o de genes. No es en s la bsqueda de nuevas causas de enfermedades lo intil sino
el hacerlo fuera de un contexto metodolgico y sustantivo que le d sentido real, prctico. Y a
esto ayudan los denominados criterios de causalidad, muchas veces, pero no siempre,
consustanciales e implcitos en la buena investigacin cientfica. Con el predominio de las
enfermedades crnicas en el siglo XX, los criterios de Koch y Henle dieron lugar a un desarrollo
y crtica que comentamos posteriormente.
El inters por la inferencia causal en epidemiologa es claro. Para MacMahon, el propsito
ms importante de la epidemiologa es adquirir conocimiento de las causas de las enfermedades
que no son prevenibles actualmente. Para ello hay que desarrollar hiptesis que expliquen la
distribucin de los patrones de enfermedad, y contrastar dichas hiptesis a travs de estudios
especficamente diseados. De ese modo podremos clasificar a las personas enfermas en grupos
que parezcan tener factores etiolgicos en comn.
ENS Octubre 2009
207
As pues, establecer las causas de los fenmenos de inters es uno de los principales
objetivos, y problemas, de la actividad cientfica. Este trabajo tiene dos objetivos concretos y
prcticos. El primero es responder a la pregunta: qu es una causa? Para ello revisamos los
modelos o representaciones formales de la causalidad de mayor inters en epidemiologa y
salud pblica. El segundo objetivo es responder a: cmo reconocemos en la prctica que una
variable o fenmeno concreto es la causa de otro? Para identificar una causa se dispone de
reglas metodolgicas llamadas criterios de causalidad. Ninguno de ellos es suficiente para
demostrar la causalidad, pero cuanto ms y mejor se cumplan ms verosmil ser que la relacin
entre dos variables sea causal. Por eso en la segunda parte de este trabajo describimos los
principales criterios de causalidad y presentamos un ejemplo de la aplicacin de dichos criterios.
Por ltimo, ya que son muchos los criterios de causalidad existentes, concluimos con un
comentario sobre la forma de combinar y organizar su aplicacin en situaciones concretas.
1.1.
Aspectos filosficos
Cuando se aborda el tema de la causalidad se suele titular y comenzar hablando de

inferencia. Sin embargo, la inferencia (causal) podra comprenderse mejor si la ubicamos en el
marco general, ms amplio y ms adecuado de la explicacin (causal) (figura 13-1). Explicacin,
contrastacin e inferencia siempre entran en juego en el mtodo cientfico, aunque dependiendo
de cul es nuestra situacin problemtica: la bsqueda de una hiptesis (causal) explicativa, la
contrastacin de una hiptesis ya formulada, o la inferencia sobre una hiptesis contrastada.
Pero la inferencia siempre es precedida por la explicacin y consiste esencialmente en valorar
los resultados de las contrastaciones.
Figura 13-1. Esquema general del mtodo cientfico. Modificado de Popper, Bunge y Giere.
Conocimiento disponible
Problema
Explicac
in
inve
ncin
Mundo real
Hiptesis
diseo de
estudios
Reglas
metodolgicas/decisin
Evidencia
+
decisin?
Contrastacin
y
Evaluacin de la evidencia
Inferencia
induccin?
Aceptacin
de la hiptesis
deduccin
lgica
Prediccin
?
decisin
Rechazo
de la hiptesis
Hiptesis
no decidida
Fte: Elaboracin propia a partir de Popper, Bunge y Giere.
ENS Octubre 2009
208
La inferencia para algunos autores slo hace referencia a la lgica. Pero la llamada
inferencia causal, el paso de la evidencia a la hiptesis, no parece ser un proceso lgico. Es una
valoracin de la hiptesis basada en observaciones, experimentos y argumentos relevantes. Y
para la valoracin de esas evidencias se ayuda de reglas metodolgicas, es decir de elementos
no lgicos que ayudan a la decisin sobre si la evidencia apoya o no a la hiptesis causal, y en
qu medida. Una decisin no es un elemento lgico, ms no por eso es arbitrario; se toma
sopesando motivos, razonadamente; disminuyendo el riesgo de error y eliminando la subjetividad
de la decisin en la discusin con otros cientficos. La evidencia (y por tanto la hiptesis) se
decide, pues, por un acuerdo o convencin razonado, reglamentado y objetivo. En caso de duda
hay que renunciar a tomar un acuerdo y proseguir la contrastacin y discusin.
Precisamente, que sean decisiones y no conclusiones (lgicas) lo que en ltimo trmino
decide el destino de una hiptesis (causal), habla de que la evaluacin de la hiptesis es tentativa,
provisional, no concluyente o definitiva, tal como deca Popper.
2.
MODELOS CAUSALES EN EPIDEMIOLOGA
2.1. El modelo determinista modificado

Algunos autores, como Rothman, propugnan un modelo general de causacin que permite
relacionar algunos de los principales principios epidemiolgicos: fuerza de los efectos,
interaccin entre causas, proporciones de la enfermedad debidas a causas especficas, periodo
de induccin, etc. El modelo propuesto es un modelo teortico, es decir imaginario, pero que
ayuda a visualizar cmo pudieran ser las cosas y, por tanto, alienta a comprobarlas. En este
modelo, causa se define como el suceso, condicion o caracterstica, que inicia o permite, sola o
en conjunto con otras causas, una secuencia de sucesos que resulta en un efecto. Se trata de un
modelo determinista modificado. Es determinista porque supone que una enfermedad puede
tener una o ms causas suficientes (CS), cada una de las cuales, por s mismas, determina
inexorablemente la enfermedad en un individuo. Cada CS (o mecanismo causal terico) est
compuesta de una constelacin mnima de causas componentes (CC) que interactan para
producir un efecto (figura 13-2). Mnima significa que cada una de las CC es necesaria para
producir la enfermedad. El problema es que en el estado actual del conocimiento, para la
mayora, si no todas, las enfermedades conocemos solo algunos de sus componentes. Por eso el
modelo atempera el determinismo modificndolo, dando cabida al azar en forma de factores o
CC todava no identificados. No conocemos una CS ni siquiera del cncer de pulmn. As, que
un individuo fumador, o expuesto a radn o asbestos, desarrolle o no cncer de pulmn, podra
deberse a que acten o no otros factores causales todava desconocidos, necesarios para
completar una CS. Por ltimo, se denomina causa necesaria a aquella CC que est presente en
todas las CS de una enfermedad , y sin la cual, por tanto, no se produce ningn caso de
enfermedad.
ENS Octubre 2009
209
Figura 13-2. Modelo causal determinista modificado. Modificado de Rothman, 1998.
Causa
suficiente
I
E
D
Causa
suficiente
II
C
A
B
Azar
cognoscible
C
D
Causa
suficiente
III
F
B
D
C
F
A
C
Azar
intrnseco
Fte: Rothman y elaboracin propia.
Por el contrario, un modelo indeterminista dira que no solo hay azar por ignorancia, debido
a factores desconocidos, sino que el azar es intrnseco a la situacin, est abierto a mltiples y
no predeterminadas circunstancias (figura 13-2). Dado que para cada enfermedad hay mltiples
factores implicados, con mltiples interacciones posibles, no podemos predecir qu ocurrir en
un caso concreto. El futuro est indeterminado, abierto. No es solo un problema de ignorancia
de los factores implicados.
El modelo es til para orientar la investigacin epidemiolgica y la toma de decisiones.
Segn este modelo, un factor es una causa de un evento si su alteracin conlleva una variacin
de la frecuencia de la enfermedad, pues desde un punto de vista pragmtico la epidemiologa
persigue descubrir relaciones que ofrezcan posibilidades para la prevencin. La causacin
necesaria y suficiente son simplemente extremos de esta definicin. En el momento actual, la
mayor parte de los factores causales conocidos no son necesarios ni suficientes para producir la
enfermedad: la actuacin del factor causal incrementa la frecuencia del resultado; pero el
resultado no siempre ocurre, y puede ocurrir sin la actuacin del factor. Por eso muchos se
inclinan a hablar solo de factores de riesgo (causales).
Este modelo acomoda tambin algunos principios epidemiolgicos (figura 13-2):
1. No es necesario conocer todas las CC para prevenir la enfermedad. Eliminando uno de
los elementos de la CS se previenen todos los casos de enfermedad (o fraccion etiolgica,
FE) que esta CS origina. As, si una CS de una enfermedad tiene cinco CC, a saber, A,
B, C, D, E; y la FE de la CC D es 20%, la FE de la/las CS de la que forma parte es
tambin 20% pues sin D la CS no se completa y, por tanto, la enfermedad no se
produce. Eliminando D se eliminan el 20% de los casos de esa enfermedad. De forma
similar, la eliminacin del uso de jeringuillas contaminadas (solo una causa componente)
prevendra la aparicin de un gran nmero de casos de Sida, hepatitis viral, etc.
2. La suma de las FE de todas las CS de una enfermedad es siempre el 100%. Sin embargo,
la FE correspondiente a cada CC equivale a la suma de las FE de la/las CS de las que
forma parte. As, si una enfermedad tiene tres CS, siendo la FE de la CS primera FE (I)
= 20%, y la de la tercera FE (III) = 50%, entonces la FE (II) = 30%. Y si la CS (I) la
forman las CC A, B, C, D, E; la II las A, B, F, G, H; y la III, las A, C, F, I, J, entonces,
ENS Octubre 2009
210
FE (D) = FE (E) = FE (I) = 20%

FE (B) = FE (I) + FE (II) = 50%
FE (A) = FE (I) + FE (II) + FE (III) = 100%
FE (A) + FE (B) + FE (C) + ... + FE (J) = 500%
Parece colegirse que en salud pblica debera considerarse en la priorizacin, aquellas
CC que por estar implicadas en varias CS responderan de una mayor proporcin de
enfermedad.
Que la suma de las FE de todas las CC pueda superar el 100% no significa obviamente
que pueda prevenirse ms del 100% de una enfermedad. No hay lmite superior a la
suma de las FE. Solo la FE atribuible a una causa aislada no puede exceder el 100%. Y
solo una causa necesaria contribuir al 100%. Por tanto, para cualquier enfermedad, la
suma de las FE de las CC es al menos del 100%. As, se ha declarado que los porcentajes
de casos de cncer atribuibles a factores de riesgo es: a la alimentacin insalubre el
10-70%, al tabaco el 25-35%, a los txicos laborales el 10-40%, a los txicos ambientales
el 5-10% y al alcohol el 10-20%. O el porcentaje de cardiopatas atribuibles a factores
de riesgo es: al colesterol srico el 30-40%, al tabaco el 20-25%, a la hipertensin el
20-25%, y a la inactividad fsica el 10-20%.
3. La medida en que una CC afecta a la frecuencia de la enfermedad depende de la
frecuencia relativa de las restantes CC pertenecientes a la misma CS en la poblacin.
As, si en la CS I de una enfermedad, la CC E est presente en el 50% de la poblacin,
y el resto de CC (A, B, C, D) estn presentes de forma combinada en la poblacin en
un 20%, entonces E contribuir con 0,50 x 0,20 = 10% de casos de enfermedad en la
poblacion. Si, por el contrario, E sigue presente en el 50% de la poblacin, y el resto
de CC de forma combinada en el 2% de ella, entonces la presencia de E conducira a
la enfermedad en un 1% de los individuos. Del mismo modo, la fuerza o riesgo relativo
(RR) de una CC depende de la frecuencia relativa de las restantes CC pertenecientes a
la misma CS en la poblacin.
4. Existe interaccin entre las CC de una CS, que depende de la prevalencia relativa de
dichas CC en la poblacin. Se habla de sinergismo si el efecto conjunto es superior a la
suma de los efectos por separado. Y de antagonismo si es al revs. Es decir, hay
interaccin (bajo un modelo aditivo) si el riesgo atribuible (RA) a la exposicin conjunta
de dos CC (A y B) es superior a la suma de sus RA por separado: RA (A+B) > RA (A)
+ RA (B). Y antagonismo, si es al revs.
5. Los periodos de induccin no son constantes para las enfermedades, sino especficos
de cada CC. Las CC actuando al inicio de la secuencia causal tienen un periodo de
induccin largo. Las CC finales, breve. Adems, no hay tiempos de induccin constantes
para una enfermedad en relacin con sus CC. Dosis pequeas requieren un conjunto de
CC para completar una CS mayor que las dosis grandes. stas tienen un periodo de
induccin ms corto al precisar menos CC para completar una CS.
2.2.
Otros modelos causales. Modelo de maraa o red
A pesar de las bondades del modelo anterior, se dispone actualmente de escasa informacin
sobre las causas de muchas enfermedades. De ah el inters de otros modelos causales ms
clsicos. En epidemiologa, muchos de los factores causales que se estudian no son mecanismos
bioqumicos o moleculares de las enfermedades, aunque stos brinden plausibilidad a las
relaciones epidemiolgicas. Sin embargo, dichos mecanismos son tambin causas. El modelo
ENS Octubre 2009
211
multicausal de la maraa o red acomoda de forma secuencial las causas distales y proximales
de la enfermedad en un solo esquema.
Por lo general una enfermedad tiene varias causas que, conjunta o independientemente,
dan lugar a la aparicin de la misma. De igual manera una sola causa puede contribuir a la
aparicin de varias enfermedades diferentes. Las causas de las enfermedades pueden dar origen
a stas de forma indirecta, es decir, a travs de la produccin de otras causas de enfermedad, o
directamente. En realidad casi siempre hay indicios de causas intermediarias; por eso la relacin
de causalidad est mejor caracterizada por el grado de proximidad que por el carcter directo o
indirecto de la misma. De hecho, el que una asociacin causal sea directa o no depende del
estado actual del conocimiento de los mecanismos de una asociacin particular, por lo que no
tiene implicaciones necesarias para la prevencin. La llamada red causal es un modelo que
ilustra de forma secuencial las relaciones entre causas y enfermedad. La figura 13-3 muestra
simplificadamente la red causal o modelo terico de produccin de la cardiopata isqumica.
Las causas que ocupan en la red los niveles jerrquicos ms altos, a menudo caractersticas
sociales, determinantes a su vez de estilos de vida o factores relacionados, son del mximo
inters desde el punto de vista epidemiolgico y preventivo. El modelo terico es un modelo
reduccionista (pueden existir varias redes causales para una enfermedad dada) que ayuda sobre
todo a identificar los elementos implicados (principales, confusores, modificadores de efecto,
etc.) en estudios concretos, y ayuda a comprender que la prevencin (reduccin) de la enfermedad
depende de la eliminacin de un elemento troncal de la red.
Este modelo est relacionado con el modelo determinista modificado. Cada uno de los
eslabones en la cadena causal pueden ser componentes de causas suficientes. Pero cada una de
las causas componentes tiene sus propias redes causales; y una enfermedad determinada puede
resultar de varias redes de causas suficientes, que pueden tener o no componentes en comn.
Figura 13-3. Modelo causal de maraa o red.
Secuencia de produccin de la cardiopata isqumica. Elaboracin propia.
Cardiopata Isqumica.
produccin.
Modelo terico de
-Educacin
-Renta
-Ocupacin
-Otros factores o
combinacin de
los anteriores
Factores de riesgo o
Modificadores de efecto
Indicadores NSE
Edad
Sexo
Raza
Perodo calendario
Otros
Factores nuevos
Me
ca
nis
m
os
NSE/Clase Social
Cardiopata Isqumica
Morbilidad
Hbitos de vida:
Tabaco
Dieta
Sedentarismo
Factores Biolgicos:
Colesterolemia
Tensin Arterial
Obesidad
Intolerancia a la Glucosa
Factores agudos
Asistencia Sanitaria
Cardiopata Isqumica
Mortalidad
NSE: nivel socioeconmico. Fte: Elaboracin propia.

ENS Octubre 2009
212
3.
3.1.
LOS CRITERIOS DE CAUSALIDAD

Los criterios de Henle-Koch
Cuando las principales enfermedades eran infecciosas, la cuestin se centraba en saber

qu evidencia era necesaria para probar que un organismo causaba la enfermedad. Henle
propuso en 1840 postulados de causacin, expandidos por Koch en los 1880s (tabla 13-1).
Sin embargo, conforme las enfermedades no infecciosas ganaron importancia a mediados del
siglo XX, se replantearon estos criterios. En 1954 E. Cuyler Hammond enunci una serie de
criterios, posteriormente discutidos y ampliados por Yerushalmy y Palmer en 1959, Sartwell
y otros. En 1964 un comit de expertos nombrado por el Surgeon General de Estados
Unidos de Amrica desarroll directrices para evaluar la evidencia sobre la relacin entre
tabaco y cncer de pulmn. Estas guas han sido revisadas desde entonces. Por ser los ms
conocidos y usados en epidemiologa, comentamos de forma detallada los criterios que Sir
Arthur Bradford Hill public en 1965, para valorar la posible causalidad de una asociacin.
Tabla 13-1. Criterios de causalidad segn diversos autores
Hume, 1739
1. Contigidad en tiempo y lugar
2. Prioridad en el tiempo
3. Conjuncin constante
Henle-Koch, 1882
1. Agente aislado en cultivo puro en cada caso de enfermedad
2. Ausencia del agente en otras enfermedades
3. Reproduccin experimental animal de la enfermedad
4. Agente recuperado del caso experimental producido
MacMahon, 1960
1. Secuencia temporal
2. Fuerza de la asociacin
3. Consistencia con conocimiento previo
Surgeon General de EE.UU., 1964
1. Consistencia
2. Fuerza
3. Especificidad
4. Relacin temporal
5. Coherencia
Pooling Project, 1978
1. Consistencia
2. Fuerza
3. Gradualidad
4. Independencia
5. Relacin temporal
6. Generalizabilidad predictiva
7. Coherencia
Kleinbaum et al, 1982 (factor de riesgo causal)
1. Debe covariar con la enfermedad (asociacin estadsticamente significativa)
2. Debe preceder en el tiempo a la enfermedad
3. Asociacin no debida enteramente a una fuente de error (sesgos o confusores)
ENS Octubre 2009
213
3.2.
Los criterios de Hill
Los criterios o estndares se dirigen a la evaluacin de la evidencia disponible sobre la

relacin entre dos factores, tpicamente la exposicin a un agente y una enfermedad. No
comentaremos los criterios en el orden en que Hill los enumer (tabla 13-2); aunque los enumer,
Hill no estableci una jerarqua entre ellos. Segn dijo, ninguno de los nueve puntos de vista
es incuestionable para aceptar o rechazar la causacin. Adems, los comentamos ms all de
lo descrito por Hill, haciendo referencias a su moderna valoracin. Como se aprecia en la
tabla 13-1, muchos de los criterios se corresponden con los enunciados antes y despus por
otros autores.
Aunque muchos autores (y el propio Hill) recomiendan usar los criterios causales solo ante
una relacin estadsticamente significativa, matizan esta cuestin. Por ejemplo, si el tamao
muestral es pequeo hay que interpretar una diferencia sustantiva no significativa como no
probada y no como no real o no causal. Adems, Hill resaltaba que los criterios causales solo
eran necesarios ante evidencia observacional. Ante buenos datos experimentales, en un ensayo
bien realizado, la existencia de significacin estadstica bastara para inferir una relacin como
causal. Pero, al margen de las dificultades prcticas y ticas, muchos experimentos reales, no
ideales, no garantizan automticamente que las variables extraas hayan sido controladas. El
propio Hill matiz esto en algunos de sus escritos. Los criterios, al menos algunos (por ejemplo,
consistencia o plausibilidad), pueden seguir siendo tiles. En definitiva, dice Hill, cuando la
diferencia observada es muy grande o muy constante, sera absurdo atribuirla al azar y carece
de importancia un test de significacin; y si es muy pequea no interesa si tcnicamente es
significativa o no. Pero entre estos dos extremos, los tests ayudan en la interpretacin.
Tabla 13-2. Criterios de causalidad de A.B. Hill, 1965*
Criterio
Descripcin
1. Fuerza
Riesgo relativo grande
2. Consistencia
Asociacin observada repetidamente por varias personas, en sitios,

circunstancias y pocas diferentes
3. Especificidad
Una causa lleva a un solo efecto
4. Temporalidad
La causa precede al efecto
5. Gradiente biolgico
La magnitud de la enfermedad aumenta con la magnitud de la

exposicin a la causa
6. Plausibilidad
La asociacin tiene sentido de acuerdo al conocimiento biolgico del

momento
7. Coherencia
Ausencia de conflicto con la historia natural y biolgica de la

enfermedad
8. Experimento
La reduccin de la exposicin a la causa se asocia a una disminucin de

la enfermedad
9. Analoga
Relacin causa-efecto ya establecida para un agente-enfermedad

similares
* Criterios enumerados en el orden propuesto por Hill.
ENS Octubre 2009
214
3.2.1.
Temporalidad
La exposicin al factor presuntamente causal debe preceder en el tiempo a la aparicin del

efecto. Pues podra ocurrir que fuera la consecuencia del efecto; as, muchos estilos de vida
(dieta, por ejemplo) cambian tras (y a consecuencia de) las etapas iniciales de la enfermedad
que presuntamente causan, sobre todo si es una enfermedad crnica de instalacin lenta. Sin
embargo, que la causa siga al efecto no significa que la causa no pueda causar ese efecto en
los casos en que le precede (la dieta desequilibrada puede causar enfermedad aunque en una
situacin dada se altere tras los primeros sntomas de la enfermedad asociada).
Un refinamiento til de este criterio es considerar que el tiempo en que la causa putativa
precede al efecto es relevante, es decir compatible con el periodo de induccin de la enfermedad
o consistente con un mecanismo biolgico. No todos los estudios epidemiolgicos tienen la
misma capacidad para poner de manifiesto este criterio. Por ejemplo, si el estudio es de cohorte
prospectivo el criterio es ms fcilmente comprobable que si es de casos-control retrospectivo.
Si el estudio es transversal, el criterio queda garantizado solo si el factor de exposicin es una
caracterstica fija (por ejemplo, el grupo sanguneo o la fecha de nacimiento). No solo el tipo de
diseo, tambin la medida de frecuencia elegida tiene diferente eficacia para demostrar la
secuencia cronolgica: es mejor la incidencia que la prevalencia, y la prevalencia de punto a la
de sobrevida.
Este es el nico criterio considerado por algunos autores como sine qua non. Sin embargo,
el propio Hill no lo consider imprescindible, probablemente por la dificultad de su consecucin
en ocasiones. Ser taxativo en la exigencia de este criterio llevara a despreciar muchos estudios
observacionales. Adems, el periodo de induccin de la ltima causa componente de una causa
suficiente cuyos componentes acten secuencialmente (algunos cnceres) es prcticamente
cero, es decir la causa sera prcticamente simultnea con el efecto. Por otro lado, el criterio es
muy obvio con algunos tipos de estudios (experimentos) o con variables fijas.
3.2.2.
Fuerza
Tambin denominado magnitud o intensidad de la asociacin o tamao del efecto, es el

primer criterio que Hill puso en su lista, y es el grado de estrechez de la asociacin entre el
factor y la enfermedad. En epidemiologa, la fuerza de la asociacin es usualmente medida por
el grado en que el RR o el odds ratio se separan de la unidad, sea por encima de 1 (en el caso de
exposiciones que causan enfermedad), o por debajo de 1 (en el caso de intervenciones
preventivas). Pero tambin puede estimarse por una diferencia de riesgos, de medias o de
proporciones, o por un coeficiente de regresin. La medida relativa del riesgo parece preferible
a la diferencia absoluta para valorar la fuerza de la asociacin por ser ms informativa: los
nmeros relativos son ms elocuentes en relacin con la etiologa. As, en la relacin del tabaco
con el cncer de pulmn, un RR de 8 (ratio de tasas 0,57/0,07 x1000 y ao en fumadores de
1-14 cigarrillos/da frente a no fumadores) es ms elocuente que una diferencia de tasas de
0,50x1000 y ao. Asimismo, una diferencia de 2,2 a 2,6 por mil de mortalidad por cncer de
pulmn y cardiopatas entre dos grupos (fumadores y no fumadores) es menos probable que sea
debida a un error de medicin si se presenta entre las tasas 2,27 y 0,07 (cncer de pulmn,
RR=32) que entre las tasas 9,9 y 7,3 (enfermedad cardiovascular, RR=1,4).
La regla de interpretacin de este criterio es que cuanto mayor es la fuerza ms verosmil
es la hiptesis causal (o ms probablemente causal es, se suele decir). Un RR muy alto (por
ejemplo, superior a 10 como para el tabaco y el cncer de pulmn) solo puede deberse a una
variable de confusin si es mucho ms frecuente en los expuestos que en lo no expuestos y se
asocia fuertemente con la enfermedad. Los confusores rara vez dan cuenta de una diferencia
tan considerable. Adems, para Hill, un RR muy alto requiere un factor tan ntimamente
ENS Octubre 2009
215
ligado al factor estudiado que sera fcilmente detectable. Inversamente, RR prximos o

inferiores a 2 (como en la relacin tabaco-trombosis coronaria) inducen a pensar en factores
de confusin (FC).
Se requiere experiencia en el rea de investigacin para apreciar cundo un RR u otra
medida del tamao del efecto es realmente grande, importante para constituir buena evidencia
de causalidad. A esta valoracin puede ayudar el examinar cun consistentemente grande es el
efecto a lo largo de una serie de estudios. En cualquier caso, autores como Brownson o Hill
hablan, en el contexto de las principales enfermedades crnicas, de RR dbiles si son inferiores
a 2; moderados entre 2 y 4, y fuertes si son superiores a 4 (estos RR suelen estar ajustados para
varios confusores). Weed ha propuesto recientemente, en el campo de la epidemiologa
nutricional, que RR estadsticamente significativos por encima de 1,2 o por debajo de 0,8 son
valorables en el juicio causal, dada la rareza de encontrar RR mayores de 1,2 o menores de 0,8;
un RR de 1,4-1,5 (o 0,5-0,6) sera fuerte. Otros autores, por el contrario, son ms exigentes y
solicitan RR de al menos 4 o 5 para empezar a considerar que una relacin sea causal. Sin
embargo, exigir valores concretos al RR equivale a olvidar que los criterios no son reglas
lgicas, autosuficientes. La valoracin del tamao del efecto es una cuestin de juicio
informado.
Como todos los criterios, el de fuerza puede tener contraejemplos, excepciones. El propio
Hill reconoce que una asociacin dbil puede ser causal. As lo es la relativamente dbil relacin
entre consumo de cigarrillos y enfermedad cardiovascular (hay otras muchas pruebas de ello);
otro caso similar es el del tabaquismo pasivo y cncer de pulmn. Tambin una relacin fuerte
puede ser no causal, debido a FC no controlados. Es el caso del sndrome de Down y el orden
de nacimiento confundido por la edad materna. Por supuesto, una vez que el confusor est
identificado, su control reduce la asociacin.
Otra limitacin del RR (u otra medida de la intensidad de la asociacin) es que su
magnitud depende de la prevalencia de las otras causas componentes necesarias para completar
la causa suficiente o mecanismo causal del que forma parte. Cuanto ms frecuentes son las
causas complementarias de un factor, mayor es la fuerza de ste y al contrario. As, el RR es
diferente entre poblaciones con distinta distribucin de factores de riesgo: el RR de enfermedad
coronaria por hipercolesterolemia en dos poblaciones con similar frecuencia de la misma,
ser mayor en aquella que tenga mayor proporcin de fumadores o hipertensos (las tres
variables forman parte de la misma causa suficiente de la enfermedad, digamos la placa de
ateroma).
En conclusin, una asociacin fuerte slo sirve (ni ms, ni menos) para descartar la hiptesis
de que la asociacin es debida enteramente a un confusor u otra fuente de sesgo modesto. Pero
cuanto ms especfico es el constituyente de una causa, ms cerca del evento biolgico est, o
ms especfica o precisa es la medida de la exposicin, ms fuerte es la asociacin. Cuando,
como es frecuente, la variable de exposicin medida es una estimacin muy indirecta del
verdadero factor biolgico de inters, la asociacin es dbil. Por ejemplo, medir un alimento en
lugar de una vitamina. Cuando el factor evaluado es un estimador ms prximo del agente
biolgico verdadero, el RR ser mucho ms alto. Esta es otra razn por la que un RR fuerte es
ms verosmilmente causal.
3.2.3.
Consistencia
Para algunos es el criterio ms importante de causalidad. No basta un resultado aislado

para refutar o corroborar en la prctica una hiptesis (causal). Es decir, aunque la evidencia
circunstancial puede apoyar positiva o negativamente una hiptesis, ni el mejor y mayor
ENS Octubre 2009
216
estudio aislado descarta verosmilmente el error; los estudios aislados son raramente
definitivos.
En epidemiologa no es posible el grado de control conseguible en el laboratorio y, por
tanto, el sustituto de la replicacin exacta es la repeticin en condiciones similares: basta que se
reproduzcan razonablemente las condiciones relevantes del estudio (sujetos comparables,
misma variable de resultado, etc.) para comprobar si el efecto es similar, es decir, si hay
consistencia. Hallazgos similares obtenidos en diferentes poblaciones, bajo circunstancias y
con mtodos distintos, y por diferentes investigadores, tienen un peso mayor para apoyar la
causalidad. Es poco probable que estudios con errores diferentes concluyan una misma cosa si
sta no es cierta. Por ejemplo, el juicio causal sobre la relacin entre el consumo actual de
cigarrillos y el riesgo de enfermedad coronaria se fortaleci cuando se realizaron un gran nmero
de estudios casos-control y de cohortes en los ltimos 40 aos en un amplio rango de poblaciones
de culturas distintas, observando a millones de personas, y todos ellos mostraron consistentemente
un riesgo aumentado.
Hay dos tipos de replicacin. La primera es la mera repeticin, con nimo de verificar
apresurada o fuertemente un resultado. La segunda es la que vara las circunstancias o mtodos
para ver si la hiptesis resiste nuevas pruebas independientes, duras, severas (ordeals): por
ejemplo, con medicin ms precisa (tcnicas ms fiables) de la exposicin o de la enfermedad,
poblaciones de distintas caractersticas sociodemogrficas, o consideracin de otros factores
causales o FC, etc. Esta segunda es la ms rica y til para la inferencia causal. Por eso la
contrastacin de la hiptesis de Barker sobre los orgenes fetales de la enfermedad coronaria ha
sido acusada de verificacionismo -lo que no quiere decir que no sea cierta-: para algunos slo
se han buscado pruebas a su favor, pero no se ha contrastado duramente, para ver si surgen
contraejemplos (controlando el nivel socioeconmico a lo largo de la vida, o estudiando gemelos;
o buscando mecanismos plausibles). En trminos filosficos, la refutacin es ms fuerte que la
verificacin. Las pruebas afirmativas son ms fciles de buscar y encontrar (sobre todo en los
primeros estudios); y mientras que un conjunto finito de observaciones, si son verdaderas y
contradicen a la hiptesis, puede refutarla, bajo ninguna condicin podra verificarla al concordar
con la misma (siempre habr casos inobservados que pueden contradecirla).
La cuestin de cundo una relacin es consistente es materia de juicio aunque, como en
otros criterios, no es un asunto arbitrario. Adems, que no haya un criterio ntido no significa
que no haya una idea reguladora, una regla que nos oriente y que facilite el acuerdo. Una regla
razonable puede ser: para ser consistentes, los hallazgos obtenidos en estudios comparables y
correctamente realizados deben ir en la misma direccin (RR por encima o por debajo de 1).
Aunque los resultados pueden diferir en tamao, y esto puede tener trascendencia prctica, ello
va ms all de la valoracin de la causalidad. Sin embargo, nadie duda que es deseable que los
hallazgos consistentes tengan una magnitud (por ejemplo, RR) similar.
Este criterio tiene tambin sus excepciones. Si no se repite la asociacin, no puede
descartarse una relacin causal porque algunos efectos ocurren solo bajo circunstancias
inusuales. Ms precisamente, el efecto de un agente causal no puede producirse a menos que
acten antes o despus las causas componentes, que se complementan hasta producir una causa
suficiente. Estas condiciones no son siempre satisfechas. As, el contacto con el virus HIV
puede causar infeccin, pero no siempre lo hace: el virus tiene que estar presente en una
concentracin determinada y en una zona permeable a su entrada (zona de la piel con prdida
de integridad por ejemplo). Adems, en ocasiones ocurren acontecimientos singulares, como el
exceso de cncer de pulmn y senos nasales en trabajadores de refinera de nquel en Gales del
Sur a principios de siglo. Aparte de esto, son frecuentes los resultados inconsistentes al repetir
estudios. No se trata de comparar el nmero de estudios con resultado positivo con el de los
ENS Octubre 2009
217
negativos. Cada estudio debe ser evaluado segn su calidad, sesgos y otros criterios que veremos;
y hay que ponderarlos, siquiera sea por juicio cualitativo. Los resultados negativos que sean
falsos pueden ocurrir por tamao muestral pequeo, sesgos o FC. Un estudio que falle en
encontrar una asociacin, pero que es limitado en metodologa y tamao, de modo que no tiene
poder suficiente para detectar un efecto (si existe), es de poco valor; por eso es de dudoso valor
que un resultado nuevo y controvertido sea contradicho por estudios dbiles, mal diseados o
pequeos. A veces, los resultados aparentemente contradictorios pueden explicarse por la
presencia de modificacin de efecto, es decir, porque la exposicin tiene efectos distintos en
diversos sectores de la poblacin. En cualquier caso, si los hallazgos de varios estudios son
inconsistentes, la inconsistencia tiene que ser explicada. Por ltimo, si la asociacin se repite
podra deberse a un sesgo siempre en la misma direccin. Por tanto, ni la ausencia ni la presencia
de consistencia garantiza la causalidad.
Por ltimo, la consistencia est muy relacionada con la generalizacin (validez externa o
aplicabilidad de los resultados a otras poblaciones). La repeticin en diversas circunstancias es
el mejor test de generalizabilidad; y la consistencia, de generalizacin. Por ejemplo, el estudio
de Framingham para examinar las causas de la enfermedad coronaria se dise originalmente
en individuos de edad media, de clase media, en una muestra sistemtica en la pequea ciudad
norteamericana de Framingham. Pero sus resultados (p.e., la hipercolesterolemia como factor
de riesgo cardiovascular) se aplican en otras partes del mundo. Y ello no solo porque la hiptesis
es universal por la constancia de las relaciones biolgicas subyacentes (y, por ende, de los
patrones de enfermedad y RR) entre diferentes individuos, sino tambin porque se han obtenido
resultados similares al volver a examinar esas relaciones o hiptesis en otras poblaciones, otras
circunstancias y con otros mtodos de estudio. Adems, la generalizacin no es solo una manera
de examinar la aplicabilidad de los resultados sino, adems, un mtodo de enriquecer o elaborar
la hiptesis causal, de corroborarla ms fuertemente, pues una hiptesis ms general ha probado
su temple en ms circunstancias.
3.2.4.
Gradiente biolgico
Tambin llamado relacin dosis-respuesta. Para algunos autores es una variante del criterio
de magnitud. Nos dice que si un factor es causal, cuanto mayor es la exposicin al factor mayor
es el riesgo de enfermedad. Es decir, hay una relacin monotnica entre el factor y su efecto.
Si es posible, las variables predictoras deben medirse de forma continua o mediante varias
categoras, para estudiar la relacin dosis-respuesta. La asociacin entre fumar cigarrillos y
cncer de pulmn es un ejemplo de esta relacin: los fumadores moderados tienen tasas de
cncer ms elevadas que los no fumadores, y los grandes fumadores presentan tasas an
mayores. Tambin la relacin de las radiaciones con el cncer parece ser aproximadamente
lineal a lo largo de todo el intervalo de exposicin. Sin embargo, otras asociaciones producen
relacin curvilineal (p.e. osteoporosis/fractura, presin arterial/enfermedad cardiovascular), y
otras son en forma de U o J (p.e. peso/mortalidad) (figura 13-4).
Hay relaciones causales que no cumplen este criterio. Algunos efectos solo se producen
por encima de un umbral de exposicin, como en el caso de las relaciones presin intraocular/
glaucoma, o dietilestilboestrol y cncer de vagina. Tampoco las asociaciones que muestren
relacin dosis-respuesta son necesariamente causales, pues puede solo reflejar el efecto de un
confusor no controlado. Por ejemplo, la relacin dosis-respuesta entre el tabaco y la cirrosis
heptica se explica por la fuerte asociacin monotnica entre el tabaco y el consumo de
alcohol.
ENS Octubre 2009
218
Figura 13-4. Relacin dosis-respuesta en cuatro situaciones. Tomado de Rose, 1992

(La estrategia de la medicina preventiva. Masson, 1994).
Hbito de fumar/cncer de pulmn

Radiaciones/cncer
Riesgo
Riesgo
Presin intraocular/glaucoma
Anemias/sntomas
Alcohol /accidentes de trfico (?)
Exposicin
Exposicin
Peso/mortalidad
Presin arterial/sntomas
Riesgo
Riesgo
Edad materna/sndrome de Down

Osteoporosis/fractura
Presin arterial/enfermedad
Cardiovascular
Exposicin
Exposicin
Relacin dosis-respuesta en cuatro situaciones. Fte: Rose G. La estrategia de la medicina preventiva. Masson, 1994.
3.2.5.
Plausibilidad
El apoyo que se exige a una hiptesis causal no tiene por qu consistir solamente en
datos que corroboren sus implicaciones (convalidacin emprica); puede venir tambin de
hiptesis o teoras ms amplias que tengan apoyo emprico independiente. Si se aade esta
convalidacin terica, la explicacin es ms profunda, ms satisfactoria. En una palabra, no
nos conformamos con correlaciones consistentes, universales, explicativas de hechos o
problemas, queremos saber el mecanismo que las explica.
Un mecanismo biolgicamente plausible, conocido o postulado, debera poder explicar por
qu la exposicin altera el riesgo de desarrollar la enfermedad. Sin embargo, dado que su
consideracin depende del estado actual del conocimiento, su falta no descarta la causalidad. Un
ejemplo es la asociacin entre el tabaquismo y el cncer de cervix. Al principio le faltaba
verosimilitud biolgica y se crey poco en ella, pero luego se identificaron componentes del humo
del tabaco en el moco cervical y en otros lquidos corporales de las fumadoras. De hecho, las
observacin aparentemente implausible alent la bsqueda de mecanismos. Por otra parte, su
presencia no garantiza causalidad. Un mecanismo aparentemente plausible para la asociacin
puede luego no demostrarse, y la asociacin puede estar sesgada. Adems, una hiptesis
epidemiolgica puede ser compatible con varias teoras mecansmicas.
Una teora mecansmica es preferible a una que no considera el mecanismo, por ser
lgicamente ms fuerte (implica a sta), ms rica (mayor contenido), metodolgicamente ms
exigente (da ms numerosas y precisas oportunidades de contrastacin), y suministrar una
explicacin ms profunda (detalla un nivel de la realidad distinto, ms bsico). Un ejemplo es
la teora oxidativa de las LDL como mecanismo para explicar la relacin entre colesterol srico
y cardiopata isqumica.
ENS Octubre 2009
219
La ausencia de este criterio tiene que ver con las llamadas relaciones o hiptesis de caja negra,
que ignoran los mecanismos de la relacin observada, y que algunos identifican con la epidemiologa
de factores de riesgo. Las relaciones de caja negra pueden ser valiosas; hay muchos ejemplos de ello.
Adems, son ms generales, sencillas, precisas y seguras, por lo que muchos investigadores siguen
proponindolas. Pero buscar su mecanismo puede lograr un mejor conocimiento del problema y, por
tanto, mejorar sus posibilidades de control. Aunque Snow no conoca la implicacin de un bacilo en
la epidemia de clera de Londres el pasado siglo, ni lo necesit para controlar la epidemia, el
conocimiento microbiolgico (posterior) mejor las medidas de prevencin y tratamiento de este
mal. Adems, que se busquen los microhechos biolgicos que subyacen a los macrohechos
epidemiolgicos es independiente, y compatible con que se busquen sus mecanismos sociales, las
causas de las causas. No hay antagonismo entre epidemiologa de factores de riesgo, epidemiologa
molecular y ecoepidemiologa.
Por ltimo, el criterio de plausibilidad est relacionado con el de consistencia o, mejor dicho, con
el de repetibilidad. Al fin y al cabo, considerar los mecanismos equivale a examinar si la hiptesis
causal se mantiene, y es consistente con circunstancias evidenciales biolgicas, que son tests ms
severos y persuasivos de la hiptesis. Adems, este criterio est relacionado con la generalizacin:
considerar los mecanismos conocidos o postulados de una asociacin ayuda a decidir si es aplicable a
otros grupos de sujetos.
3.2.6.
Especificidad y analoga
Son dos criterios despreciados por algunos autores. La especificidad postula que una causa
conduce a un efecto nico, no a efectos mltiples. Sin embargo, muchos factores aislados suelen tener
muchos efectos (por ejemplo, el tabaco). En todo caso, cierta especificidad en la magnitud de la
asociacin puede contribuir a la verosimilitud de una hiptesis causal (as, en la relacin tabaco/cncer
de pulmn el RR aumenta mucho ms que en la del tabaco con otras enfermedades). La analoga
postula que asociaciones causales similares podran producir enfermedades similares. Por ejemplo, si
un medicamento puede causar malformaciones congnitas, quizs puede hacerlo otro. Este criterio,
contemplado por Hill y MacMahon, forma parte del concepto global de plausibilidad, pues se refiere
a que la relacin es anloga a alguna otra relacin bien establecida; y, ms bien, es til para formular
hiptesis ms elaboradas que para evaluarlas.
3.2.7.
El experimento
Tambin llamado cesacin de la exposicin. Si un factor tiene un efecto, dicho efecto debera
cesar cuando es removido el factor. El proyecto en marcha Womens Health Initiative, que
contrasta entre otros los efectos de una dieta baja en grasas sobre la incidencia del cncer de mama,
es un buen ejemplo. Este criterio no siempre es obtenible en poblaciones humanas, pero si el
experimento se puede llevar a cabo constituye la prueba ms slida de causalidad. El criterio de
experimentacin es un criterio o regla metodolgica de severidad o robustez de la hiptesis. Pero
incluso puede ser visto, ms que como un criterio, como un test directo de la hiptesis causal.
3.2.8.
Coherencia
Para Susser y otros la coherencia incluye al criterio de analoga y plausibilidad. La

coherencia dice que la asociacin no debe entrar en conflicto con lo que se sabe de la enfermedad.
Es decir, debe ser consistente con el conocimiento existente. As, la asociacin del cncer de
pulmn con el consumo de tabaco es coherente con el aumento temporal habido en las dos
variables desde principios de siglo, y con la diferencia sexual en la mortalidad. Contribuyen a
la coherencia las alteraciones histopatolgicas observadas en el epitelio bronquial de los
fumadores, y la presencia en el humo del tabaco de carcingenos para la piel de los animales de
laboratorio.
ENS Octubre 2009
220
Pero la no coherencia (distinguirla del conflicto) no debera ser prueba en contra de la

causalidad. As, la ausencia de reproduccin de la hiptesis en animales de laboratorio no va en
contra de la relacin en humanos. Y si el factor causa solo una pequea proporcin de la
enfermedad total, la influencia abrumadora de otros factores puede hacer al patrn global
incoherente.
Es de inters aadir que, volviendo a las consideraciones filosficas de la causalidad, para
nosotros los criterios de causalidad, como otras muchas reglas de la ciencia, no fueron concebidos
como reglas de inferencia lgica, ni inductiva ni deductiva, sino como reglas metodolgicas,
reglas de discusin crtica, es decir criterios que ayudan, no imponen con fuerza lgica (o probable),
a decidir si la evidencia apoya o rechaza, o no permite concluir, siempre tentativamente, sobre la
hiptesis causal.
Precisamente que los criterios sean reglas metodolgicas, decisionales, explica que puedan
tener, como hemos dicho, excepciones. Las decisiones se incluyen en el mtodo crtico de la
ciencia, pero siempre como decisiones tentativas y sujetas a la crtica. Nuestras decisiones no
tienen por qu ser decisiones ltimas. Realmente, si se acepta que tienen esta naturaleza, sobrara
tener que justificar que no son necesarios ni suficientes para la causalidad. Por eso sta es una
cuestin de juicio, gradual, aunque dicotmica en la accin (se acta -o no-, como si la hiptesis
causal fuese cierta). En todo caso, sera preferible evitar el trmino criterios por su connotacin
de necesarios y concluyentes (criterio = mtodo definitivo o seguro de decisin). Se trata ms
bien de reglas o normas flexibles, orientadoras, y provisionales.
3.3.
Otros criterios de causalidad
Aceptando que los criterios de Hill son tiles en la prctica, no capturan todos los elementos
tiles para la inferencia causal. Por ello, recientemente diversos comits de expertos y autores
a ttulo individual han aumentado, modificado o desechado los criterios de Hill. Veamos algunos
de esos otros criterios.
3.3.1.
Descarte de explicaciones alternativas. Criterio de independencia
Puede haber explicaciones de la realidad alternativas a la causal, como son los sesgos y los
FC y el azar. Algunos autores abogan por una discusin especfica de estos factores (lo que en
la prctica siempre se hace, por cierto) y no considerarlos solo indirectamente a travs de
algunos de los criterios de Hill.
Para muchos autores estos criterios negativos (el descarte razonable de sesgos y FC
apoya la causalidad) deben ser la primera consideracin en la evaluacin de una hiptesis causal.
El orden de la valoracin debe ser: primero los sesgos y luego FC, pues si hay sesgo severo,
ninguna manipulacin de los datos salvar el problema. La valoracin del azar vendr en tercer
lugar.
Una concrecin de la consideracin de los FC es el llamado por algunos autores criterio de
independencia. Este criterio es considerado en muchos estudios bajo la forma general de que
la asociacin no debe ser debida enteramente al efecto de un FC. El U.S. Pooling Project (1978)
de estudios observacionales prospectivos sobre determinantes de la enfermedad coronaria lo
incluy entre sus criterios de causalidad: un factor de riesgo es independiente si mantiene al
menos un cierto grado de efecto una vez controlada (generalmente por mtodos multivariados)
la influencia de otros determinantes relevantes de la enfermedad. Este criterio lo cumplan en
1978 el aumento de colesterol srico, el consumo de tabaco y la hipertensin arterial (tras
ajustar por edad y los otros factores predictores).
ENS Octubre 2009
221
3.3.2.
Poder explicativo
Este criterio tiene que ver con la audacia, originalidad, novedad, contenido informativo,
rendimiento o poder predictivo o explicativo, inters e importancia de una hiptesis (causal).
Son caractersticas interrelacionadas que sirven para evaluar a priori una hiptesis causal,
ayudando as al progreso de la ciencia si esa hiptesis resulta corroborada a posteriori.
Una hiptesis es audaz si es nueva, va ms all de la vigente, predice hechos previamente
insospechados; o si da respuesta a una pregunta no contestada todava o que lo ha sido de forma
contradictoria o no replicadamente. MacMahon resaltaba que en epidemiologa, como en otras
ciencias, el progreso en la bsqueda de asociaciones causales se favorece con hiptesis nuevas
o ms especficas. Popper distingue dos componentes de la audacia. Audacia de predecir de la
hiptesis aspectos observables hasta ahora pasados por alto, que son tan osados que corren el
riesgo de ser falsos y, por tanto ha de intentarse refutarlos. Por eso, si resisten los tests (criterios),
se admite provisionalmente la hiptesis como verosmil: es muy improbable que el xito de una
teora tan audaz, tan improbable, tan poderosa sea debido a errores o sesgos. La segunda audacia
es suponer la realidad escondida tras lo observable: postular los mecanismos o las leyes
biolgicas subyacentes a la hiptesis o relacin epidemiolgica; se relaciona con la plausibilidad
biolgica.
La audacia, originalidad, novedad o inters de la hiptesis a priori, se relacionan con su
poder para predecir o explicar ms hechos observables novedosos e interesantes que la hiptesis
previa, vigente, o que una rival. Un rico contenido informativo de la hiptesis permite que la
contrastabilidad de la misma sea independiente y, por tanto, ms severa, ms frtil, ms
corroborable. Pero para que se produzca progreso en el conocimiento, algunas de esas nuevas
predicciones deben ser corroboradas de hecho, superar contrastaciones ingeniosas y rigurosas.
Esas pruebas rigurosas presuponen un alto grado de contrastabilidad o contenido a priori. De
ah la importancia del criterio llamado por Susser rendimiento predictivo: nuevas predicciones
que resulten exitosas, concepto tomado de Popper.
Un ejemplo de teora audaz es la de Ross sobre la aterosclerosis (1976), segn la cual la
placa de ateroma es la consecuencia de la respuesta local a la lesin endotelial. La lesin
endotelial daba lugar a la agregacin plaquetaria y el factor de crecimiento derivado de las
plaquetas originaba una proliferacin y emigracin del msculo liso que produca la placa de
ateroma. Incorporaba, pues, la plaqueta como nuevo elemento a la teora clsica y subrayaba el
fondo inflamatorio de la proliferacin. Posteriormente (1986, 1993), nuevos hallazgos cambiaron
la plaqueta por el monocito como clula fundamental. La teora actual es una sntesis de las tres
hiptesis iniciales: la inflamatoria de Virchow, la trombtica de Rokitansky y la lipdica de
Anitschkow. El hecho clave de la aterosclerosis, particularmente de su comienzo, es el acmulo
de lipoprotenas; la trombosis es fundamental en la placa rota inestable y el infarto de miocardio,
y la inflamacin es evidente en el papel de monocitos, macrfagos y proliferacin muscular lisa
en la gnesis del ateroma. La moderna teora subsume, pues, a las anteriores, predice los hechos
previstos por ellas y, adems, aade nuevas predicciones; es ms rica en contenido (y verosmil
tras contrastarse).
El inters de una teora depende tanto de la sorpresa como de la importancia. El inters
terico es el potencial para cambiar lo que los cientficos creen sobre importantes relaciones
causales. Lo sorprendente, lo contra-intuitivo debera ser un criterio importante para las buenas
hiptesis. El inters decae ante las numerosas replicaciones de una hiptesis; el inters se reaviva
al buscar y encontrar factores contextuales que modifiquen el efecto. La importancia se relaciona
con la frecuencia, gravedad y transcendencia social del problema implicado; los beneficios y
aplicabilidad anticipables de su resolucin; o el avance del conocimiento en ese u otros campos
ENS Octubre 2009
222
y las futuras guas de investigacin que probablemente se deriven. Por ejemplo, las hiptesis
sobre el cncer son ms importantes que aquellas sobre varices porque son ms las personas (y
los fenmenos biolgicos y psicolgicos) que estn afectadas ms profundamente por el primero.
Si bien, en ejemplos menos obvios las ramificaciones de una teora suelen ser difciles de
anticipar.
Es fcil deducir la conexin de este criterio con los de consistencia, plausibilidad,
independencia y con la generalizacin.
3.3.3.
Calidad de la evidencia
Este criterio se refiere a la categorizacin de la evidencia por la calidad de sus fuentes o tipos
de estudios. Se relaciona con la validez interna y la fuerza demostrativa de causalidad derivada de
los tipos de estudios o fuentes suministradoras de la evidencia.
Aunque considerado en parte en el criterio de consistencia (replicacin en diferentes
mtodos o diseos), la acepcin moderna del criterio de calidad de la evidencia introduce la
clasificacin de los tipos o diseos en orden descendente segn su fortaleza, es decir, del grado
en que stos consiguen el control de variables extraas. As, diversos grupos han establecido
clasificaciones jerrquicas de la calidad de la evidencia cientfica, fundamentalmente de cara a
priorizar intervenciones preventivas o a evaluar tecnologas sanitarias (tabla 13-3).
Tabla 13-3. Clasificacin de la calidad de la evidencia segn el diseo del estudio fuente.
Diseo
Ensayo clnico
Estudio de cohortes
Estudio de casos y controles
Estudio transversal
Estudio de riesgo agregado
Serie de casos
Informe de un caso
Los tipos de estudio estn enumerados en orden descendente de calidad. Estos o similares criterios son utilizados
por los grupos de trabajo americano y canadiense de servicios clnicos preventivos, y diversas agencias de evaluacin de tecnologas sanitarias, para juzgar la calidad de evidencia en la que apoyar algunas recomendaciones de
prctica clnica.
La corroboracin de una hiptesis causal es mayor cuanto ms severas son las condiciones
de contrastacin; en este caso, la homogeneizacin o minimizacin de factores perturbadores
(tpicamente FC) de la relacin causal en el estudio contrastador, conseguible en mayor grado
por la randomizacin en estudios experimentales; en un grado menor por restriccin,
equiparamiento, anlisis estratificado o modelos matemticos en estudios observacionales de
cohortes o casos-control; a continuacin, los estudios correlacionales poblacionales; y en un
grado mnimo en estudios descriptivos, series de casos o experiencias clnicas.
3.4.
Un ejemplo de aplicacin de criterios de causalidad
Veamos cmo se puede practicar la inferencia causal sobre la relacin entre la infeccin
por Helicobacter pylori (H. pylori) y la lcera duodenal utilizando algunos de los principales
criterios (bsicamente los de Hill).
1. Relacin temporal. En un estudio de 454 pacientes sometidos a endoscopia, 34 de los
321 pacientes positivos al H. pylori (11%) desarrollaron posteriormente lcera duodenal
a lo largo de 10 aos, comparados con 1 de 133 H. pylori-negativos (0,8%).
2. Fuerza de la relacin. El anterior estudio produce un RR prximo a 14.
ENS Octubre 2009
223
3. Relacin dosis-respuesta. El riesgo de lcera duodenal aumenta con la densidad de H.

pylori por mm2 de mucosa gstrica.
4. Replicacin de los hallazgos. Muchas de las observaciones referidas al H. pylori han
sido replicadas repetidamente.
5. Plausibilidad biolgica. El H. pylori tiene sitios de unin sobre las clulas antrales y
puede seguir a estas clulas en el duodeno. El H. pylori tambin induce mediadores de
inflamacin. La mucosa infectada por H. pylori est debilitada y es susceptible a los
efectos dainos del cido gstrico.
6. Consideracin de explicaciones alternativas. La asociacin del H. pylori con la lcera
duodenal podra explicarse por su fuerte asociacin con el consumo de tabaco. Sin
embargo, los datos sugieren que el tabaco puede incrementar el riesgo de lcera
duodenal en pacientes infectados por H. pylori pero no es un factor de riesgo en
pacientes en quienes el H. pylori ha sido erradicado. Por ello, este grmen es necesario
para la produccin de la lcera por el tabaco, y ejerce al menos un papel co-causal.
7. Cesacin de la exposicin. La erradicacin del H. pylori cura la lcera duodenal en la
misma medida que los antagonistas de los receptores de histamina. Las tasas de
recurrencia de lcera a largo plazo tras erradicar al H. pylori con terapia triple
antimicrobiana fueron cero, comparadas con tasas de recaida del 60-80% encontradas
en pacientes tratados con antagonistas de los receptores de histamina.
8. Especificidad de la asociacin. La prevalencia de H. pylori en pacientes con lcera
duodenal es 90-100%. Sin embargo, el H. pylori se ha encontrado en algunos pacientes
con lcera gstrica e incluso en individuos asintomticos.
9. Consistencia con otro conocimiento. La prevalencia de infeccin por H. pylori es la
misma en varones que en mujeres. La incidencia de lcera duodenal, que aos atrs se
crea que era mayor en varones, es igual en aos recientes. Adems, se cree que la
prevalencia de la enfermedad ulcerosa alcanz su pico en la ltima parte del siglo XIX,
y la prevalencia de H. pylori puede haber sido mucho mayor en esa poca debido a las
pobres condiciones de vida. Este razonamiento est tambin basado en observaciones
actuales de que la prevalencia de H. pylori es mucho mayor en los pases en vas de
desarrollo.
Aunque los anteriores criterios no permiten cuantificar si la asociacin es o no causal,
permiten sugerir de forma fuerte que lo es. En otras palabras, la hiptesis del H. pylori como
agente causal de la lcera duodenal parece razonablemente corroborada, hoy por hoy.
Sin embargo, los criterios de causalidad no son rgidas exigencias que permiten decidir si
la asociacin es o no causal. Entre otras razones porque estos criterios no son completos: hemos
de considerar tambin, como ya dijimos, los posibles sesgos y la calidad de las fuentes
generadoras de las evidencias. Adems, tienen excepciones y no hay acuerdo sobre cules deben
primar o como operativizarlos o valorarlos (es lo mismo un RR=2 en epidemiologa nutricional
que en la ocupacional?), o en qu medida se cumplen. Pero a pesar de sus limitaciones, los
criterios, como directrices orientadoras, facilitan la evaluacin de la evidencia y eventualmente
ayudan a tomar una decisin (tratar o no la infeccin por H. Pylori en la lcera duodenal, si se
dispone, como ocurre, de tratamiento eficaz).
4.
LA PRCTICA DE LA INFERENCIA CAUSAL
Al examinar la prctica de la inferencia causal en epidemiologa, Weed encuentra un uso

relativamente pobre y heterogneo de los criterios de causalidad de Hill, por lo que propugna
ENS Octubre 2009
224
un mayor uso de estos criterios, estudiar sus relaciones y desarrollar otros. Dado un determinado
conjunto de criterios, no est claro como combinarlos o priorizarlos, ni si esto es realmente
necesario o factible. En una aproximacin muy intuitiva, y a raz de un reciente debate sobre los
lmites de la epidemiologa como ciencia no experimental, se lleg a comentar que no son
crebles, de entrada, asociaciones cuyos RR no sean superiores a 3 o 4. Otros autores (Trichopoulos
y MacMahon) apuestan por hacer jugar un papel esencial a la plausibilidad biomdica ante
efectos inconsistentes y generalmente dbiles, y apostar por la causalidad ante asociaciones
fuertes y consistentes, aun en ausencia de apoyo biolgico. Estos mismos autores apuntan que
ante resultados inconcluyentes, moderadamente compatibles con la hiptesis, puede ajustarse la
principal medida de efecto no solo por confusores claros sino tambin por variables con
cuestionable, incluso improbable, influencia confusora. Esto mejora el control de la confusin
y la consiguiente ampliacin del intervalo de confianza reduce la tentacin de
sobreinterpretacin.
En la prctica de la epidemiologa y salud pblica, se empieza tambin a considerar
conjuntamente los criterios de Hill y los de calidad de la evidencia, es decir, a ponderar los
criterios de evidencia a la luz de los diseos de las fuentes de la evidencia, considerando
adicional y especficamente los sesgos y FC. Algunos autores sitan en un primer escaln de
evidencia a los estudios de mayor peso de diseo (ensayos clnicos y estudios de cohorte), en
segundo nivel a RR grandes y consistentes, y a los estudios casos-control y series temporales,
y en el ltimo los RR pequeos aunque plausibles y a los estudios transversales.
Sin embargo, prcticamente siempre el juicio causal se realiza valorando evidencias de
muchos tipos de estudios. As, los efectos del consumo de cigarrillos han sido demostrados
mediante experimentos con animales, grupos controlados y encuestas con seres humanos. De
hecho, la investigacin en humanos muchas veces comienza con pistas etiolgicas de
observaciones clnicas o estudios descriptivos, prosigue con estudios observacionales
analticos y, si stos parecen corroborar los hallazgos, se realiza una evaluacin experimental,
cuando es posible (agentes potencialmente beneficiosos). Esta es una secuencia inversa a la
evaluacin de calidad de las evidencias de las escalas jerrquicas. La consideracin conjunta
de los tres grandes tipos de estudios disponibles, la variedad de diseos (no la jerarquizacin
y prima excesiva de los experimentos), es, como vimos en el criterio de consistencia, una
regla que realza la inferencia.
Como seala Weed, un problema adicional es que la seleccin, clasificacin, definicin e
interpretacin de criterios varan de usuario a usuario y de grupo a grupo, lo que puede producir
juicios muy diferentes sobre la causacin a partir de la misma evidencia. De hecho, se suele
decir que la valoracin causal es materia de juicio subjetivo. De juicio s; subjetivo, no tanto. A
pesar de la aparentemente subjetiva disparidad, el proceso inferencial se objetiva al abrirse la
discusin a los dems. Las razones en pro y en contra se pueden sopesar y discutir; as se
posibilita el acuerdo. El refinamiento de los criterios y su sistematizacin, su mayor
reproducibilidad por todos, el mayor consenso sobre su definicin y reglas de interpretacin,
mejorar la toma de decisiones causales, pero sta es siempre provisional, revisable: todos
podemos errar en la misma direccin, o la evidencia puede cambiar.
Dada la cantidad de criterios existentes y la diversidad de su manejo, en la tabla 13-4 se
listan los criterios ms importantes, en un orden razonable segn diversas perspectivas. Se
prioriza el descarte razonable de explicaciones o factores no causales. El cuadro distingue
tambin los criterios que afectan a la validez interna, a la validez externa y a la comparacin con
otra evidencia. En general, los criterios ms fuertes son la precedencia temporal, la magnitud de
la asociacin, la consistencia con otros hallazgos y la credibilidad biolgica de la hiptesis.
ENS Octubre 2009
225
Tabla 13-4. Cuestiones ms relevantes para valorar la causalidad
A. Validez interna - Explicaciones no causales (o incluso ausencia de asociacin)

1. Sesgos
2. Factores de confusin
3. Azar
B. Validez interna - Caractersticas positivas
4. Relacin temporal
5. Fuerza
6. Dosis-respuesta
7. Consistencia
C. Validez externa - Generalizabilidad
8. Aplicacin a otras poblaciones
D. Comparacin con otra evidencia
9. Calidad de la evidencia
10. Consistencia
11. Plausibilidad
Modificado de Elwood (1988).
Por ltimo, las cuestiones tericas son independientes de si el epidemilogo, como

cientfico, debe aconsejar o no la accin, basndose en las evidencias cientficas de causalidad.
Su decisin puede quedar limitada a su evaluacin (metodolgica) de la hiptesis causal,
basada en la evidencia cientfica. Si no decide l sobre la accin, no faltarn otros, cientficos o
polticos, que, con evidencias cientficas u otras consideraciones, tomarn la decisin prctica
en nombre de todos.
5.
ABELSON RP. Statistics as principal argument. Hillsdale, NJ: Lawrence Erlbaum Associates, 1995.
BANEGAS JR, RODRGUEZ ARTALEJO F, REY CALERO J. Popper y el problema de la induccin en epidemiologa.
Rev Esp Salud Pb 2000;74:327-339.
BUNGE M. La investigacin cientfica. Su estrategia y su filosofa. Barcelona: Ariel, 1985.
ELWOOD JM. Causal relationships in Medicine. Nueva York: Oxford University Press, 1988.
GORDIS L. Epidemiology. Philadelphia: W.B. Saunders, 1996.
GREENLAND S (editor). Evolution of epidemiologic ideas. Chesnut Hill, MA: E.R.I., 1987.
HILL AB. The environment and disease: association or causation? Proc Roy Soc Med 1965; 58: 295-300.
MACMAHON B, TRICHOPOULOS D. Epidemiology. Principles and methods. 2 ed. Boston: Little, Brown, 1996.
POPPER KR. The logic of scientific discovery. 3 ed. London: Routledge, 1980.
RODRGUEZ ARTALEJO F, BANEGAS JR, RODRGUEZ ARTALEJO C, RODRGUEZ ARTALEJO A. Principios
del diseo experimental: del laboratorio a la epidemiologa. Revisiones en Salud Pblica 1995; 4: 149-168.
RODRGUEZ-ARTALEJO F, BANEGAS JR, HERRUZO R, REY-CALERO J. Causalidad en Epidemiologa. En:
Pidrola Gil. Medicina Preventiva y Salud Pblica. Barcelona: Masson, 2001.
ROTHMAN KJ (Ed.). Causal Inference. Chesnut Hill, MA: E.R.I., 1988.
ROTHMAN KJ, GREENLAND S. Causation and causal inference. En: Rothman KJ, Greenland S. Modern Epidemiology.
2 ed. Philadelphia: Lippincott-Raven, 1998.
STUART MILL J. De los cuatro mtodos de indagacin experimental. Cuadernos Teorema. Valencia: G. Lormo, 1980.
SUSSER M. What is a cause and how do we know one? A grammar for pragmatic epidemiology. Am J Epidemiology
1991; 133: 635-648.
ENS Octubre 2009
226

Manual Epidemiologico

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual Epidemiologico

Cargado por

Copyright:

Formatos disponibles

Manual Docente de la Escuela Nacional de Sanidad

Madrid, octubre de 2009

Escuela Nacional de Sanidad (ENS)

Catlogo general de publicaciones oficiales:

EDITA: ESCUELA NACIONAL DE SANIDAD

ENS Octubre 2009

Para citar este manual

CONCEPTO Y USOS DE LA EPIDEMIOLOGA ...........................................

Fernando Rodrguez Artalejo y Jose Ramn Banegas Banegas

MEDIDAS DE FRECUENCIA Y DE EFECTO .................................................

DISEO Y TIPOS DE ESTUDIOS EPIDEMIOLGICOS .................................

Jess Castilla Cataln

Fernando Villar lvarez

ANLISIS DE DATOS EPIDEMIOLGICOS .................................................

Javier Damin y Nuria Aragons

Marina Polln y Beatriz Prez

Javier Jimnez Jimnez

Juan de Mata Donado Campos

Miguel Angel Royo Bordonada y Jos Mara Martn Moreno

Iaki Imaz Iglesia y Jess Gonzlez Enrquez

Miguel Delgado Rodrguez

Jose Ramn Banegas Banegas y Fernando Rodrguez Artalejo

ENS Octubre 2009

ENS Octubre 2009

Concepto y Usos de la Epidemiologa

I. CONCEPTO Y USOS DE LA EPIDEMIOLOGA

La epidemiologa es la disciplina cientfica que estudia la frecuencia y distribucin de

ENS Octubre 2009

Concepto y Usos de la Epidemiologa

Sin embargo el rasgo que ms diferencia a la epidemiologa de otras disciplinas biolgicas

ENS Octubre 2009

Concepto y Usos de la Epidemiologa

Probabilidad del efecto

Probabilidad del efecto NO

Intensidad del efecto NO

Efecto SIN umbral de

Intensidad del efecto

Efecto CON umbral de

Tpicamente los cientficos de laboratorio exploran los numerosos mecanismos patognicos

ENS Octubre 2009

Concepto y Usos de la Epidemiologa

USOS DE LA EPIDEMIOLOGA EN EL CONTROL DE LOS PROBLEMAS DE SALUD

El fin ltimo de la epidemiologa es controlar los problemas de salud. Para ello la

Sugerir hiptesis sobre los posibles factores de riesgo de una enfermedad.

CONOCIMIENTOS PARA EL CONTROL DE PROBLEMAS DE SALUD EN LAS

Medir la importancia sociosanitaria de un problema de salud, con alusin especial a la

CONOCIMIENTOS PARA EL CONTROL DE PROBLEMAS DE SALUD EN LOS

Establecer la idoneidad de una prueba diagnstica y el orden en que debe aplicarse en el

ENS Octubre 2009

Concepto y Usos de la Epidemiologa

Primero, sobre la historia natural de las enfermedades y la eficacia de medidas preventivas y

Conocimiento de la historia natural de la enfermedad

La epidemiologa permite conocer muchos elementos de la historia de la enfermedad. Slo

Concepto y Usos de la Epidemiologa

clnica. Esta actividad de investigacin recibe el nombre de outcomes research o investigacin

Control de problemas de salud en las poblaciones

La epidemiologa proporciona informacin para responder a las tres preguntas

La enfermedad o problema de salud, es prevenible o controlable?

La epidemiologa ha demostrado que muchas enfermedades son prevenibles o controlables.

Si la enfermedad es prevenible, Cuales son las estrategias de prevencin y control

Esta pregunta se ha respondido en el caso de las enfermedades cardiovasculares a travs de

Concepto y Usos de la Epidemiologa

Cual es la magnitud del beneficio de las estrategias de prevencin?

Concepto y Usos de la Epidemiologa