Está en la página 1de 12

| 30 | Capítulo

Confusión y modificación del efecto

La finalidad del análisis de los resultados de un es- consumo de agua no puede considerarse un factor
tudio es obtener la mejor estimación posible del de confusión de la asociación entre el ejercicio físico
efecto, la diferencia o la asociación de interés, para y la enfermedad.
lo que se debe tener en cuenta la existencia de fac-
tores modificadores de dicho efecto y controlar la
No es necesario que la relación
influencia de los factores de confusión.
con la variable de respuesta sea causal
Un factor de confusión debe ser predictivo de la res-
CARACTERÍSTICAS puesta (es decir, estar asociado con ella), pero esta
DEL FENÓMENO DE CONFUSIÓN asociación no tiene que ser necesariamente causal.
De hecho, la mayoría de los factores de confusión
El fenómeno de confusión puede definirse como no son causa de la respuesta, sino simplemente mar-
la distorsión que se produce en la estimación de la cadores que están correlacionados con el verdadero
magnitud de la asociación entre el factor de estudio agente causal. En el ejemplo 2.13 sobre el riesgo
y la variable de respuesta, debida a la influencia de de IAM en función del sexo, éste no es la verdadera
uno o varios factores externos. causa, sino que simplemente expresa diferencias bio-
Como ya se ha explicado en páginas anteriores, lógicas que podrían ser la causa de la enfermedad.
para producir confusión, una variable debe estar La edad y el sexo son ejemplos claros de variables
asociada tanto con el factor de estudio como con que están asociadas con multitud de enfermedades,
la variable de respuesta, y no debe formar parte de la pero que no son su causa directa y, a su vez, están
cadena causal entre ellos. Por tanto, deben conside- relacionadas con muchos factores.
rarse potenciales factores de confusión las variables
por las que difieren los grupos que se comparan y
Debe ser un factor predictivo
que son pronósticas de la respuesta.
de la respuesta, independientemente
del factor de estudio
Debe estar asociado al factor
Debe existir una asociación entre el factor de confu-
de estudio y a la variable de respuesta
sión y la respuesta también en los sujetos no expues-
Si no existe dicha asociación, no se producirá un tos al factor de estudio. En el ejemplo 2.12, si el
fenómeno de confusión. Retomando el ejemplo ejercicio físico está inversamente relacionado con
2.12 sobre la relación entre el ejercicio físico y el la probabilidad de desarrollar un IAM, el consumo
infarto agudo de miocardio (IAM), los sujetos que de agua también lo estará, ya que los que realizan
realizan ejercicio y los que no, quizá diferirán en el más ejercicio beben más agua. Sin embargo, como
consumo de agua, pero hasta el momento no se ha ya se ha comentado, el consumo de agua no se ha
demostrado que la ingestión de agua esté relacio- asociado con la enfermedad en los sujetos que no
nada con el riesgo de padecer un IAM. Así pues, el realizan ejercicio físico (no expuestos) y, por tanto,

280 © 2013. Elsevier España, S.L. Reservados todos los derechos


Confusión y modificación del efecto Capítulo | 30 |

no puede confundir la asociación entre el ejercicio activa tienen unas concentraciones de cHDL más bajas
físico y la enfermedad. Esta situación es muy dis- y que, a su vez, el porcentaje de mujeres es más alto que
tinta a la de la edad, el sexo o el consumo de tabaco, en el grupo con enfermedad inactiva. Es conocido, por
que son un factor de riesgo independiente entre los estudios previos, que las mujeres tienen unas concen-
sujetos que no realizan ejercicio físico. traciones de cHDL superiores a las de los hombres. Si
no se ajustaran las diferencias observadas de cHDL
en función del sexo, se obtendría como resultado un
No debe ser un paso intermedio
efecto observado menor que el verdadero. Por el con-
en la cadena causal trario, en otras ocasiones, no ajustar por factores de
El factor de confusión no puede ser un mero paso confusión puede suponer obtener en el estudio una
intermedio en la cadena causal. Esta distinción no asociación mayor que la verdadera.
es siempre clara y requiere conocimientos sobre los
mecanismos causales de la respuesta. Desde un punto de vista práctico, la presencia de
Su identificación no debe basarse en la existencia de un fenómeno de confusión puede detectarse com-
una diferencia estadísticamente significativa entre los probando si el análisis bruto (sin tener en cuenta
grupos de estudio. Dado que la significación estadís- el factor de confusión) y el ajustado (controlando el
tica depende tanto de la magnitud de la diferencia ob- potencial fenómeno de confusión) conducen a resul-
servada como del tamaño de la muestra, una diferencia tados que difieren de forma clínicamente relevante.
muy pequeña e irrelevante puede ser estadísticamente La evaluación de la confusión no se basa, pues, en
significativa si el tamaño de los grupos es muy grande, una prueba estadística, sino en la valoración de lo
y una diferencia de gran importancia puede ser estadís- relevante que pueda considerarse la diferencia entre
ticamente no significativa si el número de sujetos in- ambas estimaciones. Aunque es difícil fijar un crite-
cluidos es muy pequeño. Por lo tanto, la significación rio único para concluir que ha existido confusión,
estadística no es un buen criterio para considerar que ya que depende de cada situación concreta, algunos
una variable puede ser un potencial factor de confu- autores lo establecen en un cambio de un 15-20%
sión. Lo que cuenta es la posible relevancia que pueda en la estimación del efecto de interés. Sin embargo,
tener sobre los resultados la diferente distribución de debe tenerse en cuenta que lo importante no es tanto
una variable entre los grupos. Además, no debe olvi- identificar si ha existido confusión, sino, en caso de
darse que múltiples diferencias de escasa importancia que se haya producido, obtener una estimación no
aparente pueden producir una distorsión del resultado distorsionada de la magnitud del efecto del factor de
clínicamente relevante, al actuar de forma conjunta. estudio sobre la variable de respuesta, es decir, que se
haya controlado su influencia (estimación ajustada).
Ejemplo 30.1. Supongamos un ensayo clínico alea- Aunque en la fase de análisis puede ajustarse por
torio en el que 50 individuos son asignados al azar las variables de confusión, no hay que olvidar que
a dos grupos: uno que recibe el tratamiento A y otro ya en el diseño se debe tener en cuenta qué variables
que recibe el tratamiento B, y en el que se observa pueden actuar como tales, para medirlas. Esta identifi-
un desequilibrio en el porcentaje de mujeres que cación depende del conocimiento que se tenga de los
han quedado asignadas a cada grupo (el 60% en el mecanismos causales, así como de estudios previos
tratamiento A frente al 40% en el tratamiento B). que se hayan realizado sobre una hipótesis similar.
© Elsevier. Fotocopiar sin autorización es un delito.

Esta diferencia no es estadísticamente significati- La información que se recoge sobre ellos debe ser
va (p = 0,20), debido, probablemente, al reducido lo suficientemente detallada como para permitir su
tamaño de la muestra, pero si el sexo fuera una adecuado control en el análisis.
variable pronóstica del resultado, la magnitud de la
diferencia podría ser lo suficientemente relevante Ejemplo 30.3. Supongamos que un posible factor
como para distorsionar el resultado del estudio. de confusión de la asociación entre el ejercicio físico
y el riesgo de desarrollar un IAM es el consumo de
Además de identificar los potenciales factores de tabaco. En un estudio sobre esta asociación no sería
confusión, es conveniente tener en cuenta su direc- suficiente recoger información sobre si un individuo
ción, es decir, cómo pueden afectar a los resultados. fuma, ya que no podría controlarse toda la distor-
sión debida a la cantidad de tabaco consumido, de
Ejemplo 30.2. Supongamos un estudio que evalúa las manera que quedaría un fenómeno de confusión
diferencias en las concentraciones de colesterol ligado residual sin controlar, al considerar que todos los
a las lipoproteínas de alta densidad (cHDL) entre en- fumadores tienen el mismo riesgo, sin tener en
fermos con sarcoidosis activa y los que no presentan cuenta el gradiente de riesgo asociado a la cantidad
actividad. Se observa que los pacientes con enfermedad de tabaco consumido.

281
Parte |4| Interpretación de resultados

Dado que los factores de confusión son una ame- confusión es mayor (ejemplo 30.1). Por ello, debe
naza constante a la validez de los datos de un es- comprobarse la comparabilidad de los grupos y, en
tudio, no sólo es necesario considerar qué variables caso de que existan potenciales factores de confu-
pueden confundir una asociación, sino también sión, ajustar el análisis por ellos.
medirlas de forma válida y precisa.
Restricción
Una forma de conseguir grupos comparables res-
AJUSTE POR FACTORES pecto a la distribución de una determinada variable
DE CONFUSIÓN es restringiendo la selección de los sujetos del estu-
dio. Por ejemplo, si el sexo es un potencial factor de
Aunque el ajuste puede realizarse en la fase de confusión, se puede decidir incluir sólo a mujeres. En
análisis, también pueden utilizarse estrategias en ocasiones, la restricción reduce la influencia de una
el diseño del estudio destinadas a evitar o reducir variable, pero no la elimina totalmente. Por ejemplo,
la confusión (cuadro 30.1). Estos procedimientos aunque en un estudio se restrinja la inclusión a los
pueden utilizarse en diferentes combinaciones para sujetos de edades entre 40 y 60 años, si existe un gra-
aumentar el grado de control. diente de riesgo asociado a la edad (el riesgo de los
sujetos de 60 años es diferente del de los de 40 años)
y esta variable se distribuye de forma desequilibrada
Técnicas de control de factores
en los grupos de estudio, no se ha eliminado com-
de confusión en el diseño pletamente el efecto de la edad, de modo que puede
Dado que para que una variable actúe como un quedar cierto fenómeno de confusión residual.
factor de confusión es necesario que se distribuya El uso de criterios de selección restrictivos tiene el
de forma desigual entre los grupos de estudio, las inconveniente de que reduce el número de sujetos
técnicas que buscan conseguir su distribución equili- candidatos, lo que puede suponer una dificultad
brada tienden a prevenir su aparición. Sin embargo, para alcanzar el tamaño de la muestra necesario para
no todas estas técnicas pueden utilizarse en todos el estudio en un tiempo razonable.
los tipos de estudio. Además, limita la capacidad de generalización
de los resultados, ya que se han utilizado criterios de
selección restrictivos, y no permite evaluar el efecto
Asignación aleatoria de las variables no consideradas (p. ej., si el estudio
En los ensayos clínicos, la asignación aleatoria de los sólo incluye mujeres, no podrá analizarse si el efecto
sujetos a los grupos de estudio tiende a conseguir del factor de estudio es diferente en los varones).
grupos similares para todas las variables pronósticas
del resultado, ya que el único factor que intervie- Emparejamiento
ne en su distribución es el azar. De todos modos,
aunque tiende a conseguir grupos similares, no lo Esta técnica implica que los sujetos del grupo de es-
asegura. Cuando se trata de grupos pequeños, la tudio y los del de control se emparejan en función de
probabilidad de que las variables se distribuyan los valores de un determinado factor de confusión.
desigualmente y puedan actuar como factores de Por ejemplo, si en un estudio de casos y controles
sobre el ejercicio físico y el riesgo de IAM, el consu-
mo de tabaco es un potencial factor de confusión, se
emparejará cada caso con un control, o más de uno,
que tenga el mismo hábito tabáquico.
Cuadro 30.1 Métodos para controlar
El emparejamiento fuerza que la distribución de
factores de confusión
los factores de confusión sea idéntica entre los dis-
En la fase de diseño: tintos grupos del estudio, lo que obliga a utilizar en
•฀ Asignación฀aleatoria el análisis técnicas estadísticas que tengan en cuenta
•฀ Restricción la naturaleza apareada de los datos para poder con-
En la fase de diseño y análisis:
trolar el efecto del factor de confusión.
•฀ Emparejamiento Esta técnica tiene limitaciones. Puede ser muy difí-
cil encontrar los controles adecuados, especialmente
En la fase de análisis:
si se desea emparejar por muchas variables. Además,
•฀ Análisis฀estratificado
imposibilita evaluar el efecto de las variables por las
•฀ Análisis฀multivariante
que se ha emparejado.

282
Confusión y modificación del efecto Capítulo | 30 |

El desarrollo de las técnicas de análisis de tipo la variable sexo, ya que en cada estrato no existirá
multivariante, que permiten controlar los factores de variabilidad por este factor, de forma que se habrá
confusión sin necesidad de recurrir al emparejamien- eliminado su potencial efecto de confusión. Si no
to, ha disminuido el atractivo de este método. existen diferencias en las estimaciones obtenidas en
cada estrato, es preferible presentar los resultados
Técnicas de ajuste por factores como una estimación conjunta del efecto entre el
ejercicio físico y el IAM que haya tenido en cuenta
de confusión la influencia del sexo, es decir, ajustada (ponderada
El procedimiento de control de factores de confusión según los estratos).
en la fase de análisis se conoce como ajuste estadís-
tico. La estrategia de análisis debe prever y especificar Ejemplo 30.5. Supongamos un estudio sobre la
las técnicas que se utilizarán con esta finalidad. asociación entre ejercicio físico e IAM, en el que
se considera que el consumo de tabaco puede ser
Ejemplo 30.4. Müllner et al (2002) revisaron 537 un potencial factor de confusión. Para controlar su
artículos originales publicados en 34 revistas médi- efecto, se divide esta variable en categorías homogé-
cas, de los que 169 (32%) informaban que habían neas (estratos), en cada una de las cuales se analiza
realizado algún tipo de ajuste por factores de con- el efecto del ejercicio físico sobre la enfermedad.
fusión. En un 45% de los casos no quedaba claro Aunque las categorías de consumo de tabaco po-
cómo se habían controlado las variables continuas drían ser múltiples (p. ej., nunca fumador, fumador
o de múltiples categorías, es decir, si se habían clasi- de menos de 10 cigarrillos/día, fumador de más de
ficado en intervalos o se habían agregado categorías, 10 cigarrillos/día y ex fumador), para ilustrar este
de manera que no podía evaluarse si se había con- ejemplo se han considerado tan sólo dos estratos:
trolado todo el fenómeno de confusión que podían no fumador y fumador.
haber producido. La conclusión que se extrae es que
los artículos frecuentemente no informan de los De los datos de la tabla 30.1 se desprende que el
métodos de ajuste o lo hacen inadecuadamente. ejercicio físico es un factor protector del IAM tanto
en fumadores como en no fumadores. La odds ratio
(OR) calculada en cada uno de los estratos es una
Análisis estratificado
estimación de la asociación entre el ejercicio físico y
La estratificación permite evaluar la asociación en- el IAM en fumadores y en no fumadores. Dado que
tre el factor de estudio y la variable de respuesta ambos resultados son muy similares, es preferible
dentro de categorías homogéneas (estratos) de una obtener una estimación global ponderada que tenga
tercera variable. Si se evalúa la asociación entre ejer- en cuenta la información de todos los individuos
cicio físico e IAM en los hombres y en las mujeres incluidos en el estudio. Cuando se trata de tablas
por separado, su estimación no estará interferida por 2 × 2, el procedimiento más utilizado para realizar

Tabla 30.1 Ejemplo de análisis estratificado. Estudio hipotético de la asociación entre ejercicio
físico (EF) e infarto agudo de miocardio (IAM), con estratificación por el consumo de tabaco
© Elsevier. Fotocopiar sin autorización es un delito.

(ejemplo 30.5)

Casos Controles

Análisis de datos crudos


EF sí 222 121
EF no 194 69 OR฀=฀0,65
Análisis estratificado
Fumadores EF sí 112 79
EF no 27 16 OR฀=฀0,84
No฀fumadores EF sí 110 42
EF no 167 53 OR฀=฀0,83
OR฀ajustada฀(Mantel-Haenszel)฀=฀0,834.

283
Parte |4| Interpretación de resultados

esta ponderación es el de Mantel y Haenszel. En este antihipertensivo con un placebo. Se utiliza como
estudio, la estimación del riesgo de IAM asociado a variable de respuesta la disminución de las cifras de
la práctica de ejercicio físico, ajustada por el consu- presión arterial diastólica (PAD). Los resultados se
mo de tabaco, es de 0,834. La diferencia entre este resumen en la tabla 30.2. En el grupo con tratamiento
valor y el obtenido con los datos crudos (OR = 0,65) activo, se ha observado un descenso de 25 mmHg,
permite cuantificar el fenómeno de confusión por el mientras que ha sido sólo de 10 mmHg en el grupo
consumo de tabaco. placebo, por lo que el efecto del tratamiento puede
Como ya se ha comentado, la magnitud de un cuantificarse en una disminución de 15 mmHg (en la
efecto de confusión se evalúa observando el grado de ecuación de regresión obtenida con los datos crudos,
discrepancia entre las estimaciones crudas y las ajus- el coeficiente de la variable tratamiento es 15).
tadas, y valorando no su significación estadística,
sino su relevancia clínica. En el ejemplo anterior, Dado que los investigadores consideran que el sexo
como las estimaciones cruda y ajustada difieren podría ser un factor de confusión, controlan su efecto,
(0,65 y 0,83, respectivamente), si se considera que obteniendo una estimación del efecto del tratamiento
la diferencia es clínicamente relevante, puede decir- de 5 mmHg tanto en hombres como en mujeres. Si
se que ha existido efecto de confusión debido a la se hubiera realizado un análisis multivariante, se ha-
variable consumo de tabaco. La mejor estimación bría obtenido una ecuación de regresión en la que
es la ajustada, ya que ha controlado este fenómeno el coeficiente de la variable tratamiento sería 5, una
de confusión. vez controlado el efecto de la variable sexo (también
El análisis estratificado es una técnica sencilla, incluida en la ecuación). El coeficiente de la variable
asequible para los investigadores y los lectores de sexo indicaría la diferencia en la respuesta observada
revistas biomédicas, que permite comprender fácil- entre hombres y mujeres (obsérvese que la disminu-
mente las interrelaciones entre el factor de estudio, ción de las cifras de PAD en los hombres ha sido
la respuesta y las variables que pueden actuar como 20 mmHg superior a la conseguida en las mujeres).
factores de confusión y/o modificadoras del efecto. En este ejemplo puede decirse que ha existido un
Su principal limitación es la dificultad para estratifi- fenómeno de confusión debido al sexo, ya que los
car por múltiples variables. Por ejemplo, si se desea coeficientes de regresión de la variable tratamiento,
controlar por tres variables (de 2, 3 y 5 categorías, calculados en el modelo con datos crudos y en el
respectivamente), existirán 30 posibles estratos y, modelo que incluye también la variable sexo, difie-
aunque en el estudio se haya incluido un número ren (15 y 5, respectivamente). Dado que el objetivo
importante de sujetos, es muy posible que en algunos del estudio es estimar el efecto del tratamiento acti-
estratos no exista el número de efectivos suficiente vo, el mejor resultado es el ajustado por el sexo, es
para estimar un efecto con una precisión aceptable. decir, 5 mmHg.
Existen diferentes técnicas de análisis multiva-
riante. La elección de la más adecuada depende del
Análisis multivariante
diseño del estudio, de la naturaleza de las variables
El análisis multivariante supera esta limitación del y de las interrelaciones entre el factor de estudio, la
análisis estratificado y permite estimar de forma variable de respuesta y los restantes factores incluidos
eficiente el efecto de un factor de estudio sobre una en el modelo, así como de las condiciones específicas
enfermedad, ajustado por varios potenciales factores de aplicación de cada una de ellas (anexo 8).
de confusión, simultáneamente.
Su uso implica la construcción de un modelo ma-
temático, en el que deben identificarse la variable Problemas del ajuste por factores
dependiente (variable de respuesta), la variable inde-
de confusión
pendiente principal (factor de estudio) y el resto de
las variables independientes (factores de confusión La mayoría de los estudios clínicos y epidemiológi-
que controlar), y se determinan los valores de los cos presentan estimaciones del efecto ajustadas por
coeficientes de regresión de cada una de las variables las variables consideradas como potenciales factores
independientes. El coeficiente del factor de estudio de confusión. Sin embargo, el hecho de haber ajus-
corresponde a la estimación de su efecto sobre la tado por algunas variables no garantiza que se haya
variable de respuesta, ajustado por el resto de las va- eliminado cualquier efecto de confusión. Pueden
riables independientes incluidas en el modelo. existir algunos problemas relacionados con la infor-
mación de las variables de confusión o con el uso
Ejemplo 30.6. Supongamos un ensayo clínico hipoté- de técnicas estadísticas inadecuadas, que pueden
tico en el que se compara la eficacia de un tratamiento conducir a fallos en el ajuste (cuadro 30.2).

284
Confusión y modificación del efecto Capítulo | 30 |

Tabla 30.2 Ejemplo de análisis multivariante. Ensayo clínico hipotético que compara un fármaco
antihipertensivo con placebo. La variable de respuesta es la disminución de las cifras de presión arterial
diastólica (dif. PAD). Se estima el efecto del tratamiento con ajuste por la variable sexo (ejemplo 30.6)

Dif. PAD Efecto del


tratamiento

Análisis de datos crudos


Tratamiento฀activo 25฀mmHg
Placebo 10฀mmHg 15฀mmHg
Ecuación฀de฀regresión฀lineal
Dif.฀PAD฀=฀10฀+฀15·tratamiento
Códigos:฀tratamiento฀(0฀=฀placebo;฀1฀=฀tratamiento฀activo)
Análisis estratificado
Hombres Tratamiento฀activo 30฀mmHg
Placebo 25฀mmHg 5฀mmHg
Mujeres Tratamiento฀activo 10฀mmHg
Placebo 5฀mmHg 5฀mmHg
Ecuación฀de฀regresión฀lineal
Dif.฀PAD฀=฀5฀+฀5·tratamiento฀+฀20·sexo
Códigos:฀tratamiento฀(0฀=฀placebo;฀1฀=฀tratamiento฀activo)
sexo฀(0฀=฀mujer;฀1฀=฀hombre)

Información inadecuada sobre Utilización de medidas indirectas poco válidas


la variable de confusión Dadas las dificultades para medir algunos de los
Agrupación inadecuada de los datos fenómenos de interés, suelen utilizarse medidas
indirectas. Cuando se ajusta por ellas, no se controla
Cuando las categorías que se crean son demasiado todo el efecto de dicho fenómeno, y queda cierta
amplias y dentro de cada una de ellas existe cierta confusión residual.
heterogeneidad o gradiente de riesgo, el ajuste no
controla todo el fenómeno de confusión y queda Ejemplo 30.7. Supongamos que se quiere estudiar
cierto efecto residual (ejemplo 30.3). la relación entre la dieta y el cáncer de mama y se
desea ajustar la estimación del efecto por la clase
socioeconómica. Si se utiliza como medida indirecta
© Elsevier. Fotocopiar sin autorización es un delito.

de esta variable el grado de estudios, dado que éste


Cuadro 30.2 Problemas en el ajuste no la representa adecuadamente, el ajuste de los
por factores de confusión datos sólo será parcial.

•฀ Información฀inadecuada฀sobre฀la฀variable฀
Mala clasificación de las variables de confusión
de฀confusión
–฀Agrupación฀inadecuada฀de฀los฀datos Cuando las variables de confusión se miden de
–฀Utilización฀de฀medidas฀indirectas฀poco฀válidas forma imprecisa o poco válida, sus relaciones con
–฀Mala฀clasificación฀de฀las฀variables฀de฀confusión el resto de las variables no se estiman correctamente,
•฀ Variables฀muy฀correlacionadas de forma que, al ajustar por ellas, no se controla
•฀ Existencia฀de฀modificación฀de฀efecto totalmente el fenómeno de confusión, y también
•฀ Variable฀intermedia฀en฀la฀cadena฀causal puede quedar un efecto de confusión residual.
•฀ Variables฀que฀no฀son฀factores฀de฀confusión
•฀ Pruebas฀estadísticas฀inadecuadas Ejemplo 30.8. Supongamos un estudio que desea
•฀ Selección฀automática฀de฀variables฀en฀un฀modelo฀
estimar el efecto del consumo de tabaco sobre el ries-
de฀regresión
go de padecer un IAM. Los investigadores sospechan

285
Parte |4| Interpretación de resultados

que la asociación puede ser total o parcialmente a una estimación del efecto diferente en cada uno
explicada por la influencia de la práctica de ejercicio de los estratos, de forma que podría sugerir erró-
físico. Asumamos que el 10% de los hombres no neamente que la actividad física modifica el efecto
realiza actividad física. La tabla 30.3a muestra los del consumo de tabaco sobre el IAM. La situación
resultados que se obtendrían cuando no hay mala llega a ser mucho más compleja cuando hay más
clasificación. de un factor de confusión que no se ha medido co-
rrectamente.
Para ajustar correctamente por un factor de con-
fusión, los instrumentos de medida deberían ser
Variables muy correlacionadas
perfectos. En la práctica, la medición del grado de ac-
tividad física es difícil y puede cambiar en el tiempo. Aunque para que una variable actúe como un factor
Además, pueden existir errores de información debi- de confusión debe estar asociada con el factor de
dos al instrumento de medida utilizado, al propio estudio, si ambas variables están muy relacionadas,
observador o, sencillamente, a que los individuos puede ser difícil distinguir sus efectos de forma
falseen las respuestas sobre sus hábitos. precisa.
Supongamos que el 50% de los hombres que prac- Intuitivamente, el ajuste implica estimar el efecto
tican algún deporte son clasificados como que no del factor de estudio sobre la variable de respues-
lo practican, mientras que el 5% de los que no hacen ta, mientras se mantiene fijo el valor del factor de
ejercicio físico son clasificados como que sí. En la confusión. Por lo tanto, si el factor de estudio y el
tabla 30.3b se presentan los resultados que se obten- de confusión están muy relacionados, prácticamente
drían con una mala clasificación no diferencial de todos los sujetos con un valor determinado de la
estas características. En esta situación, en ambos variable de confusión tendrán el mismo valor del
estratos se sobrestima el efecto del consumo de ta- factor de estudio y, en consecuencia, será difícil es-
baco sobre el riesgo de IAM (que era de OR = 1,5). timar su efecto sobre la variable de respuesta.
Así pues, aunque aparentemente se esté ajustando Si se ajusta por esta variable, el resultado será una
por un factor de confusión, en realidad se está in- estimación del efecto imprecisa, de tal forma que los
troduciendo un sesgo. Además, la mala clasificación intervalos de confianza de la estimación no ajustada
no diferencial del factor de confusión ha conducido serán más estrechos que los de la ajustada.

Tabla 30.3 Efecto de los errores de medida del factor de confusión sobre el ajuste. Estudio
hipotético del efecto del consumo de tabaco sobre el riesgo de infarto agudo de miocardio (IAM)
ajustado por la realización de ejercicio físico (EF) (ejemplo 30.8)

IAM no IAM Total OR


a)฀Situación฀en฀que฀no฀existe฀mala฀clasificación
EF sí Fuma 120 680 800
No฀fuma 20 180 200 1,5
EF no Fuma 54 1.746 1.800
No฀fuma 144 7.056 7.200 1,5
Total 338 9.662 10.000
b)฀Situación฀en฀que฀existe฀mala฀clasificación฀(el฀50%฀de฀los฀hombres฀que฀realizan฀ejercicio฀físico฀son฀
clasificados฀como฀que฀no฀lo฀realizan,฀mientras฀que฀el฀5%฀de฀los฀que฀no฀lo฀hacen฀son฀clasificados฀como฀que฀sí)
EF sí Fuma 63* 427 490
No฀fuma 17 443 460 3,8
EF no Fuma 111 1.999 2.110
No฀fuma 147 6.793 6.490 2,7
Total 338 9.662 10.000
*63฀=฀120฀−฀(0,5฀×฀120)฀+฀(0,05฀×฀54).
El฀resto฀de฀las฀casillas฀se฀calculan฀de฀la฀misma฀forma฀aplicando฀los฀porcentajes฀correspondientes.

286
Confusión y modificación del efecto Capítulo | 30 |

Existencia de una modificación del efecto es de interés evaluar hasta qué punto el consumo de
alcohol tiene un efecto sobre el IAM por mecanismos
La asunción que subyace cuando se utiliza la es- distintos al aumento del cHDL, entonces el análisis
timación ajustada es que el factor de estudio tiene debería contemplar el cHDL como una variable que
el mismo efecto en cada uno de los estratos o cate- controlar.
gorías de la variable de confusión. Cuando existe
una modificación del efecto, y los resultados son
diferentes en cada estrato, la presentación de una Variables que no son factores
única estimación ajustada no es adecuada. de confusión
El ajuste por variables que no son verdaderos fac-
Variable intermedia en la cadena causal tores de confusión no sesga la estimación, pero la
hace más imprecisa (fenómeno que se conoce como
No es apropiado ajustar por una variable que es un
sobreajuste).
paso intermedio en la cadena causal entre el factor
El uso generalizado de programas informáticos
de estudio y la variable de respuesta. Si se hiciera
que permiten realizar análisis estadísticos com-
dicho ajuste, se obtendría una infraestimación de
plejos con multitud de variables, de forma rápida y
la verdadera asociación, ya que se eliminaría de la
cómoda, facilita que algunos investigadores incluyan
estimación del efecto la parte mediada a través de
en el análisis gran cantidad de variables, algunas de
dicha variable intermedia.
las cuales no son relevantes para la relación que se
estudia. Aunque las técnicas de análisis multiva-
Ejemplo 30.9. Supongamos que en un estudio que
riante tienen ventajas respecto a las del análisis es-
trata de estimar el efecto del consumo de tabaco
tratificado, para que sean realmente útiles se deben
sobre la mortalidad infantil, se ajuste por el peso del
tener en cuenta dos condiciones básicas: el objetivo
recién nacido. El bajo peso en los recién nacidos es
del estudio debe estar bien definido, especificando
una de las consecuencias del consumo de tabaco y,
cuál es la variable de estudio y cuál la de respuesta,
a su vez, puede ser una causa de mortalidad infantil.
cuáles los potenciales factores de confusión y cuáles
Al ajustar por el bajo peso, parte del efecto del ta-
las potenciales variables modificadoras del efecto; y
baco (exposición) quedaría neutralizado por dicho
hay que incluir en el modelo sólo aquellas variables
ajuste (se eliminaría la parte del efecto del tabaco
que se conoce o se sospecha firmemente que pueden
que actúa a través del bajo peso), de forma que se
llevar a confusión o modificar el efecto.
infraestimaría su verdadera magnitud.

Una de las condiciones que debe reunir una va- Pruebas estadísticas inadecuadas
riable para ser considerada un potencial factor de
confusión es no ser un paso intermedio en la cadena Si no se utilizan las pruebas estadísticas correctas,
causal. Con frecuencia, es difícil distinguir si una va- no se controla adecuadamente el fenómeno de
riable lo es, por lo que se requiere un conocimiento confusión. Por ejemplo, si en un estudio se utiliza
profundo de los mecanismos biológicos por los que el emparejamiento, pero en el análisis no se tiene
una exposición puede causar una enfermedad. en cuenta la naturaleza apareada de los datos, la
estimación del efecto resultará sesgada.
© Elsevier. Fotocopiar sin autorización es un delito.

Ejemplo 30.10. Si se evalúa el efecto del consumo


moderado de alcohol sobre el riesgo de padecer un Selección de variables en un modelo
IAM, una variable que puede considerarse un poten-
de regresión
cial factor de confusión es la concentración de cHDL.
En algunos estudios se ha observado que el consumo La finalidad del análisis estadístico es obtener la me-
moderado de alcohol aumenta las concentraciones jor estimación (no sesgada y lo más precisa posible)
plasmáticas de cHDL y que, a mayor concentración del efecto del factor de estudio. En esta situación, el
de cHDL, menor riesgo de padecer un IAM. Se ha uso de un algoritmo automático para la selección de
postulado que uno de los mecanismos por los que las variables del modelo multivariante puede no in-
el consumo moderado de alcohol reduce el riesgo cluir variables importantes porque individualmente
de IAM es precisamente el aumento de cHDL. Si se no son estadísticamente significativas; sin embargo,
asume esta posible cadena causal, las concentracio- estas variables tomadas en conjunto podrían ser
nes de cHDL no deben considerarse un factor de responsables de una parte sustancial del efecto es-
confusión, y el efecto del consumo de alcohol sobre tudiado, y por tanto serían variables relevantes que
el IAM no debe ajustarse por ellas. Por otro lado, si controlar.

287
Parte |4| Interpretación de resultados

pueden ser causadas por la variabilidad aleatoria o si,


EVALUACIÓN DE por el contrario, reflejan diferencias reales.
LA MODIFICACIÓN
DEL EFECTO Ejemplo 30.11. Supongamos un estudio de casos y
controles (tabla 30.4) que evalúa la asociación entre
la práctica de ejercicio físico y el riesgo de sufrir un
En las situaciones anteriores, los efectos observados
IAM, y que se desea evaluar si esta asociación es
en los diferentes estratos eran similares, por lo que
diferente según el sexo de los sujetos.
tenía sentido obtener una única estimación ajus-
tada. Sin embargo, cuando no lo son y puede con-
Los datos crudos sugieren que el ejercicio físico
siderarse que existe una modificación del efecto, no
disminuye el riesgo de IAM (OR = 0,64). Sin em-
es adecuado calcular un único resultado global, sino
bargo, al estratificar, en los hombres se observa un
que lo importante es precisamente describir que
efecto protector (OR = 0,53), mientras que en las
el efecto es diferente según las diversas categorías
mujeres no (OR = 1,19). Si se realizara una prueba
de otras variables. A diferencia del fenómeno de
estadística para comparar ambas estimaciones, se
confusión, la modificación del efecto se evalúa es-
obtendría un resultado estadísticamente significa-
tadísticamente, y puede decirse que existe cuando
tivo, que indicaría que el sexo es una variable mo-
las estimaciones de cada uno de los estratos pre-
dificadora del efecto, y que la asociación entre el
sentan una diferencia estadísticamente significa-
ejercicio físico y el IAM es diferente en los hombres
tiva. Las técnicas que se utilizan para evaluar su
y en las mujeres.
existencia son también el análisis estratificado y el
Si se hubiera realizado una estimación ajustada,
multivariante.
se hubiera obtenido un valor de OR = 0,64, similar al
calculado con los datos crudos, que parecería indicar
Análisis estratificado que existe un efecto protector en todos los sujetos,
sin poner de manifiesto que este efecto solamente se
El análisis estratificado se realiza de la misma forma ha observado en los hombres. Por lo tanto, cuando
que en el caso del ajuste por factores de confusión: existe una modificación del efecto, es preferible
calculando la estimación del efecto en cada uno de presentar los resultados por estratos y no utilizar
los estratos definidos por las categorías de la variable una medida global ajustada, que podría conducir a
cuya influencia se desea evaluar. interpretaciones erróneas.
Pero, a diferencia de lo que ocurre con el fenómeno
de confusión, la evaluación de la existencia de modifi-
Análisis multivariante
cación del efecto en un análisis estratificado se realiza
mediante pruebas estadísticas específicas, como la de Cuando se utiliza una técnica de análisis multiva-
Welch, ya que se trata de determinar si las diferen- riante para evaluar la presencia de modificación
cias entre las estimaciones obtenidas en cada estrato del efecto, debe incluirse en el modelo no sólo la

Tabla 30.4 Modificación de efecto en un análisis estratificado. Estudio hipotético de la asociación


entre ejercicio físico (EF) e infarto agudo de miocardio (IAM), estratificado por sexo (ejemplo 30.11)

Casos Controles

Análisis de datos crudos


EF sí 190 266 OR฀=฀0,64
EF no 176 157
Análisis estratificado
Hombres EF sí 141 208 OR฀=฀0,53
EF no 144 112 IC฀95%฀=฀0,38฀a฀0,73
Mujeres EF sí 110 42 OR฀=฀1,19
EF no 167 53 IC฀95%฀=฀0,65฀a฀2,16
OR฀ajustada฀(Mantel-Haenszel)฀=฀0,64.

288
Confusión y modificación del efecto Capítulo | 30 |

variable que potencialmente puede producir dicho diabéticos y de sólo 5 mmHg en los no diabéticos.
efecto, sino también un término que refleje la inter- Dado que la diferencia entre ambas estimaciones
acción entre esta variable y el factor de estudio. Dado es estadísticamente significativa, se concluye que
que muchos programas estadísticos no evalúan la la diabetes modifica el efecto del tratamiento, es
existencia de modificación del efecto de forma au- decir, que la eficacia es diferente en diabéticos y en
tomática, es necesario crear intencionadamente los no diabéticos.
términos de interacción antes del análisis. Si se hubiera realizado un análisis multivariante,
Puede decirse que existe modificación del efecto además de los términos tratamiento y diabetes, se
cuando el coeficiente de regresión del término de habría incluido en el modelo un término de interac-
interacción es estadísticamente significativo (dife- ción tratamiento × diabetes. En la ecuación obtenida,
rente de 0). En este caso, la estimación del efecto este término tiene un coeficiente de 15, que es es-
no corresponde solamente al valor del coeficiente tadísticamente significativo, e indica la existencia
de regresión del factor de estudio, sino que también de interacción entre el tratamiento y la presencia de
incluye el valor de los coeficientes de los términos diabetes. Si bien el coeficiente de la variable trata-
de interacción. miento es 5, el efecto del tratamiento difiere según
la presencia de diabetes, por lo que su estimación
Ejemplo 30.12. Recuérdese el ejemplo 30.6 que pre- es 5 × (15 × diabetes). Así, en los sujetos no dia-
sentaba un ensayo clínico hipotético en el que se béticos (diabetes = 0), el efecto es 5 × 0 = 5 mmHg,
comparaba la eficacia de un tratamiento antihiper- mientras que en los diabéticos (diabetes = 1) es
tensivo con un placebo, utilizando como variable de 5 × 15 = 20 mmHg. De esta forma, el análisis multi-
respuesta la disminución de las cifras de PAD. variante permite expresar, en una sola ecuación, los
resultados de los diferentes estratos.
Supongamos que los investigadores desean estu- Los fenómenos de confusión y de modificación
diar la influencia de la presencia de diabetes mellitus del efecto son muy distintos tanto en la información
sobre la eficacia del tratamiento. Al estratificar (ta- que proporcionan como en la forma de interpretarla.
bla 30.5), se observa que el efecto del tratamiento Si una variable actúa como un factor de confusión
en relación con el placebo es de 20 mmHg en los depende de cómo se distribuye entre los grupos de

Tabla 30.5 Modificación de efecto en un análisis multivariante. Ensayo clínico hipotético que compara
un fármaco antihipertensivo con placebo. La variable de respuesta es la disminución de las cifras
de presión arterial diastólica (dif. PAD). Se evalúa la existencia de modificación de efecto debida
a la diabetes (ejemplo 30.12)

Dif. PAD Efecto del


tratamiento

Análisis de datos crudos


© Elsevier. Fotocopiar sin autorización es un delito.

Tratamiento฀activo 25฀mmHg
Placebo 10฀mmHg 15฀mmHg
Ecuación฀de฀regresión฀lineal
Dif.฀PAD฀=฀10฀+฀15·tratamiento
Códigos:฀tratamiento฀(0฀=฀placebo;฀1฀=฀tratamiento฀activo)
Análisis estratificado
Diabéticos Tratamiento฀activo 35฀mmHg
Placebo 15฀mmHg 20฀mmHg
No฀diabéticos Tratamiento฀activo 10฀mmHg
Placebo 5฀mmHg 5฀mmHg
Ecuación฀de฀regresión฀lineal
Dif.฀PAD฀=฀5฀+฀5฀x฀tratamiento฀+฀10฀×฀diabetes฀+฀15฀×฀tratamiento฀×฀diabetes
Códigos:฀tratamiento฀(0฀=฀placebo;฀1฀=฀tratamiento฀activo);฀diabetes฀(0฀=฀no;฀1฀=฀sí)

289
Parte |4| Interpretación de resultados

estudio y de si el efecto observado del factor de es- emparejamiento). Cuando una variable se comporta
tudio sobre la variable de respuesta puede explicarse como un factor de confusión, el interés reside en
total o parcialmente por esta distribución desigual. controlar su efecto.
Por lo tanto, una variable puede actuar como factor En cambio, la modificación del efecto refleja una
de confusión en un estudio experimental, pero no en característica de la relación entre el factor de estudio
otro, dependiendo de cómo quede distribuida tras y la variable de respuesta, ya que la magnitud de
el proceso de asignación. En cambio, en los estudios esta relación depende de una tercera variable. Por
observacionales, al estar asociadas a la exposición y tanto, la modificación del efecto debe ser descrita,
a la variable de respuesta, los factores de confusión pero no controlada. Además, puede proporcionar
siempre actúan como tales cuando no se ha utiliza- claves interesantes (hipótesis de trabajo) sobre los
do una técnica para prevenir su efecto (restricción o mecanismos causales de dicha relación.

BIBLIOGRAFÍA DE LOS EJEMPLOS

Müllner M, Matthews H, Altman


DG. Reporting on statistical
methods to adjust for
confounding: a cross-sectional
survey. Ann Intern Med.
2002;136:122-6.

BIBLIOGRAFÍA

Cobo E, Buekens P. Necesidad confounding in causal research. Leon DA. Failed or misleading
y limitaciones del ajuste. Med Int J Epidemiol. 2010;39(1): adjustment for confounding.
Clin (Barc). 1990;95:702-8. 107-17. Lancet. 1993;342:479-81.
Cole SR, Hernan MA. Fallibility in Hallqvist J, Ahlbom A, Diderichsen F, Maclure M, Schneeweiss S.
estimating direct effects. Int J Reuterwall C. How to evaluate Causation of bias: the episcope.
Epidemiol. 2002;31:163-5. interaction between causes: Epidemiology. 2001;12:114-22.
De Graaf MA, Jager KJ, Zoccali a review of practices in Shapiro S. Bias in the evaluation
C, Dekker FW. Matching, an cardiovascular epidemiology. of low-magnitude associations:
appealing method to avoid J Intern Med. 1996;239:377-82. an empirical perspective. Am J
confounding? Nephron Clin Hernan MA, Hernández-Díaz S, Epidemiol. 2000;151:939-45.
Pract. 2011;118(4):c315-8. Werler MM, Mitchell AA. Causal Shahar E, Shahar DJ. On the
Greenland S, Morgenstern H. knowledge as a prerequisite causal structure of information
Confounding in health for confounding evaluation: bias and confounding bias in
research. Annu Rev Public an application to birth defects randomized trials. J Eval Clin
Health. 2001;22:189-212. epidemiology. Am J Epidemiol. Pract. 2009;15(6):1214-6.
Grimes DA, Schulz KF. Bias 2002;155:176-84. Silva Ayçaguer LC. Excursión
and causal associations in Janes H, Dominici F, Zeger S. On a la regresión logística
observational research. Lancet. quantifying the magnitude en ciencias de la salud. Madrid:
2002;359:248-52. of confounding. Biostatistics. Díaz de Santos; 1995.
Groenwold RH, Klungel OH, 2010;11(3):572-82. Silverman SL. From randomized
Grobbee DE, Hoes AW. Selection Julious SA, Mullee MA. controlled trials to
of confounding variables should Confounding and Simpson’s observational studies. Am J
not be based on observed paradox. BMJ. 1994;309:1480-1. Med. 2009;122(2):114-20.
associations with exposure. Eur J Kleinbaum DG. Logistic regression: Smith GD, Phillips AN.
Epidemiol. 2011;26(8):589-93. a self-learning text. Nueva York: Confounding in
Groenwold RH, Nelson DB, Nichol Springer-Verlag; 1994. epidemiological studies: why
KL, Hoes AW, Hak E. Sensitivity Kleinbaum DG. Survival analysis: «independent» effects may
analyses to estimate the a self-learning text. Nueva York: not be all they seem. BMJ.
potential impact of unmeasured Springer-Verlag; 1996. 1992;305:757-9.

290
Confusión y modificación del efecto Capítulo | 30 |

Sonis J. A closer look at Tripepi G, Jager KJ, Dekker FW, van Stralen KJ, Dekker FW, Zoccali
confounding. Fam Med. Zoccali C. Stratification for C, Jager KJ. Confounding.
1998;30:584-8. confounding-part 1: the Nephron Clin Pract.
Sonis J, Hertz-Piccioto I. Accessing Mantel-Haenszel formula. 2010;116(2):c143-7.
the presence of confounding. Nephron Clin Pract. Wunsch H, Linde-Zwirble WT,
Fam Med. 1996;28:462-3. 2010;116(4):c317-21. Angus DC. Methods to adjust
Sørensen HT, Lash TL, Rothman KJ. Tripepi G, Jager KJ, Dekker FW, for bias and confounding
Beyond randomized controlled Zoccali C. Stratification for in critical care health
trials: a critical comparison confounding-part 2: direct services research involving
of trials with nonrandomized and indirect standardization. observational data. J Crit Care.
studies. Hepatology. Nephron Clin Pract. 2006;21(1):1-7.
2006;44(5):1075-82. 2010;116(4):c322-5.
© Elsevier. Fotocopiar sin autorización es un delito.

291

También podría gustarte