Está en la página 1de 31

Variables de Confusión

OLGA LUCIA SARMIENTO M.D M.P.H Ph.D


Facultad de Medicina
Variables de Confusión

• Cuando la relación entre la exposición a interés y la


enfermedad es debida completamente o en parte a otro
factor este factor se llama un factor de confusión

• El efecto de la variable de confusión puede ser aumentar o


disminuir la fuerza de asociación de la relación que se está
evaluando
Características de la variable de Confusión

• Un factor de confusión debe ser un factor de riesgo o un


marcador de la enfermedad (no necesariamente un factor
causal)
– Debe ser un factor de riesgo independiente para la enfermedad
– El factor debe estar asociado con la enfermedad aunque la
exposición principal no esté presente

E D

C
Evaluación de variables de confusión

1) Teóricamente: la variable de confusión no puede ser


afectada por la exposición o la enfermedad

no cumple criterio de variable de confusión Cumple criterio de variable de confusión

Conf: Conf:
PF PF

Exp: Dep: Exp: Dep:


fumar IAM fumar IAM
Evaluación de variables de confusión

2) La variable de confusión debe estar asociada con la


exposición en la población base (source population)
Cumple criterio de variable de confusión

Conf:
PF

Exp: Dep:
fumar IAM
Cómo se evalúa una variable de confusión
dependiendo de los estudios?
• En un estudio de cohorte la población base es toda la
cohorte

• En un estudio de casos y controles la población base son


los controles

• En un estudio de corte-transversal la población base es


toda la cohorte
Evaluación de variables de confusión

3) La variable de confusión debe ser un factor de riesgo para


la enfermedad a estudio (variable dependiente)

Cumple criterio de variable de confusión

Conf:
PF

Exp: Dep:
fumar IAM
ESTRATIFICACION

1. PASOS

• Calcula el estimador crudo

• Se estratifica por la variable de confusión y se calcula el


estimador en cada estrato

• Se comparan los estimadores de cada estrato con los estimadores


crudos.

• Se evalúa la dirección y la magnitud de la confusión


Estratificación: Ejemplo

Diseño del estudio: Estudio de casos y controles


Población: Población abierta
Población blanco: Toda la población a estudio
Var dependiente: IAM
Exposición principal: Fumar Total
Grupo índice:fumadores Cases Controls Total
Grupo de referencia: no fumadores Smokers
120 60 180
Covariable: uso de Padre fumador Non- smokers 80 140 220

Total 200 200 400

OR=3.50
Padre fumador No padre fumador
No usan ACO
OC users
Cases Controls Total Cases Controls Total

Smokers 100 36 Smokers 20 24 44


136
Non- smokers 50 60 110 Non- smokers 30 80 110
Total 150 96 146
246 Total 50 104 154

OR=3.33 OR=2.22

OR ajustado 2.9
Aleatorización

• Metodología utilizada en intervenciones y clinical trials

• La aleatorización permite una mayor distribución equitativa de las


variables de confusión entre expuestos y no expuestos
Restricción

• Se restringen los criterios de inclusión de la población a


estudio (e.g. Sólo mujeres)
• Se vuelve la población más homogénea
• Se previene la relación entre exposición y variable de
confusión
• Desventajas
– Se limita la población
– No permite evaluar variables modificadoras del efecto
– Limita la generalización de los resultados
ESTANDARIZACION

1. Estandarización:

• Calcula el estimador crudo

• Se estratifica por la variable de confusión y se calcula el estimador en cada estrato

• Se obtienen los pesos de acuerdo a la población blanco

• Se compara el estimador estandarizado


Definiciones
• Estimador crudo: Una medida global que no tiene
explícitamente en cuenta la composición de la
población. El estimador es el promedio de los valores
para los subgrupos individuales, ponderados por sus
tamaños relativos.

• Estimador ajustado: Un estimador ajustado por el


método de estandarización permite la comparación de
las medidas de resumen entre grupos. Se ajusta por
factores de confusión.
ESTANDARIZACION
Caso Control
Expuestos A1+ B1+
No A0+ B0+
expuestos
i.
crude OR=(A1+/B1+)/(A0+/B0+)
covariable=SI Covariable=No
Caso Control Caso Control
Expuestos A11 B11 Expuestos A10 B10
No expuestos A01 B01 No expuestos A00 B00
Total B+1 B+0
i.
Blanco W1 W2
Expuestos B11 B10
No- B01 B00
expuesto
Toda la B+1 B+0
población a
estudio
Externa
spseudoR1= provided Provided
[W1(A11/B11)+W2(A10/B10)]/
i. [W1+W2]

spseudoR0= [W1(A01/B01)+W2(A00/B00)]/
[W1+W2]

sOR=spseudoR1/spseudoR0
sOR= [W1(A11/B11)+W2(A10/B10)]/
[W1+W2]
[W1(A01/B01)+W2(A00/B00)]/
[W1+W2]
ESTANDARIZACION

Total
Cases Controls Total
Smokers 120 60 180
Non- smokers 80 140 220

Total 200 200 400

OR=3.50
No usan ACO
OC users
Cases Controls Total Cases Controls Total

Smokers 100 36 Smokers 20 24 44


136
Non- smokers 50 60 110 Non- smokers 30 80 110
Total 150 96 146 Total 50 104 154

OR=3.33 OR=2.22
Estandarización (Blanco Toda la población a
estudio)
sOR= [96(100/36)+104(20/24)]/[96+104]
[96(50/60)+104(30/80)]/[96+104]

SOR=2.97
ESTANDARIZACION

• Se compara el estimador estandarizado

i.
 ORDTC (OR due to confounding):

ORDTC = ORcrude = 3.50/2.97=1.18


ORadjusted
ii.
 percent change in the estimate:
iii.
ORcrude – ORadjusted = (3.50-2.97)/3.50= 15%
ORcrude

Conclusión: en los datos observados la variable consumo de ACO confunde la


asociación entre fumar e IAM. La Sobres estimación es del 18%.
ó
El cambio en el porcentaje desde el estimador crudo relativo al estimador crudo es del
15%
Métodos del diseño del estudio para controlar el efecto de
las variables de confusión

• Análisis
– Análisis estratificado
– Estandarizar
– Modelar (esta clase regresión logística)
• Aleatorización
• Restricción
• Matching (aparear solo en estudios de cohorte)
Otras formas de controlar por variables de
confusión en le análisis
• Estandarización (Es una comparación de promedios
ponderados usando distintos pesos)

• Modelos multivariados
– Regresión logística o regresión lineal

• Mantel-Haenszel

• Inverse variance weighted average


Regresión Logística

OLGA LUCIA SARMIENTO M.D M.P.H Ph.D


Facultad de Medicina
El Problema Multivariado

• Cuál es la relación entre la variable dependiente (dicotómica) y las


variables independientes.

Y= X, X1, X2, X3,X4

• Regresión logística es un tipo de modelamiento matemático que se


utiliza para evaluar la relación entre variables independientes y la
variable dependiente dicotómica.
Función logística

• La función logística varía entre 0-1 por lo tanto nunca tenemos un


riesgo >1 o menor de 0
Modelo logístico

Z= œ + ß1X1 + ß2X2 + ß3X3 +…. ßkXk

Ejemplo: Estudio de cohorte de 9 años con 609 participantes

Z = ENF Coronaria (0,1)


X1 = Catecolaminas (0,1) 1=altas 0=bajas
X2 = Edad(continua)
X3 = ECG (0,1) 1= anormal 0=normal

N=609 hombres

P(x)= 1
__________________

-(œ + ß1X1 + ß2X2 + ß3X3)


1+ e
Modelo logístico

Cuál es el riesgo de una persona de tener enfermedad coronaria si tiene las


catecolaminas altas, tiene 40 años y el ECG es normal

Ejemplo: Estudio de cohorte

œ = -3.911
ß1= 0.652 =
ß2 = 0.029
ß3 = 0.342 =

P1(x)= 1
__________________ =0.1090 es el riesgo de tener EC con cat altas

-
1+ e (-3.911 +0.652(1) + 0.029(40) + 0.342(0))
Modelo logístico

Cuál es el riesgo de una persona de tener enfermedad coronaria si tiene las


catecolaminas bajas, tiene 40 años y el ECG es normal

Ejemplo: Estudio de cohorte

œ = -3.911
ß1= 0.652
ß2 = 0.029
ß3 = 0.342

P0(x)= 1
__________________ =0.0600 es el riesgo de tener EC con cat bajas

-
1+ e (-3.911 +0.652(0) + 0.029(40) + 0.342(0))
Modelo logístico

Cuál es el riesgo relativo de tener EC si las catecolaminas son altas


asumiendo que las personas tienen 40 años y tienen un ECG
normal.

Ejemplo: Estudio de cohorte

• P1/P0=RR= 0.1090/0.060= 1.82


Las personas con catecolaminas altas tiene 2 veces el riesgo de una
persona con catecolaminas bajas asumiendo que las dos personas
tienen 40 años y un ECG normal
• RR= p(EC=1|CAT=1, EDAD=40, ECG=0)
___________________________________________
p(EC=1|CAT=0, EDAD=40, ECG=0)
POR crudo

proc freq data=one;


tables citologia*edad/nocol norow nopercent cmh;
run;

proc logistic descending data=one;


model citologia= edad;
run;

Citología: 0= no 1=si
Edad: 0=18-37años vs. 1>37 años

POR= 1.27 IC95%(1.12 -1.44) p=0.0003


POR ajustado

proc logistic descending data=one;


model citologia= edad afiliacion salud localidad educacion
embarazo;
run;

POR= 1.15 IC95%(0.999 1.31) p=0.05


Preguntas que se deben realizar al evaluar si se ajustó por
variables de confusión

•Cuáles son las posibles variables de confusión?


•Cómo fueron medidas las variables de confusión?
•Qué metodología se utilizó para ajustar por variables de confusión?
Estimador ajustado
• B=1.497
• OR= 4.467
• Exp (1.497)=4.467
• OR ajustado=4.467 IC95% (1.16-17.19)
p=0.0295.
• Precisión= 17.19/1.16=14.8
Dirección del sesgo

Sobre-
Sub-estimación Sobre-
estimación

RDdtc <0 >0


RRdtc <1 >1
ORdtc <1 >1
i.

Entre más lejos esté el estimador del valor nulo


la magnitud del sesgo es mayor

También podría gustarte