Está en la página 1de 13

Aplicación de los modelos de regresión

tobit en la modelización de variables


epidemiológicas censuradas
Gaceta Sanitaria 2002;16(2):188-195.

MªJosé Bleda1,2 & Aurelio Tobías2

1. Unidad de Investigación en Tuberculosis, Centro Nacional de


Epidemiología, Instituto de Salud Carlos III, Ministerio de
Sanidad y Consumo, Madrid.
2. Departamento de Estadística y Econometría, Universidad
Carlos III de Madrid.

Introducción


Variables epidemiológicas corresponden a medidas


continuas, obtenidas mediante aparatos de medición
... con determinados límites de detección.


Aunque la variable tenga una determinada


distribución, los valores observados pueden no ser
representativos.
¿Truncamiento o censura?
1. Truncamiento


Característica intrínseca de la distribución de la


variable.


Parte de la distribución de la variable que se


encuentra por encima/debajo del punto de
truncamiento contiene la información relevante que
se desea estudiar.


Ejemplo: Estudiar pacientes con niveles de


hemoglobina inferiores a 8 g/dL.
¿Truncamiento o censura?
2. Censura


No es una característica intrínseca de la distribución


de la variable.


Defecto de los datos de la muestra.




Si no hubiese censura, la variable constituiría una


muestra representativa de la población no censurada.


Ejemplo: Tiempo de supervivencia.


¿Truncamiento o censura?
3. Modelos de regresión


Para variables con truncamiento y/o censura MCO


proporciona estimaciones sesgadas e inconsistentes.


Variable truncada: modelo de regresión truncado.




Variable censurada: modelo Tobit.




Varios puntos de truncamiento y/o censura


respectivas generalizaciones.

Estudio incineradora Mataró


1. Diseño


Estudio sobre los efectos para la salud de las


emisiones de una incineradora de residuos sólidos
urbanos en la población de Mataró (Barcelona).


Bleda, Gac Sanit 1996;10(supl):56.




González, Arch Environ Health 2000;55:259-67.

n = 201.


Dieta, tabaco, alcohol, muestras de sangre y orina.




Niveles de mercurio en orina corregidos por


concentración de creatinina (µg/gr CR).
Estudio incineradora Mataró
2. Censura

Muestra n (%)
No censurada 135 (68,2)
Censurada 63 (31,8)
en:
0,1 15 (23,8)
0,2 16 (25,4)
0,3 10 (15,9)
0,4 5 (7,9)
0,5 8 (12,7)
0,6 2 (3,2)
0,7 3 (4,7)
0,9 2 (3,2)
1,2 2 (3,2)
Total 198

Modelo Tobit
1. Formulación (I)


Modelo regresión lineal para variables censuradas.




Tobin, Econometrica 1958;26:24-36.

Sea y, variable censurada con punto de censura


inferior a.


Sea y*, variable aleatoria original subyacente.




Entonces:


y=a cuando y* ≤ a


y = y* cuando y* > a
Modelo Tobit
1. Formulación (II)


y* ~ N(µ,σ2)


Probabilidad censura:


P(y*≤a) = Φ{(a-µµ)/σ
σ}


P(y*>a) = 1 - P(y*≤a) = 1 - Φ{(a-µ)/σ} = Φ{(µ


µ-a)/σ
σ}


Función de densidad de y:


P(y=a) = P (y*≤a) = Φ{(a-µ


µ)/σ
σ} cuando y* ≤ a


µ,σ
y* ~ N(µ σ)
2 cuando y* > a

Modelo Tobit
2. Estimación (I)


Formulación del modelo:




E[yi * |xi] = X’β




Pero ... valores de y* desconocidos.




Sólo se conocen valores de y censurada.




Modelizar E[yi|xi] en función de E[yi*|xi]:




E[yi|xi] = E[yi*|xi]·P(yi*>a|xi)+a·P(yi*≤a|xi)
Modelo Tobit
2. Estimación (II)


Estimación por máxima verosimilitud eficiente y


consistente.


Función de verosimilitud:

ln L(β, σ 2 ) = ∑ −
1 ( y −x β
'
)  +
2
  a − x i ' β 


ln(2π) + ln( σ 2 ) + i 2 i
2  σ 
∑ Φ σ 
ln
yi > a y <= a
i
  

Generalizable para y* con varios puntos de censura.

Modelo Tobit
3. Interpretación


Estudio de x asociada con y*:




Estimación (β) modelo Tobit representa directamente


efecto marginal de x sobre y*.


Estudio de x asociada con y:




Ponderar estimaciones (β) por P(y*≤a):

 x βˆ − a 


βˆ * Φ  i 
 σˆ 
Modelo Tobit
4. Limitaciones


Falta de normalidad:


Estimaciones inconsistentes.


Chesher, J Econometrics 1987;34:33-61.

Muestra censurada (y*≤a) y no censurada (y>a)


diferente estructura en la relación con x.


Modelo en 2 etapas de Heckman.




Heckman, Annals Economic Social Measurement 1976:5;475-492.

Ejemplo


Simulación distribución normal bivariante:




n=200

 y*   0   1 0.6 
  ~ N ,  
x  


   0   0.6 1 

Punto de censura en a=-1 para y* :




y = -1 cuando y* ≤ -1


y = y* cuando y* > -1
3

1
Y*

-1

-2

-3
-3 -2 -1 0 1 2 3
X

0
Y

-1

-2

-3
-3 -2 -1 0 1 2 3
X
Muestra original Muestra con censura en a=-1
n=200 n=200 (31)
3 3

2 2

1 1
Y*

Y
0 0

-1 -1

-2 -2

-3 -3
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
X X
y=0.0726+0.6238x y=0.1508+0.5345x
Muestra no censurada TOBIT
n=169 n=200
3 3

2 2

1 1
Y

0 Y 0

-1 -1

-2 -2

-3 -3
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
X X
y=0.2807+0.4772x y=0.0655+0.6299x

Estudio incineradora Mataró


3. Análisis
 Modelo lineal (MCO):
 Muestra no censurada.
 Modelo lineal censurado (Tobit).
 Con un único punto de censura: a=0,1 µg/gr CR.
 Con varios puntos de censura.

 Stata, versión 6.0:


 regress, tobit, cnreg


Diferentes puntos de censura Unico punto de censura

20 20

15 15
nivel mercurio

nivel mercurio
10 10

5 5

0 0
si no si no
censura censura
Diferentes puntos de censura Unico punto de censura
4 4
log(nivel mercurio)

log(nivel mercurio)
2 2

0 0

-2 -2

si no si no
censura censura

Estudio incineradora Mataró


4. Resultados
Regresión Lineal (MCO) con la muestra no censurada (n=135)

β̂ (ee) t p
edad 0,019 (0,007) 2,67 0,008
sexo 0,566 (0,186) 2,93 0,004
verduras crudas -0,069 (0,039) -1,78 0,077
ahumados 0,492 (0,477) 1,03 0,304

Modelo Tobit con un único punto de censura (n=198)

(ee) t p
edad β̂
0,0005 (0,013) 0,04 0,968
sexo 0,699 (0,346) 2,02 0,045
verduras crudas -0,152 (0,066) -2,31 0,022
ahumados 1,631 (0,984) 1,66 0,099

Modelo con varios puntos de censura (n=198)

(ee) t p
edad β̂
0,007 (0,012) 0,64 0,523
sexo 0,687 (0,282) 2,44 0,016
verduras crudas -0,096 (0,054) -1,77 0,079
ahumados 1,314 (0,797) 1,65 0,101


Estudio incineradora Mararó
5. Conclusiones
 Sólo se explica una pequeña parte de la variabilidad
de niveles de mercurio.
 Sexo y edad: proxys de otras fuentes de exposición.
 Resultados similares observados en otras poblaciones
(Santor, IARC Sci Publ 1992;118:101-6).
 Consumo de verduras crudas y ahumados: (¿?).
 Mercurio en orina asociado con el consumo de
pescado. (Svensson, Sci Tot Environ 1992;126:61-74;
Salonen, Circulation 1995;91:645-55).
 Aunque ... estudios previos no utilizaron modelos que
tengan en cuenta la censura.

Discusión (I)
 Muchas variables epidemiológicas —que no miden
tiempo de supervivencia— presentan distribuciones
con censura.
 Regresión lineal MCO proporciona estimaciones
sesgadas e inconsistentes.
 Ignorar censura: distribución muestral ≠ poblacional.
 Utilizar modelos adecuados a la naturaleza de la
variable de estudio: truncamiento/censura.


Discusión (II)
 Modelos de regresión censurados (Tobit):
 No cambia la dirección del efecto estimado.
 Diferencias en: estimación efecto y su variabilidad.
 En epidemiología cuantificar efecto tan importante
como significación estadística.
 Métodos estadísticos desarrollados en otros campos
(economía, industria, psicología, etc.) también útiles
en epidemiología.

James Tobin
(1918-2002)

  
       " ! # $ %&' ( ) *+-,". / 0 1 243"5"6 7 8 9:<;
= 9: : > ? @ @ BA ACA D EFGHI D JH @ HKFEFL;NM KJ @ O PQ"R4SPT4SU VXWY"ZLW[V \4]"^"_ ` a b"cd4e"f"g e h id<jNk



También podría gustarte