Documentos de Académico
Documentos de Profesional
Documentos de Cultura
⎧1 no ocurre el riesgo
Variable respuesta: Y = CHD = ⎨
⎩0 sí ocurre el riesgo
Si unimos los
puntos,
tendríamos una
curva en forma de
“S” (sigmoide)
una medida de cuánto más probable es que ocurra el riesgo o evento con
x+1 que con x (al aumentar x una unidad o por unidad de x). Esta cantidad
se aproxima al riesgo relativo, si la probabilidad de ocurrencia del evento
es baja.
∑ ⎡⎣y
2
SSE = i − (β0 + β1xi )⎤⎦
i =1
Significación del
modelo con G
(likelihood ratio
statistic)
Significación del
coeficiente b1 con
ˆ
estadístico de Wald
ODDS RATIO = eβ1
ˆ
β1 − β1
Z=
ˆˆ
SE( β1 )
ˆ
ODDS RATIO = eβ1
ˆ
β1
ÔR x +1 versus x = e = 1.12
Cada año que pasa se multiplica por 1.12 la probabilidad de sufrir una enfermedad coronaria
• Se deja que el alumno compruebe, con los datos anteriores, que una
predicción por intervalos (al 95%) para un individuo de 50 años es
(0.435 ; 0.677), interpretando este resultado.
• Compruebe también que 3.03 es una estimación puntual del OR de x+10
versus x e interprételo adecuadamente.
blanca 0 0 0
negra 1 0 0
latina 0 1 0
otras 0 0 1
Sí 5 20 15 10 50
No 20 10 10 10 50
Total 25 30 25 20 100
ODDS RATIO 1 8 6 4
Ln(odds ratio) β̂1 = 2.08 ˆ
β2 = 1.79 ˆ
β3 = 1.39
ˆ
Para X=(0,0,0), se tendría π(X) = 5 e0 β
ˆ =
25 1 + eˆβ0
⇒ˆ
β0 = −1.39
Significación del
modelo con G
(likelihood ratio
statistic)
Significación
individual de los
coeficientes con el
estadístico de Wald
ODDS RATIO
Significación del
modelo con G
(likelihood ratio
statistic)
Logaritmo
neperiano de la
verosimilitud del
modelo
completo
Parece que AGE (edad) y FTV no son significativas y hay dudas acerca de
RAZA. Dejamos por el momento el caso de RAZA, y contrastamos en
bloque la significación de FTV y AGE: ⎧H0 : β1 = β5 = 0
⎨
⎩H1 : al menos un coeficiente es ≠ 0
Lo hacemos en “bloque” para prevenir errores de tipo I (declarar más
variables significativas de las necesarias) y así tener en cuenta el principio
de parsimonia. Este contraste se basa en el estadístico G que, para este
caso, adopta la siguiente forma:
verosimilitud sin las variables AGE y FTV
G = −2 ln( )
verosimilitud con todas las variables
2
que bajo H0 sigue el modelo χ (2)
con G = −2 ln(
verosimilitud sin las variables AGE, FTV, raza2, raza3 (solo lwt)
)
verosimilitud con lwt, raza2 y raza3
(ˆ
β0 +ˆ
β1lwt +ˆ
β3raza2 +ˆ
β4raza3)
e e(0.81−0.015lwt +1.08 raza2 + 0.48 raza3)
π(x) =
ˆ =
1+ e
(ˆ
β0 +ˆ
β1lwt +ˆ
β3raza2 +ˆ
β4raza3) 1 + e(0.81−0.015 lwt +1.08 raza2 + 0.48 raza3)
Los ODDS RATIO para el sexo, y por tanto sus estimaciones, deben ser
establecidas con referencia a una edad específica.
Dpto. Matemática Aplicada (Biomatemática) Fac. Biología UCM
Sobre Regresión Logística
En general, si F es el factor de riesgo primario, X la covariante y FX su
interacción: log it(f, x) = g(f, x) = β0 + β1f + β2 x + β3 fx
De manera que si deseamos establecer el odds ratio, comparando los
niveles f1 y f0 , para el valor x, localizamos en primer lugar los logit:
g(f1 , x) = β0 + β1f1 + β2 x + β3 f1x
g(f0 , x) = β0 + β1f0 + β2 x + β3 f0 x
⇔
ˆ ˆ ⎤ = (f − f )2ˆ
SE ⎡ln(OR)
2
ˆ
⎣ ⎦ 1 0 β1 + ⎡(f
⎣ 1 − f0 )x ⎦ ˆ
⎤ β3 + 2(f1 − f0 )xCov(ˆ
β1 , ˆ
β3 )
Alta
significación del
modelo
completo.
Significación
de la
interacción al
nivel 0.1 **
Además,
ˆ
β1 +ˆ
ˆ 1 β3age
= e−1.94 + 0.132age
OR( versus 0, age) = e
No Significación del
modelo completo al
nivel 0.05 pero sí al
nivel 0.15. Causas
posibles: No
significación de
algunas variables
predictoras; falta de
potencia, …
Se observa una
gran variabilidad de
la respuesta LOW,
para casi todos los
valores de LWT
(peso de la madre),
lo que puede
dificultar la relación
funcional entre
LOW y LWT
No se detecta correlación
significativa entre LOW y
LWT en ninguno de los dos
grupos: cuando el peso de la
madre es bajo, es indiferente
Discretizamos LWT con 0 para peso lo bajo que sea; y si es
normal, es indiferente su
normal (≥110 libras) y 1 para bajo magnitud. Esto defiende la
peso (<110 libras) y calculamos los discretización de LWT
coeficientes de correlación
condicional :
Obedeciendo al
principio jerárquico,
a continuación
contrastamos la
significación en
bloque de los
términos de
interacción, con
ayuga de G.
A continuación,
contraste de
significación en
bloque de AGE y
FTV.
No significativo:
eliminar los
términos de
interacción.
A continuación,
contraste de
significación en
bloque de race2 y
race3
No significativo:
eliminar las
variables AGE y
FTV.
No significativo al
nivel 0.05 pero sí al
nivel 0.1: se
mantienen race2 y
race3