Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 5
Tema 5
ANÁLISIS DE
REGRESIÓN LOGÍSTICA
LECTURA OBLIGATORIA
Modelos Multivariantes 2
INTRODUCCIÓN
Predecir la probabilidad de que un evento ocurra
Gran utilidad en medicina y Ps. Clínica: identificar factores de
riesgo y factores de protección, estimar cuánto aumenta la
probabilidad de sufrir una patología si se dan una serie de
característica o condiciones, …
Logística Binaria y Logística Multinomial
Modelos Multivariantes 3
EJEMPLOS
ESTIMAR LA PROBABILIDAD DE QUE UN INDIVIDUO SUFRA UN INFARTO A
PARTIR DE:
Nivel de colesterol
Edad
Presión arterial
Sexo
Antecedentes familiares
ESTIMAR LA PROBABILIDAD DE QUE UN DETERMINADO SUJETO SUFRA
ESQUIZOFRENIA, EN FUNCIÓN DE UNA SERIE DE VIs
PREDECIR EL ÉXITO O FRACASO DE UNA TERAPIA
CONOCER LAS VARIABLES QUE EXPLICAN LA ABSTENCIÓN ELECTORAL,
el absentismo laboral, el burnout, etc.
Modelos Multivariantes 4
FILOSOFÍA
¿Qué hace la RL?
A partir de las puntuaciones de los sujetos en diferentes VIs, se
estiman probabilidades para poder hacer pronósticos.
Modelos Multivariantes 5
TÉRMINOS QUE DEBES DOMINAR
Se compara la probabilidad de ocurrencia de un evento con la probabilidad de
que no ocurra. Al cociente entre ambos se le denomina ODD.
P (Y 1)
1 P (Y 1)
Se trata de identificar aquellas variables que implican cambios en ese ratio de
probabilidad, aumentándolo o disminuyéndolo de forma significativa.
La ODD RATIO sería la razón o cociente entre dos ODDs. Permite comparar
el pronóstico realizado bajo dos situaciones o condiciones distintas (Ej: La
proporción de éxito/fracaso escolar es 5 veces menor en familias
desectructuradas que en familias estructuradas).
Lo que la regresión logística pretende es identificar aquellas VI que hacen variar
esa ODD.
Modelos Multivariantes 6
TÉRMINOS QUE DEBES DOMINAR
Lo que se estima en la Regresión Logística para cada sujeto no es un valor de
Y’, sino un LOGIT, es decir, el logaritmo de la probabilidad de que le ocurra
un evento, frente a la probabilidad de que no le ocurra.
P (Y 1)
Ln
1 P (Y 1)
El LOGIT es, precisamente, la VD en la Regresión Logística.
Modelos Multivariantes 7
EL MODELO
Dado que debemos llegar a un cociente de Probabilidades, el modelo
debe asumir una expresión matemática particular, concretamente
logarítmica:
P (Y 1)
Ln 1 X1 2X2 ... nXn
1 P (Y 1)
La regresión logística utiliza una Función de Enlace Logarítmica, para pasar de los
valores cualesquiera en las VI a predicciones en términos de un cociente
probabilidades y, de ahí a una Probabilidad (entre 0 y 1) y , finalmente a un pronóstico
concreto.
El modelo de regresión logística asume que existe una relación lineal entre los
predictores y el logaritmo de la probabilidad de ocurrencia de un evento, frente a la no
ocurrencia de dicho evento (LOGIT).
Modelos Multivariantes 8
SUPUESTOS
Modelos Multivariantes 9
ESTIMACIÓN DEL MODELO
¿Cómo se estima el modelo en la RL?
En la Regresión Lineal se hacía siguiendo el criterio de Mínimos
Cuadrados, mientras que en la RL se hace siguiendo el de Máxima
Verosimilitud.
Se generan Coeficientes Logísticos para las distintas VI.
Dichos coeficientes de la ecuación ( 1, 2, 3,...) se utilizan para hacer las
estimaciones de probabilidad de que ocurra el evento objeto de estudio.
Modelos Multivariantes 10
EVALUACIÓN DEL AJUSTE
Un primer indicador es el valor de –2LL, que vendría a ser como la parte no
explicada por el modelo. Excesivamente rudimentario: no está acotado. Cuanto
más próximo a cero mejor será el ajuste.
Contrastes globales:
“F” Anova
2
Contrastes particulares
“t” Student
Wald
Método de estimación
Mínimos cuadrados
Máxima verosimilitud
Modelos Multivariantes 13
EJEMPLO
VD dicotómica: REHABILITACIÓN
70 pacientes víctimas
de accidentes de 0 (NO SE REHABILITA)
tráfico y con daño 1 (SE REHABILITA)
cerebral (TCE)
• 3 Variables explicativas cualitativas (dicotómicas)
APOYO:
Se desea saber si 0 (SIN APOYO FAMILIAR)
variables como el
1 (CON APOYO FAMILIAR)
Tipo de Lesión, la
Atención, el Apoyo LESIÓN:
Familiar, o laEdad del 0 (DIFUSA)
sujeto influyen en la
1 (FOCALIZADA)
rehabilitación del
paciente ATENCIÓN
0 (NO INMEDIATA)
1 (INMEDIATA)
• 1 Variable explicativa cuantitativa: EDAD
Modelos Multivariantes 14
EJEMPLO
Sea 0= No se rehabilita y 1= Se rehabilita. A partir de los datos de
una tabla de contingencia podemos calcular 4 probabilidades:
La probabilidad de que el sujeto se rehabilite frente a la probabilidad de que no
se rehabilite (ODD para la rehabilitación)
La probabilidad de que el sujeto se rehabilite frente a la probabilidad de que no
se rehabilite, si es que se trata de una lesión focalizada (ODD para la
rehabilitación con lesión focalizada)
La probabilidad de que el sujeto se rehabilite frente a la probabilidad de que no
se rehabilite, si es que se trata de una lesión difusa (ODD para la rehabilitación
con lesión difusa)
El cociente entre las dos ODD, la obtenida para una lesión focalizada y la
obtenida para una lesión difusa (ODD RATIO).
Modelos Multivariantes 15
EJEMPLO
Tabla de contingencia REHABILITACAIÓN * LESIÓN
LESIÓN
DIFUSA FOCALIZADA T otal
REHABILIT ACAIÓN NO SE REHABILITA Recuento 19 8 27
% de LESIÓN 57,6% 21,6% 38,6%
SE REHABILITA Recuento 14 29 43
% de LESIÓN 42,4% 78,4% 61,4%
T otal Recuento 33 37 70
% de LESIÓN 100,0% 100,0% 100,0%
Modelos Multivariantes 16
EJEMPLO
Tabla de contingencia REHABILITACAIÓN * LESIÓN
LESIÓN
DIFUSA FOCALIZADA T otal
REHABILIT ACAIÓN NO SE REHABILITA Recuento 19 8 27
% de LESIÓN 57,6% 21,6% 38,6%
SE REHABILITA Recuento 14 29 43
% de LESIÓN 42,4% 78,4% 61,4%
T otal Recuento 33 37 70
% de LESIÓN 100,0% 100,0% 100,0%
LESIÓN
DIFUSA FOCALIZADA T otal
REHABILIT ACAIÓN NO SE REHABILITA Recuento 19 8 27
% de LESIÓN 57,6% 21,6% 38,6%
SE REHABILITA Recuento 14 29 43
% de LESIÓN 42,4% 78,4% 61,4%
T otal Recuento 33 37 70
% de LESIÓN 100,0% 100,0% 100,0%
Modelos Multivariantes 20
Si sustituimos los parámetros
Variables en la ecuación