Está en la página 1de 17

Regresión logística

Dra. Dayamí Díaz Garrido


Objetivos

Que conozcan en que


casos se utiliza la
regresión logística y
saber interpretar sus
resultados
Regresión logística Binaria
Planteamiento:
Una variable dependiente que tiene únicamente dos opciones.
(dicotómica)
Cálculo de la probabilidad de que ocurra una u otra
a partir de una serie de informaciones (variables
independientes).

Ejemplos:

“Vivo o muerto”
“Sano o enfermo”
Regresión logística
•Un investigador médico está
interesado en determinar si la
probabilidad de un infarto del
miocardio puede predecirse
conociendo tensión arterial, el nivel
de colesterol, la ingesta de calorías,
el sexo y el estilo de vida.
Regresión logística
• En general, con k variables independientes:.

ln[odds (ME / X 1 , X 2 ...X k )]   0   1 X 1  ....  k X k

p
ln[ ] 0  1X1  .... k Xk
1 p
P es la probabilidad de que se prediga que una persona puede
tener un ataque al corazón teniendo en cuenta las variables
independientes Xi.
Regresión logística

• La ecuación anterior modeliza el logaritmo


neperiano de las odds como una función lineal
de las variables independientes con el ln de
las odds como variable dependiente.
• Las variables independientes pueden ser
continuas y categóricas.
• El ln (log) de las odds se conoce como logit.
De ahí viene el nombre de regresión
logística múltiple.
Regresión logística
• Si sólo hay una variable
independiente:.

p
ln[ ]  0  1X1
1 p

1
p
1 e(01X1)
Probabilidad del éxito (sí tiene la enfermedad...)
El objetivo primordial que resuelve esta técnica
es el de modelar cómo influye en la probabilidad
de aparición de un suceso, la presencia o no de
diversos factores y el valor o nivel de los
mismos. También puede ser usada para estimar
la probabilidad de aparición de cada una de las
posibilidades de un suceso con más de dos
categorías (politómico).

http://www.seh-lelha.org/rlogis1.htm
REGRESION LOGISTICA
La regresión logística resulta útil para los casos
en los que se desea predecir la presencia o
ausencia de una característica según los valores
de un conjunto de variables predictoras. la
variable dependiente es dicotómica. Los
coeficientes de regresión logística pueden
utilizarse para estimar la razón de las ventajas
(odds ratio) de cada variable independiente del
modelo. Cociente de dos ODDS
Regresión logística múltiple
Contraste de la regresión
Suponiendo que se cumple el modelo de regresión logística
múltiple, estamos interesados en determinar si el modelo es
o no explicativo.

H0: β1= β2= β3= … βj= 0 (Xj no influye sobre Y)


H1: β1≠ β2≠ β3≠ …βj≠ 0 (Xj influye sobre Y)

Si se acepta la hipótesis nula , el modelo no es explicativo,


es decir, ninguna de las variables explicativas influye en la
variable respuesta Y .

Si se rechaza la hipótesis nula, el modelo es explicativo, es


decir, al menos
una de las variables explicativas influye en la respuesta Y .
REGRESION LOGISTICA

Calcular el odds de presencia de hipertensión y


el consumo de sal (exceso-normal)

Si dividimos el primer odds entre el segundo,


hemos calculado un cociente de odds, esto es un
odds ratio, que de alguna manera cuantifica
cuánto más probable es la aparición de
hipertensión cuando se consume mucha sal
(primer odds) respecto a cuando se consume
poca.
Ejemplo
Mediante un modelo de regresión logística, determine la
posible asociación entre el cáncer de vejiga, el consumo
de café y la procedencia. Se eligen 50 pacientes con
cáncer y 50 sin él y se definen 3 variables: CÁNCER
(0=sin cáncer, 1= con cáncer), CAFÉ (0=sin consumo,
1= con consumo), MEDIO (0=rural, 1=urbano)

Café Nocafé
Urbano Rural Urbano Rural
Cáncer 32 1 15 2
Nocáncer 15 10 15 10
Prueba de Hosmer-Lemeshow

Compara los valores observados y los esperados,


por lo tanto, si SIG es mayor de 0.05 no se puede
rechazar la hipótesis nula de que no hay diferencia
significativa entre los valores observados y los que
predice el modelo. Por lo tanto, el modelo tiene un
buen ajuste.

Prue ba de Hos me r y Le me s how

Paso Chi-c uadrado gl Sig.


1 1.177 2 .555
Ejemplo. Salida del
SPSS
Variables en la ecuación

B E.T. Wald gl Sig. Exp(B I.C. 95% para EXP(B)

OR) OR

Inferior Superior

estcivil1 -,498 ,348 2,047 1 ,153 ,608 ,307 1,202

Nivel_educativo ,154 ,205 ,566 1 ,452 1,167 ,781 1,742

Ocupacion1 ,774 ,345 5,048 1 ,025 2,169 1,104 4,261

Ingresos -,530 ,186 8,066 1 ,005 ,589 ,409 ,849

antecmadre ,396 ,372 1,131 1 ,287 1,485 ,716 3,080

Tipo_de_lactancia 1,839 ,448 16,845 1 ,000 6,288 2,613 15,132

Paso 1a
Completa_Lactancia_Materna -1,119 ,638 3,074 1 ,080 ,327 ,093 1,141

Adición_de_cereal_u_otro_a_la_l
1,713 ,488 12,303 1 ,000 5,544 2,129 14,435
eche_del_biberón

Alimento_conque_se_inició -,089 ,079 1,255 1 ,263 ,915 ,783 1,069

fmliapeso 1,379 ,461 8,946 1 ,003 3,973 1,609 9,810

Constante 1,972 1,035 3,633 1 ,057 7,187

a. Variable(s) introducida(s) en el paso 1: estcivil1, Nivel_educativo, Ocupacion1, Ingresos, antecmadre, Tipo_de_lactancia, Completa_Lactancia_Materna,

Adición_de_cereal_u_otro_a_la_leche_del_biberón, Alimento_conque_se_inició, fmliapeso.

También podría gustarte