Está en la página 1de 30

Regresión Logística

Solucionario del QUEST 04

2
Estructura de la clase Semana 02
◉ Estructura de la clase [5’]
◉ Dinámica de la clase [15’]
◉ Repaso : Regresiones lineales (vs logística) [25’]
◉ Desarrollo Teórico : odds [25’]
◉ Interpretación de coeficientes [25’]
o Odds interpretación de los coeficientes
o Ejercicio en clase 01 (XX’)

3
1 Semana 05 :
Repasos : regresión Lineal vs logística

4
Repasos : Regresiones

^
𝒀
Regresión Los modelo de regresión lineal busca predecir
Lineal el valor esperado de la variable dependiente

Regresión Buscan modelar la probabilidad de un evento


ocurriendo en función de otros factores.
Logística

5
Regresión Logística Binaria

Variable
dependiente
𝑿 Variables
independientes
Significancia en la

^
probabilidad de la

𝒀 Dicotómica ocurrencia de Y

6
función sigmoide
Ocurrencia

Probabilidad de y

No ocurrencia

7
2 Semana 05 :
Regresión Logística : odds

Basado en Sulmont (2019)


8
Probabilidad
◉ La probabilidad es una medida que nos
indica qué tan posible es que ocurra un
evento

π ◉ se calcula dividiendo las veces de que en


que ocurre un evento específico sobre el
total de eventos que se observan

◉ Las probabilidad oscilan entre 0 y 1

9
Odds

π ◉ La probabilidad de que un evento (p) sobre


la probabilidad de que no ocurra (1-p)
1−π

10
Uso de anticonceptivos modernos

La probabilidad de encontrar a una mujer


sexualmente activa que use métodos
anticonceptivos modernos es de:

Urbana Rural Total

Sí 10992 3848 12860


12860
No 12816 5512 7687 =0.623
14511 6036 20547
20547

table(endes17s$urbano,endes17s$hoy_anticon2) 11
Uso de anticonceptivos modernos
Los Odds de encontrar a una mujer
sexualmente activa que use métodos
anticonceptivos modernos es de:
Urbana Rural Total

Sí 10992 3848 12860 12860 / 20547


No 12816 5512 7687
7687 / 20547 =1.67
14511 6036 20547

12
Por cada mujer que no usa métodos modernos hay 1.67 mujeres que sí lo hacen
Odds Ratio
 Mide la posibilidad de que un evento ocurra dependiendo de la presencia
o ausencia de otra condición,

13
Uso de anticonceptivos modernos
El Odds Ratio (OR) de a posibilidad de que se
usen métodos anticonceptivos modernos según
área de residencia urbana :
Urbana Rural Total

Sí 9499 3361 12860  9499/5012


=1.51
No 5012

14511
2675

6036
7687

20547
3361/2675

14
 La posibilidad de usar métodos anticonceptivos modernos respecto de no usarlos son 1.51 veces mayores en zonas urbanas
Odds Ratio y probabilidades

Se puede convertir un Odds Ratio en una probabilidad de la siguiente manera:

15
Diferencia de los conceptos

Probabilidad : qué tan Odds : La probabilidad de un Odds Ratio: La posibilidad


posible es que ocurra un evento (p) sobre la probabilidad de que un evento ocurra
evento de que no ocurra (1-p) según otra condición

π π π
1−π

16
3 Semana 05 :
Regresión Logística : interpretación de los coeficientes

17
Transformaciones logarítmicas y regresión

π Los coeficientes miden los efectos de las


variables independientes en el logaritmo
Log
1−π natural de las Odds de la variable
dependiente.

Ejemplo : el área de residencia, urbana o rural, afecta en los ods de usar métodos anticonceptivos modernos 18
función sigmoide
Ocurrencia

0.5
Log 1 − 0.5 Log 𝟎

No ocurrencia

19
2 Semana 05 :
Regresión Logística : interpretación de los coeficientes

20
Load("endes17s.rda“)

library(ggplot2)

library(stargazer)

library(DescTools)

Carga tu data a R
*Tomado
Basadode
enSulmont
Sulmont 2019
(2019)
21
modelo1 <-glm(hoy_anticon2~urbano, binomial, data = endes17s[endes17s$activ_sex=="Ultimo mes", ])

Interpretación de los coeficientes

Por cada unidad,


Valor teórico
en cuanto aumenta
de log(ods)
el log(ods)

22
summary(modelo1)

Interpretación de los coeficientes

## Deviance Residuals: π
log = 0.64 −(0.41 ∗ 𝑋 1 )
## Min 1Q Median 3Q Max 1−π
## -1.4581 -1.2758 0.9206 0.9206 1.0821
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.63935 0.01746 36.62 <2e-16 ***
## urbanoRural -0.41106 0.03124 -13.16 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Null deviance: 27168 on 20546 degrees of free
## Residual deviance: 26996 on 20545 degrees of free

23
anova(modelo1, test = "Chisq")

Interpretación de los coeficientes


π
## Analysis of Deviance Table log = 0.64 − (0.41 ∗ 𝑋 1 )
## 1−π
## Model: binomial, link: logit
##
## Response: hoy_anticon2
##
## Terms added sequentially (first to last)
##
##
## Df Deviance Resid. Df Resid. Dev Pr(>Chi)
## NULL 20546 27168
## urbano 1 172.08 20545 26996 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

24
La sintaxis en R

◉ Modelo<-glm(y~x1, binomial, data)


Transformación en probalidades

◉ exp(coef(modelo))
◉ 1-(exp(bi)) #odds
◉ (1-odds)*100 #prob 25
Quest N°05
+ 1 Wisdom
+1 Pts. a participación

26
Quest N°05 : Titanic

Crear e interpreta los siguientes


Titanic.rda
modelos de regresión logística la
variables “Survival” :

 Según edad y sexo


 Según Pclass, edad y sexo
 Utilizando todas las variables
significativas del modelo

27
🏰 Libro de códigos
Variable Definición Categorias
Survived Survival 0 = No, 1 = Yes
1st = Upper
Pclass Ticket class 2nd = Middle
3rd = Lower
Sex Sex
Age Age in years

# of siblings / spouses Sibling = brother, sister, stepbrother, stepsister


Sibsp
aboard the Titanic Spouse = husband, wife (mistresses and fiancés were ignored)

# of parents / children Parent = mother, father


Parch
aboard the Titanic Child = daughter, son, stepdaughter, stepson

Ticket Ticket number


Fare Passenger fare
Cabin Cabin number

Embarked Port of Embarkation C = Cherbourg, Q = Queenstown,S = Southampton

28
Lecciones aprendidas

Variable
dependiente
𝑿 Variables
independientes
Significancia en la

^
probabilidad de la

𝒀 Dicotómica ocurrencia de Y

29
🏰 Recursos adicionales

https://rpubs.com/abhaypadda/logistic-regression-using-titanic-data

https://www.datacamp.com/tutorial/logistic-regression-R

https://rpubs.com/Joaquin_AR/229736

30

También podría gustarte