Documentos de Académico
Documentos de Profesional
Documentos de Cultura
S05 Regresión Logistica Binaria
S05 Regresión Logistica Binaria
2
Estructura de la clase Semana 02
◉ Estructura de la clase [5’]
◉ Dinámica de la clase [15’]
◉ Repaso : Regresiones lineales (vs logística) [25’]
◉ Desarrollo Teórico : odds [25’]
◉ Interpretación de coeficientes [25’]
o Odds interpretación de los coeficientes
o Ejercicio en clase 01 (XX’)
3
1 Semana 05 :
Repasos : regresión Lineal vs logística
4
Repasos : Regresiones
^
𝒀
Regresión Los modelo de regresión lineal busca predecir
Lineal el valor esperado de la variable dependiente
5
Regresión Logística Binaria
Variable
dependiente
𝑿 Variables
independientes
Significancia en la
^
probabilidad de la
𝒀 Dicotómica ocurrencia de Y
6
función sigmoide
Ocurrencia
Probabilidad de y
No ocurrencia
7
2 Semana 05 :
Regresión Logística : odds
9
Odds
10
Uso de anticonceptivos modernos
table(endes17s$urbano,endes17s$hoy_anticon2) 11
Uso de anticonceptivos modernos
Los Odds de encontrar a una mujer
sexualmente activa que use métodos
anticonceptivos modernos es de:
Urbana Rural Total
12
Por cada mujer que no usa métodos modernos hay 1.67 mujeres que sí lo hacen
Odds Ratio
Mide la posibilidad de que un evento ocurra dependiendo de la presencia
o ausencia de otra condición,
13
Uso de anticonceptivos modernos
El Odds Ratio (OR) de a posibilidad de que se
usen métodos anticonceptivos modernos según
área de residencia urbana :
Urbana Rural Total
14511
2675
6036
7687
20547
3361/2675
14
La posibilidad de usar métodos anticonceptivos modernos respecto de no usarlos son 1.51 veces mayores en zonas urbanas
Odds Ratio y probabilidades
15
Diferencia de los conceptos
π π π
1−π
16
3 Semana 05 :
Regresión Logística : interpretación de los coeficientes
17
Transformaciones logarítmicas y regresión
Ejemplo : el área de residencia, urbana o rural, afecta en los ods de usar métodos anticonceptivos modernos 18
función sigmoide
Ocurrencia
0.5
Log 1 − 0.5 Log 𝟎
No ocurrencia
19
2 Semana 05 :
Regresión Logística : interpretación de los coeficientes
20
Load("endes17s.rda“)
library(ggplot2)
library(stargazer)
library(DescTools)
Carga tu data a R
*Tomado
Basadode
enSulmont
Sulmont 2019
(2019)
21
modelo1 <-glm(hoy_anticon2~urbano, binomial, data = endes17s[endes17s$activ_sex=="Ultimo mes", ])
22
summary(modelo1)
## Deviance Residuals: π
log = 0.64 −(0.41 ∗ 𝑋 1 )
## Min 1Q Median 3Q Max 1−π
## -1.4581 -1.2758 0.9206 0.9206 1.0821
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.63935 0.01746 36.62 <2e-16 ***
## urbanoRural -0.41106 0.03124 -13.16 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Null deviance: 27168 on 20546 degrees of free
## Residual deviance: 26996 on 20545 degrees of free
23
anova(modelo1, test = "Chisq")
24
La sintaxis en R
◉ exp(coef(modelo))
◉ 1-(exp(bi)) #odds
◉ (1-odds)*100 #prob 25
Quest N°05
+ 1 Wisdom
+1 Pts. a participación
26
Quest N°05 : Titanic
27
🏰 Libro de códigos
Variable Definición Categorias
Survived Survival 0 = No, 1 = Yes
1st = Upper
Pclass Ticket class 2nd = Middle
3rd = Lower
Sex Sex
Age Age in years
28
Lecciones aprendidas
Variable
dependiente
𝑿 Variables
independientes
Significancia en la
^
probabilidad de la
𝒀 Dicotómica ocurrencia de Y
29
🏰 Recursos adicionales
https://rpubs.com/abhaypadda/logistic-regression-using-titanic-data
https://www.datacamp.com/tutorial/logistic-regression-R
https://rpubs.com/Joaquin_AR/229736
30