Está en la página 1de 4

Econometría II.

2023-2 UIS
Integrantes del grupo:
Yuli Vanessa Garavito Garcés – código 2202556

Julián David Lizarazo Galeano – código 2210082


Juan Esteban Ordóñez Hernández – código 2210774
José Domingo Piedrahita Santamaria – código 2182590

Taller logit
La base de datos smoke.dta incluye información acerca de si la persona fuma o no (smoke=1 si, 0 otro
caso), años de estudio (educ), precio de los cigarrillos (cigprice, céntimos por paquete), edada (age) y edad
al cuadrado (agesq), raza (white=1 para blancos, 0 otro caso), ingreso (income, dólares anuales) y una
variable que indica si el estado donde habita esa persona prohíbe fumar en espacios público (restaurn=1 si
prohíbe, 0 en otro caso). Hay otras variables en la base de datos, pero ignórelas. Se pide:
1) Ajuste un modelo logit que permita estimar la probabilidad de fumar, usando como explicativas la
educación, la edad, la edad al cuadrado, el precio de los cigarrillos, la raza, el ingreso y si vive en un
lugar donde no se permite fumar en espacios públicos. Muestre tanto la instrucción (no solo el
comando) Stata que utilizó como los resultados del modelo. Comente dichos resultados. (1 pt)

. logit smoke educ age agesq cigpric i.white income i.restaurn

Iteration 0: log likelihood = -537.50555


Iteration 1: log likelihood = -510.613
Iteration 2: log likelihood = -510.26967
Iteration 3: log likelihood = -510.26914
Iteration 4: log likelihood = -510.26914

Logistic regression Number of obs = 807


LR chi2(7) = 54.47
Prob > chi2 = 0.0000
Log likelihood = -510.26914 Pseudo R2 = 0.0507

smoke Coef. Std. Err. z P>|z| [95% Conf. Interval]

educ -.1336678 .0279345 -4.79 0.000 -.1884184 -.0789171


age .1054257 .0279352 3.77 0.000 .0506737 .1601777
agesq -.0013819 .0003175 -4.35 0.000 -.0020042 -.0007596
cigpric -.0054003 .0158661 -0.34 0.734 -.0364972 .0256966
1.white -.1160287 .2333554 -0.50 0.619 -.5733968 .3413394
income 1.59e-06 9.02e-06 0.18 0.860 -.0000161 .0000193
1.restaurn -.4560922 .1829358 -2.49 0.013 -.8146399 -.0975445
_cons .0593441 1.112231 0.05 0.957 -2.120589 2.239277

Las variables que se identifican como significativas en el modelo son la variable edad, edad al
cuadrado, educación y la variable relacionada a la restricción estatal de fumar en lugares públicos. Se
concluye: Un año más de edad aumenta la probabilidad de que la persona fume pero el efecto de la
edad de aumentar la probabilidad de que la persona sea fumadora conforme aumenta la misma
disminuye con el paso de los años; por otra parte, un año más de educación genera la reacción
contraria, reduciendo la probabilidad de fumar. En referencia a la variable de restricción estatal, si se
prohíbe estatalmente fumar en espacios públicos se reduce la probabilidad de que la persona fume.

2) Estime el efecto marginal promedio de cada variable. Muestre la instrucción (no solo el comando)
Stata que utilizó. Muestre e interprete los resultados obtenidos. (1 pt)

. margins, dydx(*)

Average marginal effects Number of obs = 807


Model VCE : OIM

Expression : Pr(smoke), predict()


dy/dx w.r.t. : educ age agesq cigpric 1.white income 1.restaurn

Delta-method
dy/dx Std. Err. z P>|z| [95% Conf. Interval]

educ -.0296138 .005861 -5.05 0.000 -.0411011 -.0181265


age .0233569 .0059988 3.89 0.000 .0115994 .0351144
agesq -.0003062 .0000675 -4.54 0.000 -.0004384 -.0001739
cigpric -.0011964 .0035142 -0.34 0.734 -.008084 .0056912
1.white -.0259082 .0524625 -0.49 0.621 -.1287327 .0769164
income 3.51e-07 2.00e-06 0.18 0.860 -3.57e-06 4.27e-06
1.restaurn -.0988955 .0382527 -2.59 0.010 -.1738694 -.0239217

Note: dy/dx for factor levels is the discrete change from the base level.

Teniendo en cuenta las variables significativas podemos concluir que por cada año adicional de
estudio, la probabilidad de fumar se reduce en 2.96 puntos porcentuales en promedio. Por otra parte,
en la variable edad se observa que, por cada año adicional de edad la probabilidad de fumar aumenta
en 2.33 puntos porcentuales en promedio; igualmente, la variable de edad al cuadrado muestra que
por cada año adicional de edad el aumento que se observa sobre la probabilidad de fumar se reduce
en 0.03 puntos porcentuales. Por otro lado, la variable restaurn muestra que si la legislación estatal
prohíbe fumar en espacios públicos la probabilidad de que una persona fume disminuye en 9.89 puntos
porcentuales.

3) Calcule la probabilidad de fumar de una persona de 40 años (no olvide incluir los años al cuadrado),
de raza blanca, con 12 años de estudio, que gana $40000 al año, que vive en un estado donde no se
permite fumar en lugares públicos y que paga 50 céntimos de dólar por la cajetilla de cigarrillos.
Muestre la instrucción (no solo el comando) Stata que utilizó Muestre los resultados y comente. (0.5
pt)
. margins, at (age=40 agesq=1600 white=1 educ=12 income=40000 restaurn=1 cigpric=50)

Adjusted predictions Number of obs = 807


Model VCE : OIM

Expression : Pr(smoke), predict()


at : educ = 12
age = 40
agesq = 1600
cigpric = 50
white = 1
income = 40000
restaurn = 1

Delta-method
Margin Std. Err. z P>|z| [95% Conf. Interval]

_cons .4213079 .0735261 5.73 0.000 .2771995 .5654164

Si la persona tiene 40 años, es de raza blanca, cuenta con 12 años de educación, tiene ingresos de
40000 dólares, vive en un estado que prohíbe fumar en lugares públicos y paga 50 centavos por
cajetilla tiene una probabilidad de fumar de 42,13% en promedio.

4) ¿Encuentra evidencia de que la prohibición de fumar en espacios públicos reduce la probabilidad de


que una persona fume? Señale en qué se basa para sustentar su respuesta. (0.5 pt)

. margins, at(restaurn=0)

Predictive margins Number of obs = 807


Model VCE : OIM

Expression : Pr(smoke), predict()


at : restaurn = 0

Delta-method
Margin Std. Err. z P>|z| [95% Conf. Interval]

_cons .408417 .0194578 20.99 0.000 .3702803 .4465536

. margins, at(restaurn=1)

Predictive margins Number of obs = 807


Model VCE : OIM

Expression : Pr(smoke), predict()


at : restaurn = 1

Delta-method
Margin Std. Err. z P>|z| [95% Conf. Interval]

_cons .3095214 .0325761 9.50 0.000 .2456734 .3733694

Podemos observar que la probabilidad de fumar si la persona puede fumar en lugares públicos es del
40,84%, mientras que cuando hay una legislación que lo prohíbe la probabilidad disminuye al
30,95%, es decir, en 9.89 puntos porcentuales. Igualmente, anteriormente al definir los efectos
marginales de las variables sobre la probabilidad de fumar habíamos determinado que la variable de
restricción sobre el poder fumar en lugares públicos era significativa y disminuía la probabilidad de
fumar.

5) ¿Cuál es la capacidad de correcta clasificación de este modelo? ¿Cuál es su nivel de sensibilidad y de


especificidad? Explique en qué consisten ambos términos. (2 pts)

. estat class

Logistic model for smoke

True
Classified D ~D Total

+ 74 65 139
- 236 432 668

Total 310 497 807

Classified + if predicted Pr(D) >= .5


True D defined as smoke != 0

Sensitivity Pr( +| D) 23.87%


Specificity Pr( -|~D) 86.92%
Positive predictive value Pr( D| +) 53.24%
Negative predictive value Pr(~D| -) 64.67%

False + rate for true ~D Pr( +|~D) 13.08%


False - rate for true D Pr( -| D) 76.13%
False + rate for classified + Pr(~D| +) 46.76%
False - rate for classified - Pr( D| -) 35.33%

Correctly classified 62.70%

El modelo cuenta con una correcta clasificación del 62,70%. El nivel de sensibilidad es del
23.87% y de especificidad es del 86,92%, es decir, la probabilidad de que el modelo clasifique a
un verdadero fumador como fumador es del 23,87%, por el contrario, la probabilidad de que
clasifique a un verdadero no fumador como no fumador es del 86,92%.

También podría gustarte