Está en la página 1de 7

Econometría II

Solucionario Taller 8

Punto 0. ¿Es lo mismo un aumento de 1pp a un 1%? Por lo tanto, si la probabilidad de que
ocurra un evento X1 es del 0.7 (70%) y la probabilidad de que ocurra X2 es de 0.8 (80%),
¿esto equivale a un aumento en cuántos puntos porcentuales? ¿y cuánto en %?

No es lo mismo 1pp a 1%, ya que 1pp se hace sobre el cambio absoluto entre
probabilidades mientras que 1% es en términos relativos. Miremos en el ejemplo, que el
cambio de 0.7 a 0.8 es de 0.1 que es equivalente a 10 puntos porcentaules (0.1*100=10pp).
0.8−0.7 0.1
En términos relativos (o porcentuales) el cambio sería de = = 0.1429 →
0.7 0.7
14.29%, por lo tanto, 1pp y 1% son dos cosas diferentes.

1. Sea el siguiente modelo de regresión lineal múltiple:


𝑦𝑖 = 𝑥𝑖′ β + ui
Pero en donde 𝑦𝑖 es una variable binaria en donde toma 2 valores (0 y 1). El vector 𝑥𝑖′
contiene variables independientes o regresoras, que pueden ser binarias,
categóricas/discretas, o continuas. Si se estima por MCO ¿qué nombre le damos a este
modelo? ¿Cuáles son las consecuencias/problemas de estimar dicho modelo por MCO?
¿Cómo podría corregirse cada uno de estos problemas?

Este modelo recibe el nombre de Modelo de Probabilidad Lineal o MPL.


Si se estima por MCO se pueden dar los siguientes problemas:
a. Probabilidades no objetivas (𝑦̂𝑖 mayores que 1 y menores que 0).
b. Efectos marginales serían constantes para todo valor de 𝑥𝑘𝑖
c. Heterocedasticidad
d. No normalidad de los errores

Cada uno de esos problemas se puede corregir haciendo uso de:


a. Efectuar una regresión usando funciones cuyos valores se trunquen en 0 y 1
(Logit, Probit o Tobit).
b. Idem
c. Estimar el MPL por medio de errores estándar por HAC
d. Reconocer que los errores tienen distribución Bernoulli y estimar por Máxima
Verosimilitud o Mínimos Cuadrados No Lineales

2. La siguiente es una distribución logística el cual es una función sigmoidea:

𝑒𝑧
𝑓(𝑧) =
1 + 𝑒𝑧
El cual también puede representarse como:
1
𝑓(𝑧) =
1 + 𝑒 −𝑧
En un modelo Logit 𝑓(𝑧) se puede representar como la probabilidad condicional de que 𝑦𝑖
sea igual a 1, y z es la recta de regresión lineal poblacional, es decir:
𝑧 = 𝑥𝑖′ 𝛽
1
Pr(𝑦𝑖 = 1|𝑋) = ′
1 + 𝑒 −𝑥𝑖 𝛽
a. Demuestre que la probabilidad de que 𝑦𝑖 = 0 es

𝑒 −𝑥𝑖 𝛽 1
Pr(𝑦1 = 0|𝑋) = =
−𝑥𝑖′ 𝛽 ′
1+𝑒 1 + 𝑒 𝑥𝑖 𝛽
Como Pr(𝑦𝑖 = 1 |𝑋) + Pr(𝑦𝑖 = 0|𝑋) = 1 → Pr(𝑦𝑖 = 0|𝑋) = 1 − Pr(𝑦𝑖 = 1 |𝑋)
1
Pr(𝑦𝑖 = 0 |𝑋) = 1 − ′
1 + 𝑒 −𝑥𝑖 𝛽

1 + 𝑒 −𝑥𝑖 𝛽 − 1
Pr(𝑦𝑖 = 0 |𝑋) = ′
1 + 𝑒 −𝑥𝑖 𝛽

𝑒 −𝑥𝑖 𝛽
Pr(𝑦𝑖 = 0 |𝑋) = ′
1 + 𝑒 −𝑥𝑖 𝛽
1
Pr(𝑦𝑖 = 0 |𝑋) = ′
1 + 𝑒 𝑥𝑖 𝛽

b. El efecto marginal de una variable continua 𝑥𝑖𝑘 sobre la probabilidad de que 𝑦𝑖 = 1


𝜕 Pr(𝑦𝑖 = 1|𝑋 )
se define como . Demuestre que en este modelo Logit, dicho impacto
𝜕𝑥𝑖𝑘
o efecto marginal es igual a:
𝜕 Pr(𝑦𝑖 = 1|𝑋)
= Pr(𝑦1 = 1|𝑋) Pr(𝑦1 = 0|𝑋) 𝛽𝑘
𝜕𝑥𝑖𝑘
Teniendo:
1
Pr(𝑦𝑖 = 1|𝑋) = ′
1 + 𝑒 −𝑥𝑖 𝛽


𝜕 Pr(𝑦𝑖 = 1|𝑋) 𝑒 −𝑥𝑖 𝛽
=− 2
(−𝛽𝑘 )
𝜕𝑥𝑖𝑘 ′
(1 + 𝑒 −𝑥𝑖 𝛽 )

𝜕 Pr(𝑦𝑖 = 1|𝑋) 𝑒 −𝑥𝑖 𝛽
= 2
(𝛽𝑘 )
𝜕𝑥𝑖𝑘 (1 + 𝑒 −𝑥𝑖′ 𝛽
)

𝜕 Pr(𝑦𝑖 = 1|𝑋) 1 𝑒 −𝑥𝑖 𝛽
= ′ 2
(𝛽𝑘 )
𝜕𝑥𝑖𝑘 1 + 𝑒 −𝑥𝑖 𝛽 1 + 𝑒 −𝑥𝑖′ 𝛽
𝜕 Pr(𝑦𝑖 = 1|𝑋)
= Pr(𝑦1 = 1|𝑋) Pr(𝑦1 = 0|𝑋) (𝛽𝑘 )
𝜕𝑥𝑖𝑘

c. La definición del Odds-ratio es el ratio de probabilidad de éxito (y=1) en relación


con la probabilidad de fracaso (y=0), es decir:
Pr(𝑦1 = 1|𝑋)
Pr(𝑦1 = 0|𝑋)

Este ratio de probabilidad usando el modelo Logit sería igual a:

1
Pr(𝑦1 = 1|𝑋) 1 + 𝑒 −𝑥𝑖′ 𝛽
= ′
Pr(𝑦1 = 0|𝑋) 𝑒 −𝑥𝑖 𝛽

1 + 𝑒 −𝑥𝑖 𝛽

Pr(𝑦1 = 1|𝑋) 1
=
Pr(𝑦1 = 0|𝑋) 𝑒 −𝑥𝑖′ 𝛽

Pr(𝑦1 = 1|𝑋) ′
= 𝑒 𝑥𝑖 𝛽
Pr(𝑦1 = 0|𝑋)
Incluso, si sacamos el logaritmo natural a ambos lados:

Pr(𝑦1 = 1|𝑋)
ln ( ) = 𝑥𝑖′ 𝛽
Pr(𝑦1 = 0|𝑋)
Este ratio de probabilidad implica que, dadas las variables de un individuo, cuánto
más tiene de probabilidad de tener un y=1 en relación con un y=0. Por ejemplo, si
este ratio es igual a 1.25 indica que hay un 25% más de probabilidad que el
individuo, con esas características, obtenga un y=1 en relación con tener un y=0. Si
es 0.85 quiere decir que este individuo con sus características tiene un 15% menos
de probabilidad de que y=1 a tener un y=0.

3. Para un modelo Probit se toma la siguiente distribución normal estándar acumulada


Φ(𝑥𝑖′ 𝛽), en donde la probabilidad de que 𝑦𝑖 = 1 es:
Pr(𝑦𝑖 = 1|𝑋) = Φ(𝑥𝑖′ 𝛽)
Tal que:
𝑥𝑖′ 𝛽
Φ(𝑥𝑖′ 𝛽) =∫ 𝜙(𝑧)𝑑𝑧
−∞

Siendo 𝜙(𝑧) la función de distribución normal estándar.

a. El impacto o efecto marginal de una variable continua 𝑥𝑖𝑘 sería:


𝜕 Pr(𝑦𝑖 = 1|𝑋)
= 𝜙(𝑥𝑖′ 𝛽)𝛽𝑘
𝜕𝑥𝑖𝑘
𝜕Φ(𝑧)
Ya que = 𝜙(𝑧)
𝜕𝑧

b. Suponga que una variable 𝑥𝑘 es binaria. ¿Cómo se calcula el efecto marginal de la


probabilidad de ocurrencia 𝑦𝑖 = 1 pasando de 𝑥𝑘 = 0 a 𝑥𝑘 = 1?

En este caso se calcula Pr(𝑦𝑖 = 1|𝑋, 𝑥𝑘 = 1) y Pr(𝑦𝑖 = 1|𝑋, 𝑥𝑘 = 0). El efecto marginal es
la diferencia entre estas dos probabilidades.

4. El R2 de Macfadden, o pseudo-R2, es una medida asociada a la bondad de ajuste en


estos modelos de elección binaria. La fórmula es:
ℒ𝑀𝑜𝑑𝑒𝑙
̂
𝑅2𝑝𝑠𝑒𝑢𝑑𝑜 = 1 −
ℒ0
En donde ℒ𝑀𝑜𝑑𝑒𝑙
̂ es el logaritmo de la verosimilitud del modelo estimado, y ℒ0 es el
logaritmo de la verosimilitud de un modelo restringido asumiendo que solo se hace con un
intercepto. Este toma valores entre 0 y 1. Mientras más cercano a 1 mejor, lo cual
implicaría que ℒ𝑀𝑜𝑑𝑒𝑙
̂ < ℒ0 . Si se tiene que son iguales ℒ𝑀𝑜𝑑𝑒𝑙
̂ = ℒ0 , entonces el
pseudoR2 daría 0 y el modelo estimado realmente no tiene una buena predictibilidad.
La matriz de confusión en cambio nos permite diferenciar los valores correctamente
predichos de los falsos negativos y falsos positivos. Con estos se pueden hacer indicadores
tales como el “hit-rate”, especificidad y sensitividad (quedó de tarea).

5. Suponga que lo contratan en la Secretaría de la Mujer de una ciudad en el que te


piden mirar los determinantes de violencia intrafamiliar hacia las mujeres de
acuerdo con el siguiente modelo econométrico

Donde 𝑦𝑖 es 1 si la mujer ha sido víctima de violencia intrafamiliar y 0 si lo contrario;


𝑒𝑑𝑎𝑑𝑖 es la edad (en años), 𝑎𝑐𝑎𝑠𝑎𝑑𝑜𝑠𝑖 son los años de casada, ℎ𝑖𝑗𝑜𝑠𝑖 el número de hijos,
𝑒𝑑𝑢𝑐𝑖 son los años de educación, 𝐼𝑛𝑑𝑒𝑝𝐸𝑐𝑜𝑛𝑜𝑚𝑖 es una variable discreta y categórica que
toma valores desde 1 (nada de independencia) a 5 (mucha independencia) y 𝑅𝑒𝑙𝑖𝑔𝑖 es otra
variable discreta que toma valores de 1 (nada religiosa) a 5 (muy religiosa) de la mujer ‘i’.
Se estiman tres modelos: MPL, Logit y Probit. Los resultados se muestran en el siguiente
Cuadro 1:
a. ¿Qué impresiones te genera dichos resultados? ¿Importa el número de hijos o los
años de educación de una mujer para evitar que sea víctima de violencia
intrafamiliar? A diferencia de lo que se espera, según los resultados anteriores
¿quién es más probable de sufrir violencia intrafamiliar, una mujer poco religiosa o
una mujer muy religiosa? ¿Qué puede estar sucediendo? ¿Qué podríamos
recomendarle a la Secretaría de la Mujer para evitar la violencia intrafamiliar?

Las impresiones acá pueden considerarse de forma subjetiva por lo que no habría una
respuesta correcta.
Sin embargo, es importante reconocer que, en las regresiones de los 3 modelos, el número
de hijos no es una variable significativa para poder explicar si una mujer es víctima de
violencia intrafamiliar, por lo que no importa si no hay hijos o si hay muchos. Según los
tres modelos, las mujeres más religiosas parecen ser menos propensas a recibir maltrato.
Esto puede deberse a 2 razones diferentes, el cuál no se pueden validar por el momento. La
primera posición se refiere a que podríamos estar hablando que realmente considerarse
religioso y/o espiritual permite ser hombres/mujeres con más valores que los que no lo son
y por lo tanto reconocen los límites y así se puede mitigar o evitar el maltrato. Sin embargo,
la otra posición puede coincidir en que las mujeres que son más religiosas quizá tengan una
aversión mucho mayor a denunciar a su pareja y, por lo tanto, pueden mentir en las
encuestas. Habría que recomendarle a la secretaría de la mujer una campaña que le permita
hacer que las mujeres sean más independientes económicamente de sus parejas, pues es una
de las variables que más se puede ejercer algún tipo de control o que pueda ser impactada
por medio de políticas públicas.

b. Suponga dos mujeres hipotéticas: La mujer A tiene 25 años, tiene 2 años de casada,
sin hijos, hizo hasta 2do semestre de Economía (13 años de educación), considera
que es muy religiosa (religiosidad=5) y depende mucho de su esposo
(IndepEcon=1). La mujer B, en cambio, es una mujer que es casi igual a la A, la
única diferencia, es que B es totalmente independiente en términos económicos de
su pareja (IndepEcon=5). Para cada una de los 3 modelos, mencione en promedio, y
ceteris paribus, cuántos puntos porcentuales hay de diferencia entre las mujeres A y
B.

MPL:
Mujer A:
𝑦
̂𝐴 = 1.228 − 0.01(25) + 0.021(2) − 0.003(0) − 0.002(13) − 0.145(1) − 0.067(5)
𝑦
̂𝐴 = 0.514 → 𝑦
̂𝐴 = 51.4%
Mujer B:
𝑦
̂𝐵 = 1.228 − 0.01(25) + 0.021(2) − 0.003(0) − 0.002(13) − 0.145(5) − 0.067(5)
𝑦
̂𝐵 = −0.066 → 𝑦̂𝐵 = −6.6%
Habría una diferencia de 58 puntos porcentuales de diferencia entre estas dos mujeres.

Logit:
Mujer A:
𝑧𝐴 = 3.835 − 0.058(25) + 0.111(2) − 0.01(0) − 0.012(13) − 0.709(1) − 0.372(5)
𝑍𝐴 = −0.118
1
Pr(𝑦𝐴 = 1|𝑋𝐴 ) = → Pr(𝑦𝐴 = 1|𝑋𝐴 ) = 0.4705 = 47.05%
1 + 𝑒 −𝑧

Mujer B:
𝑧𝐵 = 3.835 − 0.058(25) + 0.111(2) − 0.01(0) − 0.012(13) − 0.709(5) − 0.372(5)
𝑍𝐵 = −2.954
1
Pr(𝑦𝐵 = 1|𝑋𝐵 ) = → Pr(𝑦𝐵 = 1|𝑋𝐵 ) = 0.0495 = 4.95%
1 + 𝑒 −𝑧
Por lo que habría una diferencia de 42.1puntos porcentuales.

Probit:
Mujer A:
𝑧𝐴 = 2.271 − 0.034(25) + 0.066(2) − 0.008(0) − 0.008(13) − 0.425(1) − 0.221(5)
𝑧𝐴 = −0.081
Pr(𝑦𝐴 = 1|𝑋𝐴 ) = Φ(−0.081) → Pr(𝑦𝐴 = 1|𝑋𝐴 ) = 0.4631 = 46.31%
Mujer B:
𝑧𝐵 = 2.271 − 0.034(25) + 0.066(2) − 0.008(0) − 0.008(13) − 0.425(5) − 0.221(5)
𝑧𝐴 = −1.781
Pr(𝑦𝐴 = 1|𝑋𝐴 ) = Φ(−1.781) → Pr(𝑦𝐴 = 1|𝑋𝐴 ) = 0.0375 = 3.75%
Teniendo una diferencia de 42.56 puntos porcentuales.

También podría gustarte