Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Notas Clase 5 Probit Logit
Notas Clase 5 Probit Logit
Dependiente Binaria
-Logit y Probit-
0.6
0.4
0.2
0
X
• La relación es no lineal
• La variable dependiente está restringida
entre cero y uno
• Dos modelos producen una relación de
este tipo
• Un modelo basado en la función logística
• Un modelo derivado de una función de
distribución normal acumulada
Modelo Logit
• Expresando el modelo explícitamente en
términos de probabilidades tenemos
• Pi = Xi
• Donde Pi es la probabilidad de que el
hogar i sea propietario de una casa
• Una relación que genera un gráfico como
el anterior es:
1
Pi ( X i )
1 e
• Definimos la razón de probabilidades
(odds ratio) como:
Pi
1 Pi
En el caso de la propiedad de casas representa
la razón de la probabilidad de que una familia
posea una casa respecto de la probabilidad de
que no la posea.
Por ejemplo, si Pi = 0.8 significa que las
probabiliades son 4 a 1 a favor de que la familia
posea una casa (0.8/0.2)
• Si tomamos el logaritmo natural de la razón
de probabilidades obtenemos
Pi
Li ln Z i X i
1 Pi
• Entonces, el Li resulta lineal en X y también en los
parámetros
• L es llamado modelo Logit
• La interpretación del modelo es la
siguiente:
es la pendiente y mide el cambio en L
ocasionado por un cambio unitario en X,
es decir, dice cómo el logaritmo de las
porbabilidades a favor de tener una casa
cambian a mediada que el ingreso cambia
en una unidad.
es el valor de L si el ingreso es cero
• Dado un nivel de ingreso X* si se desea
estimar la probabilidad de tener una casa
(y no las probabilidades a favor de tener
una casa) se puede calcular a partir de la
definición de Pi una vez estimados los
parámetros.
• El método de estimación es por Máxima
Verosimilitud (MV)
El Modelo Probit
• La aproximación al problema es similar al
Logit pero se supone una relación no
lineal distinta (aunque muy similar) entre
Xi y P i
• Se basa en la distribución normal
acumulada
• Se supone que la decisión de poseer o no
una casa depenede de un índice I
(conocido como variable latente)
• El índice I está determinado por una o varias
variables explicativas. Por ej ingreso
• Cuanto mayor sea el índice mayor la
probabilidad de tener una casa
• Ii = Xi
• Se supone un umbral crítico I* a partir del cuál,
si I supera a I* entonces una familia posee una
casa.
• El umbral I*, al igual que I, no es observable
• Si se supone que está distribuido normalmente
con la misma media y varianza es posible
estimar los parámetros del índice y también
alguna información sobre el I*.
•
• Pi = P (Y=1|X) = P(I*i ≤ Ii)
= P(Zi ≤ Xi) = F(Xi)
Donde
Z es una variable estándar normal, Z ~
N(0,
F es la función de distribución normal
acumulada
• Explícitamente
1 Ii Z 2 / 2
F (Ii ) e dz
2
1 Xi Z 2 / 2
e dz
2
Pi = F(Ii)
1
p
Pi
0.8 Pr (I*i≤ Ii)
0.6
0.4
0.2
0
+∞ Ii = + Xi
0 -X ∞
Interpretación de los Coeficientes
• Una diferencia fundamental respecto a los
modelos lineales es que la influencia que
tienen las variables explicativas sobre la
probabilidad de elegir la opción dada por yi =
1 (la derivada parcial, dyi/dxi = βk en los
modelos lineales) no es independiente del
vector de características xi.
• Una primera aproximación a la relación
entre las variables explicativas y la
probabilidad resultante es calcular los
efectos marginales sobre la variable latente
(y*) .
• Si el efecto marginal expresa el
cambio de la variable dependiente
provocado por un cambio unitario en
una de las independientes
manteniendo el resto constante, los
parámetros estimados del Logit y el
Probit reflejan el efecto marginal de
las xik en yi de la misma forma que en
el MLP, puesto qe E (y*|x) = x´β.
• Los efectos marginales pueden construirse
sobre la probabilidad y, de hecho, este es el
tipo de presentación más frecuente.
• El efecto de la k−ésima variable explicativa,
manteniendo el resto constante, puede ser
calculado como:
• En Probit
• Los resultados previos suponen que si bien los
coeficientes de estos modelos no son directamente
interpretables, sus valores relativos si lo son.
• Por ej. el cociente βj/ βk mide la importancia relativa de
los efectos marginales de las variables xj y xk.
• Dado que los efectos marginales varian con x resulta
conveniente calcularlos para valores concretos de la
variable.
• Los “efectos marginales medios”, obtenidos a partir de la
media muestral de la variable, son una de las formas
más comunes de presentación de losresultados
• También se puede calcular, por ejemplo,
el efecto medio respecto al conjunto de las
• observaciones:
Inferencia
• La inferencia no presenta diferencias
sustanciales respecto al Modelo Lineal
Gaussiano, por lo que para llevar a cabo
hipótesis sobre el valor de un coeficiente puede
emplearse un estadístico de la t−Student
tradicional (aunque, siendo rigurosos, la
distribución apropiada sería la Normal).(ratio z)
• Por su parte, para contrastar la validez de un
conjunto de restricciones como las que definen
la significación global del modelo puede el test
de razón de verosimilitud (LR)
• LR
• Por ultimo, una forma de evaluación del modelo
es la que se deriva de la bondad del ajuste.
• Evidentemente, al tratarse de modelos no
lineales carece de sentido plantear la bondad
del ajuste en los t´erminos que definen el
coeficiente de determinación (R2).
• Existen criterios alternativos que, en cierto
modo, siguen la misma idea.
• Todas estas medidas deben interpretarse con
cierta cautela
• Su validez como criterios de selección del
modelo es ciertamente limitada.
• Una medida es el pseudo R2 de Mc Fadden: