Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
ÍNDICE
1. Variables dependientes binarias y modelo de probabilidad lineal
2. Modelos probit y logit
3. Inferencia en los modelos probit y logit
2
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I
Supongamos que queremos analizar la presencia de discriminación en el mercado
hipotecario
Los prestamos se otorgan y se deniegan en muchos casos por razones legítimas, pero
queremos analizar si conseguir un préstamo es más complicado para las minorías étnicas,
manteniendo constantes el resto de factores relevantes
Es habitual usar variables binarias como regresores y esto no causa dificultades especiales
Uno de los factores claves: cociente entre los pagos mensuales del préstamo y los
ingresos mensuales del solicitante (ratioP/I)
Diagrama de dispersión de la variable
denegar versus ratioP/I: solo 127 de las
2.380 observaciones
Por esta razón, el modelo de regresión múltiple aplicado a una variable dependiente
binaria se denomina modelo de probabilidad lineal
7
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – VARIABLES
DEPENDIENTES BINARIAS Y MODELO DE PROBABILIDAD LINEAL
2
Como veremos, el 𝑅 no es un estadístico particularmente útil en este modelo
9
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – VARIABLES
DEPENDIENTES BINARIAS Y MODELO DE PROBABILIDAD LINEAL
Subconjunto de una base de datos recopilada por investigadores del Banco de la Reserva
Federal de Boston, bajo el amparo de la Ley de Divulgación de Hipotecas (HMDA)
Modelo estimado
11
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – VARIABLES
DEPENDIENTES BINARIAS Y MODELO DE PROBABILIDAD LINEAL
¿Existe discriminación racial? Quizás, pero todavía hay factores que se deberían
tener en cuenta: ingresos potenciales del individuo, historial crediticio,…
La linealidad hace que el modelo sea muy fácil de usar, pero es su principal defecto
Las probabilidades deben estar entre 0 y 1, así que 𝑃𝑟(𝑌 = 1|𝑋1 , … , 𝑋𝑘 ) no puede ser
lineal
Modelo
𝑃𝑟(𝑌 = 1|X)=Φ(𝛽0 + 𝛽1 𝑋)
Interpretación:
𝑋 = 0,2 ⇒ 𝑃𝑟 𝑌 =1 𝑋 = 0,021
𝑋 = 0,3 ⇒ 𝑃𝑟 𝑌 =1 𝑋 = 0,161
𝑋 = 0,4 ⇒ 𝑃𝑟 𝑌 =1 𝑋 = 0,519
𝑋 = 0,6 ⇒ 𝑃𝑟 𝑌 =1 𝑋 = 0,983
16
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – MODELOS PROBIT Y
LOGIT
Regresión probit con regresores múltiples
Modelo sujeto a posible sesgo de variable omitida, por lo que se suelen incluir
regresores adicionales
18
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – MODELOS PROBIT Y
LOGIT
Aplicación a los datos HMDA
Usando las 2.380 observaciones
Efecto de la etnia
Regresión logit
Similar a la regresión probit, pero sustituyendo Φ por la función de
distribución acumulada logística estándar
22
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – MODELOS PROBIT Y
LOGIT
Misma interpretación
Motivación histórica de
este modelo: función de
distribución logística más
fácil de calcular que Φ
23
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – MODELOS PROBIT Y
LOGIT
Modelo de probabilidad lineal más fácil de usar e interpretar, pero no capta la naturaleza
no lineal de la verdadera función de regresión poblacional
Los modelos probit y logit captan la no linealidad y suelen ofrecer resultados similares
Para conjuntos de datos con pocos valores extremos de los regresores, el modelo de
probabilidad lineal puede proporcionar una aproximación adecuada
Por ejemplo, para este modelo, la probabilidad de denegación estimada es 17,7% mayor
para un solicitante de raza negra (manteniendo constante 𝑟𝑎𝑡𝑖𝑜𝑃/𝐼): cualitativamente
similar a los resultados del probit o logit
25
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – INFERENCIA EN LOS
MODELOS PROBIT Y LOGIT
Por el contrario, las funciones de regresión de los modelos probit y logit son no
lineales en los parámetros ⇒ modelos no estimables por MCO
26
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – INFERENCIA EN LOS
MODELOS PROBIT Y LOGIT
Estimación por mínimos cuadrados no lineales
Método general de estimación utilizado cuando los parámetros entran en la función de
regresión de forma no lineal
Sabemos que
Propiedades
Consistente
Normalmente distribuido en muestras grandes
Existen estimadores más eficientes, por lo que rara vez utilizado en la
práctica
Fácilmente extendible al modelo logit
28
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – INFERENCIA EN LOS
MODELOS PROBIT Y LOGIT
Estimación máximo verosímil
Los EMV son los valores de los coeficientes que “más probablemente” hayan
generado los datos 29
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – INFERENCIA EN LOS
MODELOS PROBIT Y LOGIT
Asumiendo que las variables son i.i.d., la función de probabilidad conjunta de
𝑌1 , 𝑌2 , … , 𝑌𝑘 dados los regresores es
𝑙𝑜𝑔𝐿 𝑏0 , 𝑏1 , … , 𝑏𝑘
𝑛
= 𝑌𝑖 𝑙𝑜𝑔 Φ(𝑏0 + 𝑏1 𝑋1𝑖 + ⋯ + 𝑏𝑘 𝑋𝑘𝑖 )
𝑖=1
𝑛
+ (1 − 𝑌𝑖 )𝑙𝑜𝑔 1 − Φ(𝑏0 + 𝑏1 𝑋1𝑖 + ⋯ + 𝑏𝑘 𝑋𝑘𝑖 )
𝑖=1
Propiedades
Consistente
Normalmente distribuido en muestras grandes
Eficiente (mínima varianza)
Está implementado en el software econométrico habitual, así que es muy
fácil de utilizar en la práctica
32
SESIÓN VIII - MODELOS DE VARIABLE DEPENDIENTE LIMITADA I – INFERENCIA EN LOS
MODELOS PROBIT Y LOGIT
Medidas de ajuste
Como mencionamos anteriormente, el 𝑅 2 es una medida de ajuste deficiente en el
marco de variable dependiente binaria