Modelos de regresión de respuesta cualitativa Si deseamos estudiar la La investigación en economía del trabajo indica que la PFL es participación en la fuerza laboral una función de la tasa de (PFL) de los hombres adultos. desempleo, tasa del salario Como un adulto está en la fuerza promedio, escolaridad, ingreso laboral o no lo está, la PFL es una familiar, etcétera. Son modelos de regresión en los cuales la decisión de sí o no. (1 o 0) variable dependiente o de respuesta puede Elecciones Regionales Algunas variables en la elección del voto son 2da vuelta. Candidato la tasa del crecimiento del PIB, las tasas de ser en sí misma de naturaleza cualitativa. desempleo e inflación, si el candidato se va a partido 1 o candidato reelegir, etc La variable de respuesta, sólo puede adquirir partido 2 (1 o 0) dos valores; 1 o 0. Una familia posee o no posee casa, tiene seguro contra invalidez o no lo tiene, ambos cónyuges están en la fuerza laboral o sólo uno de ellos lo está, En forma similar, un En los modelos en donde Y es cualitativa, el determinado fármaco es eficaz para curar una enfermedad objetivo es encontrar la probabilidad de que o no lo es. Una empresa decide declarar el rendimiento de un acontecimiento suceda. sus acciones u ocultarlo, un senador decide votar en favor Los modelos de regresión con respuestas de un impuesto o en cualitativas a menudo se conocen como contra, el presidente decide vetar una ley o aprobarla. modelos de probabilidad. Hay cuatro métodos 1. El modelo lineal de probabilidad para crear un (MLP) modelo de 2. El modelo logit probabilidad para una variable de 3. El modelo probit respuesta binaria: 4. El modelo tobit odelo lineal de probabilidad (MLP) Yi = β1 + β2Xi + ui Puede interpretarse como la probabilidad condicional de que el suceso tenga lugar dado Xi; es decir, Pr (Yi 1| Xi). X = Ingreso familiar E(Yi | Xi) da la probabilidad de que una familia tenga casa Y = 1 si la familia tiene casa propia y perciba ingresos por una cierta cantidad Xi. propia 0 si la familia no tiene casa propia.
Si Pi = probabilidad de que Yi 1 (es decir, de que el La variable Yi tiene la
suceso ocurra) y siguiente (1 − Pi) = probabilidad de que Yi 0 (es decir, de que el distribución (de suceso no ocurra) Es decir, Yi sigue la distribución de probabilidades de Bernoulli probabilidad):
Por consiguiente, por la definición de esperanza
matemática, obtenemos No normalidad de las perturbaciones ui El supuesto de normalidad para ui ya no se mantiene en los MLP porque, al igual que Yi, ui sólo toma dos valores
Varianzas heteroscedásticas de las perturbaciones
ya no es posible sostener la afirmación de que las perturbaciones en el MLP son Homoscedásticas. MLP plantea No cumplimiento de 0 ≤ E(Yi |Xi) ≤ 1 diversos en los MLP mide la probabilidad condicional de que ocurra el suceso Y dado X, ésta problemas debe encontrarse necesariamente entre 0 y 1. No hay garantía de que Yi, los estimadores de E(Yi | Xi), cumplan necesariamente esta restricción, y éste es el verdadero problema con la estimación del MLP por MC
Valor cuestionable de R2 como medida de la bondad del ajuste
R2 calculada de manera convencional tiene un valor limitado en los modelos de respuesta dicótoma. El problema fundamental con el MLP es que lógicamente no es un modelo muy atractivo porque supone que Pi E(Y=1/X ) aumenta linealmente con X, lo cual no sucede jamás en la realidad. Se esperaría que Pi estuviera relacionado en forma no lineal con Xi.
Por consiguiente, lo que necesitamos es un modelo
(probabilístico) de estas características: 1. A medida que aumente Xi, Pi también aumente pero nunca se salga del intervalo 0-1. 2. La relación entre Pi y Xi sea no lineal, es decir, “uno se acerca a cero con tasas cada vez más lentas a medida que se reduce Xi, y se acerca a uno con tasas cada vez más lentas a medida que Xi se hace muy grande”.
Las función de distribución acumulativa (FDA) que suele
seleccionarse para representar los modelos de respuesta 0-1 son: 1. La logística, que da lugar al MODELO LOGIT 2. La normal; que da lugar al MODELO PROBIT El modelo Logit nción de distribución logística (acumulativa). El modelo Logit, permite plantear lo siguiente: A medida que Zi se encuentra dentro de un rango de −∞ a +∞, Pi se encuentra dentro de un rango de 0 a 1, y que Pi no está linealmente relacionado con Zi (es decir, con Xi).
Al satisfacer estos requisitos creamos un problema de
estimación, porque Pi es no lineal no sólo en X sino también en las β. Esto significa que no podemos estimar los parámetros con el procedimiento habitual de MCO. Por lo que este, se puede linealizarse de la siguiente Li se llama LOGIT, y es el logaritmo de la razón de las manera. probabilidades, que no es sólo lineal en X, sino también es lineal en los parámetros. 1. A medida que P va de 0 a 1 (es decir, a medida que Z varía de −∞ a +∞, el logit L va de a +∞. Es decir, aunque las probabilidades (por necesidad) se encuentran entre 0 y 1, los logit no están acotados en esa forma. 2. Aunque L es lineal en X, las probabilidades en sí mismas no lo son. 3. Se puede incluir tantas regresoras como indique la teoría subyacente. 4. Si L, el logit, es positivo, significa que cuando se incrementa el valor de la(s) Características del regresora(s), modelo LOGIT aumentan las posibilidades de que la regresada sea igual a 1. Si L es negativo, las posibilidades de que la regresada iguale a 1 disminuyen conforme se incrementa el valor de X. El logit se convierte en negativo y se incrementa en gran medida conforme la razón de las probabilidades disminuye de 1 a 0; además, se incrementa en gran medida y se vuelve positivo conforme la razón de las probabilidades aumenta de 1 a infinito. 6. Mientras que el MLP supone que Pi está linealmente relacionado con Xi, el modelo logit supone que el logaritmo de la razón de probabilidades está relacionado linealmente con Xi.