Está en la página 1de 9

Modelos de regresión de

respuesta cualitativa

Ing. RUBEN FLORES GOMEZ


Modelos de regresión de respuesta cualitativa
Si deseamos estudiar la La investigación en economía
del trabajo indica que la PFL es
participación en la fuerza laboral
una función de la tasa de
(PFL) de los hombres adultos. desempleo, tasa del salario
Como un adulto está en la fuerza promedio, escolaridad, ingreso
laboral o no lo está, la PFL es una familiar, etcétera.
Son modelos de regresión en los cuales la decisión de sí o no. (1 o 0)
variable dependiente o de respuesta puede Elecciones Regionales Algunas variables en la elección del voto son
2da vuelta. Candidato la tasa del crecimiento del PIB, las tasas de
ser en sí misma de naturaleza cualitativa. desempleo e inflación, si el candidato se va a
partido 1 o candidato reelegir, etc
La variable de respuesta, sólo puede adquirir partido 2 (1 o 0)
dos valores; 1 o 0. Una familia posee o no posee casa, tiene seguro contra
invalidez o no lo tiene, ambos cónyuges están en la fuerza
laboral o sólo uno de ellos lo está, En forma similar, un
En los modelos en donde Y es cualitativa, el determinado fármaco es eficaz para curar una enfermedad
objetivo es encontrar la probabilidad de que o no lo es. Una empresa decide declarar el rendimiento de
un acontecimiento suceda. sus acciones u ocultarlo, un senador decide votar en favor
Los modelos de regresión con respuestas de un impuesto o en
cualitativas a menudo se conocen como contra, el presidente decide vetar una ley o aprobarla.
modelos de probabilidad.
Hay cuatro métodos 1. El modelo lineal de probabilidad
para crear un (MLP)
modelo de
2. El modelo logit
probabilidad para
una variable de 3. El modelo probit
respuesta binaria: 4. El modelo tobit
odelo lineal de probabilidad (MLP)
Yi = β1 + β2Xi + ui Puede interpretarse como la probabilidad condicional de
que el suceso tenga lugar dado Xi; es decir, Pr (Yi 1| Xi).
X = Ingreso familiar E(Yi | Xi) da la probabilidad de que una familia tenga casa
Y = 1 si la familia tiene casa propia y perciba ingresos por una cierta cantidad Xi.
propia
0 si la familia no tiene casa
propia.

Si Pi = probabilidad de que Yi 1 (es decir, de que el La variable Yi tiene la


suceso ocurra) y siguiente
(1 − Pi) = probabilidad de que Yi 0 (es decir, de que el distribución (de
suceso no ocurra)
Es decir, Yi sigue la distribución de probabilidades de Bernoulli
probabilidad):

Por consiguiente, por la definición de esperanza


matemática, obtenemos
No normalidad de las perturbaciones ui
El supuesto de normalidad para ui ya no se mantiene en
los MLP porque, al igual que Yi, ui sólo toma dos valores

Varianzas heteroscedásticas de las perturbaciones


ya no es posible sostener la afirmación de que las perturbaciones en el MLP son
Homoscedásticas.
MLP plantea
No cumplimiento de 0 ≤ E(Yi |Xi) ≤ 1
diversos en los MLP mide la probabilidad condicional de que ocurra el suceso Y dado X, ésta
problemas debe encontrarse necesariamente entre 0 y 1.
No hay garantía de que Yi, los estimadores de E(Yi | Xi), cumplan necesariamente
esta restricción, y éste es el verdadero problema con la estimación del MLP por MC

Valor cuestionable de R2 como medida de la bondad del ajuste


R2 calculada de manera convencional tiene un valor limitado en los
modelos de respuesta dicótoma.
El problema fundamental con el MLP es que lógicamente no es un modelo muy atractivo porque
supone que Pi E(Y=1/X ) aumenta linealmente con X, lo cual no sucede jamás en la realidad.
Se esperaría que Pi estuviera relacionado en forma no lineal con Xi.

Por consiguiente, lo que necesitamos es un modelo


(probabilístico) de estas características:
1. A medida que aumente Xi, Pi también aumente pero
nunca se salga del intervalo 0-1.
2. La relación entre Pi y Xi sea no lineal, es decir, “uno se
acerca a cero con tasas cada vez más lentas a medida
que se reduce Xi, y se acerca a uno con tasas cada vez
más lentas a medida que Xi se hace muy grande”.

Las función de distribución acumulativa (FDA) que suele


seleccionarse para representar los modelos de respuesta
0-1 son:
1. La logística, que da lugar al MODELO LOGIT
2. La normal; que da lugar al MODELO PROBIT
El modelo Logit
nción de distribución logística (acumulativa).
El modelo Logit, permite plantear lo siguiente:
A medida que Zi se encuentra dentro de un rango de
−∞ a +∞, Pi se encuentra dentro de un rango de 0 a 1,
y que Pi no está linealmente relacionado con Zi (es
decir, con Xi).

Al satisfacer estos requisitos creamos un problema de


estimación, porque Pi es no lineal no sólo en X sino
también en las β. Esto significa que no podemos estimar
los parámetros con el procedimiento habitual de MCO.
Por lo que este, se puede linealizarse de la siguiente
Li se llama LOGIT, y es el logaritmo de la razón de las
manera.
probabilidades, que no es sólo lineal en X, sino también
es lineal en los parámetros.
1. A medida que P va de 0 a 1 (es decir, a medida que Z varía de −∞ a +∞, el logit L
va de a +∞. Es decir, aunque las probabilidades (por necesidad) se encuentran
entre 0 y 1, los logit no están acotados en esa forma.
2. Aunque L es lineal en X, las probabilidades en sí mismas no lo son.
3. Se puede incluir tantas regresoras como indique la teoría subyacente.
4. Si L, el logit, es positivo, significa que cuando se incrementa el valor de la(s)
Características del
regresora(s),
modelo LOGIT
aumentan las posibilidades de que la regresada sea igual a 1. Si L es negativo, las
posibilidades de que la regresada iguale a 1 disminuyen conforme se incrementa el
valor de X. El logit se convierte en negativo y se incrementa en gran medida
conforme la razón de las probabilidades disminuye de 1 a 0; además,
se incrementa en gran medida y se vuelve positivo conforme la razón de las
probabilidades aumenta
de 1 a infinito.
6. Mientras que el MLP supone que Pi está linealmente relacionado con Xi, el modelo
logit
supone que el logaritmo de la razón de probabilidades está relacionado linealmente
con Xi.

También podría gustarte