Está en la página 1de 44

Modelos de regresión

Cualitativa

Econometría 2
Profa. Dra. Dannyra Mendoza
Cuello
Modelo Lineal de
Probabilidad (MLP)

Modelo probit

Modelo Logit
• ¿Cómo se clasifican las
variables según su
naturaleza?
Las variables cualitativas: representan características o
atributos que no pueden medirse numéricamente,
como género o tipo de ocupación.

Cuantitativas: Se pueden medir con números y tienen


un valor numérico, como edad o ingresos.

En la regresión lineal la naturaleza de la variable


respuesta que tipo era?
• RL.

• Cuantitativa:

• Ingreso
• Consumo
• Precio de la vivienda…
¿Qué pasa cuando mi variable dependiente es de
carácter cualitativo?
Supongamos que queremos estudiar la participación
en la fuerza laboral(PFL) de los hombres adultos.
La participación es un sí o no.
1= si está en la fuerza laboral
0= caso contrario (no está en la fuerza laboral).
• Y la PFL es una función de la tasa de desempleo, tasa
Modelos de del salario promedio, escolaridad, ingreso familiar,
regresion etc.
Elección presidencial
Cualitativa • Hay dos partidos políticos, el Demócrata y el
Republicano. La variable dependiente en este caso
es la elección de voto entre ambos partidos
políticos. Suponga que Y = 1 si el voto es para el
candidato demócrata y Y= 0 si el voto es
republicano.
En otras palabras, la regresada es una variable
dicótoma o binaria.
En general, en este tipo de regresión podemos tener
variable respuesta policótomas.
Diferencia del MRL Y MRC

• Modelo de regresión lineal


El obejtivo consiste en estimar su valor esperado dado los valores de la
regresoras .
E(/ , , ,…, ) donde las X son las regresoras, tanto cualitativas como
cuantitativas.
• Modelo de regresión Cualitativa.
El objetivo es encontrar la probabilidad de que un acontecimiento
suceda, como por ejemplo, quedar desempleada, tener una casa,
practicar algun deporte, etc.
Se conocen también como modelos de probabilidad
En otras palabras, la regresada es una variable
dicótoma o binaria.
Hay modelos para crear un modelo de
regresión con respuesta binaria:
El modelo lineal de probabilidad (MLP)(MPL)
El modelo Logit
El modelo Probit
El modelo Tobit
Modelos de regresion Cualitativa

- Modelo Probabilidad Lineal (MPL)

Econometría 2
Profa. Dra. Dannyra Mendoza Cuello
Modelo Lineal de Probabilidad
Distribución Bernoulli

• Sabemos qué si X es una variable aleatoria


Bernoulli, entonces
• X = 1, si ocurre el “éxito” con probabilidad
p.
• X = 0 si ocurre el “fracaso” con
probabilidad 1 − p.
• y que la función de masa de probabilidad
(FMP) es:
Modelo Lineal de Probabilidad

El modelo de probabilidad lineal es un modelo de elección


binaria, es decir, donde la variable dependiente puede tomar dos
valores. Estos valores son 1 o 0, para indicar éxito o fracaso,
respectivamente.
Consideremos:
Justificación

Igualando
Importante en el MPL

•La esperanza condicional del modelo en


realidad se interpreta como la
probabilidad condicional de

Lo ideal:
Problemas del Modelo Lineal de
Probabilidad
1. No cumplimiento de la normalidad de los errores
2. La heterocedasticidad de los errores
3. La posibilidad que se encuentre entre 0 y 1
4. Los valores generalmente bajos de los R^2
Algunas posibles soluciones
Incrementar tamaño de la muestra para el problema de
normalidad
Métodos de mínimos cuadrados ponderados
(heterocedasticidad)
Mínimos cuadrados restringidos (probabilidad estimada se
encuentre entre 0 y 1)
El problema principal es : suponer que E(Y=1/X) aumenta
linealmente con X. (efecto marginal o incremento de X
permanece constante)
No cumplimiento de la normalidad de los errores

El MCO no requiere una distribución de errores este normalmente


distribuidas (Jaque-bera)

No se mantiene en el MPL, al igual Y, U solo toma dos valores, siguen


una distribución de Bernoulli.
La heterocedasticidad de los errores
• Varianzas heterocedasticas de los errores.

• E, ) = 0 para i j No hay correlacion serial y


• En el caso del MPL no se puede afirmar que las perturbaciones son
homocedasticas.
• Para una Bernoulli la media y la varianza:

• Var(u) =)
• La varianza es una funcion de la media
•=E
• Var(u)= depende de x -> por tanto no homocedastica.
• MCO NO EFICIENTES MCO PONDERADOS
La posibilidad que 0 ≤ E(Yi |Xi) ≤ 1
No se encuentre entre 0 y 1

• No hay garantia que los valores de -> verdadero problema del MPL
• Si, algunos valores son menores que 0 (es decir, negativos), para esos
casos se supone que es cero
• Si son mayores que 1, se supone que = 1.

• diseñar una técnica de estimación que garantice que las probabilidades


condicionales estimadas se encuentren entre 0 y 1
Los valores generalmente bajos de los R^2
• R^2 calculada de manera convencional tiene un valor limitado en los
modelos de respuesta dicótoma.
• Dado un X, ^ Y es igual a 0 o 1.
• Todos los valores de Y se encontrarán en el eje X o en la línea
correspondiente a 1.

• Como resultado, es probable que el cálculo convencional de R^2 sea


muy inferior a 1 en estos modelos.
• O el valor de R^2 en ese tipo de modelos será elevado, 0.8 cuando
cuando la dispersión observada esté muy concentrada alrededor
• de los puntos A y B

• Debe evitarse el coeficiente de determinación como estadístico de


resumen en modelos con variable dependiente cualitativa.
Ejemplo de la base 15.1

• Cual será la hipotesis a probar:


• Y= 1 tiene casa propia
• Y=0 no tiene casa propia
• ingreso X (miles de dólares)
• 40 familias
• Aplicación de MCO
• En el ejemplo que vimos (propiedad de vivienda) esto significa que:
• En la medida que aumenta X, aumenta en una unidad , la
probabilidad de ser propietario de una casa aumenta en la misma
cantidad constante de 0.10.
• Esto es que independiente del nivel de ingreso sea de $8000,
$10.000, 18000 o $22.000. Esto no sucede en la realidad.
• Que podríamos esperas?
• Esperamos que no este relacionado linealmente con
• En otras palabras:
Familias con ingresos muy bajos – menos probabilidad de tener casa
propia
Pero con un ingreso alto X*- mas posibilidades de tener casa propia.
A partir de ese X* tendrá un efecto pequeño sobre la probabilidad de
tener casa propia.
Antes del modelo Logit y Probit era usado el MLP por sus simplicidad
Ejemplo : Datos sobre propiedad de vivienda y (1= tiene casa propia, 0= no tiene
casa propia.) e ingreso familiar X (miles de dólares) de 40 familias. Se estima el
modelo MLP. Gujarati, pagina 547 (15.1)
Ejemplo 2.
Resultados
Resultados
Resultados
Modelos de regresion Cualitativa
- Modelo Probit

Econometría 2
Profa. Dra. Dannyra Mendoza Cuello
Modelo probit

Modelo de elección binaria: 1 y 0.

Y puede representar:

1= si, pertenece al mercado de trabajo, 0= si no pertenece al


mercado de trabajo(caso contrario)

1= la ausencia o presencia de determinada condición,


0=presencia o ausencia de determinada condición.

Distribución acumulada normal estándar

Consideramos un vector de regresores que denotaremos por X,


que influyen en el resultado de Y.
Modelo Probit
• Supongamos que una variable de respuesta Y es binaria, que
denotaremos como 1 éxito y 0 fracaso. También tenemos un vector
de regresores X, que se supone que influyen en el resultado Y.
Específicamente, suponemos que el modelo toma la forma.

• donde Pr denota probabilidad y Φ es la función de distribución


acumulativa (FDA) de la distribución normal estándar. Los parámetros
β normalmente se estiman por máxima verosimilitud.
• Es posible entender el modelo Probit como un modelo de variable
latente. Supongamos que existe una variable aleatoria auxiliar.

donde ε ~ N(0, 1). Entonces Y puede verse como un indicador de si esta


variable latente es positiva:
• Para ver que los dos modelos son equivalentes, tenga en cuenta que
Interpretación de los parámetros

• Recordemos que :

• Tenemos entonces que:

• = = f()
¿Como interpretar los parámetros ?
Modelos de regresion Cualitativa
- Modelo logit

52487- Econometría 2
Profa. Dra. Dannyra Mendoza Cuello
Modelo Logit

Por facilidad:

Representa lo que se conoce como función de distribución logística

se encuentra dentro del rango de


se encuentra dentro del rango 0 y 1
no está linealmente relacionado con
Linealizar
• Si , es la probabilidad de tener casa propia y esta es dada por:

• Por consiguiente tendremos que:

• Es decir:

• Obtenemos la razón de probabilidad: razón de probabilidad de que


una familia tenga casa propia respecto a la probabilidad de que no la
posea.

• Si obtenemos un significa que las posibilidades son 4 a 1 a favor de


que la familia tenga casa propia
Tomando logaritmo natural de la razón

• Se obtiene

• Es decir que ahora no solo será lineal con X si no también con los
parámetros.
• Así la función de ligación de la ecuación es logit. Modelo logit
Ejemplo

• Modelo de regresión logística múltiple, considerando como variable dependiente


“inserción femenina en trabajos precarios” (1 = si, pertenece a trabajos precarios;
0 =caso contrario).
Ejemplo logit

• En el caso de las colombianas, tener hijos aumenta la chance de ingresar en el mercado laboral
precario en 9.5% en 2012 y 5.3% en 2019, en comparación con las colombianas sin hijos. Del mismo
modo, vemos que, un aumento adicional de un hijo, aumenta la chance de la mujer ejercer trabajo
precario en un 10.8% en 2012 y en 9.6% en 2019.
Aula practica
Ejercicio
• Utilice la base mroz y estime los tres modelo MLP, LOGIT Y PROBIT.
Realiza un cuadro comparativo de las tres estimaciones.
• Que puedes decir en relación a los parámetros y los tres modelos.

También podría gustarte