Está en la página 1de 17

Modelos de regresión de

respuesta cualitativa

Curso: economía ambiental


(Microeconometria y decisión) Econ. Alex J. Tafur Díaz
Modelos de regresión de
respuesta cualitativa

Modelos de regresión con respuesta binaria:


1. El modelo lineal de probabilidad (MLP)
2. El modelo logit
3. El modelo probit
4. El modelo tobit
Modelo lineal de
probabilidad (MLP)

Xi= ingreso Familiar


Yi= 1 Familia tiene casa propia
0 Familia tiene no casa
propia
Variable Suponiendo:
dicotómica

Para obtener estimadores


insesgados:
Yi, sigue la distribución de probabilidades de Bernoulli.

Como la probabilidad P debe encontrarse entre 0 y 1, tenemos la restricción


i
Mlp plantea diversos problemas:

1.- No normalidad de las perturbaciones Ui


supuesto de normalidad
No requiere de mediante pruebas de
MICO
perturbaciones ya que normalidad adecuadas,
asumimos que están como la de Jarque–Bera
normalmente distribuidas
Este supuesto no se
MLP mantiene ya que Yi; Ui
solo toma dos valores

La distribución de probabilidades de ui es:


2.- Varianzas heteroscedásticas de las perturbaciones

Aunque E(ui)= 0 y cov (ui, uj) =0 para i ≠ j (es decir, no


hay correlación serial)

Ya no es posible sostener la afirmación de que las perturbaciones


en el MLP son homoscedásticas(cuando la varianza del error
condicional a las variables explicativas es constante a lo largo de
las observaciones)
3.- No cumplimiento de 0 ≤ E(Yi/ Xi) ≤ 1
Esto sucede porque no cumple con la restricción 0 ≤ E(Yi/ Xi) ≤ 1

4.- Valor cuestionable de R2 como medida de la bondaddel ajuste

En la mayoría de aplicaciones practicas el R2 se encuentra entre


0.2 y 0.6.
El modelo logit
Resumiendo:

Función de distribución logística


(acumulativa)
La razón de la probabilidad de
que una familia posea una casa
propia respecto de la
Pi es a probabilidad de
probabilidad de que no la posea.
tener casa propia

=
(1- Pi) es a probabilidad de
no tener casa propia
Ahora, si tomamos el logaritmo natural de, obtenemos un resultado muy interesante,
a saber:

Es decir:
A.- L no solo es lineal en x si no en sus parámetro.
B.- L se llama logit de aquí el nombre del modelo.
CASO PRACTICO
Capacitación y Aplicación de
Acceso al
Formación Nivel de Conocimiento Uso de Tecnología Prácticas
Financiamiento
Especializada Empresariales
Desarrollo
Beneficio/ Económico del
Utilidad Costo N° de Costo por Monto de Crédito
Productor Costo po Productor ( Si
por Ha por Ha Ha Ha Recibido (Soles)
Hectárea Supera la Media 1: SI 0: NO ( De acuerdo al
del ratio B/C=1) 1: Intermedio, Avanzado 0: Sistema de Producción
1: SI 0: NO 1: SI 0: NO 1: SI 0: NO
Basico Utilizado, si es Manual no
utiliza tecnología)

1 7050 4000 2.47 1.76 0 4000 0 0 0 0 0 0


2 4000 4500 5.00 0.89 0 4500 0 0 0 0 0 0
3 4600 5000 4.00 0.92 0 5000 0 0 0 0 0 0
4 6400 8000 4.00 0.80 1 8000 1 5600 1 1 0 0
5 4600 8000 1.00 0.58 1 8000 1 5600 1 1 1 1
6 4370 8500 3.47 0.51 1 8500 1 5950 1 1 1 1
7 2000 7500 2.25 0.27 1 7500 1 5250 1 1 1 1
8 -400 6000 1.25 -0.07 1 6000 1 4200 1 1 1 1
9 -700 7000 10.00 -0.10 0 7000 0 0 0 0 0 0
10 4000 5000 1.30 0.80 0 5000 0 0 0 0 0 0
11 1100 7000 4.50 0.16 1 7000 1 4900 1 1 1 1
12 5700 7800 3.00 0.73 0 7800 0 0 0 0 0 0
13 5500 5000 4.00 1.10 1 5000 1 3500 1 1 1 1
14 2800 8000 4.00 0.35 1 8000 1 5600 1 1 1 1
15 4050 7000 2.00 0.58 1 7000 1 4900 1 1 1 1
… … … … … … … … … … … … …
85 3400 6000 5.00 0.57 0 6000 0 0 1 0 0 0
86 3400 6000 5.00 0.57 0 6000 0 0 1 0 0 0
. logit finan utidd cost n cap nivcono tec

Iteration 0: log likelihood = -58.466035


Iteration 1: log likelihood = -44.950785
Iteration 2: log likelihood = -44.801343
Iteration 3: log likelihood = -44.800838
Iteration 4: log likelihood = -44.800838 Mismo análisis de
MICO: muestra la
Logistic regression Number of obs = 86 probabilidad de recibir
LR chi2(6) = 27.33
un crédito
Prob > chi2 = 0.0001
Log likelihood = -44.800838 Pseudo R2 = 0.2337 Representa la
explicación del modelo
en %
finan Coef. Std. Err. z P>|z| [95% Conf. Interval]

utidd .0001892 .0001227 1.54 0.123 -.0000513 .0004296


cost -.0000646 .0002185 -0.30 0.768 -.0004929 .0003638
n .0009855 .0913543 0.01 0.991 -.1780656 .1800366
cap 1.097401 .6128332 1.79 0.073 -.1037305 2.298532
nivcono .7705518 .5937206 1.30 0.194 -.3931193 1.934223
tec 1.385082 .5721553 2.42 0.015 .263678 2.506486
_cons -2.148279 1.634884 -1.31 0.189 -5.352592 1.056034
. estat class

Logistic model for finan

True
Classified D ~D Total

+ 23 10 33
- 13 40 53

Total 36 50 86

Classified + if predicted Pr(D) >= .5


True D defined as finan != 0

Sensitivity Pr( +| D) 63.89%


Specificity Pr( -|~D) 80.00%
Positive predictive value Pr( D| +) 69.70%
Negative predictive value Pr(~D| -) 75.47%

False + rate for true ~D Pr( +|~D) 20.00%


False - rate for true D Pr( -| D) 36.11%
False + rate for classified + Pr(~D| +) 30.30%
False - rate for classified - Pr( D| -) 24.53%
El modelo estima el
Correctly classified 73.26% 76.23% correctamente
. fitstat
Ajuste del modelo
Measures of Fit for logit of finan

Log-Lik Intercept Only: -58.466 Log-Lik Full Model: -44.801


D(79): 89.602 LR(6): 27.330
Prob > LR: 0.000
McFadden's R2: 0.234 McFadden's Adj R2: 0.114
Maximum Likelihood R2: 0.272 Cragg & Uhler's R2: 0.366
McKelvey and Zavoina's R2: 0.354 Efron's R2: 0.274
Variance of y*: 5.095 Variance of error: 3.290 El N.º de observaciones
Count R2: 0.733 Adj Count R2: 0.361 correctas / N.º
observaciones del modelo
AIC: 1.205 AIC*n: 103.602
BIC: -262.292 BIC': -0.604
Calculo de oportunidades a través del antilogaritmo

ANTILOG. finan COEF.


Valores por encima de 1
1.00018922 utidd 0.0001892 mayor probabilidad que el
0.9999354 cost -0.0000646 evento ocurra
𝑒 𝐵𝑖 1.00098599 n 0.0009855
2.99636612 cap 1.097401 Valores por debajo de 1 es
2.16095722 nivcono 0.7705518 un indicador de menos
3.99514977 tec 1.385082 oportunidades
0.11668497 _cons -2.148279
Predicción del modelo
. mfx

Marginal effects after logit


y = Pr(finan) (predict)
= .39355009

variable dy/dx Std. Err. z P>|z| [ 95% C.I. ] X

utidd .0000451 .00003 1.54 0.122 -.000012 .000102 3850.99


cost -.0000154 .00005 -0.30 0.768 -.000118 .000087 6284.88
n .0002352 .0218 0.01 0.991 -.0425 .042971 5.07663
cap* .2570082 .13733 1.87 0.061 -.012149 .526165 .488372
nivcono* .1847251 .14108 1.31 0.190 -.091793 .461243 .395349
tec* .327016 .12786 2.56 0.011 .076422 .57761 .395349

(*) dy/dx is for discrete change of dummy variable from 0 to 1


. mfx, at ( utidd=1000 cost=3000 n=4 cap=1 nivcono=0 tec=1)
La probabilidad de
Marginal effects after logit ocurrencia en promedio.
y = Pr(finan) (predict)
= .58263907

variable dy/dx Std. Err. z P>|z| [ 95% C.I. ] X

utidd .000046 .00003 1.34 0.179 -.000021 .000113 1000


cost -.0000157 .00005 -0.31 0.759 -.000116 .000085 3000
n .0002396 .02221 0.01 0.991 -.043297 .043776 4
cap* .2648138 .14088 1.88 0.060 -.011312 .540939 1
nivcono* .1684012 .13402 1.26 0.209 -.094273 .431076 0
tec* .3236952 .12851 2.52 0.012 .071824 .575567 1

(*) dy/dx is for discrete change of dummy variable from 0 to 1