Está en la página 1de 25

MODELOS DE REGRESIN DE

RESPUESTA CUALITATIVA
Captulo 15 Gujarati

MODELOS DE REGRESIN DE
RESPUESTA CUALITATIVA
La regresada, la variable dependiente o la variable de
respuesta Y no es cuantitativa.
Regresada es una variable binaria,
polictoma (o de categora mltiple).

dictoma,

En el modelo de regresin donde Y es cualitativa, el


objetivo es encontrar la probabilidad de que un
acontecimiento suceda, por ejemplo: poseer una casa,
votar por un candidato, hacer deporte, etc.
Los modelos de respuesta cualitativa se conocen a
menudo como modelos de probabilidad.

MODELOS DE REGRESIN DE RESPUESTA


CUALITATIVA. Preguntas a considerar.
Cmo se estiman los modelos de regresin con
respuestas cualitativas?, Simplemente se estiman con
los procedimientos usuales de MCO?
Se presentan problemas de inferencias especiales?
Si una regresada es cualitativa, cmo se mide la
bondad de ajuste de dichos modelos?, tiene algn
valor el convencionalmente calculada para tales
modelos?

MTODOS PARA CREAR UN MODELO


DE PROBABILIDAD
1. Modelo lineal de probabilidad (MLP)
2. Modelo logit
3. Modelo probit
4. Modelo tobit

MODELO LINEAL DE PROBABILIDAD (MLP)


Es de simplicidad relativa y de estimacin mediante mnimos
cuadrados ordinarios.

Donde X = el ingreso familiar, y Y = 1 si la familia tiene casa propia y 0 si la familia


no tiene casa propia

Probabilidad condicional
de que el suceso tenga
lugar dado

Pr
=

MODELO LINEAL DE PROBABILIDAD (MLP)


La
variable tiene la siguiente distribucin (de probabilidad)
Probabilidad
0

1-

1
1
Total
Total

1
1
0

Restriccin

MODELO LINEAL DE PROBABILIDAD (MLP)


Caractersticas:
No normalidad de las perturbaciones . MCO no
requiere que las perturbaciones estn normalmente
distribuidas, se supone que lo estn para fines de
inferencia estadstica. En MLP, toma dos valores, y
sigue tambin una distribucin de Bernoulli.
Varianzas heterocedsticas de las perturbaciones
No cumplimiento de 0

DISTRIBUCIN DE BERNOULLI
Experimento de Bernoulli: solo son
posibles dos resultados: xito o fracaso.
Podemos definir una variable aleatoria
discreta X tal que:
xito 1
fracaso 0
Si la probabilidad de xito es p y la de fracaso 1 - p,
podemos construir una funcin de probabilidad:
1 x

P( x) p (1 p )
x

x 0,1

Un tpico experimento de Bernoulli es el lanzamiento de


una moneda con probabilidad p para cara y (1-p) para
cruz.

Valor cuestionable de como medida de la bondad de

ajuste.

. MLP (no restringido)

...

..

A 0

No sale de la banda
lgica de 0 y 1

...
0

..
B

MLP

MLP (restringido o
truncado)
elevado por dispersin
observada concentrada
alrededor de puntos A y B

EJEMPLO DE MLP.

Propiedad de vivienda Y (1 = tiene casa propia, 0 = no


tiene casa propia) e ingreso familiar X (miles de dlares)
de 40 familias
Source |

SS

df

MS

Number of obs =

-------------+-----------------------------Model | 8.0274948
Residual | 1.9475052

F( 1,

Total |

9.975

38) = 156.63

1 8.0274948

Prob > F

38 .051250137

R-squared

-------------+------------------------------

40

= 0.0000
= 0.8048

Adj R-squared = 0.7996

39 .255769231

Root MSE

= .22638

-----------------------------------------------------------------------------Y|

Coef.

Std. Err.

P>|t|

[95% Conf. Interval]

-------------+---------------------------------------------------------------X|

.102131

.0081605

12.52 0.000

_cons | -.9456861 .1228415

-7.70 0.000

.085611

.118651

-1.194366 -.6970066

EJEMPLO DE MLP.

Propiedad de vivienda Y (1 = tiene casa propia, 0 = no


tiene casa propia) e ingreso familiar X (miles de dlares)
de 40 familias

1. El intercepto da la probabilidad de que una familia con


ingreso 0 tenga una casa propia. Como es negativo se
acepta que es 0, probabilidad casi nula.
2. El valor de la pendiente 0,1021 un cambio en X de
10%.
3. Con ingreso determinado se puede tener la
probabilidad real de tener casa propia a partir de la
= -0,9457+ 12(0,1021)
ecuacin.
= 0,2795
= 28%

X = 12.000 USD

INTRODUCCIN
A diferencia de la regresin lineal que suele hacer uso
de los mtodos de estimacin por Mnimos Cuadrados),
en la regresin logstica se emplean los mtodos de
Mxima Verosimilitud (MV) para llevar a cabo la
estimacin de los parmetros del modelo.
En economa, estos modelos de regresin con variable
endgena categrica suelen emplearse para explicar la
decisin Y que toma un individuo -de entre un nmero
limitado de posibles opciones- a partir de un conjunto
de variables explicativas X1, X2, ..., Xk.

EL MODELO LOGIT

Donde X es el ingreso y = E()

Funcin de distribucin
logstica

Donde =

NO SE PUEDE APLICAR MCO POR SER NO LINEAL EN PRIMERA INSTANCIA , AUNQUE SE


PUEDE LINEALIZAR

Razn de probabilidad

EL MODELO LOGIT
En funcin de datos
Datos de nivel individual

Si una familia es duea de


una casa
Si una familia no es duea de
una casa

Existe software que puede ayudar a su clculo


utilizando MV

EL MODELO LOGIT
En funcin de datos agrupados
glogit n N x

Mnimos cuadrados
ponderados

Weighted LS logistic regression for grouped data


Source |
SS
df
MS
-------------+-----------------------------Model | 4.87904376
1 4.87904376
Residual | .185305477
8 .023163185
-------------+-----------------------------Total | 5.06434924
9 .562705471

Number of obs
F( 1,
8)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

10
210.64
0.0000
0.9634
0.9588
.15219

-----------------------------------------------------------------------------|
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------x |
.0792593
.0054611
14.51
0.000
.0666659
.0918527
_cons | -1.607727
.1110547
-14.48
0.000
-1.86382
-1.351634
------------------------------------------------------------------------------

Calificacin Y = 1 si la calificacin final fue A, 0 si


fue
B o=Ccalificacin en un examen presentado al comienzo del curso
TUCE
para evaluar los conocimientos previos de macroeconoma.
PSI = 1 con el nuevo mtodo de enseanza, 0 en otro caso
GPA = promedio de puntos de calificacin
inicial.
logit Calificacion GPA TUCE PSI
Iteration
Iteration
Iteration
Iteration
Iteration
Iteration

0:
1:
2:
3:
4:
5:

log
log
log
log
log
log

likelihood
likelihood
likelihood
likelihood
likelihood
likelihood

Logistic regression
Log likelihood = -12.889633

=
=
=
=
=
=

-20.59173
-13.259768
-12.894606
-12.889639
-12.889633
-12.889633
Number of obs
LR chi2(3)
Prob > chi2
Pseudo R2

=
=
=
=

32
15.40
0.0015
0.3740

-----------------------------------------------------------------------------Calificacion |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------GPA |
2.826113
1.262941
2.24
0.025
.3507938
5.301432
TUCE |
.0951577
.1415542
0.67
0.501
-.1822835
.3725988
PSI |
2.378688
1.064564
2.23
0.025
.29218
4.465195
_cons | -13.02135
4.931325
-2.64
0.008
-22.68657
-3.35613
------------------------------------------------------------------------------

Fuente: L. Spector y M. Mazzero

CLCULO UTILIZANDO EVIEWS

LR
= razn de verosimilitud,
reemplaza a la prueba F.
Para
el
anlisis
de
los
coeficientes se debe tomar el
antilogaritmo.
Ejemplo: PSI = 10,7897

CLCULO UTILIZANDO EVIEWS


1.00
0.75
0.50
0.25
0.00
-0.25
-0.50
-0.75
-1.00
2

10 12 14 16 18 20 22 24 26 28 30 32
CALIFICACION Residuals

LECTURA DE COEFICIENTES
Adems, en este tipo de modelos no resulta posible interpretar directamente las estimaciones
de los parmetros , ya que son modelos no lineales. Lo que haremos en la prctica es fijarnos
en el signo de los estimadores. Si el estimador es positivo, significar que incrementos en la
variable asociada causan incrementos en P(Y = 1) (aunque desconocemos la magnitud de los
mismos). Por el contrario, si el estimador muestra un signo negativo, ello supondr que
incrementos en la variable asociada causarn disminuciones en P(Y = 1).

GRFICAS DE PROBABILIDAD EN MODELOS DE RESPUESTA CUALITATIVA

Mtodos alternativos que permiten que los


residuales se distribuyan de otra forma distinta a

MODELO PROBIT
El modelo logit utiliza una Funcin logstica acumulativa

(FLA).
El modelo probit (normit) utiliza una FDA.
El probit depende de un ndice de conveniencia no
observable (variable latente), determinado por
diversas variables explicativas.
Como se relaciona el ndice con las decisiones reales. Se
supone que cada familia o persona tiene un nivel crtico

MODELO PROBIT
El probit supone que los errores tienen una distribucin
normal. Con el supuesto de normalidad se calcula de la
manera siguiente:

Probabilidad que un
suceso ocurra dado
valores de X

= P = P= F

Variable
normal
estandarizad
a
Z N(0,

logit calificacion gpa tuce psi


Iteration
Iteration
Iteration
Iteration
Iteration
Iteration

0:
1:
2:
3:
4:
5:

log
log
log
log
log
log

likelihood
likelihood
likelihood
likelihood
likelihood
likelihood

=
=
=
=
=
=

-20.59173
-13.259768
-12.894606
-12.889639
-12.889633
-12.889633

Logistic regression

Number of obs
LR chi2(3)
Prob > chi2
Pseudo R2

Log likelihood = -12.889633

=
=
=
=

32
15.40
0.0015
0.3740

-----------------------------------------------------------------------------calificacion |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------gpa |
2.826113
1.262941
2.24
0.025
.3507938
5.301432
tuce |
.0951577
.1415542
0.67
0.501
-.1822835
.3725988
psi |
2.378688
1.064564
2.23
0.025
.29218
4.465195
_cons | -13.02135
4.931325
-2.64
0.008
-22.68657
-3.35613
-----------------------------------------------------------------------------probit calificacion gpa tuce psi
Iteration
Iteration
Iteration
Iteration
Iteration

0:
1:
2:
3:
4:

log
log
log
log
log

likelihood
likelihood
likelihood
likelihood
likelihood

Probit regression
Log likelihood = -12.818803

=
=
=
=
=

-20.59173
-12.908126
-12.818963
-12.818803
-12.818803

coeficientes
Number of obs
LR chi2(3)
Prob > chi2
Pseudo R2

=
=
=
=

32
15.55
0.0014
0.3775

-----------------------------------------------------------------------------calificacion |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------gpa |
1.62581
.6938825
2.34
0.019
.2658255
2.985795
tuce |
.0517289
.0838903
0.62
0.537
-.1126929
.2161508
psi |
1.426332
.5950379
2.40
0.017
.2600795
2.592585
_cons |
-7.45232
2.542472
-2.93
0.003
-12.43547
-2.469166
------------------------------------------------------------------------------

CONSIDERACIONES SOBRE LOS


MODELOS
No hay razones de peso para elegir
entre uno y otro.
Pero hay que tener cuidado en
interpretar
los
coeficientes.
Distribucin
logstica
estndar
(logit) y normal estndar (probit)
tienen ambas media cero, sus
varianzas son diferentes.
1 para la normal estndar y para la
distribucin logstica.
Si se multiplica el coeficiente probit
por aproximadamente 1,81 se tendr el
coeficiente aproximado de logit

DISTRIBUCIONES ACUMULATIVAS LOGIT Y


PROBIT

Ejercicio resumen de modelos