Está en la página 1de 19

18:28:36

discreta
Modelos de eleccion
Econometra II
Grado en Economa
Universidad de Granada

discreta 1 / 37
Modelos de eleccion

Econometra II

18:28:36

Contenidos
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis

Introduccion
binaria
Modelos de eleccion
Modelo Lineal de Probabilidad
El modelo Logit y Probit
discreta
Inferencia en los modelos de eleccion
de los coeficientes
Interpretacion
Bondad de ajuste
de hipotesis

Contrastacion
Modelos de alternativas multiples

Modelos de alternativas
multiples

Econometra II

discreta 2 / 37
Modelos de eleccion

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta

Introduccion

de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

discreta 3 / 37
Modelos de eleccion

Econometra II

18:28:36

Introduccion
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coecientes
Bondad de ajuste

Hasta el momento se ha trabajado con variables cualitativas incluyendolas


dentro
del grupo de variables independientes, pero puede la variable dependiente ser

de naturaleza cualitativa? que ocurre en tal caso? sigue siendo valido


el
por Mnimos Cuadrados?
modelo lineal y su estimacion
toma
En ocasiones, analizamos datos donde la variable dependiente de interes
valores discretos:
Variables dependientes binarias (ej: comprar o no comprar, conceder o no un

prestamo,
tener o no una enfermedad).
(ej: tren, autobus...).
Variables discretas sin ordenacion

o rating nanciero).
Variables discretas con orden (ej: calicacion
lineal puede no ser lo mas
adecuado en estos casos porque:
Un modelo de regresion

de
Contrastacion

hipotesis

los resultados son difciles de interpretar: no se puede hablar de cambio continuo.

Modelos de alternativas
multiples

admite valores discretos, y puede que solo


nola variable dependiente solo
negativos.
podemos estar interesados en estimar la probabilidad de la ocurrencia de los distintos valores de la variable dependiente y no tanto en el valor esperado predicho.
analizaremos con algo mas
de profundidad los problemas que
A continuacion
lineal clasico

surgen al considerar un modelo de regresion


en el que la variable de concretamente, binaria) y se plantearan
las dos principendiente es cualitativa (mas
pales alternativas que se tienen en este caso: los modelos logit y probit.

Econometra II

discreta 4 / 37
Modelos de eleccion

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coecientes

binaria
Modelos de eleccion

Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

discreta 5 / 37
Modelos de eleccion

Econometra II

18:28:36

binaria
Modelos de eleccion
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Econometra II

De los ejemplos considerados anteriormente, este captulo se centra fundamentalmente en el caso en el que la variable dependdiente es una variable binaria (di
cotomica).
Es decir, supondremos que la variable dependiente Y solo puede tomar
dos valores:
n
1 , con probabilidad p
Y =
,
(1)
0 , con probabilidad 1 p
La variable Y , por
donde el valor 1 denota que el individuo ha tomado alguna accion.
de Bernoulli:
tanto, sigue una distribucion
Pr(Y = y)
E(Y )
V ar(Y )

=
=
=

py (1 p)1y ,
p,
p(1 p).

(2)

es la probabilidad de que el
En tal caso, se estara interesado en analizar cual
individuo i, dadas sus caractersticas (es decir, valores de las variables independien (es decir, Yi = 1).
tes, Xi ), tome una accion

discreta 6 / 37
Modelos de eleccion

18:28:36

binaria: ejemplo
Modelos de eleccion
Contenidos

A lo largo del presente captulo desarrollaremos el siguiente ejemplo:

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Econometra II

En numerosas ocasiones los docentes nos hemos preguntado por los factores
que influyen en que un estudiante apruebe o no las asignaturas que impartimos.
es aun
interesante desde el punto de vista del alumno. Por tanto,
Esta cuestion
mas
sobre factores que
sera deseable poder proporcionar a los mismos una orientacion
en la asignatura.
les puedan ayudar a obtener un mayor desempeno

Para analizar que factores influyen (positiva o negativamente) en el desempeno

logstica
(rendimiento) academico
de los alumnos se propone realizar una regresion
donde la variable dependiente es codificada como 1 para aquellos alumnos con una
final de 5 o superior y como 0 en caso contrario. Es decir, el desempeno

calificacion

se mide como una variable binaria que considera los valores de aprobado (exito) o

suspenso (fracaso). Por tanto, el modelo econometrico


planteado estima la probabilidad que tiene un alumno de superar la asignatura. Como variables independientes se
de ejercicios en pizarra, EP , en ordenador, EO, y exame
consideran la realizacion
nes tipo test, T T , sobre cada tema.

discreta 7 / 37
Modelos de eleccion

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Modelo Lineal de
Probabilidad
Inconvenientes
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta

Modelo Lineal de Probabilidad

de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Econometra II

discreta 8 / 37
Modelos de eleccion

18:28:36

Modelo Lineal de Probabilidad


Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Modelo Lineal de
Probabilidad
Inconvenientes

El Modelo Lineal de Probabilidad consiste simplemente en considerar un modelo


lineal en el que la variable dependiente es binaria, es decir:
de regresion
Yi = 1 + 2 X2i + + k Xki + ui ,

de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

(3)

con u N (0, 2 ) e Yi de la forma dada en (1). En este caso, dados los valores
x2 , ..., xk de las variables independientes, se verica que:
E(Yi |X = x)

=
=
=
=

El modelo Logit y Probit


Inferencia en los

modelos de eleccion
discreta

i = 1, . . . , n,

E(Yi |X = x)

Pr(Yi = 1|X = x) 1 + Pr(Yi = 0|X = x) 0


Pr(Yi = 1|X = x),
E(0 + 1 X2i + + k Xki + ui |X = x)
1 + 2 x2i + + k xki .

(3) debe ser interpretada como la probabiEs decir, la parte derecha de la ecuacion
lidad de que la variable dependiente sea igual a la unidad:
pi = Pr(Yi = 1|X = x) = 1 + 2 x2i + + k xki .

(4)

de la probabilidad de que Yi = 1 asociada con una


Y, por tanto, i es la variacion
unitaria en Xi , manteniendo constantes las otras variables explicativas
variacion
(con i = 1, . . . , k).
lineal se puede aplicar
Todo lo que conocido sobre el modelo de regresion
contraste de hipotesis,

de los parametros,

directamente: estimacion,
interpretacion
etc. Solo debemos recordar que la esperanza condicional es, en este caso, una probabilidad, por lo que 0 E(Yi |X = x) 1.
discreta 9 / 37
Modelos de eleccion

Econometra II

18:28:36

Inconvenientes del Modelo Lineal de Probabilidad


Contenidos

Introduccion

Modelos de eleccion
binaria

de la muestra en este tipo de modelos se caracteriza por una nube de


La distribucion
puntos de tal manera que las observaciones muestrales se dividen en dos subgrupos:
uno formado por las observaciones en las que ocurrio el acontecimiento objeto de
estudio (Yi = 1), y otro, por los puntos muestrales en los que no ocurrio (Yi = 0).

Modelo Lineal de
Probabilidad
Modelo Lineal de
Probabilidad

Y con respecto a X (con ajuste mnimocuadrtico)


1.4

Y = 2.29 + 0.0544X

Inconvenientes
1.2

El modelo Logit y Probit


1

Inferencia en los

modelos de eleccion
discreta
Y

de los
Interpretacion
coecientes

0.8
0.6

Bondad de ajuste

0.4

de
Contrastacion

hipotesis

0.2

Modelos de alternativas
multiples

0
0.2
40

45

50

55

60

65

R2 no es particularmente util
Por tanto, el coeciente de determinacion
porque no

es posible que todos los datos se encuentren exactamente en la recta de regresion


(R2 = 1).
Econometra II

discreta 10 / 37
Modelos de eleccion

18:28:36

Inconvenientes del Modelo Lineal de Probabilidad


Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Modelo Lineal de
Probabilidad
Inconvenientes
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Otros inconvenientes importantes son:


Puesto que la variable dependiente solo toma valores 0 o 1, el supuesto de nor de
malidad de las perturbaciones no se cumple ya que siguen la distribucion
Bernoulli:

Yi = 1
Yi = 0

ei = Yi Yi

1 1 2 X2i k Xki
1 2 X2i k Xki

Probabilidad
p
1p

Perturbaciones heteroscedasticas
(incumplimiento de la hipotesis
de homocedasticidad) ya que su varianza depende de las variables independientes:
V ar(ei )

=
=
+

E(ei E(ei ))2 = E(ei )2


(1 1 2 X2i k Xki )2 p

(1 2 X2i k Xki )2 (1 p).

Las predicciones de la variable dependiente pueden estar fuera del rango [0, 1].
El modelo lineal de probabilidad implica que el efecto marginal de cada una de las
variables explicativas es constante. Este supuesto no es muy razonable ya que
es esperable que las variaciones en la probabilidad sean distintos en los valores
centrales de las variables dependientes a las producidas en sus extremos.

discreta 11 / 37
Modelos de eleccion

Econometra II

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Modelo Logit
Modelo Probit
modelos
Comparacion
Logit y Probit

El modelo Logit y Probit

Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Econometra II

discreta 12 / 37
Modelos de eleccion

18:28:36

El modelo Logit y Probit


Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Modelo Logit
Modelo Probit
modelos
Comparacion
Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Como se ha puesto de relevancia, el modelo lineal de probabilidad presenta importantes inconvenientes que desaconsejan su uso ante variables dependientes binarias
y crea la necesidad de recurrir a otros tipos de modelos.
no lineales disenados

Las regresiones Probit y Logit son modelos de regresion


especcamente para variables dependientes binarias. Se trata de adoptar una for no lineal que obligue a que los valores estimados esten
entre 0 y 1 ya que,
mulacion
con una variable binaria dependiente Y modeliza la
como hemos visto, la regresion
probabilidad de que Y = 1.
Logit utiliza una funcion
de distribucion
logstica, mientras que la
La regresion
Probit utiliza una funcion
de distribucion
normal estandar.

regresion
Ambas funcio de probabilidad dan lugar a probabilidades ente 0 y 1, y presentan
nes de distribucion
un crecimiento no lineal (con mayores incrementos en la parte central). De esta forma

se resuelven dos de los problemas anteriormente senalados.


1

0.9

0.9

0.8

0.8

0.7

0.7

0.6

0.6

0.5

0.5

0.4

0.4

0.3

0.3

0.2

0.2

0.1

0
5

0.1

0
5

graca

logstica (izquierda) y de la
Figura 1: Representacion
de la funcion
probabilidad acumulada de una normal (derecha)
discreta 13 / 37
Modelos de eleccion

Econometra II

18:28:36

Modelo Logit
Contenidos

Logit se basa en la funcion


logstica:
El modelo de regresion

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Modelo Logit
Modelo Probit
modelos
Comparacion
Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

f (z) =

1
1
ez
=
=
,
1 + ez
1 + ez
1 + e1z

la cual esta acotada entre 0 y 1 ya que:


lm f (z) = 0,

lm f (z) = 1,

y, como se muestra en la Figura 1, presenta una forma de S que se ajusta al crecimiento no lineal deseado (leves incrementos en los extremos y mayores en la parte
central).
Logit sera de la forma:
El modelo de regresion
Yi = f (Zi ) + ui , = 1, . . . , n,

(5)

donde Zi = 1 + 2 X2i + + k Xki y, dados los valores de las variables independientes x2 , ..., xk , las probabilidades de que la variable dependiente tome los valores
1 y 0 son:
ezi
,
1 + ezi
1
=
,
1 + ezi

Pr(Y = 1|x2 , ..., xk )

E(Yi |X = x) =

Pr(Y = 0|x2 , ..., xk )

ezi
1 + ezi

con zi = 1 + 2 x2i + + k xki .


Econometra II

discreta 14 / 37
Modelos de eleccion

18:28:36

Modelo Probit
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Modelo Logit

Probit se basa en la distribucion


de probabilidad acumulada
El modelo de regresion
de una normal tipicada:
1
(z) = Pr(Z z) =
2

s2
2

ds,

donde Z N (0, 1) y es tal que, dados los valores x2 , ..., xk de las variables independientes, se verica que:

Modelo Probit
modelos
Comparacion
Logit y Probit
Inferencia en los

modelos de eleccion
discreta

Pr(Y = 1|x2 , ..., xk ) = (zi ),


con zi = 1 + 2 x2i + + k xki tal que:
Y =

de los
Interpretacion
coecientes

1
0

si zi > 0
.
si zi < 0

Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

discreta 15 / 37
Modelos de eleccion

Econometra II

18:28:36

modelos Logit y Probit


Comparacion
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Modelo Logit
Modelo Probit
modelos
Comparacion
Logit y Probit

Los modelos logit y probit comparten practicamente las mismas carectersticas: son

modelos no lineales que son estimados por los metodos


estudiados en el tema ante

rior (mnimos cuadrados no lineales o maxima


verosimilitud), donde la interpretacion
de los coecientes no es tan inmediata como en el modelo lineal de probabilidad.
en ambos casos hay que buscar una medida alternativa al coeciente de
Ademas,
para medir la bondad del ajuste realizado.
determinacion
logstica (curva azul)
La unica

diferencia entre ambos modelos es que la funcion


anchas, por lo que la probabilidad de exito

tiene colas mas


sera mayor en los extremos cuando se use el modelo logit.
1

Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0
5

Econometra II

discreta 16 / 37
Modelos de eleccion

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta

discreta
Inferencia en los modelos de eleccion

Metodo
de MV
de los
Interpretacion
coecientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

discreta 17 / 37
Modelos de eleccion

Econometra II

18:28:36

Metodo
de Maxima
Verosimilitud
Contenidos

Introduccion

Modelos de eleccion
binaria

entre la variable dependiente y las explicativas es no lineal no se


Como la relacion

puede aplicar el metodo


de MCO.

Si se usa el metodo
de maxima
verosimilitud, a partir de (2) y (4) se obtiene la
de densidad conjunta:
funcion

Modelo Lineal de
Probabilidad

L=

El modelo Logit y Probit


Inferencia en los

modelos de eleccion
discreta

i=1

ln L

n 
X

n 
X

i=1

Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

i=1
n

X
i=1

yi ln(pi ) + (1 yi ) ln(1 pi )

yi ln(pi ) yi ln(1 pi ) + ln(1 pi )

yi ln

pi
1 pi

donde se ha llamado zi = ln

Econometra II

pi i (1 pi )1yi ,

la cual, al considerar logaritmos neperianos queda:

Metodo
de MV
de los
Interpretacion
coecientes

n
Y

pi
1pi

n
X
i=1

ln(1 pi ) =

n
X
i=1

yi z i

n
X

ln(1 + ezi ),

i=1

discreta 18 / 37
Modelos de eleccion

18:28:36

Metodo
de Maxima
Verosimilitud
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

anterior
Teniendo en cuenta que pi = 1 + 2 x2i + + k xki , derivar la expresion
con respecto a cada coeciente conduce a:
ln L
1

i=1
n

El modelo Logit y Probit


Inferencia en los

modelos de eleccion
discreta

Metodo
de MV
de los
Interpretacion
coecientes
Bondad de ajuste

n
X

ln L
j

X
i=1

yi

n 
X
i=1

yi xji

ezi
1 + ezi

n 
X
i=1

ezi
1 + ezi

xji ,

j = 2, . . . , k.

Al igualar a cero las derivadas anteriores se obtiene el siguiente sistema de ecuaciones normales no lineal que tendra que ser resuelto mediante un algoritmo de

optimizacion:
n
X

de
Contrastacion

hipotesis
Modelos de alternativas
multiples

i=1

yi

X
i=1

n 
X

yi xji

i=1

X
n

i=1

0.

xji

0,

ezi
1 + ezi

ezi
1 + ezi

j = 2, . . . , k.

Bajo supuestos generales, los estimadores as obtenidos son consistentes, asintoti asintotica

camente eficientes y con distribucion


normal.
aplicando este metodo

se solventa el problema de heteAdemas,


de estimacion
roscedasticidad anteriormente comentado.
Econometra II

discreta 19 / 37
Modelos de eleccion

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes

de los coeficientes
Interpretacion

Efecto marginal
Odd ratio
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Econometra II

discreta 20 / 37
Modelos de eleccion

18:28:36

Efecto marginal
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

En los modelos lineales (como el modelo lineal de probabilidad) la derivada parcial


de la variable dependiente, Y , con respecto a cada una de las variables explicativas,
Xj , j = 1, . . . , p, es la constante j , y se interpreta como el cambio producido en
Y cuando Xj aumenta una unidad. Puesto que los modelos logit y probit son no
no es correcta.
lineales, esta interpretacion
En el modelo Logit, partiendo de (5), la derivada parcial anterior es:

El modelo Logit y Probit


Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes
Efecto marginal
Odd ratio
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

eZi
Yi
=
j ,
Xji
(1 + eZi )2

j = 1, . . . , k,

mientras que en el probit


Yi
= (zi )j ,
Xji

j = 1, . . . , k,

de densidad de la distrbucion
normal tipificada.
siendo la funcion
Por tanto, el efecto marginal en ambos modelos depende de los valores que
toman las variables explicativas (ya no es constante: uno de los objetivos perseguidos por estos modelos). Pueden, por tanto, calcularse los efectos marginales para
de la muestra (alternativamente, los efectos marginales pueden
cada observacion
evaluarse para el valor medio de las variables explicativas).
de densidad son siempre positivas, queda
Puesto que la exponencial y la funcion
del efecto marginal.
claro que el signo de los coeficientes indica la direccion
directa, mientras que uno negativo
Es decir, un signo positivo indicara una relacion
inversa.
discreta 21 / 37
Modelos de eleccion

Econometra II

18:28:36

Efecto marginal: ejemplo


Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes
Efecto marginal
Odd ratio
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

logstica de la forPara el ejemplo planteado, considerando un modelo de regresion


ma dada en (5) con Zi = 1 + 2 EPt + 3 EOt + 4 T Tt , se obtiene la siguiente

estimacion:

b1 = 3.3537,

b2 = 0.1535,

b3 = 0.2529,

b4 = 4.6931.

Puesto que todas las estimaciones de los coeficientes de las variables independientes tienen signo positivo, se tiene que el efecto marginal de estas variables
(siempre que se
sera positivo. Es decir, incrementos en estas variables significaran

individual) un aumento
rechaze la hipotesis
nula en los contrastes de significacion
en la probabilidad de aprobar.
en los
Cuanto aumenta la probabilidad de aprobar si, para la misma calificacion
ejercicios en la pizarra y mismo porcentaje de preguntas correctas en los tipo test,
de 3 en el examen de ordenador a 4?
se pasa de obtener una calificacion
Considerando, por ejemplo, fijos los valores EP = 5 y T T = 0.6, se tiene que:
Pr(Y = 1|EP = 5, EO = 3, T T = 0.6) = 0.7287639,
Pr(Y = 1|EP = 5, EO = 4, T T = 0.6) = 0.7757833,
es decir, el incremento de la probabilidad es 0.0470194.
Es este incremento constante?

Econometra II

discreta 22 / 37
Modelos de eleccion

18:28:36

Efecto marginal: ejemplo


Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes
Efecto marginal

EP
5
5
5
5
5
5
5
5
5
5
5

EO
0
1
2
3
4
5
6
7
8
9
10

TT
0.6
0.6
0.6
0.6
0.6
0.6
0.6
0.6
0.6
0.6
0.6

Pr(Y = 1)
0.5571640
0.6183522
0.6760023
0.7287639
0.7757833
0.8167018
0.8515816
0.8807929
0.9048969
0.9245446
0.9404006

Incremento
0.0611882
0.0576501
0.0527616
0.0470194
0.0409185
0.0348798
0.0292113
0.024104
0.0196477
0.015856

Odd ratio
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

en
Tal y como se observa en la tabla, para los valores constantes de calificacion

pizarra de 5 y de un 60 % de preguntas correctas en los examenes


tipo test, el cambio
en el examen de
en la probabilidad de aprobar a medida que cambia la calificacion
ordenador no es constante.
Cada una de las probabilidades anteriores se obtiene sustituyendo el correspon
diente valor de EP , EO y T T en la siguiente expresion:

bi
eZ

bi
1 + eZ

Econometra II

bi = b1 + b2 EPt + b3 EOt + b4 T Tt .
donde Z

discreta 23 / 37
Modelos de eleccion

18:28:36

Efecto marginal: ejemplo


Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes

Si se hubiese considerado un modelo Probit, las probabilidades de exito


anteriores

se hubiesen obtenido a partir de la siguiente expresion:


Pr(Y = 1|EP = ep, EO = eo, T T = tt) = (b
zi ) = Pr(Z b
zi ),

b1 + b2 ep + b3 eo + b4 tt y Z N (0, 1).
donde b
zi =
En el ejemplo que nos ocupa:

Pr(Y = 1|EP = 5, EO = 3, T T = 0.6) = Pr(Z 0.98836) 0.8389,

Pr(Y = 1|EP = 5, EO = 4, T T = 0.6) = Pr(Z 1.24126) 0.8925,


y entonces el incremento de la probabilidad es de 0.0536.

Efecto marginal
Odd ratio
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Econometra II

discreta 24 / 37
Modelos de eleccion

18:28:36

Odd ratio
Contenidos

Introduccion

entre
En la practica,
en el modelo logit, lo que se suele hacer es calcular la razon
ambas probabilidades, cociente denominado odd-ratio, es decir:

Modelos de eleccion
binaria

pi
=
1 pi

Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes
Efecto marginal
Odd ratio
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

ezi
1+ezi
1
1+ezi

= ezi ,

con zi = 1 + 2 x2i + + k xki .


probable que ocurra el
Por tanto, el odd ratio es el numero

de veces que es mas

fenomeno
o suceso frente a que no ocurra.
El odd-ratio asociado a un cambio de xjh a xjl , h 6= l, h, l = 1, . . . , n en la variable Xj , j = 1, . . . , k, supuesto que el resto de variables permanecen constantes,
viene dado por:
ezh
= ej (xjh xjl ) .
ezl
En tal caso:
entre la variable dependiente y la variable en estudio el oddSi no existe relacion
ratio toma el valor uno.
Si la variable dependiente incrementa la probabilidad sobre la variable explica elevada sea esta
da el odd-ratio sera superior a uno tanto mayor cuanto mas

relacion.
Si la variable dependiente disminuye la probabilidad de la variable explicada el
odd-ratio sera menor que uno.
discreta 25 / 37
Modelos de eleccion

Econometra II

18:28:36

Odd ratio: ejemplo


Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes
Efecto marginal
Odd ratio

Los odd-ratios asociados a un cambio unitario en las variables del ejemplo considerado se recogen en la siguiente tabla:
Variables
Odd-ratio

EP
1.1659

EO
1.2878

TT
109.1859

bj , con

e
Adviertase
que dichos valores se han obtenido a partir de la expresion
j = 2, 3, 4. Los odd-ratios asociados a un cambio de 5 unidades en cada una de las
bj .
variables sera obtenido a partir de e5
en ordenador un
As, por ejemplo, para un alumno que tiene una calificacion
probable que apruebe. Un alumno que
punto superior a otro es 1.2878 veces mas
5 veces superior a otro es 3.541322 veces mas
probable que
tiene una calificacion
apruebe.

Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Econometra II

discreta 26 / 37
Modelos de eleccion

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes

Bondad de ajuste

Bondad de ajuste
Coeficiente de

McFadden y proporcion
de aciertos
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

discreta 27 / 37
Modelos de eleccion

Econometra II

18:28:36

de aciertos
Coeficiente de McFadden y proporcion
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes
Bondad de ajuste
Coeficiente de

McFadden y proporcion
de aciertos
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

no es el de MCO
En los modelos logit y probit, debido a que el metodo
de estimacion
clasico

sino el de MV, no podemos utilizar el coeficiente de determinacion


para medir
la bondad del ajuste. Recordemos que este era uno de los problemas que surgan en
el modelo lineal de probabilidad. En su lugar, se utiliza el pseudo R2 de McFadden:
2 = 1 ln L ,
R
ln Lr
de verosimilitud del modelo sin
donde ln L es el logaritmo neperiano de la funcion
restricciones (el modelo con todas las variables explicativas) y ln Lr es el logarit de verosimilitud del modelo restringido (solo incluye el
mo neperiano de la funcion

termino
independiente del modelo).
para analizar la bondad del modelo es contabilizar el porcentaje de
Otra opcion
aciertos del modelo teniendo en cuenta que, por ejemplo, las probabilidades predichas por encima de 0.5 contabilizan como Yi = 1 y menores que 0.5 estiman Yi = 0:
Yi = 1
Yi = 0

Yi = 1
A
C

Yi = 0
B
D

En los casos A y D se habra predicho correctamente el valor de Y , por tanto, la


de aciertos vendra dada por el cociente A+D
proporcion
.
n
Si se desea ser exigente con el modelo (lo recomendado), en lugar de usar el
de exitos

umbral del 0.5 se debe usar la proporcion


(de unos) que hay en la variable
dependiente.
Econometra II

discreta 28 / 37
Modelos de eleccion

18:28:36

de aciertos: ejemplo
Proporcion
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes
Bondad de ajuste
Coeficiente de

McFadden y proporcion
de aciertos
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Observados - Predichos
Suspensos
Aprobados
Total

Suspensos
14
22
36

Aprobados
6
83
89

Total
20
105
125

Porcentaje
70 %
79.04 %
77.6 %

En la tabla anterior se cruzan las observaciones disponibles sobre el numero

de suspensos y aprobados con las predicciones realizadas por el modelo. Recordemos que
el modelo logstico proporciona la probabilidad de aprobar, por tanto, es necesario
establecer un umbral para clasificar dicha probabilidad como aprobada o suspensa. En este caso, puesto que en la muestra se tiene un 84 % de aprobados se ha
decidido que una probabilidad por debajo de 0.84 sea clasificada como suspenso y
por encima como aprobado (se puede apreciar por tanto que se ha establecido un
umbral bastante exigente).
Con esta premisa se tiene que de los 20 suspensos clasifica bien a 14 (un 70 %),
mientras que de los 105 aprobados clasifica correctamente a 83 (un 79.04 %). Finalmente, el modelo ajustado clasifica adecuadamente un 77.6 % de los datos (97 de
que aceptable si se tiene en cuenta las exigencias establecidas.
125), una cifra mas

discreta 29 / 37
Modelos de eleccion

Econometra II

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes

de hipotesis

Contrastacion

Bondad de ajuste
de
Contrastacion

hipotesis
individual
Significacion
de los coeficientes
conjunta
Significacion
de los coeficientes
Modelos de alternativas
multiples

Econometra II

discreta 30 / 37
Modelos de eleccion

18:28:36

individual de los coeficientes


Significacion
Contenidos

individual sobre los coeficientes:


Para realizar contrastes de significacion

Introduccion

H0 : j = 0
H1 : j 6= 0

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta

de
Contrastacion

hipotesis
individual
Significacion
de los coeficientes
conjunta
Significacion
de los coeficientes
Modelos de alternativas
multiples

normal:
nos basaremos en que los estimadores siguen uns distribucion
j N (j , Var(j )).
en el contraste utilizamos la siguiente regla de
Por tanto, para tomar una decision

decision:

de los
Interpretacion
coeficientes
Bondad de ajuste

Se rechaza H0 si

j

Z
p

1/2 ,
Var(j )

donde P [Z < Z1/2 ] = 1 /2 con Z N (0, 1).

de la matriz de varianzas-covarianzas de los coeficienAdviertase


que la obtencion

tes, j , no es una tarea facil.


Por suerte todos los programas informaticos
lo realizan

automaticamente,
por lo que se puede realizar inferencia en la forma habitual.

discreta 31 / 37
Modelos de eleccion

Econometra II

18:28:36

conjunta de los coeficientes


Significacion
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

conjunta sobre todos los coeficientes (o un


Para realizar contrastes de significacion
de verosimilitudes:
subconjunto), se puede utilizar el contraste de la razon
H0 : 2 = 3 = ... = k = 0
H1 : en caso contrario

de los
Interpretacion
coeficientes
Bondad de ajuste
de
Contrastacion

hipotesis

El estadstico de contraste es:

El modelo Logit y Probit


Inferencia en los

modelos de eleccion
discreta

2 ln

L(r )
2q ,

L()

donde L(r ) es la verosimilitud del modelo restringido, es decir, del modelo en el


es la verosimilitud del modelo sin restricciones y q es el
que se impone la H0 , L()
numero

de restricciones.

individual
Significacion
de los coeficientes
conjunta
Significacion
de los coeficientes
Modelos de alternativas
multiples

Econometra II

discreta 32 / 37
Modelos de eleccion

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes

Modelos de alternativas multiples

Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Modelos de
alternativas multiples

Ejemplo

discreta 33 / 37
Modelos de eleccion

Econometra II

18:28:36

Modelos de alternativas multiples

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes

Los modelos de alternativas multiples

o multinomiales generalizan a los estudiados


hasta el momento para problemas donde la variable dependiente es nominal, es
de dos posibles resultados discretos.
decir, cuando existen mas
Algunos ejemplos pueden ser:
de la universidad en la que estudiar basandose

Eleccion
en las calificaciones del

estudiante, sus gustos, medios economicos,


etc.
Que candidato recibira el voto de una persona a partir de caractersticas de
mograficas
o socio-culturales.
de los trabajos
Posibles ocupaciones profesionales de una persona en funcion
etc.
de los padres, nivel de educacion,

Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Modelos de
alternativas multiples

Ejemplo

Econometra II

discreta 34 / 37
Modelos de eleccion

18:28:36

Modelos de alternativas multiples:

ejemplo
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

sobre la demanda de un determinado


Supongamos que disponemos de informacion
producto fabricado por tres marcas: A, B y C. Queremos estudiar el efecto que tiene
de cada marca. La variable
la variable edad de cada individuo (xi ) sobre la eleccion
(yij = 1) o no (yij = 0) de la marca j-esima

dependiente yij mide la eleccion


realizada por el individuo i:

El modelo Logit y Probit


Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes
Bondad de ajuste
de
Contrastacion

hipotesis

Ejemplo

yiB

=
=

yiC

1
0

marca A,
otra marca

1
0

marca B,
otra marca

1
0

marca C,
otra marca

El modelo quedara:

Modelos de alternativas
multiples

Modelos de
alternativas multiples

yiA

yij = 1 + 2 xi + ij ,

i = 1, ..., n;

j = A, B, C.

La probabilidad de que cada individuo elija una determinada marca es:


piA
piB
piC

=
=
=

11 + 21 xi ,
12 + 22 xi ,
13 + 23 xi ,

donde se ha de cumplir que la suma de las probabilidades es igual a la unidad.


discreta 35 / 37
Modelos de eleccion

Econometra II

18:28:36

Modelos de alternativas multiples:

ejemplo
Contenidos

Introduccion

En el caso del modelo logit multinomial, la probabilidad de escoger una de las alternativas es:

Modelos de eleccion
binaria

pij =

Modelo Lineal de
Probabilidad
El modelo Logit y Probit

e1j +2j xi
j=1

pi1 =

e11 +21 xi

P3

j=1

y el resto:

1j +2j xi

Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Modelos de
alternativas multiples

Ejemplo

i = 1, ..., n;

j = A, B, C.

Una de las alternativas es la de referencia:

Inferencia en los

modelos de eleccion
discreta
de los
Interpretacion
coeficientes

e1j +2j xi

P3

pij =

1+

P3

e1j +2j xi

1+

P3

e1j +2j xi
j=2

j=2

e1j +2j xi

j = B, C.

Los odds ratio se obtienen como el cociente entre probabilidades:


pij
= e1j +2j xi , j = B, C,
pi1
y el logaritmo del odd ratio:
ln

Econometra II

p 
ij

pi1

= 1j + 2j xi ,

j = B, C.

discreta 36 / 37
Modelos de eleccion

18:28:36

Modelos de alternativas multiples:

ejemplo
Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
El modelo Logit y Probit
Inferencia en los

modelos de eleccion
discreta

se pueden comparar entre las alternativas 2 y 3:


Tambien
pi2
12 + 22 xi
=
= e12 13 +(22 23 )xi .
pi3
13 + 23 xi

Para estimar los parametros,


utilizaremos el metodo
de maxima
verosimilitud. En
de verosimilitud es:
este ejemplo, la funcion
L

i=1
n

de los
Interpretacion
coeficientes
Bondad de ajuste
de
Contrastacion

hipotesis
Modelos de alternativas
multiples

Modelos de
alternativas multiples

Ejemplo

Econometra II

n
Y

i=1
n

i=1

1+

P3

1+

P3

1+

P3

j=2

e1j +2j xi

e12 +22 xi
j=2

e1j +2j xi

e13 +23 xi
e1j +2j xi
j=2

discreta 37 / 37
Modelos de eleccion

También podría gustarte