Está en la página 1de 27

Tema 3: Modelos de elección discreta

OBJETIVOS DOCENTES

- Proponer diferentes ejemplos en los cuales la variable dependiente es una variable


que sólo toma dos valores.
- Conocer las deficiencias del modelo de regresión clásico cuando la variable
dependiente es discreta
- Explicar por qué el modelo probit o el logit es preferible al modelo de regresión clásico
cuando la variable dependiente es discreta.
- Interpretar los coeficientes de un modelo logit y probit
- Obtener el logaritmo de la función de verosimilitud.
- Conocer el procedimiento de SPSS para estimar un modelo logit
- Contrastar la significación conjunta e individual de las variables independiente del
modelo logit con las salidas de SPSS.
- Analizar la bondad del ajuste.
- Clasificar el grupo de pertenencia de los individuos
Modelos de elección discreta

Tema 3. Modelos de elección discreta.

3.1 Introducción.
3.2 Modelo lineal de probabilidad
3.3 Modelo logit y probit

Bibliografía:

Goldberger, A.S. (2001): Introducción a la Econometría, Ariel, Barcelona, cap. 17.

2
Modelos de elección discreta

3.1 Introducción. Motivación

Los modelos de elección discreta tratan de explicar una variable cualitativa en función de otras
variables (cualitativas y cuantitativas).

Con sólo dos alternativas posibles mutuamente excluyentes:


Modelos de elección binaria:
1. El modelo lineal de probabilidad
2. El modelo logit
3. El modelo probit
Modelos
Elección discreta

Con más de dos alternativas:


Modelos de elección multinomiales

3
Modelos de elección discreta

Ejemplos:

Estudio sobre si una mujer participa o no en el mercado de trabajo a partir de algunas


características de la misma: el estado civil, la edad, la educación, el número de hijos menores de
6 años, el lugar de residencia... En este caso la variable dependiente del modelo será:
1
0

Análisis de si un cliente de un banco recibe un préstamo bancario en función de una serie de


variables, por ejemplo, la renta.
1 ecibe préstamo
0 é

4
Modelos de elección discreta

3.2 Modelo lineal de probabilidad

1 el individuo i-ésimo presenta la característica A


Yi  
0 el individuo i-ésimo no presenta la característica A
Forma escalar ⋯ 1…
1…
Forma matricial: Y  X  

Por un lado, Yi es una variable dicotómica, en concreto una variable de Bernouilli:




E (Yi )  1 pi  0(1  pi )  pi Var (Yi )  pi (1  pi )

Por otro lado, a partir de la especificación lineal del modelo y asumiendo que
E (Yi )   o  1 X 1i  .....   k X ki

Por tanto, pi   o  1 X 1i  .....   k X ki


5
Modelos de elección discreta

Ejemplo 1.- Concesión de préstamos


Se quiere analizar la relación entre que un banco conceda un préstamo o no (Y) y la
renta del cliente.

Yi   o  1 X 1i   i i  1..21

1 é
y Xi= renta
0 é

Por tanto, el modelo especficado premite analizar si la renta influye en la probabilidad


de que te concedan un préstamao

Los datos están en el fichero prestamo.sav

6
Modelos de elección discreta

El siguente gráfico muestra el diagrama de dispersión de los valores observados y los valores
estimados y la renta. Analizar / Regresión / Regresión lineal.

La variable dependiente sólo toma


dos valores: 0 o 1.

Los valores ajustados no se


parecen mucho a los valores
d observados. Un mal ajuste.

Hay valores ajustados


(probabilidades) negativos,
incluso puede haber también
valores superiores a 1

7
Modelos de elección discreta

Problemas que presenta la estimación por MCO


1. La distribución de las perturbaciones no es una normal. Sólo puede tomar dos
valores  i  Yi   o  1 X 1i  .....   k X ki 

Los únicos valores que puede tener la variable dependiente son 0 y 1.Entonces,
1   o  1 X 1i  .....   k X ki 
i  
   o  1 X 1i  .....   k X ki 

2. El modelo presenta hereroscedasticidad

Var ( i )  pi (1  pi )

3. La variable = puede tomar valores tanto en el intervalo [0,1] como fuera de él.
Una solución a este problema (el más importante) implica la utilización de los
modelos LOGIT Y PROBIT, dado que garantizan que la probabilidad estimada se
encuentre en el intervalo [0,1]
8
Modelos de elección discreta

3.3 Modelo logit y probit

La idea de estos nuevos planteamientos consiste en obligar a que las predicciones del
modelo se encuentren en el intervalo [0,1]. Para ello se formula el modelo con una
función F que toma sus valores en dicho intervalo; esto es,

⋯. …
,
Donde 0 . 1

Por lo tanto
1
0 1 1

9
Modelos de elección discreta

Formulación
Modelo logit : asume una función de distribución logística de parámetros α=0 y β=1 , la
esperanza es cero y desviación típica es 1,814

1

⋯.

⋯. ⋯.

⋯.
1 ⋯.
1
1
0 1 ⋯.
1

⋯.
1
10
Modelos de elección discreta

Modelo Probit: asume una función de distribución N(0,1)


x 2
1  t2
F x   e dt
t 
2

⋯.


⋯.
1
1…
√2

⋯.


11
Modelos de elección discreta

1.0

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0
-5 -4 -3 -2 -1 0 1 2 3 4 5

F. Logística F.D. Normal(0,1)

12
Modelos de elección discreta

Estimación (Máxima verosimilitud).


Tenemos observaciones independientes que siguen una distribución:
1 p p Y 1 F Xβ
Y
0 1 p p Y 0 1 F Xβ

La densidad de Yi es 1 (Tablas de Estadística II)

La densidad de Yi dado X’i puede escribirse como:

; 1 1

La función de verosimilitud es

F Xβ 1 F Xβ

13
Modelos de elección discreta

El logaritmo neperiano de la función de verosimilitud

1 1

El estimador máximo verosímil de ,



Función no lineal en . Hay que emplear algoritmos de optimización no lineal.
Propiedades
Consistentes
Asintóticamente normales
Asintóticamente eficientes.

14
Modelos de elección discreta

Interpretación de los parámetros


Como en cualquier modelo no lineal, la interpretación de los parámetros no es la usual (el efecto
marginal de una variable permaneciendo el resto constante)

⋯. ′

⋯ ′

donde f(.) es la función de densidad.

Efecto marginal de Xj en la probabilidad depende de ′ a través de ′ . Sin embargo, el


signo del efecto viene dado por el signo de βj.

15
Modelos de elección discreta

Comentarios sobre el efecto marginal de un regresor ′

1) Dado que la función de densidad siempre toma valores positivos, el signo de está
determinado por . Por ejemplo, en el caso de los préstamos, si el coeficiente de la renta es
positivo, significa que a mayor renta mayor es la probabilidad de que te concedan un préstamo.

2) Cuando cambia, también lo hace la función de densidad ′ y cambia el efecto marginal


del regresor. Por lo tanto, el efecto marginal no se mantiene constante:

 El efecto máximo se alcanza cuando 0, que es cuando la función de densidad


alcanza el máximo.
 El efecto mínimo se alcanza cuando toma valores muy grandes o muy pequeños,
que es cuando la función de densidad toma valores próximos a cero

16
Modelos de elección discreta

3) Interpretación adicional en el Modelo logit (ODD ratio)

La función de densidad logística es:


1
1

Por tanto, dado que ′

′ 1 ′

17
Modelos de elección discreta

El ODD de 1 es el cociente entre la probabilidad de que 1 y la probabilidad de que


0:
1
0
Si para el individuo i-ésimo 1, indica que es más probable que ocurra 1 que su
contrario. ¿Cómo se interpretaría =5?

En el modelo logit

1
1 0 1
1 1
Por tanto,

⋯.

18
Modelos de elección discreta

Consideremos el cociente entre dos odds (ODDS RATIO) para los valores
⋯ 1 ⋯ y ⋯ ⋯ .
Es decir, todos los regresores constantes salvo el regresor j-ésimo que ha aumentado en una
unidad:

⋯ 1 ⋯
⋯ ⋯

⋯ 1 ⋯
⋯ ⋯

19
Modelos de elección discreta

⋯ ⋯
⋯ ⋯

Por tanto, es el Odds ratio cuando aumenta en una unidad, permaneciendo el resto de
regresores constantes.
¿Cómo se interpretaría un 1?
¿Cómo se interpretaría un 1,12?
¿Cómo se interpretaría un 0,95?

20
Modelos de elección discreta

Inferencia en el modelo Logit y Probit


Contrastes de significación individual (contraste de Wald)

H0 :  j  0 Xj no significativo 
H1 :  j  0 Xj significativo 

21
Modelos de elección discreta

Variables en la ecuación
B E.T. Wald gl Sig. Exp(B)
renta ,172 ,017 100,619 1 ,000 1,187
Paso 1a
Constante -4,389 ,275 254,766 1 ,000 ,012
a. Variable(s) introducida(s) en el paso 1: renta.

La renta es una variable significativa para estudiar la probabilidad de conceder un


préstamo. El signo del coeficiente estimado nos sirve para ver el signo del cambio en la
probabilidad. Por lo tanto, en este caso al incrementarse la renta se incrementa la
probabilidad de que te concendan un préstamo.

El valor Exp (B) asociado con la renta es 1,187: cuando se incrementa la renta en una
unidad, el odds de que te concendan un préstamo se incrementa en el 18,7%.

22
Modelos de elección discreta

El modelo permite hacer predicciones dentro y fuera de la muestra. Así, en el primer


caso, la probabilidad estimada de que al primer individuo de la muestra, con unos
ingresos mensuales de 6,97 unidades monetaria, se le conceda un préstamos es de
0.03.
. , ∗ ,
e
p Y 1 0.03
1 e . , ∗ ,

Dado que la probabilidad estimada es menor que 0.5, el modelo prevee que no se le
concede el prestamo. Podemos comprobar que, en este caso, el modelo acierta.

Si quisiéramos hacer prediciones fuera de la muestra, por ejemplo, predecir la


probabilidad de que te concedan un préstamo con ingresos de 20 unidades monetarias
resultaría ser 0.28,
. , ∗
e
p Y 1 . , ∗
0,28
1 e

23
Modelos de elección discreta

Contrastes de significación conjunta (Prueba ómnibus)


H0 : 1  2    k  0 Regresión no significativa 
H1 : Algún  j  0 Regresión significativa 

2 ó .

donde es la función de verosimilitud evaluada en el estimador MV restringido y


ó es la función de verosimilitud evaluada en el estimador MV sin restringir.

Pruebas ómnibus de coeficientes de modelo


Chi-cuadrado gl Sig.
Paso 1 Paso 109,664 1 ,000
Bloque 109,664 1 ,000
Modelo 109,664 1 ,000

24
Modelos de elección discreta

Bondad de ajuste

1) Porcentaje de aciertos y errores en la predicción

  0.5 estimamos que Y  1


Si p i i
  0.5 estimamos que Y  0
Si p i i

Considerando el número de aciertos y errores, se obtienen y valoran los porcentajes de aciertos


cuando Yi  1 y cuando Yi  0 , así como el porcentaje de aciertos global.
Estimado
  0.5   0.5 Porcentaje
p i p i correcto
Yi  1 Acierto Error --%
Observa

Yi  0 Error Acierto --%


do

Global --%

25
Modelos de elección discreta

3) Los pseudo- R2
Al igual que el coeficiente de determinación de la regresión lineal, se puede definir una medida
de bondad del ajuste que es parecido a un R2, basado las funciones de verosimilitud para el
estimador en el modelo sin restricciones y en el modelo restringido (sólo con termino
independiente).
/

1
ó

ln ó
1
ln

http://www.ats.ucla.edu/stat/mult_pkg/faq/general/Psuedo_RSquareds.htm
http://pic.dhe.ibm.com/infocenter/spssstat/v22r0m0/index.jsp?topic=%2Fcom.ibm.spss.statistics.
cs%2Fspss%2Ftutorials%2Fplum_germcr_rsquare.htm
26
Modelos de elección discreta

Resumen del modelo


Paso -2 log de la R cuadrado R cuadrado El valor -2*log likelihood (476.705) de la tabla
verosimilitu de Cox y de Resumen del modelo puede usarse para
d Snell Nagelkerke comparar modelos anidados. Esta tabla nos da
a
1 476,705 ,104 ,234
también dos Pseudo-R cuadrados

El 99,1% de los que no recibieron el


a
Tabla de clasificación préstamo fueron clasificados
Observado Pronosticado correctamente a partir del modelo. Sin
Prestam Porcentaje embargo, de los que recibieron el
0 1 correcto
préstamo, sólo el 1,2 % fue clasificado
0 906 8 99,1
Paso 1
prestam
1 85 1 1,2
correctamente por el modelo. El
Porcentaje global 90,7 porcentaje global de aciertos es el
90,5%.

27

También podría gustarte