Está en la página 1de 22

MODELOS DE ELECCIÓN BINARIA

• Por qué algunas personas deciden ir a la universidad y otras no?

• Por qué unas mujeres deciden entrar en el mercado laboral y otras


no?

• Por qué unas personas compran vivienda y otras la alquilan?

• Por qué algunas deciden emigrar y otras no?

Los economistas a menudo están interesados en los factores que subyacen a los procesos
de toma de decisiones de los individuos y empresas.

1
MODELOS DE ELECCIÓN BINARIA

• Por qué algunas personas deciden ir a la universidad y otras no?

• Por qué unas mujeres deciden entrar en el mercado laboral y otras


no?

• Por qué unas personas compran vivienda y otras la alquilan?

• Por qué algunas deciden emigrar y otras no?

Los modelos que se han desarrollado para este propósito se conocen como modelos de
respuesta cualitativa o de elección binaria. El resultado de la toma de decisión será
denotado por Y y tomará el valor de 1 si el evento ocurre y 0 en caso contrario.

2
MODELOS DE ELECCIÓN BINARIA

• Por qué algunas personas deciden ir a la universidad y otras no?

• Por qué unas mujeres deciden entrar en el mercado laboral y otras


no?

• Por qué unas personas compran vivienda y otras la alquilan?

• Por qué algunas deciden emigrar y otras no?

Se han desarrollado modelos con más de dos posibles resultados pero nosotros nos
centraremos en los modelos de elección binaria: Y=0, Y=1.
3
MODELOS DE ELECCIÓN BINARIA

pi = p(Yi = 1) = β 1 + β 2 X i

El modelo de elección binaria más simple es el modelo de probabilidad lineal donde, como
su nombre indica, la probabilidad de que ocurra un evento es p, la cual se asume que es
una función lineal de un conjunto de variables explicativas.

4
MODELOS DE ELECCIÓN BINARIA

y, p pi = p(Yi = 1) = β 1 + β 2 X i
1

β1 +β2Xi

β1

0 Xi X

Si hay una única variable explicativa, ésta sería la representación gráfica.

5
MODELOS DE ELECCIÓN BINARIA

pi = p(Yi = 1) = β 1 + β 2 X i

Por supuesto, p no se puede observar. Observamos los datos de los resultados, Y. En el


modelo de probabilidad lineal la variable dependiente Y es una variable ficticia o dummy
que puede tomar el valor Y=0, Y=1.

6
MODELOS DE ELECCIÓN BINARIA

• Por qué algunas personas consiguen finalizar bachillerato y otras


no?

Usaremos este proceso de decisión como ejemplo. Definimos una variable GRAD que es
igual a 1 si se finaliza el bachillerato, y 0 en caso contrario.

7
MODELOS DE ELECCIÓN BINARIA

. g GRAD = 0

. replace GRAD = 1 if S > 11


(509 real changes made)

. reg GRAD ASVABC

Source | SS df MS Number of obs = 540


-------------+------------------------------ F( 1, 538) = 49.59
Model | 2.46607893 1 2.46607893 Prob > F = 0.0000
Residual | 26.7542914 538 .049729166 R-squared = 0.0844
-------------+------------------------------ Adj R-squared = 0.0827
Total | 29.2203704 539 .05421219 Root MSE = .223

------------------------------------------------------------------------------
GRAD | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
ASVABC | .0070697 .0010039 7.04 0.000 .0050976 .0090419
_cons | .5794711 .0524502 11.05 0.000 .4764387 .6825035
------------------------------------------------------------------------------

Aquí observamos los resultados de la regresión entre GRAD y ASVABC. Podemos concluir
que por cada punto adicional en ASVABC se incrementa la probabilidad de graduarse en
0.007 (un 0.7%).
8
MODELOS DE ELECCIÓN BINARIA

. g GRAD = 0

. replace GRAD = 1 if S > 11


(509 real changes made)

. reg GRAD ASVABC

Source | SS df MS Number of obs = 540


-------------+------------------------------ F( 1, 538) = 49.59
Model | 2.46607893 1 2.46607893 Prob > F = 0.0000
Residual | 26.7542914 538 .049729166 R-squared = 0.0844
-------------+------------------------------ Adj R-squared = 0.0827
Total | 29.2203704 539 .05421219 Root MSE = .223

------------------------------------------------------------------------------
GRAD | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
ASVABC | .0070697 .0010039 7.04 0.000 .0050976 .0090419
_cons | .5794711 .0524502 11.05 0.000 .4764387 .6825035
------------------------------------------------------------------------------

La ordenada en el origen sugiere que una persona con un cero en el ASVABC tiene un 58%
de probabilidad de graduarse. Lo cual carece de sentido.
9
MODELOS DE ELECCIÓN BINARIA

pi = p(Yi = 1) = β 1 + β 2 X i

Lamentablemente, el modelo de probabilidad lineal adolece de serios problemas. En primer


lugar, existen problemas relacionados con el término de la perturbación.

10
MODELOS DE ELECCIÓN BINARIA

pi = p(Yi = 1) = β 1 + β 2 X i

Yi = E (Yi ) + ui

Como es usual el valor de la variable dependiente Yi en la observación i tiene un


componente no estocástico y otro aleatorio. El primero depende de Xi y los parámetros y el
segundo depende de la perturbación aleatoria.
11
MODELOS DE ELECCIÓN BINARIA

pi = p(Yi = 1) = β 1 + β 2 X i

Yi = E (Yi ) + ui

E (Yi ) = 1 × pi + 0 × (1 − pi ) = pi = β 1 + β 2 X i

El componente no estocástico en la observación i es su valor esperado. Como Yi= 1 con


probabilidad pi, Yi= 0 con probabilidad (1 – pi), el valor esperado en la observación i es β1 +
β2Xi.

12
MODELOS DE ELECCIÓN BINARIA

pi = p(Yi = 1) = β 1 + β 2 X i

Yi = E (Yi ) + ui

E (Yi ) = 1 × pi + 0 × (1 − pi ) = pi = β 1 + β 2 X i

Yi = β 1 + β 2 X i + ui

Eso significa que podemos escribir el modelo como figura arriba.

13
MODELOS DE ELECCIÓN BINARIA

Y, p pi = p(Yi = 1) = β 1 + β 2 X i
1

β1 +β2Xi

β1

0 Xi X

La función de probabilidad es por tanto el componente no estocástico de la relación entre Y


y X.
14
MODELOS DE ELECCIÓN BINARIA

pi = p(Yi = 1) = β 1 + β 2 X i

Yi = E (Yi ) + ui

E (Yi ) = 1 × pi + 0 × (1 − pi ) = pi = β 1 + β 2 X i

Yi = β 1 + β 2 X i + ui

Yi = 1 ⇒ ui = 1 − β 1 − β 2 X i

Yi = 0 ⇒ ui = − β 1 − β 2 X i

En la observación i, cuando Yi es 1, ui debe ser (1 – β1 – β2Xi). Cuando Yi=0, ui debe ser (– β1


– β2Xi).
15
MODELOS DE ELECCIÓN BINARIA

Y, p pi = p(Yi = 1) = β 1 + β 2 X i
A
1
1 – β1 – β2Xi
β1 +β2Xi

β1 β1 + β2Xi

B
0 Xi X

Los dos posibles valores, que corresponden a las observaciones A y B, se ilustran en el


gráfico. u toma únicamente dos posibles valores. En particular, u no presenta una
distribución normal. Conclusión: No podemos realizar los contrastes usuales. 16
MODELOS DE ELECCIÓN BINARIA

σ u2 = ( β 1 + β 2 X i )(1 − β 1 − β 2 X i )
i

Y, p
A
1
1 – β1 – β2Xi
β1 +β2Xi

β1 β1 + β2Xi

B
0 Xi X

Se puede demostrar que la varianza poblacional de la perturbación en la observación i


viene dada por (β1 + β2Xi)(1 – β1 – β2Xi). Esta varianza cambia con Xi, por tanto, también hay
un problema de heterocedasticidad. 17
MODELOS DE ELECCIÓN BINARIA

Y, p
A
1
1 – β1 – β2Xi
β1 +β2Xi

β1 β1 + β2Xi

B
0 Xi X

Otro problema es que el modelo de probabilidad lineal puede predecir probabilidades


mayores que 1 (zona en amarillo) o menores que 0.
18
MODELOS DE ELECCIÓN BINARIA

Fitted |
values | Freq. Percent Cum.
------------+-----------------------------------
1.000381 | 6 4.76 4.76
1.002308 | 9 7.14 11.90
1.004236 | 7 5.56 17.46
1.006163 | 3 2.38 19.84

……………………………………………………………………………………………………………………...

1.040855 | 11 8.73 93.65


1.042783 | 3 2.38 96.03
1.04471 | 2 1.59 97.62
1.046638 | 3 2.38 100.00
------------+-----------------------------------
Total | 126 100.00

Vemos que hay 126 observaciones donde se predicen probabilidades superiores a 1.

19
MODELOS DE ELECCIÓN BINARIA

. tab PROB if PROB > 1


Fitted |
values | Freq. Percent Cum.
------------+-----------------------------------
1.000381 | 6 4.76 4.76
1.002308 | 9 7.14 11.90
1.004236 | 7 5.56 17.46
1.006163 | 3 2.38 19.84

*********************************************

1.040855 | 11 8.73 93.65


1.042783 | 3 2.38 96.03
1.04471 | 2 1.59 97.62
1.046638 | 3 2.38 100.00
------------+-----------------------------------
Total | 126 100.00

. tab PROB if PROB < 0


no observations

En este ejemplo no se predicen probabilidades negativas para ningún valor de X.

20
MODELOS DE ELECCIÓN BINARIA

. tab PROB if PROB > 1


Fitted |
values | Freq. Percent Cum.
------------+-----------------------------------
1.000381 | 6 4.76 4.76
1.002308 | 9 7.14 11.90
1.004236 | 7 5.56 17.46
1.006163 | 3 2.38 19.84

*********************************************

1.040855 | 11 8.73 93.65


1.042783 | 3 2.38 96.03
1.04471 | 2 1.59 97.62
1.046638 | 3 2.38 100.00
------------+-----------------------------------
Total | 126 100.00

. tab PROB if PROB < 0


no observations

La principal ventaja del modelo de probabilidad lineal respecto al modelo logit y probit es
que resulta más fácil de estimar. Por esta razón se recomienda su uso para trabajo
exploratorio.
21
MODELOS DE ELECCIÓN BINARIA

. tab PROB if PROB > 1


Fitted |
values | Freq. Percent Cum.
------------+-----------------------------------
1.000381 | 6 4.76 4.76
1.002308 | 9 7.14 11.90
1.004236 | 7 5.56 17.46
1.006163 | 3 2.38 19.84

*********************************************

1.040855 | 11 8.73 93.65


1.042783 | 3 2.38 96.03
1.04471 | 2 1.59 97.62
1.046638 | 3 2.38 100.00
------------+-----------------------------------
Total | 126 100.00

. tab PROB if PROB < 0


no observations

Sin embargo, esta ventaja no debería ser decisiva porque hoy en día los ordenadores son
una herramienta rápida y eficiente. Además, el modelo logit y probit están presentes en la
mayoría de los software estadísticos.
22

También podría gustarte