Documentos de Académico
Documentos de Profesional
Documentos de Cultura
i
Y
0 en caso contrario
X
ki
= Variables explicativas
i
Variable aleatoria que se distribuye normal ( )
2
, 0 N
La distribucin de la muestra en este tipo de modelos se caracteriza por configurar una
nube de puntos de tal manera que las observaciones muestrales se dividen en dos
subgrupos. Uno de ellos est formado por las observaciones en las que ocurri el
acontecimiento objeto de estudio ) 1 (
i
Y , y el otro, por los puntos muestrales en los
que no ocurri ) 0 (
i
Y .
Una representacin grfica de la nube de
puntos para el caso de una sola variable
explicativa es la que aparece en el grfico,
en el que la variable explicativa se
representa en el eje de abscisas y la
variable endgena en el eje de ordenadas.
La elaboracin del modelo lineal de
probabilidad requiere el ajuste de esa nube
de puntos a una funcin lineal (recta de
regresin) capaz de explicar de la mejor
manera el comportamiento de la muestra.
Nube de puntos en un
modelo de respuesta dicotmica
-0.5
0.0
0.5
1.0
1.5
0 10 20 30 40 50 60
XI
E
N
D
O
G
E
N
A
6
El Modelo Lineal de Probabilidad, ecuacin (4), se puede interpretar en trminos
probabilsticos, en el sentido de que un valor concreto de la recta de regresin mide la
probabilidad de que ocurra el acontecimiento objeto de estudio. Es decir,
i
Y
se puede
considerar como la estimacin de la probabilidad de que ocurra el acontecimiento objeto
de estudio (Y
i
=1) siguiendo el siguiente criterio: valores prximos a cero se
corresponden con una baja probabilidad de ocurrencia del acontecimiento analizado
(menor cuanto ms prximos a cero); mientras que a valores prximos a uno se les
asigna una probabilidad elevada de ocurrencia (mayor cuanto ms prximos a uno).
La interpretacin de los coeficientes estimados en los Modelos Lineales de Probabilidad
(MLP) es la misma que la del Modelo Lineal General, recogiendo el valor del parmetro
el efecto de una variacin unitaria en cada una de las variables explicativas sobre la
probabilidad de ocurrencia del acontecimiento objeto de estudio. As, si se produce un
incremento de una unidad en la variable explicativa
i
X
1
, ese aumento provocara una
variacin igual a
1
en la probabilidad ) 1 (
i
f .
Limitaciones de la estimacin por MCO
La estimacin del modelo anterior por Mnimos Cuadrados Ordinarios plantea una serie
de limitaciones que se pasan a comentar a continuacin:
1. El valor estimado puede estar fuera del rango (0 - 1). La estimacin del Modelo
Lineal de Probabilidad a travs de MCO no garantiza que los valores estimados de
i
Y
estn entre 0 y 1, lo cual carece de lgica al interpretarse el valor estimado como una
probabilidad. Este problema se soluciona truncando el rango de variacin del valor
estimado, dando lugar al modelo conocido con el nombre de Modelo Probabilstico
Lineal Truncado, y que, para una nica variable explicativa, se expresa de la forma:
1 1 +
ki k
X
i
Y
ki k
X +
1 0 < + <
ki k
X
0 0 +
ki k
X
Sin embargo, si se restringen los valores de Y
i
a 0 y 1, los valores del trmino
independiente y la pendiente varan segn los valores de X
i
, de tal forma que:
- Para /
i
X : Trmino independiente y pendiente iguales a 0.
- Para / ) 1 ( /
i
X : Trmino independiente igual y pendiente
igual a .
7
- Para / ) 1 (
i
X : Trmino independiente igual a 1 y pendiente igual a 0.
Esto har que si se incluyen en la estimacin puntos en los que /
i
X
/ ) 1 (
i
X los estimadores sern sesgados e inconsistentes.
2. La perturbacin aleatoria puede no seguir una distribucin Normal: Dados los valores
que toma la perturbacin aleatoria no se puede asegurar que sta se distribuya como una
normal, al tratarse de una distribucin binaria o dicotmica. Si bien el incumplimiento
de la hiptesis de normalidad no invalida la estimacin por MCO, ya que los
estimadores as estimados siguen siendo ELIO, sin embargo, la ausencia de normalidad
imposibilita el uso de los estadsticos habituales utilizados para realizar el contraste de
hiptesis tales como la t-Student, la F-Snedecor, etc, al basarse dichos contrastes en la
hiptesis de normalidad de la perturbacin aleatoria.
3. Problemas de heterocedasticidad: An en el caso de que se cumpliesen las hiptesis
de media y correlacin nula en la perturbacin aleatoria 0 ) ( (
i
E y 0 ) (
j i
E para
todo ) j i no se cumple la hiptesis de varianza constante, es decir, la perturbacin
aleatoria no es homocedstica. Para comprobarlo se calcula la varianza de la
perturbacin aleatoria a travs de su definicin:
+ )) 1 ( 1 ( ) ( ) 1 ( ) 1 ( ) ( )) ( ( ) (
2 2 2 2
i ki i ki k i i i i
f X f X E E E Var
( ) ( ) ( ) ( ) ( ) ) 1 ( ) 1 ( 1 ) 1 ( ) 1 ( 1 ) 1 ( ) 1 ( 1 ) 1 ( 1 ( ) 1 ( ) 1 ( ) 1 ( 1
2
2
i i i i i i i i i i
f f f f f f f f f f + +
(5)
La varianza de la perturbacin aleatoria es una funcin de la probabilidad ) 1 (
i
f , la cual
es a su vez funcin de cada una de las observaciones de las variables explicativas
ki
X .
La perturbacin aleatoria es, por tanto, heterocedstica y la estimacin del modelo
mediante el mtodo de MCO obtiene unos estimadores de los coeficientes de regresin
con varianza no mnima, es decir, no eficientes.
Este problema podra solucionarse estimando el modelo a travs de Mnimos Cuadrados
Generalizados (MCG). A este tipo de modelos se les denomina Modelos Lineales
Probabilsticos Ponderados. La estimacin a travs de MCG requiere la realizacin de
los siguientes pasos:
- Se estima el modelo (4) mediante MCO sin tener en cuenta el problema de
heterocedasticidad, obtenindose el valor estimado
i
Y
.
- El valor
i
Y
1 (
) 1 ( ) 1 ( 1 ) (
i i i i i i
Y Y f f Var (6)
- Si los valores estimados de
i
Y
1 (
2
i i i
Y Y , con el fin de transformar el modelo
en homocedstico.
2 2 2
1
2
2
1
2
1
...
1
i
i
i
ki
k
i
i
i i
i
X X Y
+ + + + (7)
La estimacin por MCO del modelo transformado es equivalente a aplicar MCG en el
modelo (4) y en ambos casos se obtienen estimaciones eficientes de los coeficientes de
regresin.
Sin embargo, uno de los problemas que presenta la estimacin por MCG es la prdida
del trmino independiente en el modelo. La omisin del trmino independiente puede
provocar que la suma de los residuos sea distinta de cero lo que puede tener
consecuencias sobre el coeficiente de determinacin (puede ser negativo), la funcin de
verosimilitud estimada a partir de los residuos y los estadsticos que se obtienen a partir
de ella.
4. El coeficiente de determinacin R
2
est subestimado. La suma de los cuadrados de
los residuos ( )
2
i
e es ms grande de lo habitual debido a la forma especfica en que se
distribuye la nube de puntos de una variable dicotmica. Dado que el clculo del
coeficiente de determinacin
2
se ve afectado por
2
i
e , el R
2
calculado en la
estimacin por MCO es ms pequeo de lo que realmente debera ser.
2
El coeficiente de determinacin se obtiene a travs de la frmula
2
2
2
)
(
1
i i
i
Y Y
e
R
9
4. MODELOS DE PROBABILIDAD NO LINEAL
La estimacin e interpretacin de los modelos probabilsticos lineales plantea una serie
de problemas que han llevado a la bsqueda de otros modelos alternativos que permitan
estimaciones ms fiables de las variables dicotmicas. Para evitar que la variable
endgena estimada pueda encontrarse fuera del rango (0, 1), las alternativas disponibles
son utilizar modelos de probabilidad no lineales, donde la funcin de especificacin
utilizada garantice un resultado en la estimacin comprendido en el rango 0-1. Las
funciones de distribucin cumplen este requisito, ya que son funciones continuas que
toman valores comprendidos entre 0 y 1.
Especificacin de los modelos de eleccin discreta (Logit y Probit)
Dado que el uso de una funcin de distribucin garantiza que el resultado de la
estimacin est acotado entre 0 y 1, en principio las posibles alternativas son varias,
siendo las ms habituales la funcin de distribucin logstica, que ha dado lugar al
modelo Logit, y la funcin de distribucin de la normal tipificada, que ha dado lugar al
modelo Probit. Tanto los modelos Logit como los Probit relacionan, por tanto, la
variable endgena Y
i
con las variables explicativas X
ki
a travs de una funcin de
distribucin.
En el caso del modelo Logit, la funcin utilizada es la logstica, por lo que la
especificacin de este tipo de modelos queda como sigue
i X
X
i X i
i k k
i k k
i k k
e
e
e
Y
+
+
+
+
+
+
1 1
1
(8)
En el caso del modelo Probit la funcin de distribucin utilizada es la de la normal
tipificada, con lo que el modelo queda especificado a travs de la siguiente expresin,
i
s
X
ds e Yi
i
+
+
2
2 / 1
2
) 2 (
1
(9)
donde la variable s es una variable muda de integracin con media cero y varianza
uno.
Dada la similitud existente entre las curvas de la normal tipificada y de la logstica, los
resultados estimados por ambos modelos no difieren mucho entre s
3
, siendo las
3
Discrepan, nicamente, en la rapidez con que las curvas se aproximan a los valores extremos, y as la
funcin logstica es ms achatada que la normal al alcanzar, esta ltima, ms rpidamente los valores
extremos (0 y 1).
10
diferencias operativas, debidas a la complejidad que presenta el clculo de la funcin de
distribucin normal frente a la logstica, ya que la primera solo puede calcularse en
forma de integral. La menor complejidad de manejo que caracteriza al modelo Logit es
lo que ha potenciado su aplicacin en la mayora de los estudios empricos.
Al igual que en el Modelo Lineal de Probabilidad, el Modelo Logit (8) se puede
interpretar en trminos probabilsticos, es decir, sirve para medir la probabilidad de que
ocurra el acontecimiento objeto de estudio (Y
i
=1). En cuanto a la interpretacin de los
parmetros estimados en un modelo Logit, el signo de los mismos indica la direccin en
que se mueve la probabilidad cuando aumenta la variable explicativa correspondiente,
sin embargo, la cuanta del parmetro no coincide con la magnitud de la variacin en la
probabilidad (como si ocurra en el MLP). En el caso de los modelos Logit, al suponer
una relacin no lineal entre las variables explicativas y la probabilidad de ocurrencia del
acontecimiento, cuando aumenta en una unidad la variable explicativa los incrementos
en la probabilidad no son siempre iguales ya que dependen del nivel original de la
misma.
Una interpretacin ms sencilla del parmetro estimado es la que se obtiene a travs de
la linealizacin del modelo . Para ello, partiendo de la ecuacin general del Modelo
Logit (8) y definido M
i
como la probabilidad del estado o la alternativa 1, se tiene
ki k
ki k
X
X
i i i
e
e
M Y ob Y E
+
+
+
1
) 1 ( Pr ) ( (10)
de donde:
ki k i k k
X X
i i
e e M M
+ +
+
i k k
X
i i
e M M
+
) 1 ( (11)
ki k
X
i
i
e
M
M
+
) 1 (
Al cociente entre la probabilidad de que ocurra un hecho, o de que se elija la opcin 1,
frente a la probabilidad de que no suceda el fenmeno, o de que se elija la opcin 0, se
la denomina como la ratio odds. Su interpretacin es la ventaja o preferencia de la
opcin 1 frente a la 0, es decir, el nmero de veces que es ms probable que ocurra el
fenmeno frente a que no ocurra.
Ratio odds =
) 1 (
i
i
M
M
11
El ratio odds
4
, tal y como est construido (cociente entre probabilidades), siempre ser
mayor o igual que 0. El campo de variacin del ratio va desde 0 hasta + , y su
interpretacin se realiza en funcin de que el valor sea igual, menor o superior a la
unidad: si toma el valor 1 significa que la probabilidad de que ocurra la alternativa 1 es
la misma que la de que no ocurra; si el ratio es menor que 1 indica que la ocurrencia de
la alternativa 1 tiene menor probabilidad que la ocurrencia de la alternativa 0; mientras
que si es mayor que la unidad la opcin 1 es ms probable que la 0.
El inters de esta medida adquiere sentido cuando se comparan las ventajas para
distintos valores de la variable explicativa, calculndose el cociente entre odds. As, si
se compara la situacin de la observacin i con la de la observacin j (que suele ser
la de referencia), el cociente entre odds mide cuanto es ms probable que se de la
alternativa 1 en i que en j.
Cociente entre odds =
) (
) 1 (
) 1 (
jj ii k
kj k
ki k
X X
X
X
j
j
i
i
e
e
e
M
M
M
M
+
+
Si el valor obtenido es mayor a la unidad, la probabilidad de ocurra la alternativa 1 en la
observacin i es mayor que en la observacin j, mientras que si el valor obtenido es
inferior a uno, la probabilidad de ocurrencia de la alternativa 1 es superior en la
observacin j que en la i. Si el valor obtenido es igual a la unidad significa que las
probabilidades en ambas observaciones son iguales.
El clculo del cociente entre odds facilita la interpretacin de los parmetros estimados
cuando se aplica al caso concreto de calcular la variacin en la preferencia o ventaja de
un individuo i cuando incrementa en una unidad una de las variables explicativas,
frente a la ventaja o preferencia del mismo individuo i cuando se encuentra en la
situacin de referencia, obtenindose para este caso concreto
4
Tomando logaritmos neperianos del ratio odds se linealiza la ecuacin del modelo Logit, respetando el
objetivo de que los valores estimados caigan dentro del rango (0-1), obtenindose la expresin:
i k k
X
i
i
X e Ln
M
M
Ln
i k k
+
,
_
+
) (
1
La nueva variable
,
_
i
i
M
M
Ln
1
generada representa en una escala logartmica la diferencia entre las
probabilidades de que ocurra la alternativa 1 y su contraria.
12
k kj ki k
ki k
ki k
e e
e
e
M
M
M
M
Odds entre Cociente
X X
X
X
i
i
i
i
+
+
+ +
+
+
) 1 (
) 1 (
1
1
) 1 (
) 1 (
De donde el parmetro
k
e
F
i
i
i
i
n
Y
P
1
(12)
La generalizacin del modelo a k variables explicativas implica la existencia de
observaciones repetidas de Y para cada combinacin de las k variables explicativas,
pudindose calcular las proporciones o probabilidades muestrales de la misma forma
que en el caso anterior. En este caso, si bien los valores de la variable endgena estn
acotados en el rango 0-1, son valores continuos, por lo que el mtodo utilizado para la
estimacin de los parmetros del modelo es el que habitualmente se utiliza en la
econometra tradicional que trabaja con variables continuas.
13
Por lo tanto, ante la presencia de observaciones repetidas, se podra aplicar el mtodo de
Mnimos Cuadrados Ordinarios. Sin embargo, la existencia de heterocedasticidad en el
modelo obliga a estimar por Mnimos Cuadrados Generalizados, para garantizar el
cumplimiento de las propiedades de los parmetros estimados, utilizndose la inversa de
la varianza de los errores como ponderacin del modelo.
Sin embargo, lo ms habitual es no poder calcular las probabilidades muestrales, bien
porque las variables explicativas incluidas en el modelo son continuas, o bien porque
an siendo stas discretas, la combinacin de las mismas impide la obtencin de
observaciones repetidas de la variable endgena para cada uno de los intervalos F. En
esta situacin, la matriz de datos muestrales estar formada por n observaciones
pudiendo ser el valor de la variable endgena para cada una de ellas 1 0. La naturaleza
dicotmica de la variable dependiente en este tipo de modelos impide la utilizacin de
los mtodos tradicionales en la estimacin de los parmetros, al no poderse calcular la
inversa de la varianza utilizada como ponderacin del modelo. Para la estimacin de los
parmetros se utiliza el mtodo de Mxima Verosimilitud.
A continuacin se describen ambos mtodos de estimacin (mxima verosimilitud y
mnimos cuadrados generalizados) comenzando por el caso ms habitual de ausencia de
observaciones repetidas.
A. Estimacin con observaciones no repetidas: Mtodo de Mxima-Verosimilitud
Dada una variable aleatoria, caracterizada por unos parmetros, y dada una muestra
poblacional, se consideran estimadores Mximo-Verosmiles de los parmetros de una
poblacin determinada, aquellos valores de los parmetros que generaran con mayor
probabilidad la muestra observada. Es decir, los estimadores Mximo-Verosmiles son
aquellos valores para los cuales la funcin de densidad conjunta (o funcin de
verosimilitud) alcanza un mximo.
Suponiendo que las observaciones son independientes, la funcin de densidad conjunta
de la variable dicotmica Y
i
queda como:
Prob(Y
1
Y
2
... Y
i
... Y
n
) =
i i Y
i
n
i
Y
i
M M
1
1
) 1 ( (13)
donde M
i
recoge la probabilidad de que Y
i
=1. Por simplicidad se trabaja con la funcin
de densidad conjunta en logaritmos, cuya expresin es:
) 1 ln( ) 1 ( ln ) 1 ln( ) 1 ( ln ln
1 1
i i
i
i i
i n
i i
i
i
i
i i
M Y M Y M Y M Y L + +
+
(14)
14
El mtodo de estimacin de mxima verosimilitud elige el estimador del parmetro que
maximiza la funcin de verosimilitud ( = ln L), por lo que el procedimiento a seguir
ser calcular las derivadas de primer orden de esta funcin con respecto a los
parmetros que queremos estimar, igualarlas a 0 y resolver el sistema de ecuaciones
resultante. Las derivadas de primer orden de la funcin de verosimilitud respecto a los
parmetros y , tras pequeas manipulaciones, quedan como siguen:
( )
+
+
,
_
+
n
i
X
i i i
i
i
e
e
Y M Y
1
0
1
(15)
( )
+
+
,
_
+
n
i
i
X
i i i i
X
e
e
Y X M Y
i
i
1
0
1
(16)
y sustituyendo M
i
por su valor queda:
,
_
+
+
+
0
1 1
i
i
X
i
n
i
i
e
e
Y e
,
_
+
+
+
0
1 1
i
X
i
n
i
i i
X
e
e
Y e X
i
i
Se trata de un sistema de ecuaciones no lineales por lo que es necesario aplicar un
mtodo iterativo o algoritmo de optimizacin que permita la convergencia en los
estimadores.
B. Estimacin con observaciones repetidas: Mtodo Mnimos Cuadrados Generalizados
La estimacin del modelo con datos agrupados podra realizarse mediante el
procedimiento habitual utilizado para estimar regresiones lineales, ya que la variable a
modelizar ya no es dicotmica (es continua aunque acotada en el rango 0-1). Para ello
es necesario linealizar el modelo, lo cual es fcil de realizar a travs de la
transformacin ya comentada anteriormente, y por la cual:
i i k k
i
i
X
M
M
Ln + +
,
_
1
donde
i
es el valor de la perturbacin aleatoria incluida en la especificacin de todo
modelo de regresin lineal y que cumple las hiptesis de perturbacin esfrica y
ausencia de autocorrelacin. El modelo as transformado puede estimarse por el
15
procedimiento habitual de Mnimos Cuadrados Ordinarios (MCO). Sin embargo, y dado
que el valor de M
i
es desconocido y debe sustituirse por su estimacin muestral P
i
, el
modelo a estimar quedara como:
'
1
i i i k k
i
i
X
P
P
Ln + + +
,
_
donde '
i
recoge el error cometido al utilizar la estimacin muestral de la probabilidad
P
i
, en vez de su valor desconocido M
i
. Al sustituir M
i
por su estimacin muestral P
i
, los
errores, supuestos independientes, cumplen la condicin asinttica de normalidad
exigida para realizar contrastaciones y construccin de intervalos de confianza, pero,
dejan de cumplir la condicin de homocedasticidad ya que su varianza no es constante
5
.
La presencia de heterocedasticidad impide la estimacin a travs de Mnimos
Cuadrados Ordinarios, siendo necesario aplicar el mtodo de Mnimos Cuadrados
Generalizados, que sin exigir la condicin de homocedasticidad de los errores, permite
estimar estimadores ELIO. Este procedimiento transforma el modelo a estimar en otro,
donde todas las variables quedan ponderadas por los inversos de las varianzas de los
errores, y dado que se desconocen dichos valores verdaderos, stos se sustituyen por su
estimacin muestral P
i
, de donde:
) ' (
1
i
i
ar V
s
= ) 1 (
i i i
P P n (17)
quedando el modelo a estimar como:
i i i k k i
i
i
i
i
s X s
P
P
Ln s + +
,
_
1
(18)
Contraste y validacin de hiptesis
En el caso de trabajar con observaciones repetidas la contrastacin y validacin del
modelo estimado sigue la misma metodologa que la empleada en el anlisis de
regresin tradicional, por lo que remitimos a ste para profundizar en este tema.
Mientras que si nos encontramos en el caso de no disponer de observaciones repetidas,
5
La varianza de la perturbacin aleatoria no es homocedstica ya que depende del nivel en que se
encuentre la variable explicativa X, al definirse
,
_
,
_
i
i
i
i
i
M
M
Ln
P
P
Ln
1 1
'
16
la etapa de contrastacin y validacin del modelo estimado por mxima-versoimilitud se
lleva a cabo aplicando los estadsticos especficos que se comentan a continuacin.
A. Significatividad estadstica de los parmetros estimados
La distribucin del estimador del parmetro es aproximadamente:
,
_
( ; Var N
En tal situacin, se puede construir un intervalo de confianza del parmetro estimado,
para testar si dicho valor es significativamente distinto de cero de forma individual. El
contraste a realizar quedara definido como:
0 :
0
H El parmetro es igual a cero
0 :
1
H
El parmetro es distinto de cero
El intervalo de confianza proporciona un rango de posibles valores para el parmetro,
por lo que si el valor estimado no pertenece a dicho intervalo, se deber rechazar la
hiptesis nula. El intervalo quedara definido como:
)
2 / 2 /
Var z Var z +
donde es la probabilidad de que el verdadero valor del parmetro se halle fuera del
intervalo, y z es el valor tabular de la distribucin N(0;1) que deja a su derecha una
probabilidad igual a 2 / .
A partir de la expresin anterior se puede fijar un rechazo de la hiptesis nula cuando:
2 /
z
)
( Var
B. Medidas de bondad de ajuste del modelo
El uso de la funcin de verosimilitud en la estimacin, hace que la bondad del ajuste en
los modelos de eleccin discreta sea un tema controvertido, ya que en estos modelos no
existe una interpretacin tan intuitiva como en el modelo de regresin clsico. A
continuacin se describen los contrastes ms utilizados en la literatura economtrica
para medir la bondad de ajuste en un modelo Logit y que concretaremos en: ndice de
17
cociente de verosimilitudes, el estadstico chi-cuadrado de Pearson, el porcentaje de
aciertos estimados en el modelo, y la prueba de Hosmer-Lemeshow.
B.1. ndice de cociente de verosimilitudes
La funcin de verosimilitud puede tambin utilizarse para obtener un estadstico, que
tiene cierta semejanza con el coeficiente de determinacin calculado en la estimacin
lineal, conocido ndice de cociente de verosimilitudes. Este estadstico compara el
valor de la funcin de verosimilitud de dos modelos: uno corresponde al modelo
estimado que incluye todas las variables explicativas (modelo completo) y el otro sera
el del modelo cuya nica variable explicativa es la constante (modelo restringido). El
estadstico, tambin conocido como R
2
de McFadden ya que fue propuesto por
McFadden en 1974, se define como
:
) 0 ( log
log
1
L
L
ICV RV (19)
donde L es el valor de la funcin de verosimilitud del modelo completo (el estimado con
todas las variables explicativas) y L(0) es el valor correspondiente del modelo
restringido (el que incluye nicamente en la estimacin el trmino constante).
El ratio calculado tendr valores comprendidos entre 0 y 1 de forma que:
- Valores prximos a 0 se obtendrn cuando L(0) sea muy parecido a L, situacin en
la que nos encontraremos cuando las variables incluidas en el modelo sean poco
significativas, es decir, la estimacin de los parmetros no mejora el error que se
comete si dichos parmetros se igualaran a 0. Por lo que en este caso la capacidad
explicativa del modelo ser muy reducida.
- Cuanto mayor sea la capacidad explicativa del modelo, mayor ser el valor de L
sobre el valor de L(0), y ms se aproximar el ratio de verosimilitud calculado al
valor 1.
B.2. Una medida del error: el estadstico
2
de Pearson
Para medir la bondad del ajuste tambin se utilizan medidas del error que cuantifican la
diferencia entre el valor observado y el estimado. En concreto, para contrastar la
hiptesis nula de que
i i
M Y H
:
0
; lo que equivale a 0
:
0
i i i
e M Y H
18
se construye un estadstico que recoge los residuos estandarizados o de Pearson
6
del
modelo Logit, que se definen como la diferencia entre el valor observado de la variable
respuesta y el estimado, dividido por la estimacin de la desviacin tpica, ya que la
esperanza es nula. A travs del contraste de multiplicadores de Lagrange, se puede
calcular el estadstico conocido con el nombre de
2
de Pearson, que se define como
n
i
i i
i i
n
i
i
M M
M Y
e
1
2
1
2 2
)
1 (
(
(20)
Este estadstico es similar a la suma de cuadrados de los residuos del modelo de
regresin convencional. El ajuste del modelo ser mejor cuanto ms cerca est el valor
del estadstico de cero. Para saber a partir de que valor puede considerarse el ajuste
como aceptable es necesario conocer la distribucin del estadstico. ste estadstico,
bajo la hiptesis nula, se distribuye como una chi-cuadrado con (n-k) grados de libertad,
por lo que su valor se compara con el valor terico de las tablas de la chi-cuadrado para
contrastar la hiptesis nula. Si el valor calculado es superior al valor terico se rechaza
la hiptesis nula lo que equivale a decir que el error cometido es significativamente
distinto de cero, es decir, se tratara de un mal ajuste.
B.3 Porcentaje de aciertos estimados en el modelo
Otra de las vas utilizadas para determinar la bondad de un modelo Logit es predecir con
el modelo los valores de la variable endgena
i
Y de tal manera que 1
i
Y si c M
i
>
0
i
Y si c M
i
<
1 (
i i
i i
M M
M Y
7
Como se ha comentado anteriormente, de la condicin de primer orden que queda recogida en la
ecuacin (III.44) se deduce que la media de las probabilidades estimadas por el modelo, ha de coincidir
con la proporcin de unos que haya en la muestra.
19
estimar valores iguales a 1. El modo de resolver este problema es tomar un umbral ms
pequeo.
Con cualquier tipo de regla predictiva similar se cometern dos errores: habr ceros que
se clasifiquen incorrectamente como unos y unos que se clasifiquen incorrectamente
como ceros. Si se reduce el umbral por debajo de 0,5 aumentar el nmero de veces que
se clasifican correctamente observaciones para las que Y
i
=1, pero tambin aumentar el
nmero de veces en que se clasifiquen observaciones como unos para las que Y
i
=0.
Cambiando el valor del umbral se reducir siempre la probabilidad de un error de un
tipo y se aumentar la probabilidad del otro tipo de error. Por lo que el valor que debe
tomar el umbral depende de la distribucin de datos en la muestra y de la importancia
relativa de cada tipo de error.
Una vez seleccionado el nivel del umbral, y dado que los valores reales de
i
Y son
conocidos, basta con contabilizar el porcentaje de aciertos para decir si la bondad del
ajuste es elevada o no. A partir de este recuento se puede construir el siguiente cuadro
de clasificacin:
Cuadro de clasificacin de aciertos
Valor real de
i
Y
0
i
Y 1
i
Y
c M
i
<
P
11
P
12
Prediccin de
i
M
c M
i
>
P
21
P
22
Donde P
11
y P
22
correspondern a predicciones correctas (valores 0 bien predichos en el
primer caso y valores 1 bien predichos en el segundo caso), mientras que P
12
y P
21
correspondern a predicciones errneas (valores 1 mal predichos en el primer caso y
valores 0 mal predichos en el segundo caso). A partir de estos valores se pueden definir
los ndices que aparecen en el siguiente cuadro.
20
ndices para medir la bondad del ajuste
Indice Definicin Expresin
Tasa de aciertos
Cociente entre las predicciones correctas y el total de
predicciones
22 21 12 11
22 11
P P P P
P P
+ + +
+
Tasa de errores
Cociente entre las predicciones incorrectas y el total
de predicciones
22 21 12 11
21 12
P P P P
P P
+ + +
+
Especificidad
Proporcin entre la frecuencia de valores 0 correctos
y el total de valores 0 observados
21 11
11
P P
P
+
Sensibilidad
Razn entre los valores 1 correctos y el total de
valores 1 observados
22 12
22
P P
P
+
Tasa de falsos ceros
Proporcin entre la frecuencia de valores 0
incorrectos y el total de valores 0 observados
21 11
21
P P
P
+
Tasa de falsos unos
Razn entre los valores 1 incorrectos y el total de
valores 1 observados
22 12
12
P P
P
+
B.4. Prueba de Hosmer-Lemeshow
Otra medida global de la exactitud predictiva, no basada en el valor de la funcin de
verosimilitud sino en la prediccin real de la variable dependiente, es el contraste de
clasificacin diseado por David W. Jr. Hosmer y Stanley Lemeshow en 1989. Dicho
contraste consiste en realizar comparaciones entre el valor estimado y el observado por
grupos. Para ello las observaciones se dividen en J grupos (generalmente 10)
aproximadamente iguales, dividiendo el recorrido de la probabilidad en deciles de
riesgo (esto es probabilidad de ocurrencia del fenmeno < 0.1, < 0.2, y as hasta <1).
Cada uno de los grupos contiene n
j
observaciones, y en cada uno de los J grupos se
define:
- Y
j
como la suma de los valores 1 en cada uno de los grupos (
i j
Y Y )
-
j
P como la media de los valores predichos en cada grupo (
j
i
j
n
P
P
).
A partir de esta informacin se puede construir una tabla de contingencia a travs de la
que se compara tanto la distribucin de ocurrencia, como la de no ocurrencia prevista
por la ecuacin y los valores realmente observados. El contraste se realiza comparando
las frecuencias observadas y esperadas a travs del clculo del estadstico
( )
J
j j j j
j j j
P P n
P n Y
HL
1
2
) 1 (
(21)
21
Hosmer y Lemeshow demuestran que cuando el modelo es correcto el estadstico HL
sigue una distribucin chi-cuadrado con J-2 grados de libertad, por lo que valores
inferiores del estadstico calculado respecto al terico indicarn un buen ajuste del
modelo.
El uso correcto de este contraste requiere un tamao de muestra adecuado para asegurar
que cada grupo cuenta al menos con cinco observaciones. Adems el estadstico chi-
cuadrado es sensible al tamao muestral, permitiendo que esta medida encuentre
diferencias estadsticamente muy pequeas cuando el tamao muestral crece.
5. MODELOS DE RESPUESTA MLTIPLE
Cuando la variable endgena a modelizar es una variable discreta con varias alternativas
posibles de respuesta (J) nos encontramos ante los modelos de respuesta mltiple. Estos
modelos se clasifican en dos grandes grupos segn que las alternativas que presenta la
variable endgena se puedan ordenar (modelos con datos ordenados) o no se puedan
ordenar (modelos con datos no ordenados).
Modelos de respuesta mltiple con datos no ordenados
La especificacin general de los modelos de respuesta mltiple con datos no ordenados
queda recogida a travs de la siguiente expresin:
J
j
Z
Z
i
ij
ij
e
e
j Y ob
0
'
'
) ( Pr
(22)
donde Z
ij
representa la matriz de los regresores del modelo. Dichas variables
explicativas pueden ser de dos tipos:
- Variables que contienen aspectos especficos del individuo y por tanto, su valor
ser el mismo en todas las alternativas. Este tipo de variables reciben el nombre
de caractersticas, y se las denota por W
i
.
- Variables que contienen aspectos especficos de las alternativas entre las que se
ha de elegir, y varan tanto entre individuos como entre alternativas. Este tipo de
variables reciben el nombre de atributos de las alternativas y se las denota por
X
ij
.
A partir de esta especificacin general, y teniendo en cuenta que la inclusin en el
modelo de variables explicativas que hagan referencia a caractersticas o atributos
22
permite la especificacin de modelos diferentes denominados, modelo logit multinomial
en el primer caso y modelo logit condicional en el segundo.
A. El modelo Logit Multinomial
Este tipo de modelos es el que se utiliza con ms frecuencia en los trabajos aplicados.
En este modelo los valores de las variables explicativas varan para cada individuo pero
son constantes para cualquier alternativa, por lo que no se puede apreciar la influencia
de la variable en cada alternativa a no ser que se introduzca una variable ficticia,
multiplicada por los valores de W
i
, que represente a cada alternativa. Para evitar
problemas de singularidad, el nmero de variables ficticias a introducir en el modelo
ser igual al nmero de alternativas menos uno (J-1).
La formulacin de un Logit Multinomial queda recogida a travs de la siguiente
ecuacin
8
:
1
0
'
'
) ( Pr
J
j
X
X
ij i
i j
i j
e
e
P j Y ob
(23)
donde j representa el ndice asociado a cada alternativa y va desde 0 hasta (J-1). El
vector de parmetros lleva asociado el subndice correspondiente a la alternativa
concreta analizada. Las ecuaciones estimadas proporcionan un conjunto de
probabilidades para cada una de las alternativas que puede tomar un individuo i y tenga
X
i
como caractersticas individuales.
En el modelo Logit Multinomial existe una indeterminacin cuando se trata de estimar
el valor de los parmetros. Para solucionar este problema se normaliza el modelo
tomando para los parmetros que acompaan a la alternativa cero el valor cero, 0
0
.
Las probabilidades resultantes son
+
1
1
'
'
1
) ( Pr
J
j
X
X
i
i j
i j
e
e
j Y ob
+
1
1
'
1
1
) 0 ( Pr
J
j
X
i
i j
e
Y ob
para j=0
Donde se tiene que cumplir que
1
0
1
J
j
j
P
Para el caso sencillo de un modelo en el que la variable endgena presenta tres posibles
alternativas de eleccin y slo existe una variable explicativa en la modelizacin, la
probabilidad asociada a cada una de las alternativas posibles de eleccin tomaran las
siguientes expresiones
9
i i
X X
e e
P
2 2 1 1
1
1
0
+ +
+ +
i i
i
X X
X
e e
e
P
2 2 1 1
1 1
1
1
+ +
+
+ +
i i
i
X X
X
e e
e
P
2 2 1 1
2 2
1
2
+ +
+
+ +
(25)
con 1
2 1 0
+ + P P P
Y la matriz de diseo X vendr expresada como
1
1
1
1
1
1
1
1
1
]
1
n
n
X
X
X
X
X
X
X
0 1 0
0 0 1
... ... ... ...
0 1 0
0 0 1
0 1 0
0 0 1
2
2
1
1
B. El modelo Logit Condicional
Cuando las variables explicativas que se utilizan para estimar las probabilidades
asociadas a cada una de las posibles alternativas que presenta la variable endgena se
9
Se identifican con la letra los parmetros que acompaan al trmino independiente y con la letra
los que acompaan a las variables explicativas.
24
refieren a atributos de las distintas alternativas, y no a caractersticas especficas de los
individuos, el modelo que se utiliza en la estimacin es el llamado Logit Condicional.
En este caso, el valor de cada variable variar para cada alternativa y puede hacerlo o no
para cada individuo.
La diferencia de este modelo con el Logit Multinomial es que en este caso solo existe
un vector de parmetros a estimar, mientras que en el caso anterior existan tantos
vectores como alternativas menos una. Es por ello, que en la formulacin del modelo el
vector de parmetros, al ser nico, no lleva asociado ningn subndice relacionado con
la alternativa a la que acompaa, como ocurra en el caso anterior.
La otra diferencia hace referencia a que en este caso no existe ninguna indeterminacin
a la hora de estimar los parmetros, por lo que no es necesario igualar ningn vector
a cero.
La expresin formal del modelo queda definida como
J
j
X
X
i
ij
ij
e
e
j Y ob
1
'
'
) ( Pr
l
l j
l j
J
j
X
X
l j
e
e
P
1
'
'
/
/
/
+
+
l
l l l
l l l
J
j
I Z
I Z
l
e
e
P
1
'
'
(27)
donde
l
l j
J
j
X
l
e I
1
'
/
ln
.
Uno de los aspectos problemticos de este modelo radica en la especificacin de la
estructura arbrea. En algunos casos, la particin en subgrupos del conjunto de
alternativas posibles se hace de modo natural. Sin embargo, en otros casos, dicha
particin del conjunto de posibles alternativas se hace sin ningn criterio lgico, por lo
que resulta preocupante que los resultados obtenidos dependan de cmo se han definido
las ramas. De momento, no existe ningn contraste que permita seleccionar la mejor
estructura arbrea de entre varias, por lo que muchos de los trabajos empricos que
estiman este modelo presentan los resultados supuestas distintas especificaciones de la
estructura arbrea.
Modelos de respuesta mltiple con datos ordenados
Cuando la variable dependiente es discreta, pero sus valores indican un orden, no es
correcto realizar la estimacin de la misma a travs de los modelos presentados en el
apartado anterior, ya que la inclusin de la informacin que aporta el orden de las
alternativas en la especificacin del modelo permite obtener unos mejores resultados.
Tampoco sera correcto el uso de un modelo de regresin clsico, ya que codificadas las
posibles alternativas como 0, 1, 2, ...(j+1), ..., J, se estara considerando la diferencia
entre (j+1) y (j+2) como la existente entre 1 y 2, lo cual no tiene porque ser as ya que
26
los nmeros utilizados en la codificacin solo representan un orden dentro de una
clasificacin.
La formulacin del modelo Logit ordenado queda como sigue:
) X ' ( ) Y ( ob Pr
i i
0
) ' ( ) ' ( ) 1 ( Pr
1 i i i
X X Y ob
) ' ( ) ' ( ) 2 ( Pr
1 2 i i i
X X Y ob
...
) X ' ( )) J ( Y ( ob Pr
i ) J ( i
2
1 1
(28)
donde
1
,
2
, ...,
) 2 ( J
son parmetros que representan los valores de los umbrales o
barreras y se estiman a la vez que y ) X ' (
i
representa la funcin de distribucin
logstica
10
.
Para que todas las probabilidades sean positivas se debe cumplir
) 2 ( 2 1
... 0
< < < <
J
El siguiente grfico, para el que la variable observada presenta cinco posibles
alternativas, sirve para ilustrar la estructura que subyace en la construccin del modelo
Logit ordenado.
Clculo de probabilidades en el modelo Logit Ordenado
0,00
0,05
0,10
0,15
0,20
0,25
0,30
1 3 5 7 9
1
1
1
3
1
5
1
7
1
9
10
X '
X '
i
e
e
) X ' (
+
1
Y=0 Y=1 Y=2 Y=3 Y=4
f( )
-
X '
X '
1
X '
2
X '
3