Está en la página 1de 33

MODELOS DE VARIABLE DEPENDIENTE CATEGRICA O LIMITADA:

Se consideran modelos de regresin en los que la variable dependiente puede


estar CENSURADA o TRUNCADA, puede tratarse de una variable de
CONTEO, o ser una variable de tipo cualitativo: BINARIA, ORDINAL,
NOMINAL.
Variables binarias: Tienen dos categoras. Normalmente indican que ha
ocurrido un suceso, que alguna caracterstica est presente o que se elige una
opcin. Ejemplos: trabajador en paro; compra de un producto; participacin en
las elecciones;
Variables ordinales: Tienen categoras que pueden ordenarse de menor a
mayor. Ejemplos: en las encuestas se pregunta sobre el nivel de acuerdo con
respecto a alguna afirmacin, permitiendo responder en una escala ordinal, por
ejemplo: completamente de acuerdo, de acuerdo, en desacuerdo,
completamente en desacuerdo; valoraciones sobre el nivel de satisfaccin al
consumir un bien o servicio (muy satisfecho,, muy insatisfecho);
frecuencia de una determinada accin (nunca, , muy frecuentemente);
nivel de educacin alcanzado;
Variables nominales: Cuando hay mltiples respuestas, que no pueden
ordenarse. Ejemplos: tipo de empleo, status matrimonial, eleccin poltica,
preferencia de marcas,
Variables censuradas: Se dan cuando los valores de una variable se
desconocen para algn rango de la variable. Ejemplos: En informacin de renta
personal o familiar, cuando se definen intervalos del tipo ms de o menos
de; en modelos de demanda, cuando no se realiza ninguna compra del
bien;
Variables de conteo: Indican el nmero de veces que ha ocurrido algn
suceso. Ejemplos: Nmero de visitas al mdico en un ao; nmero de
publicaciones de un cientfico; nmero de visitas a un lugar de ocio; nmero de
hijos de una familia; aos de educacin;
El nivel de medida de una variable no siempre es nico. Los aos de estudios
pueden ser una variable de conteo, pero el nivel de estudios puede plantearse
como una variable ordinal o nominal. Si se considera un corte en el nivel de
estudios (con o sin estudios universitarios) podra tratarse como dicotmica.
1
MODELOS CON VARIABLE DEPENDIENTE CUALITATIVA
Tipos de modelos de eleccin discreta



















Eleccin entre dos
alternativas

Modelos de eleccin binaria
(binomiales)
Eleccin entre ms de dos
alternativas

Modelos de elecciones
mltiples (multinomiales)
Alternativas no
ordenadas
Alternativas ordenadas
2
MODELO DE ELECCIN BINARIA
Modelo de probabilidad lineal.
Modelo logit.
Modelo probit.
Modelo de probabilidad lineal
El modelo de probabilidad lineal es el modelo de regresin aplicado a una
variable dependiente binaria. La notacin que utilizaremos ser la misma que la
habitualmente empleada en el modelo de regresin lineal. Para
N i ,..., 1
:
i Ki K i i
u x x y + + + ...
1 1
i i i
u y + ' x
Donde:
y
1 1
]
]
]
]
]

]
]
]
]
]

K Ki
i
i
x
x

x
Y
i
u
es un trmino de perturbacin de media cero.
En el modelo lineal de probabilidad, la variable endgena toma nicamente dos
valores:
1
i
y
, cuando ocurre un determinado suceso.
0
i
y
, si el suceso no ocurre.
El valor esperado de esta variable,
[ ] '
i
x
i i
x y E
, puede interpretarse como la
probabilidad de que ocurra el suceso:
[ ] [ ] [ ] [ ]
i i i
x x x x 1 0 0 1 1 +
i i i i i
y P y P y P y E
El valor esperado de y dado x es la probabilidad de que y
i
= 1. Por tanto, el
modelo de probabilidad lineal se puede escribir como:
[ ]
i i i
Y P p x x
i
1
Problemas del modelo lineal de probabilidad
Los problemas de la estimacin de un modelo de regresin cuando la variable
endgena es binaria son una consecuencia de que la nube de puntos a la que
3
se debe ajustar la recta de regresin es en este caso dos lneas paralelas
sobre los dos nicos valores de la endgena.
X
.00
.20
.40
.60
.80
1.00
1.20
-.20
-3 -2 -1 0 1 2 3 4 5 -4
Y
1

Los problemas especficos que se encuentran son los siguientes:

Heterocedasticidad del trmino de perturbacin. Por tanto, los estimadores
MCO son menos eficientes.
Como
i i i
u y + x
slo puede tomar valores 1 y 0, el trmino de perturbacin
ha de ser igual a

i
x 1
o a

i
x
. Las probabilidades de que
i
u
tome uno de
estos valores sern, respectivamente:
[ ]
i i i
Y P p x x
i
1
y
[ ]
i i i
Y P p x x
i
1 0 1
. Y, por tanto:
( ) ( ) ' 1 ' var
i i
x x
i
u
Las probabilidades predichas son inconsistentes, ya que no puede garantizarse
que estn acotadas entre 0 y 1.
Interpretacin de los coeficientes
j
. En el modelo se supone que el efecto de
las variables sobre la probabilidad es constante y lineal en todo el recorrido de
las variables.
No normalidad de la perturbacin. Al tomar nicamente dos valores, la
hiptesis de normalidad del trmino de perturbacin no es aceptable. Este
problema no afecta la insesgadez de los estimadores puntuales, aunque el
proceso de inferencia basado en una distribucin normal de los estimadores
slo ser vlida si la muestra es lo suficientemente grande.
El Coeficiente de determinacin no es apropiado.
4
Alternativas al modelo lineal de probabilidad
Interesa un modelo que reproduzca adecuadamente el comportamiento de una
funcin de probabilidad.
[ ]
i
x 1
i
Y P
deber especificarse para que no supere
los lmites de 0 y 1, y con efectos no lineales de las variables explicativas:
0.0
0.2
0.4
0.6
0.8
1.0
-3 -2 -1 0 1 2 3 4
X
Y
Las distribuciones ms empleadas han sido la normal estndar y la logstica.

Si una variable

es normal, con [ ] 0 E y [ ] 1 var , su funcin de densidad


es:
( )
2
2
2
1



e
Y su funcin de distribucin acumulada:
( ) dt e
t

2
2
2
1
Si

sigue una distribucin logstica, con media 0 y varianza 3


2
, su funcin
de densidad es:
( )
[ ]
2
1


e
e
+

Y su funcin de distribucin acumulada:


( )

e
e
+

1
5
Las formas de las correspondientes funciones de distribucin se muestran en
las siguientes figuras.
Funciones de densidad normal y logstica.
.0
.1
.2
.3
.4
.5
-3 -2 -1 0 1 2 3
X
NORMAL
LOGISTIC
Funciones de distribucin acumuladas normal y logstica
0.0
0.2
0.4
0.6
0.8
1.0
-3 -2 -1 0 1 2 3
X
NORMAL
LOGISTIC
Cuando como funcin de probabilidad se emplea la distribucin normal, se
obtiene el denominado modelo probit, mientras que el empleo de la
distribucin logstica proporciona el modelo logit.
6
Modelos logit y probit
Distribucin

Modelo
NORMAL ESTNDAR

PROBIT
LOGSTICA

LOGIT
NORMAL ESTNDAR: [ ] ( ) ( )

' '
2
'
2
1
1
2
x x
x x dt e dt t y P
t
LOGSTICA:
[ ] ( )

'
1
1
1
1
' '
'
x x
x x
x

+

e e
e
y P
En el modelo probit se supone que la varianza es unitaria y en el modelo logit
que la varianza es igual a 29 . 3 3
2
. Las varianzas de las dos distribuciones
no pueden estimarse, como consecuencia de que la variable latente es
inobservable. Para estimar los modelos es necesario imponer algn supuesto
arbitrario sobre las varianzas de la distribucin. Los valores seleccionados
proporcionan frmulas sencillas y no pueden contrastarse con la informacin
muestral.
Otras justificaciones de los modelos logit y probit .
Los enfoques de de variable latente y de utilidad aleatoria.
(1) Enfoque de variable latente.
Se considera una variable latente
*
i
y , que no puede observarse directamente y
que depende linealmente de un conjunto de variables explicativas
i i i
u y + x
*

Donde
i
u
es una perturbacin aleatoria con media cero. El valor esperado de
la variable latente ser
[ ] '
*
i i i
y E x x
Un determinado suceso o eleccin se da si >
*
i
y .
Se define una variable dicotmica
i
y
, con valores 0 y 1:

'

>

y si
y si
y
*
i
*
i
i
0
1
7
El valor de puede ser cualquiera, aunque en las aplicaciones 0 es un valor
frecuente.
El modelo de probabilidad quedara definido de la siguiente forma,
( ) ) ( ' ) ( ) ' ( ) ( ) 1 (
* *

i i i i i i i i i
F u P u P u P y P y P x x x x > > + >
siendo F la funcin de distribucin del trmino de perturbacin.
X
-2
0
2
4
6
8
-4
-3 -2 -1 0 1 2 3 4 5 -4
Y


X
.00
.20
.40
.60
.80
1.00
1.20
-.20
-3 -2 -1 0 1 2 3 4 5 -4
Y
1

i i i
u x Y + +
2 1
*

'

>

0 Y si 0
0 Y si 1
*
i
*
i
i
Y
Probabilidad de observar los valores de un modelo de respuesta binaria
Probabilidad de y=1 en el modelo de respuesta binaria
8
0.0
0.2
0.4
0.6
0.8
1.0
-3 -2 -1 0 1 2 3
X
P
[
y
=
1
]
Si se supone que la perturbacin sigue una distribucin normal
( )
2
, 0 N ~ u
i
, se
tendra:
) (
'
) ( ) 1 (
*
*
*

i
i i i i i
i i
F
u
P
y
P y P y P x
x x x

,
`

.
|

,
`

.
|



Donde

0 *
0
para el trmino independiente,

k
k

*
, para el resto.
Para identificar los parmetros
*
es necesario imponer una restriccin sobre
la varianza de
i
u
. Bajo el supuesto de que la varianza es unitaria,
i
u
sigue una
distribucin normal estndar y ( ) . F es, por tanto, la funcin de distribucin
acumulada de la normal estndar.
Si se supone que
i
u
sigue una distribucin logstica con media 0 y varianza
29 . 3 3
2
se tiene:
( ) ) ( ) ( ) 1 (
* *

i i i i i
u P y P y P x x
(2) Enfoque de utilidad aleatoria.
El modelo se deriva de una eleccin entre alternativas, que proporciona
mxima utilidad.
ji
U
indica la utilidad que el individuo i-simo obtendra de dos alternativas
1 , 0 j
.
Se supone que la utilidad
ji
U
tiene dos componentes, uno sistemtico,
ij
V
, y
otro aleatorio,
ji

,
ij ij ij
V U +
, para
1 , 0 j
:
9
1 1 1
0 0 0
i i i
i i i
V U
V U

+
+
Las partes deterministas pueden especificarse de una manera sencilla como:
0 0
'
i i
V x
y
1 1
'
i i
V x
.
El individuo seleccionar la opcin
1 j
si
i i
U U
0 1

y seleccionar la opcin
0 j
si
i i
U U
0 1

.
Definiendo una variable observable
i
y

'

>
>

1 0
0 1
0
1
i i
i i
i
U si U
U si U
y

La probabilidad de que el individuo seleccione la alternativa
1 j
ser:
) ( ) ( ) ( ) ( ) 1 (
0 1 0 1 1 0 0 0 1 1 0 1 i i i i i i i i i i i i i
V V F V V P V V P U U P Y P < + > + >
Donde
( ) F es la funcin de distribucin acumulada de
1 0 i i

y:
( ) ( ) ( ) ( ) ' ' ' ' ) ( ) 1 (
0 1 0 1 0 1 i i i i i i i
F F F V V F Y P x x x x
El modelo finalmente especificado depende de la distribucin que se suponga
para los trminos aleatorios. Si
0 i

y
1 i

son normales,
1 0 i i

tambin se
distribuye normalmente. Si se supone media cero, la normalizacin de la
varianza de
1 0 i i

a uno, proporciona el modelo probit si
( ) F es la funcin de
distribucin acumulada de la normal estndar.
El modelo logit se obtiene si se supone que
0 i

y
1 i

son independientes y
siguen una distribucin de valor extremo tipo I
1
. En ese caso,
1 0 i i

sigue una
distribucin logstica, siendo
( ) F la correspondiente funcin de distribucin
acumulada.
Interpretacin de parmetros
El modelo de probabilidad es un modelo de regresin no lineal:
( ) ( ) [ ] ( ) ' ' 1 0 ' 1 ] | [
i i
x x x F F F x y E
i i
+
No importa cul sea la distribucin que se utilice en ( ) F , los parmetros

del
modelo no son los efectos marginales:
1
Una variable aleatoria

con distribucin de valor extremo tipo I tiene como funcin de densidad:


( ) ( ) ( ) ( ) exp exp exp f ,
< <
Y como funcin de distribucin acumulada:
( ) ( ) ( ) exp exp F .
10
[ ] ( )
( )
k
ki
i
ki
i i
x
y P
x
y E

' 1
i
x x
En general,
[ ]
( )
( )
( )
k k
i ki
i i
f
F
x
y E

'
'
'
i
i
x
x
x
x

Siendo ( ) f la funcin de densidad asociada a ( ) F .


Si se emplea la funcin de densidad normal estndar:
[ ]
( )
k
ki
i i
x
y E
'
i
x
x

Y si se emplea la funcin de densidad logstica:


EMBED Equation.3
[ ]
( )
( )
( ) ( ) [ ]
+

k i i k k i
ki
i i
i
e
e
x
y E

' 1 '
1
'
2
'
'
x x x
x
x
x
i
( ) ( ) [ ]
k i i
i
i
y P y P x x 1 1 1
El efecto marginal en ambos modelos depende de los valores que toman
las variables explicativas. Pueden, por tanto, calcularse los efectos
marginales para cada observacin de la muestra, obteniendo los efectos
medios como promedio de los efectos individuales. Alternativamente, los
efectos marginales pueden evaluarse para el valor medio de las
variables explicativas.
El signo de los coeficientes indica la direccin del efecto marginal:
Signo de
k

= Signo del efecto marginal de


k
x
Cuando la variable explicativa es una variable dicotmica (variables
ficticias), es ms adecuado calcular el cambio discreto en la
probabilidad. Indicando
i
d
la variable ficticia (con valores 0, 1) y es el
correspondiente parmetro:
[ ]
( ) ( ) ( ) ( )
* * * * * * * *
*
' ' 0 ' 1 '
i i i i
i
i i i
F F F F
d
d y E
x x x x
x
+ + +

En general, las dos medidas no son iguales:


11
[ ] [ ]
ki
i i
ki
i i
x
y E
x
y E

x x

Odds y Odds-ratio
En el modelo logit los resultados se suelen interpretar en trminos de los odds-
ratio.
Los odds se definen como el cociente entre las probabilidad de las dos
alternativas:
) 1 ( 1
) 1 (
) 0 (
) 1 (
x
x
x
x


i
i
i
i
Y P
Y P
Y P
Y P
En el modelo logit, este cociente de probabilidades sera:
'
) 0 (
) 1 (
i
e
Y P
Y P
i
i x
x
x


Y en logaritmos:
( ) '
) 0 (
) 1 (
ln ln
i
i
i
Y P
Y P
x
x
x

,
`

.
|


El logaritmo del odds se conoce como logit.
El cociente de odds (o odds-ratio) mide cmo se modifica el odds cuando una
de las variables explicativas cambia su valor (de
0
ki
x a
1
ki
x ).
Supongamos un modelo logit con tres variables explicativas, el odds ser:
( )
i i i i
x x x
i i i i
i i i i
i i i
e e e e e
x x x Y P
x x x Y P
x x x
3 3 2 2 1 1 0
'
3 2 1
3 2 1
3 2 1
) , , 0 (
) , , 1 (
, ,


x
Si incrementamos el valor de la variable
i
x
2
en una unidad, el nuevo odds ser:
( )
( )
i i i i
x x x
i i i i
i i i i
i i i
e e e e e
x x x Y P
x x x Y P
x x x
3 3 2 2 1 1 0
1 '
3 2 1
3 2 1
3 2 1
) , 1 , 0 (
) , 1 , 1 (
, 1 ,
+

+
+
+
x
El odds-ratio se define como el cociente de los dos odds:
( )
( )
( )
2
3 3 2 2 1 1 0
3 3 2 2 1 1 0
1
3 2 1
3 2 1
, ,
, 1 ,



e
e e e e
e e e e
x x x
x x x
i i i
i i i
x x x
x x x
i i i
i i i

+
+
O ms detalladamente:
12
( )
( )
( )
( )
2
3 2 1
3 2 1
3 2 1
3 2 1
, , 0
, , 1
, 1 , 0
, 1 , 1

e
x x x Y P
x x x Y P
x x x Y P
x x x Y P
i i i i
i i i i
i i i i
i i i i

+
+
Por tanto, el exponencial de un coeficiente puede interpretarse como el efecto
que tiene sobre el odds el incremento de una unidad en la variable.
Advierta que el odds-ratio es un coeficiente multiplicativo que puede tomar
valores desde 0 en adelante:
j

-3 -2 -1,5 -1 -0,1 -0,01 0 0,01 0,1 1 1,5 2 3


j
e

0,05 0,14 0,22 0,37 0,90 0,99 1 1,01 1,11 2,72 4,48 7,39 20,09
Adems, cuando se interpretan los odds-ratio debe tenerse en cuenta que un
cambio constante en el odds no se corresponde con un cambio constante en la
probabilidad. Long (1997) muestra el siguiente ejemplo:
Original Cambio Factor de cambio Cambio en
probabilidad Odds Probabilidad Odds Probabilidad Odds Probabilidad
0,001 0,001 0,002 0,002 2 1,998 0,001
0,010 0,010 0,02 0,020 2 1,980 0,010
0,1 0,091 0,2 0,167 2 1,833 0,076
0,5 0,333 1 0,500 2 1,500 0,167
1 0,500 2 0,667 2 1,333 0,167
2 0,667 4 0,800 2 1,200 0,133
10 0,909 20 0,952 2 1,048 0,043
100 0,990 200 0,995 2 1,005 0,005
1000 0,999 2000 1,000 2 1,000 0,000
Los datos del ejemplo muestran que mientras que los odds se modifican por un
factor de 2, las probabilidades (calculadas como ( )
1
1 1

+odds no se modifican
en una cantidad constante. Cuando los odds son muy pequeos, odds y
probabilidades se modifican en la misma cantidad; cuando los odds son muy
grandes, las probabilidades prcticamente no se modifican. La conclusin que
se deriva de este resultado es que cuando se interpretan los resultados de la
estimacin de un modelo logit, adems de los odds resulta interesante calcular
tambin las predicciones de la probabilidad y los efectos marginales.
Estimacin de los modelos logit y probit
Los modelos logit y probit se estiman usualmente empleando el mtodo de
mxima verosimilitud.
Para cada observacin en la muestra, la variable
i
y
sigue una distribucin de
Bernoulli, su funcin de probabilidad es:
13
( ) ( ) ( ) ( ) . 1 , 0 1 1 1
1


i
y
i i
y
i i i i
y y P y P y f
i i
x x x
De manera que cuando
1
i
y
, la funcin de probabilidad es:
( ) ( ) ( ) ( ) ( )
i i i i i i i
y P y P y P f x x x x 1 1 1 1 1
0 1

Y cuando
0
i
y
:
( ) ( ) ( ) ( ) ( )
i i i i i i i
y P y P y P f x x x x 0 1 1 1 0
1 0

Dada la anterior funcin de densidad, la funcin de verosimilitud para toda la
muestra viene dada por:
( ) ( ) [ ]


n
i
y
i i
y
i
i
i i
y P y P L
1
1
1 1 1 x x
Y el logaritmo de la funcin de verosimilitud:
( ) ( ) ( ) [ ]


+
n
i
n
i
i i i
i
i i
y P y y P y L
1 1
1 1 1 1 ln x x
O
( ) ( ) ( ) [ ]


+
n
i
n
i
i i i i
F y F y L
1 1
' 1 1 ' ln x x
Las condiciones de primer orden del problema de maximizacin requieren que
las primeras derivadas respecto a

. Dada la no linealidad de los modelos, los


estimadores mximo verosmiles se obtienen empleando mtodos numricos
(Newton-Raphson, Berndt-Hall-Hall-Hausman,).
Contrastes de hiptesis
Significacin individual. Los estimadores mximo verosmiles de

se
distribuyen asintticamente segn una distribucin normal. Por tanto, para
tamaos muestrales relativamente grandes se tiene:
( ) ( )
j j j
N

var ,


Y, por tanto, puede contrastarse la hiptesis nula sobre la significacin de una
variable, 0

:
0

j
H , mediante el contraste:
j
j
z

,
que si la hiptesis es cierta se distribuye asintticamente como una ( ) 1 , 0 N .
Contrastes de Wald y Razn de Verosimilitud
El contraste de Wald puede emplearse para contrastar restricciones lineales en
los parmetros, del tipo:
14
0 r R
0 r R

:
:
0
A
H
H
La hiptesis puede contrastarse con el estadstico de Wald:
2 1
)

( ) )

( ( )

(
q
Var W

r R R R r R
Si las restricciones son ciertas, el estadstico se distribuye asintticamente
como una distribucin chi-cuadrado con grados de libertad igual al nmero de
restricciones.
El contraste de cociente de verosimilitudes tambin puede emplearse para
contrastar restricciones del modelo. El estadstico se define como:
( )
2
ln ln 2 ) ln (ln 2 ln 2
q R NR NR R
NR
R
L L L L
L
L
RV

,
`

.
|

Donde
R
L y
NR
L indican los valores de la funcin de verosimilitud de los
modelos restringido y no restringido, respectivamente. Bajo la hiptesis nula el
estadstico RV se distribuye como una
2
q

Pseudo-R
2

El coeficiente de determinacin o R
2
empleado en el modelo de regresin como
medida de bondad del ajuste no parece adecuado cuando la variable
dependiente es binaria, mientras que la variable ajustada es continua en el
intervalo 0,1. Se han propuesto diversas medidas de bondad del ajuste
alternativas, denominadas Pseudo-R
2
. Entre ellas destacan:
Pseudo-R2 de McFadden. Tambin conocido como ndice de cociente de
verosimiludes. Se define como:
R
NR
MF
L
L
R
ln
ln
1
2

Donde
NR
L
indica la funcin de verosimilitud del modelo estimado y
R
L la de un
modelo restringido con coeficientes
0
j

. Si en el modelo
R NR
L L
, todos los
coeficientes
j

estimados seran cero, y el 0


2

MF
R . El estadstico se acerca al
valor 1 cuando la funcin de verosimilitud del modelo estimado (no restringido)
se acerca a su valor mximo (igual a uno) y, por tanto, con un valor del
logaritmo igual a cero.
Pseudo-R
2
de Cox-Snell. Cox y Snell propusieron una medida que tena en
cuenta el tamao de la muestra:
( ) ( ) ( )

,
`

.
|

NR R CS
L L
N
R ln ln
2
exp 1
2
15
Prediccin individual de las probabilidades
Una vez estimado el modelo es posible estimar la probabilidad de un valor
1


i
Y para cada observacin, dados los valores de las variables
independientes: ( )
i i i
P Y P

x 1

. La manera ms directa de interpretar los


resultados de la estimacin del modelo es analizar las predicciones de
probabilidad para diferentes valores de las variables independientes.
Porcentaje de Predicciones Correctas
Una forma sencilla de valorar el ajuste de un modelo de eleccin binaria
consiste en comparar las predicciones del modelo con las respuestas
observadas en la muestra. Para cada observacin se predice la probabilidad y
se asigna la respuesta de ese elemento a valores 1


i
Y o 0


i
Y , segn la
probabilidad supere o no un determinado umbral. Normalmente, el criterio de
asignacin emplea como punto de corte una probabilidad igual a 0,5:
( )
( )

'

<

0

5 , 0 1

5 , 0 1

i i i
i i i
Y Y P
Y Y P
x
x
Debe tenerse en cuenta que la eleccin de un valor igual a 0,5 es arbitraria y
que puede modificarse en funcin del nmero de 1 y 0 que haya en la muestra.
Una vez obtenidos los valores de
i
Y

se genera un cuadro clasificatorio segn el


siguiente esquema:
Valor observado de
i
Y
0
i
Y 1
i
Y
Prediccin de
i
Y


i
Y n
11
n
12
1


i
Y n
21
n
22
Los valores n
11
y n
22
se corresponden con predicciones correctas para
0
i
Y
e
1
i
Y
, respectivamente. Mientras que los valores n
12
y n
21
sealan las
predicciones incorrectas. Esta informacin permite calcular las tasas de acierto
(o error), tanto globalmente, como para cada una de las categoras, as como el
porcentaje de falsos 1 0.
Contraste de Hosmer-Lemeshow
La idea del contraste de Hosmer-Lemeshow (HL) es comparar las predicciones
de las probabilidades con los datos observados. Para calcular el estadstico se
sigue la siguiente secuencia:
16
1. Se calculan las predicciones de las probabilidades a partir de la
estimacin del modelo: ( )
i i i
P Y P

x 1

.
2. Se ordenan los datos en funcin de las probabilidades estimadas, de
menor a mayor.
3. Se dividen las observaciones en G grupos (normalmente 10) de igual
tamao (en cada uno de los grupos habr aproximadamente el mismo
nmero de observaciones). El primer grupo tendr las
1
n observaciones
con los valores de probabilidad estimada menores.
4. Dentro de cada grupo se calcula la media de la prediccin de
probabilidad
g
P

y el porcentaje de observaciones con valor


1
i
Y
,
g
y
.
5. El estadstico HL se basa en los residuos de Pearson, definidos como la
diferencia entre la frecuencia observada y frecuencia en la prediccin,
estandarizada por la desviacin estndar de la prediccin. El estadstico
suma esa diferencia estandarizada para todos los grupos:
( )
( )

G
g
g g g
g g g g
P P n
P n y n
HL
1
2
1


El estadstico HL de distribuye aproximadamente como una
2
con
2 g
de
libertad, si el modelo es correcto.
Medidas de informacin
Para valorar el ajuste de modelos alternativos se emplean diversas medidas,
conocidas como medidas de informacin. Usualmente se emplean el
denominado Criterio de Informacin de Akaike (AIC) y el Criterio de Informacin
Bayesiano (BIC).
El AIC se define como:
K L AIC 2 ln 2 +
Donde L es la verosimilitud del modelo estimado y K es el nmero de
parmetros en el modelo. El valor de L ser mayor cuanto mejor sea el ajuste,
mientras que tendr un valor ms cercano a 0 cuando el ajuste sea malo. Por
ello, cuanto menor sea el valor de AIC mejor ser el ajuste del modelo.
El estadstico AIC penaliza el nmero de parmetros incluidos en el modelo,
para compensar hecho de que incluir un mayor nmero de parmetros
mejorar siempre el ajuste.
La medida BIC se define como:
) ln( ln 2 N K L BIC +
Cuando se comparan modelos, es preferible aquel que presenta un valor
negativo mayor.
17
Ejemplo
Los datos de Mroz (1987) han sido empleados en diversos textos para
ejemplificar los modelos binarios. Mroz estudia la participacin de la mujer en el
mercado de trabajo, empleando el panel estadounidense Panel Study of
Income Dynamics (PSID) correspondiente al ao 1976.
El fichero de datos BINLFP2.WF1 contiene una muestra de mujeres casadas
en edad de trabajar, extrada del panel. Las variables incluidas en el fichero son
las siguientes:
lfp: participa en el mercado de trabajo en el ao anterior: 1=s, 0=no.
k5: nmero de hijos menores de 5 aos.
k618: nmero de hijos entre 6 y 18 aos.
age: edad de la mujer.
wc: estudios universitarios: 1=s, 0=no.
hc: estudios universitarios del marido: 1=s, 0=no.
lwg: logaritmo de los salarios de la mujer.
inc: renta familiar (excluyendo el salario de la mujer).
El modelo que se desea ajustar es el siguiente:
( ) ( ) inc lwg hc wc age k k F lfp P
inc lwg hc wc age k k
+ + + + + + + 618 5 1
618 5 0
La estimacin con EViews de un modelo binario se realiza entrando en la
opcin de ecuacin y seleccionando como mtodo BINARY-Binary Choice
(Logit, Probit, Extreme Value).
18
El mtodo permite seleccionar entre las opciones probit, logit y de valor
extremo.
Los resultados de la estimacin de los modelos logit y probit se muestran en los
cuadros 1 y 2:
Cuadro 1. Estimacin logit.
Dependent Variable: LFP
Method: ML - Binary Logit (Quadratic hill climbing)
Sample: 1 753
Included observations: 753
Convergence achieved after 4 iterations
Covariance matrix computed using second derivatives
Coefficient Std. Error z-Statistic Prob.
C 3.182140 0.644375 4.938336 0.0000
K5 -1.462913 0.197001 -7.425933 0.0000
K618 -0.064571 0.068001 -0.949557 0.3423
AGE -0.062871 0.012783 -4.918260 0.0000
WC 0.807274 0.229980 3.510193 0.0004
HC 0.111734 0.206040 0.542291 0.5876
LWG 0.604693 0.150818 4.009434 0.0001
INC -0.034446 0.008208 -4.196498 0.0000
McFadden R-squared 0.120885 Mean dependent var 0.568393
S.D. dependent var 0.495630 S.E. of regression 0.457755
Akaike info criterion 1.223461 Sum squared resid 156.1069
Schwarz criterion 1.272588 Log likelihood -452.6330
Hannan-Quinn criter. 1.242387 Restr. log likelihood -514.8732
LR statistic 124.4805 Avg. log likelihood -0.601106
Prob(LR statistic) 0.000000
Obs with Dep=0 325 Total obs 753
Obs with Dep=1 428
19
Cuadro 2. Estimacin probit.
Dependent Variable: LFP
Method: ML - Binary Probit (Quadratic hill climbing)
Sample: 1 753
Included observations: 753
Convergence achieved after 3 iterations
Covariance matrix computed using second derivatives
Coefficient Std. Error z-Statistic Prob.
C 1.918422 0.380654 5.039810 0.0000
K5 -0.874711 0.113558 -7.702746 0.0000
K618 -0.038594 0.040489 -0.953202 0.3405
AGE -0.037823 0.007609 -4.970668 0.0000
WC 0.488314 0.135487 3.604133 0.0003
HC 0.057170 0.124005 0.461032 0.6448
LWG 0.365629 0.087779 4.165324 0.0000
INC -0.020525 0.004777 -4.296758 0.0000
McFadden R-squared 0.120764 Mean dependent var 0.568393
S.D. dependent var 0.495630 S.E. of regression 0.457953
Akaike info criterion 1.223625 Sum squared resid 156.2421
Schwarz criterion 1.272752 Log likelihood -452.6950
Hannan-Quinn criter. 1.242551 Restr. log likelihood -514.8732
LR statistic 124.3565 Avg. log likelihood -0.601189
Prob(LR statistic) 0.000000
Obs with Dep=0 325 Total obs 753
Obs with Dep=1 428
Predicciones
EViews permite calcular dos tipos de predicciones: la prediccin de la
probabilidad, ( )
i i i
P Y P

x 1

, o los valores del ndice


'
i
x
. Para ello se debe
seleccionar en la barra de herramientas en la que aparece la estimacin la
opcin Forecast y en el cuadro de opciones que se abre, seleccionar una de
las opciones (Probability o Index). La serie con los valores predichos se
guarda con el nombre que se haya indicado en la opcin Forecast name.
20
Las predicciones de las series pueden emplearse de diferentes maneras. Por
ejemplo, para calcular los Efectos marginales o las elasticidades.
En el caso del modelo logit, el clculo del efecto marginal de la renta familiar
sobre la probabilidad de participar en el mercado de trabajo supondra calcular:
[ ]
( ) ( ) [ ]
INC
i
i i
i
i i
i INC
i i
Y P Y P
x
Y E

1 1

,
x x
x

21
Esto puede hacerse generando una nueva serie mediante la siguiente
instruccin:
series efminc=lfpf*(1-lfpf)*(-0.034446)
Donde lfpf es el nombre en el que se han guardado las predicciones de
probabilidad y -0.034446 el coeficiente
INC

del modelo logit. Una vez generada


la serie de efectos marginales, puede calcularse el valor medio en la muestra, o
estudiar su distribucin, obteniendo sus valores mnimo, mximo, Para
obtener un anlisis descriptivo bsico puede seleccionar la variable, hacer
doble clic en ella, seleccionar View y a continuacin la secuencia Descriptive
Statistics & Tests, Histogram and Stats segn se muestra en el siguiente
cuadro. Los resultados que se obtienen se muestran a continuacin.
22
0
20
40
60
80
100
120
140
160
-0.0075 -0.0050 -0.0025
Series: EFMINC
Sample 1 753
Observations 753
Mean -0.007150
Median -0.007757
Maximum -0.000475
Minimum -0.008611
Std. Dev. 0.001648
Skewness 1.360164
Kurtosis 4.267348
Jarque-Bera 282.5745
Probability 0.000000
Cuando se analizan los efectos marginales (o las elasticidades) un ejercicio
que resulta interesante es el clculo del efecto marginal para distintos valores o
caractersticas de alguna variable. Por ejemplo, puede interesar calcular el
efecto marginal medio segn el nmero de hijos menores de 5 aos (la variable
k5). Para ello basta con seleccionar en la secuencia Descriptive Statistics &
Tests, Stats by clasiffication y escribir la variable de inters en Series/Group
for classify. Para la variable k5, los resultados se muestran a continuacin.
23
Descriptive Statistics for EFMINC
Categorized by values of K5
Date: 01/19/08 Time: 23:04
Sample: 1 753
Included observations: 753
K5 Mean Std. Dev. Obs.
0 -0.007210 0.001587 606
1 -0.007318 0.001485 118
2 -0.005660 0.001923 26
3 -0.001280 0.000807 3
All -0.007150 0.001648 753
Alternativamente, el clculo de los efectos marginales se podra haber
realizado empleando la frmula general (vlida para cualquier distribucin):
[ ]
( )
( )
( )
k k
i ki
i i
f
F
x
y E

'
'
'
i
i
x
x
x
x

Para ello, se debera haber guardado la prediccin correspondiente a


'
i
x

(Index en la opcin Forecast de EViews) y emplear las siguientes
instrucciones:
series efminc1=@dlogistic(index)*
LOGIT INC,

series efminc2=@dprobit(index)*
PROBIT INC,

donde index recogera la serie '


i
x .
Representacin de las curvas de probabilidad
Los coeficientes estimados del modelo binario pueden emplearse para
examinar cmo varan las predicciones de probabilidad con respecto a las
variables independientes. En este apartado se van a representar cuatro curvas
de probabilidad (en el eje vertical) con respecto a la edad de la mujer (en el eje
horizontal). Cada curva muestra la estimacin de la probabilidad que
corresponde a mujeres sin hijos, con uno, dos o tres hijos, respectivamente.
Empleando EViews es necesario realizar algunas manipulaciones previas. En
primer lugar, se trata de que el modelo estimado sea reconocido como un
modelo por EViews. Para ello debe seleccionarse en la barra de herramientas
de la estimacin Proc y Make Model.
24
EViews crea un modelo basado en la especificacin de probabilidad
) ( ) 1 (
i i
F y P x
. Con una funcin de distribucin que corresponder a la de
una normal en el caso de la estimacin probit:
[ ] ( ) ( )

' '
2
'
2
1
1
2
x x
x x dt e dt t y P
t
O la de una logstica, en el caso de la estimacin logit:
[ ] ( )

'
1
1
1
1
' '
'
x x
x x
x

+

e e
e
y P
25
Para poder editar este modelo son necesarios dos pasos previos. En primer
lugar, debe romperse el ligamen entre la ecuacin estimada y el modelo
generado. Para ello, seleccione Proc, Links, Break All Links.
A continuacin seleccione en la barra de herramientas el botn Text (o
alternativamente, seleccione View, Source Text). Con ello lograr visualizar el
modelo y realizar en el mismo las modificaciones necesarias.
26
En la ventana en la que se ha editado el modelo, es necesario crear una
ecuacin para cada una de las curvas de probabilidad: sin hijos, uno, dos y tres
hijos. Estas situaciones se corresponden con valores de k5 iguales a 0, 1, 2 y
3. Respecto a las restantes variables exgenas, las curvas se calculan para
sus valores medios. En la ecuacin editada estos valores se pueden obtener
empleando la funcin de EViews @mean(nombre de la variable). La variable
age no debe promediarse, puesto que es una de las variables de inters en la
grfica.
En la ventana deber escribir las siguientes ecuaciones (puede utilizar las
opciones de copiar y pegar del editor de texto):
LFP0 = 1 - @CLOGISTIC(-(3.18214044494 - 1.46291303597 * 0 - 0.0645706836214 * @mean(K618)
- 0.0628705507705 * AGE + 0.807273778506 * @mean(WC) + 0.111733572035 * @mean(HC) +
0.604693114912 * @mean(LWG) - 0.0344464305076 * @mean(INC)))
LFP1 = 1 - @CLOGISTIC(-(3.18214044494 - 1.46291303597 * 1 - 0.0645706836214 * @mean(K618)
- 0.0628705507705 * AGE + 0.807273778506 * @mean(WC) + 0.111733572035 * @mean(HC) +
0.604693114912 * @mean(LWG) - 0.0344464305076 * @mean(INC)))
LFP2 = 1 - @CLOGISTIC(-(3.18214044494 - 1.46291303597 * 2 - 0.0645706836214 * @mean(K618)
- 0.0628705507705 * AGE + 0.807273778506 * @mean(WC) + 0.111733572035 * @mean(HC) +
0.604693114912 * @mean(LWG) - 0.0344464305076 * @mean(INC)))
LFP3 = 1 - @CLOGISTIC(-(3.18214044494 - 1.46291303597 * 3 - 0.0645706836214 * @mean(K618)
- 0.0628705507705 * AGE + 0.807273778506 * @mean(WC) + 0.111733572035 * @mean(HC) +
0.604693114912 * @mean(LWG) - 0.0344464305076 * @mean(INC)))
Una vez escritas las ecuaciones, debe hacer clik en Solve y seleccionar en
Solution scenarios & output, Active la opcin Actuals. Al aceptar esta
especificacin EViews genera cuatro nuevas variables lfp0, lfp1, lfp2, lfp3, con
las predicciones de probabilidad para los distintos nmeros de hijos.
27
Para generar las curvas de probabilidad seleccione en la barra de herramientas
del workfile las opciones Object, New Object, Group y acepte OK. En el
cuadro que se abre escriba:
age lfp0 lfp1 lfp2 lfp3
y acepte en OK.
EViews abre una ventana con el grupo de variables anteriores. En la barra de
herramientas seleccione la secuencia View, Graph. En las opciones de grfico
que se le abre, seleccione la opcin Scatter y aceptar. El grfico que
visualizar es similar al que se muestra a continuacin.
.0
.1
.2
.3
.4
.5
.6
.7
.8
.9
32 36 40 44 48 52
AGE
LFP0
LFP1
LFP2
LFP3
Como observar, las curvas de probabilidad muestran que a mayor edad de la
mujer, la probabilidad de participar en el mercado de trabajo disminuye, pero
que el nmero de hijos menores de 5 aos es tambin determinante en la
probabilidad. Cuando el nmero de hijos es igual a tres, la probabilidad de
participar es muy baja, casi nula, y prcticamente independiente de la edad de
la mujer.
Coefficient Tests
Una vez estimado el modelo, EViews ofrece algunos procedimientos que
resultan tiles para analizar el modelo. Puede visualizarlas desde la barra de
herramientas de la ventana de ecuacin, seleccionando View. La primera
opcin de inters es la de Coefficient Tests. En la misma puede realizar los
contrastes de Wald o Razn de Verosimilitud que considere necesarios.
28
Dependent Variable Frequencies
Presenta la distribucin de frecuencias de la variable dependiente.
Categorical Regressor Stats
Muestra la media y la desviacin estndar de las variables explicativas, tanto
para el total de la muestra, como para las dos categora de la variable
dependiente.
Expectation-Prediction (Classification) Table
Presenta el cuadro de clasificaciones que compara las predicciones realizadas
mediante el modelo con los datos observados en la muestra. El programa
permite seleccionar el punto de corte en la prediccin de la probabilidad, en
funcin del cual la prediccin
i
Y

tomar valor 1 0. En los resultados se


muestran cuatro tablas 2x2.
Expectation-Prediction Evaluation for Binary Specification
29
Equation: UNTITLED
Date: 01/20/08 Time: 15:19
Success cutoff: C = 0.5
Estimated Equation Constant Probability
Dep=0 Dep=1 Total Dep=0 Dep=1 Total
P(Dep=1)<=C 180 86 266 0 0 0
P(Dep=1)>C 145 342 487 325 428 753
Total 325 428 753 325 428 753
Correct 180 342 522 0 428 428
% Correct 55.38 79.91 69.32 0.00 100.00 56.84
% Incorrect 44.62 20.09 30.68 100.00 0.00 43.16
Total Gain* 55.38 -20.09 12.48
Percent Gain** 55.38 NA 28.92
Estimated Equation Constant Probability
Dep=0 Dep=1 Total Dep=0 Dep=1 Total
E(# of Dep=0) 168.80 156.20 325.00 140.27 184.73 325.00
E(# of Dep=1) 156.20 271.80 428.00 184.73 243.27 428.00
Total 325.00 428.00 753.00 325.00 428.00 753.00
Correct 168.80 271.80 440.59 140.27 243.27 383.54
% Correct 51.94 63.50 58.51 43.16 56.84 50.94
% Incorrect 48.06 36.50 41.49 56.84 43.16 49.06
Total Gain* 8.78 6.66 7.58
Percent Gain** 15.44 15.44 15.44
*Change in "% Correct" from default (constant probability) specification
**Percent of incorrect (default) prediction corrected by equation
La primera tabla (parte superior a la izquierda) se corresponde a la explicada
anteriormente, que cruza la prediccin a partir del corte en probabilidad, con los
valores observados en la muestra. Los datos reflejados en el cuadro seran los
siguientes:
Valor observado de
i
Y
0
i
Y 1
i
Y
Prediccin de
i
Y


i
Y 180 86
1


i
Y 145 342
En el cuadro se muestra el porcentaje de aciertos para
0
i
Y
e
1
i
Y
(55,38%
y 79,91%, respectivamente) y el porcentaje total de aciertos (69,32%).
Asimismo, en el cuadro aparecen los porcentajes incorrectos.
En la parte superior derecha aparece el cuadro de clasificacin de un modelo
probabilstico sin variables explicativas (nicamente con la constante). La
comparacin de ambos cuadros permite valorar la mejora en capacidad
predictiva del modelo originalmente estimado. Las valores de Total Gain y
Percent Gain permiten esa comparacin. Total Gain recoge la variacin
30
absoluta en el porcentaje de aciertos, mientras que Percent Gain se define
como la mejora porcentual respecto a las clasificaciones incorrectas del modelo
constante.
En la parte inferior del cuadro se muestran las tablas de clasificacin basadas
en el clculo del nmero esperado de observaciones con
0
i
Y
e
1
i
Y
. Por
ejemplo, para el obtener el valor esperado de valores
0
i
Y
se calcular:
( ) ( )



N
i
N
i
i
i
i
F Y P
1 1
' 0 x x
Donde la funcin de distribucin F ser la normal o la logstica.
Goodness-of-Fit Tests (Hosmer-Lemershow)
Esta opcin calcula el contraste de Hosmer-Lemershow. Adems ofrece los
resultados de otro contraste (contraste de Andrews). Los estadsticos difieren
en la forma en la que agrupan las observaciones y en la distribucin asinttica
del contraste. A continuacin slo se comentarn los resultados relacionados
con el contraste de Hosmer-Lemershow. En principio, EViews permite
seleccionar un nmero de intervalos cualquiera, aunque por defecto define 10
intervalos. Esta opcin es la que generalmente aparece en la mayora de
aplicaciones.
En la ventana de resultados aparecen las columnas Low y High en Quantile
of Risk. En estas columnas se muestran las predicciones de probabilidad
mnima y mxima en cada intervalo. En las otras columnas se muestran el
nmero de observaciones en cada intervalo con valores
0
i
Y
e
1
i
Y
, as
como el nmero esperado de predicciones con 0


i
Y e 1


i
Y . En la ltima
columna se recoge la contribucin de cada intervalo al estadstico de Hosmer-
Lemeshow.
31
Goodness-of-Fit Evaluation for Binary Specification
32
Andrews and Hosmer-Lemeshow
Tests
Equation: UNTITLED
Date: 01/20/08 Time: 17:31
Grouping based upon predicted risk (randomize ties)
Quantile of Risk Dep=0 Dep=1 Total H-L
Low High Actual Expect Actual Expect Obs Value
1 0.0140 0.3046 48 59.8827 27 15.1173 75 11.6981
2 0.3056 0.4085 56 48.0046 19 26.9954 75 3.69970
3 0.4091 0.4675 50 42.1046 25 32.8954 75 3.37557
4 0.4677 0.5215 45 38.2991 31 37.7009 76 2.36342
5 0.5226 0.5763 32 33.7267 43 41.2733 75 0.16063
6 0.5771 0.6311 25 29.7702 50 45.2298 75 1.26746
7 0.6339 0.6905 26 25.6709 50 50.3291 76 0.00637
8 0.6925 0.7510 20 20.9795 55 54.0205 75 0.06349
9 0.7559 0.8125 18 16.3535 57 58.6465 75 0.21200
10 0.8136 0.9621 5 10.2082 71 65.7918 76 3.06954
Total 325 325.000 428 428.000 753 25.9163
H-L Statistic 25.9163 Prob. Chi-Sq(8) 0.0011
Andrews Statistic 26.9485 Prob. Chi-Sq(10) 0.0027
El valor del estadstico de HL aparece al final del cuadro. En nuestro ejemplo,
el p-value del contraste es muy bajo (igual a 0,0011), indicando que el modelo
no presenta un buen ajuste a los datos.
33