Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tesina Ivana Barbona
Tesina Ivana Barbona
| y
i
b de efectos fijos y aleatorios respectivamente, o sea:
' ' ' ' ' ' ' ' ' '
ij ij ij i ij ij i ij ij ij i ij i i ij
' '
ij ij ij ij ij i i ij
y h h ( ( ) h ( ) ( )
v( ) ( ) v( )
( ) )
( )
~ + + + + + + c
= + + + c
X Z b X Z b X X Z b Z b b
X Z b b
| | | | |
| |
(11)
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
16
donde
ij
es igual al predictor
' '
ij ij i
h( )
+ X Z b | para la media condicional E(y
ij
|b
i
) y
' ' '
ij ij ij i
v( h ( )
= + X Z b | .
Matricialmente:
i i i i i i i i i
( ) ( )
~ + + + Y VX VZ b b | | c (12)
para las matrices de diseo apropiadas
i
X
y
i
Z , y con
i
+ + ~ + + Y V Y X Zb X Zb | | c (13)
para
*
i
c
igual a
1
i i
V c
, el cual sigue teniendo media cero.
La expresin (13) puede ser vista como un modelo lineal mixto para los denominados
pseudo datos
*
i
Y
, con efectos fijos , efectos aleatorios b
i
, y trmino del error
*
i
c
.
Dados valores iniciales para los parmetros , G y en la verosimilitud marginal, se
calculan las estimaciones de Bayes empricas para b
i
, y luego se calculan los pseudo-datos
*
i
Y . Seguidamente se ajusta el modelo lineal mixto (13), produciendo nuevas estimaciones
de , G y . Estas ltimas se utilizan para actualizar los pseudos-datos y el esquema
anterior se repite alternativamente hasta alcanzar la convergencia.
Las estimaciones resultantes se denominan estimaciones cuasi-verosmiles penalizadas,
debido a que se obtienen al optimizar una funcin de cuasi-verosimilitud que slo involucra
los momentos de primer y segundo orden, aumentada con un trmino de penalidad de los
efectos aleatorios.
Segn Molenberghs y Verbeke (2005) debido a que el ajuste del MLGM se basa en
principios mximo verosimiles, las inferencias acerca de los parmetros se obtienen tambin
a partir de la teora de mxima verosimilitud clsica.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
17
Al asumir que el modelo ajustado es apropiado, los estimadores de los parmetros se
distribuyen asintticamente Normal. Por lo tanto, pueden llevarse a cabo tests de tipo Wald,
tests de Razn de Verosimilitud y tests de Score. En el punto anterior se mostr que los
parmetros de los MLGM se pueden estimar ajustando un MLM a un conjunto de pseudo
datos. Las estimaciones de la precisin para los efectos fijos y para los efectos aleatorios se
calculan, entonces, utilizando la metodologa para los modelos lineales mixtos, lo que hace
posible el uso de tests Z, t y F para los efectos fijos.
En cuanto a los efectos aleatorios, resulta de inters la inferencia acerca de las
componentes de variancia. En estos casos pueden aplicarse los test csicos de Wald, Razn
de Verosimilitud y Score, siempre y cuando las hiptesis planteadas no refieran a la frontera
del espacio paramtrico.
Por ejemplo puede interesar probar si la variancia
2
b
o
de un efecto aleatorio en un
modelo lineal generalizado con un nico efecto aleatorio es igual a cero; en este caso las
hiptesis en cuestin son la siguientes: H
0
:
2
b
o
= 0 vs. H
1
:
2
b
o
> 0. De esta forma, la hiptesis
nula cae sobre la frontera del espacio paramtrico
2
0
b
o >
, por lo tanto, como fue expresado
anteriormente, ninguno de los test clsicos como Wald, Razn de Verosimilitud o Score
resultan vlidos. Esto puede verse fcilmente considerando el test de Wald que se basara en
la aproximacin de la distribucin normal estndar de la estimacin
2
b
o
.
Esta estadstica no puede distribuirse normal con media igual a cero ya que la estimacin
de
2
b
o
toma slo valores positivos. En consecuencia, bajo H
0
, esta estadstica sigue una
distribucin normal positiva en el 50% de los casos y es igual a cero en el otro 50% de los
casos. Ello conduce a una mezcla de distribuciones
2
_
como distribucin nula. Es decir,
cuando
2
b
o
> 0 y la estadstica observada del test toma el valor t, el valor de la probabilidad
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
18
asociada para este test asinttico es ( )
2
1
1
2
P t _ >
, que equivale a la mitad de la probabilidad
asociada al test asinttico Chi Cuadrado con 1 grado de libertad (Molenberghs y Verbeke,
2005; Agresti, 2002).
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
19
IV- Resultados
En esta seccin se presentan los resultados obtenidos al analizar los datos disponibles
sobre la desocupacin en el aglomerado Gran Rosario.
En primer lugar se realiza un anlisis descriptivo de las variables a considerar en este
trabajo y luego se utiliza un Modelo Logit Mixto para estudiar el efecto que tienen
determinados factores demogrficos y socio-econmicos sobre la desocupacin en el
aglomerado Gran Rosario en el perodo que comprende los aos 2005 y 2006.
IV-A Anlisis descriptivo
Durante el perodo en estudio, como ya fue explicitado, los individuos fueron
encuestados en reiteradas oportunidades u ocasiones de acuerdo a un sistema rotativo que
da la posibilidad de realizar anlisis en el tiempo, siguiendo a un hogar o a un respondente
desde su ingreso en el panel hasta la ltima vez que es encuestado.
En base a dicho seguimiento se construye la Tabla I y la Figura 1 en las cuales se
observa que el porcentaje de desocupados presenta cambios a lo largo del perodo que
comprende los 8 trimestres. Para el caso particular del ao 2005 este porcentaje resulta
14,11% en el primer trimestre, para luego descender y mantenerse aproximadamente en el
12% en los tres trimestres restantes. En el ao 2006 se visualiza que el valor del porcentaje
de desocupados para el primer trimestre supera al mismo trimestre del ao anterior. No
obstante, este porcentaje va disminuyendo a travs del 2006 finalizando el ao con 9,43%
de desocupados, cifra menor que la ltima del 2005.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
20
Tabla I: Porcentaje de desocupados por trimestre del perodo 2005-2006
Ao
2005 2006
1er
Trimestre
2do
Trimestre
3er
Trimestre
4to
Trimestre
1er
Trimestre
2do
Trimestre
3er
Trimestre
4to
Trimestre
% desocupados
14,11 12,11 12,52 12,35 14,88 12,68 11,05 9,43
PEA
1028 966 1118 1061 1109 1167 1186 1114
Figura I: Porcentaje de desocupados versus trimestres para cada ao
En la Tabla II se presentan los porcentajes de desocupados correspondientes a los aos
2005 y 2006 segn los diferentes factores demogrficos y socio-econmicos en los trimestres
considerados.
Se puede apreciar que el porcentaje de desempleo es notablemente mayor para las
mujeres que para los hombres en todos los trimestres. El mximo porcentaje de desempleo
en el perodo estudiado, en el caso de los hombres, es 12,38% en el primer trimestre del
2005 y el mnimo es 7,31% en el cuarto trimestre del 2006. Para las mujeres estos
porcentajes son 21,10% en el primer trimestre del 2006 y 12,47% en el cuarto trimestre del
2006 respectivamente. Adems, para los individuos de sexo masculino se ve que en ambos
aos el porcentaje de desocupados desciende en el segundo trimestre, a continuacin
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
21
presenta un leve aumento en el tercer trimestre para luego disminuir en el cuarto. En cuanto
a las mujeres, si bien no se observa un patrn similar al de los hombres en los dos aos, se
puede apreciar que en el 2006 el porcentaje de desempleo es elevado al principio y va
disminuyendo a travs del tiempo.
Tabla II: Porcentajes de desocupados segn condicin sociodemogrfica en el perodo 2005-
2006
% de desocupados
Ao
2005 2006
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
Sexo
Hombre 12,38 10,52 10,99 8,72 10,55 9,20 9,88 7,31
Mujer 16,67 14,32 14,49 16,81 21,10 17,26 12,60 12,47
Nivel
Educativo
Sin
Instruccin/Primaria
incompleta /
Educacin Especial.
15,49 13,33 11,11 13,33 9,52 8,82 2,56 8,05
Primaria completa o
Secundaria
incompleta
12,79 14,25 15,88 15,76 17,67 12,81 13,72 11,03
Secundaria completa
o Superior
Universitaria
incompleta
18,92 13,62 13,15 13,03 15,98 15,67 12,75 11,03
Superior
Universitaria
completa
5,73 3,59 5,43 3,92 6,21 7,18 4,48 3,11
Condicin
de jefe de
hogar
Es Jefe 4,96 8,02 5,68 6,57 7,27 5,81 4,43 5,21
No es Jefe 22,24 15,67 18,64 17,53 21,33 18,83 16,61 13,09
Rama de
Actividad
Construccin 23,47 12,63 21,65 18,89 15,04 18,63 18,35 14,66
Manufactura 3,57 5,63 10,15 9,42 6,17 3,59 9,14 4,59
Serv. Comerciales 12,77 12,68 8,83 8,78 10,12 9,94 7,14 8,27
Intermediacin
Financiera
10,87 11,76 9,43 6,52 14,68 12,40 10,62 6,74
Adm. Pblica y
Defensa, Enseanza
y Serv. Soc. y de
Salud
3,70 5,56 4,25 2,56 4,84 5,26 2,01 3,57
Otras actividades de
servicio
15,56 11,63 13,87 21,33 25,00 13,89 13,38 13,53
Nivel de
Ingreso
Familiar
Bajo (deciles 1, 2
y 3)
20,50 23,83 22,22 20,00 25,00 20,56 20,26 18,93
Medio (deciles 4,
5, 6 y 7)
12,42 9,80 11,78 10,98 12,07 10,46 8,22 8,82
Alto (deciles 8, 9 y
10)
3,14 4,85 1,54 2,37 5,03 7,03 4,69 1,66
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
22
Con respecto al nivel de educacin, los porcentajes ms bajos de desempleo se dan en
casi todos los trimestres entre las personas con educacin superior universitaria completa.
En cambio, el mayor porcentaje de desocupacin se presenta en la mayora de los trimestres
para los individuos con primaria completa o secundaria incompleta. Otra caracterstica
observada es que para el grupo de personas con secundaria completa o superior
universitaria incompleta, los porcentajes de desempleo descienden a travs del tiempo tanto
dentro del ao 2005 como del 2006. Tambin se puede ver que los porcentajes de individuos
desocupados para todos los trimestres en el ao 2006 de la categora sin instruccin o
primaria incompleta o educacin especial son menores que los mismos para los respectivos
trimestres en el ao 2005.
Al tener en cuenta la condicin de jefe de hogar, para todos los trimestres, el porcentaje
de desocupacin es notablemente ms bajo en los individuos que son jefes de hogar
respecto de aqullos que no lo son. En el ao 2005 se observa que el porcentaje de
desempleo para los jefes de hogar presenta fluctuaciones, ya que sube en el segundo
trimestre, luego decrece y vuelve a subir en el ltimo trimestre del ao. En cambio, en el ao
2006 este porcentaje desciende con el transcurso del ao.
Al considerar la rama de actividad econmica los porcentajes ms altos de desocupacin
se dan con ms frecuencia en el rea de la construccin, mientras que los ms bajos se
observan en la administracin pblica y defensa, enseanza y servicios sociales y de salud.
Tambin se observan porcentajes relativamente bajos para la rama de actividad
manufacturera.
En relacin al nivel de ingreso familiar, los mayores porcentajes de desempleo se
observan en todos los trimestres para el grupo de individuos con nivel de ingreso familiar
bajo, siendo los mismos del orden del 20%, y dicho porcentaje va descendiendo a medida
que aumenta el ingreso.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
23
En la Tabla III se puede observar que la edad promedio de los individuos desocupados
es notablemente menor que la de los individuos ocupados en todos los trimestres, lo mismo
sucede con la mediana de la edad. Por otro lado la edad promedio para las personas
desocupadas es, en casi todos los trimestres, menor en el 2006 en comparacin con el 2005.
Se destaca que para los desocupados tanto en el 2005 como en el 2006 existe una marcada
asimetra en la distribucin de la edad reflejada en la diferencia observada entre media y
mediana.
Tabla III: Medidas descriptivas para la Edad de las personas entrevistadas segn su estado
ocupacional en el perodo 2005-2006
Ao Trimestre Media
Desvo
Estndar
Mediana
Estado
Ocupacional
Ocupado
2005
1er 39,38 13,30 38,00
2do 39,73 14,47 38,00
3er 39,55 13,95 38,00
4to 40,00 13,87 35,50
2006
1er 39,08 14,00 38,00
2do 39,57 14,10 39,00
3er 39,37 14,11 38,00
4to 39,75 14,31 38,00
Desocupado
2005
1er 31,68 13,97 26,00
2do 33,77 15,55 27,00
3er 33,24 14,31 27,50
4to 33,98 14,25 28,00
2006
1er 31,81 14,39 26,00
2do 30,61 13,28 25,00
3er 30,31 13,39 25,00
4to 30,97 14,16 25,00
Medidas descriptivas generales 38,62 14,25 37,00
IV-B Modelizacin
Con el fin analizar los cambios que se presentan en la probabilidad de estar desempleado
teniendo en cuenta simultneamente las distintas caractersticas demogrficas y socio-
econmicas de los individuos se ajusta un Modelo Logit Mixto, especficamente un Modelo
Logit con intercepto aleatorio. Mediante la incorporacin del intercepto aleatorio, se pretende
tener en cuenta la posible asociacin entre las respuestas de un mismo individuo
correspondientes a diferentes momentos.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
24
Como, de acuerdo a lo observado en la Tabla y Figura I, la probabilidad estimada de
estar desocupado presenta cambios a travs del perodo considerado se decide incluir el
trimestre como un efecto fijo en el modelo. Del ajuste de dicho modelo se obtienen las
estimaciones que se presentan en la Tabla IV.
En la misma se observa que la mayora de las estimaciones de los parmetros obtenidas
al ajustar el modelo son significativas a un nivel del 5%, excepto para las categoras de la
variable nivel educacional, y para la categora de rama de actividad manufactura.
Tabla IV: Estimaciones de los parmetros del Modelo Logit Mixto
Estimacin Error Estndar
p-asociado
(Test de Wald)
Intercepto -4,7176 0,3733 <0,0001
Condicin de jefe de hogar
No es jefe 1,0475 0,1337 <0,0001
Es jefe 0 . .
Sexo
Mujer 0,3850 0,1300 0,0031
Hombre 0 . .
Nivel educativo
Sin Instruccin / Primaria incompleta o Educacin Especial -0,5014 0,3030 0,0981
Primaria completa o Secundaria incompleta 0,05812 0,2260 0,7971
Secundaria completa o Superior universitaria incompleta 0,2829 0,2160 0,1904
Superior universitaria completa 0 . .
Rama de actividad
Construccin 1,5351 0,2398 <0,0001
Manufactura 0,3486 0,2383 0,1436
Serv. Comerciales 0,9321 0,2039 <0,0001
Intermediacin Financiera 1,3950 0,2400 <0,0001
Otras actividades de servicio 1,1288 0,2088 <0,0001
Adm. Pblica y Defensa, Enseanza y Serv. Soc. y de Salud 0 . .
Nivel de Ingreso Familiar
Bajo (deciles 1, 2 y 3) 2,0075 0,2051 <0,0001
Medio (deciles 4, 5, 6 y 7) 1,0815 0,1959 <0,0001
Alto (deciles 8, 9 y 10) 0 . .
Edad -0,01279 0,004572 0,0052
Trimestre -0,04458 0,02227 0,0454
Variancia del efecto aleatorio 1,0067 0,1488 <0,0001
Con el objeto de evaluar si la variancia del efecto aleatorio del modelo es
significativamente distinta de cero, se aplica el test de Wald explicitado en la seccin C del
captulo III. El valor de la probabilidad asociada para dicho test es <0,0001, con lo cual se
concluye que la heterogeneidad entre individuos es lo suficientemente importante como para
ser tenida en cuenta mediante la incorporacin del efecto aleatorio en el modelo.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
25
Un comentario especial merece el hecho de que la variable nivel de ingreso familiar
presenta una gran cantidad de valores faltantes: 2837 sobre un total de 8749 observaciones.
De todas formas, debido a que se trata de una caracterstica importante a tener en cuenta
para el estudio de la desocupacin se decide considerarla en el modelo. Otra variable que
presenta valores faltantes es rama de actividad econmica (406 valores faltantes). No
obstante, es prudente reconocer que al ajustar el modelo en presencia de estas variables se
va a trabajar slo con una submuestra que corresponde a las personas que declaran ingreso
familiar y rama de actividad econmica. Por lo tanto, debido a que dicha submuestra se
espera resulte representativa a su vez de una subpoblacin, las inferencias en base al
modelo utilizado estn dirigidas a sta y no a la poblacin total de individuos.
A continuacin se presentan un breve anlisis descriptivo considerando la submuestra de
individuos que no presentan valores faltantes con el fin de representar las caractersticas de
los mismos.
Tabla V: Porcentaje de desocupados por trimestre del perodo 2005-2006 para la submuestra
considerada al ajustar el modelo.
Ao
2005 2006
1er
Trimestre
2do
Trimestre
3er
Trimestre
4to
Trimestre
1er
Trimestre
2do
Trimestre
3er
Trimestre
4to
Trimestre
% desocupados
10,97 11,43 10,17 9,88 12,22 8,87 9,16 8,92
PEA
720 665 757 729 679 688 688 706
Los porcentajes de desocupados por trimestre que se presentan en la tabla V disminuyen
respecto a los mismos porcentajes obtenidos en base a la totalidad de los individuos.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
26
Tabla VI: Porcentajes de desocupados segn condicin sociodemogrfica en el perodo 2005-
2006 para la submuestra considerada al ajustar el modelo.
En la tabla VI se observa que las probabilidades de estar desocupados disminuyen en la
mayora de los trimestres para las variables sexo, nivel educativo, condicin de jefe de hogar
y nivel de ingreso familiar. En el caso de la rama de actividad econmica algunas categoras
presentan aumento en el porcentaje de desocupados para algunos trimestres.
Resulta interesante sealar que se realizaron tablas de frecuencias para todas las
variables en la muestra total de individuos y en la submuestra (Ver Anexo pg. 40). Se
% de desocupados
Ao
2005 2006
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
Sexo
Hombre 10,30 9,82 8,75 8,21 9,77 6,82 7,81 6,68
Mujer 12,01 13,67 11,98 11,93 15,71 11,40 11,00 12,20
Nivel
Educativo
Sin
Instruccin/Primaria
incompleta /
Educacin Especial.
11,32 9,80 6,67 8,77 6,98 6,67 3,77 6,56
Primaria completa o
Secundaria
incompleta
11,11 13,10 12,22 12,66 12,32 10,25 11,91 11,41
Secundaria completa
o Superior
Universitaria
incompleta
11,81 13,10 11,03 9,56 14,12 10,00 9,85 8,80
Superior
Universitaria
completa
8,16 3,16 4,65 3,54 8,89 3,00 2,13 3,09
Condicin
de jefe de
hogar
Es Jefe 4,35 7,06 3,92 5,23 6,23 4,23 3,71 5,19
No es Jefe 17,90 15,63 16,58 14,48 18,13 13,81 14,79 12,84
Rama de
Actividad
Construccin 24,00 11,69 17,39 20,00 13,79 17,74 20,00 13,41
Manufactura 3,13 7,02 10,42 9,23 1,89 0,95 7,92 4,00
Serv. Comerciales 11,32 17,22 9,21 7,31 12,31 10,10 6,67 9,28
Intermediacin
Financiera
14,04 15,00 9,38 7,02 17,65 13,85 11,43 10,53
Adm. Pblica y
Defensa, Enseanza
y Serv. Soc. y de
Salud
4,11 4,55 5,10 3,50 5,26 2,78 3,15 3,54
Otras actividades de
servicio
18,63 12,75 15,79 19,09 24,77 14,42 13,64 16,30
Nivel de
Ingreso
Familiar
Bajo (deciles 1, 2
y 3)
16,08 20,89 18,90 17,62 20,87 14,29 17,05 15,22
Medio (deciles 4,
5, 6 y 7)
10,93 7,47 8,89 8,10 9,09 7,96 6,67 8,70
Alto (deciles 8, 9 y
10)
2,60 5,03 0,53 1,83 3,33 4,49 3,76 1,13
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
27
observa en base a las mismas que la muestra total y la submuestra son similares en cuanto
a la distribucin de las variables consideradas en el modelo.
Otro de los aspectos importantes a tener en cuenta en la bsqueda del modelo ms
apropiado es la evaluacin de la forma funcional bajo la que se incluyen las variables
continuas en el modelo. Para esto se recurre a estrategias propuestas por Hosmer y
Lemeshow (2000).
Una forma simple consiste en categorizar la variable continua de manera que los
cuartiles de la misma determinen los niveles. Se calculan las razones de odds estimadas
segn el modelo tomando el primer cuartil como categora de referencia. Estas razones de
odds representan la chance de estar desocupado para un individuo que pertenece a un
cuartil determinado versus la chance de estar desocupado en el caso de que el mismo
individuo pertenezca al primer cuartil. Luego se grafican los puntos medios de los cuartiles
versus las razones de odds estimadas del modelo con la variable continua como categrica.
De esta forma se puede observar y explorar grficamente la escala de la covariable. Una
recta indicara que la variable continua es lineal en el logit, mientras que si el polgono se
aparta de una recta su forma puede sugerir la posible transformacin que se debe aplicar a
la variable continua. Tiene como ventaja la simplicidad de su aplicacin, no obstante, no es
una tcnica lo suficientemente poderosa para captar desviaciones sutiles respecto a una
tendencia lineal.
Otra tcnica es la denominada Polinomios Fraccionarios; bsicamente consiste en buscar
la transformacin que proporcione la mejor forma funcional para la variable continua entre
un conjunto de posibles transformaciones de la variable a travs de un procedimiento
iterativo. (Ver Anexo pg. 45).
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
28
Las variables de naturaleza continua en el modelo son edad y trimestre. Para evaluar la
forma funcional de dichas variables se aplican las tcnicas explicitadas anteriormente
obtenindose los siguientes resultados.
Figura IV: Razones de odds entre estado ocupacional y edad categorizadas (grfico A) y
estado ocupacional y trimestre categorizada (grfico B)
En el grfico A de la Figura IV se observa que la escala de la variable edad no resulta
lineal. Por otro lado, la escala de la variable tiempo parece ser aproximadamente lineal hasta
el tercer cuartil, para luego mantenerse constante ya que la razones de odds estimadas
entre el tercer cuartil y el cuarto son prcticamente iguales como puede observarse en el
grfico B de la Figura IV.
Al aplicar la tcnica de polinomios fraccionarios a la variable edad, la transformacin
hallada conduce a incluir en el modelo dos trminos: un coeficiente que acompaa a la
variable en forma lineal y otro coeficiente que acompaa a la misma en forma logartmica.
Respecto a la variable trimestre, la misma ingresa de manera lineal confirmando la
evaluacin grfica realizada.
En la Figura V se muestran las razones de odds estimadas para estado ocupacional y
edad (grfico A) y estado ocupacional y trimestre (grfico B), en base a las transformaciones
recin elegidas. Se observa que para el caso de la variable edad, sta tiene una forma
grfico A grfico B
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
29
bastante similar a la que se visualiza en el grfico A de la Figura IV, lo que sugiere que los
resultados obtenidos segn esta tcnica concuerdan con los resultados grficos hallados
previamente. En cuanto a la variable trimestre la forma funcional elegida da lugar a una
lnea recta de pendiente negativa (Figura V grfico B).
Figura V: Razones de odds entre estado ocupacional y edad (grafico A) y estado ocupacional
y trimestre (grfico B)
Por consiguiente se reestima el modelo incluyendo edad y trimestre con la forma
funcional elegida en base a la tcnica de polinomios fraccionarios. La estimacin de dicho
modelo se presenta en la Tabla VII.
grfico A grfico B
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
30
Tabla VII: Estimaciones de los parmetros del Modelo Logit Mixto
Estimacin Error Estndar p-asociado
Intercepto 5,5152 1,9215 0,0041
Condicin de jefe de hogar
No es jefe 0,9423 0,1367 <0,0001
Es jefe 0 . .
Sexo
Mujer 0,4297 0,1304 0,0010
Hombre 0 . .
Nivel educativo
Sin Instruccin / Primaria incompleta o Educacin Especial -0,6722 0,3046 0,0274
Primaria completa o Secundaria incompleta -0,08588 0,2274 0,7057
Secundaria completa o Superior universitaria incompleta 0,1946 0,2166 0,3689
Superior universitaria completa 0 . .
Rama de actividad
Construccin 1,4711 0,2409 <0,0001
Manufactura 0,2863 0,2391 0,2313
Serv. Comerciales 0,8466 0,2047 <0,0001
Intermediacin Financiera 1,3169 0,2411 <0,0001
Otras actividades de servicio 1,0624 0,2093 <0,0001
Adm. Pblica y Defensa, Enseanza y Serv. Soc. y de Salud 0 . .
Nivel de Ingreso Familiar
Bajo (deciles 1, 2 y 3) 2,0239 0,2055 <0,0001
Medio (deciles 4, 5, 6 y 7) 1,0999 0,1963 <0,0001
Alto (deciles 8, 9 y 10) 0 . .
Edad 0,09593 0,02027 <0,0001
Log(Edad) -3,9685 0,7302 <0,0001
Trimestre -0,04984 0,02248 0,0267
Variancia del efecto aleatorio 1,0063 0,1488 <0,0001
Este modelo no presenta diferencias con respecto al anterior en cuanto a la significacin
de las variables excepto en el caso del nivel educativo sin instruccin/primaria incompleta o
educacin especial el cual resulta significativo para el nuevo modelo a un nivel del 5%.
Adems, la estimacin de la variancia del efecto aleatorio es significativamente distinta de
cero (p<0,0001), por lo tanto la incorporacin del efecto aleatorio es adecuada teniendo en
cuenta la heterogeneidad entre los individuos.
Para llevar a cabo la interpretacin de los coeficientes de las covariables en el Modelo
Logit Mixto ajustado se interpretan las estimaciones de las razones de odds condicionales.
Las mismas representan la chance de estar desocupado para un individuo segn sea el valor
asumido por cada covariable en particular manteniendo constante el valor de las restantes.
En la Tabla VIII se presentan las estimaciones puntuales de razones de odds y los
respectivos intervalos de confianza segn el modelo considerado.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
31
Tabla VIII: Razones de odds entre estado ocupacional y cada factor socio-demogrfico
Estimacin
RO
IC 95%
LI LS
Condicin de jefe de hogar
No es jefe vs. es jefe 2,566 1,963 3,355
Sexo
Mujer vs. Hombre 1,537 1,190 1,984
Nivel educativo
Sin Instruccin / Primaria incompleta o Educacin Especial vs. Superior Universitaria completa 0,511 0,281 0,928
Primaria completa o Secundaria incompleta vs. Superior Universitaria completa 0,918 0,588 1,433
Secundaria completa o Superior universitaria incompleta vs. Superior Universitaria completa 1,215 0,794 1,858
Rama de actividad
Construccin vs. Adm. Pblica y Defensa, Enseanza y Serv. Soc. y de Salud 4,354 2,715 6,983
Manufactura vs. Adm. Pblica y Defensa, Enseanza y Serv. Soc. y de Salud 1,332 0,833 2,128
Serv. Comerciales vs. Adm. Pblica y Defensa, Enseanza y Serv. Soc. y de Salud 2,332 1,561 3,483
Intermediacin Financiera vs. Adm. Pblica y Defensa, Enseanza y Serv. Soc. y de Salud 3,732 2,326 5,987
Otras actividades de servicio vs. Adm. Pblica y Defensa, Enseanza y Serv. Soc. y de Salud 2,893 1,919 4,361
Nivel de Ingreso Familiar
Bajo (deciles 1, 2 y 3) vs. Alto (deciles 8, 9 y 10) 7,568 5,057 11,325
Medio (deciles 4, 5, 6 y 7) vs. Alto (deciles 8, 9 y 10) 3,004 2,044 4,415
Trimestre 0,951 0,910 0,994
Se puede ver en la Tabla VIII que la chance de que un individuo que no sea jefe de
hogar est desocupado es aproximadamente entre 2 y 3 veces mayor que si el mismo
individuo fuese jefe de hogar.
Con respecto al nivel de instruccin se puede decir que para un individuo sin instruccin
o con primaria incompleta o educacin especial la chance de estar desocupado es entre un
10% y un 70% menor que si el mismo individuo tuviese nivel educacional superior
universitario completo.
Si se considera a un individuo con primaria completa o secundaria incompleta, la chance
de estar desocupado resulta similar a la que presentara si ste tuviese nivel educacional
superior universitario completo. Lo mismo sucede con la chance de estar desocupado para
un individuo con nivel secundario completo o superior universitario incompleto versus
superior universitario completo.
En cuanto al nivel de ingreso familiar, se puede decir que la chance de estar desocupado
para una persona con nivel de ingreso familiar bajo es entre 5 y 11 veces mayor,
aproximadamente, que si esta persona tuviese un nivel de ingreso familiar alto. A su vez, la
chance de desocupacin para un individuo con un nivel de ingreso familiar medio es entre 2
y 4 veces y media mayor que si tuviese un nivel de ingreso familiar alto.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
32
Respecto de la rama de actividad se puede destacar que la chance de desocupacin para
un individuo que se dedica a la construccin es entre 3 y 7 veces mayor que la chance que
tendra si se dedicara a la administracin pblica y defensa, enseanza y servicios sociales y
de salud.
En relacin al trimestre, la chance de estar desocupado para un individuo en particular es
como mximo un 9% menor en un trimestre dado respecto de la chance de estar
desocupado si hubiese sido entrevistado en el trimestre inmediatamente anterior, lo que da
una idea acerca de la importancia de la disminucin de la desocupacin a travs del tiempo
en el perodo bajo estudio.
Resulta interesante describir el efecto de la edad sobre la probabilidad de desocupacin.
Para esto se elige a manera de ejemplo el perfil poblacional de los individuos de sexo
masculino, jefes de hogar, con nivel educativo secundario completo o universitario
incompleto cuya rama de actividad econmica son los servicios comerciales y que poseen un
nivel de ingreso familiar medio, entrevistados en el cuarto trimestre del ao 2006. En la
Figura VIII se presenta la probabilidad estimada de estar desocupado versus la edad para
individuos con el perfil anteriormente definido.
Figura VIII: Probabilidades estimadas desocupacin segn la edad para varones, jefes de
hogar, con secundario completo o universitario incompleto con rama de actividad econmica
en los servicios comerciales, con nivel de ingreso familiar medio y entrevistados en el 4
to
trimestre del ao 2006
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
33
Se observa que la probabilidad estimada de estar desocupado alrededor de los 20 aos
es aproximadamente de 0,06, luego desciende levemente para mantenerse en ese nivel
hasta poco antes de los 50 aos, edad a partir de la cual comienza a ascender.
Por otro lado tambin resulta interesante comparar perfiles de individuos y de esta
manera poder observar cmo varan las probabilidades estimadas de estar desocupado para
individuos que difieren en alguna caracterstica. Por ejemplo, puede interesar la diferencia en
las curvas de probabilidades estimadas en funcin de la edad para hombres jefes de hogar,
con secundario completo o universitario incompleto, con nivel de ingreso familiar medio,
entrevistados en el 4
to
trimestre del ao 2006 que difieran en la rama de actividad
econmica. Estos perfiles se encuentran representados en el siguiente grfico:
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
34
Figura IX: Probabilidades estimadas de estar desocupado a travs de la edad para dos
perfiles que difieren rama de actividad econmica.
__ Hombre, jefe de hogar, con secundario completo o universitario incompleto cuya rama de
actividad son los servicios comerciales, ingreso familiar medio entrevistados en el cuarto
trimestre del ao 2006.
- - - Hombre, jefe de hogar, con secundario completo o universitario incompleto cuya rama de
actividad es la administracin pblica y defensa, enseanza y servicios sociales y de salud,
ingreso familiar medio entrevistados en el cuarto trimestre del ao 2006.
Como se visualiza en la Figura IX, las probabilidades estimadas de desocupacin son
menores para los hombres jefe de hogar con secundario completo o universitario incompleto
que pertenecen a la rama de actividad administracin pblica y defensa, enseanza y
servicios sociales y de salud, ingreso familiar medio entrevistados en el cuarto trimestre del
2006, comparadas con las respectivas probabilidades para aquellos con las mismas
caractersticas pero que pertenecen a la rama de actividad servicios comerciales.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
35
IV-B-1 Consideraciones acerca del supuesto distribucional de los efectos aleatorios
El ajuste del Modelo Logit con intercepto aleatorio, como ya fuera explicitado, supone
que los efectos aleatorios b
i
tienen distribucin normal con media 0 y variancia
2
b
o . Con el fin
de explorar el cumplimiento de dicho supuesto se calculan algunas medidas descriptivas y se
construyen grficos para las estimaciones de los efectos aleatorios asociados a cada
individuo.
Las diferencias entre las medidas de tendencia central calculadas, media y mediana,
sugieren falta de simetra en la distribucin de las estimaciones de los efectos aleatorios
(Tabla IX). La misma se corrobora al realizar el histograma y el grfico de normalidad que se
presentan en las Figuras IX y X respectivamente. Si bien Alonso et al. (2008) afirman que las
estimaciones de los efectos aleatorios pueden no seguir una distribucin normal incluso
cuando la distribucin correcta de los efectos aleatorios sea efectivamente normal, preocupa
la notable falta de normalidad observada.
Tabla IX: Medidas descriptivas para las estimaciones bayesianas de los efectos aleatorios
Media
Desvo
Estndar
Mnimo Mximo Rango Quartil 1 Mediana Quartil 3
-1,55376E-16 0,32 -0,87 1,93 2,8 -0,15 -0,06 -0,02
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
36
Figura IX: Histograma para las estimaciones de los efectos aleatorios
Figura X: Grfico de normalidad para las estimaciones de los efectos aleatorios
Es por ello que se realiz una exploracin de los dos grupos de individuos bien
diferenciados que se observan en el histograma (Figura IX) respecto a las variables
consideradas en el estudio. Slo se encontraron diferencias en relacin a la propia variable
respuesta estado ocupacional difiriendo notablemente el porcentaje de desocupados por
grupo de individuos, tal como se observa en la Tabla X que se presenta a continuacin.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
37
Tabla X: Estado Ocupacional segn si el efecto aleatorio es menor o mayor que 0
Tambin es sabido que, si bien los estimadores mximos verosmiles del modelo pueden
ser sesgados debido a la postulacin de una distribucin de los efectos aleatorios incorrecta,
la magnitud del sesgo es generalmente pequea (Alonso et al., 2008). En base a esta ltima
aseveracin se decide entonces confiar en los resultados hallados en base al ajuste del
modelo.
En este sentido, Alonso et al. han demostrado mediante estudios por simulacin, en los
cuales se consideraron diferentes distribuciones para el intercepto aleatorio, que las
estimaciones de los parmetros de inters y los procedimientos inferenciales fueron similares
independientemente de la distribucin utilizada. Estas afirmaciones tambin tranquilizan
acerca del ajuste logrado.
Cabe destacar que una estrategia recomendada cuando hay dudas acerca de la
verdadera distribucin de los efectos aleatorios, es utilizar tambin un enfoque no
paramtrico o uno semi-paramtrico para estimar los efectos aleatorios ya que el mismo
constituye una herramienta muy flexible para capturar la estructura de asociacin intra-
sujeto. Si los resultados a partir de ambos enfoques difieren sustancialmente se puede
cuestionar efectivamente el supuesto de normalidad y sera recomendable utilizar los
resultados obtenidos bajo el enfoque semi-paramtrico (Agresti et al., 2004; Litiere et al.,
2008). Esta alternativa, si bien excede los lmites fijados para esta tesina, podra enriquecer
la evaluacin del supuesto distribucional de los efectos aleatorios.
bi menor que 0 bi mayor que 0
Estado
% ocupado 34,59 99,17
% desocupado 65,41 0,83
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
38
V-Consideraciones finales
La aplicacin del Modelo Logit Mixto es muy til en el caso de contar con datos binarios
longitudinales ya que permite tener en cuenta la correlacin entre las mediciones realizadas
a un mismo individuo. En el caso de los datos sobre desocupacin analizados en este
trabajo, este modelo resulta apropiado para estudiar el efecto de determinadas covariables
demogrficas y socio-econmicas sobre la probabilidad de que un individuo est desocupado
como as tambin para controlar la heterogeneidad intra-individuo respecto al estado
ocupacional a travs del tiempo.
En particular, los resultados obtenidos para el aglomerado Gran Rosario correspondiente
al perodo 2005-2006 indican que la chance de estar desocupado es menor para un individuo
jefe de hogar respecto si este no fuese jefe de hogar. Otro hallazgo llamativo es que para
un individuo sin instruccin o con primaria incompleta o educacin especial, la chance de
estar desocupado es mucho menor que si tuviese nivel educacional superior universitario
completo. En el caso de un individuo con primaria completa o secundaria incompleta, la
chance de estar desocupado resulta similar a la que presentara si tuviese nivel educacional
superior universitario completo. Lo mismo sucede con un individuo con secundaria completa
o superior universitaria incompleta. Con respecto al nivel de ingreso familiar, segn la
modelizacin, se puede decir que la chance de desocupacin aumenta cuanto menor es el
nivel de ingreso familiar. Respecto de la rama de actividad se puede destacar que la chance
de desempleo para un individuo que se dedica a la construccin es mayor comparada con la
que tendra si se dedicara a la Administracin Pblica y Defensa, Enseanza y Servicios
Sociales y de Salud. Por ltimo, se pudo confirmar una disminucin de la chance de
desocupacin a travs del tiempo.
En conclusin, se puede decir que el modelo aplicado resulta til para estudiar la
desocupacin utilizando datos de tipo longitudinal provenientes de la EPH. Sera
enriquecedor contar con la opinin de expertos en el tema, que puedan aportar su punto de
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
39
vista respecto de las categorizaciones elegidas para las variables y las asociaciones
encontradas.
Por ltimo, cabe destacar que resultara conveniente estudiar y explorar
metodolgicamente de manera ms amplia el supuesto de normalidad de efectos aleatorios.
En este sentido se han presentado recientemente algunos test que permiten evaluar la
validez de este supuesto (Alonso et al., 2008), por lo que queda evidenciado que se trata de
un rea de investigacin actual.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
40
VI-Anexo
VI-A Anlisis descriptivo de la muestra total de individuos y la submuestra
correspondiente a los individuos utilizados para ajustar el modelo.
Tabla XI: Tabla de frecuencias de la variable sexo.
Tabla XII: Tabla de frecuencias de la variable nivel educativo.
Nivel Educativo Frecuencia Porcentaje
Submuestra de individuos que no
presentan valores faltantes
Sin instruccin/ Primaria incompleta/ Educacin especial 408 7,24
Primaria completa o Secundaria incompleta 2366 42,01
Secundaria completa o Superior universitaria incompleta 2042 36,26
Superior universitaria completa 816 14,49
Total 5632 100
Muestra total de individuos
Sin instruccin/ Primaria incompleta/ Educacin especial 589 6,73
Primaria completa o Secundaria incompleta 3390 38,75
Secundaria completa o Superior universitaria incompleta 3257 37,23
Superior universitaria completa 1513 17,29
Total 8749 100
Tabla XIII: Tabla de frecuencias de la variable condicin de jefe de hogar.
Condicin de Jefe de
Hogar
Frecuencia Porcentaje
Submuestra de individuos que no presentan valores faltantes
Es jefe 2848 50,57
No es jefe 2784 49,43
Total 5632 100
Muestra total de individuos
Es jefe 4083 46,67
No es jefe 4666 53,33
Total 8749 100
Tabla XIV: Tabla de frecuencias de la variable rama de actividad econmica.
Rama de Actividad Frecuencia Porcentaje
Submuestra de individuos que no
presentan valores faltantes
Construccin 592 10,51
Manufactura 956 16,92
Serv. Comerciales 1689 29,99
Intermediacin financiera 498 8,84
Adm. Pblica y defensa, enseanza y serv. Soc. y de salud 824 14,63
Otras actividades de servicio 1076 19,11
Total 5632 100
Muestra total de individuos
Construccin 820 9,83
Manufactura 1438 17,24
Serv. Comerciales 2588 31,02
Intermediacin financiera 807 9,67
Adm. Pblica y defensa, enseanza y serv. Soc. y de salud 1133 13,58
Otras actividades de servicio 1557 18,66
Total 8343 100
Sexo Frecuencia Porcentaje
Submuestra de individuos que no presentan valores faltantes
Hombre 3245 57,62
Mujer 2387 42,38
Total 5632 100
Muestra total de individuos
Hombre 5040 57,61
Mujer 3709 42,39
Total 8749 100
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
41
Tabla XV: Tabla de frecuencias de la variable nivel de ingreso familiar.
Nivel de Ingreso Familiar Frecuencia Porcentaje
Submuestra de individuos que no presentan valores
faltantes
Bajo (deciles 1, 2 y 3) 1878 33,29
Medio (deciles 4, 5, 6 y 7) 2401 42,63
Alto (deciles 8, 9 y 10) 1356 24,08
Total 5632 100
Muestra total de individuos
Bajo (deciles 1, 2 y 3) 2008 33,96
Medio (deciles 4, 5, 6 y 7) 2499 42,27
Alto (deciles 8, 9 y 10) 1405 23,77
Total 5912 100
Tabla XVI: Tabla de frecuencias de la variable trimestre.
Tabla XVII: Tabla de frecuencias de la variable sexo para los distintos trimestres del perodo
2005-2006
Ao Trimestre Frecuencia Porcentaje
Submuestra de individuos que no presentan valores faltantes
2005
1er 720 12,78
2do 665 11,81
3er 757 13,44
4to 729 12,94
2006
1er 679 12,06
2do 688 12,22
3er 688 12,22
4to 706 12,54
Total 5632 100,00
Muestra total de individuos
2005
1er 1028 11,75
2do 966 11,04
3er 1118 12,78
4to 1061 12,13
2006
1er 1109 12,68
2do 1167 13,34
3er 1186 13,56
4to 1114 12,73
Total 8749 100,00
Sexo
Ao
2005 2006
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
Submuestra
de
individuos
que no
presentan
valores
faltantes
Hombre
437
(60,69 %)
387
(58,20 %)
423
(55,88 %)
402
(55,14 %)
399
(58,76 %)
381
(55,38 %)
397
(57,70 %)
419
(59,35 %)
Mujer
283
(39,31 %)
278
(41,80 %)
334
(44,12 %)
327
(44,83 %)
280
(41,24 %)
307
(44,62 %)
291
(42,30 %)
287
(40,65 %)
Total
720
(100%)
665
(100 %)
757
(100 %)
729
(100 %)
679
(100 %)
688
(100 %)
688
(100 %)
706
(100 %)
Muestra
total de
individuos
Hombre
614
(59,73 %)
561
(58,07 %)
628
(56,17 %)
585
(55,14 %)
654
(58,97 %)
663
(56,81 %)
678
(57,17 %)
657
(58,98 %)
Mujer
414
(40,27 %)
405
(41,93 %)
490
(43,83 %)
476
(44,86 %)
455
(41,03 %)
504
(43,19 %)
508
(42,83 %)
457
(41,02 %)
Total
1028
(100 %)
966
(100 %)
1118
(100 %)
1061
(100 %)
1109
(100 %)
1167
(100 %)
1186
(100 %)
1114
(100 %)
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
42
Tabla XVIII: Tabla de frecuencias de la variable nivel educativo para los distintos trimestres
del perodo 2005-2006
Nivel
Educativo
Ao
2005 2006
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
Submuestra
de
individuos
que no
presentan
valores
faltantes
Sin
instruccin/
Primaria
incompleta/
Educacin
especial
53
(7,36%)
51
(7,67%)
45
(5,94%)
57
(7,82%)
43
(6,33%)
45
(6,54%)
53
(7,70%)
61
(8,64%)
Primaria
completa o
Secundaria
incompleta
315
(43,75%)
290
(43,61%)
311
(41,08%)
308
(42,25%)
284
(41,83%)
283
(41,13%)
277
(40,26%)
298
(42,21%)
Secundaria
completa o
Superior
universitaria
incompleta
254
(35,28%)
229
(34,44%)
272
(35,93%)
251
(34,43%)
262
(38,59%)
260
(37,79%)
264
(38,37%)
250
(35,41%)
Superior
universitaria
completa
98
(13,61%)
95
(14,29%)
129
(17,04%)
113
(15,50%)
90
(13,25%)
100
(14,53%)
94
(13,66%)
97
(13,74%)
Total
720
(100%)
665
(100%)
757
(100%)
729
(100%)
679
(100%)
688
(100%)
688
(100%)
706
(100%)
Muestra
total de
individuos
Sin
instruccin/
Primaria
incompleta/
Educacin
especial
71
(6,91%)
75
(7,76%)
72
(6,44%)
75
(7,07%)
63
(5,68%)
68
(5,83%)
78
(6,58%)
87
(7,81%)
Primaria
completa o
Secundaria
incompleta
430
(41,83%)
379
(39,23%)
422
(37,75%)
406
(38,27%)
447
(40,31%)
437
(37,45%)
452
(38,11%)
417
(37,43%)
Secundaria
completa o
Superior
universitaria
incompleta
370
(35,99%)
345
(35,71%)
403
(36,05%)
376
(35,44%)
438
(39,50%)
453
(38,82%)
455
(38,36%)
417
(37,43%)
Superior
universitaria
completa
157
(15,27%)
167
(17,29%)
221
(19,77%)
204
(19,23%)
161
(14,52%)
209
(17,91%)
201
(16,95%)
193
(17,32%)
Total
1028
(100%)
966
(100%)
1118
(100%)
1061
(100%)
1109
(100%)
1167
(100%)
1186
(100%)
1114
(100%)
Tabla XIX: Tabla de frecuencias de la variable condicin de jefe de hogar para los distintos
trimestres del perodo 2005-2006
Condicin
de Jefe
de Hogar
Ao
2005 2006
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
Submuestra
de
individuos
que no
presentan
valores
faltantes
Es jefe
368
(51,11%)
326
(49,02%)
383
(50,59%)
363
(49,49%)
337
(49,63%)
355
(51,60%)
350
(50,87%)
366
(51,84%)
No es jefe
352
(48,89%)
339
(50,98%)
374
(49,41%)
366
(50,21%)
342
(50,37%)
333
(48,40%)
338
(49,13%)
340
(48,16%)
Total
720
(100%)
665
(100%)
757
(100%)
729
(100%)
679
(100%)
688
(100%)
688
(100%)
706
(100%)
Muestra
total de
individuos
Es jefe
484
(47,08%)
449
(46,48%)
528
(47,23%)
502
(47,31%)
509
(45,90%)
551
(47,22%)
542
(45,70%)
518
(46,50%)
No es jefe
544
(52,92%)
517
(53,52%)
590
(52,77%)
559
(52,69%)
600
(54,10 %)
616
(52,78%)
644
(54,30%)
596
(53,50%)
Total
1028
(100%)
966
(100%)
1118
(100%)
1061
(100%)
1109
(100%)
1167
(100%)
1186
(100%)
1114
(100%)
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
43
Tabla XVIII: Tabla de frecuencias de la variable rama de actividad para los distintos
trimestres del perodo 2005-2006
Rama de
Actividad
Ao
2005 2006
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
Submuestra
de
individuos
que no
presentan
valores
faltantes
Construccin
75
(10,42%)
77
(11,58%)
69
(9,11%)
70
(9,60%)
87
(12,81%)
62
(9,01%)
70
(10,17%)
82
(11,61%)
Manufactura
128
(17,78%)
114
(17,14%)
144
(19,02%)
130
(17,83%)
106
(15,61%)
105
(15,26%)
101
(14,68%)
125
(17,71%)
Serv.
Comerciales
212
(29,44%)
180
(27,07%)
228
(30,12%)
219
(30,04%)
195
(28,72%)
208
(30,23%)
210
(30,52%)
237
(33,57%)
Intermediacin
financiera
57
(7,92%)
60
(9,02%)
64
(8,45%)
57
(7,82%)
68
(10,01%)
65
(9,45%)
70
(10,17%)
57
(8,07%)
Adm. Pblica y
defensa,
enseanza y
serv. Soc. y de
salud
102
(14,17%)
102
(15,34%)
95
(12,55%)
110
(15,09%)
109
(16,05%)
104
(15,12%)
110
(15,99%)
92
(13,03%)
Otras
actividades de
servicio
146
(20,28%)
132
(19,85%)
157
(20,74%)
143
(19,62%)
114
(16,79%)
144
(20,93%)
127
(18,46%)
113
(16,01%)
Total
720
(100%)
665
(100%)
757
(100%)
729
(100%)
679
(100%)
688
(100%)
688
(100%)
706
(100%)
Muestra
total de
individuos
Construccin
98
(10,17%)
95
(10,27%)
97
(9,10%)
90
(8,88%)
113
(10,82%)
102
(9,16%)
109
(9,57%)
116
(10,77%)
Manufactura
168
(17,43%)
160
(17,30%)
197
(18,48%)
191
(18,84%)
162
(15,52%)
167
(14,99%)
197
(17,30%)
196
(18,20%)
Serv.
Comerciales
282
(29,25%)
276
(29,84%)
317
(29,74%)
296
(29,19%)
326
(31,23%)
352
(31,60%)
364
(31,96%)
375
(34,82%)
Intermediacin
financiera
92
(9,54%)
85
(9,19%)
106
(9,94%)
92
(9,07%)
109
(10,44%)
121
(10,86%)
113
(9,92%)
89
(8,26%)
Adm. Pblica y
defensa,
enseanza y
serv. Soc. y de
salud
135
(14,00%)
129
(13,95%)
137
(12,85%)
150
(14,79%)
148
(14,18%)
144
(12,93%)
157
(13,78%)
133
(12,35%)
Otras
actividades de
servicio
189
(19,61%)
180
(19,46%)
212
(19,89%)
195
(19,23%)
186
(17,82%)
228
(20,47%)
199
(17,47%)
168
(15,60%)
Total
964
(100%)
925
(100%)
1066
(100%)
1014
(100%)
1044
(100%)
1114
(100%)
1139
(100%)
1077
(100%)
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
44
Tabla XX: Tabla de frecuencias de la variable nivel de ingreso familiar para los distintos
trimestres del perodo 2005-2006
Nivel de
ingreso
familiar
Ao
2005 2006
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
1er
trimestre
2do
trimestre
3er
trimestre
4to
trimestre
Submuestra
de
individuos
que no
presentan
valores
faltantes
Bajo (deciles
1, 2 y 3)
255
(35,42%)
225
(33,83%)
254
(33,55%)
244
(33,47%)
254
(37,41%)
196
(28,49%)
217
(31,54%)
230
(35,58%)
Medio
(deciles 4,
5, 6 y 7)
311
(43,19%)
281
(42,26%)
315
(41,61%)
321
(44,03%)
275
(40,50%)
314
(45,64%)
285
(41,42%)
299
(2,35%)
Alto (deciles
8, 9 y 10)
154
(21,39%)
159
(23,91%)
188
(24,83%)
164
(22,50%)
150
(22,09%)
178
(25,87%)
186
(27,03%)
177
(25,07%)
Total
720
(100%)
665
(100%)
757
(100%)
729
(100%)
679
(100%)
688
(100%)
688
(100%)
706
(100%)
Muestra
total de
individuos
Bajo (deciles
1, 2 y 3)
278
(36,63%)
235
(33,76%)
270
(33,92%)
260
(33,94%)
276
(38,07%)
214
(29,56%)
232
(32,40%)
243
(33,29%)
Medio
(deciles 4,
5, 6 y 7)
322
(42,42%)
296
(42,53%)
331
(41,58%)
337
(43,99%)
290
(40,00%)
325
(44,89%)
292
(40,78%)
306
(41,92%)
Alto (deciles
8, 9 y 10)
159
(20,95%)
165
(23,71%)
195
(24,50%)
169
(22,06%)
159
(21,93%)
185
(25,55%)
192
(26,82%)
181
(41,92%)
Total
759
(100%)
696
(100%)
769
(100%)
766
(100%)
725
(100%)
724
(100%)
716
(100%)
730
(100%)
Tabla XXI: Medidas descriptivas para la edad considerando los distintos trimestres del
perodo 2005-2006
Ao Trimestre Media
Desvo
Estndar
Mediana
Submuestra de individuos que no presentan
valores faltantes
2005
1er 38,48 13,33 37,00
2do 38,29 14,22 37,00
3er 38,60 14,06 37,00
4to 39,42 14,15 38,00
2006
1er 37,66 14,03 36,00
2do 38,08 13,77 37,00
3er 38,46 13,93 37,00
4to 38,55 14,01 37,00
Medidas descriptivas generales 38,45 13,94 37,00
Muestra total de individuos
2005
1er 38,29 13,65 37,00
2do 39,01 14,72 37,00
3er 38,76 14,15 37,00
4to 39,25 14,05 38,00
2006
1er 37,99 14,29 36,00
2do 38,43 14,30 37,00
3er 38,37 14,31 36,00
4to 38,92 14,52 37,00
Medidas descriptivas generales 38,62 14,25 37,00
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
45
VI-B Mtodos para la determinacin de la escala para las variables continuas
Con el fin de determinar la escala con la cual las variables continuas ingresan al modelo
se recurre a dos mtodos, Variables de Diseo y Polinomios Fraccionarios (Hosmer y
Lemeshow, 2000).
- Variables de Diseo.
Consiste en obtener los cuartiles correspondientes de la distribucin de la variable
continua. Luego se crea una variable categrica con cuatro niveles en base a los cuartiles
calculados anteriormente. Pueden utilizarse otras estrategias de categorizacin pero sta
generalmente funciona de manera adecuada en la prctica.
Se ajusta un modelo reemplazando la variable continua por la variable categorizada de
forma tal que se utilizan tres variables de diseo con el cuartil menor como grupo de
referencia. Se grafican los coeficientes estimados versus los puntos medios de cada grupo.
Para esto en el punto medio del primer cuartil se grafica el coeficiente igual a 0. Se conectan
mediante lneas los 4 puntos graficados. Se inspecciona visualmente el grfico obtenido y en
base a ste se trata de buscar la forma paramtrica ms adecuada para la escala de la
variable continua.
- Polinomios Fraccionarios.
Es una tcnica desarrollada por Royston y Altman (1994) para sugerir transformaciones.
Se desea estimar qu valor de x
p
provee el mejor ajuste para la covariable. Este mtodo
consiste en reemplazar la estimacin mximo verosmil de la potencia buscndola a travs de
un pequeo pero razonable conjunto de posibles valores para la misma.
La tcnica de Polinomios Fraccionarios puede ser usada con un Modelo Logit Mixto
multivariado, pero por simplicidad se describir el procedimiento con una sola covariable
continua y sin efecto aleatorio.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
46
El Modelo Logit lineal en la covariable es:
3
0 1
g(x, ) x | = | + | ,
donde es el vector de coeficientes del modelo y x el vector de covariables. Una forma de
generalizar el modelo anterior es especificarlo de la siguiente manera:
0 1
1
J
i
j
g(x, ) F(x)
=
| = | + |
donde F
j
(x) es un tipo particular de funcin de potencia, y el valor de la primer funcin es
F
1
(x)=
1
p
x .
Royston y Altman (1994) proponen restringir p
1
entre los valores del siguiente conjunto:
{ }
2 1 0 5 0 0 5 1 2 3 , , . , , . , , , P =
Donde p
1
=0 corresponde al logaritmo de la variable. El resto de las funciones se definen de
la siguiente forma:
1
1
p
j j
j
j j j
x , p p
F (x)
F (x)ln(x), p p
=
=
para j=2,...,J y valores de potencias restringidos a los del conjunto P.
Al implementar el mtodo, para J=1 se ajustan 8 modelos, es decir p
1
eP. El mejor de
ellos es el que posee el mayor valor de log verosimilitud. El proceso se repite con J=2
ajustando 36 modelos obtenidos con los pares de potencias, es decir (p
1
, p
2
) ePxP y el
mejor de los modelos es nuevamente el que tiene la mayor log verosimilitud.
Por ejemplo, para J=1 y p
1
=3 el modelo correspondiente es:
3
0 1
g(x, ) x | = | + |
Para J=2, p
1
=2 y p
2
=0,5 el modelo queda de la siguiente manera:
2
0 1 2
g(x, ) x x | = | + | + |
Para la eleccin del modelo significativamente mejor se procede de la siguiente forma:
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
47
Sea L(1) la log verosimilitud para el modelo lineal, es decir para J=1 y p
1
=1; L(p
1
), la log
verosimilitud para el mejor modelo con J=1 y L(p
1
, p
2
), la log verosimilitud para el mejor
modelo con J=2.
Luego el test de razn de verosimilitud comparando el modelo lineal con el mejor modelo
para J=1 es G(1, p
1
)=-2{L(1)-L(p
1
)}, que se distribuye como una
2
1
_
bajo la hiptesis nula
de linealidad de x.
El test de razn de verosimilitud comparando el mejor modelo para J=1 con el mejor
para J=2 es G[p
1
,(p
1
, p
2
)]=-2{L(p
1
)-L(p
1
,p
2
)}, el cual se distribuye como una
2
2
_
bajo la
hiptesis nula de que la segunda funcin es igual a 0.
Similarmente, el test de razn de verosimilitud comparando el modelo lineal con el mejor
modelo J=2 es G[1,(p
1
,p
2
)]=-2{L(1)-L(p
1
, p
2
)} se distribuye aproximadamente como una
2
3
_
bajo la hiptesis nula.
Cabe destacar que p
1
denota la mejor potencia tanto para J=1 como para la primer
potencia de J=2 pero que probablemente no tomen el mismo valor.
El procedimiento a seguir en el caso de cada covariable a las que se les estudia la escala
es el que se describe a continuacin:
Se realiza el test con 3 grados de libertad para el mejor modelo para J=2 versus el lineal
utilizando G[1,(p
1
,p
2
)]; si no resulta significativo a un nivel de significacin
o
entonces la
covariable es lineal en el logit.
En cambio, si es significativo, se prueba mediante un test de 2 grados de libertad el
mejor modelo para J=2 versus el mejor modelo para J=1 usando G[p
1
, (p
1
, p
2
)]. Si es
significativo a un nivel de significacin
o
entonces se elige el mejor modelo para J=2, caso
contrario se elige el mejor modelo para J=1.
Finalmente se explora cada covariable y el proceso se itera usando los resultados del
primer ciclo. El propsito de la iteracin es ver cundo la transformacin aplicada a una
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
48
covariable cambia la transformacin aplicada a una o ms de las otras covariables. El
proceso se repite hasta que no se presenten cambios entre transformaciones.
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
49
Bibliografa
ALONSO A, LETIERE S, MOLENBERGHS G. 2008. A family of tests to detect
misspecifications in the random-effects structure of generalized linear mixed models.
Computational Statistics and Data Analysis, 52, 4474-4486.
AGRESTI A. 2002. Categorical Data Analysis. John Wiley & Sons.
AGRESTI A, CAFFO B, OHMAN-STRICKLAND P. 2004. Examples in which
misspecification of random effects distribution reduces efficiency, and possible
remedies. Computational Statistics and Data Analysis, 47, 639-653.
FITZMAURICE G, LAIRD N, WARE J. 2004. Applied Longitudinal Analysis. John Wiley
& Sons.
HACHUEL L, BOGGIO G, BORRA V. 2006. Uso de Modelos Logit Mixtos para el estudio
del bajo peso al nacer en Rosario. Undcimas Jornadas Investigaciones en la
Facultad de Ciencias Econmicas.
http://www.fcecon.unr.edu.ar/investigacion/jornadas/archivos/hachuelyotros.PDF
(15/04/2009)
HOSMER D, LEMESHOW S. 2000. Applied Logistic Regression. Second Edition. John
Wiley & Sons.
Instituto Nacional de Estadstica y Censos. 2003. La nueva encuesta permanente de
hogares de Argentina.
http://www.indec.gov.ar/nuevaweb/cuadros/4/Gacetilla_EPHContinua.pdf
(04/04/2008)
Instituto Nacional de Estadstica y Censos. 2003. Encuesta Permanente de Hogares
(EPH). Cambios Metodolgicos.
http://www.indec.gov.ar/nuevaweb/cuadros/4/Gacetilla_EPHContinua.pdf
(04/04/2008)
Instituto Nacional de Estadstica y Censos. 1997. Cmo se mide el desempleo?
Uso del Modelo Logit Mixto para el Estudio de la Desocupacin en Rosario
50
http://www.indec.gov.ar/nuevaweb/cuadros/4/metempleo1.pdf (04/04/2008)
LETIERE S, ALONSO A, MOLENBERGHS G. 2008. The impact of a misspecified
random-effects distribution on the estimation and the performance of the inferential
procedures in generalized linear mixed models. Statistics in Medicine, 27, 3125-3144.
MOLENBERGHS G, VERBEKE G. 2005. Models for Discrete Longitudinal Data.
Springer.
ROYSTON P, ALTMAN D, 1994. Regression using fractional polynomials of continuous
covariates: Parsimonious parametric modelling (with discussion). Applied Statistics,
43, 429-467.
SAS INSTITUTE INC. 2006. The GLIMMIX Procedure.
http://support.sas.com/rnd/app/papers/glimmix.pdf (25/04/2008)