Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Inei
Inei
Desarrollo (CIDE)
LOS MODELOS
LOGIT Y PROBIT EN
LA INVESTIGACIN
SOCIAL
El caso de la Pobreza del Per
en el ao 2001
DIRECCIN Y SUPERVISIN
Preparado
Impreso
Diagramacin
Tiraje
Domicilio
Orden de Impresin
Depsito Legal N
:
:
:
:
:
:
Presentacin
El INEI pone a disposicin la investigacin metodolgica: "LOS MODELOS
LOGIT Y PROBIT EN LA INVESTIGACIN SOCIAL El caso de la
pobreza del Per en el ao 2001", que por su nivel de especializacin
est dirigida principalmente a los miembros de la comunidad acadmica,
profesionales de las oficinas de estadstica y los investigadores interesados
en mantener la actualidad de sus procedimientos estadsticos.
Esta investigacin metodolgica tiene por finalidad, generar instrumentos
y procedimientos que permitirn validar, mejorar y actualizar los procesos
estadsticos. Se caracteriza por ser innovadora en su campo de aplicacin,
por contener un rigor cientfico en su desarrollo integral, por la validez
de sus procesos, por la vigencia y actualidad de sus metodologas aplicadas.
En esa misma direccin, la investigacin presentada desarrolla la
metodologa asociada a los modelos de probabilidad con variable
dependiente discreta dicotmica (modelo logit y probit), en funcin del
fenmeno de pobreza en los jefes de hogar del Per para el ao 2001.
Contribuyendo a la implementacin de los enfoques asociados a estos
modelos, segn la viabilidad permitida por los factores de naturaleza
cualitativa, cuantitativa y su aporte en la probabilidad de ser pobre del
jefe de hogar.
Este estudio al igual que otros de carcter metodolgico, ha sido elaborado
por profesionales del Centro de Investigacin y Desarrollo (CIDE), en el
marco del desarrollo y promocin de investigaciones estadsticas y
socioeconmicas que permitan elevar la calidad de la informacin del
INEI y el SEN.
El INEI espera como resultado de esta investigacin, incorporarse en el
circuito de la produccin del conocimiento y elevar los estndares de
calidad de sus procesos, sentando con ello las bases de la investigacin
metodolgica en la institucin.
Lima, Agosto 2002
INDICE
Presentacin .................................................................................................. 3
Prlogo ........................................................................................................ 7
I. INTRODUCCIN ................................................................................... 9
II. FUNDAMENTACION DEL PROBLEMA .......................................... 11
2.1. Formulacin del problema ........................................................................... 13
III.OBJETIVOS DE LA INVESTIGACIN .............................................. 15
3.1. Objetivo general .............................................................................................. 15
3.2. Objetivos especficos ...................................................................................... 15
IV. MARCO TERICO ............................................................................... 17
4.1. Breve formulacin del caso de la Pobreza del Per. ............................... 17
4.1.1. Qu es la pobreza? .............................................................................. 17
4.1.2. Enfoques y mtodos para su medicin ............................................. 17
4.2. Los modelos logit y probit con variable dependiente
dicotmica (VDD). ........................................................................................ 20
4.2.1. Modelos con variable dependiente dicotmica (vdd). .................... 20
4.2.2. Formulacin del modelo logit y el modelo probit con (vdd) . .... 22
4.2.3. Caracterizacin de los modelos logit y probit aplicados
al caso de la pobreza del Per. ............................................................ 24
V. HIPTESIS .......................................................................................... 33
VI. METODOS ........................................................................................... 35
6.1. Tratamiento de errores en la adecuacin de ambos modelos. ............... 35
6.1.1. Mtodos de estimacin ........................................................................ 35
VII. LA ENCUESTA NACIONAL DE HOGARES - 2001
IV TRIMESTRE ................................................................................. 39
7.1. Caractersticas de la muestra ........................................................................ 41
7.2. Factores de relevancia para la explicacin de la pobreza
extrados de la ENAHO IV trimestre 2001. ............................................ 43
VIII. CRITERIOS DE FORMULACIN DE LOS MODELOS
LOGIT Y PROBIT CON VDD APLICADOS AL CASO DE
LA POBREZA DEL PER. .............................................................. 49
8.1. Estudio a nivel descriptivo y exploratorio de algunas variables
cualitativas y cuantitativas que inciden en la pobreza del Per. .......... 49
8.2. Formulacin y adecuacin de los modelos Logit y Probit con VDD,
en funcin de las variables o factores explicativos
ms significativos. ......................................................................................... 58
IX. CONCLUSIONES ................................................................................. 79
X. RECOMENDACIONES ...................................................................... 81
XI. BIBLIOGRAFA .................................................................................... 83
XII. ANEXOS .............................................................................................. 85
Anexo 1 Informe metodolgico ............................................................................ 87
Anexo 2. Indices de ecuaciones, cuadros y grficos ............................................. 95
Prlogo
Desde las aulas universitarias y siendo
conocedor de la difcil tarea que significa
la promocin y desarrollo de la labor
cientfica en una realidad caracterizada
por la escasez de recursos y las
restricciones presupuestarias, saludo este
esfuerzo del Centro de Investigacin y
Desarrollo (CIDE) orientado no slo a
elevar la calidad de la informacin
generado por el Sistema Estadstico
Nacional sino tambin a la produccin
cientfica y metodolgica en nuestro
medio. En este sentido, la presente
publicacin: "Los Modelos Logit y Probit
en la Investigacin Social: El Caso de la
Pobreza del Per en el Ao 2001"
satisface una necesidad no slo para los
consumidores
potenciales
de
investigaciones sociales o eventuales
investigadores sino tambin para el
pblico interesado y universitario
familiarizado con los elementos de la
estadstica.
Aunque
este
documento
es
metodolgico por naturaleza, est
orientado hacia las aplicaciones. A lo largo
del estudio, se ha mantenido al mnimo
las demostraciones terico-matemticas
y se ha puesto nfasis en el desarrollo de
un entendimiento claro de los resultados
tericos usuales en los estudios sociales
con este tipo de modelos, el cual est
plasmado en los objetivos planteados en
el documento. De otro lado, se hace una
breve pero precisa formulacin de la
pobreza en el Per cuyo anlisis se basa
en las variables provenientes de La
Encuesta Nacional de Hogares-2001 IV
Trimestre (ENAHO). De ah que, se
incluye un captulo que describe la
definicin de dichas variables para luego
interactuar sistemticamente en la
formulacin del problema y anlisis con
el enfoque de los Modelos Logit y Probit.
I. INTRODUCCION
3.1
Objetivo General
Objetivos Especficos
4.1.1 Qu es la pobreza?
1/
DE
LA
LNEA
Pobreza Absoluta:
Consumo Hogar < Costo Canasta Bsica
Consumo (LPA)
DE
Pobreza Extrema:
Comprende a las personas cuyos hogares
tienen ingresos o consumos per cpita
inferiores al valor de una canasta mnima
de alimentos.
Lnea de Pobreza Extrema (LPE): Es el costo
de una canasta mnima de alimentos.
Pobreza Extrema:
Consumo Hogar < Costo Canasta Bsica
Alimenticia (LPE)
Despus de mostrar, a modo general,
algunos enfoques y a grosso modo
mtodos de medicin de pobreza, que si
bien es cierto no es uno de los objetivos
explcitos de esta investigacin medirla,
pretendemos con ello guiar al lector hacia
la concepcin y formulacin de una
variable que permita clasificar a un
individuo de acuerdo a su nivel de
pobreza, en otras palabras, si este posee
o no la condicin de pobreza.
Segn Sen (1992) la medicin de pobreza
requiere realizar dos ejercicios distintos
pero interrelacionados: la identificacin de
los pobres por un lado y la agregacin por
otro. Este ltimo es el usado para obtener
indicadores resumen del nivel(incidencia)
de la pobreza. Para el caso de esta
investigacin solo realizaremos en alguna
medida el primer ejercicio.
Esto quiere decir que necesitaramos de
un mtodo de identificacin para construir
lo que ser la variable dependiente de las
estimaciones y es all donde entra a tallar
el MTODO DE LNEA DE POBREZA(LP),
definido anteriormente. Con lo cual se
define especficamente los valores que
FGT = H * (
1
N
zi yi
)
zi
ECUACIN IV.1
Entonces, si a = 0 obtenemos, el
porcentaje de pobres .
Si a = 1,obtenemos lo concerniente a
Brecha de Pobreza.
zi yi
1
)
FGT 1 = H * (
N
zi
2/ En trminos de Sen (Sen, 1976), ante la necesidad de obtener una medida agregada de la pobreza, H, ocurre que no se
satisfacen los axiomas de monotonicidad y transferencia. El primero establece que toda medida de pobreza bien conformada
debe reflejar las variaciones del ingreso de los hogares situados por debajo de la LP. El segundo, que la medida de pobreza
debe ser sensible a las transferencias de ingresos entre pobres y no pobres.
3/ Paz, Jorge. La pobreza en Argentina: una comparacin entre regiones dismiles. Unas, 2001.
4/ Escobal, Javier; Saavedra, Jaime; Torero, Mximo. Los Activos de los pobres en el Per. GRADE. 1998.
4.2.
Participacin en el mercado de
trabajo: Donde 0 es "no" y 1 significa
"s", donde la participacin es Var.
Dependiente nominal dicotmica, y se
representa con 0 y 1 por comodidad.
5/ Variable nominal politmica, es aquella que en sus categoras no denota ningn tipo de ordenamiento ni grado especfico,
otro ejemplo de ello lo constituye el estado civil (soltero, casado, viudo, conviviente, etc).
Donde x=0,1,2,3...N.
P[ X = x] = px (1 p)N x
x
N
ECUACIN IV.2
P [Y = 1] = F ( X , )
ECUACIN IV.3
P[Y = 0] = 1 F ( X , )
Donde el vector de parmetros(b) refleja
el aporte o impacto que X (vector de var.
explicativas) tiene como parte de la funcin
de distribucin acumulada sobre la
probabilidad. Por ejemplo uno de los
factores que podra interesarnos sera ver
el efecto que el nivel de educacin tiene
sobre la probabilidad de ser pobre.
A partir de este punto la incgnita cae
sobre el lado derecho de dicha ecuacin
y sobre cmo plantear un modelo
adecuado para este.
Una solucin a ello puede darse en un
modelo de regresin lineal.
F ( X , ) = X
ECUACIN IV.4
Tenemos que:
Y=
bX + e
ECUACIN IV.5
Grfico IV.1
Donde F es la distribucin de
probabilidad de la variable aleatoria I*.
4.2.3. Caracterizacin de los modelos
logit y probit aplicados al caso
de la pobreza en el Per.
4.2.3.1. El Modelo Logit
Supongamos el siguiente ejemplo, se tiene
que Y (1 = jefe de hogar pobre, 0 = jefe
de hogar no pobre) en funcin al ingreso
familiar X(S/.) para un conjunto de familias.
Se tiene la siguiente representacin de la
condicin de pobreza:
Pi = E( y = 1/ Xi) =
1
1+ e( 1+ 2 X )
ECUACIN
IV.8
Pi = E( y = 1/ Xi) =
donde
i = ( 1 +
1
( 1+ 2 X )
1+ e
2X )
ECUACIN IV.9
1 Pi =
1
1 + e Zi
ECUACIN IV.10
Pi
1 + eZi
=
= eZi
Zi
1 Pi 1 + e
ECUACIN IV.11
Pi
Li = ln
= Zi = 1 + 2 X
1 Pi
ECUACIN IV.12
2 , la pendiente, mide
x = 1 ( P )
La probabilidad correspondiente a un
vector X de factores que contribuyen a
explicar un fenmeno, como el de la
pobreza es ahora:
P =
De modo que:
1 y 2.
1
2
t2
dt
ECUACIN IV.14
Ii = 1 + 2 Xi
ECUACIN IV.15
2
1+ 2 Xi t 2
i
Cmo se relaciona el Ii, ndice imperfecto
1 I 2t
1
e dt =
e 2 dt
de conveniencia con la condicin =
2
2
especfica de ser pobre? Sea Y=1 si es
jefe de hogar pobre y Y=0 si no es. Ahora
ECUACION IV.16
bien, es razonable suponer que para cada
individuo hay un nivel crtico o umbral
del ndice, que se puede denominar Ii*, donde t es una variable normal
estandarizada, es decir, t N(0,1).
tal que si Ii excede a Ii*, el jefe de hogar
es pobre, de lo contrario no lo es. El nivel
Puesto que Pi representa la probabilidad
crtico Ii*, al igual que Ii, no es observable,
y se supone que est distribuido de que ocurra un evento, en este caso la
probabilidad de poseer la condicin de
normalmente con la misma media y
varianza, y por lo tanto es posible no pobreza, sta se mide por el rea de la
curva normal estndar de - a Ii, como se
solamente estimar los parmetros del
ndice, sino tambin obtener alguna muestra en la figura siguiente [GRAFICO
informacin sobre el ndice imperfecto de IV.2]:
Grfico IV.2
Pi
Pr( Ii * Ii )
Ii = 1 + 2 X
Pi
I i = F 1 ( P i )
Ii = F 1 ( Pi) = 1 + 2 Xi
ECUACIN IV.17
Donde
F 1 es la inversa de la FDA
Grfico IV.3
-20
-10
10
20
E [ y / x ]
= ( x )
x
ECUACIN IV.19
d [ x ]
e x
=
d ( x )
(1 + e x ) 2
ECUACIN IV.20
E[ y / x]
= ( x)[1 ( x)]
x
ECUACIN IV.21
Grfico IV.4
BENEFICIO
REALIZA COMPRA
DECISIN COMPRA
IMPORTANTE
UTILIDAD
EMPLEA DINERO
OTRA COSA
COSTE
y* = x +
ECUACIN IV.22
si Y*>0
si Y*0
(*)
Pr( y* 0) = Pr( x + 0) =
Pr( x) = 1 F ( x)
i = F ( xi ) . Si consideramos esta
Pr( y * 0) = Pr( x ) = F ( x )
De este modo se habra obtenido un
modelo estructural para la probabilidad y
como esta depende de la FDA Normal o
Logstica.
de
Pi = F ( xi ) + i = i + i
E ( i ) = 0 , Var ( i ) =
, siendo
i (1 i )
ni
6/ Ha no ser que haya poderosas razones, los modelos binomiales deben incluir constante (Green)
7/ En distribuciones simtricas se tiene que: 1 - F(bX) = F(-bX)
8/ Los estudios iniciales sobre modelos probit se desarrollaron en laboratorios. Cada observacin consista en n individuos que
i
reciban una cierta dosis x , la proporcin P respondan al tratamiento. Vase Finney (1971) y Cox (1970).
i
V. HIPOTESIS DE INVESTIGACIN
VI. METODOS
[ F ( x )]
yi
[1 F ( x )]1 y i
i =1
ECUACIN VI.2
ln L
=
y if i
F
i =1
+ (1 y i )
fi
xi = 0
(1 F i )
ECUACIN VI.3
yi=1
ECUACIN VI.1
L=
9/ Como vimos hace un momento en distribuciones simtricas 1-F(bx)=F(-bx). Definiendo q=2y-1, entonces lnL=SlnF(qbx).
pi = ( Pi + ui )
por lo que
1 ( pi ) = 1 ( Pi + ui )
De aqu esta expresin pude aproximarse
por:
1 ( pi ) Xi ` +
1
ui
f ( Xi ` )
El procedimiento de estimacin MV es
preciso cuando no es posible agrupar las
observaciones segn los valores del vector
Xi. En tal situacin, carece de sentido hablar
de proporciones muestrales. En dichos
casos, la estimacin por MV evita los
problemas ya citados acerca de la
estimacin MCG del modelo lineal de
probabilidad. Por otra parte el estimador
de MV es eficiente, y se calcula sobre el
modelo original, sin necesidad de ninguna
aproximacin.
En el caso del MODELO PROBIT, la
funcin de verosimilitud sera:
L = [ ( x)] yi [1 ( x)]1 yi
var(
ui
Pi (1 Pi )
,` ) =
,
f ( Xi )
ni[ f ( Xi ` )]2
ECUACIN VI.4
= ( X ` 1 X ) 1 X ` 1
Con una matriz diagonal, con
elementos genricos dados por [Ecuacin
vi.4] donde es el vector de probits
muestrales. Como la matriz es
desconocida, hay que estimarla, para lo
que se podra utilizar: a) las frecuencias
observadas pi, o bien b) las predicciones
Pi obtenidas a partir de un modelo de
probabilidad lineal previamente estimado.
1 ( x ) , dependiendo de si Y=1,
jefe de hogar pobre, Y=0, jefe de hogar
no pobre.
Por tanto la funcin logaritmo de la
verosimilitud se obtiene del logaritmo de
la expresin anterior, y tomando sus
derivadas con respecto al vector
se
x i + (1 Y i )
1
i
xi = 0 k
1 i
ECUACIN VI.5
N
Yi (x)
(x)xi = 0
S( ) =
1 (x)[1(x)]
ECUACIN VI.6
j=1,2,....,K
*
yi =
[ ( x )] 2
x i x i
( x )[1 ( x )]
yi ( x )
( x )(1 ( x ))
ECUACIN VI.10
ECUACIN VI.9
ECUACIN VI.7
I ( ) =
xij ( x)
( x)(1 ( x)) ,
xij * =
estimador
n 1 para calcular
xij *
y yi*.
MODELO LOGIT
Estimacin de mxima verosmilitud
para observaciones individuales.
La funcin de verosimilitud muestral es:
Reemplazando [ECUACION IV.4] en
[ECUACION VI.1]
L =
Y i =1
[ ( x )] 2
x i x i
( x )[1 ( x )]
F ( x ) [1 F ( x ) ] =
Yi = 0
ECUACIN VI.8
Y i ( x ))
1
[1 + e x ]
o, lo que es lo mismo:
ln L = 1 Yi ( ' x) 1 ln(1 + e x ) =
N
10/ Especialmente diseado para el caso en que se pretende obtener el EMV, este algoritmo se basa en la propiedad de que
la esperanza matemtica de la matriz hessiana de la funcin de verosimilitud (es decir, la matriz de informacin cambiada
de signo). As se ha sugerido como aproximacin, sustituir la matriz de derivadas segundas por la matriz de informacin,
= n 1 + [ I ( n 1)]1 ln L ( n 1)
N
1
i i)
(Yx
1 ln(1 + e x )
ECUACIN VI.11
y denotando por
x i * = x i P I (1 P i )
ECUACIN VI.14
i i un vector
z= 1 Yx
fila 1 x k se tiene:
Yi =
*
ln L = z 1 ln[1 + e
N
(Y i P i )
P i (1 P i )
ECUACIN VI.15
x
ln L
N e xi
= z 1
= 0k
S( ) =
+
1 ex
ECUACIN VI.12
i i
N
e x xx
= 1 xP
i i (1 Pi ) xi
1 + e x
ECUACIN VI.13
1 = 0 + [ I ( 0)]1 S ( 0)
En realidad, la matriz S(b) puede escribirse
tambin:
S ( ) = 1 Y ix i 1
N
N
xi
= 1 (Yi P i ) x i
1 + e x
1
, por lo que el
1 + e xi
algoritmo puede describirse como sigue:
donde
Pi =
calcular Pi (1 Pi ) .
Pi =
e x
1 + e x
11/ La metodologa desarrollada para la inclusin de variables se encuentra en el anexo metodolgico al final de esta
investigacin.
Objetivos Especficos
Los objetivos especficos de la ENAHO
2001 del cuarto trimestre son los
siguientes:
i. Determinar el grado de acceso a
servicios bsicos de la vivienda y del
hogar y de los programas sociales
orientados a la vivienda segn
diferentes estratos socio-econmicos.
ii. Obtener indicadores de riesgo de
salud debido al hacinamiento y las
condiciones sanitarias de los hogares
segn diferentes estratos socioeconmicos.
TEMAS A INVESTIGAR
iii. Caracterizar
las
estructuras
demogrficas, segn diferentes estratos
socio-econmicos, con el fin de medir
la evolucin y el impacto demogrfico
de los programas sociales.
iv. Determinar el nivel educativo segn
diferentes estratos socio-econmicos.
v. Determinar el grado de acceso a la
educacin y el alcance de los
programas sociales, segn diferentes
estratos socio-econmicos.
vi. Caracterizar los niveles de empleo,
segn diferentes estratos socioeconmicos.
Mdulo de Vivienda
Caractersticas de los miembros del
hogar
Mdulo bsico de Educacin
Mdulo bsico de Salud
Mdulo bsico de empleo
Sistema de Pensiones
Uso de Computadora e Internet en el
Trabajo
Ingresos del sector formal e informal
Gastos
Mdulo bsico de Programa Social
Mdulo Comunal para Informantes
Calificados
Mdulo de Opinin
CARACTERISTICAS
vii. Determinar la estructura del ingreso de
los hogares, teniendo en cuenta los
ingresos provenientes de los propios
hogares y el efecto redistributivo de
los programas sociales.
viii.Cuantificar el gasto de consumo de los
hogares diferenciando el aporte de los
7.1. CARACTERISTICAS
MUESTRA
DE
LA
Poblacin y Cobertura
El universo cubierto por la muestra de la
ENAHO es todo el territorio nacional. Es
decir, la poblacin est definida como el
conjunto de todas las viviendas particulares
y sus ocupantes residentes del rea urbana
y rural del pas.
Se excluye del estudio a la poblacin
residente en viviendas tipo colectivas
como hospitales, cuarteles, comisaras,
hoteles, centros de reclusin, etc.
[EDAD]
p208a
Edad en aos
Determinar el perodo transcurrido entre
la fecha de nacimiento de la persona y el
da de la entrevista.
Variable cuantitativa
Base de Datos: Caractersticas de los
miembros del hogar (CAP. 200)
[GNERO]
p207
Sexo
Determinar el sexo de los entrevistados.
Identificados como hombre o mujer.
Escala Nominal Dicotmica
Base de Datos: Caractersticas de los
miembros del hogar (CAP. 200)
Codificacin: 1 Hombre, 2 Mujer
[ESTADO CIVIL]
p209
Estado conyugal
Investigar sobre la naturaleza de la
participacin de la poblacin en materia
de comportamiento conyugal en especial
durante el perodo de madurez.
Escala Nominal Categrica
Base de Datos: Caractersticas de los
miembros del hogar (CAP. 200)
Codificacin: 1 Conviviente, 2 Casado(a),
3 Viudo(a), 4 Divorciado(a) ,5 Separado(a),
6 Soltero(a)
[DOMINIO GEOGRFICO]
dominio
Dominio Geogrfico
Escala Nominal Categrica
Base de Datos: Identificador presente en
todas las bases de datos
Codificacin: 1 Costa Norte , 2 Costa
Centro, 3 Costa Sur, 4 Sierra Norte, 5 Sierra
Centro, 6 Sierra Sur, 7 Selva, 8 Lima
Metropolitana
[GRANDES DOMINIOS ]
gdomini
Grandes Dominios Geog.
Escala Nominal Categrica
Codificacin: 1 Costa , 2 Sierra, 3 Selva, 4
Lima Metropolitana
[ESTRATO]
estrato
Estrato Geogrfico
Determinar la cantidad de viviendas
albergadas en cada estrato geogrfico.
Escala Nominal Categrica
Base de Datos: Identificador presente en
todas las bases de datos
Codificacin: 1 Mayor de 100,000
viviendas, 2 De 20,001 a 100,000
viviendas, 3 De 10,001 a 20,000
viviendas, 4 De 4,001 a 10,000 viviendas,
5 De 401 a 4,000 viviendas, 6 Menos de
400 viviendas, 7 AER compuestos, 8 AER
simples.
[AREA]
urb_ru
rea urbano-rural
Esta variable resulta de recodificar la
variable estrato cuyas 5 primeras categoras
proceden a conformar el rea urbana y las
categoras de 6 a la 8 conformaran el rea
rural.
Escala Nominal Dicotmica
Codificacin: 1 rea Urbana, 2 rea Rural
[DOMINIO URBANO RURAL]
domur_ru Grandes dominios por rea
urb o ru.
Esta variable resulta del cruce de las
variables gdomini (Costa, Sierra, etc) y rea
(urbano, rural).
Escala Nominal categrica
Codificacin: 11 Costa Urbana, 12 Costa
Rural, 21 Sierra Urbana, 22 Sierra Rural,
31 Selva Urbana, 32 Selva Rural, 41 Lima
Urbana
Caractersticas de
ocupacional del JH
la
insercin
[EXPERIENCIA LABORAL]
exper1
Indicador proxy de exper.
laboral
Este indicador resulta de restar a la edad
del jefe de hogar los aos de estudios,
VARIABLES INDICADORAS
DSINNIV = 1
Si JH no tiene nivel educativo y 0 en
otro caso
DPRIM = 1
Si JH tiene primaria y 0 en otro caso
DSECUND = 1
Si JH tiene secundaria y 0 en otro caso
DSUPNU = 1
Si JH tiene educ. sup no univ. y 0 en
otro caso
DSUPUN = 1
Si JH tiene educ. sup. Univer. y 0 en
otro caso
DCOLEGIO = 1
Si JH a estudiado en colegio estatal y 0
en otro caso
DCORU = 1
Si JH habita en Costa urbana y 0 en
otro caso
DSIEUR = 1
Si JH habita en Sierra urbana y 0 en
otro caso
DSELUR = 1
Si JH habita en Selva urbana y 0 en
otro caso
DINDEP
= 1
Si JH es trabajador independiente y 0
en o.c.
DEMPLEADO = 1
Si JH es empleado y 0 en o.c.
DOBRERO = 1
Si JH es obrero y 0 en otro caso
DOTRO
= 1
Si JH se encuentra en otra situacin
ocupacional
DME100 = 1
Si JH trabaja empresa con menos de
100 personas y 0 o.c.
DME499 = 1
Si JH trabaja empresa con 100 a 499
personas y 0 o.c.
DOEMP =
1
Si JH tiene otro trabajo y 0 en otro caso
DCONVI
=
1
Si JH es conviviente y 0 en otro caso
DCASAD
=
1
Si JH es casado y 0 en o.c.
DVIUDO
=
1
Si JH es viudo y 0 en o.c.
DDIVOR
=
1
Si JH es divorciado y 0 en o.c.
DSEPAR
=
1
Si JH es separado y 0 en o.c.
DSHDV
=
1
Si SS.HH. hogar - conectados a red
pblica dentro de vivienda y 0 en o.c.
DSHNO
=
1
Si hogar no tiene SS.HH. dentro de
hogar y 0 en o.c.
DAGUDV = 1
Si abastecimiento de agua es travs de
red pblica dentro de vivienda
P1122 = 1
Si el tipo de alumbrado en la vivienda
es a travs de kerosene
P115 = 1
Si se utiliza espacio en la vivienda que
destine ingresos al hogar.
Cuadro VIII.1 Perfil del Jefe de Hogar segn Nivel Educativo y Estado pobreza
estado pobreza
pobre
no pobre
Total
sin nivel
72.5%
27.5%
100.0%
primaria
61.3%
38.7%
100.0%
universitaria
8.2%
91.8%
100.0%
post univers.
.2%
99.8%
100.0%
Total
46.8%
53.2%
100.0%
a. Porcentage de columnas
12/ Debemos de recordar que si bien el objetivo de nuestra investigacin gira en torno a los modelos logit y probit, vemos que no
podemos ser ajenos a aquellos previos fundamentales de anlisis descriptivo para poder seguir avanzando sobre niveles de anlisis
ms complejos, como lo podran constituir el anlisis multivariado y los modelos de probabilidad con enfoques binomial.
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Assoc iation
N of Valid Cas es
Value
859730.5
954693.3
5
5
Asymp. Si g.
(2-sided)
.000
.000
.000
df
842469.1
5834837
Ordinal by
Ordinal
Kendall's tau- b
Kendall's tau- c
Gamma
Sp ear man Cor relation
N of Valid Cases
Value
. 346
. 409
. 567
Ap prox. Sig .
.000
.000
.000
. 375
5834837
.000
Grfico VIII.1
Perfil del Nivel Educativo segn estado de pobreza del jefe del hogar
Pob re
100
90
N o Pob re
PORCENTAJE
80
70
60
50
40
30
20
10
0
S in Nivel
Prim aria
Secundaria
Superior No
Pos t -Grado
Universitaria
NIVEL EDUCATIVO
Cuadro VIII.4
Perfil de jefe de hogar segn gnero y estado civil o conyugal en estado de pobreza
estado
pobreza
pobre
Sexo
Hombre
Mujer
Total
Conviviente
96.4%
3.6%
100.0%
Soltero
49.5%
50.5%
100.0%
Total
81.2%
18.8%
100.0%
a. Porcentage en columnas
V alue
1685365
1478553
2764186
A symp . Sig.
(2 -sided)
.000
.000
df
5
5
Nom
by
Nom
Phi
Cramer's V
Contingency Coefficient
N of Valid Cases
Value
.781
.781
.615
2764186
Approx. Sig.
.000
.000
.000
Cuadro VIII.7
Perfil de jefe de hogar segn gnero y estado civil o conyugal en estado de no pobreza
a
estado
pobreza
no
pobre
Sexo
Hombre
Mujer
Total
Conviviente
94.1%
5.9%
100.0%
Soltero
62.1%
37.9%
100.0%
Total
78.2%
21.8%
100.0%
a. Porcentage de Columnas
13/ Debemos de considerar que si bien estos coeficientes nos confirman los grados de asociacin de variables estos poseen
limitaciones como el caso del coeficiente de contingencia, que a pesar que nos puede expresar que un valor de cero
confirma la no asociacin de variables, no posee la propiedad en el caso extremo de un grado de asociacin total, es decir,
igual a 1. Para ms detalle consultar Siegel , Sidney.
Pears on Ch i-Squar e
Likelihood R atio
N of Valid Cases
Value
1356731
1327980
3144673
Asymp. Sig.
(2-sided)
.000
.000
df
5
5
No m by
No m
Ph i
Cra m er's V
Co n tin ge n cy
Co e fficien t
N o f V alid Ca se s
Va lue
.6 57
.6 57
Ap pro x. Sig .
.0 00
.0 00
.5 49
.0 00
31 44 6 73
Grfico VIII.2
Perfil del Jefe de Hogar segn Gnero y Estado Civil
condicin de no pobreza
Mujer
100
Hombre
PORCENTAJE
80
60
40
20
0
CONV IVIE NT E
CAS ADO
VIUDO
DIVOR CIADO
SE PAR ADO
S OL T E R O
ESTADO CIVIL
Grfico VIII.3
Perfil del Jefe de Hogar segn Gnero y Estado Civil
condicin de pobreza
Mujer
100
Hombre
PORCENTAJE
80
60
40
20
0
CONV IVIE NT E
CAS ADO
VIU DO
DIVOR CIADO
SE PAR ADO
S OLT E R O
ESTADO CIVIL
Cuadro VIII.10
Perfil de jefe de hogar segn Area y Regin Natural en estado de pobreza
estado
pobreza
pobre
Urbano_Rural
urbano
rural
Total
regiones naturales
costa
sierra
selva
84.3%
24.1%
42.1%
15.7%
75.9%
57.9%
Total
47.4%
52.6%
100.0%
100.0%
a. Porcentage de Columnas
100.0%
100.0%
Grfico VIII.4
Perfil del Jefe de Hogar segn rea y Regin
Natural de residencia - Condicin de pobreza
90
U rb an o
80
R ur al
PORCENTAJE
70
60
50
40
30
20
10
0
C OS TA
SI E R R A
S E LV A
REGION NATURAL
879899.6
2764184
.000
df
Nom b y
Nom
P hi
Crame r's V
Con tinge n cy
Coe fficient
N of V ali d Cases
ANLISIS CUANTITATIVO
Si bien hemos mostrado relaciones con
variables importantes que en principio nos
muestran panoramas independientes de
la pobreza y el efecto que sobre la
condicin del jefe de hogar ejercen estas
variables de naturaleza cualitativa,
extrayndolas
del
fenmeno
multidimensional en su conjunto,
podemos tambin detenernos por
instantes dado que no es objetivo de esta
investigacin analizar como cierto tipo de
activo de capital humano se comportan
dentro de las distintas condiciones de
pobreza, entre ellos, aos de estudios del
jefe de hogar.
AOS DE ESTUDIOS DEL JEFE DE
HOGAR
Uno de los indicadores que muchos
consideran de suma importancia al analizar
la pobreza, es el de los aos de estudios
del jefe de hogar. Para el ao 2001
podemos observar [CUADRO VIII.13] que
el activo de capital humano referente a
los aos de estudios del jefe de hogar es
bajo, basta solo con observar que para el
V alu e
.545
.545
.478
.000
2764 1 84
Cuadro VIII.13
Cuadro de aos de estudio del Jefe de Hogar segn Condicin de Pobreza
Aos de
estudios JH
Estado Pobreza
pobre
Promedio
Promedio sin 5% VE
Mediana
Desviacion Std.
Asimetra
Kurtosis
Promedio
Promedio sin 5% VE
Mediana
Desviacion Std.
Asimetra
Kurtosis
no pobre
Statistic
5.36
5.17
6.00
4.30
.345
-.870
9.29
9.38
11.00
4.93
-.298
-.842
Std. Error
2.60E-03
.001
.003
2.80E-03
.001
.003
Cuadro VIII.14
Prueba de Levene para igualdad de varianzas y diferencia de medias
en los aos de estudios del JH
Levene's Test for
Equality of Variances
F
Aos de
estudios
jh
Asumiendo
varianzas iguales
Sin asumir
varianzas iguales
57766.511
Sig.
.000
df
Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
-1017.677
5834834
.000
-3.92
3.86E-03
-1026.487
5834386
.000
-3.92
3.82E-03
14/ Sabemos que el estadstico de Levene es resistente a la ausencia de normalidad de una distribucin analizada, en tal sentido
se propone como ms idneo para medir la homogeneidad de las varianzas.
Grfico VIII.5
Tendencia del Promedio de aos de estudio del jh
segn estado de pobreza
10
9
8
7
6
5
4
3
N =
1178530
1553196
3103109
P o b re E xtre m o
P o b re No E xtre m o
No P o b re
POBREZA
Cases weighted by FACTOR
.911
-.072
-1.189
.570
.899
-.807
.070
.584
.451
.324
-.226
-.011
.517
-.313
.269
-.388
.270
-.168
.627
.288
.761
S.E.
.231
.011
.167
.098
.121
.125
.010
.189
.092
.095
.085
.000
.031
.040
.080
.093
.089
.082
.092
.083
.379
Wald
15.548
41.221
50.439
33.642
55.483
41.844
49.495
9.540
23.940
11.606
7.090
876.865
283.825
60.764
11.274
17.414
9.281
4.137
46.847
11.916
4.035
df
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Sig.
.000
.000
.000
.000
.000
.000
.000
.002
.000
.001
.008
.000
.000
.000
.001
.000
.002
.042
.000
.001
.045
Exp(B)
2.488
.931
.304
1.768
2.458
.446
1.072
1.793
1.570
1.383
.798
.989
1.677
.731
1.308
.678
1.310
.846
1.873
1.334
2.141
Pi =
1
1 + e Zi
ECUACIN VIII.4
ECUACIN VIII.1
Donde:
Zi = 0.761 + 0.911(sinnivel) 0.072(edad) - 1.189(costa urbana) +
0.570(sierra urbana) + 0.899(selva
urbana) - 0.807(selva rural) +
0.07(indexplabo) + 0.584(colegesta) +
0.451(obrero) + 0.324(menos100pe) 0.226(otroemple) -0.011(inpercam) +
0.517(mieperhog) - 0.313(pethogar) +
0.269(conviviente) -0.388(sehigdviv) +
0.270(noservhigie) - 0.168(aguaviv) +
0.627(alumkerose) + 0.288(empvivingre).
ECUACIN VIII.2
Prueba de hiptesis
coeficientes
sobre los
ECUACIN VIII.3
log(
Pr( jhpobre)
) = 0 + 1 X 1 + ...... + pXp
Pr( jhnopobre)
ECUACIN VIII.5
Pr ob( jhpobre)
=
Pr ob( jhnopobre)
e 0+ 1 X 1+......+ pXp = e 0e 1X 1...e pXp
ECUACIN VIII.6
Predicted
Observed
Estado pobreza
no pobre
pobre
Overall Percentage
Estado pobreza
no pobre
pobre
3400
701
519
3550
Percentage
Correct
82.9
87.2
85.1
-2 Log likelihood
11325.900
a,b,c
Coefficients
Constant
-.008
es 5683.192, el cual es menor que el 2LL para el modelo solo con la constante.
La bondad de ajuste puede apreciarse
adems en los estadsticos R2 de Cox &
Snell (0.499) y de Nagelkerke (0.665), que
nos explican el porcentaje de variacin
explicada por el modelo.
-2 Log
likelihood
5683.192
Nagelkerke
R Square
.665
Step
Block
Model
Chi-sq uare
4.126
5642 .707
5642 .707
df
1
20
20
Sig.
.042
.000
.000
Mtodos de diagnstico
Cuando se construye un modelo
estadstico, es importante examinar la
calidad de los resultados obtenidos. En
regresin lineal, observamos una variedad
de residuales, medidas de influencia e
indicadores de colinealidad. Existen
herramientas valiosas, para identificar
puntos donde el modelo no puede ajustar
bien, puntos que ejercen fuerte influencia
sobre los coeficientes estimados, y
variables que son altamente relacionadas
unas con otras. En regresin logstica y el
modelo logit existen diagnsticos
comparables que deberan ser usados para
detectar problemas.
El residual es la diferencia entre la
probabilidad observada del evento y la
probabilidad predicha del evento basado
en el modelo. Por ejemplo, si predecimos
que la probabilidad de ser pobre es 0.75
para un jefe de hogar pobre, su residual
es 1 -0.75 = 0.25.
El residual estandarizado (standardized
residual) es el residual dividido por un
estimado de su desviacin estndar. En este
caso ser:
Zi =
residuali
Pi (1 P i )
ECUACIN VIII.7
Logitresidi =
residuali
Pi (1 Pi )
ECUACIN VIII.10
Di =
Z i * hi
(1 hi ) 2
ECUACIN VIII.11
Diagnsticos de grficas
Todos los estadsticos descritos hasta ahora
pueden ser grabados para este anlisis en
la matriz de casos/variables. Cuando se
considere conveniente, se pueden
obtener grficas de probabilidad normal
usando el procedimiento de exploracin
y grficas de dignstico usando
procedimientos grficos.
El [GRFICO VIII.6] muestra la grfica de
probabilidad normal Q-Q y la grfica QQ de desviaciones respecto a la normal.
En el caso de la grfica izquierda Q-Q
(Quantiles reales y tericos de una
distribucin normal) de probabilidad
normal, los valores correspondientes a una
distribucin normal terica vienen
representados por la recta y los puntos son
los valores de la deviance de los jefes de
hogar. Como vemos estos puntos, en su
mayora, estn prximos a la recta, lo cual
indica que el ajuste es aceptable. Confirma
esto la suposicin hecha con respecto a
los tamaos de muestra grande. Para el
caso de aquellos valores de deviance muy
superiores a 2, el modelo no ajusta muy
bien dichas observaciones, pero se debe
considerar que estos corresponden
probabilidades de mala clasificacin de los
jefes de hogar, en tal sentido, se puede
optar por su eliminacin o por el anlisis
de los estadsticos de Cooks y DfBetas
para ver la influencia de dichas
observaciones.
Grfico VIII.6
Grfica Q-Q Desviaciones de
la Normal Valores Deviance
Desv. de D. Normal
-2
2.5
2.0
1.5
1.0
.5
0.0
-.5
-4
-4
-2
-4
-2
Grfico VIII.7
Grfica de Residuales Estandarizados
6
Residual Standard
-2
-4
2000
Valores Observados
Valores Observados
4000
6000
Observaciones
8000
10000
Grfico VIII.8
Grfica de Leverage por Observacin
Valores Leverage
.0 3
.0 2
.0 1
0 .0 0
0
2000
4000
6000
8000
10000
Observaciones
Grfico VIII.9
Grfica de DfBeta SINNIVEL por Observacin
.04
DFBETA SINNIV
.02
0.00
-.02
-.04
-.06
0
2000
4000
6000
8000
10000
Observaciones
Cuadro VIII.20
Deciles de Jefes de hogar Jefes de hogar pobres
Ingreso
en deciles (Ni) en deciles (ni)
Decil I
1789
1737
Decil II
1811
1711
Decil III
1782
1554
Decil IV
1705
1211
Decil V
1702
855
Decil VI
1730
531
Decil VII
1623
264
Decil VIII
1582
154
Decil IX
1498
89
Decil X
1293
21
PROBIT
ANALYSIS
MODEL Information
ONLY Normal Sigmoid is requested.
Parameter estimates converged after 11 iterations.
Optimal solution found.
Parameter Estimates (PROBIT model: (PROBIT(p)) = Intercept + BX):
Regression Coeff.
Standard Error
Coeff./S.E.
NINPERCA
-.00678
.00013
-53.42949
Intercept
S.Error
Intercept/S.E.
EPOBRE
.72278
.75554
.00094
.00057
767.70752
1322.62124
pobre
no pobre
NINPERCA
6.00
8.00
3.00
6.00
5.00
9.00
3.00
6.00
5.00
4.00
Number of
Subjects
1730.0
1582.0
1782.0
1730.0
1702.0
1498.0
1782.0
1730.0
1702.0
1705.0
Observed
Responses
531.0
154.0
1554.0
531.0
855.0
89.0
1554.0
531.0
855.0
1211.0
Expected
Responses
1319.386
1199.852
1370.164
1319.386
1301.590
1132.967
1370.164
1319.386
1301.590
1307.430
(PROBIT(p)) =
(PROBIT(p)) =
Residual
Prob
-788.386
-1045.852
183.836
-788.386
-446.590
-1043.967
183.836
-788.386
-446.590
-96.430
.76265
.75844
.76889
.76265
.76474
.75632
.76889
.76265
.76474
.76682
Intercept + BX
.72278 -.00678*
NINPERCA
Grfico VIII.10
Tasa de Respuesta
TRAMSFORMACIONES PROBIT
-1
es tado pobrez a
-2
no pobre
-3
pobre
0
DECILES DE INGRESO
10
12
Cuadro VIII.22
Incidencia en la probabilidad de ser pobre a nivel nacional
E P O B RE
S IN N IV E L
E DA D
A .R U R A L
S IE R R A
SEL VA
M O D E LO N 1
C o e f.
P> z
0 .9 47
-0 .0 7
-0 .9 96
0 .8 52
0 .5 73
M O D E LO N 2
C oe f.
P > |t |
0.0 00
0.0 00
0.0 00
0.0 00
0.0 00
1.1 4 8
- 0.0 8 3
M O D E LO N 3
C oe f.
P > | t|
0 .0 00
0 .0 00
0.7 8 5
- 0.0 6 8
0 .0 01
0 .0 00
- 0.3 9 2
- 1.4 5 6
0 .0 01
0 .0 00
C O S T A R UR
- 0.3 5 8
- 1.3 8 8
0 .0 04
0 .0 00
S IE R R A U R B
0.2 3 2
0 .0 94
S IE R R A R U R
- 0.1 7 2
- 0.9 9 1
0 .2 77
0 .0 00
- 0.5 7 1
- 1.1 1 3
0 .0 00
0 .0 00
C O S T A U RB
SEL VA R U R
IN D E X P L A B
0 .0 69
0.0 00
0.0 7 9
0 .0 00
0.0 7 0
0 .0 00
CO L EG E S T A
0 .6 01
0 .4 44
0.0 00
0.0 00
0.8 0 2
0.3 8 6
0 .0 00
0 .0 01
0.5 0 2
0.4 8 5
0 .0 09
0 .0 00
0 .3 51
-0 .2 23
-0 .0 11
0.0 00
0.0 1
0.0 00
0.3 3 3
- 0.2 7 9
- 0.0 0 9
0 .0 11
0 .0 19
0 .0 00
0.2 3 8
0 .0 26
0 .5 15
-0 .3 18
0 .2 67
-0 .4 16
0 .2 86
-0 .1 39
0 .5 93
-0 .2 84
1 .2 36
0.0 00
0.0 00
0.0 00
0.0 00
0.0 00
0.0 00
0.0 00
0.0 00
0.0 00
0.5 3 9
- 0.3 2 2
0.3 2 0
- 0.3 6 9
0.3 1 7
- 0.2 3 5
0.6 6 6
- 0.1 4 3
1.1 2 7
0 .0 00
0 .0 00
0 .0 02
0 .0 03
0 .0 10
0 .0 23
0 .0 00
0 .1 89
0 .0 08
O BR E R O
M E NO S 1 0 0 P E
O TR O E M P L
IN P E R C A M
M IE P E R H O
P ET HO G AR
C O N V I V IE N
S E H IG D V I V
NO S E HIG
AG U AV IV
A LU M K E R O
E M P V IV I
CO N S T
O bs e rv a c i on e s
LR c h i-s q u a r e
P ro b > c h i 2
S e u do R a j us t
CC
81 70
5 6 0 4.5
0.0 00
0.4 90
8 4 .01 0
O bs e rv a c io n e s
Ta m . P o b la c
F( 2 1 ,
2 5 9 3)
P ro b > F
CC
8 1 70
29 249 40
3 8 .40 0
0 .0 00
84 .1
- 0.0 1 1
0 .0 00
0.4 8 2
- 0.2 5 0
0.1 1 6
- 0.5 1 5
0.2 2 3
0 .0 00
0 .0 00
0 .2 43
0 .0 00
0 .0 48
0.6 3 9
0 .0 00
1.3 9 4
0 .0 00
O bs e rv a c io n e s
Ta m . P o b la c
F( 1 7 , 2 6 0 7 )
P ro b > F
CC
8 20 2
2 9 09 8 95
49 .5 30
0 .0 00
84 .6
S ig n if ic a n c i a : 5 %
Fu e n te : E N AH O I V TR I M . 2 0 0 1
E la b o ra c i n :C ID E
Cuadro VIII.23
Incidencia en la probabilidad de ser pobre a nivel nacional
E P O B RE
S IN N IV E L
E DA D
A .R U R A L
S IE R R A
SEL VA
M O DE L O N 1
C o e f.
P> z
0 .5 3 4
-0 .0 4 5
0 .0 0 0
0 .0 0 0
-0 .5 4 0
0 .5 0 0
0 .3 0 7
0 .0 0 0
0 .0 0 0
0 .0 0 0
M O DE L O N 2
C o e f.
P > |t |
CO ST A U RB
CO ST A R UR
M O D E LO N 3
C oef .
P > | t|
0 .6 8 3
- 0.05 0
0 .0 0 0
0 .0 0 0
0 .4 2 3
- 0.04 8
0 .0 0 2
0 .0 0 0
- 0.23 2
- 0.83 0
0 .0 0 1
0 .0 0 0
- 0.23 3
- 0.80 5
0 .0 0 0
0 .0 0 0
0 .1 7 5
0 .0 0 0
0 .0 0 0
- 0.22 4
- 0.61 6
0 .0 4 8
0 .0 1 3
0 .0 0 0
0 .0 0 0
0 .2 8 4
0 .2 5 0
0 .0 1 0
0 .0 0 0
S IE R R A U R B
IN D E X P L A B
0 .0 4 3
0 .0 0 0
- 0.11 1
- 0.60 2
0 .0 4 8
CO L E G E S T A
0 .3 3 3
0 .2 0 6
0 .0 0 1
0 .0 0 0
0 .4 6 9
0 .1 7 8
0 .0 0 0
0 .0 0 8
S IE R R A R U R
SEL VA R U R
O BR E R O
M E NO S 1 00 P E
O TR O E M P L
IN P E R C A M
M IE P E R H O
P ET HO G AR
C O N V I V IE N
S E H IG D V I V
NO SE HIG
AG U AV IV
A LU M K E R O
E M P V IV I
CO N S T
0 .2 4 3
0 .0 0 0
0 .2 2 2
0 .0 0 3
0 .1 6 8
0 .0 0 4
-0 .1 2 2
-0 .0 0 5
0 .3 0 4
0 .0 1 0
0 .0 0 0
0 .0 0 0
- 0.15 6
- 0.00 4
0 .3 0 9
0 .0 2 6
0 .0 0 0
0 .0 0 0
- 0.00 5
0 .3 0 4
0 .0 0 0
0 .0 0 0
-0 .2 0 0
0 .1 5 1
-0 .2 8 4
0 .0 0 0
0 .0 0 1
0 .0 0 0
- 0.19 5
0 .1 8 7
- 0.28 2
0 .0 0 0
0 .0 0 2
0 .0 0 0
- 0.18 0
0 .0 9 1
- 0.32 8
0 .0 0 0
0 .1 2 1
0 .0 0 0
0 .1 6 8
-0 .0 7 3
0 .3 5 7
0 .0 0 1
0 .1 1 7
0 .0 0 0
0 .1 8 4
- 0.10 7
0 .3 8 2
0 .0 0 9
0 .0 8 0
0 .0 0 0
0 .1 3 9
0 .0 3 1
0 .3 8 9
0 .0 0 0
-0 .1 8 1
0 .5 9 2
0 .0 0 0
0 .0 0 2
- 0.07 9
0 .5 9 5
0 .2 1 8
0 .0 1 2
0 .5 9 0
0 .0 0 8
O bs e rv a c i on e s
8 170
L R c h i- s q u a r e
5 4 7 0 .3
0 .0 0 0
0 .4 8 3
P ro b > c h i 2
S eu do R a jus t
CC
8 4 .0
O b s e rv a c i on e s
T a m . P o b la c
F( 20 ,
25 94)
P ro b > F
8 170
29 249 40
4 5 .3 8 0
0 .0 0 0
8 3 .4
CC
O b s e r v a c io n e s
T a m . P o bl a c
F ( 1 7,
2607)
Pro b > F
CC
820 2
2 90 989 5
6 3 .9 4 0
0 .0 0 0
8 4 .3
S ig n if ic a n c i a : 5 %
F u e n te : E N A H O I V T R I M . 2 0 0 1
E l a b o ra c i n :C ID E
IX. CONCLUSIONES
X. RECOMENDACIONES
herramientas de validacin de la
bondad de ajuste del modelo y no
dejara de lado su funcin
discriminadora, beneficiosa en este
caso en el que la variable dependiente
posee solo dos categoras.
XI. BIBILIOGRAFA
ANLISIS ECONOMTRICO.
Green, William H.
Prentice Hall. 1998.
ESTADSTICA MULTIVARIANTE EN
LAS CIENCIAS DE LA VIDA.
Carrasco, Jos Luis; Hernn, Miguel
Angel.
CIBEST. Espaa, Editorial Ciencia, 1993.
ECONOMETRA,
Gujarati, Damodr N.
Colombia, McGraw-HILL, 1997
METODOLOGA
DE
LA
INVESTIGACIN.
Hernndez, Roberto; Fernndez,
Carlos; Baptista, Pilar.
Mxico. McGraw Hill, 1994.
MTODOS
MULTIVARIADOS
APLICADOS AL ANLISIS DE
DATOS.
Johnson,
Mxico, ITP, 2000.
LIMITED-DEPENDENT
AND
QUALITATIVE
VARIABLES
IN
ECONOMETRICS.
Maddala G. S.
New York, Cambridge University Press,
1996.
MS ALL DE LA FOCALIZACIN,
RIESGOS DE LA LUCHA CONTRA LA
POBREZA EN EL PER
Chacaltana J., Juan.
PER, Consorcio de Investigacin
Econmica y Social, 2001.
IMPACTO DE LOS SERVICIOS
PBLICOS DE SALUD SOBRE LA
PRODUCTIVIDAD Y LA POBREZA,
Cortez Valdivia, Rafael.
Lima, INEI, 2000.
BIOESTADSTICA.
Daz, Gabriela; Gunther, Bruno.
Chile, Mediterrneo, 1994.
EL ANLISIS DE DATOS EN
MTODO
DE
SELECCIN
DICOTMICA DE LA VARIABLE
CONTINGENTE,
Fasciolo, Graciela.
Mendoza, 1997.
MULTIVARIATE
ANALYSIS:
SOCIOLOGY 203,
Department of Sociology, University of
California, Riverside.
XII. Anexos
ANEXO 1.
Informe metodolgico
ANEXO 2.
ANEXO 1
INFORME METODOLGICO
TAMAO DE MUESTRA: El
tamao
total de la muestra en el mbito nacional
es de 18,863 viviendas particulares, dentro
de los cuales tomamos a 16515 Jefes de
Hogar y sus respectivos hogares.
Iteration
Step 0 1
-2 Log
likelihood
11325.900
a,b,c
Coefficien
ts
Constant
-.008
a,b
Predicted
Step 0
Observed
estado pobreza01
no pobre
pobre
estado pobreza01
no pobre
pobre
4101
0
4069
0
Overall Percentage
a. Constant is included in the model.
b. The cut value is .500
Percentage
Correct
100.0
.0
50.2
Step 0
Constant
B
-.008
S.E.
.022
Wald
.125
df
Sig.
.723
Variables
DSINNIV
P208A
DCOURB
DCORU
DSIEUR
DSIERU
DSELUR
DSELRU
DLIUR
EXPER1
DCOLEGIO
DOBRERO
DME100
DOEMP
INPERCAM
MIEPERHO
PETHOGAR
DCONVI
DSHDV
DSHNO
DAGUDV
P1122
P115
Exp(B)
.992
Score
188.492
55.014
223.726
.152
15.617
836.127
.371
50.785
446.997
8.833
.075
31.997
528.833
21.192
860.534
819.967
33.780
180.384
1307.200
674.480
669.772
1114.157
57.575
df
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Sig.
.000
.000
.000
.697
.000
.000
.542
.000
.000
.003
.785
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
-2 Log
likelihood
9973.258
5683.192
Nagelkerke
R Square
.203
.665
Step 20
Step
Block
Model
Step
Block
Model
Chi-square
1352.641
1352.641
1352.641
4.126
5642.707
5642.707
df
1
1
1
1
20
20
Sig.
.000
.000
.000
.042
.000
.000
Step
2
20
Chi-square
21.938
525.158
df
8
8
Sig.
.005
.000
Step 1
Observed
estado pobreza01
Step 20
Overall Percentage
estado pobreza01
no pobre
pobre
no pobre
pobre
Overall Percentage
estado pobreza01
no pobre
pobre
2436
1665
823
3246
3400
519
701
3550
Percentage
Correct
59.4
79.8
69.5
82.9
87.2
85.1
DSHDV
Constant
DSINNIV
P208A
DCORU
DSIEUR
DSELUR
DSELRU
EXPER1
DCOLEGIO
DOBRERO
DME100
DOEMP
INPERCAM
MIEPERHO
PETHOGAR
DCONVI
DSHDV
DSHNO
DAGUDV
P1122
P115
Constant
B
-1.753
.668
.911
-.072
-1.189
.570
.899
-.807
.070
.584
.451
.324
-.226
-.011
.517
-.313
.269
-.388
.270
-.168
.627
.288
.761
S.E.
.050
.030
.231
.011
.167
.098
.121
.125
.010
.189
.092
.095
.085
.000
.031
.040
.080
.093
.089
.082
.092
.083
.379
Wald
1212.252
490.482
15.548
41.221
50.439
33.642
55.483
41.844
49.495
9.540
23.940
11.606
7.090
876.865
283.825
60.764
11.274
17.414
9.281
4.137
46.847
11.916
4.035
df
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Sig.
.000
.000
.000
.000
.000
.000
.000
.000
.000
.002
.000
.001
.008
.000
.000
.000
.001
.000
.002
.042
.000
.001
.045
Exp(B)
.173
1.950
2.488
.931
.304
1.768
2.458
.446
1.072
1.793
1.570
1.383
.798
.989
1.677
.731
1.308
.678
1.310
.846
1.873
1.334
2.141
3.913
.951
.423
2.144
3.114
.570
1.093
2.598
1.881
1.666
.942
.990
1.781
.791
1.530
.814
1.558
.994
2.241
1.571
Variables
Step
20
Variables
DSINNIV
P208A
DCOURB
DCORU
DSIEUR
DSIERU
DSELUR
DSELRU
DLIUR
EXPER1
DCOLEGIO
DOBRERO
DME100
DOEMP
INPERCAM
MIEPERHO
PETHOGAR
DCONVI
DSHNO
DAGUDV
P1122
P115
DCOURB
DSIERU
DLIUR
Score
69.683
13.868
29.125
39.325
.985
259.136
.699
1.023
125.821
8.835
.090
13.894
206.545
3.052
561.907
962.249
158.062
79.704
107.207
33.928
393.466
16.562
1.150
.005
1.496
df
Sig.
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
.000
.000
.000
.000
.321
.000
.403
.312
.000
.003
.764
.000
.000
.081
.000
.000
.000
.000
.000
.000
.000
.000
.283
.942
.221
ANEXO 2
INDICES DE ECUACIONES, CUADROS Y GRAFICOS
INDICE DE ECUACIONES
CAPTULO IV
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN
IV.1
IV.2
IV.3
IV.4
IV.5
IV.6
IV.7
ECUACIN IV.8
ECUACIN IV.9
ECUACIN IV.10
ECUACIN IV.11
ECUACIN IV.12
ECUACIN IV.13
ECUACIN IV.14
ECUACIN IV.15
ECUACIN IV.16
ECUACIN
ECUACIN
ECUACIN
ECUACIN
IV.17
IV.18
IV.19
IV.20
ECUACIN IV.21
ECUACIN IV.22
CAPTULO VI
ECUACIN VI.1
ECUACIN VI.2
ECUACIN VI.3
ECUACIN VI.4
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN
VI.5
VI.6
VI.7
VI.8
VI.9
VI.10
VI.11
ECUACIN
ECUACIN
ECUACIN
ECUACIN
VI.12
VI.13
VI.14
VI.15
CAPTULO VIII
ECUACIN VIII.1 Probabilidad del jefe de hogar pobre con FDA Logstica.
ECUACIN VIII.2 Estimacin del modelo Logit de probabilidad en funcin de sus
factores explicativos.
ECUACIN VIII.3 Anlisis de un caso particular de jefe de hogar para el modelo
logit.
ECUACIN VIII.4 Probabilidad asociada al jefe de hogar con un caso especfico.
ECUACIN VIII.5 Logit de la probabilidad de ser pobre frente a no ser pobre de
acuerdo a sus factores explicativos.
ECUACIN VIII.6 Ecuacin de regresin en trminos de Odds Ratios (Razones de
probabilidad`)
ECUACIN VIII.7 Residual estandarizado
ECUACIN VIII.8 Deviance de observaciones en presencia de pobreza.
ECUACIN VIII.9 Deviance de observaciones en ausencia de pobreza.
ECUACIN VIII.10 Logit residual del modelo de prob. de los jefes de hogar.
ECUACIN VIII.11 Medida de influencia de cada observacin.
ECUACIN VIII.12 Cambio en el primer coeficiente al retirar la observacin "i".
INDICE DE CUADROS
CAPTULO VIII
CUADRO VIII.1
CUADRO VIII.2
CUADRO VIII.3
CUADRO VIII.4
CUADRO VIII.5
CUADRO VIII.6
CUADRO VIII.7
CUADRO VIII.8
CUADRO VIII.9
CUADRO VIII.10
CUADRO VIII.11
CUADRO VIII.12
CUADRO VIII.13
CUADRO VIII.14
CUADRO VIII.15
CUADRO
CUADRO
CUADRO
CUADRO
CUADRO
VIII.16
VIII.17
VIII.18
VIII.19
VIII.20
CUADRO VIII.21
CUADRO VIII.22
CUADRO VIII.23
ANEXO
CUADRO A.1
CUADRO A.2
CUADRO A.3
CUADRO A.4
CUADRO A.5
CUADRO A.6
CUADRO A.7
CUADRO A.8
CUADRO A.9
CUADRO A.10
INDICE DE GRFICOS
CAPTULO IV
GRFICO IV.1
GRFICO IV.2
GRFICO IV.3
GRFICO IV.4
CAPTULO VIII
GRFICO VIII.1
GRFICO VIII.2
GRFICO VIII.3
GRFICO VIII.4
GRFICO VIII.5
GRFICO VIII.6
GRFICO VIII.7
GRFICO VIII.8
GRFICO VIII.9
GRFICO VIII.10
Grfica del perfil del nivel educativo segn estado de pobreza del
jefe de hogar
Grfica del perfil del jefe de hogar segn gnero y estado civil en
condicin de no pobreza.
Grfica del perfil del jefe de hogar segn gnero y estado civil en
condicin de pobreza.
Grfica del perfil del jefe de hogar segn rea y regin natural en
condicin de pobreza.
Grfica de la tendencia del promedio de aos de estudios del jefe
de hogar segn estado de pobreza.
Grfica de distribucin normal y desviaciones respecto de la
distribucin normal de las Deviances obtenidas para cada JH.
Grfica de residuales estandarizados segn observaciones.
Grfica de Leverages obtenidos segn observaciones.
Grfica de la influencia de observaciones sobre el coeficiente del
indicador sinnivel (sin nivel de educain).
Grfica de transformaciones probit segn deciles de ingreso