Está en la página 1de 98

Centro de Investigacin y

Desarrollo (CIDE)

LOS MODELOS
LOGIT Y PROBIT EN
LA INVESTIGACIN
SOCIAL
El caso de la Pobreza del Per
en el ao 2001

Lima, Agosto 2002

Centro de Investigacin y Desarrollo

DIRECCIN Y SUPERVISIN

Econ. Mirlena Villacorta Olazabal


Directora Tcnica del CIDE

Documento Elaborado por:


Franck G. Pucutay Vsquez

Preparado

Impreso
Diagramacin
Tiraje
Domicilio
Orden de Impresin
Depsito Legal N

:
:
:
:
:
:

Centro de Investigacin y Desarrollo del Instituto Nacional de


Estadstica e Informtica (INEI)
Talleres de la Oficina Tcnica de Administracin del INEI
Centro de Edicin de la Oficina Tcnica de Difusin del INEI
200 Ejemplares
Av. General Garzn 658, Jess Mara. Lima - Per
N
-OTA-INEI
150113-2002-4014

2 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

Presentacin
El INEI pone a disposicin la investigacin metodolgica: "LOS MODELOS
LOGIT Y PROBIT EN LA INVESTIGACIN SOCIAL El caso de la
pobreza del Per en el ao 2001", que por su nivel de especializacin
est dirigida principalmente a los miembros de la comunidad acadmica,
profesionales de las oficinas de estadstica y los investigadores interesados
en mantener la actualidad de sus procedimientos estadsticos.
Esta investigacin metodolgica tiene por finalidad, generar instrumentos
y procedimientos que permitirn validar, mejorar y actualizar los procesos
estadsticos. Se caracteriza por ser innovadora en su campo de aplicacin,
por contener un rigor cientfico en su desarrollo integral, por la validez
de sus procesos, por la vigencia y actualidad de sus metodologas aplicadas.
En esa misma direccin, la investigacin presentada desarrolla la
metodologa asociada a los modelos de probabilidad con variable
dependiente discreta dicotmica (modelo logit y probit), en funcin del
fenmeno de pobreza en los jefes de hogar del Per para el ao 2001.
Contribuyendo a la implementacin de los enfoques asociados a estos
modelos, segn la viabilidad permitida por los factores de naturaleza
cualitativa, cuantitativa y su aporte en la probabilidad de ser pobre del
jefe de hogar.
Este estudio al igual que otros de carcter metodolgico, ha sido elaborado
por profesionales del Centro de Investigacin y Desarrollo (CIDE), en el
marco del desarrollo y promocin de investigaciones estadsticas y
socioeconmicas que permitan elevar la calidad de la informacin del
INEI y el SEN.
El INEI espera como resultado de esta investigacin, incorporarse en el
circuito de la produccin del conocimiento y elevar los estndares de
calidad de sus procesos, sentando con ello las bases de la investigacin
metodolgica en la institucin.
Lima, Agosto 2002

Gilberto Moncada Vigo


Jefe del INEI

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 3

Centro de Investigacin y Desarrollo

4 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

INDICE
Presentacin .................................................................................................. 3
Prlogo ........................................................................................................ 7
I. INTRODUCCIN ................................................................................... 9
II. FUNDAMENTACION DEL PROBLEMA .......................................... 11
2.1. Formulacin del problema ........................................................................... 13
III.OBJETIVOS DE LA INVESTIGACIN .............................................. 15
3.1. Objetivo general .............................................................................................. 15
3.2. Objetivos especficos ...................................................................................... 15
IV. MARCO TERICO ............................................................................... 17
4.1. Breve formulacin del caso de la Pobreza del Per. ............................... 17
4.1.1. Qu es la pobreza? .............................................................................. 17
4.1.2. Enfoques y mtodos para su medicin ............................................. 17
4.2. Los modelos logit y probit con variable dependiente
dicotmica (VDD). ........................................................................................ 20
4.2.1. Modelos con variable dependiente dicotmica (vdd). .................... 20
4.2.2. Formulacin del modelo logit y el modelo probit con (vdd) . .... 22
4.2.3. Caracterizacin de los modelos logit y probit aplicados
al caso de la pobreza del Per. ............................................................ 24
V. HIPTESIS .......................................................................................... 33
VI. METODOS ........................................................................................... 35
6.1. Tratamiento de errores en la adecuacin de ambos modelos. ............... 35
6.1.1. Mtodos de estimacin ........................................................................ 35
VII. LA ENCUESTA NACIONAL DE HOGARES - 2001
IV TRIMESTRE ................................................................................. 39
7.1. Caractersticas de la muestra ........................................................................ 41
7.2. Factores de relevancia para la explicacin de la pobreza
extrados de la ENAHO IV trimestre 2001. ............................................ 43
VIII. CRITERIOS DE FORMULACIN DE LOS MODELOS
LOGIT Y PROBIT CON VDD APLICADOS AL CASO DE
LA POBREZA DEL PER. .............................................................. 49
8.1. Estudio a nivel descriptivo y exploratorio de algunas variables
cualitativas y cuantitativas que inciden en la pobreza del Per. .......... 49
8.2. Formulacin y adecuacin de los modelos Logit y Probit con VDD,
en funcin de las variables o factores explicativos
ms significativos. ......................................................................................... 58
IX. CONCLUSIONES ................................................................................. 79
X. RECOMENDACIONES ...................................................................... 81
XI. BIBLIOGRAFA .................................................................................... 83
XII. ANEXOS .............................................................................................. 85
Anexo 1 Informe metodolgico ............................................................................ 87
Anexo 2. Indices de ecuaciones, cuadros y grficos ............................................. 95

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 5

Centro de Investigacin y Desarrollo

6 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

Prlogo
Desde las aulas universitarias y siendo
conocedor de la difcil tarea que significa
la promocin y desarrollo de la labor
cientfica en una realidad caracterizada
por la escasez de recursos y las
restricciones presupuestarias, saludo este
esfuerzo del Centro de Investigacin y
Desarrollo (CIDE) orientado no slo a
elevar la calidad de la informacin
generado por el Sistema Estadstico
Nacional sino tambin a la produccin
cientfica y metodolgica en nuestro
medio. En este sentido, la presente
publicacin: "Los Modelos Logit y Probit
en la Investigacin Social: El Caso de la
Pobreza del Per en el Ao 2001"
satisface una necesidad no slo para los
consumidores
potenciales
de
investigaciones sociales o eventuales
investigadores sino tambin para el
pblico interesado y universitario
familiarizado con los elementos de la
estadstica.

Aunque
este
documento
es
metodolgico por naturaleza, est
orientado hacia las aplicaciones. A lo largo
del estudio, se ha mantenido al mnimo
las demostraciones terico-matemticas
y se ha puesto nfasis en el desarrollo de
un entendimiento claro de los resultados
tericos usuales en los estudios sociales
con este tipo de modelos, el cual est
plasmado en los objetivos planteados en
el documento. De otro lado, se hace una
breve pero precisa formulacin de la
pobreza en el Per cuyo anlisis se basa
en las variables provenientes de La
Encuesta Nacional de Hogares-2001 IV
Trimestre (ENAHO). De ah que, se
incluye un captulo que describe la
definicin de dichas variables para luego
interactuar sistemticamente en la
formulacin del problema y anlisis con
el enfoque de los Modelos Logit y Probit.

Luis Huamanchumo de la Cuba


Escuela Profesional de Ingeniera
Estadstica-UNI

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 7

Centro de Investigacin y Desarrollo

8 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

I. INTRODUCCION

La investigacin metodolgica juega un


papel fundamental en el desarrollo de los
estndares de calidad de las oficinas
estadsticas ms renombradas del mundo,
con el objetivo de generar informacin
relevante para la produccin del
conocimiento cientfico y por ende la toma
de decisiones. Pero ello implica la
utilizacin y exploracin de tcnicas
vigentes e idneas para el anlisis de su
informacin sin la cual no podran
mejorarse los procesos que implican su
produccin.

o por un enfoque de observaciones


individuales en la utilizacin de los
modelos logit y probit.

Muchos de los campos en los cuales se


desarrollan estas investigaciones abordan
diferentes aspectos tanto de la
problemtica social y econmica. Aqu
podemos decir que la Pobreza es uno de
esos temas tan apasionantes y a la vez muy
discutidos sobre el cual se desarrollan una
gran diversidad de metodologas y
explicaciones, sin ser estas concluyentes
y menos an aceptadas por todos. Desde
el punto de vista estadstico, una
explicacin a este fenmeno es
ampliamente beneficiada por la utilizacin
de los modelos de eleccin discreta
dicotmica-modelos logit y probit, para
obtener la cuantificacin del aporte de sus
factores significativos en el anlisis de la
pobreza.

O que los factores explicativos de la


pobreza del Per en el ao 2001 de
naturaleza cualitativa y cuantitativa
exclusivos del jefe de hogar como el nivel
de educacin, el tipo de colegio donde
estudi, la categora ocupacional, el
tamao de la firma donde labora, la
tenencia de otro empleo, el estado civil,
su edad, su indicador de experiencia
laboral; en combinacin con los factores
de naturaleza cualitativa y cuantitativa
exclusivos del hogar como la cantidad de
miembros del hogar, la cantidad de
miembros pertenecientes a la PET, el
ingreso per cpita mensual, el acceso a
activos pblicos de agua y desage, si el
hogar dedica un espacio fsico de este a
generacin de ingresos, no permiten
generar modelos correctamente ajustados
a la probabilidad de ser pobre del jefe de
hogar siguiendo el enfoque de
observaciones individuales en los modelos
logit y probit.

En esa misma lnea se plantea en qu


medida una explicacin sobre la pobreza
de los jefes de hogar del Per en el ao
2001, se vera beneficiada por la adopcin
de un enfoque de proporciones muestrales

Entonces diramos que los factores de


naturaleza cuantitativa como el ingreso per
cpita mensual del hogar, expresado a
travs de sus deciles de ingresos, o los
aos de estudios, etc; generan un modelo
correctamente ajustado a la probabilidad
de ser pobre de los jefes de hogar con el
enfoque de proporciones muestrales del
modelo probit.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 9

Centro de Investigacin y Desarrollo

Para tal efecto, lo que se pretende es


estudiar la relacin entre los factores
determinantes de naturaleza social,
econmica, demogrfica de la pobreza
del Per y los enfoques de utilizacin de
los modelos logit y los modelos probit.
Analizar el grado de afectacin de los
factores de naturaleza cuantitativa sobre
el enfoque de proporciones muestrales.
Comparar una estimacin del modelo logit
con una estimacin del modelo probit en
un enfoque de casos individuales, para
cuantificar el aporte de los factores
explicativos de la pobreza en los jefes de
hogar.
Luego de esta suscinta introduccin, el
segundo captulo de esta investigacin
desarrolla la fundamentacin del problema
y su sistematizacin; en el tercero se
formulan los objetivos de esta, mientras
que en el cuarto captulo mostramos el
marco terico asociado a la pobreza, cmo
esta viene definida y los mtodos para su
medicin. Adems en este se muestran
la formulacin terica de los modelos logit
y probit con variable dependiente discretadicotmica, su caracterizacin, similitudes
y diferencias, enfoques de utilizacin y los
efectos marginales asociados a cada uno
de los modelos. En el quinto captulo se
muestran las hiptesis formuladas para esta
investigacin, mientras que en el sexto
indicamos los mtodos de estimacin a
partir de los enfoques utilizados.
En el sptimo captulo se muestra de
manera general la Encuesta Nacional de
Hogares, sus objetivos y caractersticas
especficas, as como los factores
relevantes para la explicacin de la pobreza
de los jefes de hogar tomados en la
ENAHO-IV trimestre 2001. El octavo
captulo muestra los criterios de aplicacin

de los modelos logit y probit aplicados al


caso de la pobreza en el Per, partiendo
de un anlisis descriptivo-exploratorio de
algunas variables significativas como la
educacin, el estado civil, regin natural
de residencia, los aos de estudios, etc;
para luego hacer una formulacin y
desarrollo metodolgico de los modelos
en funcin a sus enfoques y factores ms
significativos, terminando con una
explicacin de los resultados obtenidos.
Los siguientes captulos hacen referencia
a las conclusiones, recomendaciones y
anexos.
No quisiera terminar esta breve
introduccin
sin
mostrar
mi
agradecimiento al Instituto Nacional de
Estadstica e Informtica por permitirme
colaborar a travs del desarrollo de esta
investigacin en avanzar ms hacia el
fortalecimiento de la cultura estadstica en
el pas, y adems, sentar las bases de la
investigacin metodolgica en el Per.
De la misma manera, las gracias infinitas a
la seora Directora Tcnica del Centro de
Investigacin y Desarrollo, Mirlena
Villacorta, por sus valorables aportes en el
desarrollo de esta investigacin, su
compresin y constante apoyo, y porque
me muestra que cada da es posible
construir desde la inteligencia y la
creatividad.
As mismo, quiero expresar mi gratitud y
reconocimiento a Luis Huamanchumo,
auditor
de
esta
investigacin
metodolgica, por sus importantsimas
apreciaciones y por su compromiso con la
labor de investigacin estadstica, desde
ya reciba las gracias infinitas. Para terminar
las gracias a Dios, a mi Familia y a mis
seres queridos.

10 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

II. FUNDAMENTACION DEL PROBLEMA

La pobreza es un fenmeno siempre


presente, en mayor o menor medida, en
todas las sociedades, razn por la cual ha
sido objeto de estudio y se han buscado
las herramientas de poltica para
enfrentarla. Existen muchas definiciones
respecto a lo que debe entenderse por
pobreza y ninguna de ellas es precisa ni
aceptada por todos, sin embargo, en
general todas las definiciones apuntan a
la situacin en que se encuentran las
personas que no disponen de los medios
(de "produccin", activos fijos,
intelectuales, sociales, culturales,
financieros y dems que permitan generar
fuentes permanentes de ingresos)
suficientes para satisfacer sus necesidades
bsicas definidas como tales para un grupo
social especfico y en un tiempo
determinado, y que permitan su desarrollo
personal y reflejen el estilo de vida de la
formacin social en su conjunto. Entre
estas necesidades figuran la alimentacin,
salud, vivienda, educacin bsica, acceso
a servicios esenciales de informacin,
recreacin, cultura, vestido, calzado,
transporte y comunicaciones, participacin
e identidad en y con la comunidad, entre
otras.
El Per es uno de los pases ms pobres
de Amrica del Sur. Una breve mirada a
cualquier listado que pretenda ordenar los
pases en funcin de su bienestar lo
demuestra. Casi la cuarta parte de los
peruanos carecen de recursos para
alimentarse adecuadamente, es decir,
viven en condiciones de pobreza extrema.

La pobreza se origina en la incapacidad


de la economa peruana para generar
suficientes empleos productivos. De los
140 mil jvenes que se integran cada ao
a la fuerza laboral urbana, menos de un
tercio obtiene un empleo adecuado y casi
el 40% est desempleado o trabajando
en algo que no implica capacitacin
alguna ni ofrece perspectivas de progreso
futuro.
Dada la complejidad del fenmeno,
existen distintas metodologas para
medirlo, tales como el mtodo de la lnea
de pobreza, el mtodo de las NBIs, el
mtodo integrado, entre otros. No
obstante, tan importante como tener una
cuantificacin rigurosa de los niveles de
pobreza y las tendencias en su evolucin
temporal y espacial, es analizar las
relaciones entre ellas y sus factores
explicativos que podran albergar opciones
de poltica para solucionarla, tales como
la educacin.

Debido a lo expuesto lneas antes, se estn


realizando estudios e investigaciones
avanzadas, pero an incipientes en el
aspecto metodolgico, sobre el rol de
factores como la posesin de activos
privados, la distribucin del ingreso, el
acceso a activos pblicos, en su explicacin
del fenmeno de la pobreza, o mejor
dicho sobre la adquisicin de tal condicin.
Investigaciones que estn orientadas y
permitan un mejor diseo e
implementacin de las polticas pblicas y

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 11

Centro de Investigacin y Desarrollo

sociales. En tal sentido queremos afirmar


que el desarrollo que se viene dando en
el mundo en muchos aspectos del
conocimiento, entre ellos en los campos
de la economa y la estadstica, permiten
explicar fenmenos a travs del desarrollo
y anlisis de enfoques cualitativos.
Con la seleccin del enfoque y la
formulacin de modelos donde la variable
dependiente cualitativa es discreta
dicotmica (2 niveles), para efectos de esta
investigacin, ser jefe de hogar pobre o
jefe de hogar no pobre; y expresada a
travs de variables o caractersticas sociales
y demogrficas que pueden poseer los
individuos (el estado civil, experiencia
educacional, categora ocupacional,
acceso a activos pblicos, etc) y el hogar
(cantidad de miembros, ingreso per cpita
mensual), podemos colaborar an ms con
explicaciones razonables a este vasto
fenmeno de LA POBREZA, constituido
en el Per actualmente por ms de la
mitad de su poblacin.
Actualmente, en nuestro pas pueden
estarse aplicando inadecuadamente
modelos con estas caractersticas, debido
a la falta de un proceso de anlisis
adecuado que determine su correcta
utilizacin y que puede responder a un
desconocimiento y una falta de
apoderamiento de las metodologas
adecuadas para su implementacin y
como consecuencia directa una correcta
explicacin de los fenmenos bajo estudio,
en donde la pobreza no se encontrara
sola, sino tambin otras manifestaciones
sociales como la situacin laboral, la
educacin, o en el campo de la medicina
para el caso de enfermedades como la
diabetes, etc.

En muchas de las investigaciones de


ndole social y demogrfica, la naturaleza
del fenmeno a indagar, en este caso la
condicin ser jefe de hogar pobre o jefe
de hogar no pobre y sus factores
determinantes de naturaleza social,
econmica y demogrfica, podran
determinar un tipo de enfoque
(proporciones muestrales u observaciones
individuales) a seguir dentro de lo que se
constituyen los modelos con variable
dependiente dicotmica y por lo tanto
utilizar los modelos logit o probit en la
explicacin de este fenmeno.
Desde la perspectiva estadstica con que
se enfoca al fenmeno de pobreza, se
puede evidenciar que no es an clara la
idea de optar por alguno de los dos
modelos (el modelo Logit o el modelo
Probit) siguiendo el enfoque de
observaciones o casos individuales, pero
que este ltimo, permitira saltar las
limitaciones que posee el enfoque de
proporciones muestrales o de clasificacin
de casos u observaciones en funcin a sus
factores determinantes de ndole social,
demogrfico, econmico, etc.
En tal sentido nos vemos en la necesidad
de proponer una metodologa de anlisis
y utilizacin de los modelos logit y probit
con variable dependiente dicotmica,
valindonos para ello de una explicacin
de la pobreza en los jefes de hogar del
Per para el ao 2001, cuantificando el
aporte de sus factores determinantes entre
ellos el nivel de educacin, los aos de
estudios, la experiencia laboral, la
condicin ocupacional, el acceso a activos
pblicos, etc; y como esta posibilita la
viabilidad de los enfoques de utilizacin
de dichos modelos y un mejor
acercamiento a su explicacin.

12 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

Para esto se analizar la informacin


recogida por La Encuesta Nacional de
Hogares (ENAHO) - IV TRIMESTRE
Condiciones de Vida Y Pobreza, realizada
por el Instituto Nacional de Estadstica e
Informtica en el ao de 2001.
2.1

En qu medida los factores


determinantes de ndole cuantitativo
como el ingreso percpita mensual, los
aos de estudios, la experiencia
laboral, la cantidad de miembros en el
hogar, etc, influyen sobre un enfoque
de proporciones muestrales del
modelo probit y la pobreza de los jefes
de hogar del Per?.

Resulta ms eficaz una estimacin del


modelo logit que una estimacin del
modelo probit en un enfoque de
observaciones individuales para
cuantificar el aporte de los factores
explicativos de la pobreza en los jefes
de hogar?.

Qu similitudes y diferencias pueden


ser encontradas en ambos modelos y
cmo pueden verse estos reflejados y
contrastados desde el caso de la
pobreza en el Per- ao 2001?

Formulacin del Problema

En qu medida una explicacin de la


pobreza en los jefes de hogar del Per se
vera beneficiada por la adopcin de un
enfoque de proporciones muestrales o por
un enfoque de observaciones individuales?
Sistematizacin del Problema

Cmo la pobreza en los jefes de


hogar del Per a travs de sus factores
determinantes de naturaleza social,
econmica y demogrfica hacen
factible el enfoque de proporciones
muestrales o el enfoque de
observaciones individuales en los
modelos logit y probit?.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 13

Centro de Investigacin y Desarrollo

14 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

III. OBJETIVOS DE LA INVESTIGACION

3.1

Objetivo General

Determinar en qu medida una explicacin


sobre la pobreza en los jefes de hogar del
Per para el ao 2001 es beneficiada
siguiendo un enfoque de proporciones
muestrales o un enfoque de observaciones
individuales.
3.2

sobre el enfoque de proporciones


muestrales del modelo probit y la
pobreza en los jefes de hogar.

Comparar una estimacin del modelo


logit con una estimacin del modelo
probit en un enfoque de casos
individuales, para cuantificar el aporte
de los factores explicativos de la
pobreza en los jefes de hogar.

Analizar las similitudes y diferencias


que puedan ser encontradas en ambos
modelos y como pueden verse estos
reflejados y contrastados desde el caso
de la pobreza en los jefes de hogar
del Per.

Objetivos Especficos

Estudiar la relacin entre los factores


determinantes de naturaleza social,
econmica, demogrfica de la pobreza
en los jefes de hogar y los enfoques
de utilizacin de los modelos logit y
los modelos probit.
Analizar el grado de afectacin de los
factores de naturaleza cuantitativa

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 15

Centro de Investigacin y Desarrollo

16 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

IV. MARCO TEORICO

4.1 BREVE FORMULACIN DEL


CASO DE LA POBREZA EN EL PER

nuestros hoy en da en pleno tercer


milenio.

4.1.1 Qu es la pobreza?

4.1.2 Enfoques y mtodos para la


medicin de la pobreza

La pobreza es una condicin en la cual


una o ms personas tienen un nivel de
bienestar inferior al mnimo socialmente
aceptado. En una primera aproximacin,
la pobreza se asocia a la incapacidad de
las personas para satisfacer sus necesidades
bsicas de alimentacin. Luego se
considera un concepto ms amplio que
incluye la salud, las condiciones de
vivienda, educacin, empleo, ingresos,
gastos y aspectos ms extensos como la
identidad, los derechos humanos, la
participacin popular, entre otros1.
En general, todas las definiciones apuntan
a la situacin en que se encuentran las
personas que no disponen de los medios
("de produccin", activos fsicos,
intelectuales, sociales, culturales,
financieros y dems) que permitan su
desarrollo personal y reflejen el estilo de
vida de la formacin social en su conjunto.
El concepto de pobreza es evidentemente
relativo y cambiante. Basta considerar las
diferencias de aquello que define a un
pobre en Suiza respecto de los satisfactores
considerados relevantes en el Per, as
como las caractersticas de la pobreza del
siglo XIX en plena revolucin industrial
versus la que presentan pases como los

1/

Existen 3 grandes enfoques para medir la


pobreza. El primero es el enfoque de la
pobreza absoluta, que toma en cuenta el
costo de una canasta mnima esencial de
bienes y servicios y considera como pobres
a todos aquellos cuyo consumo o ingreso
est por debajo de este valor.
El enfoque de pobreza relativa considera
al grupo de personas cuyo ingreso se
encuentra por debajo de un determinado
nivel. Por ejemplo, en algunos pases se
considera como pobres a todos aquellos
que tienen remuneraciones inferiores a la
mitad del ingreso promedio (Criterio
aplicado en sociedades que han logrado
erradicar la pobreza absoluta)
El enfoque de la exclusin social, de
absoluta vigencia en Europa, presta
atencin a las personas que no pueden
acceder a determinados servicios como
por ejemplo el empleo, la educacin
superior, la vivienda propia, el empleo y
otros.
Ahora dentro de lo correspondiente a los
mtodos de medicin, solo nos
centraremos en el mtodo de lnea de

INEI. Metodologas Estadsticas, Ao 1-N02 Metodologa para la medicin de la pobreza en el Per.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 17

Centro de Investigacin y Desarrollo

pobreza. Una explicacin al por qu de su


eleccin se dar a continuacin.
EL METODO
POBREZA-LP

DE

LA

LNEA

Pobreza Absoluta:
Consumo Hogar < Costo Canasta Bsica
Consumo (LPA)

DE

Este mtodo centra su atencin en la


dimensin econmica de la pobreza y
utiliza el ingreso o el gasto como medidas
del bienestar. Al determinar los niveles de
pobreza, se compara el valor per cpita
de ingreso o gasto en el hogar con el valor
de una canasta mnima denominada lnea
de pobreza.
Cuando se utiliza el mtodo de lnea de
pobreza por el consumo, se incorpora el
valor de todos los bienes y servicios que
consume el hogar, indistintamente de la
forma de adquisicin o consecucin. La
utilizacin del gasto de consumo tiene la
ventaja de que es el mejor indicador para
medir el bienestar porque se refiere a lo
que realmente consume un hogar y no a
lo que potencialmente puede consumir
cuando se mide por el ingreso. Otro
aspecto favorable es que el consumo es
una variable ms estable que el ingreso,
lo que permite una mejor condicin de la
tendencia del nivel de pobreza.
As como existen enfoques y mtodos para
medir la pobreza, existen definiciones que
nos permitirn centrar an mejor la idea
de nivel de pobreza que puede tener una
persona y/o un hogar en particular.
Pobreza Absoluta:
Comprende a las personas cuyos hogares
tienen ingresos o consumo per cpita
inferiores al costo de una canasta total de
bienes y servicios mnimos esenciales.
Lnea de Pobreza Absoluta (LPA): Es el
costo de una canasta mnima de
bienes(incluido los alimentos) y servicios.

Pobreza Extrema:
Comprende a las personas cuyos hogares
tienen ingresos o consumos per cpita
inferiores al valor de una canasta mnima
de alimentos.
Lnea de Pobreza Extrema (LPE): Es el costo
de una canasta mnima de alimentos.
Pobreza Extrema:
Consumo Hogar < Costo Canasta Bsica
Alimenticia (LPE)
Despus de mostrar, a modo general,
algunos enfoques y a grosso modo
mtodos de medicin de pobreza, que si
bien es cierto no es uno de los objetivos
explcitos de esta investigacin medirla,
pretendemos con ello guiar al lector hacia
la concepcin y formulacin de una
variable que permita clasificar a un
individuo de acuerdo a su nivel de
pobreza, en otras palabras, si este posee
o no la condicin de pobreza.
Segn Sen (1992) la medicin de pobreza
requiere realizar dos ejercicios distintos
pero interrelacionados: la identificacin de
los pobres por un lado y la agregacin por
otro. Este ltimo es el usado para obtener
indicadores resumen del nivel(incidencia)
de la pobreza. Para el caso de esta
investigacin solo realizaremos en alguna
medida el primer ejercicio.
Esto quiere decir que necesitaramos de
un mtodo de identificacin para construir
lo que ser la variable dependiente de las
estimaciones y es all donde entra a tallar
el MTODO DE LNEA DE POBREZA(LP),
definido anteriormente. Con lo cual se
define especficamente los valores que

18 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

podra tomar la variable en estudio: igual


a 1 si es un hogar pobre y 0 si es un hogar
no pobre, y como vamos a trabajar a nivel
de individuos, tomamos, 1 si fuese un Jefe
de Hogar(JH) que pertenece a un hogar
pobre y 0 si fuese un JH que no pertenece
a un hogar pobre.
Obviamente, al trabajar con esta variable
dependiente no se podr conocer la
intensidad de la pobreza2. Esta limitacin
puede ser resuelta mediante el uso de las
medidas FGT(Foster et al., 1984), que
surgen de la siguiente expresin:

FGT = H * (
1
N

zi yi
)
zi

Si a = 2, arroja un indicador de severidad


de la pobreza y que puede ser interpretado
como la suma de dos componentes: la
brecha de pobreza y la desigualdad entre
los pobres.
De acuerdo con lo anterior es posible
asignar a cada hogar un valor de intensidad
y de severidad de pobreza dado por los
supuestos acerca del parmetro a de
dichas medidas. Esta forma de proceder
requiere de mtodos de estimacin
diferentes3, que no es motivo de estudio
en este trabajo.

ECUACIN IV.1

LOS ACTIVOS DE LOS POBRES EN EL


PER4

Donde: Yi es el ingreso de la i-sima


familia u hogar, Zi es la lnea de pobreza
de ese hogar y a el parmetro de aversin
a la pobreza.

Tanto la distribucin del ingreso como los


niveles de pobreza han registrado
importantes modificaciones a lo largo de
las ltimas cuatro dcadas en el Per. Ms
all de las diferencias metodolgicas
asociadas al clculo de estos indicadores,
la evidencia sugiere que en los ltimos 40
aos se habra reducido la dispersin en la
distribucin del ingreso. Asimismo, se
habra producido una importante reduccin
en los niveles de pobreza.

Entonces, si a = 0 obtenemos, el
porcentaje de pobres .
Si a = 1,obtenemos lo concerniente a
Brecha de Pobreza.

zi yi
1
)
FGT 1 = H * (
N
zi

Este es el denominado poverty gap de


profundidad o intensidad de la pobreza.
A diferencia del anterior, esta medida
muestra la brecha existente entre el
ingreso de los hogares pobres y la lnea
de pobreza.

De otro lado, un anlisis de la distribucin


de activos durante los ltimos 10 aos
revela en general una continuacin de las
tendencias de largo plazo. El nivel
educativo medio sigue aumentando y la
desigualdad en el acceso a educacin es
cada vez ms baja. En cambio, en el caso
de los servicios pblicos, si bien el acceso

2/ En trminos de Sen (Sen, 1976), ante la necesidad de obtener una medida agregada de la pobreza, H, ocurre que no se
satisfacen los axiomas de monotonicidad y transferencia. El primero establece que toda medida de pobreza bien conformada
debe reflejar las variaciones del ingreso de los hogares situados por debajo de la LP. El segundo, que la medida de pobreza
debe ser sensible a las transferencias de ingresos entre pobres y no pobres.
3/ Paz, Jorge. La pobreza en Argentina: una comparacin entre regiones dismiles. Unas, 2001.
4/ Escobal, Javier; Saavedra, Jaime; Torero, Mximo. Los Activos de los pobres en el Per. GRADE. 1998.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 19

Centro de Investigacin y Desarrollo

medio ha ido aumentando, los niveles de


desigualdad siguen siendo muy elevados.
Asimismo, el acceso al crdito es muy
diferenciado segn los quintiles de gasto,
mientras que el ahorro y los bienes
financieros durables, que son activos que
pueden fungir como colaterales, estn
entre los activos peor distribuidos.
Asimismo, reducciones en el tamao de
la familia tienen un impacto positivo y
significativo sobre los activos privados. En
ese sentido, la concepcin que un mayor
tamao de la familia implica un aumento
de los recursos productivos de la familia,
y por lo tanto un mayor bienestar, no
encuentra sustento terico.
Debido a la multidimensionalidad de la
pobreza, su anlisis a travs de los jefes
de hogar en funcin a sus factores de
ndole cualitativo y cuantitativo, en el
primer caso reflejado a travs de posesin
de activos privados como su nivel de
educacin, su condicin ocupacional y
tamao de la empresa donde trabaja, si
posee algn otro empleo, y la influencia
de aquellos factores inseparables de su
hogar y tambin de naturaleza cualitativa,
como el acceso a activos pblicos como
agua y desage dentro de la vivienda, si
algn lugar dentro de la vivienda es
destinada para obtener ingresos juega un
papel fundamental.
Dentro de factores de naturaleza cualitativa
tambin resulta importante considerar la
regin y rea natural de procedencia del
jefe de hogar como factor preponderante
para su condicin de pobreza.
Con respecto a los factores de naturaleza
cuantitativa propios del jefe de hogar son
considerados los aos de estudios, su

indicador proxy de experiencia laboral y


su edad como aquellos que pueden
determinar su condicin. En la misma lnea,
factores correspondientes al hogar son la
cantidad de miembros en el hogar, ingreso
per cpita mensual, la cantidad de personas
en edad de trabajar, seran aquellos que
determinan una mayor probabilidad de ser
pobre.

4.2.

LOS MODELOS LOGIT Y PROBIT


CON VARIABLE DEPENDIENTE
DICOTMICA (VDD)

4.2.1. Modelos con Variable


Dependiente Dicotmica (VDD).
En muchas situaciones, el fenmeno que
queremos estudiar no es continuo, sino
discreto. Por ejemplo, cuando queremos
modelar la participacin del mercado de
trabajo, la condicin de pobreza de un Jefe
de Hogar, la decisin sobre si se hace una
compra o no. En el caso de la condicin
de pobreza existen estudios que sugieren
que factores como la educacin, la edad,
el nmero de hijos y ciertas caractersticas
econmicas, sociales, demogrficas, etc;
que podran ser relevantes para explicar si
un individuo Jefe de Hogar est ms
afecto a adquirir la condicin de pobreza.
Pero, obviamente, algo falta si se aplica
en este caso el mismo tipo de modelo de
regresin que utilizbamos para analizar
el consumo o los costes de produccin, o
algn otro fenmeno de naturaleza
cuantitativa.
Vamos a analizar algunos modelos
conocidos como modelos de respuesta
cualitativa (RC), y lo que podemos
mencionar es que tienen en comn que

20 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

su variable dependiente es discreta, es


decir puede tomar valores como "no" o
"s" que pueden ser codificados como "0"
"1"; o quizs ms valores "0", "1", "2"
segn sus categoras, para representar los
resultados cualitativos respectivos.
Pero reflejemos esto en ejemplos
concretos, el tipo de variable dependiente
y el fenmeno en estudio:

Participacin en el mercado de
trabajo: Donde 0 es "no" y 1 significa
"s", donde la participacin es Var.
Dependiente nominal dicotmica, y se
representa con 0 y 1 por comodidad.

Opinin sobre cierto tipo de


legislacin: Donde
0 sera "totalmente opuesto"
1 para "opuesto"
2 para "indiferente"
3 para " a favor"
4 para "totalmente a favor"
Aqu vemos que se ordenan las
respuestas no en funcin a su valor
cuantitativo, sino por una cuestin de
grado en la respuesta, en donde la
OPININ es Var. Dependiente
Ordinal.

rea de trabajo escogida por un


individuo: Donde 0 es representar al
vendedor, 1 para ingeniero, 2 para
abogado, 3 para poltico, y as
sucesivamente, y es de all que
podemos mencionar que AREA DE
TRABAJO es Var. Dependiente
nominal politmica5.

En ninguno de estos casos parece posible,


en principio, utilizar el anlisis de regresin
clsico. Sin embargo, en todos ellos es
posible construir modelos que enlacen el
resultado o la decisin a tomar a travs de
su aporte en la probabilidad de la
realizacin del fenmeno bajo estudio; con
un conjunto de factores, con la misma
filosofa que en regresin. Entonces lo que
se hace es analizar cada uno de estos
modelos dentro de un marco general de
LOS MODELOS DE PROBABILIDAD.
Pr(Ocurre suceso j) = Pr(Y=j) =
F(efectos relevantes: parmetros)

Resulta conveniente agrupar estos


modelos en dos grandes clases: aquellos
que siguen un enfoque binomial, es
decir, si el resultado o fenmeno depende
de la eleccin o la situacin en dos
alternativas. Para ello podemos mencionar
al respecto; que si tenemos a cada uno
de N individuos, casos u objetos que
pueden
ser
clasificados
independientemente en 1 de 2 categoras
complementarias, ejemplo de ello puede
ser cara o sello de un lanzamiento de
monedas, pacientes curados o no curados,
personas por sobre o debajo de un nivel
de ingreso, etc. En este caso se tiene que
cada individuo tiene la misma probabilidad
p de estar en una de las dos categoras,
por ejemplo si el Jefe de Hogar es pobre
(0 p 1); y la prob. 1-p de encontrarse
en la otra categora complementaria, es
decir, si el Jefe de Hogar no es pobre.
Entonces la probabilidad de que X de los
N individuos sean pobres es:

5/ Variable nominal politmica, es aquella que en sus categoras no denota ningn tipo de ordenamiento ni grado especfico,
otro ejemplo de ello lo constituye el estado civil (soltero, casado, viudo, conviviente, etc).

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 21

Centro de Investigacin y Desarrollo

Donde x=0,1,2,3...N.

4.2.2. Formulacin del modelo logit


y el modelo probit con variable
dependiente dicotmica (VDD)


P[ X = x] = px (1 p)N x
x
N

ECUACIN IV.2

As como existen en los modelos el


enfoque binomial, existe asimismo el
enfoque multinomial, que es aquel que
depende de una eleccin o resultado de
ms de 2 alternativas y que pueden
reflejarse en algunos de los ejemplos
mencionados lneas antes y que resultan
en algunos aspectos novedosos pero que
son, en su mayor parte, extensiones de
los casos binomiales.
Queremos dejar en claro aqu que en esta
investigacin el enfoque que seguir el
modelo ser de tipo binomial, porque
plantear uno de tipo multinomial
implicara, que los diversos niveles de
condicin de pobreza (no pobre, pobre y
pobreza extrema), se encontraran a un
mismo nivel de seleccin, vale decir, que
en el caso de pobreza absoluta y pobreza
extrema tendran que considerarse como
grupos excluyentes uno del otro, lo cual
no se da en este caso, pues la pobreza
extrema es una condicin mucho ms
precaria en todo aspecto que la pobreza
absoluta . Es este entonces nuestro punto
de partida para poder determinar y
cuantificar el aporte de las variables o
factores que inciden sobre la probabilidad
que un jefe de hogar se encuentre en
condicin de pobreza. En tal sentido los
modelos que ms se adecuan en esta lnea
son el modelo logit con variable
dependiente discreta dicotmica (a partir
de ahora, VDD) y el modelo probit con
VDD.

Empezaremos esta formulacin a partir de


la suposicin de un modelo de
probabilidad de condicin de pobreza para
Jefes de Hogar (JH), donde:
Y=1 El JH se encuentra en condicin de
pobreza
Y=0 El JH no se encuentra en condicin
de pobreza.
Vamos a suponer que un vector de
variables explicativas o conjunto de
factores que expliquen este fenmeno
venga dada por:
X= Nivel de Educacin, Analfabetismo,
Dominio Geogrfico, Experiencia,
Estado Civil, Categora Ocupacional,
etc.
Podemos imaginar que la primera idea
intuitiva que gira alrededor del fenmeno
de la condicin de pobreza es que esta
podra ser explicada a travs del conjunto
de factores mencionados, y cunto es que
estos contribuyen individual y en forma
conjunta a dicho fenmeno.
Entonces, autores como Green plantean
la siguiente idea:
Sea:
La probabilidad de que el Jefe de Hogar
sea pobre:

P [Y = 1] = F ( X , )

22 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

ECUACIN IV.3

Centro de Investigacin y Desarrollo

Y la probabilidad de que el Jefe de Hogar


no sea pobre:

P[Y = 0] = 1 F ( X , )
Donde el vector de parmetros(b) refleja
el aporte o impacto que X (vector de var.
explicativas) tiene como parte de la funcin
de distribucin acumulada sobre la
probabilidad. Por ejemplo uno de los
factores que podra interesarnos sera ver
el efecto que el nivel de educacin tiene
sobre la probabilidad de ser pobre.
A partir de este punto la incgnita cae
sobre el lado derecho de dicha ecuacin
y sobre cmo plantear un modelo
adecuado para este.
Una solucin a ello puede darse en un
modelo de regresin lineal.

F ( X , ) = X
ECUACIN IV.4

Tenemos que:

E(Y / X ) = 0*Pr(Yy = 0) + 1*Pr( y = 1)


E (Y / X ) = F ( X , )
A partir de lo anterior podemos construir:
Y = y = E[y/x] + [y-E[y/x]]
= F(x,b) + e

Y=

bX + e

Modelo de Probabilidad Lineal.

ECUACIN IV.5

Pero este modelo de probabilidad lineal


presenta algunos incovenientes:
(i) e presenta heterocedasticidad que
depende de b, esto es si:
Y= 0 -> bX + e=0 -> e= -bX ,
donde p(y=0)= 1-F
Y= 1 -> bX + e=1 -> e= 1-bX,
donde p(y=1)= F
Entonces tendramos que
V(e) = (-bX) (1-bX)
ECUACIN IV.6

(ii) El incoveniente ms serio es que no


se puede asegurar que las predicciones
parezcan verdaderas probabilidades. No
se puede restringir bX al intervalo
[0,1], lo cual origina tanto varianzas
negativas como probabilidades
imposibles.
Entonces para un vector de regresores
dado, esperaramos que [Grfico IV.1]:

Grfico IV.1

Lim x>+ Pr(Y = 1) = 1


Lim x> Pr(Y = 1) = 0
bX

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 23

Centro de Investigacin y Desarrollo

Analizando el grfico anterior, vemos que


para los requisitos especificados
anteriomente, en principio bastara trabajar
con una Funcin de Distribucin
Acumulada definida sobre la recta real, en
tal sentido las funciones idneas para tal
efecto vienen a ser la Normal y la Logstica.
Es natural ahora preguntarse Cul de las
dos debe usarse?, la respuesta a esa
pregunta y otras que se han empezado a
formar, van a ir siendo resueltas en la
medida de lo posible en la secciones
siguientes.
Supongamos ahora que en vez de utilizar
la funcin lineal de probabilidad de X para
caracterizar esta condicin, utilizamos una
funcin montona [F(bx )] creciente del
producto bx, es decir, variables explicativas
y aportes. Esta formulacin es ms general
que la del modelo lineal de probabilidad
y, en consecuencia, el procedimiento de
estimacin de los parmetros as como la
forma en que dichos valores deben
interpretarse, es ahora diferente.
-

Al usar esta transformacin, podemos


ver que basta tomar una funcin real F
acotada entre 0 y 1 para que el
problema que se originaba sobre el
rango de las probabilidades
desaparezca. En efecto, ahora vemos
que P = F(bx) est siempre entre 0 y
1, con independencia de los valores
que toman los factores explicativos y
sus efectos marginales. Es por ello que
las funciones de distribucin de
variables aleatorias son candidatos
importantes a ser elegidas para estas
transformaciones.
Suponga que existe un indicador que
depende de las caractersticas

individuales: Ii=bx , que determina


la decisin tomada para cada individuo
o la condicin que este posee frente a
un fenmeno dado. Es decir, el
individuo toma la decisin o se
encuentra en el estado Yi=1 si el valor
de su indicador es superior a un cierto
valor crtico I*, y la decisin contraria
o se encuentre en el otro estado si
Yi=0. Es decir, el indicador Ii refleja el
sentimiento del decisor frente a la
opcin indicada Yi=1, de modo que
si su predisposicin, indicada por Ii es
suficientemente grande (mayor que
Ii*), escoge dicha opcin, y si no,
elegir la opcin alternativa.
Por ser desconocido, consideramos el
valor crtico I* del indicador para cada
individuo como una variable aleatoria.
Entonces de acuerdo con esta
interpretacin, la probabilidad de que
el individuo i-simo elija o posea la
condicin Yi=1 viene dada por:

Pi = P(Yi = 1) = P(Ii* Ii ) = F (x)


ECUACIN IV.7

Donde F es la distribucin de
probabilidad de la variable aleatoria I*.
4.2.3. Caracterizacin de los modelos
logit y probit aplicados al caso
de la pobreza en el Per.
4.2.3.1. El Modelo Logit
Supongamos el siguiente ejemplo, se tiene
que Y (1 = jefe de hogar pobre, 0 = jefe
de hogar no pobre) en funcin al ingreso
familiar X(S/.) para un conjunto de familias.
Se tiene la siguiente representacin de la
condicin de pobreza:

24 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

Pi = E( y = 1/ Xi) =

Por consiguiente, se puede escribir

1
1+ e( 1+ 2 X )
ECUACIN

IV.8

Para facilidad de la exposicin, se escribe


[ECUACIN IV.8] como:

Pi = E( y = 1/ Xi) =
donde

i = ( 1 +

1
( 1+ 2 X )

1+ e
2X )

ECUACIN IV.9

La [ECUACIN IV.9] representa lo que


se conoce como funcin de distribucin
logstica (acumulativa). Es fcil verificar que
a medida que Zi se encuentra dentro de
un rango de - a + , Pi se encuentra
dentro de un rango 0 a 1 y que Pi no est
linealmente relacionado con Zi (es decir
con Xi), satisfaciendo as requerimientos
que son considerados. Pero parece que al
satisfacer estos requerimientos se ha
creado un problema de estimacin porque
Pi es no lineal no solamente con X sino
tambin en los , como puede verse
claramente a partir de la [ECUACIN
IV.8]. Esto significa que no se puede utilizar
el procedimiento familiar MCO para
estimar los parmetros. Pero este problema
es ms aparente que real porque la
[ECUACIN IV.8] es intrnsecamente
lineal, lo cual puede verse de la siguiente
manera.
Si Pi, la probabilidad de ser jefe de hogar
pobre, est dada por la [ECUACIN IV.9]
entonces (1 - Pi), la probabilidad de jefe
de hogar no pobre.

1 Pi =

1
1 + e Zi

ECUACIN IV.10

Pi
1 + eZi
=
= eZi
Zi
1 Pi 1 + e

ECUACIN IV.11

Ahora Pi / (1-Pi) es sencillamente la razn


de probabilidades (Odds Ratio) a favor
de ser jefe de hogar pobre- la razn de la
probabilidad de que un jefe de hogar sea
pobre a la probabilidad de que no sea
pobre. As, si Pi = 0.8, significa que las
probabilidades son 4 a 1 a favor de que el
jefe de hogar sea pobre.
Ahora, si se toma el logaritmo natural de
[ECUACIN IV.11], se obtiene un
resultado muy interesante, a saber,

Pi
Li = ln
= Zi = 1 + 2 X
1 Pi
ECUACIN IV.12

es decir, Li, el logaritmo de la razn de


probabilidades no es solamente lineal en
Xi, sino tambin (desde el punto de vista
de estimacin) lineal en los parmetros, L
es llamado Logit y de aqu el nombre
modelo LOGIT para modelos como la
[ECUACIN IV.12].
Obsrvense estas caractersticas del
modelo Logit:
(a) A medida que P va de 0 a 1 (es decir,
a medida que Z vara de - a + , el
Logit L va de - a + ). Es decir,
aunque las probabilidades (por
necesidad) se encuentran entre 0 y 1,
los Logit no estn limitados en esa
forma.
(b) Aunque L es lineal en X, las
probabilidades en s mismas no lo son.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 25

Centro de Investigacin y Desarrollo

Esta propiedad hace contraste con el


modelo de MPL, en donde las
probabilidades aumentan linealmente
con X.
(c) La interpretacin del modelo Logit es
el siguiente:

2 , la pendiente, mide

el cambio en L ocasionado por un


cambio unitario en X, es decir, dice
como el logaritmo de las
probabilidades a favor de ser jefe de
hogar pobre cambia a medida que el
ingreso cambia en una unidad, por
ejemplo de S/. 100. El intercepto

x = 1 ( P )
La probabilidad correspondiente a un
vector X de factores que contribuyen a
explicar un fenmeno, como el de la
pobreza es ahora:

P =

es el valor del logaritmo de las


probabilidades a favor de ser jefe de
hogar pobre si el ingreso es cero.
(d) Dado un nivel determinado de
ingresos, por ejemplo, X, si realmente
se desea estimar la probabilidad misma
de ser jefe de hogar pobre, y no las
probabilidades a favor de ser jefe de
hogar pobre , esto puede hacerse
directamente a partir de la
[ECUACIN IV.8], una vez que se
disponga de las estimaciones de

De modo que:

1 y 2.

(e) Mientras que el MLP supone que Pi


est linealmente relacionado con Xi,
el modelo Logit supone que el
logaritmo de la razn de probabilidades
est relacionado linealmente con X.
4.2.3.2. EL MODELO PROBIT
Si se elige como funcin F la funcin de
distribucin f de una variable normal (0,1),
se tiene:

P = E( y / x) = P(Y =1/ x) = P[I* I ] =(x)


ECUACIN IV.13

1
2

t2

dt

ECUACIN IV.14

Como se ha podido apreciar


anteriormente, para explicar el
comportamiento de una variable
dependiente dicotmica, es preciso utilizar
una FDA seleccionada apropiadamente. El
modelo Logit utiliza la funcin distribucin
logstica acumulativa. Pero esta no es la
nica FDA que se puede utilizar. En
algunas aplicaciones, la FDA normal se ha
encontrado til. El modelo de Estimacin
que surge de una FDA normal es
comnmente conocido como el modelo
Probit, aunque algunas veces tambin es
conocido como el modelo normit. En
principio, se puede sustituir la FDA normal
por la FDA logstica y proceder de acuerdo
al modelo Logit. Pero en lugar de seguir
este camino se presentar el modelo probit
basado en la teora de utilidad o de la
perspectiva de seleccin racional con base
en el comportamiento, segn el modelo
desarrollado por McFadden.
Para motivar el modelo Probit supngase
el ejemplo de condicin de pobreza, la
posesin del i-simo jefe de hogar de la
condicin de pobreza o de no poseerla,
medida a travs de un ndice imperfecto

26 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

de conveniencia Ii que est determinado


por una o varias variables explicativas, por
ejemplo, el ingreso Xi, de tal manera que
entre mayor sea el valor del ndice, mayor
ser la probabilidad de que el jefe de hogar
sea pobre. Se expresa el ndice Ii, como:

Ii = 1 + 2 Xi
ECUACIN IV.15

la cual depende nuestra variable


observable.
Dado el supuesto de normalidad, la
probabilidad de que Ii* sea menor o igual
que Ii, puede ser calculada a partir de la
FDA normal estndar como:

Pi = Pr(Y = 1) = Pr( Ii* Ii) = F ( Ii) =

2
1+ 2 Xi t 2
i
Cmo se relaciona el Ii, ndice imperfecto
1 I 2t
1
e dt =
e 2 dt
de conveniencia con la condicin =
2
2
especfica de ser pobre? Sea Y=1 si es
jefe de hogar pobre y Y=0 si no es. Ahora
ECUACION IV.16
bien, es razonable suponer que para cada
individuo hay un nivel crtico o umbral
del ndice, que se puede denominar Ii*, donde t es una variable normal
estandarizada, es decir, t N(0,1).
tal que si Ii excede a Ii*, el jefe de hogar
es pobre, de lo contrario no lo es. El nivel
Puesto que Pi representa la probabilidad
crtico Ii*, al igual que Ii, no es observable,
y se supone que est distribuido de que ocurra un evento, en este caso la
probabilidad de poseer la condicin de
normalmente con la misma media y
varianza, y por lo tanto es posible no pobreza, sta se mide por el rea de la
curva normal estndar de - a Ii, como se
solamente estimar los parmetros del
ndice, sino tambin obtener alguna muestra en la figura siguiente [GRAFICO
informacin sobre el ndice imperfecto de IV.2]:

Grfico IV.2

Pi

Pr( Ii * Ii )

Ii = 1 + 2 X

Pi

I i = F 1 ( P i )

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 27

Centro de Investigacin y Desarrollo

Ahora, para obtener informacin sobre Ii,


el ndice de utilidad, lo mismo que para
los coeficientes estimados se toma la
inversa de [ECUACIN IV.7] para obtener:

obtendra el valor de Ii, dado el valor de


Pi, es decir, evaluar la probabilidad en la
inversa de la FDA Normal.

Ii = F 1 ( Pi) = 1 + 2 Xi

4.2.3.3. Similitudes y diferencias en


ambos modelos

ECUACIN IV.17

Donde

Podemos ver que la distribucin logstica :


es similar a la distribucin normal, excepto
por sus colas, (la distribucin Logstica se
parece ms a la distribucin t con siete
grados de libertad).

F 1 es la inversa de la FDA

normal. El significado de todo esto puede


aclararse con la figura anterior [GRFICO
IV.2], donde en la figura del lado izquierdo
se obtiene (de la ordenada) la probabilidad
(acumulada) de ser jefe de hogar pobre
dado Ii* menor o igual que Ii, mientras
que en la parte derecha (de la abcisa) se

Analicemos la siguiente grfica [GRFICO


IV.3], que compara ambas funciones de
distribucin.

Grfico IV.3

-20

-10

La FDA Normal es aquella grfica


alrededor(______) de la recta real ms
gruesa y la recta de segmentos (--------)
viene a ser la FDA Logstica y el eje vertical
se desplaza entre 0 y 1.
De aqu podemos empezar a analizar cada
una de las 3 regiones formadas:

10

20

La PRIMERA REGIN, la inferior


izquierda, muestra que para el
fenmeno en estudio Y=1, por
ejemplo: si el Jefe de Hogar es pobre,
las estimaciones del modelo Logit
produciran mayores contribuciones
para la probabilidad de ser pobre en
funcin a sus factores explicativos, que
el modelo probit.

28 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

La SEGUNDA REGIN, la central,


muestra que las 2 distribuciones
generan estimaciones similares, es ms
autores como Amemiya dan un
intervalo de variacin para dichas
estimaciones similares < -1.2, 1.2 >.

La TERCERA REGIN, la superior


derecha, muestra que el modelo probit
generara mejores estimaciones de los
aportes de las variables en la
probabilidad de ser pobre que el
modelo Logit.

Debemos hacer nfasis en que ambos


modelos presentan muchas similitudes
con respecto a su representacin de
probabilidad, visiblemente apreciable en
la grfica anterior, y con respecto a sus
estimaciones en la mayora de aplicaciones
parece que se llega a los mismos resultados
partiendo de una aplicacin u otra.
Es de conocimiento que cabe esperar que
los 2 modelos originen predicciones o
aportes diferentes en los factores si la
muestra contiene:

Pocas respuestas afirmativas (Y=1), es


decir, pocas observaciones para JH
(Jefe de Hogar) en condicin de
pobreza; y del mismo modo, pocas
respuestas para (Y=0), vale decir,
pocas observaciones para JH en status
de no pobreza
Gran variacin en una variable
independiente de importancia,
especialmente si se cumple lo
mencionado en el prrafo anterior, por
ejemplo: presentar una variacin
considerable con respecto a los niveles
de educacin de los JH de la poblacin
en estudio.

Por sencillez de clculo pueden existir


razones prcticas para preferir una u otra
distribucin; pero desde el punto de vista
terico resulta difcil justificar esta eleccin.
Amemiya (1981) analiza varios aspectos
relacionados con esta cuestin pero, en
trminos generales, puede decirse que
este problema no se ha resuelto an.
Los efectos marginales en ambos
modelos
Hay que considerar que el modelo de
probabilidad es un modelo de regresin:
E[y/x] = 0*[1-F(bX)] + 1*[F(bX)]
= [F(bX)]
Y que sea cual fuere la distribucin que
se utilice, es importante observar que los
parmetros (bX) del modelo, como los
de cualquier modelo de regresin no
lineal, no son necesariamente los efectos
marginales comunes analizados.
E[ y / x] dF(x)
=
= f (x)
x
d (x)
ECUACIN IV.18

Donde f(.) es la funcin de densidad


asociada a la Funcin de distribucin F(.).
Para la distribucin normal:

E [ y / x ]
= ( x )
x
ECUACIN IV.19

Siendo f(bx) la funcin densidad normal


estndar.
Para el caso de la distribucin logstica:

d [ x ]
e x
=
d ( x )
(1 + e x ) 2
ECUACIN IV.20

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 29

Centro de Investigacin y Desarrollo

Lo que es sumamente prctico. As en el


modelo logit.

E[ y / x]
= ( x)[1 ( x)]
x
ECUACIN IV.21

Para interpretar el modelo estimado,


resulta til calcular estos efectos
marginales en varios valores de x: por
ejemplo en las medias de los regresores
o en otros puntos que puedan resultar de
inters.

Los modelos de variable dependiente


discreta aparecen con frecuencia como
modelos con funcin ndice, es decir,
interpretamos el resultado de una eleccin
discreta como un reflejo de una regresin
subyacente. Pero el significado de esto lo
entenderemos a travs de un ejemplo:
Supongamos que tenemos que tomar una
decisin para hacer una compra
importante.
Teora: Consumidor hace clculo Beneficio
marginal - Coste marginal : Obtener una
utilidad y tomar una decisin..

Grfico IV.4

BENEFICIO

REALIZA COMPRA

DECISIN COMPRA
IMPORTANTE

UTILIDAD
EMPLEA DINERO
OTRA COSA

COSTE

Podemos apreciar que el beneficio


marginal es evindentemente no observable
(no tangible), modelizamos la diferencia
entre beneficio y coste con una variable
no observable y cumple.

y* = x +
ECUACIN IV.22

Suponemos que la distribucin de


N (0,1) Logstica, entonces, no

se observa el beneficio neto de la compra,
slo si esta se hace o no.
Y=1
Y=0

si Y*>0
si Y*0

(*)

Donde bX, recibe el nombre de funcin


ndice.
Cabe recalcar que se deben considerar
algunos aspectos en la construccin de (*):

Primero: La hiptesis de varianza


unitaria es una normalizacin que no
juega ningn papel importante.
Supongamos que la varianza de es
en realidad 2 y multipliquemos
entonces los coeficientes por .
Nuestros datos observados no varan:
y es 0 1, dependiendo nicamente

30 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

del signo de y*, no de la escala en


que se midan los datos.

Segundo: La hiptesis de que el


umbral es 0, tampoco juega ningn
papel si el modelo contiene trmino
constante6.

La probabilidad del suceso Y=1, jefe de


hogar pobre, se puede ver como sigue:

Pr( y* 0) = Pr( x + 0) =
Pr( x) = 1 F ( x)

observando la respuesta de ni individuos,


todos ellos con la misma xi. La variable
dependiente observada ser la proporcin
(Pi) de los ni individuos ij para los cuales
yij = 1. Una observacin es por tanto [ ni,
Pi, xi], i = 1,...,N. Los datos electorales
constituyen un ejemplo tpico8. En el caso
de datos dados en forma agrupada, pueden
analizarse la relacin entre Pi y xi no slo
utilizando los estimadores de mxima
verosimilitud, sino tambin mtodos de
regresin. La proporcin observada Pi, es
un estimador de la cantidad poblacional

i = F ( xi ) . Si consideramos esta

Si la distribucin es simtrica7, como lo


son la normal y la logstica.

Pr( y * 0) = Pr( x ) = F ( x )
De este modo se habra obtenido un
modelo estructural para la probabilidad y
como esta depende de la FDA Normal o
Logstica.

Anlisis de datos a travs


proporciones muestrales

de

Cuando se analizan respuestas binarias, los


datos vendrn dados de una de las dos
formas siguientes: o bien, tal y como se
ha considerado hasta ahora, de forma
individual (es decir, cada observacin est
formada por la respuesta del individuo y
un vector de regresores asociados a l
[Yi, Xi ]), O bien de forma agrupada (es
decir, los datos consisten en proporciones
o recuentos de observaciones). Los datos
en forma agrupada se obtienen

igualdad como un sencillo problema de


muestreo en una poblacin Bernoulli,
utilizando los resultados bsicos de
estadstica obtenemos que:

Pi = F ( xi ) + i = i + i
E ( i ) = 0 , Var ( i ) =

, siendo

i (1 i )
ni

Este formato de regresin heterocedstica


sugiere que los parmetros podran
estimarse utilizando una regresin de
mnimos cuadrados ponderados no
lineales. Para no detallar ms podemos
decir que este anlisis y su estimacin
correspondiente ser abordada en las
secciones
posteriores
de
esta
investigacin. Lo que podemos mencionar
por ahora es que en la prctica surgen dos
complicaciones con respecto a los errores
en este enfoque. Primero, cuando la
proporcin se calcula utilizando una
muestra de gran tamao, la varianza del
estimador puede llegar a ser sumamente
pequea. Ello originar que en la regresin

6/ Ha no ser que haya poderosas razones, los modelos binomiales deben incluir constante (Green)
7/ En distribuciones simtricas se tiene que: 1 - F(bX) = F(-bX)
8/ Los estudios iniciales sobre modelos probit se desarrollaron en laboratorios. Cada observacin consista en n individuos que
i
reciban una cierta dosis x , la proporcin P respondan al tratamiento. Vase Finney (1971) y Cox (1970).
i

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 31

Centro de Investigacin y Desarrollo

de mnimo chi-cuadrado los errores


estndar sean inverosmilmente pequeos
y los estadsticos t enormemente grandes.
Por desgracia, todo esto es consecuencia
de la estructura del modelo. A los mismos
resultados se llega si se estima por mxima
verosimilitud con datos de proporciones.
Segundo, es imposible obtener tanto el
estimador de mxima verosimilitud como
algn otro relacionado, si una de las dos
proporciones es 0 1. Se han sugerido
varias posibles soluciones especficas para
este caso, la que con ms frecuencia se

utiliza consiste en sumar o restar un valor


constante pequeo, por ejemplo, 0.001,
al valor observado cuando ste sea 0 1.
De lo anteriormente expresado, en esta
investigacin se tratar de desarrollar una
metodologa que permita cuantificar el
aporte de los factores asociados a la
pobreza con su correspondiente
probabilidad de ser pobre para el jefe de
hogar en los modelos Logit y Probit con
variable dependiente dicotmica,
utlizando criterios de enfoque a nivel
terico y prctico.

32 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

V. HIPOTESIS DE INVESTIGACIN

Los factores de naturaleza cuantitativa


como el ingreso per cpita mensual del
hogar expresado a travs de sus dciles
de ingreso, los aos de estudios del
jefe hogar, etc, generan un modelo
correctamente ajustado a la
probabilidad de ser pobre de los jefes
de hogar expresado a travs de su
estadstico de bondad de ajuste
pearson c2 dejando de lado las
limitaciones del tamao de muestra,
en el enfoque de proporciones
muestrales del modelo probit.

Los factores explicativos de la pobreza


en los jefes de hogar de naturaleza
cualitativa y cuantitativa exclusivos de
estos como el nivel de educacin, el
tipo de colegio de estudio, la categora
ocupacional, el tamao de la firma

donde labora, la tenencia de otro


empleo, el estado civil, su edad, su
indicador de experiencia laboral; en
combinacin con los factores de
naturaleza cualitativa y cuantitativa
exclusivos del hogar como el indicador
de si el hogar dedica un espacio del
hogar a generacin de ingresos, la
cantidad de miembros en el hogar, la
cantidad de miembros pertenecientes
a la PET, el ingreso per cpita mensual,
el acceso a activos pblicos de agua y
desage, no permiten generar modelos
correctamente ajustados a la
probabilidad de ser pobre del jefe de
hogar siguiendo el enfoque de
observaciones individuales o no
clasificacin en los modelos logit y
probit.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 33

Centro de Investigacin y Desarrollo

34 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

VI. METODOS

6.1 Tratamiento de Errores en la


adecuacin de ambos modelos,
anlisis de factores explicativos
observables y no observables
Casi todos los modelos de eleccin binaria,
excepto el modelo de probabilidad lineal,
se estiman habitualmente por el mtodo
de mxima verosimilitud. Cada
observacin se considera como realizacin
individual de una variable aleatoria con
distribucin Bernoulli (es decir, binomial
con n=1). La probabilidad conjunta o
funcin de verosimilitud, de un modelo
con probabilidad de xito F( bX) y
observaciones independientes es:

Pr(Y1 = y1, Y2 = y2, ..., Yn = yn) =


Pr(Y1 =1, Y 2 = 0, ..., Yi =1, .., Yn = 0)
= [1 F(xi)]F(xi)
yi=0

Podemos reescribir la frmula anterior


como:
n

[ F ( x )]

yi

[1 F ( x )]1 y i

i =1

ECUACIN VI.2

Esta es la funcin de verosimilitud para una


muestra de n observaciones.
n

ln L = [ yi ln F (xi) + (1 yi)ln(1F (xi))] 9


i =1

ln L
=

y if i

F
i =1

+ (1 y i )

fi
xi = 0
(1 F i )
ECUACIN VI.3

En la ecuacin anterior y en lo que sigue,


se utilizar el subndice i para indicar que
la funcin se evala en bX, es decir, en
el conjunto de factores explicativos al
fenmeno. Al seleccionar una forma
concreta para Fi se obtiene un modelo
emprico.
A menos que se utilice el modelo de
probabilidad lineal, las ecuaciones
contenidas en la frmula anterior sern no
lineales y habrn de resolverse de modo
iterativo.

yi=1

ECUACIN VI.1

L=

Las condiciones de primer orden del


problema de maximizacin requieren que

6.1.1 Los mtodos de estimacin


segn enfoques
MODELO PROBIT
Estimacin de mnimos cuadrados con
enfoque de proporciones muestrales
El modelo original relaciona las frecuencias
observadas pi, con las probabilidades (Pi)
que resultan de las clasificaciones de los
factores explicativas, por ejemplo el
ingreso per cpita mensual, por medio de:

9/ Como vimos hace un momento en distribuciones simtricas 1-F(bx)=F(-bx). Definiendo q=2y-1, entonces lnL=SlnF(qbx).

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 35

Centro de Investigacin y Desarrollo

pi = ( Pi + ui )

Estimacin de mxima verosmilitud


para observaciones individuales

por lo que

1 ( pi ) = 1 ( Pi + ui )
De aqu esta expresin pude aproximarse
por:

1 ( pi ) Xi ` +

1
ui
f ( Xi ` )

El modelo probit puede por tanto


estimarse de modo aproximado por una
regresin de los llamados "probits"
muestrales 1 ( pi ) sobre el vector Xi.
Se trata de calcular las frecuencias
muestrales pi, obtener los valores 1 ( pi )

El procedimiento de estimacin MV es
preciso cuando no es posible agrupar las
observaciones segn los valores del vector
Xi. En tal situacin, carece de sentido hablar
de proporciones muestrales. En dichos
casos, la estimacin por MV evita los
problemas ya citados acerca de la
estimacin MCG del modelo lineal de
probabilidad. Por otra parte el estimador
de MV es eficiente, y se calcula sobre el
modelo original, sin necesidad de ninguna
aproximacin.
En el caso del MODELO PROBIT, la
funcin de verosimilitud sera:

a partir de la tablas de la distribucin N(0,1)


y estimar la regresin descrita.

Reemplazando [Ecuacin iv.9] en


[Ecuacin vi.1]

Ahora bien, los residuos tienen


heterocedasticidad, puesto que:

L = [ ( x)] yi [1 ( x)]1 yi

var(

ui
Pi (1 Pi )
,` ) =
,
f ( Xi )
ni[ f ( Xi ` )]2
ECUACIN VI.4

Por lo que habr que utilizar mnimos


cuadrados generalizados.

= ( X ` 1 X ) 1 X ` 1
Con una matriz diagonal, con
elementos genricos dados por [Ecuacin
vi.4] donde es el vector de probits
muestrales. Como la matriz es
desconocida, hay que estimarla, para lo
que se podra utilizar: a) las frecuencias
observadas pi, o bien b) las predicciones
Pi obtenidas a partir de un modelo de
probabilidad lineal previamente estimado.

Ntese que para cada individuo i el


trmino correspondiente en la funcin de
verosimilitud es simplemente ( x ) o

1 ( x ) , dependiendo de si Y=1,
jefe de hogar pobre, Y=0, jefe de hogar
no pobre.
Por tanto la funcin logaritmo de la
verosimilitud se obtiene del logaritmo de
la expresin anterior, y tomando sus
derivadas con respecto al vector

se

tienen las k condiciones necesarias de


optimalidad:

x i + (1 Y i )
1

i
xi = 0 k
1 i
ECUACIN VI.5

36 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

de I(b) y S(b) antes obtenidas puede verse


fcilmente que si se hace el cambio de
variables:

N
Yi (x)
(x)xi = 0
S( ) =
1 (x)[1(x)]

ECUACIN VI.6

donde S(b) denota el vector gradiente de


la funcin de verosimilitud. Si derivamos
de nuevo en la expresin anterior con
respecto al vector b, se obtiene la matriz
Hessiana, y tomando esperanza en esta y
cambiando de signo se obtiene finalmente
la matriz de informacin, I(b):
I ( ) =

j=1,2,....,K

*
yi =

[ ( x )] 2
x i x i
( x )[1 ( x )]

yi ( x )
( x )(1 ( x ))
ECUACIN VI.10

entonces la correccin a introducir en el

Conviene hacer hincapi en que en las


expresiones anteriores N denota el
nmero total de observaciones, por lo que
prescindiendo de clasificaciones, hay que
considerar un sumando para cada
observacin muestral. En particular, en
estos problemas es ms sencillo utilizar el
mtodo del scoring10, razn por la que
hemos calculado directamente la matriz
de informacin a partir de la matriz de
derivadas segundas de la funcin de
verosimilitud con respecto al vector b. La
inversa de la matriz de informacin ser
adems la matriz de covarianzas del
estimador de MV del vector b. El
procedimiento de estimacin de MV
utilizara:

ECUACIN VI.9

que forma, para cada observacin i, un


vector de dimensin k, e:

ECUACIN VI.7

I ( ) =

xij ( x)
( x)(1 ( x)) ,

xij * =

estimador

n 1 coincide con los

coeficientes estimados por mnimos cuadrados


ordinarios en una regresin que utilizase yi*
como variable a explicar, y xi* como vector
de variables explicativas, utilizando los

n 1 para calcular

xij *

y yi*.

MODELO LOGIT
Estimacin de mxima verosmilitud
para observaciones individuales.
La funcin de verosimilitud muestral es:
Reemplazando [ECUACION IV.4] en
[ECUACION VI.1]

L =

Y i =1

[ ( x )] 2
x i x i
( x )[1 ( x )]

F ( x ) [1 F ( x ) ] =
Yi = 0

ECUACIN VI.8

Y i ( x ))
1

[1 + e x ]

que proporciona la correccin que hay que


introducir en el estimador del vector b en
cada iteracin. Al sustituir las expresiones

o, lo que es lo mismo:

ln L = 1 Yi ( ' x) 1 ln(1 + e x ) =
N

10/ Especialmente diseado para el caso en que se pretende obtener el EMV, este algoritmo se basa en la propiedad de que
la esperanza matemtica de la matriz hessiana de la funcin de verosimilitud (es decir, la matriz de informacin cambiada
de signo). As se ha sugerido como aproximacin, sustituir la matriz de derivadas segundas por la matriz de informacin,

tenindose el llamado algoritmo de "scoring"

= n 1 + [ I ( n 1)]1 ln L ( n 1)

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 37

Centro de Investigacin y Desarrollo

N
1

i i)
(Yx
1 ln(1 + e x )

ECUACIN VI.11

y denotando por

x i * = x i P I (1 P i )
ECUACIN VI.14

i i un vector
z= 1 Yx

fila 1 x k se tiene:

Yi =
*

ln L = z 1 ln[1 + e
N

(Y i P i )

P i (1 P i )

ECUACIN VI.15

y el cambio a introducir en el vector

x
ln L
N e xi
= z 1
= 0k
S( ) =

+
1 ex

ECUACIN VI.12

y este sistema de k ecuaciones no lineales


debera, en principio, resolverse por
procedimientos numricos, para obtener
el vector de estimaciones b. La matriz de
informacin es:
I ( ) = 1

i i
N
e x xx
= 1 xP
i i (1 Pi ) xi
1 + e x
ECUACIN VI.13

Para estimar el valor b por el algoritmo del


"scoring" se comienza de un estimador bo
y se actualiza por medio de:

1 = 0 + [ I ( 0)]1 S ( 0)
En realidad, la matriz S(b) puede escribirse
tambin:
S ( ) = 1 Y ix i 1
N

N
xi
= 1 (Yi P i ) x i
1 + e x

1
, por lo que el
1 + e xi
algoritmo puede describirse como sigue:

donde

Pi =

1. A partir de un estimador inicial 0 ,

calcular Pi (1 Pi ) .

viene dado por los coeficientes estimados


por mnimos cuadrados ordinarios en una
regresin Yi* sobre el vector xi*.
El algoritmo se itera hasta conseguir su
convergencia, y se utiliza la inversa de la
matriz de informacin evaluada en el
ltimo estimador obtenido como
estimacin de la matriz de covarianzas de
b. Por otra parte, los mtodos de inferencia
que consideran esta matriz de covarianzas
son vlidos, ya que el estimador mximo
verosmil resultante tiene distribucin
normal asinttica. Las probabilidades de
que un individuo con caractersticas Xi
escoja la accin o se situe dentro del
estado que hemos catalogado como Yi=1,
(estar en condicin de pobreza) se estiman
mediante la expresin:

Pi =

e x
1 + e x

Luego de mostrar como la teora estadstica


de ambos modelos propone su desarrollo,
es aqu donde empezamos el trabajo de
estudio emprico del fenmeno de
pobreza en su conjunto. Las variables a
considerar fueron recopiladas de un
seguimiento de investigaciones las cuales
existen en abundancia acerca del tema
de la pobreza11.

2. Transformar las variables:

11/ La metodologa desarrollada para la inclusin de variables se encuentra en el anexo metodolgico al final de esta
investigacin.

38 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

VII. LA ENCUESTA NACIONAL DE HOGARES

La Encuesta Nacional de Hogares


(ENAHO), es un programa continuo de
encuestas, que inici el Instituto Nacional
de Estadstica e Informtica (INEI) a travs
de la Direccin Nacional de Censos y
Encuestas el ao 1995.
A partir del ao 1997, el INEI ha puesto
en ejecucin el Programa de
Mejoramiento de Encuestas y de la
Medicin de las Condiciones de Vida
(MECOVI), bajo el auspicio financiero y
tcnico del Banco Interamericano de
Desarrollo (BID), Banco Mundial (BM) y la
Comisin Econmica para Amrica Latina
y el Caribe (CEPAL), con el propsito
central de fortalecer y mejorar el Sistema
de Encuestas de Hogares, constituido por
un conjunto de encuestas que se vienen
realizando trimestralmente, y que
representan una de las principales fuentes
de informacin para el anlisis, evaluacin
y seguimiento de la realidad demogrfica,
social y econmica de la poblacin
peruana.
El Empleo y el Ingreso son mdulos de
seguimiento en todos los trimestres, pues
son considerados los pilares para explicar
los cambios en las condiciones de vida.
En el segundo y cuarto trimestre se
efectan las Encuestas Panel con el fin de
estudiar los cambios en las caractersticas
de la poblacin en el tiempo.

En el marco de los nuevos lineamientos


de poltica de gestin para identificar la
demanda real de informacin y en
coordinacin con los usuarios el INEI ha
identificado la necesidad de contar
principalmente con indicadores de empleo
y condiciones de vida que permitan
cumplir con su principal misin.
OBJETIVOS
Objetivos Generales:
La encuesta del cuarto trimestre del 2001
tiene los objetivos generales siguientes:
i. Generar indicadores anuales, que
permitan conocer la evolucin de la
pobreza, el bienestar y las condiciones
de vida de los hogares.
ii. Efectuar diagnsticos (anuales) sobre
las condiciones de vida y pobreza de
la poblacin.
iii. Medir el alcance de los programas
sociales en la mejora de las condiciones
de vida de la poblacin.
iv. Servir de fuente de informacin a
instituciones pblicas y privadas, as
como a investigadores.
v. Permitir la comparabilidad con
investigaciones similares en relacin a
las variables investigadas.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 39

Centro de Investigacin y Desarrollo

Objetivos Especficos
Los objetivos especficos de la ENAHO
2001 del cuarto trimestre son los
siguientes:
i. Determinar el grado de acceso a
servicios bsicos de la vivienda y del
hogar y de los programas sociales
orientados a la vivienda segn
diferentes estratos socio-econmicos.
ii. Obtener indicadores de riesgo de
salud debido al hacinamiento y las
condiciones sanitarias de los hogares
segn diferentes estratos socioeconmicos.

programas sociales segn diferentes


estratos socio-econmicos.
ix. Obtener informacin sobre morbilidad
y acceso a los servicios de salud.
x. Evaluar el grado de conocimiento y
utilizacin de los Programas Sociales y
Proyectos de Inversin Social.
xi. Caracterizar a los hogares en pobreza
extrema, pobres y no pobres en
funcin a variables demogrficas,
educativas, otras sociales y econmicas
y el grado de acceso a los servicios

TEMAS A INVESTIGAR
iii. Caracterizar
las
estructuras
demogrficas, segn diferentes estratos
socio-econmicos, con el fin de medir
la evolucin y el impacto demogrfico
de los programas sociales.
iv. Determinar el nivel educativo segn
diferentes estratos socio-econmicos.
v. Determinar el grado de acceso a la
educacin y el alcance de los
programas sociales, segn diferentes
estratos socio-econmicos.
vi. Caracterizar los niveles de empleo,
segn diferentes estratos socioeconmicos.

Mdulo de Vivienda
Caractersticas de los miembros del
hogar
Mdulo bsico de Educacin
Mdulo bsico de Salud
Mdulo bsico de empleo
Sistema de Pensiones
Uso de Computadora e Internet en el
Trabajo
Ingresos del sector formal e informal
Gastos
Mdulo bsico de Programa Social
Mdulo Comunal para Informantes
Calificados
Mdulo de Opinin

CARACTERISTICAS
vii. Determinar la estructura del ingreso de
los hogares, teniendo en cuenta los
ingresos provenientes de los propios
hogares y el efecto redistributivo de
los programas sociales.
viii.Cuantificar el gasto de consumo de los
hogares diferenciando el aporte de los

La Investigacin se desarrollar sobre la


base de una muestra de hogares siendo
los niveles de inferencia del diseo
muestral: Nacional, Urbano Nacional, Rural
Nacional, Resto Costa, Sierra, Selva y el
Area Metropolitana de Lima y Callao.

40 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

Los cuestionarios a emplearse sern los


mismos del Cuarto Trimestre de 2000,
adems de un mdulo de opinin.
Los informantes sern todos los residentes
habituales de 12 aos y ms de edad que
conforman el hogar entrevistado.
La Unidad de Investigacin: es el hogar,
el cual est constituido por: 1) los
integrantes del hogar familiar, 2) los
trabajadores del hogar con cama adentro,
reciban o no pago por sus servicios, 3) los
integrantes de una pensin familiar que
tienen como mximo 9 pensionistas, y 4)
las personas que no son miembros del
hogar familiar pero que estuvieron
presentes en el hogar los ltimos 30 das.
No sern investigados: 1) los integrantes
de una pensin familiar que tiene de 10 a
ms pensionistas, y 2) los trabajadores del
hogar con cama afuera.

7.1. CARACTERISTICAS
MUESTRA

DE

LA

Poblacin y Cobertura
El universo cubierto por la muestra de la
ENAHO es todo el territorio nacional. Es
decir, la poblacin est definida como el
conjunto de todas las viviendas particulares
y sus ocupantes residentes del rea urbana
y rural del pas.
Se excluye del estudio a la poblacin
residente en viviendas tipo colectivas
como hospitales, cuarteles, comisaras,
hoteles, centros de reclusin, etc.

poblacin en el tiempo, se ha considerado


que en la ENAHO 2001 Cuarto Trimestre
se trabaje con una muestra del tipo Panel
y una muestra No Panel.
La muestra panel estar conformada por
los hogares entrevistados en la ENAHO
2000 - Cuarto Trimestre. En el caso de la
muestra no panel, esta ser totalmente
nueva.
Muestra panel: El principal objetivo del
uso de una muestra panel en una encuesta,
es realizar un seguimiento de las unidades
de investigacin, en este caso los hogares
y los miembros que habitan en ella en un
determinado perodo. Asimismo, esta
muestra permite obtener estimaciones de
las caractersticas socio-demogrficas de
la poblacin para diferentes reas, estratos
o
dominios
de
inters,
para
posteriormente realizar comparaciones de
las unidades investigadas con referencia a
la anterior investigacin.
Muestra no panel: A travs de la muestra
No Panel, se puede obtener estimaciones
de las caractersticas socio-demogrficas
de la poblacin de estudio para diferentes
reas, estratos o dominios de inters.
Adems, esta muestra incluye las nuevas
unidades estadsticas que se incrementan
en el marco inicial de seleccin.
Metodologa de Estimacin
La metodologa de estimacin para
procesar los datos de la ENAHO, involucra
el uso de un peso o factor de expansin
para cada registro que ser multiplicado
por todos los datos que conforman el
registro correspondiente.

Niveles de Inferencia de Resultados


A efectos de permitir el estudio de los
cambios en las caractersticas de la

El factor final para cada registro tiene dos


componentes:

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 41

Centro de Investigacin y Desarrollo

El factor bsico de muestreo y los factores


de ajuste por la no entrevista.

El factor bsico de expansin para cada


hogar muestral es determinado por el
diseo de la muestra. Equivale al inverso
de su probabilidad final de seleccin, el
mismo que es el producto de las
probabilidades de seleccin en cada etapa.

El diseo de la muestra de la ENAHO,


involucra hasta 3 etapas de muestreo
donde las unidades son seleccionadas con
probabilidades proporcionales al tamao
(ppt) excepto la ltima etapa. En la ltima
etapa se seleccionar un nmero de
viviendas para cada conglomerado
teniendo en cuenta un intervalo de
seleccin.
Errores de Muestreo
Trimestralmente, en la Encuesta Nacional
de Hogares se calculan los errores de
muestreo de las estimaciones de las
principales variables investigadas en la
encuesta.
El paquete estadstico utilizado en la
ENAHO para el clculo de las varianzas es
el CENVAR (Sistema de Clculo de
Varianzas), el cual provee los estimadores
de variabilidad muestral para parmetros
poblacionales, como: totales, medias ,
razones y proporciones para los diferentes
dominios de estimacin.
Para cada parmetro especificado y
dominio de estimacin, CENVAR produce
un cuadro de salida con los indicadores
siguientes:
-

El valor estimado del parmetro


(estimacin puntual)
El error estndar

El coeficiente de variacin (CV)


El intervalo con 95 por ciento de
confianza
El efecto del diseo (DEFT)
El nmero de observaciones sobre el
cual se basa la estimacin

El algoritmo usado por el CENVAR se basa


en el mtodo de los estimadores de la
varianza de los conglomerados ltimos.
Cuestionarios
Se emplearn 6 tipos de cuestionarios:
ENAHO 01. Cuestionario individual para
ser llenado con informacin del jefe del
hogar y con entrevista directa a los
informantes individuales. Comprende las
caractersticas de la vivienda, del hogar y
de los miembros del hogar, Gastos del
Hogar, Programas Sociales y Otras
Transacciones.
ENAHO 01A. Cuestionario individual para
ser llenado con informacin del jefe del
hogar y con entrevista directa a los
informantes individuales, investiga las
caractersticas de Educacin, Salud, Empleo
e Ingreso, Sistema de Pensiones y Uso
de Computadora e Internet en el Centro
de Trabajo.
ENAHO 01B. Cuestionario individual que
es llenado por entrevista directa con
informacin del Jefe del hogar, en este
Mdulo de Opinin se investiga Nivel de
Vida/Situaciones Adversas, Participacin
ciudadana, Percepcin sobre la
comunidad, Seguridad y Violencia,
ETNIA/RAZA y Educacin de los Padres.
ENAHO 02. Cuestionario individual que
es llenado por entrevista directa con cada
productor agropecuario que conduce una

42 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

unidad agropecuaria. Se investiga los


ingresos del productor agropecuario, el
rgimen de tenencia de las tierras, la
posesin de ttulos de propiedad, el destino
de la produccin y crianza, los gastos
realizados en la actividad agropecuaria y
el crdito agropecuario.
ENAHO 03. Cuestionario aplicado a
informantes calificados del rea rural o
reas perifricas de las ciudades, investiga
acerca del acceso a servicios y programas
sociales, as como a los organismos que
financian dichos programas.
ENAHO 04. Ingreso del Trabajador
Independiente (Sector Informal).

7.2. Factores de relevancia para la


explicacin de la pobreza
extrados de la ENAHO IV
trimestre 2001
Variable dependiente
[CONDICIN DE POBREZA]
pobreza
Pobreza
Escala Nominal Categrica
Codificacin: 1 Pobre Extremo, 2 Pobre
No extremo, 3 No Pobre
Base de datos: Sumaria
Esta variable es recodificada en una nueva
variable Epobre
Escala Nominal Dicotmica
Codificacin: 0 No Pobre, 1 Pobre
Variables independientes
Caractersticas Sociodemogrficas del
Jefe de Hogar
[NIVEL DE EDUCACIN]
p301
Nivel educativo que aprob

Conocer el grado de educacin ms alto


aprobado por cada persona dentro del
nivel educativo que alcanz.
Escala Ordinal
Base de datos: Educacin (CAP. 300)
Codificacin: 1 Sin nivel, 2 Inicial, 3
Primaria incompleta, 4 Primaria completa,
5 Secundaria incompleta, 6 Secundaria
completa, 7 Sup. No Univ. Incompleta, 8
Sup. No Univ. Completa, 9 Sup. Univ.
Incompl., 10 Sup. Univ. Completa, 11
Post-grado Universitario, 99 Missing value
La variable nivel educativo que aprob
(p301) fue recodificada en la variable
adnivedu-Nivel Educativo aprobado.
Escala ordinal.
Codificacin: 1 Sin nivel, 2 Primaria, 3
Secundaria, 4 Sup. No Univ., 5 Sup. Univ.
6 Post- Grado Univ.
Se cre la variable aest-Aos de Estudios
totales. Para su construccin se consider
las variables p301 y p301b(aos de estudios
que aprob). Como es evidente,
dependiendo del grado aprobado y los
aos que aprob, se generan la cantidad
total de aos estudiados. Ejem: Si es un
jefe de hogar que lleg solo a secundaria
incompleta (3 aos aprobados), entonces
los aos de estudios totales (aest = 6
(primaria completa) + 3 (secundaria
incompleta)).
[CENTRO DE ESTUDIOS]
p301d
Centro de Estudios
Determinar si el colegio de procedencia
donde se estudio es de rgimen estatal o
particular.
Escala nominal
Base de datos: Educacin (CAP. 300)
Codificacin: 1 Estatal, 2 No estatal, 9
Missing value

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 43

Centro de Investigacin y Desarrollo

[EDAD]
p208a
Edad en aos
Determinar el perodo transcurrido entre
la fecha de nacimiento de la persona y el
da de la entrevista.
Variable cuantitativa
Base de Datos: Caractersticas de los
miembros del hogar (CAP. 200)
[GNERO]
p207
Sexo
Determinar el sexo de los entrevistados.
Identificados como hombre o mujer.
Escala Nominal Dicotmica
Base de Datos: Caractersticas de los
miembros del hogar (CAP. 200)
Codificacin: 1 Hombre, 2 Mujer
[ESTADO CIVIL]
p209
Estado conyugal
Investigar sobre la naturaleza de la
participacin de la poblacin en materia
de comportamiento conyugal en especial
durante el perodo de madurez.
Escala Nominal Categrica
Base de Datos: Caractersticas de los
miembros del hogar (CAP. 200)
Codificacin: 1 Conviviente, 2 Casado(a),
3 Viudo(a), 4 Divorciado(a) ,5 Separado(a),
6 Soltero(a)
[DOMINIO GEOGRFICO]
dominio
Dominio Geogrfico
Escala Nominal Categrica
Base de Datos: Identificador presente en
todas las bases de datos
Codificacin: 1 Costa Norte , 2 Costa
Centro, 3 Costa Sur, 4 Sierra Norte, 5 Sierra
Centro, 6 Sierra Sur, 7 Selva, 8 Lima
Metropolitana
[GRANDES DOMINIOS ]
gdomini
Grandes Dominios Geog.
Escala Nominal Categrica
Codificacin: 1 Costa , 2 Sierra, 3 Selva, 4
Lima Metropolitana

[ESTRATO]
estrato
Estrato Geogrfico
Determinar la cantidad de viviendas
albergadas en cada estrato geogrfico.
Escala Nominal Categrica
Base de Datos: Identificador presente en
todas las bases de datos
Codificacin: 1 Mayor de 100,000
viviendas, 2 De 20,001 a 100,000
viviendas, 3 De 10,001 a 20,000
viviendas, 4 De 4,001 a 10,000 viviendas,
5 De 401 a 4,000 viviendas, 6 Menos de
400 viviendas, 7 AER compuestos, 8 AER
simples.
[AREA]
urb_ru
rea urbano-rural
Esta variable resulta de recodificar la
variable estrato cuyas 5 primeras categoras
proceden a conformar el rea urbana y las
categoras de 6 a la 8 conformaran el rea
rural.
Escala Nominal Dicotmica
Codificacin: 1 rea Urbana, 2 rea Rural
[DOMINIO URBANO RURAL]
domur_ru Grandes dominios por rea
urb o ru.
Esta variable resulta del cruce de las
variables gdomini (Costa, Sierra, etc) y rea
(urbano, rural).
Escala Nominal categrica
Codificacin: 11 Costa Urbana, 12 Costa
Rural, 21 Sierra Urbana, 22 Sierra Rural,
31 Selva Urbana, 32 Selva Rural, 41 Lima
Urbana
Caractersticas de
ocupacional del JH

la

insercin

[EXPERIENCIA LABORAL]
exper1
Indicador proxy de exper.
laboral
Este indicador resulta de restar a la edad
del jefe de hogar los aos de estudios,

44 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

aunque no considera si el jefe de hogar


ha trabajado y estudiado a la vez, se
aproxima en buena medida a la
experiencia laboral del jefe de hogar. Se
resta "6" al final del indicador, pues es a la
edad en que debera empezar el colegio.
Variable cuantitativa
Por ejemplo, un jefe de hogar con 45 aos
y secundaria completa, tendr:
Exper1 = p208a - aest - 6 = 45 - (6+5) 6 = 28 aos de experiencia laboral
[CATEGORA OCUPACIONAL]
p507
Cargo en Centro Ocupacional.
Conocer la relacin del trabajador con su
empleo, es decir, la forma que tienen los
trabajadores de insertarse en el mercado
laboral. Una primera distincin bsica es
si se trabaja en forma dependiente o
independiente, ya que en ambos casos son
muy diferentes las relaciones econmicas
y laborales involucradas.
Escala Nominal Categrica
Base de datos: Empleo e Ingresos (Cap.
500)
Codificacin: 1 Empleador o patrono, 2
Trabajador independiente, 3 Empleado, 4
Obrero, 5 Trabajador Familiar no
remunerado, 6 Trabajador del Hoga, 7
Otro.
[TAMAO DE LA FIRMA]
p512a
Tamao de la empresa
Disponer de informacin sobre el volumen
de la fuerza de trabajo segn el tamao
del establecimiento, el mismo que
conjuntamente con otras caractersticas,
son tiles para determinar el volumen de
la poblacin del sector informal.
Escala Ordinal
Base de datos: Empleo e Ingresos (Cap.
500)

Codificacin: 1 menos de 100 personas,


2 De 100 a 499 personas, 3 De 500 y ms
personas.
[TRABAJO ADICIONAL]
p514
Ocupacin secundaria
Determinar el nmero de ocupados que
tienen actividad secundaria, que
desarrollan simultneamente con la
actividad principal en la semana de
referencia, ya sea en forma dependiente
o independiente.
Escala Nominal Dicotmica
Base de datos: Empleo e Ingresos (Cap.
500)
Codificacin: 1 Si , 2 No
Caractersticas del hogar
[NUCLEOS EN EL HOGAR]
nuchoga
Cant. de ncleos en hogar
Determinar el nmero de ncleos
presentes en cada hogar para intentar
captar a cuntos hogares se alberga fuera
del propio hogar del jefe de hogar, dentro
de la misma vivienda.
Variable cuantitativa
Base de datos: Generada a partir de
caractersticas de los miembros del hogar
(cap.200)
[HIJOS EN EL HOGAR]
hijxhog
Cant. de hijos del jh
Determinar la cantidad de hijos presentes
en el hogar.
Variable cuantitativa
Base de datos: Generada a partir de
caractersticas de los miembros del hogar
(cap.200)
[MIEMBROS EN EL HOGAR]
mieperhog Cant. de miembros en hogar
Determinar la cantidad de miembros
pertenecientes al hogar, se excluyen a las

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 45

Centro de Investigacin y Desarrollo

trabajadoras del hogar que no


permanecen ms de 30 das en el hogar.
Variable Cuantitativa
Base de Datos: Sumaria
[PERCEPTORES EN HOGAR]
percephog
Cant. de preceptores en
hogar.
Determinar la cantidad de preceptores
dentro de cada hogar.
Variable Cuantitativa
Base de Datos: Sumaria
[INGRESO NETO TRIMESTRAL]
inghog2d
Ingreso neto trimestral
Trimestralizar la informacin de ingresos,
llevndola a un mismo perodo de
investigacin.
Variable Cuantitativa
Base de Datos: Sumaria
[INGRESO PER CPITA M]
ingperho
Ingreso per cpita mens.
del hogar
Determinar el ingreso per cpita mensual
de los hogares.
Variable Cuantitativa
Base de datos: Generada a partir de
Sumaria.
[ACCESO LUZ]
p112
Tipo de alumbrado en su hogar
Determinar si el hogar dispone o no de
alumbrado elctrico. Asimismo se
conocer la cantidad de hogares que
carecen de servicio y permitir establecer
la relacin que existe entre padecimientos
respiratorios y algunas formas de alumbrado
como el uso de kerosene y vela.
Asimismo, las deficiencias en al agudeza
visual, tambin pueden estar en relacin
al uso de alumbrado no elctrico.
Escala Nominal Categrica

Base de datos: Caractersticas de la


vivienda y el hogar. (cap. 100)
Codificacin: 1 Electricidad, 2 kerosene
(mechero/lamparin), 3 Petrleo/gas
(lampara), 4 Vela, 5 Generador, 6 Otro.
[ACCESO AGUA]
p110
Abastecimiento agua en hogar
Conocer la cantidad de personas y lugares
donde se carece de este lquido vital, lo
que ser de utilidad para la ejecucin de
programas de saneamiento.
Escala Nominal Categrica
Base de datos: Caractersticas de la
vivienda y el hogar. (cap. 100)
Codificacin: 1 Red pblica, dentro de la
vivienda, 2 Red pblica, fuera de la
vivienda, 3 Piln de uso pblico, 4 Camin
-cisterna u otro similar, 5 Pozo, 6 Ro,
acequia, manantial o similar, 7 otro.
[ACCESO A RED SANITARIA]
p111
El servicio higinico esta
conectado
Conocer si el hogar dispone o no de
servicio higinico, su ubicacin y forma
de eliminacin de los residuos humanos.
Permitir tener una apreciacin ms
general respecto a la calidad de vida de
los habitantes; y es un componente
elemental en la determinacin del
bienestar social. Adems permitir
conocer las posibilidades de contaminacin
en la comunidad en general y las causas
que producen la hepatitis y la tifoidea.
Escala Nominal Categrica
Base de datos: Caractersticas de la
vivienda y el hogar. (cap. 100)
Codificacin: 1 Red pblica dentro de la
vivienda, 2 red pblica fuera de la vivienda,
3 pozo sptico, 4 pozo ciego o negro/
letrina, 5 ro, acequia o canal, 6 no tiene

46 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

Si se desea obtener ms informacin sobre


otras variables de medicin de condiciones
de vida y pobreza, se puede consultar
"Variables investigadas en la ENAHO-2001
IV TRIMESTRE .INEI - MECOVI"

que la categora empleador o patrono es


la categora base.

VARIABLES INDICADORAS

Se generaron variables indicadoras para


trabajar sobre los modelos de probabilidad
del jefe de hogar y poder captar el efecto
de las categoras de las variables en escalas
nominales sobre sus categoras base . El
mismo proceder se efectu para las
variables en escalas ordinales.
En tal sentido el nivel educativo agrupado
fue dividido en 5 indicadoras, donde la
categora que est fuera de riesgo es el
Post-Grado Univ.

Se generan variables indicadoras para


dominio en rea urbana y rural.

DSINNIV = 1
Si JH no tiene nivel educativo y 0 en
otro caso
DPRIM = 1
Si JH tiene primaria y 0 en otro caso
DSECUND = 1
Si JH tiene secundaria y 0 en otro caso
DSUPNU = 1
Si JH tiene educ. sup no univ. y 0 en
otro caso
DSUPUN = 1
Si JH tiene educ. sup. Univer. y 0 en
otro caso

DCOLEGIO = 1
Si JH a estudiado en colegio estatal y 0
en otro caso

La variable categora ocupacional generara


4 variables categricas, donde se considera

DCORU = 1
Si JH habita en Costa urbana y 0 en
otro caso
DSIEUR = 1
Si JH habita en Sierra urbana y 0 en
otro caso
DSELUR = 1
Si JH habita en Selva urbana y 0 en
otro caso

La variable en escala ordinal Tamao de la


firma genera dos variables indicadoras,
tomando como categora base el tamao
de la firma de 500 y ms personas.

Variable indicadora de colegio estatal.

DINDEP
= 1
Si JH es trabajador independiente y 0
en o.c.
DEMPLEADO = 1
Si JH es empleado y 0 en o.c.
DOBRERO = 1
Si JH es obrero y 0 en otro caso
DOTRO
= 1
Si JH se encuentra en otra situacin
ocupacional

DME100 = 1
Si JH trabaja empresa con menos de
100 personas y 0 o.c.
DME499 = 1
Si JH trabaja empresa con 100 a 499
personas y 0 o.c.

Variable indicadora de si el JH tiene ejerce


una actividad secundaria

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 47

Centro de Investigacin y Desarrollo

DOEMP =
1
Si JH tiene otro trabajo y 0 en otro caso

De igual manera el estado civil generara


5 variables indicadoras, donde tomaramos
como categora base cuando el jefe de
hogar es soltero.

DCONVI
=
1
Si JH es conviviente y 0 en otro caso
DCASAD
=
1
Si JH es casado y 0 en o.c.
DVIUDO
=
1
Si JH es viudo y 0 en o.c.
DDIVOR
=
1
Si JH es divorciado y 0 en o.c.
DSEPAR
=
1
Si JH es separado y 0 en o.c.

Generamos variables indicadoras cuando


el hogar tiene conexin de servicios
higinicos a red pblica dentro de
vivienda.

DSHDV
=
1
Si SS.HH. hogar - conectados a red
pblica dentro de vivienda y 0 en o.c.

De la misma manera, se generan una


variable indicadora cuando el hogar no
tiene ss.hh. dentro del hogar.

DSHNO
=
1
Si hogar no tiene SS.HH. dentro de
hogar y 0 en o.c.

Para el caso de abastecimiento de agua


dentro de la vivienda a travs de red
pblica, generamos la variable indicadora.

DAGUDV = 1
Si abastecimiento de agua es travs de
red pblica dentro de vivienda

Variable indicadora que defina si el


alumbrado pblico en la vivienda es travs
de kerosene.

P1122 = 1
Si el tipo de alumbrado en la vivienda
es a travs de kerosene

Variable indicadora que define si se utiliza


espacio de la vivienda que destine ingresos
para el hogar.

P115 = 1
Si se utiliza espacio en la vivienda que
destine ingresos al hogar.

48 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

VIII. CRITERIOS DE APLICACIN DE LOS MODELOS


LOGIT Y PROBIT CON VDD APLICADOS
AL CASO DE LA POBREZA EN EL PER

8.1 Estudio a nivel descriptivo y


exploratorio
de
variables
cualitativas y cuantitativas que
incidan en la pobreza en el Per12
Empezaremos esta parte de nuestra
investigacin describiendo aquellas
variables que nos brindan posibles
explicaciones de la pobreza en un marco
general y de los individuos Jefe de Hogar
en este caso en particular. Entre ellas se
encuentran aquellas de carcter
sociodemogrfico como el gnero, la
edad, el estado civil, el nivel de educacin,
el alfabetismo (variables de naturaleza
cualitativa), medidas en algunos casos en
escala nominal - dicotmica como el sexo
del jefe de hogar (Hombre-Mujer) y en
otros casos nominal - politmica como el
estado civil (Soltero-Casado-Convivienteetc).
En otro tipo de escalas se encuentran
aquellas que denotan un orden ascendente
en sus categoras como lo es el nivel de
educacin (Sin Nivel- Educacin Primariaetc.) alcanzado por el Jefe de Hogar.
Adems encontramos variables de
naturaleza cuantitativa como lo constituyen

la edad y el indicador proxy de experiencia


laboral , que no considera aquel caso en
el que el Jefe del Hogar, ha estudiado y
trabajado, sino solo aquel tiempo en el
cual el Jefe de Hogar solo trabaja.
Uno de los objetivos que perseguimos y
que esta implcito dentro de esta
investigacin es dejar en claro que
estamos trabajando con variables a
diferentes escalas, mencionadas como
ejemplos lneas antes, y que dependiendo
de estas escalas determinarn la
implementacin y ejecucin de las
metodologas que sirvan de herramientas
para una explicacin de la pobreza en el
Per en particular.
EDUCACIN
Una de las caractersticas de la pobreza es
que esta se encuentra asociada a niveles
bajos de educacin alcanzados por el Jefe
de Hogar. Podemos ver [Cuadro VIII.1]
como dentro de aquellos Jefes de Hogar
sin nivel educativo y nivel educativo
primario, el 72.5% y el 61.3% se
encuentran en condicin de pobreza,
respectivamente.

Cuadro VIII.1 Perfil del Jefe de Hogar segn Nivel Educativo y Estado pobreza

estado pobreza

pobre
no pobre

Total

sin nivel
72.5%
27.5%
100.0%

primaria
61.3%
38.7%
100.0%

Niv el Educativo Agrupado


secundaria
sup. no univ.
40.0%
19.3%
60.0%
80.7%
100.0%
100.0%

universitaria
8.2%
91.8%
100.0%

post univers.
.2%
99.8%
100.0%

Total
46.8%
53.2%
100.0%

a. Porcentage de columnas

12/ Debemos de recordar que si bien el objetivo de nuestra investigacin gira en torno a los modelos logit y probit, vemos que no
podemos ser ajenos a aquellos previos fundamentales de anlisis descriptivo para poder seguir avanzando sobre niveles de anlisis
ms complejos, como lo podran constituir el anlisis multivariado y los modelos de probabilidad con enfoques binomial.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 49

Centro de Investigacin y Desarrollo

En el caso de los que tienen nivel educativo


secundaria, se aprecia que el estado de
pobreza se encuentra repartido para sus
dos categoras, con 40% para el caso de
jefes de hogar pobres y con 60% para el
caso de no pobreza. Un panorama
diferente y en sentido opuesto se da en
los niveles superiores donde en el caso
de jefes de hogar con nivel educativo
superior no universitario el 80.7% se
encuentran en estado de no pobreza. En
una tendencia creciente mucho mayor y
estado de no pobreza se encuentran
aquellos jefes de hogar que tiene niveles
como el universitario y el post-grado, con
91.8% y 99.8% para la primera y segunda
respectivamente.

En funcin del comportamiento entre el


estado de pobreza y el nivel educativo del
jefe de hogar nos toca ahora analizar el
grado de relacin que estas tienen, y
definir ms an este comportamiento a
nivel poblacional. Analizando el cuadro
que muestra el Test Chi-Square [CUADRO
VIII.2] podemos ver que la hiptesis de
nulidad que supone independiente el
nivel educativo y la condicin de pobreza
del jefe de hogar es rechazada para un
valor de c2 = 859730.5 y un nivel de
significancia (p-valor =0.000), por lo tanto
a medida que el jefe de hogar va
adquiriendo un mayor nivel de educacin,
ste obtiene mas capacidades para ir
abandonando la condicin de pobreza,
ms an si tiene niveles de educacin
superiores.

Cuadro VIII.2 Chi-Square Test

Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Assoc iation
N of Valid Cas es

Value
859730.5
954693.3

5
5

Asymp. Si g.
(2-sided)
.000
.000

.000

df

842469.1
5834837

Una respuesta a la pregunta de cual es el


grado de asociacin? Se puede apreciar
en el cuadro [CUADRO VIII.3] Symmetric
Measures donde los Coeficientes de
correlacin de Spearman (0.375), Gamma
(0.567) y Kendalls tau-c (0.409) denotan
un fuerte grado de asociacin, pues nos

dan la idea de la asociacin que debe darse


entre el nivel socioeconmico y el nivel
educativo, hablando de la poblacin en su
conjunto. Debemos de tomar en cuenta
que estamos aislando en alguna medida el
fenmeno de pobreza y ponindolo solo
en trminos del nivel educativo.

Cuadro VIII.3 Symmetric Measures

Ordinal by
Ordinal

Kendall's tau- b
Kendall's tau- c
Gamma
Sp ear man Cor relation

N of Valid Cases

50 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Value
. 346
. 409
. 567

Ap prox. Sig .
.000
.000
.000

. 375
5834837

.000

Centro de Investigacin y Desarrollo

Grfico VIII.1
Perfil del Nivel Educativo segn estado de pobreza del jefe del hogar
Pob re

100
90

N o Pob re

PORCENTAJE

80
70
60
50
40
30
20
10
0
S in Nivel

Prim aria

Secundaria

Superior No

Univ ers itaria

Pos t -Grado

Universitaria

NIVEL EDUCATIVO

ESTADO CIVIL - SEXO DEL JEFE DE


HOGAR
A continuacin analizaremos el
comportamiento y la relacin existente
entre el sexo del jefe de hogar y el estado
civil que posee. Se puede apreciar
[CUADRO VIII.4] que dentro de la
condicin de pobreza, los jefes de hogar
hombres constituyen el 96.4% del estado

civil conviviente, en igual sentido se


encuentra los jefe de hogar casados que
vienen a estar constituidos en un 97.7%
por los hombres. La figura cambia para las
otras categoras de estado civil, donde para
el estado civil viuda, divorciada, separada
y soltera, las mujeres constituyen el
76.36%, el 70.86%, el 84.13% y el 50.48,
para cada categora y en ese orden
respectivamente.

Cuadro VIII.4
Perfil de jefe de hogar segn gnero y estado civil o conyugal en estado de pobreza
estado
pobreza
pobre

Sexo

Hombre
Mujer

Total

Conviviente
96.4%
3.6%
100.0%

Cual es su estado civil o conyugal


Casado
Viudo
Divorciado
Separado
97.7%
23.6%
29.1%
15.9%
2.3%
76.4%
70.9%
84.1%
100.0%
100.0%
100.0%
100.0%

Soltero
49.5%
50.5%
100.0%

Total
81.2%
18.8%
100.0%

a. Porcentage en columnas

Resultado de la incorporacin de los


efectos de diseo vemos [CUADRO
VIII.5] que segn el Chi-Square Tets,
obtenemos el coeficiente Pearson c (5)
= 1685365 y un p-valor=0.000, nos

permite rechazar la hiptesis que formula


la independencia de ambas variables, es
decir, que existe relacin significativa entre
el estado civil y el sexo del jefe de hogar
en condicin de pobreza.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 51

Centro de Investigacin y Desarrollo

Cuadro VIII.5 Chi-Square Test


estado pobreza
pobre

P ear son Chi-Square


Likelihood Ratio
N of Va lid Case s

El grado de asociacin del cual estamos


hablando lo podemos observar en el cuadro
siguiente Symetric Measures [CUADRO
VIII.6], donde coeficientes como el de
contingencia (CC) con un valor de 0.615
, el Phi = 0.781 y el Cramers V=.781
denotan un alto grado de asociacin13, lo
cual nos muestra que la pobreza afecta
en todos los estados civiles sean estos en

V alue
1685365
1478553
2764186

A symp . Sig.
(2 -sided)
.000
.000

df
5
5

condicin de pareja (casado-conviviente),


como sera en el caso de los jefes de hogar
hombres. En aquellas situaciones en las
que la mujer tiene que responder como
jefe de hogar y "no tendra pareja" (ViudaDivorciada-Soltera-etc.), podra motivar un
mayor riesgo para la adquisicin de la
condicin de pobreza.

Cuadro VIII.6 Symmetric Measures


estado
pobreza
pobre

Nom
by
Nom

Phi
Cramer's V
Contingency Coefficient
N of Valid Cases

Al analizar las mismas variables para los


jefes de hogar no pobres, podemos
observar
[CUADRO
VIII.7]
un
comportamiento parecido al de los jefes
de hogar en estado de pobreza. Es decir,
para los jefes de hogar con estado civil de
convivencia y casado, los hombres

Value
.781
.781
.615
2764186

Approx. Sig.
.000
.000
.000

constituyen el 94.1% y el 97.2% dentro


de cada categora respectivamente. Para
los jefes de hogar en los estados civiles
viudo, divorciado y separado, las mujeres
constituyen el 67.8%, el 60.2% y el
67.8% de cada categora y en ese orden
respectivamente.

Cuadro VIII.7
Perfil de jefe de hogar segn gnero y estado civil o conyugal en estado de no pobreza
a

estado
pobreza
no
pobre

Sexo

Hombre
Mujer

Total

Conviviente
94.1%
5.9%
100.0%

Cual es su estado civil o conyugal


Casado
Viudo
Divorciado
Separado
97.2%
32.2%
39.8%
32.2%
2.8%
67.8%
60.2%
67.8%
100.0%
100.0%
100.0%
100.0%

Soltero
62.1%
37.9%
100.0%

Total
78.2%
21.8%
100.0%

a. Porcentage de Columnas

13/ Debemos de considerar que si bien estos coeficientes nos confirman los grados de asociacin de variables estos poseen
limitaciones como el caso del coeficiente de contingencia, que a pesar que nos puede expresar que un valor de cero
confirma la no asociacin de variables, no posee la propiedad en el caso extremo de un grado de asociacin total, es decir,
igual a 1. Para ms detalle consultar Siegel , Sidney.

52 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

Se confirma la relacin significativa y


diferente de cero existente entre el sexo
y el estado civil del jefe de hogar, esto en
el Chi-Square Test [CUADRO VIII.8], a
travs de los coeficientes de Pearson c
(5)=1356731, el c de la razn de
verosimilitud (likelihood ratio)= 1327980

con resultados en el mismo sentido debido


al tamao de la poblacin. A travs de su
significancia (0.000) que permite rechazar
la hiptesis que sostiene la independencia
del sexo y el estado civil del jefe de hogar
dentro de cada categora de pobreza.

Cuadro VIII.8 Chi-Square Test


estado pobreza
no pobre

Pears on Ch i-Squar e
Likelihood R atio
N of Valid Cases

De lo explicado anteriormente, resulta


interesante ver que a pesar que exista una
relacin entre el sexo del jefe de hogar y
su correspondiente estado civil, la pobreza
de los jefes de hogar del Per ya no solo

Value
1356731
1327980
3144673

Asymp. Sig.
(2-sided)
.000
.000

df
5
5

capta a los hogares con jefes de hogar


mujeres sin pareja, ahora en el ao 2001
ya ha captado a los jefes de hogar con
pareja, ya sea formal o informal.

Cuadro VIII.9 Symmetric Measures


e sta do p obrez a
n o pob re

No m by
No m

Ph i
Cra m er's V
Co n tin ge n cy
Co e fficien t
N o f V alid Ca se s

Va lue
.6 57
.6 57

Ap pro x. Sig .
.0 00
.0 00

.5 49

.0 00

31 44 6 73

Grfico VIII.2
Perfil del Jefe de Hogar segn Gnero y Estado Civil
condicin de no pobreza
Mujer

100
Hombre

PORCENTAJE

80
60
40
20
0
CONV IVIE NT E

CAS ADO

VIUDO

DIVOR CIADO

SE PAR ADO

S OL T E R O

ESTADO CIVIL

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 53

Centro de Investigacin y Desarrollo

Grfico VIII.3
Perfil del Jefe de Hogar segn Gnero y Estado Civil
condicin de pobreza
Mujer

100

Hombre

PORCENTAJE

80
60
40
20
0
CONV IVIE NT E

CAS ADO

VIU DO

DIVOR CIADO

SE PAR ADO

S OLT E R O

ESTADO CIVIL

AREAS DE RESIDENCIA - REGIN


NATURAL
La pobreza en nuestros das ha
conquistado todos los mbitos del vasto
territorio peruano, lo cual sumado a
condiciones de focalizacin mal llevadas
en la dcada pasada permiti que aquellos
que se encontraban en estado de pobreza
no fueran quienes recibieran la ayuda y los
medios adecuados paleativos para subsisitir.
En el ao 2001, podemos ver [CUADRO
VIII.10] que en condicin de pobreza los

jefes de hogar del rea urbana constituye


el 84.3% para la regin de la costa. En
un nivel porcentual menor pero igual de
considerable, la regin de la sierra est
constituida en un 75.9% por jefes de
hogar del rea rural. Si bien para el rea
rural en la regin selvtica los jefes de
hogar pobres son alrededor del 58% , no
es tan evidente la diferencia como en el
resto de regiones, debido a que en el rea
urbana se encuentra un 42.1% en estado
de pobreza.

Cuadro VIII.10
Perfil de jefe de hogar segn Area y Regin Natural en estado de pobreza
estado
pobreza
pobre

Urbano_Rural

urbano
rural

Total

regiones naturales
costa
sierra
selva
84.3%
24.1%
42.1%
15.7%
75.9%
57.9%

Total
47.4%
52.6%

100.0%

100.0%

a. Porcentage de Columnas

54 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

100.0%

100.0%

Centro de Investigacin y Desarrollo

Resulta dramtico evidenciar cmo la


condicin de pobreza afecta en mayor
medida a aquellos que menos acceso
tienen en cuanto a activos pblicos de
infraestructura, educacin, salud, etc; que
son justamente aquellos jefes de hogar

que se encuentran en la sierra rural del


Per, a pesar de que se sostenga en
algunas investigaciones que la brecha de
acceso a estos activos se ha ido reduciendo
en los ltimos aos.

Grfico VIII.4
Perfil del Jefe de Hogar segn rea y Regin
Natural de residencia - Condicin de pobreza
90

U rb an o

80

R ur al

PORCENTAJE

70
60
50
40
30
20
10
0

C OS TA

SI E R R A

S E LV A

REGION NATURAL

La relacin entre estas variables es


significativa a un nivel de confianza del
95%. Esto como sabemos podemos
deducirlo del rechazo de la hiptesis que
supone la independencia del rea (urbano
o rural) y la regin natural de residencia

del jefe de hogar [CUADRO VIII.11],


ambos en escala nominal para la condicin
de pobreza, al haber obtenido valores del
coeficiente de Pearson c(2) = 819652.7
y un p-valor = 0.000, esto con una
significancia (a) de 5%.

Cuadro VIII.11 Chi-Square Test


estado pobreza01
Value
pobre
Pearson Chi-Square 819652.7
Likelihood Ratio
N of Valid Cases

El grado de asociacin que se encuentra


en estas variables se puede apreciar en el
cuadro [CUADRO VIII.12] Symmetric
Measures, el cual nos muestra los
coeficientes de asociacin Phi=0.545,

879899.6
2764184

Asy mp. Sig.


(2-s ided)
.000

.000

df

Cramers V = 0.545, y el ya conocido


coeficiente de contingencia (CC)=0 .478,
que a pesar estos ltimos de mostrar un
alto grado de relacin entre 2 variables
medidas en una escala simple como es la

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 55

Centro de Investigacin y Desarrollo

nominal, puede mostrarnos cmo va


determinando en alguna medida su
influencia en la condicin de pobreza que

posee el jefe de hogar y cmo esta entrar


a tallar dentro la probabilidad que el
individuo obtenga dicha condicin.

Cuadro VIII.12 Symmetric Measures


e stad o
p obr eza
p obr e

Nom b y
Nom

P hi
Crame r's V
Con tinge n cy
Coe fficient

N of V ali d Cases

ANLISIS CUANTITATIVO
Si bien hemos mostrado relaciones con
variables importantes que en principio nos
muestran panoramas independientes de
la pobreza y el efecto que sobre la
condicin del jefe de hogar ejercen estas
variables de naturaleza cualitativa,
extrayndolas
del
fenmeno
multidimensional en su conjunto,
podemos tambin detenernos por
instantes dado que no es objetivo de esta
investigacin analizar como cierto tipo de
activo de capital humano se comportan
dentro de las distintas condiciones de
pobreza, entre ellos, aos de estudios del
jefe de hogar.
AOS DE ESTUDIOS DEL JEFE DE
HOGAR
Uno de los indicadores que muchos
consideran de suma importancia al analizar
la pobreza, es el de los aos de estudios
del jefe de hogar. Para el ao 2001
podemos observar [CUADRO VIII.13] que
el activo de capital humano referente a
los aos de estudios del jefe de hogar es
bajo, basta solo con observar que para el

V alu e
.545
.545

App rox. S ig.


.000
.000

.478

.000

2764 1 84

estado de pobreza el promedio de aos


de estudios se encuentra alrededor de 5,
pequeo en comparacin a que los jefes
de hogar en condicin de no pobreza
tienen en promedio alrededor de 10 aos
de estudios.
Dada la heterogeneidad y dispersin de
las poblaciones en estudio, el tomar como
valor del promedio de aos de estudios
los valores obtenidos, resulta errneo. En
tal sentido deberemos optar por la
mediana como mejor medida de ajuste a
esta variable. Se puede apreciar que en
promedio, el jefe de hogar pobre estara
alcanzando el grado de primaria (6 aos),
diferencia sustantiva con respecto a los
aos alcanzados por el jefe de hogar no
pobre que podra estar alcanzando al
completar el nivel de secundaria con los
11 aos en promedio de estudio que este
tendra. No debemos adems olvidar que
estamos considerando su conducta desde
la idea de un corte transversal hecho en
el tiempo y deben ser consideradas sus
implicancias respectivas, en caso se
decidiese, probarla con alguna otra variable
y analizar su comportamiento.

56 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

Cuadro VIII.13
Cuadro de aos de estudio del Jefe de Hogar segn Condicin de Pobreza

Aos de
estudios JH

Estado Pobreza
pobre

Promedio
Promedio sin 5% VE
Mediana
Desviacion Std.
Asimetra
Kurtosis
Promedio
Promedio sin 5% VE
Mediana
Desviacion Std.
Asimetra
Kurtosis

no pobre

Ms all de que la desigualdad existente


entre los dos grupos sea evidente, es
interesante confirmar cmo a travs de la
prueba de diferencia de medias
confirmamos tal. El [CUADRO VIII.14] nos
muestra en primer lugar el estadstico de
Levene14, el cual nos permite rechazar la
idea de igualdad de poblaciones pobre y
no pobre. Como ya probamos la diferencia
existente entre los aos de estudios de
jefes de hogar pobres y no pobres, con el
test de equivalencia de medias
rechazamos tal hiptesis, primero tomando
la fila de varianzas diferentes, que ya ha
sido probada y luego podemos ver que la

Statistic
5.36
5.17
6.00
4.30
.345
-.870
9.29
9.38
11.00
4.93
-.298
-.842

Std. Error
2.60E-03

.001
.003
2.80E-03

.001
.003

diferencia de medias es distinta de cero


(3.92), debido a un t = - 1026.487 y una
significancia de 0.000, lo cual
estadsticamente hablando nos permite
rechazar la idea de igualdad de medias al
nivel poblacional.
Probada esta diferencia de medias nos toca
ahora mostrar cmo la diferencia en aos
de estudios se hace cada vez ms notoria
a medida que el jefe de hogar se
encuentra en pobreza extrema, pobreza
no extrema y no pobreza, la cual ser
mostrada por nica vez, dado que no es
fin primordial de esta investigacin.

Cuadro VIII.14
Prueba de Levene para igualdad de varianzas y diferencia de medias
en los aos de estudios del JH
Levene's Test for
Equality of Variances

F
Aos de
estudios
jh

Asumiendo
varianzas iguales
Sin asumir
varianzas iguales

57766.511

Sig.
.000

t-test for Equality of Means

df

Sig. (2-tailed)

Mean
Difference

Std. Error
Difference

-1017.677

5834834

.000

-3.92

3.86E-03

-1026.487

5834386

.000

-3.92

3.82E-03

14/ Sabemos que el estadstico de Levene es resistente a la ausencia de normalidad de una distribucin analizada, en tal sentido
se propone como ms idneo para medir la homogeneidad de las varianzas.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 57

Centro de Investigacin y Desarrollo

Una prueba a la afirmacin anterior, la


podemos confirmar con la tendencia
creciente de la diferencia en los aos de
estudios del jefe de hogar a los diversos
niveles de pobreza que este posee.
Adems de confirmada la diferencia en
los promedios de aos de estudios, la

brecha diferenciadora y por ende el acceso


al capital humano importantsimo en la
poca actual se hace cada vez ms grande
porque resulta evidente que haber prdido
un ao de estudios en la dcada pasada
no es igual que perder un ao en la
actualidad.

Grfico VIII.5
Tendencia del Promedio de aos de estudio del jh
segn estado de pobreza

IC 95% - Aos de estudios jh

10
9
8
7
6
5
4
3
N =

1178530

1553196

3103109

P o b re E xtre m o

P o b re No E xtre m o

No P o b re

POBREZA
Cases weighted by FACTOR

8.2 Formulacin y adecuacin de los


modelos Logit y Probit con VDD,
en funcin de sus enfoques y las
variables o factores explicativos
ms significativos
Como ya vimos en captulos anteriores, la
diferenciacin terica de ambos modelos
an no ha sido descubierta en su total
cabalidad, se mencion que Amemiya
(1981) intenta hacer aproximaciones hacia
la resolucin de este problema pero en
general no se obtuvieron resultados
concretos.
Si bien tenemos la necesidad de mostrar
esta diferenciacin, partimos ahora de un

criterio eminentemente prctico. Se


sostiene que el ANLISIS PROBIT15 est
estrechamente ligado a la regresin
logstica. Es que si usamos la
transformacin logit estaramos calculando
esencialmente la regresin antes
mencionada. En general, el anlisis probit
con enfoque de proporciones muestrales
sera ms apropiado para diseo de
experimentos, en funcin a que su
procedimiento mide la relacin entre la
potencia de un estmulo y la proporcin
de casos que presentan una respuesta a
ese estmulo.
Se materializa esta idea a travs de un
ejemplo, querer saber qu tan efectivo

15/ SPSS para Windows, Realease 10.0.7 (2000)

58 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

es un nuevo pesticida para liquidar


insectos, cual sera la concentracin letal
efectiva a usar? Uno podra disear un
experimento en el cual se exponen
muestras de insectos a diferentes
concentraciones del insecticida, es decir,
tener el nmero de insectos expuestos en
dicha concentracin y entonces determinar
el nmero de insectos muertos bajo tal
efecto. Aplicando un anlisis probit a estos
datos, uno puede determinar la potencia
de la relacin entre la muerte de los
insectos y la dosis de pesticida adecuado
y determinar cul es el grado de
concentracin apropiado del insecticida
que me permitira estar seguro de matar
al 95% de los insectos expuestos.
Como resulta evidente, se est realizando
un enfoque cuantitativo, confirmado esto
adems en la lnea seguida por autores
como Green o Gujarati al formular sus
modelos de probabilidad. Pero como
puede apreciar se limita al hecho de
inclusin de pocas variables, ms an
siendo estas de ndole cuantitativo y
porque necesariamente tendra que
obtener la frecuencia de observaciones
que implican en primer lugar a las variables
independientes, vale decir por ejemplo
cantidad de jefes de hogar dentro de los
deciles de ingreso, luego determinar la
cantidad de jefes de hogar pobres dentro
de cada dcil, para poder saber la tasa de
respuesta a ese nivel de ingreso dentro
de la variable dependiente (la condicin
de pobreza). Si se decidiera incluir ms
variables independientes se tiene que
tomar en cuenta que debemos obtener
las frecuencias que resultan del cruce de
estas. Imaginarse tan solo el cruce los
diversos valores del ingreso per cpita con
el estado civil, la cantidad de miembros
de la familia y con los tipos de accesos a
activos pblicos como la luz, agua, entre
otros, empiezan a figurar la inviabilidad de
esta aplicacin.
Aqu es donde se producirn limitaciones
en la aplicacin de este enfoque debido a

que si bien se pueden obtener el cruce


de ellas, no esta regido a parmetros de
medicin exacta y continua, pues la
pobreza es un fenmeno de escala
multidimensional. Sera interesante poder
saber si la mezcla de escalas determinan
un nivel de medicin que me permitiese
acceder a la probabilidad exacta de ser
pobre.
A parte de la condicin de que las
observaciones deben ser independientes.
Si tenemos un gran cantidad de estas para
las variables independientes, la Chicuadrado (c) y los estadsticos de bondad
de ajuste pueden no ser vlidos.
Retomando la diferenciacin de ambos
modelos, podemos mencionar que la
regresin logstica con enfoque de casos
individuales es ms apropiada para estudios
observacionales. Usada tambin para
situaciones en las cuales uno quiere ser
capaz de predecir la presencia o ausencia
de una caracterstica o resultado basado
en valores de un conjunto de variables
predictoras. Los coeficientes del modelo
logit pueden ser usados para estimar Odds
Ratios (`Razn de probabilidades`) para
cada una de las variables independientes
en el modelo. La regresin logstica y por
ende el modelo logit, es aplicable a un
rango mayor de situaciones de
investigacin. Adicionalmente, como en
otras formas de regresin, la
multicolinealidad de las variables
independientes si no es manejable puede
generar estimadores sesgados o inflar el
error estndar.
8.2.1 Metodologas de estimacin de
los modelos de probabilidad
MODELO DE PROBABILIDAD DE LA
POBREZA EN EL JEFE DE HOGAR
A continuacin mostramos la metodologa
de estimacin del modelo de probabilidad
del jefe de hogar pobre del Per, para el

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 59

Centro de Investigacin y Desarrollo

ao 2001, tomada una muestra aleatoria


de alrededor del 50% (8233) de los jefes
de hogar de la encuesta nacional de
hogares segn los factores considerados
de importancia en la condicin de pobreza
de ste y obtenidos segn la informacin
de la ENAHO 2001 -IV TRIMESTRE,
Condiciones de Vida y Pobreza.
Enfoque de Observaciones
Individuales
Coeficientes para el modelo logit
El [CUADRO VIII.15] contiene los
coeficientes estimados (bajo la columna
encabezada por B) y los estadsticos
asociados al modelo que predice la
probabilidad de ser pobre del jefe de
hogar del Per en el ao 2001 en funcin
a caractersticas individuales del jefe de
hogar como el no tener nivel educativo,

edad, su indicador de experiencia laboral,


indicador de condicin ocupacional,
tamao de la firma, otro empleo; y
caractersticas asociadas al hogar como el
ingreso per cpita mensual, la cantidad de
miembros, y el indicador PET del hogar,
adems si la conexin de agua y servicios
es a travs de red pblica dentro de la
vivienda. Las variables (sinnivel, costa
urbana, costa rural, sierra urbana, sierra
rural, selva urbana, selva rural, obrero,
menos100pe, otroemple, conviviente,
sehigdviv, y las cuatro ltimas variables)
son indicadoras, codificadas con 0 y 1. El
valor de 1 para OBRERO indica que el jefe
de hogar tiene condicin ocupacional de
obrero, el valor de 1 para MENOS100PE
indica que el tamao de la firma en la que
trabaja es de menos de 100 personas, el
valor de 1 para OTROEMPLE indica que
el jefe de hogar posee actividad
secundaria por la que percibe ingresos.

Cuadro VIII.15 Variables en la ecuacin


B
SINNIVEL
EDAD
COSTA URBANA
SIERRA URBAN
SELVA URBANA
SELVA RURAL
INDEXPLABO
COLEGESTA
OBRERO
MENOS100PE
OTROEMPLE
INPERCAM
MIEPERHO
PETHOGAR
CONVIVIENTE
SEHIGDVIV
NOSERVHIGIE
AGUAVIV
ALUMKEROSE
EMPVIVINGRE
Constant

.911
-.072
-1.189
.570
.899
-.807
.070
.584
.451
.324
-.226
-.011
.517
-.313
.269
-.388
.270
-.168
.627
.288
.761

S.E.
.231
.011
.167
.098
.121
.125
.010
.189
.092
.095
.085
.000
.031
.040
.080
.093
.089
.082
.092
.083
.379

Wald
15.548
41.221
50.439
33.642
55.483
41.844
49.495
9.540
23.940
11.606
7.090
876.865
283.825
60.764
11.274
17.414
9.281
4.137
46.847
11.916
4.035

df
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

60 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Sig.
.000
.000
.000
.000
.000
.000
.000
.002
.000
.001
.008
.000
.000
.000
.001
.000
.002
.042
.000
.001
.045

Exp(B)
2.488
.931
.304
1.768
2.458
.446
1.072
1.793
1.570
1.383
.798
.989
1.677
.731
1.308
.678
1.310
.846
1.873
1.334
2.141

95.0% C.I.for EXP(B)


Lower
Upper
1.582
3.913
.910
.951
.219
.423
1.459
2.144
1.940
3.114
.349
.570
1.051
1.093
1.238
2.598
1.311
1.881
1.148
1.666
.675
.942
.988
.990
1.579
1.781
.676
.791
1.118
1.530
.565
.814
1.101
1.558
.719
.994
1.565
2.241
1.133
1.571

Centro de Investigacin y Desarrollo

Dados estos coeficientes, la ecuacin para


la probabilidad de ser pobre del jefe de
hogar se puede escribir como sigue:

Entonces la probabilidad de ser pobre del


jefe de hogar es:
Pr(Jefe de hogar pobre) = 0.65847

Pr(Jefe de Hogar Pobre) =

Pi =

1
1 + e Zi

ECUACIN VIII.4

ECUACIN VIII.1

Donde:
Zi = 0.761 + 0.911(sinnivel) 0.072(edad) - 1.189(costa urbana) +
0.570(sierra urbana) + 0.899(selva
urbana) - 0.807(selva rural) +
0.07(indexplabo) + 0.584(colegesta) +
0.451(obrero) + 0.324(menos100pe) 0.226(otroemple) -0.011(inpercam) +
0.517(mieperhog) - 0.313(pethogar) +
0.269(conviviente) -0.388(sehigdviv) +
0.270(noservhigie) - 0.168(aguaviv) +
0.627(alumkerose) + 0.288(empvivingre).
ECUACIN VIII.2

Aplicando esto a un jefe de hogar sin nivel


de educacin con 60 aos de edad de
Lima con un indicador de experiencia
laboral de 54 aos, desocupado, con un
ingreso per cpita mensual de s/.143.00,
con 4 miembros en su hogar, con 3
personas en la PET , que no es conviviente,
que no use el kerosene como tipo de
alumbrado en su hogar, que posee
conexin a red pblica dentro de la
vivienda tanto de agua como de
alcantarillado y no emplea parte de la
vivienda para ingresos dentro del hogar.
Zi
=
0.761
+
0.911(1)
0.072(60)...........-0.388(1) + 0.270(0) 0.168(1) + 0.627(0) + 0.288(0)

Basados en este estimado, podemos


predecir que el jefe de hogar con estas
caractersticas es pobre. En general, si la
probabilidad estimada del evento es
menor a 0.5, podemos decir que el
evento no va a ocurrir. Si la probabilidad
es mejor que 0.5, podemos decir que el
evento va a ocurrir y por lo tanto como en
el ejemplo, que el jefe de hogar es pobre.

Prueba de hiptesis
coeficientes

sobre los

Para tamaos de muestra grande, la prueba


de que un coeficiente es 0 es basada en
el estadstico de Wald, el cual tiene una
distribucin chi-cuadrado. Cuando una
variable tiene un grado de libertad, el
estadstico de Wald es el cuadrado del ratio
del coeficiente entre su error estndar. Para
variables categricas, el estadstico de
Wald tiene sus grados de libertad
equivalentes a uno menos el nmero de
categoras.
Por ejemplo, en el [CUADRO VIII.15] el
coeficiente de sin nivel de educacin es
0.911 y su error estndar es 0.231 (en el
cuadro la columna llamada S.E.). El
estadstico de Wald es (0.911/0.231)2
15.548. El nivel de significancia para el
estadstico de Wald es mostrada en la
columna Sig. En nuestro caso todas las
variables obtenidas en el modelo resultan
ser significativamente diferentes de cero,
para un nivel de significancia de 0.05.

ECUACIN VIII.3

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 61

Centro de Investigacin y Desarrollo

Otra manera ver de este anlisis, es a travs


de la prueba asociada a su efecto:
Ho : b (SINNIV) = 0, lo cual quiere decir
que el efecto de no tener educacin es
irrelevante, pero obteniendo un valor para
el estadsitico Wald de 15.548 y una
significancia de 0.000, rechazbamos esa
hiptesis nula afirmando que tal efecto es
significativamente distinto de cero y por
tal razn relevante para la probabilidad de
ser pobre del jefe de hogar.
De la misma manera podemos afirmar, por
ejemplo, con respecto a la significancia
de la cantidad de miembros en el hogar,
obteniendo un valor de 283.825 para el
estadstico de Wald, que se obtiene de
elevar al cuadrado la divisin del
coeficiente entre su respectivo Error
Estndar de estimacin, dems est
mencionar la relevancia de esta variable y
confirmar el efecto positivo (0.517) que
juega dentro de la probabilidad de ser
pobre del jefe de hogar.
Desafortunadamente, el estadstico de
Wald posee una propiedad indeseable.
Cuando el valor absoluto del coeficiente
de regresin llega a ser demasiado grande,
el error estndar tambin lo es. Esto
produce que el estadstico de Wald, sea
muy pequeo, por tal motivo no
estaramos rechazando la hiptesis nula de
que el coeficiente es 0, cuando en realidad
s deberamos. De all que cuando
tenemos un coeficiente grande, uno no
debera de confiar en el estadstico de
Wald para prueba de hiptesis. En vez de
ello, se debera construir un modelo con
la variable y otro sin variable y basar la
prueba de hiptesis en el cambio del log
de la funcin verosimilitud. (Hauck &
Donner, 1977).

Interpretacin de los coeficientes


Para entender la interpretacin de los
coeficientes de esta regresin,
consideramos un reordenamiento de la
ecuacin para el modelo logstico. Este
puede
ser
escrito
como
un
reordenamiento en trminos de las
razones (Odds) de ocurrencia de un
evento. (Las Odds (razn de
probabilidades) de ocurrencia de un
evento es definido como el ratio de la
probabilidad de que ocurra un evento
sobre la probabilidad de que no ocurra un
evento. Por ejemplo, la odds de obtener
cara en un lanzamiento de una moneda
sera 0.5/0.5 = 1. Similarmente, la odds
de obtener un corazn en una reparticin
de cartas ser 0.25/0.75 = 1/3. No debe
confundirse este significado tcnico de la
odds con su uso informal de un simple
promedio de probabilidad)
Escribimos el modelo logstico en trminos
del logaritmo de las odds, llamada como
sabemos logit:

log(

Pr( jhpobre)
) = 0 + 1 X 1 + ...... + pXp
Pr( jhnopobre)
ECUACIN VIII.5

De la ecuacin anterior, el coeficiente


logstico puede ser interpretado como un
cambio en el log odds asociado con un
cambio unitario en la variable
independiente. Por ejemplo, del
[CUADRO VIII.15] podemos ver que el
coeficiente para sinnivel es 0.911. Esto nos
indica que cuando el jefe de hogar no
posee nivel educativo y los valores de las
otras variables independientes se
mantienen constantes, el log odds (razn
de probabilidades) se incrementa en un
0.911.

62 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

La ecuacin de regresin puede ser escrita


en trminos de los odds como:

Pr ob( jhpobre)
=
Pr ob( jhnopobre)
e 0+ 1 X 1+......+ pXp = e 0e 1X 1...e pXp
ECUACIN VIII.6

En e radica el poder de Bi, que es el factor


por el cual la razn de probabilidades
(Odds) cambia cuando la i-sima
variable independiente se incrementa en
una unidad. Si Bi positivo, este factor va a
ser mayor que 1, lo cual significa que la
Odds se incrementa; si Bi es negativo, el
factor va a ser menor que uno, lo cual
significa que la Odds decrece. Cuando Bi
es 0, el factor equivale a 1, lo cual significa
que la odds no cambia.
En ese sentido result interesante ver
como al ser obrero es 1.6 veces ms
probable ser pobre que no serlo, es decir,
la Odds a favor de ser jefe de hogar pobre
cambia positivamente en 100 (1.570 - 1)%
=57% al tener condicin ocupacional de
obrero. De la misma manera pudimos dar
una lectura parecida, pero con los criterios
adecuados del caso, al afirmar que el tener
abastecimiento de agua dentro de la
vivienda a travs de red pblica le reduce
la probabilidad de ser pobre al jefe de

hogar, es decir, que su Odds se reduce o


cambia negativamente en 100(0.8461)%= 15.4%, y como mencionamos
anteriormente la probabilidad de ser jefe
de hogar pobre sera menor con respecto
a la probabilidad de ser no pobre.
Otra de las variables que resulta de inters,
es la del nmero de miembros del hogar,
donde se puede apreciar que dicha variable
aumenta positivamente el logit de la
probabilidad de ser pobre con respecto a
no serlo en 0.517. Es decir, que la Odds
(razn de probabilidades) a favor de ser
pobre cambia posivitivamente en
100(1.677-1)%= 67.7% al producirse el
aumento de 1 persona en la cantidad de
miembros del hogar.

Determinacin de la bondad de ajuste


del modelo
Existen varios caminos para determinar de
un modo u otro la calidad de ajuste del
modelo a los datos.
Tabla de clasificacin
Un camino para determinar que tan bien
nuestro modelo ajusta los datos es
comparar nuestras predicciones con los
resultados observados. El [CUADRO
VIII.16] muestra la tabla de clasificacin
para el modelo obtenido.

Cuadro VIII.16 Tabla de Clasificacin

Predicted

Observed
Estado pobreza

no pobre
pobre

Overall Percentage

Estado pobreza
no pobre
pobre
3400
701
519
3550

Percentage
Correct
82.9
87.2
85.1

a. El punto de corte es .50

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 63

Centro de Investigacin y Desarrollo

Del cuadro anterior vemos que 3400 jefes


de hogar no pobres fueron correctamente
clasificados por el modelo como jefes de
hogar en estado de no pobreza.
Similarmente, 3550 jefes de hogar pobres
fueron correctamente clasificados en
estado de pobreza. Los elementos fuera
de la diagonal de la tabla nos dicen cuntos
jefes de hogar fueron incorrectamente
clasificados. Un total de 1220 jefes de
hogar fueron mal clasificados- 701 jefes
de hogar no pobres y 519 jefes de hogar
pobres. De los jefes de hogar no pobres
el 82.9% fueron correctamente
clasificados. De los jefes de hogar pobres
el 87.2% fueron correctamente
clasificados. Del total, el 85.1% de los
8170 jefes de hogar tomados para ser
analizados fueron correctamente
clasificados.

Otro camino de acceso a la bondad de


ajuste del modelo es examinar que tan
bien los resultados de la muestra actual
nos
dan
los
parmetros
estimados. La probabilidad de los resultados
observados, dados los parmetros
estimados, es conocida como la
verosimilitud (likelihood). Como la
verosimilitud es un nmero pequeo
menor que uno, se usa generalmente -2
veces el logaritmo de la verosimilitud (2LL) como una medida para verificar que
tan bien el modelo estimado ajusta los
datos. Un buen modelo es aquel que tiene
una alta verosimilitud obtenida de los
resultados observados. Lo cual se traducira
en un pequeo valor para -2LL. (Si un
modelo ajusta perfectamente, la
verosimilitud es 1, y -2 veces el log
likelihood es 0).

Bondad de ajuste del modelo

Ahora, para el modelo logit y de regresin


logstica de los jefes de hogar, un modelo
con solo la constante nos da un -2LL igual
a 11325.9 como se muestra en el
[CUADRO VIII.17].

Observando que tan bien clasifica el


modelo los casos observados es uno de
los caminos para determinar la potencia
del modelo logit y la regresin logstica.

Cuadro VIII.17 Historia de Iteracin


Iteracin
Step 0

-2 Log likelihood
11325.900

a,b,c

Coefficients
Constant
-.008

a. Constante es incluida en el modelo.


b. Inicial -2 Log Likelihood(-2LL): 11325.900
c. Estimacin terminada en iteracin N 1 porque
log-likelihood decrece en menos de .01%.

Bondad de ajuste con todas las


variables
El [CUADRO VIII.18] nos muestra la
bondad de ajuste para el modelo con todas
las variables independientes [CUADRO
VIII.15]. Para este modelo el valor de -2LL

es 5683.192, el cual es menor que el 2LL para el modelo solo con la constante.
La bondad de ajuste puede apreciarse
adems en los estadsticos R2 de Cox &
Snell (0.499) y de Nagelkerke (0.665), que
nos explican el porcentaje de variacin
explicada por el modelo.

64 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

Cuadro VIII.18 Model Summary


Step
20

-2 Log
likelihood
5683.192

Cox & Snell


R Square
.499

Existen otros estadsticos [CUADRO


VIII.19] que nos permiten abordar el ajuste
del modelo. Ellos son llamados X2 para el
modelo, el bloque y el paso de iteracin.
Para el caso de los jefes de hogar, la X2
del modelo es la diferencia entre -2LL para
el modelo solo con la constante y -2LL
para el modelo con todas las variables
independientes. Es decir, se prueba la
hiptesis nula que sostiene que el modelo
con solo la constante es mejor que el
modelo con todos los factores incluidos,
es decir:

c(20 g.l.) = -2 (LnL(solo con cte.) LnL(con factores covariantes)) = 11325.9


- 5683.192 = 5642.707, la cual frente a
un c(20 g.l., 5%)=31.41, rechaza la
hiptesis nula de que el efecto de todas
las variables explicativas incluidas, excepto

Nagelkerke
R Square
.665

la constante, es 0. De all que podemos


afirmar que este modelo es mejor y
mantener L = bX. La misma manera de
proceder se realiza para una comparacin
entre diversos modelos que incluyen una
cantidad diversa de factores explicativos.
Este estadstico es comparable a la prueba
F para la regresin clsica. Los grados de
libertad para c modelo son la diferencia
entre el nmero de parmetros de los dos
modelos.
Con respecto a la c del paso (Step), se
refiere al cambio en -2LL para este ltimo
paso en la construccin del modelo.
Probara la hiptesis nula que el efecto de
este paso no es significativamente
diferente de 0, lo cual es rechazado de
acuerdo a su significancia de 0.042

Cuadro VIII.19 Omnibus Test of Model Coefficients


Step 20

Step
Block
Model

Chi-sq uare
4.126
5642 .707
5642 .707

Con respecto a la c del bloque sera el


cambio en -2LL entre los sucesivos bloques
en la construccin del modelo. Prueba la
hiptesis nula que los coeficientes para el
conjunto de variables adicionadas en el
ltimo paso son 0. En el caso de los jefes
de hogar, consideramos solo dos modelos:
el modelo solo con la constante y el
modelo con todas las variables

df
1
20
20

Sig.
.042
.000
.000

independientes [CUADRO VIII.15], por


tal motivo la c del modelo y del bloque
tienen los mismos valores. Si se consideran
secuencialmente otros modelos a parte de
estos dos, usando los mtodos de
seleccin de variables Fordward o
Backward, las c para el modelo y para el
bloque van a ser diferentes.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 65

Centro de Investigacin y Desarrollo

Mtodos de diagnstico
Cuando se construye un modelo
estadstico, es importante examinar la
calidad de los resultados obtenidos. En
regresin lineal, observamos una variedad
de residuales, medidas de influencia e
indicadores de colinealidad. Existen
herramientas valiosas, para identificar
puntos donde el modelo no puede ajustar
bien, puntos que ejercen fuerte influencia
sobre los coeficientes estimados, y
variables que son altamente relacionadas
unas con otras. En regresin logstica y el
modelo logit existen diagnsticos
comparables que deberan ser usados para
detectar problemas.
El residual es la diferencia entre la
probabilidad observada del evento y la
probabilidad predicha del evento basado
en el modelo. Por ejemplo, si predecimos
que la probabilidad de ser pobre es 0.75
para un jefe de hogar pobre, su residual
es 1 -0.75 = 0.25.
El residual estandarizado (standardized
residual) es el residual dividido por un
estimado de su desviacin estndar. En este
caso ser:

Zi =

residuali
Pi (1 P i )
ECUACIN VIII.7

Para cada observacin, el residual


estandarizado puede adems ser
considerado una componente del
estadstico de bondad de ajuste c. Si el
tamao de muestra es grande, el residual
estandarizado debera aproximarse a una
distribucin normal, con media 0 y
desviacin estndar de 1.

Para cada observacin, la deviance es


calculada como:
-2*log (probabilidad calculada para el
grupo observado)
ECUACIN VIII.8

La deviance es calculada tomando la raz


cuadrada del estadstico anterior y
adicionndole un signo negativo si el
evento no ocurre para dicha observacin.
Por ejemplo, la deviance para un jefe de
hogar no pobre y una probabilidad
calculada de 0.45 de ser no pobre es

Deviance = 2 log(0.45) = 0.833


ECUACIN VIII.9

Valores grandes para la deviance indican


que el modelo no ajusta bien la
observacin. Para tamaos de muestra
grande, la deviance es aproximadamente
una distribucin normal.
El Studentized residual para cada
observacin es el cambio en la deviance
del modelo si el caso es excluido.
Discrepancias entre la deviance y el
studentized residual pueden identificar
casos inusuales. Una grfica de
probabilidad normal de los studentized
residuals puede ser muy til.
El logit residual es el residual para el
modelo si la prediccin esta en la escala
logit.

Logitresidi =

residuali
Pi (1 Pi )
ECUACIN VIII.10

El leverage en la regresin logstica es en


muchos aspectos anlogo al leverage en

66 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

la regresin de mnimos cuadrados. Los


valores de leverage son siempre usados
para detectar observaciones que tienen
gran impacto en los valores predecidos. A
diferencia de la regresin lineal, los valores
leverage en esta regresin dependen de
las puntuaciones de la variable
dependiente y del diseo de la matriz. Los
valores de los leverage estn restringidos
entre 0 y 1. Su valor promedio es p/n,
donde p es el nmero de parmetros
estimados en el modelo, incluyendo la
constante, y n es el tamao de la muestra.
La Cooks distance es la medida de la
influencia de una observacin. Nos dice
cunto afecta no solo en el residual para
esta observacin, sino tambin sobre el
residual del resto de observaciones
restantes cuando se elimina dicho caso.
La Cooks distance (D) depende de su
residual estandarizado, as como de su
leverage. Esta definido como:

Di =

Z i * hi
(1 hi ) 2
ECUACIN VIII.11

Donde Zi es su residual estandarizado y hi


es su leverage.
Otra medida de diagnstico til es el
cambio en los coeficientes del modelo
cuando una observacin es retirada del
modelo, o DFBeta. Se puede calcular el
cambio en cada coeficiente, incluyendo
la constante. Un ejemplo sera el cambio
en el primer coeficiente cuando el caso i
es borrado

DfBeta( B1( i ) ) = B1 B1( i )


ECUACIN VIII.12

Donde B 1 es el valor del coeficiente


cuando todas las observaciones son
incluidas en el modelo y B1(i) es el valor
del coeficiente cuando la i-sima
observacin es retirada. Valores grandes
de cambio identifican observaciones que
deben ser examinadas.

Diagnsticos de grficas
Todos los estadsticos descritos hasta ahora
pueden ser grabados para este anlisis en
la matriz de casos/variables. Cuando se
considere conveniente, se pueden
obtener grficas de probabilidad normal
usando el procedimiento de exploracin
y grficas de dignstico usando
procedimientos grficos.
El [GRFICO VIII.6] muestra la grfica de
probabilidad normal Q-Q y la grfica QQ de desviaciones respecto a la normal.
En el caso de la grfica izquierda Q-Q
(Quantiles reales y tericos de una
distribucin normal) de probabilidad
normal, los valores correspondientes a una
distribucin normal terica vienen
representados por la recta y los puntos son
los valores de la deviance de los jefes de
hogar. Como vemos estos puntos, en su
mayora, estn prximos a la recta, lo cual
indica que el ajuste es aceptable. Confirma
esto la suposicin hecha con respecto a
los tamaos de muestra grande. Para el
caso de aquellos valores de deviance muy
superiores a 2, el modelo no ajusta muy
bien dichas observaciones, pero se debe
considerar que estos corresponden
probabilidades de mala clasificacin de los
jefes de hogar, en tal sentido, se puede
optar por su eliminacin o por el anlisis
de los estadsticos de Cooks y DfBetas
para ver la influencia de dichas
observaciones.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 67

Centro de Investigacin y Desarrollo

Con respecto a la grfica Q-Q del lado


derecho de desviaciones de la normal,
recoge las deviances de los jefes de hogar
respecto de la recta. Si la muestra procede
de una poblacin normal, los puntos deben
fluctuar alrededor de "0" y no seguir un
patrn determinado. Como se pude

apreciar con respecto a la mayora de


observaciones sus desviaciones fluctan
alrededor de "0", lo que confirma la idea
de distribucin normal para tamaos de
muestra grandes por parte de las
deviances.

Grfico VIII.6
Grfica Q-Q Desviaciones de
la Normal Valores Deviance

Grfica Normal Q-Q para Deviance


3.0

Desv. de D. Normal

Valores Esperados D. Normal

-2

2.5
2.0

1.5
1.0

.5

0.0
-.5

-4
-4

-2

-4

-2

Una grfica de los residuales estandarizados


para cada observacin se muestra en la
[GRFICA VIII.7], all podemos ver como
los residuales toman valores grandes fuera

del rango de variacin permitido.


Hablamos especficamente para aquellos
casos donde sus residuales toman valores
superiores a 3.

Grfico VIII.7
Grfica de Residuales Estandarizados
6

Residual Standard

-2

-4
2000

Valores Observados

Valores Observados

4000

6000

Observaciones

68 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

8000

10000

Centro de Investigacin y Desarrollo

En la [GRFICA VIII.8] se muestra que


no existen en general casos que tengan
un valor de leverage muy diferenciador
unos de otros, cumplindose en primer
lugar el rango de variacin sobre el cual
vara, 0 y 1. En segundo lugar, si se quiere

ser estricto, el mayor valor diferenciador


que se encontr para el leverage se
encuentra alrededor de 0.02, lo que no
nos llevara a afirmar que dicho caso tiene
un gran impacto sobre los valores
predichos.

Grfico VIII.8
Grfica de Leverage por Observacin

Valores Leverage

.0 3

.0 2

.0 1

0 .0 0
0

2000

4000

6000

8000

10000

Observaciones

En la [GRFICA VIII.9] se muestra que


existen algunos casos que tienen sustancial
impacto en la estimacin del coeficiente
de la variable indicadora sin nivel educativo
( casos 4656 y 7198), los valores para
Dfbeta sinnivel de estas observaciones se
encuentran alrededor de -0.04 - valores
extremos. Examinando la data se revela
que el primer caso (4656), ms prximo a
-0.06, es un jefe de hogar sin nivel de
educacin, de la selva rural, hombre de
41 aos, conviviente pero en estado de
no pobreza, que trabaja solo en su
actividad principal. En el caso de la segunda
observacin (7198), valor ms prximo a
-0.04, es un jefe de hogar con primaria,

de la costa urbana, mujer de 50 aos, en


estado de pobreza no extrema, trabajadora
independiente con solo actividad principal.
Podemos ver que estos dos casos son
inusuales de acuerdo a las relaciones
obtenidas en el [CUADRO VIII.15].
Si retirsemos el caso 4656 del anlisis, el
coeficiente de la variable sinnivel de
educacin cambiara de 0.911 a -0.04731,
con lo cual se vera perjudicado, y se
convertira en un mal predictor o variable
explicativa. Lo mismo sucede si
retirsemos el caso 7198, con lo cual el
coeficiente variara de 0.911 a -0.03660,
con los efectos del caso ya conocidos.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 69

Centro de Investigacin y Desarrollo

Grfico VIII.9
Grfica de DfBeta SINNIVEL por Observacin
.04

DFBETA SINNIV

.02

0.00

-.02

-.04

-.06
0

2000

4000

6000

8000

10000

Observaciones

Enfoque de proporciones muestrales


Modelo probit
En primer lugar intentaremos ejemplificar
a qu nos referimos con la idea de tasas
de respuesta o de proporciones

muestrales dentro de este anlisis.


Supongamos que se desea estimar la
condicin de pobreza del individuo en
funcin a sus deciles de ingreso, en tal
sentido correspondera obtener la
siguiente informacin [CUADRO VIII.20]

Cuadro VIII.20
Deciles de Jefes de hogar Jefes de hogar pobres
Ingreso
en deciles (Ni) en deciles (ni)
Decil I
1789
1737
Decil II
1811
1711
Decil III
1782
1554
Decil IV
1705
1211
Decil V
1702
855
Decil VI
1730
531
Decil VII
1623
264
Decil VIII
1582
154
Decil IX
1498
89
Decil X
1293
21

Como aqu se tiene las probabilidades (Pi)


o proporciones muestrales de ser jefe de
hogar pobre segn decil de ingreso
(ninperca), obviando las limitaciones que
la tcnica posee en cuanto al tamao de

observaciones que deben entrar en el


anlisis, estimamos un modelo de
probabilidad de ser pobre del jefe de
hogar en funcin al dcil de ingreso.

70 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

PROBIT

ANALYSIS

MODEL Information
ONLY Normal Sigmoid is requested.
Parameter estimates converged after 11 iterations.
Optimal solution found.
Parameter Estimates (PROBIT model: (PROBIT(p)) = Intercept + BX):
Regression Coeff.
Standard Error
Coeff./S.E.
NINPERCA

-.00678

.00013

-53.42949

Intercept

S.Error

Intercept/S.E.

EPOBRE

.72278
.75554

.00094
.00057

767.70752
1322.62124

pobre
no pobre

Pearson Goodness-of-Fit Chi Square = 9392340.38 DF = 16512 P = .000


Parallelism Test Chi Square = 9300657.30 DF = 1 P = .000

Dado que el nivel de significancia de la


bondad de ajuste del estadstico Pearsonc es pequeo, empiezan a evidenciarse
razones para dudar del modelo.

Se puede apreciar [CUADRO VIII.21] que


el modelo parece no ajustar
correctamente las probabilidades
observadas de los jefes de hogar en
funcin a su dcil de ingreso.

Cuadro VIII.21 Frecuencias Observadas y Esperadas


EPOBRE
0
0
0
0
0
0
0
0
0
0

NINPERCA
6.00
8.00
3.00
6.00
5.00
9.00
3.00
6.00
5.00
4.00

Number of
Subjects
1730.0
1582.0
1782.0
1730.0
1702.0
1498.0
1782.0
1730.0
1702.0
1705.0

Observed
Responses
531.0
154.0
1554.0
531.0
855.0
89.0
1554.0
531.0
855.0
1211.0

En ese sentido tendramos que la


ecuacin con respecto a la condicin de
pobreza:

Expected
Responses
1319.386
1199.852
1370.164
1319.386
1301.590
1132.967
1370.164
1319.386
1301.590
1307.430

(PROBIT(p)) =
(PROBIT(p)) =

Residual

Prob

-788.386
-1045.852
183.836
-788.386
-446.590
-1043.967
183.836
-788.386
-446.590
-96.430

.76265
.75844
.76889
.76265
.76474
.75632
.76889
.76265
.76474
.76682

Intercept + BX
.72278 -.00678*
NINPERCA

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 71

Centro de Investigacin y Desarrollo

El resultado obtenido debe ser tomado


con cuidado en el sentido del cambio que
se producira sobre el probit de la
probabilidad de ser pobre. sta debe ser
transformada para llegar a la cantidad sobre
la cual variara en la distribucin normal
(Un aumento hacia los deciles ms ricos
reduce el valor de la transformacin probit
alrededor de un 0.6%).
Resulta interesante mostrar como existe
una relacin en algn sentido lineal ,
presente entre las transformaciones probit
(Z) en la distribucin normal y las
probabilidades de la variable respuesta, es
decir, la frecuencia relativa con respecto
del jefe de hogar pobre en el decil
correspondiente, podemos ver [GRFICO
VIII.10] la relacin inversa en el estado
de pobreza de las transformaciones probit
y el decil de ingreso, es decir, como a
medida que se da un aumento de los
dciles, por ende del nivel de ingreso per

cpita, la probabilidades de ser pobre


asociadas al jefe de hogar y su
transformacin probit disminuyen.
No debemos olvidar algunas de las
consideraciones que hicimos al empezar
este anlisis donde se sostuvo que algunos
de los estimadores pueden resultar no
tiles cuando manejamos tamaos de
muestra bastante grandes, en este sentido
resultara importante el modelo logit con
observaciones individuales para este tipo
de condicionamientos, adems si no se
hubiese procedido a agrupar la muestra
por niveles o valores del estmulo (deciles
de ingreso), se podra haber aplicado este
ltimo, y haber obtenido las
cuantificaciones de aportes en la
probabilidad de que un jefe de hogar sea
clasificado como pobre o no, en funcin a
su nivel de educacin, la cantidad de hijos
que este tiene, si este accede a luz elctrica
dentro de su hogar, etc.

Grfico VIII.10
Tasa de Respuesta
TRAMSFORMACIONES PROBIT

-1

es tado pobrez a
-2
no pobre
-3

pobre
0

DECILES DE INGRESO

72 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

10

12

Centro de Investigacin y Desarrollo

ANLISIS DEL MODELO SOBRE LA


PROBABILIDAD DE POBREZA EN EL
JEFE DE HOGAR DEL PER PARA EL
AO 2001

para medir la validez y confiabilidad de la


estimacin realizada en la metodologa.
La probabilidad de ser un jefe de hogar
pobre para el ao 2001 [CUADRO VIII.22]
vendra a estar fuertemente ligada a la
ausencia de activos de capital humano
como el de no tener nivel de educacin
alguno, contribuyendo este a elevar el logit
de su probabilidad de ser pobre en un
94.7% (MODELO N 1), creciendo hasta
un 114.8% (MODELO N 2) y
reducindose hasta un 78.5% (MODELO
N 3). Resulta interesantsimo y no puede
ser dejado de lado por su significancia,
ver que ser un jefe de hogar que ha
recibido su educacin en colegio estatal
aumenta el logit de su probabilidad
alrededor de un 60%, manteniendo el
efecto de las dems variables constantes

EL MODELO LOGIT (Observaciones


individuales)
Con respecto al cuadro siguiente, se van
a analizar 3 modelos, el modelo n 1, que
no incorpora los efectos de diseo de la
muestra, con el objetivo de mostrar en
que medida varan la inferencia a nivel
poblacional comparada con los modelos
que s incorporan los factores de expansin,
en este caso los modelos n 2 y n 3, en
el caso del modelo n 2, se expande la
muestra tomada para construir la
metodologa (muestra aleatoria de 8233
hogares) y en el caso del modelo n3 se
toma el resto de la muestra (8282 hogares)

Cuadro VIII.22
Incidencia en la probabilidad de ser pobre a nivel nacional
E P O B RE

S IN N IV E L
E DA D
A .R U R A L
S IE R R A
SEL VA

M O D E LO N 1
C o e f.
P> z
0 .9 47
-0 .0 7
-0 .9 96
0 .8 52
0 .5 73

M O D E LO N 2
C oe f.
P > |t |

0.0 00
0.0 00
0.0 00
0.0 00
0.0 00

1.1 4 8
- 0.0 8 3

M O D E LO N 3
C oe f.
P > | t|

0 .0 00
0 .0 00

0.7 8 5
- 0.0 6 8

0 .0 01
0 .0 00

- 0.3 9 2
- 1.4 5 6

0 .0 01
0 .0 00

C O S T A R UR

- 0.3 5 8
- 1.3 8 8

0 .0 04
0 .0 00

S IE R R A U R B

0.2 3 2

0 .0 94

S IE R R A R U R

- 0.1 7 2
- 0.9 9 1

0 .2 77
0 .0 00

- 0.5 7 1
- 1.1 1 3

0 .0 00
0 .0 00

C O S T A U RB

SEL VA R U R
IN D E X P L A B

0 .0 69

0.0 00

0.0 7 9

0 .0 00

0.0 7 0

0 .0 00

CO L EG E S T A

0 .6 01
0 .4 44

0.0 00
0.0 00

0.8 0 2
0.3 8 6

0 .0 00
0 .0 01

0.5 0 2
0.4 8 5

0 .0 09
0 .0 00

0 .3 51
-0 .2 23
-0 .0 11

0.0 00
0.0 1
0.0 00

0.3 3 3
- 0.2 7 9
- 0.0 0 9

0 .0 11
0 .0 19
0 .0 00

0.2 3 8

0 .0 26

0 .5 15
-0 .3 18
0 .2 67
-0 .4 16
0 .2 86
-0 .1 39
0 .5 93
-0 .2 84
1 .2 36

0.0 00
0.0 00
0.0 00
0.0 00
0.0 00
0.0 00
0.0 00
0.0 00
0.0 00

0.5 3 9
- 0.3 2 2
0.3 2 0
- 0.3 6 9
0.3 1 7
- 0.2 3 5
0.6 6 6
- 0.1 4 3
1.1 2 7

0 .0 00
0 .0 00
0 .0 02
0 .0 03
0 .0 10
0 .0 23
0 .0 00
0 .1 89
0 .0 08

O BR E R O
M E NO S 1 0 0 P E
O TR O E M P L
IN P E R C A M
M IE P E R H O
P ET HO G AR
C O N V I V IE N
S E H IG D V I V
NO S E HIG
AG U AV IV
A LU M K E R O
E M P V IV I
CO N S T

O bs e rv a c i on e s
LR c h i-s q u a r e
P ro b > c h i 2
S e u do R a j us t
CC

81 70
5 6 0 4.5
0.0 00
0.4 90
8 4 .01 0

O bs e rv a c io n e s
Ta m . P o b la c
F( 2 1 ,

2 5 9 3)

P ro b > F
CC

8 1 70
29 249 40
3 8 .40 0
0 .0 00
84 .1

- 0.0 1 1

0 .0 00

0.4 8 2
- 0.2 5 0
0.1 1 6
- 0.5 1 5
0.2 2 3

0 .0 00
0 .0 00
0 .2 43
0 .0 00
0 .0 48

0.6 3 9

0 .0 00

1.3 9 4

0 .0 00

O bs e rv a c io n e s
Ta m . P o b la c
F( 1 7 , 2 6 0 7 )
P ro b > F
CC

8 20 2
2 9 09 8 95
49 .5 30
0 .0 00
84 .6

S ig n if ic a n c i a : 5 %
Fu e n te : E N AH O I V TR I M . 2 0 0 1

E la b o ra c i n :C ID E

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 73

Centro de Investigacin y Desarrollo

para el primer modelo; en el caso de los


modelos 2 y 3 , aumentan alrededor de
un 80% y un 50% respectivamente.
Como ya se habr podido percibir, el
poseer coeficientes positivos sobre el
modelo logit de probabilidad beneficia en
trminos absolutos a la probabilidad de ser
pobre comparada con su complementaria
en una razn de probabilidades.
En el aspecto de la situacin ocupacional
en que se encuentra el jefe de hogar,
podemos mencionar que estar en
condicin de obrero aumenta el logit de
su probabilidad de ser pobre entre un 39%
y un 49% en los 2 ltimos modelos
respectivamente. Una situacin muy
distinta poseera el jefe de hogar que
tendra otra ocupacin, donde el efecto
en el logit de su probabilidad de ser pobre
desciende entre un 22% y un 27% en los
2 primeros modelos, manteniendo
constante el efecto del resto de variables,
mientras que en el tercero resultara no
significativo.
La idea de una reduccin del tamao de
la familia para reducir su probabilidad de
ser pobre es sustentada aqu, en funcin
del hecho de que un aumento de
miembros en el hogar estara
contribuyendo entre un 52% y un 54%
en los 2 primeros modelos y en un 48%
en el tercer modelo, a elevar el logit de
su probabilidad, siempre que se mantenga
el efecto del resto de variables constantes.
Con respecto a activos pblicos a los que
podra acceder el hogar, la no tenencia de
acceso a servicios higinicos en su
vivienda, aparte de detectar una condicin
precaria, provoca un incremento en su
logit de probabilidad de alrededor de un
29% y 32% en el primer y segundo
modelo respectivamente, en el caso del

tercero, el incremento es de alrededor de


un 22%; distinto el panorama y ms an
de seguro en su condicin, cuando este
posee conexin a red pblica de
alcantarillado dentro de su vivienda,
reduciendo as su logit en un 41.6%.
(MODELO N 1), hasta un 36.9%
(MODELO N 2) y hasta un 51.5%
(MODELO N 3), con lo cual se sigue
ratificando a la condicin de inaccesibilidad
a servicios pblicos como un factor muy
importante dentro de la condicin de
pobreza que puede poseer el jefe de
hogar.
Observando la parte estadstica el primer
modelo presenta estimaciones seudo - R
del 50% y un porcentaje de clasificacin
de 84.01%. En el caso de los modelos 2 y
3, al incluir los factores de expansin
tratamos con tamaos de poblacin de
alrededor de 2`924,940 y 2`909,895
hogares, para el primero y segundo
respectivamente; el porcentaje de correcta
clasificacin para estos modelos flucta
entre un 84.1 (modelo n2) y un 84.6
(modelo n3).
Debemos hacer hincapi en un aspecto
que puede generar discusin en el sentido
terico estadstico estricto. En el primer
modelo existen influencias negativas en
la probabilidad, es decir, que si el jefe de
hogar pertenece al rea rural su
probabilidad de ser pobre decrece en un
99.6%, mientras que si este pertenece a
las regiones naturales de la sierra y de la
selva sus probabilidades aumentan
alrededor de un 85% y un 57%. Este
resultado es producido por la
multicolinealidad existente en la relacin
entre regin natural y rea de residencia
del jefe de hogar, cuya relacin fue probada
en la parte de anlisis descriptivo
[CUADRO VIII.10], Una de las medidas

74 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

tomadas para contrarrestar este efecto fue


el de retirar esas variables y colocar otras
indicadoras que representan a las regiones
naturales y el rea de residencia del jefe
de hogar, vale decir costa urbana. sierra
rural, etc, por mencionar algunos
ejemplos; lo que sucede all con las
probabilidades de ser pobre es que estas
se reduciran, es decir, que las otras
regiones tienen comportamientos
diferenciadores con respecto a ingresos y
gastos, sueldos, salarios, condiciones de
acceso muy por debajo de los que se
presentan en Lima. En tal sentido, las
caractersticas diferenciadoras ms
especificas de cada regin determinan
aplicaciones de modelos inherentes a cada
una.
Dadas las caractersticas de esta
investigacin metodolgica, no se ha
profundizado an ms en la generacin
de tales modelos, pues los objetivos
buscados estn ms orientados hacia la
parte de diferenciacin de enfoques y
mtodos de estimacin de los modelos
logit y probit, y ms especficamente hacia
el enfoque de proporciones individuales
en estos dos ltimos modelos estimados.
EL MODELO PROBIT
De la misma manera que en el modelo
logit, realizamos la estimacin de 3
modelos, donde en el primer caso no se
emplean los efectos
de diseo
provenientes de la encuesta compleja que
es la ENAHO. En el caso de los modelos
n 2 y n 3, como se mencion lneas
antes, en el primero se trabaja con la
muestra aleatoria con la que se construy
la metodologa (8233 hogares) y que
constituye el 50% del total de
observaciones, para que luego dicha
estimacin sea evaluada en cuanto a

validez y confiabilidad con el resto de casos


(8282 hogares), y aplicando en cada uno
de ellos los factores de ponderacin
correspondientes.
Siguiendo el enfoque de estimacin
mximo-verosmil, procedimos a estimar
el modelo de probabilidad de un jefe de
hogar pobre apoyados en la suposicin que
la distribucin de los errores sigue una
distribucin normal debido a la gran
cantidad de observaciones manejadas.
Podemos observar [CUADRO VIII.23],
que no tener nivel de educacin alguno
tiene un efecto positivo sobre la
probabilidad de ser un jefe de hogar
pobre, aumentando el probit alrededor de
un 53% y un 68% en los 2 primeros
modelos y en un 42.3% en el tercero.
Planteamos aqu la misma idea de
discusin del modelo logit, acerca de la
multicolinealidad con respecto al rea y
regiones naturales de residencia, sobre qu
medida asumir, para el caso del modelo
n1 sin aplicacin de factores de expansin.
La dimensin regional es importante, es
decir, el hecho de vivir en zonas urbanas
como rurales de la costa sierra y selva
(modelos n 2 y n 3), controlando por el
resto de variables (algunas de las cuales
tratan de enfocarse en la capacidad de
consumo y de generacin de ingresos del
hogar), estaran reduciendo la probabilidad
de ser pobre, pues los ingresos por trabajo
seran superiores a los de las otras regiones
y el monto de la canasta bsica en zonas
rurales es tremendamente menor que en
zonas urbanas y sobre todo comparadas
con la categora base que sera Lima. Ello
estara explicando por qu el solo hecho
de vivir en la costa rural, luego de controlar
el efecto por el resto de variables
indicadas, reduce el probit de la

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 75

Centro de Investigacin y Desarrollo

Cuadro VIII.23
Incidencia en la probabilidad de ser pobre a nivel nacional
E P O B RE
S IN N IV E L
E DA D
A .R U R A L
S IE R R A
SEL VA

M O DE L O N 1
C o e f.
P> z
0 .5 3 4
-0 .0 4 5

0 .0 0 0
0 .0 0 0

-0 .5 4 0
0 .5 0 0
0 .3 0 7

0 .0 0 0
0 .0 0 0
0 .0 0 0

M O DE L O N 2
C o e f.
P > |t |

CO ST A U RB
CO ST A R UR

M O D E LO N 3
C oef .
P > | t|

0 .6 8 3
- 0.05 0

0 .0 0 0
0 .0 0 0

0 .4 2 3
- 0.04 8

0 .0 0 2
0 .0 0 0

- 0.23 2
- 0.83 0

0 .0 0 1
0 .0 0 0

- 0.23 3
- 0.80 5

0 .0 0 0
0 .0 0 0

0 .1 7 5
0 .0 0 0
0 .0 0 0

- 0.22 4
- 0.61 6
0 .0 4 8

0 .0 1 3
0 .0 0 0
0 .0 0 0

0 .2 8 4
0 .2 5 0

0 .0 1 0
0 .0 0 0

S IE R R A U R B

IN D E X P L A B

0 .0 4 3

0 .0 0 0

- 0.11 1
- 0.60 2
0 .0 4 8

CO L E G E S T A

0 .3 3 3
0 .2 0 6

0 .0 0 1
0 .0 0 0

0 .4 6 9
0 .1 7 8

0 .0 0 0
0 .0 0 8

S IE R R A R U R
SEL VA R U R

O BR E R O
M E NO S 1 00 P E
O TR O E M P L
IN P E R C A M
M IE P E R H O
P ET HO G AR
C O N V I V IE N
S E H IG D V I V
NO SE HIG
AG U AV IV
A LU M K E R O
E M P V IV I
CO N S T

0 .2 4 3

0 .0 0 0

0 .2 2 2

0 .0 0 3

0 .1 6 8

0 .0 0 4

-0 .1 2 2
-0 .0 0 5
0 .3 0 4

0 .0 1 0
0 .0 0 0
0 .0 0 0

- 0.15 6
- 0.00 4
0 .3 0 9

0 .0 2 6
0 .0 0 0
0 .0 0 0

- 0.00 5
0 .3 0 4

0 .0 0 0
0 .0 0 0

-0 .2 0 0
0 .1 5 1
-0 .2 8 4

0 .0 0 0
0 .0 0 1
0 .0 0 0

- 0.19 5
0 .1 8 7
- 0.28 2

0 .0 0 0
0 .0 0 2
0 .0 0 0

- 0.18 0
0 .0 9 1
- 0.32 8

0 .0 0 0
0 .1 2 1
0 .0 0 0

0 .1 6 8
-0 .0 7 3
0 .3 5 7

0 .0 0 1
0 .1 1 7
0 .0 0 0

0 .1 8 4
- 0.10 7
0 .3 8 2

0 .0 0 9
0 .0 8 0
0 .0 0 0

0 .1 3 9

0 .0 3 1

0 .3 8 9

0 .0 0 0

-0 .1 8 1
0 .5 9 2

0 .0 0 0
0 .0 0 2

- 0.07 9
0 .5 9 5

0 .2 1 8
0 .0 1 2

0 .5 9 0

0 .0 0 8

O bs e rv a c i on e s

8 170

L R c h i- s q u a r e

5 4 7 0 .3
0 .0 0 0
0 .4 8 3

P ro b > c h i 2
S eu do R a jus t
CC

8 4 .0

O b s e rv a c i on e s
T a m . P o b la c
F( 20 ,

25 94)

P ro b > F

8 170
29 249 40
4 5 .3 8 0
0 .0 0 0
8 3 .4

CC

O b s e r v a c io n e s
T a m . P o bl a c
F ( 1 7,

2607)

Pro b > F
CC

820 2
2 90 989 5
6 3 .9 4 0
0 .0 0 0
8 4 .3

S ig n if ic a n c i a : 5 %
F u e n te : E N A H O I V T R I M . 2 0 0 1

probabilidad en un 83% en el segundo


modelo y en un 80.5% en el caso del
tercero.

E l a b o ra c i n :C ID E

En el caso de la sierra rural se reducira el


probit de la probabilidad en un 11% y
22.4% en el segundo y tercer modelo
respectivamente, comparadas siempre con
la categora base que es Lima. Donde se
estn apreciando brechas bastante notorias
es en la selva rural, que comparadas con
Lima se estara reduciendo el probit de su
probabilidad en 60.2% (modelo n 2) y
61.6% (modelo n3).

dentro de la vivienda un espacio para


obtener ingresos, reduce el probit de su
probabilidad entre un 18.1% (modelo n1,
sin considerar factor de expansin) y
11.7% (modelo n 2, considerando
factores de expansin), pero que en el caso
del tercer modelo resulta siendo no
significativo. Adems se mantiene la idea
de que otro empleo para obtener ingresos,
reduce su probit de probabilidad en una
pequea medida, alrededor de un 12.2%
(modelo n 1) y 15.6% (modelo n 2).
Nuevamente en el caso del tercer modelo
resultara no significativa.

Algunos resultados obtenidos en el mismo


sentido que en el modelo Logit
anteriormente estimado recibiran igual
interpretacin, como el hecho de destinar

Queda definitivamente claro que el acceso


a activos pblicos beneficia al jefe de hogar
y al hogar en su conjunto en una reduccin
de su probabilidad de ser pobre,

76 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

reducindola en 28.2% (MODELO N 2)


y hasta 32.8% (MODELO N 3) cuando
se tiene acceso a servicios de alcantarillado
dentro de vivienda, y un 10.7%
(MODELO N 2) cuando se tiene
abastecimiento de agua dentro de la
vivienda del hogar, siendo no significativa
esta variable en el caso del modelo n 3.
Segn lo anteriormente mostrado, la
eleccin por alguno de los dos modelos
conforme al enfoque de estimacin de
observaciones individuales no es
diferenciable. Sobre todo si recalcamos la
idea que la gran cantidad de observaciones
tratadas sesgan la idea de la distribucin

normal de los errores, podra primar como


criterio para la eleccin del modelo probit
segn este enfoque.
Desde el punto de vista prctico, la
eleccin del modelo logit y de la
correspondiente regresin logstica
habilitara una mayor cantidad de
herramientas de control de la bondad de
ajuste del modelo estimado y por ende
una mejor validacin de ste, en tal sentido
se propondra como el ms idneo, para
el clculo del modelo de probabilidad del
jefe de hogar pobre del Per, en el ao
2001.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 77

Centro de Investigacin y Desarrollo

78 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

IX. CONCLUSIONES

El presenta trabajo de investigacin aborda


los modelos logit y probit aplicados en la
investigacin social para el caso de la
pobreza en el Per, durante el ao 2001,
desde la formulacin de la condicin de
la pobreza en el Per y algunos activos
pertenecientes a los jefes de hogar y al
hogar que pertenece bajo esta condicin.
Para luego sentar las bases (enfoque
terico) sobre los cuales se construy los
modelos y se adaptaron a este caso en
particular; de all que se puede concluir,
desde el punto de vista prctico, que
aspectos como el acceso a activos pblicos
benefician al desarrollo de activos privados
de los jefes de hogar a travs de un
decrecimiento en su probabilidad de ser
pobre. Dems esta confirmar el aumento
en una gran medida sobre la probabilidad
de ser pobre cuando el jefe de hogar no
tiene nivel de educacin alguno, etc.
1. Con respecto a la hiptesis que
sostiene que los factores de naturaleza
cuantitativa como el ingreso per cpita,
a travs de sus deciles de ingreso, etc;
ajustaran correctamente un modelo
para la probabilidad de pobreza en el
jefe de hogar del Per se rechazara,
en primer lugar, porque expresado a
travs del estadstico de bondad de
ajuste Pearson X mostrara dudas
acerca de las probabilidades generadas,
y por ende no se convertira en el ms
idneo sobre el cual trabajar. En
segundo lugar, dada la naturaleza del
fenmeno de la pobreza en estudio,
excluirla de sus factores de naturaleza

cualitativa, los cuales no hacen posible


la viabilidad de este enfoque segn los
indicadores existentes, resultara
contraproducente y por tal motivo el
modelo probit con variable
dependiente dicotmica con enfoque
de proporciones muestrales no es el
ms adecuado para la estimacin de la
probabilidad de ser pobre del jefe de
hogar en funcin a sus factores
determinantes.
2. Con respecto a la hiptesis que
sostiene que los factores explicativos
de la pobreza de los jefes de hogar
del Per de naturaleza cualitativa y
cuantitativa exclusivos del jefe de
hogar como el nivel de educacin, el
tipo de colegio de estudio, la categora
ocupacional, el tamao de la firma
donde labora, la tenencia de otro
empleo, el estado civil, su edad, su
indicador de experiencia laboral; en
combinacin con los factores de
naturaleza cualitativa y cuantitativa
exclusivos del hogar como el indicador
de si el hogar dedica un espacio del
hogar a generacin de ingresos, la
cantidad de miembros en el hogar, la
cantidad de miembros pertenecientes
a la PET, el ingreso per cpita mensual,
el acceso a activos pblicos de agua y
desage, etc, no generan modelos
correctamente ajustados sera
rechazada porque, en primer lugar, las
probabilidades de correcta clasificacin
para los modelos estimados se
encuentran alrededor del 84% en el

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 79

Centro de Investigacin y Desarrollo

modelo logit y en el modelo probit,


ambos con enfoque de observaciones
individuales. En segundo lugar, la
obtencin de efectos significativos en
los factores de naturaleza cualitativa y
cuantitativa mencionados lneas antes
y exclusivos al jefe y al hogar, a travs
de las estimaciones de sus respectivos
estadsticos de Wald y significancias

obtenidas, en el caso del modelo logit,


y de sus respectivos efectos en la
transformacin probit, en el caso del
modelo del mismo nombre, viabilizan
una explicacin del fenmeno de la
pobreza en funcin a los determinantes
antes mencionados.

80 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

X. RECOMENDACIONES

Si se estuviese interesado en el anlisis


probit con variable dependiente
dicotmica desde el enfoque de
proporciones para el estudio de la
pobreza bajo ciertos factores como el
nivel de educacin, el rea de
procedencia, acceso a ciertos tipos de
activos pblicos deberan en primer
lugar reducirse las cantidades de
observaciones a estudiar para no afectar
a los estimadores, y en segundo lugar,
tratar de generar variables-estmulos
(cruce de variables explicativas) que
puedan seguir un enfoque cuasicuantitativo, de tal manera de que se
pueda determinar la medida de cambio
exacto en la obtencin de la condicin
de pobreza. En tal sentido y dada la
limitacin de este enfoque, se puede
pasar al estudio de niveles ms
avanzados, como los modelos probit
con variable dependiente ordinal o
modelos con enfoques multinomiales.
Si adems de intentar obtener aportes
de variables explicativas, est
intentando predecir un modelo de
clasificacin idneo a sus criterios, el
modelo logit ampliamente difundido
aporta una mayor variedad de

herramientas de validacin de la
bondad de ajuste del modelo y no
dejara de lado su funcin
discriminadora, beneficiosa en este
caso en el que la variable dependiente
posee solo dos categoras.

Si bien no ha sido empricamente


mostrado en esta investigacin, sugiero
la inclusin de una mayor cantidad de
variables de naturaleza cuantitativa en
modelos probit con enfoque de
observaciones individuales, pues son
variables ms idneas a ser sometidas
a pruebas de normalidad y anlisis ms
complejos; adems porque su
participacin en bloques nos permitira
obtener cambios exactos a los cuales
responderan los jefes de hogar
pobres. No deben dejar de
considerarse las variables de naturaleza
cualitativa, pues son fundamentales
para la explicacin de fenmenos
sociales y podran plantearse
indicadores ms idneos para captar los
cambios de naturaleza cualitativa de los
individuos, y no solo expresarse en
presencia o ausencia de factores de
riesgo.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 81

Centro de Investigacin y Desarrollo

82 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

XI. BIBILIOGRAFA

CATEGORICAL DATA ANALYSIS,


Agresti, Alan.
Florida, Wiley, 1990.

ANLISIS ECONOMTRICO.
Green, William H.
Prentice Hall. 1998.

ESTADSTICA MULTIVARIANTE EN
LAS CIENCIAS DE LA VIDA.
Carrasco, Jos Luis; Hernn, Miguel
Angel.
CIBEST. Espaa, Editorial Ciencia, 1993.

ECONOMETRA,
Gujarati, Damodr N.
Colombia, McGraw-HILL, 1997

METODOLOGA
DE
LA
INVESTIGACIN.
Hernndez, Roberto; Fernndez,
Carlos; Baptista, Pilar.
Mxico. McGraw Hill, 1994.

MTODOS
MULTIVARIADOS
APLICADOS AL ANLISIS DE
DATOS.
Johnson,
Mxico, ITP, 2000.

ESTUDIO SOBRE DETERMINANTES


DEL ACCESO A LOS SERVICIOS DE
SALUD EN EL PER,
Lama More, Antonio.
Lima, INEI, 2000.

LIMITED-DEPENDENT
AND
QUALITATIVE
VARIABLES
IN
ECONOMETRICS.
Maddala G. S.
New York, Cambridge University Press,
1996.

SPSS ADVANCE STATISTICS,


Majira J. Norusis.
Chicago, SPSS Inc, 1994

MS ALL DE LA FOCALIZACIN,
RIESGOS DE LA LUCHA CONTRA LA
POBREZA EN EL PER
Chacaltana J., Juan.
PER, Consorcio de Investigacin
Econmica y Social, 2001.
IMPACTO DE LOS SERVICIOS
PBLICOS DE SALUD SOBRE LA
PRODUCTIVIDAD Y LA POBREZA,
Cortez Valdivia, Rafael.
Lima, INEI, 2000.

BIOESTADSTICA.
Daz, Gabriela; Gunther, Bruno.
Chile, Mediterrneo, 1994.

LOS ACTIVOS DE LOS POBRES EN


EL PER.
Escobal, Javier; Saavedra, Jaime;
Torero, Mximo.
Lima, GRADE. 1998.

EL ANLISIS DE DATOS EN
MTODO
DE
SELECCIN
DICOTMICA DE LA VARIABLE
CONTINGENTE,
Fasciolo, Graciela.
Mendoza, 1997.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 83

Centro de Investigacin y Desarrollo

METODOLOGA, GUA PARA


ELABORAR
DISEOS
DE
INVESTIGACIN EN CIENCIAS
ECONMICAS, CONTABLES Y
ADMINISTRATIVAS,
Mndez Alvarez, Carlos.
Colombia, Editorial McGraw HILL.,1995.

LA POBREZA EN ARGENTINA: UNA


COMPARACIN ENTRE REGIONES
DISMILES, BUENOS AIRES, 2DA
REUNIN ANUAL SOBRE POBREZA
Y DISTRIBUCIN DEL INGRESOLACEA/BID/BM/
Paz, Jorge A.
Universidad Torcuato Ditella, 2001.

MULTIVARIATE
ANALYSIS:
SOCIOLOGY 203,
Department of Sociology, University of
California, Riverside.

EVALUACIN DE LOS PROGRAMAS


DE
COMPLEMENTACIN
ALIMENTARIA,
GASTO
EN
ALIMENTOS Y CONDICIONES DE
VIDA EN EL PER EN EL PERODO
1998-1999,
Navarro Levano, Jos Carlos.
Lima, INEI, 2001.

POBREZA Y ECONOMA SOCIAL ANLISIS DE UNA ENCUESTA ENNIV1997.LA EDUCACIN Y LA


PROBABILIDAD DE SER POBRE EN EL
PER DE HOY, LA APLICACIN DE
UN MODELO PROBIT DE MXIMA
VEROSIMILITUD,
Shack Yalta, Nelson Eduardo.
Per, DESA, 1999.

ANLISIS ESTADSTICO CON SPSS


PARA WINDOWS.
Visauta Vinacua, B.
Espaa, Mc Graw Hill, 1998.

EL RETO 2001, COMPETIR Y CREAR


EMPLEO,
Ortiz de Zevallos, Felipe y
Kuczynski, Pedro Pablo.
Lima, El Comercio, 2001.

84 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

XII. Anexos
ANEXO 1.

Informe metodolgico

ANEXO 2.

Indices de ecuaciones, cuadros y grficos

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 85

Centro de Investigacin y Desarrollo

86 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

ANEXO 1
INFORME METODOLGICO

Fuentes de informacin utilizada.


Para cumplir con los objetivos de la
investigacin se tom en consideracin la
informacin de la ENCUESTA NACIONAL
DE HOGARES 2001 - IV TRIMESTRE, aqu
mencionamos
algunas
de
sus
caractersticas, que son de importancia
relevante para nuestra investigacin y que
nos permitiron comprobar algunas ideas
referentes a los factores determinantes de
la pobreza en el Per, y como estos
beneficiaran o afectaran, los criterios de
utilizacin de modelos logit y probit. Para
dicho propsito se analizarn variables
relacionadas con el Jefe de Hogar, en sus
aspectos sociodemogrficos y de insercin
ocupacional.

viviendas colectivas (hoteles, crceles,


asilos, etc).
MARCO DE LA MUESTRA: La muestra es
probabilstica, de reas, estratificada,
multietpica e independiente en cada
departamento.
La muestra es probabilstica porque las
unidades han sido seleccionadas mediante
mtodos al azar, lo cual permite efectuar
inferencias a la poblacin en base a la teora
de probabilidades.
La muestra es de reas, porque la
probabilidad de la poblacin de ser
seleccionada, est asociada a reas
geogrficas.

Como sabemos, el fenmeno de la


pobreza no afecta solo a los jefes de hogar
, esta trae consigo una afectacin al
conjunto familiar, por lo tanto usar solo
como unidad de anlisis al individuo y no
considerar al hogar, puede llevar a
significativos sesgos sobrestimados al
respecto, pero que constituye un punto
de partida fundamental en razn al
comportamiento de la sociedad y
especficamente de la familia peruana, y
del rol que este juega dentro y sobre el
desarrollo de su hogar, adems de tener
en cuenta que estamos desarrollando una
investigacin que devela una metodologa
sobre los modelos mencionados
anteriormente.

La muestra es estratificada, porque


previamente a la seleccin, la poblacin
se ha dividido en estratos, con el objeto
de mejorar su representatividad.

POBLACIN OBJETIVO: Fueron


las
viviendas particulares y sus residentes
habituales (miembros permanentes del
hogar), excluyndose a los residentes en

TAMAO DE MUESTRA: El
tamao
total de la muestra en el mbito nacional
es de 18,863 viviendas particulares, dentro
de los cuales tomamos a 16515 Jefes de
Hogar y sus respectivos hogares.

En la primera y segunda etapa se utiliza la


seleccin sistemtica con probabilidad
proporcional al tamao (PPT) de viviendas.
En la ltima etapa (seleccin de las
viviendas) la seleccin es sistemtica simple
con arranque aleatorio.
COBERTURA GEOGRAFICA:
Nacional, Urbana y Rural (24
departamentos y la Provincia Constitucional
del Callao).

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 87

Centro de Investigacin y Desarrollo

METODOLOGA PARA LA INCLUSIN


DE VARIABLES EN LA ESTIMACIN DE
MODELO LOGIT DE POBREZA
En primer lugar se emplea un modelo
semiautomtico de seleccin de variables
(Forward Stepwise Wald).
Block 0: Beginning Block

independiente. Sobre el se estudiar la


adicin o no de las dems variables, con
un nivel de significacin tanto de entrada
del 0.05 y de salida 0.10. En [CUADRO
A.1] de historia de iteracin obtenemos
un -2 Log likelihood = 11325.900
resultante de su funcin de verosimilitud
y un valor para la constante de -0.008.

En el paso 0 se cuenta con un modelo


configurado solo por el trmino
Cuadro A.1 Iteration History

Iteration
Step 0 1

-2 Log
likelihood
11325.900

a,b,c

Coefficien
ts
Constant
-.008

a. Constant is included in the model.


b. Initial -2 Log Likelihood: 11325.900
c. Estimation terminated at iteration number 1 because
log-likelihood decreased by less than .010 percent.

A partir de aqu se debe comparar el valor


que se obtenga en -2 Log likelihood en
los modelos con las nuevas variables
includas, de tal manera, que contrastemos
la hiptesis nula de que el modelo sin
covariables (factores de riesgo de pobreza),
es tan bueno como el modelo que las
contiene. La importancia del modelo y del
conjunto de variables significativas es
validado posteriormente con el test de
coeficientes del modelo (mnibus Test for
Model Coefficients), [CUADRO A.6] en

este caso, que rechaza o no dicha


hiptesis.
El modelo con la constante posee una tabla
de clasificacin del 50.2%, esto quiere
decirnos que solo la constante, ya esta
clasificando como pobres a 5 de cada 10,
apreciable en el [CUADRO A.2]. Pero el
valor asignado al coeficiente de la
constante es de -0.008, el cual no posee
efecto significativo alguno, pues su
significancia es de 0.723 [CUADRO A.3].

Cuadro A.2 Classification Table

a,b

Predicted

Step 0

Observed
estado pobreza01

no pobre
pobre

estado pobreza01
no pobre
pobre
4101
0
4069
0

Overall Percentage
a. Constant is included in the model.
b. The cut value is .500

88 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Percentage
Correct
100.0
.0
50.2

Centro de Investigacin y Desarrollo

Tambin viene acompaado de su error


estndar y el c de Wald, que prueba en
este caso la significancia individual que en
esta caso particular no se da; adems de
mostrar el Odds Ratio (Razn de

probabilidades), que ser fundamental en


la determinacin de la cantidad de veces
que un jefe de hogar puede ser ms pobre
con respecto a no serlo respecto de la
presencia o no de un factor.

Cuadro A.3 Variables in the Equation

Step 0

Constant

B
-.008

S.E.
.022

Antes de terminar este paso y proceder al


siguiente, observemos [CUADRO A.4], se
realiza un anlisis de las variables todava
fuera de la ecuacin a travs de su p-valor
o significancia, que indica la importancia
relativa que cada una de ellas tendra en
caso de entrar al modelo descrito. Se
seleccionar, entre las variables aquella
cuya significancia se encuentre bajo el
nivel 0.05, tomando tambin en

Wald
.125

df

Sig.
.723

consideracin su score, en este nuestro


caso, sera DSHDV CON P =0.000, es
decir la variable indicadora sobre
abastecimiento de red de alcantarillado
dentro de la vivienda.
As finaliza el paso 0 del Forward Stepwise
de Wald que se ha limitado a estudiar el
modelo de partida.

Cuadro A.4 Variables not in the Equation


Step
0

Variables

DSINNIV
P208A
DCOURB
DCORU
DSIEUR
DSIERU
DSELUR
DSELRU
DLIUR
EXPER1
DCOLEGIO
DOBRERO
DME100
DOEMP
INPERCAM
MIEPERHO
PETHOGAR
DCONVI
DSHDV
DSHNO
DAGUDV
P1122
P115

Exp(B)
.992

Score
188.492
55.014
223.726
.152
15.617
836.127
.371
50.785
446.997
8.833
.075
31.997
528.833
21.192
860.534
819.967
33.780
180.384
1307.200
674.480
669.772
1114.157
57.575

df
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

Sig.
.000
.000
.000
.697
.000
.000
.542
.000
.000
.003
.785
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000

a. Residual Chi-Squares are not computed because of redundancies.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 89

Centro de Investigacin y Desarrollo

Block 1: Method = Forward Stepwise


(Wald)
PASO 1: Variable ingresada DSHDV
Al ingresar la variable indicadora sobre
abastecimiento de alcantarillado dentro de
la vivienda, vemos que obtenemos un 2Log likelihood = 9973.258, ver
[CUADRO A.5], obtenido este de la

funcin de mxima versosimilitud, menor


con respecto al modelo solo con constante
(11325.900), adems tenemos un Cox &
Snell-R de 0.153 y un valor de Nagelker
0.203 que nos indica el grado de
variabilidad explicada por el modelo, en
esta caso demasiado baja, y que por ese
lado podemos seguir intentando buscar un
modelo ms ideoneo.

Cuadro A.5 Model Summary


Step
1
20

-2 Log
likelihood
9973.258
5683.192

Cox & Snell


R Square
.153
.499

Se observa en el [CUADRO A.6] siguiente


(Test Omnibus) o prueba de los
coeficientes del modelo, que arroja
efectos significativos sobre el ingreso de
dicha variable y por lo tanto rechazamos
la hiptesis nula de que el modelo slo
con la constante es igual de bueno que el

Nagelkerke
R Square
.203
.665

modelo con la constante y DSHDV (tipo


de acceso a alcantarillado), esto en funcin
de la chi-square obtenida que es de
1352.641 es mayor comparada con aquella
chi-square (1 g.l., 5%)=3.84, en tal
sentido el modelo obtenido hasta ese
momento es el ms adecuado.

Cuadro A.6 Omnibus Test of Model Coefficients


Step 1

Step 20

Step
Block
Model
Step
Block
Model

Chi-square
1352.641
1352.641
1352.641
4.126
5642.707
5642.707

El modelo estimado sera: Ln (p/1-p)= 0


+ 1*DSHDV = 0.668 - 1.753*DSHDV,
apreciable en el [CUADRO A.9], donde
ya apreciamos que el tener conexin a red

df
1
1
1
1
20
20

Sig.
.000
.000
.000
.042
.000
.000

pblica de alcantarillado dentro de la


vivienda produce un efecto negativo sobre
el logit de la probabilidad de ser pobre.

Cuadro A.7 Hosmer and Lemeshow Test

Step
2
20

Chi-square
21.938
525.158

df
8
8

90 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Sig.
.005
.000

Centro de Investigacin y Desarrollo

Si bien el Test de Hosmer y Lemershow


[CUADRO A.7] deberan ser atentididos
en el siguiente paso que incluye una
nueva variable, este no ser tratado en
virtud de que el resto de procedimientos
son similares en cada iteracin, por eso
solo nos detendremos aqu a afirmar que
frente a un valor de chi-squeare de 21.938
y una significacin 0.005 esta ltima se va
reduciendo a medida que se van
aumentando ms variables en el modelo.
La comparacin se hace respecto a una
chi-square (8 g.l., 5%)=15.51 obtenido
de tabla de aqu el test rechaza la hiptesis
de nulidad.
Volviendo al paso 1 encontramos que este
modelo ya tiene un porcentaje de
clasificacin general del 69.5% obtenido
de su tabla [CUADRO A.8], de aqu mismo
la subclasificacin hecha para la condicin
de pobreza de los jefes de hogar pobres
obtiene un 79.8% de subclasificacin.

independiente 0.688 y el coeficiente del


acceso a red pblica de alcantarillado
dentro de la vivienda -1.753 formulan el
modelo de probabilidad de pobreza
[CUADRO A.9], el cual por alguna de las
razones de ndole estadstica y emprica
se queda corto al intentar brindar
explicaciones del fenmeno en su
conjunto y proceder al anlisis de los
siguientes pasos de iteracin.
De la misma manera que en el paso 0, se
analizan las variables que estn fuera del
modelo en este paso (1), antes de
proceder al siguiente [CUADRO A.10],
viendo su significancia (p-valor < 0.005),
para su ingreso al modelo y adems su
score, en tal sentido algunas de las
candidatas a ingresar sern MIEPERHO (
0.000, 962.249), INPERCAM (0.000,
561.907), P1122 (0.000, 393.466), pero
como es evidente de la ingresante en el
siguiente paso ser el total de miembros
en el hogar (MIEPERHO).

Con respecto a los estimadores de los


coeficientes tenemos que el trmino
Cuadro A.8 Classification Table a
Predicted

Step 1

Observed
estado pobreza01

Step 20

Overall Percentage
estado pobreza01

no pobre
pobre
no pobre
pobre

Overall Percentage

estado pobreza01
no pobre
pobre
2436
1665
823
3246
3400
519

701
3550

Percentage
Correct
59.4
79.8
69.5
82.9
87.2
85.1

a. The cut value is .500

El mismo anlisis se realiza en cada uno


de los siguientes pasos de iteracin, en
tal sentido, para ser una lectura ms
dinmica se presenta el primer paso de
iteracin y el ltimo donde se detiene la
estimacin del modelo.

PASO 20: Variable ingresada DAGUDV


La variable ingresante en este paso, ver
[CUADRO A.9], es si el tipo de
abastecimiento de agua en la vivienda es
a travs de red pblica. Las hiptesis acerca
de la validacin de un adecuado modelo

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 91

Centro de Investigacin y Desarrollo

frente a uno que no contiene factores


significativos es fcil de verificar en el Test
mnibus, ver [CUADRO A.7], y que
permite aceptar este ltimo como mejor
modelo frente a aquel que solo contiene
el trmino constante.
Confirmada la idea anterior se puede
redondear esta, es decir, confirmar el
hecho de que nos encontramos frente a
un modelo con un desajuste menor,
adems de obtener un grado de
clasificacin general de alrededor del 85%,
ver [CUADRO A.8] .
Este ser el ltimo paso ha realizarse en la
estimacin del modelo de probabilidad de
ser jefe de hogar pobre. Primero dejando
en claro que no es el nico y definitivo
sobre el cual trabajar para estructurar

explicaciones de este fenmeno


multidimensional, esto desde el punto de
vista emprico y porque adems debemos
de dejar en claro que si bien nos
aproximamos en una buena medida a la
realidad con la herramienta estadstica esta
no resulta ser determinante y menos
reemplazante de esta.
Segundo, que desde el punto de vista
estadstico, ninguna de las variables
restantes tiene una significacin adecuada
para ingresar al modelo [CUADRO A.10],
en tal sentido, la estimacin es detenida,
y se empiezan a realizar los anlisis
mostrados en captulos anteriores en el
mismo sentido de haber ingresado la
primera variable, pues este ha sido un
proceso continuo durante toda la iteracin.

MODELOS EN CADA PASO DE ITERACIN


Cuadro A.9 Variables in the Equation
Step
a
1
Step
t
20

DSHDV
Constant
DSINNIV
P208A
DCORU
DSIEUR
DSELUR
DSELRU
EXPER1
DCOLEGIO
DOBRERO
DME100
DOEMP
INPERCAM
MIEPERHO
PETHOGAR
DCONVI
DSHDV
DSHNO
DAGUDV
P1122
P115
Constant

B
-1.753
.668
.911
-.072
-1.189
.570
.899
-.807
.070
.584
.451
.324
-.226
-.011
.517
-.313
.269
-.388
.270
-.168
.627
.288
.761

S.E.
.050
.030
.231
.011
.167
.098
.121
.125
.010
.189
.092
.095
.085
.000
.031
.040
.080
.093
.089
.082
.092
.083
.379

Wald
1212.252
490.482
15.548
41.221
50.439
33.642
55.483
41.844
49.495
9.540
23.940
11.606
7.090
876.865
283.825
60.764
11.274
17.414
9.281
4.137
46.847
11.916
4.035

df
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

a. Variable(s) entered on step 1: DSHDV.


t. Variable(s) entered on step 20: DAGUDV.

92 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Sig.
.000
.000
.000
.000
.000
.000
.000
.000
.000
.002
.000
.001
.008
.000
.000
.000
.001
.000
.002
.042
.000
.001
.045

Exp(B)
.173
1.950
2.488
.931
.304
1.768
2.458
.446
1.072
1.793
1.570
1.383
.798
.989
1.677
.731
1.308
.678
1.310
.846
1.873
1.334
2.141

95.0% C.I.for EXP(B)


Lower
Upper
.157
.191
1.582
.910
.219
1.459
1.940
.349
1.051
1.238
1.311
1.148
.675
.988
1.579
.676
1.118
.565
1.101
.719
1.565
1.133

3.913
.951
.423
2.144
3.114
.570
1.093
2.598
1.881
1.666
.942
.990
1.781
.791
1.530
.814
1.558
.994
2.241
1.571

Centro de Investigacin y Desarrollo

VARIABLES EXCLUIDAS EN CADA PASO DE ITERACIN


Cuadro A.10 Variables not in the Equation
Step
1

Variables

Step
20

Variables

DSINNIV
P208A
DCOURB
DCORU
DSIEUR
DSIERU
DSELUR
DSELRU
DLIUR
EXPER1
DCOLEGIO
DOBRERO
DME100
DOEMP
INPERCAM
MIEPERHO
PETHOGAR
DCONVI
DSHNO
DAGUDV
P1122
P115
DCOURB
DSIERU
DLIUR

Score
69.683
13.868
29.125
39.325
.985
259.136
.699
1.023
125.821
8.835
.090
13.894
206.545
3.052
561.907
962.249
158.062
79.704
107.207
33.928
393.466
16.562
1.150
.005
1.496

df

Sig.
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

.000
.000
.000
.000
.321
.000
.403
.312
.000
.003
.764
.000
.000
.081
.000
.000
.000
.000
.000
.000
.000
.000
.283
.942
.221

a. Residual Chi-Squares are not computed because of redundancies.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 93

Centro de Investigacin y Desarrollo

94 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

ANEXO 2
INDICES DE ECUACIONES, CUADROS Y GRAFICOS

INDICE DE ECUACIONES
CAPTULO IV
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN

IV.1
IV.2
IV.3
IV.4
IV.5
IV.6
IV.7

ECUACIN IV.8
ECUACIN IV.9
ECUACIN IV.10
ECUACIN IV.11
ECUACIN IV.12
ECUACIN IV.13
ECUACIN IV.14
ECUACIN IV.15
ECUACIN IV.16
ECUACIN
ECUACIN
ECUACIN
ECUACIN

IV.17
IV.18
IV.19
IV.20

ECUACIN IV.21
ECUACIN IV.22

Indicadores de Pobreza (Foster-Greer-Thordecke)


Funcin de Distribucin Binomial
Probabilidad de ser pobre del jefe de hogar en funcin a una FDA.
Modelo de regresin lineal asociado a una FDA
Modelo de probabilidad lineal
Heterocedasticidad del modelo lineal de probabilidad.
Probabilidad de poseer una condicin o presencia de fenmeno
asociada a una FDA
Probabilidad asociada a la Funcin de Distribucin Logstica
Transformacin de la probabilidad de FDA Logstica
Probabilidad del evento complementario, Y=0, o ausencia de la
condicin o fenmeno.
Razn de Probabilidades (`Odds ratio)
Modelo Logit. Logaritmo de la razn de probabilidades en funcin
a factores explicativos y sus aportes.
Probabilidad asociada a la FDA Normal.
Probabilidad del evento en funcin a una FDA normal y su
representacin matemtica.
ndice imperfecto de conveniencia
Probabilidad asociada al ndice imperfecto de conveniencia y una
FDA Normal.
Linealidad del modelo probit
Efectos marginales asociados a una FDA.
Efectos marginales para la Funcin de Distribucin Normal
Derivadas parciales respecto de los coeficientes de los factores en
la FDA Logstica.
Efecto marginal para la FDA Logstica
Diferencia de beneficio-coste con una var. Observable

CAPTULO VI
ECUACIN VI.1
ECUACIN VI.2
ECUACIN VI.3

Probabilidad conjunta de un modelo de probabilidad .


Reformulacin de la funcin de verosimilitud.
Condiciones de primer orden del problema de maximizacin.

LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 95

Centro de Investigacin y Desarrollo

ECUACIN VI.4
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN
ECUACIN

VI.5
VI.6
VI.7
VI.8
VI.9
VI.10
VI.11

ECUACIN
ECUACIN
ECUACIN
ECUACIN

VI.12
VI.13
VI.14
VI.15

Heterocedasticidad de los errores en el enfoque de proporciones


muestrales
Condiciones necesarias de optimalidad de los coeficientes b
Vector gradiente de la funcin de verosimilitud
Matriz de informacin en funcin de la matriz Hessiana.
Mtodo Scoring para estimacin de Mxima Verosimilitud.
Transformacin de la variable dependiente Xij en el modelo probit
Transformacin de la variable dependiente Yi en el modelo probit.
Logaritmo de la verosimilitud de "n" observaciones en el modelo
logit
Vector gradiente de la verosimilitud en el modelo logit
Matriz de informacin del modelo logit.
Transformacin de la variable dependiente Xi en el modelo logit.
Transformacin de la variable dependiente Yi en el modelo logit

CAPTULO VIII
ECUACIN VIII.1 Probabilidad del jefe de hogar pobre con FDA Logstica.
ECUACIN VIII.2 Estimacin del modelo Logit de probabilidad en funcin de sus
factores explicativos.
ECUACIN VIII.3 Anlisis de un caso particular de jefe de hogar para el modelo
logit.
ECUACIN VIII.4 Probabilidad asociada al jefe de hogar con un caso especfico.
ECUACIN VIII.5 Logit de la probabilidad de ser pobre frente a no ser pobre de
acuerdo a sus factores explicativos.
ECUACIN VIII.6 Ecuacin de regresin en trminos de Odds Ratios (Razones de
probabilidad`)
ECUACIN VIII.7 Residual estandarizado
ECUACIN VIII.8 Deviance de observaciones en presencia de pobreza.
ECUACIN VIII.9 Deviance de observaciones en ausencia de pobreza.
ECUACIN VIII.10 Logit residual del modelo de prob. de los jefes de hogar.
ECUACIN VIII.11 Medida de influencia de cada observacin.
ECUACIN VIII.12 Cambio en el primer coeficiente al retirar la observacin "i".

INDICE DE CUADROS
CAPTULO VIII
CUADRO VIII.1
CUADRO VIII.2
CUADRO VIII.3

Perfil del jefe de hogar segn nivel educativo y estado de pobreza


Test Chi-cuadrado (X2) de independencia entre el nivel educativo
y el estado de pobreza.
Cuadro de medidas simtricas sobre el grado de relacin entre el
nivel educativo y el estado de pobreza.

96 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

Centro de Investigacin y Desarrollo

CUADRO VIII.4
CUADRO VIII.5
CUADRO VIII.6
CUADRO VIII.7
CUADRO VIII.8
CUADRO VIII.9
CUADRO VIII.10
CUADRO VIII.11
CUADRO VIII.12
CUADRO VIII.13
CUADRO VIII.14
CUADRO VIII.15
CUADRO
CUADRO
CUADRO
CUADRO
CUADRO

VIII.16
VIII.17
VIII.18
VIII.19
VIII.20

CUADRO VIII.21
CUADRO VIII.22

CUADRO VIII.23

Perfil del jefe de hogar segn gnero y estado civil en condicin


de pobreza.
Test Chi-cuadrado (X2) de independencia entre el gnero y el
estado civil en condicin de pobreza del jefe de hogar.
Cuadro de medidas simtricas sobre el grado de relacin entre el
gnero y el estado civil del jefe de hogar pobre.
Perfil del jefe de hogar segn gnero y estado civil en condicin
de no pobreza.
Test Chi-cuadrado (X2) de independencia entre el gnero y el
estado civil en condicin de no pobreza del jefe de hogar.
Cuadro de medidas simtricas sobre el grado de relacin entre el
gnero y el estado civil del jefe de hogar no pobre.
Perfil del jefe de hogar segn rea y regin natural en estado de
pobreza
Test Chi-cuadrado (X2) de independencia entre el rea y la regin
natural en condicin de no pobreza del jefe de hogar.
Cuadro de medidas simtricas sobre el grado de relacin entre el
rea y la regin natural en estado de pobreza del jefe de hogar.
Cuadro de los aos de estudios del jefe de hogar segn condicin
de pobreza
Prueba de Levene para la igualdad de varianzas y diferencia de
medias en los aos de estudios por condicin de pobreza.
Cuadro de factores explicativos de la pobreza de los jefes de hogar
en el modelo logit con enfoque de observaciones individuales.
Tabla de correcta clasificacin de Jefes de hogar.
Historia de Iteraciones
Cuadro de estadsticos de bondad de ajuste del modelo
Cuadro de evaluacin de los coeficientes del modelo.
Frecuencia de jefes de hogar segn deciles de ingreso y jefes de
hogar pobres en cada decil de ingreso para el modelo probit con
enfoque de proporciones muestrales.
Frecuencias observadas y esperadas de los jefes de hogar en base
a modelo probit estimado.
Incidencia en la probabilidad de ser pobre a nivel nacional del jefe
de hogar segn el modelo logit con enfoque de observaciones
individuales.
Incidencia en la probabilidad de ser pobre a nivel nacional del jefe
de hogar segn el modelo probit con enfoque de observaciones
individuales.

ANEXO
CUADRO A.1
CUADRO A.2
CUADRO A.3

Historia de iteracin en el paso 0.


Tabla de clasificacin en el paso 0.
Cuadro de variables incluidas en el paso 0 (solo cte.)
LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL 97

Centro de Investigacin y Desarrollo

CUADRO A.4
CUADRO A.5
CUADRO A.6
CUADRO A.7
CUADRO A.8
CUADRO A.9
CUADRO A.10

Cuadro de variables excluidas en el paso 0.


Cuadro de resumen de modelos en los 1 y 20.
Cuadro de evaluacin de los coeficientes de los modelos generados
en el paso 1 y el paso 20.
Cuadro de prueba de Hosmer y Lemershow en las iteraciones o
pasos 1 y 20.
Tablas de correcta clasificacin de los modelos generados en los
pasos 1 y 20.
Cuadro de variables incluidas en cada paso de iteracin.
Cuadro de variables excluidas en cada paso de iteracin.

INDICE DE GRFICOS
CAPTULO IV
GRFICO IV.1
GRFICO IV.2
GRFICO IV.3
GRFICO IV.4

Grfica de los lmites de probabilidad asociado a la presencia del


evento.
Grfica de regin asociada a su probabilidad y en funcin al ndice
imperfecto o de utilidad.
Grfica de comparacin de la FDA Logstica y Normal.
Decisin de compra en base al consumidor

CAPTULO VIII
GRFICO VIII.1
GRFICO VIII.2
GRFICO VIII.3
GRFICO VIII.4
GRFICO VIII.5
GRFICO VIII.6
GRFICO VIII.7
GRFICO VIII.8
GRFICO VIII.9
GRFICO VIII.10

Grfica del perfil del nivel educativo segn estado de pobreza del
jefe de hogar
Grfica del perfil del jefe de hogar segn gnero y estado civil en
condicin de no pobreza.
Grfica del perfil del jefe de hogar segn gnero y estado civil en
condicin de pobreza.
Grfica del perfil del jefe de hogar segn rea y regin natural en
condicin de pobreza.
Grfica de la tendencia del promedio de aos de estudios del jefe
de hogar segn estado de pobreza.
Grfica de distribucin normal y desviaciones respecto de la
distribucin normal de las Deviances obtenidas para cada JH.
Grfica de residuales estandarizados segn observaciones.
Grfica de Leverages obtenidos segn observaciones.
Grfica de la influencia de observaciones sobre el coeficiente del
indicador sinnivel (sin nivel de educain).
Grfica de transformaciones probit segn deciles de ingreso

98 LOS MODELOS LOGIT Y PROBIT EN LA INVESTIGACION SOCIAL

También podría gustarte