PEDUZZIPobreza 1

Pobreza, Desigualdad y sus Medidas
INDICE
Pg. INTRODUCCION .................................................................................. 2
Captulo I MARCO CONCEPTUAL .................................................. 123Nocin de POBREZA LA MEDICIN DE LA POBREZA Y LA DISTRIBUCIN DEL INGRESO LA FORMALIZACION MATEMATICA
Captulo II CURVAS DE LORENZ ...................................................... 14 Captulo III - MEDIDAS DE DESIGUALDAD........................................ Captulo IV - INDICE DE GINI ................................................................. 25 34
Captulo V - MEDIDAS DE POBREZA .................................................... 47 Captulo VI ANEXO : VARIABLES DICOTOMICAS ............................ 64 REFERENCIAS BIBLIOGRAFICAS ..................................... 83 TABLAS ................................................................................... 90
INTRODUCCIN .... el hombre puramente econmico es casi un retrasado mental desde el punto de vista social. La teora econmica se ha ocupado mucho de este imbcil racional aposentado en la comodidad de su ordenamiento nico de preferencias para todos los propsitos
Si la teora econmica tradicional considera que el comportamiento econmico es racional en la medida en que la eleccin del sujeto agente est motivada por la maximizacin de su propio inters, es decir, que la racionalidad se identifica con la maximizacin del propio inters, entonces la pobreza o no es real o el pobre no se comporta racionalmente. Y si, por el contrario, se sostiene que la pobreza es realhecho que nadie, en su sano juicio, puede negar, puede ocurrir que se diga que ahora se es pobre y sin vivienda por libre eleccin. Debemos apuntar, no obstante, que el hecho de que la eleccin sea libre o deliberada no es condicin suficiente para llamarla racional. Ni la libertad ni la consistencia interna de una eleccin son suficientes para caracterizarla como racional. Por inters comprendemos ingresos, bienestar, bienes tiles, etc. Quien realmente es pobre, segn esta teora, parece haber maximizado su propio perjuicio, tendera, por naturaleza, a la infelicidad. En este sentido, el pobre se asemejara muchsimo al personaje que Fedor Dostoyevski describe en Apuntes del subsuelo: S, no quiero cuidarme por rabia. Esto, seguramente, no lo puedan entender (... ) S mejor que nadie que el nico perjudicado sera yo y nadie ms. Sin embargo, si no me cuido es por rabia. Que me duele el hgado, pues que duela, que duela todava ms! Acaso el pobre es un ser irracional o padece un masoquismo extremo que le lleva a elegir, entre los males, el peor de los males? Hablar o escribir sobre la pobreza ya es en s un problema tico porque en una u otra forma nos compromete. La pobreza se ha vuelta ltimamente un tema de inters para todos los estudiosos y un objeto de estudio y de discusin en seminarios, conferencias, foros
internacionales y "Cumbres Mundiales"... Sin embargo, muchas veces, ms all de las declaraciones protocolares no se va y la pobreza sigue aumentando. Y lo ms escandaloso es que muchos se hacen ricos estudiando y discutiendo la pobreza. La pobreza constituye el principal problema social a escala nacional y mundial, por su gran extensin, por comprometer el crecimiento a largo plazo y por sus caractersticas marcadamente antihumanas. La pobreza es una realidad inaceptable para cualquier sociedad. La pobreza vulnera las bases constitutivas de la vida humana y representa la prdida del potencial de existir y actuar de las personas. En el estudio y anlisis de la pobreza la matemtica, en especial la estadstica, juega junto con otras disciplinas un papel importante. Para abordar este fenmeno social y econmico el matemtico requiere indicadores, como ser, variables de ingreso, eleccin de lneas de pobreza, ndices de pobreza, etc. Son grandes las dificultades en este campo, la teora es dbil y poco desarrollada, la parte emprica, como ser la recoleccin de datos muestrales y su interpretacin, resulta arbitraria e insegura. No obstante, a pesar de estas contrariedades, ya se han conseguido algunos resultados tericos y empricos de inters. Econmicamente, en tanto que la pobreza est asociada a la carencia de recursos que coarta las libertades ms elementales de los individuos, es sin duda un problema de considerable gravedad. Como un eco que se multiplica, la pobreza anda en boca de muchos, en preocupacin de algunos y en la realidad de millones. El actual mundo unipolar del libre mercado ha sido generoso en producir, ampliar y agudizar la pobreza. En efecto, desde que jugamos en las canchas del neoliberalismo, la pobreza rompe rcord y la tranquilidad de algunos. Tal vez por ello todo tipo de instituciones tanto internacionales, Banco Mundial (BM), Banco Interamericano de Desarrollo (BID), Comisin Econmica para Amrica Latina (CEPAL), Programa de las Naciones Unidas para el Desarrollo (PNUD), como nacionales (universidades, organizaciones gubernamentales y no gubernamentales) se han dado a la tarea de explicar este complicado fenmeno social. En un reciente informe de la CEPAL se reconoce que los niveles de pobreza en Amrica Latina han aumentado desde la aplicacin, en la dcada de los 90s, de los ajustes estructurales, el proceso de globalizacin y la disminucin del gasto social. El subcontinente pas de un 35% de los hogares latinoamericanos en niveles de pobreza, durante la llamada dcada perdida (dcada de los
80s), a un 41% de los hogares con la aplicacin de las polticas neoliberales. Por qu
nos interesa medir la desigualdad y la pobreza en una sociedad?.

Somos muchos quienes creemos que nuestro pas tiene todo para estar bien. Aqu no debera existir pobreza. Tenemos una serie de recursos que muchos otros pases ms desarrollados no tienen y que nos ubican en una situacin realmente envidiable: un pas no muy grande con una poblacin relativamente reducida, una naturaleza exuberante con playas y selvas excepcionales y abundancia de agua dulce y de excelentes condiciones, posibilidades agrcolas,... Pero, cul es entonces el problema? Por qu existe todava tanta pobreza en nuestro pas? Por qu Venezuela es uno de los peores pases del continente en cuanto distribucin de las riquezas? Desde el punto de vista cientfico y tecnolgico ya no debera existir el hambre en el mundo, ni la pobreza. En el fondo el inmenso problema de la deuda externa de los pases pobres no es un problema estrictamente econmico... De hecho la humanidad dispone de la informacin y capacidad necesaria para eliminar estas plagas. Los grandes problemas de la humanidad ya no son de orden tcnico o cientfico, sino de orden moral. Dependen de las justas relaciones entre el hombre y sus semejantes, entre los grupos humanos, entre las naciones y entre el hombre y la naturaleza. Durante los ltimos 25 aos se ha producido una abundante literatura sobre la medicin de la desigualdad ,la pobreza y otros conceptos cercanos. Enlazando con el trabajo pionero de Dalton (1920), se reconoce a los autores contemporneos Atkinson (1970), Kolm (1976a, 1976b) y Sen (1973) por sentar las bases analticas de la teora de la distribucin de la renta. El objetivo habitual del paradigma desarrollado desde 1970 hasta la fecha puede anunciarse de la manera siguiente: dadas dos distribuciones de renta, cmo podemos compararlas a efectos de eficiencia, desigualdad, bienestar o pobreza? La idea central consiste en situar el problema en un contexto de bienestar social donde se hacen explcitos los juicios de valor sobre los que se basan los distintos procedimientos de evaluacin. Alternativamente, se busca la caracterizacin de los instrumentos de medida admisibles en trminos de un conjunto de propiedades normativas interesantes. Este trabajo de investigacin se desarrolla sobre la base de dos grandes temas ligados a la realidad social, poltica y econmica de una poblacin determinada en una cierta regin o pas Estos temas son :Medidas de pobreza e Indices de desigualdad.La extensin de la pobreza y el grado
6
de desigualdad en la Amrica Latina son problemas que ya tienen un largo historial. La primera es un reflejo, ante todo, del bajo nivel promedio del ingreso y de la brecha que existe en los niveles de vida de la Amrica Latina por una parte y los pases desarrollados por la otra. El segundo es consecuencia de la herencia colonial de la regin y del estilo de desarrollo emprendido desde la independencia.
El grado de bienestar de una sociedad no puede medirse exclusivamente por su nivel de renta. Es necesario tener tambin en cuenta mltiples factores histricos, culturales, polticos y econmicos y, entre stos ltimos, la distribucin de esa renta entre todos los componentes del grupo social. Desde el punto de vista normativo, los economistas tericos han sealado desde hace dcadas que, incluso en las condiciones ideales ms favorables, existen dificultades de orden fundamental para aproximar el bienestar de un colectivo de individuos a travs de magnitudes agregadas sin referencia expresa a consideraciones de ndole distributivo. Desde una perspectiva econmica se le atribuye a la renta la capacidad para derivar de ella utilidad, de acuerdo con una cierta funcin U(x). La alternativa ms frecuente es la de definir el bienestar social de un determinado colectivo como la utilidad media, calculada sobre la funcin de distribucin de la renta, de ese colectivo. As definido el bienestar social resulta ser un concepto no observable, al depender de una funcin de utilidad que tampoco lo es. El nico elemento de la definicin que es directamente observable es la distribucin de la renta en el colectivo. Directamente relacionados con la distribucin personal de la renta estn los problemas de la desigualdad y la pobreza, en los cuales me voy a centrar especialmente en este Informe de Pasanta Es importante recalcar que a la hora de realizar este tipo de estudios nos encontramos con importantes problemas metodolgicos. En primer lugar, si la calidad de las fuentes de datos constituye un problema en toda investigacin econmica, en la investigacin de la distribucin personal de la renta es uno de los mbitos ms problemticos. Y ello debido no slo a la cantidad de informacin requerida, sino al carcter especialmente delicado de la misma: las familias en general son reticentes a ofrecer informacin acerca de su nivel de ingresos. La eleccin del indicador monetario que se utilizar es tambin una cuestin
problemtica. Utilizaremos las cifras sobre gastos porque segn parece son ms fiables que la de ingresos. Por otra parte, adems de la dificultad de obtener datos fiables, las fuentes que proporcionan los datos no estn diseadas para abordar este tipo de estudios, sino que sus finalidades son otras, lo cual limita an ms las opciones metodolgicas.
Captulo I
Marco Conceptual
1. NOCIN DE POBREZA
El Banco Mundial (1990) define a la pobreza como la imposibilidad de alcanzar un nivel de vida mnimo.La sucinta definicin hace referencia, en menos de diez palabras, a un fenmeno multidimensional, complejo y de difcil aprehensin, que no comienza ni termina en lo estrictamente econmico. An la dimensin estrictamente econmica ha sido objeto de mltiples aproximaciones y perspectivas, fuertemente influidas por los instrumentos de medicin disponibles. La nocin de pobreza lleva implcita la idea de privacin. Privacin absoluta en el caso de pobreza extrema; y ms generalmente, privacin relativa, en funcin de parmetros sociales y culturales. Por ello la pobreza inevitablemente refiere a la desigualdad social, aunque ambos conceptos no se identifiquen. La privacin, entendida como la falta de acceso a ciertos bienes considerados imprescindibles, puede observarse tanto en el momento del consumo como en el de la obtencin del ingreso necesario para conseguirlos. Esto da lugar a dos enfoques que corresponden a dos grandes familias de mtodos de medicin: los mtodos directos y los del ingreso. En realidad, stos no son formas alternativas de medir la misma cosa, sino que representan dos concepciones distintas de la pobreza. El mtodo directo identifica a aquellos cuyo consumo real no satisface las convenciones aceptadas sobre necesidades mnimas, mientras que el otro trata de detectar a aquellos que no tienen la capacidad para satisfacerlas, dentro de las restricciones de comportamiento tpicas de su comunidad (Sen, 1992).Dentro del enfoque directo caben tanto los estudios que recurren a encuestas especficas como aquellos que recogen algunas caractersticas de los hogares, particularmente de sus viviendas, para evaluar el grado en que satisfacen sus necesidades bsicas. Dentro del enfoque "del ingreso" existen dos corrientes principales. En algunos estudios se trata de determinar una lnea de pobreza "absoluta", en base al ingreso necesario para adquirir una canasta normativa de bienes de consumo considerados imprescindibles. En otros se procura determinar una lnea de pobreza "relativa", definida como una
9
proporcin constante del ingreso medio. En ambos casos, se consideran pobres a quienes estn por debajo de la lnea, aunque el primer tipo de estudios es usual en los pases en desarrollo, mientras que el segundo lo es en los pases desarrollados. Esta distincin remite nuevamente a la relacin entre pobreza y desigualdad. El concepto de pobreza se refiere al nivel de vida absoluto de una parte de la sociedad, mientras que la desigualdad se refiere a los niveles de vida relativos en la sociedad en general (Banco Mundial, 1992), pero se incorpora al concepto de lnea de pobreza endgena utilizado en pases desarrollados , donde la insatisfaccin acuciante de las necesidades elementales afecta a partes muy pequeas de la poblacin.En Amrica Latina el enfoque predominante es el de la lnea pobreza absoluta, introducido por CEPAL en los estudios realizados desde mediados de los aos setenta (PNUD, 1992). No obstante, los datos de ingreso medio fueron utilizados para corregir los resultados obtenidos mediante el mtodo de la lnea de pobreza absoluta en el estudio sobre la Magnitud de la Pobreza en Amrica Latina (CEPAL, 1990). II LA MEDICION DE LA POBREZA Y LA DISTRIBUCIN DEL INGRESO Por qu nos interesa medir la desigualdad y la pobreza en una sociedad?. Tanto la pobreza como la distribucin del ingreso presentan grandes problemas filosficos y de medicin. La primera ha sido tema de un anlisis sostenido, en especial en la obra de Amartya Sen . Los datos macroeconmicos recabados cada ao como parte del ejercicio de las cuentas nacionales no ofrecen materia prima para ninguna de las mediciones habituales; aunque la distribucin funcional del ingreso (salarios, utilidades, etc.) se consigue sobre una base anual en el caso de los pases ms grandes, por lo general se considera que esto tiene un uso limitado en las sociedades, como las de la Amrica Latina, en las que la distribucin del propio ingreso salarial est sumamente sesgada y donde el ingreso no salarial suma la mayor parte de lo que recibe el decil inferior. Por todo lo anterior, la medicin de la pobreza y de la distribucin del ingreso depende de estudios de hogares, que siempre son muestras y que inevitablemente se ven sometidos a una serie de distorsiones (en particular, a una subvaloracin del ingreso real). Adems, aunque puedan emplearse los datos brutos tomados de los estudios de hogares para derivar, con relativa facilidad, medidas de distribucin del ingreso, slo se les puede utilizar para medir la pobreza despus de hacer toda una serie de ajustes. Estos ajustes incluyen suposiciones en las que no estn de acuerdo todos los investigadores, pues producen enormes
10
discrepancias en la medicin de la pobreza, aunque estn derivadas de un mismo conjunto de datos. Ni la distribucin del ingreso ni la pobreza se pueden medir directamente. Todos los indicadores slo son aproximaciones; esto puede decirse en especial de la pobreza, cuyos indicadores intentan reflejar el grado de privacin de la poblacin. Y sin embargo, esto tambin puede decirse de la distribucin del ingreso, ya que el grado de desigualdad dentro de una sociedad slo se mide aproximadamente por medio de un pequeo estudio de hogares que, a su vez, rara vez hace justicia al grado de desigualdad intrahogar, en las diferencias interregionales de precios y en las fuentes de ingreso no monetario. Existe una inmensa bibliografa terica y metodolgica de la distribucin del ingreso y de la pobreza .Lo ideal sera que las medidas de la distribucin del ingreso y de la pobreza tuviesen las siguientes propiedades: i) disponibles para cada pas, en una serie de intervalos diferentes: no ser muy til una medida, por ideal que sea, si se le encuentra para un solo ao; ii) fcilmente comparables en el tiempo y entre pases: esta propiedad, en apariencia sencilla, en realidad es difcil de lograr, ya que el uso de diferentes suposiciones al derivar indicadores a partir de datos brutos hacen intiles todas las comparaciones, as sean para un solo pas en diferentes periodos; iii) robustas: los indicadores que sean relativamente insensibles a las suposiciones que tienen que imponer los investigadores son preferibles a los que son muy sensibles; la medicin ideal sera la que fuera muy similar al ser estimada por diferentes investigadores utilizando el mismo conjunto de datos; iv) desglosables: existe una clase de medidas que se puede desglosar para revelar caractersticas acerca de las fuentes de la desigualdad y de la pobreza (por ejemplo, regin, edad y sexo). Tambin puede esperarse que los indicadores de distribucin del ingreso, siendo medidas relativas, muestren cierto nmero de propiedades o de axiomas deseables. Estos incluyen i) el axioma de la improcedencia de escala, ii) el axioma de simetra y iii) el axioma de igualacin con el fin de conservar rangos de ordenamientos. Por fortuna todas las medidas disponibles en la Amrica Latina satisfacen estos axiomas. En los cuadros 1-A , 1-B aparecen cierto nmero de diferentes mediciones de la distribucin del ingreso y de la pobreza, con una indicacin respecto a la presencia o ausencia de las propiedades deseables. Ninguna de las medidas es enteramente satisfactoria, por lo que se deben hacer ciertas elecciones difciles. Empezaremos con ciertas medidas de la distribucin del ingreso (1-A):
11
Cuadro 1 A Medidas de distribucin del ingreso . Distribucin del Muy Fcil de comparar ingreso disponible 1 Quintil inferior S Algunos problemas 2 Quintil superior S Algunos problema 3 Gini S S 4 Desfile de Pen No S 5 Theil No Con algunos ajustes 6 Atkinson No Depende del grado de aversin 7 Coeficiente de No S variacin
Robusto S S S S S S S
Fcil de desglosar No No Con dificultad No S S S
A 1.El quintil (decil) inferior. Esta medida, muy comn, que registra la parte del ingreso recibida por el 20% (10%) ms pobre de los hogares o de la poblacin, puede obtenerse fcilmente a partir de datos de encuestas de hogares. En la Amrica Latina casi siempre se refiere al ingreso per capita del hogar, suponiendo que el ingreso del hogar se divide por igual entre sus miembros (ocasionalmente, se refiere al consumo del hogar). Por lo tanto, intenta medir la proporcin del total del ingreso nacional recibida por el 20% (10%) de las personas ms pobres. Es sensible a la inclusin o exclusin del ingreso/consumo no monetario (en especial, de la produccin de las granjas no comercializada) y esto puede causar dificultades al cornparar tanto el trabajo con corte transversal como las series de tiempo. A.2. El quintil (decil) superior. Como el quintil (decil) inferior, es frecuentemente utilizado y siempre se refiere al mismo concepto de ingreso/consumo que el quintil (decil) inferior, aunque el concepto mismo vara de un estudio a otro. Se le cita mucho en el contexto latinoamericano porque es muy alto segn las normas internacionales (el quintil inferior no siempre est tan ausente en las comparaciones internacionales). Si no se le ajusta, puede ser gravemente afectado por la subvaloracin de ingresos, que vara de manera significativa de un pas a otro. A.3. Gini. El coeficiente de Gini, proveniente de la curva de Lorenz y de la distribucin del ingreso: la distribucin del ingreso por tamao mide la parte del ingreso recibida por cada decil (o quintil, o alguna otra divisin) de la poblacin. Cuando la informacin se presenta acumulativamente se le puede emplear para construir una curva de Lorenz en la
12
que el eje horizontal registra la poblacin y el eje vertical representa la renta. Luego se utiliza la grfica para medir la parte de la renta nacional recibida por cualquier proporcin dada de la poblacin, a partir de los ms pobres. El coeficiente de Gini se escribe: G= 1
n n
2n 2 y i =1 i =1
y y
i
en que n = nmero de individuos y yi = ingreso bruto del
hogar per cpita para i individual (ingreso medio aritmtico) y = ( 1 / n )
An cuando este coeficiente puede contradecir la informacin dada por los quintiles (deciles) inferior y superior, en la prctica esto no es comn. Por ello, un estudio reciente del Banco Mundial (1993) descubri en todos los casos registrados en el decenio de los ochenta cuando el quintil inferior se redujo, que la parte del quintil superior como el coeficiente de Gini subieron (lo que implica una mayor desigualdad). Por tanto, podra decirse que aade poco a nuestro conocimiento de la distribucin del ingreso y que sufre por el hecho de que, cuando se cruzan dos curvas de Lorenz, puede no modificarse. Sin embargo, es fcil de obtener, es espectacularmente alto en muchos pases de la Amrica Latina y se puede desglosar (de la manera que ms adelante se indica). Tambin empieza a aportar diferente informacin de la que dan los quintiles (deciles) inferior y superior durante el decenio de los noventa. A.4. El desfile de Pen. Esta es una grfica que en el eje horizontal registra a cada receptor de ingresos en orden ascendente de ingreso; el ingreso real aparece en el eje vertical. El "desfile" suele ser muy espectacular, porque la mayor parte de la poblacin parece de enanos cuando se la coloca al lado de unos pocos gigantes que tienen altos ingresos. El desfile de Pen es una manera visualmente notoria de presentar casi la misma informacin contenida en la curva de Lorenz y en el coeficiente de Gini. A.5. Theil. El ndice de Theil es fcil de calcular, pero difcil de interpretar intuitivamente como medida de desigualdad. Se le puede desglosar, y una forma de desglose fue empleada por Fishlow (1972) en un clebre estudio de las causas de la desigualdad en el Brasil. No es fcil de comparar porque su valor mximo depende del tamao de la muestra, pero se le puede normalizar para hacer posible las comparaciones. El ndice de desigualdad de Theil (T) puede escribirse: T =
yi ln
yi 1/ n
13
En que yi es la parte del isimo individuo en el ingreso total y N es el tamao de la T muestra. Esto se puede normalizar as: T* = en que T* es aproximadamente ln N comparable entre pases. A.6. Atkinson. El gran atractivo del ndice de Atkinson desde un punto de vista terico es que permite hacer diferentes suposiciones acerca del grado de aversin a la pobreza, cada una de las cuales da un valor diferente del ndice. Tambin se le puede desglosar directamente. Sin embargo, rara vez se le computa para los pases latinoamericanos. El ndice de Atkinson, como el ndice de Theil, es un caso especial de lo que se conoce como medidas de entropa general (EG). Esto se puede escribir como: 1 n y i EG = 1 2 y n i =1 1
utilizando la regla de LHpital , sta se convierte en la
desviacin logartmica promedio cuando = 0 ; toda la subfamilia de ndices de Atkinson cuando <1; el ndice de Theil cuando = 1; el coeficiente de variacin al cuadrado dividido entre 2 cuando = 2 . A.7.El coeficiente de variacin. Este es similar a los ndices de Theil y de Atkinson pero es ms sensible a las diferencias en el extremo superior de la distribucin del ingreso (por tanto se le conoce como medida alta de desigualdad sensible) Antes de enfocar la pobreza es necesario analizar la relacin entre las tres primeras medidas de la pobreza en el cuadro 1 (B.1-B.3) La frmula ms general para medir la pobreza es: P = 1 N
i =1
z yi z
Donde z es la lnea de pobreza ,N es el nmero total de personas, q se refiere a todos los pobres (es decir, aquellos cuyo ingreso cae por debajo de z), i es el ingreso de la isima persona pobre y es un parmetro cuyo valor an est por determinarse. Cuando se fija en cero, la frmula se vuelve: H = q/N donde H es el ndice que mide la proporcin de la poblacin pobre. Este ndice de pobreza ha sido criticado porque no revela nada acerca de la profundidad de la pobreza. Si fijamos en 1, la frmula se convierte en:
14
1 PG = n
i =1
z yi z
Esto puede replantearse como PG = IH en que I es el
coeficiente de la brecha del ingreso y se define como: I = ingreso medio de los
z yp z
en que yp denota el pobres.
q yi y z yi qz i =1 q i q q 1 z yi N = q i =1 q = q qy p = PG = = N N = N N i =1 z z z N zN N zN i =1
de donde sacando q/N de factor comn queda: PG =
q z yp ( ) = HI N z
Esta nueva medida puede interpretarse como la brecha de la pobreza (PG) ya que mide la distancia que hay entre el ingreso promedio de los pobres y la lnea de pobreza. Se le ha criticado a su vez, porque no revela nada acerca de la distribucin del ingreso entre los propios pobres. Empero si decimos que = 2 la frmula se torna: FGT = PG 2 H PG 2 + CVp 2 ; CVp2 denota el coeficiente de variacin al cuadrado del H H
ingreso (o consumo) entre los pobres. (el coeficiente de variacin al cuadrado dividido entre 2 es lo que da la frmula para EG cuando = 2 ). En esta frmula para FGT el primer trmino del lado derecho mide la contribucin de la pobreza al ndice y el segundo trmino se refiere a la contribucin de la desigualdad entre los pobres. Esta medida se conoce corno FGT en honor a sus autores(Foster-GreerT'horbecke). .Ahora es posible observar las diferentes medidas de la pobreza en el cuadro 1-B Cuadro 1 B Medidas de distribucin de la pobreza. Pobreza
Muy disponible Fcil de comparar
Robusto No No
1 Indice del censo de S poblacin 2 Brecha de la pobreza No
No No
Fcil desglosar No No
de
15
3 FGT 4 INB 5 Salario mnimo real 6 Salarios reales 7 Desempleo 8 Sector informal
No No S S S S
No S No Slo por sector No No
No S S S S No
S No No No No No
B.l. El ndice de poblacin. Se le utiliza y cita muy a menudo. Sin embargo, no es particularmente robusto, puesto que se deben hacer muchas suposiciones antes de poder estimarlo. De hecho, cabe indicar los pasos que deben darse para estimar B.1 (y sus derivados, B.2 y B.3): i) ajuste de datos brutos por subvaloracin del ingreso; ii) clculo del nivel mnimo nutricional (por lo comn, se toma de publicaciones de las Naciones Unidas); iii) clculo de requerimientos alimentarios para satisfacer ii) (esto vara de un pas a otro, por ejemplo, relativamente ms carne en la Argentina, relativamente ms cereales bsicos en Guatemala); iv) clculo del costo de iii); se deberan utilizar distintos precios para diferentes regiones (por ejemplo, superior para las zonas urbanas que para las rurales), y v) derivacin del componente no alimentario del consumo mnimo requerido para evitar la pobreza (la CEPAL supone, caractersticamente, un mltiplo de 2.0 del costo de los alimentos al calcular su lnea de pobreza para las zonas urbanas y 1.75 para las rurales). Como cualquier combinacin de estas suposiciones puede producir cambios en la lnea de pobreza, no es sorprendente que las estimaciones difieran mucho de la proporcin de la poblacin que vive en la pobreza. No obstante, si las suposiciones son las mismas en cada observacin diferente para un determinado pas, el ndice de poblacin tiene evidentes mritos. B.2 y B.3. Pese a sus atractivos, estas medidas no son fciles de obtener. Esto puede cambiar en el futuro, cuando su clculo se torne caracterstica comn de los datos de estudios por hogar. El Banco Mundial (1993) ha calculado ambos ndices para buen nmero de pases. B.4. Insatisfaccin de necesidades bsicas (INB). El atractivo del ndice INB consiste en que se basa en una serie de medidas cuantitativas (por ejemplo, acceso al agua corriente) los hogares y los individuos son definidos como "pobres" si no gozan de las instalaciones necesarias. Por tanto, no depende de precios y es relativamente robusto. Sin embargo, es un tanto arbitrario y, en ciertos aspectos, paternalista. No se le emplea
16
con frecuencia. B.5. Salarios mnimos reales. Estos son fciles de encontrar y se les considera indicadores importantes de la pobreza en situaciones en que los salarios del quintil inferior quedan determinados, en gran parte, por leyes de salario mnimo. Sin embargo, durante los aos ochenta el salario mnimo no aument en proporcin con la inflacin y ya no constituye el punto de referencia para tantas negociaciones salariales como ocurra antes. pases. B.6. Salarios reales. Estos son difciles de comparar entre pases por las grandes diferencias intrasectoriales que hay en las tasas promedio de salarios. Sin embargo, si se hacen comparaciones para un mismo sector, los ndices de salario real pueden ser tiles. La mayor dificultad al utilizar los datos del salario real para estudiar la pobreza es que el quintil (decil) inferior suele ser el que menos depende del empleo en el sector formal, mientras que la distribucin del ingreso salarial est, a su vez, sumamente sesgada. Por tanto, los datos del salario real tienen su mayor utilidad al referirse a obreros no calificados. B.7. El desempleo. Es tradicional considerar el desempleo en la Amrica Latina como un lujo que no pueden permitirse los muy pobres. Segn este concepto tradicional, las tasas de desempleo deberan estar negativamente correlacionadas con los ingresos del quintil. Hay pases en que esto an es verdad, pero esta correlacin negativa est descomponindose cada vez ms y siendo reemplazada por una correlacin positiva. Vemos as que el desempleo es un indicador de la pobreza mucho ms til de lo que fuera en el pasado, aunque an dista de ser perfecto. B.8. El sector informal. Ya est bien establecido que la extensin del empleo en el sector informal vara en proporcin inversa con el ingreso por grupo. De este modo, el quintil inferior es el que ms depende de los empleos en el sector informal, y esto lo convierte en til indicador de la pobreza. Se le suele medir como la proporcin de la fuerza laboral que hay en el sector informal. Los requisitos mnimos para hacer un estudio comparativo de la distribucin del ingreso en la Amrica Latina son el quintil (decil) superior y el inferior y el coeficiente de Gini . El requisito mnimo para el estudio de la Para algunos pases aun puede ser un til indicio de la extensin de la pobreza, pero se le debe emplear con considerable cautela y no es estrictamente comparable entre
17
pobreza es el ndice de poblacin.
18
3 FORMALIZACION MATEMATICA Los conceptos matemticos surgen mediante un elevado grado de abstraccin, son independientes de contenidos particulares y por lo tanto son aplicables a una amplia gama de objetos y valores reales, incluidos en stos valoraciones econmicas, sociales y polticas. Conceptos matemticos, en especial estadsticos, son aplicables cuando se trata de medir desigualdades en la distribucin de bienes materiales y espirituales en las sociedades humanas, as como tambin de medir la contribucin desigual que distintos sectores hacen al bienestar general de un pas dado. Igualdad y desigualdad: A lo largo de la historia diferentes autores (filsofos, escritores, activistas sociales, etc.) han dado variadas definiciones de desigualdad en el campo social e individual. El problema para nosotros consiste en cmo llevar esos conceptos al lenguaje matemtico. Haremos las siguientes puntualizaciones: 1. Desigualdades significativas en el terreno poltico. Se mencionan : el poder, la riqueza, el respeto social (o clase social) para unos. Para otros son tambin valores polticos el saber intelectual, los conocimientos prcticos, los vnculos afectivos (familia y amigos), el bienestar fsico, moral y mental. 2. Medir significa comparar. Se necesitan escalas y unidades, intervalos, razones de valores, expresados cuantitativamente, variables numricas, etc. 3. La igualdad y la desigualdad pueden atribuirse tanto a individuos como a colectividades. 4. Los valores pueden definirse en trminos absolutos y en trminos relativos considerando promedios en un determinado contexto social o humano. Por ej., el promedio de participacin individual en la renta nacional, se mide la variacin con respecto al promedio. 5. Para estudiar la desigualdad se debe adicionar valores para establecer mnimos, mximos, promedios, intervalos, variaciones, etc.
19
La pobreza constituye el principal problema social a escala nacional y mundial, por su gran extensin, por comprometer el crecimiento a largo plazo y por sus caractersticas marcadamente antihumanas.En el estudio y anlisis de la pobreza la matemtica, en especial la estadstica, juega junto con otras disciplinas un papel importante.Para abordar este fenmeno social y econmico el matemtico requiere indicadores, como ser, variables de ingreso, eleccin de lneas de pobreza, ndices de pobreza, etc. Son grandes las dificultades en este campo, la teora es dbil y poco desarrollada, la parte emprica, como ser la recoleccin de datos muestrales y su interpretacin, resulta arbitraria e insegura.No obstante, a pesar de estas contrariedades, ya se han conseguido algunos resultados tericos y empricos de inters.
20
CAPTULO II
CURVA DE LORENZ CURVA DE LORENZ: En economa, al estudiar las caractersticas de una poblacin , junto a las medidas de tendencia central, variabilidad y forma de la distribucin, es de inters el anlisis del grado de concentracin. Las medidas de concentracin tratan de poner de manifiesto el mayor o menor grado de igualdad o equidistribucin en el reparto total de los valores de la variable en estudio.La representacin grfica de la concentracin se realiza mediante la curva de Lorenz y su medida analtica se efecta mediante ndices, de entre los cuales estudiamos el de Gini. Las curvas de concentracin se aplican en principio a los estudios de renta y riqueza, pero su uso se ha extendido a otros mbitos como la concentracin espacial de la poblacin, industrias, comercios, explotaciones agrarias, etc. El instrumento analtico que permite relacionar la pobreza con la desigualdad global de una poblacin es la Curva de Lorenz. Debido a que la medicin de la pobreza se har utilizando la curva de Lorenz, debemos primero exponer su representacin algebraica. Hay una forma general de la ecuacin cuadrtica que incluye a un elevado nmero de curvas que pasan por las coordenadas (0,0) y (1,1) y que genera patrones muy similares a los de la curva de Lorenz. Esto satisface la condicin de que L(0) = 0 y que L(1) = 1 para todas las curvas pertenecientes a la familia de representaciones cuadrticas generales de la curva de Lorenz (representada como L(.) que en trminos generales se puede escribir : ax2 + bxy + cx + dy2 + ey + f = 0, en donde x y y son la proporcin acumulativa de poblacin y de ingresos respectivamente (NOTA: posteriormente utilizaremos otra notacin para estas variables) que se utilizan para especificar la posicin de la curva. Despus de algunas manipulaciones algebraicas, y definiendo t = y(1-y), u = x2 y , v = y(x 1), w = x y , la ecuacin anterior se transforma en : t = au + bv +cw Dados los pares de coordenadas (xi,yi) para cada punto de la curva de Lorenz y corrigiendo una regresin en donde t es la variable dependiente y u, v, w, son las independientes, se generarn estimadores de mnimos cuadrados ordinarios para a, b y c.
21
Estos tres parmetros proporcionarn una descripcin completa de la curva de Lorenz especfica de cada distribucin. Al sustituir los valores de xi y yi en L(x) obtendremos los valores ajustados de la curva (L*(x)). Observacin: La manera en que se puede obligar a una curva a que pase por las coordenadas (0,0) y (1,1), adems de tener una forma elptica (lo cual garantizara la generacin de patrones similares a una curva de Lorenz) es estableciendo f=0, d=1, b2 4ad<0, (a+b+c+1)>0, c>0 y (a+c-1)<0. Considerando las anteriores restricciones podemos resolver la ecuacin anterior para la variable y , y se definimos e=-(a+b+c+1), m = b2 4 a , y n = 2be 4c, cada uno de los puntos sobre la curva de Lorenz se representa as: y = L( x ) = ( bx + c ) + ( mx 2 + nx + e2 )1 / 2 (1/2) La forma cuadrtica general cuando d=1 y f=0 es ax 2 + bxy + cx + y 2 + ey = 0 Sustituyendo el valor de e en la ecuacin anterior obtenemos y( 1 y ) = a( x 2 y ) + by( x 1) + c( x y ) .
CONSTRUCCIN DE UNA CURVA DE LORENZ

Para obtener una curva de concentracin, generalmente se representa en el eje de abscisas el porcentaje acumulado de frecuencias - nmero de trabajadores, explotaciones agrarias, industrias, etc. y en el eje de ordenadas el porcentaje acumulado del volumen total de la variable ingresos, extensin, volumen de ventas, etc.- que a ellas corresponde. Dado un conjunto de datos, la informacin para derivar la curva de Lorenz y el ndice de Gini se sistematiza en la Tabla siguiente: Datos Clculos intermedios Informacin a usar %Vol.acum.. %diferencia Volumen Vol.acum.. % fr.acum..
22
xi ni Ni
xini
x n
j =1
j j
pi =
j =1 Ni 100 qi= k N j =1
x n x n
x1n1
k j j
j j
100
pi qi
j j
x1 n1 N1 x1n1
x1n1
N p1= 1 100 N
q1=
x n
j =1
2
100 p1 q1
x2 n2 N2 x2n2
x n
j =1 j
N p2= 2 100 N
x n
q2=
x n
j =1 j
j =1 k
100
j
p2 q2
............................................................................................................................ xk nk Nk xknk Ejemplo:
x n
j =1 j
pk = 100
qk = 100
pk qk = 0
Para ilustrar una aplicacin, consideremos los ingresos en millones de bolvares
de 50.000 hogares en la tabla siguiente: Ingresos por hogar (106 bolvares) 12 24 46 6 10 20 15 10 5 total = 50 Nmero de hogares 103
Solucin: Datos Clculos intermedios Informacin a usar i xi ni Ni xini Ni 100 x jnj j =1 Pi= N 1,5 20 20 30 30 40 3 15 35 45 75 70 5 10 45 50 125 90 8 5 50 40 165 100 N=50 =165
qi 18 45 76 100
pi - qi 22 25 14 0 =61
23
En la figura se muestra la curva de Lorenz, la cual se obtuvo uniendo el origen con los puntos (pi, qi). qi 100 76
45
18 pi 0 40 70 90 100
Si, como en el ejemplo, estamos estudiando los ingresos de los hogares de un pas o regin, la distribucin ms equitativa o uniforme, y que vamos a considerar ideal, sera aquella en que a un tanto por ciento pi de hogares le correspondiese el mismo tanto por ciento de ingresos qi, es decir debera ser pi = qi. Su representacin grfica sera la bisectriz del primer cuadrante. En este caso la concentracin es mnima, pues el reparto es uniforme; por ello, la distribucin es ms igualitaria cuanto ms se aproxima la curva a la bisectriz (recta de equidistribucin). En las figuras se presentan los casos extremos y una curva de Lorenz tpica.
24
Distribucin de concentracin mnima
Curva de Lorenz distribucin de concentracin mxima
qi%
pi% 100
100
VARIACIONES SOBRE EL MISMO TEMA La curva de Lorenz es una medida de concentracin, exhibe la relacin entre capas(o porcentajes) de la poblacin y los porcentajes de la renta nacional correspondiente. Se calcula del siguiente modo: sean las variables X1, X2, (individuos o familias), N1 , N2 , N3 , ... , NI . Las variables Xi (marcas de clase de los intervalos) representan valores o porcentajes de la renta nacional y las cantidades Ni son las frecuencias correspondientes a intervalos de clase.Definimos los conceptos: Pj = ji=1( Ni/N )100 y N = Ii=1Ni es la poblacin total. La curva de Lorenz est definida por la aplicacin Pj de los valores ) . La curva de Lorenz siempre queda por debajo de la diagonal del cuadrado (0, 100) * (0, 100) . En el caso de distribucin igualitaria la curva de Lorenz coincide con la diagonal Qj , o sea, a porcentajes acumulados de la poblacin le corresponden porcentajes acumulados de la renta nacional (o Qj = (ji=1 Ni.Xi)100/(Ii=1 Ni.Xi) Pj y Qj son porcentajes acumulados, la Ii=1 Ni.Xi es la renta total (o total de los valores), X3, ... , XI correspondientes a distintos sectores de la poblacin y sean las frecuencias absolutas
25
del cuadrado. El otro caso extremo sera si un solo individuo percibiera toda la renta (o todos los valores), en ese caso la curva de Lorenz coincide con los bordes del cuadrado. Ejemplo: Intervalo 1 2 3 4 5 6 7 8 9 0 - 1/3 1/3 2/3 2/3 1 1 - 3/2 3/2 - 2 2-3 3-4 4-5 > 5 Xi 1/6 Vm Vm 5/6 Vm 5/4 Vm 7/4 Vm 5/2 Vm 7/2 Vm 9/2 Vm Ni 87 426 275 116 32 28 19 11 6 1000
j
Ni
i =1
Ni/N% 8,7 42,6 27.5 11,6 3,2 2,8 1,9 1,1 0,6
NiXi/V% 1,45 21,30 22,91 14,50 5,6 7,0 6,65 4,95 15,64 100,00
Qi 1,45 22,75 45.66 60,16 65,76 72,76 79,41 84,36 100,00
Pi 8,7 51,3 78.8 90,4 93,6 96,4 98,3 99,4 100,0
87 513 788 904 936 964 983 994 1000
NOTA: los lmites de los intervalos son fracciones o mltiplos de Vm (ingreso promedio), as como tambin la marca de clase (punto medio del intervalo, Xi) Ver representacin grfica ms adelante. Si tomamos N = 100 y V = 100, N sobre el eje horizontal y V sobre el eje vertical nos queda una representacin grfica que visualiza qu porcentaje de los valores le corresponde a qu porcentaje de la poblacin. Las razones correspondientes a grupos de individuos pueden calcularse dividiendo el porcentaje de valores que les corresponde entre el porcentaje de la poblacin que representan. Comenzando en el eje horizontal, a partir de cero, por los que sufren mayor discriminacin se traza una lnea que representa el porcentaje total de valores correspondientes a porcentajes crecientes de la poblacin. Una curva de este tipo se llama Curva de Lorenz. La curva de Lorenz graficada sobre una escala de 0 a 1 equivale a la funcin de distribucin de la Renta con respecto al tanto por uno acumulado de la poblacin y sirve tambin para evaluar la pobreza. ESTIMACIN PARAMETRICA DE LA CURVA DE LORENZ
26
Ahora veremos dos caminos para encontrar la expresin algebraica de la funcin que corresponde a la CURVA DE LORENZ. Para empezar recordaremos algo de regresin cuadrtica y de parbola de mnimos cuadrados. Esta parbola tiene esta formulacin : y = a + bx + cx2, donde los coeficientes a, b y c pueden calcularse a partir de la suma de los cuadrados de las desviaciones : d2 = (a + bx + cx2 y)2 buscando un valor mnimo para esta suma calculamos las derivadas parciales de la misma con respecto a los parmetros a, b y c, las igualamos a cero y obtenemos el sistema de ecuaciones: y = n.a + b.x + c.x2 xy = a.x + b.x2 + c.x3 x2 y = a.x2 + b.x3 + c.x4 De aqu obtenemos los valores a, b y c. A este mtodo le llaman interpolacin cuadrtica. La curva de Lorenz se puede aproximar por una parbola de mnimos cuadrados, aunque esta aproximacin no es muy exacta. Ms adelante veremos una mejor aproximacin haciendo uso de los mismos parmetros a, b, y c. Estimacin de la curva de Lorenz paramtrica. Paso 1 Preparacin de los datos para la estimacin de la curva de Lorenz. Esto comprende la construccin (p,L) de los puntos muestrales tomados de las mediciones del consumo. Los valores de p y L se obtienen como la proporcin acumulada de la poblacin y su distribucin acumulada del consumo respectivamente. En este cuadro (tabla 1) ilustrativo de la India estas variables corresponden a las columnas 4ta. y 5ta. NOTA: Los datos (p,L) generalmente en estadstica se denotan (x,y). Paso 2 Estimacin de los parmetros a, b y c de la GQ curva de Lorenz. NOTA: Recordar que L( p ) = 1 bp + e + mp 2 + np + e 2 2
Donde e = - (a + b + c + 1) , m = b2 4 a, n = 2be 4c. Los parmetros a, b y c pueden estimarse por mnimos cuadrados utilizando todas excepto la ltima observacin para (p,L). La ltima observacin, cuyo valor es (1,1), se excluye porque la forma funcional de la curva de Lorenz forzosamente pasa por el punto (1,1). La
27
tabla 3 muestra la regresin correspondiente a los datos en las ltimas dos columnas de la tabla 1. Observamos que R2 es aproximadamente 1. Tales altos valores de R2 son tpicos para ambas, la GQ y la Beta, parametrizaciones de la curva de Lorenz. No obstante, un buen ajuste para la curva de Lorenz L(p, ) no implica un, igualmente, buen ajuste de la funcin de distribucin. Algunas comprobaciones se vern ms adelante. Paso 3 Determinacin del consumo medio () y de la lnea de pobreza (z). La lnea de pobreza puede ser especificada en las mismas unidades que la media. Adems, la lnea de pobreza debe estar dentro de un rango admisible determinado por el respaldo a la funcin de densidad asociada a la curva de Lorenz parametrizada. La determinacin de este rango se discute ms adelante en la seccin 5. Los valores de y z se muestran, para estos datos ilustrativos de la India, en el borde superior de la tabla 4. Paso 4 Estimaciones de H, PG y SPG usando las frmulas de la tabla 2. Las medidas de pobreza estimadas para la India rural aparecen en la tabla 4. Todas las medidas de pobreza estn expresadas en porcentajes. COMPROBANDO LA VALIDEZ DE LA CURVA DE LORENZ La curva de Lorenz debe satisfacer las siguientes cuatro condiciones: L(o, ) = 0, L(1, ) = 1, L (0+, )0, L (p, )0 si p (0,1) A las primeras dos condiciones podemos llamarlas condiciones de extremo, significan que el 0% y el 100% de la poblacin acumulan el 0% y el 100% de la renta. Sin embargo, pequeas violaciones de la segunda condicin, por ej., L(1,) = 0,99 no son molestia desde el punto de vista de la medida de la pobreza, porque en adelante todo depende de la exactitud con que la curva de Lorenz siga el ndice head-count. Las condiciones tercera y cuarta aseguran que la curva de Lorenz es montona creciente y cncava hacia arriba. No hay garanta de que los parmetros de la curva de Lorenz satisfagan estas condiciones. El siguiente cuadro muestra cmo estas condiciones pueden ser chequeadas para ambas parametrizaciones de la curva de Lorenz. Condicin L(0,) = 0 automaticamente Curva de Lorenz GQ e<0 Curva de Lorenz Beta Satisfecha
28
L(1,) = 1 automaticamente L (0+, ) 0 L (p, ) 0 p (0,1) iii) 0<m< -n/2; m<n2/42
a+c1 c0 i) m < 0 ii) 0<m<(n2/42), n0
Satisfecha L (0,001, , , ) 0 L (p, , , ) 0 para p = (0,01, 0,02, ... , 0,99)
Las frmulas para la 1 y 2 derivadas de la curva de Lorenz estn dadas en la tabla 5. Se verifica que realmente las especificaciones GQ para los datos indes corresponden a una curva de Lorenz vlida. Si, de todos modos, alguna de las cuatro condiciones no se satisfacen, conviene igualmente procurar una parametrizacin alternativa de la curva de Lorenz, y si tambin falla, an son posibles los mtodos de interpolacin. Eleccin de la parametrizacin de la curva de Lorenz y el rango admisible de las lneas de pobreza. Si ambas parametrizaciones de la curva de Lorenz producen curvas tericamente vlidas, se puede elegir entre ellas usando el criterio de la bondad de ajuste. Estando sobretodo interesados en la medida de la pobreza podemos aplicar la bondad de ajuste slo sobre el ndice estimado head-count. La parametrizacin preferida de la curva de Lorenz es la que produce la menor suma de errores cuadrticos sobre dicho ndice. En particular, construiremos la siguiente estadstica:
k
= ( Li Li ) 2 donde k = { kk-1i=1 pi H ki=1 pi } y donde Li es Li estimado

i =1
Para la India rural la especificacin GQ tiene una ms baja estadstica (ver apoyo en la tabla 4) A continuacin veremos aproximaciones GQ Lorenz y Beta-Lorenz a los valores dados por la Tabla 1
0,0092 0,0339 0,0850 0,00208 0,01013 0,03122 0,0029 9 0,0116 8 0,0324 0,0025 0 0,0134 5 0,0401 a b c 0,8874 -1,4513 0,2025 PG 0,3698 4 0,1247
SPG 0,0475
29
0,1640 0,2609 0,4133
0,07083 0,12808 0,23498
3 0,0709 2 0,1273 5 0,2344
2 0,0852 8 0,1438 6 0,2399 8 0,2640 3 0,3287 2 0,4418 9 0,5097 4 0,5772 2 0,6052
e m n r S1 S2 H
-0,639 -1,443 1,042 1,8554 -0,28184 1,00395 0,8554 0,00395 0,4506
2 109,9 89
8 0,4506 = H 0,26403 =L(H) 0,2640 0,5497 0,7196 0,8196 0,9174 0,9570 0,9751 0,34887 0,51994 0,64270 0,79201 0,86966 0,91277 3 0,3491 6 0,5210 5 0,6434 6 0,7915 6 0,8689 4 0,9125 4
1 0,6183 L(H 0,26403 9
GQ-Lorenz
Beta-Lorenz
GQ Lorenz curve L( p ) =
1 bp + e + mp 2 + np + e 2 2
Beta Lorenz curve: L(p) = p .p.(1 p ) Para estos datos las ecuaciones quedan as: GQ Lorenz : Beta-Lorenz : L(p) = -0,5.[-1,451p 0,639 + (-1,443p2 + 1,042p + 0,6392)1/2] L(p) = p 0,3698.p0,8554.(1 p)0,00395
Comparando los valores dados por la curva GQ Lorenz y los dados por la curva Beta Lorenz con los valores reales dados por la tabla 1, se ve que la aproximacin GQ es muy buena en todo el recorrido, en cambio la aproximacin Beta Lorenz no es buena en el ltimo tercio del recorrido. Al valor H = 0,4506 le corresponde un valor L(H) = 0,26403 segn la curva GQ. Ese valor de L(H) fue utilizado para calcular : = [H L(H)]/[H.(1 H)], queda = 0,3698.
30
CAPTULO III
MEDIDAS DE DESIGUALDAD Medidas de desigualdad Aplicaremos un conjunto de frmulas matemticas a distintos tipos de valores, cuantificndolos, con el fin de describir la igualdad y medir los desvos respecto de ella; se utilizarn escalas de intervalos (valores de 0 a N sobre los ejes), o de razones (valores de 0 a 1 sobre los ejes). Las distribuciones acumulativas de valores, en trminos geomtricos y algebraicos, sugieren una gran variedad de mediciones de desigualdad susceptibles de aplicacin en el campo de la poltica. Emplearemos la siguiente notacin: N: poblacin total de individuos i : subndice que corresponde a un determinado individuo (1 i N). vi: valores que posee el individuo i. V : total de valores. V = Ni=1 vi Los individuos se pueden reunir en grupos. Hay NG grupos diferentes. Indicaremos por vj los valores iguales en poder de cada individuo del grupo j. (1 j NG) f j: cantidad de miembros del grupo j. NGj=1 fj = N NGj=1 fjvj = V Para cada individuo o grupo hay un valor real medido y un valor previsto, que generalmente difiere del valor real, el cual da la expectativa, el valor que se espera corresponda al individuo i (o al grupo j). ei: valor previsto para el individuo i (o grupo i). El valor ei se calcula sobre la base del criterio de igualdad adoptado. Si v i = ei para algn individuo o grupo, se considera satisfecho este criterio. Por ejemplo, en el terreno poltico, se llama norma de igualdad democrtica (caso 1) al valor medio posedo vm =(1/N).Ni=1 vi en este caso ei = vm para todos los individuos; se llama igualdad proporcional (caso 2) en cambio a un ei que depende de diversas caractersticas individuales como ser: mrito, bienes, conocimientos, etc. , en este caso ei
31
denota una proporcin constante de mrito y es ei = k.mi donde k es una constante de proporcin y mi es el mrito del individuo i. Medir la desigualdad equivale a determinar el grado en que v i no es igual al ei aceptado como norma de igualdad.Cmo se realiza la medicin de la desigualdad? Puede hacerse mediante una diferencia (vi ei, o, vi vj) o mediante una razn (vi/ei, o, vi/vj). O sea, pueden compararse los valores de cada individuo (v i) con la norma de igualdad (ei), o tambin, entre un individuo y otro (vi con vj).Si vi fuera el valor mnimo de la poblacin y vj el valor mximo, vj vi sera la amplitud de toda la escala y v j/vi sera la razn mxima.Si se compara con la media aritmtica (ei = vm) sobre la base de la diferencia vi vm, entonces vi vm < 0 implica individuos discriminados y vi vm >0 implica individuos privilegiados; si es sobre la base de la razn vi/vm un ndice de discriminacin sera vi/vm<1 y de privilegio vi/vm>1. Si queremos comparar las diferencias vi vm en dos universos distintos se puede tomar una medida estandarizada dividiendo la diferencia vi vm entre la media respectiva. Queda as:(vi vm )/vm = (vi/vm) 1. O sea, restando 1 de una razn se obtiene una diferencia estandarizada. 1 - Mediciones acumulativas de desigualdad Si se van acumulando individuos, o grupos, y se van sumando las fracciones de valores totales que les corresponden (vi/V) se obtiene la fraccin de estos valores que le corresponde a una determinada proporcin de la poblacin (ki=1 vi/V, kN) 2 Curva de pendientes : Las pendientes de una curva de Lorenz formada mediante segmentos de recta son los cocientes: incremento vertical /incremento horizontal = (ki=j vi / Ni=1 vi).100 / ((fi/N).100) = porcentaje de valores / porcentaje poblacional correspondiente Si enumeramos los grupos poblacionales con el subndice i siendo f i el nmero de individuos en el grupo i y vi el valor comn que posee cada uno de ellos, el cociente queda as:100.(ki=j fi.vi/V) / (100.(ki=j fi/N) Si consideramos las individualidades es fi = 1, vi es el valor que posee un determinado individuo, el cociente queda: (100vi/V) / (100.1/N) = vi(N/V) = vi / (V/N) = vi/vm
32
O sea, en el lmite la pendiente de la curva de Lorenz es la razn vi/vm , a la cual se le llama tambin razn de ventaja. La curva de pendientes es una curva que en cada punto tiene como ordenada la pendiente de la curva de Lorenz.
Si la curva de Lorenz es una lnea poligonal segmentada la curva de pendientes se convierte en una escalera con peldaos negativos, cero y positivos. La superficie de cada peldao es numericamente igual al coeficiente de Schutz. Ver grfica.
Pendiente = 1
20
40
60
75 80
100
4 3 2 1 0
Pendiente de la curva de Lorenz
Superficie igual al coeficiente de Schutz
Coeficiente de proporciones 20 40 60 75 equitativas 75 % porcentaje acumulativo de la poblacin
33
4 Mayora mnima: se llama as al menor porcentaje de la poblacin que obtiene la mitad ms uno (mayora) de los valores. En el terreno social y con respecto a la renta nacional, esta mayora mnima corresponde al porcentaje de la poblacin constituido por la clase privilegiada. 5 Suma de diferencias y razones: las sumas de diferencias absolutas (Ni=1 i vm ) y las sumas de razones ( Ni=1 vi / vm ; Ni=1 (vi vm) / vm ) constituyen un ndice importante de la distribucin acumulativa de la desigualdad. NOTA : La suma Ni=1 (vi vm) = Ni=1 vi - Ni=1 vm = N.(Ni=1 vi) / N N.vm = N.vm N.vm = 0, da siempre cero, por eso se toma la suma de los valores absolutos Ni=1 i vm . DEFINIMOS : Desvo medio = (1/N)Ni=1 i vm Desvo medio normalizado = desvo medio / vm = [ (1/N)Ni=1 i vm ] / vm = Ni=1 i vm / V Coeficiente de desigualdad de Schutz = vi vm (vi /vm 1) = vi vm (1 vi/vm). En este coeficiente las sumatorias abarcan los valores que se hallan por encima o por debajo del punto de partes iguales de la poblacin. Coeficiente de desigualdad de Gini = (rea entre curva de Lorenz y la lnea de igualdad)/(rea de desigualdad mxima) . (100.100/2) Coeficiente De Gini = (rea rayada)/5000 El ndice de Gini a nivel individual. Indice De Gini individual = a/b Si graduamos las escalas en los ejes vertical y horizontal de tal modo que V=1 y N=1, entonces ei = ei/V, xi = i/N , superficie mxima = , Indice Gini = 2.rea rayada Indice De Gini = 2.Ni=1 (xi yi)xi Ver representacin grfica en Captulo IV Indice de Gini. Otras formas de medir la desigualdad: Coeficiente De Gini = (rea rayada)/
34
1. La razn entre el mximo consumo y el mnimo consumo, por quintiles. 2. El coeficiente de Gini. 3. El ndice de Theil-L 4. El ndice de Robin Hood 5. El ndice de Atkinson 6. El ndice de Theil-T La razn del mximo al mnimo desembolso por quintiles. La razn del mximo al mnimo desembolso por quintiles es una medida sumaria muy cmoda de la desigualdad en los pases desarrollados (un quintil es, simplemente, un 20% de la poblacin). Ver grficas 1 y 2, adjuntas. El principal defecto de esta medida de la desigualdad es que ella ignora el consumo del 60% de la poblacin, la cual se encuentra en la zona intermedia. Tambin ignora la distribucin del consumo en el quintil ms rico y en el quintil ms pobre de la poblacin. El coeficiente de Gini El coeficiente de Gini es una medida de la desigualdad que vara entre 0 (igualdad completa) y 1 (cuando todos los bienes pertenecen a un solo individuo). Para los pases ms desarrollados el coeficiente de Gini vara entre 0,3 y 0,6. El coeficiente de Gini tiene interpretacin grfica como el cociente del rea entre la curva de Lorenz y la diagonal, y el rea total del tringulo bajo la diagonal. De tal modo que cuanto ms se aparta la curva de Lorenz de la diagonal mayor es el coeficiente de Gini. Siendo una medida muy cmoda de la desigualdad, el coeficiente de Gini tiene, algunas desventajas: 1. No se incrementa cuando una persona ms pobre pierde lo que una persona ms rica gana. 2. No se puede descomponer en sub-grupos (como ser, regiones administrativas, reas rural y urbana, etc.), de tal modo que el Gini nacional fuera la suma de los Gini regionales. Grfica 1.
35
P=F(X )
Pb c n o la i
A
2% 0
6% 0
2% 0
o q in ltim u til
1 q inil ut
(v loe ) a rs (r n ) e ta
Grfica 2.
P= f(x) = dF(x)/dx
El ndice Theil-L
1 quintil ltimo quintil
36
El ndice Theil-L es una medida de la desigualdad basada en la Teora de la Informacin (o Probabilidad). El ndice Theil-L vara entre 0 (igualdad absoluta) e (desigualdad absoluta), aunque habitualmente no supera a 1. Como el coeficiente de Gini, el Theil-L aumenta con la desigualdad de la distribucin. Se calcula as: L = Ni=1ln (Y/(Yi.N)) = Ni=1(ln (Y/N) ln Yi) = Nln Ni=1ln Yi donde = Y/N es el consumo medio , siendo Yi una medida del bienestar (ingreso o consumo) individual, Y el consumo total y N la poblacin total. El Theil-L tiene dos ventajas: 1. Le da ms peso al sector de menor consumo. 2. Puede ser descompuesto en sub-grupos. El Theil-L nacional es la suma ponderada de los ndices de cada sub-grupo, donde la ponderacin se hace segn la participacin en el consumo de cada sub-grupo. Esta ltima propiedad es muy usada, ya que ella permite comparar las desigualdades dentro de cada grupo con la desigualdad a nivel nacional. En la anterior expresin para el ndice de Theil-L el valor de Yi se puede tomar igual al valor Xi que es el ingreso, o consumo, individual o familiar. La esperanza del ingreso individual Xi se calcula mediante las integrales:
xdF ( x)
I
O tambin:
xf ( x)dx
I
donde f(x) = dF(x)/dx , y donde F(x) es la funcin de distribucin (continua) de la poblacin con respecto al ingreso, f(x) es su derivada , a la cual se le llama densidad de la distribucin. En las grficas 1 y 2 se explica el significado de estos smbolos . La curva de Lorenz es la funcin de distribucin de la Renta nacional con respecto a la poblacin. Si se trata de una muestra de n familias (o individuos) la curva de Lorenz queda lineal por trozos, ya que las muestras son de naturaleza discontinua. Aparte de estos ndices, o medidas de la desigualdad, de los cuales el ndice de Gini ms adelante ser tratado ms a fondo, tenemos an estos tres ndices:
37
Indice de Robin Hood El ndice de Robin Hood es equivalente a la mxima distancia vertical entre la Curva de Lorenz y la lnea de igual ingreso. El valor del ndice aproxima la parte del ingreso total que debera transferirse desde las familias que estn por encima de la media a las que estn por debajo de la media para lograr la igualdad. Indice de Atkinson El ndice de Atkinson es una de las pocas medidas de la desigualdad que incorpora explcitamente juicios normativos acerca del bienestar social. El ndice se deduce al calcular el as llamado promedio de ingreso de igualdad sensible , Ye, el cual se define como el nivel del ingreso per cpita que disfrutado por cada uno hara un bienestar total equivalente al existente en la actualidad. El promedio de igualdad sensible del ingreso est dado por la siguiente expresin matemtica: Ye = (Ni=1 f(Yi)Yi(1-e))(1/(1-e)) donde Yi es la proporcin del ingreso total ganado por el isimo grupo y e es llamado parmetro de aversin a la desigualdad. El parmetro e refleja la fuerza de la preferencia social por la igualdad y puede tomar valores desde 0 a . Cuando e > 0 hay una preferencia social por la igualdad (o una aversin a la desigualdad). Cuando e crece la sociedad la asigna ms peso a la transferencia de ingresos hacia la parte ms baja de la distribucin y menos peso a la parte ms alta. Valores tpicos usados de e son 0,5 y 2. El ndice de Atkinson est dado por: I = 1 Ye/ donde es la media de ingresos actual. Cuanto ms igualitaria sea la distribucin ms cercana ser Ye a y ms bajo el valor del ndice de Atkinson. Para cualquier distribucin de ingresos el valor de I queda comprendido entre 0 y 1. Medida de entropa de Theil (ndice Theil-T). Una medida de la desigualdad propuesta por Theil (1967) se deduce a partir de la nocin de entropa en la Teora de la Informacin. La medida de entropa T est dada por: T = Ni=1Si(log Si log(1/N)) donde Si es la parte del isimo grupo en el ingreso total y N es el nmero total de grupos.
38
El ndice tiene un rango potencial de 0 a , con lo que valores ms altos (mayor entropa) indican una distribucin del ingreso ms igualitaria. OBSERVACIN Obviamente no hay una mejor medida de la desigualdad. Algunas medidas, como el ndice de Atkinson, son ms sensibles a la pobreza extrema en la cual se encuentra una parte de la poblacin pobre. Diferentes medidas dan un perfil diferente bajo varios tipos de transferencia de ingresos . Por ejemplo, el Gini es mucho menos sensible a la transferencia de ingresos entre familias si ellas estn situadas ms cerca del punto medio de la distribucin que de los extremos. El ndice de Robin Hood es insensible a las transferencias de ingresos entre familias en la zona adjunta al ingreso promedio. Los investigadores deben seleccionar la medida adecuada a las hiptesis que se les planteen. Por lo general son los datos censales los que proporcionan el material para el clculo de las medidas de desigualdad.
39
CAPTULO IV INDICE DE GINI
INDICE DE GINI: En sus conceptos bsicos es un ndice para medir el grado de desigualdad, la concentracin de la distribucin y la uniformidad de la misma . Se lo define como el cociente entre el rea comprendida entre la curva de Lorenz y la diagonal y el rea por debajo de la diagonal. Si consideramos el rea del tringulo ABC, ella es constante y vale 100*100/2 = 5000 Coef.de Gini=Ni=1(xi-yi)xi/5000
100
Coef.de Gini individual = a/b
Coef .de.Gini =
rea.rayada 5000
Veamos un cuadro de datos que nos da una distribucin de valores sobre un conjunto de 1000 personas encuestadas. El significado de los smbolos utilizados es el siguiente: V: total de los valores, N poblacin total, Vm ingreso promedio V=
I I 9
NiXi , N = Ni , Vm = V/N, en este ejemplo es: N = Ni = 1000 , V=1000Vm

i =1 i =1 i =1
Xi = marca de clase (punto medio), Qi = porcentaje acumulativo de valores, Pi = porcentaje acumulativo de unidades muestrales (personas)., (Ni/N) % = porcentaje de personas en cada grupo i (NiXi/V)% = porcentaje de valores en cada grupo i, Ni = nmero
40
de personas en cada grupo i, la frecuencia de cada intervalo es el nmero de personas cuyos ingresos estn comprendidos entre los extremos del intervalo.
j
Intervalo 1 0 - 1/3 2 1/3 2/3 3 2/3 1 4 1 - 3/2 5 3/2 - 2 6 2-3 7 3-4 8 4-5 9 > 5
Xi 1/6 Vm Vm 5/6 Vm 5/4 Vm 7/4 Vm 5/2 Vm 7/2 Vm 9/2 Vm
Ni 87 426 275 116 32 28 19 11 6 100 0
Ni
i =1
Ni/N% 8,7 42,6 27.5 11,6 3,2 2,8 1,9 1,1 0,6
NiXi/V % 1,45 21,30 22,91 14,50 5,6 7,0 6,65 4,95 15,64 100,00
Qi 1,45 22,75 45.66 60,16 65,76 72,76 79,41 84,36 100,0 0
Pi 8,7 51,3 78.8 90,4 93,6 96,4 98,3 99,4 100, 0
87 513 788 904 936 964 983 994 1000
NOTA: los lmites de los intervalos son fracciones o mltiplos del ingreso medio Vm, as como tambin el punto medio (marca de clase, Xi) de los intervalos. Ver grfica en pgina 9. Coeficiente de Gini : G = 1 - (Pi Pi-1 )(Qi + Qi-1 ) / 10000 , aqu G = 1 - 5523,008/10000 G = 0,45 aproximadamente. Conclusiones: Hay un 8,7 % de la poblacin en pobreza extrema (ingresos inferiores a 1/3 Vm)Hay un 51,3 % de la poblacin por debajo de la lnea de pobreza (2/3 Vm). Hay un 78,8% de la poblacin con ingresos inferiores a la media (Vm). Hay un 0,6 % de la poblacin que percibe el 15,64% de la renta, o sea 26 veces el promedio (26 Vm). El coeficiente de Gini es alto, significa desigualdad y pobreza elevada
DESARROLLO Y DESCOMPOSICION DEL INDICE DE DESIGUALDAD DE GINI
41
El ndice de Gini fue objeto de una descomposicin, realizada por Pyatt en 1976, la cual a su vez fue elaborada adicionalmente por Diego Petrecolla en 1984. El objeto de este desarrollo del ndice de Gini fue crear un marco de anlisis de la desigualdad que permita determinar contribuciones a la misma que verifican o contraran un determinado conjunto de hiptesis. Por ejemplo: Refirindonos a los niveles de pobreza y a las desigualdades socio-econmicas, el ndice de Gini puede descomponerse segn estas dos variables: Nivel de educacin Tasa de dependencia, o sea, cantidad de personas que dependen de los que aportan ingresos al hogar. En las encuestas se trabaja con el concepto de adulto equivalente, el cual significa que a los miembros del hogar se les asigna distintos coeficientes segn edad y sexo. La variable nivel de educacin refleja el promedio de escolaridad de la familia; se pueden considerar estos tres valores: 1 - escuela primaria incompleta, 2 - escuela primaria completa y secundaria completa, 3 - algo de escolaridad terciaria. Por tasa de dependencia se entiende el total de adultos equivalentes dividido por la suma de perceptores de ingresos del hogar, de esta forma se obtiene cuntas personas dependen de los aportadores de ingresos al hogar. Tambin aqu tenemos tres clases: 1 - tasa de dependencia alta significa que en el hogar hay ms de 3,5 adultos equivalentes por cada perceptor de ingresos, 2 - tasa media es entre 1,5 y 3,5, 3 - tasa baja es menos de 1,5. En estos anlisis es importante el concepto de lnea de pobreza, el cual permite distinguir la poblacin pobre de la poblacin no-pobre. Esta lnea de pobreza refleja el valor de una canasta de alimentos ms el valor de un conjunto de bienes y servicios no-alimentarios. Anlisis detallado del Coeficiente de Gini. El coeficiente de Gini permite condensar en un indicador nico la desigualdad de ingresos y al mismo tiempo permite su descomposicin algebraica. La descomposicin del coeficiente de Gini propuesta por Pyatt (1976) permite confrontar hiptesis, haciendo posible no slo un anlisis detallado de diferencias entre clases de una particin, sino tambin indagar en qu proporcin esas diferencias resultan corroborar o contradecir las hiptesis formuladas.
42
Este coeficiente puede definirse de varias maneras alternativas, que a su vez dan lugar a distintas interpretaciones. Algunas definiciones del coeficiente de Gini: La definicin ms corriente se formula en trminos de la curva de Lorenz. Adems de la frmula ya vista ajustada a esta definicin, tenemos esta otra propuesta por Kendall y Stuart (1963) G = (1/2n2)(1/ Ym)ni=1nj=1 Yj donde Y = (Y 1, Y2, ... , Yn) es el vector de ingresos de la poblacin, Ym es su media aritmtica y n su tamao. As escrito, el coeficiente de Gini puede ser interpretado como el promedio ponderado de las diferencias entre todos los pares posibles de ingresos (Yi, Yj), adoptando como patrn de medida el promedio aritmtico de los valores de Y (o sea, Ym). En este caso el coeficiente de Gini implica la interrelacin de cada elemento con todos los dems del conjunto considerado. Otra interpretacin posible es la planteada por Pyatt en 1976. Este autor demuestra que la frmula anterior es equivalente a: G = (1/n2)(1/Ym)ni=1nj=1 max (o, Yi Yj ) donde igual que antes Yi Yj son diferencias de ingresos de individuos elegidos aleatoriamente dentro de cada clase y Ym es el ingreso promedio. A esta interpretacin se le llama el juego de Pyatt. La frmula se aplica de la siguiente manera : se escoge al azar un individuo de la clase i y se compara su ingreso con el de otro cualquiera, tambin seleccionado aleatoriamente, de la clase j. Si el ingreso del 2 individuo es menor, se anota un cero, si es mayor, la diferencia entre ambos se registra como ganancia de la unidad (o clase) a la cual pertenece el primer individuo. Descomposicin del coeficiente de Gini propuesta por Pyatt: El coeficiente de Gini puede descomponerse en tres componentes principales, los que adicionalmente pueden a su vez descomponerse para evaluar la importancia que algunas variables tienen en la determinacin de las desigualdades de los ingresos. Esto permite
43
confrontar la informacin con hiptesis acerca de las relaciones entre las variables clasificatorias utilizadas y la distribucin del ingreso. Estos tres elementos principales son: La parte atribuible a la desigualdad de ingresos dentro de cada clase. La parte de la desigualdad atribuible a la diferencia entre los ingresos medios de las distintas clases. La parte de la desigualdad que surge del hecho que en las clases de ingresos medios ms bajos puede haber unidades familiares cuyos ingresos sean superiores a los de algunos integrantes de clases con ingresos medios ms altos. Se realiza una particin de la poblacin investigada en clases excluyentes, de tal modo que una unidad familiar cualquiera puede estar en una y slo en una clase. Se resta ahora el ingreso de cada unidad de un determinado grupo, el h por ejemplo, de los correspondientes a cada una de las unidades de otro grupo, el k, que en general tengan ingresos superiores a los de la clase h, promediando luego las diferencias obtenidas. Sea Yih el ingreso de la unidad familiar i perteneciente a la clase h; Yjk el ingreso de la unidad familiar j perteneciente a la clase k; se trata de obtener el promedio de las diferencias Yjk Yih para todos los i, j, tales que Yjk > Yih incluyendo las comparaciones dentro de una misma clase. O sea, la clase k puede ser cualquiera de las m clases incluyendo a la misma clase h. En realidad, no se trata de los ingresos mismos sino de los rangos correspondientes. Yjk Yih es la diferencia de rangos. Slo se toman las diferencias en que el 2 componente (Yjk) es mayor que el 1 (Yih), en caso contrario, a la diferencia se le asigna el valor cero. Si tomamos entre las clases h y k el promedio de todas las diferencias posibles, como hay m clases y la clase k puede ser la misma clase h , y por cada dos clases hay un solo promedio, tenemos m2 promedios posibles. Estos m2 promedios de las diferencias de rangos se pueden presentar en forma de una matriz cuadrada de orden
44
m que denominaremos D. Si llamamos dhk a la diferencia promedio entre las clases h y k, la matriz D queda as: d hk = Yjk>Yih( Yjk Yih )/ t donde t = total de diferencias tales que Yjk>Yih d11d12 d13 .........d1m d d .............d 2m 21 22 D = ........................ ........................ d m1d m 2 ............d mm El coeficiente de Gini es a su vez el promedio de estas diferencias promedio, ponderadas cada una por el factor PhPk, siendo Ph y Pk las participaciones de las poblaciones de los grupos h y k en la poblacin total (o sea, la frecuencia relativa de cada clase). Si se divide cada elemento de la matriz D por el ingreso medio de toda la poblacin(Vm) se obtiene la matriz D/Vm y el coeficiente de Gini resulta de aplicar la frmula: G = Pt.(D/Vm).P siendo P = (P1, P2, .... , Pm )t P es el vector columna cuyos elementos son las frecuencias relativas de cada grupo dentro de la poblacin total. Ahora viene una caracterstica importante del coeficiente de Gini interpretado de esta manera; se trata de la descomposicin de la matriz D en tres matrices, cada una de las cuales indica un aspecto relevante de la desigualdad total. Los elementos localizados sobre la diagonal principal de la matriz D indican cul es la ganancia esperada de aplicar el juego de Pyatt dentro de cada una de las clases en que se particion la poblacin. Los elementos dhk para k h representan la ganancia esperada de las unidades de la clase h en relacin con la clase k. Si ordenamos las clases de menor a mayor segn sus respectivos ingresos medios, el valor del elemento dhk de la matriz D es mayor que su simtrico dkh siempre que k>h (recordar que las diferencias no son nulas slo si el 2 ingreso es mayor que el
45
1, y que la mayora de los ingresos de la clase k son mayores que la mayora de los ingresos de la clase h, pudiendo suceder lo contrario slo en una minora de casos). En el caso de que el menor ingreso de k sea mayor que el mayor ingreso de h, el valor del elemento dkh ser cero. Puede demostrarse que: dhk = dkh + Vk Vh medios de las clases k y h. Es Vk > Vh y tambin dhk > dkh De acuerdo con estas consideraciones la matriz D puede ser expresada como la suma de tres matrices: La 1 , D1, se construye de modo que su diagonal principal sea la misma de D y los dems elementos iguales a cero. La 2, D2, es una matriz simtrica cuya diagonal principal est compuesta por ceros y cuyos elementos fuera de la diagonal son, para cada par, el valor mnimo de los elementos dhk y dkh. Teniendo en cuenta que en el grupo k son mayora los ingresos mayores que el promedio de ingresos en el grupo h, el valor mnimo es dkh (k > h). Si todos los ingresos del grupo k son mayores que todos los ingresos del grupo h, entonces dkh = 0 y la matriz D2 sera la matriz nula La 3, D3, se obtiene restando D (D1 + D2), sus elementos son ceros en la diagonal principal y debajo de ella y positivos iguales a Vk Vh por encima de la misma. donde Vk y Vh son los ingresos
46
d11 0.0..........0 0.d 0.0......0 22 D1 = 0.0.d 33 0......0 .................... 0.0.............d mm d23 D d32 D2 v3-v2 D3
0.d 21d31...........d m1 d 0.d ..........d m2 21 32 d 31d32 0...........d m3 D2 = ......................... d m1d m 2 d m3 ........0
Ejemplo: d23=d32+ v3-v2

de donde
d23-d32= v3-v2
0.v2 v1.v3 v1...........vm v1 0.....0.....v v ..........v v 3 2 m 2 0.....0.........0...............vm v3 D3= ...................................vm vm 1 0.....0.........0...................0 El coeficiente de Gini queda ahora as: G = Pt(D1/Vm + D2/Vm + D3/Vm)P El ndice de desigualdad se interpreta ahora en trminos de esta frmula y est compuesto de tres partes. La 1 parte es la suma ponderada de los elementos de la diagonal de D 1/Vm, siendo las ponderaciones PkPk; recurdese que los elementos de la diagonal son el promedio de las diferencias de ingresos dentro de cada clase, expresados en trminos del ingreso medio de toda la poblacin. De all que esta suma es interpretable como la contribucin a la desigualdad total de las desigualdades dentro de los grupos. Este efecto se denomina efecto de desigualdades internas. La 2 parte es la suma de los elementos de la matriz D2/Vm multiplicados por las ponderaciones PkPh. Los elementos de esta matriz representan el valor promedio de las diferencias entre los ingresos entre algunas unidades de la clase k con algunas unidades de la clase h que se superponen a la clase k por tener ingresos ms altos. Este efecto se denomina efecto de superposicin. El 3er componente de la desigualdad de ingresos en la poblacin corresponde a la matriz D3/Vm . El producto Pt(D3/Vm)P es la suma de las diferencias entre los ingresos medios de
47
las clases, ponderados por las respectivas probabilidades. Este componente se denomina efecto diferencias entre ingresos medios. La expresin del coeficiente de Gini se puede transformar de notacin matricial a notacin de sumatorias : G = mk=1Pk2dkk/Vm + h<kPhPk.dkh/Vm + mk=2mh=1PhPk(Vk Vh)/Vm Una transformacin algebraica permite obtener una expresin en la que los ndices de Gini para cada clase de la particin aparezcan explcitamente. Otra forma de descomponer el coeficiente de Gini: Si a cada fila de D1, D2, D3, se la divide por el ingreso medio de la clase correspondiente a esa fila, la expresin anterior toma la forma : G = Pt(D1 + D2 + D3)P O sea, (fila 1)/V1, (fila 2)/V2, ... , (fila m)/Vm NOTA: no confundir Vm (ingreso medio general) con Vm (ingreso medio en el grupo m). Siendo P el vector columna de las proporciones del ingreso de cada clase respecto del ingreso total de la poblacin, en tanto que D1, D2, D3, son las transformaciones de las matrices D1,D2, D3, despus que sus elementos fueran divididos por el ingreso medio de cada clase.La diagonal de D1 est formada por los ndices de Gini de cada clase. La ecuacin anterior se puede transformar en: G = mk=1PkPkGk + mh=1mk=1PhPkdhk + mk>hmh=1PhPk(Vk Vh )/Vh Donde : Gk es el coeficiente de Gini para la clase k. CONTRASTACION DE HIPOTESIS Esta forma de descomposicin del ndice de Gini permite confrontar la informacin con hiptesis acerca de las relaciones entre variables clasificatorias utilizadas y la distribucin del ingreso. Supongamos que se particiona la poblacin en tres clases, (m=3), cada una de las cuales corresponde a un nivel dado de la variable Z: educacin. Establecemos tres niveles de educacin para hacer el anlisis (tres clases). Hiptesis H0 : a mayores valores de z corresponden mayores ingresos. Analizando la suma ponderada de diferencias que definen al Gini, observamos que : D1 (desigualdades internas) no contradice ni corrobora H0. D2 (superposicin) una mitad contradice, otra mitad corrobora H0. D3 (diferencias de medias) corroboran la hiptesis H0
48
aquellas para las que el mayor ingreso corresponde al mayor valor de Z y contradicen H 0 los casos inversos. De esta manera, se puede reconstruir el coeficiente de Gini presentndolo como la suma ponderada de las diferencias de ingresos que corroboran y de las que contradicen una determinada hiptesis, utilizando esta descomposicin y atendiendo en especial al efecto diferencias de ingresos medios (D3). A continuacin el cuadro de la descomposicin del ndice de Gini para el gran Buenos Aires segn el nivel educativo. Nivel 1 (clase a) : escuela primaria incompleta. Nivel 2 (clase b) : escuela primaria y secundaria completas. Nivel 3 (clase c) : estudios universitarios (completos o incompletos). Ver cuadro : Descomposicin del ndice de Gini para el Gran Buenos Aires segn nivel educativo de la familia 1991-1995. Octubre Gini total Internas Superposi 1991 1992 1993 1994 1995 (1) 0,4658 0,4512 0,4525 0,4785 0,4838 (2) 0,17997 0,18201 0,17569 0,17740 0,17526 cion (3) 0,08530 0,08127 0,07948 0,07011 0,07993 Medias (4) 0,20052 0,18792 0,19733 0,23099 0,22861 4/1 0,43 0,42 0,44 0,48 0,47 3/1 0,18 0,18 0,18 0,15 0,16 2/1 0,39 0,40 0,38 0,37 0,37
Pasos sucesivos para determinar el ndice de Gini. Se establece un criterio para diferenciar las clases educativo). Se toman los datos de los ingresos de una muestra de las familias de la poblacin que se investiga . Se ordenan los ingresos de menor a mayor y se les adjudica el rango que les corresponde Previa seleccin aleatoria, se calculan las diferencias de rangos Yjk Yih , entre cualesquiera Yj de la clase k y cualesquiera Yi de la clase h. Se hacen los promedios de diferencias dhk y dkh (superposicin).
49
(en este caso, nivel
Se hacen los promedios de rango por clase (Vh, Vk) y el promedio general Vm. Se calculan las frecuencias relativas para las distintas clases y se establece el vector P. Se confeccionan las matrices D1 (promedios de diferencias internas), D2 (promedios de diferencias por superposicin), D3 (diferencias entre medias de rangos, Vk Vh , siendo k > h.
Se dividen los elementos de las matrices D1, D2, D3, entre el ingreso medio general Vm. Se aplica la frmula G = Pt(D1/Vm + D2/Vm + D3/Vm)P para hallar el ndice de Gini, general y desglosado, con el fin de contrastar hiptesis (en este caso concreto, Ho: mayor educacin implica mayor ingreso). EJEMPLO de clculo del ndice de Gini con descomposicin:
Sea una muestra de 20 personas, las cuales clasificamos en clases segn su nivel de estudio. Clase 1: escuela primaria incompleta Clase 2: escuela primaria y secundaria completas Clase 3: estudios universitarios, completos e incompletos. Supongamos que la cantidad de personas en cada clase sea de 10, 7 y 3 en la 1, 2 y 3 clase respectivamente. Asignamos un rango segn sus ingresos, de menor a mayor, a cada una de las 20 personas. Supongamos que la distribucin de rangos dentro de cada clase quede as: Clase 1: 1,2,3,4,5,7,9,10,11,13 Clase 2: 6,8,12,14,16,17,18 Clase 3: 15,19,20 Seleccin aleatoria de rangos dentro de cada clase: Clase 1: 1,3,7,13. Clase 2: 8,14,17. Clase 3: 15,20. Diferencias de rangos (sumatoria):
50
De clase 1 a clase 2: 7+13+16+5+11+14+1+7+10+0+1+4 = 89 Promedio: De clase 1 a clase 3: 14+19+12+17+8+13+2+7 = 92 De clase 2 a clase 3: 7+12+1+6+0+3 = 29 De clase 2 a clase 1: 0+0+0+5+0+0+0+0+0+0+0+0 = 5 De clase 3 a clase 1: 0+0+0+0+0+0+0+0 = 0 De clase 3 a clase 2: 0+0+2+0+0+0 =2 De clase 1 a clase 1: 0+2+6+12+0+0+4+10+0+0+0+6+0+0+0+0 = 40 De clase 2 a clase 2: 0+6+9+0+0+3+0+0+0 = 18 De clase 3 a clase 3: 0+5+0+0 = 5 Promedio: d33 = 5/4 = 1,25 Promedio: d22 = 18/9 = 2 Promedio: d11 = 40/16 = 2,5 Promedio: d32 = 2/6 = 0,3 Promedio: d31 = 0/8 = 0 Promedio: d21 = 5/12 = 0,4 Promedio: d23 = 29/6 = 4,8 Promedio: d13 = 92/8 = 11,5 d12 = 89/12 = 7,4
Ahora calculamos los promedios generales de cada clase sobre la base de la seleccin aleatoria que hemos hecho:
51
V1 = (1+3+7+13)/4 = 6
V2 = (8+14+17)/3 = 13
V3 = (15+20)/2 = 17,5
Por lo tanto la matriz D queda formada as: 2,5.7,4.11,5 D = 0,4.2.....4,8 0....0,3...1,25 Se cumple que: d12 d21 = V2 V1 ya que: 7,4 0,4 = 13 6 =7 d13 d31 = V3 V1 ya que: 11,5 0 = 17,5 6 = 11,5 d23 d32 = V3 V2 ya que: 4,8 0,3 = 17,5 13 = 4,5 Las matrices D1, D2, D3, quedan as: 2,5.0.0 D1 = 0...2..0 0...0..1,25 0....0,4.0 D2 = 0,4.0...0,3 0....0,3.0 0..7..11,5 D3 = 0..0...4,5 0..0...0
Calculamos ahora la frecuencia relativa de cada clase: P1= 10/20, P2= 7/20, P3= 3/20 Formamos el vector P: P = [10/20, 7/20, 3/20]t Calculamos el promedio de rangos total: Vm = [n(n+1)/2]/n = (n+1)/2 = 21/2 = 10,5 Vm = 10,5.Calculamos: Pt( D1/Vm) P = 0,086 Pt( D2/Vm) P = 0,016 Pt (D3/Vm) P = 0,221 Sumamos y calculamos el ndice de Gini global: G = 0,086 + 0,016 + 0,221 = 0,323 G = 0,323 Vemos qu proporcin dentro de este ndice corresponde a diferencias internas, a superposicin y a diferencias entre medias:Internas: 0,086/0,323 = 0,266, superposicin: 0,016/0,323 = 0,050 medias: 0,221/0,323 = 0,684 El ndice de Gini total es mediano, implica desigualdad no muy alta entre los ingresos. Un 68,4% de la desigualdad se debe a diferencias educacionales (diferencia entre medias).
52
CAPTULO V MEDIDAS DE POBREZA
I MEDIDAS DE POBREZA Una vez que la lnea de pobreza, valor del ingreso o del consumo por debajo del cual se considera pobre a un individuo o a una familia y que constituye una fraccin del ingreso medio, ha sido establecida, se pueden calcular varias estadsticas que describen la incidencia, la profundidad y la severidad de la pobreza. Entre ellas se incluyen el ndice head-count (H), el ndice brecha de pobreza (PG) y el ndice brecha cuadrtica de pobreza (SPG), el cual mide la severidad de la pobreza. Foster, Greer y Thorbecke (1984) muestran que estos tres ndices pueden ser calculados a partir de la siguiente frmula: P = (1/N).qi=1((z - xi)/z) donde xi es la medida del bienestar (consumo o ingreso) de la persona i ; z es la lnea de pobreza, N es el total de personas (o familias) de la muestra, q es la cantidad de pobres y puede interpretarse como una medida de rechazo a la desigualdad (ya que acenta la presencia de desigualdades entre la poblacin pobre). Cuando = 0, la anterior ecuacin se reduce a q/N, que representa la fraccin de pobres en la muestra. Esta medida, muy usual, de incidencia de la pobreza, expresada en forma de porcentaje, se llama ndice head-count. El defecto de esta medida es que no destaca la situacin de quienes estn muy por debajo de la lnea de pobreza. Cuando = 1, se obtiene el ndice brecha de pobreza (PG), el cual muestra la cada del consumo (o ingreso) con respecto a la lnea de pobreza, acentuando la incidencia de los sectores ms pobres. Esta brecha de pobreza, la cual es suma a su vez de todas las brechas en la poblacin, puede usarse como indicador del costo mnimo necesario para eliminar la pobreza mediante transferencias. La contabilizacin de las transferencias comprende usualmente filtraciones y costos administrativos, por eso a menudo el costo de eliminar la pobreza se interpreta como un mltiplo de PG.
53
Cuando = 2, el ndice brecha cuadrtica de pobreza (SPG), mide la severidad o intensidad de la pobreza y acenta la presencia de pobreza extrema (o sea, la existencia de pobres entre pobres). A diferencia de otras medidas, estos tres ndices tienen la importante propiedad de ser aditivamente separables, por ejemplo, el ndice head-count es igual a la suma ponderada de los ndices rural y urbano. Pasaremos revista a los principales resultados estadsticos de medidas de pobreza, los cuales se presentan en este orden: 1 Indices (medidas) de pobreza. 2 Lneas de pobreza (determinacin de las mismas) 3 Estimacin de los ndices y construccin de intervalos de confianza. Estas medidas se pueden hacer sobre la base de los ingresos (individuales, familiares, etc.), o sobre la base de los gastos. En cuanto a los ingresos, no hay un vnculo claro entre su distribucin y los parmetros bsicos de la economa y la sociedad. Lo cual constituye una dificultad para construir indicadores de pobreza. Algunos axiomas sirven de orientacin y ayuda. Exponemos los dos primeros axiomas: AXIOMA I (de monotonicidad) : si todo lo dems permanece igual, una reduccin del ingreso de una persona que est por debajo de la lnea de pobreza debe aumentar la medida o ndice de pobreza En lenguaje formal, matemtico, significa: si tenemos una poblacin con ingresos {xi} y un ndice de pobreza P(x) definido para una lnea de pobreza z, entonces para una poblacin con ingresos {yi k<z y yk<xk, Vi k, yi = xi} tenemos necesariamente P(y) > P(x). AXIOMA II (de transferencia) : si todo lo dems permanece igual, una transferencia unilateral de ingreso de una persona por debajo de la lnea de pobreza a otra persona ms rica ocasiona un aumento de la medida (o ndice) de pobreza En lenguaje formal, si tenemos una poblacin con ingresos {xi} y un ndice de pobreza P(x) definido para una lnea de pobreza z, entonces para una poblacin con ingresos
54
{yiyk = xk a, ym = xm + a, km,xk<z y yi=xi para ik, im} tenemos forzosamente P(y) > P(x); no importa que xm est por encima o por debajo de la lnea de pobreza. Sin embargo algunos ndices no se ajustan a estos axiomas. El objetivo de estos axiomas, y de otros, es limitar y ordenar los elementos normativos que dominan la construccin de estos ndices. Una amplia experiencia emprica ha permitido que ciertos ndices de pobreza se hayan popularizado. Tenemos una clase de ndices importante que agrupa a la mayora de ellos, se trata de los ndices aditivamente separables. Se caracterizan por la frmula: P = z0 (z,x)dF(x) Se llaman as por tener esta importante propiedad: Consideremos una distribucin de ingresos dividida en m grupos disjuntos, cada uno de ellos con una funcin de densidad fi (x). Entonces la densidad de esta distribucin puede ser escrita como: f(x) = i fi (x), en la que i es la proporcin de individuos en el isimo grupo, siendo i = 1. Si se multiplican ambos lados de la expresin anterior por (z,x) y se integra el resultado queda:
( z , x) f ( x) = ( z, x) i f i ( x)
grupo i
( z , x) f ( x) dx = i ( z , x) f i ( x)dx
P = i Pi , donde P es la medida de pobreza global, y Pi es la medida de pobreza del Esto permite descomponer las muestras en diferentes subgrupos , por ej., gnero, edad, regin, etc., descomposicin que ha sido muy til sobre todo por sus implicaciones polticas. Veremos algunos ndices de pobreza usados frecuentemente: 1 Proporcin de pobres (head-count): Nos informa la proporcin de la poblacin que se encuentra por debajo de la lnea de pobreza. Definiendo la lnea de pobreza como z (valor fijo), este ndice puede formularse as: H = dF ( x) = F(z) para una distribucin continua de ingresos.
0 z
55
Para el caso discreto se estima como: H = q/N, igualdad en la que q representa el nmero de personas por debajo de la lnea de pobreza (o sea, cantidad de pobres). Este ndice es el ms antiguo y de ms amplio uso. Da un mensaje directo y sencillo, de gran atractivo en crculos polticos por ser intuitivo y fcil de comprender. Sin embargo, este ndice no respeta ninguno de los axiomas antes expuestos, siendo adems insensible a la distribucin del ingreso entre los pobres y a la intensidad de la pobreza. 2 Cuociente de pobreza: Este ndice toma en cuenta, en cierta medida, la intensidad de la pobreza; se define por
z
la
frmula:
PG
z z z x 1 1 z x dF ( x) = (1 )dF ( x) = dF ( x) xdF ( x) = F ( z ) p = F ( z ) p z z z0 z z 0 0 0
en la que p es el ingreso medio de los pobres y F(z) es la proporcin de pobres H vista anteriormente. La diferencia z-p , es llamada por algunos brecha de pobreza; si se trata de un individuo particular la brecha de pobreza es z-x i . Otros autores llaman brecha de pobreza a esta medida de pobreza PG. Como p = F (z ) donde es el ingreso medio general, la expresin anterior queda as:
z x dF ( x ) = F ( z ) z F ( z ) = F ( z )(1 z ) z 0
z
Este ndice satisface el axioma I pero no el axioma II. 3 Indices P : esta familia de ndices incluye como casos particulares a los dos ndices anteriores. Se define as: P = z0 [(z-x)/z] dF(x), donde es un parmetro. Para = 0 tenemos la proporcin de pobres (H) Para =1 tenemos el cuociente de pobreza (o brecha de pobreza) (PG) Para > 1, esta frmula sobrepondera a los miembros ms pobres de la poblacin. NOTA : No confundir P con p. La P que estamos manejando en este momento es un ndice (o , medida) de pobreza. Se trata de una constante, un valor fijo. Cada poblacin en cada poca tiene una determinada medida de pobreza. En cambio la otra p a
56
la cual hacemos referencia , a la cual tambin hemos visto y seguiremos viendo, es una variable que da la proporcin de la poblacin que percibe ingresos inferiores a un cierto valor x, en otras palabras, es la distribucin de la poblacin con respecto al ingreso. Se cumple que p = F(x) y que H = F(z), donde x es el ingreso individual (o familiar), z es el valor de la lnea de pobreza (fraccin del ingreso medio Vm) y H es la medida de pobreza head-count. Tambin se cumple que p = Vm L(H, ), donde p es el ingreso medio entre los pobres, Vm es el ingreso medio general, L es la funcin que corresponde a la curva de Lorenz, H es el ndice head-count y es un parmetro vectorial (est dividido en componentes, cada uno de los cuales es a su vez un parmetro) que sirve para determinar la curva de Lorenz. 4 Indice de Sen: Su frmula es : S = F(z)[ z (1 Gp)] / z en la que Gp es el ndice de Gini para los pobres. 5 Indice de Kakwani : P(k) = [(k+1)/z]z0 (z-x)[1 F(x)/F(z)]k.dF(x) Puede escribirse como: P(k) = F(z) [k(k+1)Vm]/[z.F dF(x) Donde Vm es la media de ingreso de la poblacin, L(F(x)) es la curva de Lorenz de la distribucin F(x). NOTA : recordemos estas igualdades: F(z) = H, F(x) = p, L(F(x)) = L(p), dp. 6 Indice de Watts: W = z0 (ln z ln x)dF(x) 7 Indice de Clark : C = z0 [1 (x/z)1/ ]dF(x) II INGRESO, LINEAS DE POBREZA Y UNIDADES MUESTRALES Para efectuar una medida de pobreza se requieren estos tres elementos, los cuales tienen un grado variable de arbitrariedad. 1 Ingresos y gastos dF(x) =
k
(z)]F(z)0 L(F(x))[F(z) F(x)]k-1
57
Se trata de comparar el bienestar y de hacer escalas ordinales y cardinales con el fin de establecer un orden completo en los individuos de una poblacin. No es forzosa la correspondencia entre estos rdenes y el nivel de bienestar. Esta posibilidad se asume al efectuar una medida de pobreza. Se puede trabajar con la informacin contenida en una muestra de la poblacin, ya sea con respecto a los ingresos de sus integrantes o ya sea con respecto a los gastos de los mismos. El ingreso es una variable elusiva e imprecisa, se puede considerar compuesta por cuatro componentes: ingreso generado en el mercado de trabajo, ingreso generado por la propiedad de capital, transferencias netas y otros. Las dos primeras categoras se conocen como ganancia. Todas estas cuatro categoras son de muy difcil evaluacin, por esa razn generalmente se prefiere trabajar con variables de gasto. Las variables de gasto tienen una definicin ms precisa y clara. Las dificultades en la medicin del gasto son ms susceptibles de un tratamiento emprico adecuado. La informacin relativa a los gastos tambin es valiosa para establecer una lnea de pobreza. 2 Lneas de pobreza Definicin formal: dada una variable que representa el nivel de bienestar de los miembros de una poblacin, llamamos lnea de pobreza a un nivel o umbral de esta variable que separa a los pobres de los no-pobres en esta poblacin. A la variable bienestar , que en general tiene opciones ambiguas e inseguras, se refiere la lnea de pobreza (pobreza de ganancia, pobreza de gastos, etc.). Esta lnea de pobreza es un valor fijo determinado, en parte arbitrariamente, segn criterio de los investigadores. Se pueden definir dos tipos de lneas de pobreza: objetivas y subjetivas. En las objetivas prevalece el criterio del analista, en las subjetivas prevalece el criterio de los entrevistados. Tambin hay lneas de pobreza relativas y lneas de pobreza absolutas. En el primer caso relacionamos la lnea de pobreza con algn estadgrafo central (media, mediana, etc.) de la poblacin en estudio. Consiste en una proporcin dada, generalmente, de la mediana; aunque no hay reglas para esta eleccin. A menudo se toma 2/3 de la mediana para la lnea de pobreza y 1/3 para la de extrema pobreza.
58
En el caso de lneas de pobreza absolutas, la determinacin se hace de modo independiente de los niveles de bienestar de la poblacin en estudio. Se considera un ingreso o gasto que corresponda a un conjunto mnimo de necesidades bsicas, aunque estos factores varan bastante de una poblacin a otra y de una poca a otra. Tampoco hay una correspondencia unvoca entre el bienestar mnimo y el nivel de gastos, esta relacin puede ser afectada por cuestiones culturales y preferencias de la poblacin en estudio. Aparte de eso, el mnimo de bienestar vara de individuo a individuo, de familia a familia, de acuerdo con las edades, patrones culturales, etc. Ms importante es la clasificacin de pobreza en lneas exgenas y lneas endgenas. En el primer caso se determina la lnea de pobreza en forma independiente de la poblacin en estudio. En el segundo caso la lnea de pobreza depende de la distribucin del ingreso de la poblacin considerada. Las lneas de pobreza relativas son endgenas. En gral., las lneas de pobreza son en parte exgenas y en parte endgenas, adems la eleccin de ellas es incierta y sujeta a arbitrariedades introducidas por elementos normativos. Los ndices de pobreza son sensibles a la eleccin de la lnea de pobreza; ellos son funciones montonas crecientes con respecto a la lnea de pobreza (z). Anlisis orientados hacia la formulacin y evaluacin de polticas estn casi siempre basados en lneas de pobreza absolutas. En la prctica llamamos as a las lneas objetivas construidas sin referencia a algn estadgrafo central de la distribucin del ingreso. 3 Unidades muestrales Por lo comn la pobreza y la distribucin del ingreso son estudiadas con ayuda de encuestas de hogares, donde la unidad muestral es el hogar o la familia. Esto es as porque hay un gran nmero de individuos que perciben ingresos o participan de gastos slo de manera indirecta por causa de su pertenencia a una familia. Sin embargo, estas unidades muestrales no son directamente comparables debido a que difieren en tamao y composicin. Por ello, para que las unidades muestrales sirvan como objeto de anlisis es necesario normalizarlas. Esto se consigue corrigiendo la variable de ingreso o gasto segn el tamao normalizado de cada familia, o bien refiriendo esta informacin a un ingreso o gasto per cpita sobre la base de este tamao normalizado. Se introducen las llamadas escalas de adulto equivalente , que asignan a cada ,miembro de la familia un ponderador
59
con un valor entre 0 y l. Estos ponderadores suelen guardar una correlacin positiva con la edad y con las necesidades nutricionales de los miembros de la familia. La suma de estos ponderadores nos da el tamao normalizado de la familia, por lo gral., menor que el tamao real. III INDICES DE POBREZA Y TEST DE HIPOTESIS. Debido a que los ndices de pobreza analizados no son computados de modo directo a partir de la informacin poblacional, sino que son estimados a partir de muestras, es importante considerar el problema de la construccin de intervalos de confianza. Limitaremos este anlisis a la familia de ndices P , aditivamente separables. Consideremos el caso de una muestra {xi }ni=1 de n observaciones independientes extradas de una cierta poblacin con distribucin de ingresos F(x) y lnea de pobreza (z). Introduzcamos ahora la funcin ndice Ii tal que : Ii = 1 si xi < z, Ii = 0 si xi z. Consideremos ahora la clase de ndices de pobreza aditivamente separables. Es decir, ndices P que pueden ser escritos como P = z0 (z,x)dF(x) = z0 (z,x)f(x)dx donde x son los ingresos, y F(x) (o tambin, p) es el tanto por uno de la poblacin con ingresos inferiores a x. Ver grfica. el ndice de Watts y el ndice de Clark, todos
p = F(x) 1 F(Vm) H
p = f(x)
Vm
X = ingresos, p = tanto por uno de la poblacin con ingresos menores que x p = F(x), dp = f(x)dx
60
Un estimador muestral para esta clase de ndices es: Pe = (1/N)Qi=1 (z,xi) en el que q es el nmero de personas bajo la lnea de pobreza. Es decir q = ni=1 Ii. Para demostrar que este estimador muestral es no-sesgado podemos reescribirlo con ayuda de nuestra funcin ndice como: Pe = (1/N) ni=1 Ii (z,xi) Podemos observar que debido a que: E[Ii(z,xi)] = z0 (z,x) dF(x) = P entonces queda: E[Pe] = E[(1/N)ni=1 Ii(z,xi)] =(1/N) ni=1 E[Ii(z,xi)] = (1/N)ni=1 z0 (z,x)dF(x) (1/N)NP = P Var var(1 / N ) I i ( z , xi ) = (Pe) 1 1 1 var( I i ( z , xi ) = 2 n var( I i ( z, xi ) = var( I i ( z , xi ) 2 n n n = =
Dado que z es un nmero fijo y que suponemos que x i y xj tienen valores independientes para todo ij tambien podemos afirmar lo mismo para Ii(z,xi) y para Ij(z,xj). En consecuencia, podemos aplicar el teorema central del lmite y afirmar que n.(Pe P) tiene una distribucin asinttica normal con media 0 y varianza: 2 = E[Ii(z,xi) P]2 Demostracin: E n ( Pe P) = n E ( Pe P) = n ( E ( Pe) P ) = n ( P P ) = 0 1 var n ( Pe P ) = n var(Pe P ) = n var( Pe) = n var[ I i ( z , xi )] = var[ I i ( z , xi )] = n 2 2 2 2 E ( I i ( z, xi ) P ) = E ( I i ( z , xi )) P =
[
[
Un estimador muestral de esta varianza puede ser definido con ayuda de la siguiente frmula: 2p = (1/n) xi<z 2(z,x) Pe2 Aplicando estas frmulas a los ndices ya presentados se consiguen los siguientes resultados: Indices P :
P = (1/N).xi<z [(z-xi)/z]
2 = var ( n ( P )) = P 2 P 2 donde P = P p
estimado Aqu : 2(z,x) = [(z-xi)/z]2 ya que (z,x) = [(z-x)/z] y se tiene que:
61
(1/N)xi<z[(z-x)/z]2 = P 2 Proporcin de pobres (head-count) (H)
H = P0 = q/N , 2 = var ( n H ) = H (1 H ) H Cuociente de pobreza ( brecha de pobreza, PG) P = (1/N) xi<z [(z-xi)/z] = (1/N)xi<z(1 xi/z) = q/N (1/z)(q/N)(1/q)xi = 1 q/N (1/z)(q/N). = (q/N)(1 /z) = H .(1 /z) (1/N)xi<zxi = (q/N)(1/q)xi<zxi = (q/N) pobres. Indice de Watts : W = (1/N) xi<z(ln z ln xi)
2 2 w = var ( nW ) = (1/N).xi<z(ln z ln xi) W 2
en el que = media del ingreso de los
Indice de Clark :
2 2 2 c2 = [1/( n)]xi<z[1 (xi/z) ] C
C = (1/) [H (1/N)xi<z(xi/z)] La desviacin estandar de var( n Pe) n
n .Pe es : s ( n Pe) =
var( n Pe)
y de Pe es :
s(Pe) =
Podemos ahora construir intervalos de confianza. Observamos que la variable: t = (Pe P)/ s(Pe) sigue una distribucin normal con media 0 y varianza 1. Por lo tanto: Pe - z. s(Pe) P Pe + z.s(Pe) donde z es la variable z de la dist. Normal tipificada al nivel . Si se considera la hiptesis nula : H0 : P = 0 queda : t = Pe/s(Pe) , si t>z entonces H0 se descarta. Por otra parte si tenemos dos muestras independientes con tamaos n1 y n2 e ndices de pobreza P1 y P2 respectivamente, podemos apreciar que la desviacin estandar de (
62
P P2 ) est dada por s( P P2 ) = 1 1
2 12 2 en donde 2 y 2 son estimadores de las + 1 2 n1 n2
varianzas asintticas de ( n1 )P1 y ( n2 )P2 respectivamente. Introduciremos ahora algunas herramientas de cmputo relativamente simples para estimar las mediciones de la pobreza a partir de una clasificacin de los datos disponibles de distintas fuentes. Para usar estas herramientas slo se necesita un cuadro bsico de regresin. La metodologa se presta con facilidad a cierto nmero de simulaciones de pobreza para ser discutidas. El problema central es: Cmo construir una medida de pobreza a partir de datos agrupados?. Se examinan dos amplias maneras de aproximarnos a esta medida: los mtodos de interpolacin simple y los mtodos basados en la Curva de Lorenz parametrizada. El segundo mtodo se examina en detalle. La forma tpica de disponer los datos relativos a la distribucin de la renta o del consumo se muestra en la tabla 1. Las primeras tres columnas de la tabla dan la distribucin del consumo en la India rural para 1983. Nos dirigimos al problema central : cmo construir mediciones de pobreza? Como se dijo anteriormente, hay dos amplios caminos: interpolacin simple y curva de Lorenz. El segundo camino es preferible al primero. Sin embargo, comenzaremos describiendo brevemente la primer aproximacin y algunos problemas de su aplicacin. El mtodo de interpolacin consiste en adecuar una funcin de distribucin a los datos agrupados. Para estimar el ndice head-count la funcin de distribucin debe ajustarse sobre el intervalo de clase que contiene la lnea de pobreza . La interpolacin lineal y cuadrtica son buenos ejemplos de este mtodo. Hay dos limitaciones bsicas al usar los mtodos de interpolacin. En primer lugar ellos tienden a dar predicciones imprecisas acerca de la funcin de distribucin correspondiente a los puntos seleccionados. Esto es particularmente cierto en la interpolacin lineal. La interpolacin cuadrtica predice con ms exactitud, pero puede a veces dar densidades negativas(cuando la pendiente se vuelve negativa). Segundo, el clculo de las medidas de pobreza usando los mtodos de interpolacin puede ser engorroso e inexacto. Pueden haber refinamientos en los mtodos de interpolacin, por ejemplo, ajustando diferentes funciones de distribucin a diferentes intervalos de clase
63
(como en Kakwani y Subbarao, 1993). Pero se choca posteriormente con el problema de qu funciones ajustar sobre qu intervalos. Una metodologa alternativa para estimar las medidas de pobreza est basada en las curvas de Lorenz paramtricas. Esta metodologa se prefiere por su relativa exactitud y por lo fcil que resulta ejecutar con su ayuda una simulacin de pobreza. A continuacin se discute su implementacin . El siguiente anlisis considera el consumo como una medida del bienestar individual y por eso es la variable en trminos de la cual se mide la pobreza. Aunque esto slo se refiere a una exposicin conveniente, la metodologa sigue siendo general con respecto a la eleccin de una medida del bienestar individual. Tambin se acepta que la lnea de pobreza (definida en trminos de la misma variable) ha sido previamente determinada. Medidas de pobreza deducidas a partir de curvas paramtricas de Lorenz. Los bloques constructivos bsicos de esta metodologa son las siguientes dos funciones: Curva de Lorenz: L = L(p; ) Medida de pobreza: P = P(/z; ) Donde L es la distribucin sobre la base del p % de la poblacin y su consumo acumulado. es un vector de parmetros estimados de la curva de Lorenz. P es una medida de pobreza tomada como una funcin de la razn del consumo medio sobre la lnea de pobreza z, y de los parmetros de la curva de Lorenz. La curva de Lorenz capta toda la informacin acerca de la desigualdad relativa de la poblacin . Ella es independiente de consideraciones acerca de un estandar absoluto de vida. La lnea de pobreza refleja nuestra evaluacin acerca de un estandar absoluto de vida de los pobres. Como ya fue dicho, la medida de pobreza es homognea de grado cero en cuanto a la media de consumo y la lnea de pobreza z, de tal modo que si el consumo medio y la lnea de pobreza cambian en la misma proporcin, la pobreza quedar invariable. La homogeneidad de grado cero es una propiedad satisfecha por una gran variedad de medidas de pobreza. La funcin L comprende parametrizaciones alternativas de la curva de Lorenz, mientras que la funcin P comprende diferentes medidas de pobreza.
64
Tomaremos como medidas de pobreza las que se catalogan como clase FGT (Foster Greer Thorbecke). La clase FGT de medidas de pobreza tiene algunas propiedades deseables (como ser aditivamente descomponibles) y se incluyen en ella algunas medidas de pobreza muy usadas (como ser, las medidas head-count y brecha de pobreza). Se definen as: z x Clase FGT : P = f ( x) dx 0 z Donde: x = consumo familiar z = lnea de pobreza f(x) = densidad (en este caso, derivada de p = F(x)) = parmetro no-negativo Valores ms altos del parmetro significa que tiene mayor sensibilidad la medida de pobreza hacia las desigualdades entre los pobres. En lo que sigue, nos referiremos a la estimacin de las medidas de pobreza P, para = 0, = 1 y = 2, las cuales se denominan: P0 : head-count ndices (H) P1 : brecha de pobreza (PG) P2 : brecha cuadrtica de pobreza (SPG) En adelante, estas medidas se denotarn como H, PG y SPG. Se conocen varias formas funcionales para una estimacin de la curva de Lorenz. Dos de las mejores son: la curva de Lorenz general cuadrtica (GQ) y la que podemos llamar curva Beta-Lorenz (Kakwani, 1980). Las funciones de Lorenz para estas dos especificaciones se dan en el encabezamiento de la tabla 2. Esta tabla tambin da las frmulas para las medidas de pobreza H, PG y SPG, para cada una de estas dos parametrizaciones de la curva de Lorenz. Las medidas de pobreza se calculan sobre la base de estas frmulas. Acerca de cul tomar entre las dos parametrizaciones de la curva de Lorenz ya se vi anteriormente. Notaremos que ambas tienden a ser exactas. Hay algunas evidencias para Indonesia que el Beta-modelo produce predicciones ms precisas de las ordenadas de Lorenz en el extremo inferior de la distribucin, aunque el mismo estudio encuentra que el modelo GQ es ms
z
65
exacto sobre la distribucin total (Ravallion y Huppi, 1990). El modelo GQ tiene una ventaja comparativa sobre el modelo Beta, a saber, que l es ms simple computacionalmente. Mientras todas las medidas de pobreza para el modelo GQ han sido en realidad calculadas usando un programa de regresin simple, el modelo Beta requiere resolver una ecuacin implcita no-lineal para estimar H y para evaluar las funciones Beta incompletas necesarias en la estimacin de SPG. El modelo GQ de la curva de Lorenz se usa aqu con fines ilustrativos. La implementacin del Beta-modelo es anloga. La estimacin de las medidas de pobreza se basa en las frmulas de la tabla 2. Antes de estimar la pobreza es conveniente comprender cmo se obtienen estas frmulas. 1 El ndice head-count (H) : Se deduce mediante la relacin estrecha que hay entre la curva de Lorenz y la funcin de distribucin (ntese que p = F(x) como una funcin de x es, de hecho, la funcin de distribucin). Recordar que: Clase FGT : P = z0 [(z-x)/z] f(x)dx Cuando x vara de 0 a z, tambin p vara de 0 a H. La variable x es el ingreso (o consumo, individual o familiar). El valor es el ingreso medio general (o consumo medio). En la curva de Lorenz se debe cumplir que: L (p, ) = x/ . Aqu L (p, ) es la derivada de la curva de Lorenz. O sea, la pendiente de la curva de Lorenz en el punto x es x/. Esta pendiente evaluada con respecto a la lnea de pobreza z , teniendo en cuenta que para x = z es p = H, queda as : L (H, ) = z/ . Resolviendo para H produce las frmulas del ndice head-count en la tabla 2. Se toma en cuenta que H es el punto sobre el eje p donde la pendiente a la curva de Lorenz es z/. 2 El ndice PG, brecha de pobreza: Para deducir PG se acostumbra reformular la clase FGT de medida de pobreza como: P = H0 [(z-x)/z]dp, 0 , donde x/z = (/z)(x/) = (/z)L(p,) y tambin dp = f(x)dx, Siendo p = F(x). Esta frmula evaluando la integral para = 1 produce:
66
P1 = PG = H (/z).L(H,)
Para los datos de la tabla 1 se tiene que: = 109,9 rupias
(moneda ind), z = 89 rupias, H = 0,4506, L(H) = L(0,4506) = 0,26403 As , una vez que H ha sido calculada, directamente se calcula PG usando esta frmula. En este caso PG = 0,4506 (109,9/89).0,26403 = 0,12457 3 La medida de pobreza SPG: Ella se deduce evaluando la anterior integral para = 2. La frmula dada para SPG en la tabla 2 es simplemente el valor de esta integral. Aunque resulta ms fcil sustituir parmetros por valores e integrar despus. Una receta para construir medidas de pobreza. Para el modelo general cuadrtico de la curva de Lorenz, la clase de pobreza FGT medida para = 0, = 1 y = 2 se construye como est indicado en los pasos 1 a 5 del captulo CURVA DE LORENZ. La escala de las lneas de pobreza admisibles para la curva de Lorenz se da sobre la base de la funcin de densidad asociada a la curva de Lorenz. Esta densidad tiene dominio en el intervalo [ .L (0+, ); .L (1, ) ]. Para una curva de Lorenz tericamente vlida la escala admisible de las lnas de pobreza es evaluada as, L (0,999, ) ]. Para los datos de la India esta escala se indica en la tabla 4. Desigualdad estimada y elasticidad de las medidas de pobreza. Una muy usada medida de la desigualdad, el ndice de Gini, ya visto, se calcula fcilmente usando los parmetros estimados de la curva de Lorenz. Las frmulas ms importantes se dan en la tabla 5.Se puede tambin usar esta metodologa para construir estimaciones puntuales de elasticidad de las medidas de pobreza con respecto al consumo medio y al ndice de Gini. Las frmulas para estas elasticidades deducidas por Kakwani (1990) se presentan en la tabla 6. Las frmulas para las elasticidades con respecto al ndice de Gini asumen los desvos de la curva de Lorenz proporcionalmente sobre el rango global. El clculo de estos puntos de elasticidad est directamente ligado a cmo hemos generado la informacin necesaria. Las estimaciones del ndice de Gini y de los puntos de elasticidad de las mediciones de pobreza para la India rural se dan en la tabla 4. dentro de este intervalo [ L (0,001, );
67
68
Simulaciones de pobreza .Una importante ventaja del mtodo basado en la curva de Lorenz para estimar la pobreza es que permite un servicio de simulacin de pobreza muy verstil. Se pueden con l realizar diferentes simulaciones. Se consideran algunas en lo que sigue: Simulando medidas de pobreza para diferentes lneas de pobreza. Esta simulacin puede ser hecha a bajo costo, computando marginalmente, especificando una alternativa de lnea de pobreza en el paso 3 de la estimacin de la medida de pobreza. La sensibilidad de la medida de pobreza con respecto a la lnea de pobreza puede ser as fcilmente examinada para cualquier rango elegido de lnea de pobreza. Un caso especial es la estimacin de la ultra-pobreza (extrema pobreza) , la cual se obtiene especificando una lnea de ultra-pobreza, digamos entre el 75% y el 80% de la lnea regular de pobreza. Simulacin de pobreza por debajo del crecimiento neutro distribucional. El crecimiento neutro distribucional implica un cambio en el consumo medio (o en cualquier variable utilizada para medir el estandar de vida), sin que haya un cambio en la desigualdad relativa incorporado a la curva de Lorenz. El efecto del crecimiento distribucional neutro de la pobreza es fcilmente simulado usando el valor proyectado de la media en el paso 3 de la estimacin de la medida de pobreza. El World Development Report 1990 del Banco Mundial usa tales simulaciones para proyectar la pobreza del ao 2000. Descomposicin de los cambios en la pobreza en poca de crecimiento y de redistribucin de componentes. La idea bsica es como sigue: para cualesquiera dos datos, 0 y 1, el componente de crecimiento de un cambio en la medida de pobreza se define como el cambio en la pobreza debido a un cambio en la media, de 0 a 1 , mientras se mantiene constante la curva de Lorenz, L0 = L (p, 0) . El componente de redistribucin se define como el cambio en la pobreza debido a un cambio en la curva de Lorenz, de L0 = L (p, 0) a L1 = L (p, 1) mientras se mantiene constante la media 0. De aqu la siguiente descomposicin: P ( 1/z, 1) P ( 0/z, 0) = [P ( 1/z, 0) P ( 0/z, 0)] + [P ( 0/z, 1) P (0/z, 0 )] + residuo Cambio en la pobreza = componente de crecimiento + componente de redistribucin + Residuo
69
As, aparte de la medida de la pobreza basada en dos grupos de datos, nosotros necesitamos dos medidas simuladas de pobreza llamadas P (1, 0) y P ( 0, 1) para computar la descomposicin. Las medidas simuladas de pobreza son fciles de obtener estimando la pobreza con los parmetros de Lorenz para unos datos y estimando la pobreza con la media para otros. Desde que la lnea de pobreza se mantiene fija sobre los dos grupos de datos habra que asegurar que la media ha sido ajustada para los cambios en el costo de la vida sobre la base de los dos grupos de datos. Los resultados de la descomposicin del cambio en la pobreza en la India rural entre 1983 y 1986-1987 se muestran en la tabla 7. Simulando la contribucin de las disparidades regionales o sectoriales en el consumo medio a la pobreza agregada. Esto implica el siguiente experimento. Supongamos que hay n sectores o regiones econmicas, cada una con su consumo medio, i , y la curva de Lorenz Li = L (p, i) para i = 1, ... , n. La pobreza agregada en la economa es entonces deducida como la suma peso-poblacional de pobreza en cada sector i y est dada por P ( i/z, i). Planteamos ahora el problema: cul sera el nivel de pobreza agregada si no hubiera disparidades en la media de consumo por sectores mientras las desigualdades intrasectoriales incorporadas en el sector especfico de la curva de Lorenz Li se mantienen sin cambio? La respuesta se consigue haciendo cada i (consumo medio en el sector i) igual a (consumo medio general) y evaluando la suma peso-poblacional de P (/z, i). El valor de P (/z, i) puede ser calculado usando las frmulas de la tabla 2. La diferencia entre la suma peso-poblacional de P (/z, i) y P (i/z, i) mide la contribucin de las disparidades sectoriales en el consumo medio de la pobreza agregada. Tanto puede ser usada una simulacin explicando el perfil de pobreza para un pas, como ella nos ayuda a tasar la cantidad de pobreza agregada que es atribuible a las diferencias en el consumo medio a travs de las regiones, sectores o grupos socio-econmicos. Una aplicacin para la India se da en Dat y Ravallion (1993). Estos son slo unos pocos ejemplos ilustrativos. Pero las herramientas presentadas aqu pueden ser fcilmente adaptadas a la simulacin de pobreza en otros contextos.
70
CAPTULO VI ANEXO
Resumen sintetizado del libro de Hayward R. Alker El uso de la matemtica en el anlisis poltico VARIABLES DICOTOMICAS RELACIONES ENTRE DOS VARIABLES DICOTOMICAS: La formalizacin matemtica es de particular utilidad cuando se trata de enunciar y poner a prueba hiptesis vagas o cuestionables; obliga al cientfico a expresar y relacionar atributos por medio de variables cuantitativas. La estadstica es una rama de la matemtica particularmente importante para estudiar la poltica. Se puede dividir en: Estadstica descriptiva : Descripcin y medicin de caractersticas propias a determinados conjuntos de datos. Las distribuciones acumulativas son una tcnica de la misma. Estadstica inductiva: Infiere generalizaciones y las verifica. Enuncia los riesgos que implica aceptar o rechazar hiptesis referentes a una poblacin sobre la base de datos aleatorias muestrales. Esta generalizacin inductiva resulta muy til para el razonamiento poltico. Este captulo se trata de los mtodos para correlacionar dos variables y efectuar anlisis de regresin. Comprende tres partes: A: Relaciones entre atributos B: Anlisis de regresin y correlacin. C: Asociacin de cualidades mediante la correlacin de cantidades. A: RELACIONES ENTRE ATRIBUTOS
71
Debemos explicar relaciones entre variables cualitativas en trminos de otras variables cuantitativas. Si se trata de atributos dicotmicos, o sea, para los cuales hay slo dos opciones, estar presente o estar ausente, podemos cuantificarlos de la siguiente manera: Atributo A : presente implica A = 1 ausente implica A = 0 Atributo B: presente implica B = 1 ausente implica B=0 A NoA a+b c+d N Para ver qu relaciones existen entre los atributos A y B podemos hacer el cuadro:
B a b NoB c d a+c b+d N=a+b+c+d
Las variables a+b, c+d, a+c, b+d, se llaman distribuciones marginales. N es la poblacin total. Las variables a, b, c y d, significan: a: cantidad de veces en que A y B estn presentes simultneamente. b: cantidad de veces en que A est ausente y B presente simultneamente. c: cantidad de veces en que A est presente y B ausente simultneamente. d: cantidad de veces en que A est ausente y B ausente simultneamente. a+b: cantidad de veces que B est presente independientemente de A. c+d: cantidad de veces que B est ausente independientemente de A. a+c: cantidad de veces que A est presente independientemente de B. b+d: cantidad de veces que A est ausente independientemente de B. Los atributos A y B pueden asociarse de cuatro maneras diferentes: Independientes:
72
Se debe cumplir que : si no existe relacin alguna entre dos atributos A y B, esperamos hallar, tanto entre las A como entre las NoA la misma proporcin de B. Esta es la definicin de independencia de Yule. Yule tambin establece como criterio de independencia la siguiente relacin: a/(a+c) =b/(b+d) = (a+b)/N lo que implica que: a = (a+b)(a+c)/N O sea, el valor previsto (esperado) de a, si hay independencia entre las variables A y B, es igual al producto de las proporciones marginales de la fila y columna de a, multiplicado por la poblacin total N. La proporcin marginal de la fila de a es (a+b)/N y la proporcin marginal de la columna de a es (a+c)/N. Por ejemplo, si tuviramos para los marginales estos valores fijos: a+b = 75, c+d =75, a+c=50, b+d =100, N=150, el cuadro quedara as: A B 25 NoB 25 50 Asociacin perfecta: Es cuando los dos atributos estn siempre ambos presentes simultneamente, o ambos ausentes simultneamente. En este caso es b=0 (NoA y B) y tambin c=0 (A y NoB), a+c = a+b = a, b+d = c+d = d. Por ejemplo, si a=50 y d=100 el cuadro quedara as : A equivalente a B Significa: simultneamente NoA a NoB B NoB A 50 0 50 NoA 0 100 100 50 100 150 NoA 50 75 50 75 100 150
Asociacin condicional: A implica B, pero NoA no implica NoB, en cambio NoB implica NoA.
73
En este caso c=0. Si se da A tambin se da B (equivale a que si no se da B tampoco se da A). Por ejemplo, si a=50, b=25, c=0 B NoB A 50 0 50 NoA 25 75 100 75 75 150
Otro ejemplo: si a=40, b=30, c=0 B NoB A 40 0 40 NoA 30 80 110 70 80 150
Asociacin imperfecta: Este tipo de asociacin, diferente a los anteriores, se define como el grado en que la relacin entre dos atributos difiere de lo previsto si hubiera independencia. Esta asociacin no es rgida y predeterminada como la asociacin perfecta, ni es causal como lo es la asociacin condicional, sino que es en mayor o menor grado aleatoria. Para describir la asociacin imperfecta entre dos atributos son necesarios ciertos coeficientes, llamados coeficientes de asociacin entre atributos, los cuales se obtienen a partir de las tablas de contingencia (tablas 2x2 si se trata de dos variables). COEFICIENTES DE ASOCIACION Diferencias de proporciones: Podemos imaginar la asociacin entre atributos ligada de alguna forma al desvo respecto de la independencia. Si las variables son independientes se cumple que: a / (a+ c) = b / (b + d) Lo que implica que a/(a+c) b/(b+d) = 0, si esta diferencia es diferente de cero significa que hay algn grado de asociacin entre atributos; llamemos Eyx a esta diferencia de proporciones Eyx = a/(a+c) b/(b+d) = (ad bc)/[(a+c)(b+d)] Otras diferencias podran calcularse de manera similar, por ejemplo:
74
a/(a+b) c/(c+d) = (ad bc)/[(a+b)(c+d)] Diferencias entre las entradas de casillero observadas y las marginalmente previstas. El criterio de independencia de variables basado en el producto de marginales tambin nos sirve para evaluar el grado de dependencia, alcanza con restar del valor real el valor esperado en caso de ser independientes. Por eso mediremos la magnitud de la diferencia entre cada casillero de una tabla de contingencia y el valor que tendra si los atributos A y B fuesen independientes entre s. Empleando un subndice cero para referirse a las frecuencias previstas para cada casillero, calculadas slo sobre la base de los marginales Yule define una medida a (delta a) igual a la diferencia entre a y a0 . a = a a0 = a (a+b)(a+c)/N = (ad bc)/N Una vez establecidos los marginales queda una sola opcin para asignar entradas a los casilleros. La medida a retiene este nico grado de libertad. Por lo tanto en la tabla de contingencia 2x2 las siempre son iguales salvo en el signo. Podemos replantear una tabla 2x2 del siguiente modo: B NoB O as: B NoB A a0 + (-) c0 (+) a+c NoA b0 (+) a + b d0 + (-) c+d b+d N A a 0 + a c0+ c a+c NoA b0+ b d0+d b+d a+b c+d N
La suma de los marginales previstos debe ser igual a la suma de los marginales reales, por eso: a = b = c = d a = - b = - c = d ; a0 + b0 = a + b; a0 + c0 =a + c, b0 + d0 = b + d, c0 + d0 = c + d Demostracin: a0 + b0 = (a+c)(a+b)/N + (a+b)(b+d)/N = (a2+b2+2ab+ac+bc+ad+bd)/N = [(a+b)2+ (a+b)(c+d)]/N = (a+b)(a+b+c+d)/N = (a+b)N/N = a + b Como las son todas iguales en valor absoluto las vamos a llamar indistintamente .
75
El producto cruzado entre A y B.
Los altos valores de las a y las d corresponden a una fuerte asociacin entre los atributos A y B. Una forma de determinar la medida en que los casilleros a y d tienen un valor elevado, en tanto que b y c lo tienen bajo, consiste en restar sus respectivos productos. La expresin resultante, ad bc, se denomina producto cruzado. b c A B a NoB c a+c NoA b d b+d a+b c+d N d a
Tambin se pueden definir los productos cruzados de proporciones. Sean las proporciones Pa = a/N, Pb = b/N, Pa+b = (a+b)/N, el producto cruzado de las proporciones se denota : CAB = Pa.Pd Pb.Pc = ad/N2 bc/N2 = (ad bc)/N2 Tanto los productos cruzados, como las Eyx y las miden desvos respecto del criterio de independencia. Si restamos la proporcin de a (o sea, a/N) menos la proporcin de a0 (o sea, a0/N) veremos que esta resta es equivalente a CAB. Pa Pa0 = a/N a0/N = (a a0)/N = /N = [a (a+c)(a+b)/N]/N = (aN-a2-ac-abbc)/N2 = [a(N-a-c-b)-bc]/N2 = CAB O sea, CAB = Pa Pa0, y tambin CAB = /N As que tanto Eyx , como , como CAB tienen en sus numeradores el producto cruzado simple (ad bc ), lo que indica que estas tres formas de medir el grado de dependencia se relacionan. Chi-cuadrado (2) y fi-cuadrado (2).
Otras dos medidas de asociacin frecuentes en estadstica son X2 y 2. 2 se define como X2/N, o sea 2 = X2 promedio. Podemos definir X2 de esta manera : X2 = ni=1(frecuencia observada frecuencia esperada)2/(frecuencia esperada) X2 = (a-a0)2/a0 + (b-b0)2/b0 + (c-c0)2/c0 + (d-d0)2/d0 = a2/a0 + b2/b0 + c2/c0 + d2/d0
76
Teniendo en cuenta que todas las son iguales en valor absoluto, la frmula para chicuadrado (X2) queda as : X2 = 2/(1/a0 + 1/b0 + 1/c0 + 1/d0) o tambin X2 = ni=1i2/ei donde las ei son las entradas marginalmente previstas para cada casillero. Q de Yule.
El cociente Q = N./(ad + bc) = (ad bc)/(ad + bc) vara entre 1 y +1. (-1 Q +1) y su valor no depende de los cambios que sufran los marginales, adems es igual a la unidad en las asociaciones condicionales y en las perfectas. Como resumen de todo esto tenemos el siguiente cuadro : Eyx = (ad bc)/[(a+c)(b+d)] = a/(a+c) b/(b+d), = bc / N = a0 = b0 = c0 = d0 a0 = (a + b)(a + c)/ N , b0 = (b + d)(a + b)/ N, c0 = (a + c)(c + d)/ N, d0 = (b + d)(c + d)/ N CAB = / N = bc / N2 = .Pd Pb.Pc = Pa0 = Pb0 = Pc0 = Pd0 Si se trata de una tabla 2x2, entonces: X2 = 2. 4i=1(1/ei) En general, para una tabla de cualquier dimensin: X2 = ni=1i2/ ei Cuadro resumido para una tabla 2x2: Eyx = (ad bc)/[(a+c)(b+d)] CAB = bc / N2 = / N X2 = N(ad bc)2/[(a+c)(b+d)(a+b)(c+d)] = bc / N 2 = X2 / N Q (Yule) = (ad bc)/ (ad + bc) 2 = X2/ N N=a+b+c+d
B : ANALISIS DE CORRELACION Y REGRESION Este anlisis sirve para conocer mejor el significado de las distintas medidas de asociacin cualitativas ya vistas.
77
El primer paso ser observar las distribuciones de frecuencias de las variables a analizar. Cuando las variables pueden adoptar muchos ms valores que los dos posibles atributos dicotmicos resultan apropiados para una representacin grfica los histogramas (grficos de barras) y los polgonos de frecuencia. Se hace una representacin grfica para cada variable. Por ej., si se quiere ver qu relacin hay entre el gasto pblico y el porcentaje de votantes que concurre a las urnas, considerando varios pases, las grficas podran ser las siguientes: Nmero de pases 10 9 8 7 6 5 4 3 2 1 0 0 10 Nmero de pases (frecuencia) 10 9 8 7 6 5 4 3 2 20 30 40 50 60 70 Gasto pblico (porcentajes) 80 90 0 20 40 60 80 100 Porcentaje de votantes
El gasto pblico, oficial y privado, se toma como porcentaje del producto nacional bruto. Total de pases : 26. Analizando el 1er. Grfico se ve que el gasto pblico oscila entre el 10% y el 50% del PNB . Analizando el 2 grfico se ve que la participacin electoral oscila entre el 0% y el 100%. Lo que hace pensar que desvos del 10% al 20% en el gasto pblico se corresponden con desvos del 30% o 40% en la participacin electoral. Vemos tambin que las distribuciones de frecuencia en cada grfico adoptan formas muy distintas. El gasto pblico tiene una distribucin acampanada con un pico (o sea, aproximadamente normal), es una distribucin unimodal. En cambio la participacin electoral es bimodal, lo que significa que las participaciones de votantes altas y bajas son ms frecuentes que las medias.
78
En la siguiente grfica se indica, para cada pas, los porcentajes de participacin electoral y de gasto pblico.
Gasto pblico 100 (porcentaje PNB) 90 80 70 60 50 40 30 20 10 0 10 20 30 40 50 60 70 80 90 100 Porcentaje de participacin electoral Si se observa este diagrama de dispersin se comprueba que existe cierta asociacin general positiva entre participacin poltica y gasto pblico. Las dos lneas all trazadas indican la necesidad de responder a estas interrogantes: Qu forma adopta la relacin entre cantidad de votantes y gasto pblico? El modo ms simple y directo de describir la forma real y precisa de esta relacin es la recta de mejor ajuste. Cmo determinamos dicha recta? Aceptaremos las siguientes convenciones y supuestos: Sea i = 1,2, ... , N (en este ejemplo N = 26) Xi = cantidad de votantes del pas i. Yi = gastos reales Puesto que se toman en cuenta los desvos por encima y por debajo de los valores medios de estas variables, tomaremos: Ym = (1/N).Ni=1Yi = Y media; yi = Yi Ym, xi = Xi Xm, Xm = (1/N).Ni=1Xi = X media
79
Las x e y minsculas equivalen a las X e Y maysculas tomadas alrededor de sus respectivas medias aritmticas. Supondremos que una ecuacin lineal nos ofrece una aproximacin satisfactoria a la relacin real implicada. Siendo as, las variaciones en el gasto pblico sern proporcionales a las variaciones en el nmero de votantes. Llamando al valor predicho por esta ecuacin lineal, se tiene : = a + bX Si X=0 =a, la pendiente b nos indica la variacin de cuando X vara en una unidad. Por ej., si b= entonces una variacin de un 20% en la participacin electoral dar como resultado una variacin de un 10% en el gasto pblico. Ahora bien, el problema consiste en hallar a y b. Esta recta, se llama recta de regresin y los coeficientes a y b se llaman coeficientes de regresin. Se define: di = Yi i = desvo entre el gasto real y el gasto predicho. Los desvos medios o totales deben dar cero para que sea la mejor recta de ajuste. O sea, Ni=1di = 0. Ni=1di = Ni=1( Yi i ) = Ni=1(Yi a bXi) = 0 Desarrollando esta ltima igualdad: Ni=1Yi Ni=1 a Ni=1bXi = 0 Ni=1Yi N.a b.Ni=1Xi = 0 a = (1/N).Ni=1Yi (b/N).Ni=1Xi Ym=Ymedia y Xm=Xmedia Si en la ecuacin = a + bX reemplazamos a por la expresin anterior : = Ym bXm + bX Ym = b(X Xm) denotando: = Ym, x = X Xm, Queda as: = bx ecuacin que significa que para cada i es: i = bxi equivalente a i Ym = b(Xi Xm). De aqu vemos que cuando x = 0 (o sea, cuando X = Xm) es tambin y = 0 (o sea, Y = Ym), quiere decir que la recta de mejor ajuste pasa por el punto (Xm, Ym). Necesitamos un criterio adicional para hallar el coeficiente b, pendiente de la recta. Como criterio adicional tomaremos que la suma de los cuadrados de las desviaciones di debe ser mnima (criterio de los mnimos cuadrados), o sea: O sea, a = Ym bXm siendo
80
Ni=1di2 = Ni=1(Yi i)2 = Ni=1(Yi a bXi)2 = un mnimo NOTA: recordar que i = a + b.Xi Sustituyendo a por su valor a = Ym bXm , queda: Ni=1di2 = Ni=1[Yi Ym b.(Xi Xm)]2 = Ni=1(yi b.xi)2 = (yi2 2bxiyi+ b2xi2) derivando esta expresin con respecto a b e igualando la derivada a 0, podemos hallar para qu valor de b esta expresin adquiere su valor mnimo. [d(di2)]/db = - 2.xiyi + 2bxi2= 0 de donde bxi2 = xiyi b = (xiyi)/xi2 conocido b podemos hallar a mediante la expresin a = Ym bXm Para la recta de regresin de la figura anterior es b=0,27, a=16 y la ecuacin es: i = 16 + 0,27.Xi Cul es el grado de precisin de este modelo? Podramos esperar que los desvos cuadrticos a partir de la recta de regresin fueran mucho ms pequeos que los desvos cuadrticos de la variable dependiente (o ms bien, variable explicada) con respecto a su media. El desvo cuadrtico medio de una variable con respecto a su media se llama varianza (smbolo sy2). Varianza total = sy2 = (1/N)(Yi Ym)2 = (1/N)yi2 En realidad, esta varianza total sy2 se puede desdoblar en una parte explicada y otra parte no-explicada. La ecuacin de regresin no explica las diferencias entre sus resultados (i) y las Yi reales. La suma media de estos desvos se llama varianza no-explicada. Varianza no-explicada = sd2 = (1/N)di2 = (1/N)(Yi i)2 A su vez, la diferencia entre la varianza total y la varianza no-explicada se llama varianza explicada por la ecuacin de regresin y se refiere a los desvos entre los valores predichos y la media Ym. Varianza explicada = s2 = (1/N)(i Ym)2
81
Cuanto mayor es la varianza explicada ms se aproxima a la varianza total y menor es la cantidad de desvos no explicados, lo que significa que el modelo se ajusta mejor a la realidad y el grado de dependencia es a su vez mayor. La identidad matemtica entre estos componentes de la varianza total es: Sy2 = (1/N)(Yi Ym)2 = (1/N)(i Ym)2 + (1/N)(Yi i)2 O sea, expresado con palabras: Varianza total = varianza explicada + varianza no-explicada Demostracin: Yi Ym = (Yi i) + (i Ym), (Yi Ym)2 = (Yi i)2 + 2.(Yi i)(i Ym) + (i Ym)2 sumando ahora de 1 a N queda: (Yi Ym)2 = (Yi i)2 + 2.(Yi i) (i Ym) + (i Ym)2 teniendo que: Yi i = Yi a bXi = Yi Ym + bXm bXi = (Yi Ym) b(Xi Xm) = yi bxi Recordar que: yi = Yi Ym, xi = Xi Xm, a = Ym b.Xm, entonces: (Yi i)(i Ym) = (yi bxi)(i Ym) = (yi bxi)(a + bXi Ym) = (yi bxi)b(Xi Xm) = (yi bxi)bxi = bxiyi b2xi2 = b( xiyi bxi2 ) = b[ xiyi (xiyi / xi2 )xi2] = 0 (1/N)(Yi Ym)2 = (1/N)(i Ym)2 + (1/N)(Yi i)2 El poder de un modelo de regresin puede definirse como la proporcin de varianza explicada con respecto a la varianza total. A este poder se le llama coeficiente de determinacin( r2 ), el cual se define: r2 = varianza explicada / varianza total r2 = s2/sy2 = (i Ym)2 / (Yi Ym)2 = proporcin de varianza explicada. Este coeficiente de determinacin r2 por ser la proporcin de varianza explicada resulta muy til; ms an que el coeficiente de correlacin r (raz cuadrada del coeficiente de determinacin). Se puede medir la utilidad de un modelo de regresin por la reduccin de los desvos que la ecuacin de regresin permite. La relacin entre las varianzas sd2 (varianza no-explicada) y la sy2 (varianza total) se llama coeficiente de alienacin. Coeficiente de alienacin = (varianza no-explicada) / (varianza total) = sd2/sy2 (sy2- s2)/sy2 = 1-r2 = Por lo tanto se cumple que:
82
Se despejamos sd : sd = sy 1 r 2 dicho con otras palabras : la desviacin estandar noexplicada (sd) es igual a la desviacin estandar total multiplicada por la raz cuadrada del coeficiente de alienacin . Esta igualdad nos dice qu proporcin ( 1 r 2 ) del desvo
estandar total (sy) permanece como desvo por encima y por debajo de la lnea de regresin. Alienacin = 1 r2 Determinacin = r2
Acerca del coeficiente de correlacin r . Definimos la varianza emprica de la variable X como la desviacin cuadrtica media Var (X) = (1/N)xi2 = (1/N)(Xi Xm)2 , as como tambin la varianza emprica de la variable Y, Var (Y) = (1/N)yi2 = (1/N)(Yi Ym)2 Ahora definiremos la covarianza emprica como el producto cruzado medio entre dos variables X e Y. Cov (X, Y) = (1/N)xiyi = (1/N)(Xi Xm)(Yi Ym) Se le llama correlacin r entre las variables X e Y al cociente: r = cov (X, Y) / r = (xiyi) / var X . var Y ) = (1/N)xiyi /
2 i 2 i
1 1 xi2 N yi2 N
O sea :
x y
Demostraremos que este coeficiente de correlacin ( r ) es la
raz cuadrada del coeficiente de determinacin ( r2 ). Definamos r2 como la proporcin de variacin explicada por la ecuacin de regresin. r 2 = [ (i Ym)2 ]/ [ (Yi Ym)2 ] Recordemos que: i Ym = i = bxi y que (Yi Ym)2 = yi2 por lo tanto r2 queda : r2 = [ (bxi)2 ]/ yi2 = [b2xi2 ]/ yi2 = (xiyi / xi2)2(xi2/ yi2) = [(xiyi)2/ xi2]/ yi2 finalmente queda: r2 = (xiyi)2/(xi2yi2) r = (xiyi)/
x y
2 i
2 i
) = [cov (X,Y)]/
var X . var Y
O sea, (coeficiente de determinacin) = coeficiente de correlacin Adems de estas consideraciones tambin tenemos lo siguiente: si sustituimos las variables X e Y por las variables estandarizadas (o, normalizadas) correspondientes Zx(i) = (Xi Xm)/ sx , Zy(i) = (Yi Ym)/ sy, donde sx = 0, var X , sy = var Y , Zxm =
Zym = 0, var (Zx) = 1, var (Zy) = 1, donde Zxm y Zym son respectivamente las
medias de Zx y Zy
83
Por lo tanto Zx ~ N(0,1), Zy ~ N(0,1) O sea, Zx y Zy tienen la distribucin normal tipificada. Si ahora hacemos el producto cruzado medio de estas nuevas variables: (1/N)Zx(i).Zy(i) = (1/N)[(Xi Xm)/sx].[(Yi Ym)/sy] = (1/N)(xi/sx)(yi/sy) = (1/N) (xiyi)/(sxsy) = [ xiyi/N]/ var X . var y ) = [cov (X,Y)]/ encontramos que es igual a la correlacin r. O sea, r = (1/N)Zx(i)Zy(i), y por lo tanto la determinacin r2 = [(1/N)ZxZy]2 NOTA: recordamos que todas las sumatorias son de i =1 a i = N. Otra relacin ms: r = (1/N)[ xiyi]/(sxsy) = [ xiyi]/[ N sx N sy ] = [ xiyi/ [ xiyi/ sx = var X . var Y ) = r
2 i
][1/( N sy)] =
2 i
][
x x
2 i
2 i
/(
2 i
N sy)] dado que:
var x =
/N
2 i
N sx =
2 i
, continuamos:
r = [ xiyi / xi2 ][(
)/( N sy)] = [xiyi/xi2][( N sx)/( N sy)] =
[ xiyi/ xi2 ](sx/sy) = b(sx/sy). O sea, finalmente queda, r = b( sx / sy ) Si las variables estn estandarizadas, sx = 1, sy = 1 y r = b. En este caso la correlacin r es la pendiente de la recta de regresin. A esta altura es necesario hacer la siguiente advertencia: cuando las distribuciones de frecuencia para dos variables tienen formas muy dispares, no es posible lograr ecuaciones de regresin lineal de ajuste perfecto. El ajuste mejorar a veces si se procede a transformar una o ambas variables hasta que tengan distribuciones aproximadamente normales. Se puede cambiar la variable X ya sea por: el rango de X, el log X, la X, X 2, etc., para lograr ese fin. Ahora veremos cmo caracterizar las relaciones entre dos variables. La forma de la relacin puede ser a travs de una recta de regresin (regresin lineal) o mediante alguna otra curva.
84
El poder explicativo de la relacin se mide por el coeficiente de determinacin ( r2 ) que nos indica qu proporcin de la varianza de la variable dependiente ha sido explicada.
La precisin; al estimar la variable dependiente por medio de la ecuacin de regresin se establece el grado de precisin por medio del coeficiente de alienacin ( 1 r2 ), cuya raz cuadrada nos dice qu parte de la desviacin estandar de y (sy) permanece an sin explicar ( o sea, en forma aleatoria ). Recordar que: sd = sy 1 r 2
La significacin estadstica. Por ej., el coeficiente r de correlacin, habiendo estandarizado (normalizado), las variables X e Y , es la pendiente de la recta de regresin.
C:
ASOCIAR
CUALIDADES
EQUIVALE
CORRELACIONAR
CANTIDADES Se puede afirmar que: Las experiencias cualitativas de diferente gnero (polticas, por ej.) pueden cuantificarse en forma coherente siempre que se produzcan con frecuencia y sean objeto de interpretaciones confiables y vlidas. Las tcnicas desarrolladas para manejar datos cuantitativos sugieren valiosos medios para interpretar y verificar hiptesis (polticas, por ej.) referentes a datos cualitativos. El razonamiento matemtico estadstico ofrece al analista (poltico, por ej.) un buen fundamento para elegir cuando investiga. Si se trata de tablas 2x2 los procedimientos de clculo de correlaciones son rpidos y simples. Correlacin de variables ficticias Cuantificaremos de la siguiente manera dos atributos Xi e Yi para i = 1, 2, ... , N Si el atributo X est presente es Si el atributo Y est presente es Xi = 1 Yi = 1 Si el atributo X no est presente es Xi = 0
85
Si el atributo Y no est presente es Yi = 0 Trataremos entonces las variables cualitativas X e Y como variables ficticias que pueden tomar los valores 0 y 1. Este tipo de variable dicotmica se llama en estadstica, variable de Bernoulli. Llamando Px y Qx ( Py y Qy ) a las probabilidades de que el atributo X (Y) est presente o ausente, tenemos las siguientes frmulas: Medias : Xm = Px, Ym = Py Varianzas: sx2 = PxQx, sy2 = PyQy Covarianza (X,Y) = cov (X,Y) = (1/N)xiyi = Pxy PxPy Correlacin (X,Y) = r (X,Y) = (1/N) xiyi / (sxsy) = (Pxy PxPy) / PxQxPyQy
Vemos que las probabilidades Px y Py son las medias Xm y Ym , o sea, las proporciones en que X e Y estn presentes en el total de casos. En otras palabras, Px y Py son las frecuencias relativas de X e Y. Pxy es la proporcin de casos en que X e Y son ambas simultneamente iguales a 1. Qx y Qy son las proporciones en que cada variable est ausente. Qx = 1 Px, Cov (X,Y) = Pxy PxPy , Pa = a/N. Por lo tanto: Cov (X, Y) = Pxy PxPy = a/N (1/N2)(a + c)(a + b) = (ad bc)/N2 = CAB Usando ahora la notacin X, Y, al producto cruzado CAB hay que llamarle CXY . Como CAB = /N donde es la covariacin: = (ad bc)/N Covariacin (X, Y) = YX , covarianza (X, Y) = cov (X, Y) = YX/N 0 b a+b d c+d b+d N Consideremos nuevamente la tabla 2x2. 1 0 1 a c a+c Qy = 1 Py . Comparemos la covarianza de X e Y con el producto cruzado CAB CAB = a / N [(a + c)/N][(a + b)/N] Pxy viene a ser la proporcin de la realizacin conjunta de A y B que en este caso es Px viene a ser la probabilidad de A, Px = (a + c)/N Py es la probabilidad de B que viene a ser (a + b)/N
86
Las probabilidades (proporciones) y varianzas quedan as: Px = (a + c)/N, Qx = (b + d)/N Py = (a + b)/N, Qy = (c + d)/N, sx2 =PxQx = (a + c)(b + d)/ N2, sy2 = PyQy = (a + b)(c + d)/N2 El producto de las varianzas de X e Y: YX = xiyi = covariacin (X, Y). Cov (X, Y) = CXY = (1/N)covariacin (X, Y) = (1/N)xiyi = (ad bc)/N2 = [(ad bc)/N]/N = /N Si elevamos al cuadrado la expresin CXY = (1/N2)(ad bc) queda: CXY2 = (ad bc)2/ N4 Ahora XY2 O sea, el 2 de los atributos dicotmicos equivale al r2 de las variables ficticias. Se deduce tambin que siendo X2 = N2 entonces X2 es N veces la proporcin de varianza explicada por la determinacin r2 para variables ficticias basada en los atributos X e Y. Recordar que: r2 = (( Ym)2) / ((Y Ym)2) Falta an interpretar para X, Y, la medida de asociacin expresada por medio de Eyx: Eyx = a/(a + c) b/(b + d) = (ad bc)/[(a + c)(b + d)] = [(ad bc)/N]/[(a + c)(b + d)/N] = /(NPxQx) Por lo tanto Eyx = bYX ya que: bYX = xiyi / xi2 = [ xiyi/N ]/[xi2/N] = Cov (X, Y) / var (X) de donde bYX = (/N)/(PxQx) = Eyx . Recordar que bYX es la pendiente de la recta de regresin. Eyx se haba definido como la diferencia de proporciones entre las Y que son X menos las Y que no son X. Vemos que para atributos dicotmicos Eyx puede interpretarse como la pendiente de la recta de regresin lineal de Y sobre X. Para los politlogos estos resultados tienen muchas consecuencias prcticas. Se pueden, por ej., realizar interpretaciones cuantitativas de varias medidas de asociacin de atributos relacionados entre s y emplearlas para fines especiales as como las pendientes, covarianzas, correlaciones, coeficientes de determinacin y alienacin se utilizan en los anlisis de regresin entre variables cuantitativas. A menudo en ciencia poltica, cuando se bien, por definicin r2 es : rXY2 = CXY2 / (sx2sy2) = [(ad bc)2/N4]/[(a + c)(b + d)(a + b)(c + d)/N4] = (ad bc)2/[(a + c)(b + d)(a + b)(c + d)] = sx2sy2 = (a + c)(b + d)(a + b)(c + d)/N4
87
trata de tablas 2x2, se emplea la distribucin X2 para probar hiptesis estadsticas, pero conviene considerar tambin otras medidas, como , Eyx, Cxy, 2, las cuales revelaran mucho acerca del significado, forma e intensidad de la relacin. Por ej., para la ecuacin de regresin, tomamos: bYX = Eyx = a/(a + c) b/(b + d), a = Ym bYXXm a = Py EyxPx Luego le damos a X los valores: X = 0 Yi = a = P(Y= 0) Probabilidad de Y dado X = 0 X = 1 Yi = a + bYX = P(Y= 1) Probabilidad de Y dado X = 1 X = Xi Yi = a + bYX.Xi = P(Y= Xi) Probabilidad de Y dado X=Xi Py = a + EyxPx Para encontrar fcilmente la correlacin, recordamos que: r = bsx/sy = b ( PxQx) /( PyQy ) ] Veremos una aplicacin de lo anterior en el siguiente : EJEMPLO Forma general para atributos dicotmicos: A B a NoB c a+c NoA b a+b d c+d b+d N :
Ejemplo numrico de asociacin imperfecta : 1 88 12 100 0 24 56 80
1 0
112 68 180
Ejemplo numrico de asociacin condicional : (con los mismos marginales) 1 0 1 100 0 100 0 12 68 80 112 68 180
Clculos para el ejemplo 1:
88
ad bc = 88.56 12.24 = 4640, este producto cruzado se aleja mucho de cero, por lo tanto las variables no son independientes. = (ad bc)/N = 4640/180 = 25,78, CXY = /N = 25,78/180 = 0,14, Eyx = (ad bc)/[(a + c)(b + d)] = 4640/(100.80) = 0,58 Se puede tomar para b el valor de Eyx, o sea, b = 0,58 (pendiente de la recta de regresin) Q (Yule) = (ad bc)/(ad + bc) = 4640/5216 = 0,89, el valor de Q es cercano a 1, por lo tanto las variables se relacionan positivamente (cuando una aumenta la otra tambin aumenta). X2 = N (ad bc)2 / [(a + c)(b + d)(a + b)(c + d)] = 180.46402/ (112.68.100.80) = 63,61 Siendo X2
4; 0,05
= 9,49 (ver tabla de X2) Aqu chi-cuadrado est tomado con cuatro grados
de libertad (nmero de casilleros) al nivel = 0,05. Como el valor 63,61>9,49, significa que con una probabilidad del 95% las variables no son independientes, sino que se relacionan. Px = (a + c)/N = 100/180 = 0,56, Py = (a + b)/N = 112/180 = 0,62, Qx = 1 Px = 0,44 Qy = 1 Py = 0,38, Pxy = a/N = 88/180 = 0,49, sx2 = PxQx = 0,56.0,44 = 0,25 sx = 0,50, sy2 = PyQy = 0,62.0,38 = 0,24 sy = 0,49 r = Cxy / (sxsy) = 0,14/(0,50.0,49) = 0,57 como r = bsx/sy entonces b = rsy/sx = 0,57.0,49/0,50 de donde b = 0,56 (esta es otra forma de calcular b) Xm = Px = 0,56, Ym = Py = 0,62, a = Ym bXm = 0,62 0,56.0,56 = 0,31 Como a = 0,31 y b = 0,56, entonces la ecuacin de regresin lineal es: = 0,31 + 0,56X Calculamos ahora r2 : r2 = (0,57)2 = 0,32 este resultado significa que la ecuacin de regresin explica el 32% de la varianza.Si consideramos la asociacin condicional del ejemplo 2 podemos obtener el valor mximo que puede alcanzar r2 :r2 mxima = (ad bc)2 / [(a + c)(b + d)(a + b)(c + d)] = X2/N = 2 = 63,61/180 = 0,35 El coeficiente de alienacin es: 1 r2 = 1 0,32 = 0,68, quiere decir que hay un 68% de varianza no-explicada por la ecuacin de regresin. Si hacemos el cociente: r2 / r2 max. = 0,32/0,35 = 0,91, vemos que esta ecuacin de regresin explica el 91% de la mayor proporcin de varianza (35%) que puede explicar un modelo de regresin lineal con los presentes marginales, lo cual ocurre en el caso de la asociacin condicional (cuando c = 0).
89
REFERENCIAS BIBLIOGRAFICAS
PAGINAS WEB
INEQUALITY MEASUREMENT: THE WORLD BANK GROUP htpp://www.worldbank.org/poverty/inequal/methods/measure.htm THE LORENZ CURVE AND GINI COEFFICIENT http://www.cquest.utoronto.ca/geog/ggr270y/penfold_notes/lecture_17.html DISTRIBUCION DEL INGRESO, POBREZA Y GASTO SOCIAL EN AMERICA LATINA http://www.eclac.cl/espanol/portada/oeaesp.htm THE DISTRIBUTION OF EARNINGS IN AUSTRIA, 1972-1991 http://www.economics.uni-linz.ac.at/Papers/papers/9614.htm The Distribution of Income and Poverty http://coba.shsu.edu/micprin/arnold/chap28/chap28.htm Estimating Lorenz Curves Using a Dirichlet Distribution http://www.une.edu.au/febl/EconStud/emetwp.htm Inequality: Methods and Tools http://www.worldbank.org/poverty/inequal/index.htm Inequality and Economic Performance A Brief Overview to Theories of Growth and Distribution http://www.worldbank.org/poverty/inequal/index.htm Wealth and People: Inequality Measures http://outworld.compuserve.com/homepages/SMIPP/entkiss.htm The Third World Institute http://www.item.org.uy/CAS_2000_Tables.htm Vietnam:Attacking Poverty http://www.worldbank.org.vn/rep3/attp001.htm LITERATURE RELATED TO ENTROPY AND INEQUALITY http://ourworld.compuserve.com/homepages/SMIPP/entrolit.htm
90
RESMENES DE LOS DOCUMENTOS DEL PROYECTO POBREZA http://www.ucab.edu.ve ON CALCULATION OF THE EXTENDED GINI COEFFICIENT http://www.une.edu.au/feb1/EconStud/wps.htm Gaurav Datt FCND discussion paper N50, october 1998 Computational tools for poverty measurement and analysis http://www.ifpri.egiar.org/divs/fend/dp/dp50.htm
LIBROS
A.M.Montiel Torres, .F.Rius Daz y F.J.Barn Lopez (1997) Madrid Elementos bsicos de estadstica econmica y empresarial. Hayward R. Alker (h) "El uso de la matemtica en el anlisis poltico" Kendall, M.G. y A.Stuart (1963)The advanced theory of statistics Hafner Publishing Co., New York Salama,David Estadstica, metodologa y aplicacionesCaracas 1995,Editorial Principios
ARTICULOS
Altimir, Oscar (1 979): "La dimensin de la pobreza en Amrica Latina", Cuadernos de CEPAL NI 27, Santiago de Chile. B.Atkinson On the measurement of inequality Journal of Economic Theory,1970 Banco Mundial (1990): Informe sobre el desarrollo mundial 1990. indicadores del desarrollo mundial, Washington. La pobreza,
CEPAL (1 990): Magnitud de la pobreza en Amrica Latina en los aos ochenta, Santiago de Chile. CEPAL-PNUD (1992): "Procedimiento para medir la pobreza en Amrica Latina con el mtodo de la lnea de pobreza", en Comerco Exterior, Vol.42, N'4, Mxico, abril. Chakravarty, Satya R. Extended Gini indices of inequality INTERNACIONAL ECONOMIC REVIEW Vol.29.N1, February 1988. Clark,S., R.Hemming y D.Ulph (1981)
91
"On indices for the measurement of poverty" Economic Journal vol.91 Joshua Cohen Remarks on inequality and poverty David Donaldson and John A.Weymark, Properties of fixed-population poverty indices INTERNATIONAL ECONOMIC REVIEW, Vol.27, N3, October 1986. Feres, Juan Carlos: Notas sobre la medcn de la pobreza segn el mtodo del Ingreso, Revista de la Cepal NI 61, Abril de 1997. Foster,J.E.,Greer y E.Thorbecke (1984) "A class of decomposable poverty measures" Economtrica, vol.52. Foster, James E. and Shorrocks, Anthony F., Subgroup consistent poverty indices ECONOMETRICA, Vol.59, N3 (May 1991), 687-709 Hagenaars, Aldi, A class of poverty indices INTERNATIONAL ECONOMIC REVIEW, Vol 28,N3, October 1987 Kakwani, N. (1980) "On a class of poverty measures" Economtrica vol.48 Kawachi I. Kennedy BP Wilkinson RG. Income inequality and Health Kendall, M.G. y A.Stuart (1963)The advanced theory of statistics Hafner Publishing Co., New York Kwang Soo Cheong A comparison of alternative functional forms for parametric estimation of the Lorenz Curve Martinez, Ibsen, La cruzada de Bernardo Kliksberg El NACIONAL (25/11/2000) P.Ortega, G.Martin, A.Fernandez, M.Ladoux and A.Garca, A new functional form for estimating Lorenz curves REVIEW OF INCOME AND WEALTH, Series 37, Number 4, December 1991. Eduardo J. Ortiz F.
92
"Poltica econmica y distribucin del ingreso" Pattanaik, Prasanta K. and Sengupta, Manimay, An alternative axiomatization of Sens poverty measure REVIEW OF INCOME AND WEALTH, Series 41, N1, March 1995. Diego Petrecolla Distintas descomposiciones del coeficiente de Gini para el Gran Buenos Aires 1980-1995 Pyatt, G. (1985) "An axiomatic approach to the Gini coeficient and the measurement of welfare" Pyatt,G. (1976) "On the interpretation and disaggregation of the Gini coeficients" The Economic Journal, vol.86 Pyatt,G. (1976) "On the interpretation and disaggregation of the Gini coeficients" The Economic Journal, vol.86 Ranjan Gupta, Manash, Functional form estimating the Lorenz Curve ECONOMETRICA, Vol.52, N5 (September 1984) Riutor Matas Pobreza y desigualdad en Venezuela Revista SIC AO LXII No.614 MAYO 1999 Sen, A. K.On economic inequality Oxford University Press,1973 Sen, A.K. (1976)"Poverty: an ordinal approach to measurement" Econometrica, vol.44 Shorrocks, Anthony F., Revisting the Sen poverth index ECONOMETRICA, Vol.63, N5, (September 1995), 1225-1230. H. Theil Economic and information Theory Amsterdam: North Holland,1967 RG. Wilkinson Unhealty Societies. The afflictions of inequality London: Routledge,1996
93
TABLAS
TABLA 1 Distribucin del consumo en la India rural, 1983. D 0 - 30 30 40 40 50 50 60 60 70 70 85 85 100 100 125 125 150 150 200 200 250 250 300 300 - ... Vm= Xi 24,84 35,80 45,36 55,10 64,92 77,08 91,75 110,64 134,90 167,76 215,48 261,66 384,97 109,90 Pi 0,92 2,47 5,11 7,90 9,69 15,24 13,64 16,99 10,00 9,78 3,96 1,81 2,49 100,00 Li 0,00208 0,00805 0,02109 0,03961 0,05724 0,10689 H= 0,11387 0,17104 0,12275 0,14929 0,07764 0,04309 0,08722 P 0,0092 0,0339 0,0850 0,1640 0,2609 0,4133 0,4506 0,5497 0,7196 0,8196 0,9174 0,9570 0,9751 1,0000 L 0,00208 0,01013 0,03122 0,07083 0,12808 0,23498 0,26403 0,34887 0,51994 0,64270 0,79201 0,86966 0,91277 1,00000
D = desembolso en rupias per cpita, Xi = desembolso medio mensual en rupias per cpita Pi = porcentaje poblacional, P = tanto por uno poblacional acumulado, Li = proporcin de consumo por clase, L = proporcin acumulada del consumo. L = Li = (Pi/100)(Xi/109,9) Fuente de los datos: Sarvekshana 1986.
( Pi / 100)( Xi /109,9)
i =1
TABLA 2 Parametrizaciones alternativas de la curva de Lorenz y las medidas de pobreza correspondientes. Curva Beta Lorenz Ecuacin L( p ) = p . p (1 p ) Curva GQ Lorenz L( p ) = 1 bp + e + mp 2 + np + e 2 2
Indice H
z .H (1 H ) = 1 H 1 H
H = 1 2 n + r (b + 2 z / ) (b + 2 z / ) m 2m
1 2
Indice PG
PG = H (/z).L(H)
PG = H (/z).L(H)
94
Indice SPG
Para la curva Beta Lorenz : 2[ ] 2 ) B( H ,2 1,2 + 1) 2 B( H ,2 + 1,2 1) z
P2 = ( 1 / z )[ 2 PG ( 1 / z )] + 2 ( B( k ,r , s ) =
p
0
r 1
( 1 p )s 1dp
Indice SPG
Para la curva GQ Lorenz: Como la expresin algebraica para este ndice es demasiado larga, engorrosa y poco prctica es preferible calcular SPG mediante la siguiente integral 2 H definida: 1 .L( p) dp donde L( p ) est dada en la Tabla 5. z 0
Los parmetros estn dados por las siguientes igualdades: e = (a + b + c + 1) m = b 4a n = 2be 4c

2
r = (n 2 4me 2 )1 / 2 s1 = (r n) /(2m) s2 = (r + n) /( 2m)
= r 1 = s 1 H L( H ) = H (1 H )
NOTA: los valores a, b y c fueron hallados por el mtodo de regresin cuadrtica.
TABLA 4 Medidas de pobreza, elasticidades y estadsticas relacionadas para la India rural, 1983. Consumo medio: = 109,9 rupias, Lnea de pobreza: z = 89,00 rupias. Indice H : 45,06 % , Indice PG : 12,47 %, Indice SPG : 4,752 % , Indice de Gini : 0,289 para curva GQ Lorenz Indice de Gini : 0,38 para curva Beta Lorenz Rango admisible para la lnea de pobreza: (19,47; 147,02) NOTA: este intervalo se determina as (.L(0 + ), .L(1))
95
2 Suma de los errores cuadrticos para el ndice head-count (H) : = ( Li Li ) i =1
curva GQ Lorenz: 5,663.10 6 , curva Beta Lorenz: 14,678.10 6 vemos que hay una mejor bondad de ajuste para la curva GQ Lorenz. Las frmulas para las elasticidades fueron elaboradas por Kakwani (1990). TABLA 6 Elasticidades de las medidas de pobreza con respecto a la media () y con respecto al ndice de Gini. Elasticidad de: H PG SPG Media () -z/(HL(H)) 1 H/PG 2(1 PG/SPG) (con respecto a) Indice de Gini (1-z/)/(HL(H)) 1 + (/z 1)H/PG 2[1 + (/z 1)PG/SPG]
Los valores de las elasticidades correspondientes a estos datos son: H ............................ 1,8677.........................0,4386 PG........................... 2,6123.........................1,8483 SPG......................... 3,2503.........................3,2329
TABLA 7 Descomposicin del cambio en la pobreza en la India rural en el perodo comprendido entre el ao 1983 y el ao 1987. Medida de pobreza H .......................... PG........................ SPG ..................... Cambio total Crecimiento 7,833 3,003 1,438 -7,635 -2,817 -1,297 Redistribucin -0,317 -0,192 -0,149 Residuo 0,119 0,006 0,008
96

PEDUZZIPobreza 1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

PEDUZZIPobreza 1

Cargado por

Copyright:

Formatos disponibles

Pobreza, Desigualdad y sus Medidas

nos interesa medir la desigualdad y la pobreza en una sociedad?.

Fcil de desglosar No No Con dificultad No S S S

en que n = nmero de individuos y yi = ingreso bruto del

hogar per cpita para i individual (ingreso medio aritmtico) y = ( 1 / n )

utilizando la regla de LHpital , sta se convierte en la

Esto puede replantearse como PG = IH en que I es el

coeficiente de la brecha del ingreso y se define como: I = ingreso medio de los

en que yp denota el pobres.

de donde sacando q/N de factor comn queda: PG =

1 Indice del censo de S poblacin 2 Brecha de la pobreza No

No S No Slo por sector No No

pobreza es el ndice de poblacin.

CONSTRUCCIN DE UNA CURVA DE LORENZ

............................................................................................................................ xk nk Nk xknk Ejemplo:

Para ilustrar una aplicacin, consideremos los ingresos en millones de bolvares

Distribucin de concentracin mnima

Curva de Lorenz distribucin de concentracin mxima

Qi 1,45 22,75 45.66 60,16 65,76 72,76 79,41 84,36 100,00

Pi 8,7 51,3 78.8 90,4 93,6 96,4 98,3 99,4 100,0

87 513 788 904 936 964 983 994 1000

L(1,) = 1 automaticamente L (0+, ) 0 L (p, ) 0 p (0,1) iii) 0<m< -n/2; m<n2/42

a+c1 c0 i) m < 0 ii) 0<m<(n2/42), n0

Satisfecha L (0,001, , , ) 0 L (p, , , ) 0 para p = (0,01, 0,02, ... , 0,99)

= ( Li Li ) 2 donde k = { kk-1i=1 pi H ki=1 pi } y donde Li es Li estimado

0,1640 0,2609 0,4133

0,07083 0,12808 0,23498

3 0,0709 2 0,1273 5 0,2344

2 0,0852 8 0,1438 6 0,2399 8 0,2640 3 0,3287 2 0,4418 9 0,5097 4 0,5772 2 0,6052

-0,639 -1,443 1,042 1,8554 -0,28184 1,00395 0,8554 0,00395 0,4506

1 0,6183 L(H 0,26403 9

Pendiente de la curva de Lorenz

Superficie igual al coeficiente de Schutz

Coeficiente de proporciones 20 40 60 75 equitativas 75 % porcentaje acumulativo de la poblacin

CAPTULO IV INDICE DE GINI

Coef.de Gini individual = a/b

NiXi , N = Ni , Vm = V/N, en este ejemplo es: N = Ni = 1000 , V=1000Vm

Xi 1/6 Vm Vm 5/6 Vm 5/4 Vm 7/4 Vm 5/2 Vm 7/2 Vm 9/2 Vm

Ni 87 426 275 116 32 28 19 11 6 100 0

Qi 1,45 22,75 45.66 60,16 65,76 72,76 79,41 84,36 100,0 0

Pi 8,7 51,3 78.8 90,4 93,6 96,4 98,3 99,4 100, 0

87 513 788 904 936 964 983 994 1000

DESARROLLO Y DESCOMPOSICION DEL INDICE DE DESIGUALDAD DE GINI

0.d 21d31...........d m1 d 0.d ..........d m2 21 32 d 31d32 0...........d m3 D2 = ......................... d m1d m 2 d m3 ........0

Ejemplo: d23=d32+ v3-v2

(en este caso, nivel

CAPTULO V MEDIDAS DE POBREZA

(z)]F(z)0 L(F(x))[F(z) F(x)]k-1

estimado Aqu : 2(z,x) = [(z-xi)/z]2 ya que (z,x) = [(z-x)/z] y se tiene que:

(1/N)xi<z[(z-x)/z]2 = P 2 Proporcin de pobres (head-count) (H)

en el que = media del ingreso de los

C = (1/) [H (1/N)xi<z(xi/z)] La desviacin estandar de var( n Pe) n

P P2 ) est dada por s( P P2 ) = 1 1

2 12 2 en donde 2 y 2 son estimadores de las + 1 2 n1 n2

Para los datos de la tabla 1 se tiene que: = 109,9 rupias

B a b NoB c d a+c b+d N=a+b+c+d

Otro ejemplo: si a=40, b=30, c=0 B NoB A 40 0 40 NoA 30 80 110 70 80 150

El producto cruzado entre A y B.

Demostraremos que este coeficiente de correlacin ( r ) es la

N sy)] dado que:

r = [ xiyi / xi2 ][(

)/( N sy)] = [xiyi/xi2][( N sx)/( N sy)] =

Ejemplo numrico de asociacin imperfecta : 1 88 12 100 0 24 56 80