Está en la página 1de 7

CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.

Curva de Lorenz e Indice de Gini


Curva de Lorenz
La curva de Lorenz es útil para demostrar la diferencia entre dos distribuciones: por ejemplo quantiles
de población contra quantiles de ingresos. También es útil para comparar una distribución con relación
a alguna distribución base (referencia), por ejemplo observado contra frecuencias esperadas.

Ejemplo
POBLACION INGRESO
Grupo Porcentaj Porcentaje Porcentaj Porcentaje
e (decil) Acumulado e Acumulado
Los mas ricos 1 10 10 30 30
2 10 20 20 50
3 10 30 10 60
4 10 40 10 70
5 10 50 10 80
6 10 60 5 85
7 10 70 5 90
8 10 80 4 94
9 10 90 3 97
Los mas pobres 10 10 100 3 100
Source: Griffith & Amrhein

Gráfico de los Datos de la Tabla

Source: Griffith and Amrhein

1
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.

Interpretación de la Diagonal
Cuándo la proporción de observaciones en cada quartil para la distribución 1 es igual a la proporción
de observaciones en cada quartil para la distribución 2, los valores trazan una línea recta que forma una
diagonal (por ejemplo. % población). Es decir, las distribuciones son proporcionalmente iguales.

Interpretación de la Curva de Lorenz


La curva de Lorenz es el resultado de cuando las proporciones difieren. El grado de la curvatura nos
dice cuan diferentes las dos distribuciones son. El grado de la diferencia se puede medir directamente
del gráfico: es la distancia vertical entre la diagonal y la curva de Lorenz.

Como Crear la Curva Lorenz


1. Calcule la frecuencia relativa para cada variable - es decir el porcentaje del total.
2. Sitúe las observaciones de acuerdo a la proporción de las variables - es decir Y/X.
3. Construya una tabla de frecuencias acumuladas para cada variable de las observaciones clasificadas.
4. Trace las frecuencias relativas acumulativas y la diagonal.

Otro Ejemplo
Empleo de las Herramientas Maquinarias vs. Industria Automovilística

Datos Originales
X Y
Region A 30 30
Region B 20 15
Region C 10 8
Region D 10 5
Region E 20 19
Region F 30 23
Procedimiento para la Curva de Lorenz
1. 2. 3.
Rank by Ratio Conversión a Porcentajes Acumulado
Y/X X% Y% Cx Cy
D 0.50 8.30 5.00 8.3 5
B 0.75 16.70 15.00 25 20
F 0.77 25.00 23.00 50 43
C 0.80 8.30 8.00 58 51
E 0.95 16.70 19.00 75 70
A 1.00 25.00 30.00 100 100

2
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.

Rango de la Curva de Lorenz


En el caso más extremo, el 100 por ciento de la primera distribución se asocia con el 0 por ciento de la
segunda distribución. Es decir, cuándo una variable es presente la otra está ausente.

En este caso la curva de Lorenz sigue el eje X hacia la derecha del gráfico, es decir, tomando la forma
de un triángulo. El rango se encuentra entre 0% y 100%

El Coeficiente o Indice de Gini


El Coeficiente de Gini es una medida de resumen que captura la desviación mostrada en la curva de
Lorenz.

Se aplica a:
VARIABLES QUE SIGNIFICAN UN RECURSO QUE SE DISTRIBUYE ENTRE UNOS ELEMENTOS
EJEMPLOS DE VARIABLES
RENTA
PRODUCCIÓN
SALARIO
HERENCIA
Uso:
MEDIR SI LA DISTRIBUCIÓN TOTAL DEL RECURSO ENTRE LOS ELEMENTOS ES EQUITATIVA O NO
Será equitativa si se reparte de forma equilibrada entre todos los elementos
No será equitativa cuando unos pocos elementos acaparen la mayor parte del recurso
Compara:
LAS PROPORCIONES DE RECURSO REPARTIDAS HASTA UNA CANTIDAD (Qi)
CON LAS PROPORCIONES DE INDIVIDUOS QUE SE LO HAN REPARTIDO HASTA ESA CANTIDAD (Pi)
Obtención de Qi y Pi
Las medidas de forma permiten conocer que forma tiene la curva que representa la serie de datos de
la muestra. En concreto, podemos estudiar las siguientes características de la curva:

3
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.
a) Concentración: mide si los valores de la variable están más o menos uniformemente repartidos a lo
largo de la muestra.
b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma
(centro de simetría) los segmentos de curva que quedan a derecha e izquierda son similares.
c) Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de los
valores medios de la muestra.
a) Concentración
Para medir el nivel de concentración de una distribucón de frecuencia se pueden utilizar distintos
indicadores, entre ellos el Indice de Gini.
Este índice se calcula aplicando la siguiente fórmula:

Σ (pi - qi)
IG =
----------------------------

Σ pi
(i toma valores entre 1 y n-1)

En donde pi mide el porcentaje de individuos de la muestra que presentan un valor igual o inferior al
de xi.

n1 + n2 + n3 + ... + ni

pi = ---------------------------- x 100

Mientras que qi se calcula aplicando la siguiente fórmula:

(X1*n1) + (X2*n2) + ... + (Xi*ni)

qi = ----------------------------------------------------- x 100

∑(X1*n1) + (X2*n2) + ... + (Xn*nn)

El Índice Gini (IG) puede tomar valores entre 0 y 1:


IG = 0: concentración mínima. La muestra está uniformemente repartida a lo largo de todo su rango.
IG = 1: concentración máxima. Un sólo valor de la muestra acumula el 100% de los resultados.

Interpretación
El coeficiente de Gini a menudo es referido como un índice de desigualdad dado que mide el grado de
asociación entre dos variables:
• Coeficiente de variables de asociación geográfica.
• Coeficiente de mercadotecnia
• Concentración de la Población
• Coeficiente del área de localización
• Segregación Residencial
• Tendencia del Genero en el Empleo

4
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.

Limitaciones del Coeficiente de Gini


• Debe ser capaz de expresar los datos como una frecuencia.
• No puede tener los valores negativos de los datos.
• No pueden estudiar las variables espaciales continuas - es decir, usted necesita las categorías.
• El valor de G depende de la distribución base (por ejemplo. Área). Como la base aumenta el valor
de G (Gini) desde el cero.
• Definición delas fronteras espaciales:
Se superpone (sensible a la definición de la frontera), el nuevo arreglo
(insensible a la distribución entre áreas).

Trazo de la Probabilidad Normal


Prueba de la normalidad:

El trazo o ploteo observó la probabilidad acumulada contra la


probabilidad acumulada esperada (derivada de la tabla normal).

En Resumen:
El coeficiente Gini data de 1912, y mide el grado en que la distribución del ingreso se desvia de una
distribución proporcional (igualitaria aunque algunos autores dicen equitativa).

5
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.
Se basa en la curva de Lorenz. En el semieje de las abscisas se indica la población en percentiles o
quintiles o porcentajes (desde los mas pobres a los mas ricos). En el semieje positivo de las ordenadas
se colocan los porcentajes de la renta de 0 a 100, en fracciones de 20. Si marcamos con un punto la
relación población - ingreso, obtenemos la curva de Lorenz. Una distribución igualitaria seria: al 20%
de la población le corresponde el 20% del ingreso, al 40% el 40% de los ingresos. Lo cual daría una
recta con pendiente de 45 grados.

En la realidad se obtiene una curva cuya concavidad mira hacia el semieje positivo de las ordenadas (el
segmento de la torta que le corresponde a los ricos es proporcionalmente mas grande). El coeficiente
de Gini indica la relación entre el área bajo la curva teórica (un triangulo) y el área bajo la curva de
Lorenz. Va entre 0 y 1, valores teóricos. El valor 0 correspondería a una distribución igualitaria y el 1 a
una distribución en la situación de desigualdad absoluta (el hogar mas rico se lleva todo y el resto
nada).

Ejemplo: vamos a calcular el Índice Gini de una serie de datos con los sueldos de los empleados de
una empresa (millones pesetas).
Sueldos Empleados (Frecuencias absolutas) Frecuencias relativas
(Miles de Pesos) Simple Acumulada Simple Acumulada
3,5 10 10 25,0% 25,0%
4,5 12 22 30,0% 55,0%
6,0 8 30 20,0% 75,0%
8,0 5 35 12,5% 87,5%
10,0 3 38 7,5% 95,0%
15,0 1 39 2,5% 97,5%
20,0 1 40 2,5% 100,0%

Calculamos los valores que necesitamos para aplicar la fórmula del Índice de Gini:
Xi ni Σ ni pi Xi * ni Σ Xi * ni qi pi - qi
3,5 10 10 25,0 35,0 35,0 14,1 10,9

4,5 12 22 55,0 54,0 89,0 36,0 19,0


6,0 8 30 75,0 48,0 137,0 55,4 19,6
8,0 5 35 87,5 40,0 177,0 71,6 15,9
10,0 3 38 95,0 30,0 207,0 83,8 11,2
15,0 1 39 97,5 15,0 222,0 89,8 7,7
25,0 1 40 100,0 25,0 247,0 100,0 0

Σ pi (entre 1 y n-1) = 435,0 x Σ (pi - qi) (entre 1 y n-1 ) = 84,3

Por lo tanto:
IG = 84,3 / 435,0 = 0,19

Un Índice Gini de 0,19 indica que la muestra está bastante uniformemente repartida, es decir, su nivel
de concentración no es excesivamente alto.
Ejemplo: Ahora vamos a analizar nuevamente la muestra anterior, pero considerando que hay más
personal de la empresa que cobra el sueldo máximo, lo que conlleva mayor concentración de renta en
unas pocas personas.

6
CATEDRA DE ESTADÍSTICA SOCIAL I - TEÓRICOS. UDELAR - FCS.

Sueldos Empleados (Frecuencias absolutas) Frecuencias relativas


(Miles de Pesos) Simple Acumulada Simple Acumulada
3,5 10 10 25,0% 25,0%
4,5 10 20 25,0% 50,0%
6,0 8 28 20,0% 70,0%
8,0 5 33 12,5% 82,5%
10,0 3 36 7,5% 90,0%
15,0 0 36 0,0% 90,0%
20,0 4 40 10,0% 100,0%
En este caso obtendríamos los siguientes datos:
Xi ni Σ ni pi Xi * ni Σ Xi * ni qi pi - qi
3,5 10 10 25,0 35 35 11,7 13,26

4,5 10 20 50,0 45 80 26,8 23,15


6,0 8 28 70,0 48 128 43,0 27,05
8,0 5 33 82,5 40 168 56,4 26,12
10,0 3 36 90,0 30 198 66,4 23,56
15,0 0 36 90,0 0 198 66,4 23,56
25,0 4 40 100,0 100 298 100,0 0,00
Σ pi (entre 1 y n-1) = 407,5 x Σ (pi - qi) (entre 1 y n-1 ) = 136,69

El Índice Gini sería:


IG = 136,69 / 407,5 = 0,34

El Índice Gini se ha elevado considerablemente, reflejando la mayor concentración de rentas que


hemos comentado.
A continuación un ejemplo para Datos Agrupados:
Frecuencia
marca xini ui qi = (ui/un) 100 pi = (Ni/n) 100 pi - qi
Li-1 - Li xi ni Ni
0 - 50 25 23 23 575 575 1,48 8,85 7,37
50 - 100 75 72 95 5400 5975 15,38 36,54 21,16
100 - 150 125 62 157 7750 13725 35,33 60,38 25,06
150 - 200 175 48 205 8400 22125 56,95 78,85 21,90
200 - 250 225 19 224 4275 26400 67,95 86,15 18,20
250 - 300 275 8 232 2200 28600 73,62 89,23 15,61
300 - 350 325 14 246 4550 33150 85,33 94,62 9,29
350 - 400 375 7 253 2625 35775 92,08 97,31 5,22
400 - 450 425 5 258 2125 37900 97,55 99,23 1,68
450 - 500 475 2 260 950 38850 100,00 100,00 0,00
260 Σ xini= un= Σ pi= 651,15 Σ (pi - qi)= 125,48
38850

El Índice Gini sería:


IG = 125,48 / 651,15 = 0,19