Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Calculo IndiceGini
Calculo IndiceGini
Tabla de contenido
1
2
3
Presentacin.................................................................................................................... 1
Definicin ........................................................................................................................ 1
Ejemplo de clculo .......................................................................................................... 2
3.1 Descripcin de los datos .......................................................................................... 2
3.2 Clculo del ndice de Gini ......................................................................................... 4
3.3 Clculos usando Excel .............................................................................................. 6
3.3.1 Curva de Lorenz .............................................................................................. 12
3.4 Clculos usando StatsDirect ................................................................................... 18
3.5 Clculos usando CaEst............................................................................................ 21
4 Referencias ................................................................................................................... 24
Presentacin
Definicin
Para una poblacin determinada este ndice puede oscilar entre cero (0) y uno (1).
Tomara un valor de cero cuando todos los integrantes de la poblacin reciben el mismo
ingreso. Por el contrario, el uno significa que un miembro o unos pocos perciben todo el
ingreso y los restantes nada.
Para calcular el ndice de Gini se usa frecuentemente la ecuacin 1, en la que se necesita
acumular los valores de ingresos y poblacin estudiados.
donde,
Ecuacin 1:
Relacin entre los ingresos (X) y poblacin (Y) para el clculo del ndice de Gini.
Ecuacin propuesta por Brown (1994) y citada en ayudas del software Epidat (2006)
Para facilitar los clculos puede usarse en forma equivalente la ecuacin 2 presentada
por Vargas S. En esta ecuacin k est referida al nmero de clases formadas.
k 1
k -1
`
G
(Pi - Qi )
=
i =1
k -1
i =1
Ecuacin 2:
3.1
= 1
i =1
k 1
i =1
Clculo del ndice de Gini usando distribuciones de frecuencias, citada por Vargas S.
Ejemplo de clculo
Tabla 1:
ingreso
3200
1800
1200
600
5000
3000
2700
1360
750
600
150
600
700
100
600
Persona
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
ingreso
600
2500
1500
360
1200
1680
2300
1094
1045
2625
4070
3565
2855
600
600
persona
31
32
33
34
35
36
37
38
39
40
41
42
43
ingreso
600
300
480
480
480
600
720
400
715
960
900
400
600
43
5000
100
4900
6.44
700
Se emple Excel para construir el histograma y definir las frecuencias de cada clase (Ver
apartado 3.2). Las frecuencias calculadas para cada una de las clases definidas se
muestran en la tabla 3,
Tabla 3:
3.2
limite superior
800
1500
2200
2900
3600
4300
5000
marca de clase
450
1150
1850
2550
3250
3950
4650
Frecuencia
23
8
2
5
3
1
1
2. Calcular el producto entre el ingreso y poblacin para cada una de las clases, que
se ha ubicado en la columna (4). Por ejemplo para la clase 4 es necesario
multiplicar 2550 x 5 = 12750.
4. Calcular el valor de p.
Esto se consigue dividiendo cada uno de los valores de la columna (3) entre el
valor de la ltima clase de esa misma columna. Este ltimo valor corresponde al
total acumulado de poblacin. Por ejemplo, para la clase 3, p= 33/43 = 0.77.
(0)
Clase
(1)
ingresos
(2)
poblacin
(3)
acumulado
de
poblacin
(4)
producto
entre
ingresos y
poblacin
(4)=(1)x(2)
(5)
acumulado
del
producto
entre
ingresos y
poblacin
(6)
p
(6)=(3)/43
(7)
q
(7)=(5)/54350
(8)
p-q
(8)=(6)(7)
1
2
3
4
5
6
7
450
1150
1850
2550
3250
3950
4650
23
8
2
5
3
1
1
23
31
33
38
41
42
43
10350
9200
3700
12750
9750
3950
4650
10350
19550
23250
36000
45750
49700
54350
Suma
0.53
0.72
0.77
0.88
0.95
0.98
1.00
4.84
0.19
0.36
0.43
0.66
0.84
0.91
1.00
0.34
0.36
0.34
0.22
0.11
0.06
1.44
3.3
Hemos indicado que el ndice de Gini se ha obtenido agrupando los datos de ingresos y
luego haciendo los clculos de la frecuencia de poblacin correspondiente a cada uno de
los grupos o clases formadas.
El procedimiento general para calcular el ndice de Gini usando Excel es el siguiente:
1. Para construir la tabla de frecuencias necesitamos calcular el mximo, mnimo, y
el rango como se muestra en la figura 1:
Figura 5: Definicin de datos de entrada y salida para crear la tabla de frecuencias e histograma
6. Como resultado tendremos las frecuencias de cada una de las clases. Ver figura
6(a). Enseguida haremos un reordenamiento de la tabla de frecuencias para
trabajar con las marcas de clase y las frecuencias. Ver figura 6(b). De este punto
en adelante definiremos a las marcas de clase como ingresos y a la frecuencia
como poblacin.
(a)
(b)
Figura 6: Tabla de frecuencias calculada
10
11
13. Enseguida se calculan las diferencias de p-q para cada una de las clases. Ver la
figura 13.
14. Sumar los valores para la columna de p. Ver figura 14(a). Tambin sumar los
valores de p-q. Ver figura 14 (b). En ambos casos note que se evitan sumar los
valores de la unidad.
12
3.3.1
Curva de Lorenz
La curva de Lorenz la obtenemos graficando los valores de p y q. Sin embargo, para que
el grfico tenga el aspecto deseado es necesario seguir algunos pasos.
Procedimiento para obtener la curva de Lorenz usando Excel:
1. A la serie de datos de p y q anteponer valores de cero como se ilustra en la figura
16.
2. Marcar la serie de datos y hacer clic sobre el botn que identifica el asistente de
grficos. Elegir un grfico tipo xy . El subtipo debe ser dispersin con puntos de
13
3. Continuar con el asistente de grficos hasta el paso 3. Escribir el ttulo para los
ejes X e Y como se indica.
14
15
7. Se necesita agregar una serie de datos para conseguir que el grfico quede
terminado. Se hace clic derecho sobre el grfico y se elige la opcin Datos de
origen como se ilustra en la figura 22.
16
17
10. Luego de modificar el color de la lnea resultante nuestra Curva de Lorenz lucir
de la siguiente forma.
1
Porcentaje de ingresos
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Porcentaje de poblacin
Figura 25:
3.4
18
StatsDirect es un programa producido por Stats Direct Ltd. del Reino Unido. El software
puede ser descargado desde el sitio http://www.statsdirect.com e incluye un amplio
repertorio de metodologas estadsticas. Podemos mencionar entre ellas: distribuciones
de probabilidad, anlisis de varianza, mtodos no paramtricos, regresin y correlacin,
anlisis de sobrevivencia, entre otros.
En nuestro caso aprovechamos la disponibilidad del clculo del ndice de Gini que
StatsDirect incluye en su apartado de pruebas no paramtricas.
Debemos aclarar que el archivo de instalacin que se descarga nos permite usar una
versin de prueba durante 10 das. Este tiempo es relativamente corto, por lo que si la
intencin es usarlo para los clculos del proyecto de investigacin sobre pobreza en el
curso de Estadstica I, se recomienda a los profesores indicar esta condicin.
StatsDirect se integra completamente a Excel. Es posible por lo tanto acceder a
StatsDirect desde Excel presionando un enlace que se agrega durante la instalacin.
En nuestro caso aprovecharemos que los clculos iniciales del nmero de clases y
frecuencia de poblacin para los ingresos se han elaborado en Excel.
Procedimiento:
1. Desde el entorno de Excel, y aprovechando la tabla de frecuencias de ingresos y
poblacin accederemos a StatsDirect. Esto se muestra en la figura 26.
2. Una vez abierto StatsDirect veremos que el entorno de trabajo es muy similar a
Excel. Seleccionaremos el rango de celdas que corresponde a los ingresos y a la
poblacin (que en este caso se ha identificado como numerop). Ver la figura 27.
19
20
5. Enseguida StatsDirect calcula el valor del ndice de Gini. En este caso el valor
calculado es de 0.313 (ver figura 30). Tambin indica la estimacin por intervalo,
el error estndar y la estimacin del error sistemtico (bias).
El bootstrap es una tcnica estadstica que permite a partir de los datos observados generar nuevas muestras simuladas
de igual tamao que la muestra original con el propsito de estudiar sus resultados y propiedades. Una explicacin amplia
sobre este tema puede verse en http://www.sld.cu/galerias/pdf/sitios/revsalud/tesis_de_resampling.pdf
3.5
21
22
Figura 34: Definir la cantidad de clases a usar en el clculo del ndice de Gini
23
4. Una vez ingresados los valores es necesario hacer clic en el botn Calcular una
primera vez. Notar que desaparecen los datos de la primera fila (Esta es una
condicin particular de la calculadora, pero los datos se operan
satisfactoriamente al final). Tambin notar que en la parte superior izquierda se
han agregado los valores de ingresos y poblacin, pero sin los datos de la primera
clase. Figura 36 (a). Agregue usted nuevamente estos datos para tener las clases
completas. Figura 36 (b), y presione finalmente Calcular para obtener el ndice
Gini. Ver figura 37.
(a)
(b)
Figura 36: Definicin de los valores a usar en el clculo del ndice de Gini
24
5. El ndice de Gini calculado para este caso por CaEst es de 0.298. Es posible
obtener la curva de Lorenz al presionar el botn dibujar lorenz. Ver figura 38.
Referencias
Giles D. (2002) Calculating a estndar error for the Gini Coefficient: Some further
results. Universidad de Victoria. Departamento de Economa. Extrado el 17 de febrero
2006 desde http://web.uvic.ca/econ/ewp0202.pdf
25
StatsDirect (2006) Software de anlisis estadstico. Stats Direct Ltd. United Kingdom.
Extrado el 03 de febrero de 2006 desde http://www.statsdirect.com/
Vargas S (s.f.) Expresin del ndice de Gini para frecuencias no unitarias. IES Alfonso X
El Sabio, Toledo. Espaa. Extrado el 17 de febrero de 2006 desde
http://www.uclm.es/profesorado/ricardo/Docencia_e_Investigacion/2/AntonioVargas.do
c