Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tabla de contenido
1 Presentación.................................................................................................................... 1
2 Definición ........................................................................................................................ 1
3 Ejemplo de cálculo .......................................................................................................... 2
3.1 Descripción de los datos .......................................................................................... 2
3.2 Cálculo del índice de Gini ......................................................................................... 4
3.3 Cálculos usando Excel .............................................................................................. 6
3.3.1 Curva de Lorenz .............................................................................................. 12
3.4 Cálculos usando StatsDirect ................................................................................... 18
3.5 Cálculos usando CaEst............................................................................................ 21
4 Referencias ................................................................................................................... 24
Ing. Byron González http://www.byrong.tk 1
1 Presentación
Ha sido nuestra intención desarrollar cada uno de los apartados de este documento con
la mayor descripción posible para ayudar en la comprensión y cálculo de este índice.
Interpretaciones particulares luego de obtenido el índice de Gini y la Curva de Lorenz
serán necesarios para cada uno de los escenarios sobre los cuáles se hayan calculado.
2 Definición
Para una población determinada este índice puede oscilar entre cero (0) y uno (1).
Tomaría un valor de cero cuando todos los integrantes de la población reciben el mismo
ingreso. Por el contrario, el uno significa que un miembro o unos pocos perciben todo el
ingreso y los restantes nada.
Ecuación 1: Relación entre los ingresos (X) y población (Y) para el cálculo del índice de Gini.
Ecuación propuesta por Brown (1994) y citada en ayudas del software Epidat (2006)
Ing. Byron González http://www.byrong.tk 2
Para facilitar los cálculos puede usarse en forma equivalente la ecuación 2 presentada
por Vargas S. En esta ecuación k está referida al número de clases formadas.
k -1 k −1
∑ (Pi - Qi ) ∑Q i
I `
G = i =1
k -1
= 1− i =1
k −1
∑P i ∑P
i =1
i
i =1
Ecuación 2: Cálculo del índice de Gini usando distribuciones de frecuencias, citada por Vargas S.
3 Ejemplo de cálculo
Se empleó Excel para construir el histograma y definir las frecuencias de cada clase (Ver
apartado 3.2). Las frecuencias calculadas para cada una de las clases definidas se
muestran en la tabla 3,
1
Ecuación de Sturges: 1+ 3.33 x Log (n)
Ing. Byron González http://www.byrong.tk 4
2. Calcular el producto entre el ingreso y población para cada una de las clases, que
se ha ubicado en la columna (4). Por ejemplo para la clase 4 es necesario
multiplicar 2550 x 5 = 12750.
4. Calcular el valor de p.
Esto se consigue dividiendo cada uno de los valores de la columna (3) entre el
valor de la última clase de esa misma columna. Este último valor corresponde al
total acumulado de población. Por ejemplo, para la clase 3, p= 33/43 = 0.77.
Ing. Byron González http://www.byrong.tk 5
5. Calcular el valor de q.
Se consigue dividiendo cada uno de los valores de la columna (5) entre el valor
de la última clase de esa misma columna. Este último valor corresponde al total
acumulado. Por ejemplo, para la clase 4, q=36,000/54350=0.66.
Hemos indicado que el índice de Gini se ha obtenido agrupando los datos de ingresos y
luego haciendo los cálculos de la frecuencia de población correspondiente a cada uno de
los grupos o clases formadas.
Figura 5: Definición de datos de entrada y salida para crear la tabla de frecuencias e histograma
6. Como resultado tendremos las frecuencias de cada una de las clases. Ver figura
6(a). Enseguida haremos un reordenamiento de la tabla de frecuencias para
trabajar con las marcas de clase y las frecuencias. Ver figura 6(b). De este punto
en adelante definiremos a las marcas de clase como ingresos y a la frecuencia
como población.
(a) (b)
Figura 6: Tabla de frecuencias calculada
Ing. Byron González http://www.byrong.tk 9
13. Enseguida se calculan las diferencias de p-q para cada una de las clases. Ver la
figura 13.
14. Sumar los valores para la columna de p. Ver figura 14(a). También sumar los
valores de p-q. Ver figura 14 (b). En ambos casos note que se evitan sumar los
valores de la unidad.
La curva de Lorenz la obtenemos graficando los valores de p y q. Sin embargo, para que
el gráfico tenga el aspecto deseado es necesario seguir algunos pasos.
2. Marcar la serie de datos y hacer clic sobre el botón que identifica el asistente de
gráficos. Elegir un gráfico tipo xy . El subtipo debe ser dispersión con puntos de
datos conectados por líneas suavizadas.
Ing. Byron González http://www.byrong.tk 13
3. Continuar con el asistente de gráficos hasta el paso 3. Escribir el título para los
ejes X e Y como se indica.
7. Se necesita agregar una serie de datos para conseguir que el gráfico quede
terminado. Se hace clic derecho sobre el gráfico y se elige la opción Datos de
origen como se ilustra en la figura 22.
10. Luego de modificar el color de la línea resultante nuestra Curva de Lorenz lucirá
de la siguiente forma.
0.9
0.8
Porcentaje de ingresos
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Porcentaje de población
StatsDirect es un programa producido por Stats Direct Ltd. del Reino Unido. El software
puede ser descargado desde el sitio http://www.statsdirect.com e incluye un amplio
repertorio de metodologías estadísticas. Podemos mencionar entre ellas: distribuciones
de probabilidad, análisis de varianza, métodos no paramétricos, regresión y correlación,
análisis de sobrevivencia, entre otros.
En nuestro caso aprovechamos la disponibilidad del cálculo del índice de Gini que
StatsDirect incluye en su apartado de pruebas no paramétricas.
Debemos aclarar que el archivo de instalación que se descarga nos permite usar una
versión de prueba durante 10 días. Este tiempo es relativamente corto, por lo que si la
intención es usarlo para los cálculos del proyecto de investigación sobre pobreza en el
curso de Estadística I, se recomienda a los profesores indicar esta condición.
En nuestro caso aprovecharemos que los cálculos iniciales del número de clases y
frecuencia de población para los ingresos se han elaborado en Excel.
Procedimiento:
2. Una vez abierto StatsDirect veremos que el entorno de trabajo es muy similar a
Excel. Seleccionaremos el rango de celdas que corresponde a los ingresos y a la
población (que en este caso se ha identificado como numerop). Ver la figura 27.
Ing. Byron González http://www.byrong.tk 19
5. Enseguida StatsDirect calcula el valor del índice de Gini. En este caso el valor
calculado es de 0.313 (ver figura 30). También indica la estimación por intervalo,
el error estándar y la estimación del error sistemático (bias).
2
El bootstrap es una técnica estadística que permite a partir de los datos observados generar nuevas muestras simuladas
de igual tamaño que la muestra original con el propósito de estudiar sus resultados y propiedades. Una explicación amplia
sobre este tema puede verse en http://www.sld.cu/galerias/pdf/sitios/revsalud/tesis_de_resampling.pdf
Ing. Byron González http://www.byrong.tk 21
Los profesores Martínez de Lejarza, I., Martínez de Lejarza, J. son los autores de la
calculadora, misma que puede ser descargada desde
http://www.uv.es/~lejarza/caes/index.htm.
Para obtener el índice de Gini con CaEst es necesario contar con la distribución de
frecuencias de ingresos y población. Usaremos en nuestro caso los datos de la tabla 3. Se
ingresan a la calculadora las marcas de clase de los ingresos y las frecuencias de
población.
Procedimiento:
Figura 34: Definir la cantidad de clases a usar en el cálculo del índice de Gini
Ing. Byron González http://www.byrong.tk 23
4. Una vez ingresados los valores es necesario hacer clic en el botón Calcular una
primera vez. Notará que desaparecen los datos de la primera fila (Esta es una
condición particular de la calculadora, pero los datos se operan
satisfactoriamente al final). También notará que en la parte superior izquierda se
han agregado los valores de ingresos y población, pero sin los datos de la primera
clase. Figura 36 (a). Agregue usted nuevamente estos datos para tener las clases
completas. Figura 36 (b), y presione finalmente Calcular para obtener el índice
Gini. Ver figura 37.
(a) (b)
Figura 36: Definición de los valores a usar en el cálculo del índice de Gini
Ing. Byron González http://www.byrong.tk 24
5. El índice de Gini calculado para este caso por CaEst es de 0.298. Es posible
obtener la curva de Lorenz al presionar el botón dibujar lorenz. Ver figura 38.
4 Referencias
Giles D. (2002) Calculating a estándar error for the Gini Coefficient: Some further
results. Universidad de Victoria. Departamento de Economía. Extraído el 17 de febrero
2006 desde http://web.uvic.ca/econ/ewp0202.pdf
Ing. Byron González http://www.byrong.tk 25
StatsDirect (2006) Software de análisis estadístico. Stats Direct Ltd. United Kingdom.
Extraído el 03 de febrero de 2006 desde http://www.statsdirect.com/
Vargas S (s.f.) Expresión del índice de Gini para frecuencias no unitarias. IES “Alfonso X
El Sabio”, Toledo. España. Extraído el 17 de febrero de 2006 desde
http://www.uclm.es/profesorado/ricardo/Docencia_e_Investigacion/2/AntonioVargas.do
c