Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 5 Estadist Desc C
Unidad 5 Estadist Desc C
5 DE CONCENTRACIÓN
Y DE FORMA
OBJETIVOS DE LA UNIDAD
5. Medidas de concentración
5.1. El índice de Gini
5.2. La curva de Lorenz
www.udima.es 181
"Todos los derechos reservados. Cualquier forma de reproducción, distribución, comunicación pública o transformación de esta Unidad sólo puede ser realizada con la autorización de la Universidad a Distancia de Madrid, UDIMA, salvo excepción
prevista por la ley. Diríjase a CEDRO (Centro Español de Derechos Reprográficos, www.cedro.org) si necesita fotocopiar o escanear algún fragmento de esta obra (www.conlicencia.com; 91 702 19 70 / 93 272 04 47)".
ESTADÍSTICA DESCRIPTIVA
OBJETIVOS DE LA UNIDAD
Además de las medidas de centralización, dispersión y forma más representativas que hemos ana-
lizado en las Unidades didácticas 3 y 4 de este manual, existen otras medidas que completan el estudio
de las características principales de una distribución de frecuencias asociada a la variable estadística
estudiada. El cálculo de estas medidas, alternativas y complementarias, y su aplicación e interpretación
constituye el objeto de esta Unidad didáctica.
182 www.udima.es
"Todos los derechos reservados. Cualquier forma de reproducción, distribución, comunicación pública o transformación de esta Unidad sólo puede ser realizada con la autorización de la Universidad a Distancia de Madrid, UDIMA, salvo excepción
prevista por la ley. Diríjase a CEDRO (Centro Español de Derechos Reprográficos, www.cedro.org) si necesita fotocopiar o escanear algún fragmento de esta obra (www.conlicencia.com; 91 702 19 70 / 93 272 04 47)".
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
Un rasgo que diferencia a la media y a la mediana, dos de las principales medidas de tendencia
central estudiadas en la Unidad didáctica 3, es su comportamiento frente a los datos atípicos. La esta-
bilidad de la mediana frente a la existencia de este tipo de datos recibe el nombre de robustez. Pues
bien, las medidas de posición basadas en el orden, como son la mediana, los cuartiles o el rango inter-
cuartílico cumplen esta propiedad y se dice de ellas que son robustas. Sin embargo, las medidas basa-
das en la suma como puede ser la media (o la desviación típica si consideramos también las medidas
de dispersión) están más afectadas por las observaciones atípicas y son, por tanto, poco robustas.
La media recortada es un remedio eficaz para solventar la falta de robustez de la media aritmética
simple como medida de posición representativa de los datos de una muestra. A través de la media re-
cortada conseguimos moderar el efecto de los datos atípicos en el cálculo de la media, realizando su
cálculo después de haber eliminado las observaciones más extremas.
Por tanto, podemos definir la media recortada al % como la media de los datos que quedan des-
pués de eliminar el % de los datos más grandes y el % de los datos más pequeños.
EJEMPLO 1
6,3; 3,8; 4,4; 8,2; 2,7; 9,3; 7,2; 10,3; 4,2; 6,9
2,7; 3,8; 4,2; 4,4; 6,3; 6,9; 7,2; 8,2; 9,3; 10,3
Las medidas de tendencia central media y mediana de los mismos son, respectivamente,
2,7 3,8 4,2 4,4 6,3 6,9 7,2 8,2 9,3 10,3 6,9 6,3
Media 6,33 Mediana 6,6
10 2
, la mediana sigue siendo 6,6 (ya que se calcula como la media aritmética de los dos valores centrales, 6,3 y 6,9, que no se han modificado), pero la media
…/…
www.udima.es 183
ESTADÍSTICA DESCRIPTIVA
En esta nueva situación, la media aritmética habitual no es una buena medida de centralización de los da‐
tos. Resulta más apropiado calcular la media recortada al 10% de los datos que contienen la observación atípica. Para ello hay que elim
Los cuantiles son valores de la variable que dividen a la distribución de frecuencias en partes
iguales y los más habituales son los siguientes:
10% de los datos son inferiores a él, para el segundo decil los datos inferiores a él son el
20%, para el tercer decil, el 30% y así sucesivamente hasta el noveno decil cuyo valor in-
dica que el 90% de las observaciones son inferiores a él. El quinto decil se corresponde
con la mediana de la distribución.
• Centiles o percentiles. Son 99 valores que dividen a la distribución de los datos en 100
partes iguales. Se representan mediante la letra P P1 , P2 ,..., Pi ,..., P98 , P99 donde Pi se
re-
fiere al valor del percentil i-ésimo e indica que el i% de los datos quedan por debajo de él
(son inferiores a él) mientras que el (100-i)% de los datos están por encima de Pi (son
superiores a él). El percentil 50 se corresponde con la mediana de la distribución.
donde r hace referencia al cuantil que queremos calcular y q al número de intervalos de igual fre-
cuencia en los que queremos dividir la distribución, esto es:
• Si
q5 r 1, 2, 3, obtenemos los quintiles ( r 1 es el primer quintil, r el se-
y 4 2
gundo quintil, r 3 el tercer quintil y r 4 el cuarto quintil).
• Si
q 10 y r 1, 2, 3, 4, 5, 6, 7, obtenemos los deciles ( r 1 es el primer decil,
8, 9
r 2 el segundo decil, r el tercer decil, r 4 el cuarto decil, r 5 el quinto decil,
3
y así sucesivamente hasta r 9 que es el noveno decil).
• Si
q 100 y r 1, 2, 3, ..., obtenemos los percentiles ( r 1 es el primer percentil,
99
r 2 el segundo percentil, r el tercer percentil, y así sucesivamente hasta r 99
3
que es el percentil noventa y nueve).
www.udima.es 185
ESTADÍSTICA DESCRIPTIVA
rn
i1
– Para los quintiles: Ki Li1 N ai
5
ni
rn
i1
– Para los deciles: Li1 N ai
Di 10
ni
rn
– Para los percentiles: P L i1
a
N
100
i i1 i
ni
ce referencia al gasto en euros que realiza una muestra de 34 jóvenes menores de 20 años durante un fin de semana:
49, 60, 75, 61, 57, 61, 40, 72, 70, 83, 73, 81, 67, 70, 76, 45, 63,
79, 66, 70, 75, 70, 78, 76, 69, 52, 58, 80, 67, 31, 58, 53, 68, 67
ocalización que nos pide el enunciado, ordenamos primero los datos y elaboramos a continuación una tabla de frecuencias con las frecuencias absoluta
n,
31, 40, 45, 49, 52, 53, 57, 58, 58, 60, 61, 61, 63, 66, 67, 67, 67,
68, 69, 70, 70, 70, 70, 72, 73, 75, 75, 76, 76, 78, 79, 80 81, 83
186 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
…/…
xi ni Ni
31 1 1
40 1 1+1=2
45 1 1+1+1=3
49 1 1+1+1+1=4
52 1 1+1+1+1+1=5
53 1 1+1+1+1+1+1=6
57 1 1+1+1+1+1+1+1=7
58 2 1+1+1+1+1+1+1+2=9
60 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 = 10
61 2 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 = 12
63 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 = 13
66 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 = 14
67 3 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 = 17
68 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 + 1 = 18
69 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 + 1 + 1 = 19
70 4 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 + 1 + 1 + 4 = 23
72 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 + 1 + 1 + 4 + 1 = 24
73 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 + 1 + 1 + 4 + 1 + 1 = 25
75 2 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 + 1 + 1 + 4 + 1 + 1 + 2 = 27
76 2 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 + 1 + 1 + 4 + 1 + 1 + 2 + 2 = 29
78 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 + 1 + 1 + 4 + 1 + 1 + 2 + 2 + 1 = 30
79 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 + 1 + 1 + 4 + 1 + 1 + 2 + 2 + 1 + 1 = 31
80 1 1 + 1 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 2 + 1 + 1 + 3 + 1 + 1 + 4 + 1 + 1 + 2 + 2 + 1 + 1 + 1 = 32
81 1 1+1+1+1+1+1+1+2+1+2+1+1+3+1+1+4+1+1+2+2+1+1+1+1=
33
83 1 1+1+1+1+1+1+1+2+1+2+1+1+3+1+1+4+1+1+2+2+1+1+1+1+1
= 34
Como hemos visto en la definición, los cuartiles de una distribución la dividen en cuatro partes iguales
que contienen el mismo número de elementos. El primer cuartil es el valor por debajo del cual se sitúa el
25% de las observaciones, mientras que el tercer cuartil es el valor por debajo del cual se sitúa el 75% de
las observaciones.
www.udima.es 187
ESTADÍSTICA DESCRIPTIVA
…/…
absoluta de los datos no es unitaria y el primer valor de la frecuencia absoluta acumulada que iguala o su‐
pera a 1,7 es 2, de manera que Ni = 2 > 1,7, y el valor de la variable asociado a 2 es 40, podemos concluir que P5 40. Esto además significa
9 34 3,06 N 4 3,06 P 49
100
EJEMPLO 3
Intervalo ni
30‐40 1
40‐50 3
50‐60 11
60‐70 21
70‐80 43
80‐90 32
90‐100 9
…/…
188 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
…/…
Solución:
Como los datos del ejemplo vienen agrupados en intervalos de clase, construimos en primer lugar la tabla
con la marca de clase y las frecuencias simples y absolutas acumuladas:
Intervalo ci ni Ni
30‐40 35 1 1
40‐50 45 3 1+3=4
50‐60 55 11 1 + 3 + 11 = 15
60‐70 65 21 1 + 3 + 11 + 21 = 36
70‐80 75 43 1 + 3 + 11 + 21 + 43 = 79
80‐90 85 32 1 + 3 + 11 + 21 + 43 + 32 = 111
90‐100 95 9 1 + 3 + 11 + 21 + 43 + 32 + 9 = 120
A partir de estos datos, para determinar los cuantiles de la distribución operamos de la siguiente forma:
– Para el segundo cuartil la clase será el primer intervalo cuya frecuencia absoluta acumula‐
2 120
da iguale o supere el valor 60. Dicho intervalo es 70‐80 puesto que su frecuencia
4
absoluta acumulada es 79.
– Para el segundo decil la clase será el primer intervalo cuya frecuencia absoluta acumulada
• A continuación calculamos los cuantiles pedidos aplicando la siguiente fórmula en cada caso:
60 36
– Para los cuartiles: Q2 70 10 75,58
43
24
– Para los deciles: D2 60 10 64,29
15
21
90
– Para los percentiles: P75 80 10 83,44
79
32
www.udima.es 189
ESTADÍSTICA DESCRIPTIVA
Esta medida de dispersión relativa indica el número de veces que el rango contiene a la media
aritmética.
MPLO 4
deremos la siguiente tabla en la que se recogen los resultados obtenidos en una encuesta a 25 fami‐ lias acerca del número de hijos que tiene cada una de
0 5
1 6
2 8
3 4
4 2
Para calcular el recorrido relativo de la distribución debemos obtener en primer lugar el rango, o diferen‐
cia entre los valores máximo y mínimo que puede tomar la variable, en nuestro caso R = 4 – 0 = 4, y la media aritmética simple de los datos,
0 5 1 6 2 8 3 4 4 2 1,68
1m
x x n
n i1
ii 25
190 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
y en otro caso,
max xi
CApertura
min xi
Así, cuanto mayor sea el valor de dicho coeficiente decimos que mayor será la apertura de la
distribución analizada. De todas formas, el interés de esta medida de dispersión es limitado ya que
se establece a partir de los valores extremos de la distribución y según sean dichos valores puede dar
lugar a resultados distorsionados.
Por ejemplo, consideremos la siguiente serie de puntuaciones obtenidas por 10 individuos en una
prueba psicotécnica:
4,3; 1,8; 2,4; 6,2; 7,3; 0,7; 5,2; 8,3; 2,2; 4,9
0,7; 1,8; 2,2; 2,4; 4,3; 4,9; 5,2; 6,2; 7,3; 8,3
xn 8,3
CApertura 11,857
x1 0,7
El rango intercuartil es una medida de dispersión que se define como la diferencia entre el tercer
y el primer cuartil de la distribución de datos analizada,
RI Q3 Q1
Como apuntamos en la Unidad didáctica 4, cuanto mayor es el rango o recorrido de una distribu-
ción mayor es el campo de variabilidad de la variable estudiada y, por tanto, mayor es su dispersión.
Esta medida proporciona una información inicial acerca de la variabilidad de la distribución analizada.
El rango intercuartil es un recorrido corregido que elimina el primer y el último cuartil de la distribu-
ción, y que, como sucede con el rango, suele recoger las informaciones menos fiables.
A partir de esta medida, es posible definir el rango o recorrido semi-intercuartil del conjunto
de datos muestrales como el rango intercuartil dividido entre dos:
Q3 Q1
RSI Q
2
www.udima.es 191
ESTADÍSTICA DESCRIPTIVA
Algunos autores definen el rango semi-intercuartil como el cociente entre el rango intercuartil y la
suma del primer y tercer cuartil, esto es,
Q3 Q1
RSI Q
Q1 Q3
xi ni Ni
31 1 1
40 1 2
45 1 3
49 1 4
52 1 5
53 1 6
57 1 7
58 2 9
60 1 10
61 2 12
63 1 13
66 1 14
67 3 17
68 1 18
69 1 19
70 4 23
72 1 24
73 1 25
75 2 27
76 2 29
78 1 30
79 1 31
80 1 32
81 1 33
83 1 34
1 34
• Primer cuartil: El valor de la frecuencia absoluta acumulada que iguala o
8,5.
4
supera a 8,5 es 9 y se corresponde con un valor de la variable estudiada de xi = 58. El
primer cuartil es entonces 58.
192 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
3 34
• Tercer cuartil: El valor de la frecuencia absoluta acumulada que iguala o
25,5.
4
supera a 25,5 es 27 y se corresponde con un valor de la variable estudiada de xi = 75. El
tercer cuartil es entonces 75.
RI Q3 Q1 75 58 17
Q3 Q1 75 58 17
RSI 8,5
2 2 2
o bien,
Q3 Q1 75 58
RSI Q 0,1278
Q1 Q3 58 75
El rango percentil 10-90, o rango entre percentiles, de un conjunto de datos muestrales se define
como la diferencia entre el percentil 90 y el percentil 10:
Aunque no es frecuente, puede utilizarse también como medida alternativa de dispersión el rango
percentil semi 10-90 definido como:
1
Rango percentil semi 10-90 = P P
90 10
2
EJEMPLO 5
Determina el rango entre percentiles y el rango percentil semi 10‐90 para los siguientes datos: 97, 72, 87, 57, 39, 81, 70, 84, 93, 79, 84, 81,
Solución:
Para determinar el rango entre percentiles y el rango percentil semi 10‐90 debemos obtener en primer lugar los percentiles 10 y 90 as
www.udima.es 193
ESTADÍSTICA DESCRIPTIVA
…/…
xi ni Ni
39 1 1
57 1 2
65 1 3
70 1 4
72 2 6
75 1 7
77 1 8
79 1 9
81 2 11
84 3 14
87 1 15
93 1 16
94 1 17
96 1 18
97 2 20
10 20 90 20
A continuación calculamos 2y 18 y buscamos los valores de la variable cuyas fre‐
100 100
a absoluta acumulada que iguala o supera a 18 es 18 y se corresponde con un valor de la variable estudiada de xi = 96. Por tanto, como la frecuencia absolu
57 65 96 97
P10 2 61 P 96,5
y 90
2
y a partir de ellos podemos calcular el rango entre percentiles y el rango percentil semi 10‐90 como sigue:
1
Rango percentil semi 10‐90 = P P
9010
196,5 61 17,75
2 2
x
i 1
i x ni 0
194 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
Entonces, a partir de este concepto genérico de desviación podemos definir dos estadísticos de
dispersión de la siguiente manera:
x
m
ni
Dx i x
i1 n
12 6 7 3 15 10 18 5 76
x 8 8 9,5
8
xi 9,5
Dx
i 1 n
La desviación mediana informa sobre la distancia entre los datos y su mediana de forma
que cuanto mayor sea la dispersión existente entre dichos datos, mayor será el promedio
del valor absoluto de las diferencias de los mismos respecto de la mediana muestral.
Tanto la desviación mediana como la desviación media tienen las mismas unidades de es-
cala que los datos originales, lo que facilita su comprensión.
www.udima.es 195
ESTADÍSTICA DESCRIPTIVA
Por ejemplo, considerando de nuevo los datos del ejemplo anterior 12, 6, 7, 3, 15, 10, 18,
5, para calcular la desviación mediana debemos en primer lugar ordenarlos de menor a
mayor, 3, 5, 6, 7, 10, 12, 15, 18. A continuación obtenemos la mediana de los mismos
que, al ser un número par de observaciones se obtiene como la media aritmética de los
dos valores centrales, esto es:
7 10
2 8,5
n xi Me
Finalmente, la desviación mediana se obtiene aplicando la fórmula D
Me
i1 n
,
como sigue:
DMe xi 8,5
8
i 1
Otra medida de dispersión que se construye a partir del concepto de desviación es la va-
rianza que ya hemos analizado en profundidad en la Unidad didáctica 4.
En una distribución simétrica (como por ejemplo la distribución normal) los cuartiles quedan si-
tuados de forma simétrica respecto a la mediana, pero si la distribución analizada es asimétrica uno de
los cuartiles se separa de la mediana más que otro. Esto significa que en una distribución normal
Q3 Q2 Q2 Q1. Sin embargo, cuando la distribución es asimétrica positiva se produce la
siguiente
desigualdad,
Q3 Q2 Q2 Q1
mientras que si la distribución es asimétrica negativa, la desigualdad tiene signo contrario, esto es:
Q3 Q2 Q2 Q1
siendo
Q2 la mediana de la distribución. De esta forma, si la distribución es asimétrica a la derecha
Q3 está más lejos de la mediana que Q1 y si la distribución es asimétrica a la izquierda Q1 está más
alejada de la mediana que Q3.
Este índice varía entre –1 y 1 de forma que si es 0 la distribución es normal (simétrica) y es una
medida invariante a cambios de origen de referencia y de escala.
El coeficiente de sesgo percentílico se aplica con el mismo criterio que el coeficiente de asi-
metría de Yule-Bowley y viene definido por la siguiente ecuación,
P90 P50 P50 P10 P90 2 P50 P10
Coeficiente percentil 10-90 de sesgo =
P90 P10 P90 P10
Finalmente, conviene mencionar el coeficiente de asimetría que tiene definida la hoja de cálculo
Excel como una de sus funciones estadísticas. Este coeficiente es,
n n x x 3
Coeficiente de asimetría de Excel =
n 1 n 2 i1 s
i
y solo puede utilizarse en distribuciones de variables estadísticas cuyos valores tengan una frecuencia
absoluta unitaria puesto que, como puede observarse en la fórmula, no se contempla la frecuencia de
cada valor de la variable.
EJEMPLO 6
A partir de los datos del ejemplo 2 de esta Unidad didáctica (ver tabla de frecuencias absolutas en el ejemplo 2) los cuartiles primero y
Para obtener el coeficiente cuartil de sesgo, cuya expresión viene dada por la siguiente fórmula:
Coeficiente cuartil d
…/…
Con los mismos datos, para obtener el coeficiente percentil 10‐90 de sesgo, expresado mediante la fórmula,
10 34
La primera frecuencia absoluta acumulada mayor o igual que 3,4 es 4 y se corresponde
100
con un valor de la variable de xi = 49. El percentil 10 es 49.
50 34
La primera frecuencia absoluta acumulada mayor o igual que 17 es 17 y se corresponde
100
con un valor de la variable de xi = 67. El percentil 50 es (67 + 68)/2 = 67,5.
90 34
La primera frecuencia absoluta acumulada mayor o igual que 30,6 es 31 y se corresponde
100
con un valor de la variable de xi = 79. El percentil 90 es 79.
79 2 (67 ,5) 49
Coeficiente percentil 10‐90 de sesgo = 0,2333
79 49
que, como en el caso del coeficiente cuartil de sesgo, indica una asimetría negativa de la distribución de
los datos.
Igual que sucede con las medidas de asimetría, es posible definir otra medida de apuntamiento o
curtosis de la distribución basada en cuartiles y percentiles. Dicha medida recibe el nombre de coeficien-
te percentil de curtosis o coeficiente de curtosis de Kelley y se expresa mediante la siguiente
ecuación:
1
Q
Q
3 1
Coeficiente percentil de curtosis = 2
P90 P10
Este coeficiente vale 0,263 para la distribución normal, que como sabemos es mesocúrtica. Por
tanto, la distribución será leptocúrtica si el coeficiente es mayor que 0,263 y será platicúrtica para va-
lores del coeficiente menores que 0,263.
de forma que, en este caso, la distribución analizada será leptocúrtica para valores del coeficiente ma-
yores que 0, será platicúrtica para valores del coeficiente menores que 0 y será mesocúrtica cuando el
coeficiente sea nulo.
198 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
EJEMPLO 7
Tomemos, en este caso, los datos trabajados en el ejemplo 5 de esta misma Unidad didáctica (97, 72, 87,
57, 39, 81, 70, 84, 93, 79, 84, 81, 65, 97, 75, 72, 84, 96, 77, 94) para calcular el rango entre percentiles y el
ran‐ go percentil semi 10‐90. Recordemos la tabla con las frecuencias absolutas simples y acumuladas,
xi ni Ni
39 1 1
57 1 2
65 1 3
70 1 4
72 2 6
75 1 7
77 1 8
79 1 9
81 2 11
84 3 14
87 1 15
93 1 16
94 1 17
96 1 18
97 2 20
y el valor de los percentiles 10 y 90 de la distribución que son, respectivamente, 60,5 y 96. Entonces, para
determinar el coeficiente percentil de curtosis, dado por la fórmula,
1
Q Q
2 3 1
Coeficiente percentil de curtosis = 0,263
P90 P10
necesitamos conocer el valor de los cuartiles primero y tercero en una distribución de datos con fre‐
cuencias absolutas no unitarias. Como la primera frecuencia absoluta acumulada mayor o igual que
1 20
4 5
es 6 y se corresponde con el valor de la variable 72, el primer cuartil de la distribución será
Q1 = 72. Por otra parte, la primera frecuencia absoluta acumulada mayor o igual que 15 es 15 y
3 20
4
el valor de la variable asociado a dicha frecuencia es 87. Por tanto, el tercer cuartil es Q3 = (87 + 93)/2 =
90. Con los cálculos realizados, el valor del coeficiente percentil de curtosis es,
1 1
Q 90 72
1
3
Q
2 2
Coeficiente percentil de curtosis 0,263 0,263
P90 P10 96 60,5
Finalmente, en este caso también conviene hacer mención al coeficiente de curtosis que tiene de-
finida la hoja de cálculo Excel como una de sus funciones estadísticas,
n n 1
n
x 4 3 n 1
2
x
Coeficiente de curtosis de Excel =
i
n 1 n 2 n i1 s n2n3
3
5. MEDIDAS DE CONCENTRACIÓN
Las medidas de concentración se utilizan para medir el mayor o menor grado de igualdad en la
distribución o reparto de los valores de una variable. Habitualmente son utilizadas para el análisis de
cuestiones económicas tales como aspectos de redistribución de la renta, de la riqueza, de los sala-
rios, etc.
Resumiendo, se produce concentración máxima cuando uno solo percibe el total y los demás
nada, en este caso, nos encontraremos ante un reparto no equitativo y:
x1 x2 x3 xn1 y x
n
Se produce concentración mínima cuando el conjunto total de valores de la variable está reparti-
do por igual; en este caso diremos que estamos ante un reparto equitativo y:
x1 x2 x3 xn1 xn
Las medidas de concentración más utilizadas son el índice de Gini, que es un coeficiente y por
tanto será un valor numérico, y la curva de Lorenz, que es un gráfico y por tanto solo será una repre-
sentación en un eje de coordenadas.
Para calcular el índice de Gini (y posteriormente la curva de Lorenz) consideramos una distribu-
ción de rentas xi ; ni a partir de la cual construiremos una tabla con las siguientes columnas:
3.ª Los totales acumulados ui de los productos xi ni que se calculan de la siguiente forma:
u1 x1 n1
u2 x1 n1 x2 n2
u3 x1 n1 x2 n2 x3 n3
u4 x1 n1 x2 n2 x3 n3 x4 n4
um x1 n1 x2 n2 x3 n3 x4 n4 xm nm
m
de forma que um xi ni .
i1
5.ª La columna asociada a la renta total de todos los individuos um también se expresa en
porcentaje, la representamos por y se calcula a partir de la siguiente expresión:
qi
ui
q
100
i
um
Con estas indicaciones ya podemos confeccionar la tabla que nos permitirá calcular el índice de
Gini y que quedará determinada como sigue:
Ni ui
p 100 q 100
xi ni xi ni Ni ui i
pi qi
i
n u n
x1 n1 x1 × n1 N1 u1 p1 q1 p1 – q1
x2 n2 x2 × n2 N2 u2 p2 q2 p2 – q2
... ... ... ... ... ... ... ...
xm nm xm × nm Nm um pm qm pm – qm
G
i1 pi qi
I m1
p
i1
i
www.udima.es 201
ESTADÍSTICA DESCRIPTIVA
Por ejemplo, consideremos la siguiente distribución de datos agrupada en intervalos de igual am-
plitud que representa los ingresos diarios de un conjunto de 260 comerciales que prestan sus servicios
a una empresa editorial multinacional:
ui Ni
qi 100 pi 100
Intervalo ci ni Ni xi× ui pi qi
ni um n
100‐150 125 62 157 125 × 62 = 575 + 5.400 + 7.750 = 13.725 35,33 60,38 25,06
7.750
150‐200 175 48 205 175 × 48 = 575 + 5.400 + 7.750 + 8.400 = 22.125 56,95 78,85 21,90
8.400
200‐250 225 19 224 225 × 19 = 575 + 5.400 + 7.750 + 8.400 + 4.275 = 67,95 86,15 18,20
4.275 26.400
250‐300 275 8 232 275 × 8 = 2.200 575 + 5.400 + 7.750 + 8.400 + 4.275 + 73,62 89,23 15,61
+ 2.200 = 28.600
300‐350 325 14 246 325 × 14 = 575 + 5.400 + 7.750 + 8.400 + 4.275 + 85,33 94,62 9,29
4.550
+ 2.200 + 4.550 = 33.150
350‐400 375 7 253 375 × 7 = 2.625 575 + 5.400 + 7.750 + 8.400 + 4.275 + 92,08 97,31 5,22
+ 2.200 + 4.550 + 2.625 = 35.775
400‐450 425 5 258 425 × 5 = 2.125 575 + 5.400 + 7.750 + 8.400 + 4.275 + 97,55 99,23 1,68
+ 2.200 + 4.550 + 2.625 + 2.125 = 37.900
450‐500 475 2 260 475 × 2 = 950 575 + 5.400 + 7.750 + 8.400 + 4.275 + 100,00 100,00 0,00
+ 2.200 + 4.550 + 2.625 + 2.125 + 950 =
38.850
p i qi
125,48
IG i1
m1 0,193
651,15
p i
i1
cuyo valor cercano a 0 indica que existe poca concentración en los valores de la variable estudiada.
202 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
Si los cálculos asociados al índice de Gini los representamos en un eje de coordenadas obtenemos
la curva de concentración o curva de Lorenz. Esta curva es una forma gráfica de representar la dis-
persión o concentración de los valores de una distribución. La representación de los datos de la tabla
anterior para obtener la curva de Lorenz se realiza de la siguiente manera:
(Por ejemplo, si tenemos que caracterizar el grado de concentración de la renta en una población,
representaremos en el eje de abscisas la población ordenada de manera que los percentiles de renta
más baja se sitúen a la izquierda y los de renta más alta a la derecha. En el eje de ordenadas figurarían
de abajo a arriba los percentiles acumulados de renta).
Si la variable estuviera distribuida de forma equitativa, la curva de Lorenz coincidiría con la línea
de 45 grados que pasa por el origen, es decir, con la bisectriz de la gráfica. Por el contrario, si un solo
valor concentra toda la masa de distribución y por tanto la distribución de la variable no es equitativa,
la curva de Lorenz coincidirá con el eje horizontal hasta el punto (100,0) donde saltaría al punto
(100,100).
qi%
qi%
pi %
pi %
Generalmente la curva se encuentra en una situación intermedia entre estos dos extremos.
La interpretación de la curva de Lorenz resulta simple: cuanto más cerca se sitúe dicha curva de la
diagonal, menor concentración habrá, o mayor será la homogeneidad en la distribución de datos.
Cuanto más se acerque a los ejes, por la parte inferior del cuadrado, mayor concentración existe.
www.udima.es 203
ESTADÍSTICA DESCRIPTIVA
Siguiendo con el ejemplo que hemos enunciado en el epígrafe anterior de cálculo del índice de
Gini, la curva de Lorenz asociada a dicho enunciado es:
cercana a la diagonal, lo que indica que existe poca concentración en los valores de la variable.
Los momentos son operadores que permiten calcular, de forma simplificada, las distintas medidas
de posición, de dispersión o de forma que caracterizan a una distribución de frecuencias. Los valores
que toman los momentos caracterizan a la distribución de manera que dos distribuciones son iguales,
siempre que todos sus momentos sean iguales, y serán tanto más parecidas cuanto mayor sea el núme-
ro de momentos iguales que tengan.
Existen dos clases de momentos, los momentos ordinarios, momentos respecto al origen (de coor-
denadas) o momentos respecto a 0 y los momentos respecto a la media o momentos centrales.
Los momentos respecto al origen, simbolizados por ah, se obtienen aplicando la siguiente fórmula,
n
x 0
h n
xh xh xh xh xh
ah
i
i
1 2 3 n
i1 n i1 n n
• Si h 0
entonces a0 1
204 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
r 1 ni r ni
es decir, a1 es la media aritmética de
• Si h 1 , entonces a1 x N x N x,
i i
muestrales.
siendo xi A las desviaciones de los valores de la variable respecto del origen A. Para
A 0 obtenemos los momentos de orden h respecto al origen de coordenadas.
Por su parte, los momentos centrales o momentos respecto a la media los simbolizamos como mh
y se obtienen aplicando la siguiente expresión: n
x x h
mh i
i 1 n
• El momento central de orden 1 no tiene ningún valor estadístico ya que su valor siempre
es igual a 0:
m1 m m m 1 m
x x x
1
ni x ni
1
ni x xx0
xi n
i1 i i1 i
ni
n n i1
n i1
xn x
2
m2 i
i1 i
se conoce como la varianza de la distribución y es, como ya sabemos, una medida de dis-
persión de los valores de la variable respecto a su valor medio.
Es importante tener en cuenta, especialmente a la hora de realizar aplicaciones prácticas,
que la varianza o momento central de orden 2 puede expresarse en función de los momen-
www.udima.es 205
ESTADÍSTICA DESCRIPTIVA
tos ordinarios o momentos respecto al origen como la diferencia entre el momento ordina-
rio de orden 2 y el momento ordinario de orden 1 al cuadrado, esto es:
n 2
m2 a2 a12
n
x 2
i
m x 1 i
m
i
i1 n i1 n
EJEMPLO 8
Solución:
i1 n n
14
x0 1 3 9 13 14 17 20 21 22 25 26 34
222222222222222
a2
14
i
14
i 1
Por su parte, para calcular el momento central de orden 3 o momento respecto a la media de orden 3, de‐ bemos calcular primero la
0 1 3 9 13 14 17 20 21 22 25 26
14
1a x i
14 14
i1
xi 18,7863
14
m3
i 1 14
• Centiles o percentiles. 99 valores que dividen a la distribución de los datos en 100 partes
iguales.
• Coeficiente cuartil de sesgo o de Yule-Bowley. Mide la separación entre los cuartiles y
la mediana de la distribución de forma que si la distribución es asimétrica a la derecha
Q3 está más lejos de la mediana que Q1 y si la distribución es asimétrica a la izquierda
Q1 está más alejada de la mediana que Q3.
• Coeficiente de apertura o coeficiente de disparidad. Establece una relación entre el
mayor y el menor valor de la distribución de forma que cuanto mayor sea el valor de di-
cho coeficiente decimos que mayor será la apertura de la distribución analizada.
• Coeficiente de sesgo percentílico. Mide la separación entre los percentiles y la mediana
de la distribución.
• Coeficiente percentil de curtosis o coeficiente de curtosis de Kelley. Mide el apunta-
miento de la distribución analizada a través de los cuartiles y los percentiles.
• Cuartiles. Valores que dividen a la distribución de los datos analizados en cuatro partes
igua- les, es decir, en cuatro partes que contienen el mismo número de elementos.
• Curva de Lorenz. Representación gráfica del índice de Gini de forma que este último se
obtiene aproximadamente como el área comprendida entre la diagonal principal y la cur-
va de Lorenz dividida por el área del triángulo formado por los puntos (0,0), (100,0) y
(100,100).
• Deciles. Nueve valores que dividen a la distribución de los datos en 10 partes iguales.
• Desviación media absoluta (o simplemente desviación media). Media de los valores ab-
solutos de las desviaciones respecto a la media aritmética.
• Desviación mediana. Media de los valores absolutos de las desviaciones de la variable
respecto a la mediana de la distribución.
• Índice de Gini. Medida de concentración que indica el mayor o menor grado de igualdad
en la distribución o reparto de los valores de una variable.
• Quintiles. Cuatro valores que dividen a la distribución en cinco partes iguales.
• Media recortada. La media recortada al β % es la media de los datos que quedan des-
pués de eliminar el β % de los datos más grandes y el β % de los datos más pequeños.
• Momentos de una variable estadística unidimensional. Operadores matemáticos que
permiten calcular de forma simplificada las distintas medidas de posición, de dispersión o
de forma que caracterizan a una distribución de frecuencias.
• Rango o recorrido intercuartil o intercuartílico. Diferencia entre el tercer y el primer
cuartil de la distribución de datos analizada y nos da la franja en la que se encuentra el
50% de los datos.
• Rango o recorrido semi-intercuartil. Es el rango intercuartil dividido entre 2 o el co-
ciente entre el rango intercuartil y la suma del primer y tercer cuartil.
• Rango percentil 10-90 o rango entre percentiles. Diferencia entre el percentil 90 y el
percentil 10.
• Recorrido relativo. Cociente entre el rango o recorrido de la distribución y su media
aritmética e indica el número de veces que el rango contiene a la media aritmética.
www.udima.es 207
ESTADÍSTICA DESCRIPTIVA
ACTIVIDADES DE AUTOCOMPROBACIÓN
A partir del contenido de la presente Unidad didáctica, se propone la realización de las siguientes
actividades de autocomprobación por parte del alumno, como ejercicio general de repaso y asimilación
de la información básica proporcionada por el texto.
Enunciado 1
La tabla que aparece a continuación recoge información acerca de los salarios percibidos por los
trabajadores de una cadena de tiendas de antigüedades:
25‐35 7
35‐45 19
45‐55 16
55‐75 8
Enunciado 2
Al realizar un estudio sobre el número de horas de formación realizadas durante el último año por
50 trabajadores de una productora audiovisual, se ha obtenido que 7 de ellos han realizado entre 10 y
20 horas, 11 entre 20 y 30 horas, 15 entre 30 y 40 horas, 10 entre 40 y 50 horas, 5 entre 50 y 60 horas
y 2 entre 60 y 70 horas. Determina el recorrido relativo, el coeficiente de apertura, el recorrido inter-
cuartílico, el recorrido semi-intercuartílico, el rango entre percentiles, el rango percentil semi 10-90 y
la desviación media.
Enunciado 3
Un importante centro comercial del noroeste de Madrid dispone de zona de aparcamiento para sus
clientes. Los datos mostrados a continuación se refieren al número de horas que un conjunto de vehí-
culos permanecen en dicho aparcamiento:
4, 3, 6, 5, 2, 4, 5, 2, 4, 2, 1, 4, 5, 4, 3, 4, 3, 2, 1, 4, 3, 7, 7, 4, 7, 3, 4, 3, 3 ,5,
4, 6, 5, 6, 1, 3, 4, 6, 4, 2, 5, 6, 3, 4, 3, 2, 1, 3, 6, 5, 2, 4, 7, 5, 5, 5, 4, 1, 2, 3
Determina, a partir de estos datos, el coeficiente cuartil de sesgo, el coeficiente percentil 10-90 de
sesgo y el coeficiente percentil de curtosis.
208 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
Enunciado 4
Un estudio sobre los beneficios (en millones de €) obtenidos durante el último año por 20 empre-
sas exportadoras de materias primas para la construcción en la zona euro arroja los siguientes resulta-
dos:
2 10
6 12
6 11
4 14
2 13
Enunciado 5
0‐2 180
2‐4 240
4‐8 116
8‐12 20
12‐20 4
Calcula los momentos ordinarios de orden 1 y 2 y los momentos centrales de orden 2 y 3 asocia-
dos a esta distribución de datos.
www.udima.es 209
ESTADÍSTICA DESCRIPTIVA
Solución 1
Para determinar las medidas de posición no centrales de esta distribución de datos salariales agru-
pados, en primer lugar debemos completar la tabla original con las marcas de clase, las frecuencias
absolutas acumuladas, la amplitud de los intervalos y, como se trata de intervalos de diferente ampli-
tud, las densidades de frecuencia:
7
25‐35 30 7 7 10 0,7
10
19
35‐45 40 19 7+19=26 10 1,9
10
16
45‐55 50 16 7+19+16=42 10 1,6
10
8
55‐75 65 8 7+19+16+8=50 20 0,4
20
Entonces, para calcular el primer, segundo y tercer cuartil de la distribución, al tratarse de datos
agrupados en intervalos de distinta amplitud, aplicamos la siguiente fórmula,
rn
Ni1
Qi Li1 4
ai
ni
donde
Li1 es el extremo inferior del intervalo donde se encuentra el cuartil calculado, r es el cuartil
que queremos calcular, Ni1 es la frecuencia absoluta acumulada en el intervalo anterior al que se
encuentra el cuartil, ni es la frecuencia absoluta asociada al intervalo en el que se sitúa el cuartil y ai
la amplitud de dicho intervalo.
el segundo cuartil (que, como ya sabes, coincide con la mediana de la distribución) es,
25 7
Q 35 10 44,474
2
19
y el tercer cuartil resulta:
37,5 26
Q 45 10 52,1875
3
16
Una vez obtenidos los cuartiles de la distribución, el rango intercuartil y semi-intercuartil se de-
ducen fácilmente aplicando las siguientes fórmulas:
RI Q3 Q1 52,187537,89514,2925
o bien,
Q3 Q1 52,1875 37,895 14,2925
RSI
Q1 Q3 37,895 52,1875 90,0825
0,1587
Para calcular el percentil 40 seguimos el procedimiento utilizado para calcular los cuartiles pero
aplicando la siguiente fórmula:
rn
PL i1
a
N
100
i i1 i
ni
Entonces, el intervalo del percentil será 35-45 puesto que es el primer intervalo cuya frecuencia
absoluta acumulada, 26, iguala o supera 40 50 20. Así, el percentil buscado resulta:
a 100
20 7
35 10 41,8421
P40 19
Finalmente, los salarios que definen un intervalo que contenga el 80% central de la distribución vie-
nen dados por los deciles primero y noveno. El primer decil se encontrará en el primer intervalo cuya
1 50
frecuencia absoluta acumulada sea mayor o igual que 5 y por tanto dicho intervalo será 25-35.
10
Por su parte, el noveno decil se encontrará en el intervalo 55-75 ya que su frecuencia absoluta acumula-
da, 50, es mayor que 9 50 El valor concreto de los deciles lo obtenemos aplicando la siguiente
45.
fórmula: 10
50
D 25 10 32,143
1
7
45 42
D 55 20 62,5
9
8
www.udima.es 211
ESTADÍSTICA DESCRIPTIVA
Solución 2
Para resolver el problema planteado comenzamos construyendo una tabla de frecuencias con las
siguientes columnas:
10‐20 15 7 7
20‐30 25 11 7 + 11 = 18
30‐40 35 15 7 + 11 + 15 = 33
40‐50 45 10 7 + 11 + 15 + 10 = 43
50‐60 55 5 7 + 11 + 15 + 10 + 5 = 48
60‐70 65 2 7 + 11 + 15 + 10 + 5 + 2 = 50
R
Entonces, para calcular el recorrido relativo RR necesitamos obtener el rango de la distribución,
x
dado por la diferencia entre el mayor y el menor valor (en este caso, marca de clase) de la misma,
R = 65 – 15 = 50
RR 50
1,42045
32,5
El coeficiente de apertura viene dado por el cociente entre los valores máximo y mínimo de la
distribución, esto es:
max 65
CApertura 4,333
xi 15
min xi
El cálculo, tanto del recorrido intercuartil como del recorrido semi-intercuartil, requiere de la ob-
tención previa de los cuartiles primero y tercero. Como los datos están agrupados, los cuartiles se deri-
van aplicando la siguiente fórmula:
rn
i 1
Qi Li 1 N ai
4
Por tanto: ni
1 50
• El primer valor de la frecuencia absoluta acumulada que iguala o supera 12,5 es
4
18 que se corresponde con el intervalo 20-30. Entonces, el valor del primer cuartil es:
12,5 7
Q 20 10 25
1
11
212 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
3 50
• El primer valor de la frecuencia absoluta acumulada que iguala o supera 37,5 es
4
43, que se corresponde con el intervalo 40-50. Entonces, el valor del tercer cuartil es:
37,5 33
Q 40 10 44,5
3
10
Con lo que el recorrido intercuartil y el recorrido semi-intercuartil resultan:
Para obtener el rango entre percentiles y el rango percentil semi 10-90, dados por las fórmulas,
rn
PL i1
a
N
100
i i1 i
ni
Por tanto:
10 50
• El primer valor de la frecuencia absoluta acumulada que iguala o supera 5
100 es 7
que se corresponde con el intervalo 10-20. Entonces, el valor del percentil es:
50
P10 10 10 17,143
7
1
Rango percentil semi 10-90 = 54 17,143 18,4285
2
www.udima.es 213
ESTADÍSTICA DESCRIPTIVA
siendo xi la marca de clase de cada intervalo considerado, x la media aritmética simple de los da-
ci
tos y ni las frecuencias absolutas simples que tenemos calculadas en la tabla de frecuencias. Entonces:
Solución 3
El primer paso para calcular los coeficientes de simetría y de apuntamiento pedidos es construir
una tabla con las frecuencias absolutas simples y acumuladas:
1 5 5
2 8 5 + 8 = 13
3 12 5 + 8 + 12 = 25
4 15 5 + 8 + 12 + 15 = 40
5 10 5 + 8 + 12 + 15 + 10 = 50
6 6 5 + 8 + 12 + 15 + 10 + 6 = 56
7 4 5 + 8 + 12 + 15 + 10 + 6 + 4 = 60
Q3 2 Q2 Q1
Coeficiente cuartil de sesgo =
Q3 Q1
Como los datos del enunciado no tienen frecuencias absolutas unitarias, el primer cuartil se calcu-
lará a partir de aquel valor de la variable estudiada para el cual la frecuencia absoluta acumulada igua-
1 60
le o supere el valor 15. En este caso, la primera frecuencia absoluta mayor que 15 es 25 y se
4
corresponde con un valor de la variable de xi = 3. Por tanto, el primer percentil será 3.
Para el segundo cuartil buscamos la frecuencia absoluta acumulada que iguale o supere el valor
2 60
30. Dicha frecuencia es 40 y se corresponde con un valor de la variable de xi = 4. Por tanto,
4
el segundo cuartil es 4.
214 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
Finalmente, para obtener el tercer cuartil calculamos 3 60 de forma que la primera fre-
4 45
cuencia absoluta acumulada que lo iguala o supera es 50 y se corresponde con un valor de la variable
de xi = 5. Por tanto, el tercer cuartil es 5.
10 60
• 6. El primer valor de la frecuencia acumulada que iguala o supera a 6 es 13 y se
100
corresponde con un valor de la variable de xi = 2. El percentil 10 es 2.
50 60
• 30. El primer valor de la frecuencia acumulada que iguala o supera a 30 es 40 y
100
se corresponde con un valor de la variable de xi = 4. El percentil 10 es 4.
90 60
• 54. El primer valor de la frecuencia acumulada que iguala o supera a 54 es 56 y
100
se corresponde con un valor de la variable de xi = 6. El percentil 90 es 6.
de forma que podemos concluir que la distribución es ligeramente platicúrtica por ser el valor del
coeficiente de apuntamiento negativo.
www.udima.es 215
ESTADÍSTICA DESCRIPTIVA
Solución 4
Para calcular el índice de Gini del beneficio de las empresas, en primer lugar completamos la tabla
original con las columnas de los xi ni , los totales acumulados ui de los xi ni , las
productos productos
frecuencias acumuladas relativas, pi y la columna asociada a la renta total de todos los individuos qi :
Ni
u p 100
q 100
i
xi ni Ni xini ui i p i qi
i n
un
p qi p qi
m1 51
i1
i
i1
i 8,333
I 0,0397
G m1 51
210
p
i1
i p
i 1
i
El valor del índice está muy próximo a 0 lo que significa que la concentración de los beneficios es
muy baja o, dicho de otro modo, los beneficios en el sector analizado de las 20 empresas exportadoras
de la zona euro tienen una equidistribución muy elevada.
Solución 5
Dado que las frecuencias asociadas a cada intervalo no son unitarias, los momentos ordinarios y
centrales de orden h se calculan aplicando las siguientes fórmulas:
m
h ni
ah x
i1
i n
mh m m ni
x x x
h h
i1 i
ni x
i1 i n
n
Además, como los datos son agrupados, necesitamos obtener la marca de clase de cada intervalo
para poder realizar los cálculos. Por tanto:
216 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
0‐2 1 180
2‐4 3 240
4‐8 6 116
8‐12 10 20
12‐20 16 4
560
que además es la media de la distribución. Por tanto, la cuantía media de los siniestros es 3,321 u.m.
El momento ordinario de orden 2 se obtiene de forma similar, calculando la media de cada uno de
los valores de la variable pero en este caso elevados al cuadrado, esto es:
5
n2 2 180 2 240 2 116 2 20 2 4
a2 xi i 1 3 6 10 16 17,036
i1 560 560 560 560 560 560
que coincide con la varianza o dispersión de los valores de la cuantía del siniestro respecto al valor
medio.
El momento central de orden 3 se calcula como el anterior, solo que sustituyendo h por 3, esto es,
obteniendo la media de las desviaciones de los valores de la variable respecto de la media elevadas al
cubo:
x 3,321 ni
3
m3
i1 i 560
180 240 116 20
1 3,321 3 3,321 6 3,321 10 3,321
3 3 3 3
560 560 560 560
4
16 3,321
3
25,149
560
www.udima.es 217
ESTADÍSTICA DESCRIPTIVA
ACTIVIDADES DE REPASO
Enunciado 1
En la tabla que aparece a continuación se muestra la carga máxima soportada por los camiones de
una flota contratada por una empresa para el transporte de sus mercancías:
9,3‐9,7 2
9,8‐10,2 5
10,3‐10,7 12
10,8‐11,2 17
11,3‐11,7 14
11,8‐12,2 6
12,3‐12,7 3
12,8‐13,2 1
Enunciado 2
Una agencia regional de estadística realiza un estudio sobre los hábitos de viajes al extranjero en el
sector de la población de entre 50 y 78 años de una determinada región. El estudio concluye que, de las
90 personas entrevistadas, el grupo de edad comprendida entre 50 y 54 años realiza 7 viajes al año, el
grupo de entre 54 y 58 realiza 10, el grupo de entre 58 y 62 años realiza 16, el grupo de entre 62 y 66
años realiza 20, el grupo de entre 66 y 70 años realiza 18, el grupo de entre 70 y 74 años realiza 11 y el
grupo de entre 74 y 78 años realiza 8. Determina el recorrido relativo, el coeficiente de apertura, el reco-
rrido intercuartílico, el recorrido semi-intercuartílico, el rango entre percentiles, el rango percentil semi
10-90 y la desviación media.
Enunciado 3
Con los datos del ejercicio anterior determina los coeficientes cuartil de sesgo, percentil 10-90 de
sesgo y percentil de curtosis e interpreta los resultados obtenidos.
Enunciado 4
La tabla que tenemos a continuación recoge información acerca de los salarios brutos anuales
(expresados en miles de dólares) de 1.000 trabajadores de una empresa multinacional norteameri-
cana:
218 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
Determina el índice de Gini para medir la concentración de los salarios de los trabajadores.
Enunciado 5
En una encuesta realizada a 50 individuos acerca del número de vehículos disponibles en cada
familia se obtuvieron los siguientes datos:
2, 4, 2, 3, 1, 2, 4, 2, 3, 0, 2, 2, 2, 3, 2, 6, 2, 3, 2, 2, 3, 2, 3, 3, 4,
1, 3, 3, 4, 5, 2, 0, 3, 2, 1, 2, 3, 2, 2, 3, 1, 4, 2, 3, 2, 4, 3, 3, 2, 2
www.udima.es 219
ESTADÍSTICA DESCRIPTIVA
Solución
1
Q1 P25 10,567
Q3 11,557
RI Q3 Q1 11,55710,567 0,99
Solución 2
50‐54 52 7 7
54‐58 56 10 17
58‐62 60 16 33
62‐66 64 20 53
66‐70 68 18 71
70‐74 72 11 82
74‐78 76 8 90
Recorrido relativo: RR 24
0,3732
64,311
max
Coeficiente de apertura: CApertura 76
xi 1,4615
52
min xi
220 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
Desviación media:
x
m
x n
i
Dx i
i1 n
52 64,311 7 56 64,311 10 60 64,311 16 64 64,311 20
Solución 3
Solución 4
Índice de Gini: 0,2541
Solución 5
Tabla de frecuencias:
xi ni
0 2
1 4
2 21
3 15
4 6
5 1
6 1
www.udima.es 221
ESTADÍSTICA DESCRIPTIVA
TEST DE AUTOEVALUACIÓN
1. Los datos que se presentan a continuación hacen referencia a los porcentajes del ingreso
de 30 familias que se asignan a la compra de alimentos de primera necesidad:
26, 40, 28, 29, 30, 41, 37, 40, 33, 29, 30, 35, 29, 26, 39,
42, 49, 36, 31, 37, 38, 35, 36, 44, 33, 32, 24, 45, 34, 35
a) 0,13
b) 0,72
c) 16
d) 9
222 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
5. Una empresa realiza un ensayo para medir los tiempos (en minutos) Tiempo Empleados
que tardan sus empleados en producir las piezas para el posterior
0‐50 2
montaje de un determinado pro- ducto electrodoméstico:
50‐100 3
100‐150 10
¿A partir de qué tiempo los empleados finalizan la producción 150‐200 15
del 75% de las piezas para el montaje del electrodoméstico? 200‐250 16
250‐300 4
a) 312,5 minutos.
300‐350 10
b) 3 minutos. 350‐400 5
c) 52,5 minutos. 400‐450 3
450‐500 2
d) 231,43 minutos.
a) a4 92.846 y m4 10,333
b) a4 10,333 y m4 13.616,622
c) a4 92.846 y m4 13.616,622
d) a4 13.616,622 y m4 92.846
www.udima.es 223
ESTADÍSTICA DESCRIPTIVA
8, 9 y 10. La carga máxima soportada por los camiones de una flota contratada por una
empresa para el transporte de sus mercancías viene dada en la tabla que tenemos a con-
tinuación:
c) 0,006221 9,3‐9,7 2
9,8‐10,2 5
d) 0,069
10,3‐10,7 12
10,8‐11,2 17
9. El coeficiente cuartil de sesgo es:
11,3‐11,7 14
a) 0,03545 11,8‐12,2 6
b) 0,2544 12,3‐12,7 3
12,8‐13,2 1
c) 0,00606061
d) 0,006221
a) 0,03545
b) 0,4952
c) 0,00616
d) 0,2544
224 www.udima.es
Análisis numérico de una variable medible (III):
M.ª J. Pérez Fructuoso otras medidas de posición, de dispersión, de concentración y de forma
1 d)
2 c)
3 a)
4 b)
5 a)
6 d)
7 c)
8 a)
9 c)
10 d)
REFERENCIAS BIBLIOGRÁFICAS
DURÁ PEIRÓ, J.M. y LÓPEZ CUÑAT, J.: Fundamentos de estadística. Estadística descriptiva y modelos probabilísticos
para la inferencia, Barcelona: Ariel Economía, 1988.
KAZMAIER, L.J.: Estadística aplicada a administración y economía, Madrid: McGraw-Hill Interamericana, 2006.
LIND, D.A.; MARCHAL, W.G. y WATHEN, S.A.: Estadística aplicada a los negocios y la economía, Madrid: McGraw-
Hill Interamericana, 2008.
NEWBOLD, P.; CARLSON, W.L. y THORNE, B.: Estadística para administración y economía, New Jersey: Pearson Pren-
tice Hall, 2008.
PEÑA SÁNCHEZ DE RIVERA, D.: Estadística. Modelos y Métodos. 1. Fundamentos, Madrid: Alianza Editorial. Alianza
Universidad Textos, 1989.
PEÑA, D. y ROMO, J.: Introducción a la estadística para las ciencias sociales, Madrid: McGraw-Hill, 1997.
WONNACOTT, T.H. y WONNACOTT, R.J.: Introducción a la estadística, México: Limusa, SA. Grupo Noriega Editores,
1999.
www.udima.es 225