Está en la página 1de 83

Tema 3:

Medidas de Posición,
Dispersión y Forma
Estadística I

Beatriz María Sastre Hernández


Contenido
• 1. Medidas de posición
• 1.1. Medidas de tendencia central
• 1.2. Medidas de tendencia no central
• 2. Medidas de dispersión
• 3. Medidas de forma

Universidad Católica de Ávila


• 3.1. Momentos
• 3.2. Asimetría
• 3.3. Apuntamiento o curtosis
• 4. Diagrama de caja
• 5. Medidas de concentración

2
1. Medidas de posición

Medidas de
posición

Universidad Católica de Ávila


Central No central

Media Mediana Moda Cuantiles 3


1.1. Medidas de tendencia central
• Nos dan información sobre el centro de la distribución de la variable.

• Media aritmética:
✓ Medida de tendencia central más conocida y utilizada

Universidad Católica de Ávila


✓ Cálculo sencillo e intuitivo
❖Sólo puede obtenerse para variables cuantitativas
✓ Se mide en las mismas unidades que la variable
❖Muy sensible a los datos atípicos

σ𝑘𝑖=1 𝑥𝑖 ∗ 𝑛𝑖
𝑥ҧ =
𝑁
4
1.1. Medidas de tendencia central
• Ejemplo 1: Disponemos de la distribución por edades de un grupo de 36 personas.
Queremos obtener la edad media del grupo.

Edades Personas
0 – 24 5

Universidad Católica de Ávila


25 – 39 7
40 – 54 11
55 – 64 9
65 – 84 4

5
1.1. Medidas de tendencia central
• Ejemplo 1:

Edades Personas 𝒏𝒊 Marca de clase 𝒙𝒊 𝒙𝒊 𝒏𝒊


0 – 24 5 12 60
25 – 39 7 32 224

Universidad Católica de Ávila


40 – 54 11 47 517
55 – 64 9 59’5 535’5
65 – 84 4 74’5 298

σ𝑁
𝑖=1 𝑥𝑖 𝑛𝑖 60+224+517+535′ 5+298 1634′ 5
• 𝑥ҧ = = = = 45′ 4028 ≈ 45′ 4 𝑎ñ𝑜𝑠
𝑁 5+7+11+9+4 36

6
• La edad media del grupo de personas es de 45’4 años.
1.1. Medidas de tendencia central
• Media geométrica:
❖Sólo puede obtenerse para variables cuantitativas positivas
✓ Se mide en la mismas unidades que la variable
❖Si un valor de la variable es 0, la media geométrica también lo es

Universidad Católica de Ávila


✓ Es menos sensible a los datos atípicos que la media aritmética
✓ Útil para calcular medias de porcentajes, tantos por uno, puntuaciones, índices…

1ൗ
𝑛 𝑛 𝑛
𝑛
𝑛
𝑥𝐺 = 𝐺 = ෑ 𝑥𝑖 = ෑ 𝑥𝑖 = 𝑥1 𝑛1 ∗ 𝑥2 𝑛2 ∗ ⋯ ∗ 𝑥𝑘 𝑛𝑘
𝑖=1 𝑖=1

σ𝑘𝑖=1 𝑛𝑖 log 𝑥𝑖 7
𝐺 = 𝑎𝑛𝑡𝑖𝑙𝑜𝑔
𝑁
1.1. Medidas de tendencia central
• Ejercicio 1: El precio de la vivienda de segunda mano en España creció entre 2015 y
2016 un 10’8%; entre 2016 y 2017 un 4’2% y entre 2017 y 2018 bajó un 0’9%
(calculados a partir de las cifras de abril de cada año) ¿Cuánto ha crecido el precio de la
vivienda en media cada año?

Universidad Católica de Ávila


8
1.1. Medidas de tendencia central
• Ejercicio 1: El precio de la vivienda de segunda mano en España creció entre 2015 y 2016 un
10’8%; entre 2016 y 2017 un 4’2% y entre 2017 y 2018 bajó un 0’9% (calculados a partir de las
cifras de abril de cada año) ¿Cuánto ha crecido el precio de la vivienda en media cada año?

1
𝑥𝐺 = 𝐺 = ς𝑛𝑖=1 𝑥𝑖 Τ𝑛 = 𝑛 ς𝑛𝑖=1 𝑥𝑖 = 𝑛 𝑥1 𝑛1 ∗ 𝑥2 𝑛2 ∗ ⋯ ∗ 𝑥𝑘 𝑛𝑘 =

Universidad Católica de Ávila


3 3
1 + 0′ 108 ∗ 1 + 0′ 042 ∗ (1 − 0′ 009) = 1′ 108 ∗ 1′ 042 ∗ 0′ 991 =
3 ′
1 144145176 = 1′ 045908545 ≈ 1′ 046

9
1.1. Medidas de tendencia central
• Media armónica:
❖Sólo puede obtenerse para variables cuantitativas
✓ Se mide en las mismas unidades que la variable
❖Si algún valor de la variable es igual a 0, no se puede calcular

Universidad Católica de Ávila


❖Influencia de los valores pequeños
✓ Se utiliza para promediar velocidades, rendimientos, tiempos, electrónica…

−1
𝑘
1 𝑁
𝑥𝐴 = 𝐻 = 𝑁 ∗ ෍ = 𝑛𝑖
𝑥𝑖 σ𝑘𝑖=1
𝑖=1 𝑥𝑖

10
1.1. Medidas de tendencia central
• Ejercicio 2: Por las condiciones de la carretera, un coche debe hacer un total de 400 km,
tiene que recorrer los 100 primeros a 120km/h, los 100 segundos a 80 km/h, los 100
terceros a 100 km/h y los 100 últimos a 110 km/h. ¿Cuál es la velocidad media de todo
el trayecto?

Universidad Católica de Ávila


11
1.1. Medidas de tendencia central
• Ejercicio 2: Por las condiciones de la carretera, un coche debe hacer un total de 400 km,
tiene que recorrer los 100 primeros a 120km/h, los 100 segundos a 80 km/h, los 100
terceros a 100 km/h y los 100 últimos a 110 km/h. ¿Cuál es la velocidad media de todo
el trayecto?
−1
𝑘

Universidad Católica de Ávila


1 𝑁 400 400
𝑥𝐴 = 𝐻 = 𝑁 ∗ ෍ = 𝑛𝑖 = 100 100 100 100 = 527
𝑥𝑖 𝑘
σ𝑖=1 + + +
𝑖=1 𝑥𝑖 120 80 100 110 132
= 100′ 1897533 ≈ 100′ 2 𝑘𝑚/ℎ

12
1.1. Medidas de tendencia central
• Media cuadrática:
❖Sólo puede obtenerse para variables cuantitativas
✓ Se mide en las mimas unidades que la variable
❖El principal inconveniente es que es muy sensible a datos atípicos

Universidad Católica de Ávila


✓ Se usa cuando no queremos recoger distintos signos en las observaciones, por ejemplo en los
errores de medida

σ𝑘𝑖=1 𝑥𝑖2 𝑛𝑖
𝑥𝑄 = 𝐶 =
𝑁

13
1.1. Medidas de tendencia central
• Ejercicio 3: Se han medido los errores de predicción del PIB de 7 instituciones
obteniéndose los siguientes datos. Calcula el valor de la media más adecuada para este
caso.
Institución Error de predicción

Universidad Católica de Ávila


Institución 1 - 0’6
Institución 2 0’15
Institución 3 0’2
Institución 4 - 0’4
Institución 5 0’5
Institución 6 - 0’3
Institución 7 0’1
14
1.1. Medidas de tendencia central
• Ejercicio 3: Se han medido los errores de predicción del PIB de 7 instituciones obteniéndose los
siguientes datos. Calcula el valor de la media más adecuada para este caso.

σ𝑘 2
𝑖=1 𝑥𝑖 𝑛𝑖 −0′ 62 +0′ 152 +0′ 22 +−0′ 42 +0′ 52 +−0′ 32 +0′ 12 0′ 9325

Universidad Católica de Ávila


• 𝑥𝑄 = 𝐶 = = = =
𝑁 7 7
0′ 13324285 = 0′ 364985322 ≈ 0 365 𝑝. 𝑝. ′
Error de
Institución
predicción

Institución 1 - 0’6
Institución 2 0’15
Institución 3 0’2
Institución 4 - 0’4
Institución 5 0’5
15
Institución 6 - 0’3
Institución 7 0’1
1.1. Medidas de tendencia central
• Relación entre los diferentes tipos de media:

𝑥𝐴 ≤ 𝑥𝐺 ≤ 𝑥ҧ ≤ 𝑥𝑄

Universidad Católica de Ávila


𝐻 ≤ 𝐺 ≤ 𝑥ҧ ≤ 𝐶

16
1.1. Medidas de tendencia central
• Mediana: es el valor de la variable que, ordenados los datos en orden ascendente, deja
tantas observaciones por debajo de si como por encima.
✓ Divide a la muestra en dos partes con el mismo número de observaciones
✓ No se ve afectada por la dispersión de la variable

Universidad Católica de Ávila


❖Sólo puede obtenerse para variables cuantitativas
✓ Se mide en las mismas unidades que la variable
❖Su cálculo difiere en función de si los datos se encuentra o no agrupados en intervalos

17
1.1. Medidas de tendencia central
Variable sin agrupar Variable agrupada en intervalos

1) Ordenamos la variable en orden ascendente, 1) Ordenamos los intervalos en orden


obtenemos la columna de frecuencias ascendente, obtenemos la columna de
absolutas acumulados 𝑁𝑖 y hallamos N/2. frecuencias absolutas acumulados 𝑁𝑖 y
➢ Si N/2 está en la columna de frecuencias hallamos N/2.

Universidad Católica de Ávila


absolutas acumuladas, el valor de la mediana ➢ Si N/2 está en la columna de frecuencias
será la media entre el valor de la variable que se absolutas acumuladas, la mediana será el límite
corresponda con una frecuencia absoluta superior del intervalo que se corresponda con la
acumulada igual a N/2 y el valor de la variable frecuencia acumulada igual a N/2.
inmediatamente superior. ➢ Si N/2 no se encuentra en la columna de
➢ Si N/2 no se encuentra en la columna de frecuencias acumuladas, el intervalo mediano
frecuencias absolutas acumuladas, el valor de la será el que tenga la frecuencia absoluta
mediana será el valor 𝑥𝑖 de la variable con la acumulada inmediatamente superior a N/2.
frecuencia absoluta acumulada inmediatamente Dentro de dicho intervalo, el valor de la
superior a N/2. mediana será: 18
𝑁ൗ − 𝑁
𝑖−1
𝑀𝑒 = 𝐿𝑖−1 + 2 ∗ 𝑐𝑖
𝑛𝑖
1.1. Medidas de tendencia central
• Mediana:
1) Ordenar los datos de forma ascendente
2) Calcular las frecuencias absolutas acumuladas
3) Calcular N/2
4) Buscar si N/2 se encuentra en la columna de frecuencias absolutas acumuladas o no

Universidad Católica de Ávila


1) Si está ➔ Media entre el valor que lo contiene y el siguiente ➔ Límite superior del intervalo
2) Si no está ➔ Frecuencia inmediatamente superior ➔ fórmula

𝑁ൗ − 𝑁
𝑖−1
𝑀𝑒 = 𝐿𝑖−1 + 2 ∗ 𝑐𝑖
𝑛𝑖

𝐿𝑖−1: Límite inferior del intervalo mediano


19
𝑁𝑖−1 : Frecuencia absoluta acumulada del intervalo inmediatamente inferior al intervalo mediano
𝑛𝑖 : frecuencia absoluta del intervalo mediano
𝑐𝑖 = 𝐿𝑖+1 − 𝐿𝑖 : amplitud del intervalo mediano
1.1. Medidas de tendencia central
• Ejercicio 4: En la siguiente tabla se muestra la cantidad de parados (en miles de
personas) en España en 2020 por cohortes de edad. Calcula la mediana.

Edades Personas 𝑛𝑖
De 16 a 19 126,5

Universidad Católica de Ávila


De 20 a 24 421,3
De 25 a 29 473,8
De 30 a 34 399,7
De 35 a 39 401,9
De 40 a 44 416,1
De 45 a 49 413,4
De 50 a 54 369,4
De 55 a 59 313,4
De 60 a 64 181,8 20
De 65 a 69 13
1.1. Medidas de tendencia central
• Ejercicio 4: En la siguiente tabla se muestra la cantidad de parados (en miles de
personas) en España en 2020 por cohortes de edad. Calcula la mediana.
Edades Personas 𝑛𝑖 𝑁𝑖
De 16 a 19 126,5 126,5 𝑁 3530′ 3
= = 1765′ 15
2 2

Universidad Católica de Ávila


De 20 a 24 421,3 547,8
De 25 a 29 473,8 1021,6 𝑁ൗ − 𝑁
𝑖−1
De 30 a 34 399,7 1421,3 𝑀𝑒 = 𝐿𝑖−1 + 2 ∗ 𝑐𝑖
𝑛𝑖
De 35 a 39 401,9 1823,2 1765′ 15 − 1421′ 3 ′ 4222
= 35 + ∗ 4 = 35 + 3
De 40 a 44 416,1 2239,3 401′ 9
= 38′ 4222 𝑎ñ𝑜𝑠
De 45 a 49 413,4 2652,7
De 50 a 54 369,4 3022,1
De 55 a 59 313,4 3335,5 21
De 60 a 64 181,8 3517,3
De 65 a 69 13 3530,3
1.1. Medidas de tendencia central
• Moda: es el valor de la variable con mayor frecuencia absoluta.
➢ Es el valor que más se repite
➢ Puede obtenerse tanto para variables cuantitativas como cualitativas
➢ Se mide en las mismas unidades que la variable

Universidad Católica de Ávila


➢ No se ve alterada ante la presencia de datos atípicos
❖Su cálculo difiere en función de si los datos se encuentran o no agrupados en intervalos y si
los intervalos son de distinta o igual amplitud

➢ Si los datos no están agrupados, el valor de la variable que más se repite se corresponde con
la moda.

22
1.1. Medidas de tendencia central
Variable agrupada en intervalos de igual Variable agrupada en intervalos de distinta
amplitud amplitud
• Identificar el intervalo modal, que será • Calculamos la densidad de cada intervalo:
aquel que presente una mayor frecuencia 𝑛𝑖
ℎ𝑖 =
absoluta (𝑛𝑖 ). Dentro de dicho intervalo, el 𝑐𝑖
valor concreto de la moda será el que viene • Identificamos el intervalo modal, como

Universidad Católica de Ávila


definido por: aquel con mayor densidad (mayor ℎ𝑖 ).
𝑛𝑖+1 Dentro de dicho intervalo, el valor modal
𝑀𝑜 = 𝐿𝑖−1 + ∗𝑐
𝑛𝑖 + 𝑛𝑖+1 𝑖 será:
ℎ𝑖+1
𝑀𝑜 = 𝐿𝑖−1 + ∗𝑐
• Donde 𝐿𝑖−1 es el límite inferior del ℎ𝑖 + ℎ𝑖+1 𝑖
intervalo modal, 𝑛𝑖 la frecuencia absoluta • Donde 𝐿𝑖−1 es el límite inferior del
del intervalo modal, 𝑛𝑖+1 la frecuencia intervalo modal, ℎ𝑖 la densidad del
absoluta del intervalo inmediatamente intervalo modal, ℎ𝑖+1 la densidad del
superior al modal y 𝑐𝑖 la amplitud del intervalo inmediatamente superior al 23
intervalo modal. modal y 𝑐𝑖 la amplitud del intervalo modal.
1.1. Medidas de tendencia central
• Ejercicio 5: A partir de los datos del ejercicio 4 calcula la moda.

Edades Personas 𝑛𝑖
De 16 a 19 126,5
De 20 a 24 421,3

Universidad Católica de Ávila


De 25 a 29 473,8
De 30 a 34 399,7
De 35 a 39 401,9
De 40 a 44 416,1
De 45 a 49 413,4
De 50 a 54 369,4
De 55 a 59 313,4
De 60 a 64 181,8
24
De 65 a 69 13
1.1. Medidas de tendencia central
• Ejercicio 5: A partir de los datos del ejercicio 4 calcula la moda.
ℎ 99′ 925
• 𝑀𝑜 = 𝐿𝑖−1 + 𝑖+1 ∗ 𝑐𝑖 = 25 + ∗ 4 = 25 + 1′ 8303 =
ℎ𝑖 +ℎ𝑖+1 118′ 450+99′ 925
26′ 8303 años

Universidad Católica de Ávila


Edades Personas ℎ𝑖
De 16 a 19 126,5 42,167
De 20 a 24 421,3 105,325
De 25 a 29 473,8 118,450
De 30 a 34 399,7 99,925
De 35 a 39 401,9 100,475
De 40 a 44 416,1 104,025
De 45 a 49 413,4 103,350
De 50 a 54 369,4 92,350
25
De 55 a 59 313,4 78,350
De 60 a 64 181,8 45,450
De 65 a 69 13 3,250
1.1. Medidas de tendencia central
• Ejercicio 6: A partir de los siguientes datos referentes a las edades de 100 personas que
entran en un supermercado. Ordena los datos en una tabla estadística, representa la
variable mediante un gráfico que se ajuste a los datos y calcula las medidas de tendencia
central vistas hasta el momento.
5 4 30 18 80 86 39 90 1 37

Universidad Católica de Ávila


83 66 56 14 56 19 7 35 64 19
53 31 68 46 94 24 84 71 8 65
64 77 94 55 48 52 14 94 42 25
87 52 99 82 55 34 52 39 93 26
83 88 60 80 72 10 83 48 22 79
66 10 85 24 100 94 1 92 96 60
70 85 89 35 65 92 49 52 11 4 26
46 9 33 39 1 88 9 43 75 41
18 17 21 6 20 24 58 34 68 24
1.1. Medidas de tendencia central
• Ejercicio 6:

Edades 𝑛𝑖 𝑥𝑖 𝑁𝑖 𝑓𝑖 𝐹𝑖
De 1 a 14 16 7,5 16 0,16 0,16
De 15 a 29 14 22 30 0,14 0,3

Universidad Católica de Ávila


De 30 a 44 14 37 44 0,14 0,44
De 45 a 59 15 52 59 0,15 0,59
De 60 a 74 13 67 72 0,13 0,72
De 75 a 89 17 82 89 0,17 0,89
De 90 a 104 11 97 100 0,11 1
100 1
27
1.1. Medidas de tendencia central
• Ejercicio 6:

Edades
18

16

Universidad Católica de Ávila


14

12

10

0
28
De 1 a 14 De 15 a 29 De 30 a 44 De 45 a 59 De 60 a 74 De 75 a 89 De 90 a 104
1.1. Medidas de tendencia central
• Ejercicio 6: σ𝑁
𝑖=1 𝑥𝑖 𝑛𝑖 5058
𝑥ҧ = = = 50′ 58 𝑎ñ𝑜𝑠
𝑁 100
Edades 𝑛𝑖 𝑥𝑖 𝑥𝑖 ∗ 𝑛𝑖 𝑁𝑖
De 1 a 14 16 7,5 120 16 𝑁ൗ − 𝑁
𝑖−1
De 15 a 29 14 22 308 30 𝑀𝑒 = 𝐿𝑖−1 + 2 ∗ 𝑐𝑖
De 30 a 44 14 37 518 44 𝑛𝑖

Universidad Católica de Ávila


50 − 44
De 45 a 59 15 52 780 59 = 45 + ∗ 14 = 45 + 5′ 6
15
De 60 a 74 13 67 871 72 ′
= 50 6 𝑎ñ𝑜𝑠
De 75 a 89 17 82 1394 89
De 90 a 104 11 97 1067 100
100 5058 𝑛𝑖+1
𝑀𝑜 = 𝐿𝑖−1 + ∗𝑐
50,58 𝑛𝑖 + 𝑛𝑖+1 𝑖
11
= 75 + ∗ 14 = 75 + 5′ 5
17 + 11

= 80 5 años 29
1.2. Medidas de tendencia no central
• CUANTILES: Valores de la variable –ordenada ésta de forma ascendente - que
dividen la muestra en varias partes iguales (con el mismo número de observaciones).

Cuantiles

Universidad Católica de Ávila


Cuartiles Quintiles Deciles Percentiles

30
Q Qu D P
1.2. Medidas de tendencia no central
Variable sin agrupar Variable agrupada en intervalos
• Ordenada la variable en orden ascendente, se obtiene • Ordenados los intervalos en orden ascendente, se
la columna de frecuencias absolutas acumuladas (𝑁𝑖 ) y obtiene la columna de frecuencias absolutas
𝑟∗𝑁
hallamos
𝑟∗𝑁
, donde r es el orden del cuantil que acumuladas (𝑁𝑖 ) y hallamos .
𝑞 𝑞
estamos interesados en calcular y q el número de • Si
𝑟∗𝑁
está en la columna de frecuencias absolutas
𝑞
partes iguales en que se divide la muestra con el tipo

Universidad Católica de Ávila


acumuladas, el valor del cuantil será el límite superior
de medida que estamos usando.
del intervalo que se correspondan con la frecuencia
𝑟∗𝑁
• Si está en la columna de frecuencias absolutas absoluta acumulada igual a
𝑟∗𝑁
.
𝑞 𝑞
acumuladas, el valor del cuantil será la media entre el 𝑟∗𝑁
valor de la variable que se corresponda con una • Si no se encuentra en el columna de frecuencias
𝑞
𝑟∗𝑁
frecuencia absoluta acumulada igual a y el valor absolutas acumuladas, el intervalo en el que se
𝑞
encuentra el valor del cuantil que buscamos será el
de la variable inmediatamente superior.
que tenga la frecuencia absoluta acumulada
𝑟∗𝑁
• Si no se encuentra en la columna de frecuencias inmediatamente superior a
𝑟∗𝑁
. Dentro de dicho
𝑞 𝑞
absolutas acumuladas, el valor del cuantil será el valor intervalo, el valor del cuantil será:
𝑥𝑖 de la variable con la frecuencia absoluta acumulada 𝑟∗𝑁
31
− 𝑁𝑖−1
inmediatamente superior a
𝑟∗𝑁
𝑞
. 𝐶𝑖 = 𝐿𝑖−1 +
𝑞
∗ 𝑐𝑖
𝑛𝑖
1.2. Medidas de tendencia no central

Q N.º Interpretación

Deja por debajo de sí

Universidad Católica de Ávila


el 25% de las
1
observaciones y el
75% por encima

Deja tanto por encima


como por debajo de sí
Cuartiles 2
el 50% de las
observaciones

Deja por debajo de sí


el 75% de las
3
observaciones y el 32
25% por encima
1.2. Medidas de tendencia no central

Quintiles (Qu) 1
Deja por debajo de sí el
20% de las observaciones y
el 80% por encima

Deja por debajo de sí el

Universidad Católica de Ávila


2 40% de las observaciones y
el 60% por encima

Deja por debajo de sí el


3 60% de las observaciones y
el 40% por encima

Deja por debajo de sí el


4 80% de las observaciones y
33
el 20% por encima
1.2. Medidas de tendencia no central

Deciles (D)

Universidad Católica de Ávila


1 2 3 4 5 6 7 8 9
Deja por Deja por Deja por Deja por Deja por Deja por Deja por Deja por
Deja tanto por
debajo de sí el debajo de sí el debajo de sí el debajo de sí el debajo de sí el debajo de sí el debajo de sí el debajo de sí el
encima como
10% de las 20% de las 30% de las 40% de las 60% de las 70% de las 80% de las 90% de las
por debajo el
observaciones observaciones observaciones observaciones observaciones observaciones observaciones observaciones
y el 90% por y el 80% por y el 70% por y el 60% por
50% de las
observaciones
y el 40% por y el 30% por y el 20% por y el 10% por 34
encima encima encima encima encima encima encima encima
1.2. Medidas de tendencia no central
Deja por debajo de sí
el 1% de las
1
observaciones y el
99% por encima

Deja por debajo de sí


el 2% de las

Universidad Católica de Ávila


2
observaciones y el
98% por encima
Percentiles (P)
Deja por debajo de sí
el x% de las
i
observaciones y el 100-
x% por encima

Deja por debajo de sí


el 995 de las
99 35
observaciones y el 1%
por encima
1.2. Medidas de tendencia no central
• Correspondencias entre cuantiles:

𝑄1 = 𝑃25

𝑄2 = 𝐷5 = 𝑃50 = 𝑀𝑒

Universidad Católica de Ávila


𝑄3 = 𝑃75

𝑄𝑢1 = 𝐷2 = 𝑃20

𝑄𝑢2 = 𝐷4 = 𝑃40

𝑄𝑢3 = 𝐷6 = 𝑃60 36

𝑄𝑢4 = 𝐷8 = 𝑃80
2. Medidas de dispersión
• Las medidas de dispersión nos permiten cuantificar la variabilidad presente en una
variable.
• Miden la dispersión de los valores que toma la variable respecto a una medida de
tendencia central.
• Sólo se pueden calcular para variables cuantitativas.

Universidad Católica de Ávila


➢Varianza
➢Desviación típica
➢Coeficiente de variación
➢Recorrido o rango
➢Recorrido intercuartílico 37
2. Medidas de dispersión
• Varianza: representa el promedio de las diferencias (elevadas al cuadrado) de cada
valor de la variable respecto a su media aritmética.
• Se mide en las unidades de la variable al cuadrado.

Universidad Católica de Ávila


σ 𝑁 2
2 𝑖=1 𝑥𝑖 − 𝑥ҧ ∗ 𝑛𝑖
𝑠 =
𝑁

σ 𝑁 2
2 𝑖=1 𝑖 ∗ 𝑛𝑖
𝑥
𝑠 = − 𝑥ҧ 2
𝑁

38
2. Medidas de dispersión
• Desviación típica: Es la raíz cuadrada positiva de la varianza.
• Se mide en las mismas unidades que la variable.
• Es la medida usada más comúnmente para identificar la dispersión de una variable.
• El inconveniente que presenta es que no permite hacer comparaciones entre variables

Universidad Católica de Ávila


en cuanto a su dispersión.

σ 𝑁 2 σ𝑁 2
2 𝑖=1 𝑥𝑖 − 𝑥ҧ ∗ 𝑛𝑖 𝑖=1 𝑖 ∗ 𝑛𝑖
𝑥
𝑠= + 𝑠 = + = + − 𝑥ҧ 2
𝑁 𝑁

39
2. Medidas de dispersión
• Coeficiente de variación de Pearson: nos permite comparar la dispersión entre
diferentes variables.
• Es adimensional
• Un coeficiente de variación menor, supone una menor dispersión (o una mayor

Universidad Católica de Ávila


homogeneidad), y por el contrario, un coeficiente de variación mayor, supone una
mayor dispersión (o menos homogeneidad).
• El mayor inconveniente de esta medida de dispersión es que no es posible hallarlo
cuando la media es igual a 0.

𝑠
𝐶𝑉 =
𝑥ҧ
40
2. Medidas de dispersión
• Recorrido o rango: Es la diferencia entre el valor máximo y el mínimo que toma la
variable.

𝑅𝐶 = 𝑀𝑎𝑥 − 𝑀𝑖𝑛

Universidad Católica de Ávila


• Recorrido intercuartílico: Es la diferencia entre el cuartil 3 y el cuartil 1.

𝑅𝐼 = 𝑄3 − 𝑄1

41
2. Medidas de dispersión
• Ejemplo 2: A partir de los datos siguientes sobre PIB per cápita en miles de € y tasa de
paro en % por comunidad autónoma para 2013, calcula a interpreta las medidas de
dispersión explicadas. CCAA PIB per cápita Tasa de paro
Andalucía 16,7 36,2
Aragón 24,7 21,4

Universidad Católica de Ávila


Asturias 20,6 24,1
Baleares 23,4 22,3
Canarias 18,9 33,7
Cantabria 21,6 20,4
Castilla y León 21,9 21,7
Castilla - La Mancha 17,9 30,0
Cataluña 26,7 23,1
Comunidad Valenciana 19,5 28,1
Extremadura 15,0 33,9
Galicia 20,4 22,0
Madrid 28,9 19,8
42
Murcia 17,9 29,0
Navarra 28,4 17,9
País Vasco 30,0 26,6
La Rioja 25,3 20,0
2. Medidas de dispersión
X = PIB per cápita
• Ejemplo 2:
CCAA PIB per cápita Tasa de paro Y = Tasa de paro
Andalucía 16,7 36,2
Aragón 24,7 21,4 σ𝑁
𝑖=! 𝑥𝑖 𝑛𝑖 377′ 8
Asturias 20,6 24,1 𝑥ҧ = = = 22′ 22 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 €
𝑁 17
Baleares 23,4 22,3

Universidad Católica de Ávila


Canarias 18,9 33,7 σ𝑁 430′ 2
𝑖=1 𝑦𝑖 𝑛𝑖
Cantabria 21,6 20,4 𝑦ത = = = 25′ 31 %
Castilla y León 21,9 21,7 𝑁 17
Castilla - La Mancha 17,9 30,0
Cataluña 26,7 23,1
Comunidad Valenciana 19,5 28,1
Extremadura 15,0 33,9
Galicia 20,4 22,0
Madrid 28,9 19,8
Murcia 17,9 29,0
Navarra 28,4 17,9 43
País Vasco 30,0 26,6
La Rioja 25,3 20,0
17 377,8 430,2
2. Medidas de dispersión
• Ejemplo 2: σ𝑁
𝑥 2
∗ 𝑛 8721 ′
3
2 𝑖=1 𝑖 𝑖 2
𝑠𝑥 = − 𝑥ҧ = − 493′ 88
CCAA PIB per cápita 𝑥𝑖2 𝑛𝑖 Tasa de paro 𝑦𝑖2 𝑛𝑖 𝑁 17

= 19 1 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 € 2
Andalucía 16,7 278,9 36,2 1310,4
Aragón 24,7 610,1 21,4 458,0
Asturias 20,6 424,4 24,1 580,8
Baleares 23,4 547,6 22,3 497,3 𝑠𝑥 = + 𝑠𝑥2 = + 19′ 1 = 4′ 4 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 €

Universidad Católica de Ávila


Canarias 18,9 357,2 33,7 1135,7
Cantabria 21,6 466,6 20,4 416,2 𝑠𝑥 4′ 4
Castilla y León 21,9 479,6 21,7 470,9 𝐶𝑉𝑥 = = ′ = 0′ 1968
Castilla - La Mancha
𝑥ҧ 22 22
17,9 320,4 30,0 900,0
Cataluña 26,7 712,9 23,1 533,6
Comunidad Valenciana 19,5 380,3 28,1 789,6 𝑅𝐶𝑥
Extremadura 15,0 225,0 33,9 1149,2 = max − min = 30′ 0 − 15′ 0 = 15 000 €
Galicia 20,4 416,2 22,0 484,0
Madrid 28,9 835,2 19,8 392,0 𝑟 ∗ 𝑁 1 ∗ 17
𝑄1𝑥 = = = 4′ 25 → 18′ 9
Murcia 17,9 320,4 29,0 841,0 𝑞 4
Navarra 28,4 806,6 17,9 320,4 𝑟 ∗ 𝑁 3 ∗ 17 44
País Vasco 30,0 900,0 26,6 707,6 𝑄3𝑥 = = = 12′ 75 → 25′ 3
𝑞 4
La Rioja 25,3 640,1 20,0 400,0 𝑅𝐼𝑥 = 𝑄3 − 𝑄1 = 25′ 3 − 18′ 9 = 6′ 4
17 377,8 8721,3 430,2 11386,7
2. Medidas de dispersión
• Ejemplo 2: CCAA PIB per cápita Ni
Extremadura 15,0 1
Andalucía 16,7 2
Castilla - La Mancha 17,9 3
Murcia 17,9 4
Canarias 18,9 5

Universidad Católica de Ávila


Comunidad Valenciana 19,5 6
Galicia 20,4 7
Asturias 20,6 8
Cantabria 21,6 9
Castilla y León 21,9 10
Baleares 23,4 11
Aragón 24,7 12
La Rioja 25,3 13
Cataluña 26,7 14
Navarra 28,4 15
Madrid 28,9 16 45
País Vasco 30,0 17
2. Medidas de dispersión
σ𝑁 2
𝑖=1 𝑦𝑖 ∗ 𝑛𝑖
• Ejemplo 2: 𝑠𝑦2
= − 𝑦ത 2
𝑁

11386 7
CCAA PIB per cápita 𝑥𝑖2 𝑛𝑖 Tasa de paro 𝑦𝑖2 𝑛𝑖 = − 640′ 38 = 29′ 42%2
Andalucía 16,7 278,9 36,2 1310,4 17
Aragón 24,7 610,1 21,4 458,0
Asturias 20,6 424,4 24,1 580,8 𝑠𝑦 = + 𝑠𝑦2 = + 29′ 42 = 5′ 42%
Baleares 23,4 547,6 22,3 497,3
𝑠𝑦 5′ 42

Universidad Católica de Ávila


Canarias 18,9 357,2 33,7 1135,7
𝐶𝑉𝑦 = = ′ = 0′ 2143
Cantabria 21,6 466,6 20,4 416,2 𝑦ത 25 3
Castilla y León 21,9 479,6 21,7 470,9
Castilla - La Mancha 17,9 320,4 30,0 900,0 𝑅𝐶𝑦
Cataluña 26,7 712,9 23,1 533,6 = max − min = 36′ 2 − 17′ 9 = 18′ 3%
Comunidad Valenciana 19,5 380,3 28,1 789,6
Extremadura 15,0 225,0 33,9 1149,2
𝑟 ∗ 𝑁 1 ∗ 17
Galicia 20,4 416,2 22,0 484,0 𝑄1𝑦 = = = 4′ 25 → 21′ 4
Madrid 28,9 835,2 19,8 392,0 𝑞 4
Murcia 17,9 320,4 29,0 841,0 𝑟 ∗ 𝑁 3 ∗ 17
𝑄3𝑦 = = = 12′ 75 → 29
Navarra 28,4 806,6 17,9 320,4 𝑞 4 46
País Vasco 30,0 900,0 26,6 707,6 𝑅𝐼𝑦 = 𝑄3 − 𝑄1 = 29 − 21′ 4 = 7′ 6
La Rioja 25,3 640,1 20,0 400,0
17 377,8 8721,3 430,2 11386,7
2. Medidas de dispersión
• Ejemplo 2: CCAA Tasa de paro Ni
Navarra 17,9 1
Madrid 19,8 2
La Rioja 20,0 3
Cantabria 20,4 4

Universidad Católica de Ávila


Aragón 21,4 5
Castilla y León 21,7 6
Galicia 22,0 7
Baleares 22,3 8
Cataluña 23,1 9
Asturias 24,1 10
País Vasco 26,6 11
Comunidad Valenciana 28,1 12
Murcia 29,0 13
Castilla - La Mancha 30,0 14
Canarias 33,7 15 47
Extremadura 33,9 16
Andalucía 36,2 17
2. Medidas de dispersión
• Ejercicio 7: Los siguientes datos hacen referencia a las edades de cierta clase de
universidad. Analiza todas las medidas de tendencia central y dispersión vistas hasta el
momento.

24 20 22 20 22 24 19 18 20 20

Universidad Católica de Ávila


20 18 20 19 18 18 19 22 22 18
23 22 19 21 22 20 21 22 21 24

48
Ejercicio 7
Edad 𝑛𝑖 𝑁𝑖 𝑥𝑖 ∗ 𝑛𝑖 𝑥𝑖2 ∗ 𝑛𝑖
18 5 5 90 1620 Medidas de tendencia central:
19 4 9 76 1444 σ𝑁𝑖=! 𝑥𝑖 ∗ 𝑛𝑖 618
𝑥ҧ = =
20 7 16 140 2800 𝑁 30
21 3 19 63 1323
= 20′ 6 𝑎ñ𝑜𝑠

Universidad Católica de Ávila


22 7 26 154 3388
Me ➔ 30/2 = 15 ➔ 20
Mo = 20 y 22
23 1 27 23 529
24 3 30 72 1728
30 618 12832

49
Medidas de dispersión:
𝑁 2
σ 𝑥 ∗ 𝑛𝑖
Ejercicio 7 2
𝑠 =
𝑖=1
𝑁
𝑖
− 𝑥ҧ 2
12832
Edad 𝑛𝑖 𝑁𝑖 𝑥𝑖 ∗ 𝑛𝑖 𝑥𝑖2 ∗ 𝑛𝑖 = − 20′ 62 = 3′ 37
30
18 5 5 90 1620 𝑠 = + 𝑠 2 = + 3′ 37
19 4 9 76 1444 = 1′ 84
20 7 16 140 2800 𝑠 1′ 84
21 3 19 63 1323 𝐶𝑉 = = ′ = 0′ 089
𝑥ҧ 20 6
22 7 26 154 3388

Universidad Católica de Ávila


𝑅𝐶 = 𝑀𝑎𝑥 − 𝑀𝑖𝑛
23 1 27 23 529
= 24 − 18 = 6
24 3 30 72 1728 𝑟 ∗ 𝑁 1 ∗ 30
30 618 12832 𝑄1 = = = 7′ 5
𝑞 4
→ 19
𝑟 ∗ 𝑁 3 ∗ 30
𝑄3 = =
𝑞 4
= 22′ 5 → 22 50
𝑅𝐼 = 𝑄3 − 𝑄1 = 22 − 19
=3
3. Medidas de forma
Nos permiten
caracterizar
Medidas de numéricamente la
forma “silueta” de la
distribución de una
variable

Universidad Católica de Ávila


Momentos

Coeficiente Coeficiente
51
de Asimetría de curtosis
3.1. Momentos
• Definimos el momento de orden “r” respecto al parámetro “c” como:
σ𝑁𝑖=1 𝑥𝑖 − 𝑐
𝑟
∗ 𝑛𝑖
𝑀𝑟 𝑐 =
𝑁

Universidad Católica de Ávila


• Si damos a “r” el valor 1 y a “c” el valor 0, la expresión que obtenemos es equivalente a
la media aritmética:
σ𝑁 1
𝑖=1 𝑥𝑖 − 0 ∗ 𝑛𝑖 σ𝑁𝑖=1 𝑥𝑖 ∗ 𝑛𝑖
𝑀1 0 = = = 𝑥ҧ
𝑁 𝑁
• Si damos a “r” el valor 2 y a “c” el valor 𝑥,ҧ la expresión que obtenemos es equivalente a
la varianza:
σ𝑁𝑖=1 𝑥𝑖 − 𝑥ҧ
2∗𝑛
𝑖
𝑀2 𝑥ҧ = = 𝑠2
𝑁 52
3.1. Momentos
• Algunos momentos que usaremos:

σ𝑁
𝑖=1 𝑥𝑖 − 𝑥ҧ
3 ∗ 𝑛𝑖
𝑀3 𝑥ҧ =
𝑁

Universidad Católica de Ávila


σ𝑁
𝑖=1 𝑥𝑖 − 𝑥ҧ
4 ∗ 𝑛𝑖
𝑀4 𝑥ҧ =
𝑁

53
3.2. Asimetría
• La asimetría de una variable hace referencia a la forma que toma la distribución a
ambos lados de la media.
• Coeficiente de asimetría de Pearson:
𝑥ҧ − 𝑀𝑜
𝐴𝑝 =

Universidad Católica de Ávila


𝑠
• Puede ser mayor, igual o menos que cero.
• Si 𝐴𝑝 > 0 diremos que la distribución de la variable presente asimetría a la derecha o
positiva
• Si 𝐴𝑝 = 0 diremos que la distribución de la variable es simétrica, como la distribución
normal o gaussiana
• Si 𝐴𝑝 < 0 diremos que la distribución de la variable presenta asimetría a la izquierda
o negativa 54
3.2. Asimetría
• Coeficiente de asimetría de Fisher:
𝑀3 𝑥ҧ
𝐴𝐹 =
𝑠3

Universidad Católica de Ávila


• Puede ser mayor, igual o menos que cero, al igual que el coeficiente de asimetría de
Pearson y la interpretación será la misma
• Si 𝐴𝐹 > 0 diremos que la distribución de la variable presenta asimetría a la derecha o
positiva
• Si 𝐴𝐹 = 0 diremos que la distribución de la variable es simétrica, como la distribución
normal o gaussiana
• Si 𝐴𝐹 < 0 diremos que la distribución de la variable presenta asimetría a la izquierda o
negativa 55
3.2. Asimetría
• Coeficiente de asimetría

Universidad Católica de Ávila


56
3.2. Asimetría

Universidad Católica de Ávila


57
3.3. Apuntamiento o curtosis
• Hace referencia a lo concentrados que están los valores de la variable en torno a la
media.
• Coeficiente de apuntamiento o curtosis:
𝑀4 𝑥ҧ
𝛾=

Universidad Católica de Ávila


𝑠4
• Puede ser mayor, igual o menos que 3, la interpretación será:
• Si 𝛾 > 3 diremos que la distribución de la variable es leptocúrtica o con mayor
apuntamiento que la distribución normal o gaussiana
• Si 𝛾 = 3 diremos que la distribución de la variable es mesocúrtica, como la
distribución normal o gaussiana
• Si 𝛾 < 3 diremos que la distribución de la variable es platicúrtica o con menor
apuntamiento que la distribución normal o gaussiana 58
3.3. Apuntamiento o curtosis

Universidad Católica de Ávila


59
3.3. Apuntamiento o curtosis

Universidad Católica de Ávila


60
3. Medidas de forma
• Ejercicio 8: Los siguientes datos hacen referencia a las horas que dedican un grupo de
alumnos a la asignatura de Estadística a la semana: 6, 9, 12, 12, 12, 15, 17. Calcula las
medidas de forma estudiadas a estos datos.

Universidad Católica de Ávila


61
3. Medidas de forma
• Ejercicio 8: Los siguientes datos hacen referencia a las horas que dedican un grupo de alumnos a la asignatura de
Estadística a la semana: 6, 9, 9, 12, 12, 12, 15, 17. Calcula las medidas de forma estudiadas a estos datos.

Horas 𝑛𝑖 𝑁𝑖 𝑥𝑖 ∗ 𝑛𝑖 𝑥𝑖 − 𝑥ҧ (𝑥𝑖 − 𝑥)ҧ 2 (𝑥𝑖 −𝑥)ҧ 2 ∗ 𝑛𝑖 (𝑥𝑖 − 𝑥)ҧ 3 (𝑥𝑖 −𝑥)ҧ 3 ∗ 𝑛𝑖 (𝑥𝑖 − 𝑥)ҧ 4 (𝑥𝑖 −𝑥)ҧ 4 ∗ 𝑛𝑖

Universidad Católica de Ávila


6 1 1 6 -5,5 30,25 30,25 -166,375 -166,375 915,0625 915,0625
9 2 3 18 -2,5 6,25 12,5 -15,625 -31,25 39,0625 78,125
12 3 6 36 0,5 0,25 0,75 0,125 0,375 0,0625 0,1875
15 1 7 15 3,5 12,25 12,25 42,875 42,875 150,0625 150,0625
17 1 8 17 5,5 30,25 30,25 166,375 166,375 915,0625 915,0625
8 92 86 12 2058,5
62
3. Medidas de forma
• Ejercicio 8: Los siguientes datos hacen referencia a las horas que dedican un grupo de alumnos a la asignatura de
Estadística a la semana: 6, 9, 9, 12, 12, 12, 15, 17. Calcula las medidas de forma estudiadas a estos datos.
σ𝑁
𝑖=1 𝑥𝑖 ∗𝑛𝑖 92
• 𝑥ҧ = = = 11′ 5
𝑁 8
• 𝑀𝑜 = 12

Universidad Católica de Ávila


σ𝑁 2
𝑖=1 𝑥𝑖 −𝑥ҧ ∗𝑛𝑖 86 Horas de estudio
• 𝑠= = = 10′ 75 = 3′ 2787 3,5
𝑁 8
3

2,5

σ𝑁 3
𝑖=1 𝑥𝑖 −𝑥ҧ ∗𝑛𝑖 12 2

• 𝑀3 𝑥ҧ = = = 1′ 5 1,5
𝑁 8
1
σ𝑁 4
𝑖=1 𝑥𝑖 −𝑥ҧ ∗𝑛𝑖 2058′ 5 63
• 𝑀4 𝑥ҧ = = = 257′ 3125 0,5
𝑁 8 0
6 9 12 15 17
3. Medidas de forma
• Ejercicio 8: Los siguientes datos hacen referencia a las horas que dedican un grupo de alumnos a la asignatura de
Estadística a la semana: 6, 9, 9, 12, 12, 12, 15, 17. Calcula las medidas de forma estudiadas a estos datos.
• Coeficiente de asimetría:
𝑥ҧ −𝑀𝑜 11′ 5 −12
• 𝐴𝑝 = = = −0′ 1524 → 𝐴𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 𝑎 𝑙𝑎 𝑖𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑎 𝑜 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎
𝑠 3′ 2787

Universidad Católica de Ávila


𝑀3 𝑥ҧ 1′ 5
• 𝐴𝐹 = = = 0′ 0425 → 𝐴𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 𝑎 𝑙𝑎 𝑑𝑒𝑟𝑒𝑐ℎ𝑎 𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎
𝑠3 3′ 27873

• Coeficiente de apuntamiento o curtosis:


𝑀4 𝑥ҧ 257′ 3125
• 𝛾= = = 2′ 2266 → 𝑃𝑙𝑎𝑡𝑖𝑐ú𝑟𝑡𝑖𝑐𝑎
𝑠4 3′ 27874

64
4. Diagrama de caja
• El diagrama de caja es una representación gráfica realizada a partir de los valores que
toma una variable, que nos permite estudiar la simetría de la distribución, dispersión y
la existencia de datos atípicos.
• También se denomina box plot.
• Para su construcción se usan 5 medias descriptivas del conjunto de datos a representar:

Universidad Católica de Ávila


mediana, primer cuartil, tercer cuartil, valor máximo y valor mínimo.
• Sólo es útil para variables cuantitativas.

65
4. Diagrama de caja
• La línea central en la
caja es la mediana, sus
extremos son el primer
y tercer cuartil. Los
extremos de los

Universidad Católica de Ávila


“bigotes” que salen de
la caja son los valores
que delimitan el 95%
central de los datos,
aunque en ocasiones
coinciden con los
valores extremos de la
distribución 66
4. Diagrama de caja
Los datos atípicos se representan por
encima de los “bigotes” del diagrama
de caja.

Universidad Católica de Ávila


67
4. Diagrama de caja
• Relación entre el diagrama de caja y la asimetría de la distribución:

Universidad Católica de Ávila


68
4. Diagrama de caja
• Ejercicio 9: Representa el diagrama de caja a partir de los datos del ejercicio 8. Los
siguientes datos hacen referencia a las horas que dedican un grupo de alumnos a la
asignatura de Estadística a la semana: 6, 9, 9, 12, 12, 12, 15, 17.

Universidad Católica de Ávila


69
4. Diagrama de caja
• Ejercicio 9: Representa el diagrama de caja a partir de los datos del ejercicio 8. Los siguientes datos hacen
referencia a las horas que dedican un grupo de alumnos a la asignatura de Estadística a la semana: 6, 9, 9,
12, 12, 12, 15, 17. Calcula las medidas de forma estudiadas a estos datos.

• Media: 11’5

Universidad Católica de Ávila


• Mediana: 12
• Cuartil 1: 9
• Cuartil 3: 13’5
• Máximo: 17
• Mínimo: 6

70
Ejercicio 10
• Los siguientes datos hacen referencia al número de bolígrafos que utiliza un grupo de
alumnos universitarios durante un cuatrimestre. Estudia todas las medidas de
centralización, dispersión y forma vistas a lo largo del tema. Realiza un diagrama de
barras y uno de caja.

Universidad Católica de Ávila


5 10 6 9 8 4 1 10 7 6
8 4 2 8 10 6 4 1 6 4
8 7 2 8 0 6 6 2 2 5

71
Ejercicio 10
Bolígrafos 𝑛𝑖 𝑁𝑖 𝑥𝑖 ∗ 𝑛𝑖 𝑥𝑖 − 𝑥ҧ (𝑥𝑖 − 𝑥)ҧ 2 (𝑥𝑖 −𝑥)ҧ 2 ∗ 𝑛𝑖 (𝑥𝑖 − 𝑥)ҧ 3 (𝑥𝑖 −𝑥)ҧ 3 ∗ 𝑛𝑖 (𝑥𝑖 − 𝑥)ҧ 4 (𝑥𝑖 −𝑥)ҧ 4 ∗ 𝑛𝑖
0 1 1 0 -5,5 30,25 30,25 -166,375 -166,375 915,0625 915,0625
1 2 3 2 -4,5 20,25 40,5 -91,125 -182,25 410,0625 820,125
2 4 7 8 -3,5 12,25 49 -42,875 -171,5 150,0625 600,25
3 0 7 0 -2,5 6,25 0 -15,625 0 39,0625 0

Universidad Católica de Ávila


4 4 11 16 -1,5 2,25 9 -3,375 -13,5 5,0625 20,25
5 2 13 10 -0,5 0,25 0,5 -0,125 -0,25 0,0625 0,125
6 6 19 36 0,5 0,25 1,5 0,125 0,75 0,0625 0,375
7 2 21 14 1,5 2,25 4,5 3,375 6,75 5,0625 10,125
8 5 26 40 2,5 6,25 31,25 15,625 78,125 39,0625 195,3125
9 1 27 9 3,5 12,25 12,25 42,875 42,875 150,0625 150,0625
10 3 30 30 4,5 20,25 60,75 91,125 273,375 410,0625 1230,1875
30 165 239,5 -132 3941,875
72
Ejercicio 10
Media 5,5
Mediana 6
Moda 6
Cuartil 1 4
Cuartil 2 6
Cuartil 3 8
Máximo 10

Universidad Católica de Ávila


Mínimo 0
Varianza 7,9833
Desviación típica 2,8255
Coeficiente de variación 0,5137
Recorrido 10
Recorrido intercuartílico 4
Momento 3 -4,4
Momento 4 131,3958
Asimetría Pearson -0,1770 Izquierda 73
Asimetría Fisher -0,1951 Negativa
Curtosis 2,0616 Platicúrtica
Ejercicio 10
Bolígrados usados al cuatrimestre
7

Universidad Católica de Ávila


5

74
0
0 1 2 3 4 5 6 7 8 9 10
Ejercicio 10

Universidad Católica de Ávila


75
5. Medidas de concentración
• Índice de Gini:
• Es una medida de concentración utilizada principalmente para estudiar la
concentración de rentas.

Universidad Católica de Ávila


• Vamos a considerar la variable 𝑥𝑖 como las rentas de los individuos, y las ordenamos de
manera creciente de rentas.
• Construimos una variable 𝑢𝑖 que será el producto de la renta por la frecuencia
absoluta, es decir, 𝑢𝑖 = σ𝑖𝑗=1 𝑥𝑗 𝑛𝑗 , y representa la renta total percibida por los primeros
rentitas.
𝑁𝑖
• Calculamos una nueva variable que será: 𝑝𝑖 = ∗ 100
𝑁
𝑢𝑖 76
• Calculamos otra variable que será: 𝑞𝑖 = ∗ 100
𝑢𝑟
5. Medidas de concentración
• Índice de Gini:
𝑖
𝑢𝑖 𝑁𝑖
𝒙𝒊 𝒏𝒊 𝒙𝒊 𝒏𝒊 𝑵𝒊 𝑢𝑖 = ෍ 𝑥𝑗 𝑛𝑗 𝑞𝑖 = ∗ 100 𝑝𝑖 = ∗ 100
𝑢𝑟 𝑁
𝑗=1
𝑢1 𝑁1
𝑥1 𝑛1 𝑥1 𝑛1 𝑁1 𝑢1 = 𝑥1 𝑛1 𝑞1 = ∗ 100 𝑝1 = ∗ 100
𝑢𝑟 𝑁
𝑢2 𝑁2
𝑥2 𝑛2 𝑥2 𝑛2 𝑁2 𝑢2 = 𝑥1 𝑛1 + 𝑥2 𝑛2 𝑞2 = ∗ 100

Universidad Católica de Ávila


𝑢𝑟 𝑝2 = ∗ 100
𝑁
𝑢3 𝑁3
𝑥3 𝑛3 𝑥3 𝑛3 𝑁3 𝑢3 = 𝑥1 𝑛1 + 𝑥2 𝑛2 + 𝑥3 𝑛3 𝑞3 = ∗ 100 𝑝3 = ∗ 100
𝑢𝑟 𝑁
⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯
𝑖
𝑢𝑖 𝑁𝑖
𝑥𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖 𝑁𝑖 𝑢𝑖 = ෍ 𝑥𝑗 𝑛𝑗 𝑞𝑖 = ∗ 100 𝑝𝑖 = ∗ 100
𝑢𝑟 𝑁
𝑗=1

⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯
𝑟 77
𝑥𝑟 𝑛𝑟 𝑥𝑟 𝑛𝑟 N 𝑢𝑟 = ෍ 𝑥𝑗 𝑛𝑗 100 100
𝑗=1
5. Medidas de concentración
• Índice de Gini:
σ𝑟−1
𝑖=1 𝑝𝑖 − 𝑞𝑖
𝐼𝐺 =
σ𝑟−1
𝑖=1 𝑝𝑖

Universidad Católica de Ávila


• Si 𝐼𝐺 = 0 tendremos mínima concentración, es decir, la renta está repartida por igual
entre los N individuos, la renta está equidistribuida
• Si 𝐼𝐺 = 1 tendremos máxima concentración, es decir, sólo el último individuo percibe
toda la renta

• La columna 𝑥𝑖 𝑛𝑖 nos da el reparto del total de recursos entre los distintos elementos de
la distribución dados por las frecuencias absolutas.
78
• La columna 𝑢𝑖 nos da la evolución acumulada de recursos
• La columna 𝑁𝑖 nos da la evolución de individuos que se los reparten
5. Medidas de concentración
• Curva de Lorenz:

El Índice de Gini es el
área sombreada del entre
la diagonal y la Curva de

Universidad Católica de Ávila


Lorenz dividida por el
área del triangulo de
vértices (inferior a la
derecha) [(0,0), (100,0) y
(100, 100)]

79
5. Medidas de concentración
• Ejemplo 3: En una empresa existen cuatro categorías profesionales y cada una tiene unos
niveles de ingresos mensuales diferentes. Calcula el índice de Gini y la curva de Lorenz.

Nivel de ingresos Personas

Universidad Católica de Ávila


1000 25
2000 10
3000 4
4000 1

80
5. Medidas de concentración
• Ejemplo 3:
Nivel de
Personas x*n N p u q
ingresos
1000 25 25000 25 62,5 25000 40,9836

Universidad Católica de Ávila


2000 10 20000 35 87,5 45000 73,7705

3000 4 12000 39 97,5 57000 93,4426

4000 1 4000 40 100 61000 100

40 61000

81
5. Medidas de concentración
• Ejemplo 3:

σ𝑟−1
𝑖=1 𝑝𝑖 − 𝑞𝑖 62′ 5 − 40′ 9836 + 87′ 5 − 73′ 7705 + 97′ 5 − 93′ 4426
𝐼𝐺 = 𝑟−1 =
σ𝑖=1 𝑝𝑖 62′ 5 + 87′ 5 + 97′ 5
21′ 5164 + 13′ 7295 + 4′ 0574 39′ 3033

Universidad Católica de Ávila


′ 1588
= = = 0
247′ 5 247′ 5

• Como toma un valor próximo a cero se puede concluir que existe una buena
equidistribución de los ingresos.

82
5. Medidas de concentración
• Ejemplo 3: Curva de Lorenz

Universidad Católica de Ávila


83

También podría gustarte