Está en la página 1de 77

TEMA 1: ESTADÍSTICA DESCRIPTIVA

1.1 NÚMEROS ÍNDICE SIMPLES Y COMPLEJOS. PROPIEDADES.


IPC.

1.2 DISTRIBUCIONES DE FRECUENCIAS

1.3 REPRESENTACIONES GRÁFICAS

1.4 MEDIDAS DE POSICIÓN, DISPERSIÓN Y FORMA

1.4.1 Medidas de posición de tendencia central


1.4.2 Medidas de posición no centrales: los cuantiles
1.4.3 Medidas de dispersión
1.4.4 Medidas de forma
Medidas de asimetría
Medidas de apuntamiento o curtosis.

1
1.1: NÚMEROS ÍNDICES SIMPLES Y
COMPLEJOS. PROPIEDADES. IPC.

1.1.1 Introducción
1.1.2 Números Índices Simples
1.1.3 Números Índices Complejos
1.1.4 Números Índices Ponderados
1.1.5 Índices de Precios
1.1.6 Renovación, enlace y cambio de periodo Base en
los Números Índices.
1.1.7 Deflactación de Series económicas
1.1.8 IPC: INDICE DE PRECIOS DE CONSUMO

2
1.1.1 INTRODUCCIÓN

Un número índice es un valor expresado como porcentaje de una cifra


que se toma como base.
Puede referirse tanto a precios como a cantidades. Se clasifican en
ponderados y sin ponderar.

Vamos a utilizar la siguiente notación para denotar un índice:


𝑰𝒕𝒕𝟎

dónde el subíndice indica el periodo base y el superíndice el periodo


actual.

Ejemplo:

𝟐𝟎𝟎𝟔 : Índice del año 2011 tomando como periodo base el año 2006.
𝑰𝟐𝟎𝟏𝟏

3
PROPIEDADES
 Existencia: tienen un valor finito distinto de cero. 0 ≠ 𝐼𝑡𝑡 < ∞
0

 Identidad: si hacemos coincidir el periodo base y el actual, el valor


del índice es 100. 𝐼𝑡00 = 100.
𝑡

 Inversión: el valor del índice varía al invertir los periodos entre sí


1
de la siguiente forma: 𝐼𝑡0 = 𝐼𝑡 ⋅ 1002 .
0

 Proporcionalidad: si en el periodo actual todas las magnitudes


presentan una variación proporcional, el índice también se verá
afectado en la misma proporción.
 Homogeneidad: No le afectan los cambios realizados en las unidades
de medida.

4
VIDEOS EXPLICATIVOS:

 Web del INSTITUTO NACIONAL DE ESTADÍSTICA


(http://www.ine.es/explica/explica_pasos_pildoras.htm)

 Video sobre Números Índice


(https://www.youtube.com/watch?v=v9VR7ud21ts&list=PLJulBV7cVXidU_cleHYJ9jNjfrByO9xqi )

5
1.1.2 Números Índices Simples

Sea 𝑋𝑖 una magnitud simple, y sean


 𝑥𝑖0 el valor de dicha magnitud en el periodo base (0),
 𝑥𝑖𝑡 el valor de dicha magnitud en el periodo actual (t).
Entonces, el índice simple que nos mide la variación en % que ha
sufrido dicha magnitud entre los periodos considerados puede
calcularse como:

𝑥𝑖𝑡
𝐼0𝑡 𝑖 = ⋅ 100
𝑥𝑖0

6
Hay tres tipos de números índices muy importantes:
 Índice de Precios Simple: (relación de precios)
𝑝𝑛
𝐼𝑝 = ⋅ 100
𝑝0
 Índice de Cantidad Simple: (relación de cantidades)
𝑞𝑛
𝐼𝑝 = ⋅ 100
𝑞0
 Índice de Valor Simple: (relación de valor)
𝑝𝑛 𝑞𝑛
𝐼𝑝 = ⋅ 100
𝑝0 𝑞0
dónde 𝑝𝑗 y 𝑞𝑗 denotan los precios y las cantidades del producto en el
periodo 𝑗.

Una vez calculados los números índices para un solo bien, dinero,
cantidad o valor; el siguiente paso es calcular índices compuestos.
Los índices compuestos se forman a partir de varios bienes.

7
Ejemplo 1. (Hoja de prácticas)

Un artesano de la piel se dedica a la confección y venta de sillas de montar, habiendo


vendido en los últimos años:

Año 2005 2006 2007 2008 2009 2010 2011


Sillas 18 20 15 23 25 18 30
Utilizando Excel hallar los índices simples de ventas tomando como base el año 2005.

Solución:

05
18 06
20 07
15 08
23
𝐼05 = ⋅ 100 = 100 𝐼05 = ⋅ 100 = 111.11 𝐼05 = ⋅ 100 = 83.33 𝐼05 = ⋅ 100 = 127.78
18 18 18 18
09
25 10
18 11
30
𝐼05 = ⋅ 100 = 138.89 𝐼05 = ⋅ 100 = 100 𝐼05 = ⋅ 100 = 166.67
18 18 18

Año 2005 2006 2007 2008 2009 2010 2011


Sillas 100 111.11 83.33 127.78 138.89 100 166.67

8
1.1.3 Números Índices Complejos / Compuestos

Los índices compuestos no será otra cosa que la agregación de los distintos
índices simples elaborados para cada bien por separado.

Sin embargo, en otras ocasiones, lo que se agregan no son índices, sino las
propias magnitudes (precios o cantidades) observadas.

 Índice media aritmética:


𝐼1 + 𝐼2 + ⋯ + 𝐼𝑛 σ𝑛𝑖=1 𝐼𝑖
𝐼= =
𝑛 𝑛
 Índice media geométrica:
𝑛
𝑛
𝑛
𝐼= 𝐼1 ⋅ 𝐼2 ⋅ ⋯ ⋅ 𝐼𝑛 = ෑ 𝐼𝑖
𝑖=1

 Índice media armónica:


𝑛 𝑛
𝐼= =
1 1 1 1
+ + ⋯+ σ𝑛𝑖=1
𝐼1 𝐼2 𝐼𝑛 𝐼𝑖
 Índice media agregativa:
𝑥1𝑡 + 𝑥2𝑡 + ⋯ + 𝑥𝑛𝑡 σ𝑛𝑖=1 𝑥𝑖𝑡
𝐼= =
𝑥10 + 𝑥20 + ⋯ + 𝑥𝑛0 σ𝑛𝑖=1 𝑥𝑖0

9
1.1.4 Números Índices Ponderados

La necesidad de ponderar los índices viene de calcular índices que engloben a más
de un bien y que estén medidos en escalas diferentes.
Una ponderación representa un valor de referencia para cada producto que
determina su importancia relativa en el índice total.
 Índice media aritmética ponderada:
𝑤1 𝐼1 + 𝑤2 𝐼2 + ⋯ + 𝑤𝑛 𝐼𝑛 σ𝑛𝑖=1 𝑤𝑖 𝐼𝑖
𝐼= = 𝑛
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛 σ𝑖=1 𝑤𝑖

 Índice media geométrica ponderada:


σ𝑛 𝑛
σ𝑛 𝑖=1 𝑤𝑖
𝑖=1 𝑤𝑖 𝑤 𝑤 𝑤 𝑤𝑖
𝐼= 𝐼1 1 ⋅ 𝐼2 2 ⋅ ⋯ ⋅ 𝐼𝑛 𝑛 = ෑ 𝐼𝑖
𝑖=1

 Índice media armónica ponderada:


𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛 σ𝑛𝑖=1 𝑤𝑖
𝐼= =
1 1 1 1
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛 σ𝑛𝑖=1 𝑤𝑛
𝐼1 𝐼2 𝐼𝑛 𝐼𝑖
 Índice media agregativa ponderada:
𝑥1𝑡 𝑤1 + 𝑥2𝑡 𝑤2 + ⋯ + 𝑥𝑛𝑡 𝑤𝑛 σ𝑛𝑖=1 𝑥𝑖𝑡 𝑤𝑖
𝐼= =
𝑥10 𝑤1 + 𝑥20 𝑤2 + ⋯ + 𝑥𝑛0 𝑤𝑛 σ𝑛𝑖=1 𝑥𝑖0 𝑤𝑖
10
Ejemplo 2
1. El IPC en los meses del año 1980 ( base 1978) ha sido:
El
MesIPCEn
(Índice de Precios
Feb Mar deAbConsumo)
May enJun
los meses
Jul Agdel añoSep
1980 Oct
(base Nov
1978) Dic
ha sido:
IPC 105’3 104’9 105’7 106’3 105’6 106 108 109’7 109’7 111’3 111’6 111’9
Mes En. Feb. Mar. Abr. May. Jun. Jul. Ago. Sep. Oct. Nov. Dic.
IPC 105’3 104’9 105’7 106’3 105’6 106 108 109’7 109’7 111’3 111’6 111’9
Calcular media aritmética, geométrica y armónica.
Calcular los Índices Media Aritmética, Geométrica y Armónica.

105 ' 3  104 ' 9  105 ' 7  106 ' 3  105 ' 6  106  108  109 ' 7  109 ' 7  111' 3  111' 6  111' 9
Ia  
12
 108 ' 04

I G  12 105 '3  104 '9  105 ' 7  106 '3  105 ' 6  106  108  109 ' 7  109 ' 7  111'3  111' 6  111'9 
 107 '97
12
IH 
1 1 1 1 1 1 1 1 1
        
105 '3 104 '9 105 ' 7 106 '3 105 ' 6 106 108 109 ' 7 109 ' 7
12
 107 '979
4
1 1 1
  
111'3 111' 6 111'9

(Ejercicio hecho en Excel) 11


¿Cuándo usar la media Geométrica?

La media Geométrica se utiliza frecuentemente para promediar porcentajes,


índices, tasas de variación, etc.
La razón es que no es tan sensible a datos extremos como la media aritmética.

Ejemplo. El precio de una vivienda crece un año un 5%, al siguiente baja un 10% y
al tercer año vuelve a subir un 15%. ¿Cuánto ha crecido de media cada año?

Solución: Si le realizamos la media aritmética de esos valores obtenemos 1.033, con lo cual
saldría un crecimiento medio de 3.3%, pero esto no es cierto. Veamos por qué:

Si inicialmente valía, por ejemplo, 1000€, al cabo del primer año valdrá 1000 ⋅ (1 + 0.05) =
1050€, al cabo del segundo año valdrá 1000 ⋅ 1 + 0.05 ⋅ (1 − 0.1) = 945€ y al cabo del tercero,
1000 ⋅ (1 + 0.05) ⋅ (1 − 0.1) ⋅ (1 + 0.15) = 1000 ⋅ 1.08675 = 1086.75€

Si queremos buscar un crecimiento medio 𝐹, el objetivo es buscar un factor de crecimiento


que pase del primer valor al último de manera constante: 1000 ⋅ 𝐹 ⋅ 𝐹 ⋅ 𝐹. Entonces,

𝐹 ⋅ 𝐹 ⋅ 𝐹 = 𝐹 3 = (1 + 0.05) ⋅ (1 − 0.1) ⋅ (1 + 0.15) = 1.08675

Es decir, que 𝐹 es la media geométrica de los valores (1 + 0.05), (1 − 0.1) y (1 + 0.15).

De lo que resulta 𝐹 = 1.08675 = 1.028, de manera que la tasa media de crecimiento del valor
3

de la casa durante esos tres años es el 2.8%.

12
1.1.5 Índices de Precios
Se calculan utilizando índices complejos ponderados. Los más utilizados
son los índices de Laspeyres, Paasche y Fisher.

En España son índices de tipo Laspeyres: IPC, Índice de Precios


Industriales (IPI), Índice de Precios Agrícolas (IPA), Índice de Precios
Hoteleros (IPH).

A partir de ahora utilizaremos la siguiente notación:


 𝑝𝑖0 : precio del bien 𝑖 en el año base (0)
 𝑝𝑖𝑡 : precio del bien 𝑖 en el año en curso (𝑡)
 𝑞𝑖0 : cantidad del bien 𝑖 en el año base (0)
 𝑞𝑖𝑡 : cantidad del bien 𝑖 en el año en curso (𝑡)

13
Índice de Laspeyres del periodo 𝑡 con periodo base 0

𝑛
σ𝑖=1 𝑝𝑖𝑡 𝑞𝑖0
𝐿𝑡0 = 𝑛 ⋅ 100
σ𝑖=1 𝑝𝑖0 𝑞𝑖0

Se suma en 𝑖, es decir, en cada uno de los bienes.

Interpretación: Cociente entre el valor actual con cantidades del


periodo base y valor en el periodo base.

14
Índice de Paasche del periodo 𝑡 con periodo base 0

𝑛
σ𝑖=1 𝑝𝑖𝑡 𝑞𝑖𝑡
𝑃0𝑡 = 𝑛 ⋅ 100
σ𝑖=1 𝑝𝑖0 𝑞𝑖𝑡

Se suma en 𝑖, es decir, en cada uno de los bienes.

Interpretación: Cociente entre el valor actual y el valor en el


periodo base con cantidades del periodo actual.

Índice de Fisher del periodo 𝑡 con periodo base 0

𝐹0𝑡 = 𝐿𝑡0 ⋅ 𝑃0𝑡

15
Ejemplo 3
1. Consideramos los tres productos, con sus precios y cantidades:
Producto pio qio pit qit
X1 10 3 14 5
X2 12 7 13 6
X3 8 12 16 10

Calcular los índices de precios.

Producto pioqio pitqio pioqit pitqit


X1 30 42 50 70
X2 84 91 72 78
X3 96 192 80 160
SUMA ? 210 325 202 308

σ𝑛𝑖=1 𝑝𝑖𝑡 𝑞𝑖0 325


𝐿𝑡0= 𝑛 ⋅ 100 = ⋅ 100 = 154.8
σ𝑖=1 𝑝𝑖0 𝑞𝑖0 210
𝑡
σ𝑛𝑖=1 𝑝𝑖𝑡 𝑞𝑖𝑡 308
𝑃0 = 𝑛 ⋅ 100 = ⋅ 100 = 152.5
σ𝑖=1 𝑝𝑖0 𝑞𝑖𝑡 202
𝐹0𝑡 = 𝐿𝑡0 𝑃0𝑡 = 154.8 ⋅ 152.5 = 153.6
16
 Uno de los problemas fundamentales al calcular un número índice es
seleccionar los bienes o variables que vamos a utilizar para calcular
ese índice.

 Otro punto importante es fijar un periodo base “normal”, que no


presente anomalías que pueda trasladar a todos los valores del
índice.

 Con posterioridad pueden surgir otros problemas como la


actualización del índice.

Ejemplo para el cálculo del índice de Laspeyres utilizamos la cantidad en el


periodo base. Pero transcurrido un plazo largo de tiempo puede ocurrir que
esa cantidad del periodo base quede obsoleta y necesitemos actualizar la
base del índice.

Rehacer todos los cálculos sería muy tedioso. Por eso necesitamos
una herramienta que nos permite cambiar de base de forma sencilla.

17
3.6 RENOVACIÓN, ENLACE Y CAMBIO DE PERIODO
1.1.6 Renovación, enlace y cambio de período base en los
BASE EN
Números LOS NÚMEROS INDICES.
Índices
A medida que los datos se alejan del periodo base pierden representatividad,
con el fin de actualizarlos se realiza el cambio de base ( pasar de tener por
ejemplo 1996 como año base a 2000). Para que los datos obtenidos con esas
series con distinta base se puedan comparar, hay que realizar un enlace de
índices.
Este enlace se basa en la propiedad de la inversión de los números índices
I 00
I I 
t
h
t
0
I 0h
I 00
En España, se denomina coeficiente legal de enlace a Este dato es publicado
I 0h
por el INE.

Se verifica la siguiente propiedad:


I tt 02
I 
t2
t1  100 Los índices de Laspeyres, Paasche
I tt10
y Fisher no cumplen esta propiedad

18
Ejemplo 4.

Con los datos del Ejemplo 1 realizar un cambio de base de 2005 a 2009.

Año 2005 2006 2007 2008 2009 2010 2011


Sillas 72 80 60 92 100 72 120

19
Ejemplo 5.
En la siguiente tabla disponemos de una serie de Índices con periodo base
2000. Efectuar un cambio de base desde 2000 hasta 2002.

Años 2000 2001 2002 2003 2004


𝑰𝒕𝟐𝟎𝟎𝟎 100 127.9 144.5 178.9 240.8

Solución:
2000 2001
2000
𝐼2000 100 2001
𝐼2000 127.9
𝐼2002 = 2002 ⋅ 100 = ⋅ 100 = 69.20 𝐼2002 = 2002 ⋅ 100 = ⋅ 100 = 88.51
𝐼2000 144.5 𝐼2000 144.5
2002 2003
2002
𝐼2000 144.5 2003
𝐼2000 178.9
𝐼2002 = 2002 ⋅ 100 = ⋅ 100 = 100 𝐼2002 = 2002 ⋅ 100 = ⋅ 100 = 123.8
𝐼2000 144.5 𝐼2000 144.5
2004
2004
𝐼2000 240.8
𝐼2002 = 2002 ⋅ 100 = ⋅ 100 = 166.64
𝐼2000 144.5

Años 2000 2001 2002 2003 2004


𝑰𝒕𝟐𝟎𝟎𝟐 69.20 88.51 100 123.8 166.64
20
1.1.7 Deflactación de Series Económicas
Deflactar es eliminar el componente de la subida (inflación) o bajada
(deflación) de precios.
Se distingue entre:
 Precios corrientes: Precios vigentes en cada periodo de tiempo.
 Precios constantes: Valoración del precio con relación a un año base.

Para poder efectuar análisis comparativos de una serie de valor entre distintos
periodos, hay que pasarla de precios (euros) corrientes o de cada año, a precios
(euros) constantes o del periodo que se considere como base. El procedimiento es
dividir la moneda corriente por un índice de precios adecuado que se denomina
deflactor.
Si se desea expresar la renta disponible de las familias en moneda constante, el
deflactor será el IPC. Si se desea valorar un conjunto de productos industriales,
el deflactor será el IPI, etc.
Si denotamos: Entonces,
 𝑥0𝑡 : precio constante del bien en el año base.
𝑥𝑡
 𝑥𝑡 : precio corriente del bien en el año en curso 𝑡. 𝑥0𝑡 = ⋅ 100
𝐼0𝑡
 𝐼0𝑡 : Índice del año 𝑡 con periodo base 0 (deflactor)
21
Ejemplo 6.
Una marca de electrodomésticos fabrica, en cierta cadena industrial,
cuatro tipos de lavadoras que reciben el nombre de modelo A, B, C y D.
En los años 2002, 2003 y 2004, los precios recomendados de venta y
el número de unidades de cada modelo producidos se recogen en la
siguiente tabla:

2002 2003 2004


Modelo
Precio Cantidad Precio Cantidad Precio Cantidad
A 35 5000 37 5200 40 5400
B 40 3000 45 2500 47 2500
C 50 1500 55 1700 58 1800
D 65 1000 68 1200 70 1300

Calcular:
a. Índice de precios de Laspeyres con base 2002.
b. Índice de precios de Paasche con base 2002.
c. Valor en moneda constante de 2002 de la producción en los tres
años utilizando el índice de Paasche como deflactor.
22
σ𝑛
𝑖=1 𝑝𝑖𝑡 𝑞𝑖0
a. 𝐿𝑡0 = σ𝑛 ⋅ 100
𝑖=1 𝑝𝑖0 𝑞𝑖0

𝐿2002
2002 = 100

37 ⋅ 5000 + 45 ⋅ 3000 + 55 ⋅ 1500 + 68 ⋅ 1000


𝐿2003
2002 = ⋅ 100 = 108.16
35 ⋅ 5000 + 40 ⋅ 3000 + 50 ⋅ 1500 + 65 ⋅ 1000

40 ⋅ 5000 + 47 ⋅ 3000 + 58 ⋅ 1500 + 70 ⋅ 1000


𝐿2004
2002 = ⋅ 100 = 114.48
35 ⋅ 5000 + 40 ⋅ 3000 + 50 ⋅ 1500 + 65 ⋅ 1000

σ𝑛
𝑖=1 𝑝𝑖𝑡 𝑞𝑖𝑡
b. 𝑃0𝑡 = σ𝑛 ⋅ 100
𝑖=1 𝑝𝑖0 𝑞𝑖𝑡

2002
𝑃2002 = 100

2003
37 ⋅ 5200 + 45 ⋅ 2500 + 55 ⋅ 1700 + 68 ⋅ 1200
𝑃2002 = ⋅ 100 = 107.86
35 ⋅ 5200 + 40 ⋅ 2500 + 50 ⋅ 1700 + 65 ⋅ 1200

2004
40 ⋅ 5400 + 47 ⋅ 2500 + 58 ⋅ 1800 + 70 ⋅ 1300
𝑃2002 = ⋅ 100 = 114.11
35 ⋅ 5400 + 40 ⋅ 2500 + 50 ⋅ 1800 + 65 ⋅ 1300
23
Vamos a calcular la serie del valor de la producción en precios constantes del
año 2002. Para ello vamos a deflactar la serie de precios corrientes de cada año
utilizando el Índice de Precios de Paasche.
La producción en los años 2002, 2003 y 2004 en precios corrientes es:
Año 2002 :35·5000 + 40·3000 + 50·1500 + 65·1000 = 435000
Año 2003 :37·5200 + 45·2500 + 55·1700 + 68·1200 = 480000
Año 2004 :40·5400 + 47·2500 + 58·1800 + 70·1300 = 528900

Las producciones anteriores están en precios corrientes de cada año, si


queremos pasarlas a precios constantes del año 2002:
Valor de la producción del 2003 a precios constantes del 2002:

Valor de la producción del 2004 a precios constantes del 2002:

El valor de la producción para el año 2002 a precios del año 2002 no cambia, es
435000 24
1.1.8 IPC - ÍNDICE DE PRECIOS DE CONSUMO
Necesidad:
 El comportamiento de los consumidores varía considerablemente con
el tiempo.
 Con el mismo dinero de un año 𝑡 no se pueden adquirir los mismos
bienes en un año 𝑡 ′ .
Se hace necesario establecer un índice para poder comparar la evolución
de los precios a lo largo de los años.
El Índice de Precios de Consumo o IPC es un índice tipo Laspeyres
encadenado que mide la evolución de los precios en España.
El encargado de elaborar este índice es el INSTITUTO NACIONAL DE
ESTADÍSTICA. (Más info en http://www.ine.es/metodologia/t25/t2530138_16.pdf).
Actualmente se está elaborando tomando como período base el año
2016.

MAS INFORMACIÓN: Véase píldora del INE sobre IPC.


(https://www.youtube.com/watch?v=KsM0LaiDaMY&list=PLJulBV7cVXidU_cleHYJ9jNjfrByO9xqi)

25
Usos:
 Medida de inflación.
 Revisión de contratos de arrendamiento de inmuebles.
 Referencia en la negociación salarial y en la fijación de las pensiones.
 Actualizador de primas de seguros y otros tipos de contrato.
Cálculo:
 Elegir una serie de productos y servicios básicos (“Cesta de la
compra”).
 Se recoge información mensual de estos bienes y se calculan sus
índices.
 Se utilizan unas ponderaciones que son los gastos o valores de los
bienes en el periodo base.
 Estas ponderaciones se actualizan parcialmente cada año a través de
la Encuesta Continuada de Presupuestos Familiares.
MÁS INFORMACIÓN: Véase píldora de INE sobre Cesta de la
Compra
(https://www.youtube.com/watch?v=0xPvB4dlPCk&index=9&list=PLJulBV7cVXidU_cleHYJ9jNjfrByO9xqi)
26
La fórmula del cálculo del IPC es una media de los índices de precios de los
bienes de la cesta de la compra:
𝑚,𝑡
𝑚,𝑡
σ𝑛𝑖=1 𝑤𝑖𝑡−1 𝐼𝑖,𝑡−1
IPC𝑡−1 =
σ𝑛𝑖=1 𝑤𝑖𝑡−1
dónde:
𝑚,𝑡
 IPC𝑡−1 es el IPC general en el mes 𝑚 del año 𝑡 referido al año 𝑡 − 1.
 𝑤𝑖𝑡−1 es la ponderación del bien 𝑖 referida al año 𝑡 − 1.
𝑚,𝑡
 𝐼𝑖,𝑡−1 es el índice del bien 𝑖 en el mes 𝑚 del año 𝑡 referido al año 𝑡 − 1.

Las siguientes tablas muestran la cesta de la compra considerada para calcular


el IPC con base 2016:

27
Las ponderaciones utilizadas en el último año son:
2017
General 1.000
Alimentos y bebidas no alcohólicas 197.711
Bebidas alcohólicas y tabaco 30.190
Vestido y calzado 67.342
Vivienda 133.033
Menaje 58.765
Medicina 39.612
Transporte 146.693
Comunicaciones 35.960
Ocio y cultura 85.209
Enseñanza 16.793
Hoteles, cafés y restaurantes 121.193
Otros bienes y servicios 67.499

Es interesante calcular las tasas de variación del IPC:


 Las tasas de variación mensual se calculan como el cociente entre el índice
del mes corriente y el índice del mes anterior.
𝑚,𝑡 𝑚−1,𝑡
IPC2011 − IPC2011 IPC0𝑚,𝑡 − IPC0𝑚−1,𝑡
TVM = 𝑚−1,𝑡 ⋅ 100 = ⋅ 100
IPC2011 IPC0𝑚−1,𝑡
 Las tasas de variación anual se calculan como el cociente entre el índice del
mes corriente y el índice del mismo mes en el año anterior.
𝑚,𝑡 𝑚,𝑡−1
IPC2011 − IPC2011
TVA = 𝑚,𝑡−1 ⋅ 100
IPC2011
28
¿Cómo se actualiza la renta?
El IPC sirve para actualizar rentas. La fórmula para actualizar una renta del año
𝑡 al año 𝑡 ′ es la siguiente:

IPC0𝑡
Renta𝑡 ′ = Renta𝑡 ⋅
IPC0𝑡

Ejemplo: Se quiere actualizar una Renta de 300 € del año 2008 al año 2017
utilizando el IPC de agosto de 2008 y el de agosto de 2017.
Solución:
8,2008
IPC2016 = 93.196
8,2017
IPC2016 = 101.553
8,2017
IPC2016 101.553
Renta2013 = Renta2008 ⋅ 8,2008 =300 ⋅ = 326.9€
IPC2016 93.196

OJO: Debido al cambio de metodología que se produjo en el año 2002, la


fórmula anterior para actualizar una renta NO ES VALIDA para actualizar una
renta de un año anterior a 2002 a otro año posterior a 2002.
Sin embargo si que funciona si ambos años son anteriores a 2002 o ambos
posteriores a 2002.
29
1.2 DISTRIBUCIONES DE FRECUENCIAS

VARIABLES ESTADÍSTICAS

En los elementos de una población se pueden observar uno o varios


caracteres o variables. Así, en la población “frigoríficos producidos en
España durante el año 2010'' se pueden observar los caracteres peso,
capacidad, marca, etc. Llamaremos variable estadística a cualquiera de
estos caracteres

Las variables se dividen en dos grandes tipos:

 La variable cualitativa o Atributo es un carácter de una población


que no es susceptible de ser medido numéricamente. Como ejemplos
de atributos podemos considerar los siguientes: sexo, color de pelo,
marca de frigoríficos, etc.

 Variable Cuantitativa es cualquier carácter de una población


susceptible de tomar valores numéricos. Por ejemplo, el peso, la
edad en años, la estatura, etc.

30
A su vez, las variables Cualitativas se clasifican en:

 Nominales: son las que toman valores entre los que no se puede
establecer un orden implícito. Por ejemplo: sexo, color de pelo …
 Ordinales: son aquellas que toman valores entre los que sí se puede
establecer un orden intrínseco (aunque no sean números). Por
ejemplo: nivel de estudios, nivel de ingresos, …

Y las variables Cuantitativas se clasifican en:

 Discretas: son las que toman únicamente un número finito o infinito


numerable de valores.
 Continuas: son las que pueden tomar todos los valores de un
determinado intervalo de su campo de variación.

Ejemplo: El número de miembros de una familia es una variable


discreta, en cambio la altura de los individuos de una ciudad es continua
porque puede tomar cualquier valor dentro de un intervalo, por ejemplo
de 0 a 250 cm.

31
RESUMEN:

Nominal: sexo, color de pelo, …

Cualitativa:

Ordinal: nivel de estudios, …

Variable estadística
Discreta: nº zapato, edad (en años), …

Cuantitativa

Continua: peso, estatura, …

32
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES

Al observar los elementos de una determinada población o muestra se


presentan distintos valores de la variable considerada, cada uno de los
cuales puede repetirse una o más veces.
Sea 𝑋 la variable de interés, y sean 𝑥1 , 𝑥2 , … , 𝑥𝑘 los valores distintos
medidos en una muestra de tamaño 𝑁.

Frecuencia absoluta es el número de veces que se repite cada valor de la


variable. Frecuencia absoluta del valor 𝑥𝑖 de la variable se denomina 𝑛𝑖

Frecuencia relativa de un valor 𝑥𝑖 de la variable es su frecuencia


absoluta dividida por el número total de datos. Frecuencia relativa de
𝑥𝑖 :
𝑛𝑖
𝑓𝑖 =
𝑁

Distribución de frecuencias absoluta: 𝑥𝑖 , 𝑛𝑖 𝑘


𝑖=1

Distribución de frecuencias relativa: 𝑥𝑖 , 𝑓𝑖 𝑘


𝑖=1

33
En el caso en que los valores de la variable puedan ser ordenados de
menor a mayor 𝑥1 ≤ 𝑥2 ≤ ⋯ ≤ 𝑥𝑘 , se define:

Frecuencia absoluta acumulada, 𝑵𝒊 de un valor 𝑥𝑖 de la variable


(ordenados de menor a mayor) como el número de datos menores o
iguales que dicho valor. Por tanto:
𝑁𝑖 = 𝑛1 + ⋯ + 𝑛𝑖

Frecuencia relativa acumulada, 𝑭𝒊 es el resultado de dividir cada


frecuencia absoluta acumulada por el número total de datos:
𝑁𝑖
𝐹𝑖 = 𝑓1 + ⋯ + 𝑓𝑖 =
𝑁

De las definiciones anteriores se deducen las siguientes propiedades:


a) σ𝑘𝑖=1 𝑛𝑖 = 𝑁 y σ𝑘𝑖=1 𝑓𝑖 = 1
b) 0 ≤ 𝑓𝑖 ≤ 1
c) 𝑁𝑖 = 𝑁𝑖−1 + 𝑛𝑖
d) 𝑁𝑘 = 𝑁 y 𝐹𝑘 = 1

34
Teniendo en cuenta los conceptos anteriores una tabla de distribución
de frecuencias para datos sin agrupar es de la forma:

Valores Frecuencias Fecuencias Frecuencias Frecuencias Porcentajes Porcentajes


de la absolutas relativas absolutas relativas Acumulados
variable acumuladas acumuladas

𝑥𝑖 𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖 𝑝𝑖 𝑃𝑖

𝑥1 𝑛1 𝑓1 𝑁1 𝐹 𝑝1 𝑃1
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑥𝑘 𝑛𝑘 𝑓𝑘 𝑁𝑘 𝐹𝑘 𝑝𝑘 𝑃𝑘

𝑁 1

Las frecuencias acumuladas sólo tienen sentido cuando los datos 𝑥𝑖 son
números y se pueden ordenar. En el caso de que sean categorías, color
del pelo, tipo compra, etc. no tiene sentido este tipo de frecuencias.

35
Si el tamaño N de la muestra es grande o si se trata de una variable
estadística continua, suelen agruparse los datos en casillas o intervalos
de clase de la forma 𝐿𝑖−1 , 𝐿𝑖 donde 𝑖 = 1, … , 𝑘, sustituyendo cada valor
de la variable por la semisuma de los extremos del intervalo a que
pertenece. Esta semisuma se llama marca de clase, es decir, la Marca
de clase del intervalo [𝑳𝒊−𝟏 , 𝑳𝒊) es
𝑳𝒊−𝟏 + 𝑳𝒊
𝟐

Por tanto, una tabla de distribución de frecuencias para datos


agrupados en intervalos es de la forma:
Valores Frecuencias Frecuencias
Intervalos de Frecuencias Fecuencias
de la absolutas relativas
clase absolutas relativas
variable acumuladas acumuladas
𝐿𝑖−1 + 𝐿𝑖
[𝑳𝒊−𝟏 , 𝑳𝒊 ) 𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖
2
𝐿0 + 𝐿1
[𝑳𝟎, 𝑳𝟏) 2 𝑛1 𝑓1 𝑁1 𝐹
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
[𝑳𝒌−𝟏 , 𝑳𝒌 ) 𝐿𝑘−1 + 𝐿𝑘 𝑛𝑘 𝑓𝑘 𝑁𝑘 𝐹𝑘
2
Total 𝑁 1

Se define amplitud del un intervalo como: 𝑎𝑖 = 𝐿𝑖 − 𝐿𝑖−1


𝑛
Se define densidad de un intervalo como: 𝑑𝑖 = 𝑎𝑖 36
𝑖
Ejemplo:
Una empresa de servicios informáticos, ha realizado un estudio del coste total del
mantenimiento de 3 5 marcas de impresoras. Para ello sometió a todas las
impresoras al mismo proceso de impresión, obteniéndose los siguientes resultados
expresados en céntimos de euro
:

Coste total Nº de Frecuencia Frecuencia Frecuencia Marca de Amplitud Densidad


por Impresoras relativa absoluta relativa clase
impresión Frecuencia fi acumulada acumulada
de página absoluta Ni Fi
ni
83-87 5 5/35 5 5/35 85 4 5/4
87-91 10 10/35 15 15/35 89 4 10/4
91-95 15 15/35 30 30/35 93 4 15/4
95-101 5 5/35 35 35/35 98 6 5/6
Total 35 1

37
DISTRIBUCIONES DE FRECUENCIAS MULTIDIMENSIONALES

En la mayoría de las ocasiones que debemos trabajar con datos


procedentes de muestras o poblaciones se nos presentan dos o más
caracteres a estudiar.

Estos datos deben ser estudiados como variables o atributos


unidimensionales independientemente, o en la mayor parte de las
veces, para ser estudiados conjuntamente entre dos, tres,....,n
caracteres que son recogidas en sus respectivas variables o atributos.

Cuando consideramos dos características de una población o muestra,


podemos encontrarnos con los siguientes supuestos: todas las
variables sean cuantitativas, todas cualitativas o una situación mixta
donde unas sean cuantitativas y otras cualitativas.

38
Se denomina variable conjunta de X e Y a un par 𝑋, 𝑌 ordenado,
donde X, Y son las dos variables. Los valores vienen expresados por:

𝑥𝑖 , 𝑦𝑖 𝑐𝑜𝑛 𝑥𝑖 ∈ 𝑋; 𝑦𝑖 ∈ 𝑌 ∀𝑖 = 1,2, … , ℎ 𝑦 𝑗 = 1,2, … 𝑘

Al número de veces que se presenta conjuntamente el par de valores


(𝑥𝑖 , 𝑦𝑖) se denomina frecuencia absoluta bidimensional de dicho par, y
se representa por el símbolo 𝒏𝒊𝒋

Utilizando una terminología análoga a la de las variables


unidimensionales, designaremos por 𝑓𝑖𝑗 a la frecuencia relativa
bidimensional del par (𝑥𝑖 , 𝑦𝑖) obteniéndose por el cociente entre la
frecuencia absoluta correspondiente y el número total de valores
bidimensionales o tamaño de la muestra.
𝑛𝑖𝑗
𝑓𝑖𝑗 =
𝑁

39
Tablas de correlación y contingencia.
Para organizar y resumir los datos, (valores o modalidades), contamos con
TABLAS DE CORRELACION para variables cuantitativas bidimensionales de
frecuencias y TABLAS DE CONTINGENCIA para variables cualitativas
bidimensionales. Dichas tablas son cuadros de doble entrada, como las
siguiente:

X/Y y1 ... yj ... yk Total


X/Y x 1 y 1 n 11 . . . . . .yj n 1j. . . . .y.k nTotal
1k n 1.
x1 ... n 11 ... ... . . . n 1j . . .. . . . .n.1k .n.1.. ...
... xi ... n i1 . . . . . .. . . n ij. . . . .. .. . ...n ik n i.
xi ... n i1 ... ... . . . n ij . . .. . . . .n.ik .n.i.. ...
... xh ... n h1 . . . . . .. . . n hj. . . . .. .. . n. .hk. n h.
xh n ... n hj ... n n
Total h1 n .1 ... n .j . . .hk n .kh. N
Total n .1 ... n .j ... n .k N

𝑛𝑖𝑗: frecuencia absoluta de la celda 𝑖, 𝑗


𝑓𝑖𝑗: frecuencia relativa de la celda 𝑖, 𝑗

40
Ejemplo.
Las sucursales de una entidad bancaria presentaron los datos del ejercicio
correspondientes al año 2005.
Los siguientes datos corresponden a las variables 𝑋 =”Tipo de cuenta” e
𝑌 =”Saldo de las cuentas” (esta última en miles de euros) .

X/Y
[0,1] (1,5] (5,10] (10,100]
TOTAL
Plazo fijo 60 41 25 34
160
Cuenta Corriente 80 60 32 25
197
TOTAL 140 101 57 59 357

nij La suma de todos ellos es N=357.


[0,1] (1,5] (5,10] (10,100]
X/Y
Plazo fijo 60/357 41/357 25/357 34/357
Cuenta Corriente 80/357 60/357 32/357 25/357

f ij la suma de todos ellos es 1.

41
Distribuciones marginales.

Para una variable bidimensional (𝑋, 𝑌) existen dos distribuciones


unidimensionales marginales, la de 𝑋 y la de 𝑌. La distribución marginal
de la variable 𝑿, en una distribución de una variable bidimensional de
frecuencias 𝑋, 𝑌 , viene definida por los valores que toma dicha
variable y las frecuencias de los mismos, independientemente de los
valores que tome la otra variable Y.

Las distribuciones marginales del ejemplo anterior son:

X/Y
[0,1] (1,5] (5,10] (10,100]
TOTAL
Plazo fijo 60 41 25 34
160
Cuenta Corriente 80 60 32 25
197
TOTAL 140 101 57 59 357

𝒏𝒊𝒋 𝒇𝒊𝒋
Y
[0,1] 140 140 𝒏𝒊𝒋 𝒇𝒊𝒋
357 X
(1,5] 101 101 Plazo fijo 160 160
357 357
(5,10] 57 57 Cuenta 197 197
357 Corriente 357
(10,100] 59 59 suma 357 1
357
Suma 357 1
42
Distribuciones condicionadas.

En las distribuciones bidimensionales (𝑋, 𝑌) , nos puede interesar


estudiar una variable condicionada a que la otra variable tome un
determinado valor o valores (a veces intervalo). Tenemos así la
distribución de la variable 𝑌, dado un valor 𝑋 = 𝑥𝑖 , simbolizada por la
expresión:
𝑌ൗ
𝑋=𝑥 𝑖

También podríamos escribir 𝑋ൗ 𝑌=𝑦 cuando la distribución que se


𝑗
quiere determinar es la de la variable 𝑋, condicionada por un valor de
𝑌 = 𝑦𝑗 . Las tablas son las siguientes:

43
Podemos calcular varias distribuciones condicionadas de una
distribución bidimensional.
Por ejemplo: 𝑿 condicionado a que 𝒀 es mayor que 1, o 𝒀
condicionado a que 𝑿 es a plazo fijo.

X/Y
[0,1] (1,5] (5,10] (10,100]
TOTAL
Plazo fijo 60 41 25 34
160
Cuenta Corriente 80 60 32 25
197
TOTAL 140 101 57 59 357

𝒏𝒊𝒋 𝒇𝒊𝒋
𝒀ൗ
𝑿 = plazo fijo 𝒏𝒊𝒋 𝒇𝒊𝒋
[0,1] 60 60/160 𝑿ൗ
𝒀>𝟏
(1,5] 41 41/160 Plazo fijo 100 100/217
(5,10] 25 25/160 Cuenta 117 117/217
(10,100] 34 34/160 Corriente

Suma 160 1 suma 217 1

Ahora N=160 Ahora N=217


44
1.3 REPRESENTACIONES GRÁFICAS

Para variables cualitativas ordinales o cuantitativas discretas

Diagramas de barras.

En el eje de abscisas, de unos ejes coordenados rectangulares, se


señalan los valores de la variable, construyendo sobre estos unos
segmentos verticales de longitud igual (o proporcional) a cada una de las
frecuencias.
Según se consideren las frecuencias absolutas o relativas, se obtendrá
el correspondiente diagrama de barras.
200

100
Frecuencia ni

0
8 12 14 15 16 17 18 19 20 21

Niv el educativ o

45
Polígonos de frecuencias

Se obtiene uniendo mediante segmentos los puntos ( x1 , n1 ),..., ( xk , nk ) , si se


trata de polígonos de frecuencias absolutas, o los puntos: (x1; f1),...,(xk ; fk ) si
se trata de polígono de frecuencias relativas.

200

100
Frecuencia ni

0
8 12 14 15 16 17 18 19 20 21

Niv el educativ o

46
Diagrama de tallos y hojas. Para crearlo se consideran dos o tres cifras
significativas de los datos tomándose como tallos la primera o las dos
primeras cifras de cada dato y como hojas las últimas cifras de cada dato.
A continuación, separados por una línea vertical se representan los tallos a
la izquierda y las hojas a la derecha del tallo correspondiente.

47
Para variables cuantitativas continuas

Histograma
Histograma
Se marcan en el eje de abscisas los extremos de los intervalos de
clase, y sobre cada intervalo se construye un rectángulo cuya base
Se marcan en el eje de abscisas los extremos de los intervalos de clase, y
coincide con el intervalo y la altura es igual (o proporcional) a la
sobre cada intervalo se construye un rectángolo
𝑛 cuya base coincide con el
frecuencia de dicho intervalo. Generalmente 𝑎𝑖 , donde 𝑛𝑖 es la
intervalo y la altura es igual (o proporcional)𝑖 a la frecuencia de dicho
𝑓
frecuencia de clase
intervalo. y 𝑎𝑖 es la namplitud
Generalmente i/ai, delnintervalo,
donde i o 𝑖 donde
es la frecuencia 𝑓𝑖 es ylaai es
de clase
𝑎𝑖
la amplitud
frecuencia relativadel
. intervalo, o fi/ai donde fi es la frecuencia relativa .
h is t o g r a m a
14 0

12 0

10 0

80

60

40

D es v . t íp . = 170 75. 66
20
M e d ia = 34 419 .6
0 1 2 3 4 5 6 7 8 9 1 1 1 N1 = 4 74. 00
5 5 5 5 5 5 5 5 5 0 1 2 3
0 0 0 0 0 0 0 0 0 5 5 5 5
0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0
.0 .0 .0 .0 .0 .0 .0 .0 .0 0 0 0 0
.0 .0 .0 .0

S a l a r i o a c tu a l

48
Para variables cualitativas

Pictogramas
Los datos se representan gráficamente sustituyendo las barras del
diagrama de barras o los rectángulos del histograma por figuras alusivas
al carácter estudiado.

Cartogramas
Es la forma de representar sobre el mapa de la región estudiada los
caracteres correspondientes, bien empleando distintos colores, tramas
de distinta intensidad, o con una numeración adecuada.

49
Diagramas sectoriales
Consiste en representar mediante sectores circulares las distintas
modalidades de la variable de manera que los sectores han de tener un
ángulo central proporcional a la frecuencia correspondiente.
Direct ivo

17.7%

Seguridad

5. 7%

Administrat ivo

76.6%

Diagramas de Rectángulos
Todos los rectángulos tienen la misma base y sus áreas son
proporcionales a la frecuencia.
100

80

60

40

20
Porcentaje

50
Adminis trativo Seguridad Directivo

Categoría laboral
51
1.4 MEDIDAS DE POSICIÓN, DISPERSIÓN Y FORMA

Las medidas de una distribución de frecuencias se pueden clasificar en


los siguientes grupos:

MEDIDAS DE POSICIÓN. Estas medidas permiten situar una


distribución; proporcionan valores que determinan posiciones dentro
del conjunto de los datos.

MEDIDAS DE DISPERSIÓN. Son medidas que generalmente nos


indican la desviación de los datos respecto de ciertas medidas de
posición. En este sentido, observaremos esa desviación respecto de la
media aritmética y la mediana.

MEDIDAS DE FORMA. Estas medidas están relacionadas con la


representación gráfica de la distribución.

52
1.4.1 MEDIDAS DE POSICIÓN DE TENDENCIA CENTRAL

Media aritmética 𝑿

Se define como el cociente entre la suma de todos los valores


observados de la variable y el número total de observaciones, es decir:

σ𝑘𝑖=1 𝑥𝑖 𝑛𝑖
𝑋ത =
𝑁

Para datos agrupados se toman como 𝑥𝑖 las marcas de clase.

A veces se introducen unos coeficientes de ponderación o pesos


denominados 𝑤𝑖 que son distintos de 𝑛𝑖 con lo que la media es:

σ𝑘𝑖=1 𝑤𝑖 𝑥𝑖
𝑋ത𝑤 = 𝑘
σ𝑖=1 𝑤𝑖

ESTA ES LA MEDIA PONDERADA


53
Propiedades de la media aritmética:
 Si a todos los valores 𝑥𝑖 les sumamos la misma constante, la media
resultante es la media original más esa constante.
 Si a todos los valores 𝑥𝑖 los multiplicamos por la misma constante,
la media resulta de es la media original multiplicada por esa
constante.
 La media aritmética siempre está entre el valor más pequeño y el
más grande de los datos.

54
Ejemplo 1:
Los ingresos anuales de un grupo de banqueros son de
62900 61600 62500 60800 1.200.000
El ingreso medio de estos banqueros es de 289560
OJO: Esta cifra no es para nada significativa de el sueldo de los
empleados, porque todos, salvo uno, cobran muchísimo menos que esa
cantidad. El último valor de un millón doscientos mil euros está
afectando mucho a la media.

Ejemplo 2: La media aritmética de la siguiente distribución se calcula


como

𝒏𝒊 Marcas
Nº Empleados de clase 25 ⋅ 100 + 100 ⋅ 117 + 325 ⋅ 50
𝑋ത =
[0,50] 100 25 100 + 117 + 50
30450
(50,150] 117 100 = = 114.04
267
(150,500] 50 325

55
56
Mediana

Dada una distribución de frecuencias (𝑥𝑖 , 𝑛𝑖 ) con valores ordenados de


menor a mayor, llamamos mediana, 𝑀𝑒, al valor de la variable que deja a
su izquierda el mismo número de frecuencias que a su derecha.

Cálculo de la mediana

a. Para el cálculo práctico de la mediana con DATOS NO AGRUPADOS


en intervalos, se observa cuál es la primera frecuencia absoluta
𝑁
acumulada 𝑁𝑖 que supera o igual a 2 . Se distinguen dos casos:
𝑁
1. Si 𝑁𝑖 > 2 , la mediana es el 𝑥𝑖 que se corresponde con el 𝑁𝑖 .
𝑁
2. Si 𝑁𝑖 = 2 , la mediana es la media aritmética entre 𝑥𝑖 y 𝑥𝑖+1 .

57
b. Para DATOS AGRUPADOS en intervalos se calcula:
Observando la columna de los 𝑁𝑖 , se busca el más pequeño que verifique
𝑁
que 𝑁𝑖 ≥ , y el intervalo mediano será 𝐿𝑖−1 , 𝐿𝑖 que se corresponde a ese
2
𝑁𝑖 . En este caso la mediana será:
𝑁
− 𝑁𝑖−1 0.5 − 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖−1 + 2 ⋅ 𝑎𝑖 = 𝐿𝑖−1 + ⋅ 𝑎𝑖
𝑛𝑖 𝑓𝑖
Donde,
𝐿𝑖−1 es el extremo inferior del intervalo mediano.
𝑁𝑖−1 es la frecuencia absoluta acumulada del intervalo anterior al mediano.
𝑛𝑖 es la frecuencia absoluta del intervalo mediano.
𝑎𝑖 es la amplitud del intervalo mediano.

La mediana tiene su mayor sentido en casos de distribuciones en escala ordinal,


de la cual es la medida más representativa por describir la tendencia central
de la mismas, ya que, en estos casos, no tiene demasiado sentido la utilización
de promedios. Es una medida robusta, es decir, es poco sensible a la presencia
de observaciones atípicas.

58
En el ejemplo anterior:
Si ordenamos los ingresos anuales de los banqueros
60800 61600 62500 62900 1.200.000
La mediana de los ingresos de estos banqueros es de 62500.
Este valor es mucho más representativo que la media.

59
Ejemplo: Calcular la mediana de la siguiente variable 𝑌.

Y 𝒏𝒊𝒋 amplitud 𝒇𝒊𝒋 𝑵𝒊𝒋


[0,1] 140 1 140/357 140
(1,5] 101 4 101/357 241
(5,10] 57 5 57/357 298
(10,100] 59 90 59/357 357
Suma 357 1

𝑁 357
Cómo = = 178.5 , entonces el intervalo mediano es el
2 2
𝑁
correspondiente al 𝑁𝑖 más pequeño tal que 𝑁𝑖 ≥ = 178.5: 𝟏, 𝟓
2

y por tanto
𝑁
− 𝑁𝑖−1 178.5 − 140
𝑀𝑒 = 𝐿𝑖−1 + 2 ⋅ 𝑎𝑖 = 1 + ⋅ 4 = 2.525
𝑛𝑖 101

60
Moda

La moda, 𝑀𝑜, es el valor de la variable que más veces se repite, es


decir, el de mayor frecuencia absoluta.
La moda puede no ser única, puede haber una moda (variable unimodal),
dos modas (bimodal), etc.

Cálculo de la Moda:
a. Distribuciones NO agrupadas en intervalos.
Es el valor de la variable con mayor frecuencia absoluta.
b. Distribuciones agrupadas en intervalos de distinta amplitud.
 Primero se calcula el intervalo modal 𝐿𝑖−1 , 𝐿𝑖 , que es el
𝑛
intervalo/s con mayor densidad ℎ𝑖 = 𝑎𝑖.
𝑖
 Luego se calcula la moda usando la siguiente fórmula:
ℎ𝑖+1
𝑀𝑜 = 𝐿𝑖−1 + ⋅𝑎
ℎ𝑖+1 + ℎ𝑖−1 𝑖
Donde:
𝐿𝑖−1 es el extremo inferior del intervalo modal.
ℎ𝑖+1 y ℎ𝑖−1 son, respectivamente, las densidades de frecuencia
de los intervalos posterior y anterior al modal ℎ𝑖 .
𝑎𝑖 es la amplitud del intervalo modal.
61
Ejemplos: Cálculo de la moda de dos variables Y y X.

Y 𝒏𝒊 𝒂𝒊 𝒉𝒊
[0,1] 14 1 14
(1,5] 101 4 101/4=25.25
(5,10] 57 5 57/5=11.4
(10,20] 180 10 180/10=18

El intervalo modal es el intervalo que tiene una mayor densidad ℎ𝑖 : 1,5 .


Por tanto la moda se calcula como:
ℎ𝑖+1 11.4
𝑀𝑜 = 𝐿𝑖−1 + ⋅𝑎 =1+ ⋅ 4 = 2.7953
ℎ𝑖+1 + ℎ𝑖−1 𝑖 11.4 + 14

X 𝒏𝒊 El valor 10 es la moda de la variable


1 14 X porque es el valor que más se
3 101 repite, el de mayor densidad
5 57
10 180

62
1.4.2 MEDIDAS DE POSICIÓN NO CENTRALES: LOS CUANTILES

Pasamos a analizar otros valores notables pero que no van ha reflejar


ninguna tendencia central: los cuantiles.
Se define cuantil de orden 𝒑 (0 ≤ 𝑝 ≤ 1), que denotaremos por 𝒙𝒑 ,
como el valor que deja a lo sumo p ⋅ 𝑁 observaciones a su izquierda y
1 − 𝑝 ⋅ 𝑁 observaciones a su derecha. El cuantil 𝑝 = 0.5 es la mediana.

Otros casos importantes son:

Los cuartiles: Son tres valores que dividen a la distribución el cuatro


partes iguales, es decir, en cuatro intervalos dentro de cada cual están
incluidos el 25% de los valores de la distribución.

Los deciles: Son nueve puntos que dividen a la distribución en diez


partes iguales; dentro de cada una están incluidos el 10% de los
valores.

Los percentiles: Son valores que dividen a la distribución en cien


partes iguales; dentro de cada una está incluido el 1% de los valores.

63
Ejemplo de distribución de los CUARTILES

64
Cálculo del cuantil de orden 𝑝:

a. Distribuciones NO agrupadas en intervalos.


Se calcula el valor 𝑝 ⋅ 𝑁 y las frecuencias absolutas acumuladas.
 Si 𝑝 ⋅ 𝑁 = 𝑁𝑖 entonces el cuantil es la media aritmética entre 𝑥𝑖 y
𝑥𝑖+1 .
 Si 𝑝 ⋅ 𝑁 no coincide con ningún 𝑁𝑖 entonces el cuantil es el primer
𝑥𝑖 tal que 𝑁𝑖 > 𝑝 ⋅ 𝑁.

b. Distribuciones agrupadas en intervalos de distinta amplitud.


El cálculo es muy semejante al de la mediana. Primero se calcula 𝑝 ⋅
𝑁. Después se busca el primer 𝑖 tal que 𝑁𝑖 > 𝑝 ⋅ 𝑁 y luego se aplica la
fórmula:
𝑝 ⋅ 𝑁 − 𝑁𝑖−1 𝑝 − 𝐹𝑖−1
𝑥𝑝 = 𝐿𝑖−1 + ⋅ 𝑎𝑖 = 𝐿𝑖−1 + ⋅ 𝑎𝑖
𝑛𝑖 𝑓𝑖

65
Ejemplo: Vamos a calcular el primer cuartil (𝑝 = 0.25) de la variable Y.
Y 𝒏𝒊 𝒂𝒊 𝒇𝒊 𝑵𝒊
[0,1] 140 1 140/357 140
(1,5] 101 4 101/357 241
(5,10] 57 5 57/357 298
(10,100] 59 90 59/357 357
Suma 357 1

- Calculamos 𝑝 ⋅ 𝑁 = 0.25 ⋅ 357 = 89.25. Entonces el primer cuartil está


en el intervalo 0,1 ya que este es el primer intervalo tal que 𝑁𝑖 =
140 > 𝑝 ⋅ 𝑁 = 89.25.
- Calculamos el primer cuartil utilizando la fórmula:
0.25 ⋅ 𝑁 − 𝑁𝑖−1 89.25 − 0
𝑄1 = 𝑥0.25 = 𝐿𝑖−1 + ⋅ 𝑎𝑖 = 0 + ⋅ 1 = 0.6375
𝑛𝑖 140

66
Otros gráficos para variables cuantitativas continuas

Diagramas de caja

Este tipo de gráficos también se conocen como Box-Plots (Diagramas


de caja). Para construirlos es necesario el cálculo del primer y tercer
cuartil 𝑄1 y 𝑄3 . Se definen el extremo inferior y superior 𝐿𝐼 y 𝐿𝑆
respectivamente como:
𝑄3 − 𝑄1
𝐿𝐼 = max min 𝑥𝑖 , 𝑄1 − 1.5
𝑖=1,…,𝑘 2
𝑄3 − 𝑄1
𝐿𝑆 = min max 𝑥𝑖 , 𝑄3 + 1.5
𝑖=1,…,𝑘 2
obteniéndose un diagrama de caja de la forma
160000

140000
29

120000
32
343
18
100000 446
103
34
106
454
431
274
71
35
80000 29 218
383
100
66
235
456
53
284
88
198
449
420
173
129
89
254
283
200
389
272
205
430
160
137
387
289
329
257
458
408
60000 343 101
27
50
406
341
130
187
371
1
348
205
160
431
32
446
198
456
173
40000 34
137
257
290
420
103
200
329
430
450
71
341
232
408
284
464
406
328
389
254
307
283
387
272
235
454
289
348
130
35
66
106
88
383
458
217
18
129
89
1
113
27
199
256
100
63
151
53
286
197
20000

0
N= 474 474

Salario inicial Salario ac tual


67
Construcción de un diagrama de cajas

Ptos. atípicos o extremos

68
69
70
1.4.3 MEDIDAS DE DISPERSIÓN
Son medidas que nos indican la desviación de los valores de la variable
respecto de ciertas medidas de posición como la media aritmética o la
mediana. A la mayor o menor separación de los valores respecto a otro,
que se pretende sea su síntesis, se llama dispersión o variabilidad.

Medidas de Dispersión Absolutas

1. Recorrido: es la diferencia entre el mayor valor y el menor valor de


una distribución. Es decir:
𝑅𝑒 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛

2. Recorrido Intercuartílico: es la diferencia existente entre el


tercer cuartil y el primero. Es decir:
𝑅𝐼 = 𝑄3 − 𝑄1
Nos indica que en un intervalo de longitud 𝑄3 − 𝑄1 están comprendidos
el 50% de los valores centrales.

71
3. Varianza.
De todas las medidas de dispersión absolutas respecto a la media
aritmética, la varianza y su raíz cuadrada, la desviación típica son las
más importantes.
𝑘 ത 2 𝑛𝑖
σ 𝑖=1 𝑥 𝑖 − 𝑋
𝑆2 =
𝑁
También se puede calcular cómo:
σ𝑘𝑖=1 𝑥𝑖2 𝑛𝑖
2
𝑆 = − 𝑋ത 2
𝑁
Aunque la más utilizada por estimar mejor la varianza poblacional es
σ𝑘 ത 2
𝑖=1 𝑥𝑖 −𝑋 𝑛𝑖
la CUASIVARIANZA 𝑆መ 2 = 𝑁−1

4. Desviación típica o estándar.


Es la raíz cuadrada de la varianza, es decir:
σ𝑘
𝑖=1 𝑥𝑖 − ത 2 𝑛𝑖
𝑋
𝑆 = 𝑆2 =
𝑁
Análogamente se define la CUASIDESVIACIÓN TÍPICA
σ𝑘𝑖=1 𝑥𝑖 − 𝑋ത 2 𝑛𝑖
𝑆መ = 𝑆መ 2 =
𝑁−1
72
Ejemplo. Cálculo de la varianza

Nº Empleados 𝒏𝒊 Marcas
de clase
[0,50] 100 25
(50,150] 117 100

(150,500] 50 325

25 ⋅ 100 + 100 ⋅ 117 + 325 ⋅ 50


𝑎1 = 𝑋ത = = 114.04
100 + 117 + 50

σ𝑘𝑖=1 𝑥𝑖2 𝑛𝑖 252 ⋅ 100 + 1002 ⋅ 117 + 3252 ⋅ 50


𝑎2 = = = 24396.07
𝑁 100 + 117 + 50
Varianza = 𝑆 2 = 𝑎2 − 𝑎12 = 24396.07 − 114.04 2
= 11390.95

Desv. Típica = 𝑆 = 𝑆 2 = 11390.95 = 106.73

73
Medidas de Dispersión relativas

Si queremos comparar los promedios de dos distribuciones para saber


cuál de los dos es más representativo debemos utilizar medidas
adimensionales, es decir, que no vengan afectadas por las unidades de
medida. Estas medidas de dispersión, llamadas relativas, siempre se
concretan en forma de cociente. La más utilizada es:

El Coeficiente de variación de Pearson. Se define como el cociente


entre la desviación típica y la media aritmética, siempre y cuando la
media aritmética sea mayor que cero.

Cuanto mayor sea V menor es la representatividad de la media


aritmética
𝑆
𝑉=
𝑋ത

74
1.4.4 MEDIDAS DE FORMA
Están relacionadas con la representación gráfica de la distribución.
Pueden ser:

Medidas de asimetría.

Para saber si una distribución de frecuencias es simétrica, hay que


precisar con respecto a qué. Un buen candidato es la mediana, ya que
para variables continuas, divide al histograma de frecuencias en dos
partes de igual área. Podemos basarnos en ella para, de forma natural,
decir que una distribución de frecuencias es simétrica si el lado
derecho de la gráfica (a partir de la mediana) es la imagen por un
espejo del lado izquierdo

Asimetría positiva:
Si las frecuencias más altas se encuentran en el lado izquierdo de la
media, mientras que en derecho hay frecuencias más pequeñas (cola).
Asimetría negativa:
Cuando la cola está en el lado izquierdo.

75
Coeficiente de asimetría de Pearson:
𝑋ത − 𝑀𝑜𝑑𝑎
𝐴𝑝 =
𝑆

Coeficiente de asimetría de Fisher:


𝑚3
𝑔1 =
𝑆3
σ𝑘 ത 3
𝑖=1 𝑥𝑖 −𝑋 𝑛𝑖
donde 𝑚3 = es el momento de orden 3 con respecto a la media.
𝑁
σ𝑘 ത 2
𝑖=1 𝑥𝑖 −𝑋 𝑛𝑖
Y𝑆= 𝑁

Para cada coeficiente, existen tres posibilidades:


1. Tomar un valor mayor que cero ⇒ La asimetría es positiva o por la derecha.
2. Ser igual a cero ⇒ La distribución es simétrica.
3. Tomar un valor menor que cero ⇒ La asimetría es negativa o por la izquierda.
76
Medidas de apuntamiento o curtosis.

Miden el grado de apuntamiento de la distribución.

Coeficiente de curtosis de Fisher:


𝑚4
𝑔2 = 4 − 3
𝑆
σ𝑘 ത 4
𝑖=1 𝑥𝑖 −𝑋 𝑛𝑖
donde 𝑚4 = es el momento de orden 4 con respecto a la
𝑁
media.

 𝑔2 > 0 Distribución leptocúrtica: más apuntamiento que la


distribución normal.
 𝑔2 = 0 Distribución mesocúrtica: apuntamiento similar a la
distribución normal.
 𝑔2 < 0 Distribución platicúrtica: menos apuntamiento que la
distribución normal. 0.8

0.6

0.4

0.2

-8 -6 -4 -2 0 2 4 6 8
77
x

También podría gustarte