Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
1.1: NÚMEROS ÍNDICES SIMPLES Y
COMPLEJOS. PROPIEDADES. IPC.
1.1.1 Introducción
1.1.2 Números Índices Simples
1.1.3 Números Índices Complejos
1.1.4 Números Índices Ponderados
1.1.5 Índices de Precios
1.1.6 Renovación, enlace y cambio de periodo Base en
los Números Índices.
1.1.7 Deflactación de Series económicas
1.1.8 IPC: INDICE DE PRECIOS DE CONSUMO
2
1.1.1 INTRODUCCIÓN
Ejemplo:
𝟐𝟎𝟎𝟔 : Índice del año 2011 tomando como periodo base el año 2006.
𝑰𝟐𝟎𝟏𝟏
3
PROPIEDADES
Existencia: tienen un valor finito distinto de cero. 0 ≠ 𝐼𝑡𝑡 < ∞
0
4
VIDEOS EXPLICATIVOS:
5
1.1.2 Números Índices Simples
𝑥𝑖𝑡
𝐼0𝑡 𝑖 = ⋅ 100
𝑥𝑖0
6
Hay tres tipos de números índices muy importantes:
Índice de Precios Simple: (relación de precios)
𝑝𝑛
𝐼𝑝 = ⋅ 100
𝑝0
Índice de Cantidad Simple: (relación de cantidades)
𝑞𝑛
𝐼𝑝 = ⋅ 100
𝑞0
Índice de Valor Simple: (relación de valor)
𝑝𝑛 𝑞𝑛
𝐼𝑝 = ⋅ 100
𝑝0 𝑞0
dónde 𝑝𝑗 y 𝑞𝑗 denotan los precios y las cantidades del producto en el
periodo 𝑗.
Una vez calculados los números índices para un solo bien, dinero,
cantidad o valor; el siguiente paso es calcular índices compuestos.
Los índices compuestos se forman a partir de varios bienes.
7
Ejemplo 1. (Hoja de prácticas)
Solución:
05
18 06
20 07
15 08
23
𝐼05 = ⋅ 100 = 100 𝐼05 = ⋅ 100 = 111.11 𝐼05 = ⋅ 100 = 83.33 𝐼05 = ⋅ 100 = 127.78
18 18 18 18
09
25 10
18 11
30
𝐼05 = ⋅ 100 = 138.89 𝐼05 = ⋅ 100 = 100 𝐼05 = ⋅ 100 = 166.67
18 18 18
8
1.1.3 Números Índices Complejos / Compuestos
Los índices compuestos no será otra cosa que la agregación de los distintos
índices simples elaborados para cada bien por separado.
Sin embargo, en otras ocasiones, lo que se agregan no son índices, sino las
propias magnitudes (precios o cantidades) observadas.
9
1.1.4 Números Índices Ponderados
La necesidad de ponderar los índices viene de calcular índices que engloben a más
de un bien y que estén medidos en escalas diferentes.
Una ponderación representa un valor de referencia para cada producto que
determina su importancia relativa en el índice total.
Índice media aritmética ponderada:
𝑤1 𝐼1 + 𝑤2 𝐼2 + ⋯ + 𝑤𝑛 𝐼𝑛 σ𝑛𝑖=1 𝑤𝑖 𝐼𝑖
𝐼= = 𝑛
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑛 σ𝑖=1 𝑤𝑖
105 ' 3 104 ' 9 105 ' 7 106 ' 3 105 ' 6 106 108 109 ' 7 109 ' 7 111' 3 111' 6 111' 9
Ia
12
108 ' 04
I G 12 105 '3 104 '9 105 ' 7 106 '3 105 ' 6 106 108 109 ' 7 109 ' 7 111'3 111' 6 111'9
107 '97
12
IH
1 1 1 1 1 1 1 1 1
105 '3 104 '9 105 ' 7 106 '3 105 ' 6 106 108 109 ' 7 109 ' 7
12
107 '979
4
1 1 1
111'3 111' 6 111'9
Ejemplo. El precio de una vivienda crece un año un 5%, al siguiente baja un 10% y
al tercer año vuelve a subir un 15%. ¿Cuánto ha crecido de media cada año?
Solución: Si le realizamos la media aritmética de esos valores obtenemos 1.033, con lo cual
saldría un crecimiento medio de 3.3%, pero esto no es cierto. Veamos por qué:
Si inicialmente valía, por ejemplo, 1000€, al cabo del primer año valdrá 1000 ⋅ (1 + 0.05) =
1050€, al cabo del segundo año valdrá 1000 ⋅ 1 + 0.05 ⋅ (1 − 0.1) = 945€ y al cabo del tercero,
1000 ⋅ (1 + 0.05) ⋅ (1 − 0.1) ⋅ (1 + 0.15) = 1000 ⋅ 1.08675 = 1086.75€
De lo que resulta 𝐹 = 1.08675 = 1.028, de manera que la tasa media de crecimiento del valor
3
12
1.1.5 Índices de Precios
Se calculan utilizando índices complejos ponderados. Los más utilizados
son los índices de Laspeyres, Paasche y Fisher.
13
Índice de Laspeyres del periodo 𝑡 con periodo base 0
𝑛
σ𝑖=1 𝑝𝑖𝑡 𝑞𝑖0
𝐿𝑡0 = 𝑛 ⋅ 100
σ𝑖=1 𝑝𝑖0 𝑞𝑖0
14
Índice de Paasche del periodo 𝑡 con periodo base 0
𝑛
σ𝑖=1 𝑝𝑖𝑡 𝑞𝑖𝑡
𝑃0𝑡 = 𝑛 ⋅ 100
σ𝑖=1 𝑝𝑖0 𝑞𝑖𝑡
15
Ejemplo 3
1. Consideramos los tres productos, con sus precios y cantidades:
Producto pio qio pit qit
X1 10 3 14 5
X2 12 7 13 6
X3 8 12 16 10
Rehacer todos los cálculos sería muy tedioso. Por eso necesitamos
una herramienta que nos permite cambiar de base de forma sencilla.
17
3.6 RENOVACIÓN, ENLACE Y CAMBIO DE PERIODO
1.1.6 Renovación, enlace y cambio de período base en los
BASE EN
Números LOS NÚMEROS INDICES.
Índices
A medida que los datos se alejan del periodo base pierden representatividad,
con el fin de actualizarlos se realiza el cambio de base ( pasar de tener por
ejemplo 1996 como año base a 2000). Para que los datos obtenidos con esas
series con distinta base se puedan comparar, hay que realizar un enlace de
índices.
Este enlace se basa en la propiedad de la inversión de los números índices
I 00
I I
t
h
t
0
I 0h
I 00
En España, se denomina coeficiente legal de enlace a Este dato es publicado
I 0h
por el INE.
18
Ejemplo 4.
Con los datos del Ejemplo 1 realizar un cambio de base de 2005 a 2009.
19
Ejemplo 5.
En la siguiente tabla disponemos de una serie de Índices con periodo base
2000. Efectuar un cambio de base desde 2000 hasta 2002.
Solución:
2000 2001
2000
𝐼2000 100 2001
𝐼2000 127.9
𝐼2002 = 2002 ⋅ 100 = ⋅ 100 = 69.20 𝐼2002 = 2002 ⋅ 100 = ⋅ 100 = 88.51
𝐼2000 144.5 𝐼2000 144.5
2002 2003
2002
𝐼2000 144.5 2003
𝐼2000 178.9
𝐼2002 = 2002 ⋅ 100 = ⋅ 100 = 100 𝐼2002 = 2002 ⋅ 100 = ⋅ 100 = 123.8
𝐼2000 144.5 𝐼2000 144.5
2004
2004
𝐼2000 240.8
𝐼2002 = 2002 ⋅ 100 = ⋅ 100 = 166.64
𝐼2000 144.5
Para poder efectuar análisis comparativos de una serie de valor entre distintos
periodos, hay que pasarla de precios (euros) corrientes o de cada año, a precios
(euros) constantes o del periodo que se considere como base. El procedimiento es
dividir la moneda corriente por un índice de precios adecuado que se denomina
deflactor.
Si se desea expresar la renta disponible de las familias en moneda constante, el
deflactor será el IPC. Si se desea valorar un conjunto de productos industriales,
el deflactor será el IPI, etc.
Si denotamos: Entonces,
𝑥0𝑡 : precio constante del bien en el año base.
𝑥𝑡
𝑥𝑡 : precio corriente del bien en el año en curso 𝑡. 𝑥0𝑡 = ⋅ 100
𝐼0𝑡
𝐼0𝑡 : Índice del año 𝑡 con periodo base 0 (deflactor)
21
Ejemplo 6.
Una marca de electrodomésticos fabrica, en cierta cadena industrial,
cuatro tipos de lavadoras que reciben el nombre de modelo A, B, C y D.
En los años 2002, 2003 y 2004, los precios recomendados de venta y
el número de unidades de cada modelo producidos se recogen en la
siguiente tabla:
Calcular:
a. Índice de precios de Laspeyres con base 2002.
b. Índice de precios de Paasche con base 2002.
c. Valor en moneda constante de 2002 de la producción en los tres
años utilizando el índice de Paasche como deflactor.
22
σ𝑛
𝑖=1 𝑝𝑖𝑡 𝑞𝑖0
a. 𝐿𝑡0 = σ𝑛 ⋅ 100
𝑖=1 𝑝𝑖0 𝑞𝑖0
𝐿2002
2002 = 100
σ𝑛
𝑖=1 𝑝𝑖𝑡 𝑞𝑖𝑡
b. 𝑃0𝑡 = σ𝑛 ⋅ 100
𝑖=1 𝑝𝑖0 𝑞𝑖𝑡
2002
𝑃2002 = 100
2003
37 ⋅ 5200 + 45 ⋅ 2500 + 55 ⋅ 1700 + 68 ⋅ 1200
𝑃2002 = ⋅ 100 = 107.86
35 ⋅ 5200 + 40 ⋅ 2500 + 50 ⋅ 1700 + 65 ⋅ 1200
2004
40 ⋅ 5400 + 47 ⋅ 2500 + 58 ⋅ 1800 + 70 ⋅ 1300
𝑃2002 = ⋅ 100 = 114.11
35 ⋅ 5400 + 40 ⋅ 2500 + 50 ⋅ 1800 + 65 ⋅ 1300
23
Vamos a calcular la serie del valor de la producción en precios constantes del
año 2002. Para ello vamos a deflactar la serie de precios corrientes de cada año
utilizando el Índice de Precios de Paasche.
La producción en los años 2002, 2003 y 2004 en precios corrientes es:
Año 2002 :35·5000 + 40·3000 + 50·1500 + 65·1000 = 435000
Año 2003 :37·5200 + 45·2500 + 55·1700 + 68·1200 = 480000
Año 2004 :40·5400 + 47·2500 + 58·1800 + 70·1300 = 528900
El valor de la producción para el año 2002 a precios del año 2002 no cambia, es
435000 24
1.1.8 IPC - ÍNDICE DE PRECIOS DE CONSUMO
Necesidad:
El comportamiento de los consumidores varía considerablemente con
el tiempo.
Con el mismo dinero de un año 𝑡 no se pueden adquirir los mismos
bienes en un año 𝑡 ′ .
Se hace necesario establecer un índice para poder comparar la evolución
de los precios a lo largo de los años.
El Índice de Precios de Consumo o IPC es un índice tipo Laspeyres
encadenado que mide la evolución de los precios en España.
El encargado de elaborar este índice es el INSTITUTO NACIONAL DE
ESTADÍSTICA. (Más info en http://www.ine.es/metodologia/t25/t2530138_16.pdf).
Actualmente se está elaborando tomando como período base el año
2016.
25
Usos:
Medida de inflación.
Revisión de contratos de arrendamiento de inmuebles.
Referencia en la negociación salarial y en la fijación de las pensiones.
Actualizador de primas de seguros y otros tipos de contrato.
Cálculo:
Elegir una serie de productos y servicios básicos (“Cesta de la
compra”).
Se recoge información mensual de estos bienes y se calculan sus
índices.
Se utilizan unas ponderaciones que son los gastos o valores de los
bienes en el periodo base.
Estas ponderaciones se actualizan parcialmente cada año a través de
la Encuesta Continuada de Presupuestos Familiares.
MÁS INFORMACIÓN: Véase píldora de INE sobre Cesta de la
Compra
(https://www.youtube.com/watch?v=0xPvB4dlPCk&index=9&list=PLJulBV7cVXidU_cleHYJ9jNjfrByO9xqi)
26
La fórmula del cálculo del IPC es una media de los índices de precios de los
bienes de la cesta de la compra:
𝑚,𝑡
𝑚,𝑡
σ𝑛𝑖=1 𝑤𝑖𝑡−1 𝐼𝑖,𝑡−1
IPC𝑡−1 =
σ𝑛𝑖=1 𝑤𝑖𝑡−1
dónde:
𝑚,𝑡
IPC𝑡−1 es el IPC general en el mes 𝑚 del año 𝑡 referido al año 𝑡 − 1.
𝑤𝑖𝑡−1 es la ponderación del bien 𝑖 referida al año 𝑡 − 1.
𝑚,𝑡
𝐼𝑖,𝑡−1 es el índice del bien 𝑖 en el mes 𝑚 del año 𝑡 referido al año 𝑡 − 1.
27
Las ponderaciones utilizadas en el último año son:
2017
General 1.000
Alimentos y bebidas no alcohólicas 197.711
Bebidas alcohólicas y tabaco 30.190
Vestido y calzado 67.342
Vivienda 133.033
Menaje 58.765
Medicina 39.612
Transporte 146.693
Comunicaciones 35.960
Ocio y cultura 85.209
Enseñanza 16.793
Hoteles, cafés y restaurantes 121.193
Otros bienes y servicios 67.499
Ejemplo: Se quiere actualizar una Renta de 300 € del año 2008 al año 2017
utilizando el IPC de agosto de 2008 y el de agosto de 2017.
Solución:
8,2008
IPC2016 = 93.196
8,2017
IPC2016 = 101.553
8,2017
IPC2016 101.553
Renta2013 = Renta2008 ⋅ 8,2008 =300 ⋅ = 326.9€
IPC2016 93.196
VARIABLES ESTADÍSTICAS
30
A su vez, las variables Cualitativas se clasifican en:
Nominales: son las que toman valores entre los que no se puede
establecer un orden implícito. Por ejemplo: sexo, color de pelo …
Ordinales: son aquellas que toman valores entre los que sí se puede
establecer un orden intrínseco (aunque no sean números). Por
ejemplo: nivel de estudios, nivel de ingresos, …
31
RESUMEN:
Cualitativa:
Variable estadística
Discreta: nº zapato, edad (en años), …
Cuantitativa
32
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
33
En el caso en que los valores de la variable puedan ser ordenados de
menor a mayor 𝑥1 ≤ 𝑥2 ≤ ⋯ ≤ 𝑥𝑘 , se define:
34
Teniendo en cuenta los conceptos anteriores una tabla de distribución
de frecuencias para datos sin agrupar es de la forma:
𝑥𝑖 𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖 𝑝𝑖 𝑃𝑖
𝑥1 𝑛1 𝑓1 𝑁1 𝐹 𝑝1 𝑃1
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑥𝑘 𝑛𝑘 𝑓𝑘 𝑁𝑘 𝐹𝑘 𝑝𝑘 𝑃𝑘
𝑁 1
Las frecuencias acumuladas sólo tienen sentido cuando los datos 𝑥𝑖 son
números y se pueden ordenar. En el caso de que sean categorías, color
del pelo, tipo compra, etc. no tiene sentido este tipo de frecuencias.
35
Si el tamaño N de la muestra es grande o si se trata de una variable
estadística continua, suelen agruparse los datos en casillas o intervalos
de clase de la forma 𝐿𝑖−1 , 𝐿𝑖 donde 𝑖 = 1, … , 𝑘, sustituyendo cada valor
de la variable por la semisuma de los extremos del intervalo a que
pertenece. Esta semisuma se llama marca de clase, es decir, la Marca
de clase del intervalo [𝑳𝒊−𝟏 , 𝑳𝒊) es
𝑳𝒊−𝟏 + 𝑳𝒊
𝟐
37
DISTRIBUCIONES DE FRECUENCIAS MULTIDIMENSIONALES
38
Se denomina variable conjunta de X e Y a un par 𝑋, 𝑌 ordenado,
donde X, Y son las dos variables. Los valores vienen expresados por:
39
Tablas de correlación y contingencia.
Para organizar y resumir los datos, (valores o modalidades), contamos con
TABLAS DE CORRELACION para variables cuantitativas bidimensionales de
frecuencias y TABLAS DE CONTINGENCIA para variables cualitativas
bidimensionales. Dichas tablas son cuadros de doble entrada, como las
siguiente:
40
Ejemplo.
Las sucursales de una entidad bancaria presentaron los datos del ejercicio
correspondientes al año 2005.
Los siguientes datos corresponden a las variables 𝑋 =”Tipo de cuenta” e
𝑌 =”Saldo de las cuentas” (esta última en miles de euros) .
X/Y
[0,1] (1,5] (5,10] (10,100]
TOTAL
Plazo fijo 60 41 25 34
160
Cuenta Corriente 80 60 32 25
197
TOTAL 140 101 57 59 357
41
Distribuciones marginales.
X/Y
[0,1] (1,5] (5,10] (10,100]
TOTAL
Plazo fijo 60 41 25 34
160
Cuenta Corriente 80 60 32 25
197
TOTAL 140 101 57 59 357
𝒏𝒊𝒋 𝒇𝒊𝒋
Y
[0,1] 140 140 𝒏𝒊𝒋 𝒇𝒊𝒋
357 X
(1,5] 101 101 Plazo fijo 160 160
357 357
(5,10] 57 57 Cuenta 197 197
357 Corriente 357
(10,100] 59 59 suma 357 1
357
Suma 357 1
42
Distribuciones condicionadas.
43
Podemos calcular varias distribuciones condicionadas de una
distribución bidimensional.
Por ejemplo: 𝑿 condicionado a que 𝒀 es mayor que 1, o 𝒀
condicionado a que 𝑿 es a plazo fijo.
X/Y
[0,1] (1,5] (5,10] (10,100]
TOTAL
Plazo fijo 60 41 25 34
160
Cuenta Corriente 80 60 32 25
197
TOTAL 140 101 57 59 357
𝒏𝒊𝒋 𝒇𝒊𝒋
𝒀ൗ
𝑿 = plazo fijo 𝒏𝒊𝒋 𝒇𝒊𝒋
[0,1] 60 60/160 𝑿ൗ
𝒀>𝟏
(1,5] 41 41/160 Plazo fijo 100 100/217
(5,10] 25 25/160 Cuenta 117 117/217
(10,100] 34 34/160 Corriente
Diagramas de barras.
100
Frecuencia ni
0
8 12 14 15 16 17 18 19 20 21
Niv el educativ o
45
Polígonos de frecuencias
200
100
Frecuencia ni
0
8 12 14 15 16 17 18 19 20 21
Niv el educativ o
46
Diagrama de tallos y hojas. Para crearlo se consideran dos o tres cifras
significativas de los datos tomándose como tallos la primera o las dos
primeras cifras de cada dato y como hojas las últimas cifras de cada dato.
A continuación, separados por una línea vertical se representan los tallos a
la izquierda y las hojas a la derecha del tallo correspondiente.
47
Para variables cuantitativas continuas
Histograma
Histograma
Se marcan en el eje de abscisas los extremos de los intervalos de
clase, y sobre cada intervalo se construye un rectángulo cuya base
Se marcan en el eje de abscisas los extremos de los intervalos de clase, y
coincide con el intervalo y la altura es igual (o proporcional) a la
sobre cada intervalo se construye un rectángolo
𝑛 cuya base coincide con el
frecuencia de dicho intervalo. Generalmente 𝑎𝑖 , donde 𝑛𝑖 es la
intervalo y la altura es igual (o proporcional)𝑖 a la frecuencia de dicho
𝑓
frecuencia de clase
intervalo. y 𝑎𝑖 es la namplitud
Generalmente i/ai, delnintervalo,
donde i o 𝑖 donde
es la frecuencia 𝑓𝑖 es ylaai es
de clase
𝑎𝑖
la amplitud
frecuencia relativadel
. intervalo, o fi/ai donde fi es la frecuencia relativa .
h is t o g r a m a
14 0
12 0
10 0
80
60
40
D es v . t íp . = 170 75. 66
20
M e d ia = 34 419 .6
0 1 2 3 4 5 6 7 8 9 1 1 1 N1 = 4 74. 00
5 5 5 5 5 5 5 5 5 0 1 2 3
0 0 0 0 0 0 0 0 0 5 5 5 5
0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0
.0 .0 .0 .0 .0 .0 .0 .0 .0 0 0 0 0
.0 .0 .0 .0
S a l a r i o a c tu a l
48
Para variables cualitativas
Pictogramas
Los datos se representan gráficamente sustituyendo las barras del
diagrama de barras o los rectángulos del histograma por figuras alusivas
al carácter estudiado.
Cartogramas
Es la forma de representar sobre el mapa de la región estudiada los
caracteres correspondientes, bien empleando distintos colores, tramas
de distinta intensidad, o con una numeración adecuada.
49
Diagramas sectoriales
Consiste en representar mediante sectores circulares las distintas
modalidades de la variable de manera que los sectores han de tener un
ángulo central proporcional a la frecuencia correspondiente.
Direct ivo
17.7%
Seguridad
5. 7%
Administrat ivo
76.6%
Diagramas de Rectángulos
Todos los rectángulos tienen la misma base y sus áreas son
proporcionales a la frecuencia.
100
80
60
40
20
Porcentaje
50
Adminis trativo Seguridad Directivo
Categoría laboral
51
1.4 MEDIDAS DE POSICIÓN, DISPERSIÓN Y FORMA
52
1.4.1 MEDIDAS DE POSICIÓN DE TENDENCIA CENTRAL
Media aritmética 𝑿
ഥ
σ𝑘𝑖=1 𝑥𝑖 𝑛𝑖
𝑋ത =
𝑁
σ𝑘𝑖=1 𝑤𝑖 𝑥𝑖
𝑋ത𝑤 = 𝑘
σ𝑖=1 𝑤𝑖
54
Ejemplo 1:
Los ingresos anuales de un grupo de banqueros son de
62900 61600 62500 60800 1.200.000
El ingreso medio de estos banqueros es de 289560
OJO: Esta cifra no es para nada significativa de el sueldo de los
empleados, porque todos, salvo uno, cobran muchísimo menos que esa
cantidad. El último valor de un millón doscientos mil euros está
afectando mucho a la media.
𝒏𝒊 Marcas
Nº Empleados de clase 25 ⋅ 100 + 100 ⋅ 117 + 325 ⋅ 50
𝑋ത =
[0,50] 100 25 100 + 117 + 50
30450
(50,150] 117 100 = = 114.04
267
(150,500] 50 325
55
56
Mediana
Cálculo de la mediana
57
b. Para DATOS AGRUPADOS en intervalos se calcula:
Observando la columna de los 𝑁𝑖 , se busca el más pequeño que verifique
𝑁
que 𝑁𝑖 ≥ , y el intervalo mediano será 𝐿𝑖−1 , 𝐿𝑖 que se corresponde a ese
2
𝑁𝑖 . En este caso la mediana será:
𝑁
− 𝑁𝑖−1 0.5 − 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖−1 + 2 ⋅ 𝑎𝑖 = 𝐿𝑖−1 + ⋅ 𝑎𝑖
𝑛𝑖 𝑓𝑖
Donde,
𝐿𝑖−1 es el extremo inferior del intervalo mediano.
𝑁𝑖−1 es la frecuencia absoluta acumulada del intervalo anterior al mediano.
𝑛𝑖 es la frecuencia absoluta del intervalo mediano.
𝑎𝑖 es la amplitud del intervalo mediano.
58
En el ejemplo anterior:
Si ordenamos los ingresos anuales de los banqueros
60800 61600 62500 62900 1.200.000
La mediana de los ingresos de estos banqueros es de 62500.
Este valor es mucho más representativo que la media.
59
Ejemplo: Calcular la mediana de la siguiente variable 𝑌.
𝑁 357
Cómo = = 178.5 , entonces el intervalo mediano es el
2 2
𝑁
correspondiente al 𝑁𝑖 más pequeño tal que 𝑁𝑖 ≥ = 178.5: 𝟏, 𝟓
2
y por tanto
𝑁
− 𝑁𝑖−1 178.5 − 140
𝑀𝑒 = 𝐿𝑖−1 + 2 ⋅ 𝑎𝑖 = 1 + ⋅ 4 = 2.525
𝑛𝑖 101
60
Moda
Cálculo de la Moda:
a. Distribuciones NO agrupadas en intervalos.
Es el valor de la variable con mayor frecuencia absoluta.
b. Distribuciones agrupadas en intervalos de distinta amplitud.
Primero se calcula el intervalo modal 𝐿𝑖−1 , 𝐿𝑖 , que es el
𝑛
intervalo/s con mayor densidad ℎ𝑖 = 𝑎𝑖.
𝑖
Luego se calcula la moda usando la siguiente fórmula:
ℎ𝑖+1
𝑀𝑜 = 𝐿𝑖−1 + ⋅𝑎
ℎ𝑖+1 + ℎ𝑖−1 𝑖
Donde:
𝐿𝑖−1 es el extremo inferior del intervalo modal.
ℎ𝑖+1 y ℎ𝑖−1 son, respectivamente, las densidades de frecuencia
de los intervalos posterior y anterior al modal ℎ𝑖 .
𝑎𝑖 es la amplitud del intervalo modal.
61
Ejemplos: Cálculo de la moda de dos variables Y y X.
Y 𝒏𝒊 𝒂𝒊 𝒉𝒊
[0,1] 14 1 14
(1,5] 101 4 101/4=25.25
(5,10] 57 5 57/5=11.4
(10,20] 180 10 180/10=18
62
1.4.2 MEDIDAS DE POSICIÓN NO CENTRALES: LOS CUANTILES
63
Ejemplo de distribución de los CUARTILES
64
Cálculo del cuantil de orden 𝑝:
65
Ejemplo: Vamos a calcular el primer cuartil (𝑝 = 0.25) de la variable Y.
Y 𝒏𝒊 𝒂𝒊 𝒇𝒊 𝑵𝒊
[0,1] 140 1 140/357 140
(1,5] 101 4 101/357 241
(5,10] 57 5 57/357 298
(10,100] 59 90 59/357 357
Suma 357 1
66
Otros gráficos para variables cuantitativas continuas
Diagramas de caja
140000
29
120000
32
343
18
100000 446
103
34
106
454
431
274
71
35
80000 29 218
383
100
66
235
456
53
284
88
198
449
420
173
129
89
254
283
200
389
272
205
430
160
137
387
289
329
257
458
408
60000 343 101
27
50
406
341
130
187
371
1
348
205
160
431
32
446
198
456
173
40000 34
137
257
290
420
103
200
329
430
450
71
341
232
408
284
464
406
328
389
254
307
283
387
272
235
454
289
348
130
35
66
106
88
383
458
217
18
129
89
1
113
27
199
256
100
63
151
53
286
197
20000
0
N= 474 474
68
69
70
1.4.3 MEDIDAS DE DISPERSIÓN
Son medidas que nos indican la desviación de los valores de la variable
respecto de ciertas medidas de posición como la media aritmética o la
mediana. A la mayor o menor separación de los valores respecto a otro,
que se pretende sea su síntesis, se llama dispersión o variabilidad.
71
3. Varianza.
De todas las medidas de dispersión absolutas respecto a la media
aritmética, la varianza y su raíz cuadrada, la desviación típica son las
más importantes.
𝑘 ത 2 𝑛𝑖
σ 𝑖=1 𝑥 𝑖 − 𝑋
𝑆2 =
𝑁
También se puede calcular cómo:
σ𝑘𝑖=1 𝑥𝑖2 𝑛𝑖
2
𝑆 = − 𝑋ത 2
𝑁
Aunque la más utilizada por estimar mejor la varianza poblacional es
σ𝑘 ത 2
𝑖=1 𝑥𝑖 −𝑋 𝑛𝑖
la CUASIVARIANZA 𝑆መ 2 = 𝑁−1
Nº Empleados 𝒏𝒊 Marcas
de clase
[0,50] 100 25
(50,150] 117 100
(150,500] 50 325
73
Medidas de Dispersión relativas
74
1.4.4 MEDIDAS DE FORMA
Están relacionadas con la representación gráfica de la distribución.
Pueden ser:
Medidas de asimetría.
Asimetría positiva:
Si las frecuencias más altas se encuentran en el lado izquierdo de la
media, mientras que en derecho hay frecuencias más pequeñas (cola).
Asimetría negativa:
Cuando la cola está en el lado izquierdo.
75
Coeficiente de asimetría de Pearson:
𝑋ത − 𝑀𝑜𝑑𝑎
𝐴𝑝 =
𝑆
0.6
0.4
0.2
-8 -6 -4 -2 0 2 4 6 8
77
x