Está en la página 1de 46

M E D I DAS DE

C E N T R A L I ZA C I Ó N
CONTENIDO
Introducció n
Mediaaritmé tica
Mediana
Moda
I N T RO D U C C I O N
 Parámetro (poblacional): Es una cantidad numé rica
calculada sobre una població n
- Ejemplo: La altura media de los individuos de un país
- La idea es resumir toda la informació n que hay en la població n
en unos pocos nú meros (pará metros).

 Estadístico: Es una cantidad numé rica calculada sobre la


muestra.

⚫ La altura media de los que estamos en este aula.


 Somos una muestra (¿representativa?) de la població n.

 Si un estadístico se usa para aproximar un pará metro tambié n se


le suele llamar estimador.

⚫ Normalmente nos interesa conocer un parámetro, pero por la


dificultad que conlleva estudiar a *TODA* la población,
calculamos un estimador sobre una muestra y “confiamos” en
que sean próximos. Más adelante veremos como elegir
muestras para que el error sea “confiablemente” pequeño.
I N T RO D U C C I Ó N
 Centralización
⚫ Indican valores con respecto a los que los
datos parecen agruparse.
 Media, mediana y moda
 Posición
⚫ Dividen un conjunto ordenado de datos en grupos
con la misma cantidad de individuos.
 Cuantiles: percentiles, cuartiles, deciles,...
 Dispersión
⚫ Indican la mayor o menor concentración de los
datos con respecto a las medidas de centralización.
 Desviación típica, coeficiente de variación, rango,
varianza
 Forma
⚫ Asimetría o sesgo
⚫ Apuntamiento o curtosis
M E D I A A RI T M É T I C A
 Media Aritmé tica para una muestra: Consiste en
sumar todos los datos y dividirlos por N.
E J EM PLO
 El numero de hijos por familia queda
representado en la siguiente tabla. Calcular el
numero medio de hijos por familia
Xi ni xi.ni

0 5 0

1 6 6

2 8 16
42
𝑋𝑋� =25 =
3 4 12
1.68
4 2 8

25 42
MEDIANA
L a mediana (Me) de un
conjunto de observaciones se
define como el valor que
queda en la parte central de
este conjunto ordenados de
menor a mayor.
M E D I A NA E N DATO S N O A G RU PA D O S
 Se ordenan los datos de menor a mayor y
se busca el dato que ocupa la posició n
central.
⚫ Si la distribució n tiene un nº impar de
datos, habrá un solo dato, que
represente el valor central
⚫ Si la distribució n tiene un nº par de
datos, habrá dos valores, por tanto la
mediana será la media aritmé tica de los
dos datos que ocupan la posició n
central .
EJEMPLO 1
 Elnumero medio de hijos por familia en un
país africano es el siguiente:

2, 5, 6, 4, 5, 6, 4, 5, 3
 Para calcular la mediana:
 1º ordenamos los datos de menos a mayor:

2, 3, 4, 4, 5, 5, 5, 6, 6
 La mediana es el valor que ocupa la
posició n central es decir:

Me= 5
EJEMPLO 2
 Los sueldos de 8 trabajadores de una fá brica son
los siguientes:
650, 556, 722, 478, 570, 660, 814, 670
Para calcular la mediana:
1. Ordenamos los datos de menos a
mayor: 478, 556, 570, 650, 660, 670,
722, 814
En este caso tenemos dos valores que ocupan
posiciones centrales: 650 y 660
Luego la mediana será :
650+660
=655
2
M E D I A NA E N DATO S A G RU PA D O S
 Para calcular la mediana de n datos
tabulados por intervalos, primero se
determina el intervalo mediano que es aqué l
cuya frecuencia absoluta acumulada N i
excede de N/2.
 Luego se utiliza la fó rmula:

 donde:
⚫ L i es el límite inferior del intervalo que contiene a la
mediana.
⚫ N/2 semisuma de las frecuencias absolutas
⚫ N i - 1 = frecuencia acumulada de la clase anterior a la
que contiene a la mediana
⚫ 𝑎𝑖𝑖= amplitud del intervalo que contiene a la mediana
⚫ n i = frecuencia absoluta del intervalo mediano
EJEMPLO 3
ni Ni
El intervalo mediano es
[10, 15) 3 3
[20,25) es decir, i=3
[15, 20) 5 8
[20, 25) 7 15
[25, 30) 4 19
[30, 35) 2 21
21

𝑁 = 10.5
2
M O DA PARA
DA TO S N O
A G R U PA D O S
 Valor que má s se repite, o que presenta
mayor frecuencia absoluta (mayor ni ).

 Ejemplo: 2,3,3,4,4,4,5,5
Mo= 4
 Puede haber distribuciones
multimodales:
 Ejemplo: 2,3,3,3,4,4,4,5,5

 En este caso, hay dos modas:

Mo=3 y Mo=4
M O DA PA RA DATO S A G RU PA D O S E N
I N T E RVA L O S
 Se aplica la siguiente formula:

𝑀𝑜 = 𝐿𝑖𝑖 + 𝑛𝑖𝑖−𝑛𝑖𝑖−1 ∙ 𝑎𝑖𝑖


(𝑛𝑖𝑖−𝑛𝑖𝑖−1)+(𝑛𝑖𝑖−𝑛𝑖𝑖+1)
 Donde:
 L i : limite inferior del intervalo que contiene a la moda
 ni : frecuencia absoluta de la clase que contiene a
la moda
 ni-1: frecuencia absoluta de la clase inmediatamente
anterior a la que contiene a la moda
 ni+1 : frecuencia absoluta de la clase posterior a la que
contiene a la moda
 a i : amplitud de la clase que contiene a la moda
E J E M P L O : C A L C U L O D E L A M O DA PARA
VA L O R E S A G RU PA D O S

ni
[60-63) 5
[63-66) 18
[66-69) 42
M o = 𝐿𝑖𝑖 + 𝑛𝑖𝑖−𝑛𝑖𝑖−1 𝑎𝑖𝑖
[69-72) 27 𝑛𝑖𝑖−𝑛𝑖𝑖−1 + 𝑛𝑖𝑖−𝑛𝑖𝑖+1
[72-75] 8

100

42 − 18
𝑀𝑜 = 66 + 3 = 67,8
42 − 18 + (42 − 27)
M E D ID A S D E P O S I C IÓ N
M E D I DA S D E P O S I C I Ó N

Dividen la muestra en
varias partes.
Para calcular las medidas

de posición es necesario que


los datos esté n ordenados de
menor a mayor.
La medidas de posición se

llaman en general cuantiles.


P R I N C I P A L E S M E D I DA S DE
POSICIÓ N

 Percentil o centil
 Decil

 Cuartil

 Quintil

 Tercil
PERCENTILES
 El percentil k, al que simbolizaremos como 𝑃𝑘 , es
el valor numé rico de la variable tal que el k por
ciento de los datos ordenados está por debajo de
ese valor. En consecuencia, el (100 − 𝑘) por ciento
de los datos está por encima de 𝑃𝑘 .

𝑘 = 𝟏 , 𝟐 , 𝟑 … 𝟗𝟗
o Para hallar los percentiles primero detectamos a
qué intervalo pertenece el percentil que buscamos
y despué s procedemos a su cá lculo.
C A L C U L O D E L P E RC E N T I L PARA DATO S N O
A G RU PA D O S
Se siguen los siguientes pasos:
1) Se construye la tabla de frecuencias con los
datos ordenados de menos a mayor
2) Se calcula la columna de frecuencias absolutas
acumuladas
3) Es el primer valor cuya frecuencia absoluta acumulada
excede la cantidad :

𝑘·𝑁
100
Siendo:
𝑘: 1, 2, 3, … , 99
𝑁: Nú mero de datos de la distribució n (tamañ o
muestral)
E J EM PLO
 Calcular los percentiles 14 y 62

Xi ni Ni
2 6 6
3 15 21
4 10 31
5 9 40
40
14×40
𝑃14 → 𝐾 = 14; = 5,6 → 𝑃14 = 2
100

62×40
𝑃62 → 𝐾 = 62; = 24,8 → 𝑃62 = 4
100
C A L C U L O D E L P E RC E N T I L PARA
DATO S A G RU PA D O S

Localización
𝑘·𝑁
100
Identificación

𝑘 · 𝑁 − 𝑁 𝑖𝑖−1
𝑃𝑘 = 𝐿 𝑖𝑖 + 100 𝑎𝑖𝑖
𝑛𝑖𝑖
E JEM PLO
Calcular el percentil 35 de la siguiente
distribució n:
𝑘·𝑁
−𝑁𝑖𝑖−1
ni Ni 𝑃𝑘 = 𝐿𝑖𝑖 + 100 𝑎𝑖𝑖
𝑛𝑖𝑖
[50-60) 8 8 35×65
K= 35 → = 22,27
[60-70) 10 18 100

[70-80) 16 34
[80-90) 14 48
[90-100) 10 58
[100-110) 5 63
[110-120) 2 65
𝑃35 = 70 + 22,27−18 10 = 72,95
65 16
DECILES
 El decil k, al que simbolizaremos como 𝐷 𝑘 , es
el valor numé rico de la variable tal que el k por
ciento de los datos ordenados está por debajo de
ese valor. En consecuencia, el (100 − 𝑘) por ciento
de los datos está por encima de 𝐷 𝑘 .

𝑘 = 𝟏, 𝟐, 𝟑, … 𝟗
o Para hallar los deciles primero detectamos a que
intervalo pertenece el decil que buscamos y
despué s procedemos a su cá lculo.
C A L C U L O D E D E C I L E S PARA DATO S N O
A G RU PA D O S
Se siguen los siguientes pasos:
1) Se construye la tabla de frecuencias con los
datos ordenados de menos a mayor
2) Se calcula la columna de frecuencias absolutas
acumuladas
3) Es el primer valor cuya frecuencia absoluta acumulada
excede la cantidad :

𝑘·𝑁
10
Siendo:
k: 1, 2 , … … . 9
N: Nú mero de datos de la distribució n
E J E M P L O D E C I L E S PARA DATO S
N O A G RU PA D O S

 Calcular los Deciles 3 y 8

Xi ni Ni
2 6 6
3 15 21
4 10 31
5 9 40
40
3×40
𝐷3 → 𝑘 = 3; = 12 → 𝐷3 = 3
10

8×40
𝐷8 → 𝑘 = 8; = 32 → 𝐷8 = 5
10
C A L C U L O D E D E C I L E S PARA
DATO S A G RU PA D O S

Localización 𝑘·𝑁
𝐷𝑘 =
10

Identificación

𝑘 · 𝑁 − 𝑁 𝑖𝑖−1
10 𝑎𝑖𝑖
𝐷𝑘 = 𝐿𝑖𝑖 +
𝑛𝑖𝑖
E JEM PLO
Calcular el decil 6 de la siguiente distribució n:
𝑘·𝑁

𝐷𝑘 = 𝐿𝑖𝑖 + 10
−𝑁𝑖𝑖−1
𝑎 𝑖𝑖
𝑛𝑖𝑖
ni Ni
[50-60) 8 8 k= 6 →
6×65
= 39
10
[60-70) 10 18
[70-80) 16 34
[80-90) 14 48
[90-100) 10 58
[100-110) 5 63
[110-120) 2 65 39−34
65 𝐷6 = 80 + 10 = 83,57
14
C UA RT I L E S
 Son tres valores que dividen a un conjunto de datos
ordenados en cuatro partes del mismo tamañ o.
 𝑄𝑄1, 𝑄𝑄2 y 𝑄𝑄3 determinan los valores
correspondientes al 25%, 50% y 75% de los datos.
𝑄𝑄2 coincide con la mediana, el percentil 50 y
el decil 5

 En este caso:

k = 𝟏𝟏, 𝟐𝟐, 𝟑
o Para hallar los percentiles primero detectamos a qué
intervalo pertenece el percentil que buscamos y
despué s procedemos a su calculo.
E JEM PLO
 Calcular los cuartiles 1 y 3 de la siguiente
distribució n:
Xi ni Ni
2 6 6
3 15 21
4 10 31
5 9 40
40
1 � 40
𝑄𝑄1 → 𝐾 = 1 → 4
=10 → 𝑄
1𝑄
=3 3 � 40
𝑄𝑄3 → 𝐾 = 3 → 4
=30 → 𝑄
3𝑄
=4
C A L C U L O D E L O S C UA RT I L E S PARA DATO S
A G RU PA D O S

Localización 𝑘·𝑁
𝑄𝑄𝑘
4
=

Identificación

𝑘 · 𝑁 − 𝑁 𝑖𝑖−1
4 𝑎𝑖𝑖
𝑄𝑄𝑘 = 𝐿𝑖 𝑖
𝑛𝑖𝑖
+
E JEM PLO
Calcular el segundo cuartil de la siguiente
distribució n:
𝑘𝑁
−𝑁𝑖𝑖−1
ni Ni 𝑄𝑄2 = 𝐿𝑖𝑖 + 4
𝑛𝑖𝑖 𝑎𝑖𝑖
[50-60) 8 8 2×65
K= 2 → = 32,5
[60-70) 10 18 4

[70-80) 16 34
[80-90) 14 48
[90-100) 10 58
[100-110) 5 63
[110-120) 2 65
𝑄𝑄2 = 70 + 32,5−18 10 = 79,062
65 16
E Q U I VA L E N C I A S
 Equivalencias entre cuartiles, deciles y percentiles:

Cuartil 1 : Q1  P25

Cuartil 2 : Q2  P50  Me

Cuartil 3 : Q3  P75
M E D I DAS DE DISPERSIÓN

También podría gustarte