Está en la página 1de 48

ESTADÍSTICA GENERAL:

Medidas de centralidad y de localización

Antonio Bravo Quiroz


abravo@urp.edu.pe

Universidad Ricardo Palma

2020- 0

Antonio Bravo Q Estadı́stica General


Medidas de Tendencia Central:
Media Aritmética
Media Ponderada
Media Geométrica
Media Armónica
Mediana
Moda

Antonio Bravo Q Estadı́stica General


Medidas de Tendencia Central

Las medidas de tendencia central son estadı́sticas que resumen


la información contenida en un vector de datos cuantitativos
x = {x1 , x2 , · · · , xn } a cerca de la media poblacional µ mediante
un único valor central o promedio.
En esta sección estudiaremos los promedios: media aritmética,
media ponderada, media geométrica, media armónica, mediana y
moda, donde todos ellos se muestran como un valor posible del
parámetro µ ∈ R.

Antonio Bravo Q Estadı́stica General


Medidas de Tendencia Central
En la estadı́stica, una sumatoria es la representación abreviada de
una suma.
Sumatoria:
P
La sumatoria ( ) de los datos {x1 , x2 , ..., xn } es:
n
def
X
x1 + x2 + ... + xn = xi
i=1

donde los términos de la suma son xi , con i = 1, 2, · · · , n.


Ejemplo: La sumatoria de los 8 datos del vector:
x = {6.9, 4.5, 4.4, 7.3, 5.9, 3.2, 5.3, 3.7}
8
X
xi = 6.9 + 4.5 + 4.4 + 7.3 + 5.9 + 3.2 + 5.3 + 3.7
i=1
= 41.2
Antonio Bravo Q Estadı́stica General
Propiedades de una sumatoria:

Una sumatoria satisface todas las propiedades de una suma:

La sumatoria de una constante a, es:


n
X
a = a| + a +{z· · · + a} = na
i=1 n veces

El cuadrado de una suma es igual a la suma de cuadrados más el


doble de la suma de los productos cruzados:
n
!2 n n X
X X X
xi = xi2 +2 xi xj
i=1 i=1 i=1 j>i

Antonio Bravo Q Estadı́stica General


Propiedades de una sumatoria:

Si los datos xi sufren una transformación lineal

yi = a + bxi , i = 1, 2, · · · , n

entonces
n
X n
X n
X
yi = (a + bxi ) = na + b xi
i=1 i=1 i=1

n
X n
X n
X n
X
yi2 = (a + bxi )2 = na2 + b 2 xi2 + 2ab xi
i=1 i=1 i=1 i=1

Antonio Bravo Q Estadı́stica General


Sumatoria:
Ejemplo: Sean los datos
{33.7, 47.4, 30.4, 37.9, 32.2, 38.1, 34.5, 41.1}, con:
8
X 8
X
xi = 295.3 y xi2 = 11110.93
i=1 i=1
entonces:
8
X 8
X
(5.46xi + 67) = 5.46 xi + 8 × 67 = 2148.338
i=1 i=1

8
X 8
X
2
5.462 xi2 + 672 + 2 × 5.46 × 67xi

(5.46xi + 67) =
i=1 i=1
8
X 8
X
= 29.8116 xi2 + 4489 + 731.64 xi
i=1 i=1
= 583199.90

8 Antonio Bravo Q Estadı́stica General


Sumatoria:

" 8 #2 8
X X X
xi = xi2 + 2 xi xj
i=1 i=1 i<j

= 11110.93 + 2 × 38045.58 = 87202.09

Si se tinen 2 vectores de datos X , Y , entonces:


n
X n
X n
X
(xi + yi ) = xi + yi
i=1 i=1 i=1
n
X n
X n
X
(xi yi ) ̸= xi · yi
i=1 i=1 i=1

n n
!2
X X
xi2 ̸= xi
i=1 i=1
Antonio Bravo Q Estadı́stica General
Media Aritmética:
La media aritmética es un promedio que lo podemos asociar con
punto de equilibrio de una barra rı́gida expuesta a una serie de
fuerzas o pesos. Es el promedio más utilizado y de cálculo sencillo.
Media Aritmética
La media aritmética del vector de datos x = {x1 , x2 , ..., xn } es:
n
x1 + x2 + ... + xn 1X
x̄ = = xi
n n
i=1

Antonio Bravo Q Estadı́stica General


Media Aritmética
Las propiedades de la media aritmética:
De la definición de media aritmética, se tiene:
n
X
xi = nx̄
i=1

La media aritmética de la transformación lineal yi = a + bxi :


n n n
1X 1X X
ȳ = (a + bxi ) = a+ bxi = a + bx̄
n n
j=1 j=1 j=1

La suma de las desviaciones di = (xi − x̄) es cero. Esto es,


n
X n
X n
X
di = (xi − x̄) = xi − nx̄ = 0
i=1 i=1 i=1

Antonio Bravo Q Estadı́stica General


La Media Aritmética
Ejemplo En el siguiente cuadro se verifican las propiedades de la
media aritmética:
i xi 10xj + 5 xj − x̄
1 8.2 87 0.5
2 9.2 97 1.5
3 9.6 101 1.9
4 6.9 74 -0.8
5 10.1 106 2.4
6 7.3 78 -0.4
7 4.7 52 -3.0
8 6.5 70 -1.2
9 6.8 73 -0.9
P
69.3 738 0.0
Media 7.70 82 0.00
donde:
9
1 X 69.3
x̄ = xj = = 7.70
9 9
j=1
Antonio Bravo Q Estadı́stica General
Mediana

La mediana, es una medida de tendencia central que divide el


grupo de datos ordenados en dos mitades: el grupo de datos
menores y mayores que la mediana.
Mediana:
La mediana del vector de datos {x1 , x2 , ..., xn }, es el dato central
o medio de los datos ordenados, tal que, el 50 % de los datos son
menores que la mediana y el otro 50 % son mayores.

Antonio Bravo Q Estadı́stica General


Mediana

Cálculo de la mediana:
a) Si n es impar, existe un único dato central que es la mediana:

Me = x( n+1 )
2

b) Si n es par, existe dos datos centrales y la mediana es:


x( n ) + x( n+2 )
2 2
Me =
2

Ejemplo: Sea una muestra ordenada de tamaño n = 35:


20.6, 22.3, 23.9, 25.9, 26.2, 26.3, 28.0, 29.4, 29.4, 30.5, 30.6, 30.9,
31.1, 31.1, 31.1, 31.2, 31.7, 32.2, 33.4, 34.5, 34.9, 36.3, 36.4,
36.5, 36.7, 36.9, 38.1, 38.5, 39.4, 41.9, 42.5, 44.6, 47.7, 48.6, 53.9
Como n = 35 es impar, existe un único dato central o mediana:
Me = x( 35+1 ) = x(18) = 32.2
2
Antonio Bravo Q Estadı́stica General
Mediana:

Ejemplo: Los datos ordenados de la variable X , con n = 38:


32.7, 34.5, 35.6, 35.9, 36.2, 37.4, 39.1, 39.7, 41.1, 41.5, 41.6,
41.7, 41.9, 42.9, 43.2, 44.0, 44.5, 44.7, 45.1, 45.2, 45.3, 45.8,
46.1, 46.9, 47.0, 47.5, 48.1, 49.4, 49.6, 49.7, 50.1, 51.6, 52.1,
52.6, 52.9, 53.3, 56.2, 57.8
Como n = 38 es par, existen dos datos centrales y la mediana es:
x( 38 ) + x( 38+2 ) x(19) + x(20) 45.1 + 45.2
2 2
Me = = = = 45.15
2 2 2

En los dos ejemplos podemos observar que la mediana divide el


grupo de datos en dos mitades o 50 %: los datos menores que la
mediana y los datos mayores que la mediana.

Antonio Bravo Q Estadı́stica General


Moda:
La moda o valor modal, es el dato que más se repite y es el más
representativo del grupo de datos. Puede haber más de un dato
que más se repiten, por lo que no existe una única moda.
Moda
La moda del vector de datos {x1 , x2 , ..., xn } es el dato más
frecuente o el que más se repite.

Ejemplo: Hallar la moda para los siguientes datos:


29.4, 30.5, 31.1, 41.9, 25.9, 36.5, 30.9, 53.9, 31.2, 34.5, 38.1,
36.9, 20.6, 22.3, 34.9, 33.4, 36.4, 31.1, 29.4, 32.2, 39.4, 48.6,
42.5, 30.6, 38.5, 28.0, 26.2, 47.7, 36.3, 31.1, 23.9, 44.6, 26.3
Como los datos 31.1 se repiten 3 veces, la moda es: Mo = 31.1
Antonio Bravo Q Estadı́stica General
La media Ponderada:
La media ponderada es un promedio donde los datos xi tienen un
nivel de importancia reflejados en los pesos o ponderadores wi .

Media Ponderada
La media ponderada de los datos {x1 , x2 , · · · , xn } con pesos o
ponderadores {ω1 , ω2 , ..., ωn }, es:
n
X
ωi xi
i=1
X̄p = n
X
ωj
j=1

Podemos observarP que cada datos contribuye al promedio en la


proporción wi / wi , de modo que cuanto wi se hace grande, el
dato xi tendrá mayor importancia.

Antonio Bravo Q Estadı́stica General


Media Ponderada:

Ejemplo: Sea el vector de datos Xi (columna 1) y los pesos wi


para cada uno de los dos grupos (columna 2 y 4). La media
ponderada, en cada uno de los dos grupos, es:

Grupo I Grupo II
Xi ωi Xi ωi ωi Xi ωi
5.4 4.0 21.6 1.0 5.4
9.8 2.5 24.5 1.0 9.8
7.6 1.5 11.4 1.5 11.4
8.2 3.0 24.6 2.5 20.5
8.7 1.0 8.7 3.0 26.1
10.1 1.0 10.1 4.0 40.4
P
13.0 100.9 13.0 113.6
x̄p 7.8 8.7

Antonio Bravo Q Estadı́stica General


Media Geométrica:
La media geométrica es una media especializada para datos
positivos y expresados como una proporción o porcentaje ( %).

Media geométrica
La media geométrica para los datos {x1 , x2 , · · · , xn }, es:

n
!1/n
√ Y
X̄g = n
x1 x2 ... xn = xi
i=1

Ejemplo: Si la inflación de los últimos 6 años fueron:


5.4 %, 9.8 %, 7.6 %, 8.2 %, 8.7 %y 10.1 %
Los datos originales son proporciones PRt = Pt /P0 :
1.054, 1.098, 1.076, 1.082, 1.087, 1.101
y la media geométrica, es:

6
√6
x̄g = 1.054 ∗ 1.098 ∗ 1.076 ∗ 1.082 ∗ 1.087 ∗ 1.101 = 1.612498 = 1.089
Luego, la inflación mediaAntonio
de losBravoúltimos
Q 6 añosGeneral
Estadı́stica es 0.089 ó 8.9 % anual.
La media Geométrica
Una forma alternativa para calcular la media geométrica:

Definición (Media Geométrica)


Tomando logaritmos a ambos términos, se tiene:
n
1X
log X̄g = log xi
n
i=1

y tomando la inversa al logaritmo, que es la exponencial, se tiene:


( n )
1X
X̄g = exp log xi
n
i=1

Como el producto tiene la forma exponencial, esta expresión es útil


cuando el producto se hace muy grande o n es grande.

Antonio Bravo Q Estadı́stica General


La media Geométrica

Ejemplo: La variación del valor de las acciones de 16 empresas que


se cotizan en la Bolsa de Valores de Lima (VBL), en %, son:
28.10, 19.72, 39.83, 28.97, 13.27, 47.19, 19.60, 21.15, 14.89,
18.58, 11.77, 1.30, 14.07, 17.69, 20.13, 33.99
Los datos originales como cantidades relativas: PR = 1 + xi /100
1.2810, 1.1972, 1.3983, 1.2897, 1.1327, 1.4719, 1.1960, 1.2115,
1.1489, 1.1858, 1.1177, 1.0130, 1.1407, 1.1769, 1.2013, 1.3399
Luego, la media geométrica, es:

 
16 3.103231
x̄g = 22.26978 = exp = 1.214038
16

Luego, la variación promedio de las 16 acciones es del 21.4 %

Antonio Bravo Q Estadı́stica General


La media armónica
La media armónica es una media especializada para datos positivos
y expresados como una razón de 2 variables R = x/y > 0.
Media armónica
La media armónica para el vector de datos {x1 , x2 , · · · , xn }, es:
n n
X̄a = = n
1 1 1 X 1
+ + ··· +
x1 x2 xn xi
i=1

De acuerdo a la estructura de la expresión para el cálculo de la


media armónica, los datos deben ser positivos o mayores que cero.
Es estable cuando se presentan datos muy grandes, pero no pueden
ser muy pequeños o cercanos a cero.
Este promedio es util para datos relacionados con las variables
velocidad (espacio/tiempo), productividad, etc.
Antonio Bravo Q Estadı́stica General
La media armónica

Ejemplo: La productividad 6 obreros en la colocación de pisos, en


metros cuadrados por jornada de 8 horas, es:

15.4, 19.8, 17.6, 18.2, 18.7 y 10.1

La media armónica es:


6
X̄a =
1 1 1 1 1 1
+ + + + +
15.4 19.8 17.6 18.2 18.7 10.2
6
= = 15.80
0.3796892
La productividad media de los obreros es de 15.80 m2 por jornada.

Antonio Bravo Q Estadı́stica General


Promedios para datos agrupados en una tabla de
frecuencias:

Consideremos el caso donde el vector de datos cuantitativos

x = {x1 , x2 , · · · , xn }

fueron clasificados en una tabla de frecuencias con k clases:


I de C M de C FAS FAA FRS FRA
(L0 − L1 ] x1 n1 N1 f1 F1
(L1 − L2 ] x2 n1 N2 f2 F2
··· ··· ··· ··· ··· ···
(Lk−1 − Lk ] xk n1 Nk fk Fk
Total -.- n −.− 1 −.−

Para estos datos agrupados, se desea calcular las medidas de


tendencia central.

Antonio Bravo Q Estadı́stica General


Promedios para datos agrupados en una tabla de
frecuencias:

··· ··· ··· ··· ··· ···


(Lj−2 − Lj−1 ] xj−1 nj−1 Nj−1 fj−1 Fj−1
(Lj−1 − Lj ] xj nj Nj fj Fj
(Lj − Lj+1 ] xj+1 nj+1 Nj+1 fj+1 Fj+1
··· ··· ··· ··· ··· ···

Antonio Bravo Q Estadı́stica General


Promedios para datos agrupados:

Ejemplo: Consideremos la siguiente tabla de frecuencias:

I de C M de C nj Nj fj Fj
25.80 - 34.32 30.06 9 9 0.0677 0.0677
34.32 - 42.84 38.58 17 26 0.1278 0.1955
42.84 - 51.36 47.10 25 51 0.1880 0.3835
51.36 - 59.88 55.62 33 84 0.2481 0.6316
59.88 - 68.40 64.14 27 111 0.2030 0.8346
68.40 - 76.92 72.66 15 126 0.1128 0.9474
76.92 - 85.44 81.18 7 133 0.0526 1.0000

Los datos de la tabla serán utilizados para mostrar el cálculo de las


medidas de tendencia central o promedios.

Antonio Bravo Q Estadı́stica General


Promedios para datos de una tabla de frecuencias:
Media Aritmética para datos agrupados:
k
1X
x̄ = xi ni
n
i=1

donde los xj son las marcas de clase y nj las frecuencias de clase.

Ejemplo: En la tabla del ejemplo, las marcas de clase


mcx = {30.06, 38.58, 47.10, 55.62, 64.14, 72.66, 81.18}
y las frecuencias
fcx = {9, 17, 25, 33, 27, 15, 7}
entonces, la media aritmética, es:
7
1 X 7329.30
x̄ = xi n i = = 55.14
133 133
i=1

Antonio Bravo Q Estadı́stica General


Promedios para datos agrupados
Media Geométrica para datos agrupados:
v ( Pk
u k )
uY j=1 nj log xj
X¯g = t xi ni = exp
n

n
i=1

donde los xj son las marcas de clase y nj las frecuencias de la tabla.

Ejemplo: En la tabla del ejemplo, las marcas de clase


mcx = {30.06, 38.58, 47.10, 55.62, 64.14, 72.66, 81.18}
y las frecuencias
fcx = {9, 17, 25, 33, 27, 15, 7}
entonces, la media aritmética, es:

 
133 529.2166063
x̄g = 6.8525E + 229 = exp = 53.467
133
Antonio Bravo Q Estadı́stica General
Promedios para datos agrupados
Media Armónica para datos agrupados:
n n
X̄a = n1 n2 nk = X
k
+ + ··· + ni
x1 x2 xk
xi
i=1

donde los xj son las marcas de clase y nj las frecuencias de la tabla.

Ejemplo: En la tabla del ejemplo, las marcas de clase


mcx = {30.06, 38.58, 47.10, 55.62, 64.14, 72.66, 81.18}
y las frecuencias
fcx = {9, 17, 25, 33, 27, 15, 7}
entonces, la media aritmética, es:
133 133
x̄a = 9 7
= = 51.701
30.06 + · · · + 81.18
2.572481044
Antonio Bravo Q Estadı́stica General
Promedios para datos agrupados
Mediana para datos agrupados discretos:
La mediana de los datos discretos clasificados en una tabla de
frecuencias, es el dato distinto de la clase j:

Me = xj

donde
n
Nj−1 < ≤ Nj
2
la clase mediana o clase que contiene a la mediana, es la clase
sombreada de la tabla.
··· ··· ··· ··· ···
xj−1 nj−1 Nj−1 fj−1 Fj−1
xj nj Nj fj Fj
xj+1 nj+1 Nj+1 fj+1 Fj+1
··· ··· ··· ··· ···

Antonio Bravo Q Estadı́stica General


Promedios para datos agrupados
Mediana para datos agrupados continuos:
 
n/2 − Nj−1
Me = Lj−1 + · aj
nj

donde, la clase que contiene a la mediana es j, tal que:


n
Nj−1 < ≤ Nj
2
de modo que la clase mediana es la clase sombreada de la tabla

··· ··· ··· ··· ··· ···


(Lj−2 − Lj−1 ] xj−1 nj−1 Nj−1 fj−1 Fj−1
(Lj−1 − Lj ] xj nj Nj fj Fj
(Lj − Lj+1 ] xj+1 nj+1 Nj+1 fj+1 Fj+1
··· ··· ··· ··· ··· ···

la amplitud de la clase mediana es aj = Lj − Lj−1


Antonio Bravo Q Estadı́stica General
Promedios para datos agrupados

Ejemplo: Para aplicar la fórmula de la mediana a los datos de la


tabla del ejemplo, se tiene que:
133
N3 = 51 < = 66.5 ≤ 84 = N4
2
la clase mediana es j = 4; entonces,

L3 = 51.39, N3 = 51, n4 = 33 y a4 = 8.52

y
 
n/2 − N3
Me = L3 + · a4
n4
66.5 − 51
= 51.39 + ∗ 8.52 = 55.002
33

Antonio Bravo Q Estadı́stica General


Promedios para datos agrupados
Moda para datos agrupados discretos:
La moda de los datos discretos clasificados en una tabla de
frecuencias, es el dato distinto de la clase j:

Mo = xj

donde
nj = máx (n1 , n2 , · · · , nk )

La clase modal o clase que contiene a la moda, es la clase


sombreada de la tabla.
··· ··· ··· ··· ···
xj−1 nj−1 Nj−1 fj−1 Fj−1
xj nj Nj fj Fj
xj+1 nj+1 Nj+1 fj+1 Fj+1
··· ··· ··· ··· ···

Antonio Bravo Q Estadı́stica General


Promedios para datos agrupados
Moda para datos agrupados continuos:
 
d1
Mo = Lj−1 + · aj
d1 + d2

Donde, la clase modal es la clase j con mayor frecuencia. Esto es: j

nj = máx (n1 , n2 , · · · , nk )

de modo que la clase modal es la clase sombreada de la tabla:


··· ··· ··· ··· ··· ···
(Lj−2 − Lj−1 ] xj−1 nj−1 Nj−1 fj−1 Fj−1
(Lj−1 − Lj ] xj nj Nj fj Fj
(Lj − Lj+1 ] xj+1 nj+1 Nj+1 fj+1 Fj+1
··· ··· ··· ··· ··· ···
con d1 = nj − nj−1 , d2 = nj − nj+1 y la amplitud de la clase modal
es aj = Lj − Lj−1
Antonio Bravo Q Estadı́stica General
Promedios para datos agrupados

Ejemplo: Para aplicar la fórmula de la moda a los datos de la


tabla del ejemplo, se tiene que:

n4 = máx (n1 , n2 , · · · , n7 ) = 33

y la clase mediana es j = 4; entonces,

L3 = 51.39, n3 = 25, n4 = 33, n5 = 27, a4 = 8.52

y
 
d1
Mo = Lj−1 + · aj
d1 + d2
33 − 25
= 51.39 + ∗ 8.52 = 56.259
33 − 25 + 33 − 27

Antonio Bravo Q Estadı́stica General


Promedios para datos agrupados discretos
Ejemplo: Para los datos de la tabla, calcular la media aritmética,
la media geométrica y le media armónica, la mediana y la moda:

CLASES nj Nj fj Fj
23 9 9 0.0732 0.0732
24 16 25 0.1301 0.2033
25 29 54 0.2358 0.4391
26 37 91 0.3008 0.7399
27 19 110 0.1545 0.8944
28 13 123 0.1057 1.0001
Total 123 -.- 1.0000 -.-

a) Media aritmética:
6
1 X 3155
x̄ = x i ni = = 25.65
123 123
i=1

Antonio Bravo Q Estadı́stica General


Promedios para datos agrupados discretos
b) Media geométrica:
v
u 6
uY 398.9048
X¯G = t Xi ni = exp{
123
} = 25.61
123
i=1

c) Media armónica:
123 123
X̄A = 6
= = 25.58
X ni 4.809037
Xi
i=1
d) Mediana para datos discretos agrupados:
Como n/2 = 61.5 y N3 = 54 < n2 ≤ 91 = N4 , luego, la mediana es:
Me = x4 = 26.00
e) Moda para datos agrupados de tipo discreto:
Como n4 = 37 es la frecuencia máxima, entonces, la moda es:
Mo = x4 = 26
Antonio Bravo Q Estadı́stica General
Promedios para datos agrupados con R
# 1) Tabla de frecuencias datos discretos
# 1,1) Clases o datos distintos
vdd1 <- 23:28
# 1.2) Frecuencias absolutas
fasd <- c(9, 16, 29, 37, 19, 13)
facd <- cumsum(fasd)
# 1.3) Frecuencias relativas
frsd <- round(prop.table(fasd), 4)
frcd <- cumsum(frsd)
# 1.4) Tabla de frecuencias
cbind(vdd1, fasd, facd, frsd, frcd)
# 2) Media aritmética
sum(vdd1*fasd)/sum(fasd)
# 3) Media geométrica
exp(sum(fasd*log(vdd1))/123)
# 4) Media armónica
123/(sum(fasd/vdd1))
# 5) Mediana
# Como n = 123, N3 < n/2 = 61.5 <= 91 = N4
# Clase mediana: j = 4 ==> Me = x4 = 26
vdd1[4]
# 6) Moda
# Como mx(nj) = 37 = n4
# Clase modal j = 4 ==> Mo = x4 = 26
vdd1[4]
Antonio Bravo Q Estadı́stica General
#########################################
Media aritmética para datos agrupados de tipo continuo
Ejemplo: Consideremos una tabla de frecuencias para datos de
tipo continuo:
I de C M de C ni Ni Xi ni
35 - 49 42.0 8 8 336
49 - 63 56.0 12 20 672
63 - 77 70.0 18 38 1260
77 - 91 84.0 29 67 2436
91 - 105 98.0 18 85 1764
105 - 119 112.0 12 97 1344
119 - 133 126.0 11 108 1386
133 - 147 140.0 6 114 843
TOTAL -.- 114 -.- 10041

1) Media aritmética:
8
1 X 10041
x̄ = xi ni = = 88.053
114 114
i=1
Antonio Bravo Q Estadı́stica General
Media para datos agrupados de tipo continuo
2) Mediana para datos agrupados de Tipo continuo:
Como
n
n/2 = 114/2 = 57 y N3 = 38 < ≤ 67 = N4
2
la clase mediana es la clase j = 4, con L3 = 77, n4 = 29, N3 = 38
y a = 14, luego:
57 − 38
Me = 77 + · 14 = 86.172
29

3) Moda para datos agrupados de tipo continuo:


Como
n4 = máx{n1 , n2 , · · · , n8 } = 29
La clase modal es la clase j = 4, con L3 = 77, d1 = 29 − 18 = 11,
d2 = 29 − 18 = 11 y a = 14, luego:
11
Me = 77 + · 14 = 84.00
11 + 11
Antonio Bravo Q Estadı́stica General
Media para datos agrupados de tipo continuo con R
# 1) Datos de la tabla
lcdc <- 35+0:8*14
mcdc <- (35+49)/2+0:7*14
fasc <- c(8, 12, 18, 29, 18, 12, 11, 6)
facc <- cumsum(fasc)
adc <- 105 - 91
# 2) Media aritmética
madc <- sum(mcdc * fasc)/sum(fasc)
# 3) Mediana
# Clase mediana j = 4
sum(fasc)/2 <= facc
Medc <- lcdc[4] + (sum(fasc)/2 - facc[3])/fasc[4] * adc
# 4) Moda
# Clase modal j = 4
max(fasc)
modc <- lcdc[4] + (fasc[4] - fasc[3])/(fasc[4] - fasc[3]
+ fasc[4] - fasc[5]) * adc
Antonio Bravo Q Estadı́stica General
Medidas de Localización
Cuantiles
Cuartiles
Deciles
Percentiles

Antonio Bravo Q Estadı́stica General


Medidas de Localización
Las medias de localización o de posición permiten ubicar un punto
o cuantil en la distribución de los datos que divide los datos
ordenados en dos grupos complementarios: menores y mayores que
el cuantil.
Cuantil
El cuantil de nivel α es el dato xα que divide el grupo de datos
ordenados en la proporción α % a la izquierda de xα y (1 − α) % a
la derecha de xα .

Antonio Bravo Q Estadı́stica General


Medidas de Localización
Ejemplo: Se tienen 40 datos ordenados de la variable X :

1 2 3 4 5 6 7 8 9 10
33.8 37.6 38.2 39.2 40.6 40.9 41.1 41.8 42.1 44.3
47.7 48.5 49.4 50.4 51.5 51.9 52.6 54.1 57.9 58.1
61.5 62.3 63.1 63.2 65.5 68.9 70.2 71.3 71.5 72.3
73.0 73.2 74.6 76.1 76.4 76.6 78.9 80.9 87.4 88.9

(a) Se desea ubicar los datos que pertenecen al tercio superior.


Para esto debemos clasificar los datos en tercios y el tercio
superior se inicia en el cuantil 66.7 %, que es:
TS2 = x0.667 = 70.2143

(b) Se desea ubicar los datos que pertenecen al quinto superior.


Para esto debemos clasificar los datos en quintos y el quinto
superior se inicia en el cuantil 80.0 %, que es:
QS4 = x0.80 = 73.48
Antonio Bravo Q Estadı́stica General
Los cuantiles de uso frecuente son los cuartiles, deciles y
percentiles:
Cuartiles:
Los cuartiles son los cuantiles 25 %, 50 %, y 75 % que dividen al
grupo de datos ordenados en cuartos: Q1 , Q2 y Q3 , donde:

Q1 = x0.25 , Q2 = x0.50 y Q3 = x0.75

Antonio Bravo Q Estadı́stica General


Medidas de Localización

Ejemplo: Se tienen 40 datos ordenados de una variable X :

1 2 3 4 5 6 7 8 9 10
33.8 37.6 38.2 39.2 40.6 40.9 41.1 41.8 42.1 44.3
47.7 48.5 49.4 50.4 51.5 51.9 52.6 54.1 57.9 58.1
61.5 62.3 63.1 63.2 65.5 68.9 70.2 71.3 71.5 72.3
73.0 73.2 74.6 76.1 76.4 76.6 78.9 80.9 87.4 88.9

Para obtener los cuartiles, inicialmente calculamos la mediana y


luego, la mediana del grupo de datos menores y la del grupo de
datos mayores.
Los cuartiles son:

Q1 = x0.25 = 46.850, Q2 = x0.50 = 59.800 y Q3 = x0.75 = 88.900

Antonio Bravo Q Estadı́stica General


Los deciles clasifican los datos ordenados en 10 clases secuenciales
e iguales, donde cada clase contiene el 10 % de los datos. Son muy
usados para segmentar poblaciones.

Deciles:
Los deciles son los cuantiles 10 %, 20 %, · · · , 90 % que dividen al
grupo de datos ordenados en diez partes:

D1 = x0.10 , D2 = x0.20 · · · , D9 = x0.90

Antonio Bravo Q Estadı́stica General


Medidas de Localización

Ejemplo: Se tienen 40 datos ordenados de una variable X :

1 2 3 4 5 6 7 8 9 10
33.8 37.6 38.2 39.2 40.6 40.9 41.1 41.8 42.1 44.3
47.7 48.5 49.4 50.4 51.5 51.9 52.6 54.1 57.9 58.1
61.5 62.3 63.1 63.2 65.5 68.9 70.2 71.3 71.5 72.3
73.0 73.2 74.6 76.1 76.4 76.6 78.9 80.9 87.4 88.9

Los deciles son:

10 % 20 % 30 % 40 % 50 % 60 % 70 % 80 % 90 %
40.46 42.04 49.13 52.32 59.80 64.12 71.36 73.48 76.83

Antonio Bravo Q Estadı́stica General


Percentiles
Los percentiles son los cuantiles 1 %, 2 %, · · · , 99 % dividen al
grupo de datos ordenados en cien partes:

C1 = x0.01 , C2 = x0.02 · · · , C99 = x0.99

Antonio Bravo Q Estadı́stica General

También podría gustarte