Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONJUNTO DE DATOS
MSc. Ing. Juan Carlos Acosta Jiménez
Estadística Descriptiva
Caracterización de un conjunto de datos 2
Caracterización de un conjunto de datos 3
# ! $# !
$ "#
Si 𝑛 es par, entonces 𝑀" = $
%
∑,%*+ 𝑥% 𝑥+ + 𝑥- + 𝑥. + 𝑥/ + 𝑥0 + 𝑥,
𝑥̅&%ñ() = = = 20
6 6
∑6%*+ 𝑦% 𝑦+ + 𝑦- + 𝑦. + 𝑦/ + 𝑦0 + 𝑦, + 𝑦7 + 𝑦6
𝑦612345() = = = 72
8 8
El ascensor está sobrecargado si el peso total supera los 700 kilos, en este caso
tenemos:
, 6
∑--8
%*+ 𝑥% 𝑥+ + 𝑥- + 𝑥. + ⋯ + 𝑥--8
𝑥̅5(514 = = = $1.200.000
220 220
∑66
%*+ 𝑥% ∑--8
%*69 𝑥%
𝑥+̅ = 𝑥̅- =
88 132
7
Luego,
𝑥+ + 𝑥- + 𝑥. + ⋯ + 𝑥66 + 𝑥69 + 𝑥98 + 𝑥--8
= $1.200.000
220
88𝑥+̅ + 132𝑥̅-
= $1.200.000
220
220𝑥+̅ = $287.760.000
$287.760.000
𝑥+̅ =
220
𝑥+̅ = $1.308.000
El rango es sensible
a outliers.
Caracterización de un conjunto de datos 9
11 − 15.5 & + 12 − 15.5 & + 13 − 15.5 & + 16 − 15.5 &+ 16 − 15.5 & + 17 − 15.5 & + 18 − 15.5 & + 21 − 15.5 &
=
8−1
−4.5 & + −3.5 & + −2.5 & + 0.5 & + 0.5 & + 1.5 & + 2.5 & + 5.5 &
=
7
78
=
7
= 11.1428571
= 3.33809184
= 3.338
Caracterización de un conjunto de datos 11
78 78 82 85 81 86 80 73 84 78
68 84 75 78 76 76 82 85 91 80
70 87 77 82 84 48 49 39 39 43
35 42 34 44 49 34 30 43 31 34
41 42 45 42 35 38 39 42 43 29
• Deciles: existen nueve deciles 𝐷# ,𝐷% ,𝐷& , 𝐷8 , 𝐷; , 𝐷< , 𝐷: , 𝐷= , 𝐷> que dividen
a un conjunto de datos numéricos en 10 partes iguales.
Caracterización de un conjunto de datos 20
𝒙 𝒌 + 𝒅 𝒙 𝒌'𝟏 − 𝒙 𝒌
Ejemplo: Determine los percentiles 𝑃() , 𝑃)* , 𝑃*+ , 𝑃,+ , 𝑃-* , 𝑃.- , 𝑃/+ en el siguiente
conjuntos de datos e interprete.
Solución.
Para el percentil 𝑃+- tenemos.
1er paso.
Ordenamos los datos ascendentemente
𝒌 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
𝒙𝒌 1,5 1,9 1,9 2 2,1 2,3 2,4 3 3,2 3,2 3,4 3,6 3,6 3,8 4,2 4,2 4,7 6,4
2do paso.
Tenemos que 𝑝 = 12 y 𝑛 = 18, reemplazando obtenemos el valor del índice
𝑝 𝑛−1 12 18 − 1 204
𝑖= +1= +1= + 1 = 3.04 = 3 + 0.04
100 100 100
Donde 𝑘 = 3 y 𝑑 = 0.04
Caracterización de un conjunto de datos 22
Por tanto, el 12% de los datos tiene valores menores o iguales a 1.904 (También
podemos concluir que el 88% de los datos tienen valores mayores o iguales a 1.904)
𝒌 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
𝒙𝒌 1,5 1,9 1,9 2 2,1 2,3 2,4 3 3,2 3,2 3,4 3,6 3,6 3,8 4,2 4,2 4,7 6,4
2do paso.
Tenemos que 𝑝 = 25 y 𝑛 = 18, reemplazando obtenemos el valor del índice
𝑝 𝑛−1 25 18 − 1 425
𝑖= +1= +1= + 1 = 5,25
100 100 100
Donde 𝑘 = 5 y 𝑑 = 0,25.
3er paso.
El percentil 𝑃-0 es igual a: 𝑃-0 = 𝑄+ = 𝑥 M + 𝑑 𝑥 MN+ − 𝑥 M
= 𝑥 0 +𝑑 𝑥 , − 𝑥 0
= 2,1 + 0,25 2,3 − 2,1
= 2,1 + 0,25 0,2
= 2,1 + 0,05 En excel,
= 2,15 =PERCENTIL(matriz;k)
Por tanto, el 25% de los datos tienen valores menores o iguales a 2,15, lo cual es
equivalente a decir, el 75% de los datos tienen valores mayores o iguales a 2,15.
Caracterización de un conjunto de datos 24
Datos con sesgo negativo Datos insesgados Datos con sesgo positivo
(cola a la izquierda) (cola a la derecha)
Caracterización de un conjunto de datos 25