Está en la página 1de 20

CUARTILES, DECILES,

PERCENTILES
MEDIDAS DE UBICACIÓN
CUARTILES, DECILES Y PERCENTILES

• En un conjunto de datos en el que éstos se hallan ordenados de


acuerdo con su magnitud, el valor de en medio (o la media
aritmética de los dos valores de en medio), que divide al conjunto
en dos partes iguales, es la mediana. Continuando con esta idea se
puede pensar en aquellos valores que dividen al conjunto de datos
en cuatro partes iguales. Estos valores, denotados Q1, Q2 y Q3 son
el primero, segundo y tercer cuartiles, respectivamente; el valor
Q2 coincide con la mediana.
CUARTILES, DECILES Y PERCENTILES
• De igual manera, los valores que dividen al conjunto en diez
partes iguales son los deciles y se denotan D1,D2, . . . , D9, y los
valores que dividen al conjunto en 100 partes iguales son los
percentiles y se les denota P1, P2, . . . ,P99. El quinto decil y el
percentil 50 coinciden con la mediana. Los percentiles 25 y 75
coinciden con el primero y tercer cuartiles, respectivamente.
• A los cuartiles, deciles, percentiles y otros valores obtenidos
dividiendo al conjunto de datos en partes iguales se les llama en
conjunto cuantiles.
CUARTILES, DECILES Y PERCENTILES

EJERCICIO

Análisis de diagrama caja


Diagrama de Caja
Análisis de diagrama caja
Diagrama de caja

• Un diagrama de caja es la representación gráfica, basada en


cuartiles, que ayuda a exhibir un conjunto de datos. Para construir
un diagrama de caja, sólo necesita cinco estadísticos: el valor
mínimo, Q1 (primer cuartil), la mediana, Q3 (tercer cuartil) y el
valor máximo. Un ejemplo ayudará a explicarlo.
Diagrama de caja
• Alexander’s Pizza ofrece entregas gratuitas de pizza a 15 millas a la
redonda. Alex, el propietario, desea información relacionada con el
tiempo de entrega. ¿Cuánto tiempo tarda una entrega típica? ¿En qué
margen de tiempos deben completarse la mayoría de las entregas? En el
caso de una muestra de 20 entregas, Alex recopiló la siguiente
información:
• Valor mínimo = 13 minutos
• Q1 = 15 minutos
• Mediana = 18 minutos
• Q3 = 22 minutos
• Valor máximo = 30 minutos
• Elabore un diagrama de caja para los tiempos de entrega. ¿Qué
conclusiones deduce sobre los tiempos de entrega?
Diagrama de caja
Diagrama de caja

• El diagrama de caja muestra que el valor medio de las entregas,


50%, consume entre 15 y 22 minutos. La distancia entre los
extremos de la caja, 7 minutos, es el rango intercuartil. Este
rango es la distancia entre el primer y el tercer cuartil; muestra la
propagación o dispersión de la mayoría de las entregas.
• El diagrama de caja también revela que la distribución de los
tiempos de entrega tiene un sesgo positivo.
Diagrama de caja

• En este caso hay dos piezas de información que lo sugieren.


• Primero, la línea punteada a la derecha de la caja, que va de 22
minutos (Q3) al tiempo máximo de 30 minutos, es más larga que la
línea punteada a la izquierda que va de 15minutos (Q1) al valor mínimo
de 13 minutos. En otras palabras, 25% de los datos mayores que el
tercer cuartil se encuentra más disperso que el 25% menor que el
primer cuartil.
• Una segunda indicación del sesgo positivo es que la mediana no se
encuentra al centro de la caja. La distancia del primer cuartil a la
mediana es menor que la distancia de la mediana al tercer cuartil. El
número de tiempos de entrega entre 15 y 18 minutos es el mismo que
el número de tiempos de entrega entre 18 y 22 minutos.
Diagrama de caja

• EJERCICIO
OTRAS MEDIDAS DE
DISPERSIÓN
MEDIDAS DE DISPERSIÓN
Rango Intercuartílico

• El Rango intercuartílico IQR ( o rango intercuartil) es una


estimación estadística de las dispersión de una distribución de
datos.
• Consiste en la diferencia entre el tercer cuartil y el primer cuartil.
Mediante esta medida se eliminan los valores extremadamente
alejados. El rango intercuartílico es altamente recomendable
cuando la medida de tendencia central utilizada es la mediana (ya
que este estadístico es insensible a posibles irregularidades en los
extremos).
• IQR =
Rango Intercuartílico

• Con el rango intercuartílico podemos elaborar Diagramas de Caja,


que es un instrumento muy visual para evaluar la dispersión de
una distribución.
Rango semi - intercuartil

• El Rango semi-intercuartil es un medio de la diferencia entre el


tercer y primer cuartiles. Es la mitad de la distancia requerida
para cubrir la mitad de las cuentas. El rango semi-inercuartíl es
afectado muy poco por cuentas extremas. Esto lo hace una buena
mediad de dispersión para distribuciones sesgadas.
Rango Interpercentil

• Es la diferencia entre el percentil 99 (P99) Y el percentil 1 (P1).


• RIP= P99-P1
Para poder hallar el RIP primero se deben hallar los percentiles 1 y
99
I=(Pxn)/100
P=Posición del percentil
n=Tamaño de la muestra
Si I es no entero: Redondearlo al entero mayor
Si I es entero: Promedio de las posiciones I e (I+1)
Dispersión Relativa o Coeficiente de Variación

• Una medida de dispersión relativa de datos que toma en cuenta su


magnitud está dada por el coeficiente de variación. Es una medida
de dispersión que describe la variación en los datos en relación a
la media.
• El coeficiente de variación (CV) es una medida de la dispersión
relativa de un conjunto de datos que se obtiene dividiendo la
desviación estándar del conjunto entre su media aritmética y se
expresa en términos porcentuales.
• Interpretación: Mientras mayor sea el coeficiente de variación,
mayor será la dispersión de datos.
Dispersión Relativa o Coeficiente de Variación

• Propiedades:
• Puesto que tanto la desviación estándar como la media se miden
en unidades originales, el CV es una medida independiente de las
unidades de medición.
• Debido a la propiedad anterior el CV es la cantidad más adecuada
para comparar la variabilidad de los conjuntos de datos.
Dispersión Relativa o Coeficiente de Variación

• Métodos de Cálculo:
• Para la población se emplea la siguiente fórmula:
• 𝐶𝑉 = (σ/µ) * 100%
• Donde:
• CV = Coeficiente de variación
• σ = desviación estándar de la población
• µ = media aritmética de la población
Dispersión Relativa o Coeficiente de Variación

• Para la muestra se emplea la siguiente fórmula


• 𝐶𝑉 = (𝑆/X) * 100%
• Donde:
• CV = Coeficiente de variación
• 𝑆 = desviación estándar de la muestra
• X = media aritmética de la muestra

También podría gustarte