Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos
que comprenden el mismo número de valores.
Los cuantiles más importantes son los denominados cuartiles, deciles y percentiles.
Percentiles
Dividen el conjunto de datos en 100 partes porcentualmente iguales.
Pk
Cuartiles
Deciles
Décimo Décimo
inferior superior
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1=P10 D2 D3 D4 D5 D6 D7 D8 D9=P 90
Ejemplo 24
Si queremos determinar el puntaje mínimo para estar en el quinto superior, debemos calcular el
percentil 80.
Cálculo de un percentil
i= ( n+1
100 )
k=E ,d
donde:
n es el tamaño de muestra
E es la parte entera
0 , d es la parte decimal
donde:
X [ E ] es el dato de la posición E
X [ E +1 ] es el dato de la posición E+1
En Excel se usa la función =PERCENTIL.EXC(datos;k) donde k se escribe en forma decimal. Por ejem-
plo, si se quiere calcular el percentil 25, se usa la función =PERCENTIL.EXC(datos;0.25).
Ejemplo 25
En la figura se muestran los datos de algunos jugadores de la selección peruana y su edad en agosto
del 2020. Calcule e interprete el percentil 75 de la edad de estos jugadores.
Solución
Primero, ordenamos los datos.
Posición 13 14 15 16 17 18 19 20 21 22 23
Edad 28 29 30 30 30 30 30 31 31 35 36
i= ( n+1
100 )
k=E ,d
i= ( 23+
100 )
1
75=18 , 0
Esto quiere decir que, en agosto del 2020, el 75% de los jugadores de la selección peruana de fútbol
tenía 30 años o menos.
Estadística Descriptiva 2023 02 101
Ejercicios
93. Según los Censos Nacionales del 2017 en el Perú, el percentil 20 de la edad de los peruanos es
11 años. Interprete este valor.
94. Según los Censos Nacionales del 2017 en el Perú, el percentil 49 del número de habitaciones que
tiene una vivienda es 2. Interprete este valor. ¿Podría este percentil ayudar a entender la gran
cantidad de casos de COVID 19 en el Perú?
95. Rosa María Augusta Palacios McBride es una abogada y periodista peruana. Actualmente condu-
ce el programa Sin Guion trasmitido por YouTube en el canal RTV-La República, programa sobre
política peruana.
Se desea calcular algunas medidas de posición sobre el número de visualizaciones de sus videos
en febrero y marzo del 2023.
b. ¿Cuál debe ser el mínimo valor del número de visualizaciones diarias para pertenecer al 25% de
sus videos más vistos?
75% 25%
|-------------------------------------------------------------|-----------------|
P75
El mínimo valor del número de visualizaciones diarias para pertenecer al 25% de sus videos más
vistos es 89 916 visualizaciones.
c. ¿Cuál debe ser el máximo valor del número de visualizaciones diarias para pertenecer al 25% de
sus videos menos vistos?
25%
|------------------|-------------------------------------------------------------|
P25
El máximo valor del número de visualizaciones diarias para pertenecer al 25% de sus videos me-
nos vistos es 72 945 visualizaciones.
Estadística Descriptiva 2023 02 103
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Rango
P25intercuartil=RIC=Q
RIC = P - P – Q1=P
P 75 – P25
75 25 3 75
25% 50% 25%
Características del rango intercuartil
Se puede calcular en variables medidas en escala de intervalo o razón.
No se ve afectado por valores extremos.
Estadística Descriptiva 2023 02 104
Diagrama de cajas
El diagrama de cajas o box plot es una gráfica que describe la distribución de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango
intercuartil como medida de referencia de dispersión.
Se observa:
Tendencia central (Mediana). Permite concluir dónde los datos son mayores o menores.
Variabilidad o dispersión en el 50% central de datos (RIC: Rango intercuartil). Permite con-
cluir dónde los datos son más dispersos (heterogéneos) o menos dispersos (homogéneos). Se
observa el tamaño (alto) de la caja.
Asimetría (de manera gráfica en el 50% central de datos). Permite concluir si los datos se
concentran en valores bajos o altos (si la asimetría es positiva o negativa).
Si la mediana está en la parte inferior de la caja, cerca del P25, los datos se concentran en
valores bajos, por lo tanto, la asimetría en positiva.
Si la mediana está en la parte superior de la caja, cerca del P75, los datos se concentran en
valores altos, por lo tanto, la asimetría en negativa.
Si la mediana está exactamente en la mitad de la caja, la distribución es simétrica.
Valores atípicos. Permite concluir si existen valores atípicos bajos o altos.
Valor atípico
Es un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera valor atípico
a cualquier punto mayor al límite superior (a la derecha) o menor al límite inferior (o a la izquierda);
es decir, que se encuentre fuera de los límites.
Fuente: Variable 2
2. Trace un rectángulo con los extremos del percentil 25 y percentil 75, en cada categoría. En la caja
trace una recta horizontal en el lugar del percentil 50.
*
Categoría 1 Categoría 2 Categoría 3
Fuente: Variable 2
En el diagrama de cajas, también se puede poner las categorías en el eje vertical, con lo que
las cajas y los bigotes estarán de forma horizontal.
En la construcción del diagrama de cajas se pueden presentar dos casos, cuando el valor mínimo o
máximo son valores atípicos.
Por ejemplo, si el límite inferior Li=1 , 7 ; el percentil 25 P25=3 , 5 y los datos son:
Entonces:
Entonces:
Bigote superior
3,8 Percentil 75 P75
Estadística Descriptiva 2023 02 108
Valor atípico
*
P75 *
Variable cuantitativa P50
Máximo
P25
Rango Asimetría
RIC
Asimetría en el 50%
central
Valor atípico
*
Mínimo
Ejemplo 26
Los registros policíacos del distrito A muestran los números de informes de delitos diarios para una
muestra de días durante los meses de invierno y una muestra de días durante los meses de verano.
Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28
Construya un gráfico que permita comparar, entre invierno y verano, los valores medianos, la variabi-
lidad y encontrar los valores atípicos del número de delitos diarios. Se destinará más efectivos poli -
ciales en la estación (invierno o verano) que presente mayor cantidad de delitos.
Solución
Estadística Descriptiva 2023 02 109
Interpretación
Se debe hacer un gráfico que permita comparar la cantidad de delitos diarios.
Representación
Se hará un diagrama de cajas del número de delitos diarios por estación.
Cálculo
Calculemos los percentiles y los rangos intercuartiles. Se debe calcular los percentiles con datos sim-
ples. No calcule la distribución de frecuencias.
En el invierno, los bigotes llegan como mínimo a 5 y como máximo a 22 y en el verano, llegan como
mínimo a 5 y como máximo a 28.
Análisis y argumentación
La mediana es mayor en verano.
El RIC es más grande en invierno.
En ambas estaciones se observa asimetría negativa en el 50% central de datos (los datos se concen -
tran en valores altos).
No hay valores atípicos, pues ningún dato está fuera de los límites.
De acuerdo al gráfico se debe destinar más efectivos policiales en verano, ya que dicha estación se
tiene una mayor mediana.
Estadística Descriptiva 2023 02 110
Ejercicios
96. Según la página web https://www.facilito.gob.pe/, el precio del balón de gas de 10 kilos en las
ciudades de Cusco, Lima y Piura tiene el siguiente diagrama de cajas en el día 26 de febrero del
2023. Realice cuatro conclusiones usando el gráfico.
Fuente: Facilito.gob.pe
En Cusco, el valor mediano del balón de gas es el mayor, lo cual indica que los precios son
mayores en Cusco.
En el 50% de datos, la mayor variabilidad se presenta en Lima y la menor, en Piura.
La distribución de los precios en Piura es simétrica en el 50% central de datos. En Cusco, los
precios presentan una asimetría positiva. En Lima hay una ligera asimetría positiva.
Hay valores atípicos en Cusco y Lima. El máximo precio es 80 soles en Cusco y el mínimo es
en Lima con 33,20 soles.
97. Se quiere comparar los tiempos para realizar una cierta tarea,
con y sin capacitación. ¿Se podría afirmar que la capacitación
reduce el tiempo de realizar la tarea?
Análisis y argumentación
Tendencia central: Mediana
Los trabajadores con capacitación presentan una menor mediana. Se puede concluir que la
capacitación reduce el tiempo para realizar la tarea.
Variabilidad o dispersión en el 50% central de datos: RIC
La dispersión de los tiempos, en el 50% central de datos, es mayor para los trabajadores sin
capacitación, ya que tiene mayor RIC (20 para “Sin” y en el otro grupo 19) o una caja más
grande.
Asimetría para el 50% central de datos
Se pueden presentar 3 situaciones:
Asimetría negativa: Los datos se concentran en valores altos. (La mediana está más cerca al
P75)
Asimetría positiva: Los datos se concentran en valores bajos. (La mediana está más cerca al
P25)
Conclusión: Para los trabajadores sin capacitación se tiene una asimetría positiva en el 50%
central de datos (casi simétrica), lo que significa que los tiempos se concentran en valores
bajos.
Para los trabajadores con capacitación se tiene una asimetría negativa en el 50% central de
datos, lo que significa que los tiempos se concentran en valores altos.
Valores atípicos
Para los trabajadores sin capacitación se presentan dos valores atípicos altos; mientras que
para los trabajadores con capacitación se presenta solo un valor atípico alto.
Estadística Descriptiva 2023 02 112
98. El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en la si-
guiente tabla.
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60
Calcule el rango y el rango intercuartil de los datos. Rpta: Rango = 54, RIC = 6
i= ( n+1
100 )
k=E ,d
i= ( 51+1
100 )
75=39 , 0
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60
Percentil 25
Calculamos la posición i del percentil 25.
i= ( n+1
100 )
k=E ,d
i= ( 51+1
100 )
25=13 , 0
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60
Estadística Descriptiva 2023 02 113
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2
H1 19 19 19
0 1 1 2 2 2 2 3 3 3 4 5 5 6 6 7 8 8 0
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
H2 4 17 18
1 1 1 2 2 3 3 4 4 5 5 6 6 5 6 6 7
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
H3 9 9 15 17
0 0 0 1 2 2 2 2 3 3 3 3 4 4 5 5
Indique el horario con mayor mediana de notas, el horario con mayor rango intercuartil y el
horario donde existen valores atípicos.
El horario con mayor mediana de notas es H1, el horario con mayor rango intercuartil es H1 y el
horario donde existen valores atípicos es H2.
Ejercicios
101. Complete el siguiente cuadro con la mejor respuesta posible de acuerdo con la frase mencio-
nada.
“Determine el grupo que tenga mayor variabilidad Se elige el grupo con mayor rango intercuar-
en el 50% de los valores centrales” til
“Encuentre el grupo que tenga valores concentra- Se elige el grupo que tenga asimetría positi-
dos en los valores más pequeños” va
“Determine el grupo que tenga mayor variabilidad Se elige el grupo que tenga mayor coeficien-
de los datos” te de variación
“Haga un gráfico que muestre la distribución por- Barras agrupadas al 100% o barras apiladas
centual según la variable 1 por la variable 2” al 100%
“Calcule el valor mínimo para estar en el cuarto
superior de los datos” Percentil 75
102. Marque con una equis las medidas de resumen que se pueden calcular con una variable me -
dida en cada escala de medición.
Medida de resumen Nominal Ordinal Intervalo Razón
Media X X
Mediana X X X
Moda X X X X
Percentil X X X
Varianza X X
Desviación estándar X X
Coeficiente de variación X
Rango X X
Rango intercuartil X X
Coeficiente de asimetría X X