Está en la página 1de 6

Cuartiles y Percentiles

Los cuartiles: son valores que dividen una serie de datos, previamente ordenados en forma
creciente en 4 partes iguales; en consecuencia, existen 3 cuartiles que denotaremos por: Q1,
Q2, Q3, siendo el cuartil Q2 igual a la mediana.

Ejemplo: El siguiente grupo de datos representan las edades de un grupo de estudiante

25% 25% 25% 25%


17 18 18 20 21 22 24 24 25 27 27 28

Q1 Q2 Q3
50% mediana 50%

Los cuartiles se calculan siguiendo el concepto de la mediana.

El segundo cuartil es la mediana de todo el conjunto de datos Q2=23. El primer cuartil


Q1=19 lo podemos definir como la mediana del conjunto que contiene los datos más
pequeños y el tercer cuartil Q3=26 es la mediana del conjunto que tiene los datos más
grandes. Observe que:

1) Entre 2 cuartiles cualesquiera se encuentran siempre un 25% de


los datos
2) El 25% de los valores es menor que el primer cuartil (Q1)
3) El 50% de los valores es menor que el segundo cuartil (Q2)
4) El 75% de los valores es menor que el tercer cuartil (Q3)
5) El 25% de los valores es mayor que el tercer cuartil (Q3)
Rango intercuartil: es la diferencia entre el tercer y el primer cuartil, se denota por
RI.

RI= Q1-Q2

Percentiles: los valores que dividen una serie de datos ordenados, de menor a mayor, en 100
partes iguales se llaman percentiles. Existen 99 percentiles que se denotan por: P1, P2,
P3,………., P98, P99. Entre dos percentiles consecutivos cualesquiera se encuentra un 1% ò
1/100 parte de los datos. El cálculo de los percentiles es útil si se dispone al menos de
25 a 30 datos. Cuando se disponen de pocos datos su cálculo o interpolación no tiene mucho
sentido.

El percentil Ph de un conjunto de datos ordenados es aquel valor que como máximo una
porción h/100 o h% de datos son menores que él. Si el número de datos es n, para calcular la
ubicación i del percentil h hacemos una regla de tres:
ℎ ∗𝑛
100 i es el número de
n 100% 𝑖=
datos por debajo
i h% del percentil Ph
Ejemplo: los datos a continuación representan los pesos (Kg) de un grupo de 50 estudiantes
masculinos.

39 58 68 81 92
40 59 70 82 92
41 62 71 84 93
43 63 73 85 95
49 64 74 86 103
50 65 75 88 104
51 66 75 89 106
54 66 76 91 106
56 67 77 91 108
57 67 78 92 112

Calcular los siguientes percentiles: P25; P30; P50;P75; P90. (Las posiciones de estos percentiles
están marcados en la tabla de datos)

Solución

a) P25 es un valor por debajo del cual está el 25% de los datos

25 ∗ 50
50 100% 𝑖= = 12,5

i 25%

100 i=12,5 número de


datos por debajo
del percentil P 25

Ubicamos el dato número i en la tabla de datos ordenada, como el valor 12,5 no es un número
entero, ubicamos la posición entera siguiente, en este caso la posición i del percentil 25 (P25)
es i=13

𝑃25 = 𝑋13 = 62
El 25% de los pesos de este grupo de estudiantes es menor que 62 Kg

*Calcular el Q1 y comprobar que es “igual” al P25.

b) El percentil 30 (P30) es un valor por debajo del cual está el 30% de los datos.

30 ∗ 50 i=15 es el número
50 100%
de datos por debajo
𝑖= = 15
i 30% del percentil P 30
100
Diagrama de Caja
El diagrama de caja es un gráfico utilizado para representar una variable cuantitativa
(variable numérica). El gráfico es una herramienta que permite visualizar, a través de
los cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la
posición de la mediana, etc. Se compone de:

 Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro
de la caja una línea indica dónde se encuentra la mediana (segundo cuartil Q2)
 Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y otro
que empieza en el tercer cuartil y acaba en el máximo.
 Los datos atípicos (o valores extremos) que son los valores distintos que no
cumplen ciertos requisitos de heterogeneidad de los datos.

Los diagramas de caja son muy útiles para comparar una variable en diferentes grupos.

Construcción del diagrama de caja


Para construir el diagrama de caja, debemos seguir los siguientes pasos:

1. Ordenar los datos.


2. Calcular los tres cuartiles (Q1, Q2 y Q3). Después, dibujamos el rectángulo
(caja) delimitado por el primer y tercer cuartil, dibujando entre los dos
cuartiles una línea para indicar dónde está la mediana (segundo cuartil).
3. Calcular el rango intercuartílico, que es el tercer cuartil menos el primero.
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
4. Se calculan los límites admisibles inferior y superior (LI y LS) para
identificar los valores extremos.
𝐿𝐼 = 𝑄1 − 1,5 ∗ 𝐼𝑄𝑅
𝐿𝑆 = 𝑄3 + 1,5 ∗ 𝐼𝑄𝑅
Los límites marcarán los datos atípicos de la variable. Todos aquellos puntos
que sean menores que LI (x < LI) o mayores que LS (x > LS) son valores
extremos. Es decir, son todos aquellos valores que no están en el intervalo

5. El mínimo es el menor valor del conjunto que sea mayor o igual que LI. El
máximo es el mayor valor del conjunto que es menor o igual que LS.
Dibujamos los dos brazos. El primero va desde el primer cuartil hasta el
mínimo. El segundo, desde el tercer cuartil hasta el máximo.

6. Se dibujan los valores extremos, representados por puntos o círculos


pequeños.
Conclusiones
Las medidas de posición en un conjunto de datos están diseñadas para proporcionar al
analista algunas medidas cuantitativas de donde está el centro de los datos en una
muestra.
En las medidas de posición se trata de encontrar medidas que sinteticen las
distribuciones de frecuencias. En vez de manejar todos los datos sobre las variables,
tarea que puede ser pesada, podemos caracterizar su distribución de frecuencias
mediante algunos valores numéricos, eligiendo como resumen de los datos un valor
central alrededor del cual se encuentran distribuidos los valores de la variable. La
descripción de un conjunto de datos, incluye como un elemento de importancia la
ubicación de éstos dentro de un contexto de valores posibles.
Bibliografía
[1] Cooper William, 2011. Instrumentación electrónica y moderna y técnicas de
medición. México. Prentice Hall Hispanoamérica S.A. ISBN 968-880-236-0

[3] Mario Triola. Estadística. Décima Edición. Pearson Education. México. 2009

También podría gustarte