Está en la página 1de 12

BOX PLOT (GRAFICO DE CAJA Y

BIGOTE)

• Victor Manuel Alvarez Narvaez


¿Qué es un diagrama de caja o boxplot?

El Diagrama de Caja y bigotes es un tipo de gráfico que muestra un


resumen de una gran cantidad de datos en cinco medidas descriptivas y se
aprecia la forma, tendencia central y variabilidad.
Este tipo de gráficos nos permite identificar valores atípicos y comparar
distribuciones. Además de conocer de una forma cómoda y rápida como
el 50% de los valores centrales se distribuyen.

2
¿Para que sirve un diagrama de caja o boxplot?

Sirve para realizar un análisis más detallado y conciso respecto a la


distribución de datos en la muestra.
Este permite determinar si la muestra tiene elementos atípicos que son
valores excepcionalmente lejanos del centro. Y si se representa un sesgo a
la izquierda o derecha.

3
Elementos de un diagrama de caja o boxplot

En un diagrama de caja o boxplot se encuentran distintos elementos que


permiten identificar la información de manera clara, como los siguientes:
• Primer cuartil: el 25% de los valores son menores o igual a este valor.
• Mediana o Segundo Cuartil: Divide en dos partes iguales la distribución.
De forma que  el 50% de los valores son menores o igual a este valor.
• Tercer cuartil: el 75% de los valores son menores o igual a este valor.
• Rango Intercuartílico (RIC): Diferencia entre el valor del tercer cuartil y
el primer cuartil.
• Límites Superior o Inferior (Ls o Li). Ls contiene los casos por encima de
Q3 más 1,5 veces el rango intercuartílico o Li por debajo de Q1 – 1,5xRIC
(Estilo de Tukey). Cuando los valores no son posibles en lugar de
emplear la aproximación anterior se escogen los valores máximo o
mínimo de la muestra (Estilo de Spears).

4
Elementos de un diagrama de caja o boxplot

• Los valores atípicos son aquellos que están más a allá de los límites


inferior y superior. Cuando los valores atípicos están más allá de 3 veces
el RIC en lugar del 1.5 son denominados valores extremos.

5
Elementos de un diagrama de caja o boxplot

Caja
Las dimensiones de la caja está determinada por la distancia del rango
intercuartílico, que es la diferencia entre el primer y tercer cuartil.
El segmento que divide la caja en dos partes es la mediana, que facilitará
la comprensión de si la distribución es simétrica o asimétrica.
Si la mediana se sitúa en el centro de la caja entonces la distribución es
simétrica y tanto la media, mediana y moda coinciden.
Si la mediana corta la caja en dos lados desiguales se tiene:
• Asimetría positiva o segada a la derecha si la parte más larga de la
caja es la parte superior a la mediana. Los datos se concentran en la
parte inferior de la distribución. La media suele ser mayor que la
mediana.
• Asimetría negativa o sesgada a la izquierda si la parte más larga es
la inferior a la mediana. Los datos se concentran en la parte
superior de la distribución. La media suele ser menor que la
mediana. 6
Elementos de un diagrama de caja o boxplot

Porque un lado de la caja sea más largo que otro, no quiere decir que ese
lado contenga más datos. Indica un rango más amplio, por lo que los datos
estarán mas dispersos. Un rango menos amplio, indica que los datos están
más próximos.
Bigotes
La continuación de dos segmentos en la caja se denominan bigotes que
determina el límite para la detección de valores atípicos.
Los bigotes deben tener una longitud máxima. Dicha longitud no debe ser
superior al 150% del rango intercuartílico.
Habrá un límite superior que no podrá superar el 1,5  veces el RIC, si el
máximo no supera ese valor, la longitud del bigote será desde el tercer
cuartil hasta el máximo.
Habrá un límite inferior que no podrá superar el 1,5  veces el RIC, si el
mínimo no supera ese valor, la longitud del bigote será desde el primer
cuartil hasta el mínimo.
7
Creación de un diagrama de caja o boxplot

Para la construcción del diagrama se hace de la siguiente manera.


1. Se calculan los tres cuartiles, el máximo, el mínimo y el rango
intercuartílico.
2. Se construye una recta numérica a escala y se marca en ella los tres
cuartiles.
3. Se construye una caja con los lados sobre Q1 y Q3 (cada cuartil se
calcula con la media aritmética de dicho valor) sin importar el ancho
de caja.
4. Se dibujan dos extensiones, la izquierda que va desde la mitad del
lado inferior de la caja hasta el mínimo( límite inferior = Q1 – 1,5*RIC)
y la derecha que va desde la mitad del lado superior de la caja hasta
el máximo ( límite superior = Q3 + 1,5*RIC).

8
Creación de un diagrama de caja o boxplot

Para los datos atípicos:


• Valores menores que Q1 – 1,5*RIC o mayores que Q3 + 1,5*RIC son
considerados datos atípicos, aberrantes o extremos.
• Valores menores que Q1 – 3*RIC o mayores que Q3 + 3*RIC son
considerados datos muy atípicos, aberrantes o extremos.

9
Ejercicio de un diagrama de caja o boxplot

tenemos la siguiente distribución de datos que representa la edad de 20


personas que trabajan en una oficina bancaria y se nos pide realizar un
diagrama de caja para analizar la distribución de edades de las personas
que trabajan en el banco.
36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40

10
Conclusiones ejercicio

• La parte izquierda de la caja es mayor que la de la derecha; ello quiere


decir que las edades comprendidas entre el 25% y el 50% de la
población está más dispersa que entre el 50% y el 75%.
• El bigote de la izquierda(Xmín, Q1) es más corto que el de la derecha;
por ello el 25% de los más jóvenes están más concentrados que el 25%
de los mayores.
• El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población
está comprendido en 14,5 años.

11
Bibliografía

• Rodriguez, M. (2015). Interpretación de los Gráficos de Caja en el


Análisis Descriptivo e Inferencial.. [online] Manuel Rodriguez.
Available at: https://www.qvision.es/blogs/manuel-
rodriguez/2015/03/30/interpretacion-de-los-graficos-de-caja-en-el-
analisis-descriptivo-e-inferencial/ [Accessed 8 Mar. 2020].
• Video explicativo crear un grafico de cajas en Excel :
• https://www.youtube.com/watch?v=Q0930Gt6H6E&t=306s

También podría gustarte