Está en la página 1de 20

Diagrama de Cajas

¿Cuál es el logro de la sesión?

Al finalizar la sesión, el
estudiante interpreta
diagrama de cajas en un
contexto empresarial siendo
asertivo en su forma de
comunicar la información.
Conocimientos previos:

Medidas de posición con datos simples:


• Q1 = P25
• P50
• Q3 = P75

Medida de dispersión:
• RIC = Q3 – Q1 = P75 – P25

Concepto de simetría y asimetría:


Diagrama de cajas:

Un diagrama de cajas es una grafica que


describe la distribución de un conjunto de
datos tomando como referencia los valores de
los cuartiles como medida de posición y el
valor del rango intercuartil como medida de
referencia de dispersión.

Además, nos permite apreciar el tipo de


distribución de los datos (simétrica o
asimétrica) y la identificación de valores
extremos (datos atípicos).
Dato atípico:
Un dato se conoce como atípico (en algunos
libros se les llama discordante o aberrante) si
es notablemente diferente de los demás.
Un dato atípico puede tener su origen en un
error de registro o digitación en la base de
datos (en este caso de corrige), o puede ser
que efectivamente exista, razón por la cual no
es adecuado el uso del promedio sino de las
medidas de posición. En cuanto a una medida
de dispersión no se usa la varianza ni
desviación estándar sino el RIC.
En el gráfico, los datos discordantes son los
puntos o asteriscos azules.
Construcción del diagrama de cajas:
Se tienen los siguientes datos, correspondientes a la estatura (en metros) de
postulantes en el año 2017:
2017 1.68 1.71 1.75 1.79 1.8 1.81 1.82 1.83 1.85 1.86 1.86 1.88 1.93 1.95 1.98

Como podrá ver, los n=15 datos ya están ordenados de menor a mayor valor.
Con esos datos se calculan P25, P50, P75 y RIC = Q3-Q1 = P75-P25
2017
n 15
P25 1.79
P50 1.83
P75 1.88
RIC 0.09
Construcción del diagrama de cajas:
Ahora se calculan los límites. Los datos fuera de estos límites son atípicos (*).

Li: Límite inferior: LI = P25 - (1,5)RIC

Ls: Límite superior: LS = P75 + (1,5)RIC


2017
n 15
P25 1.79
P50 1.83
P75 1.88
RIC 0.09
Li 1.655
Ls 2.015
Construcción del diagrama de cajas:
Con los valores P25, P50 y P75 se comienza a construir el diagrama de caja.

P25=1.79 P50=1.83 P75=1.88

1.70 1.75 1.80 1.85 1.90 1.95 2.00


2017
Construcción del diagrama de cajas:
El diagrama de caja no estará completo sino se colocan los “bigotes” que son
líneas que sales de los extremos de la caja.

Observe los datos:

¿Hay algún valor que sea menor al Li = 1.655? La respuesta es NO


¿Hay algún valor que sea mayor al Ls = 2.015? La respuesta es NO

Se concluye que el bigote inferior se extiende hasta el valor 1.68 y el bigote


superior se extiende hasta el valor 1.98
Cualquier valor fuera de estos límites se considera dato atípico.
2017 1.68 1.71 1.75 1.79 1.8 1.81 1.82 1.83 1.85 1.86 1.86 1.88 1.93 1.95 1.98
Construcción del diagrama de cajas:

P25=1.79 P50=1.83 P75=1.88

1.68 1.98

1.70 1.75 1.80 1.85 1.90 1.95 2.00


2017
Construcción del diagrama de cajas:
Ahora tenemos los datos, correspondientes a la estatura (en metros) de
postulantes en el año 2018:
2018 1.54 1.72 1.72 1.74 1.75 1.79 1.81 1.84 1.85 1.85 1.87 1.90

2017 2018
n 15 12
P25=Q1 1.79 1.73
P50=Q2 1.83 1.8
P75=Q3 1.88 1.85
RIC 0.09 0.120
LIS=Q1 -1,5*RIC 1.655 1.55
LSS=Q3 + 1,5*RIC 2.015 2.03
Construcción del diagrama de cajas: Distribución de postulantes según su
estatura por año de la convocatoria

Con la información anterior, se pide construir


el diagrama de cajas para la estatura de los
postulantes del 2018 y compararla con la del
2017 que ya se tiene construida.
Construcción del diagrama de cajas: Distribución de postulantes según su
estatura por año de la convocatoria

Como se puede observar el valor mínimo


(1,54) es menor al límite inferior (1,55), este
valor mínimo se considera un valor atípico,
por lo tanto el bigote inferior llegará hasta el
siguiente valor del mínimo (1,72) ya que este
si es mayor al límite inferior (1,55).
Por otro lado, el valor máximo (1,90) no
supera el límite superior (2,03), por lo tanto el
bigote superior será el máximo. En este caso
no se tiene un valor atípico.
Conclusiones: Distribución de postulantes según su
estatura por año de la convocatoria

Del diagrama de cajas se pueden obtener


algunas conclusiones:

• El 50% de los postulantes del 2017 miden


a lo más 1,83 mts. y el 2018 el 50% de los
postulantes miden a lo más 1.80 mts.
Conclusiones : Distribución de postulantes según su
estatura por año de la convocatoria

Del diagrama de cajas se pueden obtener


algunas conclusiones:

• La caja de los datos del 2017 tiene


asimetría positiva y la caja de los datos del
2018 tiene asimetría negativa.
Conclusiones : Distribución de postulantes según su
estatura por año de la convocatoria

Del diagrama de cajas se pueden obtener


algunas conclusiones:

• Considerando el 50% de los datos


centrales, es decir, la caja; se observa
mayor dispersión en los datos del año
2018, por tener mayor RIC.
Conclusiones: Distribución de postulantes según su
estatura por año de la convocatoria

Del diagrama de cajas se pueden obtener


algunas conclusiones:

• En los datos de las estaturas de los


postulantes del 2017 no hay algún valor
atípico mientras que entre los postulantes
del 2018 hay una estatura atípica, el valor
1,54, es decir, hay un postulante con
estatura muy baja comparado con los
demás.
Cuestiones adicionales:
Muchas veces genera dudas, dentro del proceso de elaborar el diagrama de caja,
hasta donde se deben extender los bigotes.

Ejemplo:
En el siguiente conjunto de datos ordenados:

12.2 14.5 17.6 18 18.5 19.8 …………… 56.3 57.8 58.0 68.2

Si se sabe que los límites son Li = 17 y Ls = 66


¿hasta donde se extienden los bigotes?
Cuestiones adicionales:
Solución:
Miremos los datos ordenados:
¿Hay algún valor que sea menor al Li?
Si, entonces los diferenciamos de los demás datos.
¿Hay algún valor que sea mayor al Ls?
Si, entonces los diferenciamos de los demás datos.

12.2 14.5 17.6 18 18.5 19.8 …………… 56.3 57.8 58.0 68.2

Por lo tanto el bigote inferior se extiende hasta el valor 17.6 y el bigote superior se
extiende hasta el valor 68.2.
Los valores de color rojo son los atípicos.
Cuestiones adicionales:
Otra duda muy frecuente es como determinar la forma de la distribución de la caja.
Se tienen tres patrones:

Asimétrica Asimétrica
Simétrica
negativa o a la positiva o a la
izquierda derecha

También podría gustarte