Está en la página 1de 19

ESTADÍSTICA APLICADA I

Diagrama de cajas
Logro de la sesión
• Al finalizar la sesión de clase el estudiante será
capaz de construir e interpretar el diagrama de
cajas que fue construido con rigurosidad.
Diagrama de caja

¿Qué es el diagrama de caja?


El diagrama de caja, también conocido como
el diagrama de caja y bigotes o box plot, es
una herramienta gráfica que se utiliza para
comparar los datos de variables cuantitativas,
con respecto al 50% central y la mitad de los
datos.
Diagrama de caja
El diagrama de cajas es el único gráfico en el cual se puede observar
una medida de tendencia central (mediana = Q2 = P50), una medida de
variabilidad con respecto al 50% central de los datos (RIC= Q3 – Q1=
P75 – P25), la forma de la distribución, o sesgo, con respecto al 50%
central de los datos y la presencia de valores atípicos.
Para realizar el gráfico tomamos como referencia los valores de los
cuartiles como medida de posición.

Forma de la
distribución

Mediana = Q2
Construcción de un diagrama de caja
1. Se calcula: Q1, Q2 , Q3 y RIC= Q3 - Q1
2. Calcular los límites. Los datos fuera de estos límites son atípicos (*). Los límites
solo sirven de referencia no deben quedar en el gráfico
Li =Q1-(1,5)RIC
Ls=Q3 +(1,5)RIC
3. Las líneas que salen de las cajas es decir que están antes y después de las cajas
se llaman bigotes.

bigote
Construcción de un diagrama de caja
En la construcción del diagrama de cajas se pueden presentar dos casos,
cuando el valor mínimo o máximo son valores atípicos.

Caso1: cuando el valor mínimo es un valor atípico

Si el valor mínimo es un valor atípico, entonces el bigote debe llegar hasta


el dato siguiente al valor mínimo, considerando a este como nuevo valor
mínimo.
Construcción de un diagrama de caja
Caso2: cuando el valor máximo es un valor atípico

Si el valor máximo es un valor atípico, entonces el bigote debe llegar


hasta el dato anterior al valor máximo, considerando a este como nuevo
valor máximo.
Diagrama de caja
El diagrama de caja debe quedar con: la caja, la línea de la mediana, los
bigotes y los valores atípicos, todos ellos con sus respectivos valores.
Este diagrama puede ser horizontal o vertical.
El diagrama de cajas como todo gráfico debe tener: título, rótulo,
nombre en los ejes y fuente.

Distribución de trabajadores según horas extras a la


semana

0,9 1,8 8,4


3,9 4,5 6,0

Fuente: Elaboración propia


Horas extras por semana
Diagramas de cajas
Permite

1. Comparar las medianas


de dos o mas conjuntos
de datos.
2. Observar la forma de la
distribución de los datos
(simétrica o asimétrica)
en el 50% central de los
datos.
3. Determinar la dispersión
en el 50% central de los
datos con el RIC.
4. Identificar la presencia
de valores extremos o
atípicos.

Fuente: Fábrica Alpha


Caso
Los empleados de una fábrica usan dos modalidades para ir a
trabajar diariamente desde su casa, que son Modo A y Modo B.
A continuación los tiempos, en minutos, de una muestra de
empleados, para cada modalidad son:

Modo A 25 28 29 29 32 32 33 34 37 45

Modo B 24 26 27 28 29 30 32 35 36

Construya el diagrama de cajas e indique, ¿Cuál de las dos


modalidades recomendaría usted al empleado? Justifique su
respuesta
Calcule los valores para el Modo A
y grafique

Item Valor

P75 =

P50 =

P25 =

RIC =

Lim inferior =

Lim superior =
Item Valor

P75 = 34,75

P50 = 32

P25 = 28,75

RIC = 6

Lim inferior = 19,75

Lim superior = 43,75


Resultados del Caso
En base a los resultados obtenidos, conteste lo siguiente:

i. El modo que tiene los tiempos más dispersos en el 50% central es


………………………………………………………………………………………………………

ii. En el 50% central de los tiempos, el modo .…………..… presenta asimetría


positiva.

iii. El percentil 25 para el modo B es: ……………………………………….…………

iv. La mediana para el modo A es: ……………………………………….………………

v. El valor del RIC para el modo B es ………………………………………………….

vi. En base a los resultados, cuál de los dos métodos recomendaría usted?
Resultados del Caso
En base a los resultados obtenidos, conteste lo siguiente:

i. El modo que tiene los tiempos más dispersos en el 50% central es …el
modo de transportes B…..

ii. En el 50% central de los tiempos, el modo... modo de transportes B …


presenta asimetría positiva.

iii. El percentil 25 para el modo B es: …26,5 minutos…

iv. La mediana para el modo A es: …32 minutos…

v. El valor del RIC para el modo B es ……6,5 minutos…

vi. En base a los resultados, cuál de los dos métodos recomendaría usted?
Teniendo en cuenta la menor mediana recomendaría el modo B
Caso a ser resuelto por el alumno
Mañana Tarde Noche
20 19 19
El ingeniero de la fábrica de chorizos “Choripan”, está 20 20 19
20 20 19
preocupado porque los chorizos tienen problema de
20 20 19
longitud y sugerirá capacitar al turno cuya longitud de 20 21 20
chorizos se distancie más de la longitud estándar y 23 23 20
presente mayor heterogeneidad, si la longitud 23 24 20
estándar del chorizo es de 20cm. 23 25 21
24 25 21
Indique el turno al cuál se le realizará dicha 25 26 22
capacitación. 25 26 23
26 27 23
A continuación se muestra la longitud, en 26 28 24
centímetros, del chorizo por turno de fabricación. 26 28
26 30
26
29
29
30
34
Caso a ser resuelto por el alumno

En base a los resultados obtenidos, conteste lo siguiente:

El (los) turno(s) que presentó valores outliers o atípicos es: _______________________

El(los) turno(s) que presenta mayor heterogeneidad en el 50% central de los datos es:
____________

El(los) turno(s) que presentan asimetría negativa es: ____________________________

Al comparar la medida de tendencia central, el (los) turno(s) que presenta longitud de


chorizos que se distancia más de la longitud estándar es:__________________________

Indique el turno al cuál se le realizará dicha capacitación. Sustente su respuesta


Evaluación Distribución del índice de calidad para productos fabricados en dos plantas
Llene los espacios en blanco de tal manera 200

que la proposición resultante resulte


verdadera
1. El índice de calidad mediano es mayor en 150
la planta ………..

Indice de calidad
2. El índice de calidad en la planta A
presenta distribución
asimétrica_______________ mientras 100
que el índice de calidad en la planta B
presenta distribución
____________________
50
3. La variabilidad del índice de calidad en el
50% central es mayor en la planta ______
que en la planta __________
4. El índice de calidad presenta valores 0
atípicos en la planta ______ mientras que Planta A Planta B
el índice de calidad no presenta valores
Fuente: Elaboración propia
atípicos en la planta _______
Bibliografía

 Enlace encuestas.com
http://www.encuestas.com.pe/encuesta-aprobacion-presidencial-gfk-abril-2014/
 Diario Gestión
http://gestion.pe/economia/cajamarca-y-su-debil-entorno-economico-2073242
 Publicación digital INEI
http://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib1157/libro.pdf
 Cuaderno de Trabajo del curso, página 49- 51
 Video de construcción del diagrama de cajas en Excel
https://www.youtube.com/watch?v=KilTKndq0Mg&feature=youtu.be
Material producido para el curso de coloque aquí el nombre del curso
Autor: Profesores del curso

ESTADÍSTICA APLICADA 1- PREGRADO


COPYRIGHT © UPC 2016

También podría gustarte