Está en la página 1de 13

Estadística Aplicada I

Diagrama de cajas
Logro de la sesión
Al término de la sesión, el estudiante analiza los datos usando las
diagramas de cajas para dar respuesta a problemas dentro del
contexto profesional.
Valores o datos atípicos

Registro del tiempo de vida de los


focos de la marca A
¿Es un
valor
atípico?

¿Cómo aparecen los valores atípicos?

Error de ingreso de datos El registro es correcto,


Hay un elemento
extraño en la muestra pero es un caso poco
común
Diagrama de cajas

Es una gráfica que describe la distribución de un conjunto de datos


tomando como referencia los valores de los cuartiles como medida de
posición y el valor del rango intercuartil como medida de referencia de
dispersión.
Construcción de un diagrama de caja
Diagrama de cajas
En la construcción del diagrama de cajas se pueden presentar dos casos, cuando el
valor mínimo o máximo son valores atípicos.

Caso 1: cuando el valor mínimo es un valor atípico


Si el valor mínimo es un valor atípico, entonces el bigote debe llegar hasta el dato
siguiente al valor mínimo, considerando a este como nuevo valor mínimo.
Diagrama de cajas
Caso2: cuando el valor máximo es un valor atípico
Si el valor máximo es un valor atípico, entonces el bigote debe llegar hasta el dato
anterior al valor máximo, considerando a este como nuevo valor máximo.
Interpretación de diagramas de cajas

El diagrama de Caja permite

1. Comparar las medianas de dos o


más conjuntos de datos.
2. Observar el tipo de distribución de
los datos (simétrica o asimétrica en
el 50% central de los datos).
3. Determinar la dispersión en el 50%
central de los datos.
4. Identificar la presencia de valores
Valores atípicos.
atípicos
Ejemplo
Tentel S.A. desea comparar el tiempo de conexión a internet en los teléfonos
celulares de sus clientes de acuerdo a sus dos principales usos: Facebook y
WhatsApp. Para llevar a cabo la comparación se desea elaborar un diagrama de
cajas. Complete la gráfica:
a) Complete la gráfica con el diagrama de cajas del tiempo de uso del
WhatsApp. Utilice los siguientes datos:

Tiempo en minutos de los clientes usando WhatsApp


24 30 30 33 34 38 49 53
61 62 62 66 69 90 118 132

b) En el 50% central, la distribución del tiempo de uso del Facebook tiene


asimetría: ……………………………
c) En el 50% central, ¿que tiempos de uso son más homogéneos?
Justifique.
d) ¿Los tiempos de uso del WhatsApp tiene valor atípico? si fuera así,
¿cuál es el valor? …………..
Solución:
a) Calculamos los cuartiles Q1, Q2 y Q3 con los datos de los tiempos de los
clientes que usan el WhatsApp.

𝟐𝟓 𝟏𝟔+𝟏
𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 𝒊 = = 𝟒, 𝟐𝟓
𝟏𝟎𝟎
𝑸𝟏 = 𝑷𝟐𝟓 = 𝑿𝟒 + 𝟎. , 𝟐𝟓 𝑿𝟓 − 𝑿𝟒 = 𝟑𝟑 + 𝟎, 𝟐𝟓 𝟑𝟒 − 𝟑𝟑 = 𝟑𝟑, 𝟐𝟓

𝟓𝟎 𝟏𝟔 + 𝟏
𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 𝒊 = = 𝟖, 𝟓
𝟏𝟎𝟎
Q2= 𝑷𝟓𝟎 = 𝑿𝟖 + 𝟎, 𝟓 𝑿𝟔 − 𝑿𝟓 = 𝟓𝟑 + 𝟎, 𝟓 (𝟔𝟏 − 𝟓𝟑) = 𝟓𝟕

𝟕𝟓 𝟏𝟔+𝟏
𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 𝒊 = = 𝟏𝟐, 𝟕𝟓
𝟏𝟎𝟎
Q3= 𝑷𝟕𝟓 = 𝑿𝟏𝟐 + 𝟎, 𝟕𝟓 𝑿𝟏𝟑 − 𝑿𝟏𝟐 = 𝟔𝟔 + 𝟎, 𝟕𝟓 𝟔𝟗 − 𝟔𝟔 = 𝟔𝟖, 𝟐𝟓

RIC= P75-P25=68,25-33,25 = 35
𝑳í𝒎𝒊𝒕𝒆 𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓 (𝑳𝑰) = 𝟑𝟑, 𝟐𝟓 − 𝟏, 𝟓 ⨯ 𝟑𝟓 = −𝟏𝟗, 𝟐𝟓
𝑳í𝒎𝒊𝒕𝒆 𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓 (𝑳𝑺) = 𝟔𝟖, 𝟐𝟓 + 𝟏, 𝟓 ⨯ 𝟑𝟓 = 𝟏𝟐𝟎, 𝟕𝟓

Extremo del Bigote inferior = 24 Extremo del Bigote superior = 118

Luego completamos el diagrama de caja:


b) En el 50% central, la distribución del tiempo de uso del Facebook tiene asimetría: positiva
c) En el 50% central, ¿que tiempos de uso son más homogéneos? Justifique. son más
homogéneos con el uso del WhatsApp pues su RIC= 35 min. es menor que el RIC del uso de
Facebook= 36 min.
d) ¿Los tiempos de uso del WhatsApp tiene valor atípico? Si fuera así, ¿cuál es el valor? es
132
Material producido para el curso:
Por equipo de profesores de Estadística Aplicada I

ESTADÍSTICA APLICADA I - PREGRADO


COPYRIGHT © UPC

También podría gustarte