Está en la página 1de 7

ANÁLISIS EXPLORATORIO DE DATOS

EXPLORATORY DATA ANALYSIS

Valores que inspiran nuestra actividad académica en la universidad:


El amor al saber, la libertad, la honestidad, la responsabilidad y el respeto.
El Análisis Exploratorio de Datos, ha sentado las bases
para el desarrollo de la Ciencia de Datos.
I
CHARTS: El diagrama de caja y bigotes de John W. Tukey

John W. Tukey (1915-2000), de la Universidad de Princeton (EEUU),


definió en 1970 el diagrama de caja (‘box-plot’):

Este gráfico se utiliza cuando se desea explicar cómo se distribuye


una serie de datos cuantitativos. Otras opciones para reflejar
distribuciones son los histogramas y las funciones de distribución.

En comparación con estos últimas, el gráfico de caja es más sencillo


de entender, más claro y, por tanto, hace más rápida la comprensión
visual.

A
Diagrama de Caja o Box Plot
El diagrama de caja permite
principalmente:
Ventas mensuales

• Identificar y corregir datos no


válidos.

• Identificar datos discordantes:


“outliers”.

• Descubrir el patrón de
comportamiento de los datos.
MITCHE DALLAS JITHA TAURUS

Empresa

A
Tukey (1997) introduce un criterio para fijar
los extremos de los bigotes, a través de las
siguientes medidas:
Q1 – 1.5 RI
Q3 + 1.5 RI
Q1 – 3 RI
Q3 + 3 RI
Donde: RI=Q3-Q1

A
Se podría preguntar:

¿Qué porcentaje de los datos está representado


por la caja?

¿Qué porcentaje representa cada uno de los


bigotes?

¿Puede ser un bigote más largo que otro? ¿Cuál


es el significado?

¿Se encuentra la mediana siempre en el centro


de la caja?

C
mi s o :
mp ro
Un co s lo
a r
Re v i
i a do .
estud s ia
Gra c

También podría gustarte