Está en la página 1de 11

MAESTRIA EN INGENIERIA INDUSTRIAL Y

PRODUCTIVIDAD
ESTADISTICA

Que es BOXPLOT ?

Un diagrama de caja es un grafico basado en


cuartiles, mediante el cual se visualiza un
conjunto de datos. Esta compuesto por un
rectngulo, la caja y dos brazos, los bigotes.

Proporciona una visin general de la simetra


de la distribucin de los datos, si la media no
est en el centro del rectngulo, la
distribucin no es simtrica

Como se construye el BOXPLOT


1. Ordenar la distribucin
2. Calcular los cuartiles los cuales son valores que dividen una muestra de
datos en cuatro partes iguales
Valor atpico.- observacin que se encuentra mas halla del bigote superior
o inferior
Q1 = es valor mayor que el 25% de los valores de la distribucin;
es la media aritmtica de dicho valor.
Q2 = es la mediana de la distribucin, es el valor de la variable
que ocupa el lugar central
en un conjunto de datos
ordenados
Q3 = es el valor que sobrepasa al 75% de los valores de la
distribucin.
3. Dibujar la caja y los bigotes
- El bigote de la izquierda representa el colectivo de elementos desde el
inicio de la distribucin hasta Q1.
- La primera parte de la caja: de Q1 a Q2.
- La segunda parte de la caja: de Q2 a Q3
- El bigote de la derecha viene dado desde Q3 hasta el valor - mximo de
la distribucin

Ejemplo
Distribucin de edades
La siguiente tabla muestra la edad en un
colectivo de 20 personas

36

25

37

24

39

31

31

45

36

20

39

24

29

23

41

40

33

24

34

40

Primer paso: Ordenar los datos

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Segundo paso: Calcular los cuartiles

Q1
Q2
Q3
Max
Min

25
34
39
45
20

=PERCENTIL( datos, 0.25)


=PERCENTIL( datos, 0.5)
=PERCENTIL( datos, 0.75)

Diagrama de Caja
50
45
40
35
30
25
20

Interpretacin

La parte inferior de la caja es mayor que la parte


superior, eso quiere decir que las edades
comprendidas entre el 25% y el 50% de la
poblacin esta mas dispersa que entre el 50% y el
75%

El bigote inferior es mas corto que el superior


por ello el 25% de los de edad mas joven estn
mas concentrados que el 25% de los de edad
mayor

Valor atpico

Es un valor inusualmente grande o pequeo, los


valores atpicos pueden tener una influencia
desproporcionada sobre los resultados estadsticos
como
la
media,
lo
que
puede
generar
interpretaciones engaosas.
Ejemplo: Un conjunto de datos incluye los valores 1,
2, 3 y 34 en este caso el valor medio 10 que es mayor
que la mayoria de los datos 1, 2, 3 es influenciado
considerablemente por el punto de dato extremo 34,
en este caso el valor medio da la impresin de que
los valores de los datos son superiores de lo que
realmente son.

Ejercicio propuesto
Los siguientes datos representan una muestra
de poblacin de los pases segmentados en el
continente africano
Africa

poblacion

Etiopia

73750932

Congo

3697467

Mali

14517176

Egipto

72798031

Namibia

1830330

También podría gustarte