Está en la página 1de 4

EL DIAGRAMA DE CAJA

El diagrama de caja y bigotes es un resumen de grafico que permite visualizar ,para un


conjunto de datos,la tendencia central,la dispersin y la presencia posible de datos atpicos.
Para realizarlo se necesita calcular la mediana , el primer cuartil , y el tercer cuartil de los datos
.

Este diagrama consiste en un recangulo cuya longitud es el rango intercuartilico,el rectngulo


esta dividido por un segmento vertical que indica la posicin de la mediana y esta
complementando por dos lneas (llamadas bigotes)que parten de los extremos del rectngulo ,
cuya longitud puede llegar a ser el equivalente a 1.5 veces el rango intercuartilico y que
intentan encerrar los valores minimo y mximo observados .

Uso de la grafica

Representar la distribucin de una variable continua

Mediana
Percentiles
Valores extremos
Dispersin
PARTES DE UN DIAGRAMA DE CAJA
Cmo se dibuja un diagrama de caja?

}un diagrama de caja se construye como sigue:

1)Se ordena los datos de la muestra y se obtienen ; el valor minimo, el mximo , y los tres
cuartiles Q1,Q2,Q3 .

2) se dibuja un rectngulo (de anchura arbitraria) cuyos extremos son Q1 y Q3 y se indica en su


interior la posicin de la mediana ,Q2, mediante una lnea vertical

3) se calcula el rango intercuartilico del conjunto de datos Q=Q3-Q1

4) se determinan los limites admisibles superior e inferior . donde el limite inferior es igual al
mximo entre el valor minimo de los datos y el primer cuartil menos una vez y media el rango
intercuartilico . y el limite superior es el minimo entre el valor mayor de los datos y la suma del
tercer cuartil con una vez y medio el rango intercuartilico .

Li=max(xmin, Q1-1.5Q)

Ls= min(xmax, Q3-1.5Q)

Estos limites nos permitirn identificar los valores atpicos , que sern aquellos datos que
queden fuera del intervalo (Li,Ls)

5) Se dibuja una lnea horizontal desde cada extremo del rectngulo central hasta el valor mas
alejado no atpico , es decir , que esta dentro del intervalo (Li,Ls)

6) Identificar todos los datos que estn fuera del intervalo (Li,Ls) , marcndolos como atpicos

EJEMPLO DISTRIBUCIN DE EDADES


Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la edad de
un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40

ORDENAR LOS DATOS


Para calcular los parmetros estadstico, lo primero es ordenar la distribucin
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin.
Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el
siguiente:
Q1 = (24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la
variable que ocupa el lugar central en un conjunto de datos ordenados.
Como N/2 =10 ; la mediana es la media aritmtica de dicho valor y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En
nuestro caso, como 3N / 4 = 15, resulta

Q2=(39 + 39) / 2 = 39
DIBUJAR LA CAJA Y LOS BIGOTES

INFORMACIN DEL DIAGRAMA


Podemos obtener abundante informacin de una distribucin a partir de estas representaciones.
Veamos alguna:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que entre el 50% y el
75%.
El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25% de los
ms jvenes estn ms concentrados que el 25% de los mayores.
El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est comprendido en
14,5 aos.
Comparar distribuciones
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o ms conjuntos de datos.
Comparacin distribucin de edades

Comparacin entrenamientos de un corredor


Comparacin clasificacin liga
COMPARACIN DISTRIBUCIN DE EDADES
Anlogamente a lo realizado con los diagramas de tallo y hojas,
comparamos, mediante estos diagramas, esta distribucin con la del otro
ejemplo de distribucin de edades.
35 38 32 28 30 29 27 19 48 40
39 24 24 34 26 41 29 48 28 22

A partir de dicha comparacin puede obtenerse bastante informacin de ambas distribuciones

El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1) La primera parte de la


caja a (Q1, Q2), La segunda parte de la caja a (Q2, Q3) El bigote de la derecha viene dado por
(Q3, Xmx).

También podría gustarte