Documentos de Académico
Documentos de Profesional
Documentos de Cultura
http://web.frm.utn.edu.ar/estadistica
Grfico de Caja
Construccin
1.
Para su construccin, es necesario conocer o calcular los siguientes valores: xmn ; xmx ; Q1 ; Q2 ; Q3 ;
REF1 = Q1 3 RI ; REF2 = Q1 1,5 RI ; REF3 = Q3 + 1,5 RI ; REF4 = Q3 + 3 RI.
2.
Se traza una lnea horizontal de longitud proporcional al recorrido de la variable, que llamaremos eje.
Los extremos del eje sern el mnimo y el mximo de la distribucin. El eje se grada segn la escala
conveniente y se sealan los valores referenciales REF1, REF2, REF3 y REF4 (en realidad estas
marcas referenciales no aparecern en el grfico final).
3.
Paralelamente al eje se construye una caja rectangular con altura arbitraria y cuya base abarca desde el
primer cuartil hasta el tercer cuartil. Como vemos, esta caja indica grficamente el intervalo de
variacin del 50% de valores centrales de la distribucin.
4.
La caja se divide en dos partes, trazando una lnea en la posicin de la mediana. As, cada una de las
partes en que ha quedado dividida la caja encierra una cuarta (25%) parte de las observaciones.
5.
Una vez dibujada la caja, se aaden dos lneas paralelas al eje, que llamaremos bigotes o extensiones,
una de cada lado. Si el xmn es igual o mayor que la REF2, la extensin se prolonga desde el Q1 hasta el
xmn. Si el xmn es menor que la REF2, la extensin se prolonga hasta el valor observado inmediato
mayor que la REF2. Si el xmx es igual o menor que la REF3, la extensin se prolonga desde el Q3 hasta
el xmx. Si el xmx es mayor que la REF3, la extensin se prolonga hasta el valor observado inmediato
menor que la REF3.
6.
Si hay datos observados que quedan por debajo de la REF2 o por encima de la REF3, se sealan en el
grfico de modo particular, por ejemplo, con un cuadradito o cualquier otro smbolo que lo represente.
A estos datos, genricamente, los denominamos DATOS APARTADOS o VALORES EXTREMOS del
conjunto al cual pertenecen. En ocasiones se hace distincin entre los datos apartados ATPICOS y
ANMALOS. Los datos atpicos son los que quedan comprendidos entre la REF1 y la REF2, y los que
quedan comprendidos entre la REF3 y la REF4. Los datos anmalos son los que quedan por debajo de
la REF1 y tambin los que quedan por encima de la REF4. Para diferenciarlos se utilizan marcas
diferentes, por ejemplo, Statgraphics utiliza un cuadradito para los atpicos y un cuadradito con una cruz
para los anmalos.
7.
Finalmente, se indica con otro signo la posicin de la media aritmtica. Statgraphics, por ejemplo,
utiliza el signo +.
distribucin.
El grfico de caja nos proporciona informacin sobre los datos apartados, sugiriendo la necesidad o no
de utilizar determinados estadsticos.
El grfico de caja nos informa de la simetra o asimetra de la distribucin.
El grfico de caja se puede utilizar para comparar la misma variable en dos muestras distintas.
GraficoCaja 2004
Probabilidad y Estadstica
Grfico de Caja
http://web.frm.utn.edu.ar/estadistica
64
70
74
75
70
62
93
60
62
70
71
70
80
61
60
62
68
65
65
66
68
71
72
60
49
52
54
56
66
45
52
48
54
56
61
46
50
52
53
56
68
47
50
53
57
60
64
47
50
53
57
60
64
55
52
54
44
65
60
Varones
Mujeres
Box-and-Whisker Plot
40
45
50
55
60
65
70
75
80
85
90
95
PESO
Histogram
percentage
40
30
20
10
0
40
45
50
55
60
65
70
75
80
85
90
95 100
PESO
GraficoCaja 2004
Probabilidad y Estadstica
Grfico de Caja
http://web.frm.utn.edu.ar/estadistica
Box-and-Whisker Plot
HOM
MUJ
40
45
50
55
60
65
70
75
80
85
90
95
PESO
HOM
percentage
58
38
18
2
22
42
40
50
60
70
80
90
100
MUJ
GraficoCaja 2004