Está en la página 1de 5

Diagrama de Tallo y Hoja Diagrama de Caja

Una forma rpida de ordenar datos numricos (Diagrama de Tallo y Hoja)


Los siguientes datos corresponden a los precios de la libra de cobre en la Bolsa de Metales de Londres en Enero de 2000. Da 1 2 3 4 5 6 7 8 9 10 11 Precio Da 12 13 14 15 16 17 18 19 20 21 22 Precio 82.7 84.2 83.8 83.7 83.7 85.0 86.1 85.6 Da 23 24 25 26 27 28 29 30 31 Precio 84.9 84.1 83.6 82.5 83.5 82.2

83.1 82.5 83.1 83.1 83.0 82.5

Una forma de ordenar rpidamente estos datos es a travs del mtodo conocido como diagrama de tallo y hoja. Cada dato se divide en dos partes, una conocida como tallo, que se pone en una primera columna, y la otra que se denomina hoja, que se pone en fila en frente al tallo correspondiente. Es importante notar que no existe una regla fija para determinar cul es el tallo y cul es la hoja de un dato. En nuestro caso, cada dato lo separamos en su parte entera (tallo) y su parte decimal (hoja). Por ejemplo: 83.1= 83 1 Tallo Hoja 85.0= 85 Tallo 0 Hoja

El siguiente diagrama muestra los datos presentados en la tabla anterior, que llamaremos diagrama de tallo y hoja. Tallos 82. 83. 84. 85. 86. 2 0 1 0 1 5 1 2 6 5 1 3 Hojas 5 7 1 5 5 6

Profesor: Patricio Videla Jimnez.

Diagrama de Tallo y Hoja Diagrama de Caja

Una forma visual de analizar datos (Diagrama de Caja)


Tanto la media como la desviacin estndar podran no ser medidas adecuadas para representar un conjunto de valores, pues a) son afectadas, de forma exagerada, por valores extremos, b) slo con estos dos valores no podemos darnos una idea acerca de la asimetra de la distribucin de los datos. Para tratar de superar estas dificultades y como una forma de resumir grficamente los datos, se sugiere confeccionar un diagrama, conocido como diagrama de caja, que contenga la siguiente informacin: i) La Mediana, M e = Q 2 , ii) Los Extremos, E 1 y E 2 , (mnimo y mximo respectivamente) iii) Los Cuartiles, Q1 y Q 3 . El diagrama de caja consiste en graficar estos 5 valores en la siguiente forma: La mitad central de los datos, que va desde el primer hasta el tercer cuartil, se representa mediante un rectngulo. La mediana se identifica mediante una barra horizontal dentro de esta caja. Una lnea vertical se extiende desde el tercer cuartil hasta el valor mximo y otra se extiende desde el primer cuartil hasta el mnimo. Las dos lneas horizontales dibujadas a ambos extremos de la caja, se suelen denominar bigotes. La figura siguiente ilustra este diagrama, que tambin es conocido como diagrama de caja y bigote.

Profesor: Patricio Videla Jimnez.

Diagrama de Tallo y Hoja Diagrama de Caja

E2

Q3 M e = Q2

Q1

E1
La distancia entre E 1 y Q 2 es la diferencia Q 2 E 1 , que se denomina dispersin inferior. La distancia entre Q 2 y E 2 es la diferencia E 2 Q 2 , que se denomina dispersin superior. Recordemos tambin que la distancia entre Q1 y Q 3 , esto es, Q 3 Q1 , se denomina rango intercuartil. La comparacin de estas distancias entrega informacin sobre la dispersin de los datos y tambin sobre la forma de su distribucin. Por ejemplo, si la distribucin fuese relativamente simtrica, entonces la dispersin inferior debera ser aproximadamente igual a la dispersin superior. Tambin, Q 2 Q1 debera similar a Q 3 Q 2 , y Q1 E 1 similar a E 2 Q 3 . A continuacin se presenta el diagrama de caja de los precios de la libra de cobre en la Bolsa de Metales de Londres en Enero de 2000.

Profesor: Patricio Videla Jimnez.

Diagrama de Tallo y Hoja Diagrama de Caja


86,5

86,0

85,5

85,0

84,5

84,0

83,5

83,0

82,5

82,0

Observacin: Generalmente un (*) indica un punto extremo. Un punto extremo es un valor que es inconsistente con el resto de los datos. La definicin estndar de un punto extremo, es un valor que es mayor que Q 3 o menor que Q1 en ms de 1.5 veces el rango intercuartil. En caso de existir observaciones extremas, los bigotes del diagrama representan a la observacin mayor y menor dentro de los lmites. Ejemplo: Los siguientes datos corresponden al consumo de combustible (millas/galn) de 25 vehculos. 18,90 20,00 18,25 20,07 11,20 22,12 34,70 30,40 16,50 36,50 Estadgrafo Q1 Me 21,50 19,70 17,80 14,39 14,89 17,80 23,54 21,47 16,59 31,90 Valor 16.50 19.70 22.83 6.33 13,27 23,90 19,73 13,90 16,50

Q3 RIQ

Profesor: Patricio Videla Jimnez.

Diagrama de Tallo y Hoja Diagrama de Caja

La informacin la podemos visualizar en el siguiente diagrama de caja:


40 35 30 25 20 15 10 5 0

Note que
Q1 1.5RIQ = 16.5 1.5 6.33 = 7.005 (No hay observaciones menores) Q 3 + 1.5RIQ = 22.83 + 1.5 6.33 = 32.325 (Hay dos observaciones mayores (*))

Profesor: Patricio Videla Jimnez.