Está en la página 1de 5

Diagrama de Tallos y Hojas

El diagrama "tallo y hojas" (Stem-and-Leaf Diagram) permite obtener simultáneamente una


distribución de frecuencias de la variable y su representación gráfica. Para construirlo basta
separar en cada dato el último dígito de la derecha (que constituye la hoja) del bloque de cifras
restantes (que formará el tallo).

Esta representación de los datos es semejante a la de un histograma pero además de ser fáciles
de elaborar, presentan más información que estos.

Ejemplos

 Horarios de trenes
 Edad de 20 personas
 Comparar dos distribuciones

Horarios de trenes
Basándome en un articulo de Juan C. Dürsteler en InfoVis.net, tomamos
como ejemplo un horario de trenes confeccionado a partir de un díptico de la línea
Castelldefels-Barcelona/Sants recogido en la estación de Renfe. Originalmente el horario ocupa
una tabla de 10 filas y 9 columnas más una columna "viuda" con el tren de las 22:38. Un
total de 91 campos con formato hh.mm cada uno, 455caracteres.

Díptico original Trayecto Castelldefels -> Barcelona-Sants

5.03 7.32 9.02 11.07 13.32 15.07 16.50 18.32 20.07 22.38
6.02 7.37 9.07 11.32 13.37 15.20 17.02 18.37 20.20
6.18 7.50 9.24 11.37 13.50 15.32 17.07 18.50 20.32
6.37 8.02 9.32 12.02 14.02 15.37 17.20 19.02 20.37
6.48 8.05 9.37 12.07 14.07 15.50 17.32 19.07 20.50
6.55 8.20 10.02 12.32 14.20 16.02 17.37 19.20 21.02
7.02 8.24 10.07 12.37 14.32 16.07 17.50 19.32 21.07
7.07 8.32 10.32 13.02 14.37 16.20 18.02 19.37 21.20
7.20 8.37 10.37 13.07 14.50 16.32 18.07 19.50 21.32
7.25 8.51 11.02 13.20 15.02 16.37 18.20 20.02 21.37

En el diagrama Stem & Leaf se representa la hora a la izquierda de la barra de separación | y


losminutos de la salida de cada tren a la derecha. La frecuencia de los trenes se deduce
fácilmente de lalongitud de las filas y es, además, muy fácil ver en que minutos de cada hora
pasan típicamente los mismos.

Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf

05 | 03
06 | 02 18 37 48 55
07 | 02 07 20 25 32 37 50
08 | 02 05 20 24 32 37 51
09 | 02 07 24 32 37
10 | 02 07 32 37
11 | 02 07 32 37
12 | 02 07 32 37
13 | 02 07 20 32 37 50
14 | 02 07 20 32 37 50
15 | 02 07 20 32 37 50
16 | 02 07 20 32 37 50
17 | 02 07 20 32 37 50
18 | 02 07 20 32 37 50
19 | 02 07 20 32 37 50
20 | 02 07 20 32 37 50
21 | 02 07 20 32 37
22 | 38

Por otra parte, dado que a algunas horas se repite exactamente el horario de los trenes se
puede reducir aún más el tamaño del gráfico, sin perder información y ganando en claridad.

Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf reducido

05 | 03
06 | 02 18 37 48 55
07 | 02 07 20 25 32 37 50
08 | 02 05 20 24 32 37 51
09 | 02 07 24 32 37
10 11 12 | 02 07 32 37
13 14 15 16 17 18 19 20 | 02 07 20 32 37 50
21 | 02 07 20 32 37
22 | 38

Al final tenemos 59 campos de 2 dígitos, 118 caracteres más los separadores, es decir 4 veces
menos dígitos que con el horario original, menos espacio y más claridad.

Esto nos da idea de que una disposición apropiada de los datos puede ser doblemente
informativay que la representación gráfica puede contribuir enormemente a la percepción de
patrones y a lacomprensión de la naturaleza de los fenómenos.

Edad de 20 personas
Supongamos la siguiente distribución de frecuencias

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40
que representan la edad de un colectivo de N = 20 personas y que vamos a representar
mediante un diagrama de Tallos y Hojas.
Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas, es decir 3,
2, 4, que reordenadas son 2, 3 y 4.
A continuación efectuamos un recuento y vamos «añadiendo» cada hoja a su tallo
Por último reordenamos las hojas y hemos terminado el diagrama

Comparar dos distribuciones


Podemos comparar, mediante estos diagramas, dos distribuciones. Supongamos una segunda
distribución

35 38 32 28 30 29 27 19 48 40

39 24 24 34 26 41 29 48 28 22
De ella podemos elaborar sus diagrama de Tallos y Hojas y compararla con la anterior.

El diagrama de tallo y hojas (Stem-and-Leaf Diagram) es un


semigráfico que permite presentar la distribución de una variable
cuantitativa. Consiste en separar cada dato en el último dígito (que se
denomina hoja) y las cifras delanteras restantes (que forman el tallo).

Es especialmente útil para conjuntos de datos de tamaño medio (entre


20 y 50 elementos) y que sus datos no se agrupan alrededor de un único
tallo. Con él podemos hacernos la idea de qué distribución tienen los datos,
la asimetría, etc.
El nombre de tallo y hojas hace referencia a la ramificación de una
planta, siendo los dígitos delanteros marcan el tallo donde se encuentra el
número y el dígito final la hoja.
Este diagrama se utilizaba más en los años 80 y 90, cuando los
ordenadores no dibujaban gráficosaunque si que escribían dígitos.
Construcción del diagrama de tallo y
hojas
ANUNCIOS

Para construir el diagrama de tallo y hojas, debemos seguir los


siguientes pasos:
1. Ordenar los datos.
2. Redondear los números (en el caso de que no lo estén) hasta tengan las
cifran que queramos. Por ejemplo, si tenemos el número 3,62856 y queremos
que tenga 2 dígitos la parte decimal, lo redondeamos a 3,63.
3. Dibujar una tabla con dos columnas, la primera columna para el tallo y la
segunda para las hojas. Disponer todos los tallos en la primera columna en
orden descendente. Cada tallo solo se escribe una vez.
4. Registrar en la segunda columna todas las hojas, en orden creciente, junto al
tallo correspondiente.
Ejemplo
En las pruebas médicas de un instituto, se toma la altura de los
cuarenta alumnos de una clase. El médico está interesado en representar
gráficamente la variable y opta por el diagrama de tallo y hoja.
1. Ordena las alturas en una tabla:
2. Los datos son tomados en centímetros, por lo que tiene tres cifras cada
número. En este caso no se requiere redondear los datos, ya que se parte
del número de dígitos que se desea. Los dos primeros dígitos serán el tallo y
el último la hoja.
3. Una vez preparados los datos, procede a construir el diagrama. Dibuja una
tabla con dos columnas. En la primera columna coloca los tallos ordenados
de menor a mayor. En este caso los tallos serán: 14, 15, 16, 17 y 18.
4. Se registra en la segunda columna todas las hojas, debidamente ordenadas,
junto al tallo correspondiente:

Se percibe visualmente la distribución de las alturas.

También podría gustarte