Está en la página 1de 7

Diagrama de tallo y hojas

Diagrama de Tallos y Hojas


El diagrama "tallo y hojas" (Stem-and-Leaf Diagram) permite obtener simultneamente una distribucin de frecuencias de la variable y su representacin grfica. Para construirlo basta separar en cada dato el ltimo dgito de la derecha (que constituye la hoja) del bloque de cifras restantes (que formar el tallo). Esta representacin de los datos es semejante a la de un histograma pero adems de ser fciles de elaborar, presentan ms informacin que estos. Ejemplos

Horarios de trenes Edad de 20 personas Comparar dos distribuciones

Horarios de trenes
Basndome en un articulo de Juan C. Drsteler en InfoVis.net, tomamos como ejemplo un horario de trenes confeccionado a partir de un dptico de la lnea Castelldefels-Barcelona/Sants recogido en la estacin de Renfe. Originalmente el horario ocupa una tabla de 10 filas y 9 columnas ms una columna "viuda" con el tren de las 22:38. Un total de 91 campos con formato hh.mm cada uno, 455caracteres. Dptico original Trayecto Castelldefels -> Barcelona-Sants

5.03 6.02 6.18 6.37 6.48 6.55 7.02 7.07 7.20 7.25

7.32 7.37 7.50 8.02 8.05 8.20 8.24 8.32 8.37 8.51

9.02 9.07 9.24 9.32 9.37 10.02 10.07 10.32 10.37 11.02

11.07 11.32 11.37 12.02 12.07 12.32 12.37 13.02 13.07 13.20

13.32 13.37 13.50 14.02 14.07 14.20 14.32 14.37 14.50 15.02

15.07 15.20 15.32 15.37 15.50 16.02 16.07 16.20 16.32 16.37

16.50 17.02 17.07 17.20 17.32 17.37 17.50 18.02 18.07 18.20

18.32 18.37 18.50 19.02 19.07 19.20 19.32 19.37 19.50 20.02

20.07 20.20 20.32 20.37 20.50 21.02 21.07 21.20 21.32 21.37

22.38

En el diagrama Stem & Leaf se representa la hora a la izquierda de la barra de separacin | y losminutos de la salida de cada tren a la derecha. La frecuencia de los trenes se deduce fcilmente de la longitud de las filas y es, adems, muy fcil ver en que minutos de cada hora pasan tpicamente los mismos. Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf 05 | 03 06 | 02 18 37 48 55 07 | 02 07 20 25 32 37 50 08 | 02 05 20 24 32 37 51 09 | 02 07 24 32 37 10 | 02 07 32 37 11 | 02 07 32 37 12 | 02 07 32 37 13 | 02 07 20 32 37 50 14 | 02 07 20 32 37 50 15 | 02 07 20 32 37 50 16 | 02 07 20 32 37 50 17 | 02 07 20 32 37 50 18 | 02 07 20 32 37 50 19 | 02 07 20 32 37 50 20 | 02 07 20 32 37 50 21 | 02 07 20 32 37 22 | 38 Por otra parte, dado que a algunas horas se repite exactamente el horario de los trenes se puede reducir an ms el tamao del grfico, sin perder informacin y ganando en claridad.

Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf reducido 05 | 03 06 | 02 18 37 48 55 07 | 02 07 20 25 32 37 50 08 | 02 05 20 24 32 37 51 09 | 02 07 24 32 37 10 11 12 | 02 07 32 37 13 14 15 16 17 18 19 20 | 02 07 20 32 37 50 21 | 02 07 20 32 37 22 | 38 Al final tenemos 59 campos de 2 dgitos, 118 caracteres ms los separadores, es decir 4 veces menos dgitos que con el horario original, menos espacio y ms claridad. Esto nos da idea de que una disposicin apropiada de los datos puede ser doblemente informativa y que la representacin grfica puede contribuir enormemente a la percepcin de patrones y a la comprensin de la naturaleza de los fenmenos.

Diagrama de caja
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentacin visual que describe varias caractersticas importantes, al mismo tiempo, tales como la dispersin y simetra. Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los datos, sobre un rectngulo, alineado horizontal o verticalmente.

Construccin: Comparar distribuciones Diagrama de Caja a travs de Excel

Construccin:
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos muestran elrecorrido intercuartlico. Este rectngulo est dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y mximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen tienen un lmite de prolongacin, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente

EJEMPLO DISTRIBUCIN DE EDADES


Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas. 36 39 25 24 37 29 24 23 39 41 20 40 36 33 45 24 31 34 31 40

ORDENAR LOS DATOS


Para calcular los parmetros estadstico, lo primero es ordenar la distribucin 20 41 45 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40

CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el siguiente: Q1=(24 + 25) / 2 = 24,5 Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmtica de dicho valor y el siguiente: me= Q2 = (33 + 34)/ 2 =33,5 Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En nuestro caso, como 3N / 4 = 15, resulta Q2=(39 + 39) / 2 = 39

DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1) La primera parte de la caja a (Q1, Q2),

La segunda parte de la caja a (Q2, Q3) El bigote de la derecha viene dado por (Q3, Xmx).

INFORMACIN DEL DIAGRAMA


Podemos obtener abundante informacin de una distribucin a partir de estas representaciones. Veamos alguna:

La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que entre el 50% y el 75%. El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25% de los ms jvenes estn ms concentrados que el 25% de los mayores. El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est comprendido en 14,5 aos.

Seguro que t podrs obtener ms informacin (Utiliza la mediana!)

Comparar distribuciones
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o ms conjuntos de datos.

Comparacin distribucin de edades Comparacin entrenamientos de un corredor Comparacin clasificacin liga

COMPARACIN DISTRIBUCIN DE EDADES


Anlogamente a lo realizado con los diagramas de tallo y hojas, comparamos, mediante estos diagramas, esta distribucin con la del otro ejemplo de distribucin de edades.

Diagrama de sectores
Un diagrama de sectores se puede utilizar para todo tipo

de variables, pero se usa frecuentemente para las variables cualitativas.

Los datos se representan en un crculo, de modo que el ngulo de cada sector es proporcional a la frecuencia absolutacorrespondiente.

El diagrama circular se construye con la ayuda de un transportador de ngulos.

Ejemplo

En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natacin, 4 juegan al ftbol y el resto no practica ningn deporte.

Alumnos Baloncesto Natacin Ftbol Sin deporte Total 12 3 9 6 30

ngulo 144 36 108 72 360

También podría gustarte