Está en la página 1de 27

ESTADSTICA Y PROBABILIDADES

Profesor : Ing. Mvila Alumna : Estrella Cori Asto 05170135

DIAGRAMA DE CAJA

Diagrama de Caja

El diagrama de caja es una representacin grfica basada en los cuartiles, que ayuda a ilustrar un conjunto de datos.

Diagrama de Caja

Para elaborar el diagrama solo se necesitan cinco valores estadsticos: el valor mnimo; Q1 (el primer cuartil); la mediana; Q3 (tercer cuartil) y el valor mximo.

Diagrama de Caja
Este diagrama se usa cuando se necesita la mayor informacin acerca de la distribucin de los datos, la ventaja que posee con respecto a los dems diagramas es que posee caractersticas como centro y dispersin de los datos, y la principal desventaja que posee es que no presenta ninguna informacin acerca de las frecuencias que presentan los datos.

Diagrama de Caja
Los pasos para construir el diagrama de caja son los siguientes:
Dibujar y marcar un eje de medida horizontal.

Construir un rectngulo cuyo borde izquierdo esta arriba del cuarto inferior y cuyo borde derecho esta arriba del cuarto superior. Dibujar un segmento de recta vertical dentro de la caja arriba de la mediana. Prolongar rectas desde cada extremo de la caja hasta las observaciones ms lejanas que estn todava a menos de 1.5fs de los bordes correspondientes

Diagrama de Caja

Dibujar un circulo abierto para identificar cada observacin que caiga entre 1.5fs y 3fs del borde al cual esta ms cercano estas se llaman puntos inusuales suaves Dibujar un circulo de lnea llena para identificar cada observacin que caiga a mas de 3fs del borde ms cercano, estas se llaman puntos inusuales extremos donde fs = cuarto superior cuarto inferior

Diagrama de Caja
Valor mximo

Extremos entre los que espera encontrar los valores de la variable

Cuartiles, la caja contiene al 50% de las observaciones

Valor mnimo

Diagrama de Caja

Aparecen valores extremos

Mucha dispersin

Poca dispersin

Diagrama de Caja
El diagrama de caja representa el recorrido y el recorrido intercuartlico, as como los lmites entre los que se espera encontrar a la mayor parte de las observaciones. Los valores que quedan fuera de los lmites se representan con un crculo si quedan, relativamente cerca de lo que se considera normal y con un asterisco si se pueden considerar datos atpicos.

Diagrama de Caja

Ante la existencia de valores extremos se debe estudiar su procedencia: pueden ser errores de trascripcin a la hora de almacenar los datos, individuos que no pertenecen a la poblacin en estudio o simplemente datos atpicos.

Diagrama de Caja
Ejemplo:
El restaurante La Ta Veneno ofrece el servicio de entrega a domicilio sin cargo extra en un radio de 15 km. Falopia, la propietaria, desea obtener informacin acerca del tiempo de

entrega. Cunto tiempo toma una entrega tpica? Dentro de qu intervalo de tiempo se efecta la mayor parte de las entregas? Para una muestra de 20 de ellas se determin la siguiente informacin:

Diagrama de Caja
Valor mnimo = 13 min Q1 = 15 min Mediana = 18 min Q3 = 22 min Valor mximo = 30 min

Con estos datos desarrolla un diagrama de caja para los tiempos de entrega. A qu conclusiones se puede llegar acerca de los tiempos en cuestin?

Diagrama de Caja
Solucin:
El primer paso para elaborar un diagrama de caja es establecer una escala adecuada en el eje horizontal. Despus se dibuja un rectngulo (caja), que parte de Q1 (15 min) y termina en Q2 (22 min). Dentro de la caja se marca un segmento vertical para representar la mediana (18 min). Finalmente se trazan dos lneas horizontales, una desde la caja hasta el valor mnimo (13 min), y otra hasta el valor mximo (30 min) Estas lneas horizontales que sobresalen de la caja, se llaman salientes de la caja.

Diagrama de Caja
Mediana Valor mnimo Q1 Q3 Valor mximo

12

14

16

18

20

22

24

26

28

30

32 Minutos

Diagrama de Caja

El diagrama de caja muestra que el 50% central de las entregas toma entre 15 y 22 minutos. La distancia o intervalo entre los extremos de la caja, que es de 7 min, se denomina amplitud cuartlica (o intercuartlica.) Dicho intervalo es la distancia entre el primer cuartil y el tercero.

DIAGRAMA DE TALLO HOJA

Diagrama de Tallo Hoja


Un diagrama de tallo-hoja (Tukey, 1977) es un histograma que conserva informacin numrica. De manera similar al histograma permite ver el lote como un todo y advertir aspectos como: Cun aproximadamente simtricos son los datos. Cun dispersos estn los valores. La aparicin de valores inesperadamente ms frecuentes. Si algunos valores estn alejados del resto. Si hay concentraciones de valores. Si hay grupos separados.

Diagrama de Tallo Hoja


Al utilizar los dgitos de los valores de los mismos datos, en vez de simplemente encerrando reas, ofrece ventajas: Es ms fcil de construir a mano. Facilita el ordenamiento de los datos. Permite, por lo tanto, hallar la mediana y otras medidas resumen basadas en el lote ordenado. Permite ver la distribucin de los datos dentro de cada intervalo como patrones dentro de los datos.

Diagrama de Tallo Hoja


Pasos para construir un diagrama de tallo y hoja:

Seleccionar uno o ms dgitos iniciales para los valores de tallo. El/Los digito/s final/es se convierten en hojas. Hacer una lista de valores de tallo en una columna vertical (entre 5 y 20 tallos) Registrar la hoja por cada observacin junto al valor correspondiente al tallo. Indicar las unidades para tallos y hojas en algn lugar del diagrama.

Diagrama de Tallo Hoja


Ejemplo
La siguiente distribucin de frecuencia muestra el nmero de anuncios comerciales pagados por los 45 miembros del Club Neurticos Annimos en el ao actual. Observemos que 7 de los 45 socios pagaron entre 90 y 99 anuncios (pero menos de 100). Sin embargo, El nmero de asociados en esta clase se agrupan en alrededor de 90, estn dispersos a lo largo de toda clase, o se acumulan alrededor de 99 anuncios? No podemos saberlo.

Diagrama de Tallo Hoja


# De anuncios comprados 80 a 90 90 a 100 100 a 110 110 a 120 120 a 130 130 a 140 140 a 150 150 a 160 Total Frecuencia 2 7 6 9 8 7 3 3 45

Diagrama de Tallo Hoja


Una tcnica que se usa para presentar informacin cuantitativa en forma condensada es el diagrama de tallo y hoja. En el ejemplo anterior no podamos conocer los valores de la clase de 90 a 100 anuncios. Para ilustrar la construccin de un diagrama de tallo y hojas usando el nmero de comerciales comprados, supongamos que las 7 observaciones en la clase de 90 a 100 sean 96; 94; 93; 94; 95; 96 y 97.

Diagrama de Tallo Hoja


El valor de tallo es el digito o dgitos principales, en este caso el 9. Las hojas son los dgitos secundarios. EL tallo se coloca a la izquierda de una lnea vertical y los valores de las hojas a la derecha.

Los valores de las clases de 90 a 100, apareceran como sigue:

9|6434567
Por ultimo, ordenamos los valores dentro de cada tallo de menor a mayor. El segundo rengln del diagrama de tallo y hojas aparecera como sigue:

9|3445667

Diagrama de Tallo Hoja

Con el diagrama de tallo y hojas podemos observar rpidamente que hubo 2 socios que compraron 94 comerciales y que el nmero de anuncios comprados fue desde 93 hasta 97. Un diagrama de tallo y hojas es semejante a una distribucin de frecuencia, pero con ms informacin, esto es, valores de datos en lugar de marcas.

Conclusiones
Podemos resaltar la importancia y utilidad de las representaciones grficas pueden alcanzar para el proceso de anlisis de datos. Existen distintos tipos de grficos que se pueden crear, como una herramienta imprescindible en la presentacin de resultados y el proceso de anlisis estadstico.

Sin embargo es difcil precisar cundo es ms apropiado utilizar un grfico que una tabla. Ms bien podremos considerarlos dos modos distintos pero complementarios de visualizar los mismos datos.

Bibliografa
Estadstica

para Administracin y Economa Lind, Marchal, Mason

www.fisterra.com/mbe/investiga/graficos/graficos.htm metodosestadisticos.unizar.es/asignaturas/16603/Tema4.pdf webpages.ull.es/users/jjsalaza/MEI/Practica2/practica2.pdf www.monografias.com/trabajos11/estadi/estadi.shtml www.dm.uba.ar/materias/analisis_de_datos/2006/1/teoricas/Teor2.pdf