Está en la página 1de 8

http://www.fiuxy.com/ebooks-gratis/1051610-descarga-librosde-hidraulica-y-fluidos-software-gratis.

html
http://probyestjoo.blogspot.pe/2008/09/diagrama-de-cajas-ybigotes_28.html
http://www.estadisticaparatodos.es/taller/graficas/cajas.html
http://www.ehowenespanol.com/diagramas-caja-excelcomo_167255/
http://www.alcula.com/es/calculadoras/estadistica/diagramade-caja/

Histogramas
Los histogramas son otra forma conveniente de mostrar los datos. Un histograma es similar a un
grfico de barras, pero en vez de graficar datos individuales en el eje de las X (la recta horizontal),
grafica un rango de valores. Los histogramas son tiles para tener datos numricos que varan
considerablemente.
Este es un histograma de los 20 mejores tiempos de bobsleigh en pareja en los Juegos Olmpicos de
Invierno 2010. Estn graficados solo los segundos, ya que cada tiempo comenz con 3 minutos.

Los tiempos estn marcados en el eje x, y la frecuencia (la cantidad de equipos que obtuvieron cada
tiempo) en el eje y (la recta vertical). Al mirar la grfica podemos ver que siete equipos tuvieron un
tiempo final de 3:30 y 3:31 (3 minutos 31 segundos) y ningn equipo obtuvo un tiempo de entre 3:31 y
3:32.
Este histograma tiene un ancho en cada barra de 1 segundo, lo que significa que los datos estn
graficados en grupos de tiempo de 1 segundo. Podramos hacer el ancho de barra ms grande o ms
pequeo segn nuestra conveniencia. A continuacin, los mismos datos en un histograma con ancho
de barra de 1.5 segundos:
El histograma no muestra los tiempos individuales ni los tiempos exactos. Sin embargo, es una bonita
forma de ver la tendencia de los datos.

Diagramas de caja
Los diagramas de caja son una forma til de graficar datos divididos en cuatro cuartiles, cada uno
con igual cantidad de valores. El diagrama de caja no grafica frecuencia ni muestra las estadsticas
individuales, pero en ellos podemos ver claramente dnde se encuentra la mitad de los datos. Es un
buen diagrama para analizar la asimetra en los datos.
A continuacin, te dejamos algunas palabras que debes tener en cuenta cuando graficas diagramas
de caja:

Q1 Cuartil 1, la mediana de la mitad menor de los datos.

Q2 Cuartil 2, la mediana de todos los datos.

Q3 Cuartil 3, la mediana de la mitad mayor de los datos.

IQR Rango intercuartil, la diferencia entre Q3 y Q1.

Valores extremos Los valores ms pequeos y los ms grandes de los datos.

Comencemos haciendo un diagrama de caja de la puntuacin en el examen de geometra:


90, 94, 53, 68, 79, 84, 87, 72, 70, 69, 65, 89, 85, 83, 72
Paso 1: ordena los datos de menor a mayor.
53 65 68 69 70 72 79 83 84 85 87 89 90 94

Paso 2: encuentra la mediana de los datos.


Llamado tambin cuartil 2 (Q2).
Paso 3: encuentra la mediana de los datos menores que Q2.
Este sera el cuartil menor (Q1).
Paso 4: encuentra la mediana de la data mayor que Q2.
Este sera el cuartil mayor (Q3).

Paso 5: encuentra los valores extremos.


Estos seran los valores ms grandes y ms pequeos.
Valores extremos = 53 y 94.
Paso 6: crea una recta real que contenga todos los datos.
Deja que se extienda un poco ms all de los valores extremos.

Paso 7: dibuja una caja de Q1 a Q3 divididas por una recta en Q2. Luego extiende los "bigotes"
por cada lado de la caja hacia los valores extremos.

Esta grfica est dividida en cuatro grupos distintos: el bigote menor, la mitad menor de la caja, la
mitad mayor de la caja y el bigote mayor (el bigote mayor no se refiere a Jorge Negrete). Como en
cada grupo hay una misma cantidad de datos, cada seccin representa el 25% de los mismos.

A travs de este diagrama vemos que el 50% de los estudiantes obtuvo entre 69 y 87 puntos, el 75%
de los estudiantes obtuvo menos de 87 puntos y el 50% obtuvo ms de 79. Si tu puntuacin estuvo en
el bigote mayor, sintete orgulloso de ti mismo, ya que sacaste mejor nota que el 75% de tus
compaeros. Si por el contrario, tu nota estuvo en el bigote menor, quizs tengas que estudiar un poco
ms (y ver las pelculas de Jorge Negrete despus de estudiar).

Valores atpicos
Los valores atpicos son aquellos mucho ms grandes o mucho ms pequeos que el resto de los
datos. Se representan con un punto en cualquier extremo del diagrama. En nuestro ejemplo no hubo
ningn valor atpico; y aunque 53 parece ser mucho ms pequeo que el resto, en realidad no fue
lo suficientemente pequeo.
Para ser considerado un valor atpico, el valor debe ser:

mayor que Q3 por, al menos, 1.5 veces el rango intercuartil (IQR),

menor que Q1 por, al menos, 1.5 veces el IQR.

Los valores atpicos son aquellos que:


1.5(IQR) > Q3
1.5(IQR) < Q1
A continuacin, te presentamos los resultados individuales finales de salto de esqu masculino de los
Juegos Olmpicos de invierno.
283.6

269.4

262.2

261.1

246.7

245.5

239.2

233.7

230.3

227.9

226.4

225.5

224.1

223.6

222.3

221.4

217.8

217.2

216.9

211.6

211.4

208.5

204.9

202.7

202.4

200.5

198.5

182.4

111

Los cuartiles quedan as: Q1 sera 208.5, Q2 sera 222.3 y Q3 sera 236.45. La puntuacin ms baja
(111) parece ser un valor atpico, ya que es mucho ms pequea que el resto de los datos. Sin
embargo, no podemos estar seguros hasta que saquemos las cuentas.
Primero debemos calcular el IQR, que es Q3 Q1. Luego lo multiplicamos por 1.5 para obtener el
nmero que necesitamos para saber si hay algn valor atpico.
IQR = 236.45 208.50 = 27.95
1.5(IQR) = 1.5(27.95) = 41.93
208.5 41.93 = 166.57
Para que el nmero en cuestin (111) califique como un valor atpico, debe ser menor a 166.57, que
es la diferencia entre Q1 (208.5) y 41.93.
S, es! Como 111 es menor a 166.57, entonces declaramos oficialmente a 111 como un valor atpico.
Al hacer el diagrama de caja, representamos a 111 con un punto y extendemos el bigote menor solo
hasta el siguiente valor menor (que sera 182.4).

Quiz deberamos verificar que no haya ningn valor atpico hacia la mitad mayor de los datos.
236.45 + 41.93 = 278.38
Hay un valor cerca de 278.38, as que ste tambin es un valor atpico.

Media, mediana, modo y rango


La estadstica ms usada es el promedio, yhay tres formas de medirlo: la media, la mediana y
la moda.
Por qu tres? Buena pregunta. Cada una te dar una forma diferente de ver los datos; dependiendo
de la pregunta que quieras responder (o el argumento que quieras defender), cualquiera de las tres
podra probar algo.
La media es la medida ms usada para encontrar el promedio. De hecho, la gente siempre utiliza la
palabra "promedio" para referirse a la "media." Encontrarla es simple: solo suma todos los nmeros en
los datos y divdelos por la cantidad de nmeros.

La mediana es el nmero del medio en un grupo de datos. Sin embargo, los datos deben estar
ordenados numricamente (de mayor a menor o de menor a mayor) antes de encontrar este
promedio. Si el nmero del medio est entre dos nmeros, entonces encuentra la media entre esos
dos (smalos y divdelos entre 2).

Mediana: el nmero del medio en un grupo de datos.


La moda es probablemente la forma menos comn de encontrar el promedio, y en la mayora de los
casos es la menos til. Para encontrar la moda, solo encuentra el nmero que ms se repite. Puede
haber ms de una moda, o ninguna.

Moda = nmero que ms se repite.


Finalmente tenemos el rango. El rango NO es una medida de promedio; sin embargo, a menudo se
utiliza como el promedio, porque es otra manera de medir un grupo de datos. El rango mide la
"extensin" de los datos, qu tan alejados se encuentran el menor del mayor. Para encontrar el rango,
resta el valor ms pequeo del ms grande.

Rango = valor ms pequeo valor ms grande


Pero todo esto tendr mucho ms sentido si vemos algunos ejemplos. En nuestra encuesta de redes
sociales, encontramos la mediana, la media y el rango de tiempo que cada grupo pasa en las pginas
sociales por da.
Tiempo dedicado a las redes sociales (horas/da)

Chicas

Chicos

Media

2.20

1.01

Mediana

2.17

0.98

Rango

3.75

1.88

Como lo habamos dicho, en promedio las chicas pasan al menos una hora ms al da en estas
pginas que los chicos. Tanto la media como la mediana para las chicas fue significativamente mayor
a las de los chicos.

La puntuacin de esta semana de "Bromeando con las celebridades


de segunda"
Aqu tenemos la puntuacin que los participantes del programa "Bromeando con las celebridades de
segunda" obtuvieron esta semana:
Evan L

52

Nicole S

50

Pamela A

47

Chad O

44

Erin A

39

Jake P

38

Niecy N

36

Kate G

32

Ahora encontremos los tres promedios y el rango para las puntuaciones de los concursantes.
Estadstic
Cmo encontrarla
a

Explicacin

Media

Suma las puntuaciones y


divdelas entre 8, el nmero
total de concursantes. La media
es 42.25.

Mediana

Primero ordena las


puntuaciones, y despus
encuentra el valor del medio. En
este grupo, el valor medio est
entre 44 y 39, as que sumamos
estos dos y los dividimos entre
2.

Moda

No tiene moda.

No hay ninguna puntuacin que

ocurra varias veces, as que no


hay moda para este grupo de
datos.
Rango

52 32 = 20

Resta el ms pequeo del ms


grande. El rango es 20 puntos.

Para este grupo de datos, solo hay dos medidas de promedio (no hay moda). Tanto la media como la
mediana podran usarse para describir el promedio. Si fueras Evan, preferiras usar la media o la
mediana? Y si fueras Kate?
Cuidado: el rango de un grupo de datos NO mide el promedio de los datos.