Documentos de Académico
Documentos de Profesional
Documentos de Cultura
6
4
2
0
20 30 40 50 60 70 80 90
Temperatura
Las dos funciones más importantes de las estadísticas descriptivas son:
► Comunicar información
► Apoyar el razonamiento sobre los datos
California
Internacional
Otros EE.UU.
Washington
Oregón
Internacional
Oregón
Otros California
Washington EE.UU.
0 10 20 30 40
Porcentaje
8
6
4
2
0
3 4 5 6
Así, el porcentaje que cae en un bloque puede calcularse sin escala vertical, ya que el
área total es igual al 100%.
Pero es útil tener una escala vertical (escala de densidad). Su unidad es "% por unidad",
por lo que en el ejemplo anterior la unidad vertical es "% por año".
El histograma proporciona dos tipos de información sobre los
datos:
1. Densidad (hacinamiento): La altura de la barra indica cuántos sujetos hay para una
unidad en la escala horizontal. Por ejemplo, la mayor densidad se da en torno a los 19
años, ya que
.04 = 4% de todos los sujetos tienen 19 años. En cambio, sólo alrededor del 0,7%
de los sujetos entran en cada intervalo de un año para las edades comprendidas
entre 60 y 80 años.
2. Porcentajes (frecuencias relativas): Vienen dados por
30
Millas por galón para 32
20 25
coches
15
10
El diagrama de caja transmite menos información que un histograma, pero ocupa
menos espacio, por lo que es muy adecuado para comparar varios conjuntos de datos:
30 25
Kilómetros por
galón
20 15
10
4 6 8
Número de cilindros
Diagrama de dispersión
El diagrama de dispersión se utiliza para representar datos que vienen como pares.
25000
20000
5000
0
6 8 10 12 14 16
Educación
Proporcionar contexto es importante
Los análisis estadísticos suelen comparar los datos observados con una referencia. Por lo
tanto, el contexto es esencial para la integridad gráfica.
► La visualización de la información cuantitativa" de Edward Tufte (p. 74)
Para resumir los datos con un número, utilice la media o la mediana. La mediana es el
número que es mayor que la mitad de los datos y menor que la otra mitad.
Media frente a mediana
La media y la mediana son iguales cuando el histograma es simétrico.
30
25
20
15
10
5
0
km/seg
Media frente a mediana
Cuando el histograma está sesgado a la derecha, la media puede ser mucho mayor que
la mediana.
30
25
coches
20
15
10
Los dos números x¯ y s se utilizan a menudo para resumir datos. Ambos son sensibles
a unos pocos datos grandes o pequeños.
Si eso le preocupa, utilice la mediana y el rango intercuartílico.