Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Informe: Capitulo 2
ID: 1087396
Capítulo 2- Exploración de datos con tablas y graficas.
Conceptos clave.
Una distribución de frecuencia indica como un conjunto de datos se divide en
varias categorías al listar todas las categorías junto con el numero de valores de
los datos que hay en cada una.
La frecuencia para una clase es el numero de valores originales que caen en esa
clase.
Los limites inferiores de clase son las cifras más pequeñas que pueden
pertenecer a cada una de las clases.
Los limites superiores de clase son las cifras mas grandes que pueden
pertenecer a cada una de las clases.
Las fronteras de clase son las cifras que se utilizan para separar las clases, pero
sin los espacios creados por los límites de la clase.
Las marcas de la clase son los valores en el punto medio de las clases.
Anchura de clase es la diferencia entre dos limites inferiores de clase (o dos
fronteras de clase) consecutiv@s en una distribución de frecuencias.
Procedimientos para elaborar una distribución de frecuencias.
Distribución normal
Cuando se grafica un histograma, una distribución normal tiene una forma de
“campana”. Muchos métodos estadísticos requieren los datos muestrales
provengan de una población con distribución aproximadamente normal, y a
menudo se puede usar un histograma para juzgar si este requisito se cumple.
Distribución no normal
La distribución de la población no es normal si la gráfica cuantilar normal cumple
con una o dos de las siguientes condiciones:
• Los puntos no se encuentran razonablemente cerca de un patron de línea
recta.
• Los puntos muestran algún patrón sistemático diferente a un patrón de línea
recta.
Graficas de barras
Una grafica de barras utiliza barras de igual anchura para mostrar las frecuencias
de categorías de datos categóricos. Las barras pueden o no estar separadas por
pequeños espacios.
Gráficos de Pareto
Una grafica de Pareto es una grafica de barras para datos categóricos, con la
estipulación añadida de que las barras se ordenan de manera descendente de
acuerdo con las frecuencias, por ello las barras disminuyen de altura de izquierda a
derecha.
Graficas circulares
Una gráfica circular es una gráfica muy común que representa datos categóricos
como rebanadas de un círculo, el tamaño de cada rebanada es proporcional al
conteo de frecuencias para categorías.
Graficas que engañan
Por lo general, las graficas engañosas se usan para mentirle a la gente. Las graficas
deben trazarse de una manera justa y objetiva. Se debe dejar que los lectores
hagan sus propios juicios en vez de manipularlos mediante graficas engañosas.
Pictogramas
Los datos que son de naturaleza unidimensional se representan a menudo con
objetos bidimensionales u objetos tridimensionales. Mediante el uso de
pictogramas, los dibujantes pueden crear falsas impresiones que distorsionan
groseramente las diferencias mediante el uso de sencillos principios de geometría
básica.
La ecuación de regresión:
ŷ = b0 + b1x
describe algebraicamente la línea de regresión.