Curso: Procesamiento de informacin estadstica. Alumna: Oronzor Castillo Isela Benazir.
ANLISIS DESCRIPTIVO Y PRESENTACIN DE DATOS DE
UNA VARIABLE. Existen varias formas grficas (visuales) para describir la informacin. Datos cualitativos: Grficas de pastel (grficas circulares) y grficas de barras: Grficas que se usan para resumir datos cualitativos, atributos o categricos. Las grficas de pastel (grficas circulares) muestran la cantidad de datos que pertenecen a cada categora como una parte proporcional de un crculo. Las grficas de barras muestran la cantidad de datos que pertenecen a cada categora como un rea rectangular del tamao proporcional. Cuando la grfica de barras se presenta en la forma de un diagrama de Pareto, presenta informacin adicional y muy til. Diagrama de Pareto: Grfica de barra con las barras ordenadas de la categora ms numerosa a la categora menos numerosa. Incluye una grfica de lnea que muestra los porcentajes acumulados y conteos de las barras. Es popular en aplicaciones de control de calidad. Un diagrama de Pareto de tipos de defecto mostrar aquellos que tengan el mayor efecto sobre la tasa de defectos en orden de efecto. Entonces es fcil ver cules defectos deben observarse para reducir de manera ms efectiva la tasa de defectos. Datos cuantitativos: Una de las principales razones para construir una grfica de datos cuantitativos es mostrar su distribucin. La Distribucin es un patrn de variabilidad que muestran los datos de una variable. La distribucin muestra la frecuencia de cada valor de la variable. Una de las grficas ms simples usadas para mostrar una distribucin es la grfica de puntos: Describe los datos de una muestra al representar cada valor de datos con un punto colocado a lo largo de una escala. Esta escala puede ser horizontal o vertical. La frecuencia de los valores se representa a lo largo de la otra escala. Es una tcnica conveniente que se usa cuando uno comienza a analizar los datos. Resulta en una imagen de los datos que los ordena numricamente. Se ha vuelto popular una tcnica conocida como: Licenciatura en Educacin Preescolar Ciclo escolar 2017 2018 3 Semestre B Curso: Procesamiento de informacin estadstica. Alumna: Oronzor Castillo Isela Benazir.
Presentacin de tallo y hojas (para resumir datos numricos):
Presenta los datos de una muestra con los dgitos reales que constituyen los valores de datos. Cada valor numrico se divide en dos partes: el (los) dgito(s) inicial(es) es (son) el tallo y los dgitos posteriores son las hojas. Los tallos se ubican a lo largo del eje principal y para cada valor de datos se ubica una hoja de modo que muestre la distribucin de los datos. Es bastante usual que muchas variables presenten una distribucin que est concentrada (ajustada) en torno a un valor central y despus en alguna forma dispersa en una o ambas direcciones. Una presentacin grfica revela algo que el analista puede o no haber anticipado.
Distribuciones de frecuencia e histogramas.
Distribucin de frecuencias: Listado, con frecuencia expresado en
forma de tabla, que relaciona los valores de una variable con su frecuencia. Frecuencia: es el nmero de veces que el valor x ocurre en la muestra. Distribucin de frecuencias no agrupadas: No agrupadas porque cada valor de x en la distribucin es independiente. Distribucin de frecuencia agrupada: Cuando un conjunto grande de datos tiene muchos valores x diferentes en lugar de algunos valores repetidos. Lineamientos bsicos para construir una distribucin de frecuencia agrupada: Cada clase debe ser del mismo ancho. Las clases (en ocasiones llamadas cajas) deben establecerse de modo que no se traslapen y de modo que cada valor de dato pertenezca exactamente a una clase. Usa un sistema que saque ventaja de algn patrn para garantizar precisin. Cuando sea conveniente, con frecuencia ex ventajoso un ancho de clase par. Una vez establecidas las clases, es necesarios ordenar los datos en dichas clases. El mtodo para ordenar depender del formato actual de los datos. Histograma: Grfica de barras que representa una distribucin de frecuencias de una variable cuantitativa. Un histograma se constituye con los componentes siguientes: Licenciatura en Educacin Preescolar Ciclo escolar 2017 2018 3 Semestre B Curso: Procesamiento de informacin estadstica. Alumna: Oronzor Castillo Isela Benazir.
Un ttulo, que identifica la poblacin o muestra de inters.
Una escala vertical, que identifica las frecuencias en las diversas clases. Una escala horizontal, que identifica a la variable x. Los valores para los lmites de clase o puntos medios de clase pueden etiquetarse a lo largo del eje x. Usa cualquier mtodo etiquetado de ejes que represente mejor la variable. Frecuencia relativa: Medida proporcional de la frecuencia para una ocurrencia. Se encuentra al dividir la clase ente el nmero total de observaciones. Puede expresarse en fraccin comn, en forma decimal o como porcentaje. Los histogramas son herramientas valiosas. Formas de histogramas: Simtrico: Ambos lado de esta distribucin son idnticos (las mitades son imgenes especulares) Normal: Una distribucin simtrica que se amontona en torno a la media y se dispersa en los extremos. Uniforme (rectangular): Cada valor aparece con igual frecuencia. Sesgado: Una cola se prolonga ms que la otra. La direccin de asimetra est en el lado de la cola ms larga. Forma de J: No hay cola al lado de la clase con la frecuencia ms alta. Bimodal: Las dos clases ms pobladas estn separadas por una o ms clases. Con frecuencia, esta situacin implica que se muestrearon dos poblaciones. Moda: Valor de los datos que ocurren con mayor frecuencia. Clase modal: es la clase con la frecuencia ms alta. Distribucin bimodal: tiene dos clases de frecuencia alta, separadas por clases con frecuencias menores. No es necesario que las dos frecuencias altas sean iguales. Distribucin de frecuencias acumuladas: Distribucin de frecuencias que relaciones frecuencias acumuladas on valores de la variable. Frecuencia acumulada: Para una clase dad es la suma de la frecuencia para dicha clase y las frecuencias de todas las clases de valores menores. Ovija: Grfica de lnea de una frecuencia acumulada o distribucin de frecuencias relativas acumuladas.
Medidas de tendencia central.
Licenciatura en Educacin Preescolar Ciclo escolar 2017 2018 3 Semestre B Curso: Procesamiento de informacin estadstica. Alumna: Oronzor Castillo Isela Benazir.
Las medidas de tendencia central son valore numricos que ubican,
en cierto sentido, el centro de un conjunto de datos. Media (Media aritmtica). Mediana: Valor de los datos que ocupan la posicin media cuando los datos se clasifican en orden de acuerdo con su tamao. Moda: Es el valor de x que ocurre con ms frecuencia. Medio rango: Nmero exactamente a la mitad de un dato de valor ms bajo, L y un dato de valor ms alto, H. Se encuentra al promediar los valores bajo y alto.
Medidas de dispersin.
Incluyen rango, varianza y desviacin estndar. Dichos valores
numricos describen la cantidad de dispersin o variabilidad, que se encuentra entre los datos: los datos estrechamente agrupados tienen valores relativamente pequeos y los datos ms ampliamente dispersos tienen valores ms grandes. Rango: Diferencia en valor entre los datos con valor ms alto, H y los datos con valor ms bajo, L: Desviacin de la media: Es una desviacin de la media, x x, es la diferencia entre el valor x y la media. Varianza muestral: Es la medida de las desviaciones al cuadrado, calculada con n-1 como el divisor. Desviacin estndar muestral: La desviacin estndar de una muestra, s, es la raz cuadrada positiva de la varianza.