Está en la página 1de 57

Tabulacin y representacin grfica de datos cualitativos y cuantitativos

Contenido

Reglas para tabular y graficar Resmenes de datos:

Cualitativos

Distribucin de frecuencias Grficas de barra y pastel

Cuantitativos

Distribucin de frecuencias Grfica de puntos Histogramas, Diagrama acumulativo Diagrama de tallo y hojas Tabulaciones cruzadas Grficos de dispersin

Dos variables

Conceptos importantes

Poblacin: es la totalidad de elementos del universo.

Infinita
Poblacin

Finita

Conceptos importantes

Caracterstica de estudio: es la variable que se va a estudiar, ejemplos: edad, sexo, peso, altura, concentracin, ph, rendimiento, etc.

Conceptos importantes

Muestreo: es una parte de la poblacin para inferir en su caracterstica de estudio.

Conceptos importantes

Cundo usar muestras? La poblacin es infinita o muy grande. La poblacin es finita pero lo suficientemente grande, entonces es difcil hacer todo el estudio. La unidad de estudio se transforma o se destruye al ser examinado, ejemplo es ensayos destructivos.

Conceptos importantes

Variable es la caracterstica de inters a estudiar


Continua Cuantitativa Discreta
Peso Altura Frecuencia Estatura Edad
Cantidad personas Cantidad de autos Cantidad de bolsas

Variable

Cualitativa

Atributo

Color Sabor Aroma Suavidad Impacto

Las variables cuantitativas requieren de un instrumento o medio de medicin.

Conceptos importantes

Experimento: Es cualquier proceso que genera un conjunto de datos.

Elemento: es el resultado del espacio muestral.

Observacin es cualquier registro de informacin numrico o categrico.

Conceptos importantes

Estadstico: Es la medida de una caracterstica de la poblacin que se calcula a partir de los datos de una muestra.

Tabulacin

Es un ordenamiento de la informacin en filas y columnas Una buena tabla debe tener:



Ttulos y encabezamientos claros y completamente definidos Incluir las unidades en que se expresa la medicin Incluir la suficiente informacin que permita chequear la validez de los clculos o argumentos Incluir fuente de datos cuando corresponda

Ejemplo de tabulacin

Representaciones grficas

Alternativa para mostrar la informacin obtenida o generada Los principios bsicos son:

Simplicidad Fidelidad (incremento de escalas) Representar una ayuda ( no son concluyentes) Deben responder al objetivo deseado

Regla

Particin de la Poblacin. Cada observacin debe pertenecer a una, y slo una clase o categora.

Para estudiar las caractersticas de una variable se ordenan los valores observados de la muestra en k clases denominadas c1, c2, .. ck.

ANALISIS DE DATOS

Diseo de procedimientos eficientes que suministren datos confiables para su posterior anlisis. Planear la recoleccin de datos indicando entre otros aspectos tiempo (cundo?, lugar (dnde?), responsabilidades (quin?), formatos y procedimientos (cmo?). El registro y anlisis de la informacin proveniente de muestras representativas tomadas de pruebas fsicas y qumicas se hacen a los productos con el fin de verificar su estado.

14

ANALISIS DE DATOS

Datos deben ser veraces y reflejar las condiciones del proceso, datos errneos generan conclusiones errneas. El analista debe tener plena confianza en los datos para que el estudio sea vlido. Mnima desconfianza en los datos o en su procedencia obligan al analista a descartarlos. Recoleccin de datos debe ser cuidadosamente planeada y programada asignado los recursos que sean necesarios para garantizar excelente calidad de datos.

15

ANALISIS DE DATOS

Acciones correctivas y preventivas, con las que se procurar reducir y si es posible eliminar los problemas. Anlisis y aproximaciones de los datos a distribuciones de probabilidad es necesario agruparlos de tal manera que se puedan visualizar comportamientos y tendencias histricas de los procesos que ayuden a interpretar los aspectos que pueden estar causando descontrol y por ende bajos niveles de calidad.

16

Distribucin de Frecuencias

Datos No Agrupados n < 30

Datos Agrupados n 30

Tratamiento de datos, para conocer su comportamiento

Datos cualitativos

Grfico de barras:

Representacin grfica de datos cualitativos que se han resumido en una distribucin de frecuencia. En el eje horizontal se especifican los indicadores o nombres de cada clase y en el eje vertical una escala de frecuencia Un caso particular lo constituye el grfico de Pareto desarrollado como una forma de incrementar la calidad. Aqu las clases van ordenadas de izquierda a derecha de mayor a menor frecuencia Representacin grfica de frecuencias relativas o porcentuales Para dibujarlo se traza un crculo y se divide segn las frecuencias.

Grfico de pastel:

Datos cualitativos

Ejemplo
Los empleados de una empresa electrnica moderna tienen un sistema de horario flexible. Pueden comenzar su jornada de trabajo a las 7:00, 7:30, 8:00, 8:30 o 9:00. Los datos siguientes representan una muestra de las horas de entrada que seleccionaron. 1.Resumir los datos formando una distribucin de frecuencias y graficarlos en barras y pastel 2.Que le dicen los resmenes respecto a las preferencias horarias?

Datos cualitativos

Horas de entrada
7:00 7:30 8:30
8:30

8:30 8:30 8:30


7:00

9:00 8:30 8:00


9:00

8:00 7:30 8:00


8:30

7:30 7:00 7:30


8:00

Datos cualitativos

Tabla de Frecuencia
Clase F.Absoluta F.Relativa F.porcentual

7:00 7:30
8:00 8:30 9:00

3 4
4 7 2

0.15 0.2
0.2 0.35 0.1

15 % 2%
2% 35 % 10 %

Total

20

100 %

Datos cualitativos

Grfica de barras
8 7 6 5 4 3 2 1 0 07:00 07:30 08:00
Horas
Frecuencia absoluta

08:30

09:00

Entrada

Datos cualitativos

Grfico de pastel

10%

15%

35% 20%

20%

07:00

07:30

08:00

08:30

09:00

Datos cualitativos

Ejercicio
La Organizacin Internacional de Normas, en Ginebra ha desarrollado un conjunto de normas de calidad, las ISO. En todo el mundo las empresas tratan de obtener la certificacin. Una encuesta solicito a un grupo de fabricantes sus planes para obtener este nivel. Las respuestas se codificaron de acuerdo a C= ya certificado P= en vas de certificarse W= le interesa el tema N= no quiere certificarse U = indeciso

Las repuestas fueron las siguientes:

Datos cualitativos

W N P C W

P W N W W

N U W P N

N W W W W

W P N N N

P W W N U

C P N C N

W C W W W

W N W P N

N P N N W

Datos cualitativos

Forme una distribucin de frecuencia absoluta y porcentual para cada conjunto de datos

Una Consultora inform que menos del 1% de las empresas estaban certificadas un ao antes de la encuesta. Comente la tendencia hacia la certificacin ISO

DISTRIBUCIONES DE FRECUENCIAS

Es un mtodo o tcnica de anlisis de datos. Consiste en el agrupamiento de un conjunto de datos en intervalos, de tal manera que genera una distribucin o arreglo de datos. El objetivo es proporcionar una perspectiva de los datos Esta distribucin se puede comparar con las distribuciones estadsticas tericas y as inferir soluciones al problema planteado.

DISTRIBUCIONES DE FRECUENCIAS

Visualizar la posible distribucin de datos Cada dato pierde su identidad. Distribuciones estadsticas tericas o empricas para inferir hacia el problema. Distribuciones de frecuencia de datos no agrupados presentan una distribucin que es muy difcil de aproximar. Cifras significativas de los datos Seleccin de un nmero de clases que refleje una adecuada distribucin.

28

DISTRIBUCIONES DE FRECUENCIAS

Es conveniente que los datos se agrupen en un nmero de intervalos de clase que estn entre 10 y 20. Queda a criterio del analista escoger este nmero, aunque existen reglas que podran usarse como punto de partida.

Moya Marcos, Robles Natalia, 2010

Datos Agrupados 29 n 30

DISTRIBUCIONES DE FRECUENCIAS Datos agrupados

Criterio del Libro Estadstico un enfoque terico y prctico, pgina 34 a la 38.


PREAMBULO Muestreo: Recolectar los datos (xi) de acuerdo con el tamao de muestra previamente calculado. Ordenar los datos de menor a mayor.

30

DISTRIBUCIONES DE FRECUENCIAS Datos agrupados

Paso 1. Calcular el nmero apropiado de intervalos K. Regla de Sturges: k = 1 + 3,3 log n, donde n es el tamao de la muestra. Otra opcin es K = raz(n)
Paso 2. Calcular el rango: R = ximx - ximn

Paso 3. Calcular el intervalo de clase (C), as: C = R/k El valor de i debe ser redondeado siempre hacia arriba 31 los y a la misma cantidad de decimales que tienen datos.

DISTRIBUCIONES DE FRECUENCIAS Datos agrupados

Paso 4. Calcular el nuevo rango (NR) NR = C * k


Paso 5. Calcular los lmites inferior y superior de la primera y ltima clase de la distribucin, de la siguiente forma: Observ menor = Xmin (NR R)/2 Observ mayor = Xmx + (NR R)/2

Paso 6. Construir la distribucin de frecuencias

32

DISTRIBUCIONES DE FRECUENCIAS

Completar el cuadro de frecuencias de datos agrupados. Construir el histograma para observar la distribucin del conjunto de datos.

33

Datos cualitativos

Frecuencia absoluta: Se llama frecuencia


absoluta de la clase ci al nmero total de individuos u observaciones que pertenece a dicha clase y se denota por ni. Como las clases c1, c2, ..... ck

Frecuencia relativa: Se llama frecuencia relativa


de la clase ci a la proporcin de individuos que pertenecen a la clase sobre el total de individuos o tamao de la muestra. Frecuencia absoluta Frecuencia relativa = n

Frecuencia

Caso particular frecuencia relativa multiplicada por 100


Frecuencia porcentual = Frecuencia relativa 100

porcentual:

de

Datos cuantitativos

Distribucin de frecuencia
Para los datos cuantitativos se deben :

Determinar la cantidad de clases Determinar el ancho de cada clase Determinar los lmites de clase

Datos cuantitativos

Cantidad de clases:

Se forman al especificar intervalos de valores de datos que se usan para agrupar los elementos de un conjunto Se recomienda usar entre 10 y 20 clases El objetivo final es mostrar la variacin de los datos La regla es elegir igual ancho para todas las reglas Una mayor cantidad de clases se traduce en un menor ancho Clculo aproximado:

Ancho de las clases:

Ancho de clase =

Valor maximo en los datos- Valor minimo en los datos Cantidad de clases

Datos cuantitativos

Lmite de clases:

Los lmites se escogen para que cada valor de dato slo pertenezca a una clase Se asigna un valor mnimo y mximo para cada clase

Punto medio de clase: corresponde al valor promedio entre los lmites inferior y superior de clase

DISTRIBUCIONES DE FRECUENCIAS (EJEMPLO)


Se toman doce grupos de cinco unidades de una mquina llenadora de latas de pasta de tomate y se pesan, originando los siguientes datos: Construir una distribucin de frecuencias de datos agrupados.

38

A continuacion se presenta el procedimiento para construir una distribucion de frecuencias de datos agrupados

Paso 1 Recolectar datos TABULAR DATOS


HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS Artculo: Pasta de tomate Cdigo: XY-987 Caracterstica: Peso Especificacin: 20,0 2,5 decigramos Operacin: Llenado Mquina: Llenadora n=60 Operario: M. Matamoros Inspector: M. Coto Turno: 1 Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1de 1 # 1 2 3 4 5 6 7 8 9 10 11 12 1 22,0 23,0 20,0 21,5 19,0 21,5 22,5 25,0 21,5 24,5 22,5 23,5 2 20,5 19,0 19,0 19,0 21,5 24,0 20,0 20,5 23,0 24,0 22,5 20,0 3 20,0 21,5 19,5 21,0 22,5 19,5 21,0 21,5 22,5 23,5 20,5 20,5 4 21,0 21,0 20,0 20,0 22,5 22,0 22,5 21,5 23,5 22,0 22,0 22,5 5 22,5 21,5 22,5 22,0 18,5 22,0 22,0 22,5 21,0 22,0 19,5 23,0 -

40

SOLUCION

Paso 2: Ordenar datos de menor a mayor (es opcional) Paso 3: Fijar el nmero de clases (k) Regla de Sturges: k = 1 + 3,3 log n, donde n es el tamano de la muestra. k = 1 + 3,3 log 60 = 6,867, redondear a la prxima unidad k =7 Paso 4: Determinar el Rango (R) R = ximx - ximn R = 25,0 18,5 = 6,5

41

SOLUCION
Paso 5: Calcular el intervalo de clase (C) R 6,5 C = = = 0,923 = 1,0 k 7

C = 1,0 El valor de C debe ser redondeado siempre hacia arriba y a la misma cantidad de decimales que tienen los datos.
Paso 6: Calcular el Nuevo Rango (NR) NC = C * k = 1, 0 * 7 = 7,0

SOLUCION
Paso 5: Fijar los limites reales de clase (Li , Ls). Se les reconoce por ser limites abiertos.
Li1 = ximn (NR-R)/2 = Li2 = Ls1 = XXXX Ls2 = Li2 + C = y as sucesivamente hasta completar las k clases

SOLUCION
Paso 7: Completar el cuadro de frecuencias de datos agrupados de la siguiente manera a. Punto medio de clase o Marca de Clase (Xk) Xk = Li + Ls o li + ls 2 2 b. Obtener la frecuencia absoluta de cada clase nk (conteo) c. Obtener la frecuencoa absoluta acumulada (Nk)

d. Calcular la frecuencia relativa (fk) fk = nk n e. Obtener la frecuencia relativa acumulada (Fk) Fk = Nk n

SOLUCION
Paso 8: Construir el histograma para observar la distribucion del conjunto de datos

SOLUCION

HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS Artculo: Pasta de tomate Cdigo: XY-987 Caracterstica: Peso Especificacin: 20,0 2,5 decigramos Operacin: Llenado Mquina: Llenadora n=60 Operario: M. Matamoros Inspector: M. Coto Turno: 1 Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1 de 1 Li Ls CONTEO nk xk Nk fk Fk 18,25 19,25 ||||| 5 18,75 5 8,33 8,33 19,25 20,25 ||||||||| 9 19,75 14 15,00 23,33 20,25 21,25 |||||||| | 9 20,75 23 15,00 38,33 21,25 22,25 |||||||||||||||| 16 21,75 39 26,67 65,00 22,25 23,25 |||||||||||||| 14 22,75 53 23,33 88,33 23,25 24,25 ||||| 5 23,75 58 8,33 96,67 24,25 25,25 || 2 24,75 60 3,33 100

46

Utilizando Minitab 16
Histograma de Peso
Normal 19 17 15
Frecuencia
Media Desv.Est. N 21,54 1,485 60

13 11 9 7 5 3 1 18 19 20 21 Peso 22 23 24 25

Datos cuantitativos

Histogramas

Este grfico se puede preparar con datos que han sido resumido en una distribucin de frecuencia Se coloca la variable de inters en el eje horizontal y la distribucin de frecuencia el vertical A diferencia del grfico de barras no hay separacin entre los rectngulos formados por las clases adyacentes, se completa con la lnea vertical que separa a cada uno de ellos Cuando se traza un lnea recta entre cada punto medio de clase se construye un polgono de frecuencia

Datos cuantitativos

Histograma y poligono de frecuencias

10

15

20

25

Unidad de medicin

Datos cuantitativos

Diagrama acumulativo

Este tipo de resumen corresponde a la distribucin de frecuencias acumuladas, en donde se emplean la cantidad de clases, anchos y lmites definidos anteriormente Esta distribucin muestra la cantidad de elementos menores que, o iguales al lmite superior de clase para cada clase El ltimo elemento de una frecuencia acumulada es siempre la cantidad de elementos Una grfica de una distribucin acumulada se llama OJIVA. Los valores de los datos estn en el eje horizontal y las frecuencias acumuladas en el eje vertical

Datos cuantitativos

Ejemplo
Considere la siguiente distribucin de frecuencias: Clase Frecuencia 10-19 10 20-29 14 30-39 17 40-49 7 50-59 2 Forme una distribucin acumulada absoluta y relativa

Datos cuantitativos

Clase 10-19

Frecuencia 10

F.acumulada absoluta
10

F.acumulada porcentual
2%

20-29
30-39 40-49 50-59

14
17 7 2

24
41 48 50

48%
82% 96% 100%

Total

50

50

100%

Datos cuantitativos

Diagrama de tallo y hoja (Stem-and-Leaf)

Es dentro de las tcnicas de anlisis exploratorio de datos una de ms usadas ya que permite mostrar el orden de rangos as como la forma de un conjunto de datos en forma simultanea Se caracteriza por ser fcil de construir y dar ms informacin que un histograma, debido a que muestra los valores reales No hay cantidad nica de tallos ni hojas an cuando se recomienda seleccionar entre 5 a 20 tallos

Datos cuantitativos

Ejemplo
Trace un diagrama de tallo y hoja para los siguientes datos. 70, 72, 75, 64, 58, 83, 80, 82, 76, 75, 68, 65, 57, 78, 85, 72 1.Ordenar en forma ascendente 2.Seleccionar rangos (ancho de clases) define tallos 3.Incorporar hojas

Tallo
5 6 7 8 7 4 0 0 8 5 2 2
8 2 3

Hoja

5 5

Datos cuantitativos

Tabulaciones cruzadas

Es formato de tabulacin se emplea para examinar la relacin entre dos variables Se pueden considerar comparaciones entre variables cuali o cuantitativa
n= 196 Calificacin de calidad Buena Muy Buena Excelente Total Precio por cubierto $10-19 $20-29 42 40 34 64 2 14 78 118

Datos cuantitativos

Grficos de dispersin

Son una representacin de la relacin entre dos variables cuantitativas En este diagrama se grafican los puntos con esas coordenadas Pueden indicar relacin positiva, negativa y sin relacin aparente

Resumen
Objetivo Naturaleza Tipo de diagrama

Distribucin de frecuencia de una variable

Cualitativa Continua
Cualitativa

Circular, Barras Simples Histogramas, Polgonos de frecuencia


Barras agrupadas

Distribucin de frecuencia de dos variables

Continua Relacin entre dos variables Cualitativa

Histogramas, Polgonos de frecuencia Barras agrupadas y Barras proporcionales Grficos lineales y diagramas de dispersin

Continua

También podría gustarte