Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 1
Sesin 2 Introduccin a la Estadstica: Descripcin de Datos Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 2 Estadstica Descriptiva Datos resumidos y presentados convenientemente. Dichos resmenes pueden ser: tabulares grficos o numricos Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 3 Una distribucin de frecuencias es una tabla que resume los datos mostrando la frecuencia o nmero de elementos que hay dentro de cada una de sus clases, que deben ser mutuamente excluyentes y colectivamente exhaustivas. El objetivo es proveer informacin acerca del conjunto de datos que no podra obtenerse rpidamente por simple observacin de los datos originales. Distribucin de frecuencias Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 4 Ejemplo: Marada Inn A las personas hospedadas en el Marada Inn un fin de semana cualquiera, se les pidi que contestaran una encuesta con el objetivo de evaluar la calidad de las instalaciones del hotel. Se les pidi primero, que usando la siguiente escala: 1=excelente, 2=sobre el promedio, 3=promedio, 4=debajo del promedio y 5=pobre; calificaran la calidad de su infraestructura. Adems, se registr el monto de sus cuentas por dicho fin de semana en el hotel, su regin de origen (1=norte, 2=centro, 3=sur y 4=extranjero) y la edad. La informacin proporcionada por 50 huspedes se muestran en la hoja Excel adjunta. Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 5 Distribucin de frecuencias Calificacin Frecuencia Pobre 9 Debajo Promedio 8 Promedio 10 Sobre Promedio 14 Excelente 9 Total 50 Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 6 H I J 1 Calificacin Frecuencia 2 Pobre =CONTAR.SI($B$2:$B$51,H2) 3 Debajo promedio =CONTAR.SI($B$2:$B$51,H3) 4 Promedio =CONTAR.SI($B$2:$B$51,H4) 5 Sobre promedio =CONTAR.SI($B$2:$B$51,H5) 6 Excelente =CONTAR.SI($B$2:$B$51,H6) 7 Total =SUMA(I2:I6) 8 Usando Excel: Funcin CONTAR.SI para Construir una Distribucin de Frecuencias Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 7 H I J 1 Calificacin Frecuencia 2 Pobre 9 3 Debajo promedio 8 4 Promedio 10 5 Sobre promedio 14 6 Excelente 9 7 Total 50 8 Usando Excel: Funcin CONTAR.SI para Construir una Distribucin de Frecuencias Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 8 La frecuencia relativa de una clase es la fraccin o proporcin del total de datos que pertenecen a una determinada clase. Una distribucin de frecuencias relativas es una tabla que nos resume un conjunto de datos mostrando la frecuencia relativa para cada clase. Distribucin de frecuencias relativas Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 9 Distribucin de frecuencias relativas Calificacin Frecuencia Frecuencia Relativa Pobre 9 0.18 Debajo Promedio 8 0.16 Promedio 10 0.20 Sobre Promedio 14 0.28 Excelente 9 0.18 Total 50 1.00 Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 10 H I J 1 Calificacin Frecuencia Frecuencia Relativa 2 Pobre =CONTAR.SI($B$2:$B$51,H2) =+I2/$I$7 3 Debajo promedio =CONTAR.SI($B$2:$B$51,H3) =+I3/$I$7 4 Promedio =CONTAR.SI($B$2:$B$51,H4) =+I4/$I$7 5 Sobre promedio =CONTAR.SI($B$2:$B$51,H5) =+I5/$I$7 6 Excelente =CONTAR.SI($B$2:$B$51,H6) =+I6/$I$7 7 Total =SUMA(I2:I6) =SUMA(J2:J6) 8 Usando Excel: Funcin CONTAR.SI para Construir una Distribucin de Frecuencias Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 11 H I J 1 Calificacin Frecuencia Frecuencia Relativa 2 Pobre 9 0.18 3 Debajo promedio 8 0.16 4 Promedio 10 0.2 5 Sobre promedio 14 0.28 6 Excelente 9 0.18 7 Total 50 1 8 Usando Excel: Funcin CONTAR.SI para Construir una Distribucin de Frecuencias Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 12 Un grfico de barras es una herramienta grfica para trabajar con datos cualitativos. En un eje (normalmente el horizontal), colocamos las etiquetas con los nombres de las categoras. En el otro eje (normalmente el vertical), se puede usar la frecuencia, la frecuencia relativa. Usamos una barra de ancho fijo que dibujamos arriba de cada etiqueta, con una altura de acuerdo con su correspondiente frecuencia. Las barras estn separadas para enfatizar que cada clase es una categora diferente. Grfico de Barras Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 13 Calificacin de Calidad Marada Inn Grfico de Barras Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 14 El grfico de pie es una herramienta grfica usada generalmente para presentar distribuciones de frecuencia relativa de datos cualitativos. Primero se traza un crculo; luego usando las frecuencias relativas se subdivide en sectores que corresponden a la frecuencia relativa de cada clase. Dado que hay 360 en un circulo, una clase con una frecuencia relativa de .25 consumir .25(360) = 90 de ese crculo. Grfico de Pie Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 15 Grfico de Pie Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 16 Guas para seleccionar el nmero de clases Use entre 5 y 20 clases. Conjuntos de datos con un nmero grande de elementos, generalmente requieren un nmero grande de clases. Conjuntos de datos pequeos usualmente requieren pocas clases Distribucin de Frecuencias Para Datos Numricos Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 17 Gua para seleccionar el Ancho de Clase Use clases de igual ancho Ancho aproximado de clase = Nmero de Clases Dato ms grande - Dato ms pequeo Distribucin de Frecuencias Para Datos Numricos Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 18 Distribucin Acumulada de Frecuencias muestra el nmero de observaciones con valores iguales o menores que el lmite superior de cada clase. Distribucin Acumulada de Frecuencias Relativas muestra la proporcin de tems con valores menores o iguales al el lmite superior de cada clase. Distribucin Acumulada de Frecuencias Porcentuales muestra el porcentaje de tems con valores menores o iguales al el lmite superior de cada clase. Distribucin Acumulativa Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 19 La funcin FRECUENCIA no es una funcin simple de Excel. FRECUENCIA nos proporciona valores mltiples. En Excel, la formula que dan como respuesta mltiples valores se llaman frmula matricial. Una frmula matricial tiene una forma especial de ingresar. Usando la funcin FRECUENCIA de Excel para Construir una Distribucin de Frecuencias Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 20 Pasos para ejecutar esta funcin: Paso 1 Seleccionar la matriz donde deben aparecer las frecuencias Paso 2 Escribir la siguiente frmula: {= FRECUENCIA (Datos,Grupos)} Paso 3 Presionar CTRL + SHIFT + ENTER (La frmula aparecer en toda la matriz seleccionada) Usando la funcin FRECUENCIA de Excel para Construir una Distribucin de Frecuencias Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 21 Montos facturados Frecuencia Frecuencia Relativa Frecuencia Relativa Acumulada Frecuencia Relativa Acumulada 50 a 59 2 0.04 0.04 1.00 60 a 69 13 0.26 0.30 0.96 70 a 79 16 0.32 0.62 0.70 80 a 89 7 0.14 0.76 0.38 90 a 99 7 0.14 0.90 0.24 100 a 109 5 0.10 1.00 0.10 Total 50 1.00 Para el ejemplo, escogemos 6 clases: Distribucin de Frecuencias Para Datos Numricos Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 22 Histograma El histograma es una manera muy comn de presentar grficamente datos cuantitativos. La variable de inters se coloca en el eje horizontal. Se dibuja un rectngulo arriba de cada intervalo de clase con una altura correspondiente a su frecuencia, frecuencia relativa, o frecuencia porcentual. A diferencia del grfico de barras, un histograma no tiene separaciones entre rectngulos de clases adyacentes Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 23 Usando herramientas de Excel Herramientas Anlisis de Datos Histograma Usando Excel para Construir un Histograma Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 24 Usando Excel para Construir un Histograma Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 25
Monto($) 20 40 60 80 100 F r e c u e n c i a s
P o r c e n t u a l e s
A c u m u l a d a s
50 60 70 80 90 100 110 Ojiva de Frecuencias Porcentuales Acumuladas Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 26 Anlisis Exploratorio de Datos El Anlisis Exploratorio de Datos es un conjunto de tcnicas que usan aritmtica simple y grficos fciles de dibujar para resumir datos rpidamente. Una de estas tcnicas es el diagrama de hoja y tallo. Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 27 Diagrama de Hoja y Tallo Cada dgito en el tallo es una hoja. Cada lnea en el diagrama se conoce como tallo. A la derecha de la lnea, registramos el ltimo dgito de cada dato en orden. El primer dgito de cada dato se coloca a la izquierda de una lnea vertical. Es muy parecido a un histograma, con la ventaja de que este diagrama conserva los valores originales. Un Diagrama de Hoja y Tallo nos muestra ambos el orden y la forma de la distribucin de los datos. Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 28 5 6 7 8 9 10 2 7 2 2 2 2 5 6 7 8 8 8 9 9 9 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 0 0 2 3 5 8 9 1 3 7 7 7 8 9 1 4 5 5 9 tallo hoja Ejemplo: Marada Inn Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 29 Dado que tenemos el primer dgito repetido, el primer valor corresponde a valores de la hoja de 0 - 4, y el segundo a valores de la hoja de 5 - 9. Si se cree que un diagrama de hoja y tallo est muy concentrado, podemos abrir el diagrama usando dos tallos para cada dgito inicial. Diagrama de Hoja y Tallo Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 30 5 5 9 1 4 7 7 7 8 9 1 3 5 8 9 0 0 2 3 5 5 5 6 7 8 9 9 9 1 1 2 2 3 4 4 5 6 7 8 8 8 9 9 9 2 2 2 2 7 2 5 5 6 6 7 7 8 8 9 9 10 10 Ejemplo: Marada Inn Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 31 Unidades de la Hoja Cuando no se muestran las unidades de la hoja, se asume que es 1. Las unidades pueden ser 100, 10, 1, 0.1, y as. En el ejemplo anterior, la unidad de la hoja fue 1. Cada hoja se define por un slo dgito. Diagrama de Hoja y Tallo Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 32 Ejemplo: Unidad de hoja = 0.1 Si tenemos los siguientes datos 8 9 10 11 Unidad de hoja = 0.1 6 8 1 4 2 0 7 8.6 11.7 9.4 9.1 10.2 11.0 8.8 El diagrama de hoja y tallo para estos datos sera: Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 33 16 17 18 19 Unidad de hoja = 10 8 1 9 0 3 1 7 1806 1717 1974 1791 1682 1910 1838 El 82 de 1682 Se redondea a 80 y se representa por un 8. Ejemplo: Unidad de hoja = 10 Si tenemos los siguientes datos El diagrama de hoja y tallo sera: Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 34 Tablas de Contingencia y Diagramas de Dispersin Tablas de Contingencia y Diagramas de Dispersin son dos mtodos que permiten resumir los datos para dos (o ms) variables simultneamente. Los gerentes necesitan mtodos que les permitan graficar y tabular datos de manera que se entiendan las relaciones entre dos variables. Hasta el momento hemos visto mtodos que resumen datos pero una variable a la vez. Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 35 Tablas de Contingencia Tabla de contingencia es una forma de resumir en una tabla datos de dos variables simultneamente. Se puede usar si: ambas variables son cualitativas, o Si alguna es cuantitativa, para hacer la tabla debe ser transformada en otra cualitativa. Las filas y las columnas definen las clases para cada una de las dos variables. Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 36 El patrn general que muestran los puntos sugieren la relacin entre las variables. Una de las variables se muestra en el eje vertical y la otra en el horizontal. Un diagrama de dispersin es una representacin grfica de la relacin entre dos variables cuantitativas. Una lnea de tendencia es una aproximacin de la relacin. Diagramas de Dispersin y Lneas de Tendencia Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013. Anlisis de Datos para la Gerencia 37 Procedimientos Grficos y Tabulares Cualitativo Cuantitativo Mtodos Tabulares Mtodos Tabulares Mtodos Grficos Mtodos Grficos Dist.Frec. Dist.Frec.Relat. Dist.Frec.Porc. Tab.deConting. Grfico de Barras Grfico de Pie Dist. Frec. Dist.Frec.Relat. Dist.Frec.Acum. Dist.Frec.Relat.A cumuladas Diagrama de Hoja y Tallo Tab.deConting. Histograma Ojiva Diagrama de Dispersin Dato