Está en la página 1de 24

Diplomado:

EXCEL EMPRESARIAL
Materia:

ESTADÍSTICA Y ANÁLISIS DE DATOS

Docente: M.Sc.(c) Ing. Jhimmy R. Rios Saravia


Tema 2:

Descripción Gráfica de los Datos.


2.1 - Gráficos para describir variables categóricas
Las variables categóricas pueden describirse utilizando tablas de distribución de frecuencias y gráficos
como gráficos de barras, gráficos de tarta y diagramas de Pareto. Estos gráficos son utilizados
habitualmente por los directivos y los analistas de mercado.
2.1 - Gráficos para describir variables categóricas

Gráfico de Barras Los gráficos de barras se utilizan normalmente para describir datos categóricos.
Si nuestro objetivo es llamar la atención sobre la frecuencia de cada categoría,
lo más probable es que tracemos un gráfico de barras.
2.1 - Gráficos para describir variables categóricas
Si es hacer hincapié en la proporción de cada categoría, es probable que
Gráfico de Tarta
elijamos un gráfico de tarta.

EJEMPLO

El gerente de un Centro de Ventas pidió una desagregación


Varios
de los gastos de viaje de los Vendedores que asistían a 12% Transporte
diversas Ciudades del interior. Se observó que el 31 por Matricula 31%
ciento de los gastos estaba representado por los costes de 20%
transporte, el 25 por ciento por los costes de alojamiento,
el 12 por ciento por los gastos de alimentación, el 20 por Alimentación
ciento por los gastos de matrícula y el resto por costes 12% Alojamiento
varios. Represente gráficamente estos datos. 25%
2.1 - Gráficos para describir variables categóricas
Un diagrama de Pareto es un gráfico de barras que muestra la frecuencia de las causas de
Gráfico de Pareto los defectos. La barra de la izquierda indica la causa más frecuente y las de la derecha
indican las causas con frecuencias decrecientes. Los diagramas de Pareto se utilizan para
separar lo «poco vital» de lo «mucho trivial».
Una empresa fabrica y entrega sus productos a varias tiendas al por menor y quiere disminuir
EJEMPLO el número de devoluciones. Para ello, investigó el número de ocurrencias generadoras de
devolución de la entrega en el último semestre, conforme presentado en la tabla abajo:

Razones Ocurrencias
Separación incorrecta 45
Facturación incorrecta 60
Atraso en el transporte 125
Pedido errado 30
Atraso en la entrega 140
Precio errado 20
Producto dañado 65
Otros 15
500
2.1 - Gráficos para describir variables categóricas

Gráfico de Pareto EJEMPLO - Solución

Ocurrencias % Acumulado

Razones Ocurrencias Porcentaje % Acumulado 500 100,00%


450 90,00%
Atraso en la entrega 140 28,00% 28,00% 400 80,00%
350 70,00%
Atraso en el transporte 125 25,00% 53,00% 300 60,00%
Producto dañado 65 13,00% 66,00% 250 50,00%
200 40,00%
Facturación incorrecta 60 12,00% 78,00%
150 30,00%
Separación incorrecta 45 9,00% 87,00% 100 20,00%
30 6,00% 93,00% 50 10,00%
Pedido Errado
0 0,00%
Precio errado 20 4,00% 97,00%
otros 15 3,00% 100,00%
500 100 %
2.1 - Gráficos para describir variables categóricas

Gráfico de Pareto Problemas principales Ocurrencias


Las políticas de la empresa requieren demasiada información 3
Las políticas exigen procedimientos complicados 3
Ejercicio Demasiada burocracia 7
Presupuestos muy limitados 8
Cuadrantes inadecuados 42
Está usted interesado en analizar los Políticas inadecuadas 6
principales problemas a los que se El personal sanitario tiene demasiadas tareas en casa 7
enfrentan los empleados de la Clínica El personal sanitario tiene otros trabajos 15
Oruro. Para ello ha decidido realizar, en El personal sanitario carece de puntualidad 21
Los empleados del hospital no tienen suficiente formación 6
primer lugar, un diagrama de Pareto. Como
Los empleados no están suficientemente motivados 12
primer paso ha realizado un conjunto de El personal sanitario se muestra despreocupado 4
entrevistas con empleados y mandos del El personal sanitario no sigue el plan de trabajo 59
hospital. 8
No hay suficiente colaboración entre los empleados del hospital
Los métodos utilizados están ya obsoletos 28
¿Qué conclusiones podría sacar?
Habría que mejorar tecnológicamente el hospital 10
Los procedimientos requieren mucho tiempo 30
2.2 - Gráficos para describir datos de series temporales
Gráfico de Series Representa una serie de datos en varios intervalos de tiempo. Midiendo el tiempo en el eje
Temporales de abscisas y la cantidad numérica que interesa en el de ordenadas se obtiene un punto en
el gráfico por cada observación. Uniendo los puntos contiguos en el tiempo por medio de
líneas rectas se obtiene un gráfico de series temporales.

En la tabla se muestra las ventas trimestrales realizadas por una empresa durante un periodo
EJEMPLO de 6 años que se encuentran en el fichero de datos Ventas Anuales 2014-2019. Describa los
datos gráficamente.

Trimestres
Año 1 2 3 4
2014 271 199 240 255
2015 341 246 245 275
2016 351 283 353 292
2017 401 282 306 291
2018 370 242 281 274
2019 356 245 304 279
2.1 - Gráficos para describir variables categóricas
Gráfico de Series
EJEMPLO - Solución
Temporales

Ventas
450

400

350

300

250

200

150

100
T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4
2014 2015 2016 2017 2018 2019
2.3 - Gráficos para describir variables numéricas
Distribución de Una distribución de frecuencias de datos numéricos es una tabla que resume datos
Frecuencias enumerando las clases en la columna de la izquierda y el número de observaciones de cada
clase en la columna de la derecha. Sin embargo, en una distribución de frecuencias de datos
numéricos las clases o intervalos no son fácilmente identificables.

Reglas de Regla 1: Decidir k, el número de intervalos (clases).


Construcción Regla 2: Los intervalos (clases) deben ser de la misma amplitud, w; la amplitud
viene determinada por lo siguiente:
𝑉𝑎𝑙𝑜𝑟 𝑀𝑎𝑥 − 𝑉𝑎𝑙𝑜𝑟 𝑀𝑖𝑛
𝑤 = 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠

Tanto k como w deben redondearse al alza, posiblemente al siguiente número


entero mayor.

Regla 3: Los intervalos (clases) deben ser inclusivos y no solaparse.


2.3 - Gráficos para describir variables numéricas
Distribución de
Frecuencias Sugerencia 1 Sugerencia 2
𝐾= 𝑁 𝐾 = 1 + 3,322 log(𝑁)
Formas de hallar k
Sugerencia 3
Guía rápida para decidir un número aproximado de intervalos de
una distribución de frecuencias

Tamaño de la Muestra Número de Intervalos


Menos de 50 5–7
De 50 a 100 7–8
De 101 a 500 8 – 10
De 501 a 1000 10 – 11
De 1001 a 5000 11 – 14
Más de 5000 14 - 20
2.3 - Gráficos para describir variables numéricas
Distribución de
Frecuencias
Erika Buenfil, directora de marketing de una prestigiosa compañía de telefonía móvil, obtuvo
Ejercicio los registros de los minutos consumidos por una muestra aleatoria de 110 abonados al plan
más barato de la empresa (250 minutos mensuales como máximo en hora punta). La Tabla
contiene una lista de los minutos consumidos por cada abonado de la muestra durante un
mes. ¿Qué indican los datos?
271 236 294 252 254 263 266 222 262 278 288
262 237 247 282 224 263 267 254 271 278 263
262 288 247 252 264 263 247 225 281 279 238
252 242 248 263 255 294 268 255 272 271 291
263 242 288 252 226 263 269 227 273 281 267
263 244 249 252 256 263 252 261 245 252 294
288 245 251 269 256 264 252 232 275 284 252
263 274 252 252 256 254 269 234 285 275 263
263 246 294 252 231 265 269 235 275 288 294
263 247 252 269 261 266 269 236 276 248 298
2.3 - Gráficos para describir variables numéricas
Distribución de Redondeo
Ejercicio - Solución Min 222
Frecuencias Max 298
Rango 76
Frecuencia k 10,488 10
30 Amplitud 7,6 8
27

25 24

Inf Sup Frecuencia


20
222 230 5
15
230 238 8
12 238 246 6
11
10
10 8 246 254 24
6 6 254 262 10
5
5
262 270 27
1
0 270 278 12
230 238 246 254 262 270 278 286 294 302 278 286 6
286 294 11
294 302 1
2.3 - Gráficos para describir variables numéricas
Distribución de
Tipos Histogramas
Frecuencias
Distribución
Simétrica

Distribución
Distribución
sesgada
sesgada
positivamente
negativamente
2.3 - Gráficos para describir variables numéricas
Distribución de En un área de servicios dentro de una empresa de manufactura se realiza una encuesta para
Frecuencias evaluar la calidad del servicio proporcionado y el nivel de satisfacción de los clientes
internos. La encuesta consiste de 10 preguntas, y cada una de ellas evalúa diferentes
EJERCICIO aspectos del servicio proporcionado. Las respuestas para cada pregunta es un número entre
0 y 10. Para hacer un primer análisis de los resultados obtenidos se suman los puntos
obtenidos de las 10 preguntas para cada cuestionario. A continuación se muestran los
puntos obtenidos en 50 cuestionarios.

78 78 82 85 81 86 80 73 84 78
68 84 75 78 76 76 82 85 91 80
70 87 77 82 84 48 49 39 39 43
35 42 34 44 49 34 30 43 31 34
41 42 45 42 35 38 39 42 43 29

• Realice el histograma e interprételo con cuidado.


• ¿Qué es lo más destacado que observa en el histograma?
• ¿Tendría alguna utilidad hacer un análisis por separado de cada una de las
preguntas? Explique.
2.4 - Tablas y gráficos para describir relaciones entre variables

Sirve para estudiar las posibles relaciones entre dos variables cuantitativas.
Diagrama de Puntos
El diagrama de puntos dispersos es una representación de los datos, que comprende
lo siguiente:
1) El rango de cada variable.
2) La pauta de valores existente dentro del rango.
3) Una sugerencia sobre la posible relación entre las dos variables.
4) Una indicación de los casos atípicos (puntos extremos).

Responde a:

¿Cuánto varía la cantidad vendida cuando varía el precio?

¿Cómo influye en las ventas totales el salario total disponible en una región
geográfica?

¿Aumenta la publicidad las ventas?


2.4 - Tablas y gráficos para describir relaciones entre variables
Costo Nro días
Diagrama de
3 7
Puntos 3 6
Chasky Delivery ofrece tres tarifas distintas de envío de 3 5
Ejercicio paquetes de menos de 5 kilos de Miraflores al Centro de la 5 5
ciudad: ordinario, 3 BOB; urgente, 5 BOB; y superurgente, 10 5 6
BOB. Para comprobar la calidad de estos servicios, un 5 6
importante minorista de venta por correo envió 15 paquetes de 10 2
Miraflores a San Pedro en momentos elegidos aleatoriamente. 10 1
Los paquetes fueron enviados en grupos de tres por los tres 10 4
servicios al mismo tiempo para reducir las diferencias 3 9
resultantes del día del envío. Los datos siguientes muestran el 3 10
coste de envío, x, y el número de días, y, en pares (x, y): 5 6
5 7
10 5
10 4
2.4 - Tablas y gráficos para describir relaciones entre variables

Diagrama de
Ejercicio - Solución
Puntos

Costo Nro días


12
3 7
3 6
10
3 5
5 5
8
5 6
5 6
10 2 6
10 1
10 4 4
3 9
3 10 2
5 6
5 7 0
10 5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
10 4 Costo Nro días
2.4 - Tablas y gráficos para describir relaciones entre variables

Diagrama de
Interpretación
Puntos
2.4 - Tablas y gráficos para describir relaciones entre variables
%
Diagrama de En cierta empresa es usual pagar horas Semana Horas Extra
Defectuosos
Puntos extras para cumplir con los tiempos de 1 340 5
entrega. En este centro productivo, un 2 95 3
3 210 6
EJERCICIO grupo de mejora de calidad está
4 809 15
tratando de reducir la proporción de
5 80 4
piezas malas. Con este propósito 6 438 10
deciden investigar la relación que existe 7 107 4
entre la cantidad de horas extras, y el 8 180 6
porcentaje de artículos defectuosos. A 9 100 3
10 550 13
continuación se muestran los datos 11 220 7
obtenidos. 12 50 3
13 193 6
14 290 8
15 340 2
16 115 4
17 362 10
18 300 9
19 75 2
20 93 2
21 320 10
22 154 7
2.5 - Errores en la presentación de datos

En algunas circunstancias, es fácil que la manera en que se presenta el resumen induzca a error.
Debemos extraer de los datos la imagen más clara y precisa posible. Los gráficos incorrectos
pueden ofrecer una imagen distorsionada y dar una falsa impresión. Es posible transmitir un
mensaje erróneo sin ser deliberadamente deshonesto.
1.6 – Conclusiones

Se debe tomar en
cuenta que una mala
expresión de la
información puede llevar
No se requiere un amplio a grandes confusiones.
conocimiento estadístico
para transmitir lo valioso
de la información
Se logro entender que
existen distintos tipos de
gráficas para el análisis
de la información así
como para su
apreciación.

También podría gustarte