Está en la página 1de 42

Business Analytics

Posgrados en Ciencias Contables

Profesor: Heriberto Felizzola Jimenez


Introducción personal

• Heriberto Felizzola Jimenez (h.felizzola@javeriana.edu.co)

• Formación:
• Ingeniero Industrial (Universidad del Norte, Barranquilla - Colombia)
• Magister en Ingeniería Industrial (Universidad del Norte, Barranquilla - Colombia)
• Estudiante del Doctorado en Ingeniería (Universidad de los Andes, Bogotá –
Colombia)
• Certificado como Black Belt en Lean Six Sigma

• Áreas de investigación y docencia:


• Ciencia de Datos y Machine Learning (Contratación Pública, Sistemas de Salud,
Gestión de Operaciones)
• Mejoramiento de Procesos con Lean Six Sigma
• Estadística Industrial (Control Estadístico de Procesos y Diseño de Experimentos)
• Métodos de Decisión Multicriterio
Objetivos del curso

1. Objetivo general:

Preparar al estudiante en la aplicación de herramientas analíticas que le permitirán convertir datos en


información, interpretar correctamente dicha información y alimentar la toma de decisiones, generando
valor agregado para su organización.

2. Objetivos de Formación:

• Ilustrar a los estudiantes cómo la combinación de técnicas estadísticas facilita el proceso de toma de
decisiones y genera valor a la organización.
• Entrenar a los estudiantes en el uso herramientas estadísticas ampliamente utilizadas por las empresas.
• Ilustrar cómo el uso de las herramientas estadísticas permite evaluar diversas estrategias empresariales.
Objetivos del curso

3. Resultados de Aprendizaje

Esperamos que al final del curso sean capaces de...

• Apoyar la toma de decisiones a través de la visualización de datos y la estadística descriptiva,


• Distinguir entre causalidad y correlación,
• Aplicar herramientas de analítica de negocios en la toma decisiones,
• Evaluar la aplicación e interpretación de técnicas de la analítica de datos a situaciones de
negocio específicas.
Objetivos del curso

Que NO esperamos de ustedes…


Información importante:
pánico a la estadística

• Bloqueo mental que resulta de pensar en una clase basada en estadística

- En ocasiones el resultado es ni siquiera intentar entender.

• Se presentarán los materiales a un nivel introductorio:

- Sin mucha teoría ni expresiones matemáticas.


- Se explica el concepto en términos muy generales
(importante entender) y se ilustra con muchos ejemplos.

• Objetivo: Convencer de que el uso de datos es muy útil para la toma


de decisiones en una empresa/organización y que se entienda ciertos
principios básicos del análisis de datos para la toma de decisiones.
Estructura del curso: ¿Qué NO hacemos en este curso?

• Big data: Aplicación de Analytics a problemas que involucran enormes


cantidades de datos

• Muchas observaciones
• Muchas variables
• Datos no estructurados

• Característica distintiva: Uso de métodos de ciencias de la computación

• Mayoría de problemas de Analytics a la que están expuestos ejecutivos


involucran “Small data”.
Estructura del curso: ¿Qué hacemos en este curso?
• Comenzamos suponiendo que ya tenemos los datos.

• Exploraremos formas de resumir datos:


- Visualizaciones
- Estadísticos descriptivos

• Aprenderemos a construir intervalos de confianza, que nos


dicen con qué tanta precisión estamos calculando un
promedio.

• Aprenderemos a elaborar pruebas de hipótesis, que nos


dicen si dos grupos son distintos en cuanto a alguna
característica.
Estructura del curso: ¿Qué hacemos en este curso?

• Usaremos regresiones, que explotan las relaciones entre dos


o más variables para predecir y para prescribir.

• Dando un paso atrás, veremos distintas formas de recolectar


datos y cómo hacerlo apropiadamente

• Finalmente, conoceremos el potencial, las herramientas y


vocabulario de la analítica de negocios en un contexto de
Small Data.
Estructura del curso: ¿Qué hacemos en este curso?

Cadena de valor de Business Analytics


Actividad Software Objetivo Método
Recolección, SQL / Hadoop / MS Construcción y arquitectura No cubierto
almacenamiento y Power BI de bases de datos. Ejemplo
organización de datos. base de datos de
transacciones de los
clientes. Amazon.

Análisis de datos MS Excel, R , Stata, Análisis estratégico. MS Excel / Casos


Python, SPSS Ejemplo: Estrategia de
ventas.

Comunicación de los MS Power Point / MS Diseño de presentación de Power point /


resultados Word / Latex / resultados. Reportes y Reportes de
Tableau presentaciones. talleres y trabajo
final
Uso de Casos Harvard

• Utilizaremos casos de la vida real, con datos reales, para


elaborar nuestro análisis.

- Los enunciados de cada caso y la bases de datos se


encuentran en Teams
- Hay que leerlos previo a cada sesión (ver syllabus)

• Discutiremos el caso, definiremos una estrategia para


resolverlo, y ustedes harán el análisis en Excel.
Horario

12 sesiones de 4 horas (48 Fechas:


horas) • Vie. 22 Jul. 6 Pm – 10 Pm
Minutos Actividad • Sab. 23 Jul. 8 Am – 5 Pm
15 Anuncios, resolución de dudas • Vie. 29 Jul. 6 Pm – 10 Pm
105 Tema nuevo y práctica • Sab. 30 Jul. 8 Am – 1 Pm
15 Receso • Vie. 5 Ago. 6 Pm – 10 Pm
105 Continuación tema nuevo, práctica o quiz • Sab. 6 Ago. 8 Am – 5 Pm
• Vie. 12 Ago. 6 Pm – 10 Pm
• Sab. 13 Ago. 8 Am – 5 Pm
• Vie. 19 Ago. 6 Pm – 10 Pm
Evaluación
• Evaluación basada en:

- Quizzes cortos (uno cada sabado, se evalúa tema visto


en la semana anterior). 30%.

- Tareas (Solución de casos). 30%.

- Proyecto caso final (en equipos de 2, más información


pronto). 40%.
Bibliografía
Knaflic, C. N. (2015). Storytelling with data: A data visualization guide for business
professionals. Wiley.
 
Levine, D. M., Berenson, M. L., & Stephan, D. (2016). Statistics for managers using
Microsoft Excel. Upper Saddle River, N.J: Prentice Hall.
 
Anderson, D. R., Sweeney, D. J., Williams, T. A., Camm, J. D., & Cochran, J. J. (2016).
Statistics for business & economics. Cengage Learning.
 
Diez, D., Cetinkaya-Rundel, M., Barr, C. D. (2019). OpenIntro Statistics.
INTRODUCCIÓN
¿Qué es la analítica de negocios?

Es la aplicación de tecnologías informáticas y herramientas


estadísticas que permiten analizar datos relevantes para la toma
de decisiones dentro una empresa/organización.

Los elementos involucrados son…


Procesos Técnicas Comunicación Ideas claves
Datos
Analíticos Estadísticas de Resultados
Ejemplos de preguntas que podríamos responder con
Analítica de Negocios
• ¿Cuáles son las características demográficas de mis clientes?
• ¿Cuál es la probabilidad de un cliente con cierto perfil incumpla sus pagos?
• ¿Cuál será el costo esperado de atender a un paciente con ciertas características?
• ¿Cuál es la máxima disposición a pagar los clientes de cierto perfil por mi producto?
• ¿Hay evidencia para decir que un consumidor está dispuesto a pagar más por mi producto que
el de la competencia?
• ¿Cuál sería el efecto esperado en ventas de introducir una bonificación para los vendedores?
• ¿Cuál diseño de mi página web es más efectivo?
• ¿Qué probabilidad hay de que el valor de un portafolio de inversión disminuya en más del
50% este año?
Ejemplos de preguntas que podríamos responder
con Analítica de Negocios
• ¿Cuáles son las características de mis clientes?
Ejemplos desde la Universidad Javeriana

• Evaluar el desempeño de profesores, basándose en evaluaciones de estudiantes.

• Predecir, basándose en características demográficas y desempeño, si un alumno


caerá en prueba académica o no, con el objetivo de intervenir a tiempo.

• Predecir demanda por un curso en particular, basándose en demanda en el


semestre anterior y distintas características del curso.

• Comparar el efecto de distintas modalidad (presencial, virtual, combinada,


alternancia) sobre los objetivos de aprendizaje
Ejemplo
(con uso de grandes cantidades de datos)

https://www.youtube.com/watch?v=vQILP19qABk
Ejemplo
(con uso de grandes cantidades de datos)
Ejemplo
Aspectos de la analítica
Analítica descriptiva: visualizar y tabular datos que ya
se tienen para entender cambios o la situación actual de
un negocio (básicamente describir la información que
se tiene)

¿Han crecido las ventas después de la introducción de


un nuevo plan de mercadeo?

¿Qué regiones son las más débiles en ventas?

¿Cuáles son las características de mis clientes?

¿Cuánto ha variado el precio de las acciones de Coca


Cola en los últimos 5 años?
Aspectos de la analítica

Analítica predictiva: predecir qué pasará, explotando relaciones entre


variables. Para predecir, es suficiente que las variables que estamos
estudiando estén correlacionadas, no es necesario que una cause otra.

Puntaje de crédito (probabilidad de morosidad)


Retención de clientes (probabilidad de perderlo, intervención temprana)
¿Cuánto me costará atender a un paciente de acuerdo a sus características?
Detección de fraudes (probabilidad de que sea fraudulenta)
Protección de infantes (probabilidad de que el niño sea maltratado)
Predicción de inventarios
Aspectos de la analítica

Analítica prescriptiva: se enfoca en hacer uso de la analítica para determinar cuál es la mejor
decisión que se podría tomar. Aquí es importante determinar causalidad. Muchas veces se hace
con experimentos.

¿Cuál de los diseños de página deberíamos implementar?

¿Si subimos el precio aumentarían las ganancias?

¿Sería efectivo implementar un sistema de compensación basado en desempeño?


ACTIVIDAD EN CLASE

• Si ha utilizado datos en su negocio/vida laboral para responder preguntas relevantes para su


negocio:
- Describa brevemente su negocio/actividad laboral
- Especifique qué pregunta respondió
- ¿Cómo la respondió? (¿Qué datos recolectó?)

• Si nunca ha utilizado datos en su negocio/vida laboral para responde preguntas relevantes para su
negocio:
- Describa brevemente su negocio/actividad laboral
- ¿Qué pregunta le gustaría responder?
- ¿Qué datos cree necesitar?

• Desarrolle una presentación en Power Point de 2 diapositivas


¿Por qué utilizamos el análisis de datos?

MANEJO DE EXPECTATIVAS Piense en el manejo de la Pandemia


por COVID19:
• Como se manejó al inicio
• Como se manejó después de 1
- No nos gusta la incertidumbre. año con datos, estudios e
investigaciones disponibles.
- Intentamos entender aspectos inciertos del negocio. • ¿Qué cambió?
• ¿Cree que se manejo mejor?

- Intentamos predecir el éxito de un producto, servicio o


portafolio

- Intentamos minimizar el fracaso y el riesgo


ESTADÍSTICA DESCRIPTIVA

Definiciones,
Organización y
Visualización
Algunas definiciones
VARIABLE
Una característica (género, ventas, PIB) que puede tomar
distintos valores para distintos observaciones (personas,
firmas, años).

DATOS
El conjunto de observaciones (filas) con sus las respectivas
realizaciones para las variables (columnas).

Ejemplo: caracterización de la clase.


Tipos de Variables
Las columnas representan las características de cada uno de los
préstamos, también denominadas variables.

Cada fila
representa un
único préstamo.
Esto puede ser
un
caso/instancia/o
bservación. 

Continua
Discreta Ordinal (Orden) Nominal
Cada celda es un valor único de la (Medición – Cálculo)
(Conteo) (Clase)
variable para una observación
Numérica Categórica
particular.

Tipos de Variable
Ejemplos de tipos de variables
Pregunta Respuesta Tipo de Variable

¿Tiene perfil de Facebook?


Sí o No Categórica?- Nominal

¿Cuántos mensajes de texto ha


enviado en los últimos dos --------------- Numérica?- Discreta
días?

¿Cuánto tiempo le tomó bajar


la aplicación? --------------- ?
Numérica - Continua

¿Cómo evaluaría su Muy mala, Mala, Regular,


experiencia en Facebook? Buena, Muy Buena Categórica? - Ordinal
¿Cómo resumir los datos?
Tipo de variable
Numérica Categórica

Media, mediana, moda, rango,


Conteo, proporción, tablas de
varianza, desviación estándar,
Estadísticas frecuencia, tablas de
cuártiles, percentiles, sesgo,
contingencia
curtosis, tablas de frecuencia

Método

Histograma, gráfico de caja, Gráfico de barras, Pareto,


Gráfico
valores individuales donas, torta
Organización y visualización de
datos categóricos
Ejemplo
Imagine que usted trabaja en un call center que Hora Cliente Requerimiento Tiempo Calificación
atiende los requerimientos de los clientes  para:
Soporte
• Ventas e instalación 8:10 Cliente 1
Tecnico
15 3
• Soporte técnico
8:25 Cliente 2 Soporte 9 4
• Quejas y reclamos Tecnico
• Cambios
Queja y
• Factura 8:26 Cliente 3
Reclamo
8 4
• Otros
Cada día se registran los siguientes datos: 8:35 Cliente 4 Intalación 7 2
• Hora … … …. … …
• Nombre del cliente
Soporte
• Tipo de requerimiento 17:36 Cliente 125 Tecnico 13 5

• Tiempo de atención
17:52 Cliente 126  Otros 8 5
• Calificación de la atención
A continuación se presenta una muestra de la 18:00 Cliente 127 Factura 12 3
base de datos:
Tabla de Frecuencia
• Cuando se tienen variables categóricas se utilizan las
tablas de frecuencia para generar estadísticas, tales Requerimiento Total Porcentaje Porcentaje
Acumulado
como:
• Conteo
• Conteos acumulados Soporte técnico 97 36,47 % 36,47 %
• Porcentajes Ventas e
79 29,70 % 66,17 %
• Porcentajes acumulados instalación
• Las tablas de frecuencia suministran información Quejas y reclamos 36 13,53 % 79,70 %
clave para:
• Analizar las categorías Factura 25 9,40 % 89,10 %
• Su importancia relativa Cambios 18 6,77 % 95,86 %
• Generar gráficos
Otros 11 4,14 % 100,00 %
• Recomendación!!!
• Cuando la variable categórica es nominal, es Total 266 100,00 %
recomendable generar un ordenamiento según su
frecuencia.
• Este tipo de análisis se conoce como Pareto, el
cual permite identificar las categorías principales
Gráfico de Barras Ordenado

Requerimiento Total Porcentaje Porcentaje


Acumulado

Soporte técnico 97 36,47 % 36,47 %

Ventas e
instalación 79 29,70 % 66,17 %

Quejas y reclamos 36 13,53 % 79,70 %

Factura 25 9,40 % 89,10 %

Cambios 18 6,77 % 95,86 %

Otros 11 4,14 % 100,00 %

Total 266 100,00 % Los gráficos de barras se utilizan cuando se quiere presentar las
categorías como un ranking de acuerdo a su importancia o peso
Gráfico de Paréto Categorías importantes
Representan cerca del 80%

• Se basa en el principio 80/20


• Esto quiere decir: gran parte del problema esta
concentrado en pocas causas.
• Se utiliza como una herramienta para identificar
los problemas con mayor relevancia o causas de
mayor incidencia.
• Esta compuesto por un gráfico de barras
ordenado y una ojiva.
• Los problemas principales (o causas) se
seleccionan con el 80% de porcentaje
acumulado.
Gráfico de Torta y Dona
Otros
4%
Cambios
7%

Factura
9%

Soporte técnico
36%

Quejas y reclamos
14%

Ventas e instalación
30%

Los gráficos de dona o torta se utiliza cuando se


quiere representar el peso de las categorías con
respecto al todo.
Problemas con los gráficos de Torta

En algunos casos lo
gráficos de torta pueden
generar distorsiones al
momento de representar
el peso de las clases o
categorías.

Se recomienda utilizar el
gráfico de torta con pocas
categorías.
Tabla de Frecuencia - Variables Ordinales

• Cuando la variable categórica es ordinal Porcentaje


Calificación Total Porcentaje
no se recomienda realizar el ordenamiento. Acumulado
• El propósito es analizar patrones,
distribuciones y comportamientos de las 1: Bajo 20 7,52 % 7,52 %

categorías en su orden lógicos: 2: Medio bajo 38 14,29 % 21,80 %


• Niveles
• Fechas 3: Medio  69 25,94 % 47,74 %
• Estratos 4: Medio alto 74 27,82 % 75,56 %
• Valores discretos
• Rango de valores discretos o continuos 5: Alto 65 24,44 % 100,00 %
• Otros
Total 266 100,00 %
Gráfico para variables categóricas ordinales
Ejercicio
Utilizando los datos de películas (movies.xls):

a) Construya un gráfico de barras, un gráfico de torta y un gráfico de Pareto para la


cantidad de películas por genero. ¿Qué géneros tienen la mayor cantidad de películas?
b) ¿Que gráfico es mejor para representar estos datos?
c) Repita el proceso para analizar las variables:
• Distribuidor (distributor)
• Clasificación (mppa)
• Mes (month)
• Año (year)

También podría gustarte