Está en la página 1de 33

Introducción

a la Analítica de Negocios
Acerca de mi:

• Laura María Yarce Gómez


• Ingeniera Industrial – Universidad de Antioquia (Monitora del curso de simulación)
• Especialista en Analítica – Universidad Nacional
• Data Scientist Senior – Tuya S.A.
• Correo: laura.yarce@udea.edu.co
• https://www.linkedin.com/in/laura-yarce-g%C3%B3mez-62aaa212b/

Acerca de la evaluación:

% Evaluación Tema
15% Taller 1
15% Taller 2
15% Taller 3
30% Trabajo Final: 5% (Primera entrega) – 10% (Segunda entrega) – 20% (Entrega y exposición final)

25% Seguimiento (Quiz, Participación, Tareas)


Acerca del curso:
Semana Módulo o Tema
1-2 Introducción a la analítica de negocios: Analítica descriptiva, predictiva, prescriptiva
3-6 Formulación y evaluación de requerimiento para el desarrollo de un proyecto de analítica
7-8 Pre-procesamiento de bases de datos
9-10 Visualización de datos
11-14 Creación y presentación de tableros y reportes
15 Presentación de trabajo final y taller para el examen final
16 Cierre y retroalimentación del curso

Fechas importantes: Tener en cuenta:


• Semana 5: Taller 1 • Horario de curso: 4-8 viernes.
• Semana 8: Taller 2 - Entrega primera parte trabajo final • Horario de asesoría: 6-8 miércoles. Es necesario
• Semana 12: Taller 3 - Entrega segunda parte del trabajo final reservar el espacio a más tardar el día lunes.
• Semana 16: Entrega trabajo final y exposición.

Conocimientos Previos:
• Probabilidad e inferencia estadística
• Programación y algoritmia
Metodología:
Sesiones teóricas:
• Explicación de conceptos

Sesiones prácticas:
• Python - Streamlit
• SQL
• DataStudio – Gsuite

Seguimiento:
• Talleres y tareas
• Lúdicas
• Lectura y discusión de artículos científicos

Trabajo final del curso (Máximo 3)


• Tres entregas y exposición final

Material: Classroom 27ivz7e


Objetivos del curso:
• Introducir la analítica e inteligencia de negocios como una herramienta soporte a la toma de decisiones.

• Entender las diferencias entre analítica descriptiva, predictiva y prescriptiva.

• Introducir las etapas de formulación, evaluación y administración de requerimientos para el desarrollo de un


proyecto en analítica.

• Conocer y aplicar técnicas de pre-procesamiento de datos para la formulación y solución de problemas de analítica.

• Formulación y planteamiento de una hipótesis sobre un problema u oportunidad desde la analítica.

• Conocer técnicas de visualización de datos como un insumo para el análisis de datos y la implementación de la
inteligencia de negocio.
Introducción a la Analítica de Negocios:

Conozcámonos ¿Qué expectativas tenemos


un poco del curso?
¿A qué se refiere la analítica de negocios?

Consiste en crear conocimiento de valor a partir del análisis de datos masivos con el propósito de extraer patrones de
comportamiento sobre nuestros hábitos y costumbres, así como interpretar de forma eficiente situaciones
empresariales para tomar decisiones informadas e inteligentes.

Comprende el conjunto de métodos de análisis básicos que conlleva el uso de datos para conocer qué ha pasado o qué
está pasando en este momento (descriptivo), así como métodos de análisis avanzados para saber qué pasará
(predictivo) o qué debería suceder en el futuro (prescriptivo)
Historia de la Analítica de Negocios

Los 90s:
1958 1. Volumen
BI 1.0:Todo el personal tenía
El alemán de IBM Hans acceso a los datos. pero hacer 2. Velocidad
Peter Luhn pública nuevas preguntas seguía siendo 3. Variedad
“A Business Intelligence Los 70s:
muy caro. Una vez que se 4. Veracidad
System”- “Habilidad de Se crean grandes bases de
"diseñó" una pregunta, la 5. Valor
aprender las relaciones de datos y aplicaciones para
respuesta estaría disponible
hechos presentados de empresas, creando un campo Actualidad:
rápidamente, pero solo para esa
forma que guíen las acciones de acción importante para el
pregunta.
hacia una meta deseada” desarrollo del BI. BIG DATA

1962 Los 80s: 2000s:


Kanneth Iverson inventa el Creación del concepto BI 2.0: Ya no solo se considera la
primer lenguaje de de Datawarehouse. información estructurada, se empieza
programación multidimensional, 1985: Microsoft lanza al mercado a tener en cuenta otro tipo de
que será la base para el Excel 1.0, herramienta que se información y documentos no
procesamiento analítico en línea. convierte en la más popular y estructurados.
Conocido como OLAP ampliamente utilizada. 
Introducción a la Analítica de Negocios

ÉNFASIS

Inteligencia Artificial
Analítica
Avanzada
Analítica

Cognitiva
Analítica
Prescriptiva
Analítica
Predictiva

Analítica
Operaciona
Analítica

Descriptiva
l
Analítica Descriptiva
Da respuesta a: ¿Qué pasó o está pasando en el negocio?
Es una etapa preliminar del procesamiento de datos que crea un resumen de los datos históricos para proporcionar información
útil y preparar los datos para su posterior análisis.

Beneficios
• Hace más fácil el entendimiento y consumo de los datos.
• Filtrar o quitar datos no significativos (se concentra en patrones y no datos atípicos)

Ejemplos:

Calcular diferentes KPIs, definidos por el


Detectar qué productos están vendiendo más y
cliente, que resuman el estado del negocio y
en qué zonas.
alerten sobre posibles problemas

Identificar qué noticias de prensa están Visualizar cómo se distribuyen


teniendo más repercusión en las redes geográficamente las personas que escriben
sociales, según temáticas. tuits sobre un determinado tema o personaje
público.

Observar la evolución histórica de las Averiguar personas más influyentes en una red
demandas de un determinado servicio o de comunicación empresarial, o cuellos de
producto, para diferentes periodos temporales. botella existentes entre departamentos.
Analítica Descriptiva
Sin embargo, existen algunas desventajas: ¿Qué es la estadística engañosa?

El uso indebido, intencional o no de datos numéricos. Los resultados dan una información engañosa al receptor quien luego se
queda con ese pensamiento si no nota el error o no tiene la imagen completa de los datos. Para generar confiabilidad se
utilizan: Pruebas de control (resultados similares al reproducir el experimento bajo condiciones similares)

¡ Verdades a medias !
En una encuesta de investigación de 2009 realizada por el Dr. Fanelli se encontró que el 33,7% de los científicos encuestados
admitieron prácticas de investigación cuestionables, incluyendo: modificación de resultados para mejorar los resultados,
interpretación subjetiva de datos, retención de detalles analíticos y eliminación de observaciones.

Tipos de engaños comunes con la estadística:

Encuesta mal Correlación vs Visualización Pesca de datos Sesgo intencionado y Usar cambio porcentual con un
diseñada causalidad engañosa de datos selectivo tamaño de muestra pequeño

Fanelli, D. (2009). How many scientists fabricate and falsify research? A systematic review and meta-analysis of survey data. PloS one, 4(5), e5738.
Analítica Descriptiva Encuesta mal
¿Cómo engañar con la analítica descriptiva? diseñada

Los patrones de redacción específicos tienen un efecto persuasivo e inducen a los encuestados a responder de manera
predecible. Ejemplo Preguntas Cargadas sobre una encuesta de asistencia de gobierno:

1. ¿Cree que debería pagar impuestos para que otros ciudadanos no tengan que trabajar?
2. ¿Cree que el gobierno debería ayudar a las personas que no pueden encontrar trabajo?

Hacer una pregunta, pero precederla con una declaración condicional o una declaración de hecho:

3. Dados los crecientes costos para la clase media, ¿apoya los programas de asistencia del gobierno?

Preguntas Neutrales:
4. ¿Apoya los programas de asistencia del gobierno para el desempleo?
5. ¿Cuál es su punto de vista con respecto a la asistencia por desempleo?
Analítica Descriptiva Pesca de
¿Cómo engañar con la analítica descriptiva? datos

Vigen, T. (2015). Spurious correlations. Hachette Books.


Analítica Descriptiva Visualización
¿Cómo engañar con la analítica descriptiva? engañosa de datos

1. Iniciar en un número diferente a 0 en el eje Y 3. Gráficos en 3D

2. Escala logarítmica 4. Utilizar el área


Analítica Descriptiva Sesgo
¿Cómo engañar con la analítica descriptiva? intencionado y
selectivo

El sesgo intencionado es el intento deliberado de influir en los resultados de


los datos sin siquiera fingir responsabilidad profesional. Se presenta en
forma de omisiones o ajustes de datos
El sesgo selectivo es un poco más discreto para quien no lee las líneas
pequeñas. Suele recaer en la muestra de personas encuestadas. Por
ejemplo, la naturaleza del grupo de personas encuestadas: preguntarle a un
estudiante universitario sobre la edad legal para beber, a un grupo de
personas jubiladas sobre el sistema de cuidado de ancianos. Terminará con
un error estadístico llamado "sesgo selectivo".
Analítica Descriptiva
¿Cómo engañar con la analítica descriptiva? Usar cambio porcentual con
un tamaño de muestra
pequeño

Otra forma de generar estadísticas engañosas, también


ligada a la elección de muestra discutida anteriormente, es
el tamaño de dicha muestra. Cuando un experimento o una
encuesta se realiza sobre un tamaño de muestra totalmente
no significativo, no solo los resultados serán inutilizables,
sino que la forma de presentarlos, es decir, como
porcentajes, será totalmente engañosa.
Analítica Descriptiva Correlación vs
¿Cómo engañar con la analítica descriptiva? causalidad

La Paradoja de Simpson
En probabilidad y estadística, la paradoja de Simpson o efecto Yule-Simpson es una paradoja en la cual una tendencia que aparece
en varios grupos de datos desaparece cuando estos grupos se combinan y en su lugar aparece la tendencia contraria para los
datos agregados. Esta situación se presenta con frecuencia en las ciencias sociales y en la estadística médica,1​ y es causa de
confusión cuando a la frecuencia de los datos se le asigna sin fundamento una interpretación causal.

La paradoja desaparece cuando se analizan las relaciones causales presentes.

https://www.youtube.com/watch?v=hpbXkrm68rI
Analítica Descriptiva

Normalmente usamos:

1. Medidas de frecuencia: con que frecuencia ocurre cierto evento.


2. Medidas de tendencia central: la respuesta promedio (media, mediana y moda)
3. Medidas de dispersión: Saber como un dato se distribuye en un rango.
4. Medidas de posición: Identificar la posición de un dato en respuesta de otros (Percentiles)

¿Cómo funciona la analítica descriptiva?

Adquisición de Carga y
Procesamiento Visualización
datos Almacenamiento
Analítica Predictiva
Da respuesta a: ¿Qué pasará en mi negocio?

La analítica predictiva es el uso de datos, algoritmos estadísticos y técnicas de machine learning para identificar la probabilidad
de resultados futuros basados en datos históricos. El objetivo es llegar más allá de saber lo que ha sucedido para proveer la mejor
evaluación de lo que sucederá en el futuro.

¿Por qué ahora?


• Volúmenes y tipos de datos cada vez mayores
• Mayor interés en el uso de datos para producir insights valiosos.
• Computadoras más rápidas y económicas.
• Software más fácil de usar.
• Condiciones económicas más difíciles y la necesidad de tener una diferenciación competitiva.

Beneficios

1. Detectar Fraude 2. Optimizar Campañas 3. Mejorar Operaciones 4. Reducir Riesgo


Analítica Predictiva
Desventajas:
• Se dificulta el manejo de grandes volúmenes de datos
• Incluso con los datos suficientes, a veces no se consideran todas las posibles variables para tener una predicción precisa
• El tiempo es clave para tener éxito: El comportamiento de los clientes cambia con el tiempo, por lo cual, el modelo debe
adaptarse.

¿ Cómo funciona la analítica predictiva?


Escoger y aplicar la Validamos y
Adquisición de Carga y
Procesamiento herramienta calibramos el
datos Almacenamiento
predictiva adecuada modelo aplicado

Entre las técnicas más utilizadas


se encuentra el Machine
Learning

¿Qué es Machine learning o Aprendizaje de Máquina?

Es una rama de la inteligencia artificial que permite que las máquinas aprendan sin ser expresamente programadas para ello.
Tienen la habilidad de identificar patrones entre los datos para hacer predicciones. Este aprendizaje automático se produce por
medio de algoritmos: Un algoritmo no es más que una serie de pasos ordenados que se dan para realizar una tarea.
Analítica Predictiva
¿Cómo funciona?

Entrada Modelo Predicción

¿Qué queremos hacer?

Predicción o regresión de Segmentación de datos Clasificación


valores futuros en base a para descubrir grupos de automática de la
valores históricos. interés ocultos. información.

Tipos de Machine Learning


Los tipos de implementación de machine Learning pueden clasificarse en tres categorías diferentes:

1. Aprendizaje supervisado
2. Aprendizaje no supervisado
3. Aprendizaje de refuerzo según la naturaleza de los datos que recibe.
Analítica Predictiva
Aprendizaje supervisado:
En el aprendizaje supervisado los algoritmos trabajan con datos “etiquetados”, intentado encontrar una función que, dadas las
variables de entrada, les asigne la etiqueta de salida adecuada. El algoritmo se entrena con un “histórico” de datos y así “aprende” a
asignar la etiqueta de salida adecuada a un nuevo valor, es decir, predice el valor de salida. (Simeone, 2018). Ejemplo: Detector de
Spam

Se suele usar en:


• Problemas de clasificación (identificación de dígitos, diagnósticos, o detección de fraude de identidad).
• Problemas de regresión (predicciones meteorológicas, de expectativa de vida, de crecimiento etc.)

Estos dos tipos principales de aprendizaje supervisado, clasificación y regresión, se distinguen por el tipo de variable objetivo. En los casos
de clasificación, es de tipo categórico, mientras que, en los casos de regresión, la variable objetivo es de tipo numérico.

Los algoritmos más habituales aplicados: Árboles de decisión, Clasificación de Naïve Bayes, Regresión por mínimos cuadrados, Regresión
Logística, Máquinas de vector soporte (SVM), Métodos “Ensamble” (Conjuntos de clasificadores)

k-neighbors
1. Dorada
>= 7gr ; 2cm < x <= 5cm

2. Plateada
3gr < x <= 7gr; <= 3.5m

Un amigo te da 1MM monedas 3. Bronce


de 3 tipos diferentes <5 gr, >=5m
Analítica Predictiva – Machine Learning
Aprendizaje no Supervisado:

El aprendizaje no supervisado tiene lugar cuando no se dispone de datos “etiquetados” para el entrenamiento. Sólo conocemos los
datos de entrada, pero no existen datos de salida que correspondan a un determinado input. Por tanto, sólo podemos describir la
estructura de los datos, para intentar encontrar algún tipo de organización que simplifique el análisis. Por ello, tienen un carácter
exploratorio.

Por ejemplo, las tareas de clustering, buscan agrupamientos basados en similitudes, pero nada garantiza que éstas tengan algún
significado o utilidad. En ocasiones, al explorar los datos sin un objetivo definido, se pueden encontrar correlaciones espúreas
curiosas, pero poco prácticas.
El aprendizaje no supervisado se suele usar en:
• Problemas de clustering
• Agrupamientos de co-ocurrencias
• Perfilado.

Los tipos de algoritmo más habituales en aprendizaje no supervisado son: Algoritmos de clustering, Análisis de componentes principales
y Descomposición en valores singulares
y
Nombre Anotacione Pases
s

Anotaciones
Laura ## ##
Sara ## ##
Daniel ## ##
Santiago ## ##
Sebastián ## ##
Pases x
Analítica Predictiva – Machine Learning
Supervisado vs No supervisado

Parámetros Supervisado No Supervisado


Los algoritmos se usan en datos no
Datos de entrada Los algoritmos utilizan datos etiquetados
etiquetados
Maquinas de vector soporte, Red
Se dividen en categorías diferentes:
Neuronal, Regresión Lineal y Logística,
Algoritmos usados Algoritmos de cluster, K-means,
Bosque Aleatorio, and Árboles de
Clustering Jerárquico etc.
clasificación
Complejidad
Es un método simple. Es computacionalmente complejo
computacional
Precisión de los
Método altamente preciso y confiable. Método menos preciso y confiable
resultados
Número de clases Es conocido No es conocido
Su decisión puede estar sobrecargada si Menor precisión en los resultados, porque
Inconveniente principal sus datos de entrenamiento no tienen no se conoce de antemano una
ejemplos de la clase que se desea clasificación
Analítica Predictiva – Machine Learning
Aprendizaje por refuerzo

No todos los algoritmos ML se pueden clasificar como algoritmos de aprendizaje supervisado o no supervisado. Hay una “tierra de
nadie” que es donde encajan las técnicas de aprendizaje por refuerzo. Este tipo aprendizaje se basa en mejorar la respuesta del
modelo usando un proceso de retroalimentación. El algoritmo aprende observando el mundo que le rodea. Su información de
entrada es la retroalimentación que obtiene del mundo exterior como respuesta a sus acciones. Por lo tanto, el sistema aprende a
base de ensayo-error.

No es un tipo de aprendizaje supervisado, porque no se basa estrictamente en un conjunto de datos etiquetados, sino en la
monitorización de la respuesta a las acciones tomadas. Tampoco es un aprendizaje no supervisado, ya que, cuando modelamos a
nuestro “aprendiz” sabemos de antemano cuál es la recompensa esperada.

El tipo de algoritmo más habitual es: Se hace una retroalimentación


Q-Learning basado en Procesos de Decisión de Markov negativa, diciendo que la imagen es un
perro

Gato

Perro
Analítica Predictiva
Algoritmos
Analítica Prescriptiva
Da respuesta a: Dado que se que va pasar ¿Qué hacer con mi negocio?

Nos permite encontrar el mejor curso de acción para una situación o escenario determinado. También puede recomendar opciones de
decisión o incluso automatizar acciones para acelerar una oportunidad futura o mitigar un riesgo

El análisis prescriptivo combina sinérgicamente datos, reglas de negocio, modelos matemáticos y optimización.

Beneficios:
• Optimización de procesos, campañas y estrategias.
• Reduce al mínimo las necesidades de mantenimiento y las entrelaza a mejores condiciones.
• Reduce los costos sin afectar el rendimiento.
• Aumenta la probabilidad de que las empresas enfoquen y planifiquen de forma adecuada el crecimiento interno.

Ejemplos:

1. Programa de capacitación 2. Anticiparse a la demanda 3. Aprovechar la tierra


Analítica Cognitiva
Los datos fluyen de dispositivos móviles, redes sociales y en sí cada cosa que esté digitalizada y conectada. Hasta hace
relativamente poco el 80% de los datos se habían mantenido prácticamente invisibles para nuestros sistemas
informáticos, y ese porcentaje incluye todo lo que la humanidad codifica en el lenguaje, más todo lo que capta con la vista,
los sonidos y el movimiento.

Una de las transformaciones recientes más importante es la llegada de la tecnología cognitiva. Los sistemas cognitivos
pueden ingerir/digerir datos no estructurados en todas sus formas. Además, es capaz de razonar sobre esos datos, y de
aprender de cada interacción. De hecho nunca deja de aprender.

Cora, Agente inteligente del Royal Bank of Scotland Planificador de viaje personal por WayBlazer

Con la ayuda de IBM Watson,


Royal Bank of Scotland (RBS)
desarrolló un asistente inteligente
que es capaz de manejar más de
5,000 consultas en un sólo día.
Inteligencia Artificial
¿Qué nos imaginamos?

¿Qué es realmente la inteligencia artificial?

Inteligencia Inteligencia Artificial


Capacidad de razonar para resolver un problema con Cuando esta capacidad se traslada a una máquina, a la cual
información obtenida a través del análisis del contexto se le alimenta de datos para tener una aproximación lo más
en el cual nos encontramos, del procesamiento de cercana posible a un resultado y además realizar los ajustes
ideas complejas y de la experiencia. necesarios a dichos procesos para optimizarlos
Inteligencia Artificial
Áreas que abarca la Inteligencia Artificial

Minería
de PLN Analíticas
datos

Datos

Machine Deep
Robótica
Learning Learning
Inteligencia Artificial

Intento de hacer a un dispositivo tan o más inteligente que un humano. Darle la capacidad de razonar o pensar
en función a los datos que se le está pasando.

Niveles de Inteligencia Artificial:

● Inteligencia Artificial Débil: Ejemplo, un asistente de celular como Siri. No rebasan la línea de lo que
están programados para hacer.
● Inteligencia Artificial Fuerte: Tiene la habilidad de reconocer patrones en el comportamiento humano
y/o el ambiente.
● Super Inteligencia Artificial: Supera la inteligencia de un humano, incluso alguno considerado genio.
Tiene la capacidad de tomar decisiones propias.
● Singularidad Tecnológica: Es el nombre que se le da al concepto del momento en el que la Super
Inteligencia Artificial va a dominar.
Inteligencia Artificial
Algunas dificultades:

Dependencia y sensibilidad a los datos Patrones discriminatorios

Decisiones difíciles e importantes Riesgo de la privacidad


Seguimiento
En parejas escoger un artículo científico sobre un caso de aplicación de la analítica que le corresponda. Puede ser un
caso de éxito o fracaso.

A partir del artículo hacer una exposición donde presente:

1. ¿Cuál fue el objetivo de la aplicación?


2. ¿Qué metodología se usó?
3. ¿Cuales fueron los resultados?
4. ¿Cuales fueron las conclusiones?
5. Su opinión personal sobre el artículo.

Puedes apoyarse de: una ppt, diagrama, mapa mental, mapa conceptual, etc.

Exposición: 5 min

Nota: Cada presentación será evaluada por el resto de los compañeros. En classroom se van a subir los criterios de la
evaluación. Se debe enviar el nombre del artículo a más tardar el jueves al medio día.

Enlace para crear los grupos:


https://drive.google.com/file/d/1paWmeqxVev7uUuqYrP8qIWOzPxtT9ihW/view?usp=sharing

También podría gustarte