Está en la página 1de 69

ESPECIALIZACIÓN PYTHON

FOR ANALYTICS

Sesión 1

Docente: Luis Chacón


Reglas

Se requiere puntualidad para un mejor desarrollo del curso.

Para una mayor concentración mantener silenciado el micrófono durante la


sesión.

Las preguntas se realizarán a través del chat y en caso de que lo requieran


podrán activar el micrófono.

Realizar las actividades y/otareasencomendadas en los plazos determinados.

Identificarse en la sala Zoom con el primer nombre y primer apellido.


Expositor: Luis Chacón Montalván

https://www.linkedin.com/in/luis-chacon-unmsm/

luis.estadistica2012@gmail.com.pe

Estadística
Maestría en Gestión Económica

Especialización en Business intelligence &


Business Analytics

Micromaster in Data Science


Evaluación del curso

Asistencia (Curso): mínimo 80% sesiones para


recibir la certificación

✓ Listado 1 de ejercicios (Módulo 1 al 4): 15%


✓ Listado 2 de ejercicios (Módulo 5 al 8): 15%
✓ Presentación Primer caso integrador: 20%
✓ Cuestionario final teórico (Módulo 9 y 10): 15%
✓ Presentación Segundo caso integrador: 35%
Contenido – Sesión 01

• Bussiness Intelligence y Business Analytics


• ¿Qué es Analytics?
• Beneficios del uso del Analytics en la empresa
• Principales metodologías de Analytics
• Principales softwares de Analytics
• Casos de éxito empresariales usando metodologías analíticas
La importancia de la información
✓ Al hablar de una eficiente gestión de la organización es
imprescindible tomar en cuenta un factor clave que es
la toma de decisiones.
✓ Cuando se toman decisiones en las empresas éstas
deben de cumplir con ciertas características, ya que de
esto depende en muchas ocasiones el éxito o fracaso
de la organización: Oportunas, Rápidas, Informadas,
Efectivas y Eficientes (en uso de recursos).
✓ La importancia de la información para las
organizaciones radica en que es un recurso esencial,
éstas la utilizan al desempeñar sus operaciones
diarias y de manera estratégica para la búsqueda de
un alto nivel competitivo y crecimiento.
La importancia de la información
Datos vs Información
La Cadena de Valor
¿Qué es Business Intelligence?
La Inteligencia de Negocios (Business
Intelligence) es un concepto, en el que
podemos incluir:

✓ Metodologías
✓ Técnicas
✓ Herramientas de cómputo y
✓ Procesos de toma de decisiones

Que provean de datos precisos y


oportunos para una toma o evaluación
en las decisiones
¿Qué es Business Intelligence?
BENEFICIOS:
1.Mayor visibilidad de las operaciones
de tu negocio.
2. Informes centralizados y detallados.
3. Análisis de tendencias y pronósticos
del futuro.
4. Toma de decisiones certeras.
5.Contar con información oportuna y
confiable para resolver preguntas de su
negocio de una manera más ágil.
6.Obtener métricas e indicadores clave
del negocio.
Pirámide de Business Intelligence
¿Qué no es Business Intelligence?
✓ NO es una tecnología, se apoya en ella.
✓ NO da una única solución, se enfoca en la visión y las necesidades de cada
negocio.
✓ NO brida un sistema de tecnología, brinda un medio para analizar la
información para gente del negocio.
La analítica de datos
La analítica de datos en los negocios
Business Intelligence y Business Analytics
¿Qué es Analytics?
Analytics puede ser definido como el proceso que abarca el uso de Técnicas estadísticas, sistemas de
información e investigación de operaciones para explorar, visualizar, descubrir y comunicar patrones y
tendencias en la data. Analytics puede convertir data en información útil

Descriptiva Predictiva Prescriptiva


Descubrir características Desarrollar modelos predictivos Colocar los recursos de manera
importantes engrandes bases de para identificar y predecir patrones óptima para tomar ventaja de la
datos. El objetivo es obtener un a futuro predicción de patrones o
resumen general y panorama escenarios futuros
completo de la data
• Estadística descriptiva • Análisis multivariado • Métodos de investigación de
• Gráficos • Minería de datos operaciones
• Distribuciones de frecuencias • Modelamiento predictivo
• Probabilidad
• Métodos de muestreo
En el espectro de soluciones analíticas, el aprendizaje automático
encuentra más potencial en etapas post-predictivas
Aprender del pasado para alcanzar un mejor desempeño futuro

Adaptativo
¿Cómo lo
Valor accedido

aprendo?
Prescriptivo
¿Cómo lo puedo
Predictivo optimizar?
Descriptivo Diagnóstico ¿Cuándo pasará?
¿Qué paso? ¿Por qué
pasó?

Describir el sistema Entender por Modelar el sistema Prescribir las Aprender del
bajo consideración qué se tiene el simulando acciones a tomar comportamiento del
usando datos para desempeño escenarios para para optimizar el usuario para
identificar visto y qué lo predecir posibles desempeño en los enfocar personas
tendencias causó futuros resultados resultados calificadas en los
casos
Sofisticación analítica excepcionales
Business Analytics y KDD
6. Apoyo a la Toma
de Decisiones

5. Visualización
del conocimiento
4.Interpretación y
Evaluación

3.Data Mining
KKnnoowwleeddggee
Conocimiento
2.Selección y
Preprocesamiento
p(x)=0.02
p ( x) =0 .0 2

1.Consolidación
Patrones y Modelos
de los Datos

WareDhWouse Datos preparados

Datos Consolidados
Metodología para el uso de Analytics

Metodología CRISP

Metodología SEMMA
Metodología CRISP
Metodología CRISP
I. Comprensión del negocio (Objetivos y requerimientos desde una perspectiva no técnica)

• Establecimiento de los objetivos del negocio (Contexto inicial, objetivos, criterios de éxito)

• Evaluación de la situación (Inventario de recursos, requerimientos, supuestos, terminologías


propias del negocio,…)

• Establecimiento de los objetivos de la minería de datos (objetivos y criterios de éxito)

• Generación del plandel proyecto (plan, herramientas, equipo y


técnicas)
Metodología CRISP
II Comprensión de los datos (Familiarizarse con los datos teniendo presente los objetivos del
negocio

• Recopilación inicial de datos

• Descripción de los datos

• Exploración de los datos

• Verificación de calidad de datos


Metodología CRISP
III Preparación de los datos (Obtener la vista minable o dataset)

• Selección de los datos

• Limpieza de datos

• Construcción de datos

• Integración de datos

• Formateo de datos
Metodología CRISP
IV Modelado (Aplicar las técnicas de minería de datos a los dataset)

• Selección de la técnica de modelado

• Diseño de la evaluación

• Construcción del modelo

• Evaluación del modelo


Metodología CRISP
V Evaluación (De los modelos de la fase anteriores para determinar si son útiles a las
necesidades del negocio)

• Evaluación de resultados

• Revisar el proceso

• Establecimiento de los siguientes pasos o acciones


Metodología CRISP
VI Despliegue (Explotar utilidad de los modelos, integrándolos en las tareas de toma de
decisiones de la organización)

• Planificación de despliegue

• Planificación de la monitorización y del mantenimiento

• Generación de informe final

• Revisión del proyecto


Metodología SEMMA
• Creada por SAS Institute, ligada a producto SAS Enterprise Miner

• SAS: “NO es metodología de minería de datos”, sino es una organización lógica tool-set SAS

• A partir de una muestra estadísticamente representativa de los datos permite descubrir patrones de
negocio desconocidos.
Metodología SEMMA
I MUESTREO

• Extrae muestras significativas y representativas para aplicar el análisis.

• Rapidez en análisis.

• Muestreo simple o con reposición. Asociar nivel de confianza

II EXPLORACIÓN

• Para simplificar el problema y optimizar la eficiencia del modelo.

• Usa herramientas de visualización y técnicas de estadísticas descriptiva.

• Determina las variables explicativas (entradas al modelo)


Metodología SEMMA
III MODIFICA

• Formatea los datos, para ser utilizado por el modelo.

IV MODELA

• Establece una relación [variables explicativas y variables objetivo]

• Trabaja con un nivel de confianza determinado.

• Las técnicas son: análisis discriminante, métodos de agrupamiento, y análisis de regresión, redes
neuronales, técnicas adaptativas, lógica fuzzy, árboles de decisión, reglas de asociación y computación
evolutiva.

III EVALÚA

• Valora los resultados mediante el análisis de bondad del modelo.

• Contrasta con otros métodos estadísticos o con nuevas muestras.


CRISP VS SEMMA
SEMMA CRISP

Orientado al desarrollo del proceso de Orientado a los objetivos


MD empresariales

Se inicia analizando los objetivos del


Se inicia analizando los datos
negocio

Metodología abierta y
Ligada a productos SAS
gratuita

Orientado a una metodología de


gestión de proyectos
Situaciones de Negocio a resolver con Analytics
Casos de Éxito de Aplicación de Analytics
Casos de Éxito de Aplicación de Analytics
Casos de Éxito de Aplicación de Analytics
Educación Ejecutiva
UTEC
Educación Ejecutiva
UTEC
ETAPAS DEL DESARROLLO DE UNA SOLUCIÓN
ANALÍTICA

¿Cómo le ha ido al negocio? ¿Cómo le irá al negocio?


(vista al pasado - BI) (vista al futuro - PREDICTIVOS)
PARA EL DESARROLLO
DEBEMOS SEGUIR
ALGUNOS PASOS…

Fuga de clientes

¿Es posible mitigar Modelos


Predictivos
la fuga a través de
una solución de ML?
PARA EL DESARROLLO
DEBEMOS SEGUIR
ALGUNOS PASOS…
PROBLEMA

¿Cuento con datos para


DATA
explicar la fuga? Modelos
Predictivos
• Un listado de
clientes que
fugan mensualmente
• Tráfico de voz

• Facturación
• Datos del cliente
PARA EL DESARROLLO
DEBEMOS SEGUIR
ALGUNOS PASOS…
PROBLEMA

¿Cómo trato los datos?


• Grupo 1 : Modelo entrena DATA
Modelos
Predictivos

• Grupo 2 : Modelo prueba


PREDICTIVO
PARA EL DESARROLLO
DEBEMOS SEGUIR
ALGUNOS PASOS…
PROBLEMA

¿Qué algoritmos puedo usar?

DATA
Problema = Churn Modelos
Predictivos
Churn = 2 categorías

• Regresión Logística (Estadístico)


PREDICTIVO
• Random Forest (Machine Learning)
PARA EL DESARROLLO
DEBEMOS SEGUIR
ALGUNOS PASOS…
PROBLEMA

¿Qué tan certera es la


DATA
solución de ML? Modelos
Predictivos
Gini: Fuerza para diferenciar
a churners vs. no churners

EVALUAR
0% 25% 45% 65% 100% PREDICTIVO

Malo Regular Bueno Muy bueno


PARA EL DESARROLLO
DEBEMOS SEGUIR
ALGUNOS PASOS…
PROBLEMA

• Gestión a partir de los insights


DESPLIEGUE
A / B DATA
Modelos
Predictivos

Testing

• Gestión por propensión EVALUAR


PREDICTIVO

Menos Más
Panorama tecnológico en Analytics
Panorama tecnológico en Analytics
¿Se puede aplicar Advanced Analytics a varias industrias?
Consumo masivo Salud
▪ Propensión de productos ▪ Dashboard de gestión y monitoreo
▪ Pricing analítico ▪ Estimación de demanda
▪ Análisis de almacén ▪ Geolocalización de nuevas sedes
▪ Pedido sugerido
Horeca Minería
▪ Social trends ▪ Mantenimiento predictivo
▪ Pricing analítico ▪ Monitoreo de indicadores operacionales
▪ Pedido sugerido ▪ Alertas regulatorias y de conflictividad

Educación Construcción
▪ Deserción estudiantil ▪ Dashboard de gestión y monitoreo
▪ Pricing analítico ▪ Geolocalización de nuevos proyectos
▪ Estimación de demanda

Retail Automotor
▪ Perfilamiento de clientes ▪ Social trends y posicionamiento en la red
▪ CRM analítico ▪ Modelos credit scoring para financiamiento
▪ Fuga de clientes ▪ Modelos de propensión de ventas
▪ Sistema de recomendaciones
Casos de Éxito de Aplicación de Analytics
Casos de Éxito de Aplicación de Analytics
Casos de Éxito de Aplicación de Analytics
Educación Ejecutiva
UTEC
Educación Ejecutiva
UTEC
¿Qué es Python?
¿Por qué Python?

✓ Es un lenguaje de programación interpretado. ¡Bye compilador!


✓ Posee un tipado dinámico, es decir no requiere que se declare el tipo de dato de
cada variable creada y además puede cambiar conforme se le vaya asignando
valores.
✓ Recomendado para aprender el programa, sintaxis muy sencilla y legible (como
si estuviéramos hablándole al ordenador)
✓ ¡Código abierto! Completamente gratis, libre de usar y distribuir sin perder
presencia en ámbitos comerciales.
✓ Es multiplataforma, se puede utilizar y ejecutar en Windows, Linux, Mac, etc.
✓ Enorme cantidad de módulos y paquetes respaldados por la comunidad .
Stack Overflow
Kaggle
Ventajas de Python sobre otros lenguajes
1. Está desarrollado bajo una licencia de código abierto, por lo que es de libre uso y distribución,
incluso para uso comercial.
2. Es uno de los lenguajes de programación más versátiles que existen, puede ser usado en
muchos campos diferentes. Es decir, permite programar desde videojuegos hasta aplicaciones
móviles.
3. Es fácil de aprender. Si comprendes Python, podrás entender más fácilmente otros lenguajes de
programación. Esto quiere decir que es una excelente opción si apenas incursionas en el mundo
de los desarrolladores.
4. Gracias a su popularidad, cuenta con una amplia comunidad que organiza eventos,
conferencias, reuniones y colabora en materia de códigos e información.
5. El Python Package Index (PyPI) aloja miles de módulos de terceros para Python. Tanto la
biblioteca estándar de Python como los módulos aportados por la comunidad permiten
infinitas posibilidades.
Ventajas de Python sobre otros lenguajes
6. Este lenguaje de programación permite una diversidad
de desarrollos de una manera fácil, ágil y rápida.
7. Python cuenta con características propias que lo
hacen único en comparación con otros lenguajes de
programación.
8. Su similitud con el idioma inglés lo convierte en un
lenguaje fácil de comprender.
9. Su característica multiplataforma permite que este
pueda ser usado en diferentes sistemas operativos.
10. Fue diseñado para ser rápido (de aprender, usar y
comprender) y para imponer una sintaxis limpia y
uniforme.
¿Quiénes utilizan Python?
Python en ciencia de datos
¿Dónde aprender Python?
Introducción a jupyter
notebooks

Project Jupyter existe para desarrollar software de


código abierto, estándares abiertos y servicios para
computación interactiva en docenas de lenguajes de
programación.
Jupyter Notebook es una aplicación web de código
abierto que le permite crear y compartir documentos
que contienen código en vivo, ecuaciones,
visualizaciones y texto narrativo. Los usos incluyen:
limpieza y transformación de datos, simulación
numérica, modelado estadístico, visualización de
datos, aprendizaje automático y mucho más.
Lecturas recomendadas

- Python Machine Learning – Capítulo 1: Giving computers the ability to learn from data
- Hands on Machine Learning – Capítulo 1: The machine learning landscape
- Data Science for Business – Capítulo 1: Introduction: Data-Analytic Thinking
- Data Science for Business – Capítulo 2: Business Problems and Data Science Solutions
Documentales y
películas

También podría gustarte