Está en la página 1de 71

Herramientas de Análisis de

Datos para la Toma de


Decisiones

Instituto Forum
Octubre de 2019
Camilo Torres Ovalle
Instituto
Forum
Edificio Ad Portas

Presentación y preguntas
Instituto
Forum
Edificio Ad Portas

Aprender de Analítica

Leer datos
Conceptos
Trabajar con datos
Técnicas
Analizar datos

Herramientas Discutir con datos


Gestión de datos
Desarrollar en los estudiantes habilidades
relacionadas con el diseño, desarrollo e
implementación de modelos de analítica
descriptiva, que permitan presentar la
información a través herramientas de analytics
de Microsoft (Power Query, Power Pivot, Power
BI, OneDrive y Share Point Online), con el
propósito de identificar patrones y
comportamientos que permitan tomar mejores
decisiones informadas.

Instituto
Forum
Puente gris
Resultado previsto de aprendizaje

 Construir modelos analíticos con las herramientas de análisis de


datos (Power Query, Power Pivot en Excel y Power BI) que permitan
trasformar datos en información útil y fácil de entender en un
contexto relacionado con las disciplinas de formación de cada
estudiante.
 Comunicar con claridad los análisis que realiza ,por lo cual, comparte
los modelos construidos con sus equipos de trabajo y con los
interesados, a través de las herramientas en la nube (OneDrive,
Share Point Online y Power BI) para facilitar la toma de decisiones
informadas.

Instituto
Forum
Puente gris
Metodología
“Proceso dinámico de integración centrado en los
estudiantes”, donde el profesor proveer su
experiencia profesional y los elementos conceptuales
necesarios, centrándose en ser un “dinamizador que
facilite el proceso de aprendizaje”.
Se requiere una participación activa y productiva de
los participantes con el apoyo del profesor para el
desarrollo del aprendizaje por proyectos.
*8 sesiones de 4 horas trabajo con el docente
* 32 horas de trabajo independiente

**Presentación, Videos, talleres prácticos (70%)

Instituto
Forum
Puente gris
Contenido Temático
 Introducción a la analítica: presentación de conceptos básicos de analítica (descriptiva,
predictiva y prescriptiva), aplicaciones, contexto nacional e internacional e importancia en la toma
de decisiones
 Introducción a las herramientas de análisis de datos: Power Query, Power Pivot, Power BI,
OneDrive y Share Point Online.
 Diseño de modelos de analítica: fuentes de información, tipos de datos, tipos de variables,
elementos básicos de estadística descriptiva y el proceso de Extract, transform and load ETL.
 Desarrollo de modelos de analítica: Procesos de ETL: Extract, transform and load; conexión
(extracción) e integración de múltiples fuentes y tipos de datos, prealistamiento de la información
(transformación) y cargue para la construcción de modelos relacionales.
 Visual analytics : técnicas para implementar modelos de alto impacto visual, dashboard
 Integración de modelos de analítica en la Nube (OneDrive, Share Point Online y Power BI)
 Introducción al lenguaje DAX: fórmulas y funciones básicas del lenguaje Data Analysis
Expressions (DAX).

Instituto
Forum
Puente gris
Instituto
Forum
Ecosistema del Campus

Otras herramientas
Evaluación
La evaluación del estudiante se realizará de acuerdo con lo establecido en las
reglamentaciones vigentes, dentro de las actividades previstas en esta fase del proceso de
aprendizaje son:

 Actividades en clase y talleres en grupo (20%)


 Quizes individuales (20%).
 Parcial individual (20%)
 Proyecto que desarrollen los estudiantes en grupos de 3 personas (40%) con datos
propios de alguna de las empresas donde trabajen. El 100% de esta actividad saldrá de:
50% de la evaluación de los jurados, 25% coautoevaluación de los compañeros del grupo
y 25% del profesor."

Instituto
Forum
Puente gris
¿Qué es
analítica?”

Instituto
Forum
Puente gris
https://www.youtube.com/watch?time_continue=8&v=3C0aLuNIecc

Instituto
Forum
Puente gris
“Analytics: uso exhaustivo de los datos, análisis estadísticos
y cuantitativos, modelos explicativos y predictivos, y
dirección y gestión basados en hechos como motor de la
toma de decisiones en las acciones emprendidas”

Instituto
Forum
Lago con vista al Edificio Ad Portas
“A nalytics se refiere al uso intensivo de

datos, técnicas cuantitativas, modelos matemáticos y


herramientas computacionales para tomar decisiones en
una compañía que conduzcan a la optimización de sus
recursos, una mayor satisfacción de los clientes, una mayor
rentabilidad o la disminución de los riesgos a los que está
permanentemente expuesta.”

Fuente: Curso de Marketing Analytics, Universidad de los Andes, sede Caribe

Instituto
Forum
Lago con vista al Edificio Ad Portas
Potential competitive advantage increases with more sophisticated analytics

Autonomous
Analytics Machine learning
“What can we learn from the data?”
Prescriptive Optimization
Competitive Advantage

Analytics “What´s the best that can happen?”


Experimental design
“What happens if we try this?”
Predictive Predictive modeling
Analytics “What will happen next?”
Forecasting/extrapolation Edificio Ad Portas

“What if these trends continue?”


Statistical analysis
“Why is this happening?”
Descriptive Alerts
Analytics “What actions are needed?”
Query/drill down
“What exactly is the problem?”
Ad hoc reports
“How many, how often, where?”
Standard reports
“What happened?”
Fuente: Competing on Analytics: The New Science of Winning, 2017 Sophistication of Inteligence
Analítica en el contexto internacional y nacional

Instituto
Forum
Lago con vista al Edificio Ad Portas
“Tras el petróleo,
los datos son la
nueva materia
prima del siglo
XXI”

“La evidente
concentración del
GAFA+M y sus
derivadas”

Fuente: https://www.weforum.org/es/agenda/2017/05/data-economy-nuestros-datos-son-la-nueva-materia-prima-de-la-economia

Instituto
Forum
Lago con vista al Edificio Ad Portas
Fuente: https://twitter.com/theeconomist

Instituto
Forum
Lago con vista al Edificio Ad Portas
Instituto
Forum
Punto Embarcadero
Global State Of Enterprise Analytics, 2018

Fuente: GLOBAL STATE OF ENTERPRISE ANALYTICS REPORT 2018, Microstrategy

Instituto
Forum
Punto Embarcadero
Global State Of Enterprise Analytics, 2018 (Forbes)
El 71% de las empresas a nivel mundial predice que sus inversiones en analytics
se acelerarán en los próximos 3 años a 5 años.

Cloud Computing (24%), Big Data (20%) y AI / Machine Learning (18%) son las tecnologías
que tendrán el mayor impacto en los próximos cinco años.

El 57% de las empresas tiene un Director de datos (CDO, CAO), un rol de


liderazgo que es fundamental para ayudar a democratizar los datos y los
análisis en cualquier organización.

El 52% de las empresas están aprovechando la analítica para proporcionar una mayor
información e inteligencia contextual en las operaciones.

Solo el 16% de las empresas ha permitido que al menos el 75% de sus empleados
tengan acceso a datos y análisis de la compañía.

Instituto
Forum
Punto Embarcadero
The growth of analytics and data science master's degree
program in the US

Fuente: Institute for Advance Analytics. North Carolina State University, 2019

Instituto
Forum
Punto Embarcadero
Instituto
Forum
Punto Embarcadero
Graduated of analytics and data science masters degrees
awarded in US

Fuente: Institute for Advance Analytics. North Carolina State University, 2019

Instituto
Forum
Punto Embarcadero
Instituto
Forum
Ecosistema del Campus

Contexto Nacional
Instituto
Forum
Ecosistema del Campus

A nivel nacional

“Datos digitales que son puestos a


disposición con las características
técnicas y jurídicas necesarias para que
puedan ser usados, reutilizados y
redistribuidos libremente por cualquier
persona, en cualquier momento y en
cualquier lugar”
Instituto
Forum
Ecosistema del Campus

A nivel nacional CONPES 3920

Fuente: http://noticiasalsur.co/buscan-crear-valor-social-y-economico-con-los-datos-digitales/
Instituto
Forum
Ecosistema del Campus
Instituto
Forum
Ecosistema del Campus

Lenguajes – Herramientas más usadas


Resultados de encuesta laboral de data science y
machine learning en Colombia, sept 2019.
Instituto
Forum
Ecosistema del Campus

Proceso de analítica para tomar decisiones informadas

Datos Información Conocimiento Decisiones

“Los datos y la analítica son la parte medular de la


revolución digital”
“Para sobrevivir y tener éxito en la era digital, es el momento de ubicar los datos y la analítica en el centro de su
organización y expandirlos hacia los empleados, clientes, proveedores y socios. Insight
Llevar a escala el valor de los datos
y la analítica requiere una cultura de habilitación de datos que permeé todas y cada una de las facetas de su
Datosempresa.
internosUna cultura en laPatrones
y externos que los datos y la analítica informen e impulsen los objetivos
Tipologías empresariales, las
Personalización
Datos personales eficiencias operativas yCaracterizaciones
Tendencias la innovación.” Segmentaciones
Datos sociodemográficos Relaciones Frecuencia de eventos Campañas
Datos transaccionales Fuente: Garther Data & Analytics
Comportamientos Summit 2018
Participaciones Fidelización
Datos históricos Inferencias Potenciales Recuperación
Instituto
Forum
Ecosistema del Campus
Instituto
Forum
Puente gris
Instituto
Forum
Puente gris

“A medida que se recopilan


más y más datos, las
compañías están demandado
perfiles que sean capaces de
tomar decisiones inteligentes
basadas en ellos.”
Instituto
Forum
Puente gris

Algunos conceptos claves


Instituto
Forum
Puente gris

Análisis exploratorio
El análisis exploratorio de datos consiste en un
conjunto de técnicas y herramientas que ayudan
a visualizar y resumir los datos. El objetivo es
identificar, reconocer y familiarizarse con los
datos, prepararlos para el adecuado análisis
datos
Análisis exploratorio

Cualitativa Cuantitativa

categóricas Discreta Continua

 Rango
 Media
 Mediana
 Moda
 Varianza
 Desviación Estándar

Instituto
Forum
Aulas Atelier
Objetivos descriptivos

Objetivo Características

• Explicar/resumir/comunicar patrones • Rapidez

• Descubrir/detectar patrones • Precisión

• Confianza

Instituto
Forum
Aulas Atelier
Tipos de Gráficos

FORMA RELACIÓN COMPARACIONES COMPOSICIONES

• Estáticas • Estáticas
• En el tiempo • En el tiempo

Instituto
Forum
Aulas Atelier
GRANULARIDAD

Instituto
Forum
Aulas Atelier
Instituto
Forum
Puente gris

GRANULARIDAD

La granularidad hace referencia a los pequeños componentes


individuales que permiten que un sistema funcione. Un estudio
a nivel granular proporciona un entendimiento detallado de los
mercados y las oportunidades de crecimiento, y una manera
claramente enfocada, precisa y detallada de administrar
iniciativas y actividades discretas en toda la corporación para
un crecimiento orgánico y sostenible.
Fuente: The Granularity of Growth. Patrick Viguerie, Sven Smit & Mehrdad Baghai. Año 2007
GRANULARIDAD

Instituto
Forum
Aulas Atelier
GRANULARIDAD

Día
Semana
Mes
Trimestre
Semestre
Año

Instituto
Forum
Aulas Atelier
Instituto
Forum
Aulas Atelier
Instituto
Forum
Puente gris

Manos a la obra!!
Instituto
Forum
Puente gris
Instituto
Forum
Puente gris

Diagnostico
Instituto
Forum
Puente gris

Con el set de datos que está disponible en Teams, deben crear un


gráfico que permita ver el promedio de las notas por cada una de las
actividades académicas de evaluación. (10 minutos)
Instituto
Forum
Puente gris

Diagnostico
Instituto
Forum
Puente gris

Introducción a
las
herramientas
“Extracción, transformación y carga (ETL) es
una canalización de datos que se utiliza para
recopilar datos de varios orígenes, transformar
los datos según las reglas de negocio y
cargarlos en un almacén de datos de destino.”
Microsoft

“Proceso utilizado para recopilar datos de


numerosas bases de datos, aplicaciones y
sistemas dispares, transformando los datos de
manera que coincidan con el formato requerido
del sistema de destino y cargándolos en una
base de datos de destino.” Amazon
“El proceso de Extracción (E), Transformación (T) y Carga (L, de Load en Inglés) -ETL- consume entre
el 60% y el 80% del tiempo de un proyecto de analitycs”

Instituto
Forum
Aulas Atelier
Instituto
Forum
Aulas Atelier
Herramientas

Instituto
Forum
Aulas Atelier
Instituto
Forum
Aulas Atelier
¿Que tenemos disponible?

Instituto
Forum
Aulas Atelier
Power Query

Una consulta (Query) es un bloque de datos listos


para ser transformados y llevados a formato tabular.

Formato Tabular
Son los datos convertidos en filas y columnas de manera
organizada, es decir, una tabla de datos fácil de identificar,
sin campos con errores, ni filas y columnas en blanco, sin
subtotales ni totales, son datos listos para ser
transformados y visualizados, toda una materia prima lista
para construir el informe.

Instituto
Forum
Aulas Atelier
Nuestra principales herramientas

Power Query es una tecnología de conexión de


datos que permite descubrir, conectar, combinar y
refinar los orígenes de datos para satisfacer sus
necesidades de análisis.

Power Pivot es una tecnología de modelado de datos que


le permite crear modelos, establecer relaciones y crear
cálculos. Con Power Pivot, puede trabajar con conjuntos
de datos de gran tamaño, establecer amplias relaciones y
crear cálculos complejos (o simples), todo en un entorno
de alto rendimiento, y dentro de la experiencia familiar de
Excel.

Instituto
Forum
Aulas Atelier
Instituto
Forum
Aulas Atelier
Instituto
Forum
Aulas Atelier
Power Query

1. La cinta de opciones: Son las pestañas donde se encuentran todas las funcionalidades para la limpieza y
transformación de datos, también podemos agregar columnas personalizadas, es donde el Lenguaje M juega un
papel importante, adicional podemos ver el editor avanzado (vista) y la configuración de la consulta, orígenes y
demás.
2. Listado de consultas: En esta parte encontramos las consultas que hemos realizado en el mismo libro de Excel
3. Barra de Fórmulas: Igual que Excel, Power Query tiene la barra fórmulas y en esta podemos ver la programación
que arroja cada paso, es decir, lo que venimos llamando Lenguaje M

Instituto
Forum
Aulas Atelier
Power Query

4. Configuración de Consulta: Las propiedades y los pasos aplicados se encuentran en esta parte, es muy
relevante entenderla ya que en las propiedades podemos cambiar el nombre de la consulta y en los pasos aplicados
es el paso a paso que se va generando cada vez que hacemos cambios, limpiezas o modificaciones a los datos, es
una especie de grabadora muy similar a la grabadora de macros de Excel, va creando un código cada que encuentra
cambios
5. Área deenresultados:
la manipulación
Los de los datos.
resultados de cada consulta se van viendo reflejados en esta área, tanto la consulta
inicial como la consulta transformada

Instituto
Forum
Aulas Atelier
Construcción del modelo!!

Instituto
Forum
Aulas Atelier
Instituto
Forum
Puente gris

Aplicaciones
prácticas
Ejercicios planteados

1. Conexión web
2. Conexión API
3. Análisis datos hurto de celulares
4. Modelo relacional ventas - ETL Edificio Ad Portas

5. Modelo de datos - integración BD notas 3 cohortes- ETL, DAX


6. Modelo de datos para analizar series de tiempo
Ejemplo ETL

“El proceso de Extracción (E), Transformación (T) y Carga


(L, de Load en Inglés) -ETL- consume entre el 60% y el
80% del tiempo de un proyecto de analitycs”

Instituto
Forum
Aulas Atelier
Ejemplo conexión en la Web

Transformación de datos en Transformación de datos en Transformación de datos en


Power Query, agregación de Power Query, datos no Power Query y cargue en el
los campeones de la estructurados (normalizados) modelo para construir un
Champions League análisis gráfico

Instituto
Forum
Aulas Atelier
Ejemplo datos abiertos
Uso de API

CASO: Perfil Epidemiológico


Morbilidad 2011-2018
( Urgencias- Hospitalizacion- CExterna)

Una API es el mecanismo más útil para conectar


dos softwares entre sí para el intercambio de mensajes o
datos en formato estándar como XML , CSV o JSON.

JSON stands for JavaScript Object Notation

Instituto
Forum
Aulas Atelier
Instituto
Forum
Puente gris

¿Qué tanto sabes?

Hurto de celulares 2017


Fuente: Grupo Información de Criminalidad (GICRI) - DIJIN.

• Hacer un análisis exploratorio, identifique:


• Observaciones
• Variables
• Analice:
• Por Departamento, municipio
• Meses y días de más delitos
• ¿Qué más puedes hacer?
Ejercicio hurto celulares
1. Descargar la carpeta (Celulares_vr2)
2. Cargar carpeta en power query
3. Dejar sólo las columnas de “content” y “Name”
4. Crear una nueva columna, usar la función. Excel.Workbook([variable])
5. Borrar la columna content
6. Expandir la nueva columna, dejando data y kind
7. Promover encabezados, función Table.PromoteHeaders([GetData.Data])
8. Expandir todo
9. Cargar archivo de rango de edad
10. Hacer análisis gráfico
11. Descargar la carpeta (Celulares_vr2_2do semestre)
12. Copiar los archivos en la carpeta Celulares_vr2

Instituto
Forum
Aulas Atelier
Bases de datos de hurto a celulares 2017

Edificio Ad Portas
Instituto
Forum
Puente gris

Ejemplo TRM

Transformación de datos desde una carpeta local y creación de informe analítico de la TRM
Ejemplo TRM – paso a paso

1. Descargar la carpeta data dólar


2. Cargar en power query la carpeta
3. Dejar sólo las columnas de “content” y “Name”
4. Crear una nueva columna, usar la función. Excel.Workbook([variable])
5. Borrar la columna content
6. Expandir la nueva columna, dejando data y kind
7. Promover encabezados, función Table.PromoteHeaders([Data])
8. Expandir todo

Transformación de datos desde una carpeta local y creación de informe analítico de la TRM

Instituto
Forum
Aulas Atelier
¡¡Muchas gracias!!

“Without data you're just another person with an opinion”, Edwards Deming

Instituto
Forum
Aulas Atelier

También podría gustarte