Está en la página 1de 105

¡Les damos la

bienvenida!
¿Comenzamos?
Esta clase va a ser
grabada
COMISIÓN N°29805

Presentación
del equipo
✔ Profesor responsable: José López

✔ Tutores:
○ Jorge Ruiz
○ David Silvera
○ Franklin Zhunio
○ Juan Demaestri
Presentación
de estudiantes
Por encuestas de Zoom

1. País
2. Conocimientos previos
3. ¿Por qué elegiste este curso?
¿Dudas sobre el
onboarding?
Míralo aquí
Lo que debes saber
!
antes de empezar
Acuerdos
y compromisos
ACUERDOS Y COMPROMISOS

Convivencia
✓ Conoce aquí nuestro código de ✓ Ten en cuenta las normas del buen
conducta y ayúdanos a generar un hablante y del buen oyente, que nunca
ambiente de clases súper ameno. están de más.

✓ Durante las clases, emplea los medios ✓ Verifica el estado de la cámara y/o el
de comunicación oficiales para canalizar micrófono (on/off) de manera que esto
tus dudas, consultas y/o comentarios: no afecte la dinámica de la clase.
chat Zoom público y privado, y por el
chat de la plataforma.
ACUERDOS Y COMPROMISOS

Distractores
✓ Encuentra tu espacio y crea el momento
oportuno para disfrutar de aprender

✓ Evita dispositivos y aplicaciones que puedan


robar tu atención

✓ Mantén la mente abierta y flexible, los


prejuicios y paradigmas no están invitados
ACUERDOS Y COMPROMISOS

Herramientas
✓ Mantén a tu alcance agua, mate o café ✓ Conéctate desde algún equipo (laptop,
tablet) que te permita realizar las
actividades sin complicaciones.
✓ Si lo necesitas, ten a mano lápiz y papel
para que no se escapen las ideas. Pero
recuerda que en Google Drive tienes ✓ Todas las clases quedarán grabadas y
archivos que te ayudarán a repasar, serán compartidas tanto en la
incluidas las presentaciones. plataforma de Coderhouse como por
Google Drive.
ACUERDOS Y COMPROMISOS

Equipo
✓ ¡Participa de los After Class! Son un gran espacio
para atender dudas y mostrar avances.

✓ Intercambia ideas por el chat de la plataforma.

✓ Siempre interactúa respetuosamente.

✓ No te olvides de valorar tu experiencia educativa y


de contarnos cómo te va.
Interacciones
en clase
INTERACCIONES EN CLASE

Mientras el
profesor explica
Para mantener una comunicación clara y fluida a lo largo
de la clase, te proponemos mantener 2 reglas:

1. Si tienes dudas durante la explicación, debes


consultarle directamente por privado a tu tutor por
el chat de Zoom.
INTERACCIONES EN CLASE

Espacios para
consultas
2. Entre contenido y contenido, se abrirán breves
espacios de consulta. Allí puedes escribir en el chat
tu pregunta.

¡Tu duda puede ayudar a otras personas!


No olvides seleccionar “todos” para que todos
puedan leerte (y no solo tu tutor).
INTERACCIONES EN CLASE

Funcionalidades
Para evitar saturar el chat de mensajes, utiliza Por ejemplo: si se pregunta si se escucha
los signos que figuran en el apartado correctamente, debes seleccionar la opción
Participantes, dentro de Zoom.** “Sí” o “No”.

**Para quitar el signo, presiona el mismo botón nuevamente o la opción “clear all”.
After Class
AFTER CLASS

¿Qué son?
Te acompañamos para resolver tus consultas Tu profesor/a está comprometido con tu
sobre el contenido en estos espacios. educación, por lo tanto:

Si hay temas que no se entendieron o ✓ Se responderán dudas puntuales que


necesitan refuerzo se trabajarán en una clase hayan quedado sobre los temas dados.
de 1 hs que opera como espacio de consulta. ¡Vení preparado, queremos escucharte!

No son obligatorias ni se toma asistencia, pero


✓ Se verán temas de conocimientos
son el espacio uno a uno con tu profesor/a**
básicos para la nivelación de saberes.
para responder dudas puntuales o reforzar
conceptos.

**Los/as tutores/as también serán protagonistas, liderando 5 veces este espacio en todo el curso.
Desafíos
y entregables
DESAFÍOS Y ENTREGABLES

¿Qué son?
Actividades en clase Desafíos entregables

Ayudan a poner en práctica los conceptos y Relacionados completamente con el


la teoría vista en clase. No deben ser subidos proyecto final. Deben ser subidos a la
a la plataforma. plataforma hasta 7 días luego de la clase,
para que sean corregidos.
DESAFÍOS Y ENTREGABLES

¿Qué son?
Desafíos complementarios Entregas del Proyecto final

Desafíos que complementan a los Entregas con el estado de avance del


entregables. Son optativos, pero de ser proyecto final, que deberán ser subidas a la
subidos a la plataforma a tiempo, y habiendo plataforma hasta 7 días luego de la clase
sido aprobados, suman puntos para el top 10. para ser corregidas cada tutor/a.
DESAFÍOS Y ENTREGABLES

Proyecto final
El Proyecto final se construye a partir de los Se debe subir a la plataforma la ante-última o
desafíos que se realizan clase a clase. Se va última clase del curso. En caso de no hacerlo
creando a medida que el estudiante sube los tendrás 20 días a partir de la finalización del
desafíos entregables a nuestra plataforma. curso para cargarlo en la plataforma. Pasados
esos días el botón de entrega se inhabilitará.
El objetivo es que cada estudiante pueda
utilizar su Proyecto final como parte de su
portfolio personal.
¿Cuál es nuestro
Proyecto final?
PROYECTO FINAL

Proyecto final en DS

Consigna:
El proyecto final consiste en tres entregas, donde de
manera secuencial irán resolviendo un problema para
una industria, negocio o proyecto personal. El proyecto
final debe plasmar cada una de las fases de un proyecto
de Data Science: Data Acquisition, Data Wrangling,
Exploratory Data Analysis, Modelamiento, Evaluación y
Despliegue. Se deberá entregar un notebook en formato
jupyter notebook (.ipynb) y una presentación (PDF, ppt o
Google Slides)
PROYECTO FINAL

Proyectos de nuestros
estudiantes
En este link podrán ver los Proyectos finales
de diferentes estudiantes de este curso de
comisiones anteriores.

¡Esperamos que les resulten inspiradores!


PROYECTO FINAL

Entrega Requisito Fecha

1° entrega Elección de potenciales datasets para importe con Clase 5 - DS I


la librería Pandas

2° entrega Visualizaciones en Python Clase 8 - DS I

3° entrega Estructurando un proyecto de DS- Parte I Clase 12 - DS I

4° entrega Estructurando un proyecto de DS- Parte II Clase 17 - DS I

5° entrega Estructurando un proyecto de DS- Parte III Clase 19 - DS I

Primera Pre-entrega Análisis de datos con Python Clase 21 - DS I


PROYECTO FINAL

Entrega Requisito Fecha

7° entrega Descarga de datos desde APIs públicas Clase 5 - DS II

8° entrega Data Wrangling Clase 7 - DS II

9° entrega Data StoryTelling Clase 11 - DS II

10° entrega Obtención de Insights Clase 14 - DS II

Segunda Pre-entrega Obtención de insights a partir de visualizaciones Clase 16 - DS II


PROYECTO FINAL

Entrega Requisito Fecha

12° entrega Entrenando un algoritmo de Machine Learning Clase 3 - DS III

13° entrega Evaluando modelos de Machine Learning Clase 6 - DS III

14° entrega Ingeniería de atributos y selección de variables Clase 8 - DS III

Entrenamiento y optimización de Modelos de


Entrega final Clase 16 - DS III
Machine Learning
¡Importante!
Los desafíos y entregas se deben cargar hasta siete días después de
finalizada la clase. Te sugerimos llevarlos al día.
Completa con éxito
el programa
Desafíos Desafíos
Desafíos Entrega Desafíos Proyecto
Kick Off Clase 0 Desafíos intermedia Desafíos final Certificado Top 10

Recuerda que el primer requisito para finalizar con éxito es asistir a las clases.
Clase 01. DATA SCIENCE

La necesidad de
información en la
Industria 4.0
Temario

00 01 02

Introducción a la
La necesidad de Introducción a librería
ciencia de Datos Información en la científica Python:
Industria 4.0 Pandas (Parte 1)

✓ Cuarta Revolución
Industrial ✓ Nociones
✓ Proyectos en ✓ El Ambiente de la básicas de
Data Science Industria 4.0 Pandas
✓ Transformación
✓ ¿Por qué es Digital ✓ Operaciones
importante la ✓ Ciclo de vida de en Pandas
Ciencia de un proyecto de
ciencia de datos ✓ Práctica
Datos?
✓ Valor y retorno de
integradora
la Ciencia de Datos
Objetivos de la clase

Identificar los componentes importantes de una


estrategia de Data & Analytics.

Comprender el rol de los datos en la organización


desde una perspectiva de Transformación Digital y
en la Industria 4.0

Facilitar la identificación de oportunidades del uso


de los datos para la transformación digital y la
estrategia de negocios.
MAPA DE CONCEPTOS Industria 4.0

Cuarta Revolución
Industrial

Industria 4.0
El ambiente de la
industria 4.0

Características de
Transformación Digital la industria 4.0

Necesidad de la
información en la
industria 4.0
Ciclo de vida de un
proyecto de ciencia
de datos

Valor y retorno de la
ciencia de datos

Estrategia Data Driven


Transformación Digital e
Industria 4.0
Cuarta Revolución
Industrial
Cuarta Revolución
Industrial
A partir de esta nueva denominación se transformó la REEMPLAZAR
mirada sobre la industria de las revoluciones anteriores: POR IMAGEN
Industria 1.0, Industria 2.0 e Industria 3.0.

🤔 ¿Escuchaste hablar de la Primera y Segunda


Revolución Industrial en la escuela? Bueno, ya vamos por
la 4ta.

Fuente: Mixtrategy.com
Cuarta Revolución
Industrial
REEMPLAZAR El Banco Interamericano de Desarrollo (BID) identifica la
POR IMAGEN particularidad de esta Revolución Industrial en la
convivencia de una gran variedad de tecnologías que se
fusionan borrando los límites entre lo físico, lo digital y lo
biológico.

Sin duda, esto implica un gran cambio de paradigma, en


todos los ámbitos de la vida.

¿Quieres saber más? Consulta el material ampliado de la clase


Cuarta Revolución
Industrial
Entendemos la cuarta Revolución Industrial
como la transición hacia nuevos sistemas
ciber-físicos que operan en forma de
complejas redes como salto cualitativo a sólo
50 años de la Revolución digital (Industria
3.0).
Industria 4.0
¿Por qué hablamos de Industria
4.0?
El término “Industria 4.0” surge de un El fundamento de la Industria 4.0 está en el
conjunto de especialistas multidisciplinarios desarrollo de sistemas tipo SCADA con fácil
convocados por el gobierno alemán a supervisión y sustentabilidad así como
comienzos de la década de 2010 enfocados estructuras IIoT que permiten utilizar el poder
en re-diseñar un programa de mejoras para la de las máquinas inteligentes y el análisis en
industria manufacturera. tiempo real.
Supervisory Control and Data Acquisition (SCADA) Sistemas IIoT
El ambiente de la
Industria 4.0
El ambiente de la
industria 4.0
El ambiente de la industria 4.0 está enmarcado en cuatro
grandes pilares:
👉 Internet of Things (IoT)
👉 Internet of Services (IoS)
👉 Internet of Data (IoD)
👉 Internet of People (IoP)

Estos componentes conforman lo que se conoce como


Smart Factory
Internet of Things
(IoT)
✔ Describe la conectividad entre objetos físicos
como tostadores, refrigeradores, TV al Internet
permitiendo la comunicación entre dispositivos.

✔ Se requiere de diversos factores como una


infraestructura de conectividad con alta velocidad
y protocolos de comunicación (e.j Machine to
Machine M2M) para la correcta implementación del
IoT.
Industrial Internet
of Things (IIoT)
REEMPLAZAR ✔ Se refiere a sensores interconectados, instrumentos y
POR IMAGEN otros dispositivos industriales enlazados entre sí con
aplicaciones computacionales para mejorar procesos
industriales y de manufactura.
Internet of Services
(IoS)
✔ Se refiere a un marketplace global de aplicaciones y
software basado en internet que se ofrecen como
servicios.
✔ IoS incluye los servicios de Blockchain que es
importante en cadenas de suministros.
✔ IoT facilitado por IoS crea innovación disruptiva.
Internet of Data
(IoD)
✔ IoD se fundamenta en los los billones de datos
extensivos generados por dispositivos del IoT
✔ Estos volúmenes de información tienen el potencial
para generar $ cuando las tecnicas Analiticas de Big
Data descubren patrones en ellos.
Internet of People
(IoP)
✔ Un nuevo paradigma del internet donde los humanos y
sus dispositivos personales no son considerados
como usuarios finales sino como elementos activos.
✔ IoP se desarrolla de forma descentralizada como
Blockchain donde los datos no están bajo el control de
una sola entidad.
✔ El lema del IoP es ser un internet “de y para las
personas” en vez de ser uno donde se sacrifica su
privacidad.
Características de la
Industria 4.0
Características de
la Industria 4.0
La Industria 4.0 se caracteriza por tener nueve
características principales:
✔ Big Data
✔ Simulación
✔ Internet of Services
✔ Realidad aumentada
✔ Sistemas ciber-físicos
✔ Manufactura automática
✔ IoT (Internet of Things)
✔ Sistemas de cómputo en la nube
✔ Sistemas de robótica autónomos
Fuente: Tay, S. et al. (2018). An Overview of Industry 4.0: Definition, Components,
and Government Initiatives
Características de
la Industria 4.0
✔ Industria 1.0: Mecanización del trabajo que solía
realizarse de forma manual.
✔ Industria 2.0: Transformación que se produjo con la
introducción de la electricidad en procesos.
✔ Industria 3.0: Llegada de la informática y la
automatización a la escena industrial. (Uso de
controladores lógicos programables, robots, etc).
✔ Industria 4.0: Era de Cyber Physical Systems (CPS).
Máquinas inteligentes, sistemas de almacenamiento e
instalaciones de producción capaces de intercambiar
información de forma autónoma,
Fuente: Tay, S. et al. (2018). An Overview of Industry 4.0: Definition, Components,
and Government Initiatives
Transformación
digital
La transformación digital es el fomento de
evolución y nuevos modelos de negocio
incorporando la digitalización de archivos e
incorporando lo digital a todas las áreas de
negocio.
- Harvard Business Review, 2021
Near Field Communications Cloud IA
Blockchain (NFC)

Tecnología
Realidad virtual Robótica Ways of working
móvil
Transformación Digital
La transformación digital es el proceso Deseamos ver mejoras dramáticas en el
mediante el cual se realizan cambios desempeño y cambiar las rutas para lograr el
integrales en la estrategia, modelos éxito.
operativos, personas, cultura y procesos. Las amenazas para las organizaciones hoy en
día son más resistentes y más robustas.
Problemas nuevos, exigen soluciones
innovadoras 🚀

Como muestra el siguiente cuadro, existe un movimiento constante


en el top de empresas líderes…
Top 10 Compañías 2021 Top 10 Compañías 2011 Top 10 Compañías 2001

Wallmart Wallmart Exxon Mobil

State Grid Exxon Mobil Wallmart

Amazon Chevron General Motors

China National Petroleum CoconoPhillips Ford Motor

Sinopec Group China Fannie Mae General Electric

Apple General Electric Citigroup

CVS Health Berkshire Hathaway Enron

UnitedHealth Group General Motors Intl. Business Machines

Toyota Motor Company Bank of America. AT&T

Volkswagen Ford Motor Verizon Communications

Fuente: https://fortune.com/global500/search/
¿Por qué datos y por
qué ahora?
¿Por qué datos y
por qué ahora?
Según Forbes (2021) “Ahora más que nunca, los datos, la
analítica y la experiencia son de importancia existencial.
No es simplemente una cuestión de opinión. Se ha
convertido en un asunto público y social de vida o
muerte.”

Los datos impulsan las decisiones que tomamos y los


riesgos que asumimos hoy día.
¿Por qué datos y
por qué ahora?
En un contexto de Pandemia, por ejemplo, las respuestas a
preguntas como:
¿Abrimos negocios y escuelas? ¿Abrimos
establecimientos públicos? ¿Qué nos dicen los datos? ¿La
curva sube o se aplana? ¿Se volverá a emplear a la gente?
¿Volverá el negocio?
Solo se pueden responder con el uso de datos.
Tendencias en Data & Analytics
2021-2022
✔ IA más inteligente, rápida y responsable ✔ Choques entre mundos de datos y
analytics
✔ Decisión Intelligence
✔ Data Marketplaces e Intercambios
✔ X Analytics: Data No Estructurada
✔ Blockchain en data & analytics
✔ Gestión de datos aumentada
✔ MLOps (Machine Learning Operations)
✔ Cloud es una realidad
✔ Modelos de lenguaje avanzados (e.j.
BERT)
Dinámica de pares
¡Formemos equipos!
En esta clase conformaremos nuestros equipos
de trabajo. Para esto, nos dividiremos en
Breakout Rooms con nuestros tutores y allí
realizaremos una dinámica de agrupación.
Duración: 10 minutos
DINÁMICA DE PARES

¡Algunas cosas importantes!


Presencia Apertura al aprendizaje
✓ Nos comprometemos a estar presentes ✓ Es importante, al trabajar en equipo, a
en el trabajo junto a nuestro escuchar las ideas y la voz de nuestro o
compañero. nuestra compañera. ¡Las ideas nos
enriquecen!
Colaboración
✓ Ambos colaboraremos en los Compromisos y acuerdos
entregables, pre entregas y en la ✓ Es importante, una vez que tengamos
construcción de nuestro Proyecto Final. un compañero, pautar horarios y modos
de trabajo que sean funcionales a
ambos.
DINÁMICA DE PARES

Ahora sí… ¡A formar grupo!


Consigna: Nos dividiremos en breakout En él encontraremos un cuadro según
rooms por tutorías. Una vez estemos en el diferentes intereses, anotaremos nuestro
room correspondiente nuestro tutor nos nombre en la columna que corresponda.
compartirá un archivo docs. El tutor nos Luego, armaremos los pares.
mostrará diferentes ejemplos de proyectos
asociados a diferentes tópicos.

NOTA: usaremos los breakouts rooms. El tutor/a tendrá el rol de facilitador/a.



Break
¡10 minutos y volvemos!
Ciclo de vida de un
proyecto de Ciencia de
Datos
Ciclo de vida de un proyecto
de Ciencia de datos
Momento 1: Definir el objetivo

Momento 2: Recolección de la data

Momento 3: Preparar la data

Momento 4: Elección del Algoritmo


Ciclo de vida de un proyecto
de Ciencia de datos
Momento 5: Entrenar el modelo

Momento 6: Validación del modelo

Momento 7: Deployment del modelo


1. Definir el objetivo
Es vital entender el problema a resolver y cuáles son
nuestros objetivos dado las características de la empresa,
así como de la data que tendremos a disposición.
Las siguientes preguntas son típicas en esta etapa:

✔ ¿Qué exactamente deseamos hacer?


✔ ¿Cómo exactamente podremos hacerlo?
✔ ¿Es posible lo que deseo dada la data que tengo?
2. Recolección de
data
✔ Data First Party: Data propia de la empresa
(ERP,CRM,BD, etc).
✔ Data Second Party: Suele ser data que comparte una
organización con sus aliados estratégicos.
✔ Data Third Party: Datos de tercero que podemos
obtener ya sea de forma gratuita o incurriendo en
algún tipo de costo asociado.
3. Preparar la data
Normalmente lo conocemos como la limpieza de los datos o
el formateo del dato.
El objetivo de esta etapa es manipular y convertir la data en
formas que produzcan mejores resultados. Algunos
ejemplos serían:
Eliminar o inferir datos perdidos, categorizar los valores de
las variables, normalizar los valores numéricos o escalarlos
para que puedan ser comparables.
4. Elección del
Algoritmo
Una vez que ya hemos preprocesado la data, nos
corresponde elegir el algoritmo más adecuado en relación al
problema que deseamos resolver.
En este punto tenemos que decidir por el Tipo de
Aprendizaje que vamos a implementar.
En las próximas clases de: Modelos Analíticos para Ciencia
de Datos II y III se abordarán los Tipos de Aprendizaje en ML
con mucho mayor detalle y profundidad.
4. Elección del
Algoritmo
Tipos de aprendizaje
Aprendizaje Supervisado: Son entrenados El mismo recibe un conjunto de entradas
utilizando ejemplos etiquetados, como una junto con los resultados correctos
entrada donde se conoce el resultado correspondientes, y el algoritmo aprende
deseado. comparando su resultado real con resultados
correctos para encontrar errores. Luego
modifica el modelo en consecuencia es decir,
la salida de este algoritmo es conocida.
Tipos de aprendizaje
Aprendizaje No Supervisado: Se utiliza Por ejemplo: identificar segmentos de clientes
contra datos que no tienen etiquetas con atributos similares que después puedan
históricas. No se da la "respuesta correcta" al ser tratados de manera semejante en
sistema. El objetivo es explorar los datos y campañas de marketing o bien puede
encontrar alguna estructura en su interior. encontrar los atributos principales que
separan los segmentos de clientes.
Tipos de aprendizaje
Aprendizaje por Refuerzo: el algoritmo Este tipo de aprendizaje tiene tres
descubre a través de ensayo y error qué componentes principales: el agente (el que
acciones producen las mayores aprende o toma decisiones), el entorno (todo
recompensas. con lo que interactúa el agente) y acciones (lo
que el agente puede hacer).
Se utiliza a menudo en robótica, juegos y
navegación.
5. Entrenar el
modelo
Este paso tiene una relación directa con conceptos que
abordaremos más adelante en el curso (Training y Test). Sin
embargo, el proceso de entrenamiento de un modelo de ML,
consiste en proporcionarle al modelo datos de
entrenamiento de los cuales pueda aprender.
6. Validar el modelo
Se realizará con la data de validación y procederemos a
¨correr” el algoritmo y a evaluar los resultados obtenidos.
En el caso de que los resultados no sean satisfactorios,
deberemos volver a la etapa 5 hasta que nuestro modelo se
ajuste bien a las dos particiones (data de entrenamiento y
data de validación).
7. Deployment del
modelo
Implementación en producción de nuestro modelo.
Generalmente, solemos ayudarnos de la nube a través de los
tres vendors más conocidos que existen actualmente:
✔ AWS
✔ Azure
✔ GCP
Ejemplo en vivo
¡Vamos a trabajar con datos!
¿Qué conceptos de Data Science conocen o
han escuchado nombrar?
¿Qué conceptos han escuchado
antes?
Por encuestas de Zoom:
✔ SQL
✔ Exploratory Data Analysis
✔ Estadística inferencial
✔ Data Wrangling
✔ Machine Learning
✔ Minería de datos
✔ Deep Learning
✔ Limpieza de datos
✔ Inteligencia artificial
¡Vamos a trabajar con
datos!

Miremos en el notebook Clase 1.ipynb cómo


crear un gráfico igual a este.
Valor y retorno de
la ciencia de Datos
Valor y retorno de la Ciencia de
Datos
Así como cualquier inversión, la factibilidad de ¿Qué queda del valor generado después de
un proyecto de ciencia de datos ocurre los costos se contabiliza el costo de los
cuando genera más valor que costos. Para errores?
esto se puede utilizar el índice ROI (Return of
Investment)
Valor y retorno de la Ciencia de
Datos
Retorno= valor -(1-accuracy)*Costo del error Accuracy: Métrica de performance del
modelo.
Retorno: Lo que se genera o el profit por cada Costo del error: Costos adicionales por un
predicción. error (e.g nos demoramos 10 min corrigiendo
Valor: El valor generado por cada predicción un error en el sistema)
(e.g antes demoramos 5 minutos en obtener
una predicción manual, con el algoritmo
ahora toma 0.01 s)
Valor y retorno de la Ciencia de
Datos
Si hacemos que el Retorno =0 entonces: Ejemplo: Si cada predicción ahorra 5 min de
trabajo pero arreglar errores te cuesta 20 min
0= valor -(1-accuracy)*Costo del error el Break Even Accuracy sería: 1- (5/20) = 0.75
accuracy= 1- (valor/Costo del error) (75%)
A esto se le conoce como Break Even Tu modelo debe tener al menos 75% de
Accuracy accuracy para que valga la pena usarlo
Valor y retorno de la Ciencia de
Datos
Ejemplo: Si tenemos un algoritmo que tiene Si estamos hablando de un call center que
un accuracy de 78%, donde cada predicción puede recibir 10000 llamadas al mes
ahorra 5 min de trabajo y arreglar errores ahorramos 467 horas de trabajo manual
cuesta 10 min, entonces: 🚀Nada mal 🚀

Retorno= valor -(1-accuracy)*Costo del error


Retorno = 5- (1-0.78)*10=2.8
Entonces, usar el algoritmo nos ahorra 2.8
minutos (168 seg) de trabajo.
Estrategia
data-driven
Data Driven
REEMPLAZAR Es una disciplina que utiliza diversas técnicas y
POR IMAGEN herramientas de análisis para aprovechar los datos
generados dentro de un ámbito o empresa para su beneficio
y el de sus clientes.
Dicho de otro modo, se trata de sacar valor a los millones de
datos de los que hoy disponemos para tomar mejores
decisiones basadas en ellos.
Organización Data-Driven

Datos Refinamiento Uso


Organización Data-Driven

Refinamiento Uso
Datos

Un producto de datos es Un producto de datos es


Los clientes compran el
una aplicación informática información digital que
producto de datos una
que toma entradas de se puede comprar y
vez y continúan
datos y genera salidas, usar.
usándolo tal como está.
devolviéndole al entorno.
Datos
Refinamiento
Usos
Ejemplo de caso de uso
✔ Estrategia: Análisis exploratorio de
datos, metodología de agrupamiento
(clustering), obtención de conclusiones
Detección de fraude en una compañía de
✔ Funcionamiento: La información
póliza de seguros:
recolectada por parte de la aseguradora
Su tarea es responder si existen patrones
es el insumo del algoritmo de
particulares en los grupos de reclamos
segmentación que permitirá detectar
presentados que puedan ser indicativos de
fraude en posibles reclamos de los
fraude.
usuarios
✔ Oportunidades: Combinar con datos de
ventas e información sociodemográfica
para ofrecer nuevos productos de
pólizas para los clientes de la empresa
Objetivos específicos:
✔ Identificar posibles grupos
problemáticos posiblemente asociados
✔ Comprender el comportamiento de los a eventos fraudulento.
reclamos por parte de los usuarios.
✔ Brindar ofertas promocionales, cupones
✔ Identificar grupos de acuerdo a su y ofertas en pólizas a diferentes
condición sociodemográfica. usuarios.
✔ Actualizar servicios.
Datos y análisis del caso:
Fuentes de Datos: Es donde podemos
capturar la información, que puede ser de
tres tipos: estructurada, semi-estructurada o
no estructurada.
Tipo de Análisis: Es la metodología que
usamos para resolver el problema. nos
podemos preguntar por: Descriptivo (¿Qué
pasó?), Diagnóstico (¿Por qué
paso?),Predictivo (¿Qué pasará?), Prescriptivo
(¿Cómo hacer que suceda?)
Actividad colaborativa
Optimizando el stock para una PYME
Ayudamos a optimizar el stock de nuestra
heladería de barrio
Realizaremos la actividad en la sala general.

Duración: 15-20 minutos


ACTIVIDAD COLABORATIVA

Optimizando el stock para


una PYME
Consigna: En la heladería de Pedro se lleva ✔ ¿Cómo piensan que esta información
mucho tiempo trabajando sin ningún tipo de puede ayudar a tener un mejor control
estrategia enfocada al uso de los datos como del stock de la heladería?
oportunidad de mejora y manejo de stocks.
Recientemente, debido a la crisis sanitaria, el ✔ ¿Qué nivel de madurez tendría esta
dueño ha cambiado su perspectiva y piensa empresa según el modelo Data
que su empresa debería hacer un mejor uso Management Maturity Model?
de los datos históricos recolectados.
¿Preguntas?
¿Quieres saber más?
Te dejamos material
ampliado de la clase
MATERIAL AMPLIADO

Recursos multimedia

✓ Industria 4.0: Fabricando el futuro |


Unión industrial Argentina, BID e INTAL
✓ Ciclo de vida de un proyecto de Data
Science | Analytics Vidhya
✓ Transformación Digital | Salesforce

Disponible en nuestro repositorio.


CLASE N°1

Glosario Ciclo de vida de un proyecto de DS: 7 fases que


describen cómo resolver un problema analitico
(Definir objetivo, Recolectar datos, Limpiar y preparar
Industria 4.0: que permiten utilizar el poder de las
datos, Elección de algoritmo, Evaluación de algoritmos
máquinas inteligentes y el análisis en tiempo real por
y Despliegue)
medio de la interacción con sistemas ciber-físicos
Valor de retorno de un proyecto de DS: costo
IoT (Internet of Things): conectividad entre
(tiempo o $) que se pierde o gana con la
dispositivos a la Internet
implementación de cualquier algoritmo en un proceso
IoS (Internet of Services): conectividad entre productivo
dispositivos a escala industrial
Estrategia Data Driven: uso de técnicas y
IoD (Internet of Data): manejo de volúmenes de herramientas para mejorar la toma de decisiones con
datos gigantes interconectados el fin de extraer el valor de los datos

IoP (Internet of People): interacciones mucho más Transformación digital: uso de tecnología en todas
eficientes entre personas las áreas del negocio para mejorar productividad.
Muchas gracias.
Resumen
de la clase hoy
✓ Cuarta Revolución Industrial
✓ El Ambiente de la Industria 4.0
✓ Transformación Digital
✓ Ciclo de vida de un proyecto de ciencia de datos
✓ Valor y retorno de la Ciencia de Datos

También podría gustarte