Está en la página 1de 100

¡LES DAMOS LA

BIENVENIDA!
¿Empezamos?
CRONOGRAMA DE CLASE
Parte 1 Parte 2

La necesidad de Introducción a la
información en la Programación
Industria 4.0

TRANSFORMACIÓN DIGITAL NOCIONES BÁSICAS

ESTRATEGIA DATA-DRIVEN PROBANDO ESTRUCTURAS

PROBANDO ESTRUCTURAS
RECUERDA PONER A GRABAR LA
CLASE
PRESENTACIÓN DE ESTUDIANTES

Por encuestas de Zoom:


1. País
2. Conocimientos previos en
Data Science
3. ¿Por qué elegiste el curso?
¿DUDAS DEL ON-BOARDING?
MIRALO AQUI
DESAFÍOS Y ENTREGABLES
Son actividades o ejercicios que se realizan durante la cursada, para enfocarse en
la práctica.

Desafíos genéricos Desafíos entregables


Ayudan a poner en práctica los conceptos y Relacionados completamente con el
la teoría vista en clase No deben ser subidos Proyecto Final. Deben ser subidos
a la plataforma. obligatoriamente a la plataforma hasta 7 días
luego de la clase para que sean corregidos.
DESAFÍOS Y ENTREGABLES
Son actividades o ejercicios que se realizan durante la cursada, para enfocarse en
la práctica.

Desafíos complementarios Entregas del Proyecto Final


Desafíos que complementan a los Entregas con el estado de avance de tu
entregables. Son optativos y, de ser subidos proyecto final que deberás subir a la
a la plataforma a tiempo y aprobados, suman plataforma a lo largo del curso y hasta 7 días
puntos para el top 10. luego de la clase, para ser corregidas por tu
docente o tutor/a.
PROYECTO FINAL
El Proyecto Final se construye a partir de los desafíos que se realizan clase a
clase. Se va creando a medida que se suben los desafíos entregables a
nuestra plataforma.

El objetivo es que cada estudiante pueda utilizar su Proyecto Final como parte
de su portfolio personal.

El proyecto final se debe subir a la plataforma la ante-última o última clase


del curso. En caso de no hacerlo tendrás 20 días a partir de la finalización del
curso para cargarlo en la plataforma. Pasados esos días el botón de entrega
se inhabilitará.
¿CUÁL ES NUESTRO PROYECTO FINAL?
MODELO ANALÍTICO DE MACHINE
LEARNING
En equipos de entre 3 y 5 estudiantes gestionarán un proyecto con las características
necesarias para su implementación en el nivel técnico en una organización.
Diseñarán un modelo analítico de Data Science en Jupyter Notebooks, acorde a la temática
a tratar y su respectiva documentación. Tendrán por lo menos una iteración para la
optimización del modelo construido. Todas las métricas deberán estar declaradas
correctamente.

📢¡Revisa en la carpeta de camada la consigna completa!📢


EJEMPLOS
Proyecto Enlace

Titanic https://github.com/mrdbourke/your-first-kag
gle-submission/blob/master/kaggle-titanic-d
ataset-example-submission-workflow.ipynb

Predicción de Fuga de Clientes https://github.com/prajgujarathi/Churn-Predi


ction-Model/blob/master/Churn%20Predictio
n%20Model.ipynb

Modelo de Riesgo de Crédito https://github.com/Prakhar-FF13/Credit-Risk


-Modelling/blob/master/Credit%20Risk%20
Modelling.ipynb
¡IMPORTANTE!
Los desafíos y entregas de proyecto se deben cargar hasta siete
días después de finalizada la clase. Te sugerimos llevarlos al día.
Clase 01. DATA SCIENCE

LA NECESIDAD DE INFORMACIÓN EN
LA INDUSTRIA 4.0 & Introducción
a la programación con Python
(Parte I)
● Comprender el rol de los datos en la
organización desde una perspectiva de
Transformación Digital y en la Industria 4.0.
● Identificar los componentes importantes de
una estrategia de Data & Analytics.
OBJETIVOS DE LA CLASE ● Facilitar la identificación de oportunidades

Parte 1 del uso de los datos para la transformación


digital y la estrategia de negocios.
TRANSFORMACIÓN DIGITAL
E INDUSTRIA 4.0: UNA
MIRADA ACTUAL
¿Por qué datos y por qué ahora?
Las transformaciones en el mundo que vivimos se sostienen y aceleran principalmente por el uso
de datos. Su implementación atraviesa múltiples industrias, áreas de servicio y amplios aspectos
de la vida cotidiana.

¿Cómo crees que ha influido el uso de datos en la situación pandémica del SARS-COV2? ¿Cómo
ha impactado a la hora de combatir el virus y crear la vacuna?
¿De dónde viene la Industria 4.0?

El término “Industria 4.0” surge de un de especialistas


multidisciplinarios convocados por el gobierno alemán a comienzos
de la década de 2010 enfocados en rediseñar un programa de
mejoras para la industria manufacturera.

Lectura recomendada en Material ampliado.


A partir de de esta nueva
nominación se transformó la
mirada sobre la industria de las
revoluciones anteriores:
Industria 1.0, Industria 2.0 e
Industria 3.0.

Fuente: Mixtrategy.com
🤔 ¿Escuchaste hablar de la Primera y Segunda Revolución
Industrial en la escuela? Bueno, ya vamos por la 4ta.
Hablar de Industria 4.0 es hablar de la
Cuarta Revolución Industrial
Entendemos la 4ta Revolución Industrial como la transición
hacia nuevos sistemas ciber-físicos que operan en forma de
complejas redes como salto cualitativo a sólo 50 años de la
Revolución digital (Industria 3.0).

Lectura recomendada en Material ampliado.


El Banco Interamericano de Desarrollo (BID) identifica la
particularidad de esta Revolución Industrial en la convivencia de una
gran variedad de tecnologías que se fusionan borrando los límites
entre lo físico, lo digital y lo biológico.
Sin duda, esto implica un gran cambio paradigmático en todos los
ámbitos de la vida.

Lectura recomendada en Material ampliado.


¿Qué tiene que ver con la Transformación
Digital?

La transformación digital es “el fomento de evolución y nuevos


modelos de negocio incorporando la digitalización de archivos e
incorporando lo digital a todas las áreas de negocio”.

Harvard Business Review


Tendencias en Data & Analytics 2020-2021
● IA mas inteligente, rápida y responsable
● Decision Intelligence
● X Analytics: Data No Estructurada
● Gestión de datos aumentada
● Cloud es una realidad
● Choques entre mundos de datos y analytics
● Data Marketplaces e Intercambios
● Blockchain en data & analytics
¡PARA PENSAR!
¿Cuál de las siguientes de las tecnologías crees que
revolucionará nuestra vida cotidiana en la próxima década?
(basado en el famoso tweet de Brian Feroldi)

CONTESTA LA ENCUESTA DE ZOOM


¿Qué hacer con datos? Hacking Cultural

Se trata de encontrar puntos vulnerables en su cultura y


convertirlos en un cambio real que se mantenga.
Ejemplo de caso de uso
Seguimiento de la ubicación interior en un aeropuerto:

● Objetivo: Gran aeropuerto internacional quiere mejorar los servicios ofrecidos


a los clientes
● Estrategia: Configura un sistema para rastrear a los viajeros usando
triangulación wifi
● Funcionamiento: Si el wifi de un pasajero está activado, la medición de la
intensidad de la señal en diferentes enrutadores permite una medición precisa
de la ubicación dentro de la terminal
● Oportunidades: Combinar con datos de ventas de tiendas e información
sobre vuelos
Objetivos específicos
● Comprender el comportamiento del pasajero para mejorar su
experiencia.
● Optimizar las asignaciones de puertas y ubicaciones de tiendas.
● Mitigar la experiencia negativa de los retrasos.
● Brindar ofertas promocionales, cupones y ofertas en ciertas
tiendas.
● Actualizar y/o reubicar servicios.
Datos y análisis del caso

Datos:
● Variados, Estructurados, No Estructurados.

Análisis:
● Descriptivo, Predictivo, Prescriptivo
CASO OBAMA
En el caso de Analítica de Campaña de Reelección 2013 de
Barack Obama, ¿cuáles serían los Objetivos, los Datos
y el Análisis?
En breakout room se agruparán en equipos de 5 personas y discutirán
por 10 minutos cómo la analítica fue clave en la campaña electoral de
Barack Obama.

Pueden remitirse al enlace proporcionado o buscar otro en Internet.

Luego deberán identificar los Objetivos, los Datos y el Análisis para


este caso.
ESTRATEGIA DATA-DRIVEN
Data Driven
Es una disciplina que utiliza diversas técnicas y herramientas
de análisis para aprovechar los datos generados dentro de un
ámbito o empresa para su beneficio y el de sus clientes.
Dicho de otro modo, se trata de sacar valor a los millones de
datos de los que hoy disponemos para tomar mejores
decisiones basadas en ellos.
Organización Data-Driven

Datos Refinamiento Uso


Producto de Datos

Datos Refinamiento Información

Los clientes compran Un producto de datos es Un producto de datos


el producto de datos una aplicación informática es información digital
una vez y continúan que toma entradas de que se puede comprar.
usándolo tal como datos y genera salidas,
está. devolviéndolas al entorno.
Datos
Refinamiento
Uso
Producto de Datos: Ejemplo
Estrategia de Data & Analytics
¿Qué es Estrategia?

¿Cómo Triunfamos?
● Propósito Empresarial
● Relaciones críticas y resultados
● Formas en que la empresa crea
valor.
● Habilidades empresariales
esperadas
¿Qué es el Modelo de Operación?
¿Qué se requiere para ejecutar?:
● Recursos, proceso, prácticas y
estructuras organizativas para cerrar
brechas.
● Datos requeridos y activos analíticos con
un ciclo de vida administrado
● Cómo deben evolucionar los entornos,
plataformas, herramientas y prácticas
● Orquestación de recursos en proyectos,
programas y/o líneas de productos para
tener éxito.
A medida que su entorno empresarial se vuelve más dinámico e
impredecible, también lo hace la conexión entre la estrategia y el
modelo operativo

BREAK
¡5/10 MINUTOS Y VOLVEMOS!
COMPONENTES DE UNA
ESTRATEGIA DATA-DRIVEN
Bases de la Estrategia
ORGANIZACIÓN DATOS HERRAMIENTAS CULTURA
DE ANALISIS
Objetivos Estratégicos Nuevos Datos Autoservicio Cultura de Datos

Resultados Esperados Datos Gobernados Capacidad de Cómputo Alfabetización de Datos


Medibles

Modelo de Operacion Datos Disponibles Consultas Sencillas Especializacion

Roles Definidos Datos Oportunos Visualización Intuitiva Comunicacion

Alineación / Autonomía Calidad de Información Ciencia de Datos Storytelling

Gestion de Datos Repositorios Escalables


Data Management Maturity Model
En la industria la administración de datos pasa por 5 niveles que definen la madurez de esta.

Nivel 1 Nivel 2 Nivel 3 Nivel 4 Nivel 5

● Poca o ninguna ● Gobierno ● Data vista como ● Gobierno ● Procesos de Alta


gobernanza emergente habilitador centralizado y Predicción
● Roles definidos ● Introducción organizacional. planificado ● Riesgo Reducido
dentro de los consistente de ● Procesos y ● Gestión de ● Métricas bien
silos herramientas herramientas Riesgos asociado establecidas y
● Problemas de ● Algunos roles y escalables a datos desplegadas
calidad de procesos ● Metas ● Métricas de para medir la
datos no definidos establecidas Performance de calidad de los
abordados ● Creciente considerando la Iniciativas de datos
conciencia del calidad de los Datos
impacto de los datos ● Métricas de
problemas de ● Automatización mejora de
calidad de datos de procesos Calidad de Datos
Big Data Analytics Maturity Model
“Al 2021, 50% de las organizaciones
carecerán de habilidades suficientes en
IA y alfabetización de datos para generar
valor sobresaliente en su organización”
Todo muy lindo… pero ¿por dónde
empezamos?
¡Bienvenidos/as al curso de Data
Science!
ROADMAP .
1 2 3 4

Propedeúticos de Metodologías y Data Acquisition y Exploratory Data


Data Science Herramientas Data Wrangling Analysis (EDA) &
Tecnológicas para Insight Discovery
Data Science

5 6 7

Datathon
Algoritmos de Validación de Tópicos
Machine Learning resultados del Modelo Avanzados de
y Tuneo Machine Learning Coderhouse
PRÓXIMOS PASOS .
1. Fundamentos de Programación para Data Scientists. Programación en
Python

2. Estadística Básica para Data Scientists.

3. Fundamentos de Bases de Datos.



BREAK
¡25/30 MINUTOS Y VOLVEMOS!
● Realizar una primera aproximación al
lenguaje de programación Python.

OBJETIVOS DE LA CLASE
● Conocer las distintas formas de
desarrollo con Python.
Parte II
MAPA DE CONCEPTOS
MAPA DE CONCEPTOS Parte 2

Programación y
lenguajes
Toma de contacto
Python como lenguaje
con Python
Interpretado vs
Compilado
Basics: Variables,
asignación,
operaciones
Python tradicional
Formas de
Estructuras
desarrollo con
Python
IPython y notebooks
Funciones

Tipos de datos
TOMA DE CONTACTO CON
PYTHON
Desde el principio:
Programación y Python
¿Qué es la programación?
● La programación es una forma de ejecutar un
algoritmo.
● Un algoritmo es una secuencia de pasos que
lleva a un resultado.
● Una receta es un algoritmo.
● Si se sigue el algoritmo, se llega al resultado.
Programa y computadora
● La computadora nació para resolver cálculos.
● La programación es un complemento para la computadora.
● Es una forma de que la computadora entienda el funcionamiento
de un algoritmo y lo ejecute.
● La computadora entiende ceros y unos (lenguaje binario),
nosotros no.
● Por lo tanto, un programa traduce un lenguaje humano a
lenguaje binario.
Programación y lenguajes
● No existe un solo lenguaje que solucione todos los problemas
● Cada lenguaje resuelve un conjunto de problemas posibles:
Empresariales, Web, etc.
● Para Data Science, existen algunos lenguajes que funcionan muy
bien: Python, R, Julia y Scala son algunos de ellos.\

Python R Julia Scala


Python rocks!
Python es el lenguaje más solicitado en las búsquedas laborales
relacionadas con Data Science y se ubica entre el segundo y tercer
puesto en 2021 de acuerdo a varios rankings de lenguajes de
desarrollo general (no sólo Data Science).

En otras palabras, Python no puede faltar en un portfolio de Data


Science.
¿Interpretado o Compilado?
PYTHON ES UN LENGUAJE INTERPRETADO,
ESTO QUIERE DECIR QUE:

● Usa un programa intérprete que traduce en tiempo casi real nuestras


órdenes a binario.
● La traducción se hace línea por línea.
● Podemos probar código “de a pedacitos”.
● El lenguaje compilado se traduce todo junto al final.
● No es simplemente una mejora, es una forma de trabajar muy útil para
Data Science.
Python en pocas palabras
(PYTHON IN A NUTSHELL)

● Lenguaje Open Source


(un código abierto y accesible diseñado para que cualquier pueden ver, modificar y
distribuirlo).

● Su fuerte es la simplicidad y la facilidad para compartir código.


● Cuenta con 3 componentes:
○ Intérprete: programa intérprete, traductor a binario.
○ IDE: entorno de desarrollo, lugar donde escribiremos código.
○ Paquetes: conjuntos de funciones pre-armadas para problemas habituales.
Formas de desarrollo
con Python
Python tradicional
● Tradicionalmente Python puede desarrollarse en Anaconda, o en su versión
simplificada, Miniconda.
● Además, puede utilizarse de varias otras formas.
○ La forma más básica es escribiendo python en la terminal, lo que abre un entorno
de trabajo dentro de la misma terminal.
⚠ NO es la forma más cómoda, ni la más utilizada.
○ Otra forma más útil es usando Python interactivo (IPython). Puede accederse
escribiendo ipython en la terminal.
⚠ No aporta muchas mejoras si se usa de esa forma.

¡Existe una forma mejor! 💪


IPython y notebooks
Las notebooks siguen siendo IPython, pero con vitaminas 🚀

● Escribimos código en el navegador que resulta ser el IDE.


● El código pasa por el mismo intérprete que el que usa la terminal,
pero todo se trabaja en el navegador.
● El código se escribe en cajas de texto que pueden ejecutarse de a
una o todas juntas.
● El conjunto total de cajas de texto es una notebook.

👉 Esta configuración SÍ es de las más utilizadas para Data Science.


🔗 Guía de instalación de Python con
Miniconda, Jupyter notebooks y Google Colab

BREAK
¡5/10 MINUTOS Y VOLVEMOS!
NOCIONES BÁSICAS DE
PROGRAMACIÓN
Basics: Variables, asignación,
expresiones
Pensemos en una fórmula
Pensemos en una fórmula
● En la expresión x + y = z queremos representar que la suma de los
números x e y dará como resultado el número z
● Si lo quisiéramos programar, podríamos pensarlo así:
1. Ingresar un número, que cumplirá el rol de la x
2. Ingresar un número, que cumplirá el rol de la y
3. Decirle a la computadora que efectúe la suma de x e y
4. Al resultado lo haremos cumplir el rol de la z
5. Mostrar al usuario el valor de z como resultado
Pensemos en una fórmula
● Toda vez que a un símbolo le damos un valor (x = 2) estamos haciendo
una asignación. En Python:
x = 2 #asignamos números
y = 3
z = x + y #realizamos la suma
z #en z se encuentra el resultado
5 #se muestra el resultado

● Cada parte del código “compuesta” que represente un valor concreto (x


+ y) es una expresión.
● Este razonamiento es análogo a las expresiones matemáticas.
Objetos y punteros
● Python es un lenguaje orientado a objetos
● Es así que en Python todo es un objeto, o sea, cuenta con:
○ Datos

○ Metadatos, atributos o propiedades (un punto y una palabra sin paréntesis):


X.atributo 👉 Un atributo caracteriza al dato

○ Funcionalidad o métodos (un punto y una palabra con paréntesis):


x.método() 👉 Un método es algo que el dato puede hacer, por lo tanto al ejecutarlo
le estamos pidiendo al dato que ejecute una acción
Objetos y punteros
x=1.0
x.is_integer() # ¿es x un entero? se lo preguntamos con el método is_integer()

x=1.4
x.is_integer() # ¿y ahora? se lo preguntamos de vuelta

print(x.real,x.imag) # miramos los atributos de x, en este caso su parte real


# y su parte imaginaria
Objetos y punteros
● Las variables en Python no contienen los datos, sino que
apuntan a los datos.
● Esta es la forma de trabajo de los punteros, lo que hace que el
lenguaje sea más eficiente.
PRÁCTICA RÁPIDA
¿Cuáles son las salidas de los siguientes bloques de código?

¡ESCRÍBELO EN EL CHAT!
¿No notaste algo raro en el ejercicio anterior...?
Objetos y punteros

● Cuando operamos sobre una variable (método) operamos


sobre el objeto al que apunta.
● Cuando realizamos una asignación (=) conectamos
(apuntamos) la variable al objeto. Aquí no cambiamos
el objeto.
Objetos y punteros
x = [1, 2, 3] # x es una lista
y = x # el objeto al que apunta x ([1, 2, 3]) ahora es también
# apuntado por y
print(y is x) # x e y son el mismo objeto (True)
print(x,y) # [1, 2, 3] [1, 2, 3]
x.append(4) # aquí operó sobre el objeto [1, 2, 3] apuntado por x.
# Los métodos se identifican luego de un punto (x.método())
print(y) # como x e y apuntan al mismo objeto, y refleja los cambios
x = "hola" # al realizar asignación, ahora x apunta al objeto texto
# (string) "hola"
print(x is y) # x e y ahora no apuntan al mismo objeto (False)
print(x,y) # x e y apuntan a dos objetos diferentes (“hola” [1, 2, 3, 4])
Objetos y punteros
La diferencia es muy sutil y en general no afecta el trabajo de Data
Science. No obstante, no todos los lenguajes se comportan así.

⚠ Hay que tener en cuenta esto para no cometer errores.


- Un método comienza por un punto después de la variable.
- El método modifica el objeto apuntado por la variable.
- La variable no es, ni contiene al objeto.
- La asignación “conecta” a la variable con el objeto
apuntado.
Operadores
● Los operadores permiten trabajar sobre las variables, a la manera
de las operaciones matemáticas.
● Cada operador da un resultado como salida.
● Identificamos 4 tipo de operadores:
■ Operadores aritméticos
■ Operadores de asignaciones
■ Operadores de identidad y pertinencia
Operadores aritméticos
● Los operadores aritméticos son directamente operaciones
matemáticas estándar.

Aritméticos
a + b Suma
a - b Resta
a * b Multiplicación
a / b División
a // b División entera (resultado sin decimal)
a % b Módulo (resto de la división entera)
a ** b Exponenciación
-a Negativo
Operadores de asignaciones
● Los asignadores simplifican operadores aritméticos comunes.

Asignaciones
a += b a = a + b
a -= b a = a - b
a *= b a = a * b
a /= b a = a / b
a //= b a = a // b
a %= b a = a % b
a **= b a = a ** b
Operadores de comparación
● Los comparadores dan resultados lógicos (si/no, true/false)

Comparadores

a == b a igual a b

a != b a distinto de b

a < b a menor a b

a > b a mayor a b

a <= b a menor o igual que b

a >= b a mayor o igual que b


Operadores de identidad y
pertenencia
● Los operadores de identidad y pertenencia verifican relaciones entre
objetos.
● Dentro de esta categoría, los operadores “in”, como casos particulares,
buscan objetos dentro de listas. ¡Son muy útiles!

Identidad y pertenencia
a is b a es el mismo objeto que b
a is not b a no es el mismo objeto que b
a in b a está contenido en b
a not in b a no está contenido en b
¿QUIERES SABER MÁS? TE DEJAMOS
MATERIAL AMPLIADO DE LA CLASE
● Guía de instalación de Python con Miniconda,
Jupyter notebooks y Google Colab | Guillermo
Leale

Disponible en nuestro repositorio.


● Industria 4.0: Fabricando el futuro | Unión
industrial Argentina, BID e INTAL

Disponible en nuestro repositorio.


¡MUCHAS GRACIAS!
Resumen de lo visto en clase hoy:
- Programar en Python: ¿de qué se trata y
qué hay que tener en cuenta?
¡MUCHAS GRACIAS!
Resumen de lo visto en clase hoy:
- Transformación digital e Industria 4.0
- Estrategia data-driven
- ¡Lo que se viene!
¿PREGUNTAS?
OPINA Y VALORA ESTA CLASE
#DEMOCRATIZANDOLAEDUCACIÓN

También podría gustarte