Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Juan Martín
Pampliega
Title of
class/project
3
Metodología - Applied Machine Learning
4
Herramientas
5
Libros de Referencia
6
Cursos de Referencia
7
Kaggle + Blog Posts + Papers
8
02 Machine
Learning
Qué es Machine Learning?
10
Qué es Machine Learning?
11
Aplicaciones
12
Tipos de Aprendizaje
13
Aprendizaje Supervisado
14
Aprendizaje Supervisado
15
Aprendizaje Supervisado: Clasificación de Spam
16
Relación entre Estadística y Machine Learning
Estadística
● Generalmente involucra inferencia a partir de una muestra de una población
en el contexto de un test de hipótesis.
● Se realizan asunciones sobre cómo se relaciona la muestra a la población y del
proceso sobre el cual queremos realizar la inferencia.
● Ejemplo: “La gente en cuarentena no es más propensa a hacer un curso un viernes a
la noche.”
● Dos papers interesantes: Breiman (2001) y Shmueli (2010)
17
Relación entre Estadística y Machine Learning
Machine Learning
● Trata sobre predicción y generalización.
Queremos utilizar datos ya existentes para predecir
comportamiento sobre observaciones futuras o que
no hayamos visto.
● Se trata de realizar predicciones sobre
observaciones puntuales y no sobre una población
general.
● No necesita tener un modelo del proceso de
generación de observaciones pero si necesita que
las nuevas observaciones sean generadas por el
mismo proceso que las originales.
18
Data Science
Combina conocimiento de negocio,
informática, matemática y estadística
para extraer información valiosa a partir
de los datos.
Los Data Scientists aplican Machine
Learning sobre todo tipos de datos para
analizarlos y construir sistemas
predictivos que puedan realizar tareas
que anteriormente solamente podían
ser realizados por la inteligencia de un
ser humano
Estos sistemas generan insights y
accionables que los analistas y usuarios
de negocio aplican para generar valor
para el negocio.
19
Consideraciones relevantes para el “mundo real”
1. Definir el objetivo y definir una forma de medir ese objetivo (KPI).
2. Aplicar Machine Learning no debería ser la primera forma de solucionar un
problema.
3. Dependerá de nosotros determinar si necesitamos utilizar aprendizaje
supervisado o no supervisado, o si es un problema de clasificación o regresión.
4. Además de definir ese KPI es importante establecer un baseline de la situación
actual y poder medir las mejoras.
5. Debemos poder comunicar los resultados o predicciones, el por qué ocurren,
el grado de confianza y el impacto que las mismas pueden tener.
20
Reglas de proyectos de Machine Learning de Google
https://developers.google.com/machine-learning/guides/rules-of-ml
Y muchas más
21
Machine Learning Workflow
22
Machine Learning Workflow:
Extracción de Features
23
Machine Learning Workflow:
Entrenamiento del Modelo
24
Cómo sabemos que tan bueno es nuestro modelo?
25
Machine Learning Workflow
26
Machine Learning Workflow
27
Ejemplo de regresión: Precios de Casas
28
Ejemplo de regresión: Métrica de Error
29
Overfitting y Underfitting
30
Interpretabilidad del modelo
31
Deep Learning
32
Deep Learning
33
Aprendizaje No Supervisado
Reinforcement Learning
No se trabaja con un set de datos si no con un ambiente completo donde las acciones del agente
influencian qué partes ve y las situaciones que se generan.
Tenemos un entorno (la grilla), los estados y acciones (posición en la grilla y movimiento en la
misma) y los pagos (puntaje).
El objetivo es derivar una “regla de política” (un conjunto de acciones para cada estado) con el
objetivo de obtener el máximo retorno esperado de pagos
Muy usado en disciplinas diversa como economía, teoría de juegos, robotica, etc
35
División del tiempo en la vida de un Data Scientist
36
Por qué Python?
https://gitlab.com/mutt_data/muttlib
37
ML en Python
38
Referencias
The Cycle of Experimentation
https://towardsdatascience.com/ai-ml-practicalities-the-cycle-of-experimentation-fd4
6fc1f3835
39
Title of Muchas Gracias!
class/project