Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modulo1 Introduccio ünAAprendizajeDeMa Üquina
Modulo1 Introduccio ünAAprendizajeDeMa Üquina
Aprendizaje de Máquina
MÓDULO 1
2
Agenda
1) Definición
2) Historia
3) Aplicaciones
4) Tipos de Aprendizaje.
5) Argot de Aprendizaje de Máquina
6) Áreas Relacionadas
7) Limitaciones
8) Bibliotecas
9) Conferencias
3
Definición
¿Aprendizaje de Máquina?
01 02 Tony Tether, 03
Bill Gates, Microsoft DARPA John Hennessy, Stanford
"Un avance en el "El aprendizaje de máquina "El aprendizaje de
aprendizaje de máquina es el próximo Internet" máquina es la nueva
valdría diez microsofts" moda"
04 05 06
Prabhakar Raghavan, Yahoo Greg Papadopoulos, Sun Steve Ballmer, Microsoft
"Las clasificaciones web de hoy " El aprendizaje de "El aprendizaje de máquina hoy
son principalmente una máquina resulta en una es uno de los aspectos más
cuestión de aprendizaje de candentes de la computación"
máquina"
verdadera revolución"
5
¿Qué significa Aprendizaje?
6
¿Qué significa Aprendizaje?
7
Entonces, ¿qué es el aprendizaje de
máquina?
8
Entonces, ¿qué es el aprendizaje de
máquina?
9
Entonces, ¿qué es el aprendizaje de
máquina?
● Automatización de la automatización
● Hacer que las computadoras se programen
● El software de escritura es el cuello de botella
● ¡Deje que los datos hagan el trabajo!
10
Entonces, ¿qué es el aprendizaje de
máquina?
● Automatización de la automatización
● Hacer que las computadoras se programen
● El software de escritura es el cuello de botella
● ¡Deje que los datos hagan el trabajo!
Programación Tradicional
datos
Computadora resultado
programa
11
Entonces, ¿qué es el aprendizaje de
máquina?
● Automatización de la automatización
● Hacer que las computadoras se programen
● ¡Deje que los datos hagan el trabajo!
● Usar la computadora para detectar automáticamente patrones en los datos y usarlos
para hacer predicciones o decisiones.
datos datos
Computadora resultado Computadora programa
programa resultado
12
Entonces, ¿qué es el aprendizaje de
máquina?
● Automatización de la automatización
● Hacer que las computadoras se programen
● ¡Deje que los datos hagan el trabajo!
datos datos
Computadora resultado Computadora programa
programa resultado
13
¿Magia?
14
¿Magia?
¡NO!
● Semillas = Algoritmos
● Nutrientes = Datos
● Jardinero = Tú
● Plantas = Modelos
15
Historia
Historia
Algoritmo implementado
como un circuito
Perceptron
1957 1959 1969 1980 1990 2000 2010
Historia
Algoritmo implementado
como un circuito
Perceptron
1957 1959 1969 1980 1990 2000 2010
Arthur Samuel
Programa de damas
basado en el
aprendizaje
18
Historia
Perceptrons
Algoritmo implementado (limitaciones de los
como un circuito modelos lineales)
Arthur Samuel
Programa de damas
basado en el
aprendizaje
19
Historia
Perceptrons
Algoritmo implementado (limitaciones de los
como un circuito modelos lineales)
Visión computacional: detección de objetos, detección de Speech: conversión de habla a texto, reconocimiento de
rostros, detección de escritura, segmentación semántica, habla, asistentes personales, identificación del hablante, y
estimación de pose, y otras. otras.
26
Aplicaciones
27
Aplicaciones
28
Aplicaciones
29
Aplicaciones
30
Aplicaciones
Detección de spam.
31
Tipos de Aprendizaje
Aprendizaje
NO SUPERVISADO
SUPERVISADO
REFORZADO
Imagine un organismo o máquina que experimenta una serie de entradas sensoriales: x1, x2, x3, x4,. . .
33
Aprendizaje
NO SUPERVISADO
El objetivo de la máquina es construir
SUPERVISADO un modelo de x que pueda ser
utilizado para razonar, tomar
La máquina también recibe las decisiones, predecir cosas,
salidas deseadas y1, y2,. . ., y comunicarse, etc.
su objetivo es aprender a
producir la salida correcta
dada una nueva entrada.
REFORZADO
La máquina también puede producir acciones
a1, a2,. . . que afectan el estado del mundo, y
recibe recompensas (o castigos) r1, r2,. . .. Su
objetivo es aprender a actuar de una manera
que maximice las recompensas a largo plazo.
Imagine un organismo o máquina que experimenta una serie de entradas sensoriales: x1, x2, x3, x4,. . .
34
Aprendizaje
NO SUPERVISADO
El objetivo de la máquina es construir un
SUPERVISADO modelo de x que pueda ser utilizado para
razonar, tomar decisiones, predecir cosas,
La máquina también recibe las comunicarse, etc.
salidas deseadas y1, y2,. . ., y ● Sin etiquetas / objetivos
● Sin realimentación
su objetivo es aprender a
● Encontrar estructura oculta en datos
producir la salida correcta
dada una nueva entrada.
REFORZADO
● Datos etiquetados La máquina también puede producir acciones
● Retroalimentación directa
● Predecir resultado / futuro
a1, a2,. . . que afectan el estado del mundo, y
recibe recompensas (o castigos) r1, r2,. . .. Su
objetivo es aprender a actuar de una manera
que maximice las recompensas a largo plazo.
Imagine un organismo o máquina que experimenta una serie
● de entradas
Proceso sensoriales: x1, x2, x3, x4,. . .
de decisión
● Sistema de recompensas
● Aprende series de acciones 35
Aprendizaje
NO SUPERVISADO
SUPERVISADO
REFORZADO
Imagine un organismo o máquina que experimenta una serie de entradas sensoriales: x1, x2, x3, x4,. . .
36
Aprendizaje Supervisado
● Datos etiquetados
● Retroalimentación directa
● Predecir resultado / futuro
Aprendizaje Supervisado
● Datos etiquetados
● Retroalimentación directa
● Predecir resultado / futuro
Clasificación
Ejemplo de clasificación binaria con dos
características (variables "independientes",
predictores)
Aprendizaje Supervisado
● Datos etiquetados
● Retroalimentación directa
● Predecir resultado / futuro
objetivo
(variable
dependiente)
atributo
Clasificación
Regresión
Ejemplo de clasificación binaria con dos
características (variables "independientes",
predictores)
Aprendizaje Supervisado
● Datos etiquetados
● Retroalimentación directa
● Predecir resultado / futuro
objetivo
(variable
dependiente)
SUPERVISADO
REFORZADO
Imagine un organismo o máquina que experimenta una serie de entradas sensoriales: x1, x2, x3, x4,. . .
42
Aprendizaje No Supervisado
● Sin etiquetas / objetivos
● Sin realimentación
● Encontrar estructura oculta en datos
Aprendizaje No Supervisado
● Sin etiquetas / objetivos
● Sin realimentación
● Encontrar estructura oculta en datos
representación latente
representación latente
Agrupamiento
Aprendizaje No Supervisado
● Sin etiquetas / objetivos
● Sin realimentación
● Encontrar estructura oculta en datos
Identifying Regulatory Mechanisms using Individual Variation Reveals Representar palabras por vectores
Key Role for Chromatin Modification. [Su-In Lee, Dana Pe'er, Aimee
M. Dudley, George M. Church and Daphne Koller. ’06]
Clustering de genes Word embeddings
Aprendizaje No Supervisado
● Sin etiquetas / objetivos
● Sin realimentación
● Encontrar estructura oculta en datos
SUPERVISADO
REFORZADO
Imagine un organismo o máquina que experimenta una serie de entradas sensoriales: x1, x2, x3, x4,. . .
52
Aprendizaje Reforzado
● Proceso de decisión
● Sistema de recompensas
● Aprende series de acciones
Aprendizaje Reforzado
● Proceso de decisión
● Sistema de recompensas
● Aprende series de acciones
Ambiente
Recompensa
Estado
Acción
Agente
Aprendizaje Reforzado
● Proceso de decisión
● Sistema de recompensas
● Aprende series de acciones Punto de referencia actual de última generación: StarCraft II
Vinyals, Oriol, Timo Ewalds, Sergey Bartunov, Petko Georgiev, Alexander Sasha Vezhnevets,
Michelle Yeo, Alireza Makhzani et al. "Starcraft II: A new challenge for reinforcement
learning." arXiv preprint arXiv:1708.04782 (2017).
Kaggle 2019
Encuesta de profesionales de ciencia de datos y ML: ¿qué métodos
de ciencia de datos utiliza en el trabajo?
56
Argot de Aprendizaje
de Máquina
Representación de Datos
Punto de dato: Instancia de datos, vector de características
58
Representación de Datos
Punto de dato: Instancia de datos, vector de características
59
Representación de Datos
Punto de dato: Instancia de datos, vector de características
Número de Atributos:
60
Representación de Datos
Conjunto de datos: N puntos (instancia de datos).
61
Datos Estructurados
bases de datos, hojas de cálculo / archivos csv
62
Datos Estructurados
bases de datos, hojas de cálculo / archivos csv
63
Datos Estructurados
bases de datos, hojas de cálculo / archivos csv
instancias
150
variable objetivo/
etiqueta
atributos
64
Datos No Estructurados
características como píxeles de imagen, señales de
audio, oraciones de texto
65
Datos No Estructurados
características como píxeles de imagen, señales de
audio, oraciones de texto
66
Más términos
● Ejemplo de entrenamiento: sinónimo de observación, registro de entrenamiento, instancia de entrenamiento, muestra de
● Objetivo: sinónimo de resultado, verdad fundamental, salida, variable de respuesta, variable dependiente, etiqueta (clase) (en
clasificación)
● Salida / predicción: usada para distinguir de los objetivos; significa salida del modelo
● Modelo: Dados los datos D, aprendemos los parámetros del modelo θ, a partir de los cuales podemos predecir nuevos puntos de
datos.
67
Áreas Relacionadas
Minería de Datos vs. Aprendizaje Automático
Extrae automáticamente conocimientos Usar la computadora para detectar automáticamente patrones en
útiles de grandes conjuntos de datos. los datos y usarlos para hacer predicciones o decisiones.
- Por lo general, para ayudar con la - Queremos automatizar algo que un humano puede hacer.
toma de decisiones humanas. - Queremos hacer cosas que un humano no puede hacer (ver 1 TB
de datos).
Humanos en el proceso
Generalización de tareas
69
Minería de Datos vs. Aprendizaje Automático
La minería de datos y el aprendizaje automático son muy similares:
- La minería de datos a menudo linda más con las bases de datos.
- El aprendizaje automático a menudo linda más con la inteligencia artificial.
70
Aprendizaje Profundo vs. Aprendizaje de
Máquina vs. Inteligencia Artificial
71
Aprendizaje Profundo vs. Aprendizaje de
Máquina vs. Inteligencia Artificial
72
Limitaciones
Limitaciones
"La combinación de algunos datos y un deseo doloroso de una
respuesta no asegura que se pueda extraer una respuesta
razonable de un cuerpo de datos dado". - John Tukey(FFT)
74
Bibliotecas
Principales bibliotecas científicas de Python
https://speakerdeck.com/jakevdp/the-state-of-the-stack-scipy-2015-keynote?slide=8 76
Principales bibliotecas científicas de Python
https://speakerdeck.com/jakevdp/the-state-of-the-stack-scipy-2015-keynote?slide=8 77
Conferencias
Principales Conferencias
1. International Conference on Machine Learning (ICML)
2. International Joint Conference on Artificial Intelligence and Pacific Rim International Conference on Artificial Intelligence (IJCAI-PRICAI)
3. The Conference for Machine Learning Innovation (ML Conference)
4. Conference on Neural Information Processing Systems (NeurIPS)
5. O’Reilly Strata Data & AI Conference
6. International Conference on Machine Learning and Data Mining (MLDM)
7. DATAx - evento que reúne a líderes empresariales, estrategas y profesionales
8. Ai4 - ponentes de las compañías más innovadoras del mundo
9. AI Summit NSW 2020 - evento dedicado a directores de información, jefes de AI / ML, jefes de innovación y jefes de ciencia de datos.
10. International Conference on Learning Representations (ICLR)
11. International Conference on Machine Learning, Optimization, and Data Science (LOD)
12. Applied Machine Learning Conference - Fundación Tom Tom
13. Intelligent Systems Conference (IntelliSys)
14. Annual Conference on Learning Theory (COLT)
15. European Conference on Artificial Intelligence (ECAI)
16. The Data Science Conference - esta es la única conferencia de ciencia de datos libre de patrocinadores, vendedores y reclutadores
17. KDD - investigadores y profesionales de la ciencia de datos, minería de datos, descubrimiento de conocimiento, análisis de datos a gran
escala y big data
18. European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML PKDD)
19. Open Data Science Conference
79
Perú
1. International Conference on Information Management and Big Data (SIMBig)
80
Bibliografía recomendada de la sesión
• Bishop CM. Pattern recognition and machine learning. springer; 2006.
• Müller AC, Guido S. Introduction to machine learning with Python: a guide for data scientists. " O'Reilly Media, Inc."; 2016 Sep 26.
• Witten IH, Frank E. Data mining: practical machine learning tools and techniques. Acm Sigmod Record. 2002 Mar 1;31(1):76-7.
• Mueller JP, Massaron L. Machine learning for dummies. John Wiley & Sons; 2016 May 31.
• Domingos P. A few useful things to know about machine learning. Communications of the ACM. 2012 Oct 1;55(10):78-87.
81