Está en la página 1de 21

Machine Learning Para Principiantes

Primer encuentro: definiciones e ideas básicas


28 de Febrero 2023

Lic. Lucas J. Zenocratti

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
DEFINICIÓN DE APRENDIZAJE AUTOMÁTICO
El Aprendizaje Automático (Machine Learning) es
una rama de la Inteligencia Artificial que estudia
mecanismos que permiten a las computadoras
“aprender” a clasificar o predecir en base a datos.

Dos definiciones “fundamentales”


de aprendizaje automático:

Arthur Samuel (1959): campo de estudio que otorga
a la computadoras la habilidad de aprender sin que
sea necesario programarlas explícitamente (Ejemplo:
juego de ajedrez).

Tom Mitchell (1998): un programa de computadora
aprende de una experiencia E con respecto a la tarea
T y alguna medida de su desempeño P, si su
desempeño en T, medido por P, mejora con la
experiencia E.
Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
MACHINE LEARNING (ML) Y DEEP LEARNING (DL)

En pocas palabras, el Machine Learning es una aplicación


de la inteligencia artificial en la que programas informáticos
utilizan algoritmos para encontrar patrones en los datos, sin
estar programados específicamente para ello.

Dentro del ML, se encuentran los algoritmos de aprendizaje


profundo (Deep Learning). Éstos son algoritmos automáticos
que utilizan grandes conjuntos de redes neuronales para
aprender a partir de extensos volúmenes de datos, sin que
haya un “agente externo” para identificar patrones.

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
MACHINE LEARNING (ML) Y DEEP LEARNING (DL)
Principal diferencia entre ML y DL:
En ML, un agente externo (digamos, nosotros) debe extraer
características de los datos de entrada. En DL, los algoritmos
empleados incluyen la extracción de características.

Otras diferencias:

En ML es más común usar árboles de decisiones, mientras que
en DL se utilizan redes neuronales multi-capas.

En ML, se seleccionan manualmente las características y un
clasificador para catalogarlas. En DL, los pasos de extracción
de características y modelización son automáticos.

En ML hay que “guiar” a la máquina en cada fase del proceso
para que aprenda, a través de la práctica, a identificar lo que
queremos de manera automática. En DL la máquina aprende
por sí sola con cada nuevo input de información que recibe, y
además aprende de los errores para aproximarse cada vez más
rápido y mejor al resultado correcto.
Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
REDES NEURONALES: IDEA GENERAL
Las redes neuronales artificiales son la “estructura fundamental” de todos los algoritmos de DL. Son sistemas
compuestos de muchos elementos simples de proceso (neuronas) operando en paralelo, cuya función está
determinada por la estructura de la red, los pesos de las conexiones, y el procesado realizado en los
elementos o nodos de cálculo. El nombre “red neuronal” está muy bien justificado y basado en la biología,
puntualmente en el funcionamiento de un sistema nervioso biológico:
Diferencias entre una red neuronal natural
(RNB) y una red neuronal artificial (RNA):

El cerebro biológico no tiene “capas”, y sus
neuronas no trabajan sincrónicamente como
las de una RNA.

Algoritmo de aprendizaje: las RNA utilizan
descenso por gradiente. No tenemos idea
cómo lo hacen las RNB.

Los cerebros biológicos tienen trillones de
conexiones sinápticas, mientras que las RNA
más poderosas del mundo no tienen más que
unos pocos millones.
Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
REDES NEURONALES: IDEA GENERAL

A pesar de las similitudes, hay una diferencia muy importante


entre las RNA y las RNB (más allá de su “construcción”, por
supuesto).

El cerebro humano, por ejemplo, es capaz de aprender a


partir de pocos ejemplos y pocas repeticiones.

En cambio, las RNA necesitan una gran cantidad de


ejemplos para que el aprendizaje sea aceptable. Es por eso
que entrenar una RNA requiere muchas veces manejar
grandes conjuntos de datos de forma ordenada y
sistemática.

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
REDES NEURONALES: IDEA GENERAL


Una red neuronal está compuesta de capas (es decir,
‘pilas’ de neuronas). En una red de DL, hay una capa de
neuronas de entrada (datos), una capa de neuronas de
salida, y varias capas intermedias llamadas capas
ocultas.

Cada capa codifica un representación simplificada de los
datos de entrada.

Un algoritmo de DL aprende más y más acerca de los
datos de entrada a medida que los datos pasan a través
de sucesivas capas de la red. En general este
procedimiento es “hacia adelante” (redes feedforward),
pero también hay otras posibilidades (autoencoders y
redes neuronales convolucionales).

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
TIPOS DE APRENDIZAJE

SUPERVISADO
NO SUPERVISADO Consiste en la modificación de
los pesos al comparar la
No se requieren patrones predicción del algoritmo junto
de salida deseados. a los valores de salida
deseados.

REFORZADO
Determinar qué acciones debe escoger un agente de
software en un entorno dado con el fin de maximizar alguna
noción de "recompensa" o premio acumulado.

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
APRENDIZAJE SUPERVISADO: REGRESIÓN


Dado un conjunto de datos (X,Y),
donde X son las inputs e Y son las
etiquetas. Aprender un mapeo de la
forma
X --> Y.

Predecir así Y a partir del X
correspondiente a nuevos items.

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
APRENDIZAJE SUPERVISADO: CLASIFICACIÓN


Dado un conjunto de datos (X,Y),
encontrar la separación óptima
entre clases, de manera que se
pueda predecir a qué clase
pertenece un nuevo item.

La clasificación puede ser binaria o
multi-clase.

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
APRENDIZAJE SUPERVISADO: CLASIFICACIÓN


Si los datos están de alguna manera “ordenados”
de alguna manera, la clasificación es más eficiente.

Algoritmos útiles: 
Regresión logística

Support Vector Machines

Árboles de decisiones

Random forests

Redes neuronales

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
APRENDIZAJE NO SUPERVISADO


Dado un conunto de datos (X) sin
etiquetas, el objetivo es encontrar alguna
“estructura” en los datos.

Ejemplos: 
Análisis de redes sociales

Segmentación de mercado

Análisis astronómicos


Algoritmos útiles:  K-means

Clustering

Reducción de dimensiones

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
HERRAMIENTAS USUALES EN ML

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
HERRAMIENTAS USUALES EN ML

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
HERRAMIENTAS USUALES EN ML

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
HERRAMIENTAS USUALES EN ML

En el presente Taller, nos centraremos en Deep Learning.

Puntualmente, estudiaremos más o menos en detalle redes


neuronales con aprendizaje supervisado. Veremos
también algunas de las aplicaciones más útiles del DL en
Astronomía.

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
REDES NEURONALES: CÓMO, POR QUÉ Y PARA QUÉ
Actualización de los pesos al comparar
RED NEURONAL SUPERVISADA la predicción de la red con los valores
de salida deseados.

Cómo??

ESQUEMA DE TRABAJO
(MUY SIMPLIFICADO)
1) Actualizar cada vez que se presenta un nuevo dato.

2) Actualizar una vez que se presentan TODOS los datos.

3) Presentar varias veces el conjunto de ejemplos (ciclos


o épocas).

Paso final

Etapa de Validación

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
REDES NEURONALES: CÓMO, POR QUÉ Y PARA QUÉ
Capacidad de etiquetar correctamente
los datos de entrenamiento (precisión).
QUÉ BUSCAMOS AL ENTRENAR
UNA RED NEURONAL Capacidad de etiquetar correctamente
un sub-conjunto de datos que no se
usaron para entrenar.

Capacidad para generalizar el


aprendizaje a datos nuevos
USOS MÁS COMUNES DE
REDES NEURONALES

Reconocimiento de Reconocimiento de Clustering Control y automatización


patrones y clasificación datos anómalos a nivel industrial

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
DEEP LEARNING: RESUMEN

GRANDES PROGRESOS

Que es? Extracciones de patrones a partir de datos ●
Reconocimiento de rostros

Cómo? Redes neuronales + optimización

Clasificación de imágenes

Reconocimiento de voz

Con qué? Lenguaje de programación amigable

Generación de voz a partir de texto
(Python) + Librerías

Generación de texto a partir de voz

Traducción automática

Por qué ahora? Volúmens de datos + Hardware +

Diagnósticos médicos
Comunidad + Herramientas + Inversión

Conducción autónoma

Asistentes digitales (chatbots)

Principales limitaciones? Sesgo. Necidad de

Sistemas de recomendación y búsqueda
muchos datos (big data). Interpretabilidad.

Gaming

Robótica inteligente

Desarrollos actuales? Aprendizaje con menos

Pronósticos
datos, arquitecturas más eficientes, aumento de la

Generación automática de imágenes,
capacidad de cómputo (computación cuántica). textos, música, arte.

Aportes a la ciencia en general

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
DEEP LEARNING: QUÉ NECESITAMOS PARA IMPLEMENTARLO


Lenguaje de programación potente


Librerías de Machine Learning


Conjunto de datos


Manipulación de gráficos


Operaciones matemáticas eficientes


Entorno de programación amigable

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023
TO BE CONTINUED...

GRACIAS POR SU ATENCIÓN!!

Dudas? Preguntas? Comentarios?


CONTACTO:
CONTACTO ljzenocratti@gmail.com

Taller: Machine Learning para Principiantes – Galaxies Models Group Febrero 2023

También podría gustarte