MACHINE
LEARNING
AVANZADO
Experta Disciplinar :
CLAUDIA MARCELA OSPINA MOSQUERA
Ingeniera Mecatrónica UNAL. , Licenciada en Física U.P.N. &
Magister en Educación UDES.
Agenda
Fundamentos de los modelos de aprendizaje supervisado
y no supervisado.
Ejemplos de cada modelo.
Tipos de algoritmos de clasificación y regresión,:
fortalezas , debilidades,
¿ Cómo elegir el adecuado para sus datos y
objetivos específicos?.
Orientaciones Generales
Caracteristicas los modelos de aprendizaje
en ML.
Machine Learning es uno de los términos de moda
en el sector de las tecnologías relacionadas con la
inteligencia artificial.
Se trata de la utilización de algoritmos que permiten
a las máquinas aprender imitando la forma en que
aprendemos los humanos. Dentro de Machine
Learning encontramos dos tipos destacados, el
Machine Learning supervisado y el Machine Learning
no supervisado. A continuación, resaltaremos las
diferencias entre estos dos grandes grupos, sus
características y para qué se utilizan.
Características del modelo de aprendizaje
Supervisado.
En esta modalidad de Machine Learning se podría entender como algoritmos que “aprenden”
de los datos introducidos por una persona. En este caso:
Se necesita la intervención humana para etiquetar, clasificar e introducir los datos en el
algoritmo.
El algoritmo genera datos de salida esperados, ya que en la entrada han sido etiquetados
y clasificados por alguien.
Existen dos tipos de datos que pueden ser introducidos en el algoritmo:
Clasificación: clasifican un objeto dentro de diversas clases. Por ejemplo, para
determinar si un paciente está enfermo o si un correo electrónico es spam.
Regresión: predicen un valor numérico. Sería el caso de los precios de una casa al
escoger diferentes opciones o la demanda de ocupación de un hotel.
Características del modelo de aprendizaje
Supervisado.
Algunas aplicaciones prácticas de este tipo de Machine Learning:
La predicción de coste de un siniestro en el caso de las compañías de seguros.
La detección de fraude bancario por parte de entidades financieras.
La previsión de avería en la maquinaria de una compañía.
Características del modelo de
aprendizaje Supervisado.
Características del modelo de aprendizaje
No Supervisado.
A diferencia del caso anterior, no existe la intervención humana en este tipo de Machine
Learning. Aquí los algoritmos aprenden de datos con elementos no etiquetados buscando
patrones o relaciones entre ellos. En este caso:
Se introducen datos de entrada sin etiquetar.
No necesita la intervención humana.
Existen dos tipos de algoritmos para Machine Learning no supervisado:
Clustering: clasifica en grupos los datos de salida. Es el caso de las segmentaciones de
clientes según qué hayan comprado.
Asociación: descubre reglas dentro del conjunto de datos. Por ejemplo, aquellos clientes
que compran un coche también contratan un seguro, por lo que el algoritmo detecta esta
regla.
Características del modelo de aprendizaje
No Supervisado.
Existen otros casos prácticos en los que se utiliza este tipo
de Machine Learning:
La segmentación del tipo de clientes en un banco.
La clasificación del tipo de pacientes en un hospital.
El sistema de recomendaciones de contenido según el
consumo del usuario en plataformas de streaming de
vídeo.
Características del modelo de
aprendizaje No Supervisado.
Características del modelo de
aprendizaje Por Refuerzo.
Es una rama del machine learning en la cual la
máquina guía su propio aprendizaje a través de
recompensas y castigos. Es decir, consiste en un
sistema de instrucción autónomo cuyo camino es
indicado según sus aciertos y errores.
Consta de un aprendizaje empírico, por lo que el agente
informático está en constante búsqueda de aquellas
decisiones que le premien de algún modo, a la par que
evita aquellos caminos que, por experiencia propia, son
penalizados.
También, se puede decir que el aprendizaje reforzado es un
concepto similar al que utilizan los seres vivos. Esto es, las
máquinas aprenden qué decisiones tomar de acuerdo a la
situación en la que se encuentren. Además, son capaces de
desarrollar estrategias con una visión a largo plazo.
Características del modelo de
aprendizaje Por Refuerzo.
Características del modelo de
aprendizaje Por Refuerzo.
Características del modelo de
aprendizaje Por Refuerzo.
Características del modelo de
aprendizaje Por Refuerzo.
Aprendizaje automático -Métricas de regresión en Machine
Learning utilidad de métrica de error según el objetivo.
Las metricas de regresión en aprendizaje
automatico y cada modelo de Machine
Learning que la utiliza intenta resolver un
problema con un objetivo diferente utilizando
un conjunto de datos diferente y, por lo tanto,
es importante comprender el contexto antes de
elegir una métrica.
Generalmente, las respuestas a la siguiente
pregunta nos ayudan a elegir la métrica
apropiada:
Tipo de tarea: ¿Regresión? ¿Clasificación?
Objetivo de negocio?
¿Cuál es la distribución de la variable
objetivo?
Tipos de Algoritmos en ML
Figura: Tipos de Machine Learning , clasificación de sus algoritmos según su uso y aplicaciones típicas
Tipos de Algoritmos en ML y Selección
Para empezar a conocer qué tipo de algoritmo utilizar, se necesita saber el número de dimensiones con las que se esta
trabajando, esto significa que se debe conocer el número de entradas en el problema (estas entradas también se conocen
como variables o características). Si se esta trabajando con un segmento de datos grande o con muchas variables, se puede
optar por algoritmos de reducción de dimensiones por ejemplo.
Las técnicas para minimizar el número de variables de entrada en los datos de entrenamiento son conocidas como “Algoritmos
de Reducción de Dimensiones”.
La Extracción de Variables y Selección de Variables para seguir avanzando es el proceso de traducir los datos iniciales en
variables numéricas que pueden ser procesadas mientras se mantiene la información en el conjunto de datos original esto es
conocido como extracción de variables.
Esto produce mejores salidas que aplicar directamente machine learning a los datos crudos. Tres algoritmos conocidos para la
reducción de dimensionalidad, incluyendo el Análisis de Componente Principal, la Descomposición en Valores Singulares y el
Análisis de Discriminante Lineal.
Si no se busca combinar las variables de lo datos y en su lugar eliminar variables innecesarias para mantener las importantes,
entonces se recomienda usar el algoritmo de Análisis de Componente Principal.
https://github.com/latinxinai/AI-Educational-Resources/raw/master/CheatSheets/Machine%20Learning%20Cheat%20Sheet.pdf
Tipos de Algoritmos en ML y Selección
Tipos de Algoritmos en ML y Selección
PCA (Análisis de Componente Principal)
Es un algoritmo matemático para reducir la dimensión
de un conjunto de datos, con el fin de simplificar el
número de variables mientras se retiene la mayor parte
de información. Este intercambio de exactitud por
simplicidad es muy usado para encontrar patrones en
grandes segmentos de datos.
En términos de conexiones lineales, tiene un gran
número de aplicaciones cuando una gran cantidad de
datos está presente, como la edición de multimedia,
control de calidad estadístico, análisis de portafolios y
más aplicaciones como el reconocimiento facial y la
compresión de imágenes.
Tipos de Algoritmos en ML y Selección
PCA (Análisis de Componente Principal)
Alternativamente, si se busca un algoritmo que funcione a través de la combinación de variables,
este algoritmo no sería la mejor opción a usar. se tiene que tomar en cuenta que si desea un
modelo probabilístico o uno no probabilístico.
Los datos probabilísticos involucran selecciones aleatorias y es preferido por muchos
científicos ya que da resultados más precisos.
Mientras que los no probabilísticos no involucran esa aleatoriedad.
Si trabaja con este último tipo de datos, se debe usar el algoritmo de Descomposición en Valores
Singulares.
Tipos de Algoritmos en ML y Selección
SVD (Descomposición en Valores Singulares)
En el mundo del machine learning, este algoritmo permite que los datos sean transformados en un
espacio donde las categorías pueden ser fácilmente distinguidas. Se encarga de descomponer una
matriz en tres diferentes. En el procesamiento de imágenes, por ejemplo, un número reducido de
vectores son usados para rearmar una foto para que sea parecida a la original.
Tipos de Algoritmos en ML y Selección
SVD (Descomposición en Valores Singulares)
Comparado con el algoritmo de PCA, ambos pueden reducir la dimensión de los datos. Pero
mientras que el PCA obvia los componentes menos significativos, el algoritmo SVD los convierte en
un tipo de datos especiales, representado en tres diferentes matrices, de esa manera es más fácil
de manipular y analizar estos datos.
Si preferimos un enfoque probabilístico, es más recomendable el algoritmo de Análisis de
Discriminante Lineal para problemas más abstractos.
Tipos de Algoritmos en ML y Selección
LDA (Análisis de Discriminante Lineal)
Es un algoritmo de clasificación en el cual dos o más grupos han sido anteriormente identificados y las
nuevas observaciones son categorizadas en uno de los grupos basándose en sus características o
variables.
Se diferencia del PCA ya que descubre un subespacio de variables que optimiza la separabilidad de los
grupos. Mientras que PCA ignora las etiquetas de las clases y se enfoca en capturar la más grande
variación de dirección del conjunto de datos.
El análisis de discriminante lineal utiliza el Teorema de Bayes, una proposición probabilística usada
para determinar la probabilidad de una ocurrencia basada en su relación con otro evento.
Es frecuentemente usado en reconocimiento facial, en identificación de clientes y en los campos
médicos para identificar el estado de la enfermedad del paciente.
Tipos de Algoritmos en ML y Selección
El siguiente paso es seleccionar si se quiere que el algoritmo tenga o no respuestas, es decir, si desea
desarrollar un modelo predictivo basado en datos etiquetados con el fin de enseñar a la máquina.
Se puedes usar las técnicas de agrupamiento si se prefiere ir por una vía con datos sin etiquetas, de
esa forma la máquina puede trabajar sin alguna guía y buscar por ella misma las similitudes.
Tipos de Algoritmos en ML y Selección
Por otro lado, el proceso de seleccionar un subconjunto de variables relevantes para usarlos en la creación de modelos es
conocido como selección de variables.
Esto ayuda en la simplicidad del problema para hacerlo más sencillo de comprender tanto para investigadores como para
usuarios. De la misma manera, ayuda a la reducción de tiempos de entrenamiento y evita la maldición de la dimensionalidad.
La selección de variables incluye a los algoritmos de Agrupamiento, Regresión y Clasificación.
PCA (Análisis de Máquina de Vector
Componente Soporte con
01 04
Principal) función Kernel
SVD ML Algoritmos
Regresión Logística
(Descomposición en 04
01
Valores Singulares) Máquina de Vector
01- NO Soporte Lineal 04
LDA (Análisis de 04-
SUPERVISADO Naïve Bayes
Discriminante SUPERVISADO:
01 04
Lineal) 02 CLASIFICACIÓN
Agrupamiento
Regresión Lineal
02 Jerárquico ML 03
K-Modes categoricas Red Neuronal
02 02- NO 03
SUPERVISADO: 03- Árbol de Impulso de
K-Means AGRUPAMIENTO SUPERVISADO
02 03 Gradiente
GMM (Modelo de DBSCAN
(Agrupamiento Bosque Aleatorio
02 Mezcla Gaussiana) 04 03
Espacial Basado en
02 Densidad de Regresión
03 Árbol de Decisión
Aplicaciones con 03
Ruido)
Machine
Learning
Avanzado
¡Gracias!
No dude en contactar al Docente si tiene alguna
pregunta.