Documentos de Académico
Documentos de Profesional
Documentos de Cultura
24/08/21
Universidad de los Andes
MINE: Análisis con deep learning
Departamento de Ingeniería de Sistemas y Computación
2021-20 Maestría en Ingeniería de Sistemas y Computación
Proceso de aprendizaje a partir de datos.
¿Modelo de negocio?
¿Cuál es el problema?
¿Situación actual? ¿Cómo ¿Cuál algoritmo de aprendizaje utilizar?
el negocio resuelve el ¿Cómo funciona? ¿Qué requerimientos
problema? ¿Tarea de tiene? ¿Cómo ajustar sus parámetros? Y si
aprendizaje? ¿Cómo se aplican varios algoritmos ¿Cuál modelo
evaluar los resultados? seleccionar?
¿Rendimientos de ¿Cómo evaluar los modelos?
referencia? ¿Requisitos de ¿Qué métricas utilizar según la tarea y el
los datos? contexto de aprendizaje?
▪ Eliminación de
Antes de la preparación, separar
el conjunto de test
identificadores.
▪ Transformación de
variables categóricas a
numéricas.
▪ Normalización de
atributos numéricos.
Modelado
1. Especificar primero la arquitectura:
Engine Size(L)
Cylinders CO2
Algoritmos para la
construcción del
conjunto de datos
Clases:
1: Cuerpos de agua
2: Vegetación baja
3: Vegetación alta
4: Suelos desnudos
5: Área urbana
Generación del conjunto de datos 6: Nubes
7: Sombra de nubes
Modelado
1. Especificar primero la arquitectura:
𝑒 𝑜𝑖
𝑠𝑜𝑓𝑡𝑚𝑎𝑥 𝑜𝑖 = 𝑁𝑐 𝑜 𝑑𝑜𝑛𝑑𝑒 𝑁𝑐 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
σ𝑖=1 𝑒 𝑖
𝐸𝑒𝑛𝑡 ≈ 𝐸𝑡𝑒𝑠𝑡
▪ En general, los algoritmos de aprendizaje tienen parámetros que se pueden ajustar para controlar la complejidad de los modelos
que generan. Estos parámetros se conocen como hiperparámetros.
▪ No confundir con los parámetros del modelo.
▪ Un aspecto esencial será entonces determinar los valores de los hiperparámetros que controlan la complejidad para obtener un
modelo que generalice bien para nuevos datos.
▪ Para hacerlo se utilizan técnicas de validación. Estás técnicas nos permitirán determinar la complejidad adecuada para nuestro
conjunto de datos.
¿Cómo ajustar hiperparámetros?
Alta
𝑬𝒗𝒂𝒍 varianza
Diferencia entre
𝐸𝑒𝑛𝑡 𝑦 𝐸𝑣𝑎𝑙
𝑬𝒆𝒏𝒕
¿Y qué hacer?
En el contexto bias-varianza
Otros aspectos relacionadas con el sobreajuste
▪ Aumentar gradualmente la cantidad de capas
ocultas y de neuronas, hasta que se comience a
ajustar el conjunto de entrenamiento (early
stopping).
▪ Comenzar con una red muy grande, pero utilizar
regularización.
▪ Para tareas muy complejas, como la clasificación de
imágenes o el reconocimiento de voz, se requiere
de redes con muchas capas, pero no
completamente conectadas.
Si: ¿Qué hacer? ▪ En muchos casos no habrá necesidad de
entrenarlas desde cero, ya que es posible reutilizar
Alto bias Red neuronal más grande partes de una red previamente entrenada para una
tarea similar (aprendizaje por transferencia).
Alta varianza Más datos
Regularización
Entrenamiento de redes neuronales.
¿Problemas?
En clasificación:
Tipo de problema de Función de activación capa de
No. de entradas No. de neuronas de salida
clasificación salida
Sigmoide
Binario Una
Tangente hirpebólica
Multiclase
Sigmoide
(Un dato solo puede Una por cada dimensión Una por clase
Softmax
pertenecer a una clase) (variable de entrada)
Multietiqueta
(Un dato puede pertenecer a Una por etiqueta Sigmoide
más de una clase)
En regresión:
Tipo de problema de Función de activación capa de
No. de neuronas de entrada No. de neuronas de salida
regresión salida
Caso general Identidad
Si se requiere que la salida sea
ReLU
siempre positiva Una por cada dimensión de
Una por cada dimensión de
Si se requiere que la salida entrada
salida
esté limitada (variable de entrada)
Sigmoide
(hay que escalar los datos al
Tangente hipérbólica
rango de la función de
activación)
Ejemplos de proyectos.
*Julián Montoya.
▪ Aprendizaje no supervisado en el perfilamiento de clientes para profit scoring - Caso de estudio de una Fintech
Latinoamericana*
Modelo SOM coloreado con K-medias
El negocio del microcrédito se ha popularizado especialmente
con el auge de las empresas Fintech. Sin embargo, la evaluación
de riesgo de este tipo de créditos sigue siendo un desafío dada
la singularidad de sus clientes objetivo. Desde esta perspectiva,
para las Fintech prestamistas, no solo es importante conocer la
probabilidad de default sino también la potencial rentabilidad
del préstamo, para así tomar la decisión de si se otorga o no el
microcrédito. Este proyecto se centra en el desarrollo de un
modelo de caracterización y perfilamiento de clientes con el fin
de realizar un profit scoring para el caso de estudio de una
Fintech latinoamericana.
Para esto, se usaron técnicas de aprendizaje de máquina no
supervisado, específicamente se presenta un método híbrido de
agrupamiento basado en mapas autoorganizados de Kohonen
(SOM) y algoritmos de K-medias. A partir de los grupos
resultantes se etiqueta a los clientes como no deseables o
deseables. Para estos últimos, se hace un perfilamiento que
define sus características más relevantes. De esta forma el
modelo desarrollado prueba ser una herramienta clave tanto
para la toma de decisión de aprobación o negación del crédito
como para la agrupación y caracterización de clientes deseables
en el negocio.
*María Juliana Moya.
▪ Aplicación de las técnicas de aprendizaje automático para la detección temprana de antracnosis en hojas de guanábana.
▪ Autocodificadores.