Está en la página 1de 11

Aprendizaje

Reforzado
Aprendizaje Supervisado
• Aprendizaje Supervisado es aprender a desempeñar
una tarea, a partir de una distribución de datos
previamente etiquetada por un experto o supervisor.
• Extrapolar o generalizar la respuestas del sistema o
agente, para que este actúe correctamente en
situaciones no presentes en el training set.

Aprendizaje Reforzado
Aprendizaje no Supervisado
• Aprender o encontrar alguna representación oculta
en una distribución de datos sin etiquetar.
• El aprendizaje reforzado no es una forma de
aprendizaje no supervisado.
• El aprendizaje no supervisado no aborda el problema
de maximizar una señal de recompensa.
Aprendizaje Reforzado
Aprendizaje Reforzado
• Problemas relacionados con
un agente interactuando
Agente
con un entorno.
• Descubrir que acciones st rt at
Next state st+1
tomar, dado el estado en el
que se encuentra.
Entorno
• Maximizar una señal
numérica de recompensa.
Aprendizaje Reforzado
Aprendizaje Reforzado
• Aprendizaje por parte de un agente, directamente
de la interacción con su entorno.
• Enfoque computacional para comprender y
automatizar el aprendizaje de un objetivo en
particular (toma de decisiones).

Aprendizaje Reforzado
Elementos del Aprendizaje Reforzado
• Política de decisión π a|s
• Métricas asociadas - 𝑣π s , 𝑞π a, s
• Señal de recompensa rt
• Modelo del ambiente (opcional)

Aprendizaje Reforzado
Algunas Aplicaciones
Control
• Balancear el péndulo que se
encuentra sobre la plataforma móvil.
• Estados: Ángulo y velocidad angular
del péndulo, posición y velocidad
lineal de la plataforma móvil.
• Acción: Fuerza horizontal aplicada a
la plataforma móvil.
Aprendizaje Reforzado
Algunas Aplicaciones
Robótica
• Llegar a una posición específica
evadiendo obstáculos.
• Estados: Pose del robot y la
información obtenida por sus
sensores (LiDAR).
• Acción: Velocidad lineal y angular
del robot.
Aprendizaje Reforzado
Algunas Aplicaciones
Juegos de Atari
• Completar el juego con la
puntuación más alta.
• Estados: Todos los pixeles
mostrados en la pantalla.
• Acción: Arriba, Abajo, Izquierda
y Derecha.

Aprendizaje Reforzado

También podría gustarte