Documentos de Académico
Documentos de Profesional
Documentos de Cultura
https://learn.unity.com/course/ml-agents-hummingbirds
Objetivos
Ver el contenido de la unidad 7 de ML-Agents: Hummingbirds
Realizar los ejercicios marcados
Asignar Tareas/Productos
Motivación
Generar enemigos desafiantes es necesario para el desarrollo de videojuegos
Etapa Material
Traducción de ML-Agents: Hummingbirds
Resumen
El aprendizaje por reforzamiento (reinforcement learning) es una de las más fascinantes
Inteligencias Artificiales y el proyecto de Unity ML-Agents es uno de los más sencillos y divertidas
formas de comenzar. El instructor del curso Adam Kelly es un experimentado desarrollador en
Unity que ha creado diversos tutoriales y curso de ML-Agents para la empresa Immersive Limit
desde sus comienzos en 2018.
En este curso aprenderás como crear colibríes voladores inteligentes que pueden navegar hacia las
flores, sumergir sus picos y beber el néctar. Estos colibríes tienen 6 grados de libertad, es decir,
pueden volar (dirigirse x,y,z) y girar en cualquier dirección (x,y,z) para encontrar sus objetivos. Al
tener controles algo más complejos sus rutas de vuelo son difícilmente solucionadas con sistemas
de navegación tradicional. Aprenderás como crear un ambiente de entrenamiento, y entrenar
redes neuronales para desempeñar esta tarea, luego podrás competir contra los colibríes
entrenados en un simple juego.
No hay duda que el Aprendizaje por Reforzamiento es un tema complejo, pero los ML-Agents
separan las partes complicadas a los investigadores para que tu puedas centrarte en solucionar tu
problema. Para el final del curso, tendrás una buena comprensión en como poder crear agentes de
inteligencia artificial e integrarlos a tus propios juegos y simulaciones
Training (Entrenamiento)
Resumen
En este proyecto, configuraremos Anaconda para manejar Python y entrenar nuestros agentes.
Hablaremos de como configurar el entrenamiento, así de la forma en como monitorearlo. Una vez
que hallamos entrenado correctamente la red neuronal, la importaremos en nuestro proyecto.
o Escoger:
"C:\Users\mvela\Documents\HummingbirdsConfig\ml-agents-release_8\com.unity.ml-agents\package.json"
o Esperar a que se añada en Unity, deberá listar ahora el paquete ML Agents
correspondiente (en este caso 1.5.0)
A continuación, instalaremos ml agents en Anaconda
o pip3 install mlagents
Igualmente en Unity puede verse como el Colibrí se mueve solo por la escena
Esto nos permite ir al modo de escena y observar a los colibríes, y empezaremos poco a
poco a ver flores azules
En Project settings -> Time Scale podemos cambiar de 20 a 1, con lo cual lo pondremos a
velocidad normal para analizar mejor el comportamiento
o Una vez analizado es importante volver a ponerlo en 20
8. Tensorboard (Tensorboard) (10m) (Puede Omitirse)
En este tutorial aprenderemos de Tensorboard
Abrimos otro prompt de Anaconda
Activamos el Medio con: conda activate ml-agents-1.0
Vamos al directorio de ml-agents-1.0
o cd C:\Users\mvela\Documents\HummingbirdsConfig
tensorboard --logdir results --port 6006
saldrá un mensaje con un localhost
o lo colocamos en un navegador (chrome) como: localhost:6006
nos permite visualizar el comportamiento de los resultados
9. Importing .nn File & Inference (Importando el archivo .nn & Inferencia) (10m)
En este tutorial aprenderemos a realizar inferencia con un agente ya entrenado
Después de pasar las 5 000 000 de ciclos de entrenamiento, la recompensa promedio son
la mayor parte de las flores después de 2h 30 min de entrenamiento
11. Training Wrap-up & Challenge (Resumen del Entrenamiento & Reto) (30m)
En este tutorial te retaremos acerca de como resultaría el entrenar con diferentes parámetros
E
Autoevaluación
¿Cómo se añaden los códigos a la escena?
Productos
Etapa Verbal
INDIVIDUAL
o Verifique que pueda responder las preguntas de autoevaluación, en caso de faltar
alguna investigue su solución, de no encontrarla pregunte a su profesor o
compañeros.
Etapa mental
INDIVIDUAL Tarea: ML-Agents Parte 4
o Revise los videos de la plataforma de Unity
o Apóyese en la guía en español (clase escrita) de ser necesario para la realización
de los puntos aquí descritos
Realice la configuración necesaria y ponga una captura de pantalla con la
recompensa media superior a 30 unidades, o bien, las curvas de
TensorBoard