Alphastar

Cargado por

Jehan Carlos C T

0% encontró este documento útil (0 votos)

5 vistas3 páginas

Título original

Derechos de autor

Formatos disponibles

DOCX, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

5 vistas3 páginas

Alphastar

Cargado por

Jehan Carlos C T

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 3

Buscar dentro del documento

ALPHASTAR

a. Aplicaciones De RL
En la última década, las investigaciones en las que se ha usado alguna forma de RL han
sufrido un gran aumento, especialmente en el campo de los videojuegos.
Uno de los grandes culpables de esto es el lanzamiento de Arcade Learning Environment
(ALE) en 2013 que se define como una plataforma y metodología para evaluar el desarrollo
de IA general. ALE es un entorno de trabajo diseñado para facilitar el desarrollo de agentes
que jueguen juegos de la Atari 2600, una videoconsola desarrollada en 1977. Uno de los
trabajos que más ha destacado en este campo y ha servido como base para el desarrollo de
soluciones RL es ”Playing Atari with Deep Reinforcement Learning”. En este artículo se
introduce un nuevo modelo de aprendizaje que solo tiene como entrada píxeles del juego.
b. Atari with Deep Reinforcement Learning :
DeepMind es una compañía de inteligencia artificial y creó un programa de inteligencia
artificial utilizando aprendizaje de refuerzo profundo que juega juegos.

Pero AlphaGo había sido entrenado jugando contra jugadores humanos. Esta versión fue
capaz de superar el nivel de Atari with Deep Reinforcement Learning el avance más
importante y con mayor repercusión fue la creación de AlphaGo [31], el primer programa
capaz de derrotar a un jugador profesional y a un campeón mundial de Go, convirtiéndose
en el mejor jugador de la historia en 2016. Un año después, se desarrolló su sucesor,
AlphaGo Zero que utiliza DRL junto a la búsqueda en arbol de Monte-Carlo para.
elegir el mejor movimiento. Fue entrenado compitiendo solamente contra el mismo,
mientras que AlphaGo había sido entrenado jugando contra jugadores humanos. Esta
versión fue capaz de superar el nivel de AlphaGo en tan solo 3 días de entrenamiento.
Además, usando la misma IA en otros juegos de mesa como ajedrez o shogi consiguió
vencer a los mejores programas de cada juego. Además, usando la misma IA en otros
juegos de mesa como ajedrez o shogi consiguió vencer a los mejores programas de cada
juego.

Imágenes de Breakout juegos usados en el articulo Alpha go y o se mejora a sí mismo a un nivel

sobrehumano.

c. Solución de Problemas De RL:

Como sus creadores ya habían demostrado grandes avances en juegos de mesa, buscaron un
reto mayor con videojuegos modernos más complejos. Por este motivo nació AlphaStar
centrado en aprender a jugar al juego Starcraft II Figura, un juego de estrategia en tiempo
real, es decir, sin turnos como en Go o ajedrez. Además cuenta con un número de acciones
mucho mayor que cualquiera de los juegos de mesa mencionados anteriormente ya que en
él se pueden construir distintos edificios, obtener recursos y dirigir a un ejercito formado
por distintos grupos. Es considerado una de los juegos de estrategia más completos y
complejos. AlphaStar fue capaz de vencer a varios jugadores profesionales, aunque también
perdió alguna batalla, por lo que aún podría mejorar.
1. Tipos de redes usadas:
Resnet: Es un tipo de red neuronal convolucional, pero añade conexiones
(Skip Connections). Estas permiten saltar capas dentro de la arquitectura, esto permite
apilar un mayor número de capas.
Feed forward: Es la arquitectura de red neuronal básica. La principal propiedad de esta
red es que la señal viaja estrictamente unidireccionalmente de entrada a salida.
Trasformeer: Esta red intenta implementar el (aprendizaje relacional) esto busca las
entidades de importancia para poder ganar, y las relaciones entre estas.
Depp LSTM: (memoria a largo-corto plazo): esta red permite codificar y memorizar
(incluso a largo plazo) la información que es relevante a lo largo del tiempo de la
partida

Bibliografía

DeepMind. (2019). Grandmaster level in StarCraft II using multi-agent reinforcement

learning. NATURE, 7,10,11,12,15.

También podría gustarte

Autoevaluación Sesión Coaching
Documento5 páginas
Autoevaluación Sesión Coaching
Omar Martinez P
82% (11)
Análisis Del Desarrollo Social en Guatemala 2.1
Documento11 páginas
Análisis Del Desarrollo Social en Guatemala 2.1
claudialopezc1568
Aún no hay calificaciones
Plan Taller de Cocina
Documento6 páginas
Plan Taller de Cocina
Cesia Gonzalez Cea
50% (2)
Un CRM, Al Contrario Que El ERP
Documento1 página
Un CRM, Al Contrario Que El ERP
Jehan Carlos C T
Aún no hay calificaciones
Por Otro Lado, Los Sitemas ERP Están Destinados A Empresas
Documento1 página
Por Otro Lado, Los Sitemas ERP Están Destinados A Empresas
Jehan Carlos C T
Aún no hay calificaciones
La Organización, Pero Hoy en Día, L
Documento1 página
La Organización, Pero Hoy en Día, L
Jehan Carlos C T
Aún no hay calificaciones
Pero A Su Vez, Un CRM y Un ERP Tienen Muchas Cosas
Documento1 página
Pero A Su Vez, Un CRM y Un ERP Tienen Muchas Cosas
Jehan Carlos C T
Aún no hay calificaciones
Presentado Por: Jehan Carlos Coila Ticona Isaac. Isaac Jesus Guevara Macavilca
Documento2 páginas
Presentado Por: Jehan Carlos Coila Ticona Isaac. Isaac Jesus Guevara Macavilca
Jehan Carlos C T
Aún no hay calificaciones
Casos Prácticos
Documento5 páginas
Casos Prácticos
Jehan Carlos C T
Aún no hay calificaciones
Redes N
Documento5 páginas
Redes N
Jehan Carlos C T
Aún no hay calificaciones
Jehan
Documento3 páginas
Jehan
Jehan Carlos C T
Aún no hay calificaciones
Seguridad Ciudadana Serenazgo
Documento5 páginas
Seguridad Ciudadana Serenazgo
Jehan Carlos C T
Aún no hay calificaciones
ALPHASTAR (Aplicación)
Documento4 páginas
ALPHASTAR (Aplicación)
Jehan Carlos C T
Aún no hay calificaciones
Técnicas de Auditoría Asistidas Por Computador
Documento1 página
Técnicas de Auditoría Asistidas Por Computador
Jehan Carlos C T
Aún no hay calificaciones
Cuadrosss Redes Neuronales
Documento5 páginas
Cuadrosss Redes Neuronales
Jehan Carlos C T
Aún no hay calificaciones
Fiesta de Locos
Documento1 página
Fiesta de Locos
Jehan Carlos C T
Aún no hay calificaciones
Técnicas de Auditoría Asistidas Por Computador
Documento1 página
Técnicas de Auditoría Asistidas Por Computador
Jehan Carlos C T
Aún no hay calificaciones
Sniffer
Documento11 páginas
Sniffer
Jehan Carlos C T
Aún no hay calificaciones
Historia de Las Computadoras Personales
Documento7 páginas
Historia de Las Computadoras Personales
Jehan Carlos C T
Aún no hay calificaciones
Psio
Documento6 páginas
Psio
Tatiana Castro
Aún no hay calificaciones
Informe Semestral Guillermo
Documento7 páginas
Informe Semestral Guillermo
Bazar Ilie
Aún no hay calificaciones
Empoderamiento y Participación Juvenil.
Documento12 páginas
Empoderamiento y Participación Juvenil.
Cano Nana
Aún no hay calificaciones
L1.Módulo 1
Documento8 páginas
L1.Módulo 1
MARÍA ELENA CISTERNAS MELGAREJO
Aún no hay calificaciones
Reglamento Interno 2022
Documento122 páginas
Reglamento Interno 2022
Paola Rossana Cepiran Arriola
Aún no hay calificaciones
Dinosaurios Aramado de Texto Enciclopedi
Documento11 páginas
Dinosaurios Aramado de Texto Enciclopedi
Rosana Osorio
100% (1)
Condiciones para La Produccion Simbolica
Documento6 páginas
Condiciones para La Produccion Simbolica
Elias Castillo Castellanos
Aún no hay calificaciones
Monografia Pamela Herbas
Documento20 páginas
Monografia Pamela Herbas
Ronald Huanca Calle
Aún no hay calificaciones
Tesis - Elaboracion de Material Didactico Con Productos Reciclables.
Documento101 páginas
Tesis - Elaboracion de Material Didactico Con Productos Reciclables.
MiLenca MayTa
100% (1)
2020 Tesis Deisy Liliana Peña Rodriguez
Documento211 páginas
2020 Tesis Deisy Liliana Peña Rodriguez
Ale Trigueros
Aún no hay calificaciones
1 Tesis Ing. Informatica Autores García y Mena 2014
Documento172 páginas
1 Tesis Ing. Informatica Autores García y Mena 2014
manuel
Aún no hay calificaciones
Planeación Didáctica PDF
Documento78 páginas
Planeación Didáctica PDF
Luis Galvez
100% (1)
El Asiento de Toda Pasión
Documento6 páginas
El Asiento de Toda Pasión
Fritz Diaz
Aún no hay calificaciones
Bases La P. Agustina
Documento18 páginas
Bases La P. Agustina
Lenka Beth Correa
Aún no hay calificaciones
Infografía Inteligencia Artificial
Documento4 páginas
Infografía Inteligencia Artificial
andres
Aún no hay calificaciones
La Formación Profesional Integral en El SENA Se Desarrolla Mediante Una Propuesta Pedagógica Fundamentada en El Desarrollo Humano Del Aprendiz
Documento5 páginas
La Formación Profesional Integral en El SENA Se Desarrolla Mediante Una Propuesta Pedagógica Fundamentada en El Desarrollo Humano Del Aprendiz
Jennifer Gomez
Aún no hay calificaciones
2SEESION
Documento28 páginas
2SEESION
Maribel Duran
Aún no hay calificaciones
El Yoga en La Escuela
Documento25 páginas
El Yoga en La Escuela
Laura Messina
Aún no hay calificaciones
Aprendo en Casa
Documento18 páginas
Aprendo en Casa
Ajfy Para Ti
Aún no hay calificaciones
3 U2 Clase 2 Antropología
Documento7 páginas
3 U2 Clase 2 Antropología
Anastasia
Aún no hay calificaciones
Matriz Del Marco Del Buen Desempeño Docente
Documento3 páginas
Matriz Del Marco Del Buen Desempeño Docente
c_enrique33742
Aún no hay calificaciones
Cuestionario de Autocomprobación de Conocimientos de La Unidad 2 - Revisión Del Intento
Documento4 páginas
Cuestionario de Autocomprobación de Conocimientos de La Unidad 2 - Revisión Del Intento
Ana Hormigo Luque
Aún no hay calificaciones
El Papel Del Neuropsicóilogo y Sus Áreas de Aplicación
Documento3 páginas
El Papel Del Neuropsicóilogo y Sus Áreas de Aplicación
Aiko Sanchez
Aún no hay calificaciones
Funciones de La Familia
Documento10 páginas
Funciones de La Familia
LIZBET JACKELINE OLIVA OTERO
Aún no hay calificaciones
Mikulic. La Educación Emocional y Social en Argentina
Documento3 páginas
Mikulic. La Educación Emocional y Social en Argentina
carolinasgarofalo
Aún no hay calificaciones
Cuaderno Inicial
Documento9 páginas
Cuaderno Inicial
Silvina Perez
Aún no hay calificaciones
Proyecto Educativo Institucional Ueaf 2018-2021
Documento157 páginas
Proyecto Educativo Institucional Ueaf 2018-2021
Andrea Cicenia
Aún no hay calificaciones