Robo Cup

Balompi Simulado: Un Nuevo Desafo para Agentes Artificiales Inteligentes
Sergio A. Rojas Ren Lozada Rafael Meneses Julin Olarte David Surez Andrea Vega
Grupo de Inters en Adaptacin, Computacin & MEnte (ACME-UD) Laboratorio de Automtica, Microelectrnica e Inteligencia Computacional (LAMIC) Facultad de Ingeniera Universidad Distrital Francisco Jos de Caldas, Bogot, Colombia srojas@udistrital.edu.co
La Competicin Mundial de Robots RoboCopa propone un escenario de experimentacin para agentes artificiales reales y simulados que deben participar en un juego similar al balompi real. Este es un problema interesante para los investigadores en Inteligencia computacional, ya que debe abarcar aspectos relacionados con el control, navegacin, planeacin, comunicacin, colaboracin y toma de decisiones, que adems deben ser resueltos en tiempo real con un entorno altamente dinmico. En este artculo se presenta una descripcin de esta iniciativa acadmica, y de los avances del proyecto que en este sentido, se adelanta en la Universidad Distrital. Palabras clave: Agentes inteligentes, competiciones de robots, RoboCopa.
Resumen
THE CHALLENGES OF SOCCER SIMULATION FOR ARTIFICIAL INTELLIGENT AGENTS
The Robot World Cup initiative (RoboCup) provides a testing arena for artificial real and simulated agents that have to play a game similar to soccer. For the Computational Intelligence approach, it is a very interesting problem because it must deal with control, navigation, planning, communication, cooperation and decision-making issues that must be solved in real time into a highly dynamically changing environment. This paper presents an overview of this initiative with a description of the project that is going onward at the Universidad Distrital. Keywords: Intelligent agents, robot tournaments, RoboCup.
Abstract
1. Introduccin
Los juegos siempre han representado un desafo para los estudiosos de la Inteligencia computacional (IA), pues en
ellos se considera imperativo el uso de estrategias inteligentes para alcanzar el xito. Desde mediados del siglo anterior se han propuesto estos problemas (ejemplo, jugar ajedrez, damas, cartas) como campos de experimentacin ideales para disear agentes artificiales que imiten el raciocinio de la mente humana, aplicando reglas de inferencia basadas en la valoracin de los diferentes estados del juego [1]. Esta metfora ha planteado una gran incgnita cuyo clmax ha sido la realizacin de torneos entre el actual campen mundial de ajedrez y una supercomputadora: ser posible que el computador pueda actuar de manera ms inteligente que el ser humano? Aunque la pregunta sigue abierta, lo que es claro hasta el momento es que la metfora del raciocinio mental no es la nica va para intentar implementar inteligencia en nuestras mquinas. Las nuevas corrientes de la IA, le apuestan a enfoques inspirados en la biologa y la etologa [2], argumentando que ms que pensamientos inteligentes existen comportamientos inteligentes y que el aprendizaje de tales comportamientos es vital para permitir a un agente (simulado, robot, o animal) ser exitoso en el entorno que lo rodea. Por otra parte, el comportamiento de un individuo, puede a su vez ser fundamental para el buen desempeo (eficiencia, efectividad y adaptacin) de su comunidad. Ejemplos abundan en la naturaleza como las hormigas que construyen su hormiguero y buscan comida para sobrevivir, o las bandadas de gaviotas que vuelan grandes distancias en formacin V sin perder su camino, o en el plano humano los deportes de equipo que requieren de tcticas bien planificadas para ganar las competiciones. Precisamente, entre estos ltimos se encuentra el ftbol asociado o balompi, deporte bastante popular que desde el punto de vista acadmico posee caractersticas muy llamativas para el estudio del comportamiento inteligente: colaboracin entre varios agentes, toma de decisiones en tiempo real, cambio dinmico del entorno, alta incertidumbre. Estas caractersticas plantean el desafo interesante de construir agentes artificiales que puedan jugar y competir en encuentros de balompi.
El reciente inters que ha surgido alrededor de este tema, se ha cristalizado en la Competicin Mundial de Robots RoboCopa (The Robot World Cup Initiative- RoboCup), que se organiza anualmente como un evento acadmico para presentar los avances alcanzados por equipos desarrollados por investigadores de todo el mundo. En este artculo se presenta una descripcin de esta iniciativa, as como los requisitos y retos para una posible participacin en ella. El artculo est organizado de la siguiente forma: en la seccin 2 se exponen aspectos generales de la RoboCopa, en la seccin 3 se describen algunos de los enfoques de diferentes equipos participantes en la penltima edicin del evento, en la seccin 4 se presentan consideraciones sobre el desarrollo de un jugador simulado y uno real, y finalmente se presentan las conclusiones.
Liga de Robots Sony-Aibo: robots cuadrpedos de la empresa Sony. Liga de Simulacin de Rescate: una nueva modalidad donde los agentes resuelven tareas de rescate en escenarios de desastre urbano simulados en el computador. Liga de Robots Humanoides: es la liga mayor, donde los robots deben ser bpedos y tener completa autonoma en su navegacin, equilibrio y estrategia de juego.
2. Descripcin de la RoboCopa
La RoboCopa surge de una iniciativa de diversos grupos de investigacin alrededor del mundo interesados en el estudio de la IA, particularmente, en el comportamiento inteligente que pueden exhibir agentes artificiales simulados en software o implementados en hardware (robots). Ms que una competicin, la RoboCopa se considera un esfuerzo multidisciplinar que busca un objetivo muy ambicioso: lograr que a mediados del siglo XXI (ao 2050), sea posible enfrentar al equipo campen mundial de ftbol asociado con un equipo de agentes humanoides completamente autnomos, que sean capaces de vencerlo. Mientras tanto, desde 1997 cada ao se organiza un evento acadmico en el que se presentan los ltimos adelantos, prototipos, estrategias, tcnicas y herramientas en forma de torneos, ponencias y cursillos. Se busca de esta forma fomentar la investigacin y el desarrollo de nuevas tecnologas inteligentes, no solamente enmarcadas dentro del juego del balompi, sino tambin con posibilidad de aplicacin a otros dominios como navegacin autnoma y tareas de rescate en desastres naturales. La versin documentada ms reciente1 corresponde al ao 2001 [3]. En ella se organizaron torneos en las siguientes categoras: Liga de Simulacin: los jugadores son programas simulados en un servidor. Liga de Robots Pequeos (F180): los jugadores son robots que no sobrepasan los 18 cm. de dimetro, el baln es una bola de golf. Liga de Robots Medianos (F2000): los robots son de dimensiones menores a 50x50 cm. y 80 Kg. de peso. La bola es un baln profesional de ftbol.
Todas las ligas son independientes entre s, y los grupos de investigacin pueden hacer sus aportes en cualquiera de ellas. Sin duda, un equipo novato debera incursionar en las ligas menores (Simulacin o Robots Pequeos), ya que tanto los costos de experimentacin como la complejidad de las soluciones tienen una tendencia creciente a medida que se acercan a los robots bpedos. Por iniciativa del Laboratorio de Automatizacin, Microelectrnica e Inteligencia Computacional (LAMIC), la Universidad Distrital ha mostrado su inters en ser parte de la iniciativa RoboCopa. Para tal fin se ha iniciado el proyecto ROBOCOPA-UD que pretende el desarrollo en el corto plazo de un equipo de agentes simulados, y en el mediano plazo un equipo de robots pequeos. A continuacin se expone una descripcin de los aspectos generales de estas dos ligas.
2.1. Liga de Simulacin

En el torneo de simulacin se realizan partidos entre dos equipos de once jugadores bajo un esquema cliente/servidor con protocolos de comunicacin UDP/IP. Los organizadores de la RoboCopa suministran el servidor y el monitor de la simulacin. Los jugadores son desarrollados por cada grupo de investigacin, y se conectan como clientes del servidor. El servidor de la simulacin (SoccerServer) es el encargado de controlar toda la informacin referente al partido (posicin de baln y jugadores, tiempo de juego, marcador). El monitor hace la visualizacin bidimensional del campo de juego en la pantalla (en la fig. 1 se observa un instante de un partido del campeonato del 2001). Los clientes solicitan informacin al servidor, y con base en ella ejecutan comandos de control tales como girar, patear, mover, acelerar. Cada jugador determina su posicin de manera relativa a ciertos objetos como los arcos, las lneas de demarcacin, banderines, el baln, otros jugadores (ver fig. 2) de los cuales recibe informacin visual cada cierto periodo de tiempo. Adems tambin puede recibir informacin auditiva, como las decisiones del rbitro, y eventualmente mensajes enviados por sus compaeros de equipo.
Las memorias de la competicin del 2002 saldrn publicadas en Septiembre del 2003.
1
La simulacin trata de ajustarse de la manera ms exacta a la realidad. Se consideran aspectos como la influencia del viento en el movimiento del baln, el formato como el jugador recibe la informacin, la imprecisin de la informacin visual y auditiva a medida que aumenta la distancia, el cansancio y la recuperacin de energa de los jugadores despus de realizar una carrera, la potencia y el efecto que se le puede dar al baln al patearlo, la
restriccin que el arquero sea el nico con posibilidad de agarrar el baln.
2.2. Liga de Robots Pequeos

En la liga de robots pequeos se usa un campo de juego de 152.5cm por 274cm de color verde, que tiene una lnea con un crculo de 25cm de dimetro en el centro.
Figura 1. Instantnea de uno de los partidos de Tsinghureolus, el equipo campen del 2001
Figura 2. Banderines usados para determinar la posicin en el campo de juego simulado
El ancho del rea de gol es de 50cm. El arco tiene 18cm de profundidad con un fondo color azul para un equipo, y amarillo para el otro. A lo largo de la cancha se extiende una pared de 10cm de altura para que los robots no se salgan de ella. Los robots deben tener una longitud mxima de 18cm y una altura hasta de 22.5cm. Cada equipo cuenta con cinco de ellos diferenciados por el color correspondiente. Durante el juego no se pueden hacer sustituciones a no ser que el robot se dae. Los robots no se pueden mover manualmente. Se permite utilizar comunicacin inalmbrica entre robots y redes de computadores situadas fuera del campo. Tambin es permitido el uso de sistemas de visin global o sistemas de visin externos para conocer la posicin del baln y los jugadores en el campo. Se juegan dos tiempos de 10 minutos con descanso. El baln es una bola de golf de color naranja. Existe un reglamento con faltas que son determinadas por un rbitro humano.
Hasta el momento se han realizado seis versiones del torneo de la RoboCopa. Los avances alcanzados muestran equipos cada vez ms robustos con una gran variedad de estrategias inteligentes. Algunos de los destacados en la ms reciente versin, se describen a continuacin [3].
3.1. Acciones complejas organizadas en colas

El equipo Zeng01 presentado por la Fukui University de Japn [4] cuenta con varios tipos de jugadores diseados por diferentes programadores: 4 tipos de arqueros, 18 tipos de defensas, 21 tipos de mediocampistas y 12 tipos de delanteros. Los desarrollos estn basados en CMUnited99, el equipo campen de 1999, cuyo cdigo fuente es libre. La seleccin de jugadores y la formacin del equipo lo determinan utilizando una tcnica de teora de juegos. Para ejecutar acciones complejas como mantener el baln, esquivar, pasar se establece una cola de acciones bsicas que deben ser ejecutadas en el orden respectivo. Dependiendo del perfil de los jugadores elegidos, el equipo tendr una estrategia, que por ejemplo, en los experimentos realizados fueron la de ataque entrando por el centro o ataque con carrileros laterales.
3. Equipos simulados en la RoboCopa
3.2. Arquitectura de tres capas
El equipo SBCe de la Shahid Beheshti University, en Irn [5], organiza las estrategias inteligentes dentro de tres capas que se complementan entre s: la capa de accin, que es el conjunto de destrezas bsicas reactivas coordinadas por un administrador que determina cual primitiva debe ejecutarse en un momento dado, y si hay las condiciones para ello (por ejemplo, no se podra patear si el baln no est al frente); la capa de tctica, encargada de ejecutar la secuencia de acciones que permitirn hacer un cambio en el estado del partido, teniendo en cuenta eventos inesperados o nuevos objetivos inmediatos; y la capa de planeacin que realiza tareas de planificacin teniendo en cuenta objetivos, recursos y fuerzas involucradas, con el fin de modificar la tctica actual. En realidad la capa de tctica es la encargada de dirigir las acciones del equipo. Ella esta pendiente de las acciones propuestas por la capa de accin y de los nuevos planes propuestos por la capa de planeacin. Por tal razn se ejecuta como un ciclo continuo donde se van instalando o desinstalando acciones y respuestas a eventos. Las acciones bsicas del equipo estn basadas en el equipo CMUnited99, al cual se le aadieron las capas de tctica y planeacin. Con base en ellas se generan diferentes tipos de estrategias defensivas y ofensivas.
pueden ser activadas de acuerdo al comportamiento del equipo oponente y a las estadsticas recopiladas durante el juego. Cada tctica tiene parmetros globales que controlan el comportamiento del equipo y formaciones que estn activas en diferentes situaciones (como defensa, ataque, etc.). El entrenador humano puede especificar la estrategia y el comportamiento activo de cada jugador para cada formacin. Durante el juego los jugadores siguen el consejo del entrenador para cambiar tcticas, formaciones y tipos de jugadores. Los jugadores tambin pueden decidir por s mismos cambios de tcticas basados en la informacin estadstica enviada por el entrenador o compaeros de equipo y en las tcnicas de modelamiento del oponente. Las decisiones individuales que toman los jugadores se toman dependiendo de la posicin actual: posesin del baln o recuperacin del baln. En cada una de ellas se encuentran acciones como disparar, pasar, atacar, esquivar, conservar, para el primer caso, e interceptar, ubicar y proteger el arco en el segundo.
3.5. Lenguajes de comunicacin entre agentes

El equipo Dirty Dozen desarrollado por el Instituto de Ciencias Cognitivas de la University of Osnabrueck, Alemania [8], se compone de agentes jugadores y de un entrenador en lnea. Para especificar el comportamiento de cada uno de los agentes se implement un sistema multiagente llamado Lenguaje de Formalizacin de Estrategias (SFL). El SFL permite que entrenadores y jugadores se puedan comunicar unos con otros. El SFL se basa principalmente en dos premisas. La primera tiene que ver con el desarrollo de las destrezas de bajo nivel de cada jugador, como lo son correr, patear, girar, entre otras, por medio de un modelamiento de las caractersticas del mundo. La segunda incluye el mejoramiento en la coordinacin del equipo en cuanto a estrategias de posicionamiento en el campo, gracias a la bsqueda de patrones en el juego del oponente por parte del entrenador. El SFL utiliza una sintaxis especfica para el reconocimiento de los mensajes del entrenador, compuesta por un conjunto de avisos-reglas que definen el comportamiento del equipo. Las reglas tambin pueden estar representadas por acciones que cada jugador o todo el equipo pueden realizar.
3.3. Modelamiento del mundo.

El equipo 11Monkeys del Instituto de Ciencias y Tecnologa de la Keio University en Japn [6] fundamenta el compartimiento de sus agentes en la elaboracin de un modelo del mundo (de la cancha y el partido en este caso). Un modelo exacto y completo del mundo, permitira al agente seleccionar mejor las acciones a ejecutar, pero le consumira demasiados recursos del sistema que estaran desperdiciados (por ejemplo, a un atacante en inminente posicin de gol, puede no interesarle la informacin en ese momento de su propio arco). Por esta razn el modelo del mundo propuesto por estos investigadores, est restringido a la menor cantidad de informacin posible; la visin del agente es local limitndola a cubrir un dimetro menor a 5 metros (simulados). Adems incluyeron heursticas por ejemplo, para el comportamiento del arquero, para que durante el saque de meta no escoja una direccin puramente aleatoria y evite de esta forma la posibilidad de convertir autogoles; en vez de ello, el arquero se puede mover por el rea de saque hasta encontrar un espacio vaco.
3.4. Estrategias dirigidas por el entrenador

El equipo FCPortugal 2001 de la Aveiro University of Portugal [7] sigue las instrucciones que determina un director tcnico humano. Para cada juego el entrenador especifica la estrategia que el equipo utilizar. Esta estrategia est constituida por tcticas cuidadosas que
3.6. Cooperacin usando gritos cortos

El equipo YowAI-2001 desarrollado por el departamento de Ciencia Computacional de la Universidad de ElectroComunicaciones de Tokio, Japn [9], est basado en cooperacin por gritos cortos y no en cooperacin por
comunicacin por gran cantidad de mensajes no humanos entre agentes, como lo hacen la mayora de equipos. Cada vez que un agente recibe un grito de otro, debe ejecutar una accin primitiva. Los gritos pueden contener coordenadas detalladas o informacin numrica, ya que cada uno tiene un espacio de 512 caracteres ASCII. La esencia del grito en la comunicacin entre agentes es obtener una situacin tctica. La obtencin de esta situacin es un concepto muy abstracto que slo se puede dar por la comprensin comn que tengan de ella los integrantes del equipo.
comportamiento (conjunto de acciones). El control del agente se determina mediante los mdulos de percepcin, razonamiento y actuacin.
3.9. Sincronizacin, estimacin y comunicacin del modelo del mundo

Uva Trilearn 2001 es el equipo del grupo de sistemas autnomos inteligentes de la Universidad de msterdam [12]. Este equipo utiliz mecanismos de sincronizacin avanzada y tcnicas de estimacin exacta de la posicin y la velocidad. Como resultado obtuvieron una estrategia de juego rpido y una poltica de pateo ptima. El mtodo de sincronizacin determina el momento ptimo de ejecutar una accin. La poltica de pateo ptima determina el punto exacto de la cancha desde el cual debe patear al arco, teniendo en cuenta la posicin desde donde se dispara la bola y la posicin del arquero. Los jugadores pueden percibir, razonar y actuar simultneamente, utilizando programacin multihilo. La arquitectura del agente consta de la capa perceptor-efector, la capa de control y la capa de habilidades. Adems posee un modelo del mundo que se actualiza con la nueva informacin captada por el agente; dependiendo de la posicin del baln, el agente que posea la mejor visin del campo de juego tiene la capacidad de comunicar su modelo del mundo a sus compaeros ms cercanos. La principal estrategia del equipo es pasar la bola rpidamente de jugador a jugador procurando tener la iniciativa del ataque; su principal formacin es un 4-3-3. La estrategia divide el campo en zonas, y cada jugador procura mantenerse en promedio en la misma posicin, es decir, que cada jugador posee un punto atractor dentro del campo.
3.7. Planeacin estratgica y aprendizaje

El equipo de los Wizards del Departamento de Ciencias de la Computacin de la Universidad de Essex, Inglaterra [10] se centr en la implementacin de planes estratgicos basados en la coordinacin y cooperacin multiagentes, utilizando para ello programas multihilos, aprendizaje por refuerzo, y posicionamiento adaptativo. El desarrollo de los planes la cooperacin es parte fundamental, y comprende tres componentes principales, a saber, los Disparos, que son seales que habilitan o desautorizan un plan determinado; las Acciones, que son combinaciones de comportamientos de bajo y alto nivel que son ejecutados secuencialmente y los Abortos, que son condiciones que aseguran que el plan sea adecuado. En cuanto al aprendizaje por refuerzo, se basa en darle al agente premios y castigos, sin especificar la tarea que debe cumplir. El agente debe seleccionar las acciones que garanticen el mejor premio a largo plazo. Cada jugador cuenta con un mdulo de acciones primitivas (Patear, Girar, Correr) y comportamientos tcticos (Mover, Interceptar, Pasar, Pase-gol, Posicionar), que contribuyen a alcanzar la meta global de anotar goles.
3.10. Comportamiento obtenido evolutivamente

El equipo del Departamento de Ciencias de la Computacin de la RMIT University en Australia [13] utiliza una tcnica de programacin gentica que es un proceso de generacin de programas por evolucin simulada. La meta es generar programas con capacidad de elaborar una estrategia ptima de juego. Para ello, se evolucionaron jugadores representados por programas que incluan instrucciones para ejecutar primitivas bsicas como patear, correr, agarrar, etc. El cromosoma de cada jugador incluye un programa de control. As, un equipo estara compuesto de once cromosomas, cuyos genes incluyen funciones y terminales de diferentes niveles. Se emplean operadores genticos como la recombinacin sexual y la mutacin para obtener nuevos jugadores. De esta forma, repitiendo el proceso varios ciclos, se van obteniendo diferentes generaciones de equipos. La aptitud o eficiencia de cada equipo se
3.8. Comportamiento de enjambre

El equipo Wahoo Wunderking de la Universidad de Virginia, EEUU [11] utiliza tcnicas de inteligencia de enjambre como lo hacen colonias de hormigas o de abejas. Las acciones primitivas ejecutadas por el equipo de agentes, en conjunto, definen un comportamiento funcional de un sistema de enjambre, como dispersarse o agruparse. Estas primitivas se describen por medio de restricciones sobre los estados del sistema. Por ejemplo, dispersarse se describe por la restriccin en la cual dos jugadores no se encuentran uno con respecto al otro dentro de una cierta distancia. La arquitectura del agente consta de tres partes: modelo del mundo (contiene toda la informacin proveniente del servidor), cuerpo (que ejecuta una accin compleja y retorna informacin sensorial del agente), y mdulos de
calcula con base en la duracin que tiene en un torneo, es decir, el nmero de rondas que se mantiene antes de ser eliminado (antes de perder un partido).
hasta el arco contrario y patear tratando de anotar gol.
4. Prototipos iniciales de jugadores en el proyecto ROBOCOPA-UD

Hasta el momento el mayor esfuerzo del proyecto ROBOCOPA-UD se ha centrado en el desarrollo de los primeros prototipos de jugadores para la Liga de Simulacin, con el fin de establecer un marco de experimentacin inicial en la cual probar diferentes estrategias inteligentes. La primera tarea fue obtener los servidores de simulacin, monitoreo, libreras y logs (repeticiones) de partidos ya jugados. Estos elementos fueron instalados en ambiente Windows y Linux, dado que se esperaba poder trabajar en cualquiera de ellos. Esta fue una de las razones por las que se decidi utilizar el lenguaje de programacin Java para la implementacin de los clientes (jugadores); adems, este lenguaje soporta las libreras para la comunicacin UDP/IP exigidas. Inicialmente se dise el modelo de clases mostrado en la fig. 3 como la estructura bsica para representar tanto los aspectos tcnicos del protocolo de comunicacin con el SoccerServer como la simulacin de un agente preliminar. Por ejemplo, el envo de comandos de control se encapsula en las clases Comunicador, ComunicaSimulacion, Receptor y Emisor. La recepcin de informacin visual y auditiva se modela en las clases Percepcion, InfoVisual, InfoObjeto, InfoJugador. Por ltimo, las estrategias de comportamiento se implementan en la clase Jugador, y especficamente en los subtipos de jugador: Delantero, Arquero. Se han definido hasta el momento dos tipos de jugadores: AgenteArquero y AgenteDelantero. Cada uno tiene un comportamiento tpicamente reactivo basado en heursticas bsicas. Los dos tipos de jugadores se describen a continuacin: AgenteArquero. Puede atajar, regresar o esperar. Cuando est atajando, el arquero ubica el baln, se mueve hacia l, lo agarra, se orienta hacia el arco contrario y saca con gran fuerza. Cuando esta regresando, se voltea hacia su arco, se mueve hacia l, y gira para estar pendiente del baln. Cuando est esperando, se mantiene movindose sobre la lnea de gol. AgenteDelantero: Puede girar, correr, y patear. La estrategia hasta el momento es ejecutar una secuencia de estas primitivas con un enfoque netamente ofensivo en el que busca llevar la bola
Figura 3. Modelo inicial de clases para el dominio de la Liga de Simulacin de la RoboCopa
En los experimentos realizados, se observa que los dos jugadores cumplen con su rol de manera rudimentaria. Por ejemplo, el arquero es capaz de tomar el baln cuando este cae en su rea sin pasar la lnea de gol, pero no es capaz de atajarlo cuando es un disparo directo al arco. Por su parte el atacante siempre lleva el baln hacia el arco contrario y dispara hacia l, sin considerar la ubicacin del arquero. Sin duda es necesario implementar tcnicas mas elaboradas para el control de estos agentes, de forma que puedan comportarse de manera ms inteligente. En la fig. 4 aparece una instantnea de una competencia entre estos dos jugadores. En cuanto a la Liga de Robots Pequeos se ha construido un primer prototipo de robot junto con la cancha de balompi, conforme los reglamentos. Se busc que el mvil pudiera controlarse desde una estacin central por medio de comunicacin inalmbrica. Se escogieron transmisores y receptores en la banda infrarroja, y se disearon los protocolos necesarios para transmitir y ejecutar los comandos bsicos de movimiento y giro. En la fig. 5a se observa un primer plano del robot prototipo. En la actualidad se estn realizando las pruebas pertinentes para afinar el prototipo y comenzar a desarrollar el equipo completo. Tambin se estn comenzando a implementar
las primeras estrategias de control de movimiento en Java y se est experimentando con ellas (en la fig. 5b se ve el robot movindose por la cancha).
soluciones a un problema complejo de comportamiento, en donde la principal meta es trabajar en equipo para marcar un gol. Varias universidades y centros de investigacin estn comprometidas con este objetivo. Los resultados obtenidos permitirn profundizar en el terreno de la inteligencia computacional, lo que redundar en nuevas soluciones donde se apliquen agentes artificiales inteligentes a problemas de la vida diaria. Este proyecto apunta, precisamente, a afrontar algunos de estos desafos con el fin de ofrecer aportes desde nuestra Universidad.
(a)
Figura 4. Competencia entre un Delantero y Arquero
5. Conclusiones y trabajo futuro

El principal flanco de trabajo del proyecto RoboCopa ha sido hasta el momento la liga de simulacin donde se ha comenzado a implementar lo que en un futuro sern el arquero y el delantero del equipo. Para ello se estn afinando las funciones primitivas de los jugadores, por ejemplo, correr hacia el baln, patear y en el caso del arquero tomar la bola. En el futuro cercano se tiene pensado obtener avances importantes en la liga de robots pequeos. Hasta ahora se ha generado una plataforma bsica de hardware con comunicacin inalmbrica mediante interfaz por puerto serial y transmisin IR. En esta liga se tienen grandes expectativas por tratarse de un campo multidisciplinario, desarrollo de hardware y desarrollo de control inteligente por medio de software. La exploracin de diversas tcnicas de inteligencia computacional genera muchas perspectivas frente a las posibilidades de poder obtener comportamientos competitivos en jugadores primitivos de ftbol. Estas tcnicas difieren tanto en su estructura como en su base algortmica; mientras que algunas usan estrategias de competencia eficientes y estticas, otras usan heurstica y azar para generar comportamientos adaptativos potencialmente ptimos. Todas estas son posibles
(b) Figura 5. (a) Primer plano y (b) Vista en movimiento del prototipo de robot pequeo
6. Agradecimientos
El proyecto ROBOCOPA-UD est patrocinado por el Centro de Investigaciones de la Universidad Distrital Francisco Jos de Caldas. Los autores desean expresar su agradecimiento a Gerardo Muoz, Javier Balln, Cesar Rodrguez, Hugo Velasco, Karina Miranda y Diana Gmez por su valiosa colaboracin e inmenso inters.
7. Referencias
[1] S. Russell, P. Norvig. Inteligencia Artificial. Un enfoque prctico, Mxico: Prentice-Hall, 1996.
[2] S.A. Rojas. Prototipo Animat de Interaccin Simple con el Ambiente: Un Experimento de Aprendizaje Maquinal, en: Revista Ingeniera, nm. 8, 2003. [3] A. Birk, S. Coradeschi, S. Tadokoro (Eds.), RoboCup 2001: Robot Soccer World Cup V, Berlin: Springer-Verlag, 2002. [4] T. Morishita, H. Shimora, K. Hiratsuka, T. Kubo, K. Hiroshima, R. Funakami, J. Nishino, T. Odaka y H. Ogura. "Zeng01 Team Description: Formation Decision Method Using Game Theory" en [3]. [5] E. Nazemi, M. Rahmani, y B. Radjabalipour. "3T Architectury for the SBCe Simulator Team". en [3] [6] K. Susuki, N. Tanaka Y M. Yamamoto. "11monkeys3 Team Description", en [3]. [7]. N. Lao y L. Reis. "FC Portugal 2001 Team Description: Flexible TeamWork and Configurable Strategy", en [3] [8] S. Buttinger, M. Diedrich, L. Hennig, A. Hoenemann, P. Huegelmeyer, A. Nie, A. Pegam, C. Rogowski, C. Rollinger, T. Steffens, y W. Teiken. The Dirty Dozen Team and Coach Description, en [3]. [9] K. Nakayama y I. Takeuchi. Team YowAI-2001 Description, en [3]. [10] H. Hu, K. Kostiadis, M. Hunter, y N. Kalyviotis. Essex Wizards 2001 Team Description, en [3]. [11] K. Browne, J. McCune, A. Trost, D. Evans, y D. Brogan. Behavior Combination and Swarm Programming, en [3]. [12] R. de Boer, J. Kok, y F. Groen. Uva Trilearn 2001 Team Description, en [3]. [13] V. Ciesielski, D. Mawhinney, P. Wilson. Genetic Programming for Robot Soccer, en [3].

Robo Cup

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Robo Cup

Cargado por

Copyright:

Formatos disponibles

Balompi Simulado: Un Nuevo Desafo para Agentes Artificiales Inteligentes

THE CHALLENGES OF SOCCER SIMULATION FOR ARTIFICIAL INTELLIGENT AGENTS

2.1. Liga de Simulacin

restriccin que el arquero sea el nico con posibilidad de agarrar el baln.

2.2. Liga de Robots Pequeos

Figura 2. Banderines usados para determinar la posicin en el campo de juego simulado

3.1. Acciones complejas organizadas en colas

3. Equipos simulados en la RoboCopa

3.2. Arquitectura de tres capas

3.5. Lenguajes de comunicacin entre agentes

3.3. Modelamiento del mundo.

3.4. Estrategias dirigidas por el entrenador

3.6. Cooperacin usando gritos cortos

3.9. Sincronizacin, estimacin y comunicacin del modelo del mundo

3.7. Planeacin estratgica y aprendizaje

3.10. Comportamiento obtenido evolutivamente

3.8. Comportamiento de enjambre

hasta el arco contrario y patear tratando de anotar gol.

4. Prototipos iniciales de jugadores en el proyecto ROBOCOPA-UD

Figura 3. Modelo inicial de clases para el dominio de la Liga de Simulacin de la RoboCopa

Figura 4. Competencia entre un Delantero y Arquero

5. Conclusiones y trabajo futuro

También podría gustarte