Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sergio A. Rojas Ren Lozada Rafael Meneses Julin Olarte David Surez Andrea Vega
Grupo de Inters en Adaptacin, Computacin & MEnte (ACME-UD) Laboratorio de Automtica, Microelectrnica e Inteligencia Computacional (LAMIC) Facultad de Ingeniera Universidad Distrital Francisco Jos de Caldas, Bogot, Colombia srojas@udistrital.edu.co
La Competicin Mundial de Robots RoboCopa propone un escenario de experimentacin para agentes artificiales reales y simulados que deben participar en un juego similar al balompi real. Este es un problema interesante para los investigadores en Inteligencia computacional, ya que debe abarcar aspectos relacionados con el control, navegacin, planeacin, comunicacin, colaboracin y toma de decisiones, que adems deben ser resueltos en tiempo real con un entorno altamente dinmico. En este artculo se presenta una descripcin de esta iniciativa acadmica, y de los avances del proyecto que en este sentido, se adelanta en la Universidad Distrital. Palabras clave: Agentes inteligentes, competiciones de robots, RoboCopa.
Resumen
The Robot World Cup initiative (RoboCup) provides a testing arena for artificial real and simulated agents that have to play a game similar to soccer. For the Computational Intelligence approach, it is a very interesting problem because it must deal with control, navigation, planning, communication, cooperation and decision-making issues that must be solved in real time into a highly dynamically changing environment. This paper presents an overview of this initiative with a description of the project that is going onward at the Universidad Distrital. Keywords: Intelligent agents, robot tournaments, RoboCup.
Abstract
1. Introduccin
Los juegos siempre han representado un desafo para los estudiosos de la Inteligencia computacional (IA), pues en
ellos se considera imperativo el uso de estrategias inteligentes para alcanzar el xito. Desde mediados del siglo anterior se han propuesto estos problemas (ejemplo, jugar ajedrez, damas, cartas) como campos de experimentacin ideales para disear agentes artificiales que imiten el raciocinio de la mente humana, aplicando reglas de inferencia basadas en la valoracin de los diferentes estados del juego [1]. Esta metfora ha planteado una gran incgnita cuyo clmax ha sido la realizacin de torneos entre el actual campen mundial de ajedrez y una supercomputadora: ser posible que el computador pueda actuar de manera ms inteligente que el ser humano? Aunque la pregunta sigue abierta, lo que es claro hasta el momento es que la metfora del raciocinio mental no es la nica va para intentar implementar inteligencia en nuestras mquinas. Las nuevas corrientes de la IA, le apuestan a enfoques inspirados en la biologa y la etologa [2], argumentando que ms que pensamientos inteligentes existen comportamientos inteligentes y que el aprendizaje de tales comportamientos es vital para permitir a un agente (simulado, robot, o animal) ser exitoso en el entorno que lo rodea. Por otra parte, el comportamiento de un individuo, puede a su vez ser fundamental para el buen desempeo (eficiencia, efectividad y adaptacin) de su comunidad. Ejemplos abundan en la naturaleza como las hormigas que construyen su hormiguero y buscan comida para sobrevivir, o las bandadas de gaviotas que vuelan grandes distancias en formacin V sin perder su camino, o en el plano humano los deportes de equipo que requieren de tcticas bien planificadas para ganar las competiciones. Precisamente, entre estos ltimos se encuentra el ftbol asociado o balompi, deporte bastante popular que desde el punto de vista acadmico posee caractersticas muy llamativas para el estudio del comportamiento inteligente: colaboracin entre varios agentes, toma de decisiones en tiempo real, cambio dinmico del entorno, alta incertidumbre. Estas caractersticas plantean el desafo interesante de construir agentes artificiales que puedan jugar y competir en encuentros de balompi.
El reciente inters que ha surgido alrededor de este tema, se ha cristalizado en la Competicin Mundial de Robots RoboCopa (The Robot World Cup Initiative- RoboCup), que se organiza anualmente como un evento acadmico para presentar los avances alcanzados por equipos desarrollados por investigadores de todo el mundo. En este artculo se presenta una descripcin de esta iniciativa, as como los requisitos y retos para una posible participacin en ella. El artculo est organizado de la siguiente forma: en la seccin 2 se exponen aspectos generales de la RoboCopa, en la seccin 3 se describen algunos de los enfoques de diferentes equipos participantes en la penltima edicin del evento, en la seccin 4 se presentan consideraciones sobre el desarrollo de un jugador simulado y uno real, y finalmente se presentan las conclusiones.
Liga de Robots Sony-Aibo: robots cuadrpedos de la empresa Sony. Liga de Simulacin de Rescate: una nueva modalidad donde los agentes resuelven tareas de rescate en escenarios de desastre urbano simulados en el computador. Liga de Robots Humanoides: es la liga mayor, donde los robots deben ser bpedos y tener completa autonoma en su navegacin, equilibrio y estrategia de juego.
2. Descripcin de la RoboCopa
La RoboCopa surge de una iniciativa de diversos grupos de investigacin alrededor del mundo interesados en el estudio de la IA, particularmente, en el comportamiento inteligente que pueden exhibir agentes artificiales simulados en software o implementados en hardware (robots). Ms que una competicin, la RoboCopa se considera un esfuerzo multidisciplinar que busca un objetivo muy ambicioso: lograr que a mediados del siglo XXI (ao 2050), sea posible enfrentar al equipo campen mundial de ftbol asociado con un equipo de agentes humanoides completamente autnomos, que sean capaces de vencerlo. Mientras tanto, desde 1997 cada ao se organiza un evento acadmico en el que se presentan los ltimos adelantos, prototipos, estrategias, tcnicas y herramientas en forma de torneos, ponencias y cursillos. Se busca de esta forma fomentar la investigacin y el desarrollo de nuevas tecnologas inteligentes, no solamente enmarcadas dentro del juego del balompi, sino tambin con posibilidad de aplicacin a otros dominios como navegacin autnoma y tareas de rescate en desastres naturales. La versin documentada ms reciente1 corresponde al ao 2001 [3]. En ella se organizaron torneos en las siguientes categoras: Liga de Simulacin: los jugadores son programas simulados en un servidor. Liga de Robots Pequeos (F180): los jugadores son robots que no sobrepasan los 18 cm. de dimetro, el baln es una bola de golf. Liga de Robots Medianos (F2000): los robots son de dimensiones menores a 50x50 cm. y 80 Kg. de peso. La bola es un baln profesional de ftbol.
Todas las ligas son independientes entre s, y los grupos de investigacin pueden hacer sus aportes en cualquiera de ellas. Sin duda, un equipo novato debera incursionar en las ligas menores (Simulacin o Robots Pequeos), ya que tanto los costos de experimentacin como la complejidad de las soluciones tienen una tendencia creciente a medida que se acercan a los robots bpedos. Por iniciativa del Laboratorio de Automatizacin, Microelectrnica e Inteligencia Computacional (LAMIC), la Universidad Distrital ha mostrado su inters en ser parte de la iniciativa RoboCopa. Para tal fin se ha iniciado el proyecto ROBOCOPA-UD que pretende el desarrollo en el corto plazo de un equipo de agentes simulados, y en el mediano plazo un equipo de robots pequeos. A continuacin se expone una descripcin de los aspectos generales de estas dos ligas.
Las memorias de la competicin del 2002 saldrn publicadas en Septiembre del 2003.
1
La simulacin trata de ajustarse de la manera ms exacta a la realidad. Se consideran aspectos como la influencia del viento en el movimiento del baln, el formato como el jugador recibe la informacin, la imprecisin de la informacin visual y auditiva a medida que aumenta la distancia, el cansancio y la recuperacin de energa de los jugadores despus de realizar una carrera, la potencia y el efecto que se le puede dar al baln al patearlo, la
Figura 1. Instantnea de uno de los partidos de Tsinghureolus, el equipo campen del 2001
El ancho del rea de gol es de 50cm. El arco tiene 18cm de profundidad con un fondo color azul para un equipo, y amarillo para el otro. A lo largo de la cancha se extiende una pared de 10cm de altura para que los robots no se salgan de ella. Los robots deben tener una longitud mxima de 18cm y una altura hasta de 22.5cm. Cada equipo cuenta con cinco de ellos diferenciados por el color correspondiente. Durante el juego no se pueden hacer sustituciones a no ser que el robot se dae. Los robots no se pueden mover manualmente. Se permite utilizar comunicacin inalmbrica entre robots y redes de computadores situadas fuera del campo. Tambin es permitido el uso de sistemas de visin global o sistemas de visin externos para conocer la posicin del baln y los jugadores en el campo. Se juegan dos tiempos de 10 minutos con descanso. El baln es una bola de golf de color naranja. Existe un reglamento con faltas que son determinadas por un rbitro humano.
Hasta el momento se han realizado seis versiones del torneo de la RoboCopa. Los avances alcanzados muestran equipos cada vez ms robustos con una gran variedad de estrategias inteligentes. Algunos de los destacados en la ms reciente versin, se describen a continuacin [3].
El equipo SBCe de la Shahid Beheshti University, en Irn [5], organiza las estrategias inteligentes dentro de tres capas que se complementan entre s: la capa de accin, que es el conjunto de destrezas bsicas reactivas coordinadas por un administrador que determina cual primitiva debe ejecutarse en un momento dado, y si hay las condiciones para ello (por ejemplo, no se podra patear si el baln no est al frente); la capa de tctica, encargada de ejecutar la secuencia de acciones que permitirn hacer un cambio en el estado del partido, teniendo en cuenta eventos inesperados o nuevos objetivos inmediatos; y la capa de planeacin que realiza tareas de planificacin teniendo en cuenta objetivos, recursos y fuerzas involucradas, con el fin de modificar la tctica actual. En realidad la capa de tctica es la encargada de dirigir las acciones del equipo. Ella esta pendiente de las acciones propuestas por la capa de accin y de los nuevos planes propuestos por la capa de planeacin. Por tal razn se ejecuta como un ciclo continuo donde se van instalando o desinstalando acciones y respuestas a eventos. Las acciones bsicas del equipo estn basadas en el equipo CMUnited99, al cual se le aadieron las capas de tctica y planeacin. Con base en ellas se generan diferentes tipos de estrategias defensivas y ofensivas.
pueden ser activadas de acuerdo al comportamiento del equipo oponente y a las estadsticas recopiladas durante el juego. Cada tctica tiene parmetros globales que controlan el comportamiento del equipo y formaciones que estn activas en diferentes situaciones (como defensa, ataque, etc.). El entrenador humano puede especificar la estrategia y el comportamiento activo de cada jugador para cada formacin. Durante el juego los jugadores siguen el consejo del entrenador para cambiar tcticas, formaciones y tipos de jugadores. Los jugadores tambin pueden decidir por s mismos cambios de tcticas basados en la informacin estadstica enviada por el entrenador o compaeros de equipo y en las tcnicas de modelamiento del oponente. Las decisiones individuales que toman los jugadores se toman dependiendo de la posicin actual: posesin del baln o recuperacin del baln. En cada una de ellas se encuentran acciones como disparar, pasar, atacar, esquivar, conservar, para el primer caso, e interceptar, ubicar y proteger el arco en el segundo.
comunicacin por gran cantidad de mensajes no humanos entre agentes, como lo hacen la mayora de equipos. Cada vez que un agente recibe un grito de otro, debe ejecutar una accin primitiva. Los gritos pueden contener coordenadas detalladas o informacin numrica, ya que cada uno tiene un espacio de 512 caracteres ASCII. La esencia del grito en la comunicacin entre agentes es obtener una situacin tctica. La obtencin de esta situacin es un concepto muy abstracto que slo se puede dar por la comprensin comn que tengan de ella los integrantes del equipo.
comportamiento (conjunto de acciones). El control del agente se determina mediante los mdulos de percepcin, razonamiento y actuacin.
calcula con base en la duracin que tiene en un torneo, es decir, el nmero de rondas que se mantiene antes de ser eliminado (antes de perder un partido).
En los experimentos realizados, se observa que los dos jugadores cumplen con su rol de manera rudimentaria. Por ejemplo, el arquero es capaz de tomar el baln cuando este cae en su rea sin pasar la lnea de gol, pero no es capaz de atajarlo cuando es un disparo directo al arco. Por su parte el atacante siempre lleva el baln hacia el arco contrario y dispara hacia l, sin considerar la ubicacin del arquero. Sin duda es necesario implementar tcnicas mas elaboradas para el control de estos agentes, de forma que puedan comportarse de manera ms inteligente. En la fig. 4 aparece una instantnea de una competencia entre estos dos jugadores. En cuanto a la Liga de Robots Pequeos se ha construido un primer prototipo de robot junto con la cancha de balompi, conforme los reglamentos. Se busc que el mvil pudiera controlarse desde una estacin central por medio de comunicacin inalmbrica. Se escogieron transmisores y receptores en la banda infrarroja, y se disearon los protocolos necesarios para transmitir y ejecutar los comandos bsicos de movimiento y giro. En la fig. 5a se observa un primer plano del robot prototipo. En la actualidad se estn realizando las pruebas pertinentes para afinar el prototipo y comenzar a desarrollar el equipo completo. Tambin se estn comenzando a implementar
las primeras estrategias de control de movimiento en Java y se est experimentando con ellas (en la fig. 5b se ve el robot movindose por la cancha).
soluciones a un problema complejo de comportamiento, en donde la principal meta es trabajar en equipo para marcar un gol. Varias universidades y centros de investigacin estn comprometidas con este objetivo. Los resultados obtenidos permitirn profundizar en el terreno de la inteligencia computacional, lo que redundar en nuevas soluciones donde se apliquen agentes artificiales inteligentes a problemas de la vida diaria. Este proyecto apunta, precisamente, a afrontar algunos de estos desafos con el fin de ofrecer aportes desde nuestra Universidad.
(a)
(b) Figura 5. (a) Primer plano y (b) Vista en movimiento del prototipo de robot pequeo
6. Agradecimientos
El proyecto ROBOCOPA-UD est patrocinado por el Centro de Investigaciones de la Universidad Distrital Francisco Jos de Caldas. Los autores desean expresar su agradecimiento a Gerardo Muoz, Javier Balln, Cesar Rodrguez, Hugo Velasco, Karina Miranda y Diana Gmez por su valiosa colaboracin e inmenso inters.
7. Referencias
[1] S. Russell, P. Norvig. Inteligencia Artificial. Un enfoque prctico, Mxico: Prentice-Hall, 1996.
[2] S.A. Rojas. Prototipo Animat de Interaccin Simple con el Ambiente: Un Experimento de Aprendizaje Maquinal, en: Revista Ingeniera, nm. 8, 2003. [3] A. Birk, S. Coradeschi, S. Tadokoro (Eds.), RoboCup 2001: Robot Soccer World Cup V, Berlin: Springer-Verlag, 2002. [4] T. Morishita, H. Shimora, K. Hiratsuka, T. Kubo, K. Hiroshima, R. Funakami, J. Nishino, T. Odaka y H. Ogura. "Zeng01 Team Description: Formation Decision Method Using Game Theory" en [3]. [5] E. Nazemi, M. Rahmani, y B. Radjabalipour. "3T Architectury for the SBCe Simulator Team". en [3] [6] K. Susuki, N. Tanaka Y M. Yamamoto. "11monkeys3 Team Description", en [3]. [7]. N. Lao y L. Reis. "FC Portugal 2001 Team Description: Flexible TeamWork and Configurable Strategy", en [3] [8] S. Buttinger, M. Diedrich, L. Hennig, A. Hoenemann, P. Huegelmeyer, A. Nie, A. Pegam, C. Rogowski, C. Rollinger, T. Steffens, y W. Teiken. The Dirty Dozen Team and Coach Description, en [3]. [9] K. Nakayama y I. Takeuchi. Team YowAI-2001 Description, en [3]. [10] H. Hu, K. Kostiadis, M. Hunter, y N. Kalyviotis. Essex Wizards 2001 Team Description, en [3]. [11] K. Browne, J. McCune, A. Trost, D. Evans, y D. Brogan. Behavior Combination and Swarm Programming, en [3]. [12] R. de Boer, J. Kok, y F. Groen. Uva Trilearn 2001 Team Description, en [3]. [13] V. Ciesielski, D. Mawhinney, P. Wilson. Genetic Programming for Robot Soccer, en [3].