Está en la página 1de 6

Minimizacin del Congestionamiento Vial Mediante el

Cambio Inteligente de Luces de los Semforos


rea de Conocimiento: Sistemas Multiagente
Juan Maya Cilia1, Jess Manuel Olivares Ceja2
1

Centro de Investigacin en Computacin del Instituto Politcnico Nacional


jmaya@sagitario.cic.ipn.mx
2
Centro de Investigacin en Computacin del Instituto Politcnico Nacional
jesusoc@yahoo.com
Abstract. Una de las consecuencias del crecimiento urbano es el
congestionamiento vehicular. Las repercusiones de este problema no slo se
manifiestan en los tiempos de traslado, sino tambin en daos al entorno
ecolgico, en costos econmicos y en la salud mental de gran parte de los
conductores (derivados del estrs y del cansancio), a los cuales se anan
deterioros en la salud fsica debidas a alteraciones citogenticas [10]
Por ser catica, la red vial es un sistema no lineal que se comporta de manera
aleatoria y que es impredecible. Este trabajo plantea un sistema multi-agente
que, sin intentar solucionar el problema completamente, mejora otras
propuestas para condiciones similares. La propuesta maneja una arquitectura
BDI-EO, extensin de la conocida BDI, a la cual se le aaden los mdulos de
Experiencia y de Obligaciones.
Mostramos no slo un sistema descentralizado sino tambin un mecanismo
implcito de toma de acuerdos en situaciones conflictivas.
Keywords: Sistema Multi-agente, Trfico Vehicular, Arquitectura BDI-EO, .
Resolucin Implcita de Conflictos

1 Introducin
La bsqueda de soluciones para evitar el congestionamiento vehicular se remonta desde
la dcada de los aos sesentas, en el siglo XX, cuando se presentaron los primeros
problemas viales debidos al crecimiento poblacional de algunas ciudades y al
incremento en las facilidades que tuvieron los ciudadanos de esas misma urbes para
obtener un vehculo.
Los primeros estudios utilizaban tcnicas de la Investigacin de Operaciones,
basados en problemas de optimizacin de redes; las soluciones dadas por stas son
ptimas siempre y cuando las variables propias del problema sean estticas. De esta
forma, la planeacin del tiempo que deben durar los colores de los semforos (verde,
mbar o rojo) es ptima para ciertas condiciones pero, dado que la red vial es un

sistema dinmico, una modificacin en las condiciones iniciales provoca respuestas


menos satisfactorias y, en el peor de los casos, un congestionamiento mayor.
Tambin la computacin evolutiva ha abordado el problema, encontrndose dentro
de las propuestas de solucin los trabajos de Vogel [17] y Penner [15]. Actualmente
existen proyectos para control de las luces de los semforos que ocupan esta tecnologa,
lo cual hace evidente que esta solucin tiene resultados aceptables; sin embargo, el
sistema es centralizado, lo que trae como consecuencia que una falla en la entidad
principal ocasione el colapso de todo el sistema.
Otra alternativa para solucionar el problema est inspirada en los autmatas
celulares que, si bien en la mayora de los proyectos son utilizados como una
herramienta muy poderosa para realizar simulaciones en tiempo real ([14], [1], [16],
[3]), tienen ciertas propiedades que han sido retomadas en trabajos como los de Elina
Mancinelli, Guy Cohen, Stephane Gaubert, Jean-Pierre Quadrat, y Edmundo Rofman
[13]. No obstante, las propuestas hechas empleando autmatas suponen ciudades
regulares y que no hay calles principales sino que todas tienen las mismas
caractersticas fsicas y la misma demanda.
Por lo que respecta a los sistemas hechos con sistemas multi-agentes, Marco Wiering
propone uno que usa algoritmos de aprendizaje reforzado. Otra forma la sugiere Choy
[6], quien incorpora a un sistema multi-agente tcnicas de la computacin evolutiva
sugiriendo, al mismo tiempo, una arquitectura con tres capas jerrquicas: capa de
cruces, capa de zona y capa de los controladores regionales. Tambin han hecho
propuestas ocupando esta tecnologa el investigador belga Carlos Gershenson [9] y los
estadounidenses Kart Dresner y Peter Stone [8] quienes plantean un sistema muy
semejante al presentado por Marco Wiering. En algunos casos se observan mecanismos
centralizados, y en otros se observan condiciones futuristas en las cuales no slo hay
comunicacin entre semforos, sino tambin entre los propios carros.

2 Arquitectura del Sistema


El problema del trfico vial es complejo y, por ende, no puede resolverse con
estrategias simples como la construccin de caminos o aumentando el flujo de las calles
ms congestionadas de la ciudad. Hacer esto, lejos de beneficiar la circulacin, podra
complicar ms el flujo vehicular al presentarse fenmenos como el descrito por Braess
[2]. Ante esto, el sistema propuesto encuentra una secuencia en los cambios de luces
cuyo patrn es dinmico para as evitar estos fenmenos.
2.1 Suposiciones iniciales
La propuesta que se presenta en este artculo supone que: 1) pueden encontrarse
patrones del flujo vehicular que dependen de factores como: trfico en otras calles, hora
y da; dichos patrones se repiten y, aunque no se sabe con exactitud cuando, suponemos
que si se aplica la misma combinacin de luces en el sistema en condiciones parecidas,
entonces tendramos una respuesta similar en la gran mayora de los casos. 2) Existen
puntos en la ciudad donde tienden a ir los vehculos; si se llegan a detectar en el
momento oportuno, entonces se puede modificar la combinacin de luces de manera tal

que el flujo hacia esos lugares sea mayor comparado con los que van a otros puntos. 3)
De alguna manera, hay trfico en ciertas zonas que disminuyen la circulacin en otras,
siendo que esto no siempre es evidente.
El primer y segundo punto hacen necesario el tener un repositorio donde se guarden
las condiciones reinantes en un instante junto con las soluciones que se dieron, a fin de
repetirlas o encontrar mejores. Este es el objetivo de la capa de experiencia (E) que,
conjugado con un algoritmo gentico (para explorar ms alternativas), permite no solo
encontrar un antecedente, sino tambin buscar mejores combinaciones a ste.
Para el caso del ltimo punto, dado que cada semforo se ocupa slo de realizar sus
propios clculos y no tiene dispositivos que le digan qu sucede en otros, su nica
forma de conocer lo que pasa es por medio de una comunicacin intensa con sus
vecinos en la cual le informen los parmetros ms importantes de sus respectivos
cruces, y que tambin le indiquen, en forma concisa, cul es la intencin que tienen
respecto a la combinacin de luces.

Agente 0:
Comunica
con:
Ag -1
Ag. -2
Ag. -3
Ag. -4
Ag. 1,
Ag. 2,
Ag. 3,
Ag. 4

Agente 1:
Comunica
con:
Ag 0
Ag. -1
Ag. -2
Ag. -3
Ag. 2,
Ag. 3,
Ag. 4,
Ag. 5

Agente 2:
Comunica
con:
Ag 0
Ag. -1
Ag. -2
Ag. 1
Ag. 3,
Ag. 4,
Ag. 5,
Ag. 6

Agente 3:
Comunica
con:
Ag 0
Ag. -1
Ag. 1
Ag. 2
Ag. 4,
Ag. 5,
Ag. 6,
Ag. 7

Agente 4:
Comunica
con:
Ag 0,
Ag. 1,
Ag. 2,
Ag. 3,
Ag. 5,
Ag. 6,
Ag. 7,
Ag. 8

Fig 1. Comunicacin entre agentes vecinos

Este diseo parte de la premisa de que todo agente en el sistema tiene un vecino.
Con esto se crea un efecto domin en el que los agentes: an sin tener los parmetros de
los agentes ms alejados, realizarn una accin que sea benfica para todo el sistema
porque cada uno de ellos buscar una combinacin de luces que no perjudique a sus
vecinos, de los cuales uno ser vecino, por su parte, de alguno que est entre los ms
alejados. La figura anterior ilustra una posible situacin en la que se muestra la
comunicacin entre 5 agentes cualquiera. El agente 0 se comunica con los agentes 4,
-3, -2, -1, 0, 1, 2, 3 y 4. De estos, los agentes con tinta ms tenue indican que no todo el
quinteto de agentes (de los mostrados en la figura) los conoce.

2.2 Arquitectura BDI-OE


Dado que cada agente tiene cierta libertad de elegir la combinacin de luces que crea
conveniente de acuerdo a los parmetros informados por sus vecinos, y que como nica
meta tiene la maximizacin de la vecindad de la que forma parte, se corre el riesgo de
que se presente la Tragedia de Recursos Comunes [11]. Esto se evita por medio de
dos cualidades del sistema: 1) La meta se manifiesta mediante una funcin de ganancia
que no slo considera las condiciones del cruce donde se encuentra el semforo, sino
tambin las de los agentes vecinos. 2) Dado que las intenciones de los agentes no se
comunican entre s, no es suficiente la aplicacin del punto 1 para garantizar un
adecuado funcionamiento, ya que la combinacin de luces en uno de los agentes puede
disminuir el efecto de la combinacin de otro; para controlar esta situacin, se establece
un cdigo de normas sociales que son conocidas por todos los agentes y que permiten
que las acciones de uno no entren en conflicto con las de otro.
El punto 2 mencionado en el prrafo anterior se implementa en un mdulo que tiene
como objetivo el aplicar ciertas reglas cuando hay intenciones conflictivas entre dos o
ms agentes vecinos. Al respecto, existen algunos estudios previos desarrollados por
investigadores holandeses que tambin proponen una extensin del modelo BDI
aadindole una capa de obligaciones (O) [4]. Dado que el objetivo con esta capa es el
mismo, esa capa es bautizada con el mismo nombre. En general, la arquitectura que
propone esta tesis se ilustra en la siguiente figura
Informacin del ambiente y de otros agentes
Creencias:
Situacin en el
cruce
actual;
situacin en otros
cruces

Se contrasta con ...


Alimenta a

Podran
producir
Conflicto*:
Los deseos del
agente versus la
afectacin a los
intereses de los otros

Experiencia:
Historial de
creencias junto
con acciones
ejecutadas.
Razonamiento:
Bsqueda de
mejores alternativas

Resuelve
Accin a
ejecutar

Normas Sociales:
Accin a tomar en
caso de situacin
conflictivas.

Fig 2. Arquitectura propuesta

Ahora bien, las etapas mostradas en la figura anterior se realizan sncronamente. Es


decir, al mismo tiempo todos envian la informacin a los otros agentes, al mismo
tiempo todos piensan en las alternativas y al mismo tiempo todos cambian de luces
(esto ltimo no es obligatorio). El esquema mostrado en la siguiente figura ilustra los
tiempos que se manejan para este sistema.

Envo de
informacin
ti

Meditacin
ti

Aviso de accin
ti

Agente
actuando
ti

Envo de
informacin
ti+1

Fig 3. Orden de ejecucin de las diversas tareas de los agentes


En el tiempo ti, la nica tarea que realizan los agentes es el envo de los parmetros
presentes en su cruce. La etapa marcada como Meditacin inicia el proceso que en la
figura 2 est representada por el tringulo de Creencias, Experiencia y
Razonamiento. Cuando se acaba este tiempo, los agentes estn obligados en el tiempo
ti a decir a sus vecinos qu accin desean ejecutar. Como ya se haba previamente
mencionado, puede haber un conflicto ya sea entre la alternativas halladas por la capa
de experiencia y razonamiento, o bien, entre el deseo surgido de sta y los de otro
agente. Si se llega a presentar este caso, el agente tiene el periodo entre ti y ti para
consultar las Normas Sociales y rectificar o ratificar su decisin. Una vez que se da el
tiempo ti, se termina toda comunicacin y el agente simplemente acta.

3 Resultados
Tomando como base las consideraciones tericas mencionadas en el captulo anterior
se realiz un sistema multiagente para hacer experimentos. Para poder apreciar lo que
suceda, se tom un mapa en formato jpg que muestra una zona de la Ciudad de
Mxico, la cual comprenda aproximadamente un rea de veinticinco kilmetros
cuadrados. Teniendo definida la seccin, se procedi a construir los agentes descritos
en este artculo y tambin unos agentes sencillos para simular a los automovilistas. La
ejecucin de los agentes se hizo en varias computadoras y la simulacin de los sensores
que obtienen informacin del ambiente se realiz por medio de servidores.
Los experimentos se realizaron para rangos diferentes de trfico vehicular. Los
resultados son contrastantes cuando se compara el funcionamiento de agentes que ya
tienen experiencia contra los que no la poseen. En el primer caso, con el cambio de
luces, lejos de disminuir la congestin vehicular, la aumenta. Esto se debe a que la
Experiencia funciona como una capa de Aprendizaje que le permite a un agente
comparar posibles acciones con otras que hayan sido tomadas en condiciones similares.
En cada situacin nueva el agente no tiene una referencia de la cual partir.
En cambio, el funcionamiento del sistema mejora considerablemente cuando los
agentes tienen experiencia. Las pruebas muestran que los agentes tienden a dar
prioridad a las rutas crticas (aquellas que desembocan en un punto de concentracin de
trfico). Esto no significa que desaparezca el congestionamiento, sino ms bien
significa que la ganancia colectiva es mayor cuando est operando el sistema BDI-EO
que cuando est en funcionamiento otro.

4.- Conclusiones y trabajo futuro


Los experimentos demuestran que la arquitectura propuesta en este artculo puede
adaptarse a ambientes caticos, y abren expectativas prometedoras de que no slo
pueda aplicarse a problemas de congestionamiento vial.
Es necesario hacer
simulaciones en otros ambientes que permitan conocer los alcances en la flexibilidad de
los agentes. Tambin, como trabajo futuro est previsto hacer estudios sobre lo que
sucede cuando agentes de mucha experiencia conviven con agentes de poca (los
experimentos realizados se hicieron con agentes en un mismo nivel); para despus ver
el funcionamiento del sistema cuando se incorpora un nuevo tipo de agente que fungir
como maestro para transmitir conocimiento a agentes con poca o nula experiencia.

Referencias
[1] Biham Ofer, Middleton Alan A., y Levine Dov, Self-Organization and a Dynamical
Transition in Traffic Flow Models, Physical Review.
[2] Braess Dietrich, ber ein Paradox der Verkerhsplannung, Unternehmenstorchung
12:258-268 (1968)
[3] Brockfeld Elmar, Barlovic Robert, Schadschneider Andreas y Schrecknberg Michael,
Optimizaing traffic ligths in a cellular automaton model for city traffic, Physical
review E, Volumen 64.
[4] Broersen, J., Dastani M., Hulstijn J, y Van der Torre L. Goal generation in the BOID
architecture, University of Delf, 2002.
[6] Choy Min Chee, Cheu Ruey Long, Srinivasan Dipti y logi Filippo, Real-Time
Coordinated Signal Control Using Agents with Online Reinformement Learning,
82nd Annual Meeting of the Transportation Research Board
[8] Dresner Kurt y Stone Peter, Multiagent Traffic Management: A Reservation-Based
Intersection Control Mechanism, AAMAS'04, July 19-23, 2004, Estados Unidos.
[9] Gershenson, Carlos, Self-Organizing Traffic Lights, Centrum Leo Apostel, Vrije
Universiteit Brussel, 30 de noviembre de 2004
[10] Gomez Arroyo, Sandra Luz, slga@atmosfera.unam.mx
[11] Hardin, Garret, The Tragedy of Commons", Science, volumen 162, po. 1243-1248.
[13] Elina Mancinelli, Guy Cohen, Stephane Gaubert, Jean-Pierre Quadrat, y Edmundo
Rofman, On Traffic Light Control of Regular Towns, Institut National De Recherche
En Informatique Et En Automatique (INRIA).
[14] Nagel Kai y Schreckenberg Michael, A cellular automaton model for freeway traffic,
Journal de Physique I, Septiembre de 1992, Francia.
[15] Penner Joanne, Hoar Ricardo y Jacob Christian, Swarm-Based traffic simulation
with evolutionary traffic light adaptation, Universidad de Clgary.
[16] Schadschneider Andreas, Chowdhury Debashish, Brockfeld Elmar, Klauck K, Santen
L., y Zittartz J., A new cellular automata model for city traffic, en "Traffic and
Granular Flow 1999: Social, Traffic, and Granular Dynamics" editado por D. Helbing,
H. J. Herrmann, M. Schreckenberg, D. E. Wolf (Springer, Berlin, 2000)
[17] Vogel Andrea, Goerick Christian y von Seelen Werner, Evolutionary Algorithms for
Optimizing Traffic Signal Operation, Institut fr Neuroinformatik,Ruhr-Universitt
Bochum.
[18] Marco Wiering, Multi-Agent Reinforcement Learning for traffic Light Control,
University of Utrecht.

También podría gustarte