Está en la página 1de 4

Traducido del inglés al español - www.onlinedoctranslator.

com

Un marco de razonamiento de flujo basado en un modelo de agentes múltiples

Wafaa Mebrek y Amel Bouzeghoub


CNRS Paris Saclay, Telecom SudParis, SAMOVAR
Francia
correo electrónico: apellido.nombre@telecom-sudparis.eu

RESUMEN habilidades de razonamiento. Por lo tanto, la comunidad


El procesamiento sobre la marcha de grandes volúmenes de flujos de datos es RDF Stream Processing (RSP) abordó estos problemas en la
cada vez más necesario. Para hacer frente a la heterogeneidad de estos datos, última década. Sin embargo, si bien la importancia de gran
el modelo RDF se adopta cada vez más, lo que lleva a una gran cantidad de parte de la investigación realizada hasta ahora, todavía hay
sistemas y lenguajes de procesamiento de flujo RDF (RSP) que se ocupan de mucho margen de mejora como el problema del
problemas como consultas continuas, razonamiento incremental y rendimiento, la escalabilidad o las capacidades de
procesamiento de eventos complejos (CEP). Sin embargo, la mayoría de ellos ha razonamiento que son muy limitadas. Una de las soluciones
implementado enfoques centralizados y, por lo tanto, sufren algunas más relevantes que abordó estos problemas es [7], que
limitaciones como la colaboración, el intercambio, la expresividad y la agrega un razonador externo, ya que era imposible
escalabilidad. Los sistemas multiagentes han demostrado ampliamente su implementarlo usando un solo motor RSP de forma aislada.
valor y eficiencia, en particular su propiedad intrínseca descentralizada junto Sin embargo, esta solución todavía tiene deficiencias: (1)
con su mecanismo de cooperación y comunicación. En este documento, tiene un razonador centralizado (2) no es escalable y (3) no
proponemos un nuevo marco MAS4MEAN (Multi-Agent System for stream es fácil implementar los componentes de la arquitectura.
rEAsoNing) basado en un modelo de múltiples agentes para aprovechar sus Con el fin de superar los problemas antes mencionados, en
beneficios y abordar los desafíos de aumentar la escalabilidad y la facilidad de este trabajo,
implementación en entornos altamente dinámicos. Una evaluación El resto del documento está organizado de la siguiente manera: la Sección 2

experimental preliminar con un conjunto de datos del mundo real muestra detalla el estado del arte sobre los agentes de procesamiento de flujos RDF y

resultados prometedores en comparación con un trabajo existente. razonamiento de flujos. Nuestra contribución se describe en la Sección 3 y se evalúa
en la Sección 4. La Sección 5 concluye y brinda algunas perspectivas.

CONCEPTOS CCS
2. TRABAJO RELACIONADO
• organización de sistemas informáticos→Sistemas embebidos;
Redundancia; robótica; •Redes→ Confiabilidad de la red; Existen varias soluciones de procesamiento de flujo RDF en la literatura, cada
una con sus propias propiedades en términos de lenguaje de consulta

PALABRAS CLAVE compatible, expresividad, capacidad de razonamiento o escalabilidad. Todos


estos motores RSP amplían SPARQL para gestionar la transmisión de datos y
Razonamiento de flujos, procesamiento de flujos, flujos RDF, sistemas de agentes
abordar una parte del problema aprovechando los paradigmas existentes (ya
múltiples
sea CEP (Procesamiento de eventos complejos) o DSMS (Sistemas de gestión de
Formato de referencia ACM: flujo de datos)) [3]. Algunos de ellos, más influenciados por CEP, utilizan
Wafaa Mebrek y Amel Bouzeghoub. 2020. Un marco de Stream Reasoning basado en operadores temporales complejos como EP-SPARQL [1], Sparkwave [8] e IN-
un modelo Multi-Agents. EnEl 35º Simposio ACM/SIGAPP sobre Informática Aplicada STANS [14] mientras que otros utilizan la ventana deslizante de forma
(SAC '20), del 30 de marzo al 3 de abril de 2020, Brno, República Checa. ACM, Nueva atemporal como C-SPARQL [2] y CQELS [10] . La comunidad RSP reúne motores
York, NY, EE. UU., Artículo 4, 4 páginas. https://doi.org/10.1145/3341105. 3374111
que (i) están distribuidos pero generalmente no son de código abierto, por
ejemplo, CQELS Cloud [9] o están diseñados sobre una infraestructura como
SPARK Streaming1, parpadeo2o apache tormenta3. Por ejemplo, Strider [12][13]
1. INTRODUCCIÓN se basa en Spark Streaming y usa Kafka4
Las aplicaciones actuales se caracterizan por una generación de datos rápida y gestión de flujo de datos y DRSS [4] utiliza la plataforma Apache Storm5. A
continua y requieren también un consumo rápido de datos. Dichas aplicaciones pesar de los beneficios de la distribución y la paralelización de los tratamientos,
deben admitir el procesamiento y el razonamiento sobre los flujos, en la complejidad de esta solución dificulta su uso, despliegue o extensión; (ii)
particular para los entornos de IoT, a fin de extraer conocimiento de fuentes de centralizados y luego no admiten alta capacidad de procesamiento. Estas
datos heterogéneas para la toma de decisiones. Para lograr esto, el modelo de soluciones, aunque relevantes, adolecen de algunas limitaciones en términos
datos RDF ofrece representación del conocimiento y proporciona de escalabilidad y expresividad, donde algunas características requeridas en
CEP no son compatibles con ninguno de los sistemas actuales. Los autores en
Se otorga permiso para hacer copias digitales o impresas de parte o la totalidad de este trabajo para [7] superan estas limitaciones agregando un razonador externo (ASP
uso personal o en el aula sin cargo, siempre que las copias no se hagan o distribuyan con fines de lucro
incremental) para realizar el razonamiento sobre
o ventaja comercial y que las copias lleven este aviso y la cita completa en la primera página. . Deben
respetarse los derechos de autor de los componentes de terceros de este trabajo. Para todos los
demás usos, comuníquese con el propietario/autor(es). 1https://spark.apache.org/streaming/
SAC '20, del 30 de marzo al 3 de abril de 2020, Brno, República Checa 2https://flink.apache.org

© 2020 Copyright del propietario/autor(es). 3https://tormenta.apache.org

ACM ISBN 978-1-4503-6866-7/20/03. . .$15.00 4https://kafka.apache.org/


https://doi.org/10.1145/3341105.3374111 5https://tormenta.apache.org

509
datos de series de tiempo y mostró cómo RSP puede dividir y agregar datos de Concepto CEP (Procesamiento de eventos complejos) para admitir el modelado
sensores para reducir las inconsistencias para este razonador. de eventos y consultas en sistemas RSP. El resultado de la conversión es un
Independientemente de los importantes conocimientos proporcionados por conjunto de tripletas RDF con el mismo sujeto. Se asocia una marca de tiempo
este trabajo, aún se podría hacer mucho más para superar sus deficiencias a cada triple y forma un par (<si,pagsi,oi>,ti)dóndesies el sujeto, pi el predicado,
como arquitectura centralizada que afectan el rendimiento del sistema, su oi el objeto y ti la marca de tiempo. Estos pares se consideran eventos triples
facilidad de uso o la implementación y la escalabilidad. Como se afirma en [15], RDF. Como resultado, una secuencia ordenada de eventos triples RDF ((<si,pags
afirmamos que esto podría mejorarse significativamente mediante entornos i,oi>,ti), (<sj,pagsj,oj>,tj), ...)donde i<j forma un flujo RDF.
descentralizados y mediante el uso del concepto de agentes de razonamiento
de flujo [11]. De hecho, el razonamiento de flujo puede aprovechar las muchas
fortalezas de los sistemas de agentes múltiples (MAS), como su capacidad para 3.2 Procesamiento de los datos de transmisión
gestionar eventos en curso, adaptarse cuando cambia el entorno, razonar o Los datos entrantes se distribuyen por tipos de sensores gracias a agentes de
tomar decisiones y ser reactivo. Por esta razón, la principal contribución de este software (llamados agentes de procesamiento) en los que se integra un motor C-
trabajo es construir un marco basado en el modelo MAS que soporta una SPARQL RSP. Se crea un agente de procesamiento para cada agente de detección, lo
ejecución oportuna de consultas continuas y razonamiento sobre flujos de que significa que múltiples instancias del motor C-SPARQL podrían manejar
datos RDF. Hasta donde sabemos, esta es una primera contribución que fácilmente más consultas en una ventana de tiempo y establecer un procesamiento
estudia las implicaciones de combinar el razonamiento de corrientes y el paralelo de ellas. Los eventos de flujo resultantes generados a partir de consultas C-
paradigma multiagente. SPARQL se envían a los agentes de razonamiento.

3 ARQUITECTURA CONCEPTUAL 3.3 Razonamiento de corrientes


VISIÓN GENERAL
Los agentes razonadores se encargan de inferir conocimiento (en nuestro caso
es una actividad humana o una alarma) sobre los eventos que ocurrieron
durante una ventana de tiempo específica. Para ello, cada agente razonador
posee un razonador Clingo [5] y un conjunto de reglas. Las reglas se
distribuyen entre los agentes de razonamiento según el área de vecindad de
los sensores. En esta etapa, la representación de la regla es una característica
clave que brinda la posibilidad de agregar los eventos de flujo resultantes de
los agentes de procesamiento.

4 EXPERIMENTOS Y DISCUSIÓN
Para una evaluación experimental, ejecutamos el prototipo en una PC
estándar con un procesador central de 2,6 GHz y 16 Gb de RAM y usamos
Jadex8plataforma. Además, para procesar eventos y consultas, múltiples
instancias del motor C-SPARQL9estaban preparados y Clingo
10Solucionador de ASP. Utilizamos un conjunto de datos extraído del Proyecto CASAS11
que describen un apartamento para un solo residente. En general, el apartamento
Figura 1: descripción general de la arquitectura
contiene 12 sensores de movimiento, 17 sensores de batería y luz, tres sensores
magnéticos de puerta y cinco sensores de temperatura.
La arquitectura de la Figura 1 se basa en el paradigma Multiagente para Para evaluar la escalabilidad y el rendimiento de MAS4MEAN, lo comparamos
aprovechar al máximo sus propiedades de distribución, colaboración y razonamiento. con el trabajo más cercano presentado anteriormente [7][6]. Se propusieron
Está compuesto por un conjunto de agentes que tienen diferentes roles: (i) detectar diferentes escenarios, en particular el escenario de monitoreo electrónico de la
datos sin procesar de sensores; (ii) procesar los datos de transmisión (iii) razonar la atención médica que conduce al desarrollo de un marco en el proyecto E-
transmisión a lo largo del tiempo y el espacio para capturar las características care@home . El marco E-care@home (como lo llamamos abreviadamente)
principales de la transmisión. gestionó los eventos por medio de un middleware orientado a mensajes
(plataforma Apache Kafka) y utiliza una instancia de C-SPARQL para limpiar y
3.1 Detección de datos sin procesar de sensores dividir los datos del sensor y una instancia de ASP razonador para inferir
Un entorno inteligente se compone de múltiples áreas inteligentes que implementan actividades. Debido a la falta de disponibilidad de la implementación de toda la
sensores heterogéneos (por ejemplo, luz, movimiento, temperatura, etc.). Los agentes canalización de este trabajo y para una comparación de referencia,
de detección (por ejemplo, TemperatureAgent, MotionAgent, LightAgent) se encargan implementamos E-care@home y lo ejecutamos con el mismo conjunto de datos.
de recopilar datos sin procesar de los sensores como triples (ti, id, v), donde ti es una
marca de tiempo, id el identificador del sensor y el valor de va y convierten estos El propósito de la evaluación es doble: 1) Primero, queríamos validar nuestra
datos en el momento. vuele a flujos RDF y luego a eventos gracias a dos ontologías primera suposición de que una arquitectura distribuida basada en el paradigma de
complementarias, Sensor ontology SOSA (Sensor, Observation, Sample y Actuator)6y múltiples agentes impacta positivamente en la velocidad de los datos RDF.
SmartHome Event ODP (patrones de diseño de ontología)7basado en el
8Jadex versión 3.0
9Motor C-SPARQL versión 0.9.6
6https://www.w3.org/2015/spatial/wiki/SOSAOntología 10Razonador Clingo versión 4.3
7http://ontologydesignpatterns.org/wiki/MainPAGSaé 11http://ailab.wsu.edu/casas/datasets/

510
Procesando; 2) En segundo lugar, como efecto secundario, queríamos probar
la mejora de la escalabilidad del motor C-SPARQL y del solucionador ASP
Clingo. Con este fin, realizamos una serie de evaluaciones para comparar E-
care@home y MAS4MEAN en términos de procesamiento y razonamiento de
acuerdo con tres métricas: (1) el número de eventos procesados por ventana
de tiempo; (2) el tiempo de ejecución de los motores y los razonadores; (3) el
número de hechos procesados por los razonadores

Figura 5: Número de hechos procesados por el razonador Clingo en una


ventana de tiempo de 10 segundos con E-care@home y MAS4MEAN

es capaz de procesar significativamente más eventos que E-care@Home , por


lo que ofrece un potencial para ampliar los sistemas RSP. Podemos explicar
este resultado por el hecho de que en la capa de agentes de procesamiento se
distribuyen diferentes instancias de C-SPARQL según su tipo de sensor. Como
resultado, se reduce el número de eventos asignados al motor C-sparql.
Figura 2: Número de eventos procesados por C-sparql en una ventana
de tiempo de 10 segundos con Ecare@Home y MAS4MEAN
Por supuesto, estos resultados no transmiten el significado por sí
mismos, si no se tiene en cuenta el tiempo de ejecución. Esto es lo que
intenta hacer el segundo experimento al comparar el tiempo de
ejecución para ambos enfoques dentro de la misma ventana de tiempo.
Como podemos ver en la Figura 3, MAS4MEAN reduce drásticamente el
tiempo de ejecución, que varía de 4 a 13 milisegundos, mientras que para
E-care@home varía de 11 a 41 milisegundos.
El tercer experimento está relacionado con la evaluación de las actuaciones
de los razonadores, es decir, Clingo vs ASP. Como se muestra en la figura 4,
ninguno de los enfoques supera significativamente el tiempo de ejecución. Sin
embargo, podemos observar que la mayoría de las veces (antes de 100 ms),
Clingo consume menos o al menos tiene el mismo tiempo de ejecución (cerca
de 0 ms) que ASP.
El último experimento mide el número de hechos procesados por los
Figura 3: Evaluación de C-sparql en un conjunto de datos de apartamentos de razonadores Clingo y ASP. Los resultados representados en la Figura 5
un solo residente con E-care@home y MAS4MEAN W=10s muestran que, aunque el consumo de tiempo no es tan bajo como se esperaba
para todas las ventanas de tiempo en el experimento anterior, la cantidad de
hechos consumidos por Clingo es mayor que la de ASP.
Finalmente, resumimos en la Tabla 1 una comparación entre
MAS4MEAN y E-care@home para resaltar las principales características y
al mismo tiempo sus beneficios/deficiencias.
Para gestionar la comunicación en la implementación así como los
eventos entrantes, se utilizó Apache Kafka en Ecare@home mientras que
MAS4MEAN utiliza la cola MAS ya integrada en el modelo. De hecho, los
agentes son bien conocidos por sus habilidades de comunicación y
colaboración utilizando FIPA-ACL (Fundación para Agentes Físicos
Inteligentes-Lenguaje de Comunicación de Agentes). En términos de
tratamiento de consultas y reglas, la operación de agregación es
generalmente costosa. MAS4MEAN reduce este costo agregando solo las
reglas en comparación con E-care@home donde se agregan consultas y
Figura 4: Evaluación de Clingo en un conjunto de datos de apartamentos reglas. e-cuidado@casautiliza un patrón único para las consultas C-
de un solo residente con E-care@home y MAS4MEAN W=10s SPARQL. Esta restricción se elimina en MAS4MEAN ya que es posible tener
múltiples patrones con las instancias de C-SPARQL. El paradigma de
El primer experimento calcula el número de eventos procesados por C- múltiples agentes ofrece la oportunidad a MAS4MEAN de agregar
SPARQL en ambos enfoques para la misma ventana de tiempo (10 s). Los fácilmente nuevos motores RSP mientras que en E-care@home se
resultados se ilustran en la Figura 2. Como podemos ver, MAS4MEAN necesita un esfuerzo de desarrollo. Finalmente, como se demostró en el

511
Tabla 1: Tabla Comparativa [10] Danh Le Phuoc, Minh Dao-Tran, Josiane Xavier Parreira y Manfred Hauswirth. 2011. Un
enfoque nativo y adaptativo para el procesamiento unificado de flujos vinculados y
datos vinculados. EnLa Web Semántica - ISWC 2011 - 10ª Conferencia Internacional de
Enfoque e-care@Home Enfoque MAS4MEAN Web Semántica, Bonn, Alemania, 23-27 de octubre de 2011, Actas, Parte I. 370–388.
https://doi.org/10.1007/978-3-642-25073-6_24
Enfoque de centralización Enfoque distribuido [11] Pablo Pico-Valencia y Juan A. Holgado-Terriza. 2018. Agentificación de Internet de
Procesamiento de eventos Sistemas multiagente las cosas: una revisión sistemática de la literatura.IJDSN14, 10 (2018).
[12] Xiangnan Ren. 2018.Razonamiento y procesamiento de flujo RDF distribuido. tesis
complejos Kafka cola MAS Université Paris-Est. https://tel.archives-ouvertes.fr/tel-02083973
Patrón de consulta de agregación de Agregación de reglas [13] Xiangnan Ren, Olivier Curé, Li Ke, Jeremy Lhez, Badre Belabbess, Tendry Randriamalala,
Yufan Zheng y Gabriel Kepeklian. 2017. Strider: un motor de procesamiento de flujo
consultas y reglas Consultas distribuidas
RDF distribuido adaptable y habilitado para inferencia.Procedimientos de la Fundación
Motor único RSP Múltiples motores RSP VLDB10, 12 (2017), 1905–1908.
Baja escalabilidad del razonador Alta escalabilidad del razonador [14] Mikko Rinne, Esko Nuutila y Seppo Törmä. 2012. INSTANS: procesamiento de eventos de
alto rendimiento con RDF estándar y SPARQL. EnActas del ISWC 2012 Posters &
Demonstrations Track, Boston, EE. UU., del 11 al 15 de noviembre de 2012.
[15] Riccardo Tommasini, Davide Calvaresi y Jean-Paul Calbimonte. 2019. Transmisión de
Reasoning Agents: Blue Sky Ideas Track. EnActas de la 18.ª Conferencia internacional
evaluaciones, MAS4MEAN es capaz de hacer frente a un mayor volumen de
sobre agentes autónomos y sistemas multiagente, AAMAS '19, Montreal, QC, Canadá,
eventos en comparación con E-care@home. del 13 al 17 de mayo de 2019. 1664–1680.

5. CONCLUSIÓN
Este artículo propone un marco denominado MAS4MEAN basado en el
desarrollo de unidades inteligentes colaborativas capaces de contener medios
de razonamiento y procesamiento de flujo para monitorear entornos
inteligentes con datos de flujo altamente dinámicos. Este trabajo enfatiza el
supuesto de la eficiencia de tal arquitectura descentralizada. De hecho, se
informaron las principales ventajas de este marco en comparación con el
trabajo más cercano en la literatura, E-care@home . Para probar la eficacia de
la propuesta, MAS4MEAN se probó con un conjunto de datos público. Los
resultados se compararon con los obtenidos por E-care@home con el mismo
benchmark. Los resultados de la evaluación demuestran que nuestra
propuesta supera a E-care@Home.Para la fase de procesamiento, MAS4MEAN
puede consumir una mayor cantidad de eventos en el menor tiempo. Para la
capa de razonamiento, MAS4MEAN es capaz de manejar más hechos que E-
care@home en un tiempo un poco mejor. Como trabajo futuro, planeamos
probar nuestra propuesta con conjuntos de datos más grandes y usar las
capacidades de múltiples disparos de Clingo.

REFERENCIAS
[1] Darko Anicic, Paul Fodor, Sebastian Rudolph y Nenad Stojanovic. 2011. EP-SPARQL: un
lenguaje unificado para procesamiento de eventos y razonamiento de flujo. EnActas de
la 20ª Conferencia Internacional sobre la World Wide Web, WWW 2011, Hyderabad,
India, 28 de marzo - 1 de abril de 2011. 635–644. https://doi.org/10.1145/
1963405.1963495
[2] Davide Francesco Barbieri, Daniele Braga, Stefano Ceri, Emanuele Della Valle y Michael
Grossniklaus. 2010. C-SPARQL: un lenguaje de consulta continua para flujos de datos
RDF.En t. J. Computación Semántica4, 1 (2010), 3–25.
[3] Gianpaolo Cugola y Alessandro Margara. 2012. Procesamiento de flujos de información: Del flujo
de datos al procesamiento de eventos complejos.Cómputo ACM. sobrev.44, 3 (2012), 15:1–15:62.

[4] Amadou Fall Dia, Zakia Kazi-Aoul, Aliou Boly y Elisabeth Métais. 2017. Drss: Streaming rdf
sparql distribuido. EnConferencia Internacional sobre Investigación, Gestión y
Aplicaciones de Ingeniería de Software. Springer, 125-145.
[5] Martin Gebser, Roland Kaminski, Benjamin Kaufmann y Torsten Schaub. 2014.
Clingo = ASP + Control: Informe Preliminar.CoRRabs/1405.3694 (2014).
[6] Robin Keskisärkkä. 2017.Hacia el procesamiento de eventos complejos habilitados
semánticamente. vol. 168 páginas. Suecia. Tesis doctoral.
[7] Robin Keskisärkkä y Eva Blomqvist. [Dakota del Norte]. Apoyo al monitoreo en tiempo
real en investigaciones criminales. EnLa Web Semántica: Eventos Satélite ESWC 2015.
[8] Srdjan Komazec, Davide Cerri y Dieter Fensel. 2012. Sparkwave: coincidencia continua de patrones
mejorados por esquemas sobre flujos de datos RDF. EnActas de la Sexta Conferencia
Internacional ACM sobre Sistemas Distribuidos Basados en Eventos, DEBS 2012, Berlín,
Alemania, 16-20 de julio de 2012. 58–68.
[9] Danh Le-Phuoc, Hoan Nguyen Mau Quoc, Chan Le Van y Manfred Hauswirth.
2013. Procesamiento elástico y escalable de datos de flujo enlazado en la nube.
En La Web Semántica – ISWC 2013, Harith Alani, Lalana Kagal, Achille Fokoue,
Paul Groth, Chris Biemann, Josiane Xavier Parreira, Lora Aroyo, Natasha Noy,
Chris Welty y Krzysztof Janowicz (Eds.). Springer Berlín Heidelberg, Berlín,
Heidelberg, 280–297.

512

También podría gustarte