Está en la página 1de 5

XXIV Edición del Workshop de investigadores en Ciencias de la Computación 493

Técnicas de modelado y simulación en sistemas de HPC y salud.


Diego Encinas1,2, Jimena Jara1, Román Bond1, Daniel Rosatto1, Lucas Maccallini1, Mauro Gomez1,
Federico Montes de Oca1, Adriana Gaudiani3, Martin Morales1,4
1
Proyecto de Investigación SimHPC - Programa TICAPPS - Instituto de Ingeniería y Agronomía -
UNAJ
2
Instituto de Investigación en Informática LIDI (III-LIDI) - Facultad de Informática - UNLP –
Centro Asociado CIC
3
Área de Computación - Instituto de Ciencias - UNGS
4
Centro CodApli - Facultad Regional La Plata - UTN

dencinas@unaj.edu.ar, elchejime@gmail.com, rbond@unaj.edu.ar, drosatto@unaj.edu.ar,


lucas.maccallini@gmail.com, mauro.f.gmz@gmail.com, federicomdo97@gmail.com,
agaudiani@ungs.edu.ar, martin.morales@unaj.edu.ar

Resumen optimización de aplicaciones sociales –


SimHPC” de la Universidad Nacional Arturo
El objetivo de esta línea de investigación es el Jauretche (UNAJ), acreditado por resolución
estudio de diferentes técnicas de modelado y interna 183/21. Además, el proyecto aporta al
simulación para entornos de Cómputo en Altas Programa “Tecnologías de la información y la
Prestaciones (HPC, High Performance comunicación (TIC) en aplicaciones de interés
Computing). El enfoque del estudio es la social” – TICAPPS de la UNAJ.
obtención de herramientas que permitan predecir En el tema existe un convenio de
la eficiencia del sistema ante posibles escenarios colaboración en actividades de Investigación y
y reconfigurar el sistema físico. Además, se Postgrado con el Instituto de Investigación en
analizan los diferentes componentes del sistema Informática – LIDI de la Universidad Nacional
que pueden influir en las prestaciones de La Plata y el Área de Computación del
significativamente y pueden llegar a modelarse Instituto de Ciencias de la Universidad Nacional
y/o reconfigurarse. de General Sarmiento.
Por otra parte, se ha llevado a cabo el
desarrollo de un simulador para entornos en el
área de salud, en el sector de emergencias Introducción
hospitalarias y de propagación de enfermedades.
El crecimiento sostenido en la demanda del
Palabras clave: Arquitecturas Multiprocesador. poder de cómputo remarca la necesidad de
Simulación. Sistema E/S paralela. Modelado y sistemas con enfoques de paralelización masiva
y cómputo de alta performance (HPC, High
Simulación basado en agentes (Agent- Performance Computing) [1]. Los clusters se han
BasedModeling and Simulation, ABMS). Cloud convertido en uno de los enfoques principales
Computing. CloudSim. Simulación y Salud. para lograr paralelismo a bajo costo. Una noción
extendida lo constituye la utilización de grid
Contexto computing y más recientemente cloud
computing. Independientemente de la solución,
Se presenta una línea de Investigación que es estos sistemas constan de un gran número de
parte del Proyecto de Investigación “Simulación, componentes incluyendo nodos de
Computación de Altas Prestaciones (HPC) y
XXIV Edición del Workshop de investigadores en Ciencias de la Computación 494

procesamiento, bancos de memoria, discos, entre identificar los factores que influyen en las
otros. prestaciones y proponer nuevas soluciones [4]
En cuanto a las herramientas de simulación [5].
para Cloud Computing, CloudSim es un En el área de tolerancia a fallas en sistemas de
framework desarrollado en Java que provee las cómputo de alta prestaciones se puede notar la
APIs necesarias para que el usuario genere una importancia de la unidad de E/S en las
simulación de un Data Center funcionando como arquitecturas paralelas como un punto a mejorar
servidor de nube capaz de simular la ejecución para lograr cubrir las exigencias de las
de CloudLets. aplicaciones que utilizan HPC. Una manera de
Por otra parte, los servicios de urgencias llevar a cabo este trabajo es utilizar técnicas de
hospitalarias son considerados como una de las simulación para evaluar el efecto de los cambios
unidades del sistema sanitario de mayor de los factores con mayores influencias en las
complejidad y fluidez, lo que unido a la prestaciones del sistema de E/S paralelo.
variabilidad de su actividad da lugar a que su Se puede disminuir la complejidad y la
gestión operativa sea una tarea muy complicada probabilidad de errores en la generación de
[2]. Es por ello que resultaría de mucha utilidad sistemas híbridos desarrollando una simulación
para sus responsables disponer de un sistema de específica de éstos utilizando diferentes
ayuda a la toma de decisiones (Decision Support frameworks [6] [7] [8].
System-DSS) tan flexible como un simulador, Las aplicaciones científicas con un uso
que permitiría tomar medidas disponiendo de intensivo de datos utilizan software de E/S
información suficiente sobre las alternativas paralelo para acceder a archivos. Contar con una
posibles. herramienta que permita predecir el
comportamiento de este tipo de aplicaciones en
Sistemas de E/S Paralela HPC es de gran utilidad para los desarrolladores
Las exigencias en los sistemas de E/S de aplicaciones paralelas como para
paralelos se han incrementado debido al aumento administradores de centros de cómputo. Por
en número, velocidad y potencia de las unidades otro lado, ABMS ha sido utilizado para modelar
de procesamiento en los clusters. También las problemas y sistemas complejos en diversas
aplicaciones científicas que utilizan cómputo de áreas de la ciencia.
altas prestaciones acrecientan estos Evaluar las prestaciones del subsistema de
requerimientos. E/S con diferentes configuraciones y la misma
En muchos casos, el cuello de botella de los aplicación, permite adaptar la configuración de
sistemas paralelos es la E/S a causa de las E/S teniendo en cuenta el patrón de acceso de la
exigencias que debe afrontar [3]. La E/S Paralela aplicación. Pero también puede ser una gran
es esencial para emparejar el avance de las ventaja analizar las necesidades de las
arquitecturas de los procesadores y el rápido aplicaciones antes de configurar el sistema
crecimiento de la capacidad computacional. físico. Una manera de predecir el
Aunque la arquitectura jerárquica de memoria comportamiento de las aplicaciones en el sistema
multinivel puede evitar grandes pérdidas de de cómputo, ante distintas configuraciones, es
prestaciones debido a los retardos de acceso a utilizando técnicas de modelado y simulación.
disco, la capacidad de memoria es limitada. Se está desarrollando modelos e
Además, como la capacidad computacional implementando una simulación de la
aumentará, la disponibilidad de memoria por arquitectura de E/S paralela, por medio de
core decrecerá, especialmente si la escala de los técnicas de simulación basadas en agentes o
sistemas de HPC se proyecta a millones de cores Sistemas Multi-Agente, (MAS-
o más. Varias simulaciones científicas y de MultiAgentSystems), para evaluar el efecto de
ingeniería de áreas críticas de investigación, tales dimensionar el sistema de E/S o cambiar
como la nanotecnología, astrofísica, clima y componentes como la red de almacenamiento,
energía física están convirtiéndose en dispositivos de E/S, entre otros [9].
aplicaciones intensivas de datos. Para poder
disminuir la brecha entre CPUs-E/S se deben
XXIV Edición del Workshop de investigadores en Ciencias de la Computación 495

Simulación de arquitecturas de Cloud Lo destacable es que el entorno de la cola de


Computing procesos es en el espacio de memoria de
CloudSim [10] [11] es un Framework de RamEntity y que cada instrucción que compone
simulación generalizado y extensible que a un código objeto del proceso es en realidad un
permite el modelado y la simulación de evento con todos sus parámetros.
diferentes infraestructuras y servicios de
aplicaciones de Cloud Computing. Un ejemplo
de utilización es la simulación de muchos centros Simulación y Salud
de datos. Al analizar las necesidades presentes en los
Su arquitectura consiste en entidades servicios de salud, se obtiene que dentro de una
específicas que se representan como clases Java sala de urgencias se encuentre una gran
que pueden ser heredadas o instanciadas. Estas diversidad de escenarios posibles donde cada
clases representan centros de datos, hosts físicos, uno de estos puede afectar a resultados sensibles
máquinas virtuales, servicios a ejecutar en los como, por ejemplo, la tasa de mortalidad de
centros de datos y servicios en la nube de personas. Para solucionar este problema se
usuarios [12] [13]. Además, CloudSim soporta la desarrolló un simulador con el objetivo de ser
inserción dinámica de los elementos de una herramienta capaz de recrear una gran
simulación y proporciona aplicaciones de paso cantidad de escenarios y así poder tomar
de mensajes y la topología de la red del centro de decisiones rápidas.
datos. El simulador desarrollado se centra en la
La versatilidad de CloudSim es la principal prevalencia puntual de infecciones
ventaja del sistema. La integración de nuevos intrahospitalarias [16] en una sala de urgencias y
parámetros y conceptos de la simulación es cómo la afectan distintos factores relacionados
implementada desde abstracciones con la gestión hospitalaria.
preestablecidas convenientemente por los Para llevar a cabo el modelado del simulador
autores. Las abstracciones principales son se utilizó el paradigma de Modelado y
SimEvent [14], SimEntity [15], Simulación basado en Agentes (ABMS). El
DataCenterCharacteristics y Vm. framework utilizado es Repast Simphony [17],
El aporte de un desarrollo de nuevos actores una herramienta especializada en ABMS, la cual
al componente Vm (Virtual Machine) posibilita provee una serie de ventajas respecto al
que por medio de simulación se obtengan modelado e implementación de agentes, así
métricas de entrada/salida. Las estadísticas que como también la coordinación concurrente de los
aporta la nueva implementación de Vm dan agentes.
soporte a un espacio de memoria ram en tiempos De esta manera, se clasificaron distintos
de simulación. Dicho espacio de memoria agentes intervinientes en el ambiente de una sala
principal está controlado por otro componente de urgencias, como los pacientes y médicos,
que es capaz de procesar instrucciones guardadas entre otros. Dichos agentes definen su
en el espacio de memoria sintético denominado comportamiento mediante máquinas de estado,
RamEntity. Si las instrucciones se guardan las cuales determinan las acciones
lógicamente, la nueva versión de Vm es capaz de correspondientes tanto a la atención hospitalaria
administrar procesos en la nueva capa de como también al estado de salud respecto de una
ejecución. La idea general de la implementación enfermedad intrahospitalaria específica.
consiste en la creación de una nueva SimEntity y La propagación de la infección
sus agregaciones necesarias para manipular el intrahospitalaria estará modelada mediante
espacio de memoria proporcionada por interacciones entre estos agentes, por ejemplo,
RamEntity, en tiempos de simulación. De tal uno de los focos de infección más importante de
forma que cada celda de RamEntity no sólo las salas de urgencias son las salas de espera. La
guarda datos, sino que también es posible que forma más efectiva para calibrar el simulador se
mantenga objetos interpretables como eventos da mediante el grado de interacción de agentes,
para la nueva SimEntity que se denomina ajustando así la tasa de transmisión de la
InitEntity. enfermedad en cuestión.
XXIV Edición del Workshop de investigadores en Ciencias de la Computación 496

Una vez calibrado el simulador, se pueden comportamiento de las distintas capas de la


obtener resultados. El trabajador de la salud pila de software de E/S.
dispone de diversos parámetros para configurar ▪ Análisis, modelado e implementación de
la simulación, por ejemplo, la cantidad de las operaciones típicas de E/S: read, write,
pacientes, la cantidad de camas disponibles, la open, close, flush.
cantidad de insumos hospitalarios, etc. Al ▪ Análisis y modelado de librerías de archivos
realizar distintas ejecuciones, se pueden obtener para aplicaciones que utilizan cómputo de
resultados analizando distintos posibles cuellos altas prestaciones-HPC. Se ha utilizado
de botella, configurando la cantidad de médicos Amazon Web Services para creación de
clínicos disponibles, la cantidad de cluster virtuales y obtener métricas de la pila
recepcionistas encargados de la admisión, el de software de E/S.
triage, entre otros. De esta manera, es posible la ▪ Incorporación de tiempos de entrenamiento,
toma de decisiones respecto a la asignación de obtenidos en AWS, en el simulador. Con esto
recursos y personal para agilizar la estancia se logra una salida más detallada y un
hospitalaria de los pacientes y evitar los método para validar tiempos y métricas del
contagios producidos por sus interacciones. simulador con AWS.
Además, se analiza y trabaja la optimización ▪ Implementación de comandos para ejecutar
y paralelización del simulador con los ambientes desde command center en NetLogo. Con esto
Repast HPC para clusters y Flame para ejecución se logró sintetizar el benchmark IOR
sobre GPU, obteniendo mejor performance en correspondiente a la capa de aplicación de la
términos de tiempos. pila de E/S, logrando introducir nuevos
parámetros como tamaño de archivo y
cantidad de nodos de E/S (metadata server y
Líneas de Investigación, Desarrollo e data server). De ejecutar este comando, se
Innovación obtiene una nueva salida similar a la del
benchmark IOR [18].
Temas de Estudio e Investigación ▪ Obtención de un método de desarrollo de
nuevos actores genéricos CloudSim que
▪ Arquitecturas multiprocesador para mejoran el modelado y la producción de
procesamiento paralelo: multiprocesador de estadísticas virtuales.
memoria compartida, multiprocesador on- ▪ Implementación de la entidad InitEntity que
chip de memoria distribuida. Multicore, procesa instrucciones en el espacio de
Clusters, Clusters de multicore. Grid. Cloud. memoria de las máquinas virtuales. Se
▪ Arquitectura de E/S paralela considerando el vinculan exitosamente los tiempos de
software, hardware, comunicaciones entre procesamiento de un cloudlet y las
módulos y dispositivos de almacenamiento. instrucciones en las máquinas virtuales [19].
▪ Nuevos aportes de desarrollos que mejoren ▪ Contraste de una simulación de un cluster en
los modelos de simulaciones con CloudSim la nube y uno idéntico desplegado en un
para el análisis de la performance en sistemas sistema de cloud computing público [20].
de arquitecturas de software de Cloud ▪ Modelado de infraestructuras de sistemas de
Computing. salud.
▪ Modelado y simulación para la ▪ Implementación de un simulador para
administración de sistemas de salud. analizar el contagio de enfermedades
intrahospitalarias [21].
Resultados y Objetivos
▪ Paralelización en la ejecución de
Investigación experimental simuladores.
▪ Implementación de un simulador para
▪ Diseño y desarrollo de modelos mediante analizar la propagación de enfermedades
técnicas de Modelado y simulación basada [22].
en agentes (ABMS) para analizar el
Formación de Recursos Humanos
XXIV Edición del Workshop de investigadores en Ciencias de la Computación 497

Dentro de la temática de la línea de I/D se Published online 24 August 2010 in Wiley Online
participa en el dictado de la carrera de Ingeniería Library (wileyonlinelibrary.com). DOI:
10.1002/spe.995.
en Informática de la UNAJ. También aportan 11. http://www.cloudbus.org/cloudsim 2018.
trabajos de alumnos de las materias Redes de 12. Hamza Ouarnoughi, Jalil Boukhobza, Frank
Computadoras 2 y Programación en Tiempo Singhoff, Stephane Rubini, Erwann Kassis.
Real. Por otro lado, algunos integrantes “Considering I/O Processing in CloudSim for
participan en el dictado de la Diplomatura en Performance and Energy Evaluation”. OpenStack
Cloud Software: Open source software for building
Ciencia de Datos de la UNAJ. private and public clouds. © Springer International
Durante 2021 se han realizado publicaciones Publishing AG 2016 M. Taufer et al. (Eds.): ISC High
nacionales e internacionales. Además, se Performance Workshops 2016, LNCS 9945, pp. 591–
encuentran en desarrollo y concluidas varias 603, 2016. DOI: 10.1007/978-3-319-46079-6 40.
Prácticas Profesionales Supervisadas (PPS) con 13. Kushang Parikh, Nagesh Hawanna, Haleema.
P.K, Jayasubalakshmi.R and N.Ch.S.N.Iyengar. School
las que concluyen sus estudios los alumnos de of Computing Science and engineering Vellore Institute
Ingeniería en Informática. of Technology, Tamil Nadu,“Virtual Machine
En esta línea de I/D existe cooperación a nivel Allocation Policy in Cloud Computing Using CloudSim
nacional e internacional. Hay dos investigadores in Java.” 2015.
realizando estudios de postgrado, 1 becario EVC 14. www.icsa.inf.ed.ac.uk/research/groups/hase/simj
ava 2018.
CIN, un becario de Iniciación a la Investigación 15. F. Howell, R Mc Nab. A discrete event
UNAJ y 2 alumnos avanzados de grado simulation library for java. International Conference on
colaborando en las tareas. Web-Based Modeling and Simulation. 1998.
16. Prevalencia puntual de infección nosocomial,
Referencias disponible en internet:
https://www.researchgate.net/publication/242363760_
1. Grama A, Gupta A, Karypis G, Kumar V. “Introduction Prevalencia_puntual_de_infeccion_nosocomial. Fecha:
to parallel computing”. SecondEdition. Pearson 29/03/2020
Addison Wesley, 2003. 17. Repast Simphony Frequently Asked Questions,
2. R. Galeano, C. Villalba, D. Rexachs, E. Luque. Agent- disponible en internet:
Based Model to Simulate Outpatient’s Consultations at https://repast.github.io/docs/RepastFAQ/RepastFAQ.h
the "Hospital de Clínicas". The Eighth International tml. Fecha: 29/03/2020
Conference on Advances in System Simulation 18. D. Encinas, S. Mendez, M. Naiouf, A. De Giusti,
(SIMUL 2016). 1:46-51 D. Rexachs del Rosario, and E. Luque, An Agent-Based
3. H Hennessy, J. L., Patterson, and D. A., Computer Model for Analyzing the HPC Input/Output System
Architecture, Fourth Edition: A Quantitative Approach. International journal on advances in systems and
San Francisco, CA, USA: Morgan Kaufmann measurements vol. 13, num. 3 & 4, págs. 192-202,
Publishers Inc., 2006. 2020.
4. J. M. May, Parallel I/O for high performance 19. D. Rosatto, R. Bond, M. Belizán, M. Morales, D.
computing. San Francisco, CA, USA: Morgan Encinas. Modelado y simulación de arquitecturas de
Kaufmann Publishers Inc., 2001. Cloud Computing con CloudSim: comunicación entre
5. V. Balaji, Earth system modelling – Volume 4. IO and entidades. XXIII Congreso Argentino de Ciencias de la
Postprocessing. Springer, 2013. Computación. ISBN 978-950-34-1539-9. 2017
6. D. Encinas, Utilización de un reloj global para el 20. T. Rosales, J. Spinelli, M. Di Nardo, R. Bond, D.
modelado de un ambiente simulado distribuido. XVIII Rosatto, D. Encinas, F. Romero. Análisis de una
Congreso Argentino de Ciencias de la Computación. plataforma de simulación para Cloud Computing. Un
2012 caso de estudio. XXVI Congreso Argentino de Ciencias
7. D. Encinas, Simulación de una red CAN para de la Computación. 2020
dimensionar las comunicaciones de una IMU. VII 21. L. Maccallini, D. O. Encinas, and F. Romero.
Congreso Argentino de Tecnología Espacial. 2013. “An Approach to the Modeling and Simulation of Intra-
8. D. Black, SystemC: From the Ground Up. Second Hospital Diseases”. Journal of computer science and
Edition, Springer, 2010. technology (ISSN 1666-6038), vol. 21, num. 2, págs.
9. D. Encinas et al.,Modeling I/O System in HPC: An 157-169, doi. 10.24215/16666038.21.e14, 2021.
ABMS Approach. The Seventh International 22. J. Baez, A. Barreto, B. Galarza, M. Morales, D.
Conference on Advances in System Simulation Encinas. Simulación para estimar propagación de
(SIMUL), ISBN: 978-1-61208-442-8, 2015. enfermedades. 8º Congreso Nacional de Ingeniería
10. R. Calheiros, R. Ranjan, A. Beloglazov, C. De Informática/Sistemas de Información (CoNaIISI 2020).
Rose and R. Buyya “CloudSim: a toolkit for modeling San Francisco, Córdoba. 2020
and simulation of cloud computing environments and
evaluation of resource provisioning algorithms”

También podría gustarte