Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Burguener, G. y Lopez, L.
24 de noviembre de 2011
Indice general
1. Conceptos de epidemiologa
1.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
1.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
12
2.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
13
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
17
2.4.1. Par
ametros de las ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
20
24
2.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
3. Implementaci
on del modelo cl
asico y determinaci
on de sus par
ametros
26
3.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
26
28
3.4. Conclusi
on
33
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
4.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
4.2. Aut
omatas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
4.3. Aut
omatas celulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
4.4. Aut
omatas celulares aplicados al modelado de epidemias . . . . . . . . . . . . . . . . . .
40
4.4.1. Revisi
on de modelos de automatas celulares usados en el modelado de epidemias
41
4.5. Conclusi
on
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5. Implementaci
on del modelo de aut
omatas celulares
43
45
5.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
46
53
5.4. Pruebas del modelo con distintas distribuciones de probabilidad de la tasa de infecci
on .
56
57
5.5. Pruebas del modelo con distintas distribuciones espaciales de individuos infecciosos . . .
59
5.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
61
6.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
6.2. Agentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
6.3. Ambientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
64
65
6.5.1. Revisi
on de modelos basados en agentes usados en el modelado de epidemias . .
65
6.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
ii
7. Implementaci
on del modelo multiagente
68
7.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
68
7.2.1. Ecuaci
on para la din
amica del virus . . . . . . . . . . . . . . . . . . . . . . . . .
69
7.2.2. Ecuaci
on para la din
amica de los linfocitos T precursores . . . . . . . . . . . . .
70
7.2.3. Ecuaci
on para la din
amica de los linfocitos T efectores . . . . . . . . . . . . . . .
71
7.2.4. Ecuaci
on para la carga viral total . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
7.2.5. Reformulaci
on del sistema de ecuaciones . . . . . . . . . . . . . . . . . . . . . . .
72
7.3. Definici
on del sistema multiagente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
75
7.5. Pruebas del modelo con distintas distribuciones de probabilidad de la tasa de infecci
on .
77
7.6. Pruebas del modelo con distintas distribuciones espaciales de individuos infecciosos . . .
77
7.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
8. Conclusiones Generales
81
A. C
alculo paralelo
83
A.1. Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
84
96
iii
Resumen
Una epidemia es una noci
on utilizada por la salud comunitaria para referirse a una enfermedad
que afecta a un n
umero de individuos superior al esperado en una poblacion durante un tiempo determinado. Es decir, este concepto es una relacion entre el nivel de incidencia o prevalencia normal de una
enfermedad y el n
umero de casos que se detectan en un momento dado. En otras palabras, una epidemia es un incremento significativo en el n
umero de casos de una enfermedad con respecto al n
umero
de casos esperados. En los casos en los que la epidemia se extiende por varias regiones geogr
aficas de
varios continentes o incluso de todo el mundo, se refiere a ella como pandemia. Si la enfermedad afecta
una zona en forma sostenida a traves del tiempo, se trata de una endemia. La importancia de modelar
sistemas radica en el hecho de que permite comprender y estudiar sus comportamientos, extrapolar
resultados y hacer predicciones, a traves de un enfoque simplificado de los mismos. Utilizando diferentes metodos numericos y de resoluci
on de sistemas de ecuaciones es posible obtener una descripci
on
aproximada del comportamiento de un sistema dado. Actualmente, en epidemiologa se encuentra altamente difundido el modelado por compartimentos. Este tipo de modelos se comportan bien cuando se
aplican a poblaciones de gran tama
no, con distribucion homogenea y teniendo en cuenta una correcta
eleccion de las funciones que determinan las relaciones entre los diferentes compartimentos. Lo que hace
a este tipo de modelado atractivo en ciencias biologicas es su intuitiva razonabilidad, pero ignora
factores importantes que forman parte de la realidad del problema, como pueden ser el contacto entre
los individuos, el mecanismo de contagio y como se compone la poblacion a estudiar.
Los modelos celulares resultan adecuados para modelar sistemas naturales que puedan ser descritos como una colecci
on masiva de objetos simples. En este caso, los individuos de una poblaci
on
interact
uan localmente entre s y pueden evolucionar a traves de varios estados como resultado de
dichas interacciones.
Utilizando estas tecnicas pudo modelarse la heterogeneidad a nivel individual y espacial. Se implementaron dos modelos, el primero basados en automatas celulares y el segundo basado en agentes.
Mediante los aut
omatas se incorpor
o explcitamente la tasa de infeccion en cada individuo siguiendo
distintas distribuciones de probabilidad y se ensayaron distintas distribuciones espaciales. En el modelado basado en agentes se incorpor
o ademas un modelo de sistema inmune explcito en cada individuo,
basado en ecuaciones diferenciales. Mediante el modelado de la heterogeneidad pudieron explicarse
comportamientos que no se explican con los modelos clasicos.
Captulo 1
Conceptos de epidemiologa
1.1.
Introducci
on
1.2.
Qu
e es la epidemiologa?
Figura 1.1: A modo ilustrativo escena que retrata la peste negra que azoto a Italia en 1348
no pueden medirse f
acilmente. Por ejemplo, la clase social es un indicador para ingreso, ocupaci
on,
educacion, h
abitos de consumo. El sexo puede relacionarse con caractersticas hormonales, psicol
ogicas, geneticas o sociales. Por eso es importante discernir y separar los componentes de cada variable.
Una buena variable epidemiol
ogica debera tener impacto en la salud individual y poblacional, ser precisamente medible, diferenciar poblaciones en alguna caracterstica subyacente relevante para la salud
(herencia, ingresos, h
abitos de salud, etc.) y generar hipotesis etiologicas testeables hasta que no se
hayan resuelto temas clnicos y patol
ogicos, como la definicion de enfermedad.
La epidemiologa se encuentra en una relacion interdependiente con la medicina clnica. La investigacion y comprensi
on de las causas de una enfermedad forma parte de la epidemiologa, mientras que la
toma de medidas de prevenci
on y control forma parte de la salud p
ublica. Se evidencia la dependencia
de la epidemiologa al ver que esta debe presentar evidencia cientfica de forma que gue a acciones de
salud p
ublica. Por otro lado, una enfermedad desconocida debe definirse con base clnica. Si no hay
forma de definirla, no puede diagnosticarse bien y la epidemiologa es ineficaz.
Por eso, la primera pregunta para el epidemiologo incumbe a la validez y a la definici
on de la
enfermedad o problema bajo investigacion. La precision de los diagnosticos depende de la claridad de
la definicion, pudiendo darse un sesgo por exceso o por defecto. La decision sobre que se considera como
enfermedad suele ser pragm
atica. Para la investigacion cientfica, puede ser adecuada una definici
on
que incluya personas con alta probabilidad de tener la enfermedad. Para salud p
ublica, tal vez no, dado
que si se subestiman los casos, se pierden los pacientes con sntomas tempranos, los que mas podran
beneficiarse. Por lo tanto, para prop
ositos epidemiologicos, un caso de enfermedad es:
Una enfermedad diagnosticada por un medico;
Un caso dentro de un grupo o brote de casos;
3
Figura 1.2: Escena ilustrada datada en el medioevo que retrata la peste bubonica en europa durante el
siglo XIV.
Un caso que ocurra en una persona que tiene, al menos, dos de tres problemas (por ejemplo:
desordenes gastrointestinales, sarpullido, desorden mental).
Un caso sin diagn
ostico claro.
El efecto del error en la definici
on puede ser muy grande, y comparar diferentes poblaciones puede
ser enga
noso. Cambios en la definici
on son comunes, cambiando el n
umero de casos, y mostrando c
omo
muchas veces la definici
on es pragm
atica.
1.3.
El concepto epidemiol
ogico de poblaci
on
Las poblaciones incluyen individuos aislados, pero una situacion as muy rara. La familia es la
unidad basica, aunque los humanos se relacionan con poblaciones mas grandes. La interacci
on en sociedad es la piedra basal de la epidemiologa como ciencia medica. No pueden hacerse estudios epidemiologicos en una sola persona; para comparar patrones y estados, se necesitan al menos dos individuos.
Pueden ser miles, millones, aunque usualmente pueden ser muy pocos. Los casos se analizan para ver
patrones en el tiempo, lugares y subpoblaciones (trada tiempo-espacio-persona), para ver las causas
de los patrones, probabilidades de enfermedad y sus causas. Las conclusiones pueden aplicarse directamente al grupo estudiado, pero s
olo indirectamente a los individuos, y solo a individuos razonablemente
tpicos de la poblaci
on.
La mayora de las enfermedades son contradas por pocas personas, muchas ocurren s
olo una
vez, y solo hay dos grados: o se tiene o no se tiene la enfermedad. Predecir el riesgo individual de
contraer resfro en un lustro es m
as sencillo que predecir si un individuo tendra cancer de pulm
on. Aun
as, el conocimiento del estudio de grupos es beneficioso para los individuos, a veces, aun m
as que el
conocimiento proveniente del propio individuo. La prediccion del desenlace de la enfermedad una vez que
4
fuertemente influenciados por los comportamientos sociales; las tasas de mortalidad estan asociadas a
desigualdades sociales, as como el nivel de salud mental y fsica, las enfermedades cardiovasculares y
los crmenes y accidentes. El efecto de la sociedad incluso tiene impacto en enfermedades geneticas,
como el sndrome de Down, cuya tasa de incidencia depende de la edad de la madre. Por lo tanto, la
epidemiologa debe analizar el patr
on de enfermedad usando variables que caractericen a los individuos,
las sociedades y el medio ambiente. Para casi todas las enfermedades, los patrones cambiaran si las
organizaciones sociales cambiaran.
Por la gran influencia de la sociedad, tambien se efect
ua una distincion entre individuos enfermos y poblaciones enfermas. Las personas con problemas de salud claros (hipertension, alcoholismo,
obesidad) son s
olo una porci
on del espectro. La prevencion de tales problemas requiere cambios en la
poblacion como un todo. Por ejemplo, en la prevencion del alcoholismo, se requiere que la totalidad
de la distribuci
on de consumo de alcohol cambie, la mayora supuestamente normal debe aceptar
la responsabilidad de la minora desviada. Al considerar la poblacion completa, pasamos de hablar
de individuo enfermo o sano a hablar de poblacion enferma o sana. Por ejemplo, al comparar la
distribucion de presi
on arterial entre keniatas y londinenses, vemos que hay diferecias. La pregunta
sobre que causa esto es diferente a la de que causa hipertension en un individuo. Podemos decir que
influye la dieta, el ejercicio, el estres, etc. Esto afecta a la poblacion entera. La mayor causa de c
ancer
de pulmon es el tabaco. Que causa que la gente fume a
un sabiendo esto? Estas causas tienden a ser
sociales y ambientales, no biol
ogicas. La idea de que las causas en los individuos difieren de las causas
en la poblaciones, lleva a una estrategia basada en ambas consideraciones, y con el objetivo de cambiar
la distribuci
on de los factores de riesgo en las poblaciones, en oposicion a los individuos.
En forma similar a la distinci
on entre individuos enfermos y poblaciones enfermas, tambien se
realiza una distinci
on entre variables epidemiologicas a nivel poblacion y a nivel individuo. La informacion recabada a nivel individual puede no representar el verdadero estado de la poblacion, as como
la informaci
on sobre una poblaci
on puede no tener significado a nivel individual. Los atributos individuales tales como la edad, la presi
on sangunea y el colesterol usualmente pueden combinarse en forma
significativa y ser descritos en la poblacion como un conjunto. Para ser significativos, los datos deber
an
provenir de una muestra representativa. De lo contrario, los resultados globales no seran exactos, aunque
las medidas individuales s lo sean. Por ejemplo, si se quiere evaluar el promedio de colesterol en una
poblacion, no sera correcto hacerlo en base a voluntarios, pues representan una muestra atpica. Los
estudios epidemiol
ogicos suelen basarse en poblaciones enteras o en muestras seleccionadas utilizando metodos de muestreo probabilsticos (y aun as puede haber dificultades en la representatividad,
dado que el porcentaje de respuesta de los llamados a participar de un estudio ronda el 60 %, y la
participacion es generalmente menor en jovenes de bajos recursos, generando un posible sesgo).
Los atributos de una poblaci
on se describen tanto por la distribucion de frecuencias como por
parametros estadsticos como la media y la desviacion estandar. La distribucion de poblaci
on de la
mayora de las mediciones biol
ogicas sigue la distribucion normal, pero esto debe verificarse en cada
caso. A veces, las medidas individuales no tienen utilidad tomadas en forma conjunta (por ejemplo,
las huellas dactilares, la personalidad, el color de ojos), porque no siguen un patron o no tienen una
interpretacion u
til. Las medidas de la poblacion o el medio ambiente tambien pueden carecer de sentido
cuando se aplican a un individuo (densidad de poblacion, PBI, temperatura ambiente). Estas medidas
solo pueden aplicarse en su propio nivel. Algo paradojico es que algunos datos individuales (por ejemplo,
el n
umero de personas que viven en un hogar), usados a nivel global (por ejemplo, como densidad de
6
Figura 1.4: La figura ilustra el rol que tiene las interacciones entre grupos humanos con la diseminaci
on
de una epidemia
poblacion de una zona), deja de ser significativo a nivel individual.
Las variables sociales suelen medirse en individuos, las variables ambientales, no. Los desafos contemporaneos en epidemiologa incluyen la medicion precisa de la exposicion ambiental en las personas,
y la medicion de caractersticas sociales como un conjunto. Las caractersticas sociales, incluida la cohesion social, el trabajo en equipo, y el estado de la transicion economica, probablemente tengan efectos
profundos sobre la salud, pero a
un est
an descriptos en forma incompleta. Los avances en epidemiologa
estan siendo impulsados por el re-an
alisis crtico del concepto de poblacion.
La generalizaci
on es crucial para muchas disciplinas academicas. Idealmente, las conclusiones deben
ser aplicables a personas de otros lugares similares. En la practica, como las poblaciones humanas
son muy variables en lo biol
ogico, ambiental y social, la generalizacion es muy difcil. Una clara y
detallada descripci
on de la poblaci
on, en su medio ambiente y contexto social, es esencial para evaluar
el potencial de generalizaci
on. Es com
un ignorar esta regla y generalizar demasiado facilmente, cayendo
en el error. Cuando la generalizaci
on no es apropiada, los datos epidemiologicos a
un pueden utilizarse
para evaluaciones locales del estado de salud de la poblacion directamente en estudio.
En realidad, no existen poblaciones estaticas como para efectuar una generalizacion amplia. Las
poblaciones de seres vivos son din
amicas en forma inherente. En las comunidades de seres vivos,
el tama
no y composici
on de las poblaciones esta cambiando constantemente debido a las muertes,
nacimientos y migraciones. Aun si el tama
no de la poblacion permanece fija, la poblacion sigue cambiando. Adem
as, aunque tomemos un grupo fijo, las personas envejecen, por lo que la edad promedio
aumenta, con el consiguiente efecto en el patron de la enfermedad. En forma mas gradual, lo mismo
puede ocurrir en sociedades enteras (aumento del promedio de vida, aumento de la edad promedio,
etc.), lo que se denomina transici
on demografica. Yendo al extremo, consideremos un lugar donde el
n
umero de personas es fijo, donde cuando un individuo muere o se va, es sustituido por otro y donde
la edad, sexo y composici
on etnica no vara en el tiempo. Un lugar de este tipo podra ser una c
arcel o
7
una instituci
on como un hogar de ancianos. Incluso as, los patrones de salud no son fijos, porque los
comportamientos humanos evolucionan constantemente, y su entorno cambia. En resumen, a los fines
epidemiologicos, no existen poblaciones humanas estaticas.
Si bien todas las poblaciones son dinamicas, el concepto de poblacion fija es u
til en algunos casos
(por ejemplo, al pensar en formas de medir la ocurrencia de una enfermedad). Los estudios de cohorte
son un intento de crear una poblaci
on cerrada. En poblaciones cerradas, las personas que mueren
o migran no son reemplazadas. El cambio de tama
no de la poblacion se puede predecir si sabemos la
tasa de muerte y de emigraci
on. La prediccion del tama
no en poblaciones abiertas (las poblaciones
naturales) es mucho m
as difcil y requiere, ademas de lo anterior, una estimacion de la inmigraci
on y
de patrones de fecundidad. La predicci
on del tama
no y composicion de poblaciones abiertas es un componente clave de la demografa. Si el n
umero de personas entrando esta equilibrado por el n
umero de
personas saliendo, la poblaci
on se encuentra en un estado estable.Los cambios en el medio ambiente y
en el comportamiento conducen a influencias temporales sobre las pautas de enfermedad. Por ejemplo,
las mujeres eran menos propensas a ser fumadoras en los a
nos 20 que en los 50. La combinaci
on de
la transicion demogr
afica y los efectos de influencia mas amplias (medio ambiente, comportamiento,
etc.), conduce a un profundo cambio en el patron de enfermedad, y el predominio de ciertas enfermedades cronicas. En muchos pases, con el aumento de la riqueza, estan predominando enfermedades
relacionadas con el estilo de vida opulento y con los grupos de mayor edad. Para la epidemiologa, estas
transiciones son una ventaja, porque han llevado a una mayor variacion en las pautas de morbilidad y
exposicion a las causas, proporcionando el combustible para el avance epidemiologico.
1.4.
Las enfermedades aumentan y disminuyen su frecuencia en el tiempo y varan sus patrones entre
distintas poblaciones casi sin excepci
on, a tal punto que este fenomeno constituye uno de los axiomas
de la epidemiologa. En ocasiones la incidencia de la enfermedad disminuye por causas naturales y
no por acciones de salud p
ublica. El estudio de los cambios de frecuencia de las enfermedades es de
interes para ayudar a controlar los aumentos abruptos y para comprender los factores que influyen en
la frecuencia (y, por lo tanto, profundizar en las causas de la enfermedad). Ademas, haciendo uso de
la tendencia temporal de la enfermedad y sus causas, pueden desarrollarse polticas de salud y planes
de asistencia sanitaria y predecir y modificar su curso futuro. En forma muy general, las causas se
clasifican en geneticas y ambientales. Las variaciones temporales de la enfermedad se producen debido
a alteraciones en las caractersticas de las personas o de su medio ambiente. Como estos cambios no son
geograficamente uniformes, esto genera diferentes patrones de la enfermedad en diferentes lugares. Si
bien el factor genetico es de menor importancia a nivel poblacion, se equipara con el factor ambiental
cuando se considera el nivel individuo, porque las variaciones geneticas entre los individuos son grandes.
El control de la enfermedad por lo general no implica ninguna accion a nivel de esta interacci
on entre
el genoma y el medio ambiente, sino a nivel de alguno de los dos factores que interact
uan, siendo el
factor ambiental el elegido en la mayora de los casos, por ser mas facil de manipular.
A la hora de estudiar las variaciones, es de especial importancia discernir si las variaciones son
reales o aparentes. Cuando los cambios en la frecuencia de la enfermedad son reales y no un artefacto,
las causas suelen ser muy difciles de identificar. Para poder comprender las causas, el primer paso es
8
Figura 1.5: Imagen tomada en un hospital improvisado en Europa occidental durante la gran pandemia
de gripe de 1918
descartar a los artefactos como posible explicacion, luego se debe proponer una hipotesis explicativa
y dise
nar un test de hip
otesis. Finalmente se deben evaluar los resultados en relacion a marcos de
pensamiento causal. Demostrar las variaciones en una enfermedad es el primer paso para establecer una
asociacion epidemiol
ogica que, a su vez, puede generar hipotesis explicativas. La asociacion puede ser
un vnculo entre la enfermedad y un factor de riesgo, que puede ser una caracterstica de la poblaci
on,
del ambiente, incluso otra enfermedad. Los artefactos mas comunes que generan variacion aparente
incluyen el azar, los errores en las observaciones, tecnicas sesgadas, cambios en la estructura de la
poblacion, variaci
on de personas que buscan atencion medica seg
un su nivel de conocimientos y acceso
al sistema de salud, cambios en la metodologa de diagnosis seg
un cada establecimiento, cambios en la
forma de recolecci
on de datos.
Un tipo especial de variaci
on en epidemiologa son los denominados cl
usters. Los cl
usters son
agregaciones de eventos o enfermedades relativamente raros en tiempo o lugar. Es una mini-epidemia,
es decir, la ocurrencia de la enfermedad en niveles superiores a lo esperado (por ejemplo, cuatro casos
de leucemia en una cuadra o cinco casos de amebiasis en una fabrica). Dicho cluster puede significar un
problema de salud p
ublica suyacente. La identificacion no es sino el comienzo del problema. El proceso
de descubrir las causas de la ocurrencia del cluster es complejo.Como el resto de las variaciones en
enfermedades, los clusters pueden surgir por azar, sesgo o error. Sin embargo, son tambien susceptibles
de ser pasados por alto por falta o insensibilidad de los datos o metodos de analisis.
Las variaciones en los patrones de las enfermedades son de valor practico para ayudar a guiar en el
diagnostico y en el tratamiento. Para decisiones de poltica sanitaria, las variaciones de la enfermedad
en las u
ltimas decadas (tendencias seculares) son de especial importancia para evaluar prioridades y
para evaluar si los objetivos de salud se han logrado. La variacion de las enfermedades por lugar y
situacion socioecon
omica es una gua para evaluar el nivel de inequidad en la salud.Las variaciones
espaciales de los patrones de la enfermedad pueden ayudar en la asignacion de personal y recursos para
lugares especficos.
9
Figura 1.6: Imagen tomada en un hospital improvisado en la ciudad de kansas (EE UU) durante la gran
pandemia de gripe espa
nola de principios del siglo pasado; denota el alcance que tuvo esta enfermedad
que afecto poblaciones a lo largo de todo el mundo.
1.5.
Error y sesgo
En el area de la salud, la verdad suele ser desconocida, y no puede ser calculada con exactitud.
Los errores, definidos como la diferencia entre un valor teorico y uno medido, son una parte inevitable
de las investigaciones. Si no se reconocen, los errores generan falso conocimiento, que solo puede ser
corregido con el tiempo y la profundizacion de las investigaciones. El sesgo es mas sutil que el error. Es
una preferencia o inclinaci
on por un tipo de resultado en particular. En estadstica, el sesgo es un error
causado por favorecer sistem
aticamente cierta salida en detrimento de otras. Sin embargo, se usan como
sinonimos frecuentemente. En epidemiologa suele usarse el termino sesgo para errores que aplican en
forma diferente para distintos grupos. Puede ser intencional o no. La investigacion biologica es difcil
por la complejidad y heterogeneidad de seres vivos y la variabilidad que ocurre en los descriptores y
biologicas. A esto se agregan las dificultades tecnicas, de costos y eticas (tanto para investigaciones con
animales como con seres humanos).
El error y el sesgo pueden surgir, entre otras posibilidades, en la seleccion y en el an
alisis e
interpretacion de los datos. Surge la pregunta sobre si el error y el sesgo son inherentes al proceso
investigativo. El sesgo provoca un falso entendimiento de las diferencias entre grupos y genera patrones
incorrectos de enfermedad, por lo que puede considerarse mas importante que los errores al azar, que
afectan a todas las comparaciones por igual (aunque los errores que afectan por igual pueden llevar
tambien a conclusiones err
oneas).
10
1.6.
Conclusiones
11
Captulo 2
Introducci
on
En este captulo revisaremos los modelos epidemiologicos basados en ecuaciones diferenciales ordinarias. Son modelos denominados compartimentales, entendiendo como compartimiento a una regi
on
con un grupo de individuos o material distribuidos uniformemente. Los modelos compartimentales realizan con las siguientes hip
otesis [Galvani and May, 2005]:
La distribuci
on es uniforme en cada compartimiento.
La distribuci
on de individuos al ingresar a un compartimiento es instantanea.
La tasa de paso de un material de un compartimiento a otro se relaciona con la cantidad de
material existente.
Usualmente existe una ley de conservacion de alguna cantidad (masa, energa u otra entidad
fsica), pero en nuestro caso no es estrictamente necesario.
De todos los modelos presentados se hace especial hincapie en el modelo SEIR, que es usado para
modelar epidemias ocasionadas por enfermedades infecciosas con perodo de incubacion no infeccioso
(como, por ejemplo, la gripe), y es el que se toma como base para el desarrollo posterior de los modelos
basados en autom
atas y agentes. A continuacion se realiza un analisis del modelo matem
atico, los
parametros involucrados en el, la estabilidad del sistema y el plano de fase.
12
2.2.
Modelos SEIR
(2.1)
permite un gradiente tanto de individuos como de interaccion entre ellos. Este tipo de ecuaciones
permitira capturar la din
amica en forma precisa, pero el tratamiento matematico es usualmente muy
complicado y en muchos casos innecesario. Efectuando una serie de hipotesis simplificatorias es posible
modelar el sistema de forma satisfactoria mediante ecuaciones diferenciales ordinarias.
De estas simplificaciones surgen una serie de modelos compartimentales aplicados a epidemias.
Entre los m
as utilizados se encuentran los modelos SEIR, que son los analizados en esta tesis. En los
SEIR, los individuos se encuentran divididos en cuatro grupos [Li and Muldowney, 1995, Li et al., 1999,
Li and Jin, 2005]:
Susceptibles (S): Individuos que estan sanos pero que pueden contraer la enfermedad. En este
modelo, esto implica que a
un no han contrado la enfermedad.
Expuestos (E): Individuos que portan la enfermedad pero que, al hallarse en su perodo de
incubaci
on, no muestran sntomas y no infectan a otros.
Infecciosos (I): Individuos que tienen la enfermedad y pueden transmitirla.
Recuperados (R): Se agrupa con esta denominacion a los individuos que se han curado y est
an
inmunizados, y a los individuos que estan enfermos pero en cuarentena (por lo que no infectan a
otros).
Las hip
otesis b
asicas realizadas para construir estos modelos son [Li et al., 2006]:
La enfermedad que se modela confiere inmunidad a las personas que se recuperan.
La poblaci
on total (N ) es constante. Es decir, S(t) + E(t) + I(t) + R(t) = N , Esto implica que
los nacimientos y muertes en el perodo son despreciables, y que la enfermedad no es mortal.
La poblaci
on se encuentra uniformemente distribuida en la region considerada.
El flujo es unidireccional entre los compartimentos (figura 2.1).
La tasa de incremento de E es proporcional al n
umero de contactos entre S y I. Asimismo, esta
es tambien la tasa de decremento de S (dado que el flujo es unidireccional, todo nuevo expuesto
proviene de la poblaci
on susceptible).
13
dS
dT
dE
dT
dI
dT
dR
dT
SI,
N
= SI E,
N
=
(2.2)
=E I,
=I.
Es decir, a partir del momento de inicio de la infeccion, S solo puede disminuir, porque una vez
recuperado, el individuo no puede infectarse nuevamente. La tasa de disminucion es proporcional al
producto entre el tama
no de la poblacion sana y la fraccion infectada en cada momento (I/N ), pues
esto determina la fracci
on de contactos potencialmente infecciosos y, por lo tanto, la velocidad de
infeccion. El aumento del n
umero de individuos expuestos es, como previamente se explico, igual a
la disminuci
on de individuos sanos. Al mismo tiempo, existe una tasa de disminucion de individuos
expuestos, determinada por la duraci
on del perodo de latencia y el ingreso de los individuos expuestos
a la poblacion de individuos infectados. Esta tasa es proporcional a la poblacion misma de expuestos,
ya que cuantos m
as individuos expuestos haya, mayor cantidad pasara al estado infeccioso.
La tasa de disminuci
on de individuos expuestos corresponde a la de aumento en individuos infecciosos. Los infecciosos pasan al compartimento de recuperados tambien a su propia tasa, proporcional al
n
umero de infecciosos. La tasa de individuos que se recuperan es proporcional al n
umero de infectados
en cada momento, por lo que el termino es identico al de disminucion de infecciosos, pero con signo
opuesto. Los par
ametros que afectan a cada termino de la ecuacion pueden tomarse como constantes
o variables, y dependen de la naturaleza de la enfermedad, de la poblacion, su distribucion, h
abitos y
zona geografica.
Si la duraci
on de la enfermedad es lo suficientemente prolongada, deben tenerse en cuenta las tasas
de nacimiento y defunci
on, porque afectan a la evolucion temporal de la epidemia. Durante el transcurso
de la epidemia, los nacimientos se incorporan directamente a la poblacion susceptible. Al mismo tiempo,
las defunciones pueden ocurrir en todas las poblaciones, por lo que un termino relacionado con la tasa
de defuncion debe ser incluido en cada ecuacion. Como a
un se considera a la poblacion constante,
14
la tasa de nacimientos debe estar balanceada con la tasa de defunciones. Estas hipotesis conducen al
siguiente modelo [Li and Muldowney, 1995]:
dS
dT
dE
dT
dI
dT
dR
dT
=(N S)
=
SI,
N
SI ( + )E,
N
(2.3)
=E ( + )I,
=I R.
= N SI S.
(2.4)
dT
N
Es este caso ya no se cumple el requerimiento de poblacion constante de los modelos compartimentales
(S + E + I + R = N t).
15
2.3.
Otros modelos
Existen muchas variantes de modelos epidemiologicos, cada una se adecua mejor a un tipo de
epidemia o enfermedad. Sin embargo, todas guardan una estrecha relacion entre s. Entre ellas, se
pueden mencionar:
Modelos SIR: Si consideramos una enfermedad con un perodo de latencia lo suficientemente
breve para despreciarlo, el compartimento E desaparecera de las ecuaciones consideradas. El modelo
pasa a tener un flujo S I R, y las ecuaciones se reducen a [Beretta and Takeuchi, 1995, Satsuma
et al., 2004]:
dS
=N SI S,
dT
N
dI
= SI ( + )I,
dT N
dR
=I R.
dT
(2.5)
Modelos SIS: Los modelos vistos hasta ahora consideran que los individuos recuperados quedan
inmunizados. Pero si la enfermedad no confiere inmunidad, la clase R ya no puede considerarse, porque
todos los recuperados son nuevamente susceptibles, y el progreso ya no sera unidireccional. Si tampoco
consideramos el perodo de latencia, se tendran solo dos clases, S e I, y un flujo S I S. En esta
situacion, las ecuaciones se reducen a [Vries et al., 2005]
dS
=N SI S + I,
dT
N
dI
= SI ( + )I.
dT N
(2.6)
Como puede verse, el termino correspondiente a los recuperados del modelo SIR, simplemente se incorpora a la ecuaci
on de individuos susceptibles.
Modelos SIRS: Una situaci
on intermedia se dara si los individuos recuperados adquieren inmunidad, pero una cierta proporci
on la puede perder. El compartimento R debe considerarse, pero una
parte de el vuelve al compartimento S, en un flujo S I R S. Las ecuaciones diferenciales que
lo describen son: El modelo pasa a tener un flujo S I R, y las ecuaciones se reducen a:[Vries
et al., 2005, Liu et al., 1986, Wen and Yang, 2008]
dS
=N SI S + R,
dT
N
dI
= SI ( + )I,
dT N
dR
=I R R.
dT
16
(2.7)
El nuevo termino en las ecuaciones corresponde a la proporcion de individuos recuperados que puede
volver a ser susceptible. Este termino se suma en la primer ecuacion y se resta en la u
ltima.
Modelos SEIS: Descartando la caracterstica de inmunizacion, el SEIR se reduce a [Vries et al.,
2005] S E I S, con el modelo dado por:
dS
=N SI S + I,
dT
N
dE
= SI ( + )E,
dT N
dI
=E ( + )I.
dT
(2.8)
MS
M,
N
MS
=
SI S,
N
N
= SI ( + )I,
N
=N
(2.9)
=I R.
2.4.
An
alisis del modelo SEIR
2.4.1.
Par
ametros de las ecuaciones
Los par
ametros pueden considerarse constantes o variantes en el tiempo, dependiendo de las circunstancias [Hethcote, 2000, Li and Muldowney, 1995, Li et al., 1999, 2006]. No obstante, lo m
as
com
un es que sean constantes. En el caso del modelo SEIR, los parametros que afectan a las ecuaciones
diferenciales son:
17
: es la probabilidad efectiva, o tasa por la que un individuo expuesto pasa al estado infeccioso.
Se relaciona con la duraci
on del perodo de latencia en forma inversa (1/ es la duraci
on media
del perodo de latencia).
: es la probabilidad o tasa de recuperacion de los individuos infectados. En forma similar a ,
1/ es la duraci
on media del perodo infeccioso.
: se refiere a la tasa de mortalidad, por persona.
: es la tasa de natalidad. Para el caso de una poblacion constante, es igual a la tasa de mortalidad,
por lo que se usa s
olo uno de los dos.
: el contacto entre susceptibles e infecciosos lleva a la transmision efectiva del agente infeccioso
con una cierta probabilidad, representada en las ecuaciones por el parametro . Este par
ametro
es en realidad una probabilidad efectiva; es la tasa de infeccion por persona, y tiene en cuenta el
tipo de contacto y la duraci
on del perodo infeccioso. Suele denominarse fuerza de infecci
on.
En su forma m
as simple, se considera que cualquiera puede contactar con cualquiera en la poblaci
on
(principio de acci
on de masas), los diferentes compartimentos poblacionales se encuentran mezclados
en forma homogenea. De esta forma, el modelo SEIR se ve muy simplificado. No se consideran factores
como las edades, organizaci
on y estratos sociales, variaciones estacionales o diferencias geogr
aficas. De
esta forma, la fuerza de infecci
on puede considerarse como una constante, independiente del tiempo
u otras variables. Esto, por supuesto, conlleva a un modelo menos preciso, y solo suele ser u
til para
predicciones a corto plazo.
Si se considerara, por ejemplo, la dependencia con el tiempo, se podra tomar a como una funci
on
periodica, que variara seg
un la epoca del a
no
(t) = 0 (1 + 1 cos(2t)).
(2.10)
Si el tiempo est
a expresado en a
nos, se tiene un perodo anual (como se da en el caso del resfro y otras
infecciones).
Ro: este par
ametro adimensional, denominado n
umero b
asico de reproducci
on, determina el potencial de infecci
on de una poblacion, es una medida de la fuerza de la infecci
on. Se define como
el valor promedio de infecciones secundarias que ocurren cuando un individuo infectado es introducido en una poblaci
on formada integramente por individuos susceptibles.[Li et al., 1999] Si bien
no aparece en las ecuaciones en forma directa, esta relacionado con los otros parametros, y especialmente con (Ro y son claves en los modelos epidemiologicos. El problema principal en estos
modelos es que el patr
on de contactos casi siempre es desconocido y difcil de medir. Adem
as, el
termino S(t)I(t) es una fuente importante de no linelidad. Puede hacer la diferencia entre una
evoluci
on cclica de la incidencia y un regimen caotico). La evolucion de una enfermedad puede
determinarse a partir de Ro. Si Ro es menor a 1, la enfermedad tendera a desaparecer porque, en
promedio, un infectado transmite a menos de una persona. De esta forma, cuando cada infectado
se recupera, deja menos infectados nuevos, determinando un decaimiento que continuara a menos
que Ro aumente. Si Ro es mayor a 1, la poblacion infectada permanecera en forma endemica,
18
(2.11)
El producto 0 c es el valor promedio de infecciones por persona por unidad de tiempo, porque el
n
umero de contactos, c, es multiplicado por la proporcion de contactos exitosos. Es decir, 0 c es la tasa
de infecciones por persona, , y Ro queda expresado como D. [Li and Muldowney, 1995]
Para el caso de un SIR sin tasas de natalidad o defuncion, siendo la tasa de recuperaci
on por
persona, 1/ es la duraci
on media del perodo infeccioso, D, ya que:[Satsuma et al., 2004]
19
Tasa de recuperacion =
(2.12)
Si consideramos un SIR con poblacion variable, una porcion de individuos infecciosos abandonar
a el
compartimento por muerte natural. En este caso, la poblacion infecciosa disminuye a una tasa de
+ , por lo que D pasa a ser 1/( + ). Para el modelo SEIR, no todos los expuestos ingresan al
compartimento S, porque tambien estan sujetos a la tasa de defuncion . Solo ingresa una fracci
on
/( + ), que disminuye la duraci
on D, en la misma proporcion. Entonces, Ro queda determinado
para el SEIR, como:
R0 =
( + )( + )
(2.13)
(2.14)
min (1 + /)( + ).
(2.15)
2.4.2.
Un sistema inicialmente en reposo se dice estable si ante cualquier entrada acotada responde
con una salida acotada. En nuestro caso, podemos analizar la estabilidad del sistema analizando su
comportamiento en el equilibrio. Si = , el sistema encontrara el equilibrio cuando:
N S
SI =0,
N
SI ( + )E =0,
N
E ( + )I =0,
(2.16)
I R =0.
Es decir, cuando la poblaci
on de cada compartimento no vare. Para I(0) = 0 y E(0) = 0, el equilibrio
se verifica en todo momento (equilibrio trivial). Si I(0) > 0, se verificara para t .
Sabiendo que S = N E I R, reemplazamos en (2.16)
I
(N E I R) ( + )E = 0,
N
20
(2.17)
y
E=I
( + )
R=
I.
(2.18)
( + )( + )
I
(N I
I I)
I=0
N
(2.19)
( + )
( + )( + )
[
+ + 1] + I[
] = 0
N
(2.20)
b)I1 =
I2 =
(+)(+)
(+)
(
+
N
+ 1)
(+)(+)
(+)
(
+
N
+ 1)
I2 = 0
si
( + )( + )
] > 0
(2.21)
( + )( + )
] < 0.
(2.22)
si
N
(Ro
1) para Ro > 1
0
para Ro < 1
I2 =
0
N
(Ro
para Ro > 1
1) para Ro < 1
N
,
Ro
N (Ro 1)
E=
,
Ro ( + )
N
I=
(Ro 1),
N
(Ro 1).
R=
S=
(2.23)
Para ver el tipo de estabilidad, examinaremos el jacobiano del sistema. Definiendo: s = S/N ; e =
E/N ; i = I/N ; r = R/N , y dividiendo todas la ecuaciones por N , el sistema se reescribe como:
21
ds
dT
de
dT
di
dT
dr
dT
= s si,
=si ( + )e,
(2.24)
=e ( + )i,
=i r.
Si consideramos que s + e + i + r = 1, una de la ecuaciones se deduce a partir de las otras tres. Tomando
s = 1 e i r, podemos reducir el sistema a:
de
=i(1 e i r) ( + )e,
dT
di
=e ( + )i,
dT
dr
=i r.
dT
(2.25)
( + ) (1 e 2i r) 0
( + )
0 ,
J =
0
( + )
( + ) 0 .
J =
0
(2.26)
Resolviendo el determinante, encontramos que los autovalores del Jacobiano son las races de la ecuaci
on
c
ubica
( + )[( + + )( + + ) ] = 0.
22
(2.27)
Un autovalor es claramente 1 = , el cual es siempre negativo, dado que solo se consideran par
ametros positivos. Los otros son las dos races de la ecuacion cuadratica
( + + )( + + ) = 0
(2.28)
2 + ( + 2 + ) + ( + )( + ) = 0,
(2.29)
2,3 =
( + 2 + )
p
( + 2 + )2 4[( + )( + ) ]
2
(2.30)
Para par
ametros positivos, estas races son siempre reales. Si Ro < 1, entonces ( + )( + ) > ,
por lo que [( + )( + ) ] > 0. Esto implica que ambos autovalores son negativos al igual que 1 ,
por lo que el equilibrio trivial con Ro < 1 es local y asintoticamente estable.
Si Ro > 1, ( + )( + ) < , y [( + )( + ) ] < 0. Un autovalor es positivo y el otro
negativo, y como 1 es negativa, el equilibrio en este caso es un punto de ensilladura, inestable. Para el
caso de Ro = 1, el equilibrio no puede dilucidarse por linealizacion. Pero si consideramos la siguiente
funcion de Lyapunov y su derivada
L=+
( + )
i
L0 = i(
R0 1
e i r)
Ro
(2.31)
(Ro 1)
,
Ro ( + )
i = (Ro 1),
r = (Ro 1).
e=
23
(2.32)
( + ) (1
J =
(Ro1)
Ro (+)
( + )
0
( + )[( + + )( + + ) (1
(Ro 1)
(2.33)
Nuevamente 1 = y los otros dos autovalores se obtienen de la ecuacion cuadratica formada a partir
del segundo termino de la ecuaci
on c
ubica. Desarrollando y simplificando los terminos, llegamos a
2,3 =
( + 2 + )
p
( + 2 + )2 4(Ro 1)
,
2
(2.34)
No hay equilibrio endemico para Ro 1. Esto implica que cualquier brote epidemico terminar
a con
la extincion de la poblaci
on infecciosa.
Para Ro > 1, podemos ver claramente que 4(Ro 1) > 0. Esto implica que en este caso
ambos autovalores tambien son negativos al igual que 1 , por lo que el equilibrio endemico es local y
asintoticamente estable.
Figura 2.3: Planos de fase para (a) un valor de Ro menor a uno y (b) para un valor de Ro mayor a uno
2.4.3.
Plano de fase
[Hethcote, 2000, Jacquez and ONeill, 1991] Dada esta restriccion, s+i siempre sera menor que 1, y como
24
tampoco pueden tomar valores negativos, el diagrama en el plano de fase de estos dos compartimentos
estara restringido a un tri
angulo T:
T = {(s, i)|s 0, i 0, s + i 1}
(2.35)
Este tri
angulo es positivamente invariante, es decir que si se parte de un estado inicial interior a
T, todo estado posterior tambien ser
a interior a T para todo t 0.
hs(0), i(0)iM hs(t), i(t)i M, t 0
(2.36)
2.5.
Conclusiones
Existen diversos modelos epidemiologicos basados en ODE, adecuandose mejor a uno u otro tipo
de enfermedad. Las epidemias de gripe son modeladas mediante los SEIR, que modela explcitamente el
perodo latente no infeccioso caracterstico de esta enfermedad. En estos modelos, el n
umero de reproduccion Ro determina la permanencia en forma endemica de la epidemia o su extincion. Este par
ametro
depende de la tasa de infecci
on, la tasa de paso de expuesto a infeccioso, la tasa de recuperaci
on y la
tasa de mortandad, y determina un equilibrio endemico para un valor mayor a 1, mientras que predice
la extincion de la epidemia si es menor o igual a 1. Para que el modelo funcione y este parametro prediga el curso de la epidemia deben cumplirse razonablemente bien las hipotesis de distribucion uniforme
e instantanea, as como ser constantes los parametros en todos los individuos. Esto puede cumplirse
razonablemente bien en poblaciones grandes, pero como veremos en captulos posteriores, no lo hace
en poblaciones m
as peque
nas.
25
Captulo 3
Implementaci
on del modelo cl
asico y
determinaci
on de sus par
ametros
3.1.
Introducci
on
En este captulo se implementa un modelo SEIR basado en ODE y se obtienen los parametros que
mejor ajustan el modelo a un conjunto de datos. Los datos disponibles corresponden a los individuos
reportados como enfermos en la epidemia de gripe de 1918 en la ciudad de Ginebra, Suiza, y el modelo
SEIR modificado es el aplicado en el trabajo desarrollado por Chowell et al. [Chowell et al., 2006, 2008]
3.2.
En el trabajo de Chowell et al. se utiliza un modelo SEIR con el agregado de tres compartimentos:
Un compartimento de individuos reportados, dado que son los u
nicos datos de los que se dispone.
Un compartimento de individuos asintomaticos, partiendo del supuesto de que una porci
on de
la poblaci
on tiene una carga viral suficiente como para infectar a otros (aunque sea en menor
medida) pero sin sintomatologa como para ser reportado.
Un compartimento de individuos muertos por la enfermedad.
Con estos nuevos compartimentos, el modelo SEIR queda reformulado como se ve en la figura 3.1.
Como en el modelo SEIR tradicional, los nacimientos ingresan en el compartimiento de susceptibles, mientras que las muertes naturales ocurren en todos los compartimientos, con tasa . Tanto
los infecciosos del compartimiento I como los del J tienen una tasa de infeccion , mientras que el
compartimiento de asintom
aticos infecta con tasa q. Los individuos expuestos pasan a infecciosos o
26
27
3.3.
=N S SI + J +
=S
q
A,
N
I + J + qA
( + )E,
N
=(1 )E (1 + )A,
=E ( + 1 + )I,
(3.1)
=I (2 + + )J,
=1 A + I + 2 J R,
=J.
Para resolver este sistema de ecuaciones en forma numerica se emplea la funcion ode45, incluida
en la biblioteca de funciones de Matlab, la cual utiliza el metodo de Runge-Kutta de cuarto orden, el
mas utilizado por su relaci
on
optima entre costo computacional, estabilidad y precision. Para el metodo
de Runge-Kutta de orden 4, si definimos el problema inicial de la siguiente manera:
y 0 = f (x, y), y(t0 ) = y0
(3.2)
(3.3)
k1 =f (xi , yi ),
1
1
k2 =f (xi + h, yi + k1h),
2
2
1
1
k3 =f (xi + h, yi + k2h),
2
2
k4 =f (xi + h, yi + k3h).
(3.4)
Donde:
Observese que las k son relaciones de recurrencia, esto es, k1 aparece en la ecuacion para k2, la
cual aparece en la ecuaci
on para k3, etc. As, el siguiente valor yn + 1 es determinado por el presente
valor yn mas el producto del tama
no del intervalo h por una pendiente estimada. La pendiente es un
promedio ponderado de pendientes:
28
pendiente =
k1 + 2k2 + 2k3 + k4
6
(3.5)
Los metodos de Runge-Kutta logran una exactitud superior a los metodos basados en expansiones
de Taylor, sin requerir el c
alculo de derivadas superiores. Para el modelo determinstico empleado para
la epidemia de gripe, los par
ametros a ajustar son:
Ne, es la poblaci
on inicial de individuos en estado de latencia o de incubacion del la enfermedad.
Ni, es la poblaci
on inicial de individuos que se encuentran en estado infectivo
, es la tasa de infecci
on.
, es la fracci
on de tasa de individuos en estado latente que pasan a estado infeccioso.
1 , es la tasa de recuperaci
on de individuos infecciosos y asintomaticos.
2 , es la tasa de recuperaci
on de individuos hospitalizados.
, es la tasa de individuos diagnosticados .
q, es un par
ametro proveniente de la tasa de infeccion de los individuos asintomaticos a = b q.
Estos no pueden tomar un valor cualquiera, sino que solo pueden estar dentro de un rango aceptable, de esta forma los intervalos entre los cuales dichos parametros pueden variar quedan definidos de
la siguiente manera:
0 < N e < 300, 0 < N i < 300, 0 < < 50, 0 < < 1, 0 < 1 < 1, 0 < 2 < 1, 0 < < 1, 0 < q < 1
El resto de los par
ametros fueron obtenidos de diferentes fuentes [Chowell et al., 2006, 2008] y no
son sometidos a la minimizaci
on.
La superficie de error contiene muchos mnimos locales, por lo que el uso de algoritmos de optimizacion local result
o ineficiente y en muchos casos inaplicable en conjunto con las restricciones
impuestas. Para lograr llegar a un mnimo cercano al global se opto por el uso del metodo de recocido simulado en conjunto con un metodo de punto interior. El recocido simulado es un algoritmo de
29
optimizacion probabilstico que logra una buena aproximacion al mnimo global de una funci
on dada.
Su funcionamiento emula al proceso real de recocido, en el cual un cuerpo es enfriado lentamente, de
modo de adoptar una configuraci
on de mnima energa. Los metodos de punto interior transforman un
problema de optimizaci
on con restricciones en otro sin ellas. Estos metodos fijan una barrera que
evita que se salga de la regi
on factible, moviendose siempre dentro de ella (puntos interiores). Dado un
punto inicial, estos metodos encontrar
an un mnimo local cercano, no asegurando que sea global.
Para aplicar el metodo de recocido simulado se utilizo la funcion de Matlab simulannealbnd.
El proceso se repiti
o sucesivas veces para lograr una mejor aproximacion al mnimo global. Luego
de aplicado el recocido simulado se refino el mnimo hallado mediante el metodo de punto interior
implementado en la funci
on de Matlab fmincon. Esta funcion intenta encontrar el mnimo de una
funcion escalar comenzando desde un punto inicial estimado, que debe proporcionarse. En nuestro
caso, el punto inicial corresponde al mnimo encontrado por la funcion simulannealbnd.
El error cuadr
atico fue calculado utilizando un promedio ponderado del error cuadratico entre
individuos infectados reportados y la cantidad estimada por el modelo y el error cuadratico de esas
mismas funciones acumuladas. Dicho de otra manera, el error cuadratico queda representado por la
siguiente ecuaci
on:
EC =
X acumI(i) acumrealI(i)2
I(i) Ireal(i)2
l
+ (1 l)
errorestimado1
errorestimado2
(3.6)
donde:
l es un factor de ponderaci
on, que vara entre 0 y 1. Si es igual a 0 no se tiene en cuenta a la
funcion acumulada para calcular el error, si es igual a 1 el error se calcula solamente teniendo en
cuenta el acumulado de la funci
on.
El error estimado es un factor de normalizacion, que corresponde al error obtenido utilizando
un juego de par
ametros de una minimizacion preliminar, utilizando l = 1 para el error estimado
1 y l = 0 para el error estimado 2.
I es el n
umero de infectados calculado.
Ireal es el n
umero de infectados reportados.
acumI es la funci
on acumulada de la cantidad calculada de infectados.
acumrealI es la funci
on acumulada de la cantidad reportada de infectados.
Para encontrar el valor l
optimo se reformulo el calculo de error como un problema multi objetivo, y se
procedio a una variaci
on sistem
atica de l en cada minimizacion. El acumulado de la funcion realiza un
filtrado de la funci
on original, lo que aporta mayor estabilidad pero se pierde informacion importante
aportada por la din
amica de la funci
on original. Del analisis de las figuras 3.2(a), 3.2(b), 3.2(c), 3.2(d)
y 3.2(e), se concluye que el l
optimo puede variar entre 0,1 y 0,3, en el caso de q, puede observarse
en la figura 3.2(e) que la mayor variacion del parametro se obtiene para valores de l cercanos a 0,3.
30
(a) variaci
on de con respecto a l
(b) variaci
on del par
ametro con respecto a l
(c) variaci
on del par
ametro con respecto a l
(d) variaci
on del par
ametro 1 con respecto a l
(e) variaci
on del par
ametro q con respecto a l,
puede observarse variaci
on solo en valores de l cercanos a 0,3
31
8,32
0,082
1
0,418
2
0,418
0,16
q
0
Ne
365
Ni
186
32
3.4.
Conclusi
on
33
Captulo 4
Introducci
on
En este captulo se hace una revision de los distintos tipos de automatas de estados finitos y su
uso como aut
omatas celulares para modelar poblaciones de objetos similares. Se hace hincapie en su
aplicacion en el modelado de epidemias y se ejemplifica su uso mediante una breve revision de modelos
epidemiologicos previos que abordan la problematica desde distintas prespectivas.
4.2.
Aut
omatas
Para poder presentar las diversas aproximaciones que se usan en el modelado de epidemias mediante
automatas celulares es preciso definir primero que se entiende por automata. En el contexto de las
ciencias de la computaci
on, un aut
omata es un modelo matematico que realiza computos en forma
automatica sobre una entrada para producir una salida. El modelo consta de un alfabeto, un conjunto
de estados y un conjunto de transiciones entre estados. Se comienza en un estado inicial y se va leyendo
una cadena de caracteres del alfabeto, a medida que se desplaza de un estado a otro, para finalmente
detenerse en un estado final o de aceptacion, que representa la salida. Los estados pueden ser finitos o
infinitos. En nuestro caso, la cantidad de estados es finita.[Fu, 2002]
Formalmente, un aut
omatas de estados finitos determinista puede definirse con un quintuplete de
la forma:
A = F(E,X,s,F,T) [Fu, 2002, Beauchemin et al., 2005, White et al., 2007]
Donde:
34
E es el conjunto de estados.
X es el alfabeto de entrada.
s E es el estado inicial.
F E es un conjunto de estados finales o de aceptacion.
T son las reglas o funci
on transicion entre estados.
La funci
on de transici
on indica a que estado se va a pasar sabiendo cual es el estado actual y
el smbolo que se est
a leyendo. En un automata determinstico la transicion posible es solo una, y el
estado actual es una representaci
on de la actividad pasada del sistema, que es suficientemente detallda
como para servir de base para determinar que salida producira y como sera actualizado por la entrada.
Una variante de este tipo de aut
omata es el automata de estados finitos con salida. Este tipo de
automata agrega a la definici
on anterior una funcion . Esta funcion emite un smbolo de salida. La
salida puede depender del estado en que se encuentra el automata, en cuyo caso recibe el nombre de
maquina de Moore, o depender de la transicion, denominandose entonces maquina de Mealy. En este
u
ltimo caso, es equivalente a que la salida dependa del estado y la entrada. En los automatas con salida
es com
un tambien agregar un conjunto Y a la definicion original, correspondiente al alfabeto de salida,
que puede ser distinto al de entrada.[Quanxing and Zhen, 2006, HOYA et al., 2007, Fu, 2002]
Otro tipo de aut
omata de estados finitos es el no determinista. Un automata finito no determinista
es aquel que presenta cero, una o m
as transiciones para el mismo caracter del alfabeto. El estado
inicial tambien puede ser variable. A diferencia del caso determinista, la funcion de transici
on lleva
a un conjunto de estados, y el automata puede estar en varios estados a la vez (o en ninguno). El
estado siguiente no s
olo depende de la entrada actual sino tambien de un n
umero arbitrario de eventos
posteriores. No es posible determinar en que estado se encuentra la maquina hasta no recibir las entradas
posteriores. En este tipo de aut
omatas es posible cambiar de estado en ausencia de smbolo de entrada,
en cuyo caso se denomina aut
omata de estados finitos no determinista con transiciones vacas.[HOYA
et al., 2007, Quanxing and Zhen, 2006]
El caso m
as generalizado de aut
omata no determinista recibe el nombre de automata probabilstico.
Un automata celular probabilstico es aquel en el que las reglas de transicion son probabilsticas,
generalmente representadas como una matriz de transicion. La probablidad de pasar a cierto estado
puede depender del estado actual o de la entrada. Tambien puede que el valor de salida dependa de una
funcion de distribuci
on de probabilidad propia de cada estado o entrada. Las transiciones mediante
entradas vacas tambien son posibles en este caso, pudiendo asociarse una probabilidad de cambio
de estado. Desde el punto de vista biologico se trata de un caso mas realista, puesto que en muchas
aplicaciones de la Biologa o de la Fsica no es posible predecir hacia donde va a crecer un tejido o
como va a moverse exactamente un electron. A la hora de simular dicho automata debe calcularse el
siguiente valor de manera aleatoria, siguiendo una distribucion de probabilidad.[Mikler et al., 2005]
Es com
un representar a los aut
omatas mediante grafos de estados. Los grafos permiten representar
los estados del aut
omata y las transiciones posibles hoya2007modeling. En la figura 4.1 se muestra un
ejemplo de un grafo correspondiente a un automata de estados finitos de cuatro estados, donde:
35
4.3.
Aut
omatas celulares
Los aut
omatas pueden usarse para simular grandes poblaciones de objetos similares si se permite
alguna forma de interconexi
on entre ellos. La forma mas com
un de relacionarlos y organizarlos es a
traves de redes de aut
omatas celulares, que consisten en un conjunto de automatas (o celulas) que
modifican sus estados siguiendo algoritmos sencillos. Los automatas celulares son redes de aut
omatas
simples conectados localmente [White et al., 2007, Beauchemin et al., 2005, Fu, 2002]. Cada aut
omata
simple produce una salida a partir de varias entradas, modificando en el proceso su estado seg
un una
funcion de transici
on. Por lo general, el estado de una celula en una generacion determinada depende
u
nica y exclusivamente de los estados de las celulas vecinas y de su propio estado en la generaci
on
anterior. Mediante la interconexi
on de un gran n
umero de automatas pueden modelarse diferentes
sistemas, tanto macrosc
opicos como microscopicos, con un alto grado de complejidad. Constituyen una
muy buena alternativa a los sistemas de ecuaciones diferenciales.
Una red de aut
omatas celulares queda definida formalmente por la tupla:[Teweldemedhin et al.,
2004, HOYA et al., 2007]
R = G(T,C)
Donde:
T es la topologa (forma de interconexion de las celulas).
C son los grados y tipos de acoplamiento entre celulas.
36
Otro de los aspectos importantes de un automata celular son las reglas de transicion. Son las
que determinan la evoluci
on del sistema. Las reglas de transicion dependen de la geometra de la
trama, de la vecindad y del conjunto de estados. En general, pueden especificarse de muchas maneras
diferentes, la especificaci
on m
as directa consiste en anotar el resultado de la regla de transici
on para
cada configuraci
on posible de estados en la vecindad[HOYA et al., 2007]. Una clase importante de reglas
de transicion son las probabilsticas. En este caso la regla de transicion no es una funcion que tiene
exactamente un resultado para cada configuracion de la vecindad, sino que es una regla que provee uno
o mas resultados posibles con probabilidades asociadas. Una propiedad importante de los aut
omatas
celulares es que un cambio muy peque
no en la regla de transicion puede tener efectos muy grandes
sobre la dinamica de la red.
4.4.
Aut
omatas celulares aplicados al modelado de epidemias
En la literatura actual existen muchas implementaciones de modelos poblacionales en base a modelos celulares. Las formas de encarar el modelado son diversas, pudiendo agruparse en ocho categoras,
seg
un modelen en forma continua o discreta el espacio, el tiempo o los individuos. En el caso especfico
de los automatas celulares, la evoluci
on temporal se efect
ua siempre en pasos discretos, y el espacio
esta conformado por una grilla fija, donde cada celda se encuentra en un estado de varios posibles
dentro de un conjunto finito.
Dado el interes de capturar los efectos de la heterogeneidad poblacional sobre la evolucion temporal
de la epidemia, el modelado de la poblacion en forma discreta (con un individuo por celda a lo sumo), se
evidencia como la forma natural. En este caso, los estados posibles de cada celda se derivan directamente
de los compartimentos definidos en el modelo clasico, contemplando ademas un estado adicional para
el caso de las celdas vacas.
Sin embargo, en la literatura abundan los trabajos en los que se considera a cada celda como una
distribucion homogenea de individuos de cada tipo[Beauchemin et al., 2005, Berec, 2002]. En estos casos
las celdas representan
areas de igual tama
no que contienen una poblacion especfica. Diferentes celulas
tendran diferentes poblaciones, es decir, diferentes densidades y posiblemente diferentes propiedades
de movilidad. Se modela la dispersi
on de la infeccion mediante el ajuste de la fuerza de contacto entre
cada celda y las incluidas en su vecindad. Las infecciones ocurren por contacto entre individuos de
una misma celda o de celdas vecinas. En este caso, el estado de cada automata puede considerarse
como uno solo, y lo que se visualiza es la salida de cada celda, consistente en la cantidad de individuos
correspondiente a uno u otro compartimento en cada instante de tiempo. Las ecuaciones diferenciales
del modelo cl
asico est
an incluidas explcitamente en cada celda, y la evolucion de la epidemia en cada
una sigue la evoluci
on temporal del modelo clasico, con las modificaciones que puedan surgir del paso
de individuos desde o hacia una celda en particular. Sin embargo, tomando a todos los aut
omatas
como un conjunto, la evoluci
on temporal de la epidemia es similar a la del modelo clasico. Muchos
modelos usan reglas deterministas para la actualizacion de las celdas. Pero en el caso de las epidemias,
las reglas probabilsticas parecen reflejar con mayor precision el comportamiento real. En general, las
actualizaciones de las celdas se realizan en varias fases: fase de movimiento, fase de exposicion, infecci
on,
recuperacion, etc. Si bien existen mnimas diferencias en los resultados, en general es indistinto el orden
en el que se implementen las fases. La fase de movimiento es distinta para los casos de poblacion discreta
40
o continua, pero en ambos casos consiste en una simulacion de movimiento poblacional mediante el
cambio de la salida o del estado de celdas vecinas.
4.4.1.
Revisi
on de modelos de aut
omatas celulares usados en el modelado de epidemias
Para contrastar mejor nuestro enfoque con el de otros modelos de automatas se presenta en esta
seccion un breve repaso de algunos trabajos previos.
Martn del Rey [White et al., 2007] propone un modelo SEIR implementado a traves de un aut
omata celular en donde cada celula representa a una poblacion en particular como puede ser un n
ucleo
urbanstico o rural. Los vecinos de cada celula son aquellos entre los cuales existe una va de comunicacion que permita el flujo de poblaci
on desde uno hacia el otro. Las suposiciones en las que se basa
este modelo pueden resumirse de la siguiente forma:
El n
umero total de individuos en el espacio celular y en cada nodo en particular permanece
constante a lo largo del tiempo. Es decir que no se tienen en cuenta los procesos migratorios ni
los nacimientos o las muertes. A su vez, cada celula posee una capacidad maxima de poblaci
on.
La va de contagio de la enfermedad es en forma directa, por contacto fsico entre un individuo
infectado y un individuo susceptible (principio de accion de masas).
Por u
ltimo, los individuos pueden desplazarse entre nodos y luego retornar hacia el nodo al cual
pertenecen a lo largo del tiempo.
En este modelo lo que se implementa es un sistema SIR clasico en cada nodo o celula. Presupone
una distribuci
on homogenea de la poblacion en cada nodo y heterogenea entre nodos. Implementa un
sistema de ecuaciones en diferencias en cada nodo, que es identico al clasico con el agregado de un
termino de infecci
on entre celdas vecinas.
Otro ejemplo con una metodologa similar es el de Quan-Xing Liu, Zhen Jin y Mao-Xing Liu [Liu
et al., 2006]. En este caso se implementa un modelo SEIR clasico basado en ecuaciones diferenciales
ordinarias. El trabajo explora el comportamiento espacial de la epidemia en enfermedades que tienen
caracter estacional. Para esto se considera una tasa de infeccion variable, seg
un una funcion sinusoidal.
No obstante, la tasa es la misma en todas las celdas en un instante dado de tiempo. Para simular el
movimiento espacio-temporal asociado a las diferentes olas de una epidemia se implementa un modelo
denominado dependiente de la vecindad, que es una modificacion del modelo clasico, de modo que
las ecuaciones no evolucionan solo en funcion del tiempo t si no tambien en funcion del espacio r.
Es, en definitiva, un sistema de ecuaciones diferenciales parciales discretizado en tiempo y espacio. A
diferencia del primer ejemplo, no se modela una infeccion entre celdas vecinas sino una migraci
on de
individuos, por lo que la poblaci
on en cada celda es variable. Se incorpora, ademas, una estocasticidad
en la migraci
on.
Definiendo c(r, t) como el vector de densidades individuales para una posicion r dada y un tiempo
t determinado, L(c(r, t)) como el vector de cinetica local (correspondiente al modelo de ecuaciones
41
diferenciales ordinarias) y D como la matriz de coeficientes de difusion (que afecta la velocidad de paso
entre celdas para cada tipo de individuo), el sistema se expresa en forma compacta como:
c(r, t)t = Lcrm, t + D2c(r, t)
(4.1)
efectivo de infecci
on. Este u
ltimo determina la distancia maxima que el virus puede moverse fuera
de un huesped en particular. Por otro lado, el radio de movimiento determina la maxima distancia
que un huesped determinado puede moverse y esta asociado a una probabilidad de movimiento. Esta
probabilidad determina la frecuencia con la que puede ocurrir dicho evento dentro de una celula o entre
celulas vecinas. Se asume una poblaci
on distribuida en forma homogenea en cada celula. La celula hacia
la cual ocurre un proceso migratorio desde la celula actual se elige en forma aleatoria entre las vecinas
a la actual. Un par
ametro de inmigracion permite a este modelo simular un mundo abierto o cerrado
dependiendo del valor de este. Este define la probabilidad de cada celula de recibir inmigrantes, este
evento tambien se encuentra afectado por la capacidad de carga. El modelo tambien incorpora una tasa
de nacimiento y muerte natural que se refieren a la incorporacion de un nuevo individuo a la celula
por reproducci
on natural en el caso del primer parametro y a la desaparicion de uno en el caso del
segundo, este u
ltimo afecta a todos los individuos de la poblacion. Estos eventos pueden ocurrir con una
probabilidad asociada a cada uno en cada paso de tiempo. La morbilidad del virus es una medida de
cuan rapido el virus mata al huesped, solo afecta a los que se encuentran en el estado de infectado. En
este modelo tambien se incorporan otros parametros probabilsticos como la probabilidad de infecci
on
por contacto con vectores, la probabilidad de re-infeccion y la probabilidad de infeccion espont
anea. El
algoritmo en el que se basa este modelo pude resumirse de la siguiente manera:
Algoritmo 1 Fase de movimiento
para i = 1 f ilas hacer
para j = 1 columnas hacer
celda = Grilla(i, j){selecci
on de una celula de la grilla}
si movimiento Z [0, 1] entonces
vecina = Grilla(x [1, V ], y [1, V ]){seleccion de una celula vecina aleatoria de la vecindad
de tama
noV }
vecina indiviuos = vecina indiviuos + celda individuos
fin si
fin para
fin para
El modelo de Shih Ching Fu llega a incorporar cientos de individuos por celda. En cierta escala
de trabajo esto puede ser v
alido, pero tiene el efecto no deseado de suavizar la dinamica en forma
similar a los ejemplos anteriores. En nuestro modelo simularemos un individuo por celda como m
aximo.
4.5.
Conclusi
on
43
entre celdas mediante el intercambio de estados. En conjunto, representan una forma simple, flexible y
eficiente de simular evoluciones temporales y espaciales de epidemias.
44
Captulo 5
Implementaci
on del modelo de
aut
omatas celulares
5.1.
Introducci
on
5.2.
Al implementar el modelo cl
asico [Chowell et al., 2006, 2007, 2008] con los parametros optimizados se observa c
omo la evoluci
on se acerca a los datos reales de una forma suavizada. Utilizando
distintos juegos de par
ametros optimizados se obtienen evoluciones levemente diferentes, pero siempre suavizadas, como es de esperar en un modelo que considera a la poblacion como algo continuo y
perfectamente homogeneo. En los datos de los individuos reportados se observan, luego de alcanzado
el maximo, peque
nas oleadas secundarias que pueden interpretarse como rebrotes locales ocasionados
por distribuciones heterogeneas de las cargas virales, de la inmunidad o de los individuos en el espacio. Esta posible interpretaci
on no puede ponerse a prueba en el modelo clasico y, como se vio en el
captulo anterior, tampoco en buena parte de las implementaciones de modelos basados en aut
omatas
celulares. Teniendo en cuenta estas consideraciones y las previas, una primera definicion de nuestra red
de automatas considera:
Cada celda representa un individuo en alguno de los estados posibles, o bien el estado de celda
vaca. No se hace distinci
on entre el estado de fallecido y el de celda vaca. Los nacimientos
implican el paso de celda vaca a celda en estado susceptible.
La transici
on entre estados es probabilstica. Las probabilidades de transicion corresponden a
los par
ametros del modelo cl
asico. Estos parametros son determinsticos en el modelo cl
asico,
pero como resultado de una agregacion de probabilidades individuales bajo la asuncion de una
poblaci
on suficientemente grande. Por lo tanto, es la transicion probabilstica la que sustenta al
modelo cl
asico y no al reves. Aplicada directamente a cada automata, se evidencia una variabilidad
46
decreciente al aumentar la poblacion, hasta coincidir con la evolucion determinstica del modelo
clasico.
La distribuci
on inicial es al azar, cumpliendo con la asuncion de distribucion homogenea para
tama
nos grandes de poblaci
on.
Se simula un movimiento al azar de los automatas mediante un cambio de estado recproco de
celdas vecinas, es decir, una celda pasa de estado E1 a E2 mientras que una vecina pasa de estado
E2 a E1. Este movimiento busca emular en forma aproximada el movimiento de individuos reales
(que en realidad no siguen movimientos al azar), que contribuye a la distribucion homogenea y a
los contactos entre infecciosos y susceptibles.
El contacto potencialmente infeccioso se efect
ua entre individuos infecciosos (sintomaticos y asintomaticos) y los susceptibles que se encuentren dentro de la vecindad definida como zona de
influencia de los individuos infecciosos. La infeccion es tambien probabilstica y directamente
relacionada con el par
ametro correspondiente del modelo clasico.
Por simplicidad, la grilla a usar es de tipo rectangular, y la vecindad es de tipo Moore, con un
tama
no no definido a priori.
La condici
on de frontera es fija, con un contorno compuesto por celdas vacas no interactuantes,
compatible con la situaci
on en una ciudad: una zona de alta densidad de poblacion rodeada de
una zona de densidad mucho menor.
El automata queda entonces definido como una maquina de Moore estocastica mediante la sextupla
A = (E, X, Y, , , P o) , donde:
E, el conjunto de estados posibles, comprende 7 estados: S (susceptible), E (expuesto), I (infeccioso), A (asintom
atico), J (infeccioso reportado), R (recuperado) y D (muerto o vaco).
X es el conjunto de entrada (n
umeros reales). Un automata u
nicamente recibe una entrada cuando se encuentra en estado S, emitida por otro automata en estado I o A, cuando el receptor
se encuentra en la vecindad del emisor. Las transiciones que no implican contacto con individuos infecciosos se efect
uan en forma probabilstica independientemente de una posible entrada
(transiciones sobre entrada vaca ).
Y es el conjunto de salida (igual a X) emitido en estado I o A, correspondiente con la entrada
recibida en estado S. La salida corresponde a la probabilidad de infeccion por contacto que tenga
el automata en estado I o A, obtenida de distribuir el valor de beta para ese automata en la
vecindad que se considere.
es la funci
on de transici
on de estado, que aplicada sobre el estado activo en la iteraci
on k,
decide probabilsticamente el estado activo en la iteracion k+1. La funcion se aplica en dos pasos,
uno correspondiente al cambio de estados por infeccion y recuperacion y otro correspondiente al
movimiento. Para decidir los cambios de estado se definen dos matrices de probabilidad: una para
la transici
on sobre entrada vaca y otra para la transicion por contacto con infecciosos.
47
S
E
I
A
J
R
D
S
1
0
0
0
0
0
0
E
0
1 ( + )
0
0
0
0
0
I
0
0
1 ( + 1 + )
0
0
0
0
A
0
0
0
1 (1 + )
0
0
0
J
0
0
0
1 (2 + + )
0
0
R
0
0
1
1
2
1
0
S
E
S
1 /
0
E
/
1
Siendo cada elemento pij de la matriz la probabilidad de pasar del estado i al j en cada instante
de tiempo, y colocando los estados S, E, I, A, J, R y D en orden creciente desde la fila o columna 1
hasta la 7, la matriz de transici
on sobre entrada vaca queda definida como se muestra en el cuadro 5.1
Donde los smbolos corresponden a los parametros usados en el modelo clasico.
Definiendo el tama
no de vecindad como y al valor de entrada como (pudiendo corresponder a
o a q seg
un provenga de un infeccioso sintomatico o asintomatico, respectivamente), la matriz de
transicion por contacto queda definida como se detalla en el cuadro 5.2
Finalmente, el movimiento es equiprobable desde una celda centrada en un area de tama
no predefinible a cualquier otra, inclusive ella misma, incluida dentro del area. Las celdas se intercambian
posiciones, lo que puede interpretarse como cambios de estado.
es la funci
on de salida, que emite el valor de tasa de infeccion del automata si este se encuentra
en estado I o A. Este valor est
a relacionado con el del modelo clasico, pero no es exactamente
el mismo. En el modelo cl
asico considerabamos que estaba compuesto por:
= 0c
(5.1)
El par
ametro que se utiliza en la funcion de salida del automata corresponde a 0 del modelo
clasico, es decir, la probabilidad de transmision por contacto.
A su vez, el n
umero potencial de contactos infecciosos c se relaciona con la vecindad en el modelo
de aut
omatas, pero no es exactamente el n
umero de vecinos. Para poder realizar la equivalencia
entre ambas metodologas, el n
umero de celdas vecinas en el modelo de automatas se multiplica
por la densidad de celdas ocupadas en la grilla -que puede variar seg
un el tama
no de grilla usado
48
Ei/G
Ii/G
Ai/G
Ji/G
(5.2)
P(o), el vector de estado inicial, esta compuesto por las probabilidades de cada estado de ser el
inicial en un aut
omata dado. Definiendo como Gt a la cantidad total de celdas en la grilla y como
Si, Ei, Ii, Ai, Ji, Ri, Di al n
umero inicial de individuos en cada estado en la grilla (siendo su
suma igual a Gt y no a la poblacion total, ya que Di incluye las celdas vacas), el vector queda
definido como se muestra en el cuadro 5.3
En nuestro caso s
olo se consideran probabilidades para los estados S, E, I y D, derivadas de los
valores iniciales de individuos en el modelo clasico, y las celdas que quedan vacas en consecuencia.
Todos los otros estados no cuentan con individuos iniciales.
La red de aut
omatas queda definida por R = G(T, C), donde:
La topologa T es cuadrada. La vecindad es de tipo Moore, y solo es considerada para las celdas
en estado I o A. Las condiciones de frontera son fijas, con un contorno compuesto por celdas
vacas no interactuantes.
La conexi
on C es unidireccional desde las celdas en estado I o A hacia las celdas en estado S que
esten dentro de la vecindad. La conexion es isotropa e igual en cualquier punto de la vecindad, y
aporta una entrada a cada celda S consistente en el valor de que tenga la celda I o A, utilizado
para efectuar la transici
on probabilstica hacia el estado E. Las celdas en estado S que esten
incluidas en varias vecindades en un paso de tiempo dado tendran tantas oportunidades para
cambiar de estado como la cantidad de vecindades en las que esten incluidas.
En el c
odigo implementado puede dividirse en dos ciclos principales como se ve en el algoritmo
3, luego de la inicializaci
on de la grilla con individuos (Grilla, N t). Un primer ciclo que va desde 1
hasta el n
umero total de das que abarca la primer ola de la epidemia de gripe (N ), en este caso 73. El
segundo ciclo recorre uno a uno cada casillero de la grilla; en este ciclo pueden distinguirse 7 procesos
o instancias diferentes en la, estos son:
1. Infecci
on.
49
50
Algoritmo 3 Din
amica del aut
omata celular
Grilla{Grilla cuadrada de NxN en donde evolucionan los automatas}
N t = IndividuosT otales
N = DiasT otales
para Dia = 1 N hacer
para i = 1 N t hacer
{Infecci
on}
{Expuesto a Infeccioso}
{Paso a Reportados}
{Recuperaci
on}
{Muerte por enfermedad}
{Nacimientos y muertes naturales}
{Movimiento de individuos}
fin para
fin para
Algoritmo 4 Estado infeccioso
si Estado = I entonces
si V ecino = S entonces
Z U [0, 1]
si Z < / entonces
Estado = E
fin si
fin si
si no
si Estado = A entonces
Z U [0, 1]
si Z < q/ entonces
Estato = E
fin si
fin si
fin si
Algoritmo 5 Estado Expuesto
si Estado = E entonces
Z U [0, 1]
si Z < r entonces
Estado = I
si Z < r entonces
Estado = A
fin si
fin si
fin si
51
52
5.3.
A la hora de intentar reproducir el modelo clasico [Chowell et al., 2008] con los parametros minimizados, se presentan varios obst
aculos y alternativas a emplear. En primer lugar, se presenta el
problema de la escala a utilizar. Es evidente que a mayor tama
no de grilla y poblacion empleada, m
as
cerca estaremos de la asunci
on de poblacion grande del modelo clasico [Chowell et al., 2007] (as como
mayor sera el costo computacional de la simulacion). Como la extension de la validez de esta hip
otesis
es justamente algo que se est
a poniendo a prueba al aplicar el modelo de automatas, no es necesario ni
deseable usar tama
nos de grilla demasiado grandes a la hora de analizar el comportamiento temporal
de la epidemia, pero s lo es a los efectos de validar el modelo de automatas usando como par
ametro el
modelo clasico.
Otra elecci
on necesaria y que muestra efectos importantes en el comportamiento global es la del
tama
no y forma de la vecindad. El uso de formas alternativas no muestra ning
un cambio significativo,
por lo que se elige la de Moore por razones de simplicidad de programacion y de computo. El tama
no
de la vecindad, en cambio, determina el grado de influencia global de la heterogeneidad. Cuanto mayor
sea el tama
no de vecindad usado, m
as se acercan los resultados a la asuncion de homogeneidad espacial
del modelo cl
asico. Esto se debe a que con un tama
no muy grande de vecindad los infecciosos pueden
influir aun en zonas de baja densidad de infecciosos, suavizando el efecto de heterogeneidad. Si
usasemos un tama
no de vecindad que abarque toda la grilla, no importara la distribucion espacial de
los individuos; el resultado sera el equivalente a una distribucion perfectamente homogenea porque
cada infeccioso influira en toda la grilla, sin importar su ubicacion. El tama
no de vecindad tambien
representa un lmite para el valor de usado. Como el valor de /beta ajustado en el modelo cl
asico
es mayor a uno pero en cada celda la probabilidad de contagio no puede ser mayor a uno, la tasa de
contagio depender
a de la cantidad de celdas con las que pueda interactuar el individuo infeccioso en
cada unidad de tiempo. Por ejemplo, con una vecindad de Moore de radio r = 1, un individuo infeccioso
no podra contagiar a m
as de ocho individuos susceptibles en cada iteracion. Para asegurar un lmite
superior apropiado a la hora de ajustar el modelo de automatas, se eligio un radio de Moore de r = 3,
que permite un m
aximo de 48 contagios por unidad de tiempo.
Por u
ltimo, es posible efectuar una modificacion del modelo en el compartimento J. Este compartimento es incluido en el modelo cl
asico por necesidad, dado que los datos corresponden a individuos
reportados y no al total de enfermos. Sin embargo, la tasa de infeccion se considera igual a la del
compartimento I. A todos los efectos del modelo, su comportamiento no vara respecto del que tienen
los individuos infecciosos sintom
aticos. Es entonces posible eliminar el compartimento J y obtenerlo al
final de cada iteraci
on a partir de la tasa de reportados. Esto da lugar a un error inicial, dado que en
el modelo cl
asico no hay individuos iniciales en J. Sin embargo, esta modificacion puede usarse para
obtener una ventaja adicional, como se vera mas adelante.
53
54
55
5.4.
5.4.1.
Heterogeneidad y superspreading
El uso de una tasa constante de infeccion no tiene en cuenta el rol de la variacion individual en
el proceso de infecci
on. Esta variaci
on puede ser de gran influencia cuando la distribucion espacial
tampoco es uniforme y cuando hay una presencia importante de superspreaders. Se define como
superspreaders a aquellos individuos dentro de la poblacion que son capaces de infectar a un n
umero
mayor de individuos susceptibles que el promedio, en otras palabras, si Ro es el n
umero reproductivo
de la epidemia, un superspreader posee un n
umero reproductivo mayor que el promedio.[Galvani and
May, 2005, Lloyd-Smith et al., 2005] De esta forma podemos definir el n
umero reproductivo individual,
, como el n
umero de casos secundarios esperados por un infectado en particular. Este parametro puede
ser descripto por medio de funciones de densidad de probabilidad continuas con una o varias medias
seg
un sea el caso de la funci
on utilizada. Con un grado de infectividad distribuido continuamente, se
logra agregar una mayor heterogeneidad al modelo. Estas variaciones en el n
umero reproductivo pueden
deberse a factores tales como:
Individuos infectados y no diagnosticados.
Altas tasas de contacto entre individuos.
Alta carga viral en algunos individuos infectados.
57
5.5.
Otra asunci
on efectuada en los modelos poblacionales es la de homogeneidad espacial. Pero si
la epidemia comenzara en una o unas pocas regiones acotadas, la homogeneidad no se lograra instantaneamente si asumieramos movimiento al azar de individuos. En la figura 5.7 puede verse c
omo el
comportamiento de la epidemia se aleja cada vez mas de lo esperado al variar la distribucion espacial
inicial de los individuos infecciosos. En el primer caso, los individuos infecciosos ocupan inicialmente
una mitad de la grilla. La evoluci
on llega a valores menores de infecciosos porque, al estar mas confinados a una zona de la grilla, los infecciosos tienen mas encuentros con otros infecciosos que lo esperable
en condiciones homogeneas. En el segundo caso ocupan un cuarto y en el tercero un dieciseisavo. En
estos dos casos se observa c
omo la epidemia se mantiene en valores bajos pero persistentes, al no tener
suficientes individuos susceptibles en la vecindad inicialmente, pero encontrando nuevos susceptibles a
medida que se efect
ua el movimiento al azar.
59
5.6.
Conclusiones
60
Captulo 6
Introducci
on
El modelado basado en agentes es una metodologa que intenta superar las limitaciones de los
automatas celulares. Utiliza como base del modelado a entidades virtuales denominadas agentes. Tradicionalmente, los agentes se han empleado en la resolucion de problemas en forma distribuida, donde
cada agente tiene la capacidad para resolver una parte del problema pero solo se puede llegar a la resolucion global trabajando en forma conjunta. Mas recientemente se ha comenzado a utilizar a los agentes
para realizar simulaciones, permitiendo modelar individuos con interacciones y comportamientos complejos dentro de un entorno din
amico. En el presente captulo se desarrollara una revision te
orica de
los principales conceptos referidos a agentes y sistemas multiagente con el objetivo de incorporar estos
conocimientos y poder implementar dicha tecnica de modelado en una seccion posterior. Los temas
tratados en esta secci
on son:
Agentes, definici
on y caractersticas.
Ambientes, definici
on y propiedades.
Sistemas multiagente, definici
on y caractersticas principales.
Sistemas multiagente aplicados al modelado de epidemias.
6.2.
Agentes
acotada, se consideran agentes inteligentes a aquellos capaces de actuar de forma autonoma y flexible
en un ambiente, entendiendose por flexibles a agentes que son reactivos (mantienen una interacci
on
constante con su ambiente y responden a los cambios que ocurren en este), pro-activos (no siguen
solo reglas de estmulo-respuesta, sino que generan y tratan de alcanzar metas, toman la iniciativa) y
sociales (se comunican e interact
uan con otros agentes y en algunos casos cooperan para lograr metas
que no pueden alcanzarse individualmente) [Epstein, 2006].
De acuerdo a la aplicaci
on que pueda darseles, los agentes suelen tener tambien otras propiedades
[Yergens et al., 2006, Armano and Martin, 2006, Epstein, 2006]:
Movilidad: La habilidad de un agente para moverse dentro de una red o sistema.
Veracidad: Un agente no debe a consciencia comunicar informacion falsa.
Benevolencia: Los agentes no tienen metas conflictivas, todo agente deber tratar siempre de hacer
lo que se le ha solicitado.
Racionalidad: Un agente siempre actuara en funcion de lograr sus metas.
Aprendizaje/Adaptaci
on: Agentes que mejoran su performance con el tiempo a partir de su
percepci
on del ambiente y su desempe
no previo.
Para poder actuar sobre el ambiente, los agentes deben poder percibir de alguna forma su estado
y poseer una funci
on que relacione la percepcion con la accion. Para ello poseen lo que se conoce como
Sistema de percepci
on que es la capacidad de un agente de observar su entorno se pone de manifiesto
en la funcion see. La relaci
on entre percepcion y accion se plasma en la funcion action, que representa
el proceso de toma de decisiones del agente [Epstein, 2006]. La salida de la funcion see mapea estados
del ambiente en perceptos:
see : E P er
(6.1)
La funci
on action mapea secuencias de perceptos en acciones:
action : P er Ac
(6.2)
Otro concepto importante que es necesario definir a la hora de hablar sobre agentes es el de Agentes
con estado, estos son agentes que modifican su comportamiento seg
un el estado en que se encuentren, en
forma similar a los aut
omatas. Tienen una estructura de datos interna usada para grabar informaci
on
sobre el ambiente y su historia [Epstein, 2006]. Se define a I como el conjunto de todos los estados
internos del agente. La funci
on see no se modifica, pero la funcion action ahora se define como un
mapeo de estados internos en acciones.
action : I Ac
62
(6.3)
La funci
on next mapea un estado interno y una percepcion en un estado interno:
next : IxP er I
(6.4)
6.3.
Ambientes
Todo agente se desenvuelve en un ambiente, que puede o no ser explcitamente creado para el.
El rango de los ambientes de trabajo es muy grande. Es posible clasificar estos ambientes a traves
de diferentes caractersticas que determinan el tipo de interaccion con que tendran con los agentes
[Epstein, 2006].
Accesible/No accesible: un ambiente accesible es aquel en el cual el agente puede obtener informaci
on completa y actualizada sobre el estado del ambiente. La mayora de los ambientes
moderadamente complejos (incluyendo el mundo fsico e internet) son inaccesibles. Mientras m
as
accesible sea el ambiente es m
as sencillo construir agentes que funcionen sobre el.
Determinstico/Aleatorio: un ambiente determinstico es aquel en el cual el siguiente estado
esta totalmente determinado por el estado actual y la accion a ejecutar por el agente. No hay
incertidumbre. El mundo fsico es no determinstico. Representa un gran reto para el dise
no de
agentes.
Episodico/No epis
odico: considerando como episodio a un evento de percepcion-accion, un ambiente epis
odico implica que los episodios siguientes no dependen de las acciones que ocurrieron
en episodios previos (como ocurre en las cadenas de Markov). Este caso es mas simple que el no
episodico, porque el agente puede decidir que accion tomar basandose solo en el episodio actual,
sin necesidad de reaccionar en base a las interacciones entre el episodio actual y los futuros.
Discreto/Continuo: un ambiente es discreto si tiene un n
umero fijo y finito de acciones y percepciones. De lo contrario, es continuo.
Estatico/Din
amico: el ambiente es dinamico si puede modificarse durante el tiempo en que el
agente decide. De lo contrario es estatico.
Competitivo/Cooperativo: el ambiente es competitivo cuando el aumento de eficiencia de un
agente reduce la eficiencia de los demas. Si es cooperativo, en cambio, el aumento de eficiencia
de un agente aumenta la eficiencia del resto de los agentes.
El ambiente puede estar en cualquiera de los estados del conjunto finito E (estados del ambiente),
compuesto por estados instant
aneos y discretos e, e0 , ..., y los agentes tienen un repertorio de acciones
63
posibles Ac = , 0 ... que transforman el estado del ambiente. Una corrida r de un agente en un
ambiente es una secuencia de estados del ambiente alternados con acciones del agente.
Definiendo R como el conjunto de todas las posibles secuencias sobre E y Ac, RAc es el subconjunto
de R que termina con una acci
on y RE el subconjunto de R que termina en un estado del ambiente.
Una funci
on de transformaci
on de estados representa el comportamiento del ambiente:
= RAc p(E)
(6.5)
(6.6)
Es decir que el agente decide la accion a tomar basandose en la historia del sistema.
6.4.
Sistemas multiagentes
Un sistema multiagente puede definirse como una red de agentes que trabajan en conjunto para
resolver un problema que escapa a las posibilidades de su capacidad individual[Yergens et al., 2006,
Armano and Martin, 2006]. En general, un sistema multiagente consta de los siguientes elementos:
Un ambiente de trabajo.
Un conjunto de objetos ubicados en el ambiente.
Un conjunto de agentes (los objetos activos del sistema).
Un conjunto de relaciones que comunica a los agentes.
Un conjunto de operadores que hacen posible que los agentes puedan percibir, producir, transformar o modificar objetos.
En el contexto de las simulaciones mediante agentes, un sistema multiagente es un conjunto de
agentes que se desenvuelven e interact
uan en un ambiente determinado [Iantovics, 2010]. Los agentes
tambien podr
an estar unidos por otras relaciones (organizacionales). Las simulaciones con sistemas
multiagente permiten simular en forma directa a los individuos, sus comportamientos y sus interacciones, as como otros elementos propios del sistema.[Epstein, 2006] Estan basadas en la idea de que es
posible representar en forma computarizada el comportamiento de entidades que se encuentran activas
en un determinado ambiente y que es posible obtener consecuencias validas de las interacciones.
64
En un sistema multiagente existen propiedades a nivel individual y a nivel sistema. Las propiedades
a nivel individual corresponden a los comportamientos y caractersticas de cada agente. Las propiedades
a nivel sistema son las propiedades globales del ambiente en el que viven los agentes, y emergen como
resultado de la acci
on e interacci
on de los agentes entre s y con el ambiente [Epstein, 2006].
6.5.
Al modelar una epidemia en base a agentes, la poblacion a estudiar esta compuesta por agentes
que interact
uan entre s, implementando explcitamente un agente por individuo. Los ambientes en los
que se desenvuelven los agentes pueden ser pases, regiones, ciudades o zonas mas peque
nas, dependiendo del objetivo del modelado, y cada ambiente puede tener diferentes regiones (ciudades, casas,
hospitales, escuelas, etc.), dentro de las cuales los agentes podran tener distintos comportamientos e
interacciones [Bauer et al., 2009, Auchincloss and Roux, 2008]. El ambiente ya no necesita ser una
grilla discreta como en el caso de los automatas celulares, sino que puede ser continuo, y los agentes
moverse libremente en el. El tiempo tambien puede ser continuo, modelandose de diferentes maneras
(por ejemplo, como un proceso de Poisson). Los individuos interaccionan al encontrarse dentro de una
vecindad, ya sea en cuanto a la forma de moverse como a la posibilidad de ser infectados. Los individuos
fuera de la regi
on de vecindad no son considerados. Las vecindades pueden ser variables y depender
de la region del ambiente donde se este [Eyob et al., 2005]. La infectividad de los individuos puede
exhibir comportamientos m
as complejos, que dependan de la evolucion propia de cada individuo y su
relacion con el resto, en una forma m
as acorde con la realidad. El movimiento de los individuos puede
modelarse en forma puramente estoc
astica o seguir alg
un lineamiento acorde con lo observado para el
individuo que se est
a modelando (ida o vuelta del trabajo, migracion de aves, etc.). Los agentes pueden
incluir tambien comportamientos m
as complejos, imitando caractersticas humanas como creencias,
intenciones, deseos o conocimientos.
6.5.1.
Revisi
on de modelos basados en agentes usados en el modelado de epidemias
Al igual que en el caso del modelo basado en automatas celulares, se realizara un breve repaso de
repaso de trabajos previos que modelan epimedias usando sistemas multiagentes.
Epstein [Epstein et al., 2002] simula una epidemia de tipo SEIR. Asumiendo una tasa de contagio
constante en dos estados infecciosos posibles (uno de baja y otro de alta tasa de contagio), se modelan
dos ciudades de 400 habitantes cada una. Cada ciudad contiene 100 casas con dos adultos trabajadores
y dos ni
nos en cada una. En cada ciudad hay una escuela y un lugar de trabajo. Todos los ni
nos acuden
a la escuela en su ciudad. La mayora de los adultos acuden al trabajo en su ciudad, mientras que una
peque
na fracci
on trabaja en la ciudad vecina. Existe un solo hospital usado por ambas ciudades, con
5 trabajadores de cada ciudad. Cada da se divide en dos fases iguales. En la primera fase, correspondiente al da, los adultos y ni
nos acuden al trabajo y la escuela, respectivamente. En la segunda fase,
correspondiente a la noche, los miembros de cada familia interact
uan en sus casas exclusivamente. Cada fase consta de muchas iteraciones. En cada iteracion se efect
uan una interaccion al azar entre cada
individuo y un vecino relevante (colega de trabajo, compa
nero de escuela o miembro de la familia).
La probabilidad de infecci
on depende no solo del estadio del agente infeccioso sino de la densidad de
65
66
y que no supone un gran consumo de recursos computacionales. En nuestro modelo basado en agentes
la tasa de infecci
on vara de acuerdo a la carga viral que posee cada individuo en un momento dado,
en base al modelado del sistema inmune, como se vera en el captulo siguiente.
6.6.
Conclusiones
67
Captulo 7
Implementaci
on del modelo multiagente
7.1.
Introducci
on
El modelado basado en agentes permite simular a cada individuo en forma independiente del
resto y con un comportamiento lo suficientemente detallado como para asemejarse al comportamiento
humano en los aspectos b
asicos que interesen a la tematica en la que se aplique. No obstante, el nivel de
complejidad y detalle usado es muy variable, y algunas de las implementaciones son tan sencillas que
en poco se diferencian de los aut
omatas celulares. En el captulo anterior se vieron diversos ejemplos de
modelado de epidemias utilizando agentes. Si bien varan en la forma de abordar el problema, en todos
los casos se utiliza una tasa de infecci
on constante, de la misma forma que se hizo en el modelo cl
asico
y, tomando el promedio de cada grupo, tambien en el modelo de automatas celulares. En esta secci
on
se propone la implementaci
on de un sistema multiagente, el cual permite abordar el problema en un
nivel de detalle mas profundo que el modelo basado en automatas. Los temas que se desarrollar
an en
este captulo son:
Nuevo abordaje del problema, descripcion de los sistemas de ecuaciones correspondientes.
Definici
on del sistema multiagente.
Ajuste de los par
ametros del modelo.
Pruebas del modelo con distintas distribuciones de probabilidad para la tasa de infecci
on.
Pruebas del modelo con diferentes distribuciones espaciales de individuos infecciosos.
7.2.
Existen muchos trabajos en los que se modela el sistema inmune, ya sea en humanos o en otras
especies, y que muestran que la infectividad de un individuo depende fuertemente de su carga viral en
68
cada momento [Eyob et al., 2005, Rhee, 2006, Kim et al., 2008]. Esta carga viral no es constante sino
que vara a lo largo del tiempo, dependiendo de diversos factores. Estos mismos trabajos muestran que
la susceptibilidad para enfermarse de una persona tambien vara a lo largo del tiempo, dependiendo del
estado de las defensas del individuo e, indirectamente, del contacto con otras personas y de la carga
viral propia -que influye en la proliferacion de celulas del sistema inmune del organismo-.
Estos dos factores -infectividad y susceptibilidad - hasta ahora haban sido tenidos en cuenta como
una sola unidad, que dimos en llamar tasa de infecci
on . Esta tasa era tenida en cuenta u
nicamente para individuos totalmente susceptibles (compartimiento de susceptibles), mientras que el resto
se consideraba no susceptible (compartimiento de recuperados, considerados totalmente inmunes, y
compartimiento de expuestos e infecciosos, que tampoco eran tenidos en cuenta en la interacci
on).
Teniendo como base los trabajos previos que modelan el sistema inmune es posible introducir en cada
agente el sistema de ecuaciones diferenciales que reproduce el comportamiento inmunologico individual
y as obtener los factores que determinan el contagio en forma separada. Con cada agente concebido de
esta manera, todos pueden interactuar en un ambiente apropiado y puede analizarse el comportamiento
emergente, la evoluci
on global de la epidemia.
El trabajo que sirve de punto de partida es el de Bocharov [Bocharov, 1998].En este trabajo se
modela la infecci
on por virus LCMV (Lymphocytic Choriomeningitis Virus) y la respuesta inmune a
nivel de los linfocitos T citot
oxicos en ratones. El modelo se centra en el bazo y sigue el curso de tres
variables dependientes del tiempo:
V (t) - concentraci
on de partculas virales a un tiempo t (partculas ml
1 )
Ep (t) - concentraci
on de linfocitos T precursores especficos de virus a un tiempo t (partculas
1
ml ).
E(t) - concentraci
on de linfocitos T efectores especficos de virus a un tiempo t (partculas ml1 ),
Una variable adicional, W (t), caracteriza la carga viral total en el bazo durante un cierto perodo
de tiempo. Representa una integraci
on de V (t) en un tiempo determinado. Esta variable es utilizada
para poder describir la inducci
on anergica de los linfocitos producida por la presencia sostenida de
concentraciones altas de virus, como se vera mas adelante.
El modelo es adaptable para utilizarse como modelo de gripe. Una representacion esquem
atica
puede verse en la figura 7.1.
7.2.1.
Ecuaci
on para la din
amica del virus
69
(7.1)
Figura 7.1: Modelo de respuesta inmune de linfocitos T ante una infeccion por virus LCMV
Vemos que el primer termino de la porcion derecha de la ecuacion es la ecuacion logstica cl
asica.
El aumento de concentraci
on de virus es proporcional a la poblacion de virus en cada instante pero, a
su vez, existe una competencia intraespecfica debido a los recursos limitados con los que cuentan para
multiplicarse. La concentraci
on m
axima de virus no puede exceder Vmax , o capacidad de acarreo.
El segundo termino de la porci
on derecha de la ecuacion representa la disminucion en la poblaci
on
de virus por el ataque de linfocitos T efectores a las celulas infectadas, provocando la lisis celular.
Asumiendo que a mayor cantidad de celulas infectadas, mayor concentracion de virus, esta disminuci
on
es proporcional a las concentraciones de virus y de linfocitos efectores, que determinan los n
umeros
de encuentros entre linfocitos y celulas infectadas en forma similar a la vista para los modelos
epidemiologicos. Los par
ametros y V E caracterizan la tasa de reproduccion de los virus y la tasa de
remocion por parte de los linfocitos efectores, respectivamente.
Los valores estimados para los par
ametros son de 107 109 particulas ml1 para Vmax , 34 dias1
para y 0, 3x104 ml celula1 dia1 para V E .
7.2.2.
Ecuaci
on para la din
amica de los linfocitos T precursores
(7.2)
gp (W ) =
1
(1 + W/p )2
(7.3)
A mayor valor de W (t), menor es el valor que toma gp (W ), disminuyendo la influencia del segundo
termino del lado derecho de la ecuaci
on diferencial. La variable W(t), al ser una integracion de V (t),
sera alta cuando V(t) sea alta por un cierto tiempo.
El tercer termino de la porci
on derecha de la ecuacion diferencial representa la programaci
on para
apoptosis por estimulaci
on prolongada de los receptores de los linfocitos T ante la presencia sostenida
de altas dosis de antgeno, situaci
on que ocurre alrededor de los seis das de infeccion. El retardo de
tiempo A representa el tiempo en que las celulas T deben ser estimuladas a traves de sus receptores
para que se active la muerte programada.
La estimaci
on de par
ametros en el trabajo de Bocharov indica que Ep esta en el rango de 5 x {101
1
celulas ml , Ep se encuentra entre 0, 003 0, 3 dias 1, p entre 107 109 particulas ml1 , bp
entre 105 104 (particulas ml1 )1 dias1 , entre 0, 3 0, 4 dias, A entre 3 7dias y A P entre
1018 1014 (ml/particulas)2 dias1 .
102 }
7.2.3.
Ecuaci
on para la din
amica de los linfocitos T efectores
dE(t)
= gE (W )bd V (t )Ep (t ) bEV V (t)E(t) AE V (t A )V (t)E(t) E E(t)
dt
(7.4)
la cual depende de la cantidad de virus y linfocitos precursores en un tiempo anterior, dado por
, merced al retardo dado por la duracion media de la division celular. El parametro bd es la tasa de
diferenciacion. La funci
on gE (E) es la misma que gp (W ), pero con un valor distinto para p . Representa
la modulacion de la diferenciaci
on provocada por la carga antigenica.
El segundo termino representa la disminucion de linfocitos T por interacciones lticas con las celulas
infectadas, siendo bE V la tasa de muerte. El tercer termino describe la muerte programada, similar a
la que ocurre en linfocitos precursores. El u
ltimo termino representa la muerte natural de los linfocitos,
siendo E la inversa de la vida media de los linfocitos maduros.
La estimaci
on de par
ametros indica que bd se encuentra dentro del rango de 105 - 104 ml
particulas 1 dias1 , E est
a entre 107 109 particulas ml1 , AE su ubica entre 1018 1014
1
2
1
(ml particulas ) dias y E entre 0, 2 0, 5 dias. El valor de bE V se fija en cero, indicando que
no se considera una aceleraci
on de su muerte por su accion citotoxica.
7.2.4.
Ecuaci
on para la carga viral total
Se usa el termino carga viral para indicar la cantidad total de virus con la que se enfrenta el
sistema inmune en un cierto tiempo. Esto representa una integracion de la concentracion viral durante
ese tiempo. Esta forma de describir la cantidad de virus permite describir la induccion de anergia, como
se vio en la ecuaci
on de la din
amica para linfocitos precursores. La ecuacion diferencial toma la forma:
dW (t)
= bW V (t) W W (t)
dt
(7.5)
7.2.5.
Reformulaci
on del sistema de ecuaciones
El modelo presentado puede introducirse como comportamiento en cada agente, emulando el sistema inmune. Esta incorporaci
on permite eliminar los compartimientos discretos del modelo cl
asico,
entre los que pasaban los individuos en forma instantanea transcurrido cierto tiempo promedio. En su
lugar, cada individuo tendr
a un nivel de infectividad y de susceptibilidad dependientes de la din
amica
del sistema inmune y de las interacciones con otros individuos, y podra considerarse que se pas
o del
estado susceptible, expuesto o infeccioso al cruzarse cierto umbral de carga viral, pero solo a los fines
de relevar el estado de la poblaci
on, sin ninguna influencia en el comportamiento de cada individuo y
su dinamica interna.
Para poder implementar el modelo fue necesario efectuar algunas modificaciones, porque los retardos no pueden incluirse en forma directa en la resolucion numerica del sistema de ecuaciones. Para
72
poder incorporarlos, los retardos se simularon a partir de sistemas de orden elevado. El sistema final
queda formulado como:
dE(t)
dt
dEp (t)
dt
dEp (t)
dt
dVA (t)
dt
dV (t)
dt
dV (t)
dt
dW (t)
dt
Siendo
1
0
0
A =
0
1
0
B = 50, 8 0 0
y
A A
7.3.
0, 15 0, 0075 0, 0001
1
0
0
=
0
1
0
BA = 0, 0001 0 0
Definici
on del sistema multiagente
(7.7)
U es el par
ametro que toma en cuenta la carga viral de los agentes vecinos. Es la sumatoria de
cargas virales de los agentes vecinos, afectadas por un componente de aleatoriedad que corresponde a
0 del modelo cl
asico, la probabilidad de infeccion.
La susceptibilidad a la infecci
on depende del estado del sistema inmune. Si el agente que interacciona con un infeccioso est
a en estado susceptible, tendra una baja carga de linfocitos efectores, por lo
que su susceptibilidad ser
a alta. Si, en cambio, el agente es recuperado, su carga inmune es alta y no
es afectado por los agentes infecciosos.
74
7.4.
Los par
ametros del modelo cl
asico que controlan el paso de expuesto a infeccioso y de infeccioso
a recuperado se ajustan, en el modelo de agentes, modificando los parametros del modelo interno de
cada agente. El par
ametro correspondiente a 0 , as como el paso a asintomaticos y a reportados, se
modifican de forma externa.
Para poder obtener un comportamiento del sistema interno acorde a los parametros del modelo
epidemiologico cl
asico, se lo someti
o a un proceso de optimizacion de parametros similar al efectuado
en el modelo cl
asico, pero no comparando contra datos reales sino contra los datos que se obtendran
en el sistema interno si los par
ametros globales de la epidemia fuesen los mismos que se obtuvieron en
el modelo cl
asico. Se consider
o que un agente se encuentra en estado expuesto al alcanzar una carga
viral de 1000 partculas virales por mililitro, mientras que al alcanzar una carga viral de 10 millones de
partculas virales por mililitro se pasa a estado infeccioso. La cada de la carga viral a valores menores
a 1000 partculas virales por mililitro indica la recuperacion del agente.
Dada la gran demanda computacional, solo se efectuo un ajuste aproximado. Con estos par
ametros
optimizados, la evoluci
on interna de un agente en ausencia de interacciones puede verse en la la figura
7.2.
En presencia de interacciones, el efecto de las mismas dependera del momento en que ocurran.
En la figura 7.3 se muestra la evoluci
on para una interaccion previa a toda infeccion; por otro lado,
en la figura 7.4 puede apreciarse la evolucion para otra posterior a una infeccion. Puede verse c
omo
la interaccion previa provoca una infeccion mientras que la segunda tiene un efecto muy leve que es
rapidamente anulado debido a la presencia de linfocitos efectores, producidos en una infeccion anterior.
Para realizar simulaciones con muchos individuos interactuando se tomo una poblacion peque
na
debido al gran costo computacional que implica simular una gran cantidad de agentes con un sistema de
ecuaciones diferenciales interno. Se inicio en cada caso con 700 individuos susceptibles y 21 individuos
expuestos.
75
76
7.5.
Al igual que en el caso del modelo de automatas, se efectuaron simulaciones con distintas distribuciones de probabilidad para la tasa de infeccion. En el primer caso, la distribucion utilizada es
normal, mientras que en el segundo caso es bimodal. Al igual que en el caso de automatas, la presencia
de superspreaders puede ser importante, y quedan modelados por la porcion mayor al promedio de la
distribucion normal o por la regi
on correspondiente a la moda de mayor promedio de la distribuci
on
bimodal.
Una realizaci
on de la evoluci
on de la epidemia con tasa de infeccion de distribucion normal puede
verse en la figura 7.6. La evoluci
on para una tasa con distribucion bimodal se ejemplifica en la figura
7.7.
7.6.
77
78
7.7.
Conclusiones
A lo largo de una epidemia la infectividad de los individuos depende de la carga viral, por otro
lado, esta no permanece constante, vara a traves del tiempo t dependiendo de diversos factores; la
susceptibilidad es otra caracterstica que no permanece constante a lo largo de la epidemia. Es posible
modelar la respuesta inmune de cada individuo a nivel de los linfocitos T y la carga viral total con
sistemas de ecuaciones al igual que en los modelos clasicos pero a nivel individuo; utilizando sistemas
de ecuaciones de orden elevado es posible introducir retardos al modelo y de esta forma simular los
perodos entre las diferentes etapas de la enfermedad. De esta forma se puede modelar el proceso global
por medio de la interacci
on de estos inidividuos que son en si un sistema u
nico. Realizando simulaciones
con diferentes distribuciones de probabilidad (normal y bimodal) para la tasa total de infecci
on se
puede apreciar que la presencia de superspreaders pude ser importante; estos quedan modelados por
la porcion mayor al promedio en la distribucion normal y por la region correspondiente a la moda de
mayor promedio en la distribuci
on bimodal. Si nos alejamos de la condicion de homogeneidad perfecta
se pude ver un comportamiento que esta lejos de ser el ideal; esto se debe a que las variaciones en
las interacciones ocacionan una din
amica anormal, prolongando o reduciendo ciertos perodos durante
la epidemia. El modelado basado en agentes permite incorporar heterogeneidad al sistema y observar
comportamientos que se asemejan mas al del sistema real. Por otro lado, al ser capaz de incorprar
la respuesta inmune y la carga viral de cada individuo como un sisteme de ecuaciones particular,
permitiendo crear sistemas mas acordes al real con un nivel de complejidad considerabelemente menor
que los modelos cl
asicos.
79
80
Captulo 8
Conclusiones Generales
La asunci
on central de los patrones que estudia la epidemiologa es que estos patrones pueden
analizarse sistem
aticamente para entender sus causas y controlar la enfermedad. El uso de variables
epidemiologicas tales como edad o sexo como marcadores de fenomenos mas complejos permite entender
mejor estos patrones. En el caso de las poblaciones, la interaccion social es la piedra basal de esta
ciencia, esta tiene influencia tanto en enfermedades ambientales como geneticas. Hasta en los casos
mas extremos, se considera que las poblaciones son dinamicas, las enfermedades tambien aumentan
y disminuyen en frecuencia, siendo este uno de los axiomas de la epidemiologa. El estudio de estos
cambios ayuda a controlar los cambios abruptos y a comprender los factores que son de influencia.
Existen diversos modelos epidemiologicos basados en ODE, adecuandose mejor a uno u otro tipo
de enfermedad. En los modelos SEIR, se modela explcitamente el perodo latente no infeccioso caracterstico de una enfermedad, en estos modelos, el n
umero de reproduccion Ro, que dependende de
la tasa de infecci
on, la tasa de paso de expuesto a infeccioso, la tasa de recuperacion y la tasa de
mortandad, determina la permanencia en forma endemica de la epidemia o su extincion y determina
un equilibrio endemico para un valor mayor a 1, mientras que predice la extincion de la epidemia si
es menor o igual a 1. Para que el modelo funcione y este parametro prediga el curso de la epidemia
deben cumplirse razonablemente bien las hipotesis de distribucion uniforme e instantanea, as como
ser constantes los par
ametros en todos los individuos. Esto puede cumplirse razonablemente bien en
poblaciones grandes, pero no lo hace en el caso poblaciones mas peque
nas.
Implementando un modelo cl
asico basado en ODE usando un juego de parametros obtenido mediante un proceso de optimizaci
on como se ve en el captulo 3, La curva obtenida no captura las irregularidades observadas en los datos sino que se comporta mas como un promedio de varias realizaciones,
generando un efecto de suavizado de los datos; esta variabilidad observada puede tomarse como algo
puramente estoc
astico o como algo inherente al sistema, proveniente de alg
un tipo de heterogeneidad
en la poblaci
on.
Los modelos basados en aut
omatas son especialmente u
tiles cuando se intenta modelar un sistema
como una colecci
on masiva de objetos que en su totalidad afectan el comportamiento de todo el sistema,
modelando a traves de un conjunto de reglas se obtiene en una estocasticidad natural y por lo tanto
a un aumento de la heterogeneidad. La implementacion de diferentes distribuciones de probabilidad
81
82
Ap
endice A
C
alculo paralelo
A.1.
Introducci
on
El siguiente apendice hace una introduccion a las metodologas de calculo paralelo usadas para
acelerar la ejecuci
on de los scripts de matlab. El mismo esta basado en las siguientes referencias: [Choy
and Edelman, 2003, 2005].
La computaci
on paralela es una tecnica de programacion en la que muchas instrucciones se ejecutan
simultaneamente. Se basa en el principio de que los problemas grandes se pueden dividir en partes m
as
peque
nas que pueden resolverse de forma concurrente. Durante muchos a
nos, la computacion paralela
se ha aplicado en la problemas de alta prestaciones, pero el interes en ella ha aumentado en los u
ltimos
a
nos debido a las restricciones fsicas que impiden el escalado en frecuencia. La computacion paralela
se ha convertido en el paradigma dominante en la arquitectura de computadores, principalmente en
los procesadores multin
ucleo. Los ordenadores paralelos se pueden clasificar seg
un el nivel de paralelismo que admite su hardware: los ordenadores multin
ucleo y multiproceso tienen varios elementos de
procesamiento en una sola m
aquina, mientras que los clusters, los MPP y los grids emplean varios
ordenadores para trabajar en la misma tarea. Los programas paralelos son mas difciles de escribir que
los secuenciales porque la concurrencia introduce nuevos tipos de errores de software. La comunicaci
on
y la sincronizaci
on entre las diferentes subtareas son tpicamente las grandes barreras para conseguir
un buen rendimiento de los programas paralelos. El incremento de velocidad que consigue un programa
como resultado de la paralelizaci
on viene dado por la ley de Amdahl.
La Ley de Amdahl, llamada as por el arquitecto de ordenadores Gene Amdahl, se usa para
averiguar la mejora m
axima de un sistema cuando solo una parte de este es mejorado. Esta ley establece que la mejora obtenida en el rendimiento de un sistema debido a la alteraci
on de uno de sus
componentes est
a limitada por la fracci
on de tiempo que utiliza dicho componente. La formula original
de la ley de Amdahl es la siguiente:
F = Fa ((1 Fm ) +
83
Fm
)
Am
(A.1)
Donde:
F = tiempo de ejecuci
on mejorado.
Fa = tiempo de ejecuci
on antiguo.
Esta formula se puede reescribir usando la definicion del incremento de la velocidad que viene dado
por A = Fa /F por lo que la f
ormula anterior se puede reescribir como:
A=
1
(1 Fm ) +
Fm
Am
(A.2)
Donde:
A es la aceleraci
on o ganancia en velocidad conseguida en el sistema completo debido a la mejora
de uno de sus subsistemas.
Am es el factor de mejora que se ha introducido en el subsistema mejorado.
Fm es la fracci
on de tiempo que el sistema utiliza el subsistema mejorado.
Por ejemplo, si en un programa el tiempo de ejecucion de un cierto algoritmo supone un 30 por
ciento del tiempo de ejecuci
on total del programa, y conseguimos hacer que este algoritmo se ejecute
en la mitad de tiempo tendremos Am = 2 , F m = 0,3 y A 1,18
Es decir, hemos mejorado la velocidad de ejecucion del programa en un factor de 1, 18. La ley de
Amdahl se mide en unidades genericas, es decir los resultados no son porcentajes, ni unidades de tiempo.
La Ley de Amdahl se puede interpretar de manera mas tecnica, pero en terminos simples, significa que
es el algoritmo el que decide la mejora de velocidad, no el n
umero de procesadores. Finalmente se llega
a un momento que no se puede paralelizar mas el algoritmo.
La computaci
on paralela emplea elementos de procesamiento m
ultiple simultaneamente para resolver un problema. Esto se logra dividiendo el problema en partes independientes de tal manera que
cada elemento de procesamiento pueda ejecutar su parte del algoritmo a la misma vez que los dem
as.
Los elementos de procesamiento pueden ser diversos e incluir recursos tales como un u
nico ordenador
con muchos procesadores, varios ordenadores en red, hardware especializado o una combinaci
on de los
anteriores.
A.1.1.
Paralelismo en MATLAB
de procesamiento de se
nales en los Estados Unidos lo adoptaron rapidamente, seguido por otros grupos
de cientficos e ingenieros en los EE.UU. y del extranjero. En terminos generales, el n
umero de usuarios
de MATLAB se ha duplicado cada a
no desde 1978. De acuerdo conThe MathWorks, actualmente hay
cerca de 300,000 usuarios en cincuenta pases, y esta cifra sigue aumentando rapidamente. En muchas
comunidades cientficas y de ingeniera, MATLAB se ha convertido en la lengua dominante para el
calculo numerico de escritorio.
Hay por lo menos seis razones para el exito de MATLAB pueden ser identificadas:
La excepcional facilidad de usar, intuitiva sintaxis, a favor de la brevedad y la simplicidad sin ser
tan comprimido.
La muy alta calidad de los programas numericos subyacentes, resultado de los lazos ntimos de
MATLAB con la comunidad de investigacion y analisis numerico desde un principio.
Graficos de gran alcance y f
acil de usar.
El alto nivel del lenguaje, que a menudo hace que sea posible llevar a cabo calculos en una o dos
lneas de MATLAB que se requieren decenas o cientos de lneas en Fortran o C. (la posibilidad
de enlazar con Fortran o programas de C es tambien una ventaja).
La facil extensibilidad de MATLAB a traves de paquetes de archivos -m conocidos como cajas de
herramientas o tool boxes. Estas Cajas de herramientas son producidas tanto por The MathWorks
como por por otros, cubren diversas areas de aplicacion como optimizacion, procesamiento de
se
nales, l
ogica difusa, ecuaciones diferenciales parciales, y matematica financiera.
Desde el principio, todo el lenguaje se ha construido en torno a vectores reales o complejos y matrices (incluyendo matrices dispersas) como el tipo de datos fundamentales. Para los inform
aticos
que no practican el c
alculo numerico, tal limitacion puede parecer estrecha y caprichosa, pero ha
demostrado ser extraordinariamente fructfera.
Originalmente, MATLAB fue concebido como una ayuda a la educacion y como una herramienta
para el prototipado de algoritmos, que luego se traducirian en un lenguaje real. Se supona que las
capacidades de MATLAB eran limitadas y que, al ser un lenguaje interpretado, no pudra alcanzar
el rendimiento de un lenguaje compilado. Con los a
nos, sin embargo, la fuerza de estos argumentos
fue desapareciendo. Las capacidades de MATLAB no pueden ser llamadas estrechas; en cuanto a
rendimiento, muchos usuarios encuentran que una degradacion en la velocidad por un factor entre 1 y
10 es mas que compensado por una mejora de la facilidad de programacion en un factor de entre 10 y
100. En MATLAB, un esfuerzo modifica el modelo, traza una nueva variable, o reformula el problema
de forma interactiva. Tan r
apida en tiempo real de exploracion lo cual es raramente factible en Fortran
o C.
Matlab 2010a posee un tool box de computacion paralela para estudiantes. No es parte del paquete
basico para estudiante de Matlab, pero ahora esta disponible como una caja de herramientas del tipo
add-on.Por supuesto, que ha estado disponible para los usuarios comerciales durante alg
un tiempo.
En un equipo multi-core, Matlab puede tomar ventaja de las m
ultiples unidades de procesamiento
(tambien llamadas n
u
cleos) en varios grados.
85
Muchas de las funciones incorporadas en Matlab son multi-core / multi-hilo a priori. Si el tama
no
del problema es lo suficientemente grande, se puede ejecutar en paralelo en la maquina sin ning
un
esfuerzo. Solo hay que asegurarse de que se encuentra establecida la opcion correspondiente en las
preferencias.
A partir de MATLAB 7.4 (R2007a), MATLAB soporta el calculo multiproceso para una serie
de funciones de
algebra lineal (por ejemplo, multiplicar matrices), funciones de elementos numericos
(por ejemplo, cos), y expresiones que son combinaciones de elementos. Estas funciones se ejecutan
automaticamente en m
ultiples hilos y no es necesario especificar explcitamente los comandos para
crear discusiones en el c
odigo.
Para que una funci
on o una expresion se pueda ejecutar mas rapido (acelerar) en m
ultiples CPUs,
las siguientes condiciones deben ser verdaderas:
1. Las operaciones en el algoritmo que lleva a cabo una funcion determinada son facilmente divididas
en secciones que se pueden ejecutar al mismo tiempo, y requieren de muy poca comunicaci
on o
algunas operaciones secuenciales. Este es el caso de todas las operaciones elementales.
2. El tama
no de los datos es lo suficientemente grande para que las ventajas de la ejecucion concurrente superan el tiempo necesario para dividir los datos y gestionar la ejecucion de subprocesos
independientes.
3. La operaci
on no esta alojada en la memoria en donde el tiempo de procesamiento esta dominado
por el tiempo de acceso a memoria, como es el caso de operaciones sencillas, como las se
naladas
anteriormente. Como regla general, las funciones mas complejas aceleran mejor que las funciones
simples.
El Parallel Computing Toolbox crea varios workers (llamados laboratorios o labs en la jerga de
Matlab) en una m
aquina local, o incluso mas en varios equipos en un cl
uster (para lo cual se necesita
del Distributed Computing Server opcion para el trabajo en cluster, no disponible para los usuarios de Matlab-student). Luego, se puede escribir explcitamente el codigo a utilizar en los m
ultiples
laboratorios, siempre que sea posible.
Otros toolboxes tambien son capaces de realizar computacion en paralelo, si esta instalado el
Parallel Computing Toolbox, y har
an uso de las herramientas que este brinda en cierta medida.
Como propuesta inicial, para justificar el uso de este toolbox en el presente trabajo se porprone
realizar una prueba piloto en una computadora con las sieguientes caractersticas:
SO: Ubuntu 10.04
Procesador: QL-62 AMD Athlon X2 Dual-Core 2.2 GHZ.
Memoria: 2048 MB DDR2 800 MHZ.
A la hora de paralelizar el c
odigo basta con reemplazar la sentencia FOR por PARFOR en el c
odigo
matlab del que ya disponemos. Este comando es de gran ayuda ya que corre en ambientes de trabajo
86
en donde el Prallel Computing Toolbox no se encuentra instalado por lo cual sirve para computaci
on
secuencial y paralela. De esta forma el usuario solo tiene que cambiar la sintaxis clasica FOR por la
sintaxis PARFOR
Otro de los factores a tener en cuenta al momento de realizar la paralelizacion es iniciar el n
umero
correcto de laboratorios, para ello debemos crear una funcion utilitaria, isfunction, que desgraciadamente no se encuentra implementada en matlab. El codigo de dicha funcion es el siguiente:
%f u n c i n i s c o n f i g
function [ r e s u l t ] = i s f u n c t i o n ( f u n c t i o n s t r i n g )
% D e v u e l v e cuando f u n c t i o n s t r i n g e s una f u n c i n c o n o c i d a .
result = 0;
% S i e s una p a l a b r a c l a v e e n t o n c e s e s VERDADERO.
i f iskeyword ( f u n c t i o n s t r i n g )
result = 1;
else
fh = str2func ( f u n c t i o n s t r i n g ) ;
f = functions ( fh ) ;
S i e s una f u n c i n , f u n c t i o n s ( ) d e v u e l v e e l a r c h i v o de l a f u n c i n .
i f ( isempty ( f . f i l e ) )
result = 1;
else
result = 0;
end
end
end
De esta forma se puede correr c
odigo en procesadores paralelos solamente si el toolbox esta disponible,
simplemente serciorandose, por ejemplo, de que la funcion matlabpool este presente. Sin este test tendramos un error del tipo Undefined function matlabpool lo que significa que la herramienta no se
encuentra instalada siendo imposible paralelizar por esta va.
Finalmente para demostrar la utulidad de esta herramiente se propone escribir una funci
on simple
que consume una cantidad considerable de tiempo, y se puede ejecutar en modo paralelo o en serie,
con un n
umero variable de repeticiones, y devuelve el tiempo necesario para realizar dicha operacion.
Podemos entonces medir el tiempo de ejecucion necesario en paralelo y en serie para diferentes tama
nos
del problema (ver algoritmo 11).
Luego podemos llamar a esta funcion de forma repetida incrementando el tama
no del problema
de la siguiente forma:
De este modo podemos obtener una buena comparacion entre los dos metodos por medio de una
forma sencilla. Los resultados obtenidos de esta prueba pueden verse en las figuras A.1, A.2. Puede
observarse que el metodo paralelo tarda al menos la mitad de tiempo que el metodo secuencial, lo cual
es de esperar si se tiene en cuenta que este algoritmo de prueba se corrio en dos procesadores.
A continuaci
on puede observarse un resumen de la salida del algoritmo en la cual se muestra el
87
88
89
n
umero de iteraciones que se estan conrriendo, el speedup (que mide la relacion entre el tiempo de
resolucion en paralelo Vs el tiempo de resolucion en serie), el tiempo de resolucion en serie y el tiempo
de resolucion en paralelo.
Puede observarse que para un n
umero peque
no de iteraciones es mas rapido el modo secuencial
que el modo paralelo, lo cual hace injustificable usar este u
ltimo si el total de operaciones a resolver
3
es menor al order de 2x10 . Cuando el total de operaciones aumenta en forma considerable tambien lo
hace el speedup; a medida que aumenta el n
umero de iteraciones el la realcio entre los tiempos tiende a
2, quiere decir que el metodo paralelo es aproximadamente el doble de veloz que el metodo secuencial.
>>Testeando
>>Testeando
>>Testeando
>>Testeando
...
>>Testeando
>>Testeando
>>Testeando
>>Testeando
>>Testeando
...
>>Testeando
>>Testeando
>>Testeando
con
con
con
con
1
2
4
8
iteraciones:
iteraciones:
iteraciones:
iteraciones:
con
con
con
con
con
14961
22443
33666
50500
75751
0,00x
0,00x
0,01x
0,01x
iteraciones:
iteraciones:
iteraciones:
iteraciones:
iteraciones:
speedup
speedup
speedup
speedup
1,47x
1,95x
1,33x
1,88x
1,87x
speedup
speedup
speedup
speedup
speedup
segundos)
segundos)
segundos)
segundos)
Finalmente puede observarse todo esto viendo la figura A.3 que describe el speedup, Aqu puede
apreciarse como a medida que aumenta el n
umero de operaciones a resolver tambien lo hace la eficiencia
del metodo de computaci
on en paralelo, llegando a ser casi el doble de efectivo que el metodo secuencial.
A continuaci
on se describe el pseudocodigo del agente y de sus principales rutinas, se declar
o una
clase agente con las especificaciones que se detallan en el cuadro A.1.
En esta secci
on se describe el pseudocodigo de las principales rutinas del agente para poder areciar
la logic aplicada al momomento de realizar la simulacion. Finalmente se programo una rutina principal
que consta de un ciclo FOR que se extiende la cantidad de das totales correspondientes a la primer
ola de la epidemia, dentro de este ciclo se utilizan tres ciclos mas como puede verse en el algoritmo
13; todos ellos, dos corresponden a la fase de infeccion y movimiento, y el tercero a evoluci
on corren
en paralelo, proporcionando as una optimizacion de la mayor parte del codigo y un aumento en la
velociadad en el orden antes a apreciado(ver figuras A.1,A.2).
Para finalizar, tambien puede observarse el pseudocodigo correspondiente a las principales rutinas
utilizadas por el agente.El pseudoc
odigo 15 describe la logica utilizada para simular la infecci
on entre
agentes. El pseudoc
odigo 14 describe la logica de movimiento utilizada.El pseudocodigo 16 describe la
forma en que evoluciona el sistema inmune de cada agente en el tiempo.El pseudocodigo 17 simplemente
se utiliza para sacar una fotografa del agente en un instante de tiempo dado.
90
91
92
93
94
Agente
estado : entero
X : Arreglo de reales (sistema de ecuaciones)
posicion : array de 1x2 entero
velocidad : Real
direccion : Real
comportamiento : Entero
t12 : Entero
t23 : Entero
t34 : Entero
id : Real
r : Real
betaprima : Real
q : Real
Objeto()
M over()
Inf eccion()
V irulencia()
Evolucion()
P ublicar()
Cuadro A.1: Clase agente. Atributos: estado, describe los posibles estados en los que puede estar el
individuo (1 = susceptible, 2 = expuesto, 3 = inf eccioso, 4 = recuperado, 5 = asintomatico); X, es el
sistema de ecuaciones que describen el sistema inmune del individuo; posicion, posicion en la grilla del
agente; velocidad, velocidad a la que se desplaza el agente; comportamiento, especifica si el individuo
se mueve en forma aleatoria o si este sigue un patron de moviemiento; txy describe los umbrales
para pasar de un estado al otro; id, es el identificador u
nico de cada agente. Funciones: Objeto(),
es un costructor de para la clase; M over(), es la funcion de movimiento; Inf eccion(), especifica la
dinamica de infecci
on;V irulencia(), define la dinamica de infeccion influenciada por los otros agentes;
Evolucion(), contiene el sistema de ODE que describen como evoluciona el sistema inmune de cada
agente a cada instante de tiempo; P ublicar(), publica la posicion, la infectividad y otras caractersticas
del agente en cada instante de tiempo
95
Ap
endice B
96
Das
0
1
2
3
4
5
6
7
8
9
0
11
12
13
14
15
16
17
18
19
20
21
22
23
24
26
27
28
29
30
31
32
33
34
35
36
Nro de reportados
15
8
16
14
34
55
60
38
45
54
91
85
71
110
108
136
263
194
199
204
223
233
188
234
200
224
188
137
169
195
141
189
200
189
200
138
Das
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
Nro de reportados
139
130
131
104
93
67
86
82
73
59
67
53
38
38
26
34
25
23
27
30
44
29
33
23
23
5
11
23
15
10
15
13
9
10
13
97
Bibliografa
G. Armano and A. Martin. The second international workshop on multi-agent systems for medicine,
computational biology, and bioinformatics. Future, 2006.
A.H. Auchincloss and A.V. Diez Roux. A new tool for epidemiology: the usefulness of dynamic-agent
models in understanding place effects on health. American journal of epidemiology, 168(1):1, 2008.
R. Bagni, R. Berchi, and P. Cariello. A comparison of simulation models applied to epidemics. Journal
of Artificial Societies and Social Simulation, 5(3), 2002.
A.L. Bauer, C.A.A. Beauchemin, and A.S. Perelson. Agent-based modeling of host-pathogen systems:
The successes and challenges. Information sciences, 179(10):13791389, 2009.
C. Beauchemin, J. Samuel, and J. Tuszynski. A simple cellular automaton model for influenza a viral
infections. Journal of theoretical biology, 232(2):223234, 2005.
L. Berec. Techniques of spatially explicit individual-based models: construction, simulation, and meanfield analysis. Ecological Modelling, 150(1-2):5581, 2002.
E. Beretta and Y. Takeuchi. Global stability of an sir epidemic model with time delays. Journal of
mathematical biology, 33(3):250260, 1995.
Raj S. Bhopal. Concepts of epidemiology: an integrate introduction to the ideas, theories, principles
and methods of epidemiology. Oxford University Press, 2002.
GA Bocharov. Modelling the dynamics of lcmv infection in mice: conventional and exhaustive ctl
responses. Journal of theoretical biology, 192(3):283308, 1998.
G. Chowell, CE Ammon, NW Hengartner, and JM Hyman. Transmission dynamics of the great
influenza pandemic of 1918 in geneva, switzerland: assessing the effects of hypothetical interventions.
Journal of theoretical biology, 241(2):193204, 2006.
G. Chowell, H. Nishiura, and L. Bettencourt. Comparative estimation of the reproduction number for
pandemic influenza from daily case notification data. Journal of the Royal Society Interface, 4(12):
155, 2007.
G. Chowell, MA Miller, and C. Viboud. Seasonal influenza in the united states, france, and australia:
transmission and prospects for control. Epidemiology and infection, 136(06):852864, 2008.
R. Choy and A. Edelman. Matlab* p 2.0: a unified parallel matlab. 2003.
98
R. Choy and A. Edelman. Parallel matlab: Doing it right. Proceedings of the IEEE, 93(2):331341,
2005.
B. Coburn, B. Wagner, and S. Blower. Modeling influenza epidemics and pandemics: insights into the
future of swine flu (h1n1). BMC medicine, 7(1):30, 2009.
J.M. Epstein. Generative social science: Studies in agent-based computational modeling. Princeton
Univ Pr, 2006.
J.M. Epstein, Brookings Institution, Center on Social, and Economic Dynamics. Toward a containment
strategy for smallpox bioterror: an individual-based computational approach. Citeseer, 2002.
T. Eyob, M. Tshilidzi, and M. Conrad. Agent-based modeling: A case study in hiv epidemic. In
Proceedings of the Fourth International Conference on Hybrid Intelligent Systems), 2005.
S.C. Fu. Modelling epidemic spread using cellular automata. University of Western Australia, 2002.
A.P. Galvani and R.M. May. Dimensions of superspreading. Nature, 438(7066):293295, 2005.
H.W. Hethcote. The mathematics of infectious diseases. SIAM review, pages 599653, 2000.
W. HOYA et al. Modeling epidemics using cellular automata. Applied mathematics and computation,
186(1):193202, 2007.
B. Iantovics. Cognitive medical multiagent systems. BRAIN. Broad Research in Artificial Intelligence
and Neuroscience, 1(1):pp12, 2010.
J.O. Lloyd-Smith, S.J. Schreiber, P.E. Kopp, and WM Getz. Superspreading and the effect of individual
variation on disease emergence. NATURE-LONDON-, 438(7066):355, 2005.
A.R. Mikler, S. Venkatachalam, and K. Abbas. Modeling infectious diseases using global stochastic
cellular automata. Journal of Biological Systems, 13(4):421439, 2005.
L. Quanxing and J. Zhen. Spatial organization and evolution period of the epidemic model using
cellular automata. Arxiv preprint nlin.CG/0605046, 2006.
Timothy Reluga, Jan Medlock, and Alison Galvani. A model of spatial epidemic spread when individuals
move within overlapping home ranges. Bulletin of Mathematical Biology, 68:401416, 2006. ISSN
0092-8240. URL http://dx.doi.org/10.1007/s11538-005-9027-y. 10.1007/s11538-005-9027-y.
A.J. Rhee. An agent-based approach to HIV/AIDS epidemic modeling: a case study of Papua New
Guinea. PhD thesis, Massachusetts Institute of Technology, Engineering Systems Division, Technology and Policy Program; and,(SM)Massachusetts Institute of Technology, Dept. of Civil and
Environmental Engineering, 2006.
J. Satsuma, R. Willox, A. Ramani, B. Grammaticos, and AS Carstea. Extending the sir epidemic
model. Physica A: Statistical and Theoretical Physics, 336(3-4):369375, 2004.
E. Teweldemedhin, T. Marwala, and C. Mueller. Agent-based modelling: a case study in hiv epidemic.
In Hybrid Intelligent Systems, 2004. HIS04. Fourth International Conference on, pages 154159.
IEEE, 2004.
G. De Vries, T. Hillen, M. Lewis, J. Muller, and B. Schonfisch. A course in mathematical biology. 2005.
L. Wen and X. Yang. Global stability of a delayed sirs model with temporary immunity. Chaos, Solitons
& Fractals, 38(1):221226, 2008.
S.H. White, A.M. del Rey, and G.R. Sanchez. Modeling epidemics using cellular automata. Applied
Mathematics and Computation, 186(1):193202, 2007.
D. Yergens, J. Hiner, J. Denzinger, and T. Noseworthy. Multi agent simulation system for rapidly developing infectious disease models in developing countries. In The Second International Workshop on
Multi-Agent Systems for Medicine, Computational Biology, and Bioinformatics, page 104. Citeseer,
2006.
T. Zhang and Z. Teng. Global asymptotic stability of a delayed seirs epidemic model with saturation
incidence. Chaos, Solitons & Fractals, 37(5):14561468, 2008.
100