Está en la página 1de 4

APLICACIÓN DE REDES NEURONALES PARA

LA PREDICCION DE DENGUE
Alexandra Peralta, Diego Sotelo, Italo Casanova, Sebastian Salirrosas

Abstract—En el presente trabajo se tratará la importancia • Pruebas de laboratorio: Como las pruebas serológicas,
de la detección temprana del dengue, y el porqué se aplicará donde se detecta el anticuerpo producido por la infección
un enfoque basado en redes neuronales artificiales para el del dengue, prueba PCR, donde detecta la presencia del
diagnóstico de este, haciendo un repaso de varios trabajos previos
que ya se han enfocado en este tema. material genético del virus en la sangre del paciente,
Keywords: PACS, teleradiology, Medical Imaging, Archiving. hemograma completo, donde se realiza el conteo de
plaquetas pues el dengue suele disminuir el recuento de
I. I NTRODUCCI ÓN plaquetas.
El dengue es una enfermedad viral transmitida por
mosquitos que representa un importante problema de salud III. E STADO DEL ARTE
global, de gran impacto en las últimas décadas en América
Latina y el Perú, particularmente en la Amazonı́a que repre- A. Redes artificales
senta el 57% del territorio y el 12% de la población nacional Un modelo de red neuronal es un algoritmo de aprendizaje
[4] y según la OMS (Organización Mundial de la Salud) cada automático inspirado en la forma en que funciona el cerebro
año se producen entre 100 y 400 millones de infecciones. Por humano. Consisten en capas de unidades de procesamiento
ende su diagnóstico temprano y preciso es fundamental para interconectadas llamadas ”neuronas artificiales” o ”nodos”.
el manejo adecuado de los pacientes y la prevención de brotes Estas neuronas están organizadas en capas de entrada, ocultas
epidémicos. Debido al avance de la Inteligencia Artificial y a y de salida. Además que se entrenan utilizando un conjunto
la gran precisión de esta, se propondrá como solución el uso de datos de entrenamiento que proporciona entradas y salidas
de redes neuronales artificiales para el diagnóstico del dengue. predecibles. Durante el entrenamiento, el modelo ajusta los
II. J USTIFICACI ÓN pesos de conexión entre las neuronas para minimizar la difer-
encia entre la salida prevista y la salida real. A continuación
A. EL DENGUE veremos diversos modelos para el diagnóstico del Dengue y
El dengue es una enfermedad viral transmitida por haciendo énfasis en la red neuronal artificial.
mosquitos, principalmente por el mosquito Aedes aegypti. Es 1) Evaluation of dengue model performances developed
considerada una enfermedad tropical y afecta a millones de using artificial neural network and random forest classifiers.:
personas en diferentes partes del mundo, especialmente en Según el trabajo [1] la forma de entrenar una red neuronal
regiones de clima cálido y húmedo, la infección de este virus artificial (RNA) es la siguiente:
puede resultar en diversas manifestaciones clı́nicas, desde
1) Recopilación de datos
casos leves hasta formas graves y potencialmente mortales.
2) Procesamiento de datos
B. SÍNTOMAS 3) Diseño del modelo de redes neuronales
4) Entrenamiento del modelo
Los sı́ntomas del dengue son muy conocidos: Fiebre, dolor
5) Evaluación del modelo
en los músculos y articulaciones, dolor detrás de los ojos,
6) Validación del modelo
náuseas y vómitos, dolor de cabeza, sarpullido
Este trabajo usó datos de laboratorio como: el nivel de
C. MAGNITUD DE LA ENFERMEDAD DEL DENGUE hemoglobina, hematrocitos, Leucocitos, Trombocitos, Neutro-
Si bien la mayorı́a de los casos de dengue son leves filos, Linfocitos y monocitos para diagnosticar el dengue a
y autolimitados, la enfermedad puede tener manifestaciones través de dos técnicas diferentes, siendo la primera redes
graves que requieren atención médica y pueden poner en neuronales artificiales y la segunda random forest classifiers.
peligro la vida. Dando como resultado de rendimiento del 56% a las redes
neuronales artificiales y un 5% y 57% a un clasificador random
D. DIAGNÓSTICOs de la ENFERMEDAD USADOS forest de 5 esquemas y 10 esquemas respectivamente. Por lo
Existen dos formas de diagnosticar el dengue: que se puede concluir que las redes neuronales artificiales
• La evaluación clı́nica: El médico evalúa los sı́ntomas y tienen un rendimiento similar a un clasificador random forest
antecedentes del paciente -Pruebas de laboratorio: Como con menor costo de poder de cómputo.
las pruebas serológicas, donde se detecta el anticuerpo [2] [3] [4] [5]
B. Diagnóstico del dengue utilizando redes neuronales artifi- • Tamaño de la población
ciales • Casos previos de Dengue
Este modelo de red neuronal artificial se basa en una mult- • Temperatura máxima del aire

icapa en que se entrena a los nodos mediante el algoritmo de • Fecha

entrenamiento Backpropagation, que se basa en el cálculo del • Las variables con mayor influencia en la locación de
gradiente negativo o gradiente descendente del error cuadrático México fueron:
medio en la salida de la RNA, modifica el valor de los pesos • Tamaño de la población
de las conexiones entre las neuronas de entrada, ocultas y de • Casos previos de Dengue
salida, cada vez que entrena la red se modifican los pesos, la • Temperatura mı́nima del aire
clave está en entrenar la red neuronal cuantas veces sea nece- • Fecha
saria, hasta encontrar el menor error de entrenamiento y sobre Por lo cual se puede concluir que tanto el tamaño de la
todo de validación, de donde se obtienen los pesos definitivos. población, los casos previos de Dengue, la temperatura del
De manera que para este artı́culo tuvieron una arquitectura de aire y la fecha serı́an variables indispensables en la creación
red neuronal artificial multicapas propagation de 24 neuronas de nuestro modelo, y debido a que las ciudades donde se hizo
en la capa de entrada, 12 neuronas en la primera capa oculta, el estudio son ciudades parecidas en temperatura y ubicación
4 neuronas en la segunda capa oculta y una neurona en la capa geográfica a la ciudad de Lima el poder de estas variables será
de salida con función de activación tansig en las capas ocultas parecido para una ciudad costera como Lima. Por último el
y de salida, algoritmo de entrenamiento trainlm (Levenberg modelo llegó a un poder predictivo mayor al 7% para cada
Marquardt), presenta un alto valor de factor de correlación uno de los modelos de RNA.
R=90.175, lo que demuestra su validez para el diagnóstico
del dengue a partir de los sı́ntomas de la enfermedad en la E. Diagnosis of dengue virus infection using spectroscopic
región San Martı́n, con una efectividad equivalente a 90.175% images and deep learning
Las entradas a los sı́ntomas del dengue donde estos fueron En este se utilizó una red neuronal convolucional (CNN)
adaptados y adecuados en forma matricial en un excel de transformador con memoria a corto plazo (LSTM) en el que
24 filas que eran los sı́ntomas y 215 columnas que eran los se consideraron como entrada a las variantes del clima en
patrones donde la última fila corresponde al target que es la donde los modelos se desarrollaron utilizando la incidencia de
salida objetivo que muestra la presencia (1) o ausencia del DF. Además, LSTM-ATT mostró el desempeño más alto, con
dengue (0). una puntuación promedio de 1,60 para la clasificación basada
en RMSE y 1,95 para la clasificación basada en MAE. En
C. Modelos predictivos para el Diagnóstico de Dengue: Es-
particular, pudo pronosticar la incidencia de DF mejor que
tudio caso en Paraguay
LSTM en 13 o 14 de 20 provincias para MAE o RMSE,
Se tienen los modelos de la red neuronal artificial (ANN) respectivamente. Además, LSTM-ATT fue capaz de predecir
y la máquina de vectores de soporte (SVM) donde este con precisión la incidencia de DF y los meses de brote
último busca un hiperplano separador con el margen más con hasta 3 meses de anticipación, aunque el rendimiento
alto pero ambos funcionan para datos con alta dimensión disminuyó ligeramente en comparación con los pronósticos
donde los polinomios ANN-MLP y SVM han demostrado que a corto plazo. Hasta donde sabemos, esta es la primera vez
pueden funcionar como clasificadores en el diagnóstico de que se emplean métodos de aprendizaje profundo para la
la enfermedad del dengue con altos promedios de precisión, predicción de la incidencia y los brotes de FD a largo y corto
sensibilidad y especificidad, dentro del contexto espacial y plazo en Vietnam utilizando caracterı́sticas meteorológicas
temporal determinado por el conjunto de datos en donde El ricas y únicas.
perceptrón multicapa ANN logró mejores resultados con un
promedio de 96% de precisión, 96% de sensibilidad y 97% IV. METODOLOGIA
de especificidad, con una baja variación en treinta particiones A. Datos de entrada:
diferentes del conjunto de datos. En comparación, el polinomio
SVM obtuvo resultados superiores al 90% en cuanto a pre- Como ya se vio en los trabajos previos para diagnosticar el
cisión, sensibilidad y especificidad.[g] dengue a través del enfoque de redes neuronales artificiales se
pueden usar datos de entrada como los sı́ntomas, resultados
D. Application of artificial neural networks for dengue fever de laboratorios clı́nicos o incluso datos geográficos como la
outbreak predictions in the northwest coast of Yucatan, Mexico ubicación y el clima, los que ofrecen los resultados más
and San Juan, Puerto Rico. precisos son los datos de resultados de laboratorio clı́nicos, sin
En el trabajo [2] se entrenó a 4 distintos modelos de RNA, 2 embargo, a su vez son los datos más costosos de conseguir,
para cada una de las ubicaciones. Estos modelos tenı́an como por lo que, la manera más eficiente de diagnosticar el virus
objetivos poblaciones distintas: Población de riesgo (personas del dengue es a través de los sı́ntomas Nuestros datos serán
menores a 24 años) y Población vulnerable (personas menores los siguientes:
a 5 años y mayor a 65 años). Las variables con mayor • dolor de cabeza
influencia para la locación de Puerto Rico fueron: (dengue.servereh eadche)
• dolor detrás de los ojos Fig. 2: Capa oculta
(dengue.painb ehindt hee yes)
• dolor en los músculos y articulaciones
(dengue.jointm usclea ches)
• sabor metálico en la boca
(dengue.metalict astei nt hem outh)
• pérdida de apetito
(dengue.appetitel oss)
• dolor abdominal
(dengue.abdominalp ain)
• náuseas
(dengue.nauseav omiting)
• diarrea
(dengue.diarrhoea) D. Procesamiento de los datos
• dengue
(dengue.dengue) (este se usará para validar el modelo) Es importante preprocesar la data antes de usarlos para el
• temperatura actual entrenamiento de datos, los procesamientos que realizaremos
(dengue.currentt emp) serán los siguientes:
• Estandarización/Normalización: Las redes neuronales son
B. Metadatos sensibles a la escala de los datos de entrada.
Se utilizará solo una capa por motivos de simplicidad y • Manejo de Valores Faltantes: Las redes neuronales no
eficiencia, para evitar el sobreajuste y para que el modelo sea pueden manejar valores faltantes. El preprocesamiento
más fácil de interpretar y ası́ poder cumplir con caracterı́sticas ayuda a llenar estos valores faltantes con estadı́sticas
esenciales como la interpretación y explicabilidad. apropiadas como la media, mediana o moda, o un valor
inferido de un método más complejo.
C. Elección del tipo de RNA • Manejo de Valores Faltantes: El preprocesamiento ayuda
Entre los diversos tipos de RNA que existen usaremos las a llenar estos valores faltantes con estadı́sticas apropiadas
Redes Neuronales Feedforward (FFNN) debido a que estas como la media, mediana o moda, o un valor inferido de
son las que se usan principalmente en nuestra tarea, que es de un método más complejo.
clasificación. El motivo por el que no usamos los otros tipos • Reducción de Ruido: Los datos del mundo real a menudo
de redes son los siguientes: Redes Neuronales Recurrentes: contienen ruido que puede afectar negativamente el
Se utilizan cuando se trabaja con datos secuenciales, donde rendimiento de un modelo. El preprocesamiento puede
se guarda información temporal y las dependencias, debido a ayudar a reducir este ruido, por ejemplo, a través de
que solo usaremos una capa este tipo de red es inviable para técnicas de suavizado o eliminación de valores atı́picos.
nuestro trabajo Redes neuronales convolucionales: Ideales para
procesar datos de estructura cuadrı́cula como imágenes, como E. Salida
nuestros datos no tienen este tipo de estructura no es viable Para nuestro output lo que realizaremos será al valor que
para nuestro trabajo. Redes neuronales generativas adversari- nos de la red neuronal aplicarle una función sigmoide para
ales: Se utiliza para la generación de datos sintéticos mediante clasificar binariamente el valor de salida puesto que nuestro
la competencia entre un generador y un discriminador, como resultado debe ser sı́ o no, lo que es una variable dicotómica.
nuestro trabajo busca clasificar y no generar data, no es viable
este método. Por lo tanto el modelo serı́a el siguiente: Fig. 3: Salida

Fig. 1: Modelo RNA

F. División de datos para el entrenamiento, validación y


prueba
1) Entrenamiento: Para el entrenamiento separamos el 80%
de nuestros datos, ya que deben ser lo suficientemente grande
y representativo de los datos reales para que el modelo pueda Fig. 8: Prediccion
aprender de manera efectiva.
2) Validación: Para la validación usamos el 20% de los
datos y con esto ajustamos hiper parámetros.
3) Prueba: Para la prueba usamos un dato que ya conoce-
mos el resultado y evaluamos que resultado nos da.
G. Codigo

Fig. 4: Codigo

parámetros en un valor verdadero obtenemos una predicción


con el 100% de precisión que se trata de un caso de dengue
y, si bien esto no justifica el uso del modelo, si demuestra
cierto de grado de validez, por lo que se cree que contando
con un conjunto de datos de entrenamiento y prueba de
mayor volumen, esta red neuronal podrı́a ser de ayuda en la
Fig. 5 predicción y prevención del dengue ya que permite detectar un
brote temprano del dengue además que que el modelo al estar
analizando datos en tiempo real permite identificar patrones y
señales de un posible brote de dengue por lo que esto puede
ayudar a enfocar los recursos y esfuerzos de control en esas
áreas especı́ficas, de esta manera las medidas de prevención
serı́an más acertadas y aportarı́a mucho con la lucha de esta
enfermedad.
R EFERENCES
[1] D. B. E. B. A. A.-A. H. S. Silitonga, P., “Evaluation of
dengue model performances developed using artificial neurall net-
work and random forest classifiers. procedia computer science,”
Fig. 6 https://doi.org/10.1016/j.procs.2020.12.018, vol. 179, p. 135–143, 2021.
[2] D. A. P. M.-L. P. A. G.-R. J. E. G.-C. S. F.-A. J. S. D. A. . M.-K.
F. E. Laureano-Rosario, A. E., “Application of artificial neural networks
for dengue fever outbreak predictions in the northwest coast of yucatan,
mexico and san juan, puerto rico. tropical medicine and infectious
disease,” Informática PeerJ, vol. 1, pp. 3–5, 2018.
[3] B. Rı́os Rı́os, “Diagnóstico del dengue utilizando redes neuronales
artificiales.” Ciencia Latina Revista Cientı́fica Multidisciplinar, vol. 6,
p. 4, 2019.
[4] S. G.-G. M. G.-T. Jorge D. Mello-Román, Julio C. Mello-Román,
“Predictive models for the medical diagnosis of dengue: A case study
in paraguay,” Computational and Mathematical Methods in Medicine,
vol. 6, 2019.
[5] T.-H. T. T.-M. J. V. M. H. D.-T. Q. V. C. N. N.-N. T. T. L. V. H. M.-H.
B. C. D. B. N. N. Q. N. H. L. T. N. Q. T. N. T. N. N. D. A. L. V. Q. P.
D. T. M. H. N. Q. V. . S. M. T. Nguyen, V.-H., “Deep learning models
Fig. 7 for forecasting dengue fever based on climate data in vietnam,” PLoS
Neglected Tropical Disease, vol. 18, p. 6, 2022.

resultado de la prediccion:
V. C ONCLUSIONES
Teniendo en cuenta el poco volumen de datos con el que
se entrenó al modelo, al realizar una predicción con todos los

También podría gustarte