Journal PNTD 0010061 en Es

Traducido del inglés al español - www.onlinedoctranslator.
com
plosENFERMEDADES TROPICALES DESATENDIDAS
ARTÍCULO DE INVESTIGACIÓN
Técnicas de aprendizaje automático y aprendizaje

profundo para apoyar el diagnóstico clínico de
enfermedades arbovirales: una revisión sistemática
1
Sebastiánao Rogério da Silva NetoIDENTIFICACIÓN
1 , Thomas Tabosa Oliveira1IDENTIFICACIÓN, Igor Vítor Teixeira IDENTIFICACIÓN,
Samuel Benjamín Aguiar de OliveiraIDENTIFICACIÓN

2,3 , Vanderson Souza Sampaio2,3
IDENTIFICACIÓN, Theo Lynn4,
Patricia Takako Endo1 * IDENTIFICACIÓN
1Universidade de Pernambuco, Recife, Brasil,2Universidade do Estado do Amazonas, Manaos, Brasil, 3Fundaçao de

Medicina Tropical Dr. Heitor Vieira Dourado, Manaos, Brasil,4Universidad de la ciudad de Dublín, Dublín, Irlanda
a1111111111
a1111111111 * patricia.endo@upe.br
a1111111111
a1111111111
a1111111111
Abstracto
Fondo
ACCESO ABIERTO Las enfermedades tropicales desatendidas (ETD) afectan principalmente a las poblaciones más pobres, que a
Citación:da Silva Neto SR, Tabosa Oliveira T, Teixeira IV, menudo viven en áreas rurales remotas, barrios marginales urbanos o zonas de conflicto. Los arbovirus son una
Aguiar de Oliveira SB, Souza Sampaio V, Lynn T, et al. categoría importante de NTD que transmiten los mosquitos. El dengue, el chikungunya y el zika son tres arbovirus
(2022) Aprendizaje automático y técnicas de aprendizaje
que afectan a una gran proporción de la población de América Latina y del Sur. El diagnóstico clínico de estas
profundo para apoyar el diagnóstico clínico de
enfermedades arbovirales: una revisión sistemática. PLoS enfermedades arbovirales es una tarea difícil debido a la circulación simultánea de varios arbovirus que presentan
Negl Trop Dis 16(1): e0010061.https://doi.org/10.1371/ síntomas similares, pruebas serológicas inexactas que resultan de la reacción cruzada y la coinfección con otros
journal.pntd.0010061
arbovirus.
Editor:Rhoel Ramos Dinglasan, Universidad de
Florida, ESTADOS UNIDOS Objetivo
Recibió:30 de julio de 2021 El objetivo de este artículo es presentar evidencia sobre el estado del arte de los estudios que
Aceptado:6 de diciembre de 2021 investigan la clasificación automática de enfermedades arbovirales para apoyar el diagnóstico clínico
Publicado:13 de enero de 2022

basado en modelos de Machine Learning (ML) y Deep Learning (DL).
Historial de revisión por pares:PLOS reconoce los beneficios
de la transparencia en el proceso de revisión por pares; por lo

Método
tanto, permitimos la publicación de todo el contenido de la Llevamos a cabo una Revisión Sistemática de la Literatura (SLR) en la que se buscó en Google Scholar
revisión por pares y las respuestas de los autores junto con los
para identificar documentos clave sobre el tema. De 963 registros iniciales (956 de búsqueda basada en
artículos finales publicados. El historial editorial de este artículo
está disponible aquí: https://doi.org/10.1371/

cadenas y siete de un único procedimiento de bola de nieve hacia atrás), solo se identificaron 15
journal.pntd.0010061 artículos relevantes.
Derechos de autor:©2022 da Silva Neto et al. Este es un

artículo de acceso abierto distribuido bajo los términos Resultados
de laLicencia de atribución de Creative Commons , que
Los resultados muestran que la investigación actual se centra en la clasificación binaria del dengue,
permite el uso, la distribución y la reproducción sin
restricciones en cualquier medio, siempre que se acredite
principalmente utilizando algoritmos de aprendizaje automático basados en árboles. Solo se identificó un artículo
el autor original y la fuente. mediante DL. Cinco documentos presentaron soluciones para problemas de clases múltiples, cubriendo Dengue (y
Declaración de disponibilidad de datos:Todos los datos relevantes son

sus variantes) y Chikungunya. No se identificaron trabajos que investigaran modelos para diferenciar entre
dentro del manusc rasgar Dengue, Chikungunya y Zika.
PLOS Negligencia d Enfermedades tropicales |https://doi.org/10.1371/journal.pntd.001006113 de enero de 2022 1 / 37

PLOS ENFERMEDADES TROPICALES DESATENDIDAS Técnicas de apoyo al diagnóstico clínico de enfermedades arbovirales: una revisión sistemática
Fondos:VSS tiene una beca (062.00249/2020 [EDITAL N. Conclusiones

006/2019 - UNIVERSAL AMAZONAS]) de Fundaçao de
amparoaPesquisa do Estado do Amazonas (FAPEAM) ( El uso de un sistema de apoyo a la decisión clínica eficiente para enfermedades arbovirales
http://www.fapeam.am. gov.br/ ). Los patrocinadores no puede mejorar la calidad de todo el proceso clínico, aumentando así la precisión del diagnóstico y
tuvieron ningún papel en el diseño del estudio, la
el tratamiento asociado. Debe ayudar a los médicos en su proceso de toma de decisiones y, en
recopilación y el análisis de datos, la decisión de publicar o
consecuencia, mejorar el uso de los recursos y la calidad de vida del paciente.
la preparación del manuscrito.
Conflicto de intereses:Los autores han declarado que

no existen intereses contrapuestos.
Abreviaturas: IA, Inteligencia artificial;MONTAÑA, Fosfatasa
alcalina;alternativa, alanina transaminasa; ALYMPHP,

Resumen del autor
porcentaje de linfocitos atípicos;AST, Aspartato
Las enfermedades tropicales desatendidas (ETD) afectan principalmente a las poblaciones más pobres, que a
aminotransferasa;ABC, Área bajo la curva;BIA, Análisis de
menudo viven en áreas rurales remotas, barrios marginales urbanos o zonas de conflicto. Los arbovirus son
Impedancia Bioeléctrica; BRBES, Sistema Especializado de Reglas
una categoría importante de NTD que transmiten los mosquitos. El dengue, el chikungunya y el zika son tres
de Creencias;CARRO, Árbol de Clasificación y Regresión;CNN,
Red Neuronal Convolucional;CZS, Síndrome Zika Congénito; arbovirus que afectan a una gran proporción de la población de América Latina y del Sur. El diagnóstico
AVAD, años de vida ajustados por discapacidad;DBN, Redes de clínico de estas enfermedades arbovirales es una tarea difícil debido a la circulación simultánea de varios
creencias profundas;DDM, Modelo Diagnóstico del Dengue; arbovirus que presentan síntomas similares y, a veces, resultados de prueba inexactos. En este artículo,
DENV, Virus del Dengue;DF, Dengue;DHF, Dengue Hemorrágico;
presentamos el estado del arte de los estudios que investigan la clasificación automática de enfermedades
DHF1, Dengue Hemorrágico 1;DHF2, Dengue Hemorrágico 2;
por arbovirus basados en modelos de Machine Learning (ML) y Deep Learning (DL). Los resultados
DHF3, Dengue Hemorrágico 3;DL, Aprendizaje profundo;DSN,
redes de apilamiento profundo;DSPM, Modelo de predicción de

muestran que la investigación actual se centra en la clasificación del dengue, principalmente utilizando
la gravedad del dengue;DSS, Síndrome de Shock por Dengue; algoritmos de aprendizaje automático basados en árboles. El uso de un sistema de apoyo a la decisión
ELISA, Inmunoensayo ligado a enzimas;EOSBAS, Recuento de clínica eficiente para enfermedades arbovirales puede mejorar la calidad de todo el proceso clínico,
basófilos de eosinófilos;EOSBASP, porcentaje de basófilos de
aumentando así la precisión del diagnóstico y el tratamiento asociado. Debe ayudar a los médicos en su
eosinófilos;FLBES, Sistema Experto Basado en Lógica Difusa;FN,
proceso de toma de decisiones y, en consecuencia, mejorar el uso de los recursos y la calidad de vida del
Falso negativo;FP, Falso positivo; FPR, Tasa de falsos positivos;
paciente.
GRU, Unidades Recurrentes Cerradas;HAI, ensayo de inhibición
de la hemaglutinación; HGB, hemoglobina;HT, Hipertensión;htc,
hematocrito;UCI, Unidad de Cuidados Intensivos;ID3,
dicotomizador iterativo 3;IgG, Inmunoglobulina G;IgM,
Inmunoglobulina M;JEV, virus de la encefalitis japonesa;kNN, K-
vecinos más cercanos;LAVABO, dejar uno fuera;LSTM, Memoria 1. Introducción

a Largo Plazo;LINFA, Recuento de linfocitos;LINFA, porcentaje
Las enfermedades tropicales desatendidas (NTD, por sus siglas en inglés) incluyen una amplia gama de enfermedades
de linfocitos;MCH, Hemoglobina corpuscular media; MCHC,
parasitarias, virales y bacterianas que prevalecen en condiciones tropicales y subtropicales en 149 países y afectan a mil
Concentración de hemoglobina corpuscular media;ML,
millones de personas cada año.1]. Una categoría importante de NTD son los virus transmitidos por artrópodos (o
Aprendizaje automático;MLP, Perceptrón multicapa;
MONONUCLEOSIS INFECCIOSA, Recuento de monocitos; enfermedades por arbovirus), un grupo de virus que se encuentran en la naturaleza y se transmiten biológicamente entre
MONOP, porcentaje de monocitos;monovolumen, Volumen huéspedes vertebrados susceptibles a través de artrópodos hematófagos [2 ].
medio de plaquetas;ENT, Enfermedades no transmisibles;
Los arbovirus incluían una amplia variedad de enfermedades, incluido el virus de la peste porcina africana, el
NEUTRO, Recuento de neutrófilos;NEUTP, Porcentaje de
virus de la encefalitis japonesa (JEV), el virus de la fiebre del Valle del Rift, el virus de la encefalitis transmitida por
neutrófilos;NN, Redes neuronales;ETD, Enfermedades tropicales
garrapatas, el virus del Nilo occidental y el virus de la fiebre amarilla, sin embargo, los más comunes son el
desatendidas;OFI, Otra enfermedad febril;PCR, Reacción en
cadena de la polimerasa;PDW, Ancho de distribución de dengue, el chikungunya y el zika.3]. Estos tres arbovirus son transmitidos principalmente por Aedes spp.
plaquetas;PLCR, Proporción de células grandes de plaquetas; plt mosquitos, de los cuales Aedes aegyptiyAedes albopictusson los vectores más comunes [4 ,5 ]. ElAedes aegypti
, Recuento de plaquetas;glóbulos rojos, Recuento de glóbulos puede adaptarse fácilmente a áreas urbanas y semiurbanas [6 ,7 ]. El crecimiento de la población, la urbanización
rojos; RDW, Ancho de distribución de glóbulos rojos;RNN, Redes
no planificada, la modificación del hábitat, la migración humana y animal y el cambio climático, combinados con
Neuronales Recurrentes;República de China, Característica
viviendas de baja calidad y entornos peridomiciliarios descuidados, contribuyen a crear condiciones ecológicas
Operativa del Receptor;RT-PCR, Reacción en cadena de la
polimerasa con transcriptasa inversa;cámara réflex, Revisión

ideales para Aedes spp. poblaciones para prosperar [5,8–10]. Estos factores, que afectan desproporcionadamente
Sistemática de la Literatura;MOS, Mapa autoorganizado; a los pobres, aumentan el área geográfica de riesgo de enfermedades arbovirales y contribuyen a establecer a los
arbovirus como un problema de salud mundial.8 –11 ]. Estos arbovirus se mantienen fuera de las estaciones
lluviosas por transmisión transovárica de mosquitos hembra a su descendencia.12 ,13 ]. Otros modos de
transmisión incluyen la transmisión vertical y sexual [14 ,15 ], y transfusiones contaminadas [5 ,dieciséis ]. La carga
global de enfermedades arbovirales en general es significativa. La incidencia y el número de muertes por dengue
van en aumento
PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 2 / 37

MVS, Máquinas de vectores soporte;Tennesse, Verdadero lo que resultó en una carga global de enfermedad de 2,9 millones de años de vida ajustados por discapacidad
Negativo; ANTORCHAS, infecciones por toxoplasmosis,
(AVAD) solo en 2017, un aumento del 107 % desde 1990.17 ]. Un análisis reciente sobre la carga global de
rubéola, citomegalovirus, herpes simple y sífilis;TP, Verdadero
Chikungunya y Zika sugiere una pérdida anual promedio de más de 106 000 y 44 000 AVAD, respectivamente,
Positivo;TPR, Tasa de verdaderos positivos;WBC, Células
entre 2010 y 2019 [18]. En cada caso, la carga de estas enfermedades afecta de manera desproporcionada a las
blancas de la sangre;XAI, Inteligencia Artificial Explicable;ZIKV,
Virus Zika. Américas.

Si bien la presentación clínica de estas enfermedades está bien establecida [19 ,20 ], el diagnóstico de
estas enfermedades es una tarea difícil. En la literatura se citan tres razones principales para explicar por
qué existen dificultades para realizar un diagnóstico de arbovirus. En primer lugar, la mayoría de los casos
son asintomáticos, por lo que el arbovirus puede estar presente en un área sin un brote identificable.21 ,22
]. En segundo lugar, su infección sintomática suele ser clínicamente indistinguible entre sí. Todos ellos
comparten síntomas comunes como fiebre, artralgia, mialgia, dolor de cabeza y dolor retroorbitario.21 ]. Si
bien el dengue y el zika tienen algunos síntomas distintos, por ejemplo, diátesis hemorrágica (dengue) y
edema en las extremidades (zika), y el chikungunya está relacionado con molestias en las articulaciones, su
diagnóstico requiere un alto grado de experiencia y conocimiento clínico que puede complicarse aún más
en poblaciones especiales [22 ,23 ]. Además, los síntomas de Dengue y Chikungunya pueden incluir
hemorragias y leucopenia/trombocitopenia, mientras que los síntomas de Chikungunya y Zika pueden
incluir conjuntivitis no purulenta.22 ]. En tercer lugar, la coinfección también es común, lo que aumenta la
dificultad del diagnóstico de estas afecciones.5 ,21 ,24 ,25 ].
A pesar de las dificultades en el diagnóstico diferencial, la progresión y el impacto de estas enfermedades
varía significativamente. Después de la infección por Dengue, la enfermedad puede manifestarse de forma
asintomática y es posible que los pacientes ni siquiera sepan que están infectados. Serológicamente, después de
7-10 días después de la picadura del mosquito, se puede confirmar un diagnóstico de Dengue [26 ]; algunas
personas pueden experimentar síntomas como fiebre, dolor de cabeza, dolor en los músculos y articulaciones y
fatiga. Para algunos, la enfermedad puede progresar a una condición más severa que resulta en sangrado, daño a
órganos y pérdida de plasma.19 ]. El dengue se puede clasificar en dos etapas: la fase febril y la fase crítica. La fase
febril suele durar de 2 a 7 días. La fase crítica del dengue comienza con la desaparición de la fiebre y suele durar
de 24 a 48 horas. Si bien la mayoría de los pacientes mejoran clínicamente, algunos pueden experimentar el
síndrome de fuga vascular sistémica, caracterizado por un aumento de la hemoconcentración, hipoproteinemia,
derrame pleural y ascitis.27 ]. El dengue grave puede provocar la muerte debido a la fuga de plasma, la
acumulación de líquidos, la dificultad respiratoria, el sangrado intenso o la alteración de órganos.19 ]. La infección
por Chikungunya puede manifestar síntomas similares al Dengue entre el cuarto y el séptimo día después de la
picadura, pero con mayor dolor articular. La progresión de Chikungunya tiene tres fases. La fase aguda se
caracteriza por síntomas de aparición súbita que se manifiestan con fiebre alta, exantema y artralgia, afectando
principalmente a las articulaciones pequeñas y grandes. La fase subaguda se caracteriza por un empeoramiento
de las artralgias. Si bien Chikungunya rara vez es fatal, puede progresar a un estado crónico. El reumatismo
posterior a Chikungunya es común y puede durar de semanas a años con efectos adversos asociados en la calidad
de vida.5 ,28 –31 ]. Inicialmente, el zika se consideró una enfermedad leve, a veces sin episodios de fiebre.5 ], sin
embargo, ahora está claro que su principal amenaza está relacionada con la microcefalia y otras anomalías
congénitas en el feto y el recién nacido; puede desencadenar el síndrome de Guillain-Barré, neuropatía y mielitis
en adultos y niños mayores [31 ]. Los síntomas del Zika incluyen artralgia, edema de las extremidades, fiebre baja,
erupción maculopapular que a menudo es pruriginosa, dolores de cabeza, dolor retroorbitario, sin conjuntivitis
purulenta, vértigo, mialgia y trastornos digestivos.32 ]. La manifestación más grave de infección es el Síndrome
Congénito de Zika (CZS). El riesgo de la infección puede ocurrir durante cualquier trimestre gestacional [33 ]. El
CZS está relacionado con microcefalia fetal, secuencia de disrupción cerebral fetal, calcificaciones subcorticales,
signos piramidales y extrapiramidales, anomalías oculares (moteado pigmentado focal, atrofia coriorretiniana),
contracturas congénitas, restricción del crecimiento fetal e incluso la muerte.33 –35 ].
La identificación temprana de infecciones específicas por arbovirus puede tener un impacto significativo en el
curso clínico y las decisiones relacionadas con el tratamiento y la atención. Los impactos adversos de los pobres

diagnóstico de arbovirus se exacerban cuando existen presiones contrapuestas por financiamiento y personal
capacitado y experimentado, debido a múltiples epidemias de enfermedades concurrentes.36 ]. Se requieren
nuevos enfoques escalables de bajo costo para el diagnóstico diferencial de enfermedades arbovirales para la
vigilancia epidemiológica. Uno de esos enfoques es el desarrollo de modelos computacionales para el seguimiento
y la clasificación diagnóstica basados en datos y síntomas clínicos. Los modelos de Machine Learning (ML) y Deep
Learning (DL) han sido ampliamente propuestos en el campo biomédico para apoyar el diagnóstico y la predicción
de enfermedades.37 ]. ML es un método computacional que hace uso de la experiencia para hacer predicciones,
es decir, es un algoritmo que recibe datos de entrada (conjunto de datos de entrenamiento) para aprender o
encontrar un patrón. La calidad y el tamaño de los datos son fundamentales para el éxito del proceso de
aprendizaje y, en consecuencia, para garantizar la eficiencia de las predicciones del modelo. Al diseñar un modelo
de ML, el objetivo es encontrar una configuración (un conjunto de hiperparámetros) que produzca un modelo
capaz de generalizar y producir un rendimiento satisfactorio al tratar con nuevos datos nunca antes vistos. DL es
un subcampo de ML que enfatiza el aprendizaje basado en capas sucesivas de representaciones cada vez más
significativas.38 ]. Aquí, “profundo” se relaciona con la idea de capas sucesivas de representaciones. Los modelos
DL se basan en iteraciones tempranas de redes neuronales (NN) y se informan cada vez más como el enfoque de
ML más efectivo con la ventaja de combinar la extracción de características y la tarea de clasificación al mismo
tiempo. Sin embargo, la naturaleza de "caja negra" de la mayoría de los modelos de DL es un desafío importante
en el espacio de la salud que valora la transparencia. Como tales, los modelos ML más transparentes se usan
comúnmente debido a su interpretabilidad.
En este artículo, presentamos una SLR sobre cómo la investigación existente emplea técnicas de ML y DL para
clasificar automáticamente las enfermedades arbovirales y respaldar el diagnóstico clínico.
2 métodos
El propósito de una SLR es identificar, seleccionar y evaluar críticamente la investigación sobre un tema específico.
Las SLR generalmente comprenden tres fases principales: planificar la revisión, realizar la revisión e informar los
resultados de la revisión [39 ]. El objetivo de este artículo es presentar evidencia sobre el estado del arte de los
estudios que investigan la clasificación automática de enfermedades arbovirales para apoyar el diagnóstico clínico
basado en modelos ML y DL. Para lograr este objetivo, esta SLR sigue la metodología presente enFigura 1 y busca
abordar las siguientes preguntas de investigación:
• RQ 01: ¿Qué arbovirus son el foco de investigación sobre la clasificación ML y DL de enfermedades arbovirales
para apoyar el diagnóstico clínico?
• RQ 02: ¿Qué técnicas de ML y DL se están utilizando en la investigación relacionada con la clasificación de

enfermedades arbovirales para apoyar el diagnóstico clínico?
• RQ 03: ¿Cómo se están diseñando los modelos ML y DL y cómo se comportan a la hora de clasificar las
enfermedades por arbovirus?
• RQ 04: ¿Qué características de los datos se consideran al aplicar las técnicas de ML y DL?
• RQ 05: ¿Cuáles son las métricas que se utilizan para evaluar el rendimiento de las técnicas
de ML y DL?
2.1 Estrategia de búsqueda
La estrategia de búsqueda comprendió una fase automatizada y otra manual. Se realizó una búsqueda
bibliográfica utilizando Google Scholar con la siguiente cadena de búsqueda:((“aprendizaje profundo” O
“aprendizaje automático”) Y (“arbovirus” O “arboviral”) Y (“clasificación” O “diagnóstico” O “análisis”) Y
(“datos clínicos”), en marzo de 2021. Google Scholar fue seleccionado debido a la

Figura 1. Selección de estudios.
https://doi.org/10.1371/journal.pntd.0010061.g001
exhaustividad de los artículos indexados en su base de datos [40 ]. Los autores realizaron controles de calidad en
otras bases de datos académicas y bibliométricas comunes para asegurarse de que no se dejara de lado ningún
artículo importante.
Wohlin [41 ] define bola de nieve como “. . .el uso de una lista de referencias de artículos o citas del artículo
para identificar artículos adicionales”. Hay dos formas de usar este procedimiento: hacia atrás y hacia adelante. La
bola de nieve hacia atrás usa la lista de referencias para encontrar nuevos artículos para incluir en la revisión
sistemática, mientras que la bola de nieve hacia adelante identifica nuevos artículos basados en

en aquellos documentos que citan los documentos relevantes. Para ampliar la muestra de artículos en el SLR, realizamos
una búsqueda manual para identificar y descargar estudios relevantes de un procedimiento de bola de nieve inversa de
una sola iteración aplicado a los estudios relevantes encontrados en la búsqueda automatizada.
2.2 Selección de estudios
Para garantizar la selección de solo estudios relevantes para nuestra revisión, consideramos los estudios que
cumplen con los criterios de inclusión específicos. Los criterios de inclusión requerían que los artículos estuvieran
en idioma inglés y utilizaran datos clínicos en la aplicación de modelos ML o DL para el diagnóstico de arbovirus
en un estudio primario. Se excluyeron los artículos si(1)no examinó el diagnóstico de arbovirus,
(2)estaban en un idioma diferente al inglés,(3)eran un estudio secundario o terciario,(4)utilizado técnicas
estadísticas convencionales, o(5)no usó datos clínicos como entradas para los modelos ML y DL.
La búsqueda automatizada inicial arrojó 956 registros. Estos tuvieron su título y resúmenes evaluados
por dos autores independientes de acuerdo con los criterios de inclusión y exclusión. Cuando surgía un
conflicto, un tercer autor arbitraba la selección. Con base en los criterios de inclusión y exclusión, nueve
artículos fueron retenidos en la muestra. Realizamos un solo procedimiento de bola de nieve hacia atrás.
Esto arrojó otros siete artículos, seis de los cuales se mantuvieron en la muestra después de la revisión. La
muestra final fue de 15 artículos.
2.3 Extracción y codificación de datos
Se extrajeron los siguientes datos para cada estudio: autores, año de publicación, tipo(s) de enfermedad arboviral,
técnica(s) de ML y DL empleada(s), el conjunto de datos utilizado en el estudio, las características de los datos utilizados
como entrada y las métricas utilizadas para evaluar el rendimiento de ML y DL.
3 Resultados y discusiones
3.1 ¿Qué arbovirus son el foco de la investigación sobre la clasificación de enfermedades
arbovirales mediante aprendizaje automático y aprendizaje profundo para respaldar el
diagnóstico clínico?
Sorprendentemente, dada la variedad de enfermedades arbovirales, el enfoque de la investigación, aunque una muestra
pequeña, fueron las tres enfermedades más populares, es decir, el dengue, el chikungunya y el zika. Aunque estas tres son
enfermedades arbovirales comunes, no se encontraron estudios que hicieran multiclasificación considerando entre estas
tres enfermedades arbovirales u otros tipos de arbovirales, como el virus del Nilo Occidental, el virus de la fiebre amarilla,
el virus de la Encefalitis de Saint Louis, el virus Mayaro, el virus Oropouche y otros, mostrando que hay espacio para más
investigaciones en esta área.

La mayoría de los trabajos presentaron modelos de clasificación binaria—Dengue o no [42 –47 ];
Fiebre hemorrágica del dengue (FHD) o no [48 ]; Chikungunya o no [49 ]; y Zika clasificados entre
“Casos descartados” y “Algo probable” para CZS [50 ]. Es interesante notar que el único trabajo que
trata sobre Zika se enfoca en CZS, sin cubrir Zika en general.
Cuatro estudios intentaron abordar problemas de clases múltiples. Thitiprayoonwongse et al. [51 ]
clasificados entre Dengue Fiebre (DF), Dengue Hemorrágico Fiebre 1 (DHF1), Dengue Hemorrágico Fiebre
2 (DHF2) y Dengue Hemorrágico Fiebre 3 (DHF3). Fahmi et al. [52 ] se centró únicamente en el Dengue,
clasificándose entre DF, FHD y Síndrome de Shock por Dengue (SSD). Veiga et al [50 ] clasificaron entre
“Casos descartados”, “Algo probable”, “Moderadamente probable” y “Altamente probable” de tener SCZ,
mientras que Lee et al. [53 ] modelos propuestos para diferenciar entre DF, DHF y Chikungunya.

3.2 ¿Qué técnicas de Machine Learning y Deep Learning se están utilizando en la

investigación relacionada con la clasificación de enfermedades arbovirales para apoyar el
diagnóstico clínico?
ML tiene básicamente cuatro categorías de técnicas de aprendizaje: aprendizaje supervisado, aprendizaje no

supervisado, aprendizaje semisupervisado y aprendizaje reforzado. Las técnicas identificadas en esta SLR se
basan en el aprendizaje supervisado. Los sistemas de aprendizaje supervisado resuelven el problema de
aproximación de funciones en el que los datos de entrenamiento son un conjunto de (x, y) pares y el objetivo es
producir una predicción y�en respuesta a hacha�[54 ]. La clasificación supervisada es una de las tareas más
frecuentes realizadas y, como era de esperar, una gran cantidad de técnicas aprovechan ML, incluidos árboles de
decisión, NN, Support Vector Machine (SVM), Naive Bayes, Logistic Regression y K-Nearest Neighbors (kNN)) [55 ].
A pesar de las ventajas y la amplia aplicabilidad de los modelos ML, sufren problemas de selectividad e invariancia.56
]. Tales problemas limitan su capacidad para procesar datos sin procesar, por lo que requieren una ingeniería de
selección de características cuidadosa (y que requiere mucho tiempo) antes del entrenamiento del modelo. Los modelos
DL (también conocidos como aprendizaje estructurado profundo, aprendizaje jerárquico o ML profundo) niegan este
problema de ML. Los modelos DL se componen de múltiples capas de abstracción que pueden aprender
automáticamente de las características de los datos originales, eliminando así la necesidad de seleccionar características.
El uso de modelos no lineales facilita el descubrimiento de soluciones para problemas más complejos. Comúnmente, las
arquitecturas de DL tienen muchas capas ocultas compuestas de neuronas conectadas a través de una función de
activación. La subsección 3.2.7 describe una DL común, la red neuronal convolucional (CNN).
Figura 2 presenta las técnicas ML y DL utilizadas para realizar la clasificación de enfermedades arbovirales en
la muestra SLR (a los efectos de este documento, consideramos las técnicas estadísticas tradicionales (p. ej.,
árboles de decisión, regresión logística y Naive Bayes) como ML según [57 ]. Solo un artículo en la muestra SLR
usó DL. Ho et al. [47 ] compararon una CNN con modelos de Árbol de Decisión y Regresión Logística. Todos los
demás artículos emplean técnicas comunes de aprendizaje automático, incluidos algoritmos basados en árboles
(Árboles de decisión, Bosque aleatorio, AdaBoost y Gradient Boost), NN, SVM, Naive Bayes, Logistic Regression y
kNN.
3.2.1 Algoritmos basados en árboles: árbol de decisión, bosque aleatorio, AdaBoost y gradiente
Aumentar.Un árbol de decisión es un método no paramétrico que se puede aplicar en problemas con
variables categóricas (árbol de clasificación, el enfoque de este trabajo) y también con variables continuas.
Fig 2. Modelos utilizados en los trabajos divididos por los principales problemas.

(árbol de regresión). Un árbol se compone de un nodo raíz, nodos internos y nodos hoja, y se construye dividiendo
sucesivamente los datos de acuerdo con una de las variables predictoras [58 ]. Para construir un árbol de decisión,
es necesario definir el algoritmo de división de nodos para minimizar la impureza del nodo. Si la división logra la
máxima reducción de impurezas, entonces el nodo se define como una hoja [59 ]. Los algoritmos de división más
comunes son la ganancia de información (utilizada por el árbol de clasificación y regresión (CART)) y el índice de
Gini (utilizado por los algoritmos Iterative Dichotomiser 3 (ID3) y C4.5). La principal ventaja de utilizar los
algoritmos del árbol de decisión es la selección implícita de características durante el proceso de construcción del
modelo y la interpretabilidad de los resultados. Los árboles de decisión también pueden manejar valores faltantes,
que se encuentran comúnmente en estudios clínicos [42 ]. Por otro lado, los árboles demasiado complejos no
generalizan bien los datos, a menudo presentan un sobreajuste (o un ajuste insuficiente) y son propensos a
errores con un número relativamente pequeño de muestras para el entrenamiento. La muestra de SLR incluye
once modelos de árboles de decisión—[42 , 44 –47 ,50 –53 ,60 ,61 ].
A diferencia de los árboles de decisión (a veces denominados enfoques de "aprendices fuertes") optimizados
para resolver un problema específico buscando la mejor solución posible, las técnicas de aprendizaje por
conjuntos se basan en un conjunto de "aprendices débiles". Las técnicas de aprendizaje en conjunto se pueden
clasificar en tres clases:(1)embolsado (o bootstrapping),(2)impulso, y(3)apilamiento [62 ]. Random Forest es una
técnica de conjunto basada en embolsado que combina varios árboles de decisión. Se construye aleatoriamente a
partir de un conjunto de árboles posibles conkcaracterísticas de cada nodo. Aleatorio en este contexto significa
que en el conjunto de árboles, cada árbol tiene la misma posibilidad de ser muestreado. Se obtienen árboles de
clasificación múltiple a partir de muestras de arranque para calcular la clasificación mayoritaria final. La muestra
de SLR incluye tres modelos Random Forest—[48 ,50 , 52 ]. Como los modelos Random Forest combinan diferentes
árboles de decisión, sus resultados no son tan fáciles de entender como un árbol de decisión y también son más
costosos desde el punto de vista computacional. A pesar de esto, los bosques aleatorios normalmente superan a
los árboles de decisión y manejan mejor los errores de equilibrio cuando se trabaja con un conjunto de datos
desequilibrado [63 ].
El boosting es una técnica de conjunto que combinakmodelos de bajo rendimiento (METRO1,METRO2. . ., mk)
para mejorar el modelo final,METRO�[64 ]. ElkLos clasificadores se aprenden iterativamente y después de unMise
aprende, se actualizan los pesos para generar el siguiente clasificador,Mi+1. El rendimiento mejora al entrenar
tuplas que fueron mal clasificadas porMi. El último modelo potenciado,METRO�, combina los resultados de cadak
clasificador El refuerzo adaptativo (AdaBoost) [sesenta y cinco ] es el primer peldaño en las técnicas de impulso y
utiliza árboles de decisión con una sola división (un nodo y dos hojas), también llamados tocones de decisión,
como "aprendices débiles". Gradient Boost utiliza una técnica llamada modelado aditivo por etapas hacia adelante
que agrega un nuevo árbol de decisión en cada paso para minimizar una función de costo global utilizando el
método de descenso de gradiente más pronunciado [62 ]. Las principales ventajas de los algoritmos de impulso en
general, incluidos AdaBoost y Gradient Boost, son la selección de variables automatizadas intrínsecas y la
flexibilidad con respecto al tipo de predictores y la estabilidad al manejar datos de alta dimensión.66 ]. AdaBoost,
en particular, también es conocido por ser bastante resistente al sobreajuste. Si bien estas ventajas han atraído la
atención de los investigadores biomédicos [66 ], solo un artículo en la muestra SLR propuso un modelo AdaBoost
(Fahmi et al. [52 ]) y otro, Veiga et al. [50 ], propuso un modelo Gradient Boost.
3.2.2 Máquina de vectores de soporte (SVM).SVM es un clasificador basado en la estadística de Vapnik

teoría del aprendizaje [67 ]. Para realizar la clasificación, SVM construye hiperplanos en un espacio
multidimensional para separar instancias de diferentes clases. El objetivo es encontrar el hiperplano de
separación óptimo y, al mismo tiempo, maximizar la distancia entre los vectores de soporte (que son los
delimitadores extremos) [62 ,67 ].
La robustez es una de las principales ventajas de los modelos SVM. Los datos con valores atípicos no tienen un impacto
negativo en el rendimiento del modelo SVM. Si bien los modelos de árbol de decisiones se benefician de la
interpretabilidad, la falta de transparencia es un inconveniente de los modelos SVM, especialmente cuando se trata de

conjuntos de datos de alta dimensión. Los modelos SVM también pueden consumir bastante memoria y, por lo tanto, el
procesamiento de conjuntos de datos grandes y complejos puede ser lento [62 ]. Los modelos SVM aparecen en cinco
estudios en la muestra SLR—[43 ,46 ,48 ,49 ,52 ].

3.2.3 Redes Neuronales (NN).Inspirado en el sistema nervioso humano, un NN está compuesto
de grupos de nodos (o unidades) simulando capas de neuronas. Cada neurona se multiplica por pesos
para simular sinapsis y el resultado se pasa a la neurona de la siguiente capa. Todos los resultados
recibidos por una neurona se resumen y se usa una fórmula matemática, llamada función de activación,
para convertir el valor recibido para transportarlo a la siguiente capa de neuronas, simulando la activación
de una neurona humana. Este tipo de arquitectura permite entrenar un modelo NN ajustando los pesos
que conectan las neuronas a través de una experiencia de aprendizaje. Durante el entrenamiento de la
NN, se "activan" diferentes conjuntos de neuronas en la NN y, al final, el objetivo es que el modelo pueda
generalizar patrones pasados.
El modelo NN más básico es un perceptrón [68 ]. Se compone de sólo dos capas de neuronas:(1)la capa
de entrada para recibir los datos, y(2)la capa de salida para realizar la predicción. Una vez que tiene una
función de activación simple, es posible resolver problemas linealmente separables. El perceptrón
multicapa (MLP) es una forma evolucionada de perceptrón con capas adicionales de neuronas en el medio,
las capas ocultas y una función de activación más compleja en las neuronas. Estas adiciones hacen que el
MLP sea muy útil para resolver problemas complejos tanto de clasificación como de regresión. Los MLP a
menudo se denominan NN y los términos se usan indistintamente. En general, las NN presentan muchas
ventajas, incluida una alta capacidad de aprender y generalizar, y la capacidad de manejar información
imprecisa, confusa, ruidosa y probabilística.69 ,70 ]. Como tales, son ampliamente utilizados en la
investigación en salud.71 –73 ].
MLP fue una solución de ML popular en la década de 1980 con aplicaciones en varios campos.
Recientemente se renovó el interés por este tipo de modelos debido al éxito de DL. Varios autores
clasifican MLP como un modelo tradicional de ML [74 ,75 ], pero con la llegada de DL se mejoraron los
conceptos de MLP y también se puede clasificar como DL [76 ]. En este artículo, clasificamos MLP como un
modelo tradicional de ML debido al contexto observado en las propuestas seleccionadas. Cinco artículos
emplearon modelos NN en la muestra SLR: [44 ,45 ,49 ,52 ,77 ].
3.2.4 Bayesiano ingenuo.Naive Bayes es un clasificador probabilístico que realiza la clasificación
con base en el Teorema de Bayes, seleccionando la clase más probable de acuerdo a sus variables independientes [78 ]. El
términoingenuose debe a la forma en que el modelo calcula las probabilidades de cada evento, es decir, todos los
atributos del conjunto de datos son igualmente importantes e independientes.

En general, los modelos Naive Bayes son simples, rápidos y efectivos, y funcionan bien cuando un conjunto de datos
contiene valores atípicos o faltan datos.62 ], características comunes en muchos conjuntos de datos de salud. Sin
embargo, los modelos Naive Bayes no están exentos de inconvenientes. Asumen que todos los atributos de un conjunto
de datos tienen la misma importancia, lo que a menudo no es cierto. Si un conjunto de datos tiene una gran cantidad de
atributos, la confiabilidad de los resultados puede ser limitada. Cuatro trabajos en la muestra SLR aplicaron modelos Naive
Bayes—[43 ,45 ,48 ,52 ].

3.2.5 Regresión logística.La regresión logística es una técnica de clasificación basada en la idea de
modelando las probabilidades de pertenecer a la Clase 1 usando una función exponencial [62 ]. En esta técnica,
la variable dependiente,Y, es binaria y las variables independientes,X= {X1,X2, . . .,Xnorte}, se utilizan para estimar el
valor deYmediante el uso de una función logística. El objetivo es encontrar un hiperplano óptimo, que separe las
dos clases objetivo (clasificación binaria). En el caso de problemas de varias clases, se puede utilizar la estrategia
de uno contra todos para abordar el problema.
Algunas ventajas de este modelo incluyen el manejo de variables independientes categóricas y un alto
grado de confiabilidad. Como desventajas, este tipo de modelo no se generaliza bien cuando se usa una
gran cantidad de características, es vulnerable al sobreajuste y no puede resolver problemas no lineales,
lo que requiere una transformación de recursos no lineales.79 ]. Dos trabajos emplearon Regresión
Logística en la muestra SLR—[47 ] y [52 ].

3.2.6 k-vecinos más cercanos (kNN).kNN es una técnica de clasificación que define un mínimo
número mínimo de vecinos,k, y calcula la distancia, la similitud, de cada elemento de
datos con respecto a sukvecinos Hay muchas medidas de similitud, y los enfoques más
comunes son la distancia euclidiana y la métrica de Minkowski.62 ]. La clase más
frecuente entre los vecinos.kse determina como la clase de la instancia de destino [80
].
La simplicidad es la principal ventaja de kNN. kNN es una buena opción cuando se trabaja con un pequeño
conjunto de datos de baja dimensión; sin embargo, puede ser extremadamente ineficiente cuando se trata de
grandes conjuntos de datos porque calcula todas las distancias por pares [62 ]. Solo un artículo en la muestra SLR
propuso un modelo kNN, Fahmi et al. [52 ], utilizando la distancia euclidiana conk=5.
3.2.7 Redes Neuronales Convolucionales (CNN).Una CNN es una técnica de DL. Las CNN son
diseñado para procesar datos de entrada en forma de matrices múltiples [81 ]. Una CNN básica comprende capas
convolucionales, capas de agrupación, función no lineal (generalmente ReLU) y capas totalmente conectadas. Las unidades
en una capa convolucional se organizan en mapas de características y cada unidad está conectada a parches locales en los
mapas de características de la capa anterior. Se realiza mediante el uso de un conjunto de pesos llamados filtros. El
resultado de esta suma ponderada local se pasa a través de una función de activación no lineal. Todas las unidades en un
mapa de características comparten el mismo banco de filtros y diferentes mapas de características en una capa pueden
usar diferentes bancos de filtros. El resultado de todo este proceso alimenta capas totalmente conectadas dando como
resultado una clasificación final. Como se discutió anteriormente, los modelos DL, incluida CNN, a menudo superan a los
modelos ML tradicionales, sin embargo, su adopción en entornos de salud se ha visto afectada debido a una falta inherente
de transparencia.
Aunque la metodología de entrenamiento y prueba de modelos está claramente bien definida, los modelos
resultantes en sí mismos pueden ser a menudo inexplicables para los humanos.82 ]. Incluso cuando se utilizan técnicas
para seleccionar atributos que dan como resultado un buen rendimiento del modelo, es posible que las relaciones entre
esos atributos y la clasificación de salida no rastreen directamente las relaciones causales en el mundo real.82 ]. Un
artículo en la muestra SLR, Ho et al. [47 ], utiliza una CNN, DenseNet. DenseNet es una arquitectura CNN en la que cada
capa está conectada con todas las demás dentro de un bloque denso.83 ]. En este caso, todas las capas pueden acceder a
los mapas de características de sus capas anteriores, lo que permite una gran reutilización de características. Como
consecuencia directa, el modelo es más compacto y menos propenso al sobreajuste. Además, cada capa individual recibe
supervisión directa de la función de pérdida a través de las rutas de acceso directo, lo que proporciona una supervisión
profunda implícita.84 ].
3.3 ¿Cómo se están diseñando los modelos de Machine Learning y Deep Learning
y cómo funcionan al clasificar las enfermedades por arbovirus?
Como se presentó en la Sección 3.1, los estudios incluidos en la muestra de SLR se centraron en solo tres
arbovirus: Dengue, Chikungunya y Zika. Antes de detallar los modelos, presentamos algunos conceptos
básicos para comprender mejor las propuestas de la muestra.
La mayoría de los modelos ML y DL tienen un conjunto de hiperparámetros que se pueden ajustar para lograr
un mejor rendimiento [85 ]. Existen básicamente dos tipos de métodos de optimización de hiperparámetros:
búsqueda manual y búsqueda automática [86 ]. En la investigación manual, las pruebas se realizan manualmente
en función de la intuición básica y la experiencia de los usuarios para identificar los parámetros importantes, es
decir, aquellos que tienen el mayor impacto en los resultados. El método de búsqueda automática más conocido
es la búsqueda en cuadrícula. En este método, la combinación de todos los valores posibles de hiperparámetros
se define dado un rango; su rendimiento se compara de acuerdo con alguna métrica predefinida y se selecciona
la configuración que logra el mejor rendimiento. Aunque este método es ampliamente utilizado y presenta
resultados interesantes, sufre de dimensionalidad, es decir, la eficiencia del algoritmo disminuye rápidamente a
medida que se ajusta el número de hiperparámetros y aumenta el rango de valores de los hiperparámetros.

Dada esta desventaja de la búsqueda en cuadrícula, el algoritmo de búsqueda aleatoria es una alternativa que reduce
la búsqueda de hiperparámetros, apuntando a una solución aproximada de una función de optimización, es decir, se
realizan combinaciones aleatorias dentro de un rango de valores. Al comparar la búsqueda aleatoria con la búsqueda en
cuadrícula, hemos aumentado la eficiencia en el tiempo de procesamiento; sin embargo, dado que el espacio de búsqueda
es limitado, es posible que se excluyan mejores soluciones [86 ].
Otro proceso muy utilizado en ML es la selección de atributos para la construcción de un modelo,

denominada selección de características. La selección de características se puede dividir en tres categorías:
contenedor, filtro e incrustado [87 ]. Los métodos de envoltura utilizan el rendimiento predictivo de un
algoritmo de aprendizaje predefinido para evaluar la calidad de los atributos seleccionados. Con la
selección de un algoritmo de aprendizaje específico, el método de envoltura típico realiza dos pasos:(1)
busca un subconjunto de atributos, y(2)evalúa los atributos seleccionados. Repite los pasos hasta que se
cumplen algunos criterios de parada. Los métodos de filtrado son independientes del algoritmo de
aprendizaje. Miran las características de los datos para evaluar la importancia de un atributo dado. Este
método generalmente es más eficiente desde el punto de vista computacional, pero debido a la falta de un
algoritmo de aprendizaje específico en el paso de selección de atributos, las características seleccionadas
pueden no ser ideales para el algoritmo de aprendizaje de destino. Finalmente, los métodos integrados
son una compensación entre los métodos de filtro y contenedor, incorporando la selección de
características en el aprendizaje del modelo. Este método hereda las ventajas de los métodos de envoltura
y filtro, incluidas las interacciones con el algoritmo de aprendizaje. Como tal, es mucho más eficiente que
los métodos de envoltorio, ya que no necesita evaluar iterativamente conjuntos de atributos. Básicamente,
88 ].
En el modelado de ML y DL, el sobreajuste es un problema común. Según Ying [89 ], el sobreajuste ocurre cuando el
modelo no generaliza bien los datos observados con los datos no vistos, es decir, el modelo se ajusta muy bien en el
conjunto de entrenamiento pero se ajusta mal en el conjunto de prueba. El sobreajuste puede ocurrir porque el ruido
puede estar presente en el conjunto de entrenamiento. Esto puede suceder cuando el conjunto de entrenamiento es muy
pequeño o cuando los datos no son muy representativos o hay demasiado ruido. El sobreajuste también puede ocurrir
cuando el algoritmo tiene demasiadas hipótesis (muchas entradas), comprometiendo así el equilibrio entre la precisión y la
consistencia del modelo aprendido. En este caso, el modelo no maneja bien los diferentes conjuntos de datos de origen.
Hay al menos cuatro enfoques para abordar el problema del sobreajuste: detención anticipada, reducción de la red,
expansión de los datos de entrenamiento y regularización.89 ]. La detención anticipada implica detener el entrenamiento
en el punto en que el rendimiento en un conjunto de datos de prueba comienza a degradarse. Este fenómeno se conoce
como “ralentización de la velocidad de aprendizaje”. En este caso, el modelo continúa aprendiendo después de un punto
dado, aumentando el error de validación y consecuentemente disminuyendo el error de entrenamiento. Pueden surgir dos
problemas. En primer lugar, detenerse antes del punto de mejor resultado, lo que hace que el resultado sea superior al
óptimo. En segundo lugar, detenerse después del punto con el mejor resultado, lo que resulta en un sobreajuste. Por lo
tanto, el objetivo principal de esta solución es encontrar el punto exacto en el que se debe interrumpir el entrenamiento [
89 ,90 ].
En la reducción de redes, se utiliza el concepto de poda, que reduce la complejidad de la clasificación al
eliminar datos menos significativos o irrelevantes, evitar el sobreajuste y mejorar la precisión de la clasificación.
Hay dos enfoques de poda estándar: prepoda y postpoda. En la prepoda, su funcionamiento tiene lugar durante el
proceso de aprendizaje, utilizando, por ejemplo, criterios de parada a través de alguna regla (duración, coste,
prueba de significación, etc.). En post-poda, el conjunto de entrenamiento se divide en dos conjuntos: conjunto de
media luna y conjunto de poda. Este enfoque ignora los problemas de sobreajuste durante el proceso de
aprendizaje en el conjunto en crecimiento, por lo que evitan el sobreajuste al excluir reglas del modelo generado
durante el aprendizaje.89 ,91 ].
El ajuste de los hiperparámetros aporta equilibrio y regularidad en el entrenamiento del modelo, pero para realizar
estos ajustes se necesitan muestras suficientes para el aprendizaje. En este sentido, un conjunto de datos ampliado
puede mejorar en gran medida la precisión de estos modelos. Este tipo de enfoque ha sido ampliamente

Se utiliza para mejorar el rendimiento de generalización de los modelos. Comúnmente, se utilizan cuatro enfoques para
expandir un conjunto de datos:(1)adquirir más datos de entrenamiento;(2)agregar algo de ruido aleatorio a un conjunto de
datos existente;(3)volver a adquirir algunos datos de un conjunto de datos existente a través de alguna forma de
procesamiento adicional; y/o(4)producir nuevos datos basados en la distribución del conjunto de datos existente [86 ,89 ].
La expansión de conjuntos de datos tiene inconvenientes. Con mayores datos, habrá en consecuencia un aumento en el
tiempo de entrenamiento. Además, dichos datos pueden ser difíciles de adquirir y, a menudo, requieren la intervención
humana para etiquetarlos.

Finalmente, la regularización es una técnica que aplica una pequeña variación a los datos originales para
entrenar eficientemente un modelo de modo que el modelo se generalice mejor [92 ]. Para llevar a cabo este
proceso se añade otro término, una sanción, también conocido como regularizador. Existen tres métodos
principales de regularización: regularización L1, regularización L2 y abandono. Con la regularización L1 se penaliza
el valor absoluto de los pesos. La regularización L1 también se conoce como operador de selección y reducción
absoluta mínima (LASSO) [92 ]. Por el contrario, la regularización L2 define los pesos de cada característica y
elimina características del modelo, conservando solo las características más valiosas. Esto permite que el modelo
sea más simple e interpretable. Este método de regularización utiliza la distancia euclidiana como término de
penalización. El método dropout es una solución para evitar el sobreajuste en las redes neuronales. Básicamente,
elimina aleatoriamente unidades y conexiones en la red durante el proceso de entrenamiento. Este proceso
generalmente se lleva a cabo siguiendo los siguientes pasos:(1)liberar la mitad de las neuronas ocultas al azar y
construir una red más simple;(2) entrenar la red simple usando un gradiente descendente estocástico;(3)restaurar
las neuronas extraídas en el Paso 1;(4)eliminar la mitad de las neuronas ocultas de la nueva red para formar una
nueva red simple; y,(5)repitiendo todo el proceso hasta alcanzar el conjunto ideal de parámetros [89 ,93 ,94 ].
tabla 1 presenta una lista de estudios incluidos por año de publicación, objetivo de clasificación, técnicas de
ML y/o DL utilizadas, configuraciones de modelos, software, métricas de evaluación y técnicas de optimización
empleadas para la selección de hiperparámetros y características.
3.3.1 Dengue.De los 15 artículos relevantes en la muestra SLR, 12 incluían el diagnóstico de
Dengue en sus estudios incluyendo clasificación binaria y clasificación multiclase:
• clasificación binaria
• Dengue o no Dengue: Tanner et al. [42 ], Fátima y Hundewale [43 ], Sajana et al. [44
], Gambhir et al. [45 ], Sanjudevi y Savitha [46 ], Ho et al. [47 ];
• Gravedad del dengue: Tanner et al. [42 ], Potts et al. [60 ], Phakhounthong et al. [61 ];
• Riesgo de dengue: Faisal et al. [77 ]; y
• FHD o no: Arafiyah et al. [48 ]

Tanner et al. aparecieron dos veces porque presentaban dos problemas de clasificación distintos.
• Clasificación multiclase
• DF, DHF o DSS: Fahmi et al. [52 ]; y
• DHF1, DHF2 o DHF3: Thitiprayoonwongse et al. [51 ]
Tanner et al. [42 ] propuso dos modelos de árboles de decisión. Primero, el Modelo Diagnóstico de Dengue
(DDM) buscó clasificar si un paciente tenía o no Dengue utilizando 1.200 registros de pacientes con enfermedad
febril aguda. El segundo, el Modelo de Predicción de la Gravedad del Dengue (DSPM), buscó clasificar la gravedad
del Dengue en adultos utilizando datos de 161 pacientes. Se construyó un clasificador de Árbol de Decisión C4.5
utilizando el software Inforsense. Un enfoque de validación cruzada k-fold (k=10) para evitar el sobreajuste del
modelo. Ambos modelos presentaron buen desempeño sin embargo el

Tabla 1. Resumen de los estudios primarios.�:El estudio parece presentar un sobreajuste del modelo o una metodología de evaluación comparativa inapropiada.
estudios primarios Año Objetivo ML y/o Configuración del modelo Software Métrica hiperparámetro Característica
clasificación DL mejoramiento selección
Tanner et al. [42 ] 2008 (1) Dengue o Decisión no descrito No Sensibilidad, No aplicado Árbol de decisión
no Árbol descrito error de especificidad
(2) Gravedad de tasa, AUC

Dengue
Fátima y 2012 Dengue o no bayesiana ingenua Valores por defecto del R Exactitud, No aplicado No aplicado
Hundewale [43 ] paquete e1071 sensibilidad,
especificidad, tasa
riesgo
MVS no descrito Búsqueda de cuadrícula
Sajana et al. [44 ]� 2018 Dengue o no Decisión no descrito No Exactitud, No aplicado No aplicado
Árbol descrito precisión, recuerdo,
Medida F
NN no descrito
Gambhir et al. [45 ] 2018 Dengue o no NN capas ocultas = 3 No Exactitud, No aplicado No aplicado
lr = 0.3 descrito sensibilidad
impulso = 0.25 especificidad, error
tasa
Decisión criterio = ganancia de
Árbol información
tamaño de división = 2
min tamaño de hoja = 2
min ganancia = 0.01
profundidad máxima = 20
confianza = 0.5
bayesiana ingenua Estimacion
método = codicioso
ancho de banda mínimo = 0.01
número de núcleos = 10
Sanjudevi y Savitha 2019 Dengue o no Decisión no descrito WEKA Exactitud, No aplicado No aplicado
[46 ]� Árbol sensibilidad,
especificidad, AUC
MVS no descrito
Ho et al. [47 ] 2020 Dengue o no Decisión criterio = gini No República de China, ABC No aplicado Probabilidades crudas
Árbol tamaño mínimo de hoja = descrito proporciones
20 xval = 10 Equilibrado
cp = 0,01 razones de probabilidades
Logístico solucionador = lbfgs
Regresión
CNN capas ocultas = 16
Potts et al. [60 ] 2010 Gravedad de Decisión criterio = gini SPSS Sensibilidad, No aplicado Árbol de decisión
Dengue Árbol división mínima de muestras = 0.05 Respuesta especificidad
profundidad máxima = 5 Árbol 3.0
impureza mínima
disminución = 0.0001
Phakhounthong et al. 2018 Gravedad de Decisión no descrito WEKA Exactitud, Aplicado pero no Logístico
[61] Dengue Árbol sensibilidad, descrito Regresión
especificidad
Faisal et al. [77 ] 2010 Riesgo de dengue NN neuronas = 10 No Exactitud Búsqueda de cuadrícula MOS
lr = 0,1 descrito
impulso = 0.99
iteraciones = 20.000
titiprayoonwongse 2012 DF, DHF1, Decisión (1) confianza = 0,4 No Exactitud, No aplicado Árbol de decisión
et al. [51 ] DHF2 o DHF3 Árbol descrito sensibilidad,
especificidad
(2) confianza = 0,3
(Continuado)

Tabla 1.(Continuado)
estudios primarios Año Objetivo ML y/o Configuración del modelo Software Métrica hiperparámetro Característica
clasificación DL mejoramiento selección
(3) No descrito
Arafiyah et al. [48 ] 2018 FHD o no Aleatorio no descrito Naranja Exactitud, No aplicado No aplicado
Bosque sensibilidad
MVS no descrito
bayesiana ingenua no descrito
Fahmi et al. [52 ] 2020 DF, DHF o DSS NN neuronas = 100 Naranja Exactitud, No aplicado RelieveF
activación = Relu sensibilidad,
solucionador = Adán precisión
reg alfa = 0.0001
iteraciones = 200
Decisión criterio = ganancia de

Árbol información
hoja mínima = 5
instancias mínimas = 2
profundidad máxima = 100
MVS c = 100
núcleo = rbf
tolerancia = 0,0010
iteración máxima = 100
KNN k=5
distancia
métrica = euclidiana
peso = uniforme
Aleatorio n estimadores = 10
Bosque tamaño de división =
5 criterio = gini
bayesiana ingenua no descrito

AdaBoost estimador base = árbol de
decisión
n estimadores = 50
lr = 1.0
algoritmo = SAMME.R
función de pérdida =
regresión lineal
Logístico Configuración por defecto

Regresión
Hossain et al. [49 ] 2019 Chikungunya o NN no descrito matlab ABC No aplicado No aplicado
no
MVS no descrito
Veiga et al. [50 ] 2021 Zika (CZS) o Aleatorio n estimadores = 100 max Sensibilidad, búsqueda de cuadrícula Aplicado pero
no Bosque profundidad = 5 precisión no descrito
tamaño de división = 40 Puntuación F1
Degradado profundidad máxima = 8
Aumentar tamaño de división = 5
KNN no descrito
Decisión no descrito
Árbol
adaboost no descrito
Lee et al. [53 ] 2012 DF, DHF o Decisión binario recursivo R Sensibilidad, Poda Logístico
Chikungunya Árbol fraccionamiento especificidad AUC Regresión
https://doi.org/10.1371/journal.pntd.0010061.t001

DDM se desempeñó mejor en todas las métricas, es decir, sensibilidad (71,2 %), especificidad (90,1 %), tasa de
error general (15,7 %) y área bajo la curva (AUC) (0,88). Esto no sorprende dado el conjunto de datos más
grande disponible para el DDM.
Fátima y Hundewale [43 ] compararon dos modelos de clasificación, SVM y Naive Bayes, para clasificar
si un paciente tenía o no dengue. Para determinar los mejores hiperparámetros de SVM, se realizó una
búsqueda en cuadrícula cambiando el parámetro gamma y el costo (c). A pesar de ejecutar Grid Search, no
se detalló ni la mejor configuración ni la configuración del modelo Naive Bayes. En general, el modelo SVM
presentó el mejor desempeño, a pesar de su baja sensibilidad (47%). El modelo Naive Bayes presentó alta
sensibilidad y muy baja especificidad, precisión y tasas de riesgo, todas por encima del 18%.
Sajana et al. [44 ] propusieron tres modelos para la clasificación binaria del dengue utilizando datos
clínicos y de laboratorio: un MLP y dos árboles de decisión (C4.5 y CART). Como Fáthima y Hundewale [43
], no se detallaron las configuraciones de los modelos. El modelo CART presentó los mejores resultados,
logrando el 100% en todas las métricas (exactitud, sensibilidad, precisión y F-Measure). No se menciona
el uso de la selección de características y la optimización de hiperparámetros. Dados los resultados, es
posible que los modelos estuvieran sobreajustados debido a la poca cantidad de datos disponibles, es
decir, solo 20 registros.
Gambhir et al. [45 ] propusieron tres modelos (NN, Decision Tree y Naive Bayes) para clasificar si un
paciente tenía o no dengue. La configuración de los modelos se describió en el documento y se resume en
tabla 1 . Validación cruzada de K-fold (k=10) se utilizó para validar y probar los modelos. El NN presentó los
mejores resultados: 79,09 % de precisión, 55,55 % de sensibilidad y 88,5 % de especificidad. Sin embargo,
los otros modelos lograron un rendimiento similar. Gambhir et al.
[45 ] no describió si se aplicó la optimización de hiperparámetros o la selección de características en el conjunto
de datos.
Sanjudevi y Savitha [46 ] compararon los modelos Decision Tree y SVM para clasificar si un paciente tenía o no
dengue. No se describieron las configuraciones del modelo. Se empleó la herramienta WEKA para ejecutar los
experimentos y calcular las métricas. El modelo SVM obtuvo los mejores resultados logrando 100% de
sensibilidad, 100% de especificidad, 100% de precisión y AUC del 99%. Los resultados de rendimiento
extremadamente alto sugieren un sobreajuste del modelo.
Ho et al. [47 ] propusieron tres modelos para clasificar el dengue utilizando datos clínicos: un árbol de
decisiones, una regresión logística y una CNN. Los modelos se validaron y probaron mediante validación cruzada
k-fold (k=10). La selección de características se realizó mediante el análisis de la razón de probabilidades cruda y la
razón de probabilidades ajustada. De los 18 atributos disponibles, inicialmente se seleccionaron cuatro: edad,
temperatura corporal, recuento de glóbulos blancos (WBC) y recuento de plaquetas (PLT). Se realizaron tres
experimentos con más atributos:(1)seis atributos, los cuatro anteriores más género y conteo de hemoglobina;(2)11
atributos, los seis anteriores y cinco señales vitales más; y(3)todo el conjunto de datos con 18 atributos. Los
resultados sugirieron que cuando se usaban solo cuatro atributos, el AUC en todos los experimentos estuvo cerca
del 84 %. La CNN se desempeñó marginalmente mejor que los modelos de árbol de decisión y regresión logística.
Potts et al. [60 ] propusieron árboles de decisión para clasificar a los pacientes pediátricos en casos de
dengue “grave” o “no grave”. Las reglas de detención utilizadas para crear los árboles se describieron en el
documento y se resumen entabla 1 . Se evaluaron cinco escenarios con diferentes definiciones de Dengue
Severo:(1)El árbol 1 consideró el dengue grave como DSS y utilizó cuatro de los 11 atributos disponibles
(WBC, hematocrito (HTC), porcentaje de monocitos (MONOP), PLT);(2)El árbol 2 definió el dengue grave
como FHD de grado 3 o 4 oíndice de derrame pleural(PEI)>15, y usó cinco atributos (Edad, WBC, PLT,
porcentaje de neutrófilos (NEUTP), aspartato aminotransferasa (AST));(3) El árbol 3 definió el dengue grave
como DSS o líquido intravenoso requerido;(4)El árbol 4 definió Dengue Severo como DSS o PLT menos de
50,000; y(5)El árbol 5 definió Dengue Severo como DSS o recibió intervención de líquidos. Los árboles 3, 4 y
5 no fueron descritos en el trabajo porque, según

a Potts et al. [60 ], no obtuvieron ninguna mejora significativa en relación con los árboles 1 y 2. Ambos
árboles de decisión 1 y 2 tienen la misma variable de división inicial, WBC, lo que refuerza la utilidad de
esta variable para distinguir el dengue grave. Los modelos se validaron y probaron mediante validación
cruzada k-fold (k=5) y resultados (el trabajo no presentó explícitamente ninguna métrica para evaluar los
modelos, como la precisión o la sensibilidad. Sin embargo, en los resultados se presentó una tabla con
valores que pueden interpretarse como la sensibilidad de los “Severo” y “ clases "no graves"), sugirieron
que los árboles 1 y 2 lograron una métrica de sensibilidad superior al 90 % para la clase "grave", mientras
que la sensibilidad para la clase "no grave" estuvo por debajo del 50 %.
Phhakhounthong et al. [61 ] propuso un modelo de árbol de decisión CART para clasificar la gravedad del
dengue en función de los atributos clínicos y de laboratorio. Realizaron un análisis de regresión logística para
determinar la importancia de cada atributo para componer el árbol. En su caso, el factor más significativo para
predecir el dengue grave fue el hematocrito. Los resultados obtenidos de la validación cruzada kfold (k=10) para la
clasificación binaria de Dengue Severo fueron 60,5% de sensibilidad, 65% de especificidad y 64,1% de precisión.
Phhakhounthong et al. [61 ] afirman que se aplicaron parámetros de ajuste y poda de árboles para optimizar el
modelo, pero no describieron la configuración utilizada para el experimento. A pesar de haber realizado una
selección de características con Regresión Logística, los resultados no superaron el 65% en las métricas evaluadas.
Faisal et al. [77 ] buscó una clasificación binaria del riesgo de Dengue, diferenciando a los pacientes
como de “alto riesgo” o “bajo riesgo”. Para la tarea de clasificación se propuso un modelo MLP y se realizó
una técnica de Grid Search para optimizar la configuración del modelo, cambiando cuatro parámetros:
número de neuronas, impulso, tasa de aprendizaje y número de iteraciones (es de destacar que en la
técnica de Grid Search proceso, cada atributo fue probado individualmente). Se seleccionaron siete
atributos mediante Self Organizing Map (SOM) y el modelo logró una precisión del 70 %.
Thitiprayoonwongse et al. [51 ] clasificó a un paciente como DF, DHF1, DHF2 y DHF3 utilizando un árbol
de decisión. Se utilizaron dos conjuntos de datos, uno del Hospital Srinagarindra y otro del Hospital
Songklanagarind. Se realizaron tres experimentos:(1)usando solo datos del Hospital Srinagarindra;(2)
usando solo datos del Hospital Songklanagarind; y(3)utilizando datos de ambos hospitales. No se
describieron los atributos de los dos conjuntos de datos, pero se presentaron los atributos seleccionados
para componer el árbol de decisiones para cada experimento. en experimento(1), se seleccionaron seis
atributos: shock, fuga, sangrado, plaquetas, tamaño hepático y vacuna vacuna. en experimento(2), se
seleccionaron nueve atributos: shock, fuga, sangrado, plaquetas, dolor abdominal, exantema, uri, HTC,
AST. en experimento(3)Se seleccionaron ocho atributos: shock, fuga, sangrado, plaquetas, alanina
transaminasa (ALT), lymp, WBC (recuento y recuento mínimo). Se cambió la configuración del Árbol de
Decisión solo en el parámetro grado de confianza en Experimentos(1)y(2); no se proporcionó ningún
detalle para el Experimento(3). Experimento
(1)presentó los mejores resultados generales. Es interesante que incluso con la adición de un conjunto de datos
más, Experiment(3)en gran medida no logró resultados superiores. La clase que plantea el mayor desafío de
clasificación, DHF1, informó los valores más bajos en los tres experimentos, aunque todos fueron superiores al 80
%.
Arafiyah et al. [48 ] propusieron y evaluaron tres modelos para clasificar o no DHF: Random Forest, SVM y
Naive Bayes. Desafortunadamente, no hay información sobre las configuraciones del modelo. Los modelos fueron
entrenados y las métricas fueron calculadas utilizando la herramienta Orange. Random Forest logró mejores
resultados que los modelos SVM y Naive Bayes: 79,6 % de precisión, 84,1 % de precisión, 82,2 % de sensibilidad,
83,1 % de F1-Score y 89,8 % de AUC. No se proporcionaron detalles sobre la optimización de hiperparámetros o la
selección de funciones.
Fahmi et al. [52 ] evaluaron ocho modelos para clasificar el dengue en tres categorías: DF, DHF y
DSS. Los modelos incluyeron NN, SVM, kNN, Decision Tree, Random Forest, Naive Bayes, AdaBoost
y Logistic Regression. La configuración de todos los modelos se describió y se resume entabla 1 .
Los experimentos se llevaron a cabo en dos escenarios diferentes:(1)

sin selección de características, y(2)con selección de características utilizando la técnica ReliefF (es un algoritmo
desarrollado por Kira y Rendell en 1992 [95 ] que adopta un enfoque de método de filtro para la selección de
características que es notablemente sensible a las interacciones de características). En ambos escenarios, el mejor
resultado lo obtuvo el modelo NN con 71,3% de precisión, 70,8% de precisión y 71,3% de sensibilidad en Escenario
(1)y con un 72 % de precisión, un 71,5 % de precisión y un 72 % de sensibilidad en Escenario(2). Los resultados
mostraron que la selección de funciones proporcionó mejoras significativas.
En resumen, los estudios de nuestra muestra que abordaron el diagnóstico de dengue se centraron
principalmente en la clasificación binaria (11); sólo dos estudios realizaron una clasificación multiclase. Los
estudios de clasificación multiclase buscaron clasificar los subtipos de dengue [51 ] o diferentes niveles de
gravedad de la enfermedad [52 ]. El predominio de la clasificación binaria refleja su naturaleza más simple. La
clasificación multiclase es más compleja de realizar e interpretar y, en consecuencia, los resultados suelen ser
inferiores a los de modelos más simples. Esto se refleja en nuestra SLR [51 ,52 ]. Los modelos basados en árboles
(árbol de decisión y derivados) fueron la técnica más utilizada en la clasificación del dengue (10); nueve de los
cuales utilizaron árboles de decisión simples, a menudo obteniendo mejores resultados que otros modelos de
referencia. Es importante resaltar que, a pesar de que los algoritmos de aprendizaje basados en árboles se usan
ampliamente para problemas de clasificación debido a su simplicidad para la implementación y la
interpretabilidad de los resultados, el uso de conjuntos de datos desequilibrados puede sesgar el rendimiento de
dichos modelos, lo que exacerba las deficiencias inherentes a la división en árbol. criterio [96 ]. Se observó que
varios estudios probablemente sufrieron un sobreajuste del modelo [44 ,46 ]. No es posible realizar más análisis
debido a la falta de detalles en sus publicaciones, aunque se debe tener en cuenta que cada uno de estos estudios
utilizó los conjuntos de datos más pequeños (consulte la Sección 3.4). El uso de diferentes conjuntos de datos y la
falta de detalles con respecto a la configuración del modelo, la selección de funciones y las optimizaciones de
hiperparámetros dificultaron las comparaciones de estos estudios. Por ejemplo, seis de los 12 estudios [43 ,44 ,46 ,
48 ,53 ,61 ] no presentó ninguna descripción de los modelos propuestos, lo que tuvo un impacto negativo en la
reproducibilidad futura.
3.3.2 Chikungunya.Solo un estudio en la muestra SLR buscó clasificar a Chikungunya.
Hossain et al. [49 ] propuso un Sistema de Reglas de Creencias Especializadas (BRBES) para clasificar
Chikungunya utilizando datos clínicos que contienen signos y síntomas vitales, y considerando las clases de
gravedad como salida (muy alta, alta, media y baja). El sistema BRBES se comparó con un NN, un SVM y un
Sistema Experto Basado en Lógica Difusa (FLBES), así como con opiniones de expertos. Debido al alcance
de nuestro trabajo, consideramos solo los modelos ML para el análisis, es decir, NN y SVM. El NN superó al
modelo SVM, obteniendo un AUC de 81,1% vs 80,8%. A pesar de la pequeña diferencia de rendimiento
entre estos dos modelos ML, ninguno de los modelos superó al sistema BRBES. Una limitación significativa
de este estudio es la falta de detalles sobre las configuraciones del modelo, lo que afecta negativamente la
comparabilidad y la reproducibilidad.
3.3.3 Zika.En relación a la clasificación del Zika, solo se identificó un estudio. Veiga et al.
[50 ] trató de clasificar los casos sospechosos de CZS utilizando datos clínicos y no clínicos. Los autores
compararon cinco algoritmos: kNN, CART Trees, Random Forest, AdaBoost y Gradient Boost. Después de
realizar una búsqueda en cuadrícula, solo dos de los modelos candidatos fueron seleccionados y descritos
en la publicación final:(1)se utilizó el modelo Random Forest con un conjunto de datos sin datos textuales
para abordar una clasificación binaria (“Casos descartados” y “Algo probable”); y(2) el modelo Gradient
Boost se utilizó con un conjunto de datos con datos textuales complementarios para manejar una salida
multiclase ("Casos descartados", "Algo probable", "Moderadamente probable" y "Altamente probable").
Para la clasificación binaria, el modelo Random Forest obtuvo una sensibilidad del 91 % y una puntuación
F1 del 83 % para la clase "Casos descartados". Sin embargo, mostró resultados significativamente más
pobres para la clase "Algo probable" con una sensibilidad del 50 % y una puntuación F1 de 61%,. Durante la
ejecución de Grid Search, los modelos basados en árboles obtuvieron un rendimiento similar y todos
fueron superiores a kNN. El pequeño pero mejor desempeño de Random Forest en relación

a otros modelos basados en árboles probablemente se deba a su proceso de arranque que ayuda a evitar el sobreajuste
cuando se utilizan conjuntos de datos pequeños según el Grupo 1 (272 muestras).
Para el problema multiclase, el modelo Gradient Boost presentó un buen desempeño principalmente
para la clase “Casos descartados” con 91% en todas las métricas (precisión, sensibilidad y F1-score). Como
la cantidad de datos utilizados en este experimento es mayor (1109 muestras) que la clasificación binaria,
Gradient Boost obtuvo un mejor rendimiento. Sin embargo, Veiga et al. [50 ] no proporcionó detalles
sobre la proporción de datos en cada clase. Como tal, no es posible analizar si algún desequilibrio de
datos afectó el rendimiento de los modelos. Este es el único estudio donde el código de los modelos
finales están disponibles para su descarga (https://github.com/rafael-veiga/Classificationalgorithm-of-
Congenital-Zika-Syndrome-characterizations-diagnosis-and-validation ).
3.3.4 Diagnóstico diferencial de arbovirus.Dadas las dificultades en el diagnóstico diferencial
de los arbovirus discutidos en la Sección 1, fue sorprendente que solo se identificara un estudio que
buscaba distinguir entre dos enfermedades arbovirales diferentes, en este caso Dengue y Chikungunya.
Lee et al. [53 ] modelos propuestos para diferenciar entre casos de DF, FHD y Chikungunya. Se
presentaron cuatro experimentos:(1)DF y Chikungunya usando solo datos clínicos;(2)DF y Chikungunya
utilizando datos clínicos y de laboratorio;(3)DHF y Chikungunya usando solo datos clínicos; y(4)DHF y
Chikungunya utilizando datos clínicos y de laboratorio. Para cada clasificación, se desarrolló un modelo de
árbol de decisión utilizando el software R. No se proporcionaron detalles sobre la configuración del
modelo. Los resultados sugirieron que los árboles de decisión que usaban datos clínicos y de laboratorio
superaron a los modelos que usaban solo datos clínicos.
3.3.5 Validación cruzada.Vale la pena señalar que varios estudios utilizaron validación cruzada
técnicas para validar y probar sus modelos. [42 ,45 ,47 ,50 ,52 ,61 ] utilizó la validación cruzada k-fold conk=10; y [
60 ] también usó k-fold pero conk=5. Lee et al. [53 ] fue el único estudio que aplicó la validación cruzada de dejar
uno fuera (LOO). Por lo general, se recomiendan validaciones cruzadas cuando se manejan conjuntos de datos
pequeños y en un intento de minimizar el sesgo de aprendizaje. La validación cruzada LOO es un tipo de
validación cruzada k-fold en la quekes el número de muestras en el conjunto de datos. Por lo tanto, a pesar de
aprovechar cada punto de datos, la validación cruzada LOO puede ser costosa desde el punto de vista
computacional, especialmente si el conjunto de datos es grande. Mientras Lee et al. tenía un conjunto de datos
compuesto por 1.034 muestras, no mencionaron nada sobre el esfuerzo computacional necesario para ejecutar
los experimentos.
3.4 ¿Qué atributos se consideran al aplicar las técnicas de Machine

Learning y Deep Learning?
3.4.1 Resumen de conjuntos de datos y atributos.Tabla 2 resume los conjuntos de datos utilizados por el
estudios incluidos en este SLR por número de registros, número de atributos, entrada para modelos, período
de los datos y ubicación. Si bien la cantidad de atributos presentados en esta tabla se describieron como
disponibles en un conjunto de datos focales, en algunos casos, los estudios no los usaron todos para entrenar y
probar sus modelos propuestos (consulte la Subsección 3.4.2).
Tanner et al. [42 ] utilizó un conjunto de datos que comprende 1200 registros de pacientes de Singapur y
Vietnam con enfermedad febril aguda. El conjunto de datos se compone de 15 atributos clínicos (síntomas y
signos vitales) y 26 de laboratorio. Los atributos seleccionados para el modelo de clasificación del dengue fueron
PLT, WBC y recuento de linfocitos (LYMPH), temperatura corporal, recuento de hematocritos y recuento de
neutrófilos (NEUT). Para la clasificación de la gravedad del dengue, los atributos seleccionados fueron PLT, el valor
de cruce (Ct) de la reacción en cadena de la polimerasa con transcripción inversa (RT-PCR) en tiempo real para el
ARN viral del dengue y la presencia de inmunoglobulina G anti-dengue (IgG ) anticuerpos.
Fátima y Hundewale [43 ] utilizó un conjunto de datos que comprende 5000 registros de pacientes con
dengue de Chennai y Tirunelveli, India. El conjunto de datos incluye detalles sobre 29 pacientes

Tabla 2. Características de los conjuntos de datos utilizados para evaluar los modelos de Machine Learning y Deep Learning para la clasificación de enfermedades arbovirales.
Clasificación Registros Atributos Entrada para modelos Período Ubicación
Dengue
Tanner et al. [42] 1200 41 3y5 no descrito Singapur y Vietnam
Fátima y Hundewale [43] 5,000 29 no descrito no descrito India
Sajana et al. [44] 20 12 12 no descrito India
Gambhir et al. [45] 110 dieciséis dieciséis 2015 a 2016 India
Sanjudevi y Savitha [46] 108 17 no descrito no descrito no descrito
Ho et al. [47] 4,894 18 4, 6, 11 y 18 2015 Taiwán
Potts et al. [60] 1,230 11 11 1994–97, 1999–2002, 2004–07 Tailandia
Phakhounthong et al. [61] 1,180 23 5 2009 a 2010 camboya
Faisal et al. [77] 210 40 7 no descrito no descrito
Thitiprayoonwongse et al. [51] 1001 400 6, 8 y 9 no descrito Tailandia
Arafiyah et al. [48] 213 4 4 2005 Indonesia
Fahmi et al. [52] 14,019 dieciséis 10 2016 a 2019 Indonesia
Chikungunya
Hossain et al. [49] 250 5 5 no descrito bangladesh
zika
Veiga et al. [50] 1,501 13 7 2015 Brasil
Dengue y Chikungunya
Lee et al. [53] 1,034 33 5 2004 y 2008 Singapur
síntomas. La estructura del conjunto de datos no se proporciona con suficiente detalle para inferir hasta qué punto el
conjunto de datos está equilibrado o desequilibrado; la mayoría de los datos parecerían estar relacionados con pacientes
sin dengue.
Sajana et al. [44 ] usó los datos recopilados de varias salas médicas de hospitales en Vijayawada, India; comprende
solo 20 registros con 12 atributos. Como no se hace referencia a ninguna técnica de selección de características en el
documento, asumimos que todos los atributos se usaron para el entrenamiento del modelo.
Gambhir et al. [45 ] utilizó datos clínicos y no clínicos adquiridos de pacientes en Delhi entre 2015 y
2016. El conjunto de datos contiene 110 registros: 85 casos positivos de dengue y 25 casos negativos de
dengue. Cada registro tiene 16 atributos, de los cuales nueve son datos clínicos (edad, sexo, vómito, dolor
abdominal, escalofríos, dolor de cuerpo, dolor de cabeza, debilidad y fiebre) y el resto datos de examen
físico/laboratorio (temperatura, frecuencia cardíaca, PLT, dengue antígeno NS1 o serología
(Inmunoglobulina M (IgM), IgG)). En el trabajo original, estos datos fueron clasificados erróneamente.
Gambhir et al. [45 ] consideró como datos no clínicos la edad, sexo, vómitos, dolor abdominal, escalofríos,
dolor de cuerpo, cefalea, debilidad y fiebre; y PLT, temperatura, frecuencia cardíaca, antígeno de dengue
NS1, IgM, IgG, antígeno de dengue NS1 como clínica.
Sanjudevi y Savitha [46 ] utilizó un conjunto de datos compuesto por 108 registros con 17 atributos. Los
atributos no se detallaron en el documento y no se realizó ninguna técnica de selección de características.
Ho et al. [47 ] utilizó datos del Hospital Universitario Nacional Cheng Kung (NCKUH) en la ciudad de Tainan,
Taiwán. El conjunto de datos comprendía 4.894 registros de datos clínicos y de laboratorio, incluidos 2.942 casos
de dengue confirmados por laboratorio y 1.952 casos sin dengue. Ho et al. [47 ] analizaron las razones de
probabilidades para seleccionar cuatro atributos y crear un subconjunto de datos; se crearon dos subconjuntos
adicionales con seis y 11 atributos basados en el subconjunto inicial. En los experimentos, el conjunto de datos
con todos los atributos también se usó con fines de comparación; sin embargo, no hubo evidencia de que más
atributos contribuyeran a mejorar el rendimiento del modelo.
Potts et al. [60 ] utilizó datos de 1.384 pacientes pediátricos con Dengue y FHD, con 11 atributos.
Después de la selección inicial, se incluyeron 1230 registros en el análisis: 208 casos de FHD,

374 del DF, y 648 de Otras enfermedades febriles (OFI). Los datos se recopilaron en Tailandia para los
períodos 1994 a 1997, 1999 a 2002 y 2004 a 2007.
Phakhounthong et al. [61 ] utilizó un conjunto de datos que comprende 1.225 registros relacionados con
episodios febriles en niños del Hospital Infantil de Angkor, Camboya. De esos 1,225 registros, 198 fueron casos
confirmados de Dengue; solo 38 fueron casos de Dengue Severo. El conjunto de datos incluía información sobre
datos demográficos, clínicos y de laboratorio. Se utilizó la regresión logística y se seleccionaron estos cinco
atributos para el entrenamiento del modelo.
Faisal et al. [77 ] utilizó un conjunto de datos con registros de 210 pacientes con 40 atributos, divididos en mediciones
de parámetros demográficos, clínicos, de laboratorio y de análisis de impedancia bioeléctrica (BIA) para clasificar el riesgo
de dengue. Los datos de laboratorio se utilizaron para clasificar el riesgo inicial del paciente y, por lo tanto, crear el atributo
de salida para el entrenamiento del modelo. Este procedimiento se realizó utilizando un modelo no supervisado, SOM.
Después de eso, se utilizó otro modelo SOM para realizar la selección de características para definir los atributos que se
utilizarán como entrada para el modelo propuesto; finalmente se seleccionaron siete atributos.
Thitiprayoonwongse et al. [51 ] utilizaron dos conjuntos de datos: uno compuesto por información de
524 pacientes del Hospital Srinagarindra, Tailandia y otro con 477 pacientes del Hospital
Songklanagarind, Tailandia para clasificar DF, DHF1, DHF2 o DHF3. El modelo de árbol de decisión
seleccionó diferentes atributos para cada experimento.
Arafiyah et al. [48 ] usó un conjunto de datos médicos que comprende 213 registros utilizando solo cuatro
fuentes de datos clínicos: temperatura, presencia de manchas, presencia de sangrado y prueba de tornikuet. Los
autores no describieron la lista completa de los atributos presentes en el conjunto de datos, por lo que no hay
forma de saber si se aplicó la selección de características o cómo.
Fahmi et al. [52 ] usó un conjunto de datos proporcionado por la División de Control y Prevención de
Enfermedades en Java Central, Indonesia, para clasificar DF, DHF o DSS. Después de la verificación de los valores
faltantes, la selección de los atributos relevantes y la normalización de los datos, el conjunto de datos final
comprendió 14 019 registros con 16 atributos que incluyen información demográfica, epidemiológica, clínica y de
laboratorio (hematológica). A pesar de tener 16 atributos disponibles, después de la aplicación del procedimiento
de selección de características, solo quedaron diez atributos para el entrenamiento y prueba del modelo en
función de su importancia.
Como se discutió, solo un estudio abordó la clasificación de Chikungunya. Hossain et al. entrenó y probó su modelo
utilizando un conjunto de datos que comprende 250 registros recopilados de varios hospitales en Dhaka y Chittagong,
Bangladesh. El conjunto de datos tenía cinco atributos indicativos de los síntomas del paciente, es decir, fiebre, dolor
muscular, dolor en las articulaciones, dolor de cabeza e hinchazón en las articulaciones, cada uno clasificado como de
intensidad alta, media o baja.
En relación con la clasificación del Zika, Veiga et al. [50 ] trató de clasificar los casos sospechosos de CZS
utilizando datos clínicos y no clínicos. Se consideró un conjunto de datos con 1.501 registros de recién
nacidos vivos sospechosos de microcefalia informados en el Registro de Eventos de Salud Pública (RESP) y
el Sistema Nacional de Registro de Nacimientos (SINASC) de Brasil. Este conjunto de datos contiene
información demográfica, epidemiológica, clínica (signos), de laboratorio (serológica y otras). De 13
atributos, siete se utilizaron como entrada para el modelo. Además, también existen datos textuales
proporcionados por el profesional de la salud al registrar la información de los recién nacidos en el
sistema, tales como informes, descripciones y otras posibles observaciones. Veiga et al. [50 ] separó los
registros en dos grupos donde el Grupo 1 contenía solo datos clínicos y no clínicos (272 registros), y el
Grupo 2 contenía notas clínicas, no clínicas y textuales complementarias (1109 registros). Los términos más
frecuentes presentados en las notas se utilizaron para ayudar en la clasificación. El Grupo 2, que consideró
estas notas textuales, obtuvo mejores resultados en comparación con el Grupo 1.
Lee et al. [53 ] usó datos demográficos, epidemiológicos, clínicos y de laboratorio con 1034 registros
para entrenar y probar su modelo para distinguir entre dos enfermedades arbovirales diferentes:

Dengue y Chikungunya. Si bien se identificaron 36 atributos en el estudio, solo cinco se usaron para entrenar y
probar el modelo, es decir, período de síntomas, fiebre, fiebre (duración), sangrado y PLT. De los 1.034 registros,
917 estaban relacionados con pacientes adultos con Dengue confirmados por la prueba de reacción en cadena de
la polimerasa (PCR), incluidos 55 registros relacionados con FHD. 117 fueron registros relacionados con pacientes
de Chikungunya confirmados por RT-PCR. Los datos de chikungunya se recopilaron en agosto de 2008, mientras
que los datos de dengue se recopilaron durante el gran brote de dengue de 2004, ambos en Singapur.
Es importante señalar que ninguno de los estudios incluidos describe o discute explícitamente cómo manejan los datos
desequilibrados (desequilibrio entre clases). Dada la forma en que se informaron los conjuntos de datos en los
documentos, ninguno de los modelos se entrenó con un conjunto de datos con un número similar de registros por clase,
como se presenta enTabla 3 ). El conjunto de datos utilizado por Tanner et al. [42 ] presenta este problema de desequilibrio
en el que la clase DSS representa solo el 0,016 del conjunto de datos completo, mientras que la clase sin DF presenta
0,696. Una situación similar se encuentra en el conjunto de datos utilizado por Lee et al. [53 ] en el que DHF es 0,053 y DF
es 0,833. Aunque no se menciona explícitamente, Lee et al. [53 ] aplicó la validación cruzada LOO, como se describe en la
subsección 3.3.4, que puede considerarse una alternativa al evaluar modelos con conjuntos de datos desequilibrados.
Según Él et al. [96 ], cuando se les presentan conjuntos de datos complejos y desequilibrados, la mayoría de los algoritmos
de aprendizaje estándar “fallar a
Tabla 3. Distribución de muestras por clases.
Clases Muestras Proporción�
Dengue
Tanner et al. [42 ] No -DF 836 0.696
DF 173 0.144
DHF 171 0.142
DSS 20 0.016
Gambhir et al. [45 ] No Dengue 25 0.227
Dengue 85 0.772
Ho et al. [47 ] No Dengue 1,952 0.398
Dengue 2,942 0.601
Potts et al. [60 ] OFI 648 0.526
DF 374 0.304
DHF 208 0.169
Phakhounthong et al. [61 ]�� Dengue 160 0.808
Dengue grave 38 0.191
Thitiprayoonwongse et al. [51 ] DF 488 0.487
FHD 1 222 0.221
FHD 2 229 0.228
FHD 3 62 0.061
Fahmi et al. [52 ] DF 4,870 0.347
DHF 8,540 0.609
DSS 609 0.043
Dengue y Chikungunya
Lee et al. [53 ] DF 862 0.833
DFH 55 0.053
Chikungunya 117 0.113
�Los números fueron redondeados.
��Hay 982 muestras de casos que no son de dengue en este conjunto de datos con un total general de 1180 registros, como se muestra enTabla 2 , pero como esta clase no se
consideró en el problema, no la usamos para calcular la proporción.

representar adecuadamente las características distributivas de los datos y, en consecuencia, proporcionar

precisiones desfavorables entre las clases de datos”. Ocurre esencialmente porque los modelos ML aprenden
reduciendo el error y no tienen en cuenta la proporción de clase. En salud, donde la clase minoritaria es
comúnmente el caso positivo para la enfermedad objetivo (o el caso raro), es deseable que un clasificador
proporcione una alta precisión para la clase minoritaria, sin impactar severamente en el desempeño de la clase
mayoritaria.96 ]. En nuestra muestra se identificaron tres excepciones. Gambhir et al. [45 ] y Ho et al. [47 ]
utilizaron conjuntos de datos en los que el número de casos de dengue es mayor que el de casos sin dengue; y
Fahmi et al. [52 ] utilizó un gran conjunto de datos, en el que había más casos de FHD que de FHD.
Además, la combinación de datos desequilibrados y un problema de tamaño de muestra pequeño también se

encontró en este SLR. Por ejemplo, Gambhir et al. [45 ] utilizó un conjunto de datos compuesto por 110 registros con 85
casos positivos de Dengue y 25 casos negativos. Otros trabajos también presentaron un pequeño conjunto de datos, como
[44 ,46 ,48 ,49 ,77 ], teniendo menos de 250 registros cada uno, sin embargo ninguno describió la distribución de las
clases. En tales casos, los algoritmos de aprendizaje tradicionales pueden fallar al usar reglas inductivas sobre el espacio
muestral.96 ]. Cuando las muestras son limitadas, las reglas formadas pueden volverse demasiado específicas, lo que lleva
a un sobreajuste [96 ]. Es probable que este sea el caso en Sajana et al. [44 ] y Sanjudevi y Savitha [46 ]. Para abordar estos
problemas, algunos métodos, como el muestreo, la sensibilidad al costo, el aprendizaje activo y basado en kernel [96 ]
están disponibles en la literatura.
3.4.2 Atributos de los conjuntos de datos.Fig. 3 presenta los tipos de atributos encontrados en los datos
conjuntos descritos anteriormente. Los datos demográficos, epidemiológicos y clínicos (síntomas, signos
y comorbilidades) se agruparon como atributos de recursos limitados siguiendo la terminología
presentada por Lee et al. [53 ]; No se especifica el equipo específico para estos datos, ya que se
recopilaron en el momento de la cita. Los atributos de laboratorio (hematológicos, bioquímicos y
serológicos) y otros se agrupan como atributos bien dotados porque requieren equipos específicos para
su realización.
Tabla 4 presenta un resumen de todos los datos demográficos, epidemiológicos y clínicos presentes en el
conjunto de datos utilizado por los 15 estudios incluidos. A pesar del enfoque en los estudios que utilizaron datos
clínicos como entrada para los clasificadores según [48 ,49 ], también encontramos casos en los que los datos
clínicos se utilizaron junto con otro tipo de datos, por ejemplo, [42 ,44 ,45 ,47 ,50 –53 ,60 ,61 ,77 ]. Fátima y
Hundewale [43 ] y Sanjudev et al. [46 ] no proporcionó detalles sobre el conjunto de datos ni los atributos
utilizados en sus estudios. Thitiprayoonwongse et al. [51 ] solo describió los atributos finales seleccionados en el
conjunto de datos.
Edad, género, peso y residencia (estado) fueron la información demográfica presente en el conjunto de datos
descrito en [45 ,47 ,50 ,52 ,53 ,60 ,77 ]. Los datos clínicos más comunes utilizados para clasificar las enfermedades
arbovirales fueron: dolor abdominal, fiebre, temperatura y sangrado.
Tabla 5 presenta el resumen de todos los datos no clínicos (laboratorio y otros) encontrados en este SLR
Como se esperaba, ninguno de los 15 estudios primarios usó solo datos no clínicos (ya que estos trabajos fueron
excluidos de nuestro SLR). Los datos no clínicos presentados en elTabla 5 es bastante
Fig 3. Atributos encontrados en los conjuntos de datos.

Tabla 4. Resumen de todos los datos demográficos, epidemiológicos y clínicos presentados en el conjunto de datos utilizado por los estudios primarios.
Atributos [42] [43] [44] [45] [46] [47] [60] [61] [77] [51] [48] [52] [49] [50] [53]
Datos demográficos
Edad ⌀ - ⌀ ✓$ - ✓$ ✓$ ✓ ⌀ ⌀ ⌀ ✓$ ⌀ ✓ ✓
Género ⌀ - ⌀ ✓$ - ✓ ✓$ ✓ ✓ ⌀ ⌀ ✓ ⌀ ✓$ ✓
Peso ⌀ - ⌀ ⌀ - ⌀ ✓ ⌀ ✓$ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Residencia (estado) ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓ ⌀
Datos epidemiológicos
Período de síntomas ⌀ - ⌀ ⌀ - ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ✓$ ⌀ ⌀ ✓$
Semana epidemiológica ⌀ - ⌀ ⌀ - ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓ ⌀
Gravedad ⌀ - ⌀ ⌀ - ✓ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ✓ ⌀
vacuna contra la encefalitis japonesa ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓$ ⌀ ✓ ⌀ ⌀ ⌀
Datos clinicos
Síntomas
Dolor abdominal ⌀ - ✓$ ✓$ - ⌀ ✓ ✓ ✓$ ✓$ ⌀ ⌀ ⌀ ⌀ ✓
Fiebre ⌀ - ⌀ ✓$ - ✓$ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ✓$ ⌀ ✓$
Dolor de cabeza ✓ - ✓$ ✓$ - ⌀ ✓ ✓ ✓ ⌀ ⌀ ⌀ ✓$ ⌀ ✓
Mialgia ✓ - ✓$ ✓$ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ✓$ ⌀ ✓
vómitos ✓ - ✓$ ✓$ - ⌀ ✓ ✓ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
Arthalgia ✓ - ✓$ ⌀ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ✓$ ⌀ ⌀
Fiebre (duración) ⌀ - ⌀ ⌀ - ⌀ ✓ ✓ ⌀ ✓$ ⌀ ⌀ ⌀ ⌀ ✓$
Diarrea ✓ - ✓$ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ✓
Dolor retroorbitario ✓ - ✓$ ⌀ - ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Debilidad ✓ - ⌀ ✓$ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Escalofríos ⌀ - ⌀ ✓$ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
alteración del gusto ✓ - ✓$ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Inflamación de articulaciones ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓$ ⌀ ⌀
Anorexia ✓ - ⌀ ⌀ - ⌀ ✓ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
Náuseas ✓ - ⌀ ⌀ - ⌀ ✓ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
Conjuntivitis ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Tos ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
Mareo ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Picor ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀
Ictericia ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀
Dolor de garganta ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
Sensibilidad de la piel ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Señales
Temperatura ✓$ - ✓$ ✓$ - ✓ ⌀ ✓ ⌀ ✓ ✓$ ⌀ ⌀ ⌀ ✓
Sangrado ✓ - ⌀ ⌀ - ⌀ ✓ ✓ ✓$ ✓$ ✓$ ⌀ ⌀ ⌀ ✓$
prueba de tornikuet ⌀ - ⌀ ⌀ - ⌀ ✓$ ⌀ ⌀ ✓ ✓$ ✓$ ⌀ ⌀ ⌀
hepatomegalia ⌀ - ⌀ ⌀ - ⌀ ⌀ ✓ ✓$ ✓$ ⌀ ✓ ⌀ ⌀ ⌀
Choque ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓$ ⌀ ✓$ ⌀ ⌀ ⌀
Ritmo cardiaco ✓ - ⌀ ✓$ - ✓ ⌀ ✓ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ✓
Erupción ✓ - ⌀ ⌀ - ⌀ ⌀ ✓ ✓ ✓$ ⌀ ⌀ ⌀ ✓† ✓
Derrame pleural ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓ ⌀ ✓$ ⌀ ⌀ ⌀
ascitis ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓ ⌀ ✓$ ⌀ ⌀ ⌀
Puntuación de coma de Glasgow ⌀ - ⌀ ⌀ - ⌀ ⌀ ✓$ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
edad gestacional ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓$ ⌀
Circunferencia de la cabeza ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓$ ⌀
(Continuado)

Atributos [42] [43] [44] [45] [46] [47] [60] [61] [77] [51] [48] [52] [49] [50] [53]
Fuga de plasma ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓$ ⌀ ⌀ ⌀ ✓$ ⌀
Presión arterial ⌀ - ⌀ ⌀ - ✓ ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀
La frecuencia respiratoria ⌀ - ⌀ ⌀ - ✓ ⌀ ✓ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀
cara al ras ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Linfadenopatía palpable ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀
peso al nacer ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓ ⌀
Tiempo de llenado capilar ⌀ - ⌀ ⌀ - ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
comorbilidades
HT ⌀ - ⌀ ⌀ - ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
ENT (excepto HT) ⌀ - ⌀ ⌀ - ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Infeccion de las vias respiratorias altas ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀
✓ :datos disponibles en el conjunto de datos;⌀:datos no disponibles en el conjunto de datos; $: datos utilizados como entrada para los modelos; -: conjunto de datos no descrito;
†: historia materna de erupción. Algunos atributos fueron generalizados en base al conocimiento de los autores.
Términos equivalentes: Género [45 ,47 ,53 ,77 ] o sexo [48 ,50 ,60 ,61 ]; Período de síntomas [52 ,61 ] o tiempo desde el inicio [53 ]; Gravedad (no hospitalizado, hospitalizado, ingreso en la Unidad de Cuidados
Intensivos (UCI) y muerte); mialgia [53 ,77 ], dolor corporal [45 ,77 ] o dolor muscular [42 ,44 ,49 ]; Artralgia [53 ] o dolor en las articulaciones [42 ,44 ,49 ]; Fiebre (duración) [53 ,60 , 61 ] o días de defervescencia [
51 ]; Dolor retroorbitario [42 ,61 ] o dolor detrás de los ojos [44 ]; Debilidad [45 ,61 ] o somnolencia [42 ]; alteración del gusto [42 ] o sabor metálico [44 ]; anorexia [53 ,60 ,77 ] o pérdida del apetito [42 ];
Conjuntivitis [51 ] u ojos rojos [42 ]; Sangrado [42 ,48 ,51 ,53 ,60 ,77 ], detectar [48 ], erupción petequial [77 ], moretones [51 ], o hematuria [61 ]; Prueba de Rumpel-Leed [52 ], prueba R/L [52 ] o prueba de
tornikuet [48 ,51 ,60 ]; hepatomegalia [52 ,77 ], hígado crecido [51 ] o agrandamiento del hígado [61 ]; Ritmo cardiaco [45 ,47 ], la frecuencia del pulso [42 ,61 ] o taquicardia [53 ]; Erupción [42 ,51 ,53 ,61 ],
macular [77 ], o antecedentes maternos de erupción [50 ]; Derrame pleural [51 ,52 ] o índice de derrame pleural [60 ]; La frecuencia respiratoria [47 ,61 ] o disnea [51 ]; Linfadenopatía palpable [42 ] o
agrandamiento de los ganglios linfáticos [51 ]; Las ENT incluyen enfermedades cardíacas, accidentes cerebrovasculares, lesiones renales, enfermedades hepáticas graves o cáncer.
diverso. El atributo más común utilizado como entrada para los modelos fue el PLT utilizado en nueve
estudios—[42 ,44 ,45 ,47 ,51 –53 ,60 ,61 ]. Para el entrenamiento del modelo, la mayoría de los datos no
clínicos de naturaleza hematológica, por ejemplo, PLT, WBC y HTC. Gamhbir et al. utilizaron los antígenos
Dengue IgM, Dengue IgG y Dengue NS1. [45 ]; Veiga et al. utilizaron RT-PCR para el virus del Zika (ZIKV),
toxoplasmosis, rubéola, citomegalovirus, herpes simple e infecciones por sífilis (TORCHS) (otros excepto
Zika) e informes de neuroimagen (US, CT, MRI). [50 ]. Los datos bioquímicos utilizados en los modelos
fueron ALT, creatinina y tamaño del hígado.
Lee et al. [53 ] compararon dos casos en relación con los atributos presentes en su conjunto de datos:(1)un
caso de recursos limitados en el que solo se utilizaron los datos disponibles en el momento de la presentación en
el hospital (datos clínicos), y(2)un caso con buenos recursos en el que se utilizaron datos clínicos y de laboratorio
para la clasificación. Según la Subsección 3.3.4, la mayoría de los mejores resultados de la clasificación de DF, DHF
o Chikungunya se obtuvo utilizando un conjunto de datos clínicos y de laboratorio. Estos resultados demuestran
que el uso restringido de datos clínicos para la clasificación múltiple puede no ser tan satisfactorio como cuando
se combinan datos clínicos y no clínicos. Con base en sus resultados, también destacamos que el uso de pocos
atributos (consideraron solo cinco atributos) es factible para la clasificación de DF, DHF y Chikungunya con buen
desempeño. En cuanto al número de atributos, una conclusión similar fue encontrada por Ho et al. [47 ].
Afirmaron que la adición de más atributos no proporcionó ninguna mejora significativa en los resultados de
ninguno de sus modelos, por lo que el subconjunto con solo cuatro atributos pudo proporcionar la mayor
cantidad de información esencial posible y se puede recopilar fácilmente con un costo mínimo. Ho et al. [47 ]
destacan dos hallazgos principales:(1)su "los modelos de alta sensibilidad pueden ser una herramienta de
vigilancia eficaz en el período previo a la epidemia” para complementar el diagnóstico clínico, y(2)los modelos de
alta especificidad, como en su propuesta, se pueden aprovechar para identificar casos de dengue confirmados por
laboratorio en los sitios de brotes para monitorear en tiempo real las tendencias epidémicas.

Tabla 5. Resumen de todos los datos no clínicos (laboratorio y otros) presentados en el conjunto de datos utilizado por los estudios primarios.
Atributos [42] [43] [44] [45] [46] [47] [60] [61] [77] [51] [48] [52] [49] [50] [53]
Datos de laboratorio
Hematológico
Recuento de plaquetas (PLT) ✓ - ✓ ✓ - ✓ ✓ ✓ ✓ ✓ ⌀ ✓ ⌀ ⌀ ✓
ps ps ps ps ps ps ps ps ps
Glóbulos blancos (WBC) ✓ - ✓ ⌀ - ✓ ✓ ✓ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ✓
ps ps ps ps ps ps
Hematocrito (HTC) ✓ - ⌀ ⌀ - ⌀ ✓ ✓ ✓ ✓ ⌀ ✓ ⌀ ⌀ ✓
ps ps ps ps ps
Recuento de linfocitos (LINFA) ✓ - ⌀ ⌀ - ⌀ ✓ ✓ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ✓
ps ps
Hemoglobina (HGB) ✓ - ✓ ⌀ - ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ✓
ps ps
Recuento de neutrófilos (NEUT) ✓ - ⌀ ⌀ - ⌀ ✓ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
ps
Porcentaje de linfocitos (LYMPHP) ✓ - ⌀ ⌀ - ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
ps
Porcentaje de neutrófilos (NEUTP) ✓ - ⌀ ⌀ - ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
ps
Porcentaje de monocitos (MONOP) ✓ - ⌀ ⌀ - ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
ps
Porcentaje de linfocitos atípicos (ALYMPHP) ⌀ - ⌀ ⌀ - ⌀ ✓ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ✓
Recuento de monocitos (MONO) ✓ - ⌀ ⌀ - ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
Recuento de basófilos de eosinófilos (EOSBAS) ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Porcentaje de basófilos de eosinófilos (EOSBASP) ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Hemoglobina corpuscular media (MCH) ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Concentración media de hemoglobina corpuscular (MCHC) ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
VCM ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Volumen plaquetario medio (MPV) ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Ancho de distribución de plaquetas (PDW) ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Proporción de células grandes de plaquetas (PLCR) ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Recuento de glóbulos rojos (RBC) ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Ancho de distribución de glóbulos rojos (RDW) ✓ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Bioquímico
Alanina transaminasa (ALT) ⌀ - ⌀ ⌀ - ⌀ ✓ ✓ ✓ ✓ ⌀ ⌀ ⌀ ⌀ ✓
ps ps
Aspartato aminotransferasa (AST) ⌀ - ⌀ ⌀ - ⌀ ✓ ⌀ ✓ ✓ ⌀ ⌀ ⌀ ⌀ ✓
ps ps
Creatinina ⌀ - ⌀ ⌀ - ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
ps
Albúmina ⌀ - ⌀ ⌀ - ⌀ ✓ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ✓
Proteína ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ✓ ⌀ ✓ ⌀ ⌀ ✓
Urea ⌀ - ⌀ ⌀ - ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
Fosfatasa alcalina (ALP) ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
bilirrubón ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
Potasio ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
Sodio ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
serológico
Inmunoglobulina M (IgM) contra el dengue (ELISA) ⌀ - ⌀ ✓ - ✓ ✓ ✓� ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀
ps
Inmunoglobulina G (IgG) contra el dengue (ELISA) ✓ - ⌀ ✓ - ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀
ps
(Continuado)

Atributos [42] [43] [44] [45] [46] [47] [60] [61] [77] [51] [48] [52] [49] [50] [53]
Antígeno del dengue NS1 (ELISA) ⌀ - ⌀ ✓ - ✓ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
ps
Toxoplasmosis, rubéola, citomegalovirus, herpes simple y ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓ ⌀
Serología de infecciones por sífilis (TORCHS)† ps
Serología Zika ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓ ⌀
ps
Anticuerpos contra el dengue (ensayo de inhibición de la hemaglutinación (HAI)) ⌀ - ⌀ ⌀ - ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Virus de la encefalitis japonesa (JEV) e inmunoglobulina M contra el dengue ⌀ - ⌀ ⌀ - ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
(IgM) (ELISA)
Biología Molecular
Reacción en cadena de la polimerasa con transcripción inversa del dengue (RT-PCR) ✓ - ⌀ ⌀ - ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓

carga viral del dengue ✓ - ⌀ ⌀ - ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Chikungunya reacción en cadena de la polimerasa de transcripción inversa ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓
(RT-PCR)
Otros
Antígeno del dengue NS1 ⌀ - ⌀ ✓ - ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
ps
Proteína en orina ⌀ - ⌀ ⌀ - ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
ps
Sangre en heces ⌀ - ⌀ ⌀ - ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Aislamiento viral del dengue ⌀ - ⌀ ⌀ - ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Glóbulos rojos en orina ⌀ - ⌀ ⌀ - ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
Imagenes medicas
Informe de neuroimagen ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ✓ ⌀
ps
Radiografía de tórax ⌀ - ⌀ ⌀ - ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
impedancia bioelectrica
agua extracelular ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
ps
Masa celular corporal ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
ps
Resistencia reactiva ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
ps
Otros† ⌀ - ⌀ ⌀ - ⌀ ⌀ ⌀ ✓ ⌀ ⌀ ⌀ ⌀ ⌀ ⌀
✓ :Datos disponibles en el conjunto de datos;⌀:Datos no disponibles en el conjunto de datos; $: Datos utilizados como entrada para los modelos; -: Conjunto de datos no descrito;
†:PLT; glóbulos blancos; HTC; HGB; NEUTRO; LINFA NEUTP; LINFA; ALYMPPH; MONONUCLEOSIS INFECCIOSA; MONOP; EOSBAS; EOSBASP; MCH; CHMC; monovolumen; PDW; PLCR; glóbulos rojos; RDW; ALT;
AST; MONTAÑA; IgM; IgG; inmunoensayo ligado a enzimas (ELISA); HAI; JEV; RT-PCR;
�Este artículo buscó anticuerpos contra el dengue en muestras de líquido cefalorraquídeo; ANTORCHAS; Otras características como modelos de conjuntos de datos en el artículo [77 ] fueron
resistencia, ángulo de fase, capacitancia corporal, TRT = TBW/W, agua intracelular, agua corporal total, agua extracelular, masa grasa, índice de masa corporal, masa corporal magra, (ERB) =
(ECM/BCM), tasa metabólica basal , ERI = ECW/ICW. Para confirmar el diagnóstico de arbovirus, algunos artículos utilizaron los criterios de la OMS para el dengue [51 ] o no especificó cómo se
hizo el trámite [44 ,48 ,49 ,77 ]. Algunos atributos fueron generalizados en base al conocimiento de los autores. Términos equivalentes: PLT [42 ,44 ,47 ,53 ,60 ,61 ,77 ], máximo y mínimo PLT [
51 ], o trombocitos [52 ]; CMB [42 ,44 ,47 ,60 ,61 ], recuento máximo y mínimo de leucocitos [51 ], o recuento de leucocitos [53 ]; Hematocrito alto y bajo [51 ,61 ], hematocrito inicial o
diagnóstico [52 ], o cuando se hizo una sola medida [42 ,44 ,45 ,47 ,53 ,60 ]; RDW CV o SV [42 ]; Proteína [53 ], hipoproteinemia [52 ] o globulina [51 ]; Carga viral del dengue [47 ] o umbral de
cruce del umbral de cruce del virus del dengue (DENV) RT-PCR [42 ].
Es interesante notar que los conjuntos de datos utilizados son bastante diferentes con respecto al
número de muestras y atributos. Además, los estudios incluidos no usaron atributos similares para
entrenar y probar sus modelos propuestos. En general, los estudios incluidos no describieron los datos
clínicos y no clínicos de manera estandarizada, lo que dificulta resumir estos

datos sin un profesional de la salud. Otro desafío al analizar los conjuntos de datos está relacionado con la falta de
descripción detallada en los estudios incluidos. La descripción de los datos y la metodología del experimento son
fundamentales para la replicabilidad de los estudios; en la mitad de los casos no hay información sobre la
configuración del modelo. Además, aunque todos los estudios utilizaron conjuntos de datos, ninguno de ellos está
disponible para su uso, lo que afecta aún más la reproducibilidad.
3.5 ¿Cuáles son las métricas que se utilizan para evaluar el desempeño de las
técnicas de Machine Learning y Deep Learning?
Las métricas comunes utilizadas para evaluar un clasificador se calculan en función de una matriz de
confusión. La matriz de confusión es una tabla cruzada que registra el número de ocurrencias entre la
clasificación verdadera y la clasificación predicha por el modelo [97 ]. Se compone de cuatro valores:
• Verdadero Positivo (TP): El número de valores de la clase principal que el modelo predice correctamente.
• Falso Positivo (FP): El número de valores de la clase principal que el modelo predice
mal.
• True Negative (TN): El número de valores de la clase secundaria que el modelo predice
correctamente.
• Falso Negativo (FN): El número de valores de la clase secundaria que el modelo predice
mal.
higo 4 presenta las métricas utilizadas para evaluar los modelos propuestos en la literatura. Algunos
trabajos utilizaron más de una métrica y están duplicados en el gráfico. Las métricas de evaluación utilizadas
por los trabajos que se encuentran en este SLR son: sensibilidad, exactitud, especificidad, precisión,
característica operativa del receptor (ROC) y AUC, y puntuación F1. La sensibilidad y la precisión se utilizaron en
la mayoría de los estudios incluidos en la muestra SLR.
3.5.1 Sensibilidad.La sensibilidad, también conocida como recuerdo, fue utilizada por siete estudios—[42 –48 ,50 –
53 ,61 ]. Define qué tan bien un modelo predijo correctamente los casos de TP. Se calcula como el número de TP
dividido por la suma de TP y FN, como se muestra enecuación 1 .
TP
sensibilidad¼ d1Þ
TPþFN
Fig 4. Métricas utilizadas para evaluar los modelos propuestos en la literatura.

3.5.2 Precisión.La precisión fue la métrica más común utilizada entre los estudios en este
cámara réflex—[42 –48 ,50 –52 ,77 ]. Se utiliza para averiguar cuánto es correcto un modelo. Se calcula como la
suma de TP y TN dividida por el total de muestras, como se muestra enecuación 2 .
TPþTennesse
exactitud¼ d2Þ
TPþTennesseþFPþFN
3.5.3 Especificidad.La especificidad fue utilizada por cinco estudios incluidos en esta SLR—[42 ,43 ,45 –47 ,
51 ,53 ,61 ]. Esta métrica determina qué tan bien el modelo predijo correctamente los casos de NT. Se
calcula por el número de TN dividido por la suma de TN y FP segúnecuación 3 .
Tennesse
especificidad¼ d3Þ
TennesseþFP
3.5.4 Precisión.La precisión se utilizó en [44 ,48 ,50 ,52 ,61 ]. Esta métrica define cuántos
casos clasificados como TP en realidad son TP, y se calcula como el número de TP dividido por la suma de TP y FP,
como se muestra enecuación 4 .
TP
precisión¼ d4Þ
TPþFP
3.5.5 Característica operativa del receptor (ROC) y área bajo la curva (AUC).
ROC y AUC se usaron en cuatro estudios—[46 ,48 ,49 ,53 ]. La curva ROC es un gráfico para analizar
la capacidad de discriminación del modelo, es decir, qué tan bien el modelo puede dividir entre dos
clases. Es un gráfico con la Tasa de Verdaderos Positivos (TPR), la sensibilidad, en elX eje, y la Tasa
de Falsos Positivos (FPR), el complemento de la especificidad, en elyeje. Basado en ROC, es posible
calcular el AUC. El AUC resume la curva ROC en un solo valor, agregando todos los umbrales ROC.
Su resultado varía entre 0 y 1; un AUC de 0,5 representa una prueba sin capacidad de
discriminación, mientras que un AUC de 1,0 representa una prueba con discriminación perfecta [98
].
3.5.6 Puntuación F1.La puntuación F1 es la media armónica entre dos métricas: precisión y
sensibilidad. Se utiliza cuando el objetivo es buscar un equilibrio entre estas dos métricas, calculándose
como se presenta enecuación 5 . Esta métrica se utilizó en [44 ,48 ,50 ].
precisión�precisión de
F1 puntaje¼2� d5Þ
sensibilidadþsensibilidad
Para abordar los problemas de datos desequilibrados mencionados anteriormente, se pueden usar métricas de
evaluación más informativas para evaluar modelos. Estos incluyen AUC, curvas de recuperación de precisión y curvas de
costo. A pesar de los supuestos desequilibrios, la mayoría de los estudios incluidos emplearon métricas tradicionales
como precisión, sensibilidad y especificidad. Relativamente pocos (3) usaron AUC [42 , 46 ,49 ].
4. Discusión
En este SLR sobre el uso de ML y DL para apoyar el diagnóstico clínico de enfermedades arbovirales, encontramos
963 publicaciones, 15 de las cuales cumplieron con los criterios de inclusión y fueron posteriormente analizadas en
detalle. Hemos informado nuestros hallazgos en cinco categorías principales:(1)foco de enfermedad,(2)técnica ML
y DL,(3)Diseño de modelos ML y DL,(4)conjuntos de datos y atributos, y(5)métricas de evaluación. Comparar los
estudios seleccionados, incluso dentro de estas categorías, debido a la variación en

la enfermedad focal y la región, la técnica de ML y DL y la configuración del modelo de ML y DL son un desafío.

Los resultados no se presentan de manera uniforme. Seis de los estudios [43 ,44 ,46 ,48 ,53 ,61 ] no proporcionó
suficientes detalles sobre sus modelos propuestos, ninguno de los estudios seleccionados proporcionó acceso a
sus datos, y solo un estudio [50 ] proporcionó detalles de sus modelos en línea para su descarga.
En primer lugar, dado el bajo número de estudios, es importante señalar que claramente hay escasez de
investigación en el uso de ML y DL para respaldar el diagnóstico clínico de las enfermedades arbovirales en su
conjunto. Esta escasez de investigación se exacerba aún más cuando se considera que solo tres enfermedades
arbovirales (Dengue, Chikungunya y Zika) aparecen en los estudios seleccionados, y la mayoría de los artículos (12)
se centran en una sola enfermedad, el Dengue. Los arbovirus, como la fiebre amarilla, que no figuraron en
ninguno de los estudios seleccionados, tienen una carga significativa. 47 países de África, América Central y del Sur
tienen regiones endémicas de fiebre amarilla. Por ejemplo, en 2013, la carga de la fiebre amarilla solo en África se
estimó en 84 000–170 000 casos graves y 29 000–60 000 muertes. Si bien el dengue, el chikungunya y el zika sin
duda requieren más estudio, existe una necesidad significativa de investigación en el espectro más amplio de
enfermedades arbovirales. Dada la similitud de los síntomas entre los arbovirus, hay una escasez sorprendente de
investigación sobre ML y DL para respaldar el diagnóstico diferencial utilizando datos clínicos. Una de las razones
más comunes por las que las personas en áreas de bajos recursos buscan atención médica es una enfermedad
febril [99 ]. Tales enfermedades incluyen infecciones del tracto respiratorio, mononucleosis, malaria y fiebre
tifoidea.100 ]). Al igual que los arbovirus, por lo general requieren pruebas de laboratorio complejas para su
confirmación, y medir tanto la sensibilidad como la especificidad puede ser un desafío. Pocos estudios en la
muestra SLR buscaron la clasificación de enfermedades multiclase. Los estudios futuros podrían explorar la
eficacia de diferentes enfoques para la clasificación de múltiples clases de arbovirus y otras enfermedades febriles,
incluidos(1)el desarrollo de algoritmos multiclase, y(2)descomponer un problema de varias clases en múltiples
problemas de dos clases (binarios) según Zhou et al. [101 ].
En general, se encontró que los sistemas identificados para el diagnóstico de arbovirus de ML y DL utilizando
datos clínicos eran efectivos. Sin embargo, estos hallazgos deben moderarse con cautela. En algunos casos, por
ejemplo, Sanjudevi y Savitha [46 ] y Sajana et al. [44 ], las métricas de rendimiento extremadamente altas sugieren
un sobreajuste del modelo. En ambos casos, faltan detalles sobre la configuración del modelo, la selección de
características y la optimización de hiperparámetros. En el caso de Sajana et al. [44 ], el conjunto de datos es muy
pequeño.
Observamos que solo un artículo hizo uso de una arquitectura DL, una CNN [47 ], y ningún documento utilizó métodos
de conjunto que combinaran DL y ML. Los modelos DL están atrayendo una atención significativa en el dominio de la salud
[102 ], especialmente para tratar con datos no estructurados, como imágenes y datos de series temporales. Sin embargo,
nuestros hallazgos sugieren que los estudios previos sobre la clasificación de las enfermedades arbovirales utilizan
principalmente datos tabulares y están dominados por modelos basados en árboles. Esto es de esperar ya que los
modelos de ML tradicionales son adecuados para este tipo de datos. Para hacer uso de datos tabulares con modelos DL, el
principal desafío es remodelar los datos para que encajen en la representación de entrada específica. Comúnmente, los
conjuntos de datos son de alta dimensión y muy dispersos. En consecuencia, el desafío de remodelar una buena
representación de insumos se ve exacerbado [103 ]. Otro desafío para los modelos DL que trabajan con datos tabulares
está relacionado con la escala y distribución de las características presentes en el conjunto de datos. Para los modelos
basados en árboles, este aspecto es insignificante; sin embargo, los DL son muy sensibles a este problema, lo que puede
provocar problemas de gradiente que desaparecen y explotan [103 ]. A pesar de estos desafíos, uno puede aprovechar las
poderosas funciones que DL puede proporcionar de manera inherente. Por ejemplo, mediante el uso de un modelo DL y
las capas asociadas de convolución y agrupación máxima, se puede reducir el tiempo y el esfuerzo involucrados en la
selección manual de características, una tarea que requiere mucho tiempo y que se usa comúnmente cuando se procesan
conjuntos de datos para el entrenamiento y las pruebas de ML. Los estudios existentes han propuesto la transformación
de datos tabulares en imágenes (matriz) para alimentarlos en un modelo DL. por ejemplo alviny otros. [104 ] propuso una
CNN y una

LSTM para detectar sepsis en neonatos. Sus resultados muestran que los DL superaron a los modelos de ML
tradicionales seleccionados, como SVM y la regresión logística, lo que sugiere que se pueden lograr mejoras
significativas con DL si los datos se modifican en consecuencia. La investigación futura debería considerar la
evaluación comparativa del rendimiento de un conjunto más amplio de arquitecturas DL, tanto discretamente
como como parte de conjuntos, incluidas las redes neuronales recurrentes (RNN), las redes de creencias
profundas (DBN) y las redes de apilamiento profundo (DSN), entre otros, utilizando diferentes técnicas para
remodelar los conjuntos de datos. En particular, el uso de memoria a largo plazo a corto plazo (LSTM) y unidades
recurrentes cerradas (GRU), ambos tipos de RNN, puede resultar fructífero.
Si bien las técnicas de ML y DL representan una oportunidad importante para la
investigación y la práctica, plantean sus propios desafíos. Dos desafíos importantes son
la transparencia y la disponibilidad de datos. ML y DL a menudo se denominancaja negra
modelos como su funcionamiento interno es demasiado complejo para que un ser
humano lo comprenda. Como tales, han sido criticados por su falta de interpretabilidad,
comprensión y transparencia. Por razones legales, éticas y científicas, este es un tema
importante para las decisiones de alto riesgo, como el diagnóstico clínico.105 ,106 ].
Como tal, ha habido numerosos pedidos de investigación sobre ML e IA explicables (a
veces denominados Inteligencia Artificial Explicable (XAI)) [105 –107 [108 ]).
Un segundo desafío significativo en el diagnóstico de enfermedades arbovirales utilizando datos clínicos es más
logístico y está relacionado con el tamaño y la calidad de los conjuntos de datos disponibles. Tener un conjunto de datos
suficiente para entrenar y validar modelos ML y DL es fundamental. En primer lugar, ninguno de los estudios en la muestra
de SLR describe o analiza explícitamente los datos desequilibrados, una característica común en todos los estudios. La
distribución de clases desequilibrada puede resultar en modelos sesgados hacia la clase mayoritaria [109 ]. Este problema
se puede abordar de varias maneras. Por ejemplo, Chawla et al. [110 ] sugieren que a nivel de datos, se puede aplicar
sobremuestreo aleatorio con sustitución, submuestreo aleatorio, sobremuestreo dirigido o sobremuestreo con una
generación informada de nuevas muestras. Del mismo modo, Chawla et al. [110 ] sugieren que, a nivel algorítmico, los
ajustes de costos de las diversas clases para contrarrestar el desequilibrio de clases, los ajustes en la estimación
probabilística en la hoja del árbol (cuando se trabaja con árboles de decisión) y los ajustes en el umbral de decisión y se
basan en el reconocimiento en lugar de la discriminación. aprendizaje basado. En segundo lugar, nuestros hallazgos
sugieren que la mayoría de los conjuntos de datos de los estudios seleccionados eran relativamente pequeños. Se podría
argumentar, demasiado pequeño. El más grande, presentado en Fahmi et al. [52 ] comprendió solo 14,019 registros,
mientras que el más pequeño comprendió 20 registros [44 ]. En tercer lugar, notamos un posible problema de cambio de
conjunto de datos. El cambio de conjunto de datos ocurre cuando hay un cambio de fuente de datos de entrenamiento a
prueba. En consecuencia, hay una diferencia en las distribuciones de los datos de entrenamiento y prueba, lo que da como
resultado que los modelos aprendidos en los datos de entrenamiento fallen en los datos de prueba.111 ]. Los tipos
comunes de cambio de conjunto de datos incluyen cambio de covariable simple, cambio de probabilidad anterior, sesgo de
selección de muestra y datos desequilibrados [112 ]. Cada uno de estos problemas afecta la confianza en los resultados y la
generalización, pero también tiene implicaciones prácticas para su uso operativo futuro. Superar algunos de estos
problemas, como el sesgo en la selección de muestras, requiere un esfuerzo coordinado de los sistemas de vigilancia de la
salud y los investigadores de todo el mundo y un mayor intercambio de datos clínicos.
La selección de características y la optimización de hiperparámetros son pasos clave en la selección y

optimización de modelos ML y DL. Un problema importante en muchos de los estudios seleccionados fue la falta
de detalles sobre si se utilizaron la selección de características y la optimización de hiperparámetros y, de ser así,
qué técnicas. Solo Fáthima y Hundewale [43 ], Faisal et al. [77 ] y Veiga et al. [50 ] informaron sobre el uso de una
técnica de optimización de hiperparámetros, búsqueda en cuadrícula, para encontrar mejores configuraciones
de modelos. Otros [47 ,51 –53 ,61 ,77 ] informaron explícitamente que aplicaron técnicas de selección de
características para encontrar los atributos que proporcionaron los mejores resultados para sus modelos. Ocho
estudios no proporcionan ningún detalle [42 ,45 –50 ,60 ]. Suponiendo que estos estudios no usaron

estas técnicas de búsqueda y optimización, esto representa una oportunidad para mejorar aún
más el rendimiento.
Nuestra revisión se centró en los estudios que utilizaron datos clínicos en sus modelos de ML y DL. En algunos casos,
esta no fue la única fuente de datos. Por ejemplo, la mayoría de los estudios seleccionados utilizaron datos clínicos con
otros tipos de datos, como resultados de pruebas de laboratorio para respaldar el diagnóstico de un arbovirus
determinado.42 ,44 ,45 ,47 ,50 –53 ,60 ,61 ,77 ]. Las enfermedades arbovirales son comunes en algunas de las regiones
más pobres y remotas del mundo. El diagnóstico basado en pruebas de laboratorio requiere tanto la disponibilidad de
equipo especializado como de personal para operarlo. Incluso si está disponible, en algunos casos esto puede aumentar el
tiempo transcurrido y la complejidad del diagnóstico. Por el contrario, una herramienta de apoyo a la decisión basada en
datos clínicos utilizando ML y DL es de bajo costo y rápida sin necesidad de recursos especializados.
En sus pautas para desarrollar y reportar modelos ML en investigación biomédica, Luo et al. [113 ]
sugieren que se deben informar las siguientes métricas de evaluación: sensibilidad, especificidad, valor
predictivo positivo, valor predictivo negativo, AUC y gráfico de calibración. Nuestro análisis sugiere una
brecha significativa entre los estudios seleccionados y estas guías. Si bien la mayoría de los estudios
evaluaron la sensibilidad, la especificidad y los valores predictivos, pocos estudios ofrecieron una
evaluación integral de todas las métricas. Por ejemplo, solo cuatro estudios midieron el rendimiento
mediante ROC y AUC.
Finalmente, descartando los modelos que parecen presentar sobreajuste o benchmarking inadecuado,
ninguno de los trabajos superó el 85% de precisión. Este rendimiento puede explicarse por una variedad de
factores, incluida la calidad del conjunto de datos de entrenamiento y la ausencia o la mala ejecución de la
selección de funciones o la optimización de hiperparámetros. No obstante, dadas las limitaciones y el potencial de
mejora, somos optimistas de que ML y DL ofrecen oportunidades significativas para el desarrollo de herramientas
de apoyo a la decisión de bajo costo para apoyar el diagnóstico, particularmente en áreas remotas y vulnerables, a
menudo caracterizadas por la pobreza.
5. Conclusiones
Esta SLR presentó una descripción general de la literatura actual que aplica modelos ML y DL para la clasificación
de enfermedades arbovirales como apoyo para el diagnóstico clínico. De la amplia gama de arbovirus, la
investigación de ML y DL para diagnosticar arbovirus con base en datos clínicos se limita a las tres infecciones
más comunes: dengue, chikungunya y zika. Identificamos que los objetivos principales eran en gran parte
clasificaciones binarias. En el caso del dengue, hay pruebas de intentos más matizados de clasificación en varias
clases, por ejemplo, la gravedad y el riesgo del dengue. De manera similar, existe cierta evidencia de diagnóstico
diferencial tanto dentro de los virus (p. ej., Dengue/Dengue grave o Zika/Zika congénito) como entre virus; sin
embargo, tales estudios son la excepción. Aunque se trata de una muestra limitada, la mayoría de los estudios
incluidos se centraron en técnicas de ML en lugar de LD. de los primeros, la mayoría eran modelos basados en
árboles (Decision Tree, Adaboost, Gradient Boost, Random Forest). El único modelo de DL era una CNN,
DenseNet. Las métricas de evaluación más comunes fueron la precisión, la sensibilidad y la especificidad. A pesar
de la evidencia de conjuntos de datos desequilibrados, solo tres estudios incluidos utilizaron AUC. En resumen, la
investigación de ML y DL para diagnosticar arbovirus se encuentra en un nivel incipiente de madurez.
Sugerimos que tener un sistema de apoyo a la toma de decisiones clínicas sobre enfermedades arbovirales
eficiente y completo puede mejorar la calidad de todo el proceso clínico de enfermedades arbovirales,
aumentando así la exactitud, la precisión y el rendimiento del diagnóstico (y mitigando el riesgo de diagnóstico
erróneo) y el tratamiento asociado. También ayudaría a los médicos en su proceso de toma de decisiones y, como
consecuencia, mejoraría la utilización de recursos y la calidad de vida del paciente en general. Sin embargo, esto
requiere un enfoque sostenido, centrado y sistemático de la investigación que coloque el diagnóstico diferencial y
la reproducibilidad en su centro. Esto implica mayor

coordinación y uso compartido de conjuntos de datos y mayor detalle con respecto a la configuración del modelo, la
selección de funciones y la optimización de hiperparámetros.

ML, y DL más específicamente, tienen importantes limitaciones legales, éticas y científicas, particularmente con
respecto a la toma de decisiones de atención médica, sobre todo la naturaleza de caja negra de muchas técnicas
de DL. En cuanto a futuras investigaciones basadas en los resultados y desafíos abiertos de un SLR, destacamos
las siguientes direcciones, en cuanto al diagnóstico y clasificación de enfermedades arbovirales utilizando ML y DL:
(1)uso de diferentes tipos y fuentes de datos, incluidos datos clínicos y demográficos, datos estructurados y no
estructurados, para entrenar y probar modelos;(2) aplicaciones de técnicas para abordar datos desequilibrados;(3)
mayor exploración y evaluación de modelos DL y modelos de conjuntos, que comprenden modelos ML y DL, para
la clasificación de arbovirus;(4)mayor énfasis en el diagnóstico diferencial dentro y entre una gama más amplia de
arbovirus;
(5)aplicación de técnicas de selección de características y optimización de hiperparámetros para ajustar modelos;(
6)uso consistente de un conjunto más completo de métricas de evaluación para acomodar datos desequilibrados,
y(7)un sistema de soporte de decisiones de diagnóstico de fácil acceso en regiones remotas que permite una
conectividad intermitente.
Expresiones de gratitud
Los autores desean agradecer al Conselho Nacional de Desenvolvimento Cientı́fico e Tecnológico

(CNPq); Fundação de Amparo à Pesquisa do Estado do Amazonas (FAPEAM); Fundação de Vigilância
em Saúde Dra. Romero Costa Pinto; Fundação de Amparo a Ciência e Tecnologia do Estado de
Pernambuco (FACEPE); y la Universidade de Pernambuco (UPE), entidad del Gobierno del Estado de
Pernambuco volcada en la promoción de la Enseñanza, la Investigación y la Extensión.
Contribuciones de autor
Conceptualización:Sebastião Rogério da Silva Neto, Thomás Tabosa Oliveira, Igor Vitor
Teixeira, Theo Lynn, Patricia Takako Endo.
Curación de datos:Sebastião Rogério da Silva Neto, Thomás Tabosa Oliveira, Igor Vitor Teixeira,
Samuel Benjamín Aguiar de Oliveira, Theo Lynn, Patricia Takako Endo.
Análisis formales:Sebastião Rogério da Silva Neto, Thomás Tabosa Oliveira, Igor Vitor Teix-
eira, Samuel Benjamin Aguiar de Oliveira, Vanderson Souza Sampaio, Theo Lynn, Patricia
Takako Endo.
Adquisición de fondos:Vanderson Souza Sampaio.
Investigación:Sebastião Rogério da Silva Neto, Thomás Tabosa Oliveira, Igor Vitor Teixeira,
Samuel Benjamin Aguiar de Oliveira, Vanderson Souza Sampaio, Theo Lynn, Patricia
Takako Endo.
Metodología:Sebastião Rogério da Silva Neto, Theo Lynn, Patricia Takako Endo.
Administración de proyecto:Patricia Takako Endo.
Supervisión:Vanderson Souza Sampaio, Theo Lynn, Patricia Takako Endo.
Validación:Sebastião Rogério da Silva Neto, Theo Lynn, Patricia Takako Endo.
Visualización:Patricia Takako Endo.
Redacción – borrador original:Sebastião Rogério da Silva Neto, Thomás Tabosa Oliveira, Igor Vitor
Teixeira, Samuel Benjamin Aguiar de Oliveira, Vanderson Souza Sampaio, Theo Lynn,
Patricia Takako Endo.

Redacción – revisión y edición:Sebastião Rogério da Silva Neto, Thomás Tabosa Oliveira, Igor
Vitor Teixeira, Vanderson Souza Sampaio, Theo Lynn, Patricia Takako Endo.
Referencias
1.Organización Mundial de la Salud. Enfermedades Tropicales Desatendidas; 2020
2.Artsob H, Lindsay R, Drebot M. Arbovirus. En: Quah SR, editor. Enciclopedia Internacional de Salud Pública
(Segunda Edición). segunda edición ed. Oxford: prensa académica; 2017. pág. 154–160. Disponible de:
https://www.sciencedirect.com/science/article/pii/B9780128036785000230.3 .
3.Lopes N, Nozawa C, Linhares REC. Caracterı́sticas gerais e epidemiologiados arbovı́rus emergentes no
Brasil. Revista Pan-Amazônica de Saúde. 2014; 5(3):55–64.4.
4.Organización Mundial de la Salud. Keeping the Vector Out: Mejoras de vivienda para el control de vectores y el
desarrollo sostenible; 2017.5.
5.Paixao ES, Teixeira MG, Rodrigues LC. Zika, chikungunya y dengue: las causas y amenazas de enfermedades
arbovirales nuevas y reemergentes. BMJ salud global. 2018; 3 (suplemento 1): e000530.6.https://doi.org/
10.1136/bmjgh-2017-000530 IDPM:29435366
6.Kalbus A, de Souza Sampaio V, Boenecke J, Reintjes R. Explorando la influencia de la deforestación en la incidencia
de la fiebre del dengue en el estado brasileño de Amazonas. Más uno. 2021; 16(1):e0242685.7.https://doi.org/
10.1371/journal.pone.0242685 IDPM:33411795
7.LaDeau SL, Allan BF, Leisnham PT, Levy MZ. Los fundamentos ecológicos del potencial de transmisión y las
enfermedades transmitidas por vectores en los paisajes urbanos. Ecología Funcional. 2015; 29(7):889–901.8.
https://doi.org/10.1111/1365-2435.12487 IDPM:26549921
8.Esser HJ, Mögling R, Cleton NB, Van Der Jeugd H, Sprong H, Stroo A, et al. Factores de riesgo asociados con la
circulación sostenida de seis arbovirus zoonóticos: una revisión sistemática para la selección de sitios de vigilancia
en áreas no endémicas. Parásitos y vectores. 2019; 12(1):265.9.https://doi.org/10.1186/s13071- 019-3515-7 IDPM:
31133059
9.Girard M, Nelson CB, Picot V, Gubler DJ. Arbovirus: una amenaza mundial para la salud pública. Vacuna.
2020; 38(24):3989–3994https://doi.org/10.1016/j.vaccine.2020.04.011 IDPM:32336601
10Lowe R, Lee S, Lana RM, Codeço CT, Castro MC, Pascual M. Arbovirus emergentes en la selva
amazónica urbanizada. bmj. 2020; 371.https://doi.org/10.1136/bmj.m4385 IDPM:33187952
11Liu LE, Dehning M, Phipps A, Swienton RE, Harris CA, Klein KR. Actualización clínica sobre dengue, chikungunya
y Zika: lo que sabemos al momento del envío del artículo. Medicina de desastres y preparación de salud
pública. 2017; 11(3):290–299.https://doi.org/10.1017/dmp.2016.144 IDPM:27572514
12Cruz LCdTAd, Serra OP, Leal-Santos FA, Ribeiro ALM, Slhessarenko RD,Santos MAd. Transmisión transovárica
natural del virus del dengue 4 en Aedes aegypti de Cuiabá, Estado de Mato Grosso, Brasil.
Revista da Sociedade Brasileira de Medicina Tropical. 2015; 48(1):18–25.https://doi.org/10.1590/
0037-8682-0264-2014 IDPM:25860459
13Heath CJ, Grossi-Soyster EN, Ndenga BA, Mutuku FM, Sahoo MK, Ngugi HN, et al. Evidencia de transmisión transovárica
de los virus Chikungunya y Dengue en mosquitos capturados en el campo en Kenia. PLoS enfermedades tropicales
desatendidas. 2020; 14(6):e0008362.https://doi.org/10.1371/journal.pntd.0008362 IDPM:32559197
14D'Ortenzio E, Matheron S, de Lamballerie X, Hubert B, Piorkowski G,Maquart M, et al. Evidencia de

transmisión sexual del virus Zika. Revista de Medicina de Nueva Inglaterra. 2016; 374(22):2195–2198.
https://doi.org/10.1056/NEJMc1604449 IDPM:27074370
15.Deckard DT, Chung WM, Brooks JT, Smith JC, Woldai S, Hennessey M, et al. Transmisión sexual de hombre a
hombre del virus del Zika: Texas, enero de 2016. Informe semanal de morbilidad y mortalidad. 2016; 65
(14):372–374.https://doi.org/10.15585/mmwr.mm6514a3 IDPM:27078057
dieciséis.Hoad VC, Speers DJ, Keller AJ, Dowse GK, Seed CR, Lindsay M, et al. Primer caso informado de infección por el
virus del río Ross transmitida por transfusión. Med J Aust. 2015; 202(5):267–9.https://doi.org/10.5694/
mja14.01522 IDPM:25758699
17Zeng Z, Zhan J, Chen L, Chen H, Cheng S. Carga global, regional y nacional del dengue de 1990 a 2017: un
análisis sistemático basado en el estudio de carga global de enfermedad 2017. EClinicalMedicine.
2021; 32:100712.https://doi.org/10.1016/j.eclim.2020.100712 IDPM:33681736
18Puntasecca CJ, King CH, LaBeaud AD. Medición de la carga global de los virus chikungunya y Zika: una revisión
sistemática. PLoS enfermedades tropicales desatendidas. 2021; 15(3):e0009055.https://doi.org/10. 1371/
diario.pntd.0009055 IDPM:33661908
19Organización Mundial de la Salud. Dengue y dengue grave; 2021.
20Organización Mundial de la Salud. virus Zika; 2018.

21Paniz-Mondolfi AE, Rodriguez-Morales AJ, Blohm G, Marquez M,Villamil-Gomez WE. Síndrome ChikDenMa-
Zika: el desafío de diagnosticar infecciones por arbovirus en medio de epidemias concurrentes; 2016.
22Ioos S, Mallet HP, Goffart IL, Gauthier V, Cardoso T, Herida M. CurrentZika virus epidemiology and Recent
Epidemiology. Medicina y enfermedades infecciosas. 2014; 44(7):302–307. IDPM:25001879
23Cerbino-Neto J, Mesquita EC, Amancio RT, Brasil PEAAd. Eventos que preceden a la muerte entre pacientes infectados
por el virus chikungunya: una revisión sistemática. Revista da Sociedade Brasileira de Medicina Tropical. 2020; 53.
https://doi.org/10.1590/0037-8682-0431-2019 IDPM:32401863
24Villamil-Gómez WE, González-Camargo O, Rodriguez-Ayubi J,Zapata-Serpa D, Rodriguez-Morales AJ. Infección

por dengue, chikungunya y zikaco en un paciente de Colombia. Revista de infección y salud pública.
2016; 9(5):684–686.
25Eligio-Garcı́a L, Crisóstomo-Vázquez MDP, Caballero-Garcı́a MdL,Soria-Guerrero M, Méndez-Galván
JF, López-Cancino SA, et al.Co-infección de Dengue, Zika y Chikungunya en un grupo de gestantes
de Tuxtla Gutiérrez , Chiapas: Datos preliminares. 2019. PLOS Tropical Descuidado
Enfermedades. 2020; 14(12):e0008880.https://doi.org/10.1371/journal.pntd.0008880
26Cavalcanti LPdG, Freitas ARR, Brasil P, Cunha RVd. Vigilancia de las muertes por arbovirus en Brasil:
del dengue al chikungunya. Memorias del Instituto Oswaldo Cruz. 2017; 112(8):583–585. https://
doi.org/10.1590/0074-02760160537 IDPM:28767985
27Maniero VC, Santos MO, Ribeiro RL, de Oliveira PA, da Silva TB, Moleri AB, et al. Dengue, chikungunya y zika
vı́rus no brasil: situaciónaoepidemiológica, aspectos clínicos y medidas preventivas. Almanaque
multidisciplinar de pesquisa. 2016; 1(1).
28Marimoutou C, Vivier E, Oliver M, Boutin JP, Simon F. Morbilidad y deterioro de la calidad de vida 30 meses después de
la infección por chikungunya: cohorte comparativa de policías militares franceses infectados y no infectados en la
isla Reunión. Medicamento. 2012; 91(4):212–219.https://doi.org/10.1097/MD.0b013e318260b604 IDPM:22732952
29Rodriguez-Morales A, Cardona-Ospina J, Villamil-Gómez W,Paniz-Mondolfi A. ¿Cuántos pacientes con

reumatismo inflamatorio crónico post-chikungunya podemos esperar en las nuevas áreas endémicas de
América Latina? Reumatología internacional. 2015; 35(12):2091–2094.https://doi.org/10.1007/
s00296-015-3302-5 IDPM:26045218
30Marques CDL, Duarte ALBP, Ranzolin A, Dantas AT, Cavalcanti NG, Gonçalves RSG, et al. Recomendaciones
de la Sociedad Brasileña de Reumatología para el diagnóstico y tratamiento de la fiebre Chikungunya.
Parte 1-Diagnóstico y situaciones especiales. Revista brasileira de reumatologia. 2017; 57:s421–s437.
https://doi.org/10.1016/j.rbr.2017.05.004
31Organización Mundial de la Salud. chikungunya; 2020.
32.Zanluca C, Melo VCAd, Mosimann ALP, Santos GIVd, Santos CNDd, Luz K. Primer reporte de transmisión
autóctona del virus Zika en Brasil. Memorias del Instituto Oswaldo Cruz. 2015; 110(4):569–572. https://
doi.org/10.1590/0074-02760150192 IDPM:26061233
33.Brasil P, Pereira JP Jr, Moreira ME, Ribeiro Nogueira RM, Damasceno L,Wakimoto M, et al. Infección por el virus Zika en
mujeres embarazadas en Río de Janeiro. Revista de medicina de Nueva Inglaterra. 2016; 375 (24):2321–2334.
https://doi.org/10.1056/NEJMoa1602412
34.Costello A, Dua T, Duran P, Gülmezoglu M, Oladapo OT, Perea W, et al. Definición del síndrome asociado con la
infección congénita por el virus del Zika. Boletín de la Organización Mundial de la Salud. 2016; 94(6):406. IDPM:
27274588
35.Driggers RW, Ho CY, Korhonen EM, Kuivanen S, Jääskeläinen AJ, Smura T, et al. Infección por el virus Zika con viremia
materna prolongada y anomalías cerebrales fetales. Revista de medicina de Nueva Inglaterra.
2016; 374(22):2142–2151.https://doi.org/10.1056/NEJMoa1601824
36.Donalisio MR, Freitas ARR, Zuben APBV. Arbovirus emergentes en Brasil: desafíos para la clínica e
implicaciones para la salud pública. Revista de saudepublica. 2017; 51:30.https://doi.org/10.1590/S1518-
8787.2017051006889 IDPM:28423140
37.Dargan S, Kumar M, Ayyagari MR, Kumar G. Una encuesta sobre el aprendizaje profundo y sus aplicaciones: un nuevo paradigma
para el aprendizaje automático. Archivos de Métodos Computacionales en Ingeniería. 2019; pag. 1–22.
38.Chollet F. Aprendizaje profundo con Python. Simón y Schuster; 2017.

39.Kitchenham B, Charters S. Pautas para realizar revisiones sistemáticas de literatura en ingeniería de
software. 2007.
40Gusenbauer M. Google Scholar para eclipsarlos a todos? Comparando los tamaños de 12 buscadores
académicos y bases de datos bibliográficas. Cienciometría. 2019; 118(1):177–214.https://doi.org/10.1007/
s11192-018-2958-5

41.Wohlin C. Pautas para la bola de nieve en estudios sistemáticos de literatura y una aplicación en ingeniería de
software. En: Actas de la 18ª conferencia internacional sobre evaluación y evaluación en ingeniería de
software; 2014. págs. 1–10.
42.Tanner L, Schreiber M, Low JG, Ong A, Tolfvenstam T, Lai YL, et al. Los algoritmos del árbol de decisiones predicen el
diagnóstico y el resultado de la fiebre del dengue en la fase temprana de la enfermedad. PLoS Negl Trop Dis.
2008; 2(3):e196.https://doi.org/10.1371/journal.pntd.0000196 IDPM:18335069
43.Fathima SA, Hundewale N. Análisis comparativo de técnicas de aprendizaje automático para la clasificación de
arbovirus. En: Actas de la Conferencia Internacional 2012IEEE-EMBS sobre Informática Biomédica y de la
Salud. IEEE; 2012. pág. 376–379.
44.Sajana T, Navya M, Gayathri Y, Reshma N. Clasificación del dengue mediante técnicas de aprendizaje
automático. Int J Eng Technol. 2018; 7(2.32):212–218.https://doi.org/10.14419/ijet.v7i2.32.15570
45.Gambhir S, Malik SK, Kumar Y. El diagnóstico de la enfermedad del dengue: una evaluación de tres enfoques de
aprendizaje automático. International Journal ofHealthcare Information Systems and Informatics (IJHISI). 2018;
13(3):1–19.https://doi.org/10.4018/IJHISI.2018070101
46.Sanjudevi D, Savitha D. Predicción de la fiebre del dengue mediante técnicas de clasificación. Int Res J Eng Technol
(IRJET). 2019; 6(02):558–563.
47.Ho TS, Weng TC, Wang JD, Han HC, Cheng HC, Yang CC, et al. Comparación del aprendizaje automático con modelos de casos
y controles para identificar casos confirmados de dengue. PLoS enfermedades tropicales desatendidas. 2020;
14(11):e0008843.https://doi.org/10.1371/journal.pntd.0008843 IDPM:33170848
48.Arafiyah R, Hermin F, Kartika I, Alimuddin A, Saraswati I. Clasificación de la fiebre hemorrágica del dengue
(DHF) mediante SVM, bayes naive y randomforest. En: Serie de conferencias IOP: Ciencia e ingeniería
de materiales. vol.434. publicación IOP; 2018. pág. 012070.
49.Hossain MS, Sultana Z, Nahar L, Andersson K. Un sistema inteligente para diagnosticar chikungunya bajo
incertidumbre. Revista de redes móviles inalámbricas, computación ubicua y aplicaciones confiables.
2019; 10(2):37–54.
50Veiga RV, Schuler-Faccini L, França GV, Andrade RF, Teixeira MG, Costa LC, et al. Algoritmo de clasificación para
el Síndrome Zika congénito: caracterizaciones, diagnóstico y validación. Informes científicos. 2021; 11(1):1–
7.https://doi.org/10.1038/s41598-021-86361-5 IDPM:33762667
51.Thitiprayoonwongse D, Suriyaphol P, Soonthornphisaj N. Extracción de datos de la infección por dengue mediante el árbol de
decisión. Entropía. 2012; 2:2.
52.Fahmi A, Purwitasari D, Sumpeno S, Purnomo MH. Evaluación del Desempeño de Clasificadores para la Predicción de
Casos de Infección por el Virus del Dengue Basado en Criterios de Diagnóstico Clínico. En: 2020 Simposio
Internacional de Electrónica (IES). IEEE; 2020. pág. 456–462.
53.Lee VJ, Chow A, Zheng X, Carrasco LR, Cook AR, Lye DC, et al. Predictores clínicos y de laboratorio
simples de Chikungunya versus dengue en adultos. PLoS Negl Trop Dis. 2012; 6(9):e1786.https://
doi.org/10.1371/journal.pntd.0001786 IDPM:23029573
54.Jordan MI, Mitchell TM. Aprendizaje automático: tendencias, perspectivas y perspectivas. Ciencia. 2015; 349
(6245):255–260.https://doi.org/10.1126/science.aaa8415 IDPM:26185243
55.Kotsiantis SB, Zaharakis I, Pintelas P, et al. Aprendizaje automático supervisado: una revisión de las técnicas de
clasificación. Aplicaciones emergentes de inteligencia artificial en ingeniería informática. 2007; 160(1):3–24.
56.Chauhan NK, Singh K. Una revisión sobre el aprendizaje automático convencional frente al aprendizaje profundo. En: 2018
Conferencia Internacional sobre Tecnologías de Computación, Energía y Comunicación (GUCON). IEEE; 2018.
pag. 347–352.
57.Campesato O. Inteligencia artificial, aprendizaje automático y aprendizaje profundo. Stylus Publishing, LLC; 2020.
58.Esmaily H, Tayefi M, Doosti H, Ghayour-Mobarhan M, Nezami H,Amirabadizadeh A. Una comparación entre el árbol
de decisión y el bosque aleatorio para determinar los factores de riesgo asociados con la diabetes tipo 2. Revista
de investigación en ciencias de la salud. 2018; 18(2):412.
59.Singh S, Gupta P. Estudio comparativo ID3, carro y C4. 5 algoritmo de árbol de decisión: una encuesta. Revista
internacional de ciencia y tecnología de la información avanzada (IJAIST). 2014; 27(27):97–103.
60Potts JA, Gibbons RV, Rothman AL, Srikiatkhachorn A, Thomas SJ, Supradish Po, et al. Predicción de la gravedad de la enfermedad
del dengue entre pacientes pediátricos tailandeses utilizando indicadores de laboratorio clínico temprano. por favor
Negl Trop Dis. 2010; 4(8):e769.https://doi.org/10.1371/journal.pntd.0000769 IDPM:20689812
61.Phakhounthong K, Chaovalit P, Jittamala P, Blacksell SD, Carter MJ,Turner P, et al. Predicción de la gravedad de la
fiebre del dengue en niños al ingreso en función de las características clínicas y los indicadores de laboratorio:
aplicación del análisis del árbol de clasificación. Pediatría BMC. 2018; 18(1):1–9.https://doi.org/10.1186/
s12887-018-1078-y
62.Bonaccorso G. Algoritmos de aprendizaje automático. Packt Publishing Ltd; 2017.

63.Khoshgoftaar TM, Golawala M, Van Hulse J. Un estudio empírico de aprendizaje a partir de datos desequilibrados
utilizando bosques aleatorios. En: 19th IEEEInternational Conference on Tools with Artificial Intelligence (ICTAI
2007). vol. 2.IEEE; 2007. pág. 310–317.
64.Ke G, Meng Q, Finley T, Wang T, Chen W, Ma W, et al. Lightgbm: un árbol de decisiones de aumento de gradiente altamente
eficiente. Avances en los sistemas de procesamiento de información neural. 2017; 30:3146–3154.
sesenta y cinco.Freund Y, Schapire RE, et al. Experimentos con un nuevo algoritmo de impulso. En: ICML. vol. 96. Citeseer; 1996.
pág. 148–156.
66.Mayr A, Binder H, Gefeller O, Schmid M. La evolución de los algoritmos de refuerzo. Métodos de información
en medicina. 2014; 53(06):419–427. IDPM:25112367
67.Vapnik V. La naturaleza de la teoría del aprendizaje estadístico. medios de comunicación de Springer Science Business; 2013.
68.Gurney K. Una introducción a las redes neuronales. prensa CRC; 2018.
69.Sharkawy AN. Principio de red neuronal y sus principales tipos. Revista de avances en matemáticas
aplicadas y computacionales. 2020; 7:8–19.https://doi.org/10.15377/2409-5761.2020.07.2
70.Du KL, Swamy MN. Redes neuronales en un marco de softcomputing. Medios de comunicación de ciencia y negocios de
Springer; 2006.
71.Ahmad F, Isa NAM, Hussain Z, Osman MK. Diagnóstico médico inteligente de enfermedades utilizando un algoritmo
genético híbrido mejorado-red de perceptrones multicapa. Revista de sistemas médicos. 2013; 37(2):1–8. https://
doi.org/10.1007/s10916-013-9934-7
72.Cybenko G. Aproximación por superposiciones de una función sigmoidal. Matemáticas de control, señales y
sistemas. 1989; 2(4):303–314.https://doi.org/10.1007/BF02551274
73.Paliwal M, Kumar UA. Redes neuronales y técnicas estadísticas: una revisión de aplicaciones. Sistemas
Expertos con Aplicaciones. 2009; 36(1):2–17.https://doi.org/10.1016/j.eswa.2007.10.005
74.Sahoo AK, Pradhan C, Das H. Evaluación del desempeño de diferentes métodos de aprendizaje automático y redes neuronales
convolucionales basadas en aprendizaje profundo para la toma de decisiones en salud. En: Computación inspirada en la naturaleza
para la ciencia de datos. Saltador; 2020. pág. 201–212.
75.Paterakis NG, Mocanu E, Gibescu M, Stappers B, van Alst W. Deeplearning versus métodos tradicionales de
aprendizaje automático para la predicción de la demanda de energía agregada. En: 2017 IEEE PES Innovative
Smart Grid TechnologiesConference Europe (ISGT-Europe). IEEE; 2017. pág. 1–6.
76.Golovko V. Aprendizaje profundo: una descripción general y principales paradigmas. Memoria óptica y redes
neuronales. 2017; 26(1):1–17.https://doi.org/10.3103/S1060992X16040081
77.Faisal T, Ibrahim F, Taib MN. Un enfoque inteligente no invasivo para predecir el riesgo en pacientes con
dengue. Sistemas Expertos con Aplicaciones. 2010; 37(3):2175–2181.https://doi.org/10.1016/j.eswa.
2009.07.060
78.Mitchell T. Aprendizaje automático, McGraw-Hill Higher Education. Nueva York.1997.
79.Ayer T, Chhatwal J, Alagoz O, Kahn CE Jr, Woods RW, Burnside ES. Comparación de regresión logística y modelos de
redes neuronales artificiales en la estimación del riesgo de cáncer de mama. Radiografías. 2010; 30 (1):13–22.
https://doi.org/10.1148/rg.301095057 IDPM:19901087
80.Cubrir T, Hart P. Clasificación del patrón del vecino más cercano. Transacciones IEEE sobre teoría de la
información. 1967; 13(1):21–27.https://doi.org/10.1109/TIT.1967.1053964
81.LeCun Y, Cortes C, Burges C. LA BASE DE DATOS MNIST: de dígitos escritos a mano.http://yannlecuncom/exdb/
mnist/ Consultado el 25 de agosto de 2020. 1998.
82.Londres AJ. Inteligencia artificial y decisiones médicas de caja negra: precisión versus explicabilidad. Informe
del Centro Hastings. 2019; 49(1):15–21.https://doi.org/10.1002/hast.973 IDPM:30790315
83.Huang G, Liu Z, Van Der Maaten L, Weinberger KQ. Redes convolucionales densamente conectadas. En: Actas de la
conferencia IEEE sobre visión por computadora y reconocimiento de patrones; 2017. pág. 4700–4708
84.Zhu Y, Newsam S. Densenet para flujo denso. En: 2017 Conferencia internacional IEEE sobre procesamiento de
imágenes (ICIP). IEEE; 2017. pág. 790–794.
85.Feurer M, Hutter F. Optimización de hiperparámetros. En: Aprendizaje automático automatizado. Springer, Cham;
2019. pág. 3–33.
86.Wu J, Chen XY, Zhang H, Xiong LD, Lei H, Deng SH. Optimización de hiperparámetros para modelos de aprendizaje
automático basados en optimización bayesiana. Revista de Ciencia y Tecnología Electrónica. 2019; 17(1):26–40.
87.Li J, Cheng K, Wang S, Morstatter F, Treviño RP, Tang J, et al. Selección de características: una perspectiva de datos.
Encuestas de Informática ACM (CSUR). 2017; 50(6):1–45.
88.Chandrashekar G, Sahin F. Una encuesta sobre métodos de selección de características. Computación e Ingeniería
Eléctrica. 2014; 40(1):16–28.https://doi.org/10.1016/j.compeleceng.2013.11.024

89.Ying X. Una descripción general del sobreajuste y sus soluciones. En: Journal of Physics: Serie de conferencias.
vol. 1168. Publicación IOP; 2019. pág. 022022.
90.Raskutti G, Wainwright MJ, Yu B. Detención anticipada y regresión no paramétrica: una regla de detención óptima
dependiente de los datos. El diario de investigación de aprendizaje automático. 2014; 15(1):335–366.
91.Fürnkranz J. Algoritmos de poda para el aprendizaje de reglas. Aprendizaje automático. 1997; 27(2):139–172.https://
doi. org/10.1023/A:1007329424533
92.Nusrat I, Jang SB. Una comparación de técnicas de regularización en redes neuronales profundas. Simetría. 2018;
10(11):648.https://doi.org/10.3390/sym10110648
93.Ng AY. Selección de características, regularización L 1 frente a L 2 e invariancia rotacional. En: Actas de la vigésima primera
conferencia internacional sobre aprendizaje automático; 2004. pág. 78.
94.Srivastava N, Hinton G, Krizhevsky A, Sutskever I, Salakhutdinov R.Dropout: una forma sencilla de evitar el sobreajuste
de las redes neuronales. La revista de investigación de aprendizaje automático. 2014; 15(1):1929–1958.
95.Kononenko I. Estimación de atributos: Análisis y extensiones de RELIEF. En: Conferencia europea sobre aprendizaje
automático. Saltador; 1994. pág. 171–182.
96.Él H, García EA. Aprender de datos desequilibrados. Transacciones IEEE sobre conocimiento e ingeniería
de datos. 2009; 21(9):1263–1284.https://doi.org/10.1109/TKDE.2008.239
97.Grandini M, Bagli E, Visani G. Métricas para la clasificación de clases múltiples: una descripción general. preimpresión de arXiv
arXiv:200805756. 2020.
98.Hoo Zhe Hui TD Candlish Jane. ¿Qué es una curva ROC? Revista de Medicina de Emergencia. 2017; 34:3.
IDPM:28302644
99Crump JA, Kirk MD. Estimación de la carga de enfermedades febriles. PloS Enfermedades tropicales desatendidas.
2015; 9(12):e0004040.https://doi.org/10.1371/journal.pntd.0004040 IDPM:26633014
100.Téllez I. Enfermedades febriles. Revista Internacional de Enfermedades Infecciosas. 2010; 14:e172.https://doi.org/

10.1016/j.ijid.2010.02.1865
101.Zhou J, Peng H, Suen CY. Descomposición basada en datos para clasificación multiclasificación. Reconocimiento de patrones
ción 2008; 41(1):67–76.https://doi.org/10.1016/j.patcog.2007.05.020
102.Xiao C, Choi E, Sun J. Oportunidades y desafíos en el desarrollo de modelos de aprendizaje profundo utilizando elec-
Datos de registros de salud electrónicos: una revisión sistemática. Revista de la Asociación Estadounidense de Informática
Médica. 2018; 25(10):1419–1428.https://doi.org/10.1093/jamia/ocy068 IDPM:29893864
103.Marais JA. Aprendizaje profundo para datos tabulares: un estudio exploratorio; 2019.
104.Alvi RH, Rahman MH, Khan AAS, Rahman RM. Enfoque de aprendizaje profundo sobre datos tabulares para predecir la
sepsis neonatal de aparición temprana. Revista de Información y Telecomunicaciones. 2020; pag. 1–21.
105.Watson DS, Krutzinna J, Bruce IN, Griffiths CE, McInnes IB, Barnes MR, et al. Aplicaciones clínicas de algoritmos de
aprendizaje automático: más allá de la caja negra. Bmj. 2019; 364.
106.Rudin C. Deje de explicar modelos de aprendizaje automático de caja negra para decisiones de alto riesgo y utilice modelos
interpretables en su lugar. Inteligencia de la máquina de la naturaleza. 2019; 1(5):206–215.https://doi.org/10.1038/
s42256-019-0048-x
107.Castelvecchi D. ¿Podemos abrir la caja negra de la IA? Noticias de la naturaleza. 2016; 538 (7623): 20.https://doi.org/
10.1038/538020a IDPM:27708329
108.Pawar U, O'Shea D, Rea S, O'Reilly R. Inteligencia artificial explicable en el cuidado de la salud. En:2020 Conferencia Internacional
sobre Conciencia Situacional Cibernética, Análisis de Datos y Evaluación (CyberSA). IEEE; 2020. pág. 1–2.
109.Ganganwar V. Una descripción general de los algoritmos de clasificación para conjuntos de datos desequilibrados. Revista
Internacional de Tecnología Emergente e Ingeniería Avanzada. 2012; 2(4):42–47.
110.Chawla NV, Japkowicz N, Kotcz A. Edición especial sobre el aprendizaje a partir de conjuntos de datos desequilibrados.
Boletín de exploraciones ACM SIGKDD. 2004; 6(1):1–6.https://doi.org/10.1145/3262579
111.Kull M, Flach P. Patrones de cambio de conjunto de datos. En: Primer Taller Internacional sobre Aprendizaje en Contextos
Múltiples (LMCE) en ECML-PKDD; 2014.
112.Quinorteonero-Candela J, Sugiyama M, Lawrence ND, Schwaighofer A. Datasetshift in machine learning. Mit

Press; 2009.
113.Luo W, Phung D, Tran T, Gupta S, Rana S, Karmakar C, et al. Pautas para desarrollar y reportar modelos predictivos de
aprendizaje automático en la investigación biomédica: una visión multidisciplinaria. Revista de investigación
médica en Internet. 2016; 18(12):e323

Journal PNTD 0010061 en Es

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Journal PNTD 0010061 en Es

Cargado por

Copyright:

Formatos disponibles

Traducido del inglés al español - www.onlinedoctranslator.

plosENFERMEDADES TROPICALES DESATENDIDAS

Técnicas de aprendizaje automático y aprendizaje

Samuel Benjamín Aguiar de OliveiraIDENTIFICACIÓN

Patricia Takako Endo1 * IDENTIFICACIÓN

1Universidade de Pernambuco, Recife, Brasil,2Universidade do Estado do Amazonas, Manaos, Brasil, 3Fundaçao de

Publicado:13 de enero de 2022

Historial de revisión por pares:PLOS reconoce los beneficios

de la transparencia en el proceso de revisión por pares; por lo

está disponible aquí: https://doi.org/10.1371/

Derechos de autor:©2022 da Silva Neto et al. Este es un

Declaración de disponibilidad de datos:Todos los datos relevantes son

dentro del manusc rasgar Dengue, Chikungunya y Zika.

PLOS Negligencia d Enfermedades tropicales |https://doi.org/10.1371/journal.pntd.001006113 de enero de 2022 1 / 37

Fondos:VSS tiene una beca (062.00249/2020 [EDITAL N. Conclusiones

Conflicto de intereses:Los autores han declarado que

Abreviaturas: IA, Inteligencia artificial;MONTAÑA, Fosfatasa

alcalina;alternativa, alanina transaminasa; ALYMPHP,

redes de apilamiento profundo;DSPM, Modelo de predicción de

de la hemaglutinación; HGB, hemoglobina;HT, Hipertensión;htc,

hematocrito;UCI, Unidad de Cuidados Intensivos;ID3,

dicotomizador iterativo 3;IgG, Inmunoglobulina G;IgM,

Inmunoglobulina M;JEV, virus de la encefalitis japonesa;kNN, K-

vecinos más cercanos;LAVABO, dejar uno fuera;LSTM, Memoria 1. Introducción

polimerasa con transcriptasa inversa;cámara réflex, Revisión

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 2 / 37

Virus Zika. Américas.

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 3 / 37

clasificar automáticamente las enfermedades arbovirales y respaldar el diagnóstico clínico.

• RQ 02: ¿Qué técnicas de ML y DL se están utilizando en la investigación relacionada con la clasificación de

2.1 Estrategia de búsqueda

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 4 / 37

Figura 1. Selección de estudios.

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 5 / 37

2.2 Selección de estudios

2.3 Extracción y codificación de datos

investigaciones en esta área.

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 6 / 37

3.2 ¿Qué técnicas de Machine Learning y Deep Learning se están utilizando en la

ML tiene básicamente cuatro categorías de técnicas de aprendizaje: aprendizaje supervisado, aprendizaje no

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 7 / 37

3.2.2 Máquina de vectores de soporte (SVM).SVM es un clasificador basado en la estadística de Vapnik

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 8 / 37

estudios en la muestra SLR—[43 ,46 ,48 ,49 ,52 ].

atributos del conjunto de datos son igualmente importantes e independientes.

Bayes—[43 ,45 ,48 ,52 ].

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 9 / 37

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 10 / 37

Otro proceso muy utilizado en ML es la selección de atributos para la construcción de un modelo,

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 11 / 37

humana para etiquetarlos.

• Riesgo de dengue: Faisal et al. [77 ]; y

• FHD o no: Arafiyah et al. [48 ]

PLOS Enfermedades tropicales desatendidas |https://doi.org/10.1371/journal.pntd.0010061 13 de enero de 2022 12 / 37

clasificación DL mejoramiento selección

(2) Gravedad de tasa, AUC

MVS no descrito Búsqueda de cuadrícula

min tamaño de hoja = 2

min ganancia = 0.01

Árbol tamaño mínimo de hoja = descrito proporciones

Logístico solucionador = lbfgs

(2) confianza = 0,3