A Comprehensive Review of Machine Learning Techniques On Diabetes Detection

Machine Translated by Google
Sharma y Shah Computación visual para la industria, la biomedicina y el arte
(2021) 4:30 https://doi.org/10.1186/s42492021000977
computación visual para la industria,
Biomedicina y Arte
REVISIÓN Acceso abierto
Una revisión exhaustiva de las técnicas de
aprendizaje automático para la detección de diabetes
Toshita Sharma1 y Manan Shah2*
Resumen
La diabetes mellitus ha sido una preocupación creciente debido a su alta morbilidad, y la edad promedio de los individuos afectados por esta enfermedad ha
disminuido ahora a la mitad de los veinte años. Dada la alta prevalencia, es necesario abordar este problema de manera efectiva. Muchos investigadores y
médicos ahora han desarrollado técnicas de detección basadas en inteligencia artificial para abordar mejor los problemas que se pasan por alto debido a errores
humanos. Técnicas de minería de datos con algoritmos tales como: agrupamiento espacial basado en la densidad de aplicaciones con ruido y puntos de orden
para identificar la estructura del agrupamiento, el uso de sistemas de visión artificial para aprender datos en imágenes faciales, obtener mejores funciones para
el entrenamiento de modelos y diagnóstico a través de la presentación de iridociclitis para la detección de la enfermedad a través de los patrones del iris han
sido desplegados por varios profesionales. Los clasificadores de aprendizaje automático, como las máquinas de vectores de soporte, la regresión logística y los
árboles de decisión, han sido discutidos comparativamente por varios autores. Se han considerado modelos de aprendizaje profundo, como redes neuronales
artificiales y redes neuronales recurrentes, con un enfoque principal en la memoria a corto plazo y arquitecturas de redes neuronales convolucionales en
comparación con otros modelos de aprendizaje automático. Por lo general, se utilizan varios parámetros, como el error cuadrático medio, los errores absolutos
medios, el área bajo las curvas y los gráficos con criterios variables. En este estudio, se analizan los desafíos relacionados con la inadecuación de los datos y la
implementación del modelo. También se ha discutido el alcance futuro de tales métodos, y se espera que los nuevos métodos mejoren el rendimiento de los
modelos existentes, permitiéndoles lograr una mayor comprensión de las condiciones de las que depende la prevalencia de la enfermedad.
Palabras clave: Aprendizaje automático, Aprendizaje profundo, Cuidado de la salud, Detección de diabetes
Introducción las personas que tienen dolencias prevalecientes más directamente,
Dada la creciente población, es necesario desarrollar y este grupo comprende la mayoría del grupo de personas
sistemas para mejorar la salud y mitigar las crecientes afectadas por muchas enfermedades como diabetes, azúcar en la
preocupaciones en todo el mundo. A medida que avanza la sangre y problemas de presión arterial [1]. Según el Informe
investigación científica, el desarrollo de dicho sistema se Nacional de Estadísticas de Diabetes 2020, cada 1 de cada 10
vuelve más eficiente. Los sistemas de salud están diseñados personas en los Estados Unidos tiene diabetes, y los nuevos casos
para brindar a las personas los requisitos para una buena de diabetes 1 y 2 han aumentado significativamente entre los jóvenes.
salud y realizar la detección y diagnóstico de enfermedades Dado que la salud y el cuidado de la salud forman pilares críticos
y condiciones correctamente con mayor eficiencia, tal como de una sociedad saludable, es necesario utilizar las capacidades
lo proponen los métodos convencionales. En general, los de los métodos computacionales y la inteligencia artificial [2] para
pacientes suelen estar muy preocupados por la calidad del desarrollar nuevos métodos para su aplicación en los sistemas de
sistema de salud y las instalaciones disponibles para brindar salud para promover una sociedad más saludable y reducir el
riesgo
tratamiento. Los beneficios de las mejoras en los sistemas de salud de tal ae
tienden nfermedades
afectar en nuestras generaciones, aumentando
aún más la calidad de vida.
* Correspondencia: manan.shah@spt.pdpu.ac.in Ha habido un gran impacto en el mundo médico con el avance
2
Departamento de Ingeniería Química, Escuela de Tecnología, Pandit
de la tecnología. Los resultados de salud pueden depender de una
Universidad de Energía Deendayal, 382426 Gandhinagar, Gujarat, India
La lista completa de información del autor está disponible al final del artículo. cuestión de segundos para las personas que
© El(los) autor(es). Acceso abierto 2021 Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite
el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito
correspondiente al autor o autores originales y a la fuente. , proporcione un enlace a la licencia Creative Commons e indique si se
realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del
artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative
Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso
directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 2 de 16
es posible que no pueda llegar a un hospital o recibir tratamiento algoritmos como los árboles potenciados por gradiente, que se
de emergencia. La tecnología cierra esta brecha en distancia y pueden usar para crear modelos predictivos de la progresión de
recursos para todas las personas a las que se extienden sus la prediabetes a la diabetes, y tienen como objetivo proporcionar
beneficios. Se han desarrollado varias tecnologías utilizando un diagnóstico temprano para un mejor tratamiento y reducir los
máquinas de formación de imágenes por resonancia magnética riesgos adicionales [12]. Otro estudio aplicó un algoritmo de
en la tecnología de vídeo. Las aplicaciones basadas en Internet máquina de vector de soporte modificado (SVM) como un método
pueden proporcionar a los pacientes servicios personalizables. eficiente para datos tanto lineales como no lineales [13].
Después de algunas visitas clínicas, el resto del trabajo se puede
realizar a través de servicios de alta tecnología como la telesalud. Desde la llegada de la inteligencia artificial y las tecnologías
Los médicos pueden comunicarse con los pacientes a través de relacionadas, estos métodos computacionales se han aplicado a
Internet para atender mejor sus necesidades [3]. Un ejemplo del modelos de detección en tiempo real en casi todos los campos. El
uso de la tecnología de video implica la provisión de dicha uso de minería de datos, aprendizaje automático, aprendizaje
mecanización en caso de emergencia para pacientes con trauma profundo y visión por computadora ha reducido drásticamente la
en áreas rurales y urbanas donde la atención clínica puede no dificultad de estudiar técnicas más nuevas que pueden mejorar
estar disponible [4]. La tecnología tiene la capacidad de permitir la significativamente los métodos existentes. En la siguiente sección,
atención médica domiciliaria con mayor productividad y seguridad se analizan los algoritmos y métodos.
[5]. La precisión y disponibilidad de los datos se han propuesto
como uno de los problemas más importantes que enfrentan los Aplicación de última tecnología en detección de diabetes Los
hospitales, lo que implica el mantenimiento y procesamiento algoritmos utilizados en minería de datos, aprendizaje automático
posterior de los datos de los pacientes. Varios algoritmos en el o cualquier campo de la inteligencia artificial realizan modelado
campo del aprendizaje automático y el aprendizaje profundo se predictivo, es decir, el uso de datos y estadísticas para predecir
han aplicado beneficiosamente en la práctica a los tratamientos resultados futuros basados en datos históricos. Los síntomas más
médicos. Algunas ideas de vanguardia surgen de la implementación comunes de la diabetes incluyen metabolismo anormal,
masiva de tecnologías, como la creación de algoritmos de hiperglucemia y un riesgo asociado de complicaciones específicas
coincidencia y el procesamiento del lenguaje natural [6]. La minería que afectan los ojos, los riñones y el sistema nervioso, que son
de datos se puede utilizar para extraer datos directamente, en lugar de
confiar
partes en el conocimiento
importantes de D
del cuerpo. expertos.
ichos síntomas se utilizan para
Se considera que estos métodos producen patrones únicos y recopilar datos y luego se realiza el modelado en función de las
distintivos para crear planes personalizados para cada hospital [7]. categorías de edad y género. Uno de esos algoritmos es ordenar
puntos para identificar la estructura de agrupamiento (OPTICS),
La diabetes mellitus (DM) es una de las enfermedades más que es un conjunto de puntos de pedido para identificar estructuras
arquetípicas a nivel mundial. Es una enfermedad que implica que de agrupamiento. OPTICS es una versión avanzada de
los sistemas del cuerpo de una persona no pueden funcionar de agrupamiento espacial de aplicaciones basado en la densidad
manera eficiente para usar la energía de los alimentos. Se (DBSCAN) con ruido, y elimina todos los aspectos negativos de
conocen cuatro tipos principales de diabetes, que incluyen el tipo DBSCAN. El método de agrupación de datos utilizado en este
1, el tipo 2, la gestacional y otras formas, siendo los más comunes algoritmo es un algoritmo iterativo equilibrado de reducción y
el tipo 1 y el tipo 2 [8]. La diabetes tipo 1 generalmente ocurre en agrupación que utiliza jerarquías (BIRCH) que selecciona los
el grupo de edad joven de 30 a 40 años y depende de la insulina. datos más adecuados para un análisis posterior. Por lo tanto, se
Se requiere que los pacientes tomen dosis de insulina durante utiliza la técnica de minería de datos naïve Bayes (NB), y BIRCH
toda su vida. Por el contrario, el tipo 2 predomina en la cohorte de y OPTICS se utilizan para agrupar tipos de datos similares y para
más de 40 años y suele estar relacionado con el peso de los identificar el algoritmo correcto para una mayor precisión [14].
pacientes. Se sabe que la diabetes tipo 2 tiene una mayor Apache Spark se encuentra entre las plataformas de análisis de
prevalencia en todo el mundo, ya que representa más del 90 % estado de más rápido crecimiento. Opera más rápidamente que
de los casos [9]. Debido a que esta enfermedad ha estado durante la plataforma Hadoop, lo que la hace más fácil de usar y aplicable
mucho tiempo cerca de la cima de las clasificaciones mundiales a la práctica clínica [11].
que enumeran enfermedades graves, muchos investigadores y Otra aplicación de este tipo en el campo de OpenCV es el uso
médicos han propuesto algoritmos y métodos para su tratamiento del sistema de detección de DM no invasivo asistido por
y detección. La implementación de estos algoritmos tiene sus computadora. Este sistema proporcionó resultados inmediatos a
raíces en las disciplinas de aprendizaje profundo y aprendizaje partir de imágenes faciales. El modelo examinó cuatro bloques de
automático. Con el análisis predictivo respaldado por redes salud de la piel: frente, mejilla izquierda, mejilla derecha y puente
neuronales, específicamente redes neuronales convolucionales nasal. Luego, la extracción de características se realizó utilizando
(CNN) y redes neuronales recurrentes (RNN), estos métodos un patrón binario local y luego la clasificación utilizando el
tienen la capacidad de determinar sentimientos y aprender agrupamiento de kvecino más cercano (KNN) y un SVM. Todas
características de modelos altos automáticamente [10, 11]. estas características se conectaron con software y muestran los
resultados
Algunos investigadores han implementado el uso del aprendizaje automático en tiempo
a través de real [15].
islam et al. [16] utilizaron diferentes algoritmos para un conjunto de obtener resultados que parecen más adecuados para aplicaciones de la
datos de síntomas de diabetes, incluidos NB, bosque aleatorio (RF), vida real.
regresión logística (LR) y un árbol de decisión (DT). Primero, el conjunto Choudhury y Gupta [17] utilizaron diferentes algoritmos para clasificar
de datos con el sistema del paciente se ingresa en el sistema en el que a las personas en dos categorías: individuos de alto y bajo riesgo. Usaron
se aplican los algoritmos predictivos. Después de esto, el conjunto de un SVM para establecer un hiperplano para la categorización, una
datos se ingresa en la base de datos y se observa el rendimiento o la técnica de clasificación KNN para agrupar nuevos datos en grupos,
precisión lograda por el modelo. clasificadores DT, RF y NB, y el método de clasificador binario llamado
El algoritmo más adecuado se selecciona comúnmente en función de la LR. Al comparar las precisiones para esta clasificación en forma de
mayor precisión y el mejor rendimiento. Los datos del usuario se toman matriz de confusión, como se muestra en la Fig. 1, se encontró que el
nuevamente como entrada para el algoritmo para mayor capacitación y algoritmo LR es el más eficiente y preciso, mientras que el algoritmo DT
evaluación para aumentar la precisión del modelo en tiempo real. logró el más bajo.
Iridodiagnóstico es un sistema predictivo en el que la enfermedad precisión.
se detecta a través de patrones de iris. Esto se usó para la detección de Shukla [18] usó un algoritmo LR, sacó un conjunto de datos que
diabetes a través del siguiente método. Los datos se recopilaron de mostraba que se obtendría la máxima precisión si se usaran parámetros
pacientes diabéticos y no diabéticos en los que se realizó un como la glucosa, el índice de masa corporal (IMC) y los embarazos, que
preprocesamiento. La siguiente parte se denomina segmentación de se representaron en forma de gráfico de barras. , como se muestra en la
imágenes, en la que el iris del ojo se separa de la imagen en el conjunto Fig. 2. El autor también intentó mostrar que la enfermedad depende
de datos. predominantemente de aquellas características que nos parecen escasas
La normalización se realiza en la que el iris circular se convierte en un pero que los médicos han señalado como relevantes y que posiblemente
rectángulo mediante el mapeo polar. Luego se realiza la extracción de conduzcan a un mayor riesgo de enfermedades posteriores. El modelo
características en esta imagen final. Se utiliza una matriz de coocurrencia LR entrenado con las características dominantes mostró una precisión
de nivel de gris para caracterizar las imágenes, que es un proceso para del 82,92%. Para el pronóstico del modelo, 0.458 fue la probabilidad de
examinar la textura. Este proceso asigna números del 1 al 8 a las áreas clase cero y 0.572 para la clase uno, que estima la probabilidad de que
de las imágenes calculando con qué frecuencia aparecen en la imagen una persona sea diabética.
pares de píxeles con valores específicos y en una relación espacial
específica. Dalakleidi et al. [19] usó dos conjuntos de datos llamados PID, Caso
En esta matriz, las características como el contraste, la correlación, la 1 e Hippokrateion, que es el Caso 2 en el que el PID se divide en 50 %
disimilitud, la homogeneidad, la varianza y la entropía son las para entrenamiento y 50 % para prueba, mientras que Hippokrateion
características pertinentes para proporcionar datos de alta calidad. tiene una bifurcación de 70 % para entrenamiento y los otros 30 % para
Estos son solo algunos de los autores entre muchos que han las pruebas. Utilizaron regresión logística binaria (BLM), algoritmo de
contribuido a la literatura en este campo. A continuación, se proporciona árbol modelo logístico (LMT), que es una combinación de aprendizaje
un estudio detallado de la metodología utilizada por otros investigadores LR y DT en modelos simples. El rendimiento del modelo se midió
en este campo. utilizando la precisión de clasificación (ACC) y el área bajo la curva
(AUC). BLM logró un ACC de 80,47 y AUC de 0,85, mientras que LMT
Aprendizaje automático en la detección de logró un ACC de
diabetes El aprendizaje automático es un método mediante el cual un
sistema computacional aprende las características de los datos de
entrada. Dichos métodos han demostrado su eficacia para la detección de la diabetes.
Se han desarrollado muchos algoritmos de aprendizaje automático,
incluidos métodos de aprendizaje supervisado, no supervisado y de
refuerzo. Evidentemente, esto es práctico porque los métodos de
aprendizaje automático se basan en datos. Con cantidades tan masivas
de datos ingresados en la base de datos, el aprendizaje automático
puede ahorrar un esfuerzo humano considerable. Los modelos se
entrenan con estos datos y proporcionan la salida más adecuada en
función de los datos de entrada. Los modelos se pueden entrenar en
cualquier parámetro que sea factible para la practicidad y los requisitos
médicos. Algunos pueden examinar las características faciales, mientras
que otros buscan datos de informes de sangre obtenidos de pacientes.
Debido a que hay muchos síntomas de la enfermedad, los parámetros
varían en consecuencia. Con muchos métodos propuestos, los Fig. 1 Resultados de la clasificación de SVM, KNN, NB, DT y LR en forma
de verdadero positivo (TP), falso positivo (FP), verdadero negativo (TN) y
investigadores probaron varios algoritmos y ajustaron numerosos
falso negativo (FN), que son los parámetros de la matriz de confusión [17 ]
hiperparámetros para
no eran. El mejor resultado se logró utilizando el algoritmo de
RF con una precisión del 99 %. Por lo tanto, es un algoritmo
eficaz para un conjunto de datos recién creado. La Figura 4
muestra exactamente cómo se desempeñó cada algoritmo en
el modelado y la predicción.
harris et al. [21] realizó un diagnóstico clínico para la
detección de diabetes mellitus no dependiente de insulina
(NIDDM) mediante regresión lineal ponderada. La relación
entre la prevalencia de la retinopatía y la duración de la
Fig. 2 El peso de cada una de las características que arrojan la variable NIDDM se determinó según los años individuales de duración
resultado [18] y se evaluó mediante una regresión lineal ponderada con
pesos para los datos de cada año inversamente proporcionales
a la varianza binomial. El autor afirmó que la condición de
77,6 y AUC de 0,84 en el Caso 1. En el Caso 2, el BLM retinopatía es un parámetro importante para el diagnóstico
superó al LMT con un ACC de 93,45, mientras que el LMT precoz de la enfermedad. Por lo general, aparece casi 4 a 7
tuvo un ACC de 92,86. años antes del diagnóstico clínico de la enfermedad. La figura
islam et al. [20] utilizó varios algoritmos para analizar un 5 proporciona un gráfico preciso de los resultados obtenidos.
conjunto de datos utilizando los algoritmos NB y LR, así como
el algoritmo RF, después de aplicar técnicas de evaluación Ameena y Ashadevi [22] utilizaron el lenguaje R para
de división porcentual y validación cruzada de 10 veces. construir un modelo en SVM, DT, RF y LR. Utilizaron un
La Figura 3 muestra su arquitectura propuesta. El conjunto conjunto de datos de 768 mujeres, todas mayores de 20 años.
de datos contenía registros de 520 personas a las que se les Utilizaron las siguientes características: IMC, azúcar en
preguntó por las posibles razones de la diabetes. Después sangre, número de embarazos y función de pedigrí de
del procesamiento previo de datos, hubo un total de 314 diabetes. Se definen dos clases: 1, que afirma la diabetes y 0
valores positivos y 186 valores negativos. Los valores positivos para la negación. En una comparación de las precisiones, el
representan que la persona es diabética y los negativos implican qautor
ue concluyó que el algoritmo RF
Fig. 3 Arquitectura propuesta del sistema de detección [16]
Tabla 1 Tabla de comparación obtenida para el modelo KNN y
DT en conjuntos de datos preprocesados y otros sin
preprocesamiento [23]
Datos KNN (k = 2) DT
Con preprocesamiento 0.9545 0.936
Sin preprocesamiento 0.9318 0.9434
pliegues Se utilizaron medidas de precisión, medida F,
recuperación, precisión y ROC. Los atributos utilizados fueron la
concentración de glucosa, la presión arterial, el IMC, la edad, el
grosor de los pliegues cutáneos, el número de embarazos, la
Fig. 4 Rendimiento de cada algoritmo en el conjunto de datos recién
concentración de insulina a las 2 h, la función genealógica y la
adquirido [20] clase 0 o 1. En el modelado, los autores calcularon que el RN
mostró el máximo precisión con 586 instancias correctamente
identificadas. La siguiente Fig. 6 muestra los diferentes tipos de
mostró las máximas estimaciones correctas, con una precisión clasificadores utilizados junto con el número de instancias clasificadas.
de casi el 77% en comparación con los otros modelos. Ahuja et al. [25] utilizaron el conjunto de datos de la UCI que
Daanouni et al. [23] usó KNN y el algoritmo DT en dos conjuntos contiene 768 registros de mujeres en los que 500 eran diabéticos,
de datos, el primero con 2000 instancias y el segundo con 768. mientras que los 268 restantes no lo eran. Los autores utilizaron
Usaron ocho características o atributos para entrenar el modelo, ocho características para la clasificación y aplicaron una técnica
como el IMC, la glucosa, el azúcar en la sangre y el embarazo. de selección de características, que es el análisis discriminante
Los autores utilizaron el 80% para entrenamiento y el 20% restante lineal (LDA), para extraer las características importantes requeridas
para pruebas. Utilizaron hiperparámetros optimizados para reducir para la clasificación. Utilizaron cinco tipos de clasificadores para
la pérdida. Los resultados se grafican en dos tipos de datos: el aprendizaje automático, incluidos SVM, DT, LR, RF y un
preprocesamiento y sin. La comparación de resultados se realizó perceptrón multicapa. Los autores utilizaron cuatro parámetros
mediante una curva operativa del receptor (ROC). El autor para la evaluación, incluida la exactitud, la precisión, el recuerdo
concluyó que KNN tiene una precisión máxima del 97,53 % y un y la puntuación F. Sobre la base de estos parámetros, los autores
AUC de 0,9689. La Tabla 1 muestra una tabla de comparación de concluyeron que el perceptrón multicapa produce los mejores
las precisiones obtenidas para entrenar el modelo utilizando el resultados. La Tabla 2 menciona los resultados utilizando
clasificador KNN. diferentes valores de validación de kfold.
Alehegn et al. [26] utilizó el conjunto de datos de diabetes indio
Sisodia D y Sisodia DS [24] utilizaron tres clasificadores, PIMA con ocho características para entrenar y el conjunto de
incluidos SVM, NB y DT. La clasificación se realiza en el conjunto datos del hospital 130 D con una mayor cantidad de valores. Se
de datos de diabetes india de PIMA, que es el conjunto de datos utilizaron cuatro métodos de clasificación, incluidos los algoritmos
de diabetes india de PIMA tomado de la UCI. Para medir la RF, KNN, NB y J48DT. J48 es una versión mejorada del algoritmo
precisión, la validación cruzada interna fue 10 de clasificación Iterative Dichotomiser 3 (ID3). Se utilizó una
validación cruzada de 10 K para el 90 % de entrenamiento y el 10
% de prueba. El autor construyó un híbrido.
La figura 5 muestra cómo, en el momento del diagnóstico clínico de NIDDM, los Fig. 6 Diferentes algoritmos de clasificación resultan en modelos de
pacientes tenían la afección prevalente de retinopatía diabética. predicción donde NB supera a los otros dos
Tabla 2 Resultados de precisión de diferentes clasificadores a diferentes valores de validación kfold (%)
kdoblar Clasificador de vectores de soporte DT RF LR Perceptrón multicapa
k = 2 77.6 69 69,9 77.8 77.5
k = 4 77.6 69,9 70 77.6 78.7
k = 5 77.5 71.5 72,9 77.6 78.2
k = 10 77.5 69.5 70 77.6 77.6
modelo que consta de todos los algoritmos anteriores. El autor concluyó algoritmos para analizar cuál proporciona el máximo
que NB y J48 son buenos para grandes cálculos de datos, y el precisión.
clasificador KNN es mejor para conjuntos de datos más pequeños. La Daanouni et al. [23] utilizó ANN y DNN en dos conjuntos de datos de
Figura 7 muestra los diferentes algoritmos utilizados junto con las 2000 y 768 instancias. Incluían ocho atributos con la etiqueta de salida
instancias identificadas correcta e incorrectamente. como 1 para resultados positivos y 0 para resultados negativos. La red
fue entrenada en dos tipos de datos: preprocesados y no preprocesados.
Algunos trabajos más realizados por otros investigadores que se han El modelo DNN parece lograr una alta precisión tanto en los datos
mencionado en la Tabla 3. Contiene un estudio de los algoritmos de obtenidos, con una precisión del 98 % para el conjunto de datos
aprendizaje automático utilizados en los métodos. preprocesados como del 99,5 % para el conjunto de datos 1. En el
conjunto de datos 2, los datos no preprocesados tuvieron una precisión
Aprendizaje profundo en la detección de del 80,99 % y el otro 96,35%. Por lo tanto, los autores concluyeron que
diabetes El aprendizaje profundo es un campo computacional que DNN es un clasificador óptimo para la detección de diabetes.
generalmente está involucrado cuando se requiere un alto poder computacional.
El aprendizaje profundo se centra en las redes neuronales, sus tipos, Rakshit et al. [40] usó R, SQL y Python en un entorno de estudio de
épocas de entrenamiento, capas de entrada y salida ocultas. La capa aprendizaje automático de Microsoft Azure con el conjunto de datos de
de entrada es la primera capa, y las capas ocultas son responsables de diabetes PIMA, en el que el 80 % se usó para capacitación y el otro 20
todos los cálculos y manipulaciones, como circunvoluciones y agrupación. % para pruebas. Este conjunto de datos se refiere principalmente a la
La capa de salida determina el número de clases para la clasificación. diabetes en las mujeres. Este contiene ocho atributos que son
Debido a que el aumento de datos, lo que significa ajustar los datos para importantes para la construcción de modelos para una red neuronal de
aumentar la precisión, también está disponible en el aprendizaje clase 2. La figura 8 muestra la representación general de la red neuronal.
profundo, encuentra muchas aplicaciones con el entrenamiento de La capa oculta tenía 100 nodos, con la capa de salida conectada a la
imágenes. Cuantas más capas tiene la red, más es capaz de clasificar. enésima capa oculta. Con el modelo entrenado durante más de 1000
Debido a las muchas ventajas, se ha utilizado ampliamente en el campo épocas con una tasa de aprendizaje de 0,01, lograron una precisión del
de la medicina para calcular resultados con gran precisión. Existen 83,3 % en un conjunto de datos con 262 casos negativos y 131 casos
diferentes tipos de redes con las redes neuronales artificiales (ANN) más positivos.
competentes, redes neuronales profundas (DNN), CNN y RNN. Muchos
investigadores que trabajan para la detección de una enfermedad Sapón et al. [41] presentó la predicción de la diabetes mediante ANN
comparan el aprendizaje automático y el aprendizaje profundo supervisadas. El conjunto de datos comprende aproximadamente 250
pacientes con 27 variables o características, donde exactamente el 50
% se usó para entrenamiento, mientras que el 50 % restante se usó
para probar con la herramienta MATLAB. Los algoritmos de gradiente
utilizados incluyeron el gradiente conjugado de FletcherPowell, el
gradiente conjugado de PolakRibiére y el gradiente conjugado escalado.
Estos algoritmos se usaron para entrenar el modelo y luego se analizaron
usando el coeficiente de correlación (CC) R. Los resultados de estos
algoritmos se trazan en diferentes épocas contra el error cuadrático
medio.
Con base en una comparación de los valores de R, los autores concluyen
que el gradiente conjugado escalado confirma la mayor precisión con
un valor de 0,88, seguido del gradiente conjugado de FletcherPowell
con un valor de 0,097219 y, finalmente, el conjugado de PolakRibiére
gradiente con 0.056466.
Fig. 7 Precisión de los algoritmos de clasificación en el conjunto de datos de diabetes referencias [31, 42] ambos realizaron la detección usando una ANN.
indio PIMA. El modelo híbrido propuesto muestra la máxima precisión
Árbitro. [42] usó el conjunto de datos de población india PIMA para
mujeres en Phoenix, mientras que [31] realizó este algoritmo
Tabla 3 Un estudio exhaustivo de los métodos de aprendizaje automático realizado por algunos investigadores
Algoritmo Método utilizado/innovación Aplicación y trabajo futuro Resultados y limitaciones (si se Referencias
especifica)
J48, El modelo se realizó en el conjunto de datos de la El autor afirmó que estos algoritmos de El algoritmo AdaBoost con el J48 como [27]

AdaBoost y Red de Vigilancia Centinela de Atención Primaria conjunto se pueden usar en otros conjuntos de clasificador base mostró la máxima precisión
embolsado de Canadá con varias funciones para entrenar. El datos de enfermedades para aumentar seguido por el embolsado y luego el clasificador
en el clasificador autor utilizó métodos de conjunto AdaBoost en el precisión. J48.
base clasificador base J48 DT. El AROC se utilizó como parámetro.
NB con El conjunto de datos utilizado fue el PIMA Al recopilar una gran cantidad de datos para el Los parámetros utilizados para la evaluación [28]

agrupamiento Indians Diabetes Dataset con ocho atributos. entrenamiento, la precisión se puede aumentar son la precisión, la sensibilidad y la
El modelo es NB realizado en agrupamiento muchas veces, ayudando a las personas a especificidad. El modelo con agrupamiento
previo. Este modelo se compara solo con el modelo desarrollar un sistema que les brinde una mostró un aumento del 10 % en la precisión, un
NB. Quinientos treinta y un casos de datos se predicción correcta sin tener que consultar a un aumento de la sensibilidad del 53,11 %, pero la
dividieron en 5 grupos. El cuarto grupo fue el único médico. limitación causada aquí fue la caída de la
que se usó para las pruebas, que constaba de 148 especificidad del 10,99 % y también una cantidad
instancias. reducida del conjunto de datos.
DT, LR y Los conjuntos de datos iniciales se recopilaron del modelo final obtenido con las unidades de Los siguientes datos muestran la [29]

NB con atención primaria, que (a través de una mayor precisión adicional
se
constaba die
mplementó en yu n
11 funciones cambio)
una
aplicación web precisión con embolsado y refuerzo.
embolsado comercial. datos de 30122 personas. Los tres algoritmos sy
e
ruefuerzo,
tilizan junto
que cson lpos
ara
mdétodos
isminuir
de
eel mbolsado
sobreajuste DT 85.090, LR 82.308, NB 81.010,
y refuerzo y aumentar la precisión. embolsado con DT (BG+DT) 85.333,
embolsado con LR (BG+LR) 82.318,
embolsado con NB (BG+NB) 80.960,
reforzado con DT (BT+DT) 84.098, reforzado
con LR (BT+LR) 82.312, y refuerzo con NB
(BT+NB) 81.019. RF 85.558 muestra la máxima
precisión.
El ROC se utilizó para la validación final.
LR, KNN, El autor recopiló un conjunto de datos sin procesar del hospital médico Noakhali que contiene El autor El clasificador RF fue el algoritmo que mejor [30]

SVM, LDA, propuso que podemos mejorar la precisión de las primeras
9843
por muestras
ciento con 14 atributos.
del tratamiento El ochenta
para disminuir el se desempeñó en la clasificación de datos y LR
NB, DT y sufrimiento de los datos se tomó para entrenar a los pacientes.
prueba.
Además,
Todos lpos
odemos
algoritmos
y el riesto
mplementan
para la mostró el peor desempeño. Aunque los
RF más clasificadores para recoger elegidos por el autor, se umodelos
saron para
epl recedentes
sin líder para la
cluego
y onstrucción de
la validación clasificadores de aprendizaje automático se usan
fue el rendimiento y se extendió para que se realizara automáticamente
de mación. en ellos usando kfold. análisis ampliamente, todavía carecen de precisión frente
a los modelos de aprendizaje profundo.
LR y DTs El conjunto de datos se elaboró mediante un Recientemente, muchos investigadores LR logró un ACC del 76,54 %, una [31]

cuestionario realizado a 1487 individuos de han estado implementando varios sensibilidad del 79,4 % y una especificidad del
los que 735 eran diabéticos y los 752 restantes algoritmos y redes para compararlos y encontrar 73,54 % en los datos de prueba, mientras que el
negativos. A todas las características se les realizó el más factible. Los DT y LR se encuentran entre DT obtuvo una precisión del 76,97 %, una
la prueba chicuadrado de Pearson. El rendimiento los más utilizados. sensibilidad del 78,11 % y una especificidad del
de los modelos se evaluó en tres parámetros: precisión, 75,78 %. En general, el modelo DT funcionó mejor
sensibilidad y especificidad. que el modelo LR.
El modelo plantea una limitación del conjunto
Aparte de esto, también se construyó una matriz de de datos. Se recopila solo de un área de China,
confusión para determinar el rendimiento del modelo. si se hubiera recopilado de diferentes regiones,
la implementación del modelo podría ser más
práctica.
El conjunto de datos anónimos de fusión de SVM y LR Practice fue LR es un modelo ampliamente utilizado en Al usar un subconjunto más pequeño de [32]

utilizado para el estudio tomado de Kaggle que salud pública y práctica clínica para la detección funciones, el modelo LR se desempeñó
contiene datos de aproximadamente 10000 de enfermedades y el cálculo de riesgos. ligeramente mejor que el modelo SVM.
pacientes. Las características se dividieron en línea
base, prueba de laboratorio, diagnóstico y
medicación. Para la tarea de clasificación se
desplegaron LR y SVM. El modelo LR se implementó
usando la función GLM y el SVM se usó en un
núcleo lineal.
El área bajo la ROC fue el parámetro utilizado para
la evaluación.
DT y NB El conjunto de datos considerado fue la base de datos de El autor propuso recopilar información Utilizando una división porcentual de 70:30, el [33]

diabetes india PIMA. Al aplicar la selección de para el conjunto de datos de diferentes algoritmo J48 DT clasificó correctamente 177
características, el autor obtuvo cinco características. personas para hacer un modelo más instancias (76,95 %), mientras que el NB obtuvo
Se usó una validación cruzada de 10 veces para la representativo. El trabajo puede mejorarse aún una precisión del 79,56 %. La precisión obtenida
preparación de datos, después de lo cual se usó el más para incluir se desempeñó mejor en la división porcentual, lo
algoritmo J48: DT y automatización. que muestra
Tabla 3 Un estudio exhaustivo de los métodos de aprendizaje automático realizado por algunos investigadores (Continuación)
especifica)
Se aplica NB. El rendimiento del modelo se evaluó los modelos no muestran una buena precisión
utilizando el error absoluto medio (MAE), el error en conjuntos de datos más grandes.
cuadrático medio (RMSE), el error absoluto relativo, el
error cuadrático relativo de la raíz y la estadística kappa.
Aumento de El autor utilizó el conjunto de datos de diabetes El autor sugiere el uso de más algoritmos en esta La precisión obtenida con el clasificador [34]

RF y XG PIMA. Usando Jupyter Notebook como un IDE, el autor rama del aprendizaje automático como modelo RF resultó ser del 71,9 %. El modelo híbrido
entrena el modelo usando 8 atributos del total de 9 híbrido para una mejor propuesto a través de XG boost obtuvo una
proporcionados en el conjunto de datos. Los algoritmos precisiones. precisión del 74,1 %.
utilizados fueron RF y XGBoost. Después de establecer Las precisiones obtenidas en los modelos fueron
los hiperparámetros, se entrenaron los modelos. comparativamente menores en comparación con
las ya disponibles. El ajuste de hiperparámetros
debe configurarse mejor para optimizar el algoritmo.
DT (J48) y El autor utilizó el conjunto de datos de diabetes india En el futuro, está previsto recopilar la información El algoritmo J48 tuvo una precisión del [33]

nótese bien
PIMA con 8 atributos, que se redujo a 5 según la de diferentes lugares del mundo y crear un 76,95 % con otros parámetros como la
selección de funciones. El preprocesamiento se realizó modelo profético más preciso y general para la estadística kappa, MAE, RMSE, error absoluto
utilizando WEKA utilizando una validación de 10 veces. conclusión de la diabetes. El estudio futuro relativo y error absoluto relativo raíz. El
El modelo se creó utilizando el conjunto de datos del 70 también se centrará en recopilar información de algoritmo NB tuvo una precisión de hasta el
% y el resto se utilizó para las pruebas. un período de tiempo posterior y descubrir nuevos 79,56 %. Dado que este modelo no está
elementos de pronóstico potenciales para configurado de manera óptima, un modelo
incorporar. El trabajo se puede ampliar y mejorar desarrollado requeriría más datos de entrenamiento
para la automatización del análisis de diabetes. para su creación y prueba.
Genético Este trabajo es un modelo que implementa los El trabajo propuesto ayuda a minimizar el costo A través de este enfoque de GA, la precisión [35]

algoritmos algoritmos genéticos y difusos para la predicción efectiva y aumentar la precisión y puede usarse en el aumentó hasta el 87 % y el costo de
con lógica de enfermedades. Para la implementación de GA se futuro para mejores implementaciones. capacitación se redujo en más de
difusa utilizó MATLAB R2006b. El principio de selección de 50%.
características se implementó utilizando algoritmos de
lógica difusa. En primer lugar, se realizó un mapeo
simultáneo basado en una medida de adecuación de
los valores de las variables a cada clase utilizando
funciones de pertenencia adecuadas según cada tipo
de característica. Luego, se propusieron mecanismos
simples de razonamiento difuso para tratar, de manera
unificada, la clasificación.
kNN, NB, Estos modelos se crearon en comparación Una aplicación de genoma completo para la detección de El modelo propuesto se evaluó sobre la base [36]

DT, RF, SVM diabetes tipo 2. Se tomaron un total de asociación y asociación
161
ffenomenal
ueron estudio
300 d
me
uestras
asociación
de las
en
ceuales
speranza de la exactitud, precisión, especificidad,
LR para su asociación diabética, 60 no diabética y el resto fueron
asociación
Ucsando
confirmado. on DM.
el R esultó ser
resumen ucn
de no
aracterísticas, sensibilidad y AUC. El algoritmo propuesto
se seleccionaron asociaciones importantes para futuras ocho características con los modelos. obtuvo un AUC de 0,98, que supera el AUC de
última generación de 0,71.
Herramienta WEKA utilizada. Estos algoritmos se
utilizaron contra un marco propuesto que extrae
automáticamente patrones de tipo 2
MD.
LR, DT, RF, El autor utilizó el conjunto de datos de mujeres indias El autor propuso crear modelos avanzados Se compararon diferentes modelos sobre la base [22]

MVS PIMA relacionado con la salud de las mujeres con 8 en RF debido a su mayor precisión y capacidad de la precisión. RF obtuvo la mayor precisión con
atributos. Se entrenaron diferentes modelos para este para superar el sobreajuste. un 77,06 %, seguida de SVM.
conjunto de datos bajo diferentes hiperparámetros.
DT – J48, RF El autor obtuvo un conjunto de datos de Luzhou del examen El autor esperaba poder predecir el tipo de diabetes Los algoritmos RF y J48 lograron una [37]

físico del hospital. Se tomó un conjunto de prueba utilizando un conjunto de datos que contenía los precisión del 73,95 % y el 73,88 %,
independiente con 13700 muestras. Los datos contenían datos necesarios, lo que supondría una ventaja respectivamente, en el conjunto de datos de
14 atributos. Otro conjunto de datos fue el conjunto de adicional para mejorar la precisión. Luzhou y del 71,44 % y el 71,67 %,
datos de diabetes india PIMA. El algoritmo DT y RF se respectivamente, en el conjunto de datos de PIMA.
implementaron en WEKA con análisis de componentes
principales.
Tabla 3 Un estudio exhaustivo de los métodos de aprendizaje automático realizado por algunos investigadores (Continuación)
especifica)
NB y SVM El conjunto de datos de pacientes de 500 registros se Clasificadores de este tipo pueden ayudar NB pudo clasificar correctamente el 74 % [38]

recopiló del instituto de atención médica para en la detección temprana de la vulnerabilidad de de las instancias. Para SVM, la precisión
la diabetes que tiene síntomas de enfermedad un paciente diabético a enfermedades del corazón. obtenida fue del 95,6 %.
cardíaca. El conjunto de datos contenía 9 atributos. Allí, los pacientes pueden ser advertidos
Ambos algoritmos se implementaron en el conjunto de cambiar su estilo de vida.
de datos WEKA. Para SVM, se utilizó un kernel de Esto se traducirá en la prevención de que los
función de base radial. pacientes diabéticos se vean afectados por
enfermedades del corazón, lo que resultará en
bajas tasas de mortalidad, así como la reducción
de los costos de salud para el estado.
DT, SVM, El autor utilizó el conjunto de datos indio PIMA. El beneficio de este modelo optimizado Los modelos se comparan sobre la base de [39]

RF KNN Luego, se realizó la normalización de datos de aprendizaje automático es que es adecuado la precisión, la sensibilidad y la especificidad.
seguida de la selección de características. para pacientes con DM y se puede aplicar a DT tiene una precisión del 78,25%.
todos los campos de los entornos de atención
médica.
en un modelo de cuestionario que contenía datos de 1487 personas Árbitro. [44] usó el conjunto de diabetes PIMA y calculó el modelo
con resultados positivos y negativos. Las características que usando una ANN y usó ocho características para modelar. El autor
siguieron siendo comunes para el modelado fueron el IMC, la explicó las diferentes funciones utilizadas para el preprocesamiento
edad, el peso, el estado civil, los embarazos y la ref. [31] recopilaron y entrenamiento de modelos. La función de activación era una
una gran cantidad de variables, como el consumo de alcohol, función sigmoidea, y se usa retropropagación para calcular el
carne, consumo de cigarrillos, variedad de bebidas y sus recuentos gradiente de la función de pérdida.
y la rutina de ejercicio y sueño. La función de error calculó el error final en aproximadamente un
Considerando la estructura de la ANN, ref. [31] tenía 8 % al final de la construcción del modelo. Los resultados fueron
aproximadamente 15 nodos ocultos, mientras que los mismos validados en ROC y RMSE. El autor logró un área ROC de 0.88 y
variaban de 0 a 5 en la ref. [42]. Árbitro. [31] logró un ACC de RMSE igual a 0.39, lo cual es un clasificador FAIR. La figura 9
73,52% frente a la ref. [42], quienes lograron una precisión del muestra los resultados representados en forma de líneas.
80,21 % en los datos de prueba.
Árbitro. [43] realizó un estudio comparativo de redes neuronales Árbitro. [29] usó una ANN para su modelo entrenado sobre un
en la detección de diabetes. Usando nuevamente el conjunto de conjunto de datos que consta de más de 30000 instancias y 11
diabetes indio PIMA, usaron las ocho características comunes características para entrenar. Con las capas ocultas igual a 12, los
requeridas para la preparación del modelo. Con los primeros 576 valores de las capas se calcularon usando la función sigmoidea.
casos utilizados para la prueba, utilizaron una técnica de validación Se implementaron métodos de ensacado y refuerzo. También se
cruzada de 10 veces para estimar los resultados. El autor utilizó configuró el embolsado para reducir la varianza en el modelo, y se
una red neuronal multicapa (MLNN) con 50 neuronas para cada realizó un refuerzo para reducir el error. La red neuronal con
capa oculta y una capa de salida que usa la función de activación bagging logró una precisión del 85,324 %, seguida del modelo
no sigmoidea y una PNN, que es una red neuronal probabilística ANN con boosting con una precisión del 84,815 % y luego la ANN
con una sola capa oculta. El autor concluyó sus resultados sobre con un 84,532 %. Finalmente, el autor valida la comparación final
la precisión, mostrando que el modelo MLNN logró una precisión utilizando un ROC.
de 79,62 y el PNN logró una precisión de 78,65.
Árbitro. [45] utilizaron técnicas de aprendizaje automático y
aprendizaje profundo para detectar DM. El conjunto de datos
utilizado aquí fue el conjunto de datos de diabetes indio PIMA que
consta de 768 funciones y ocho funciones para entrenar con un
total de 500 instancias que pertenecen a la clase no diabética y las
268 restantes, que son de clase diabética. El 60% de los datos se
seleccionó para entrenamiento y el 40% restante para prueba; se
utilizó una CNN. Se componen de tres capas, siendo la clasificación
realizada por la capa de salida. La precisión de predicción lograda
con el modelo fue del 76,81 %.
Algunos trabajos más realizados por otros investigadores que
Fig. 8 Representación general de una red neuronal, xm muestra los pesos de entrada e
se han mencionado en la Tabla 4. Contiene un estudio de los
yp son los pesos de salida
algoritmos de aprendizaje profundo utilizados en los métodos.
el modelo se ejecuta en procesos por lotes de automatización. Además,
dado que solo hay unos pocos conjuntos de datos de diabetes disponibles
en Internet; más datos públicos deberían estar disponibles para la
investigación. Se deben realizar más investigaciones utilizando la frecuencia
cardíaca, ya que requiere menos ancho de banda y su complejidad
computacional también es baja. También se pueden utilizar en la nube o en
dispositivos móviles. Las señales de frecuencia cardíaca también deben
usarse para detectar otras enfermedades cardíacas. En algunos casos, los
autores requerían un conjunto de datos de series temporales. Dado que no
están disponibles en ningún recurso en línea, es difícil replicar dicho trabajo.
Dichos modelos especiales requieren un ajuste extenso y grandes conjuntos
de datos tanto para el entrenamiento como para las pruebas.
La siguiente parte es la construcción de un modelo real.
Para lograr una precisión perfecta, se deben ajustar muchos parámetros.
Fig. 9 Los gráficos trazados entre el valor real mostrado por la línea azul y
los valores pronosticados mostrados por la línea roja Los estados aleatorios, el kernel, la cantidad de árboles, el ajuste de
hiperparámetros y varios otros se consideran al crear un modelo. La
selección de un algoritmo correcto con hiperparámetros adecuados también
Desafíos y alcance futuro Aunque debe realizarse con precisión. Algunos modelos de clasificación solo
son muchos los métodos y algoritmos que se han propuesto en el campo del entrenarán en un solo parámetro, lo que resulta en una menor precisión para
aprendizaje automático o aprendizaje profundo, aún quedan muchos el modelo en la detección en tiempo real. Es evidente del análisis de estos
desafíos, como mencionan los autores en sus trabajos. La primera esquemas en todas las clases que la mayoría de ellos sufren de un solo
preocupación que viene a la mente cuando se construye un modelo son los parámetro de entrada de datos o la selección de características no es óptima.
datos. referencias [32, 33, 49] fueron algunos de los autores que hicieron Junto con tales restricciones en los parámetros, pocos esquemas basados
referencia al problema. en clasificación dependen puramente de tipos de dispositivos de hardware,
Uno de los mayores problemas encontrados durante la encuesta de los lo que aumenta la dificultad de disponibilidad y adaptabilidad de estos
documentos fue encontrar artículos y documentos que no se relacionaban esquemas.
con el popular conjunto de datos indios PIMA. Este conjunto de datos se
eligió para garantizar que los modelos proporcionaran buenos resultados
debido al establecimiento del conjunto de datos. Un modelo de aprendizaje automático basado en la atención médica solo
Los conjuntos de datos son demasiado pequeños o inadecuados, o carecen es útil si se puede usar en beneficio de las personas. Aquí, el despliegue del
de datos en tiempo real. Los conjuntos de datos pequeños plantean un modelo en aplicaciones prácticas es fundamental. Muchos autores han
problema de sobreajuste en el modelo, que muestra una mayor precisión, propuesto implementar modelos en plataformas móviles. En las
pero no pueden manejar los datos de prueba más nuevos. implementaciones de la vida real, solo los ingenieros con antecedentes y
Por lo tanto, el modelo no es factible para la implementación en tiempo experiencia con servidores en la nube y DevOps pueden implementar
real. Algunos autores trabajaron con datos de CGM, que eran en tiempo modelos. En este proceso en curso, se deben considerar muchas cuestiones,
real, pero el entrenamiento del modelo con esos datos no fue eficiente. Los como la frecuencia con la que se deben mostrar las predicciones o la
conjuntos de datos también se seleccionaron de regiones particulares que cantidad de aplicaciones que se requieren para el procesamiento del modelo.
no son representativas de un sistema común. Aunque se tomaron precauciones considerables para garantizar que no
Diferentes regiones tienen diferentes personas y estilos de vida. hubiera discrepancias en el estudio, ningún estudio puede afirmar que es
En general, los investigadores pasan el 80 % de su tiempo limpiando y perfecto y siempre hay posibilidades de mejora. El desarrollo de un estudio
administrando datos para el entrenamiento de modelos. Por lo tanto, la más inquisitivo que proporcione una visión más profunda de los aspectos
que permiten el poder predictivo de los modelos en lugar de solo parámetros
complejidad de los datos conduce a costos y cargos de mantenimiento más elevados.
El siguiente paso es la selección de funciones. Mientras que algunos autores predefinidos como exactitud, precisión, puntaje F1, ROC y AUC sería
descuidaron algunas de las características, algunos las agruparon para un beneficioso en el futuro. Para la clasificación, para distinguir entre perfiles
entrenamiento factible. Cada conjunto de datos plantea el problema de tener diabéticos y normales, los esquemas basados en agrupaciones brindan
características apropiadas para satisfacer las necesidades de un único resultados precisos. Sin embargo, la mayoría de los algoritmos de
algoritmo. Una vez que todos los datos están disponibles, se finalizan las agrupamiento luchan con problemas de plugnplay, lo que significa que
pilas técnicas. Hay muchas herramientas disponibles para construir modelos generalmente contienen intervención humana durante la clasificación y el
de aprendizaje automático, pero también es necesario elegir un modelo para análisis, lo que implica la posibilidad de error.
optimizar el rendimiento. El siguiente desafío es la depuración. Esto se
vuelve fácil si se utilizan herramientas como Jupyter Notebooks donde el
código se divide en celdas. Esto se vuelve difícil cuando el
Tabla 4 Un estudio exhaustivo de los métodos de aprendizaje profundo realizado por algunos investigadores
Algoritmo Método utilizado/innovación Solicitud Resultados y limitaciones (si se Referencias
especifica)
Red neuronal El conjunto de datos utilizado fue el conjunto Como el autor compara su red con los métodos Los resultados de la red propuesta por el autor [46]

de creencias profundas de datos de diabetes india PIMA con 768 convencionales de clasificadores de aprendizaje y los métodos convencionales se observaron
instancias y 8 características. La función oculta automático y obtuvo resultados altos, cree que en tres parámetros: valor de recuperación,
de activación utilizada fue la unidad lineal esta red puede modificarse según la precisión y medida F1. Esta red obtuvo altos
rectificadora ReLU con tres capas ocultas y conveniencia y usarse también para la detección valores de recuperación, precisión y medida F1,
sigmoide como función de activación de entrada. de otras enfermedades. lo que demuestra que es un buen modelo.
El tamaño del lote en 100 y las épocas
establecidas en 5.
Memoria a El autor utilizó el conjunto de datos Direct Net El autor elaboró sobre las aplicaciones de la vida Se concluyó que el uso de LSTM para la [47]

corto plazo Inpatient Accuracy Study que contiene real al proponer implementar modelos LSTM en predicción del nivel de glucosa en sangre
(LSTM) redes aproximadamente 110 instancias. plataformas móviles, aplicaciones y servidores es prometedor. Los valores de RMSE obtenidos
neuronales – El modelo de red neuronal propuesto aquí tiene en la nube para que estén disponibles para las son 4,67 que es el mínimo y 29,12 el valor
RNN una capa LSTM. El modelo funciona para masas. máximo. Los datos faltantes son un problema
predecir los niveles de azúcar en la sangre. para el modelo, ya que si el paciente retira el
Para la cuadrícula de búsqueda, el autor tiene dispositivo CGM, el modelo debe ser entrenado
en cuenta las unidades LSTM, las unidades en un formato que pueda manejar
densas y las longitudes de secuencia. automáticamente los datos faltantes.
El parámetro tomado para evaluar el
desempeño del modelo es RMSE.
Modelo Los datos tomados fueron de seis individuos Los modelos ELM son fáciles de implementar El modelo se evaluó en tres parámetros: [48]

de predicción en el grupo de edad de 22 a 29 años. El modelo en cualquier aplicación de clasificación y pueden RMSE, CC y lapso de tiempo (TL) a diferentes
profunda de predicción profunda es un modelo de realizar aproximaciones para funciones concentraciones de glucosa para PH = 15, 30
múltiples capas que consta de predictores continuas; son ampliamente utilizados en este y 45 minutos con combinaciones de entrada
basados en datos que se alimentan con campo de investigación para implementar de tres tipos que involucran concentraciones
mediciones de glucosa y series temporales. La modelos eficientes. de glucosa y azúcar. Para todos los PH, los
primera parte son los modelos autorregresivos modelos lineales junto con ELM superan al
con entradas externas o ANN seguidos por la ANNELM logrando TL reducido, RMSE
máquina de aprendizaje extremo (ELM) y se dan reducido y CC aumentado.
las predicciones del nivel de glucosa. La
velocidad de aprendizaje de los ELM es muy
rápida y, además, son más fáciles de implementar.
Descomposición de El conjunto de datos se obtuvo del El autor propuso un modelo más preciso al Los parámetros considerados para [49]

modo empírico hospital de shanghai que contiene 174 tratarlo con datos en tiempo real o datos evaluar la precisión del desempeño fueron el
(EDM) y instancias. Los datos se utilizan para personalizados para dar mejores resultados. MAE y el RMSE. El MAE mide el error de
LSTM entrenar dos modelos: uno es LSTM y el otro es También se sugirió la implementación del modelo predicción y el RMSE da la desviación entre el
LSTM+EDM. Los LSTM son versiones mejoradas en clientes móviles. valor observado y el valor de verdad. Los
de RNN y EDM es un método de descomposición resultados se observan en un intervalo de tiempo
de señal adaptable para métodos no lineales y de 30, 60, 90 y 120 min.
no estacionarios. Las medidas de evaluación del
desempeño son MAE y RMSE.
Red El conjunto de datos sin procesar incluía dos El autor afirmó que este estudio sobre el uso El autor utilizó tres parámetros para la evaluación, [50]

convolucional instancias masculinas y cuatro instancias femeninas. de algoritmos DL en la predicción de series a saber, RMSE, ganancia temporal y energía
temporal con La selección de características se realizó en temporales ayudaría a los profesionales e normalizada de segundo orden. Los valores de
vainilla LSTM el conjunto de datos seguida del ajuste de investigadores a seleccionar modelos apropiados RMSE, ganancia temporal y energía fueron
hiperparámetros. La red LSTM utilizada tenía con parámetros pragmáticos. mucho más altos para el LSTM vainilla que para
3 capas ocultas con un tamaño igual a 50. El el TCN.
bloque TCN tiene 10 capas, cada una con un
factor de dilatación de 2 y un tamaño de kernel La limitación del modelo fue que no recopila
de 4. datos que impliquen un significado más profundo
para la salida personalizada.
ANA Conjunto de datos médicos tomado de la Debido a que las ANN logran una alta precisión, Para aumentar el rendimiento del modelo, se [30]

facultad de medicina de Noakhali que contiene el autor recomienda que usarlas para la agregó una capa oculta adicional y las épocas se
datos de 9483 pacientes con 14 características. predicción de modelos y la detección de aumentaron a 100. La precisión resultó ser del
El conjunto de datos se dividió en un 80 % para enfermedades sería una alternativa mucho mejor 95,14 % en los datos de prueba y del 96,42 % en
entrenamiento y el 20 % restante para pruebas. que otros modelos de ML. el entrenamiento.
Para ANN, el autor eligió la función de activación
SoftMax con seis capas ocultas. El entrenamiento El autor afirma que los modelos lograron
se realizó utilizando la función de activación de poca precisión porque los conjuntos de
ReLU con 25 épocas. datos más pequeños y la incapacidad
de los modelos para adaptarse a diversos
Tabla 4 Un estudio exhaustivo de los métodos de aprendizaje profundo realizado por algunos investigadores (Continuación)

especifica)
conjuntos de datos
LSTM y Bi El autor recopiló el conjunto de datos de pacientes El autor propuso el uso modelo para Los resultados se calcularon a [51]

LSTM (RNN) reales al monitorear su salud. El modelo fue medicamentos orales, plumas de insulina y el diferentes PH = 15, 30, 45 y 60 minutos.
entrenado y probado en 26 conjuntos de datos bombas CSII, que incorporan todas Al ejecutar los modelos para diferentes épocas
que contenían datos CGM en tiempo real. El Mediciones de CGM. de 100 a 2000 con una diferencia de 100, las
modelo consiste en una capa LSTM y una capa épocas número 900, 1300, 1500, 1700 fueron
BiLSTM cada una con 4 unidades, y tres capas las que mostraron una buena precisión y, por lo
completamente conectadas con 8, 64 y 8 tanto, se eligieron como número de época previa
unidades, respectivamente. Las épocas oscilaron al entrenamiento para niveles de PH particulares.
entre 100 y 2000. Los parámetros utilizados para
la evaluación fueron RMSE, CC y TL.
CNN Una predicción de riesgo puede Proporciona una base para la autogestión de la La precisión de predicción del modelo en los tres [52]

identificar con precisión el riesgo de la salud de los trabajadores del acero, facilita la conjuntos de datos fue del 94,5 %, 91,0 % y
enfermedad utilizando CNN. El estudio se asignación racional de recursos médicos y de 89,0 %, respectivamente, y el AUC fue de 0,950
basó en un grupo de trabajadores del acero salud y el desarrollo de servicios de salud, y (IC del 95 %: 0,938–0,962), 0,916 (IC del 95 %:
de alrededor de 5900. Se realizó una encuesta proporciona una base para que los departamentos 0,888–0,945), y 0,899 (IC 95%: 0,8590,939).
de investigación para obtener datos en tiempo gubernamentales tomen decisiones. Muestra que el modelo establecido puede
real sobre características como el sexo, la predecir con precisión el riesgo de diabetes tipo
edad, el historial de enfermedades, el estilo de 2 en los trabajadores del acero.
vida y los exámenes físicos. El modelo se evaluó
mediante ROC y área bajo la curva.
AlexNet y En este estudio, el autor desarrolló un modelo El autor sugirió usar este modelo híbrido Los resultados de las redes se compararon [53]

GoogleLeNet llamado IGRNet para detectar y diagnosticar la para predicciones futuras debido a su sobre diferentes funciones de activación. El
prediabetes de manera efectiva utilizando un desempeño eficiente. modelo IGRNet obtuvo una precisión del 85,6
electrocardiograma de 12 derivaciones que dura %, superior a la de cualquier otro modelo
5 s de 2251 datos de casos. Las redes neuronales utilizado para la comparación.
utilizadas se compararon con algoritmos de ML
tradicionales como SVM, RF y KNN.
DNN La recopilación de datos se recuperó del El sistema propuesto será de apoyo Las muestras de datos se dividieron en [54]

repositorio de aprendizaje automático de para el personal médico y también para la validación cruzada de 5 y 10 veces.
UCI: conjunto de datos de diabetes india gente común porque con una validación La precisión obtenida en este modelo para
PIMA. Para la red neuronal, el recuento de cruzada de cinco veces, la precisión fue cinco veces fue del 98,04 % y para diez veces
capas ocultas es 4. El número de neuronas en mayor que cualquier otro modelo y al fue del 97,27 %. Los resultados también se
las capas fue 12, 16, 16 y 14. compararlo con otros modelos establecidos analizaron a través de ROC y puntaje F1.
de autores, resultó ser ser el más alto.
LSTM y GRU El conjunto de datos utilizado incluía registros de Los modelos recibieron una alta precisión del 97 % Los modelos LSTM y GRU lograron mejores [55]

más de 14000 pacientes de 2010 a 2015. incluso con una secuencia de longitud tridimensional. resultados que MLP. Para dependencias más
Se usaron episodios para representar esas largas, LSTM superó mientras que en secuencias
medidas. Cada secuencia tenía 30 más cortas, GLU funcionó mejor. Obtuvieron
características. El conjunto de datos una precisión de más del 97%.
utilizado para entrenar los modelos LSTM y
GRU. Los resultados se compararon con los Debido a la falta de conjuntos de datos que
modelos MLP. estén más concentrados en la diabetes tipo 2,
puede ser difícil replicar este trabajo utilizando
diferentes conjuntos de datos.
Red de El autor utilizó el conjunto de datos de El autor propuso extender este trabajo para Los resultados del perceptrón se calcularon [56]

perceptrones diabetes indio PIMA. La ANN desarrollada aumentar aún más la precisión para ayudar en para 10 ejecuciones durante 150 épocas.
multicapa contiene 4 capas para la red MLP que tiene la predicción temprana de la diabetes. La precisión promedio más alta la obtuvo la
81281 nodos. Se formaron tres redes más con red que tiene los nodos 81281281, seguida
los nodos 832321, 864641 y 81281281. de 864641 y luego 832321.
Con la función de activación de ReLU en la
capa de entrada y las capas ocultas, la capa de
salida es sigmoide.
Algoritmo ELM Los datos se adquirieron de múltiples El objetivo de esta investigación fue el El enfoque propuesto demostró ser eficiente. [57]

fuentes, incluidos laboratorios estudio del tratamiento de la diabetes en El objetivo era reducir la FP y la FN y aumentar
médicos, hospitales y conjuntos de datos el cuidado de la salud utilizando big data la precisión y las tasas de recuperación, lo cual
públicos. El conjunto de datos fue y aprendizaje automático. Presenta un gran fue logrado por el autor.
preprocesado y estaba destinado a incluir 12 sistema de procesamiento de datos empleando
Tabla 4 Un estudio exhaustivo de los métodos de aprendizaje profundo realizado por algunos investigadores (Continuación)
especifica)
atributos importantes que afectan a la un algoritmo ELM.
diabetes. ELM tiene una capacidad de
entrenamiento más rápida. Se utilizaron 320
muestras para entrenamiento y 480 para
entrenamiento.
Red neuronal El autor obtuvo un conjunto de datos de Luzhou El autor espera predecir el tipo de diabetes La red neuronal obtuvo una precisión [37]

del examen físico del hospital. Se sacó un utilizando un conjunto de datos que es una guía del 74,14 % en el conjunto de datos de Luzhou
conjunto de prueba independiente con 13700 para mejorar la precisión. y del 74,75 % en el conjunto de datos indio de
muestras. PIMA con el uso del análisis de componentes
Los datos contenían 14 atributos. principales.
Otro conjunto de datos fue el conjunto de datos
de diabetes india PIMA. Este método es una
red de dos capas con neuronas sigmoideas
ocultas y de salida SoftMax.
CNN El conjunto de datos utilizado por el autor se Fuzzification demuestra ser de naturaleza útil La red neuronal con valor de α = 2 se [58]

tomó del Instituto Nacional de Diabetes, que ya que proporciona diversos datos desempeñó mejor con valor de α 5. CNN se
consta de nueve parámetros. para entrenar. desempeñó mejor que ambos.
La fuzzificación se realizó en el conjunto de
datos de CNN que se completa.
Los valores α de la red neuronal fueron 2 y
5. Estas redes se compararon con una CNN.
Teniendo en cuenta todos los desafíos anteriores, todavía se puede Se han discutido métodos, comenzando desde diferentes algoritmos
considerar que se pueden superar en el futuro. Los académicos y los básicos como LR, SVM, DT, hasta una clasificación adicional que
médicos continuarán trabajando para construir conjuntos de datos incluye ID3, C4.5, C5.0, J48 y CART y NB. Los métodos de conjunto,
mejores y más grandes y diseñar modelos y algoritmos más eficientes como el embolsado, el refuerzo y los regresores de RF, se utilizan aún
para una mejor clasificación y precisión. Cualquiera de las más para mejorar la precisión y el rendimiento de los modelos. Estas
enfermedades que ocurren a gran escala, como la diabetes, puede técnicas se han implementado en todo tipo de plataformas como
controlarse mediante técnicas de inteligencia artificial y automatización. Python o MATLAB, y los modelos se han analizado utilizando diferentes
Se pueden crear modelos eficientes de última generación basados en parámetros como el área bajo la curva o matrices de confusión o
estudios que proporcionen una detección temprana de la diabetes y términos matemáticos como el RMSE o el MAE. El aprendizaje
que puedan ayudar a las personas a cambiar aún más su estilo de automático se ha introducido en los sistemas de diagnóstico médico,
vida. Debido a que el aprendizaje profundo funciona mejor en la ya que ha demostrado ser preciso en la detección, exitoso en la
mayoría de los conjuntos de datos, debe combinarse con diferentes aplicación a los tratamientos y más rentable. Aunque los anteriores
algoritmos para lograr una mayor precisión y rendimiento. Los son clasificadores muy fuertes, creemos que el aprendizaje profundo,
esquemas híbridos juegan un papel importante en la mejora del que es un subconjunto del aprendizaje automático, puede aprender
rendimiento de los modelos. A través de la detección temprana, los grandes cantidades de datos no estructurados y sin etiquetar.
pacientes pueden ser tratados mucho antes para evitar mayores
riesgos de problemas cardíacos en casos de diabetes. Cualquier
modelo que se pueda implementar en plataformas móviles debe Los modelos de aprendizaje profundo son más complejos y precisos.
atender a las masas en busca de su ayuda y ser representativo. Una Los diferentes modelos para el aprendizaje profundo comienzan desde
implicación de esta encuesta es que los modelos de aprendizaje las ANN más básicas hasta las redes convolucionales y las RNN
automático que han arrojado resultados eficientes pueden ser utilizados adicionales, incluidas LSTM y BiLSTM. También se han discutido las
por futuros investigadores para pulir y mejorar aún más, así como para redes de creencias temporales y profundas. Por el contrario, el
crear una tubería o un conjunto de modelos correctos y eficientes para aprendizaje profundo implica algunas deficiencias, como el aumento
aumentar las posibilidades de predecir la enfermedad. con aún más del tiempo de cálculo, los recursos y el ajuste frecuente de los
probabilidad. Dichos modelos se pueden improvisar aún más para parámetros. El aprendizaje profundo funciona mejor en conjuntos de
automatizar el sistema creado para que pueda manejar datos más datos de imágenes; por lo tanto, para el diagnóstico de diabetes, las
nuevos sin problemas. imágenes serían mejores. La mayoría de los investigadores han
implementado varios algoritmos tanto en el aprendizaje automático
Conclusiones como en el profundo para comparar su desempeño en los datos,
La diabetes puede ser devastadora después de un cierto período si no mientras que otros han combinado dos o tres métodos para obtener
se detecta o diagnostica correctamente. Muchos aprendizaje automático más precisión en un solo sistema.
Los investigadores, los médicos clínicos y la gente de la (eds) Ciencias de la computación ICCS 2004. 4ª conferencia internacional, Cracovia,
industria creen ampliamente que la inteligencia artificial tiene Polonia, junio de 2004. Apuntes de conferencias sobre ciencias de la computación, vol 3039.
Springer, Berlín, Heidelberg, págs. 11181125. https://doi.org/10.1007/978354 0259442_145
el poder de alterar las situaciones actuales de medicación Lassi M, Sonnenwald DH (2010) Identificación de factores que pueden afectar la adopción y el
tardía y detección debido a errores humanos. La 4. uso de un laboratorio de ciencias sociales: una síntesis de investigaciones previas. Inf Res15(3)
automatización tiene la capacidad de construir sistemas de
detección médica eficientes y confiables. El aprendizaje 5. Bonfiglio S (2012) El papel de las TIC en un cuidado de la salud que pasa de ser “centrado en la
automático, a través de sus potentes modelos predictivos y clínica” a “centrado en el paciente”. En: Donnelly M, Paggetti C, Nugent C, Mokhtari M (eds)
de clasificación, juega un papel importante para ayudar a conseguirlo.Análisis de impacto de soluciones para la prevención y gestión de enfermedades crónicas.
Décima conferencia internacional sobre hogares inteligentes y telemática de la salud, junio de
abreviaturas 2012. Apuntes de conferencias sobre informática, vol 7251. Springer, Berlín, Heidelberg, págs.
250253. https://doi.org/10.1007/9783642307799_37 6. Poston RS, Reynolds RB, Gillenson
ÓPTICA: Puntos de ordenación para identificar la estructura del racimo; DBSCAN: agrupación
ML (2006) Soluciones tecnológicas para
espacial de aplicaciones basada en la densidad; DM: Diabetes mellitus; BIRCH: Algoritmo de
mejorar la precisión y disponibilidad de los registros de atención médica. Inf Syst Manag
agrupamiento y reducción iterativo equilibrado que utiliza jerarquías; LSTM: memoria a largo
24(1):59–71. https://doi.org/10.1080/10580530601038097 7. Duan L, Street WN, Xu E (2011)
plazo; ID3: dicotomizador iterativo 3; SVM: máquina de vectores de soporte; KNN: Kvecinos
más cercanos; VP: Verdadero positivo; TN: Verdadero negativo; Sistemas de información de atención médica: métodos de extracción de datos en la creación de un
FP: falso positivo; FN: falso negativo; BLM: regresión logística binaria; sistema de recomendación clínica. Enterp Inf Syst 5(2):169–181. https://doi.org/
10.1080/17517575.2010.541287 Saiti K, Macaš M, Štechová K, Pithová P, Lhotská L (2017) Una
LMT: algoritmo de árbol del modelo logístico; ACC: La precisión de la clasificación;
8. revisión de la predicción de modelos en diabetes y del diseño de reguladores de glucosa basados
AUC: Área bajo la curva; LDA: análisis discriminante lineal; RNA: Red neuronal artificial;
RNN: Red neuronal recurrente; CNN: red neuronal convolucional; DNN: red neuronal en el control predictivo de modelos para el páncreas artificial. En: Bursa M, Holzinger A, Renda
profunda; MAE: Error absoluto medio; ME, Khuri S (eds) Tecnología de la información en informática biológica y médica. 8° congreso
CC: Coeficiente de correlación; TL: Retardo de tiempo; ROC: curva de funcionamiento del receptor; internacional ITBAM 2017, agosto 2017. Apuntes de cátedra en informática, vol 10443. Springer,
ELM: máquina de aprendizaje extremo; NIDDM: Diabetes mellitus no insulinodependiente; Cham, pp 1119. https://doi.org/10.1 007/9783319642659_6 Haritha R, Sureshbabu D,
IMC: índice de masa corporal; DT: Árbol de decisión; LR: regresión logística; Sammulal P (2019) Detección de diabetes mediante análisis de componentes principales y redes
neuronales. En: Santosh KC, Hegadi RS (eds) Tendencias recientes en procesamiento de
RF: bosque aleatorio; NB: Naïve Bayes; MLNN: red neuronal multicapa;
9. imágenes y reconocimiento de patrones.
RMSE: error cuadrático medio; EDM: Descomposición modal empírica
Agradecimientos Los
Segunda conferencia internacional, RTIP2R 2018, diciembre de 2018.
autores agradecen al Departamento de Ingeniería Electrónica y de Comunicaciones de la
Universidad de Nirma y al Departamento de Ingeniería Química de la Facultad de Tecnología Comunicaciones en informática y ciencias de la información, vol 1036. Springer, Singapur.
de la Universidad de Energía Pandit Deendayal por el permiso para publicar esta https://doi.org/10.1007/9789811391842_24 10. Chen Q, Alrowais R, Burhan M, Ybyraiymkul
investigación. D, Shahzad MW, Li Y et al (2020)
Un sistema de desalación solar autosostenible mediante tecnología de pulverización directa.
Contribuciones de los autores Energía 205:118037. https://doi.org/10.1016/j.energy.2020.118037 11. Kunekar
Todos los autores hacen contribuciones sustanciales a este manuscrito; TS y MS participaron PR, Gupta M, Agarwal B (2019) Detección y análisis del estilo de vida
en la redacción del manuscrito; TS escribió el manuscrito principal; todos los autores enfermedades basadas en la fase temprana de la vida: una encuesta. En: Somani AK,
discutieron los resultados y la implicación en el manuscrito en todas las etapas. Los autores Ramakrishna S, Chaudhary A, Choudhary C, Agarwal B (eds) Tecnologías emergentes en
leyeron y aprobaron el manuscrito final. ingeniería informática: microservicios en análisis de big data. Segunda conferencia internacional
ICETCE 2019, febrero de 2019. Communications in computer and information science, vol 985.
Springer, Singapur. https://doi. org/10.1007/9789811383007_6 12. Cahn A, Shoshan A, Sagiv
Financiamiento No aplicable. T, Yesharim R, Goshen R, Shalev V et al (2020)
Predicción de progresión de prediabetes a diabetes: desarrollo y validación de un modelo de
Disponibilidad de datos y materiales Todos
aprendizaje automático. Diabetes Metab Res Rev 36(2): e3252. https://doi.org/10.1002/dmrr.3252
los datos y materiales pertinentes se presentan en el documento principal.
Declaraciones 13. Thenappan S, Rajkumar MV, Manoharan PS (2020) Predicción de la diabetes
mellitus utilizando una máquina de vector de soporte modificada con seguridad en la nube.
IETE J Res. https://doi.org/10.1080/03772063.2020.1782781. (en prensa)
Conflicto de intereses Los
autores declaran que no tienen conflictos de intereses. 14. Bai BGM, Nalini BM, Majumdar J (2019) Análisis y detección de diabetes utilizando técnicas de
minería de datos: una aplicación de big data en el cuidado de la salud. En: Shetty NR, Patnaik
Detalles del autor LM, Nagaraj HC, Hamsavath PN, Nalini N (eds) Investigación emergente en computación,
1 información, comunicación y aplicaciones, vol 882. Springer, Singapur
Departamento de Electrónica y Tecnología de la Comunicación, Universidad de
2
Nirma, 382481 Ahmedabad, Gujarat, India. Departamento de Química
Ingeniería, Escuela de Tecnología, Universidad de Energía Pandit Deendayal, 382426 15. Shu T, Zhang B, Tang YY, Chengdu IEEE (2018) 1518 de julio de 2018. https://doi. org/10.1109/
Gandhinagar, Gujarat, India. ICWAPR.2018.8521271 16. Islam MT, Raihan M, Farzana F, Aktar N, Ghosh P, Kabiraj S
(2020) Típico
Recibido: 9 abril 2021 Aceptado: 29 octubre 2021 y predicción de enfermedades diabéticas atípicas utilizando un algoritmo de bosque aleatorio.
En: Resúmenes de la 11.ª conferencia internacional sobre tecnologías informáticas,
de comunicación y de redes, IEEE, Kharagpur, 13 de julio de 2020. https://doi.org/10.1109/
Referencias 1. ICCCNT49239.2020.9225430 17. Choudhury A, Gupta D (2019) Una encuesta sobre el
Nakahara T, Hyogo H, Yoneda M, Sumida Y, Sumida Y, Fujii H et al (2013) diagnóstico médico de la diabetes utilizando técnicas de aprendizaje automático. En: Kalita J,
La diabetes mellitus tipo 2 se asocia con la gravedad de la fibrosis en pacientes con Balas VE, Borah S, Pradhan R (eds) Desarrollos recientes en aprendizaje automático y
enfermedad del hígado graso no alcohólico en una gran cohorte retrospectiva de pacientes análisis de datos. Avances en sistemas inteligentes y computación, vol 740. Springer,
japoneses. J Gastroenterol 49(11):1477–1484. https://doi.org/10.1 007/s0053501309111 Singapur, pp 67–78. https://doi.org/10.1007/9789811312809_6 _
2. Solanki P, Baldaniya D, Jogani D, Chaudhary B, Shah M, Kshirsagar A (2021)
Inteligencia artificial: nueva era de transformación en el upstream del petróleo. Pet Res (en 18. Shukla AK (2020) Pronóstico de diabetes del paciente basado en el enfoque de aprendizaje
prensa). https://doi.org/10.1016/j.ptlrs.2021.07.002 3. Duplaga M (2004) El impacto de la automático. En: Pant M, Sharma TK, Arya R, Sahana BC, Zolfagharinia H (eds)
tecnología de la información en la calidad de los servicios de salud. En: Bubak M, van Albada GD, Sloot Computación blanda: teorías y aplicaciones. Avances en sistemas inteligentes y computación,
PMA, Dongarra J vol 1154. Springer, Singapur
19. Dalakleidi KV, Zarkogianni K, Karamanos VG, Thanopoulou AC, Nikita KS 37. Zou Q, Qu KY, Luo YM, Yin DH, Ju Y, Tang H (2018) Predicción de la diabetes
(2013) Un algoritmo genético híbrido para la selección de las características críticas para la mellitus con técnicas de aprendizaje automático. Frente Genet 9:515. https://doi. org/10.3389/
predicción del riesgo de complicaciones cardiovasculares en pacientes con diabetes tipo 2. En: fgene.2018.00515 38. Parthiban G, Srivatsa SK (2012) Aplicación de métodos de aprendizaje
Abstracts of the 13th IEEE international conference on BioInformatics and BioEngineering, Chania, automático en
1013 de noviembre de 2013. https://doi.org/10.1109/BIBE.2013.6701620 20. Islam MMF, Ferdousi diagnóstico de enfermedades del corazón para pacientes diabéticos. Int J Appl Inf Syst 3(7):25–30.
R, Rahman S, Bushra HY (2020) Predicción de probabilidad de diabetes en etapa temprana https://doi.org/10.5120/ijais12450593
utilizando técnicas de minería de datos. En: Gupta M, Konar D, Bhattacharyya S, Biswas S (eds) Visión 39. Challa M, Chinnaiyan R (2019) Enfoque de aprendizaje automático optimizado para
artificial e inteligencia artificial en el análisis de imágenes médicas. Avances en sistemas inteligentes y la predicción de la diabetes mellitus. En: Smys S, Tavares JMRS, Balas VE, Iliyasu AM (eds) Visión
computación, vol 992. Springer, Singapur, pp 113–125. https://doi.org/10.1007/9789811387982_12 computacional y computación bioinspirada. ICCVBIC 2019.
_ Avances en sistemas inteligentes y computación, vol 1108. Springer, Cham, pp 321–328. https://
doi.org/10.1007/9783030372187_37
40. Rakshit S, Manna S, Biswas S, Kundu R, Gupta P, Maitra S y otros (2017)
21. Harris MI, Klein R, Welborn TA, Knuiman MW (1992) El inicio de la NIDDM ocurre al menos 4 a 7 años Predicción de diabetes tipo II utilizando una red neuronal de dos clases. En: Mandal JK, Dutta P,
antes del diagnóstico clínico. Cuidado de la diabetes 15(7):815–819. https://doi.org/10.2337/ Mukhopadhyay S (eds) Inteligencia computacional, comunicaciones y análisis empresarial. Primera
diacare.15.7.815 _ 22. Ameena RR, Ashadevi B (2020) Análisis predictivo de mujeres diabéticas conferencia internacional, CICBA 2017, marzo de 2017. Communications in computer and
information science, vol 776. Springer, Singapur, 6571. https://doi.org/10.1007/9789811064302_6
pacientes usando R. En: Peter JD, Fernandes SL (eds) Simulación y modelado de sistemas para _ 41. Sapon MA, Ismail K, Zainudin S (2011) Predicción de la diabetes mediante el uso
computación en la nube y aplicaciones de big data. Elsevier Inc., Ámsterdam. https://doi.org/
10.1016/B9780128197790.00006X
23. Daanouni O, Cherradi B, Tmiri A (2019) Predicción de enfermedades diabéticas usando Red neuronal artificial. En: Resúmenes de la conferencia internacional de 2011 sobre circuitos,
datos mixtos y algoritmos de aprendizaje automático supervisado. En: Resúmenes de la 4.ª conferencia sistemas y simulación IPCSIT vol. 7, IACSIT Press, Singapur, 28 de mayo de 2011 42. Shanker MS
internacional sobre aplicaciones de ciudades inteligentes, ACM, Casablanca, 24 de octubre de 2019. (1996) Uso de redes neuronales para predecir la aparición de diabetes mellitus. J Chem Inf Comput Sci
https://doi.org/10.1145/3368756.3369072 24. Sisodia D, Sisodia DS (2018) Predicción de diabetes 36(1):35–41. https://doi.org/10.1021/ ci950063e
usando clasificación
algoritmos Procedia Comput Sci 132: 1578–1585. https://doi.org/10.1016/j. procs.2018.05.122 43. Temurtas H, Yumusak N, Temurtas F (2009) Un estudio comparativo sobre
Diagnóstico de enfermedades diabéticas mediante redes neuronales. Aplicación de sistema
25. Ahuja R, Sharma SC, Ali M (2019) Un modelo de predicción de enfermedades diabéticas basado en experto 36(4): 8610–8615. https://doi.org/10.1016/j.eswa.2008.10.032 44. Kumar A, Gupta PK,
algoritmos de clasificación. Ann Emerg Technol Comput 3 (3): 44–52. https://doi.org/10.33166/ Srivastava A (2020) Una revisión de las tecnologías modernas para abordar la pandemia de COVID19.
AETiC.2019.03.005 _ 26. Alehegn M, Joshi RR, Mulay P (2019) Análisis y predicción de la diabetes Diabetes Metab Syndr: Clin Res Rev 14(4): 569–573. https://doi.org/10.1016/j.dsx.2020.05.008 45.
utilizando bosques aleatorios, KNN, Naïve Bayes y J48: un enfoque conjunto. Int J Sci Technol Res 8(9):1346– Yahyaoui A, Jamil A, Rasheed J, Yesiltepe M (2019) Una decisión de apoyo
1354 27. Perveen S, Shahbaz M, Guergachi A, Keshavjee K (2016) Análisis de rendimiento de las
técnicas de clasificación de minería de datos para predecir la diabetes. sistema para la predicción de la diabetes utilizando técnicas de aprendizaje automático y
aprendizaje profundo. En: Resúmenes de la primera conferencia internacional de informática e
ingeniería de software, IEEE, Ankara, 6 y 7 de noviembre de 2019. https://doi.org/10.1109/
Procedia Comput Sci 82:115–121. https://doi.org/10.1016/j.procs.2016.04.016 UBMYK48245.2019.8965556
28. Khan NS, Muaz MH, Kabir A, Islam MN (2019) Una aplicación basada en el aprendizaje automático 46. Prabhu P, Selvabharathi S (2019) Modelo de red neuronal de creencias profundas para la
sistema inteligente para predecir la diabetes. Int J Big Data Anal Healthc 4(2):1. https://doi.org/ predicción de la diabetes mellitus. En: Resúmenes de la 3.ª conferencia internacional sobre
10.4018/IJBDAH.2019070101 29. NaiArun N, Moungmai R (2015) Comparación de clasificadores imágenes, procesamiento de señales y comunicación, IEEE, Singapur, 2729 de julio de 2019.
para el riesgo de https://doi.org/10.1109/ICISPC.2019.8935838 47. Idriss TE, Idri A, Abnane I, Bakkoury Z (2019)
predicción de diabetes Procedia Comput Sci 69:132–142. https://doi.org/10.101 6/j.procs.2015.10.014 Predicción de glucosa en sangre usando una red neuronal LSTM. En: Resúmenes de la conferencia
30. Kocher T, Holtfreter B, Petersmann A, Eickholz P, Hoffmann T, Kaner D et al (2019) Efecto del federada de 2019 sobre informática y sistemas de información, IEEE, Leipzig, 14 de septiembre de
tratamiento periodontal en HbA1c entre pacientes con prediabetes. J Dent Res 98(2):171–179. https://doi.org/ 2019. https://doi.org/10.15439/2019F159
10.1177/002203451 8804185
48. Jankovic MV, Mosimann S, Bally L, Stettler C, Mougiakakou S, Belgrade IEEE (2016) 2224 de
noviembre de 2016. https://doi.org/10.1109/NEUREL.2016.7800095 49. Song W, Cai WY, Li J, Jiang
31. Meng XH, Huang YX, Rao DP, Zhang Q, Liu Q (2013) Comparación de tres modelos de minería de FS, He SQ (2019) Predicción de los niveles de glucosa en sangre con datos de CGM basados en EMD y
datos para predecir diabetes o prediabetes por factores de riesgo. LSTM. En: Resúmenes de la 6.ª conferencia internacional sobre sistemas e informática, IEEE,
Kaohsiung J Med Sci 29(2):93–99. https://doi.org/10.1016/j.kjms.2012.08.016 32. Sheikhi G, Altınçay Shanghái, 24 de noviembre de 2019. https://doi.org/10.1109/ICSAI48974.2019.9010318 50. Zhang L,
H (2016) El costo de la diabetes mellitus tipo II: una perspectiva de aprendizaje automático. En: Kyriacou E, Zhu F, Xie L, Wang C, Wang J, Chen R et al (2020) Clínica
Christofides S, Pattichis CS (eds) XIV conferencia mediterránea sobre ingeniería médica y biológica
e informática 2016. Actas de IFMBE, vol 57. Springer, Cham, pp 818821. https://doi.org/ características de los pacientes con cáncer infectados con COVID19: un estudio de caso
10.1007/9783319327037_160 33. Iyer A, Jeyalatha S, Sumbaly R (2015) Diagnóstico de diabetes retrospectivo en tres hospitales dentro de Wuhan, China. Ann Oncol 31(7):894–901. https://
usando doi.org/10.1016/j.annonc.2020.03.296 51. Marco ML, Heeney D, Binda S, Cifelli CJ, Cotter PD,
Foligné B et al (2017)
clasificación de técnicas de minería. Int J Data Min Knowl Manag Process 5(1): 1–14. https://doi.org/ Beneficios para la salud de los alimentos fermentados: microbiota y más allá. Curr Opin
10.5121/ijdkp.2015.5101 Biotechnol 44:94–102. https://doi.org/10.1016/j.copbio.2016.11.010 52. Wu JH, Li J, Wang J,
34. Barik S, Mohanty S, Mohanty S, Singh D (2021) Análisis de la precisión de la predicción de la diabetes Zhang L, Wang HD, Wang GL et al (2020) Riesgo
utilizando técnicas de aprendizaje automático híbrido y clasificador. En: Mishra D, Buyya R, predicción de diabetes tipo 2 en trabajadores del acero basada en la red neuronal
Mohapatra P, Patnaik S (eds) Computación inteligente y en la nube. convolucional. Aplicación de computación neuronal 32(13):9683–9698. https://doi.org/10.1 007/
Innovación inteligente, sistemas y tecnologías, vol 153. Springer, Singapur, pp 399–409. https:// s0052101904489y
doi.org/10.1007/9789811562020_41 35. Ephzibah EP (2011) Un sistema experto híbrido genético 53. Wang LY, Mu Y, Zhao J, Wang XY, Che HL (2020) IGRNet: un modelo de aprendizaje profundo para
borroso para el diagnóstico efectivo de enfermedades cardíacas. En: Wyld DC, Wozniak M, Chaki N, el diagnóstico no invasivo y en tiempo real de la prediabetes a través de electrocardiogramas.
Meghanathan N, Nagamalai D (eds) Avances en informática y tecnología de la información. primera Sensores (Basilea) 20(9):2556. https://doi.org/10.3390/s2 0092556
conferencia internacional, ACITY 2011, julio de 2011. Communications in computer and information
science, vol 198. Springer, Berlin, Heidelberg, pp 115121. https://doi.org/10.1007/9783642225550_13 54. Ayon SI, Islam M (2019) Predicción de la diabetes: un enfoque de aprendizaje profundo. Int J Inf Ing
36. Zheng T, Xie W, Xu LL, He XY, Zhang Y, You MR et al (2017) Un marco basado en el aprendizaje Electron Bus 11(2):21–27. https://doi.org/10.5815/ijieeb.2019.02.03 55. Alhassan Z, McGough AS,
automático para identificar la diabetes tipo 2 a través de registros de salud electrónicos. Int J Med Alshammari R, Daghstani T, Budgen D, Moubayed NA (2018) Diagnóstico de diabetes mellitus tipo 2 a partir
Inform 97:120–127. https://doi.org/10.1016/j. ijmedinf.2016.09.014 de datos clínicos de series temporales utilizando modelos de aprendizaje profundo. En: Kůrková V,
Manolopoulos Y, Hammer B, Iliadis L, Maglogiannis I (eds) Redes neuronales artificiales y aprendizaje
automático ICANN 2018. 27.ª conferencia internacional sobre redes neuronales artificiales
redes, octubre de 2018. Apuntes de clase en informática, vol 11141.
Springer, Cham. https://doi.org/10.1007/9783030014247_46 56.
Kumar NM, Manjula R (2019) Diseño de perceptrón multicapa para el
diagnóstico de diabetes mellitus utilizando keras en aprendizaje profundo. En:
Satapathy SC, Bhateja V, Das S (eds) Computación y aplicaciones inteligentes
inteligentes. Innovación inteligente, sistemas y tecnologías, vol 104. Springer, Singapur
57. Mahajan AS (2020) Diagnóstico médico de diabetes mediante aprendizaje profundo
técnicas y análisis de big data. J Tecnología emergente Innov Res 7: 1490–1497
58. Deshmukh T, Fadewar HS, Shukla A (2020) La detección de Prameha
(diabetes) de forma ayurvédica con la ayuda del aprendizaje profundo difuso. En:
Gunjan VK, Diaz VG, Cardona M, Solanki VK, Sunitha KVN (eds) ICICCT 2019
Confiabilidad del sistema, control de calidad, seguridad, mantenimiento y gestión.
Springer, Singapur. https://doi.org/10.1007/9789811384615_17
Nota del editor Springer
Nature se mantiene neutral con respecto a los reclamos jurisdiccionales
en mapas publicados y afiliaciones institucionales.

A Comprehensive Review of Machine Learning Techniques On Diabetes Detection

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

A Comprehensive Review of Machine Learning Techniques On Diabetes Detection

Cargado por

Copyright:

Formatos disponibles

Machine Translated by Google

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 2 de 16

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 3 de 16

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 4 de 16

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 5 de 16

Con preprocesamiento 0.9545 0.936

Sin preprocesamiento 0.9318 0.9434

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 6 de 16

k = 2 77.6 69 69,9 77.8 77.5

k = 4 77.6 69,9 70 77.6 78.7

k = 5 77.5 71.5 72,9 77.6 78.2

k = 10 77.5 69.5 70 77.6 77.6

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 7 de 16

J48, El modelo se realizó en el conjunto de datos de la El autor afirmó que estos algoritmos de El algoritmo AdaBoost con el J48 como [27]

NB con El conjunto de datos utilizado fue el PIMA Al recopilar una gran cantidad de datos para el Los parámetros utilizados para la evaluación [28]

DT, LR y Los conjuntos de datos iniciales se recopilaron del modelo final obtenido con las unidades de Los siguientes datos muestran la [29]

LR, KNN, El autor recopiló un conjunto de datos sin procesar del hospital médico Noakhali que contiene El autor El clasificador RF fue el algoritmo que mejor [30]

LR y DTs El conjunto de datos se elaboró mediante un Recientemente, muchos investigadores LR logró un ACC del 76,54 %, una [31]

El conjunto de datos anónimos de fusión de SVM y LR Practice fue LR es un modelo ampliamente utilizado en Al usar un subconjunto más pequeño de [32]

DT y NB El conjunto de datos considerado fue la base de datos de El autor propuso recopilar información Utilizando una división porcentual de 70:30, el [33]

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 8 de 16

Aumento de El autor utilizó el conjunto de datos de diabetes El autor sugiere el uso de más algoritmos en esta La precisión obtenida con el clasificador [34]

DT (J48) y El autor utilizó el conjunto de datos de diabetes india En el futuro, está previsto recopilar la información El algoritmo J48 tuvo una precisión del [33]

Genético Este trabajo es un modelo que implementa los El trabajo propuesto ayuda a minimizar el costo A través de este enfoque de GA, la precisión [35]

k­NN, NB, Estos modelos se crearon en comparación Una aplicación de genoma completo para la detección de El modelo propuesto se evaluó sobre la base [36]

LR, DT, RF, El autor utilizó el conjunto de datos de mujeres indias El autor propuso crear modelos avanzados Se compararon diferentes modelos sobre la base [22]

DT – J48, RF El autor obtuvo un conjunto de datos de Luzhou del examen El autor esperaba poder predecir el tipo de diabetes Los algoritmos RF y J48 lograron una [37]

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 9 de 16

NB y SVM El conjunto de datos de pacientes de 500 registros se Clasificadores de este tipo pueden ayudar NB pudo clasificar correctamente el 74 % [38]

DT, SVM, El autor utilizó el conjunto de datos indio PIMA. El beneficio de este modelo optimizado Los modelos se comparan sobre la base de [39]

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 10 de 16

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 11 de 16

Red neuronal El conjunto de datos utilizado fue el conjunto Como el autor compara su red con los métodos Los resultados de la red propuesta por el autor [46]

Memoria a El autor utilizó el conjunto de datos Direct Net El autor elaboró sobre las aplicaciones de la vida Se concluyó que el uso de LSTM para la [47]

Modelo Los datos tomados fueron de seis individuos Los modelos ELM son fáciles de implementar El modelo se evaluó en tres parámetros: [48]

Descomposición de El conjunto de datos se obtuvo del El autor propuso un modelo más preciso al Los parámetros considerados para [49]

Red El conjunto de datos sin procesar incluía dos El autor afirmó que este estudio sobre el uso El autor utilizó tres parámetros para la evaluación, [50]

ANA Conjunto de datos médicos tomado de la Debido a que las ANN logran una alta precisión, Para aumentar el rendimiento del modelo, se [30]

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 12 de 16

Algoritmo Método utilizado/innovación Solicitud Resultados y limitaciones (si se Referencias

LSTM y Bi El autor recopiló el conjunto de datos de pacientes El autor propuso el uso modelo para Los resultados se calcularon a [51]

CNN Una predicción de riesgo puede Proporciona una base para la autogestión de la La precisión de predicción del modelo en los tres [52]

AlexNet y En este estudio, el autor desarrolló un modelo El autor sugirió usar este modelo híbrido Los resultados de las redes se compararon [53]

DNN La recopilación de datos se recuperó del El sistema propuesto será de apoyo Las muestras de datos se dividieron en [54]

LSTM y GRU El conjunto de datos utilizado incluía registros de Los modelos recibieron una alta precisión del 97 % Los modelos LSTM y GRU lograron mejores [55]

Red de El autor utilizó el conjunto de datos de El autor propuso extender este trabajo para Los resultados del perceptrón se calcularon [56]

Algoritmo ELM Los datos se adquirieron de múltiples El objetivo de esta investigación fue el El enfoque propuesto demostró ser eficiente. [57]

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 13 de 16

Red neuronal El autor obtuvo un conjunto de datos de Luzhou El autor espera predecir el tipo de diabetes La red neuronal obtuvo una precisión [37]

CNN El conjunto de datos utilizado por el autor se Fuzzification demuestra ser de naturaleza útil La red neuronal con valor de α = 2 se [58]

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 14 de 16

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 15 de 16

Sharma y Shah Computación visual para la industria, la biomedicina y el arte (2021) 4:30 Página 16 de 16

También podría gustarte

kNN, NB, Estos modelos se crearon en comparación Una aplicación de genoma completo para la detección de El modelo propuesto se evaluó sobre la base [36]