Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sharma y Shah Computación visual para la industria, la biomedicina y el arte
(2021) 4:30 https://doi.org/10.1186/s42492021000977
computación visual para la industria,
Biomedicina y Arte
REVISIÓN Acceso abierto
Una revisión exhaustiva de las técnicas de
aprendizaje automático para la detección de diabetes
Toshita Sharma1 y Manan Shah2*
Resumen
La diabetes mellitus ha sido una preocupación creciente debido a su alta morbilidad, y la edad promedio de los individuos afectados por esta enfermedad ha
disminuido ahora a la mitad de los veinte años. Dada la alta prevalencia, es necesario abordar este problema de manera efectiva. Muchos investigadores y
médicos ahora han desarrollado técnicas de detección basadas en inteligencia artificial para abordar mejor los problemas que se pasan por alto debido a errores
humanos. Técnicas de minería de datos con algoritmos tales como: agrupamiento espacial basado en la densidad de aplicaciones con ruido y puntos de orden
para identificar la estructura del agrupamiento, el uso de sistemas de visión artificial para aprender datos en imágenes faciales, obtener mejores funciones para
el entrenamiento de modelos y diagnóstico a través de la presentación de iridociclitis para la detección de la enfermedad a través de los patrones del iris han
sido desplegados por varios profesionales. Los clasificadores de aprendizaje automático, como las máquinas de vectores de soporte, la regresión logística y los
árboles de decisión, han sido discutidos comparativamente por varios autores. Se han considerado modelos de aprendizaje profundo, como redes neuronales
artificiales y redes neuronales recurrentes, con un enfoque principal en la memoria a corto plazo y arquitecturas de redes neuronales convolucionales en
comparación con otros modelos de aprendizaje automático. Por lo general, se utilizan varios parámetros, como el error cuadrático medio, los errores absolutos
medios, el área bajo las curvas y los gráficos con criterios variables. En este estudio, se analizan los desafíos relacionados con la inadecuación de los datos y la
implementación del modelo. También se ha discutido el alcance futuro de tales métodos, y se espera que los nuevos métodos mejoren el rendimiento de los
modelos existentes, permitiéndoles lograr una mayor comprensión de las condiciones de las que depende la prevalencia de la enfermedad.
Palabras clave: Aprendizaje automático, Aprendizaje profundo, Cuidado de la salud, Detección de diabetes
Introducción las personas que tienen dolencias prevalecientes más directamente,
Dada la creciente población, es necesario desarrollar y este grupo comprende la mayoría del grupo de personas
sistemas para mejorar la salud y mitigar las crecientes afectadas por muchas enfermedades como diabetes, azúcar en la
preocupaciones en todo el mundo. A medida que avanza la sangre y problemas de presión arterial [1]. Según el Informe
investigación científica, el desarrollo de dicho sistema se Nacional de Estadísticas de Diabetes 2020, cada 1 de cada 10
vuelve más eficiente. Los sistemas de salud están diseñados personas en los Estados Unidos tiene diabetes, y los nuevos casos
para brindar a las personas los requisitos para una buena de diabetes 1 y 2 han aumentado significativamente entre los jóvenes.
salud y realizar la detección y diagnóstico de enfermedades Dado que la salud y el cuidado de la salud forman pilares críticos
y condiciones correctamente con mayor eficiencia, tal como de una sociedad saludable, es necesario utilizar las capacidades
lo proponen los métodos convencionales. En general, los de los métodos computacionales y la inteligencia artificial [2] para
pacientes suelen estar muy preocupados por la calidad del desarrollar nuevos métodos para su aplicación en los sistemas de
sistema de salud y las instalaciones disponibles para brindar salud para promover una sociedad más saludable y reducir el
riesgo
tratamiento. Los beneficios de las mejoras en los sistemas de salud de tal ae
tienden nfermedades
afectar en nuestras generaciones, aumentando
aún más la calidad de vida.
* Correspondencia: manan.shah@spt.pdpu.ac.in Ha habido un gran impacto en el mundo médico con el avance
2
Departamento de Ingeniería Química, Escuela de Tecnología, Pandit
de la tecnología. Los resultados de salud pueden depender de una
Universidad de Energía Deendayal, 382426 Gandhinagar, Gujarat, India
La lista completa de información del autor está disponible al final del artículo. cuestión de segundos para las personas que
© El(los) autor(es). Acceso abierto 2021 Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite
el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito
correspondiente al autor o autores originales y a la fuente. , proporcione un enlace a la licencia Creative Commons e indique si se
realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del
artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative
Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso
directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Machine Translated by Google
es posible que no pueda llegar a un hospital o recibir tratamiento algoritmos como los árboles potenciados por gradiente, que se
de emergencia. La tecnología cierra esta brecha en distancia y pueden usar para crear modelos predictivos de la progresión de
recursos para todas las personas a las que se extienden sus la prediabetes a la diabetes, y tienen como objetivo proporcionar
beneficios. Se han desarrollado varias tecnologías utilizando un diagnóstico temprano para un mejor tratamiento y reducir los
máquinas de formación de imágenes por resonancia magnética riesgos adicionales [12]. Otro estudio aplicó un algoritmo de
en la tecnología de vídeo. Las aplicaciones basadas en Internet máquina de vector de soporte modificado (SVM) como un método
pueden proporcionar a los pacientes servicios personalizables. eficiente para datos tanto lineales como no lineales [13].
Después de algunas visitas clínicas, el resto del trabajo se puede
realizar a través de servicios de alta tecnología como la telesalud. Desde la llegada de la inteligencia artificial y las tecnologías
Los médicos pueden comunicarse con los pacientes a través de relacionadas, estos métodos computacionales se han aplicado a
Internet para atender mejor sus necesidades [3]. Un ejemplo del modelos de detección en tiempo real en casi todos los campos. El
uso de la tecnología de video implica la provisión de dicha uso de minería de datos, aprendizaje automático, aprendizaje
mecanización en caso de emergencia para pacientes con trauma profundo y visión por computadora ha reducido drásticamente la
en áreas rurales y urbanas donde la atención clínica puede no dificultad de estudiar técnicas más nuevas que pueden mejorar
estar disponible [4]. La tecnología tiene la capacidad de permitir la significativamente los métodos existentes. En la siguiente sección,
atención médica domiciliaria con mayor productividad y seguridad se analizan los algoritmos y métodos.
[5]. La precisión y disponibilidad de los datos se han propuesto
como uno de los problemas más importantes que enfrentan los Aplicación de última tecnología en detección de diabetes Los
hospitales, lo que implica el mantenimiento y procesamiento algoritmos utilizados en minería de datos, aprendizaje automático
posterior de los datos de los pacientes. Varios algoritmos en el o cualquier campo de la inteligencia artificial realizan modelado
campo del aprendizaje automático y el aprendizaje profundo se predictivo, es decir, el uso de datos y estadísticas para predecir
han aplicado beneficiosamente en la práctica a los tratamientos resultados futuros basados en datos históricos. Los síntomas más
médicos. Algunas ideas de vanguardia surgen de la implementación comunes de la diabetes incluyen metabolismo anormal,
masiva de tecnologías, como la creación de algoritmos de hiperglucemia y un riesgo asociado de complicaciones específicas
coincidencia y el procesamiento del lenguaje natural [6]. La minería que afectan los ojos, los riñones y el sistema nervioso, que son
de datos se puede utilizar para extraer datos directamente, en lugar de
confiar
partes en el conocimiento
importantes de D
del cuerpo. expertos.
ichos síntomas se utilizan para
Se considera que estos métodos producen patrones únicos y recopilar datos y luego se realiza el modelado en función de las
distintivos para crear planes personalizados para cada hospital [7]. categorías de edad y género. Uno de esos algoritmos es ordenar
puntos para identificar la estructura de agrupamiento (OPTICS),
La diabetes mellitus (DM) es una de las enfermedades más que es un conjunto de puntos de pedido para identificar estructuras
arquetípicas a nivel mundial. Es una enfermedad que implica que de agrupamiento. OPTICS es una versión avanzada de
los sistemas del cuerpo de una persona no pueden funcionar de agrupamiento espacial de aplicaciones basado en la densidad
manera eficiente para usar la energía de los alimentos. Se (DBSCAN) con ruido, y elimina todos los aspectos negativos de
conocen cuatro tipos principales de diabetes, que incluyen el tipo DBSCAN. El método de agrupación de datos utilizado en este
1, el tipo 2, la gestacional y otras formas, siendo los más comunes algoritmo es un algoritmo iterativo equilibrado de reducción y
el tipo 1 y el tipo 2 [8]. La diabetes tipo 1 generalmente ocurre en agrupación que utiliza jerarquías (BIRCH) que selecciona los
el grupo de edad joven de 30 a 40 años y depende de la insulina. datos más adecuados para un análisis posterior. Por lo tanto, se
Se requiere que los pacientes tomen dosis de insulina durante utiliza la técnica de minería de datos naïve Bayes (NB), y BIRCH
toda su vida. Por el contrario, el tipo 2 predomina en la cohorte de y OPTICS se utilizan para agrupar tipos de datos similares y para
más de 40 años y suele estar relacionado con el peso de los identificar el algoritmo correcto para una mayor precisión [14].
pacientes. Se sabe que la diabetes tipo 2 tiene una mayor Apache Spark se encuentra entre las plataformas de análisis de
prevalencia en todo el mundo, ya que representa más del 90 % estado de más rápido crecimiento. Opera más rápidamente que
de los casos [9]. Debido a que esta enfermedad ha estado durante la plataforma Hadoop, lo que la hace más fácil de usar y aplicable
mucho tiempo cerca de la cima de las clasificaciones mundiales a la práctica clínica [11].
que enumeran enfermedades graves, muchos investigadores y Otra aplicación de este tipo en el campo de OpenCV es el uso
médicos han propuesto algoritmos y métodos para su tratamiento del sistema de detección de DM no invasivo asistido por
y detección. La implementación de estos algoritmos tiene sus computadora. Este sistema proporcionó resultados inmediatos a
raíces en las disciplinas de aprendizaje profundo y aprendizaje partir de imágenes faciales. El modelo examinó cuatro bloques de
automático. Con el análisis predictivo respaldado por redes salud de la piel: frente, mejilla izquierda, mejilla derecha y puente
neuronales, específicamente redes neuronales convolucionales nasal. Luego, la extracción de características se realizó utilizando
(CNN) y redes neuronales recurrentes (RNN), estos métodos un patrón binario local y luego la clasificación utilizando el
tienen la capacidad de determinar sentimientos y aprender agrupamiento de kvecino más cercano (KNN) y un SVM. Todas
características de modelos altos automáticamente [10, 11]. estas características se conectaron con software y muestran los
resultados
Algunos investigadores han implementado el uso del aprendizaje automático en tiempo
a través de real [15].
Machine Translated by Google
islam et al. [16] utilizaron diferentes algoritmos para un conjunto de obtener resultados que parecen más adecuados para aplicaciones de la
datos de síntomas de diabetes, incluidos NB, bosque aleatorio (RF), vida real.
regresión logística (LR) y un árbol de decisión (DT). Primero, el conjunto Choudhury y Gupta [17] utilizaron diferentes algoritmos para clasificar
de datos con el sistema del paciente se ingresa en el sistema en el que a las personas en dos categorías: individuos de alto y bajo riesgo. Usaron
se aplican los algoritmos predictivos. Después de esto, el conjunto de un SVM para establecer un hiperplano para la categorización, una
datos se ingresa en la base de datos y se observa el rendimiento o la técnica de clasificación KNN para agrupar nuevos datos en grupos,
precisión lograda por el modelo. clasificadores DT, RF y NB, y el método de clasificador binario llamado
El algoritmo más adecuado se selecciona comúnmente en función de la LR. Al comparar las precisiones para esta clasificación en forma de
mayor precisión y el mejor rendimiento. Los datos del usuario se toman matriz de confusión, como se muestra en la Fig. 1, se encontró que el
nuevamente como entrada para el algoritmo para mayor capacitación y algoritmo LR es el más eficiente y preciso, mientras que el algoritmo DT
evaluación para aumentar la precisión del modelo en tiempo real. logró el más bajo.
Iridodiagnóstico es un sistema predictivo en el que la enfermedad precisión.
se detecta a través de patrones de iris. Esto se usó para la detección de Shukla [18] usó un algoritmo LR, sacó un conjunto de datos que
diabetes a través del siguiente método. Los datos se recopilaron de mostraba que se obtendría la máxima precisión si se usaran parámetros
pacientes diabéticos y no diabéticos en los que se realizó un como la glucosa, el índice de masa corporal (IMC) y los embarazos, que
preprocesamiento. La siguiente parte se denomina segmentación de se representaron en forma de gráfico de barras. , como se muestra en la
imágenes, en la que el iris del ojo se separa de la imagen en el conjunto Fig. 2. El autor también intentó mostrar que la enfermedad depende
de datos. predominantemente de aquellas características que nos parecen escasas
La normalización se realiza en la que el iris circular se convierte en un pero que los médicos han señalado como relevantes y que posiblemente
rectángulo mediante el mapeo polar. Luego se realiza la extracción de conduzcan a un mayor riesgo de enfermedades posteriores. El modelo
características en esta imagen final. Se utiliza una matriz de coocurrencia LR entrenado con las características dominantes mostró una precisión
de nivel de gris para caracterizar las imágenes, que es un proceso para del 82,92%. Para el pronóstico del modelo, 0.458 fue la probabilidad de
examinar la textura. Este proceso asigna números del 1 al 8 a las áreas clase cero y 0.572 para la clase uno, que estima la probabilidad de que
de las imágenes calculando con qué frecuencia aparecen en la imagen una persona sea diabética.
pares de píxeles con valores específicos y en una relación espacial
específica. Dalakleidi et al. [19] usó dos conjuntos de datos llamados PID, Caso
En esta matriz, las características como el contraste, la correlación, la 1 e Hippokrateion, que es el Caso 2 en el que el PID se divide en 50 %
disimilitud, la homogeneidad, la varianza y la entropía son las para entrenamiento y 50 % para prueba, mientras que Hippokrateion
características pertinentes para proporcionar datos de alta calidad. tiene una bifurcación de 70 % para entrenamiento y los otros 30 % para
Estos son solo algunos de los autores entre muchos que han las pruebas. Utilizaron regresión logística binaria (BLM), algoritmo de
contribuido a la literatura en este campo. A continuación, se proporciona árbol modelo logístico (LMT), que es una combinación de aprendizaje
un estudio detallado de la metodología utilizada por otros investigadores LR y DT en modelos simples. El rendimiento del modelo se midió
en este campo. utilizando la precisión de clasificación (ACC) y el área bajo la curva
(AUC). BLM logró un ACC de 80,47 y AUC de 0,85, mientras que LMT
Aprendizaje automático en la detección de logró un ACC de
diabetes El aprendizaje automático es un método mediante el cual un
sistema computacional aprende las características de los datos de
entrada. Dichos métodos han demostrado su eficacia para la detección de la diabetes.
Se han desarrollado muchos algoritmos de aprendizaje automático,
incluidos métodos de aprendizaje supervisado, no supervisado y de
refuerzo. Evidentemente, esto es práctico porque los métodos de
aprendizaje automático se basan en datos. Con cantidades tan masivas
de datos ingresados en la base de datos, el aprendizaje automático
puede ahorrar un esfuerzo humano considerable. Los modelos se
entrenan con estos datos y proporcionan la salida más adecuada en
función de los datos de entrada. Los modelos se pueden entrenar en
cualquier parámetro que sea factible para la practicidad y los requisitos
médicos. Algunos pueden examinar las características faciales, mientras
que otros buscan datos de informes de sangre obtenidos de pacientes.
Debido a que hay muchos síntomas de la enfermedad, los parámetros
varían en consecuencia. Con muchos métodos propuestos, los Fig. 1 Resultados de la clasificación de SVM, KNN, NB, DT y LR en forma
de verdadero positivo (TP), falso positivo (FP), verdadero negativo (TN) y
investigadores probaron varios algoritmos y ajustaron numerosos
falso negativo (FN), que son los parámetros de la matriz de confusión [17 ]
hiperparámetros para
Machine Translated by Google
no eran. El mejor resultado se logró utilizando el algoritmo de
RF con una precisión del 99 %. Por lo tanto, es un algoritmo
eficaz para un conjunto de datos recién creado. La Figura 4
muestra exactamente cómo se desempeñó cada algoritmo en
el modelado y la predicción.
harris et al. [21] realizó un diagnóstico clínico para la
detección de diabetes mellitus no dependiente de insulina
(NIDDM) mediante regresión lineal ponderada. La relación
entre la prevalencia de la retinopatía y la duración de la
Fig. 2 El peso de cada una de las características que arrojan la variable NIDDM se determinó según los años individuales de duración
resultado [18] y se evaluó mediante una regresión lineal ponderada con
pesos para los datos de cada año inversamente proporcionales
a la varianza binomial. El autor afirmó que la condición de
77,6 y AUC de 0,84 en el Caso 1. En el Caso 2, el BLM retinopatía es un parámetro importante para el diagnóstico
superó al LMT con un ACC de 93,45, mientras que el LMT precoz de la enfermedad. Por lo general, aparece casi 4 a 7
tuvo un ACC de 92,86. años antes del diagnóstico clínico de la enfermedad. La figura
islam et al. [20] utilizó varios algoritmos para analizar un 5 proporciona un gráfico preciso de los resultados obtenidos.
conjunto de datos utilizando los algoritmos NB y LR, así como
el algoritmo RF, después de aplicar técnicas de evaluación Ameena y Ashadevi [22] utilizaron el lenguaje R para
de división porcentual y validación cruzada de 10 veces. construir un modelo en SVM, DT, RF y LR. Utilizaron un
La Figura 3 muestra su arquitectura propuesta. El conjunto conjunto de datos de 768 mujeres, todas mayores de 20 años.
de datos contenía registros de 520 personas a las que se les Utilizaron las siguientes características: IMC, azúcar en
preguntó por las posibles razones de la diabetes. Después sangre, número de embarazos y función de pedigrí de
del procesamiento previo de datos, hubo un total de 314 diabetes. Se definen dos clases: 1, que afirma la diabetes y 0
valores positivos y 186 valores negativos. Los valores positivos para la negación. En una comparación de las precisiones, el
representan que la persona es diabética y los negativos implican qautor
ue concluyó que el algoritmo RF
Fig. 3 Arquitectura propuesta del sistema de detección [16]
Machine Translated by Google
Tabla 1 Tabla de comparación obtenida para el modelo KNN y
DT en conjuntos de datos preprocesados y otros sin
preprocesamiento [23]
Datos KNN (k = 2) DT
pliegues Se utilizaron medidas de precisión, medida F,
recuperación, precisión y ROC. Los atributos utilizados fueron la
concentración de glucosa, la presión arterial, el IMC, la edad, el
grosor de los pliegues cutáneos, el número de embarazos, la
Fig. 4 Rendimiento de cada algoritmo en el conjunto de datos recién
concentración de insulina a las 2 h, la función genealógica y la
adquirido [20] clase 0 o 1. En el modelado, los autores calcularon que el RN
mostró el máximo precisión con 586 instancias correctamente
identificadas. La siguiente Fig. 6 muestra los diferentes tipos de
mostró las máximas estimaciones correctas, con una precisión clasificadores utilizados junto con el número de instancias clasificadas.
de casi el 77% en comparación con los otros modelos. Ahuja et al. [25] utilizaron el conjunto de datos de la UCI que
Daanouni et al. [23] usó KNN y el algoritmo DT en dos conjuntos contiene 768 registros de mujeres en los que 500 eran diabéticos,
de datos, el primero con 2000 instancias y el segundo con 768. mientras que los 268 restantes no lo eran. Los autores utilizaron
Usaron ocho características o atributos para entrenar el modelo, ocho características para la clasificación y aplicaron una técnica
como el IMC, la glucosa, el azúcar en la sangre y el embarazo. de selección de características, que es el análisis discriminante
Los autores utilizaron el 80% para entrenamiento y el 20% restante lineal (LDA), para extraer las características importantes requeridas
para pruebas. Utilizaron hiperparámetros optimizados para reducir para la clasificación. Utilizaron cinco tipos de clasificadores para
la pérdida. Los resultados se grafican en dos tipos de datos: el aprendizaje automático, incluidos SVM, DT, LR, RF y un
preprocesamiento y sin. La comparación de resultados se realizó perceptrón multicapa. Los autores utilizaron cuatro parámetros
mediante una curva operativa del receptor (ROC). El autor para la evaluación, incluida la exactitud, la precisión, el recuerdo
concluyó que KNN tiene una precisión máxima del 97,53 % y un y la puntuación F. Sobre la base de estos parámetros, los autores
AUC de 0,9689. La Tabla 1 muestra una tabla de comparación de concluyeron que el perceptrón multicapa produce los mejores
las precisiones obtenidas para entrenar el modelo utilizando el resultados. La Tabla 2 menciona los resultados utilizando
clasificador KNN. diferentes valores de validación de kfold.
Alehegn et al. [26] utilizó el conjunto de datos de diabetes indio
Sisodia D y Sisodia DS [24] utilizaron tres clasificadores, PIMA con ocho características para entrenar y el conjunto de
incluidos SVM, NB y DT. La clasificación se realiza en el conjunto datos del hospital 130 D con una mayor cantidad de valores. Se
de datos de diabetes india de PIMA, que es el conjunto de datos utilizaron cuatro métodos de clasificación, incluidos los algoritmos
de diabetes india de PIMA tomado de la UCI. Para medir la RF, KNN, NB y J48DT. J48 es una versión mejorada del algoritmo
precisión, la validación cruzada interna fue 10 de clasificación Iterative Dichotomiser 3 (ID3). Se utilizó una
validación cruzada de 10 K para el 90 % de entrenamiento y el 10
% de prueba. El autor construyó un híbrido.
La figura 5 muestra cómo, en el momento del diagnóstico clínico de NIDDM, los Fig. 6 Diferentes algoritmos de clasificación resultan en modelos de
pacientes tenían la afección prevalente de retinopatía diabética. predicción donde NB supera a los otros dos
Machine Translated by Google
Tabla 2 Resultados de precisión de diferentes clasificadores a diferentes valores de validación kfold (%)
kdoblar Clasificador de vectores de soporte DT RF LR Perceptrón multicapa
modelo que consta de todos los algoritmos anteriores. El autor concluyó algoritmos para analizar cuál proporciona el máximo
que NB y J48 son buenos para grandes cálculos de datos, y el precisión.
clasificador KNN es mejor para conjuntos de datos más pequeños. La Daanouni et al. [23] utilizó ANN y DNN en dos conjuntos de datos de
Figura 7 muestra los diferentes algoritmos utilizados junto con las 2000 y 768 instancias. Incluían ocho atributos con la etiqueta de salida
instancias identificadas correcta e incorrectamente. como 1 para resultados positivos y 0 para resultados negativos. La red
fue entrenada en dos tipos de datos: preprocesados y no preprocesados.
Algunos trabajos más realizados por otros investigadores que se han El modelo DNN parece lograr una alta precisión tanto en los datos
mencionado en la Tabla 3. Contiene un estudio de los algoritmos de obtenidos, con una precisión del 98 % para el conjunto de datos
aprendizaje automático utilizados en los métodos. preprocesados como del 99,5 % para el conjunto de datos 1. En el
conjunto de datos 2, los datos no preprocesados tuvieron una precisión
Aprendizaje profundo en la detección de del 80,99 % y el otro 96,35%. Por lo tanto, los autores concluyeron que
diabetes El aprendizaje profundo es un campo computacional que DNN es un clasificador óptimo para la detección de diabetes.
generalmente está involucrado cuando se requiere un alto poder computacional.
El aprendizaje profundo se centra en las redes neuronales, sus tipos, Rakshit et al. [40] usó R, SQL y Python en un entorno de estudio de
épocas de entrenamiento, capas de entrada y salida ocultas. La capa aprendizaje automático de Microsoft Azure con el conjunto de datos de
de entrada es la primera capa, y las capas ocultas son responsables de diabetes PIMA, en el que el 80 % se usó para capacitación y el otro 20
todos los cálculos y manipulaciones, como circunvoluciones y agrupación. % para pruebas. Este conjunto de datos se refiere principalmente a la
La capa de salida determina el número de clases para la clasificación. diabetes en las mujeres. Este contiene ocho atributos que son
Debido a que el aumento de datos, lo que significa ajustar los datos para importantes para la construcción de modelos para una red neuronal de
aumentar la precisión, también está disponible en el aprendizaje clase 2. La figura 8 muestra la representación general de la red neuronal.
profundo, encuentra muchas aplicaciones con el entrenamiento de La capa oculta tenía 100 nodos, con la capa de salida conectada a la
imágenes. Cuantas más capas tiene la red, más es capaz de clasificar. enésima capa oculta. Con el modelo entrenado durante más de 1000
Debido a las muchas ventajas, se ha utilizado ampliamente en el campo épocas con una tasa de aprendizaje de 0,01, lograron una precisión del
de la medicina para calcular resultados con gran precisión. Existen 83,3 % en un conjunto de datos con 262 casos negativos y 131 casos
diferentes tipos de redes con las redes neuronales artificiales (ANN) más positivos.
competentes, redes neuronales profundas (DNN), CNN y RNN. Muchos
investigadores que trabajan para la detección de una enfermedad Sapón et al. [41] presentó la predicción de la diabetes mediante ANN
comparan el aprendizaje automático y el aprendizaje profundo supervisadas. El conjunto de datos comprende aproximadamente 250
pacientes con 27 variables o características, donde exactamente el 50
% se usó para entrenamiento, mientras que el 50 % restante se usó
para probar con la herramienta MATLAB. Los algoritmos de gradiente
utilizados incluyeron el gradiente conjugado de FletcherPowell, el
gradiente conjugado de PolakRibiére y el gradiente conjugado escalado.
Estos algoritmos se usaron para entrenar el modelo y luego se analizaron
usando el coeficiente de correlación (CC) R. Los resultados de estos
algoritmos se trazan en diferentes épocas contra el error cuadrático
medio.
Con base en una comparación de los valores de R, los autores concluyen
que el gradiente conjugado escalado confirma la mayor precisión con
un valor de 0,88, seguido del gradiente conjugado de FletcherPowell
con un valor de 0,097219 y, finalmente, el conjugado de PolakRibiére
gradiente con 0.056466.
Fig. 7 Precisión de los algoritmos de clasificación en el conjunto de datos de diabetes referencias [31, 42] ambos realizaron la detección usando una ANN.
indio PIMA. El modelo híbrido propuesto muestra la máxima precisión
Árbitro. [42] usó el conjunto de datos de población india PIMA para
mujeres en Phoenix, mientras que [31] realizó este algoritmo
Machine Translated by Google
Tabla 3 Un estudio exhaustivo de los métodos de aprendizaje automático realizado por algunos investigadores
Algoritmo Método utilizado/innovación Aplicación y trabajo futuro Resultados y limitaciones (si se Referencias
especifica)
Tabla 3 Un estudio exhaustivo de los métodos de aprendizaje automático realizado por algunos investigadores (Continuación)
Algoritmo Método utilizado/innovación Aplicación y trabajo futuro Resultados y limitaciones (si se Referencias
especifica)
Se aplica NB. El rendimiento del modelo se evaluó los modelos no muestran una buena precisión
utilizando el error absoluto medio (MAE), el error en conjuntos de datos más grandes.
cuadrático medio (RMSE), el error absoluto relativo, el
error cuadrático relativo de la raíz y la estadística kappa.
Herramienta WEKA utilizada. Estos algoritmos se
utilizaron contra un marco propuesto que extrae
automáticamente patrones de tipo 2
MD.
Tabla 3 Un estudio exhaustivo de los métodos de aprendizaje automático realizado por algunos investigadores (Continuación)
Algoritmo Método utilizado/innovación Aplicación y trabajo futuro Resultados y limitaciones (si se Referencias
especifica)
en un modelo de cuestionario que contenía datos de 1487 personas Árbitro. [44] usó el conjunto de diabetes PIMA y calculó el modelo
con resultados positivos y negativos. Las características que usando una ANN y usó ocho características para modelar. El autor
siguieron siendo comunes para el modelado fueron el IMC, la explicó las diferentes funciones utilizadas para el preprocesamiento
edad, el peso, el estado civil, los embarazos y la ref. [31] recopilaron y entrenamiento de modelos. La función de activación era una
una gran cantidad de variables, como el consumo de alcohol, función sigmoidea, y se usa retropropagación para calcular el
carne, consumo de cigarrillos, variedad de bebidas y sus recuentos gradiente de la función de pérdida.
y la rutina de ejercicio y sueño. La función de error calculó el error final en aproximadamente un
Considerando la estructura de la ANN, ref. [31] tenía 8 % al final de la construcción del modelo. Los resultados fueron
aproximadamente 15 nodos ocultos, mientras que los mismos validados en ROC y RMSE. El autor logró un área ROC de 0.88 y
variaban de 0 a 5 en la ref. [42]. Árbitro. [31] logró un ACC de RMSE igual a 0.39, lo cual es un clasificador FAIR. La figura 9
73,52% frente a la ref. [42], quienes lograron una precisión del muestra los resultados representados en forma de líneas.
80,21 % en los datos de prueba.
Árbitro. [43] realizó un estudio comparativo de redes neuronales Árbitro. [29] usó una ANN para su modelo entrenado sobre un
en la detección de diabetes. Usando nuevamente el conjunto de conjunto de datos que consta de más de 30000 instancias y 11
diabetes indio PIMA, usaron las ocho características comunes características para entrenar. Con las capas ocultas igual a 12, los
requeridas para la preparación del modelo. Con los primeros 576 valores de las capas se calcularon usando la función sigmoidea.
casos utilizados para la prueba, utilizaron una técnica de validación Se implementaron métodos de ensacado y refuerzo. También se
cruzada de 10 veces para estimar los resultados. El autor utilizó configuró el embolsado para reducir la varianza en el modelo, y se
una red neuronal multicapa (MLNN) con 50 neuronas para cada realizó un refuerzo para reducir el error. La red neuronal con
capa oculta y una capa de salida que usa la función de activación bagging logró una precisión del 85,324 %, seguida del modelo
no sigmoidea y una PNN, que es una red neuronal probabilística ANN con boosting con una precisión del 84,815 % y luego la ANN
con una sola capa oculta. El autor concluyó sus resultados sobre con un 84,532 %. Finalmente, el autor valida la comparación final
la precisión, mostrando que el modelo MLNN logró una precisión utilizando un ROC.
de 79,62 y el PNN logró una precisión de 78,65.
Árbitro. [45] utilizaron técnicas de aprendizaje automático y
aprendizaje profundo para detectar DM. El conjunto de datos
utilizado aquí fue el conjunto de datos de diabetes indio PIMA que
consta de 768 funciones y ocho funciones para entrenar con un
total de 500 instancias que pertenecen a la clase no diabética y las
268 restantes, que son de clase diabética. El 60% de los datos se
seleccionó para entrenamiento y el 40% restante para prueba; se
utilizó una CNN. Se componen de tres capas, siendo la clasificación
realizada por la capa de salida. La precisión de predicción lograda
con el modelo fue del 76,81 %.
Algunos trabajos más realizados por otros investigadores que
Fig. 8 Representación general de una red neuronal, xm muestra los pesos de entrada e
se han mencionado en la Tabla 4. Contiene un estudio de los
yp son los pesos de salida
algoritmos de aprendizaje profundo utilizados en los métodos.
Machine Translated by Google
el modelo se ejecuta en procesos por lotes de automatización. Además,
dado que solo hay unos pocos conjuntos de datos de diabetes disponibles
en Internet; más datos públicos deberían estar disponibles para la
investigación. Se deben realizar más investigaciones utilizando la frecuencia
cardíaca, ya que requiere menos ancho de banda y su complejidad
computacional también es baja. También se pueden utilizar en la nube o en
dispositivos móviles. Las señales de frecuencia cardíaca también deben
usarse para detectar otras enfermedades cardíacas. En algunos casos, los
autores requerían un conjunto de datos de series temporales. Dado que no
están disponibles en ningún recurso en línea, es difícil replicar dicho trabajo.
Dichos modelos especiales requieren un ajuste extenso y grandes conjuntos
de datos tanto para el entrenamiento como para las pruebas.
La siguiente parte es la construcción de un modelo real.
Para lograr una precisión perfecta, se deben ajustar muchos parámetros.
Fig. 9 Los gráficos trazados entre el valor real mostrado por la línea azul y
los valores pronosticados mostrados por la línea roja Los estados aleatorios, el kernel, la cantidad de árboles, el ajuste de
hiperparámetros y varios otros se consideran al crear un modelo. La
selección de un algoritmo correcto con hiperparámetros adecuados también
Desafíos y alcance futuro Aunque debe realizarse con precisión. Algunos modelos de clasificación solo
son muchos los métodos y algoritmos que se han propuesto en el campo del entrenarán en un solo parámetro, lo que resulta en una menor precisión para
aprendizaje automático o aprendizaje profundo, aún quedan muchos el modelo en la detección en tiempo real. Es evidente del análisis de estos
desafíos, como mencionan los autores en sus trabajos. La primera esquemas en todas las clases que la mayoría de ellos sufren de un solo
preocupación que viene a la mente cuando se construye un modelo son los parámetro de entrada de datos o la selección de características no es óptima.
datos. referencias [32, 33, 49] fueron algunos de los autores que hicieron Junto con tales restricciones en los parámetros, pocos esquemas basados
referencia al problema. en clasificación dependen puramente de tipos de dispositivos de hardware,
Uno de los mayores problemas encontrados durante la encuesta de los lo que aumenta la dificultad de disponibilidad y adaptabilidad de estos
documentos fue encontrar artículos y documentos que no se relacionaban esquemas.
con el popular conjunto de datos indios PIMA. Este conjunto de datos se
eligió para garantizar que los modelos proporcionaran buenos resultados
debido al establecimiento del conjunto de datos. Un modelo de aprendizaje automático basado en la atención médica solo
Los conjuntos de datos son demasiado pequeños o inadecuados, o carecen es útil si se puede usar en beneficio de las personas. Aquí, el despliegue del
de datos en tiempo real. Los conjuntos de datos pequeños plantean un modelo en aplicaciones prácticas es fundamental. Muchos autores han
problema de sobreajuste en el modelo, que muestra una mayor precisión, propuesto implementar modelos en plataformas móviles. En las
pero no pueden manejar los datos de prueba más nuevos. implementaciones de la vida real, solo los ingenieros con antecedentes y
Por lo tanto, el modelo no es factible para la implementación en tiempo experiencia con servidores en la nube y DevOps pueden implementar
real. Algunos autores trabajaron con datos de CGM, que eran en tiempo modelos. En este proceso en curso, se deben considerar muchas cuestiones,
real, pero el entrenamiento del modelo con esos datos no fue eficiente. Los como la frecuencia con la que se deben mostrar las predicciones o la
conjuntos de datos también se seleccionaron de regiones particulares que cantidad de aplicaciones que se requieren para el procesamiento del modelo.
no son representativas de un sistema común. Aunque se tomaron precauciones considerables para garantizar que no
Diferentes regiones tienen diferentes personas y estilos de vida. hubiera discrepancias en el estudio, ningún estudio puede afirmar que es
En general, los investigadores pasan el 80 % de su tiempo limpiando y perfecto y siempre hay posibilidades de mejora. El desarrollo de un estudio
administrando datos para el entrenamiento de modelos. Por lo tanto, la más inquisitivo que proporcione una visión más profunda de los aspectos
que permiten el poder predictivo de los modelos en lugar de solo parámetros
complejidad de los datos conduce a costos y cargos de mantenimiento más elevados.
El siguiente paso es la selección de funciones. Mientras que algunos autores predefinidos como exactitud, precisión, puntaje F1, ROC y AUC sería
descuidaron algunas de las características, algunos las agruparon para un beneficioso en el futuro. Para la clasificación, para distinguir entre perfiles
entrenamiento factible. Cada conjunto de datos plantea el problema de tener diabéticos y normales, los esquemas basados en agrupaciones brindan
características apropiadas para satisfacer las necesidades de un único resultados precisos. Sin embargo, la mayoría de los algoritmos de
algoritmo. Una vez que todos los datos están disponibles, se finalizan las agrupamiento luchan con problemas de plugnplay, lo que significa que
pilas técnicas. Hay muchas herramientas disponibles para construir modelos generalmente contienen intervención humana durante la clasificación y el
de aprendizaje automático, pero también es necesario elegir un modelo para análisis, lo que implica la posibilidad de error.
optimizar el rendimiento. El siguiente desafío es la depuración. Esto se
vuelve fácil si se utilizan herramientas como Jupyter Notebooks donde el
código se divide en celdas. Esto se vuelve difícil cuando el
Machine Translated by Google
Tabla 4 Un estudio exhaustivo de los métodos de aprendizaje profundo realizado por algunos investigadores
Algoritmo Método utilizado/innovación Solicitud Resultados y limitaciones (si se Referencias
especifica)
Tabla 4 Un estudio exhaustivo de los métodos de aprendizaje profundo realizado por algunos investigadores (Continuación)
conjuntos de datos
Con la función de activación de ReLU en la
capa de entrada y las capas ocultas, la capa de
salida es sigmoide.
Tabla 4 Un estudio exhaustivo de los métodos de aprendizaje profundo realizado por algunos investigadores (Continuación)
Algoritmo Método utilizado/innovación Solicitud Resultados y limitaciones (si se Referencias
especifica)
atributos importantes que afectan a la un algoritmo ELM.
diabetes. ELM tiene una capacidad de
entrenamiento más rápida. Se utilizaron 320
muestras para entrenamiento y 480 para
entrenamiento.
Teniendo en cuenta todos los desafíos anteriores, todavía se puede Se han discutido métodos, comenzando desde diferentes algoritmos
considerar que se pueden superar en el futuro. Los académicos y los básicos como LR, SVM, DT, hasta una clasificación adicional que
médicos continuarán trabajando para construir conjuntos de datos incluye ID3, C4.5, C5.0, J48 y CART y NB. Los métodos de conjunto,
mejores y más grandes y diseñar modelos y algoritmos más eficientes como el embolsado, el refuerzo y los regresores de RF, se utilizan aún
para una mejor clasificación y precisión. Cualquiera de las más para mejorar la precisión y el rendimiento de los modelos. Estas
enfermedades que ocurren a gran escala, como la diabetes, puede técnicas se han implementado en todo tipo de plataformas como
controlarse mediante técnicas de inteligencia artificial y automatización. Python o MATLAB, y los modelos se han analizado utilizando diferentes
Se pueden crear modelos eficientes de última generación basados en parámetros como el área bajo la curva o matrices de confusión o
estudios que proporcionen una detección temprana de la diabetes y términos matemáticos como el RMSE o el MAE. El aprendizaje
que puedan ayudar a las personas a cambiar aún más su estilo de automático se ha introducido en los sistemas de diagnóstico médico,
vida. Debido a que el aprendizaje profundo funciona mejor en la ya que ha demostrado ser preciso en la detección, exitoso en la
mayoría de los conjuntos de datos, debe combinarse con diferentes aplicación a los tratamientos y más rentable. Aunque los anteriores
algoritmos para lograr una mayor precisión y rendimiento. Los son clasificadores muy fuertes, creemos que el aprendizaje profundo,
esquemas híbridos juegan un papel importante en la mejora del que es un subconjunto del aprendizaje automático, puede aprender
rendimiento de los modelos. A través de la detección temprana, los grandes cantidades de datos no estructurados y sin etiquetar.
pacientes pueden ser tratados mucho antes para evitar mayores
riesgos de problemas cardíacos en casos de diabetes. Cualquier
modelo que se pueda implementar en plataformas móviles debe Los modelos de aprendizaje profundo son más complejos y precisos.
atender a las masas en busca de su ayuda y ser representativo. Una Los diferentes modelos para el aprendizaje profundo comienzan desde
implicación de esta encuesta es que los modelos de aprendizaje las ANN más básicas hasta las redes convolucionales y las RNN
automático que han arrojado resultados eficientes pueden ser utilizados adicionales, incluidas LSTM y BiLSTM. También se han discutido las
por futuros investigadores para pulir y mejorar aún más, así como para redes de creencias temporales y profundas. Por el contrario, el
crear una tubería o un conjunto de modelos correctos y eficientes para aprendizaje profundo implica algunas deficiencias, como el aumento
aumentar las posibilidades de predecir la enfermedad. con aún más del tiempo de cálculo, los recursos y el ajuste frecuente de los
probabilidad. Dichos modelos se pueden improvisar aún más para parámetros. El aprendizaje profundo funciona mejor en conjuntos de
automatizar el sistema creado para que pueda manejar datos más datos de imágenes; por lo tanto, para el diagnóstico de diabetes, las
nuevos sin problemas. imágenes serían mejores. La mayoría de los investigadores han
implementado varios algoritmos tanto en el aprendizaje automático
Conclusiones como en el profundo para comparar su desempeño en los datos,
La diabetes puede ser devastadora después de un cierto período si no mientras que otros han combinado dos o tres métodos para obtener
se detecta o diagnostica correctamente. Muchos aprendizaje automático más precisión en un solo sistema.
Machine Translated by Google
Los investigadores, los médicos clínicos y la gente de la (eds) Ciencias de la computación ICCS 2004. 4ª conferencia internacional, Cracovia,
industria creen ampliamente que la inteligencia artificial tiene Polonia, junio de 2004. Apuntes de conferencias sobre ciencias de la computación, vol 3039.
Springer, Berlín, Heidelberg, págs. 11181125. https://doi.org/10.1007/978354 0259442_145
el poder de alterar las situaciones actuales de medicación Lassi M, Sonnenwald DH (2010) Identificación de factores que pueden afectar la adopción y el
tardía y detección debido a errores humanos. La 4. uso de un laboratorio de ciencias sociales: una síntesis de investigaciones previas. Inf Res15(3)
automatización tiene la capacidad de construir sistemas de
detección médica eficientes y confiables. El aprendizaje 5. Bonfiglio S (2012) El papel de las TIC en un cuidado de la salud que pasa de ser “centrado en la
automático, a través de sus potentes modelos predictivos y clínica” a “centrado en el paciente”. En: Donnelly M, Paggetti C, Nugent C, Mokhtari M (eds)
de clasificación, juega un papel importante para ayudar a conseguirlo.Análisis de impacto de soluciones para la prevención y gestión de enfermedades crónicas.
Décima conferencia internacional sobre hogares inteligentes y telemática de la salud, junio de
abreviaturas 2012. Apuntes de conferencias sobre informática, vol 7251. Springer, Berlín, Heidelberg, págs.
250253. https://doi.org/10.1007/9783642307799_37 6. Poston RS, Reynolds RB, Gillenson
ÓPTICA: Puntos de ordenación para identificar la estructura del racimo; DBSCAN: agrupación
ML (2006) Soluciones tecnológicas para
espacial de aplicaciones basada en la densidad; DM: Diabetes mellitus; BIRCH: Algoritmo de
mejorar la precisión y disponibilidad de los registros de atención médica. Inf Syst Manag
agrupamiento y reducción iterativo equilibrado que utiliza jerarquías; LSTM: memoria a largo
24(1):59–71. https://doi.org/10.1080/10580530601038097 7. Duan L, Street WN, Xu E (2011)
plazo; ID3: dicotomizador iterativo 3; SVM: máquina de vectores de soporte; KNN: Kvecinos
más cercanos; VP: Verdadero positivo; TN: Verdadero negativo; Sistemas de información de atención médica: métodos de extracción de datos en la creación de un
FP: falso positivo; FN: falso negativo; BLM: regresión logística binaria; sistema de recomendación clínica. Enterp Inf Syst 5(2):169–181. https://doi.org/
10.1080/17517575.2010.541287 Saiti K, Macaš M, Štechová K, Pithová P, Lhotská L (2017) Una
LMT: algoritmo de árbol del modelo logístico; ACC: La precisión de la clasificación;
8. revisión de la predicción de modelos en diabetes y del diseño de reguladores de glucosa basados
AUC: Área bajo la curva; LDA: análisis discriminante lineal; RNA: Red neuronal artificial;
RNN: Red neuronal recurrente; CNN: red neuronal convolucional; DNN: red neuronal en el control predictivo de modelos para el páncreas artificial. En: Bursa M, Holzinger A, Renda
profunda; MAE: Error absoluto medio; ME, Khuri S (eds) Tecnología de la información en informática biológica y médica. 8° congreso
CC: Coeficiente de correlación; TL: Retardo de tiempo; ROC: curva de funcionamiento del receptor; internacional ITBAM 2017, agosto 2017. Apuntes de cátedra en informática, vol 10443. Springer,
ELM: máquina de aprendizaje extremo; NIDDM: Diabetes mellitus no insulinodependiente; Cham, pp 1119. https://doi.org/10.1 007/9783319642659_6 Haritha R, Sureshbabu D,
IMC: índice de masa corporal; DT: Árbol de decisión; LR: regresión logística; Sammulal P (2019) Detección de diabetes mediante análisis de componentes principales y redes
neuronales. En: Santosh KC, Hegadi RS (eds) Tendencias recientes en procesamiento de
RF: bosque aleatorio; NB: Naïve Bayes; MLNN: red neuronal multicapa;
9. imágenes y reconocimiento de patrones.
RMSE: error cuadrático medio; EDM: Descomposición modal empírica
Agradecimientos Los
Segunda conferencia internacional, RTIP2R 2018, diciembre de 2018.
autores agradecen al Departamento de Ingeniería Electrónica y de Comunicaciones de la
Universidad de Nirma y al Departamento de Ingeniería Química de la Facultad de Tecnología Comunicaciones en informática y ciencias de la información, vol 1036. Springer, Singapur.
de la Universidad de Energía Pandit Deendayal por el permiso para publicar esta https://doi.org/10.1007/9789811391842_24 10. Chen Q, Alrowais R, Burhan M, Ybyraiymkul
investigación. D, Shahzad MW, Li Y et al (2020)
Un sistema de desalación solar autosostenible mediante tecnología de pulverización directa.
Contribuciones de los autores Energía 205:118037. https://doi.org/10.1016/j.energy.2020.118037 11. Kunekar
Todos los autores hacen contribuciones sustanciales a este manuscrito; TS y MS participaron PR, Gupta M, Agarwal B (2019) Detección y análisis del estilo de vida
en la redacción del manuscrito; TS escribió el manuscrito principal; todos los autores enfermedades basadas en la fase temprana de la vida: una encuesta. En: Somani AK,
discutieron los resultados y la implicación en el manuscrito en todas las etapas. Los autores Ramakrishna S, Chaudhary A, Choudhary C, Agarwal B (eds) Tecnologías emergentes en
leyeron y aprobaron el manuscrito final. ingeniería informática: microservicios en análisis de big data. Segunda conferencia internacional
ICETCE 2019, febrero de 2019. Communications in computer and information science, vol 985.
Springer, Singapur. https://doi. org/10.1007/9789811383007_6 12. Cahn A, Shoshan A, Sagiv
Financiamiento No aplicable. T, Yesharim R, Goshen R, Shalev V et al (2020)
Predicción de progresión de prediabetes a diabetes: desarrollo y validación de un modelo de
Disponibilidad de datos y materiales Todos
aprendizaje automático. Diabetes Metab Res Rev 36(2): e3252. https://doi.org/10.1002/dmrr.3252
los datos y materiales pertinentes se presentan en el documento principal.
Declaraciones 13. Thenappan S, Rajkumar MV, Manoharan PS (2020) Predicción de la diabetes
mellitus utilizando una máquina de vector de soporte modificada con seguridad en la nube.
IETE J Res. https://doi.org/10.1080/03772063.2020.1782781. (en prensa)
Conflicto de intereses Los
autores declaran que no tienen conflictos de intereses. 14. Bai BGM, Nalini BM, Majumdar J (2019) Análisis y detección de diabetes utilizando técnicas de
minería de datos: una aplicación de big data en el cuidado de la salud. En: Shetty NR, Patnaik
Detalles del autor LM, Nagaraj HC, Hamsavath PN, Nalini N (eds) Investigación emergente en computación,
1 información, comunicación y aplicaciones, vol 882. Springer, Singapur
Departamento de Electrónica y Tecnología de la Comunicación, Universidad de
2
Nirma, 382481 Ahmedabad, Gujarat, India. Departamento de Química
Ingeniería, Escuela de Tecnología, Universidad de Energía Pandit Deendayal, 382426 15. Shu T, Zhang B, Tang YY, Chengdu IEEE (2018) 1518 de julio de 2018. https://doi. org/10.1109/
Gandhinagar, Gujarat, India. ICWAPR.2018.8521271 16. Islam MT, Raihan M, Farzana F, Aktar N, Ghosh P, Kabiraj S
(2020) Típico
Recibido: 9 abril 2021 Aceptado: 29 octubre 2021 y predicción de enfermedades diabéticas atípicas utilizando un algoritmo de bosque aleatorio.
En: Resúmenes de la 11.ª conferencia internacional sobre tecnologías informáticas,
de comunicación y de redes, IEEE, Kharagpur, 13 de julio de 2020. https://doi.org/10.1109/
Referencias 1. ICCCNT49239.2020.9225430 17. Choudhury A, Gupta D (2019) Una encuesta sobre el
Nakahara T, Hyogo H, Yoneda M, Sumida Y, Sumida Y, Fujii H et al (2013) diagnóstico médico de la diabetes utilizando técnicas de aprendizaje automático. En: Kalita J,
La diabetes mellitus tipo 2 se asocia con la gravedad de la fibrosis en pacientes con Balas VE, Borah S, Pradhan R (eds) Desarrollos recientes en aprendizaje automático y
enfermedad del hígado graso no alcohólico en una gran cohorte retrospectiva de pacientes análisis de datos. Avances en sistemas inteligentes y computación, vol 740. Springer,
japoneses. J Gastroenterol 49(11):1477–1484. https://doi.org/10.1 007/s0053501309111 Singapur, pp 67–78. https://doi.org/10.1007/9789811312809_6 _
2. Solanki P, Baldaniya D, Jogani D, Chaudhary B, Shah M, Kshirsagar A (2021)
Inteligencia artificial: nueva era de transformación en el upstream del petróleo. Pet Res (en 18. Shukla AK (2020) Pronóstico de diabetes del paciente basado en el enfoque de aprendizaje
prensa). https://doi.org/10.1016/j.ptlrs.2021.07.002 3. Duplaga M (2004) El impacto de la automático. En: Pant M, Sharma TK, Arya R, Sahana BC, Zolfagharinia H (eds)
tecnología de la información en la calidad de los servicios de salud. En: Bubak M, van Albada GD, Sloot Computación blanda: teorías y aplicaciones. Avances en sistemas inteligentes y computación,
PMA, Dongarra J vol 1154. Springer, Singapur
Machine Translated by Google
19. Dalakleidi KV, Zarkogianni K, Karamanos VG, Thanopoulou AC, Nikita KS 37. Zou Q, Qu KY, Luo YM, Yin DH, Ju Y, Tang H (2018) Predicción de la diabetes
(2013) Un algoritmo genético híbrido para la selección de las características críticas para la mellitus con técnicas de aprendizaje automático. Frente Genet 9:515. https://doi. org/10.3389/
predicción del riesgo de complicaciones cardiovasculares en pacientes con diabetes tipo 2. En: fgene.2018.00515 38. Parthiban G, Srivatsa SK (2012) Aplicación de métodos de aprendizaje
Abstracts of the 13th IEEE international conference on BioInformatics and BioEngineering, Chania, automático en
1013 de noviembre de 2013. https://doi.org/10.1109/BIBE.2013.6701620 20. Islam MMF, Ferdousi diagnóstico de enfermedades del corazón para pacientes diabéticos. Int J Appl Inf Syst 3(7):25–30.
R, Rahman S, Bushra HY (2020) Predicción de probabilidad de diabetes en etapa temprana https://doi.org/10.5120/ijais12450593
utilizando técnicas de minería de datos. En: Gupta M, Konar D, Bhattacharyya S, Biswas S (eds) Visión 39. Challa M, Chinnaiyan R (2019) Enfoque de aprendizaje automático optimizado para
artificial e inteligencia artificial en el análisis de imágenes médicas. Avances en sistemas inteligentes y la predicción de la diabetes mellitus. En: Smys S, Tavares JMRS, Balas VE, Iliyasu AM (eds) Visión
computación, vol 992. Springer, Singapur, pp 113–125. https://doi.org/10.1007/9789811387982_12 computacional y computación bioinspirada. ICCVBIC 2019.
_ Avances en sistemas inteligentes y computación, vol 1108. Springer, Cham, pp 321–328. https://
doi.org/10.1007/9783030372187_37
40. Rakshit S, Manna S, Biswas S, Kundu R, Gupta P, Maitra S y otros (2017)
21. Harris MI, Klein R, Welborn TA, Knuiman MW (1992) El inicio de la NIDDM ocurre al menos 4 a 7 años Predicción de diabetes tipo II utilizando una red neuronal de dos clases. En: Mandal JK, Dutta P,
antes del diagnóstico clínico. Cuidado de la diabetes 15(7):815–819. https://doi.org/10.2337/ Mukhopadhyay S (eds) Inteligencia computacional, comunicaciones y análisis empresarial. Primera
diacare.15.7.815 _ 22. Ameena RR, Ashadevi B (2020) Análisis predictivo de mujeres diabéticas conferencia internacional, CICBA 2017, marzo de 2017. Communications in computer and
information science, vol 776. Springer, Singapur, 6571. https://doi.org/10.1007/9789811064302_6
pacientes usando R. En: Peter JD, Fernandes SL (eds) Simulación y modelado de sistemas para _ 41. Sapon MA, Ismail K, Zainudin S (2011) Predicción de la diabetes mediante el uso
computación en la nube y aplicaciones de big data. Elsevier Inc., Ámsterdam. https://doi.org/
10.1016/B9780128197790.00006X
23. Daanouni O, Cherradi B, Tmiri A (2019) Predicción de enfermedades diabéticas usando Red neuronal artificial. En: Resúmenes de la conferencia internacional de 2011 sobre circuitos,
datos mixtos y algoritmos de aprendizaje automático supervisado. En: Resúmenes de la 4.ª conferencia sistemas y simulación IPCSIT vol. 7, IACSIT Press, Singapur, 28 de mayo de 2011 42. Shanker MS
internacional sobre aplicaciones de ciudades inteligentes, ACM, Casablanca, 24 de octubre de 2019. (1996) Uso de redes neuronales para predecir la aparición de diabetes mellitus. J Chem Inf Comput Sci
https://doi.org/10.1145/3368756.3369072 24. Sisodia D, Sisodia DS (2018) Predicción de diabetes 36(1):35–41. https://doi.org/10.1021/ ci950063e
usando clasificación
algoritmos Procedia Comput Sci 132: 1578–1585. https://doi.org/10.1016/j. procs.2018.05.122 43. Temurtas H, Yumusak N, Temurtas F (2009) Un estudio comparativo sobre
Diagnóstico de enfermedades diabéticas mediante redes neuronales. Aplicación de sistema
25. Ahuja R, Sharma SC, Ali M (2019) Un modelo de predicción de enfermedades diabéticas basado en experto 36(4): 8610–8615. https://doi.org/10.1016/j.eswa.2008.10.032 44. Kumar A, Gupta PK,
algoritmos de clasificación. Ann Emerg Technol Comput 3 (3): 44–52. https://doi.org/10.33166/ Srivastava A (2020) Una revisión de las tecnologías modernas para abordar la pandemia de COVID19.
AETiC.2019.03.005 _ 26. Alehegn M, Joshi RR, Mulay P (2019) Análisis y predicción de la diabetes Diabetes Metab Syndr: Clin Res Rev 14(4): 569–573. https://doi.org/10.1016/j.dsx.2020.05.008 45.
utilizando bosques aleatorios, KNN, Naïve Bayes y J48: un enfoque conjunto. Int J Sci Technol Res 8(9):1346– Yahyaoui A, Jamil A, Rasheed J, Yesiltepe M (2019) Una decisión de apoyo
1354 27. Perveen S, Shahbaz M, Guergachi A, Keshavjee K (2016) Análisis de rendimiento de las
técnicas de clasificación de minería de datos para predecir la diabetes. sistema para la predicción de la diabetes utilizando técnicas de aprendizaje automático y
aprendizaje profundo. En: Resúmenes de la primera conferencia internacional de informática e
ingeniería de software, IEEE, Ankara, 6 y 7 de noviembre de 2019. https://doi.org/10.1109/
Procedia Comput Sci 82:115–121. https://doi.org/10.1016/j.procs.2016.04.016 UBMYK48245.2019.8965556
28. Khan NS, Muaz MH, Kabir A, Islam MN (2019) Una aplicación basada en el aprendizaje automático 46. Prabhu P, Selvabharathi S (2019) Modelo de red neuronal de creencias profundas para la
sistema inteligente para predecir la diabetes. Int J Big Data Anal Healthc 4(2):1. https://doi.org/ predicción de la diabetes mellitus. En: Resúmenes de la 3.ª conferencia internacional sobre
10.4018/IJBDAH.2019070101 29. NaiArun N, Moungmai R (2015) Comparación de clasificadores imágenes, procesamiento de señales y comunicación, IEEE, Singapur, 2729 de julio de 2019.
para el riesgo de https://doi.org/10.1109/ICISPC.2019.8935838 47. Idriss TE, Idri A, Abnane I, Bakkoury Z (2019)
predicción de diabetes Procedia Comput Sci 69:132–142. https://doi.org/10.101 6/j.procs.2015.10.014 Predicción de glucosa en sangre usando una red neuronal LSTM. En: Resúmenes de la conferencia
30. Kocher T, Holtfreter B, Petersmann A, Eickholz P, Hoffmann T, Kaner D et al (2019) Efecto del federada de 2019 sobre informática y sistemas de información, IEEE, Leipzig, 14 de septiembre de
tratamiento periodontal en HbA1c entre pacientes con prediabetes. J Dent Res 98(2):171–179. https://doi.org/ 2019. https://doi.org/10.15439/2019F159
10.1177/002203451 8804185
48. Jankovic MV, Mosimann S, Bally L, Stettler C, Mougiakakou S, Belgrade IEEE (2016) 2224 de
noviembre de 2016. https://doi.org/10.1109/NEUREL.2016.7800095 49. Song W, Cai WY, Li J, Jiang
31. Meng XH, Huang YX, Rao DP, Zhang Q, Liu Q (2013) Comparación de tres modelos de minería de FS, He SQ (2019) Predicción de los niveles de glucosa en sangre con datos de CGM basados en EMD y
datos para predecir diabetes o prediabetes por factores de riesgo. LSTM. En: Resúmenes de la 6.ª conferencia internacional sobre sistemas e informática, IEEE,
Kaohsiung J Med Sci 29(2):93–99. https://doi.org/10.1016/j.kjms.2012.08.016 32. Sheikhi G, Altınçay Shanghái, 24 de noviembre de 2019. https://doi.org/10.1109/ICSAI48974.2019.9010318 50. Zhang L,
H (2016) El costo de la diabetes mellitus tipo II: una perspectiva de aprendizaje automático. En: Kyriacou E, Zhu F, Xie L, Wang C, Wang J, Chen R et al (2020) Clínica
Christofides S, Pattichis CS (eds) XIV conferencia mediterránea sobre ingeniería médica y biológica
e informática 2016. Actas de IFMBE, vol 57. Springer, Cham, pp 818821. https://doi.org/ características de los pacientes con cáncer infectados con COVID19: un estudio de caso
10.1007/9783319327037_160 33. Iyer A, Jeyalatha S, Sumbaly R (2015) Diagnóstico de diabetes retrospectivo en tres hospitales dentro de Wuhan, China. Ann Oncol 31(7):894–901. https://
usando doi.org/10.1016/j.annonc.2020.03.296 51. Marco ML, Heeney D, Binda S, Cifelli CJ, Cotter PD,
Foligné B et al (2017)
clasificación de técnicas de minería. Int J Data Min Knowl Manag Process 5(1): 1–14. https://doi.org/ Beneficios para la salud de los alimentos fermentados: microbiota y más allá. Curr Opin
10.5121/ijdkp.2015.5101 Biotechnol 44:94–102. https://doi.org/10.1016/j.copbio.2016.11.010 52. Wu JH, Li J, Wang J,
34. Barik S, Mohanty S, Mohanty S, Singh D (2021) Análisis de la precisión de la predicción de la diabetes Zhang L, Wang HD, Wang GL et al (2020) Riesgo
utilizando técnicas de aprendizaje automático híbrido y clasificador. En: Mishra D, Buyya R, predicción de diabetes tipo 2 en trabajadores del acero basada en la red neuronal
Mohapatra P, Patnaik S (eds) Computación inteligente y en la nube. convolucional. Aplicación de computación neuronal 32(13):9683–9698. https://doi.org/10.1 007/
Innovación inteligente, sistemas y tecnologías, vol 153. Springer, Singapur, pp 399–409. https:// s0052101904489y
doi.org/10.1007/9789811562020_41 35. Ephzibah EP (2011) Un sistema experto híbrido genético 53. Wang LY, Mu Y, Zhao J, Wang XY, Che HL (2020) IGRNet: un modelo de aprendizaje profundo para
borroso para el diagnóstico efectivo de enfermedades cardíacas. En: Wyld DC, Wozniak M, Chaki N, el diagnóstico no invasivo y en tiempo real de la prediabetes a través de electrocardiogramas.
Meghanathan N, Nagamalai D (eds) Avances en informática y tecnología de la información. primera Sensores (Basilea) 20(9):2556. https://doi.org/10.3390/s2 0092556
conferencia internacional, ACITY 2011, julio de 2011. Communications in computer and information
science, vol 198. Springer, Berlin, Heidelberg, pp 115121. https://doi.org/10.1007/9783642225550_13 54. Ayon SI, Islam M (2019) Predicción de la diabetes: un enfoque de aprendizaje profundo. Int J Inf Ing
36. Zheng T, Xie W, Xu LL, He XY, Zhang Y, You MR et al (2017) Un marco basado en el aprendizaje Electron Bus 11(2):21–27. https://doi.org/10.5815/ijieeb.2019.02.03 55. Alhassan Z, McGough AS,
automático para identificar la diabetes tipo 2 a través de registros de salud electrónicos. Int J Med Alshammari R, Daghstani T, Budgen D, Moubayed NA (2018) Diagnóstico de diabetes mellitus tipo 2 a partir
Inform 97:120–127. https://doi.org/10.1016/j. ijmedinf.2016.09.014 de datos clínicos de series temporales utilizando modelos de aprendizaje profundo. En: Kůrková V,
Manolopoulos Y, Hammer B, Iliadis L, Maglogiannis I (eds) Redes neuronales artificiales y aprendizaje
automático ICANN 2018. 27.ª conferencia internacional sobre redes neuronales artificiales
Machine Translated by Google
redes, octubre de 2018. Apuntes de clase en informática, vol 11141.
Springer, Cham. https://doi.org/10.1007/9783030014247_46 56.
Kumar NM, Manjula R (2019) Diseño de perceptrón multicapa para el
diagnóstico de diabetes mellitus utilizando keras en aprendizaje profundo. En:
Satapathy SC, Bhateja V, Das S (eds) Computación y aplicaciones inteligentes
inteligentes. Innovación inteligente, sistemas y tecnologías, vol 104. Springer, Singapur
57. Mahajan AS (2020) Diagnóstico médico de diabetes mediante aprendizaje profundo
técnicas y análisis de big data. J Tecnología emergente Innov Res 7: 1490–1497
58. Deshmukh T, Fadewar HS, Shukla A (2020) La detección de Prameha
(diabetes) de forma ayurvédica con la ayuda del aprendizaje profundo difuso. En:
Gunjan VK, Diaz VG, Cardona M, Solanki VK, Sunitha KVN (eds) ICICCT 2019
Confiabilidad del sistema, control de calidad, seguridad, mantenimiento y gestión.
Springer, Singapur. https://doi.org/10.1007/9789811384615_17
Nota del editor Springer
Nature se mantiene neutral con respecto a los reclamos jurisdiccionales
en mapas publicados y afiliaciones institucionales.