Está en la página 1de 16

Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte  
(2021)  4:30  https://doi.org/10.1186/s42492­021­00097­7
computación  visual  para  la  industria,
Biomedicina  y  Arte

REVISIÓN Acceso  abierto

Una  revisión  exhaustiva  de  las  técnicas  de  
aprendizaje  automático  para  la  detección  de  diabetes
Toshita  Sharma1  y  Manan  Shah2*

Resumen

La  diabetes  mellitus  ha  sido  una  preocupación  creciente  debido  a  su  alta  morbilidad,  y  la  edad  promedio  de  los  individuos  afectados  por  esta  enfermedad  ha  
disminuido  ahora  a  la  mitad  de  los  veinte  años.  Dada  la  alta  prevalencia,  es  necesario  abordar  este  problema  de  manera  efectiva.  Muchos  investigadores  y  
médicos  ahora  han  desarrollado  técnicas  de  detección  basadas  en  inteligencia  artificial  para  abordar  mejor  los  problemas  que  se  pasan  por  alto  debido  a  errores  
humanos.  Técnicas  de  minería  de  datos  con  algoritmos  tales  como:  agrupamiento  espacial  basado  en  la  densidad  de  aplicaciones  con  ruido  y  puntos  de  orden  
para  identificar  la  estructura  del  agrupamiento,  el  uso  de  sistemas  de  visión  artificial  para  aprender  datos  en  imágenes  faciales,  obtener  mejores  funciones  para  
el  entrenamiento  de  modelos  y  diagnóstico  a  través  de  la  presentación  de  iridociclitis  para  la  detección  de  la  enfermedad  a  través  de  los  patrones  del  iris  han  
sido  desplegados  por  varios  profesionales.  Los  clasificadores  de  aprendizaje  automático,  como  las  máquinas  de  vectores  de  soporte,  la  regresión  logística  y  los  
árboles  de  decisión,  han  sido  discutidos  comparativamente  por  varios  autores.  Se  han  considerado  modelos  de  aprendizaje  profundo,  como  redes  neuronales  
artificiales  y  redes  neuronales  recurrentes,  con  un  enfoque  principal  en  la  memoria  a  corto  plazo  y  arquitecturas  de  redes  neuronales  convolucionales  en  
comparación  con  otros  modelos  de  aprendizaje  automático.  Por  lo  general,  se  utilizan  varios  parámetros,  como  el  error  cuadrático  medio,  los  errores  absolutos  
medios,  el  área  bajo  las  curvas  y  los  gráficos  con  criterios  variables.  En  este  estudio,  se  analizan  los  desafíos  relacionados  con  la  inadecuación  de  los  datos  y  la  
implementación  del  modelo.  También  se  ha  discutido  el  alcance  futuro  de  tales  métodos,  y  se  espera  que  los  nuevos  métodos  mejoren  el  rendimiento  de  los  
modelos  existentes,  permitiéndoles  lograr  una  mayor  comprensión  de  las  condiciones  de  las  que  depende  la  prevalencia  de  la  enfermedad.

Palabras  clave:  Aprendizaje  automático,  Aprendizaje  profundo,  Cuidado  de  la  salud,  Detección  de  diabetes

Introducción   las  personas  que  tienen  dolencias  prevalecientes  más  directamente,  
Dada  la  creciente  población,  es  necesario  desarrollar   y  este  grupo  comprende  la  mayoría  del  grupo  de  personas  
sistemas  para  mejorar  la  salud  y  mitigar  las  crecientes   afectadas  por  muchas  enfermedades  como  diabetes,  azúcar  en  la  
preocupaciones  en  todo  el  mundo.  A  medida  que  avanza  la   sangre  y  problemas  de  presión  arterial  [1].  Según  el  Informe  
investigación  científica,  el  desarrollo  de  dicho  sistema  se   Nacional  de  Estadísticas  de  Diabetes  2020,  cada  1  de  cada  10  
vuelve  más  eficiente.  Los  sistemas  de  salud  están  diseñados   personas  en  los  Estados  Unidos  tiene  diabetes,  y  los  nuevos  casos  
para  brindar  a  las  personas  los  requisitos  para  una  buena   de  diabetes  1  y  2  han  aumentado  significativamente  entre  los  jóvenes.
salud  y  realizar  la  detección  y  diagnóstico  de  enfermedades   Dado  que  la  salud  y  el  cuidado  de  la  salud  forman  pilares  críticos  
y  condiciones  correctamente  con  mayor  eficiencia,  tal  como   de  una  sociedad  saludable,  es  necesario  utilizar  las  capacidades  
lo  proponen  los  métodos  convencionales.  En  general,  los   de  los  métodos  computacionales  y  la  inteligencia  artificial  [2]  para  
pacientes  suelen  estar  muy  preocupados  por  la  calidad  del   desarrollar  nuevos  métodos  para  su  aplicación  en  los  sistemas  de  
sistema  de  salud  y  las  instalaciones  disponibles  para  brindar   salud  para  promover  una  sociedad  más  saludable  y  reducir  el  
riesgo  
tratamiento.  Los  beneficios  de  las  mejoras  en  los  sistemas  de  salud   de  tal  ae  
tienden   nfermedades  
afectar en  nuestras  generaciones,  aumentando  
aún  más  la  calidad  de  vida.
*  Correspondencia:  manan.shah@spt.pdpu.ac.in Ha  habido  un  gran  impacto  en  el  mundo  médico  con  el  avance  
2
Departamento  de  Ingeniería  Química,  Escuela  de  Tecnología,  Pandit
de  la  tecnología.  Los  resultados  de  salud  pueden  depender  de  una  
Universidad  de  Energía  Deendayal,  382426  Gandhinagar,  Gujarat,  India
La  lista  completa  de  información  del  autor  está  disponible  al  final  del  artículo. cuestión  de  segundos  para  las  personas  que

©  El(los)  autor(es).  Acceso  abierto  2021  Este  artículo  tiene  una  licencia  internacional  Creative  Commons  Attribution  4.0,  que  permite  
el  uso,  el  intercambio,  la  adaptación,  la  distribución  y  la  reproducción  en  cualquier  medio  o  formato,  siempre  que  se  otorgue  el  crédito  
correspondiente  al  autor  o  autores  originales  y  a  la  fuente. ,  proporcione  un  enlace  a  la  licencia  Creative  Commons  e  indique  si  se  
realizaron  cambios.  Las  imágenes  u  otro  material  de  terceros  en  este  artículo  están  incluidos  en  la  licencia  Creative  Commons  del  
artículo,  a  menos  que  se  indique  lo  contrario  en  una  línea  de  crédito  al  material.  Si  el  material  no  está  incluido  en  la  licencia  Creative  
Commons  del  artículo  y  su  uso  previsto  no  está  permitido  por  la  regulación  legal  o  excede  el  uso  permitido,  deberá  obtener  el  permiso  
directamente  del  titular  de  los  derechos  de  autor.  Para  ver  una  copia  de  esta  licencia,  visite  http://creativecommons.org/licenses/by/4.0/.
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  2  de  16

es  posible  que  no  pueda  llegar  a  un  hospital  o  recibir  tratamiento   algoritmos  como  los  árboles  potenciados  por  gradiente,  que  se  
de  emergencia.  La  tecnología  cierra  esta  brecha  en  distancia  y   pueden  usar  para  crear  modelos  predictivos  de  la  progresión  de  
recursos  para  todas  las  personas  a  las  que  se  extienden  sus   la  prediabetes  a  la  diabetes,  y  tienen  como  objetivo  proporcionar  
beneficios.  Se  han  desarrollado  varias  tecnologías  utilizando   un  diagnóstico  temprano  para  un  mejor  tratamiento  y  reducir  los  
máquinas  de  formación  de  imágenes  por  resonancia  magnética   riesgos  adicionales  [12].  Otro  estudio  aplicó  un  algoritmo  de  
en  la  tecnología  de  vídeo.  Las  aplicaciones  basadas  en  Internet   máquina  de  vector  de  soporte  modificado  (SVM)  como  un  método  
pueden  proporcionar  a  los  pacientes  servicios  personalizables.   eficiente  para  datos  tanto  lineales  como  no  lineales  [13].
Después  de  algunas  visitas  clínicas,  el  resto  del  trabajo  se  puede  
realizar  a  través  de  servicios  de  alta  tecnología  como  la  telesalud.   Desde  la  llegada  de  la  inteligencia  artificial  y  las  tecnologías  
Los  médicos  pueden  comunicarse  con  los  pacientes  a  través  de   relacionadas,  estos  métodos  computacionales  se  han  aplicado  a  
Internet  para  atender  mejor  sus  necesidades  [3].  Un  ejemplo  del   modelos  de  detección  en  tiempo  real  en  casi  todos  los  campos.  El  
uso  de  la  tecnología  de  video  implica  la  provisión  de  dicha   uso  de  minería  de  datos,  aprendizaje  automático,  aprendizaje  
mecanización  en  caso  de  emergencia  para  pacientes  con  trauma   profundo  y  visión  por  computadora  ha  reducido  drásticamente  la  
en  áreas  rurales  y  urbanas  donde  la  atención  clínica  puede  no   dificultad  de  estudiar  técnicas  más  nuevas  que  pueden  mejorar  
estar  disponible  [4].  La  tecnología  tiene  la  capacidad  de  permitir  la   significativamente  los  métodos  existentes.  En  la  siguiente  sección,  
atención  médica  domiciliaria  con  mayor  productividad  y  seguridad   se  analizan  los  algoritmos  y  métodos.
[5].  La  precisión  y  disponibilidad  de  los  datos  se  han  propuesto  
como  uno  de  los  problemas  más  importantes  que  enfrentan  los   Aplicación  de  última  tecnología  en  detección  de  diabetes  Los  
hospitales,  lo  que  implica  el  mantenimiento  y  procesamiento   algoritmos  utilizados  en  minería  de  datos,  aprendizaje  automático  
posterior  de  los  datos  de  los  pacientes.  Varios  algoritmos  en  el   o  cualquier  campo  de  la  inteligencia  artificial  realizan  modelado  
campo  del  aprendizaje  automático  y  el  aprendizaje  profundo  se   predictivo,  es  decir,  el  uso  de  datos  y  estadísticas  para  predecir  
han  aplicado  beneficiosamente  en  la  práctica  a  los  tratamientos   resultados  futuros  basados  en  datos  históricos.  Los  síntomas  más  
médicos.  Algunas  ideas  de  vanguardia  surgen  de  la  implementación   comunes  de  la  diabetes  incluyen  metabolismo  anormal,  
masiva  de  tecnologías,  como  la  creación  de  algoritmos  de   hiperglucemia  y  un  riesgo  asociado  de  complicaciones  específicas  
coincidencia  y  el  procesamiento  del  lenguaje  natural  [6].  La  minería   que  afectan  los  ojos,  los  riñones  y  el  sistema  nervioso,  que  son  
de  datos  se  puede  utilizar  para  extraer  datos  directamente,  en  lugar  de  
confiar  
partes   en  el  conocimiento  
importantes   de  D
del  cuerpo.   expertos.
ichos  síntomas  se  utilizan  para  
Se  considera  que  estos  métodos  producen  patrones  únicos  y   recopilar  datos  y  luego  se  realiza  el  modelado  en  función  de  las  
distintivos  para  crear  planes  personalizados  para  cada  hospital  [7]. categorías  de  edad  y  género.  Uno  de  esos  algoritmos  es  ordenar  
puntos  para  identificar  la  estructura  de  agrupamiento  (OPTICS),  
La  diabetes  mellitus  (DM)  es  una  de  las  enfermedades  más   que  es  un  conjunto  de  puntos  de  pedido  para  identificar  estructuras  
arquetípicas  a  nivel  mundial.  Es  una  enfermedad  que  implica  que   de  agrupamiento.  OPTICS  es  una  versión  avanzada  de  
los  sistemas  del  cuerpo  de  una  persona  no  pueden  funcionar  de   agrupamiento  espacial  de  aplicaciones  basado  en  la  densidad  
manera  eficiente  para  usar  la  energía  de  los  alimentos.  Se   (DBSCAN)  con  ruido,  y  elimina  todos  los  aspectos  negativos  de  
conocen  cuatro  tipos  principales  de  diabetes,  que  incluyen  el  tipo   DBSCAN.  El  método  de  agrupación  de  datos  utilizado  en  este  
1,  el  tipo  2,  la  gestacional  y  otras  formas,  siendo  los  más  comunes   algoritmo  es  un  algoritmo  iterativo  equilibrado  de  reducción  y  
el  tipo  1  y  el  tipo  2  [8].  La  diabetes  tipo  1  generalmente  ocurre  en   agrupación  que  utiliza  jerarquías  (BIRCH)  que  selecciona  los  
el  grupo  de  edad  joven  de  30  a  40  años  y  depende  de  la  insulina.   datos  más  adecuados  para  un  análisis  posterior.  Por  lo  tanto,  se  
Se  requiere  que  los  pacientes  tomen  dosis  de  insulina  durante   utiliza  la  técnica  de  minería  de  datos  naïve  Bayes  (NB),  y  BIRCH  
toda  su  vida.  Por  el  contrario,  el  tipo  2  predomina  en  la  cohorte  de   y  OPTICS  se  utilizan  para  agrupar  tipos  de  datos  similares  y  para  
más  de  40  años  y  suele  estar  relacionado  con  el  peso  de  los   identificar  el  algoritmo  correcto  para  una  mayor  precisión  [14].  
pacientes.  Se  sabe  que  la  diabetes  tipo  2  tiene  una  mayor   Apache  Spark  se  encuentra  entre  las  plataformas  de  análisis  de  
prevalencia  en  todo  el  mundo,  ya  que  representa  más  del  90  %   estado  de  más  rápido  crecimiento.  Opera  más  rápidamente  que  
de  los  casos  [9].  Debido  a  que  esta  enfermedad  ha  estado  durante   la  plataforma  Hadoop,  lo  que  la  hace  más  fácil  de  usar  y  aplicable  
mucho  tiempo  cerca  de  la  cima  de  las  clasificaciones  mundiales   a  la  práctica  clínica  [11].
que  enumeran  enfermedades  graves,  muchos  investigadores  y   Otra  aplicación  de  este  tipo  en  el  campo  de  OpenCV  es  el  uso  
médicos  han  propuesto  algoritmos  y  métodos  para  su  tratamiento   del  sistema  de  detección  de  DM  no  invasivo  asistido  por  
y  detección.  La  implementación  de  estos  algoritmos  tiene  sus   computadora.  Este  sistema  proporcionó  resultados  inmediatos  a  
raíces  en  las  disciplinas  de  aprendizaje  profundo  y  aprendizaje   partir  de  imágenes  faciales.  El  modelo  examinó  cuatro  bloques  de  
automático.  Con  el  análisis  predictivo  respaldado  por  redes   salud  de  la  piel:  frente,  mejilla  izquierda,  mejilla  derecha  y  puente  
neuronales,  específicamente  redes  neuronales  convolucionales   nasal.  Luego,  la  extracción  de  características  se  realizó  utilizando  
(CNN)  y  redes  neuronales  recurrentes  (RNN),  estos  métodos   un  patrón  binario  local  y  luego  la  clasificación  utilizando  el  
tienen  la  capacidad  de  determinar  sentimientos  y  aprender   agrupamiento  de  k­vecino  más  cercano  (KNN)  y  un  SVM.  Todas  
características  de  modelos  altos  automáticamente  [10,  11].   estas  características  se  conectaron  con  software  y  muestran  los  
resultados  
Algunos  investigadores  han  implementado  el  uso  del  aprendizaje  automático   en  tiempo  
a  través   de real  [15].
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  3  de  16

islam  et  al.  [16]  utilizaron  diferentes  algoritmos  para  un  conjunto  de   obtener  resultados  que  parecen  más  adecuados  para  aplicaciones  de  la  
datos  de  síntomas  de  diabetes,  incluidos  NB,  bosque  aleatorio  (RF),   vida  real.
regresión  logística  (LR)  y  un  árbol  de  decisión  (DT).  Primero,  el  conjunto   Choudhury  y  Gupta  [17]  utilizaron  diferentes  algoritmos  para  clasificar  
de  datos  con  el  sistema  del  paciente  se  ingresa  en  el  sistema  en  el  que   a  las  personas  en  dos  categorías:  individuos  de  alto  y  bajo  riesgo.  Usaron  
se  aplican  los  algoritmos  predictivos.  Después  de  esto,  el  conjunto  de   un  SVM  para  establecer  un  hiperplano  para  la  categorización,  una  
datos  se  ingresa  en  la  base  de  datos  y  se  observa  el  rendimiento  o  la   técnica  de  clasificación  KNN  para  agrupar  nuevos  datos  en  grupos,  
precisión  lograda  por  el  modelo. clasificadores  DT,  RF  y  NB,  y  el  método  de  clasificador  binario  llamado  
El  algoritmo  más  adecuado  se  selecciona  comúnmente  en  función  de  la   LR.  Al  comparar  las  precisiones  para  esta  clasificación  en  forma  de  
mayor  precisión  y  el  mejor  rendimiento.  Los  datos  del  usuario  se  toman   matriz  de  confusión,  como  se  muestra  en  la  Fig.  1,  se  encontró  que  el  
nuevamente  como  entrada  para  el  algoritmo  para  mayor  capacitación  y   algoritmo  LR  es  el  más  eficiente  y  preciso,  mientras  que  el  algoritmo  DT  
evaluación  para  aumentar  la  precisión  del  modelo  en  tiempo  real. logró  el  más  bajo.

Irido­diagnóstico  es  un  sistema  predictivo  en  el  que  la  enfermedad   precisión.
se  detecta  a  través  de  patrones  de  iris.  Esto  se  usó  para  la  detección  de   Shukla  [18]  usó  un  algoritmo  LR,  sacó  un  conjunto  de  datos  que  
diabetes  a  través  del  siguiente  método.  Los  datos  se  recopilaron  de   mostraba  que  se  obtendría  la  máxima  precisión  si  se  usaran  parámetros  
pacientes  diabéticos  y  no  diabéticos  en  los  que  se  realizó  un   como  la  glucosa,  el  índice  de  masa  corporal  (IMC)  y  los  embarazos,  que  
preprocesamiento.  La  siguiente  parte  se  denomina  segmentación  de   se  representaron  en  forma  de  gráfico  de  barras. ,  como  se  muestra  en  la  
imágenes,  en  la  que  el  iris  del  ojo  se  separa  de  la  imagen  en  el  conjunto   Fig.  2.  El  autor  también  intentó  mostrar  que  la  enfermedad  depende  
de  datos. predominantemente  de  aquellas  características  que  nos  parecen  escasas  
La  normalización  se  realiza  en  la  que  el  iris  circular  se  convierte  en  un   pero  que  los  médicos  han  señalado  como  relevantes  y  que  posiblemente  
rectángulo  mediante  el  mapeo  polar.  Luego  se  realiza  la  extracción  de   conduzcan  a  un  mayor  riesgo  de  enfermedades  posteriores.  El  modelo  
características  en  esta  imagen  final.  Se  utiliza  una  matriz  de  coocurrencia   LR  entrenado  con  las  características  dominantes  mostró  una  precisión  
de  nivel  de  gris  para  caracterizar  las  imágenes,  que  es  un  proceso  para   del  82,92%.  Para  el  pronóstico  del  modelo,  0.458  fue  la  probabilidad  de  
examinar  la  textura.  Este  proceso  asigna  números  del  1  al  8  a  las  áreas   clase  cero  y  0.572  para  la  clase  uno,  que  estima  la  probabilidad  de  que  
de  las  imágenes  calculando  con  qué  frecuencia  aparecen  en  la  imagen   una  persona  sea  diabética.
pares  de  píxeles  con  valores  específicos  y  en  una  relación  espacial  
específica. Dalakleidi  et  al.  [19]  usó  dos  conjuntos  de  datos  llamados  PID,  Caso  
En  esta  matriz,  las  características  como  el  contraste,  la  correlación,  la   1  e  Hippokrateion,  que  es  el  Caso  2  en  el  que  el  PID  se  divide  en  50  %  
disimilitud,  la  homogeneidad,  la  varianza  y  la  entropía  son  las   para  entrenamiento  y  50  %  para  prueba,  mientras  que  Hippokrateion  
características  pertinentes  para  proporcionar  datos  de  alta  calidad. tiene  una  bifurcación  de  70  %  para  entrenamiento  y  los  otros  30  %  para  
Estos  son  solo  algunos  de  los  autores  entre  muchos  que  han   las  pruebas.  Utilizaron  regresión  logística  binaria  (BLM),  algoritmo  de  
contribuido  a  la  literatura  en  este  campo.  A  continuación,  se  proporciona   árbol  modelo  logístico  (LMT),  que  es  una  combinación  de  aprendizaje  
un  estudio  detallado  de  la  metodología  utilizada  por  otros  investigadores   LR  y  DT  en  modelos  simples.  El  rendimiento  del  modelo  se  midió  
en  este  campo. utilizando  la  precisión  de  clasificación  (ACC)  y  el  área  bajo  la  curva  
(AUC).  BLM  logró  un  ACC  de  80,47  y  AUC  de  0,85,  mientras  que  LMT  
Aprendizaje  automático  en  la  detección  de   logró  un  ACC  de
diabetes  El  aprendizaje  automático  es  un  método  mediante  el  cual  un  
sistema  computacional  aprende  las  características  de  los  datos  de  
entrada.  Dichos  métodos  han  demostrado  su  eficacia  para  la  detección  de  la  diabetes.
Se  han  desarrollado  muchos  algoritmos  de  aprendizaje  automático,  
incluidos  métodos  de  aprendizaje  supervisado,  no  supervisado  y  de  
refuerzo.  Evidentemente,  esto  es  práctico  porque  los  métodos  de  
aprendizaje  automático  se  basan  en  datos.  Con  cantidades  tan  masivas  
de  datos  ingresados  en  la  base  de  datos,  el  aprendizaje  automático  
puede  ahorrar  un  esfuerzo  humano  considerable.  Los  modelos  se  
entrenan  con  estos  datos  y  proporcionan  la  salida  más  adecuada  en  
función  de  los  datos  de  entrada.  Los  modelos  se  pueden  entrenar  en  
cualquier  parámetro  que  sea  factible  para  la  practicidad  y  los  requisitos  
médicos.  Algunos  pueden  examinar  las  características  faciales,  mientras  
que  otros  buscan  datos  de  informes  de  sangre  obtenidos  de  pacientes.  
Debido  a  que  hay  muchos  síntomas  de  la  enfermedad,  los  parámetros  
varían  en  consecuencia.  Con  muchos  métodos  propuestos,  los   Fig.  1  Resultados  de  la  clasificación  de  SVM,  KNN,  NB,  DT  y  LR  en  forma  
de  verdadero  positivo  (TP),  falso  positivo  (FP),  verdadero  negativo  (TN)  y  
investigadores  probaron  varios  algoritmos  y  ajustaron  numerosos  
falso  negativo  (FN),  que  son  los  parámetros  de  la  matriz  de  confusión  [17 ]
hiperparámetros  para
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  4  de  16

no  eran.  El  mejor  resultado  se  logró  utilizando  el  algoritmo  de  
RF  con  una  precisión  del  99  %.  Por  lo  tanto,  es  un  algoritmo  
eficaz  para  un  conjunto  de  datos  recién  creado.  La  Figura  4  
muestra  exactamente  cómo  se  desempeñó  cada  algoritmo  en  
el  modelado  y  la  predicción.
harris  et  al.  [21]  realizó  un  diagnóstico  clínico  para  la  
detección  de  diabetes  mellitus  no  dependiente  de  insulina  
(NIDDM)  mediante  regresión  lineal  ponderada.  La  relación  
entre  la  prevalencia  de  la  retinopatía  y  la  duración  de  la  
Fig.  2  El  peso  de  cada  una  de  las  características  que  arrojan  la  variable   NIDDM  se  determinó  según  los  años  individuales  de  duración  
resultado  [18] y  se  evaluó  mediante  una  regresión  lineal  ponderada  con  
pesos  para  los  datos  de  cada  año  inversamente  proporcionales  
a  la  varianza  binomial.  El  autor  afirmó  que  la  condición  de  
77,6  y  AUC  de  0,84  en  el  Caso  1.  En  el  Caso  2,  el  BLM   retinopatía  es  un  parámetro  importante  para  el  diagnóstico  
superó  al  LMT  con  un  ACC  de  93,45,  mientras  que  el  LMT   precoz  de  la  enfermedad.  Por  lo  general,  aparece  casi  4  a  7  
tuvo  un  ACC  de  92,86. años  antes  del  diagnóstico  clínico  de  la  enfermedad.  La  figura  
islam  et  al.  [20]  utilizó  varios  algoritmos  para  analizar  un   5  proporciona  un  gráfico  preciso  de  los  resultados  obtenidos.
conjunto  de  datos  utilizando  los  algoritmos  NB  y  LR,  así  como  
el  algoritmo  RF,  después  de  aplicar  técnicas  de  evaluación   Ameena  y  Ashadevi  [22]  utilizaron  el  lenguaje  R  para  
de  división  porcentual  y  validación  cruzada  de  10  veces. construir  un  modelo  en  SVM,  DT,  RF  y  LR.  Utilizaron  un  
La  Figura  3  muestra  su  arquitectura  propuesta.  El  conjunto   conjunto  de  datos  de  768  mujeres,  todas  mayores  de  20  años.  
de  datos  contenía  registros  de  520  personas  a  las  que  se  les   Utilizaron  las  siguientes  características:  IMC,  azúcar  en  
preguntó  por  las  posibles  razones  de  la  diabetes.  Después   sangre,  número  de  embarazos  y  función  de  pedigrí  de  
del  procesamiento  previo  de  datos,  hubo  un  total  de  314   diabetes.  Se  definen  dos  clases:  1,  que  afirma  la  diabetes  y  0  
valores  positivos  y  186  valores  negativos.  Los  valores  positivos   para  la  negación.  En  una  comparación  de  las  precisiones,  el  
representan  que  la  persona  es  diabética  y  los  negativos  implican  qautor  
ue concluyó  que  el  algoritmo  RF

Fig.  3  Arquitectura  propuesta  del  sistema  de  detección  [16]
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  5  de  16

Tabla  1  Tabla  de  comparación  obtenida  para  el  modelo  KNN  y  
DT  en  conjuntos  de  datos  preprocesados  y  otros  sin  
preprocesamiento  [23]
Datos KNN  (k  =  2) DT

Con  preprocesamiento 0.9545 0.936

Sin  preprocesamiento 0.9318 0.9434

pliegues  Se  utilizaron  medidas  de  precisión,  medida  F,  
recuperación,  precisión  y  ROC.  Los  atributos  utilizados  fueron  la  
concentración  de  glucosa,  la  presión  arterial,  el  IMC,  la  edad,  el  
grosor  de  los  pliegues  cutáneos,  el  número  de  embarazos,  la  
Fig.  4  Rendimiento  de  cada  algoritmo  en  el  conjunto  de  datos  recién  
concentración  de  insulina  a  las  2  h,  la  función  genealógica  y  la  
adquirido  [20] clase  0  o  1.  En  el  modelado,  los  autores  calcularon  que  el  RN  
mostró  el  máximo  precisión  con  586  instancias  correctamente  
identificadas.  La  siguiente  Fig.  6  muestra  los  diferentes  tipos  de  
mostró  las  máximas  estimaciones  correctas,  con  una  precisión   clasificadores  utilizados  junto  con  el  número  de  instancias  clasificadas.
de  casi  el  77%  en  comparación  con  los  otros  modelos. Ahuja  et  al.  [25]  utilizaron  el  conjunto  de  datos  de  la  UCI  que  
Daanouni  et  al.  [23]  usó  KNN  y  el  algoritmo  DT  en  dos  conjuntos   contiene  768  registros  de  mujeres  en  los  que  500  eran  diabéticos,  
de  datos,  el  primero  con  2000  instancias  y  el  segundo  con  768.   mientras  que  los  268  restantes  no  lo  eran.  Los  autores  utilizaron  
Usaron  ocho  características  o  atributos  para  entrenar  el  modelo,   ocho  características  para  la  clasificación  y  aplicaron  una  técnica  
como  el  IMC,  la  glucosa,  el  azúcar  en  la  sangre  y  el  embarazo.   de  selección  de  características,  que  es  el  análisis  discriminante  
Los  autores  utilizaron  el  80%  para  entrenamiento  y  el  20%  restante   lineal  (LDA),  para  extraer  las  características  importantes  requeridas  
para  pruebas.  Utilizaron  hiperparámetros  optimizados  para  reducir   para  la  clasificación.  Utilizaron  cinco  tipos  de  clasificadores  para  
la  pérdida.  Los  resultados  se  grafican  en  dos  tipos  de  datos:   el  aprendizaje  automático,  incluidos  SVM,  DT,  LR,  RF  y  un  
preprocesamiento  y  sin.  La  comparación  de  resultados  se  realizó   perceptrón  multicapa.  Los  autores  utilizaron  cuatro  parámetros  
mediante  una  curva  operativa  del  receptor  (ROC).  El  autor   para  la  evaluación,  incluida  la  exactitud,  la  precisión,  el  recuerdo  
concluyó  que  KNN  tiene  una  precisión  máxima  del  97,53  %  y  un   y  la  puntuación  F.  Sobre  la  base  de  estos  parámetros,  los  autores  
AUC  de  0,9689.  La  Tabla  1  muestra  una  tabla  de  comparación  de   concluyeron  que  el  perceptrón  multicapa  produce  los  mejores  
las  precisiones  obtenidas  para  entrenar  el  modelo  utilizando  el   resultados.  La  Tabla  2  menciona  los  resultados  utilizando  
clasificador  KNN. diferentes  valores  de  validación  de  k­fold.
Alehegn  et  al.  [26]  utilizó  el  conjunto  de  datos  de  diabetes  indio  
Sisodia  D  y  Sisodia  DS  [24]  utilizaron  tres  clasificadores,   PIMA  con  ocho  características  para  entrenar  y  el  conjunto  de  
incluidos  SVM,  NB  y  DT.  La  clasificación  se  realiza  en  el  conjunto   datos  del  hospital  130  D  con  una  mayor  cantidad  de  valores.  Se  
de  datos  de  diabetes  india  de  PIMA,  que  es  el  conjunto  de  datos   utilizaron  cuatro  métodos  de  clasificación,  incluidos  los  algoritmos  
de  diabetes  india  de  PIMA  tomado  de  la  UCI.  Para  medir  la   RF,  KNN,  NB  y  J48­DT.  J48  es  una  versión  mejorada  del  algoritmo  
precisión,  la  validación  cruzada  interna  fue  10­ de  clasificación  Iterative  Dichotomiser  3  (ID3).  Se  utilizó  una  
validación  cruzada  de  10  K  para  el  90  %  de  entrenamiento  y  el  10  
%  de  prueba.  El  autor  construyó  un  híbrido.

La  figura  5  muestra  cómo,  en  el  momento  del  diagnóstico  clínico  de  NIDDM,  los   Fig.  6  Diferentes  algoritmos  de  clasificación  resultan  en  modelos  de  
pacientes  tenían  la  afección  prevalente  de  retinopatía  diabética. predicción  donde  NB  supera  a  los  otros  dos
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  6  de  16

Tabla  2  Resultados  de  precisión  de  diferentes  clasificadores  a  diferentes  valores  de  validación  k­fold  (%)
k­doblar Clasificador  de  vectores  de  soporte DT RF LR Perceptrón  multicapa

k  =  2 77.6 69 69,9 77.8 77.5

k  =  4 77.6 69,9 70 77.6 78.7

k  =  5 77.5 71.5 72,9 77.6 78.2

k  =  10 77.5 69.5 70 77.6 77.6

modelo  que  consta  de  todos  los  algoritmos  anteriores.  El  autor  concluyó   algoritmos  para  analizar  cuál  proporciona  el  máximo
que  NB  y  J48  son  buenos  para  grandes  cálculos  de  datos,  y  el   precisión.
clasificador  KNN  es  mejor  para  conjuntos  de  datos  más  pequeños.  La   Daanouni  et  al.  [23]  utilizó  ANN  y  DNN  en  dos  conjuntos  de  datos  de  
Figura  7  muestra  los  diferentes  algoritmos  utilizados  junto  con  las   2000  y  768  instancias.  Incluían  ocho  atributos  con  la  etiqueta  de  salida  
instancias  identificadas  correcta  e  incorrectamente. como  1  para  resultados  positivos  y  0  para  resultados  negativos.  La  red  
fue  entrenada  en  dos  tipos  de  datos:  preprocesados  y  no  preprocesados.  
Algunos  trabajos  más  realizados  por  otros  investigadores  que  se  han   El  modelo  DNN  parece  lograr  una  alta  precisión  tanto  en  los  datos  
mencionado  en  la  Tabla  3.  Contiene  un  estudio  de  los  algoritmos  de   obtenidos,  con  una  precisión  del  98  %  para  el  conjunto  de  datos  
aprendizaje  automático  utilizados  en  los  métodos. preprocesados  como  del  99,5  %  para  el  conjunto  de  datos  1.  En  el  
conjunto  de  datos  2,  los  datos  no  preprocesados  tuvieron  una  precisión  
Aprendizaje  profundo  en  la  detección  de   del  80,99  %  y  el  otro  96,35%.  Por  lo  tanto,  los  autores  concluyeron  que  
diabetes  El  aprendizaje  profundo  es  un  campo  computacional  que   DNN  es  un  clasificador  óptimo  para  la  detección  de  diabetes.
generalmente  está  involucrado  cuando  se  requiere  un  alto  poder  computacional.
El  aprendizaje  profundo  se  centra  en  las  redes  neuronales,  sus  tipos,   Rakshit  et  al.  [40]  usó  R,  SQL  y  Python  en  un  entorno  de  estudio  de  
épocas  de  entrenamiento,  capas  de  entrada  y  salida  ocultas.  La  capa   aprendizaje  automático  de  Microsoft  Azure  con  el  conjunto  de  datos  de  
de  entrada  es  la  primera  capa,  y  las  capas  ocultas  son  responsables  de   diabetes  PIMA,  en  el  que  el  80  %  se  usó  para  capacitación  y  el  otro  20  
todos  los  cálculos  y  manipulaciones,  como  circunvoluciones  y  agrupación.   %  para  pruebas.  Este  conjunto  de  datos  se  refiere  principalmente  a  la  
La  capa  de  salida  determina  el  número  de  clases  para  la  clasificación.   diabetes  en  las  mujeres.  Este  contiene  ocho  atributos  que  son  
Debido  a  que  el  aumento  de  datos,  lo  que  significa  ajustar  los  datos  para   importantes  para  la  construcción  de  modelos  para  una  red  neuronal  de  
aumentar  la  precisión,  también  está  disponible  en  el  aprendizaje   clase  2.  La  figura  8  muestra  la  representación  general  de  la  red  neuronal.  
profundo,  encuentra  muchas  aplicaciones  con  el  entrenamiento  de   La  capa  oculta  tenía  100  nodos,  con  la  capa  de  salida  conectada  a  la  
imágenes.  Cuantas  más  capas  tiene  la  red,  más  es  capaz  de  clasificar.   enésima  capa  oculta.  Con  el  modelo  entrenado  durante  más  de  1000  
Debido  a  las  muchas  ventajas,  se  ha  utilizado  ampliamente  en  el  campo   épocas  con  una  tasa  de  aprendizaje  de  0,01,  lograron  una  precisión  del  
de  la  medicina  para  calcular  resultados  con  gran  precisión.  Existen   83,3  %  en  un  conjunto  de  datos  con  262  casos  negativos  y  131  casos  
diferentes  tipos  de  redes  con  las  redes  neuronales  artificiales  (ANN)  más   positivos.
competentes,  redes  neuronales  profundas  (DNN),  CNN  y  RNN.  Muchos  
investigadores  que  trabajan  para  la  detección  de  una  enfermedad   Sapón  et  al.  [41]  presentó  la  predicción  de  la  diabetes  mediante  ANN  
comparan  el  aprendizaje  automático  y  el  aprendizaje  profundo supervisadas.  El  conjunto  de  datos  comprende  aproximadamente  250  
pacientes  con  27  variables  o  características,  donde  exactamente  el  50  
%  se  usó  para  entrenamiento,  mientras  que  el  50  %  restante  se  usó  
para  probar  con  la  herramienta  MATLAB.  Los  algoritmos  de  gradiente  
utilizados  incluyeron  el  gradiente  conjugado  de  Fletcher­Powell,  el  
gradiente  conjugado  de  Polak­Ribiére  y  el  gradiente  conjugado  escalado.  
Estos  algoritmos  se  usaron  para  entrenar  el  modelo  y  luego  se  analizaron  
usando  el  coeficiente  de  correlación  (CC)  R.  Los  resultados  de  estos  
algoritmos  se  trazan  en  diferentes  épocas  contra  el  error  cuadrático  
medio.
Con  base  en  una  comparación  de  los  valores  de  R,  los  autores  concluyen  
que  el  gradiente  conjugado  escalado  confirma  la  mayor  precisión  con  
un  valor  de  0,88,  seguido  del  gradiente  conjugado  de  Fletcher­Powell  
con  un  valor  de  0,097219  y,  finalmente,  el  conjugado  de  Polak­Ribiére  
gradiente  con  0.056466.

Fig.  7  Precisión  de  los  algoritmos  de  clasificación  en  el  conjunto  de  datos  de  diabetes   referencias  [31,  42]  ambos  realizaron  la  detección  usando  una  ANN.
indio  PIMA.  El  modelo  híbrido  propuesto  muestra  la  máxima  precisión
Árbitro.  [42]  usó  el  conjunto  de  datos  de  población  india  PIMA  para  
mujeres  en  Phoenix,  mientras  que  [31]  realizó  este  algoritmo
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  7  de  16

Tabla  3  Un  estudio  exhaustivo  de  los  métodos  de  aprendizaje  automático  realizado  por  algunos  investigadores
Algoritmo  Método  utilizado/innovación Aplicación  y  trabajo  futuro Resultados  y  limitaciones  (si  se   Referencias
especifica)

J48, El  modelo  se  realizó  en  el  conjunto  de  datos  de  la   El  autor  afirmó  que  estos  algoritmos  de   El  algoritmo  AdaBoost  con  el  J48  como   [27]


AdaBoost  y   Red  de  Vigilancia  Centinela  de  Atención  Primaria   conjunto  se  pueden  usar  en  otros  conjuntos  de   clasificador  base  mostró  la  máxima  precisión  
embolsado   de  Canadá  con  varias  funciones  para  entrenar.  El   datos  de  enfermedades  para  aumentar seguido  por  el  embolsado  y  luego  el  clasificador  
en  el  clasificador   autor  utilizó  métodos  de  conjunto  AdaBoost  en  el   precisión. J48.
base clasificador  base  J48  DT. El  AROC  se  utilizó  como  parámetro.

NB  con   El  conjunto  de  datos  utilizado  fue  el  PIMA   Al  recopilar  una  gran  cantidad  de  datos  para  el   Los  parámetros  utilizados  para  la  evaluación   [28]


agrupamiento Indians  Diabetes  Dataset  con  ocho  atributos. entrenamiento,  la  precisión  se  puede  aumentar   son  la  precisión,  la  sensibilidad  y  la  
El  modelo  es  NB  realizado  en  agrupamiento   muchas  veces,  ayudando  a  las  personas  a   especificidad.  El  modelo  con  agrupamiento  
previo.  Este  modelo  se  compara  solo  con  el  modelo   desarrollar  un  sistema  que  les  brinde  una   mostró  un  aumento  del  10  %  en  la  precisión,  un  
NB.  Quinientos  treinta  y  un  casos  de  datos  se   predicción  correcta  sin  tener  que  consultar  a  un   aumento  de  la  sensibilidad  del  53,11  %,  pero  la  
dividieron  en  5  grupos.  El  cuarto  grupo  fue  el  único   médico. limitación  causada  aquí  fue  la  caída  de  la  
que  se  usó  para  las  pruebas,  que  constaba  de  148   especificidad  del  10,99  %  y  también  una  cantidad  
instancias. reducida  del  conjunto  de  datos.

DT,  LR  y Los  conjuntos  de  datos  iniciales  se  recopilaron  del  modelo  final  obtenido  con  las  unidades  de   Los  siguientes  datos  muestran  la   [29]


NB  con   atención  primaria,  que  (a  través  de  una  mayor  precisión  adicional  
se  
constaba   die  
mplementó   en  yu  n  
11  funciones   cambio)  
una  
aplicación  web   precisión  con  embolsado  y  refuerzo.
embolsado   comercial.  datos  de  30122  personas.  Los  tres  algoritmos  sy  
e  
ruefuerzo,  
tilizan  junto  
que  cson  lpos  
ara  
mdétodos  
isminuir  
de  
eel  mbolsado  
sobreajuste   DT  85.090,  LR  82.308,  NB  81.010,  
y  refuerzo y  aumentar  la  precisión. embolsado  con  DT  (BG+DT)  85.333,  
embolsado  con  LR  (BG+LR)  82.318,  
embolsado  con  NB  (BG+NB)  80.960,  
reforzado  con  DT  (BT+DT)  84.098,  reforzado  
con  LR  (BT+LR)  82.312,  y  refuerzo  con  NB  
(BT+NB)  81.019.  RF  85.558  muestra  la  máxima  
precisión.
El  ROC  se  utilizó  para  la  validación  final.

LR,  KNN, El  autor  recopiló  un  conjunto  de  datos  sin  procesar  del  hospital  médico  Noakhali  que  contiene  El  autor   El  clasificador  RF  fue  el  algoritmo  que  mejor   [30]


SVM,  LDA, propuso  que  podemos  mejorar  la  precisión  de  las  primeras  
9843  
por   muestras  
ciento   con  14  atributos.  
del  tratamiento   El  ochenta  
para  disminuir  el   se  desempeñó  en  la  clasificación  de  datos  y  LR  
NB,  DT  y sufrimiento  de  los  datos  se  tomó  para  entrenar  a  los  pacientes.  
prueba.  
Además,  
Todos  lpos  
odemos  
algoritmos  
y  el  riesto  
mplementan  
para  la   mostró  el  peor  desempeño.  Aunque  los  
RF más  clasificadores  para  recoger  elegidos  por  el  autor,  se  umodelos  
saron  para  
epl  recedentes  
sin   líder  para  la  
cluego  
y  onstrucción   de  
la  validación   clasificadores  de  aprendizaje  automático  se  usan  
fue  el  rendimiento  y  se  extendió  para  que  se  realizara  automáticamente  
de  mación. en  ellos  usando  k­fold.  análisis   ampliamente,  todavía  carecen  de  precisión  frente  
a  los  modelos  de  aprendizaje  profundo.

LR  y  DTs  El  conjunto  de  datos  se  elaboró  mediante  un   Recientemente,  muchos  investigadores   LR  logró  un  ACC  del  76,54  %,  una   [31]


cuestionario  realizado  a  1487  individuos  de   han  estado  implementando  varios   sensibilidad  del  79,4  %  y  una  especificidad  del  
los  que  735  eran  diabéticos  y  los  752  restantes   algoritmos  y  redes  para  compararlos  y  encontrar   73,54  %  en  los  datos  de  prueba,  mientras  que  el  
negativos.  A  todas  las  características  se  les  realizó   el  más  factible.  Los  DT  y  LR  se  encuentran  entre   DT  obtuvo  una  precisión  del  76,97  %,  una  
la  prueba  chi­cuadrado  de  Pearson.  El  rendimiento   los  más  utilizados. sensibilidad  del  78,11  %  y  una  especificidad  del  
de  los  modelos  se  evaluó  en  tres  parámetros:  precisión,   75,78  %.  En  general,  el  modelo  DT  funcionó  mejor  
sensibilidad  y  especificidad. que  el  modelo  LR.
El  modelo  plantea  una  limitación  del  conjunto  
Aparte  de  esto,  también  se  construyó  una  matriz  de   de  datos.  Se  recopila  solo  de  un  área  de  China,  
confusión  para  determinar  el  rendimiento  del  modelo. si  se  hubiera  recopilado  de  diferentes  regiones,  
la  implementación  del  modelo  podría  ser  más  
práctica.

El  conjunto  de  datos  anónimos  de  fusión  de  SVM  y  LR  Practice  fue LR  es  un  modelo  ampliamente  utilizado  en   Al  usar  un  subconjunto  más  pequeño  de   [32]


utilizado  para  el  estudio  tomado  de  Kaggle  que   salud  pública  y  práctica  clínica  para  la  detección   funciones,  el  modelo  LR  se  desempeñó  
contiene  datos  de  aproximadamente  10000   de  enfermedades  y  el  cálculo  de  riesgos. ligeramente  mejor  que  el  modelo  SVM.
pacientes.  Las  características  se  dividieron  en  línea  
base,  prueba  de  laboratorio,  diagnóstico  y  
medicación.  Para  la  tarea  de  clasificación  se  
desplegaron  LR  y  SVM.  El  modelo  LR  se  implementó  
usando  la  función  GLM  y  el  SVM  se  usó  en  un  
núcleo  lineal.
El  área  bajo  la  ROC  fue  el  parámetro  utilizado  para  
la  evaluación.

DT  y  NB  El  conjunto  de  datos  considerado  fue  la  base  de  datos  de   El  autor  propuso  recopilar  información   Utilizando  una  división  porcentual  de  70:30,  el   [33]


diabetes  india  PIMA.  Al  aplicar  la  selección  de   para  el  conjunto  de  datos  de  diferentes   algoritmo  J48  DT  clasificó  correctamente  177  
características,  el  autor  obtuvo  cinco  características.   personas  para  hacer  un  modelo  más   instancias  (76,95  %),  mientras  que  el  NB  obtuvo  
Se  usó  una  validación  cruzada  de  10  veces  para  la   representativo.  El  trabajo  puede  mejorarse  aún   una  precisión  del  79,56  %.  La  precisión  obtenida  
preparación  de  datos,  después  de  lo  cual  se  usó  el   más  para  incluir se  desempeñó  mejor  en  la  división  porcentual,  lo  
algoritmo  J48:  DT  y automatización. que  muestra
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  8  de  16

Tabla  3  Un  estudio  exhaustivo  de  los  métodos  de  aprendizaje  automático  realizado  por  algunos  investigadores  (Continuación)
Algoritmo  Método  utilizado/innovación Aplicación  y  trabajo  futuro Resultados  y  limitaciones  (si  se   Referencias
especifica)

Se  aplica  NB.  El  rendimiento  del  modelo  se  evaluó   los  modelos  no  muestran  una  buena  precisión  
utilizando  el  error  absoluto  medio  (MAE),  el  error   en  conjuntos  de  datos  más  grandes.
cuadrático  medio  (RMSE),  el  error  absoluto  relativo,  el  
error  cuadrático  relativo  de  la  raíz  y  la  estadística  kappa.

Aumento  de   El  autor  utilizó  el  conjunto  de  datos  de  diabetes   El  autor  sugiere  el  uso  de  más  algoritmos  en  esta   La  precisión  obtenida  con  el  clasificador   [34]


RF  y  XG PIMA.  Usando  Jupyter  Notebook  como  un  IDE,  el  autor   rama  del  aprendizaje  automático  como  modelo   RF  resultó  ser  del  71,9  %.  El  modelo  híbrido  
entrena  el  modelo  usando  8  atributos  del  total  de  9   híbrido  para  una  mejor propuesto  a  través  de  XG  boost  obtuvo  una  
proporcionados  en  el  conjunto  de  datos.  Los  algoritmos   precisiones. precisión  del  74,1  %.
utilizados  fueron  RF  y  XGBoost.  Después  de  establecer   Las  precisiones  obtenidas  en  los  modelos  fueron  
los  hiperparámetros,  se  entrenaron  los  modelos. comparativamente  menores  en  comparación  con  
las  ya  disponibles.  El  ajuste  de  hiperparámetros  
debe  configurarse  mejor  para  optimizar  el  algoritmo.

DT  (J48)  y El  autor  utilizó  el  conjunto  de  datos  de  diabetes  india   En  el  futuro,  está  previsto  recopilar  la  información   El  algoritmo  J48  tuvo  una  precisión  del   [33]


nótese  bien
PIMA  con  8  atributos,  que  se  redujo  a  5  según  la   de  diferentes  lugares  del  mundo  y  crear  un   76,95  %  con  otros  parámetros  como  la  
selección  de  funciones.  El  preprocesamiento  se  realizó   modelo  profético  más  preciso  y  general  para  la   estadística  kappa,  MAE,  RMSE,  error  absoluto  
utilizando  WEKA  utilizando  una  validación  de  10  veces.   conclusión  de  la  diabetes.  El  estudio  futuro   relativo  y  error  absoluto  relativo  raíz.  El  
El  modelo  se  creó  utilizando  el  conjunto  de  datos  del  70   también  se  centrará  en  recopilar  información  de   algoritmo  NB  tuvo  una  precisión  de  hasta  el  
%  y  el  resto  se  utilizó  para  las  pruebas. un  período  de  tiempo  posterior  y  descubrir  nuevos   79,56  %.  Dado  que  este  modelo  no  está  
elementos  de  pronóstico  potenciales  para   configurado  de  manera  óptima,  un  modelo  
incorporar.  El  trabajo  se  puede  ampliar  y  mejorar   desarrollado  requeriría  más  datos  de  entrenamiento  
para  la  automatización  del  análisis  de  diabetes. para  su  creación  y  prueba.

Genético Este  trabajo  es  un  modelo  que  implementa  los   El  trabajo  propuesto  ayuda  a  minimizar  el  costo   A  través  de  este  enfoque  de  GA,  la  precisión   [35]


algoritmos   algoritmos  genéticos  y  difusos  para  la  predicción  efectiva   y  aumentar  la  precisión  y  puede  usarse  en  el   aumentó  hasta  el  87  %  y  el  costo  de  
con  lógica   de  enfermedades.  Para  la  implementación  de  GA  se   futuro  para  mejores  implementaciones. capacitación  se  redujo  en  más  de
difusa utilizó  MATLAB  R2006b.  El  principio  de  selección  de   50%.
características  se  implementó  utilizando  algoritmos  de  
lógica  difusa.  En  primer  lugar,  se  realizó  un  mapeo  
simultáneo  basado  en  una  medida  de  adecuación  de  
los  valores  de  las  variables  a  cada  clase  utilizando  
funciones  de  pertenencia  adecuadas  según  cada  tipo  
de  característica.  Luego,  se  propusieron  mecanismos  
simples  de  razonamiento  difuso  para  tratar,  de  manera  
unificada,  la  clasificación.

k­NN,  NB, Estos  modelos  se  crearon  en  comparación  Una  aplicación  de  genoma  completo  para  la  detección  de   El  modelo  propuesto  se  evaluó  sobre  la  base   [36]


DT,  RF,  SVM diabetes  tipo  2.  Se  tomaron  un  total  de  asociación  y  asociación  
161  
ffenomenal  
ueron  estudio  
300  d
me  
uestras  
asociación  
de  las  
en  
ceuales  
speranza   de  la  exactitud,  precisión,  especificidad,  
LR para  su  asociación  diabética,  60  no  diabética  y  el  resto  fueron  
asociación  
Ucsando  
confirmado.   on  DM.  
el  R esultó  ser  
resumen   ucn  
de   no  
aracterísticas,   sensibilidad  y  AUC.  El  algoritmo  propuesto  
se  seleccionaron  asociaciones  importantes  para  futuras  ocho  características  con  los  modelos. obtuvo  un  AUC  de  0,98,  que  supera  el  AUC  de  
última  generación  de  0,71.

Herramienta  WEKA  utilizada.  Estos  algoritmos  se  
utilizaron  contra  un  marco  propuesto  que  extrae  
automáticamente  patrones  de  tipo  2
MD.

LR,  DT,  RF, El  autor  utilizó  el  conjunto  de  datos  de  mujeres  indias   El  autor  propuso  crear  modelos  avanzados   Se  compararon  diferentes  modelos  sobre  la  base   [22]


MVS PIMA  relacionado  con  la  salud  de  las  mujeres  con  8   en  RF  debido  a  su  mayor  precisión  y  capacidad   de  la  precisión.  RF  obtuvo  la  mayor  precisión  con  
atributos.  Se  entrenaron  diferentes  modelos  para  este   para  superar  el  sobreajuste. un  77,06  %,  seguida  de  SVM.
conjunto  de  datos  bajo  diferentes  hiperparámetros.

DT  –  J48,  RF  El  autor  obtuvo  un  conjunto  de  datos  de  Luzhou  del  examen   El  autor  esperaba  poder  predecir  el  tipo  de  diabetes   Los  algoritmos  RF  y  J48  lograron  una   [37]


físico  del  hospital.  Se  tomó  un  conjunto  de  prueba   utilizando  un  conjunto  de  datos  que  contenía  los   precisión  del  73,95  %  y  el  73,88  %,  
independiente  con  13700  muestras.  Los  datos  contenían   datos  necesarios,  lo  que  supondría  una  ventaja   respectivamente,  en  el  conjunto  de  datos  de  
14  atributos.  Otro  conjunto  de  datos  fue  el  conjunto  de   adicional  para  mejorar  la  precisión. Luzhou  y  del  71,44  %  y  el  71,67  %,  
datos  de  diabetes  india  PIMA.  El  algoritmo  DT  y  RF  se   respectivamente,  en  el  conjunto  de  datos  de  PIMA.
implementaron  en  WEKA  con  análisis  de  componentes  
principales.
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  9  de  16

Tabla  3  Un  estudio  exhaustivo  de  los  métodos  de  aprendizaje  automático  realizado  por  algunos  investigadores  (Continuación)
Algoritmo  Método  utilizado/innovación Aplicación  y  trabajo  futuro Resultados  y  limitaciones  (si  se   Referencias
especifica)

NB  y  SVM  El  conjunto  de  datos  de  pacientes  de  500  registros  se   Clasificadores  de  este  tipo  pueden  ayudar   NB  pudo  clasificar  correctamente  el  74  %   [38]


recopiló  del  instituto  de  atención  médica  para   en  la  detección  temprana  de  la  vulnerabilidad  de   de  las  instancias.  Para  SVM,  la  precisión  
la  diabetes  que  tiene  síntomas  de  enfermedad   un  paciente  diabético  a  enfermedades  del  corazón. obtenida  fue  del  95,6  %.
cardíaca.  El  conjunto  de  datos  contenía  9  atributos.   Allí,  los  pacientes  pueden  ser  advertidos  
Ambos  algoritmos  se  implementaron  en  el  conjunto   de  cambiar  su  estilo  de  vida.
de  datos  WEKA.  Para  SVM,  se  utilizó  un  kernel  de   Esto  se  traducirá  en  la  prevención  de  que  los  
función  de  base  radial. pacientes  diabéticos  se  vean  afectados  por  
enfermedades  del  corazón,  lo  que  resultará  en  
bajas  tasas  de  mortalidad,  así  como  la  reducción  
de  los  costos  de  salud  para  el  estado.

DT,  SVM, El  autor  utilizó  el  conjunto  de  datos  indio  PIMA. El  beneficio  de  este  modelo  optimizado   Los  modelos  se  comparan  sobre  la  base  de   [39]


RF  K­NN Luego,  se  realizó  la  normalización  de  datos   de  aprendizaje  automático  es  que  es  adecuado   la  precisión,  la  sensibilidad  y  la  especificidad.  
seguida  de  la  selección  de  características. para  pacientes  con  DM  y  se  puede  aplicar  a   DT  tiene  una  precisión  del  78,25%.
todos  los  campos  de  los  entornos  de  atención  
médica.

en  un  modelo  de  cuestionario  que  contenía  datos  de  1487  personas   Árbitro.  [44]  usó  el  conjunto  de  diabetes  PIMA  y  calculó  el  modelo  
con  resultados  positivos  y  negativos.  Las  características  que   usando  una  ANN  y  usó  ocho  características  para  modelar.  El  autor  
siguieron  siendo  comunes  para  el  modelado  fueron  el  IMC,  la   explicó  las  diferentes  funciones  utilizadas  para  el  preprocesamiento  
edad,  el  peso,  el  estado  civil,  los  embarazos  y  la  ref.  [31]  recopilaron   y  entrenamiento  de  modelos.  La  función  de  activación  era  una  
una  gran  cantidad  de  variables,  como  el  consumo  de  alcohol,   función  sigmoidea,  y  se  usa  retropropagación  para  calcular  el  
carne,  consumo  de  cigarrillos,  variedad  de  bebidas  y  sus  recuentos   gradiente  de  la  función  de  pérdida.
y  la  rutina  de  ejercicio  y  sueño. La  función  de  error  calculó  el  error  final  en  aproximadamente  un  
Considerando  la  estructura  de  la  ANN,  ref.  [31]  tenía   8  %  al  final  de  la  construcción  del  modelo.  Los  resultados  fueron  
aproximadamente  15  nodos  ocultos,  mientras  que  los  mismos   validados  en  ROC  y  RMSE.  El  autor  logró  un  área  ROC  de  0.88  y  
variaban  de  0  a  5  en  la  ref.  [42].  Árbitro.  [31]  logró  un  ACC  de   RMSE  igual  a  0.39,  lo  cual  es  un  clasificador  FAIR.  La  figura  9  
73,52%  frente  a  la  ref.  [42],  quienes  lograron  una  precisión  del   muestra  los  resultados  representados  en  forma  de  líneas.
80,21  %  en  los  datos  de  prueba.
Árbitro.  [43]  realizó  un  estudio  comparativo  de  redes  neuronales   Árbitro.  [29]  usó  una  ANN  para  su  modelo  entrenado  sobre  un  
en  la  detección  de  diabetes.  Usando  nuevamente  el  conjunto  de   conjunto  de  datos  que  consta  de  más  de  30000  instancias  y  11  
diabetes  indio  PIMA,  usaron  las  ocho  características  comunes   características  para  entrenar.  Con  las  capas  ocultas  igual  a  12,  los  
requeridas  para  la  preparación  del  modelo.  Con  los  primeros  576   valores  de  las  capas  se  calcularon  usando  la  función  sigmoidea.  
casos  utilizados  para  la  prueba,  utilizaron  una  técnica  de  validación   Se  implementaron  métodos  de  ensacado  y  refuerzo.  También  se  
cruzada  de  10  veces  para  estimar  los  resultados.  El  autor  utilizó   configuró  el  embolsado  para  reducir  la  varianza  en  el  modelo,  y  se  
una  red  neuronal  multicapa  (MLNN)  con  50  neuronas  para  cada   realizó  un  refuerzo  para  reducir  el  error.  La  red  neuronal  con  
capa  oculta  y  una  capa  de  salida  que  usa  la  función  de  activación   bagging  logró  una  precisión  del  85,324  %,  seguida  del  modelo  
no  sigmoidea  y  una  PNN,  que  es  una  red  neuronal  probabilística   ANN  con  boosting  con  una  precisión  del  84,815  %  y  luego  la  ANN  
con  una  sola  capa  oculta.  El  autor  concluyó  sus  resultados  sobre   con  un  84,532  %.  Finalmente,  el  autor  valida  la  comparación  final  
la  precisión,  mostrando  que  el  modelo  MLNN  logró  una  precisión   utilizando  un  ROC.
de  79,62  y  el  PNN  logró  una  precisión  de  78,65.
Árbitro.  [45]  utilizaron  técnicas  de  aprendizaje  automático  y  
aprendizaje  profundo  para  detectar  DM.  El  conjunto  de  datos  
utilizado  aquí  fue  el  conjunto  de  datos  de  diabetes  indio  PIMA  que  
consta  de  768  funciones  y  ocho  funciones  para  entrenar  con  un  
total  de  500  instancias  que  pertenecen  a  la  clase  no  diabética  y  las  
268  restantes,  que  son  de  clase  diabética.  El  60%  de  los  datos  se  
seleccionó  para  entrenamiento  y  el  40%  restante  para  prueba;  se  
utilizó  una  CNN.  Se  componen  de  tres  capas,  siendo  la  clasificación  
realizada  por  la  capa  de  salida.  La  precisión  de  predicción  lograda  
con  el  modelo  fue  del  76,81  %.

Algunos  trabajos  más  realizados  por  otros  investigadores  que  
Fig.  8  Representación  general  de  una  red  neuronal,  xm  muestra  los  pesos  de  entrada  e  
se  han  mencionado  en  la  Tabla  4.  Contiene  un  estudio  de  los  
yp  son  los  pesos  de  salida
algoritmos  de  aprendizaje  profundo  utilizados  en  los  métodos.
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  10  de  16

el  modelo  se  ejecuta  en  procesos  por  lotes  de  automatización.  Además,  
dado  que  solo  hay  unos  pocos  conjuntos  de  datos  de  diabetes  disponibles  
en  Internet;  más  datos  públicos  deberían  estar  disponibles  para  la  
investigación.  Se  deben  realizar  más  investigaciones  utilizando  la  frecuencia  
cardíaca,  ya  que  requiere  menos  ancho  de  banda  y  su  complejidad  
computacional  también  es  baja.  También  se  pueden  utilizar  en  la  nube  o  en  
dispositivos  móviles.  Las  señales  de  frecuencia  cardíaca  también  deben  
usarse  para  detectar  otras  enfermedades  cardíacas.  En  algunos  casos,  los  

autores  requerían  un  conjunto  de  datos  de  series  temporales.  Dado  que  no  
están  disponibles  en  ningún  recurso  en  línea,  es  difícil  replicar  dicho  trabajo.  
Dichos  modelos  especiales  requieren  un  ajuste  extenso  y  grandes  conjuntos  
de  datos  tanto  para  el  entrenamiento  como  para  las  pruebas.

La  siguiente  parte  es  la  construcción  de  un  modelo  real.
Para  lograr  una  precisión  perfecta,  se  deben  ajustar  muchos  parámetros.  
Fig.  9  Los  gráficos  trazados  entre  el  valor  real  mostrado  por  la  línea  azul  y  
los  valores  pronosticados  mostrados  por  la  línea  roja Los  estados  aleatorios,  el  kernel,  la  cantidad  de  árboles,  el  ajuste  de  
hiperparámetros  y  varios  otros  se  consideran  al  crear  un  modelo.  La  
selección  de  un  algoritmo  correcto  con  hiperparámetros  adecuados  también  
Desafíos  y  alcance  futuro  Aunque   debe  realizarse  con  precisión.  Algunos  modelos  de  clasificación  solo  
son  muchos  los  métodos  y  algoritmos  que  se  han  propuesto  en  el  campo  del   entrenarán  en  un  solo  parámetro,  lo  que  resulta  en  una  menor  precisión  para  
aprendizaje  automático  o  aprendizaje  profundo,  aún  quedan  muchos   el  modelo  en  la  detección  en  tiempo  real.  Es  evidente  del  análisis  de  estos  
desafíos,  como  mencionan  los  autores  en  sus  trabajos.  La  primera   esquemas  en  todas  las  clases  que  la  mayoría  de  ellos  sufren  de  un  solo  
preocupación  que  viene  a  la  mente  cuando  se  construye  un  modelo  son  los   parámetro  de  entrada  de  datos  o  la  selección  de  características  no  es  óptima.  
datos.  referencias  [32,  33,  49]  fueron  algunos  de  los  autores  que  hicieron   Junto  con  tales  restricciones  en  los  parámetros,  pocos  esquemas  basados  
referencia  al  problema. en  clasificación  dependen  puramente  de  tipos  de  dispositivos  de  hardware,  
Uno  de  los  mayores  problemas  encontrados  durante  la  encuesta  de  los   lo  que  aumenta  la  dificultad  de  disponibilidad  y  adaptabilidad  de  estos  
documentos  fue  encontrar  artículos  y  documentos  que  no  se  relacionaban   esquemas.
con  el  popular  conjunto  de  datos  indios  PIMA.  Este  conjunto  de  datos  se  
eligió  para  garantizar  que  los  modelos  proporcionaran  buenos  resultados  
debido  al  establecimiento  del  conjunto  de  datos. Un  modelo  de  aprendizaje  automático  basado  en  la  atención  médica  solo  
Los  conjuntos  de  datos  son  demasiado  pequeños  o  inadecuados,  o  carecen   es  útil  si  se  puede  usar  en  beneficio  de  las  personas.  Aquí,  el  despliegue  del  
de  datos  en  tiempo  real.  Los  conjuntos  de  datos  pequeños  plantean  un   modelo  en  aplicaciones  prácticas  es  fundamental.  Muchos  autores  han  
problema  de  sobreajuste  en  el  modelo,  que  muestra  una  mayor  precisión,   propuesto  implementar  modelos  en  plataformas  móviles.  En  las  
pero  no  pueden  manejar  los  datos  de  prueba  más  nuevos. implementaciones  de  la  vida  real,  solo  los  ingenieros  con  antecedentes  y  
Por  lo  tanto,  el  modelo  no  es  factible  para  la  implementación  en  tiempo   experiencia  con  servidores  en  la  nube  y  DevOps  pueden  implementar  
real.  Algunos  autores  trabajaron  con  datos  de  CGM,  que  eran  en  tiempo   modelos.  En  este  proceso  en  curso,  se  deben  considerar  muchas  cuestiones,  
real,  pero  el  entrenamiento  del  modelo  con  esos  datos  no  fue  eficiente.  Los   como  la  frecuencia  con  la  que  se  deben  mostrar  las  predicciones  o  la  
conjuntos  de  datos  también  se  seleccionaron  de  regiones  particulares  que   cantidad  de  aplicaciones  que  se  requieren  para  el  procesamiento  del  modelo.  
no  son  representativas  de  un  sistema  común. Aunque  se  tomaron  precauciones  considerables  para  garantizar  que  no  
Diferentes  regiones  tienen  diferentes  personas  y  estilos  de  vida. hubiera  discrepancias  en  el  estudio,  ningún  estudio  puede  afirmar  que  es  
En  general,  los  investigadores  pasan  el  80  %  de  su  tiempo  limpiando  y   perfecto  y  siempre  hay  posibilidades  de  mejora.  El  desarrollo  de  un  estudio  
administrando  datos  para  el  entrenamiento  de  modelos.  Por  lo  tanto,  la   más  inquisitivo  que  proporcione  una  visión  más  profunda  de  los  aspectos  
que  permiten  el  poder  predictivo  de  los  modelos  en  lugar  de  solo  parámetros  
complejidad  de  los  datos  conduce  a  costos  y  cargos  de  mantenimiento  más  elevados.
El  siguiente  paso  es  la  selección  de  funciones.  Mientras  que  algunos  autores   predefinidos  como  exactitud,  precisión,  puntaje  F1,  ROC  y  AUC  sería  
descuidaron  algunas  de  las  características,  algunos  las  agruparon  para  un   beneficioso  en  el  futuro.  Para  la  clasificación,  para  distinguir  entre  perfiles  
entrenamiento  factible.  Cada  conjunto  de  datos  plantea  el  problema  de  tener   diabéticos  y  normales,  los  esquemas  basados  en  agrupaciones  brindan  
características  apropiadas  para  satisfacer  las  necesidades  de  un  único   resultados  precisos.  Sin  embargo,  la  mayoría  de  los  algoritmos  de  
algoritmo.  Una  vez  que  todos  los  datos  están  disponibles,  se  finalizan  las   agrupamiento  luchan  con  problemas  de  plug­n­play,  lo  que  significa  que  
pilas  técnicas.  Hay  muchas  herramientas  disponibles  para  construir  modelos   generalmente  contienen  intervención  humana  durante  la  clasificación  y  el  
de  aprendizaje  automático,  pero  también  es  necesario  elegir  un  modelo  para   análisis,  lo  que  implica  la  posibilidad  de  error.
optimizar  el  rendimiento.  El  siguiente  desafío  es  la  depuración.  Esto  se  
vuelve  fácil  si  se  utilizan  herramientas  como  Jupyter  Notebooks  donde  el  
código  se  divide  en  celdas.  Esto  se  vuelve  difícil  cuando  el
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  11  de  16

Tabla  4  Un  estudio  exhaustivo  de  los  métodos  de  aprendizaje  profundo  realizado  por  algunos  investigadores
Algoritmo Método  utilizado/innovación Solicitud Resultados  y  limitaciones  (si  se   Referencias
especifica)

Red  neuronal   El  conjunto  de  datos  utilizado  fue  el  conjunto   Como  el  autor  compara  su  red  con  los  métodos   Los  resultados  de  la  red  propuesta  por  el  autor   [46]


de  creencias  profundas de  datos  de  diabetes  india  PIMA  con  768   convencionales  de  clasificadores  de  aprendizaje   y  los  métodos  convencionales  se  observaron  
instancias  y  8  características.  La  función  oculta   automático  y  obtuvo  resultados  altos,  cree  que   en  tres  parámetros:  valor  de  recuperación,  
de  activación  utilizada  fue  la  unidad  lineal   esta  red  puede  modificarse  según  la   precisión  y  medida  F1.  Esta  red  obtuvo  altos  
rectificadora  ReLU  con  tres  capas  ocultas  y   conveniencia  y  usarse  también  para  la  detección   valores  de  recuperación,  precisión  y  medida  F1,  
sigmoide  como  función  de  activación  de  entrada.   de  otras  enfermedades. lo  que  demuestra  que  es  un  buen  modelo.
El  tamaño  del  lote  en  100  y  las  épocas  
establecidas  en  5.

Memoria  a   El  autor  utilizó  el  conjunto  de  datos  Direct  Net   El  autor  elaboró  sobre  las  aplicaciones  de  la  vida   Se  concluyó  que  el  uso  de  LSTM  para  la   [47]


corto  plazo Inpatient  Accuracy  Study  que  contiene   real  al  proponer  implementar  modelos  LSTM  en   predicción  del  nivel  de  glucosa  en  sangre  
(LSTM)  redes   aproximadamente  110  instancias. plataformas  móviles,  aplicaciones  y  servidores   es  prometedor.  Los  valores  de  RMSE  obtenidos  
neuronales  – El  modelo  de  red  neuronal  propuesto  aquí  tiene   en  la  nube  para  que  estén  disponibles  para  las   son  4,67  que  es  el  mínimo  y  29,12  el  valor  
RNN una  capa  LSTM.  El  modelo  funciona  para   masas. máximo.  Los  datos  faltantes  son  un  problema  
predecir  los  niveles  de  azúcar  en  la  sangre.   para  el  modelo,  ya  que  si  el  paciente  retira  el  
Para  la  cuadrícula  de  búsqueda,  el  autor  tiene   dispositivo  CGM,  el  modelo  debe  ser  entrenado  
en  cuenta  las  unidades  LSTM,  las  unidades   en  un  formato  que  pueda  manejar  
densas  y  las  longitudes  de  secuencia. automáticamente  los  datos  faltantes.
El  parámetro  tomado  para  evaluar  el  
desempeño  del  modelo  es  RMSE.

Modelo   Los  datos  tomados  fueron  de  seis  individuos   Los  modelos  ELM  son  fáciles  de  implementar   El  modelo  se  evaluó  en  tres  parámetros:   [48]


de  predicción   en  el  grupo  de  edad  de  22  a  29  años.  El  modelo   en  cualquier  aplicación  de  clasificación  y  pueden   RMSE,  CC  y  lapso  de  tiempo  (TL)  a  diferentes  
profunda de  predicción  profunda  es  un  modelo  de   realizar  aproximaciones  para  funciones   concentraciones  de  glucosa  para  PH  =  15,  30  
múltiples  capas  que  consta  de  predictores   continuas;  son  ampliamente  utilizados  en  este   y  45  minutos  con  combinaciones  de  entrada  
basados  en  datos  que  se  alimentan  con   campo  de  investigación  para  implementar   de  tres  tipos  que  involucran  concentraciones  
mediciones  de  glucosa  y  series  temporales.  La   modelos  eficientes. de  glucosa  y  azúcar.  Para  todos  los  PH,  los  
primera  parte  son  los  modelos  autorregresivos   modelos  lineales  junto  con  ELM  superan  al  
con  entradas  externas  o  ANN  seguidos  por  la   ANN­ELM  logrando  TL  reducido,  RMSE  
máquina  de  aprendizaje  extremo  (ELM)  y  se  dan   reducido  y  CC  aumentado.
las  predicciones  del  nivel  de  glucosa.  La  
velocidad  de  aprendizaje  de  los  ELM  es  muy  
rápida  y,  además,  son  más  fáciles  de  implementar.

Descomposición  de   El  conjunto  de  datos  se  obtuvo  del   El  autor  propuso  un  modelo  más  preciso  al   Los  parámetros  considerados  para   [49]


modo  empírico hospital  de  shanghai  que  contiene  174   tratarlo  con  datos  en  tiempo  real  o  datos   evaluar  la  precisión  del  desempeño  fueron  el  
(EDM)  y instancias.  Los  datos  se  utilizan  para   personalizados  para  dar  mejores  resultados.   MAE  y  el  RMSE.  El  MAE  mide  el  error  de  
LSTM entrenar  dos  modelos:  uno  es  LSTM  y  el  otro  es   También  se  sugirió  la  implementación  del  modelo   predicción  y  el  RMSE  da  la  desviación  entre  el  
LSTM+EDM.  Los  LSTM  son  versiones  mejoradas   en  clientes  móviles. valor  observado  y  el  valor  de  verdad.  Los  
de  RNN  y  EDM  es  un  método  de  descomposición   resultados  se  observan  en  un  intervalo  de  tiempo  
de  señal  adaptable  para  métodos  no  lineales  y   de  30,  60,  90  y  120  min.
no  estacionarios.  Las  medidas  de  evaluación  del  
desempeño  son  MAE  y  RMSE.

Red   El  conjunto  de  datos  sin  procesar  incluía  dos   El  autor  afirmó  que  este  estudio  sobre  el  uso   El  autor  utilizó  tres  parámetros  para  la  evaluación,   [50]


convolucional   instancias  masculinas  y  cuatro  instancias  femeninas. de  algoritmos  DL  en  la  predicción  de  series   a  saber,  RMSE,  ganancia  temporal  y  energía  
temporal  con   La  selección  de  características  se  realizó  en   temporales  ayudaría  a  los  profesionales  e   normalizada  de  segundo  orden.  Los  valores  de  
vainilla  LSTM el  conjunto  de  datos  seguida  del  ajuste  de   investigadores  a  seleccionar  modelos  apropiados   RMSE,  ganancia  temporal  y  energía  fueron  
hiperparámetros.  La  red  LSTM  utilizada  tenía   con  parámetros  pragmáticos. mucho  más  altos  para  el  LSTM  vainilla  que  para  
3  capas  ocultas  con  un  tamaño  igual  a  50.  El   el  TCN.
bloque  TCN  tiene  10  capas,  cada  una  con  un  
factor  de  dilatación  de  2  y  un  tamaño  de  kernel   La  limitación  del  modelo  fue  que  no  recopila  
de  4. datos  que  impliquen  un  significado  más  profundo  
para  la  salida  personalizada.

ANA Conjunto  de  datos  médicos  tomado  de  la   Debido  a  que  las  ANN  logran  una  alta  precisión,   Para  aumentar  el  rendimiento  del  modelo,  se   [30]


facultad  de  medicina  de  Noakhali  que  contiene   el  autor  recomienda  que  usarlas  para  la   agregó  una  capa  oculta  adicional  y  las  épocas  se  
datos  de  9483  pacientes  con  14  características.   predicción  de  modelos  y  la  detección  de   aumentaron  a  100.  La  precisión  resultó  ser  del  
El  conjunto  de  datos  se  dividió  en  un  80  %  para   enfermedades  sería  una  alternativa  mucho  mejor   95,14  %  en  los  datos  de  prueba  y  del  96,42  %  en  
entrenamiento  y  el  20  %  restante  para  pruebas.   que  otros  modelos  de  ML. el  entrenamiento.
Para  ANN,  el  autor  eligió  la  función  de  activación  
SoftMax  con  seis  capas  ocultas.  El  entrenamiento   El  autor  afirma  que  los  modelos  lograron  
se  realizó  utilizando  la  función  de  activación  de   poca  precisión  porque  los  conjuntos  de  
ReLU  con  25  épocas. datos  más  pequeños  y  la  incapacidad  
de  los  modelos  para  adaptarse  a  diversos
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  12  de  16

Tabla  4  Un  estudio  exhaustivo  de  los  métodos  de  aprendizaje  profundo  realizado  por  algunos  investigadores  (Continuación)

Algoritmo Método  utilizado/innovación Solicitud Resultados  y  limitaciones  (si  se   Referencias


especifica)

conjuntos  de  datos

LSTM  y  Bi El  autor  recopiló  el  conjunto  de  datos  de  pacientes   El  autor  propuso  el  uso  modelo  para   Los  resultados  se  calcularon  a   [51]


LSTM  (RNN) reales  al  monitorear  su  salud.  El  modelo  fue   medicamentos  orales,  plumas  de  insulina  y  el diferentes  PH  =  15,  30,  45  y  60  minutos.
entrenado  y  probado  en  26  conjuntos  de  datos   bombas  CSII,  que  incorporan  todas Al  ejecutar  los  modelos  para  diferentes  épocas  
que  contenían  datos  CGM  en  tiempo  real.  El   Mediciones  de  CGM. de  100  a  2000  con  una  diferencia  de  100,  las  
modelo  consiste  en  una  capa  LSTM  y  una  capa   épocas  número  900,  1300,  1500,  1700  fueron  
Bi­LSTM  cada  una  con  4  unidades,  y  tres  capas   las  que  mostraron  una  buena  precisión  y,  por  lo  
completamente  conectadas  con  8,  64  y  8   tanto,  se  eligieron  como  número  de  época  previa  
unidades,  respectivamente.  Las  épocas  oscilaron   al  entrenamiento  para  niveles  de  PH  particulares.
entre  100  y  2000.  Los  parámetros  utilizados  para  
la  evaluación  fueron  RMSE,  CC  y  TL.

CNN Una  predicción  de  riesgo  puede   Proporciona  una  base  para  la  autogestión  de  la   La  precisión  de  predicción  del  modelo  en  los  tres   [52]


identificar  con  precisión  el  riesgo  de  la   salud  de  los  trabajadores  del  acero,  facilita  la   conjuntos  de  datos  fue  del  94,5  %,  91,0  %  y  
enfermedad  utilizando  CNN.  El  estudio  se   asignación  racional  de  recursos  médicos  y  de   89,0  %,  respectivamente,  y  el  AUC  fue  de  0,950  
basó  en  un  grupo  de  trabajadores  del  acero   salud  y  el  desarrollo  de  servicios  de  salud,  y   (IC  del  95  %:  0,938–0,962),  0,916  (IC  del  95  %:  
de  alrededor  de  5900.  Se  realizó  una  encuesta   proporciona  una  base  para  que  los  departamentos   0,888–0,945),  y  0,899  (IC  95%:  0,859­0,939).  
de  investigación  para  obtener  datos  en  tiempo   gubernamentales  tomen  decisiones. Muestra  que  el  modelo  establecido  puede  
real  sobre  características  como  el  sexo,  la   predecir  con  precisión  el  riesgo  de  diabetes  tipo  
edad,  el  historial  de  enfermedades,  el  estilo  de   2  en  los  trabajadores  del  acero.
vida  y  los  exámenes  físicos.  El  modelo  se  evaluó  
mediante  ROC  y  área  bajo  la  curva.

AlexNet  y En  este  estudio,  el  autor  desarrolló  un  modelo   El  autor  sugirió  usar  este  modelo  híbrido   Los  resultados  de  las  redes  se  compararon   [53]


GoogleLeNet llamado  IGRNet  para  detectar  y  diagnosticar  la   para  predicciones  futuras  debido  a  su   sobre  diferentes  funciones  de  activación.  El  
prediabetes  de  manera  efectiva  utilizando  un   desempeño  eficiente. modelo  IGRNet  obtuvo  una  precisión  del  85,6  
electrocardiograma  de  12  derivaciones  que  dura   %,  superior  a  la  de  cualquier  otro  modelo  
5  s  de  2251  datos  de  casos.  Las  redes  neuronales   utilizado  para  la  comparación.
utilizadas  se  compararon  con  algoritmos  de  ML  
tradicionales  como  SVM,  RF  y  KNN.

DNN La  recopilación  de  datos  se  recuperó  del   El  sistema  propuesto  será  de  apoyo   Las  muestras  de  datos  se  dividieron  en   [54]


repositorio  de  aprendizaje  automático  de   para  el  personal  médico  y  también  para  la   validación  cruzada  de  5  y  10  veces.
UCI:  conjunto  de  datos  de  diabetes  india   gente  común  porque  con  una  validación   La  precisión  obtenida  en  este  modelo  para  
PIMA.  Para  la  red  neuronal,  el  recuento  de   cruzada  de  cinco  veces,  la  precisión  fue   cinco  veces  fue  del  98,04  %  y  para  diez  veces  
capas  ocultas  es  4.  El  número  de  neuronas  en   mayor  que  cualquier  otro  modelo  y  al   fue  del  97,27  %.  Los  resultados  también  se  
las  capas  fue  12,  16,  16  y  14. compararlo  con  otros  modelos  establecidos   analizaron  a  través  de  ROC  y  puntaje  F1.
de  autores,  resultó  ser  ser  el  más  alto.

LSTM  y  GRU  El  conjunto  de  datos  utilizado  incluía  registros  de Los  modelos  recibieron  una  alta  precisión  del  97  %   Los  modelos  LSTM  y  GRU  lograron  mejores   [55]


más  de  14000  pacientes  de  2010  a  2015.   incluso  con  una  secuencia  de  longitud  tridimensional. resultados  que  MLP.  Para  dependencias  más  
Se  usaron  episodios  para  representar  esas   largas,  LSTM  superó  mientras  que  en  secuencias  
medidas.  Cada  secuencia  tenía  30   más  cortas,  GLU  funcionó  mejor.  Obtuvieron  
características.  El  conjunto  de  datos   una  precisión  de  más  del  97%.
utilizado  para  entrenar  los  modelos  LSTM  y  
GRU.  Los  resultados  se  compararon  con  los   Debido  a  la  falta  de  conjuntos  de  datos  que  
modelos  MLP. estén  más  concentrados  en  la  diabetes  tipo  2,  
puede  ser  difícil  replicar  este  trabajo  utilizando  
diferentes  conjuntos  de  datos.

Red  de   El  autor  utilizó  el  conjunto  de  datos  de   El  autor  propuso  extender  este  trabajo  para   Los  resultados  del  perceptrón  se  calcularon   [56]


perceptrones   diabetes  indio  PIMA.  La  ANN  desarrollada   aumentar  aún  más  la  precisión  para  ayudar  en   para  10  ejecuciones  durante  150  épocas.
multicapa contiene  4  capas  para  la  red  MLP  que  tiene   la  predicción  temprana  de  la  diabetes. La  precisión  promedio  más  alta  la  obtuvo  la  
8­12­8­1  nodos.  Se  formaron  tres  redes  más  con   red  que  tiene  los  nodos  8­128­128­1,  seguida  
los  nodos  8­32­32­1,  8­64­64­1  y  8­128­128­1. de  8­64­64­1  y  luego  8­32­32­1.

Con  la  función  de  activación  de  ReLU  en  la  
capa  de  entrada  y  las  capas  ocultas,  la  capa  de  
salida  es  sigmoide.

Algoritmo  ELM  Los  datos  se  adquirieron  de  múltiples El  objetivo  de  esta  investigación  fue  el   El  enfoque  propuesto  demostró  ser  eficiente.   [57]


fuentes,  incluidos  laboratorios   estudio  del  tratamiento  de  la  diabetes  en   El  objetivo  era  reducir  la  FP  y  la  FN  y  aumentar  
médicos,  hospitales  y  conjuntos  de  datos   el  cuidado  de  la  salud  utilizando  big  data   la  precisión  y  las  tasas  de  recuperación,  lo  cual  
públicos.  El  conjunto  de  datos  fue   y  aprendizaje  automático.  Presenta  un  gran   fue  logrado  por  el  autor.
preprocesado  y  estaba  destinado  a  incluir  12 sistema  de  procesamiento  de  datos  empleando
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  13  de  16

Tabla  4  Un  estudio  exhaustivo  de  los  métodos  de  aprendizaje  profundo  realizado  por  algunos  investigadores  (Continuación)
Algoritmo Método  utilizado/innovación Solicitud Resultados  y  limitaciones  (si  se   Referencias
especifica)

atributos  importantes  que  afectan  a  la   un  algoritmo  ELM.
diabetes.  ELM  tiene  una  capacidad  de  
entrenamiento  más  rápida.  Se  utilizaron  320  
muestras  para  entrenamiento  y  480  para  
entrenamiento.

Red  neuronal  El  autor  obtuvo  un  conjunto  de  datos  de  Luzhou   El  autor  espera  predecir  el  tipo  de  diabetes   La  red  neuronal  obtuvo  una  precisión   [37]


del  examen  físico  del  hospital.  Se  sacó  un   utilizando  un  conjunto  de  datos  que  es  una  guía   del  74,14  %  en  el  conjunto  de  datos  de  Luzhou  
conjunto  de  prueba  independiente  con  13700   para  mejorar  la  precisión. y  del  74,75  %  en  el  conjunto  de  datos  indio  de  
muestras. PIMA  con  el  uso  del  análisis  de  componentes  
Los  datos  contenían  14  atributos. principales.
Otro  conjunto  de  datos  fue  el  conjunto  de  datos  
de  diabetes  india  PIMA.  Este  método  es  una  
red  de  dos  capas  con  neuronas  sigmoideas  
ocultas  y  de  salida  SoftMax.

CNN El  conjunto  de  datos  utilizado  por  el  autor  se   Fuzzification  demuestra  ser  de  naturaleza  útil   La  red  neuronal  con  valor  de  α  =  2  se   [58]


tomó  del  Instituto  Nacional  de  Diabetes,  que   ya  que  proporciona  diversos  datos desempeñó  mejor  con  valor  de  α  5.  CNN  se  
consta  de  nueve  parámetros. para  entrenar. desempeñó  mejor  que  ambos.
La  fuzzificación  se  realizó  en  el  conjunto  de  
datos  de  CNN  que  se  completa.
Los  valores  α  de  la  red  neuronal  fueron  2  y  
5.  Estas  redes  se  compararon  con  una  CNN.

Teniendo  en  cuenta  todos  los  desafíos  anteriores,  todavía  se  puede   Se  han  discutido  métodos,  comenzando  desde  diferentes  algoritmos  
considerar  que  se  pueden  superar  en  el  futuro.  Los  académicos  y  los   básicos  como  LR,  SVM,  DT,  hasta  una  clasificación  adicional  que  
médicos  continuarán  trabajando  para  construir  conjuntos  de  datos   incluye  ID3,  C4.5,  C5.0,  J48  y  CART  y  NB.  Los  métodos  de  conjunto,  
mejores  y  más  grandes  y  diseñar  modelos  y  algoritmos  más  eficientes   como  el  embolsado,  el  refuerzo  y  los  regresores  de  RF,  se  utilizan  aún  
para  una  mejor  clasificación  y  precisión.  Cualquiera  de  las   más  para  mejorar  la  precisión  y  el  rendimiento  de  los  modelos.  Estas  
enfermedades  que  ocurren  a  gran  escala,  como  la  diabetes,  puede   técnicas  se  han  implementado  en  todo  tipo  de  plataformas  como  
controlarse  mediante  técnicas  de  inteligencia  artificial  y  automatización.   Python  o  MATLAB,  y  los  modelos  se  han  analizado  utilizando  diferentes  
Se  pueden  crear  modelos  eficientes  de  última  generación  basados  en   parámetros  como  el  área  bajo  la  curva  o  matrices  de  confusión  o  
estudios  que  proporcionen  una  detección  temprana  de  la  diabetes  y   términos  matemáticos  como  el  RMSE  o  el  MAE.  El  aprendizaje  
que  puedan  ayudar  a  las  personas  a  cambiar  aún  más  su  estilo  de   automático  se  ha  introducido  en  los  sistemas  de  diagnóstico  médico,  
vida.  Debido  a  que  el  aprendizaje  profundo  funciona  mejor  en  la   ya  que  ha  demostrado  ser  preciso  en  la  detección,  exitoso  en  la  
mayoría  de  los  conjuntos  de  datos,  debe  combinarse  con  diferentes   aplicación  a  los  tratamientos  y  más  rentable.  Aunque  los  anteriores  
algoritmos  para  lograr  una  mayor  precisión  y  rendimiento.  Los   son  clasificadores  muy  fuertes,  creemos  que  el  aprendizaje  profundo,  
esquemas  híbridos  juegan  un  papel  importante  en  la  mejora  del   que  es  un  subconjunto  del  aprendizaje  automático,  puede  aprender  
rendimiento  de  los  modelos.  A  través  de  la  detección  temprana,  los   grandes  cantidades  de  datos  no  estructurados  y  sin  etiquetar.
pacientes  pueden  ser  tratados  mucho  antes  para  evitar  mayores  
riesgos  de  problemas  cardíacos  en  casos  de  diabetes.  Cualquier  
modelo  que  se  pueda  implementar  en  plataformas  móviles  debe   Los  modelos  de  aprendizaje  profundo  son  más  complejos  y  precisos.
atender  a  las  masas  en  busca  de  su  ayuda  y  ser  representativo.  Una   Los  diferentes  modelos  para  el  aprendizaje  profundo  comienzan  desde  
implicación  de  esta  encuesta  es  que  los  modelos  de  aprendizaje   las  ANN  más  básicas  hasta  las  redes  convolucionales  y  las  RNN  
automático  que  han  arrojado  resultados  eficientes  pueden  ser  utilizados   adicionales,  incluidas  LSTM  y  Bi­LSTM.  También  se  han  discutido  las  
por  futuros  investigadores  para  pulir  y  mejorar  aún  más,  así  como  para   redes  de  creencias  temporales  y  profundas.  Por  el  contrario,  el  
crear  una  tubería  o  un  conjunto  de  modelos  correctos  y  eficientes  para   aprendizaje  profundo  implica  algunas  deficiencias,  como  el  aumento  
aumentar  las  posibilidades  de  predecir  la  enfermedad.  con  aún  más   del  tiempo  de  cálculo,  los  recursos  y  el  ajuste  frecuente  de  los  
probabilidad.  Dichos  modelos  se  pueden  improvisar  aún  más  para   parámetros.  El  aprendizaje  profundo  funciona  mejor  en  conjuntos  de  
automatizar  el  sistema  creado  para  que  pueda  manejar  datos  más   datos  de  imágenes;  por  lo  tanto,  para  el  diagnóstico  de  diabetes,  las  
nuevos  sin  problemas. imágenes  serían  mejores.  La  mayoría  de  los  investigadores  han  
implementado  varios  algoritmos  tanto  en  el  aprendizaje  automático  
Conclusiones   como  en  el  profundo  para  comparar  su  desempeño  en  los  datos,  
La  diabetes  puede  ser  devastadora  después  de  un  cierto  período  si  no   mientras  que  otros  han  combinado  dos  o  tres  métodos  para  obtener  
se  detecta  o  diagnostica  correctamente.  Muchos  aprendizaje  automático más  precisión  en  un  solo  sistema.
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  14  de  16

Los  investigadores,  los  médicos  clínicos  y  la  gente  de  la   (eds)  Ciencias  de  la  computación  ­  ICCS  2004.  4ª  conferencia  internacional,  Cracovia,  

industria  creen  ampliamente  que  la  inteligencia  artificial  tiene   Polonia,  junio  de  2004.  Apuntes  de  conferencias  sobre  ciencias  de  la  computación,  vol  3039.
Springer,  Berlín,  Heidelberg,  págs.  1118­1125.  https://doi.org/10.1007/978­3­54  0­25944­2_145  
el  poder  de  alterar  las  situaciones  actuales  de  medicación   Lassi  M,  Sonnenwald  DH  (2010)  Identificación  de  factores  que  pueden  afectar  la  adopción  y  el  
tardía  y  detección  debido  a  errores  humanos.  La   4. uso  de  un  laboratorio  de  ciencias  sociales:  una  síntesis  de  investigaciones  previas.  Inf  Res15(3)

automatización  tiene  la  capacidad  de  construir  sistemas  de  
detección  médica  eficientes  y  confiables.  El  aprendizaje   5. Bonfiglio  S  (2012)  El  papel  de  las  TIC  en  un  cuidado  de  la  salud  que  pasa  de  ser  “centrado  en  la  
automático,  a  través  de  sus  potentes  modelos  predictivos  y   clínica”  a  “centrado  en  el  paciente”.  En:  Donnelly  M,  Paggetti  C,  Nugent  C,  Mokhtari  M  (eds)

de  clasificación,  juega  un  papel  importante  para  ayudar  a  conseguirlo.Análisis  de  impacto  de  soluciones  para  la  prevención  y  gestión  de  enfermedades  crónicas.  
Décima  conferencia  internacional  sobre  hogares  inteligentes  y  telemática  de  la  salud,  junio  de  

abreviaturas 2012.  Apuntes  de  conferencias  sobre  informática,  vol  7251.  Springer,  Berlín,  Heidelberg,  págs.  
250­253.  https://doi.org/10.1007/978­3­642­30779­9_37  6.  Poston  RS,  Reynolds  RB,  Gillenson  
ÓPTICA:  Puntos  de  ordenación  para  identificar  la  estructura  del  racimo;  DBSCAN:  agrupación  
ML  (2006)  Soluciones  tecnológicas  para
espacial  de  aplicaciones  basada  en  la  densidad;  DM:  Diabetes  mellitus;  BIRCH:  Algoritmo  de  
mejorar  la  precisión  y  disponibilidad  de  los  registros  de  atención  médica.  Inf  Syst  Manag  
agrupamiento  y  reducción  iterativo  equilibrado  que  utiliza  jerarquías;  LSTM:  memoria  a  largo  
24(1):59–71.  https://doi.org/10.1080/10580530601038097  7.  Duan  L,  Street  WN,  Xu  E  (2011)  
plazo;  ID3:  dicotomizador  iterativo  3;  SVM:  máquina  de  vectores  de  soporte;  KNN:  K­vecinos  
más  cercanos;  VP:  Verdadero  positivo;  TN:  Verdadero  negativo; Sistemas  de  información  de  atención  médica:  métodos  de  extracción  de  datos  en  la  creación  de  un  

FP:  falso  positivo;  FN:  falso  negativo;  BLM:  regresión  logística  binaria; sistema  de  recomendación  clínica.  Enterp  Inf  Syst  5(2):169–181.  https://doi.org/
10.1080/17517575.2010.541287  Saiti  K,  Macaš  M,  Štechová  K,  Pithová  P,  Lhotská  L  (2017)  Una  
LMT:  algoritmo  de  árbol  del  modelo  logístico;  ACC:  La  precisión  de  la  clasificación;
8. revisión  de  la  predicción  de  modelos  en  diabetes  y  del  diseño  de  reguladores  de  glucosa  basados  
AUC:  Área  bajo  la  curva;  LDA:  análisis  discriminante  lineal;  RNA:  Red  neuronal  artificial;  
RNN:  Red  neuronal  recurrente;  CNN:  red  neuronal  convolucional;  DNN:  red  neuronal   en  el  control  predictivo  de  modelos  para  el  páncreas  artificial.  En:  Bursa  M,  Holzinger  A,  Renda  

profunda;  MAE:  Error  absoluto  medio; ME,  Khuri  S  (eds)  Tecnología  de  la  información  en  informática  biológica  y  médica.  8°  congreso  

CC:  Coeficiente  de  correlación;  TL:  Retardo  de  tiempo;  ROC:  curva  de  funcionamiento  del  receptor; internacional  ITBAM  2017,  agosto  2017.  Apuntes  de  cátedra  en  informática,  vol  10443.  Springer,  

ELM:  máquina  de  aprendizaje  extremo;  NIDDM:  Diabetes  mellitus  no  insulinodependiente;   Cham,  pp  11­19.  https://doi.org/10.1  007/978­3­319­64265­9_6  Haritha  R,  Sureshbabu  D,  

IMC:  índice  de  masa  corporal;  DT:  Árbol  de  decisión;  LR:  regresión  logística; Sammulal  P  (2019)  Detección  de  diabetes  mediante  análisis  de  componentes  principales  y  redes  
neuronales.  En:  Santosh  KC,  Hegadi  RS  (eds)  Tendencias  recientes  en  procesamiento  de  
RF:  bosque  aleatorio;  NB:  Naïve  Bayes;  MLNN:  red  neuronal  multicapa;
9. imágenes  y  reconocimiento  de  patrones.
RMSE:  error  cuadrático  medio;  EDM:  Descomposición  modal  empírica

Agradecimientos  Los  
Segunda  conferencia  internacional,  RTIP2R  2018,  diciembre  de  2018.
autores  agradecen  al  Departamento  de  Ingeniería  Electrónica  y  de  Comunicaciones  de  la  
Universidad  de  Nirma  y  al  Departamento  de  Ingeniería  Química  de  la  Facultad  de  Tecnología   Comunicaciones  en  informática  y  ciencias  de  la  información,  vol  1036.  Springer,  Singapur.  

de  la  Universidad  de  Energía  Pandit  Deendayal  por  el  permiso  para  publicar  esta   https://doi.org/10.1007/978­981­13­9184­2_24  10.  Chen  Q,  Alrowais  R,  Burhan  M,  Ybyraiymkul  

investigación. D,  Shahzad  MW,  Li  Y  et  al  (2020)
Un  sistema  de  desalación  solar  autosostenible  mediante  tecnología  de  pulverización  directa.
Contribuciones  de  los  autores   Energía  205:118037.  https://doi.org/10.1016/j.energy.2020.118037  11.  Kunekar  

Todos  los  autores  hacen  contribuciones  sustanciales  a  este  manuscrito;  TS  y  MS  participaron   PR,  Gupta  M,  Agarwal  B  (2019)  Detección  y  análisis  del  estilo  de  vida

en  la  redacción  del  manuscrito;  TS  escribió  el  manuscrito  principal;  todos  los  autores   enfermedades  basadas  en  la  fase  temprana  de  la  vida:  una  encuesta.  En:  Somani  AK,  

discutieron  los  resultados  y  la  implicación  en  el  manuscrito  en  todas  las  etapas.  Los  autores   Ramakrishna  S,  Chaudhary  A,  Choudhary  C,  Agarwal  B  (eds)  Tecnologías  emergentes  en  

leyeron  y  aprobaron  el  manuscrito  final. ingeniería  informática:  microservicios  en  análisis  de  big  data.  Segunda  conferencia  internacional  
ICETCE  2019,  febrero  de  2019.  Communications  in  computer  and  information  science,  vol  985.  
Springer,  Singapur.  https://doi.  org/10.1007/978­981­13­8300­7_6  12.  Cahn  A,  Shoshan  A,  Sagiv  

Financiamiento  No  aplicable. T,  Yesharim  R,  Goshen  R,  Shalev  V  et  al  (2020)

Predicción  de  progresión  de  prediabetes  a  diabetes:  desarrollo  y  validación  de  un  modelo  de  
Disponibilidad  de  datos  y  materiales  Todos  
aprendizaje  automático.  Diabetes  Metab  Res  Rev  36(2):  e3252.  https://doi.org/10.1002/dmrr.3252
los  datos  y  materiales  pertinentes  se  presentan  en  el  documento  principal.

Declaraciones 13.  Thenappan  S,  Rajkumar  MV,  Manoharan  PS  (2020)  Predicción  de  la  diabetes
mellitus  utilizando  una  máquina  de  vector  de  soporte  modificada  con  seguridad  en  la  nube.  
IETE  J  Res.  https://doi.org/10.1080/03772063.2020.1782781.  (en  prensa)
Conflicto  de  intereses  Los  
autores  declaran  que  no  tienen  conflictos  de  intereses. 14.  Bai  BGM,  Nalini  BM,  Majumdar  J  (2019)  Análisis  y  detección  de  diabetes  utilizando  técnicas  de  
minería  de  datos:  una  aplicación  de  big  data  en  el  cuidado  de  la  salud.  En:  Shetty  NR,  Patnaik  
Detalles  del  autor LM,  Nagaraj  HC,  Hamsavath  PN,  Nalini  N  (eds)  Investigación  emergente  en  computación,  
1 información,  comunicación  y  aplicaciones,  vol  882.  Springer,  Singapur
Departamento  de  Electrónica  y  Tecnología  de  la  Comunicación,  Universidad  de  
2
Nirma,  382481  Ahmedabad,  Gujarat,  India. Departamento  de  Química
Ingeniería,  Escuela  de  Tecnología,  Universidad  de  Energía  Pandit  Deendayal,  382426   15.  Shu  T,  Zhang  B,  Tang  YY,  Chengdu  IEEE  (2018)  15­18  de  julio  de  2018.  https://doi.  org/10.1109/

Gandhinagar,  Gujarat,  India. ICWAPR.2018.8521271  16.  Islam  MT,  Raihan  M,  Farzana  F,  Aktar  N,  Ghosh  P,  Kabiraj  S  
(2020)  Típico

Recibido:  9  abril  2021  Aceptado:  29  octubre  2021 y  predicción  de  enfermedades  diabéticas  atípicas  utilizando  un  algoritmo  de  bosque  aleatorio.
En:  Resúmenes  de  la  11.ª  conferencia  internacional  sobre  tecnologías  informáticas,  
de  comunicación  y  de  redes,  IEEE,  Kharagpur,  1­3  de  julio  de  2020.  https://doi.org/10.1109/
Referencias  1.   ICCCNT49239.2020.9225430  17.  Choudhury  A,  Gupta  D  (2019)  Una  encuesta  sobre  el  

Nakahara  T,  Hyogo  H,  Yoneda  M,  Sumida  Y,  Sumida  Y,  Fujii  H  et  al  (2013) diagnóstico  médico  de  la  diabetes  utilizando  técnicas  de  aprendizaje  automático.  En:  Kalita  J,  

La  diabetes  mellitus  tipo  2  se  asocia  con  la  gravedad  de  la  fibrosis  en  pacientes  con   Balas  VE,  Borah  S,  Pradhan  R  (eds)  Desarrollos  recientes  en  aprendizaje  automático  y  

enfermedad  del  hígado  graso  no  alcohólico  en  una  gran  cohorte  retrospectiva  de  pacientes   análisis  de  datos.  Avances  en  sistemas  inteligentes  y  computación,  vol  740.  Springer,  

japoneses.  J  Gastroenterol  49(11):1477–1484.  https://doi.org/10.1  007/s00535­013­0911­1 Singapur,  pp  67–78.  https://doi.org/10.1007/978­981­13­1280­9_6  _

2. Solanki  P,  Baldaniya  D,  Jogani  D,  Chaudhary  B,  Shah  M,  Kshirsagar  A  (2021)
Inteligencia  artificial:  nueva  era  de  transformación  en  el  upstream  del  petróleo.  Pet  Res  (en   18.  Shukla  AK  (2020)  Pronóstico  de  diabetes  del  paciente  basado  en  el  enfoque  de  aprendizaje  

prensa).  https://doi.org/10.1016/j.ptlrs.2021.07.002  3.  Duplaga  M  (2004)  El  impacto  de  la   automático.  En:  Pant  M,  Sharma  TK,  Arya  R,  Sahana  BC,  Zolfagharinia  H  (eds)

tecnología  de  la  información  en  la  calidad  de  los  servicios  de  salud.  En:  Bubak  M,  van  Albada  GD,  Sloot   Computación  blanda:  teorías  y  aplicaciones.  Avances  en  sistemas  inteligentes  y  computación,  

PMA,  Dongarra  J vol  1154.  Springer,  Singapur
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  15  de  16

19.  Dalakleidi  KV,  Zarkogianni  K,  Karamanos  VG,  Thanopoulou  AC,  Nikita  KS 37.  Zou  Q,  Qu  KY,  Luo  YM,  Yin  DH,  Ju  Y,  Tang  H  (2018)  Predicción  de  la  diabetes
(2013)  Un  algoritmo  genético  híbrido  para  la  selección  de  las  características  críticas  para  la   mellitus  con  técnicas  de  aprendizaje  automático.  Frente  Genet  9:515.  https://doi.  org/10.3389/
predicción  del  riesgo  de  complicaciones  cardiovasculares  en  pacientes  con  diabetes  tipo  2.  En:   fgene.2018.00515  38.  Parthiban  G,  Srivatsa  SK  (2012)  Aplicación  de  métodos  de  aprendizaje  
Abstracts  of  the  13th  IEEE  international  conference  on  BioInformatics  and  BioEngineering,  Chania,   automático  en
10­13  de  noviembre  de  2013.  https://doi.org/10.1109/BIBE.2013.6701620  20.  Islam  MMF,  Ferdousi   diagnóstico  de  enfermedades  del  corazón  para  pacientes  diabéticos.  Int  J  Appl  Inf  Syst  3(7):25–30.  
R,  Rahman  S,  Bushra  HY  (2020)  Predicción  de  probabilidad  de  diabetes  en  etapa  temprana   https://doi.org/10.5120/ijais12­450593
utilizando  técnicas  de  minería  de  datos.  En:  Gupta  M,  Konar  D,  Bhattacharyya  S,  Biswas  S  (eds)  Visión   39.  Challa  M,  Chinnaiyan  R  (2019)  Enfoque  de  aprendizaje  automático  optimizado  para
artificial  e  inteligencia  artificial  en  el  análisis  de  imágenes  médicas.  Avances  en  sistemas  inteligentes  y   la  predicción  de  la  diabetes  mellitus.  En:  Smys  S,  Tavares  JMRS,  Balas  VE,  Iliyasu  AM  (eds)  Visión  
computación,  vol  992.  Springer,  Singapur,  pp  113–125.  https://doi.org/10.1007/978­981­13­8798­2_12   computacional  y  computación  bioinspirada.  ICCVBIC  2019.
_ Avances  en  sistemas  inteligentes  y  computación,  vol  1108.  Springer,  Cham,  pp  321–328.  https://
doi.org/10.1007/978­3­030­37218­7_37
40.  Rakshit  S,  Manna  S,  Biswas  S,  Kundu  R,  Gupta  P,  Maitra  S  y  otros  (2017)
21.  Harris  MI,  Klein  R,  Welborn  TA,  Knuiman  MW  (1992)  El  inicio  de  la  NIDDM  ocurre  al  menos  4  a  7  años   Predicción  de  diabetes  tipo  II  utilizando  una  red  neuronal  de  dos  clases.  En:  Mandal  JK,  Dutta  P,  
antes  del  diagnóstico  clínico.  Cuidado  de  la  diabetes  15(7):815–819.  https://doi.org/10.2337/ Mukhopadhyay  S  (eds)  Inteligencia  computacional,  comunicaciones  y  análisis  empresarial.  Primera  
diacare.15.7.815  _  22.  Ameena  RR,  Ashadevi  B  (2020)  Análisis  predictivo  de  mujeres  diabéticas conferencia  internacional,  CICBA  2017,  marzo  de  2017.  Communications  in  computer  and  
information  science,  vol  776.  Springer,  Singapur,  65­71.  https://doi.org/10.1007/978­981­10­6430­2_6  
pacientes  usando  R.  En:  Peter  JD,  Fernandes  SL  (eds)  Simulación  y  modelado  de  sistemas  para   _  41.  Sapon  MA,  Ismail  K,  Zainudin  S  (2011)  Predicción  de  la  diabetes  mediante  el  uso
computación  en  la  nube  y  aplicaciones  de  big  data.  Elsevier  Inc.,  Ámsterdam.  https://doi.org/
10.1016/B978­0­12­819779­0.00006­X
23.  Daanouni  O,  Cherradi  B,  Tmiri  A  (2019)  Predicción  de  enfermedades  diabéticas  usando Red  neuronal  artificial.  En:  Resúmenes  de  la  conferencia  internacional  de  2011  sobre  circuitos,  

datos  mixtos  y  algoritmos  de  aprendizaje  automático  supervisado.  En:  Resúmenes  de  la  4.ª  conferencia   sistemas  y  simulación  IPCSIT  vol.  7,  IACSIT  Press,  Singapur,  28  de  mayo  de  2011  42.  Shanker  MS  
internacional  sobre  aplicaciones  de  ciudades  inteligentes,  ACM,  Casablanca,  2­4  de  octubre  de  2019.   (1996)  Uso  de  redes  neuronales  para  predecir  la  aparición  de  diabetes  mellitus.  J  Chem  Inf  Comput  Sci  
https://doi.org/10.1145/3368756.3369072  24.  Sisodia  D,  Sisodia  DS  (2018)  Predicción  de  diabetes   36(1):35–41.  https://doi.org/10.1021/  ci950063e
usando  clasificación
algoritmos  Procedia  Comput  Sci  132:  1578–1585.  https://doi.org/10.1016/j.  procs.2018.05.122 43.  Temurtas  H,  Yumusak  N,  Temurtas  F  (2009)  Un  estudio  comparativo  sobre
Diagnóstico  de  enfermedades  diabéticas  mediante  redes  neuronales.  Aplicación  de  sistema  
25.  Ahuja  R,  Sharma  SC,  Ali  M  (2019)  Un  modelo  de  predicción  de  enfermedades  diabéticas  basado  en   experto  36(4):  8610–8615.  https://doi.org/10.1016/j.eswa.2008.10.032  44.  Kumar  A,  Gupta  PK,  
algoritmos  de  clasificación.  Ann  Emerg  Technol  Comput  3  (3):  44–52.  https://doi.org/10.33166/ Srivastava  A  (2020)  Una  revisión  de  las  tecnologías  modernas  para  abordar  la  pandemia  de  COVID­19.  
AETiC.2019.03.005  _  26.  Alehegn  M,  Joshi  RR,  Mulay  P  (2019)  Análisis  y  predicción  de  la  diabetes   Diabetes  Metab  Syndr:  Clin  Res  Rev  14(4):  569–573.  https://doi.org/10.1016/j.dsx.2020.05.008  45.  
utilizando  bosques  aleatorios,  KNN,  Naïve  Bayes  y  J48:  un  enfoque  conjunto.  Int  J  Sci  Technol  Res  8(9):1346– Yahyaoui  A,  Jamil  A,  Rasheed  J,  Yesiltepe  M  (2019)  Una  decisión  de  apoyo
1354  27.  Perveen  S,  Shahbaz  M,  Guergachi  A,  Keshavjee  K  (2016)  Análisis  de  rendimiento  de  las  
técnicas  de  clasificación  de  minería  de  datos  para  predecir  la  diabetes. sistema  para  la  predicción  de  la  diabetes  utilizando  técnicas  de  aprendizaje  automático  y  
aprendizaje  profundo.  En:  Resúmenes  de  la  primera  conferencia  internacional  de  informática  e  
ingeniería  de  software,  IEEE,  Ankara,  6  y  7  de  noviembre  de  2019.  https://doi.org/10.1109/
Procedia  Comput  Sci  82:115–121.  https://doi.org/10.1016/j.procs.2016.04.016 UBMYK48245.2019.8965556

28.  Khan  NS,  Muaz  MH,  Kabir  A,  Islam  MN  (2019)  Una  aplicación  basada  en  el  aprendizaje  automático 46.  Prabhu  P,  Selvabharathi  S  (2019)  Modelo  de  red  neuronal  de  creencias  profundas  para  la  
sistema  inteligente  para  predecir  la  diabetes.  Int  J  Big  Data  Anal  Healthc  4(2):1.  https://doi.org/ predicción  de  la  diabetes  mellitus.  En:  Resúmenes  de  la  3.ª  conferencia  internacional  sobre  
10.4018/IJBDAH.2019070101  29.  Nai­Arun  N,  Moungmai  R  (2015)  Comparación  de  clasificadores   imágenes,  procesamiento  de  señales  y  comunicación,  IEEE,  Singapur,  27­29  de  julio  de  2019.  
para  el  riesgo  de https://doi.org/10.1109/ICISPC.2019.8935838  47.  Idriss  TE,  Idri  A,  Abnane  I,  Bakkoury  Z  (2019)  
predicción  de  diabetes  Procedia  Comput  Sci  69:132–142.  https://doi.org/10.101  6/j.procs.2015.10.014   Predicción  de  glucosa  en  sangre  usando  una  red  neuronal  LSTM.  En:  Resúmenes  de  la  conferencia  
30.  Kocher  T,  Holtfreter  B,  Petersmann  A,  Eickholz  P,  Hoffmann  T,  Kaner  D  et  al  (2019)  Efecto  del   federada  de  2019  sobre  informática  y  sistemas  de  información,  IEEE,  Leipzig,  1­4  de  septiembre  de  

tratamiento  periodontal  en  HbA1c  entre  pacientes  con  prediabetes.  J  Dent  Res  98(2):171–179.  https://doi.org/ 2019.  https://doi.org/10.15439/2019F159
10.1177/002203451  8804185
48.  Jankovic  MV,  Mosimann  S,  Bally  L,  Stettler  C,  Mougiakakou  S,  Belgrade  IEEE  (2016)  22­24  de  
noviembre  de  2016.  https://doi.org/10.1109/NEUREL.2016.7800095  49.  Song  W,  Cai  WY,  Li  J,  Jiang  
31.  Meng  XH,  Huang  YX,  Rao  DP,  Zhang  Q,  Liu  Q  (2013)  Comparación  de  tres  modelos  de  minería  de   FS,  He  SQ  (2019)  Predicción  de  los  niveles  de  glucosa  en  sangre  con  datos  de  CGM  basados  en  EMD  y  
datos  para  predecir  diabetes  o  prediabetes  por  factores  de  riesgo. LSTM.  En:  Resúmenes  de  la  6.ª  conferencia  internacional  sobre  sistemas  e  informática,  IEEE,  

Kaohsiung  J  Med  Sci  29(2):93–99.  https://doi.org/10.1016/j.kjms.2012.08.016  32.  Sheikhi  G,  Altınçay   Shanghái,  2­4  de  noviembre  de  2019.  https://doi.org/10.1109/ICSAI48974.2019.9010318  50.  Zhang  L,  
H  (2016)  El  costo  de  la  diabetes  mellitus  tipo  II:  una  perspectiva  de  aprendizaje  automático.  En:  Kyriacou  E,   Zhu  F,  Xie  L,  Wang  C,  Wang  J,  Chen  R  et  al  (2020)  Clínica
Christofides  S,  Pattichis  CS  (eds)  XIV  conferencia  mediterránea  sobre  ingeniería  médica  y  biológica  
e  informática  2016.  Actas  de  IFMBE,  vol  57.  Springer,  Cham,  pp  818­821.  https://doi.org/ características  de  los  pacientes  con  cáncer  infectados  con  COVID­19:  un  estudio  de  caso  
10.1007/978­3­319­32703­7_160  33.  Iyer  A,  Jeyalatha  S,  Sumbaly  R  (2015)  Diagnóstico  de  diabetes   retrospectivo  en  tres  hospitales  dentro  de  Wuhan,  China.  Ann  Oncol  31(7):894–901.  https://
usando doi.org/10.1016/j.annonc.2020.03.296  51.  Marco  ML,  Heeney  D,  Binda  S,  Cifelli  CJ,  Cotter  PD,  
Foligné  B  et  al  (2017)
clasificación  de  técnicas  de  minería.  Int  J  Data  Min  Knowl  Manag  Process  5(1):  1–14.  https://doi.org/ Beneficios  para  la  salud  de  los  alimentos  fermentados:  microbiota  y  más  allá.  Curr  Opin  
10.5121/ijdkp.2015.5101 Biotechnol  44:94–102.  https://doi.org/10.1016/j.copbio.2016.11.010  52.  Wu  JH,  Li  J,  Wang  J,  
34.  Barik  S,  Mohanty  S,  Mohanty  S,  Singh  D  (2021)  Análisis  de  la  precisión  de  la  predicción  de  la  diabetes   Zhang  L,  Wang  HD,  Wang  GL  et  al  (2020)  Riesgo
utilizando  técnicas  de  aprendizaje  automático  híbrido  y  clasificador.  En:  Mishra  D,  Buyya  R,   predicción  de  diabetes  tipo  2  en  trabajadores  del  acero  basada  en  la  red  neuronal  
Mohapatra  P,  Patnaik  S  (eds)  Computación  inteligente  y  en  la  nube. convolucional.  Aplicación  de  computación  neuronal  32(13):9683–9698.  https://doi.org/10.1  007/
Innovación  inteligente,  sistemas  y  tecnologías,  vol  153.  Springer,  Singapur,  pp  399–409.  https:// s00521­019­04489­y
doi.org/10.1007/978­981­15­6202­0_41  35.  Ephzibah  EP  (2011)  Un  sistema  experto  híbrido  genético­ 53.  Wang  LY,  Mu  Y,  Zhao  J,  Wang  XY,  Che  HL  (2020)  IGRNet:  un  modelo  de  aprendizaje  profundo  para  
borroso  para  el  diagnóstico  efectivo  de  enfermedades  cardíacas.  En:  Wyld  DC,  Wozniak  M,  Chaki  N,   el  diagnóstico  no  invasivo  y  en  tiempo  real  de  la  prediabetes  a  través  de  electrocardiogramas.  
Meghanathan  N,  Nagamalai  D  (eds)  Avances  en  informática  y  tecnología  de  la  información.  primera   Sensores  (Basilea)  20(9):2556.  https://doi.org/10.3390/s2  0092556
conferencia  internacional,  ACITY  2011,  julio  de  2011.  Communications  in  computer  and  information  
science,  vol  198.  Springer,  Berlin,  Heidelberg,  pp  115­121.  https://doi.org/10.1007/978­3­642­22555­0_13   54.  Ayon  SI,  Islam  M  (2019)  Predicción  de  la  diabetes:  un  enfoque  de  aprendizaje  profundo.  Int  J  Inf  Ing  
36.  Zheng  T,  Xie  W,  Xu  LL,  He  XY,  Zhang  Y,  You  MR  et  al  (2017)  Un  marco  basado  en  el  aprendizaje   Electron  Bus  11(2):21–27.  https://doi.org/10.5815/ijieeb.2019.02.03  55.  Alhassan  Z,  McGough  AS,  
automático  para  identificar  la  diabetes  tipo  2  a  través  de  registros  de  salud  electrónicos.  Int  J  Med   Alshammari  R,  Daghstani  T,  Budgen  D,  Moubayed  NA  (2018)  Diagnóstico  de  diabetes  mellitus  tipo  2  a  partir  
Inform  97:120–127.  https://doi.org/10.1016/j.  ijmedinf.2016.09.014 de  datos  clínicos  de  series  temporales  utilizando  modelos  de  aprendizaje  profundo.  En:  Kůrková  V,  
Manolopoulos  Y,  Hammer  B,  Iliadis  L,  Maglogiannis  I  (eds)  Redes  neuronales  artificiales  y  aprendizaje  
automático  ­  ICANN  2018.  27.ª  conferencia  internacional  sobre  redes  neuronales  artificiales
Machine Translated by Google

Sharma  y  Shah  Computación  visual  para  la  industria,  la  biomedicina  y  el  arte (2021)  4:30 Página  16  de  16

redes,  octubre  de  2018.  Apuntes  de  clase  en  informática,  vol  11141.
Springer,  Cham.  https://doi.org/10.1007/978­3­030­01424­7_46  56.  
Kumar  NM,  Manjula  R  (2019)  Diseño  de  perceptrón  multicapa  para  el
diagnóstico  de  diabetes  mellitus  utilizando  keras  en  aprendizaje  profundo.  En:  
Satapathy  SC,  Bhateja  V,  Das  S  (eds)  Computación  y  aplicaciones  inteligentes  
inteligentes.  Innovación  inteligente,  sistemas  y  tecnologías,  vol  104.  Springer,  Singapur  
57.  Mahajan  AS  (2020)  Diagnóstico  médico  de  diabetes  mediante  aprendizaje  profundo
técnicas  y  análisis  de  big  data.  J  Tecnología  emergente  Innov  Res  7:  1490–1497
58.  Deshmukh  T,  Fadewar  HS,  Shukla  A  (2020)  La  detección  de  Prameha
(diabetes)  de  forma  ayurvédica  con  la  ayuda  del  aprendizaje  profundo  difuso.  En:  
Gunjan  VK,  Diaz  VG,  Cardona  M,  Solanki  VK,  Sunitha  KVN  (eds)  ICICCT  2019  ­  
Confiabilidad  del  sistema,  control  de  calidad,  seguridad,  mantenimiento  y  gestión.  
Springer,  Singapur.  https://doi.org/10.1007/978­981­13­8461­5_17

Nota  del  editor  Springer  
Nature  se  mantiene  neutral  con  respecto  a  los  reclamos  jurisdiccionales  
en  mapas  publicados  y  afiliaciones  institucionales.

También podría gustarte