Está en la página 1de 33

Machine Translated by Google

Computación cognitiva (2021) 13: 1–33


https://doi.org/10.1007/s12559-020-09773-x

Aprendizaje profundo en minería de datos biológicos

Mufti Mahmud1,5 · M. Shamim Kaiser2 · T. Martin McGinnity1,3 · Amir Hussain4

Recibido: 1 mayo 2020 / Aceptado: 28 septiembre 2020 / Publicado en línea: 5 de enero de 2021
© El Autor(es) 2020

Resumen
Los avances tecnológicos recientes en las herramientas de adquisición de datos permitieron a los científicos de la vida adquirir datos multimodales
de diferentes dominios de aplicaciones biológicas. Categorizados en tres grandes tipos (es decir, imágenes, señales y secuencias), estos datos son
enormes en cantidad y de naturaleza compleja. La extracción de una cantidad tan enorme de datos para el reconocimiento de patrones es un gran
desafío y requiere técnicas sofisticadas de aprendizaje automático con uso intensivo de datos. Los sistemas de aprendizaje basados en redes
neuronales artificiales son bien conocidos por sus capacidades de reconocimiento de patrones y, últimamente, sus arquitecturas profundas,
conocidas como aprendizaje profundo (DL), se han aplicado con éxito para resolver muchos problemas complejos de reconocimiento de patrones.
Para investigar cómo DL, especialmente sus diferentes arquitecturas, ha contribuido y se ha utilizado en la extracción de datos biológicos
pertenecientes a esos tres tipos, se realizó un metanálisis y los recursos resultantes se analizaron críticamente. Centrándose en el uso de DL para
analizar patrones en datos de diversos dominios biológicos, este trabajo investiga las aplicaciones de diferentes arquitecturas de DL a estos datos.
A esto le sigue una exploración de las fuentes de datos de acceso abierto disponibles pertenecientes a los tres tipos de datos junto con las
herramientas populares de DL de código abierto aplicables a estos datos. Además, se proporcionan investigaciones comparativas de estas
herramientas desde perspectivas cualitativas, cuantitativas y de evaluación comparativa. Finalmente, se describen algunos desafíos de investigación
abiertos en el uso de DL para extraer datos biológicos y se presentan una serie de posibles perspectivas futuras.

Palabras clave Interfaces cerebro-máquina · Bioimágenes · Comparación de rendimiento de aprendizaje profundo · Imágenes médicas · Ómicas ·
Fuentes de datos de acceso abierto · Herramientas de código abierto

Introducción siglos [1]. Esto aceleró el desarrollo de herramientas y tecnologías de


vanguardia que permiten a los científicos estudiar de manera holística
La búsqueda por comprender los comportamientos humanos, así como los sistemas biológicos y profundizar, de una manera sin precedentes,
las distintas patologías, su diagnóstico precoz y la búsqueda de curas, en los detalles moleculares de los organismos vivos [2, 3]. La creciente
ha impulsado la investigación en ciencias de la vida en los dos últimos sofisticación tecnológica ha presentado a los científicos nuevas
herramientas para la secuenciación del ADN [4], la expresión génica
[5], la bioimagen [6], la neuroimagen [7] y las interfaces cuerpo/cerebro-
M. Mahmud y MS Kaiser son los primeros autores conjuntos.
máquina [8].
* Muftí Mahmud Estos enfoques innovadores para estudiar los organismos vivos
mufti.mahmud@ntu.ac.uk; muftimahmud@gmail.com producen una gran cantidad de datos [9] y crean una situación que a
* M. Shamim Kaiser menudo se conoce como "diluvio de datos" [10]. Dependiendo de la
mskaiser@juniv.edu aplicación y experimentación objetivo, estos macrodatos biológicos

1
pueden caracterizarse por sus características inherentes de ser
Departamento de Ciencias de la Computación, Nottingham Trent
jerárquicos (es decir, datos provenientes de diferentes niveles de un
Universidad, Clifton, NG11 8NS Nottingham, Reino Unido
2
sistema biológico, desde moléculas a células, tejidos y sistemas),
Instituto de Tecnología de la Información, Jahangirnagar
heterogéneos (es decir, datos adquiridos por diferentes métodos de
Universidad, Savar 1342 Dhaka, Bangladesh
3
adquisición, desde la genética hasta la fisiología, desde la patología
Centro de Investigación de Sistemas Inteligentes, Universidad de Ulster,
hasta las imágenes), dinámico (es decir, los datos cambian en función
Irlanda del Norte BT48 7JL Derry, Reino Unido
4
del tiempo) y complejo (es decir, datos que describen procesos
Escuela de Informática, Edimburgo, EH11 4BN Edimburgo,
biológicos no lineales) [11]. Estas características intrínsecas de los
Reino Unido

5
macrodatos biológicos supusieron un enorme desafío para los científicos
Centro de innovación de tecnología médica, Nottingham Trent
de datos a la hora de identificar patrones y analizarlos para inferir significados.
Universidad, NG11 8NS Clifton, Nottingham, Reino Unido

Vol.:(0123456789) 1 3
Machine Translated by Google

2 Computación cognitiva (2021) 13: 1–33

conclusiones de estos datos [12]. Los desafíos han desencadenado Desde la década de 1950, se han propuesto muchos métodos
el desarrollo de herramientas de software racionales, confiables, pertenecientes a ambos paradigmas de aprendizaje (es decir ,
reutilizables, rigurosas y robustas [11] utilizando métodos basados en supervisado y no supervisado) . Los métodos populares en el supervisado
aprendizaje automático (ML) para facilitar el reconocimiento, la dominio incluyen: ANN [14] y sus variantes (p. ej ., Backpropa gation
clasifcación y la predicción de patrones en los grandes datos biológicos [13].[15],
]. Hopfeld Networks [16], Boltzmann Machines [17], Restricted
Según cómo un método aprende de los datos, las técnicas de ML Boltzmann Machines [18], Spiking Ne ral Networks [19], etc.), Bayesian
se pueden clasificar en términos generales en supervisadas . Estadísticas [20], Máquinas de vectores de soporte [21] y otros
y enfoques no supervisados . En el aprendizaje supervisado , los clasificadores lineales [22] (p. ej.
objetos de un conjunto se clasifican mediante un conjunto de Discriminante lineal de Fisher [23], Regressors [24], Naive Bayes
anotaciones o atributos o características conocidas, es decir, un grupo supervisado
Classifer. [25], etc.), k-Nearest Neighbors [26], Hid den Markov Model
El algoritmo aprende los patrones a partir de un número limitado de [27] y Decision Trees [28]. Los métodos populares no supervisados
datos de entrenamiento anotados y luego clasifica los datos de prueba incluyen: codificadores automáticos [29], maximización de expectativas
restantes utilizando el conocimiento adquirido. En cambio, en el [30], cuello de botella de información [31], mapas autoorganizados
aprendizaje no supervisado , los patrones se definen primero a partir [32], reglas de asociación [33], agrupamiento jerárquico [34], k-Means
de un subconjunto de datos desconocidos y luego los datos restantes [35], Agrupación difusa [36] y Agrupación basada en la densidad [37,
se clasifican según los patrones definidos, es decir, un algoritmo no 38] (p. ej., ordenar puntos para identificar la estructura de agrupación
supervisado primero define los patrones entre los objetos en un grupo. [39]). Muchos de estos métodos se han aplicado con éxito a datos
de datos con anotaciones o atributos o características desconocidos, provenientes de diversas fuentes biológicas.
y luego utiliza el conocimiento adquirido para clasificar los datos
restantes. Además, existe otra categoría llamada aprendizaje por En aras de la simplicidad, la gran cantidad de datos biológicos
refuerzo que está fuera del alcance de este trabajo, pero permite que que provienen de los diversos dominios de aplicación se han
un agente mejore su experiencia y conocimiento aprendiendo categorizado en unos pocos tipos de datos amplios. Estos tipos de
iterativamente a través de la interacción con su entorno. datos incluyen Secuencias (datos generados por tecnologías Omics,
por ejemplo, [gen/transcript/epigen/prote/metabol]omics [40]),

Datos Aprendizaje profundo Aplicaciones

Reconocimiento de actividad humana


Electroencefalograma
Cartografía/ Monitoreo de comportamiento
electromiograma Simple a abstracto
Electrocardiograma caracteristicas
Clasificación estado cognitivo

Actividad individual / multiunidad Detección de anomalías

potenciales de campo

Reconstrucción de imagen
Diagnóstico de enfermedades
AD DBN Segmentación de órganos
Imágenes EM
Detección de anomalías
(f/s) RM
Exploración PET/CT

radiografías Análisis celular


Imágenes de fondo de ojo Clasificación de células/tejidos
Imágenes de Endoscopia Conteo de células
RNN CNN
Diagnóstico de enfermedades

predicción de enfermedades
Gen/ADN/secuencia de ARN
diseño de drogas
La expresion genica
componentes moleculares
modificación genética
Estructura de la proteína Splicing alternativo
Aporte Producción Oculto Visible Núcleo Conv./Grupo
PS interpretación

ALU de control ALU


ALU ALU

Cache

DRACMA DRACMA
DL4J scikit

UPC GPU FPGA ASIC APRENDIZAJE PROFUNDO4J

Hardware Herramientas / Marcos / Bibliotecas

Fig. 1 El ecosistema de análisis de datos moderno que utiliza métodos avanzados [Medical/ Bio]-Imaging y señales de [Brain/ Body]–Machine
de aprendizaje automático con un enfoque específico en la aplicación de DL a la Interfaces) se extraen utilizando DL con arquitecturas adecuadas diseñadas para
minería de datos biológicos. Los datos biológicos provenientes de varias fuentes aplicaciones específicas
(por ejemplo, datos de secuencias de Omics, varias imágenes de

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 3

Imágenes (datos generados por técnicas de imágenes [bio/médicas/clínicas/ los componentes de este ecosistema (ver los diversos componentes del
salud] que contienen imágenes [sub]celulares y de diagnóstico), y Señales ecosistema en la Fig. 1). Los componentes restantes del ecosistema incluyen
(señales eléctricas generadas por el cerebro y los músculos y adquiridas usando fuentes de datos de acceso abierto y cajas de herramientas y bibliotecas de
sensores apropiados en el [Cerebro] /Cuerpo]–Interfaces de máquina o BMI). código abierto que se utilizan en el desarrollo de métodos individuales. Por lo
Cada uno de estos tipos de datos que se originan en diversos dominios de tanto, es de suma importancia tener una comprensión completa de la disponibilidad
aplicaciones biológicas han sido testigos de importantes contribuciones de los de conjuntos de datos y sus características, las capacidades y opciones que
métodos de ML especificados y sus variantes (ver Secuencias ofrecen las bibliotecas, y cómo se comparan entre sí en diferentes entornos de
ejecución, como central
[41], imágenes [42–44] y señales [45–47]).
En los últimos años, los métodos de DL están remodelando potencialmente unidad de procesamiento (CPU) y unidad de procesamiento gráfico (GPU).
el futuro de ML y AI [48]. Vale la pena mencionar aquí que, desde una perspectiva La novedad del artículo actual radica en que es el primero de su tipo en cubrir de
más amplia, ML se ha aplicado a una variedad de tareas que incluyen detección manera integral el ecosistema completo del análisis de datos moderno utilizando
de anomalías [49, 50, 278, 283, 290], minería de datos biológicos [51, 52], técnicas avanzadas de ML, es decir, DL.
detección de coronavirus [53, 54], detección de enfermedades y manejo de Por lo tanto, con el objetivo anterior, esta revisión proporciona: una breve
pacientes [55–57, 277, 279–282, 284, 286, 287, 289, 291], educación [58], descripción general de los conceptos de DL y sus aplicaciones a varios tipos de
procesamiento del lenguaje natural [59, 285, 288] y predicción de precios [60]. A datos biológicos; una lista de repositorios de datos de acceso abierto disponibles
pesar de la notable popularidad y aplicabilidad a diversas disciplinas [61], no que ofrecen datos para el desarrollo de métodos; y una lista de marcos y
existe una revisión exhaustiva que se centre en el reconocimiento de patrones en bibliotecas de código abierto existentes que se pueden utilizar para aprovechar el
datos biológicos y proporcione indicaciones sobre las diversas fuentes de datos poder de estas técnicas junto con su comparación relativa y de rendimiento. Hacia
biológicos y herramientas de DL, y el rendimiento de esas herramientas [51]. el final, se identifican algunos temas abiertos y se esbozan algunas perspectivas
futuras especulativas.

El resto del artículo está organizado de la siguiente manera: la Sección 2


Además, considerando el ecosistema de análisis de datos moderno que proporciona una descripción general conceptual e introduce al lector a la teoría
utiliza técnicas avanzadas de ML (como DL), proporcionar información sobre la subyacente de DL; Seccion 3
aplicación de métodos solo cubre parcialmente describe las aplicaciones; La Sección 4 enumera los programas de código abierto

a b
3%1%
3%
4%

5%

5%

6%

58%
7%

8%

CNN FCN DA TRL RNN


ANN GAN DNN DBN DBM

Fig. 2 Aplicación de diferentes modelos de DL a datos biológicos. a los colores de los pasteles individuales coinciden con los colores de la nube de palabras.
Nube de palabras generada con palabras clave de autor extraídas de trabajos de Leyenda: CNN: red neuronal convolucional, FCN: red totalmente conectada, DA[E]:
investigación publicados entre enero de 2011 y marzo de 2020 que mencionaron el codificador automático profundo, TRL: aprendizaje por transferencia, RNN: red neuronal
análisis de datos biológicos (imágenes, señales y secuencias) utilizando técnicas de DL recurrente (incluida la memoria a largo plazo o LSTM), ANN: red neuronal artificial ,
e indexados en la base de datos Scopus. Las palabras clave fueron podadas para GAN: Red adversa generativa, DNN: Red neuronal profunda, DBN: Red de creencias
resaltar los métodos de análisis. b Distribución de artículos publicados que mencionan profundas, DBM: Máquina de Boltzmann profunda
el uso de las 10 técnicas principales. los

13
Machine Translated by Google

4 Computación cognitiva (2021) 13: 1–33

repositorios de datos; La Sección 5 presenta las populares herramientas DL BM es eso, el proceso de aprendizaje es computacionalmente costoso y
de código abierto; y las Secciones 6 y 7 comparan las herramientas más bastante lento. Debido a esto, un BM requiere un largo período para alcanzar
populares desde una perspectiva relativa y de rendimiento. Sección 8 las estadísticas de equilibrio [62]. Sin embargo, esta ineficiencia en el
presenta al lector algunos de los temas abiertos y sugerencias sobre las aprendizaje se puede resolver formando un gráfico bipartito (es decir,
perspectivas futuras, y finalmente, el artículo concluye en la Sección 9. restringiendo para tener una capa oculta y una capa visible)
[67]. Para extender esta arquitectura superficial a una profunda, se apilan
varios RBM como elementos de aprendizaje unitario y esto produce las
siguientes dos arquitecturas DL.
Descripción general del aprendizaje profundo
Máquina profunda de Boltzmann (DBM)
En DL, las representaciones de datos se aprenden con niveles de abstracción
crecientes, es decir, en cada nivel se aprenden representaciones más DBM [70] es una pila de RBM no dirigidos que admite un mecanismo de
abstractas definiéndolas en términos de representaciones menos abstractas retroalimentación entre las capas para facilitar la inferencia de unidades de
en niveles inferiores [62]. A través de este proceso de aprendizaje jerárquico, nivel superior para propagarse a unidades de nivel inferior. Esto permite que
un sistema puede aprender representaciones complejas directamente de los una entrada se interprete alternativamente a través de la competencia
datos sin procesar [63]. concurrente en todos los niveles del modelo.
Aunque se han propuesto muchas arquitecturas DL en la literatura para A pesar de este poderoso mecanismo de inferencia, la estimación de los
diversas aplicaciones, ha habido una preferencia constante por utilizar parámetros del modelo a partir de los datos sigue siendo un desafío y no
variantes particulares para datos biológicos. Como se muestra en la Fig. 2, puede resolverse utilizando métodos tradicionales basados en gradientes (p.
los modelos más populares se identificaron como: Deep Neural Network ej., divergencia contrastiva persistente [71]) [70]. Aunque este problema de
(DNN), Deep Boltz mann Machine (DBM) y Deep Belief Network (DBN), Deep aprendizaje se supera entrenando previamente cada RBM de forma codiciosa
Autoencoder (DA), Generative Adversarial Network (GAN) , Red neuronal por capas, con salidas de las variables ocultas de las capas inferiores como
recurrente (RNN, incluido LSTM) y Red neuronal convolucional (CNN). Cada entrada a las capas superiores [67], la complejidad del tiempo sigue siendo
una de las arquitecturas de estos modelos y sus respectivos pros y contras alta y el enfoque puede no ser adecuado para grandes conjuntos de datos de
se enumeran en la Tabla 1. Las siguientes subsecciones presentan cada una entrenamiento. [72].
de estas arquitecturas DL utilizadas con mayor frecuencia en la extracción de
datos biológicos. Red de creencias profundas (DBN)

DBN [73], en contraste con DBM, se forma apilando varios RBM juntos de
manera que la capa latente de un RBM está vinculada a la capa visible del
Red neuronal profunda (DNN) siguiente RBM. Como las dos capas superiores de DBN no están dirigidas,
las conexiones están dirigidas hacia abajo a su capa inferior inmediata [73,
Un DNN [64] está inspirado en el mecanismo de procesamiento visual 74]. Así, la DBN es un modelo híbrido con las dos primeras capas como
multinivel del cerebro, comenzando con el área cortical 'V1' y luego con el modelo gráfico no dirigido y siendo el resto modelo generativo dirigido. Las
área 'V2', y así sucesivamente [65]. Imitando esto, la red neuronal artificial diferentes capas se aprenden de forma codiciosa por capas y se ajustan con
tradicional o NN se amplía con capas ocultas adicionales que contienen precisión en función de la salida requerida [75]; sin embargo, el procedimiento
unidades computacionales no lineales en cada una de estas capas ocultas de entrenamiento es computacionalmente exigente.
para aprender un subconjunto de las representaciones dadas. A pesar de su
uso exitoso en una variedad de aplicaciones diferentes, el principal
inconveniente ha sido el proceso de entrenamiento lento y engorroso [66]. Codificador automático profundo (DA)

DA es una arquitectura DL [76] obtenida apilando una serie de Autoencoders


[Restringido] Máquinas de Boltzmann ([R]BM) controlados por datos que son elementos no supervisados. DA también se
conoce como DAE y está diseñado para reducir la dimensión de los datos al
[R]BM representa distribuciones de probabilidad específcas a través de un proyectar automáticamente las representaciones entrantes en un espacio de
modelo generativo probabilístico no dirigido [67]. Considerado como un menor dimensión que el de la entrada. En un Autoencoder, se utilizan
detector de características no lineales, [R]BM se entrena en función de la cantidades iguales de unidades en las capas de entrada/salida y menos
optimización de sus parámetros para un conjunto de observaciones dadas unidades en las capas ocultas. Las transformaciones (no) lineales se
para obtener el mejor ft posible de la distribución de probabilidad a través de incorporan en las unidades de capa oculta para codificar la entrada dada en
un método de cadena de Markov Monte Carlo conocido como muestreo de dimensiones más pequeñas [77]. A pesar de que requiere una etapa de
Gibbs [68, 69 ]. Con conexiones simétricas entre unidades posteriores en preentrenamiento y sufre un error de desaparición, esta arquitectura es
múltiples capas ocultas, BM tiene solo una capa visible. El principal popular por su capacidad de compresión de datos.
inconveniente de la norma.

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 5

Tabla 1 Puntos clave y aplicaciones de diferentes arquitecturas de aprendizaje profundo

Arquitectura ventajas Contras.

DNN - DNN puede aprender la representación de - Requiere un volumen sustancial de datos de


características de alto nivel y aplicar el aprendizaje entrenamiento.
de transferencia. - Se requiere una potencia computacional signifcativa.
- Puede ser utilizado para el cuidado de la salud y

reconocimiento visual. - El proceso de aprendizaje es lento.

Aporte Oculto Producción

DBM - Modelo gráfico, enlaces no dirigidos a través de un - Alta complejidad de tiempo para interferencias que DBN.
conjunto de nodos visibles y un conjunto de nodos ÿ - La información de aprendizaje no llega a la capa
ocultos. inferior.
- Utilizado principalmente para reducción de - Tiende a overft.
dimensionalidad y clasificación.

Oculto Visible

DBN - Fácil de codificar y funciona lo suficientemente bien - Se puede entrenar con avidez, una capa a la vez.
para unas pocas capas.
- Ganancia de alto rendimiento por adición - Distribución posterior difícil de deducir para
ing capas en comparación con el perceptrón configuraciones de causas ocultas.
multicapa.
- Robusto en la clasificación.

Oculto Visible

AD - Aprenda la codificación, reconstrucción y generación - Requiere etapa de preentrenamiento debido a las


de datos al mismo tiempo. posibilidades de error de desaparición.
- El entrenamiento es estable sin datos de etiqueta. - Cada aplicación requiere rediseñar y volver a entrenar
- Variante: DA escasa, sin ruido y contractiva. el modelo.

- El DA es sensible a los errores de entrada.

Aporte Oculto Producción

GAN - El principal beneficio es el aumento de datos. - Difícil de entrenar ya que optimizar la función de
ción pérdida es difícil y requiere mucho ensayo y error.
- GAN realiza un aprendizaje no supervisado.

- GAN aprende distribuciones de densidad de


datos.

Entrada retroalimentada Oculto De entrada y salida

RNN - Puede procesar entradas de cualquier longitud. - La computación es lenta y el entrenamiento puede ser
- RNN puede usar la memoria interna y funciona bien difícil.

para transmitir datos de series temporales. - El procesamiento de secuencias largas es difícil.


- Propenso a problemas como explosión y desaparición
de gradientes.

Aporte Oculto Producción

13
Machine Translated by Google

6 Computación cognitiva (2021) 13: 1–33

Tabla 1 (continuación)

Arquitectura ventajas Contras.

CNN - CNN puede capturar información jerárquica. - Se requiere un gran conjunto de datos etiquetados para el

entrenamiento.
Convolución y Pooling Totalmente conectado
- CNN puede compartir el peso preentrenado - El mecanismo de trabajo de CNN no está claro.
que se requiere para el aprendizaje de
transferencia.
- Requiere menos conexión en comparación con
DNN.

Aporte Producción

Núcleo Conv./Grupo Oculto

Leyenda: DA Deep Autoencoder, DBN Deep Belief Network, RNN Recurrent Neural Network, DNN Deep Neural Network, DBM Deep Boltz mann Machine, CNN Convolutional Neural Network.

y tiene muchas variantes, por ejemplo, codificador automático de eliminación de Red neuronal convolucional (CNN)
ruido [76], codificador automático disperso [78], codificador automático
variacional [79] y codificador automático contractivo [80]. CNN [90] es un modelo NN multicapa [91] que ha ganado popularidad en el
análisis de datos basados en imágenes. Inspirada en la neurobiología de la
corteza visual, la CNN consta de capas convolucionales que contienen un
Red adversaria generativa (GAN) conjunto de bancos de fltros que se pueden aprender y seguidas de capas
totalmente conectadas. Estos bancos de fltros convolucionan con los datos de
GAN [81] es un modelo generativo efectivo. Los modelos generativos realizan entrada y pasan los resultados a las funciones de activación (p. ej., ReLU,
una tarea de aprendizaje no supervisada, en la que descubren y aprenden Sigmoid y Tanh). También existen pasos de submuestreo entre estas capas. La
automáticamente los patrones existentes en los datos y luego usan ese CNN supera a las DNN, que no escalan bien con datos de entrada
conocimiento para generar nuevos ejemplos del patrón aprendido como si se multidimensionales correlacionados localmente. Para abordar el problema de
hubieran extraído del conjunto de datos original. Usando GAN, el problema se escalado de las DNN, el enfoque CNN ha tenido bastante éxito en el análisis de
ve como un problema de aprendizaje supervisado con dos aspectos: (i) el conjuntos de datos con una gran cantidad de nodos y parámetros (por ejemplo,
generador, que genera nuevos ejemplos a medida que se entrenan, y (ii) el imágenes). Como las imágenes son 'estacionarias', los fltros de convolución
discriminador, que clasifica los ejemplos generados en dos clases (reales o (CF) pueden aprender fácilmente núcleos controlados por datos. La aplicación
falsos). Estos modelos generador y discriminador se entrenan juntos en un de dicha CF junto con una función de agrupación adecuada reduce las
juego de suma cero (es decir, de forma contradictoria) de modo que los ejemplos características que se suministran a la red completamente conectada para
generados por el modelo generador maximicen la pérdida del modelo clasificar. Sin embargo, en el caso de grandes conjuntos de datos, incluso esto
discriminador [82, 83]. puede ser desalentador y puede resolverse utilizando redes escasamente
conectadas. Algunas de las configuraciones populares de CNN incluyen AlexNet
[92], VGGNet [93]

Red neuronal recurrente (RNN) GoogLeNet [94], etc. (consulte la Tabla 2 para obtener una lista completa de las
variaciones de CNN con detalles relevantes).
La arquitectura RNN [84] está diseñada para detectar alineaciones
espaciotemporales en flujos de datos [85]. A diferencia de los NN de
alimentación directa que realizan cálculos unidireccionales desde la entrada Aprendizaje profundo y datos biológicos
hasta la salida, un RNN calcula la salida del estado actual en función de las
salidas de los estados anteriores. Debido a esta propiedad similar a la 'memoria', Se han informado muchos estudios en la literatura que emplean diversas
a pesar de los problemas de aprendizaje relacionados con gradientes que se arquitecturas de DL con conjuntos de parámetros variados y relacionados
desvanecen y explotan, RNN ha ganado popularidad en muchos campos (consulte la sección 2) para analizar patrones en datos biológicos. Para la
relacionados con la transmisión de datos (por ejemplo, minería de texto, series mayoría de las arquitecturas de DL, como se muestra en la Fig. 3, el número de
temporales, genomas, finanzas, etc.). En los últimos años, también se han publicaciones aumenta constantemente a lo largo de los años. A continuación
aplicado dos variantes principales, RNN bidireccional (BRNN) [86] y Long Short- se describe un conjunto de estudios representativos seleccionados al azar de la
Term Memory (LSTM) [87] [48, 88, 89]. gran cantidad de literatura informada y se resumen en la Tabla 3. Estos estudios
pertenecen a

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 7

Tabla 2 Puntos clave de diferentes arquitecturas de CNN profundas

Arquitectura Diseño de red Parámetros Puntos clave

LeNet (1998) LeNet-5 es la primera arquitectura CNN con 2 convolu 0,06 millones - Feedforward NN.

cional y 3 capas totalmente conectadas. - La conexión entre capas es escasa para reducir la
complejidad computacional. 60 millones: más profundo que

Alex Net (2012) AlexNet tiene 8 capas y consta de 5 convolucionales LeNet y artefactos de alias en los mapas de características aprendidas debido al gran
y 3 capas totalmente conectadas. tamaño del filtro.

VGG-16 (2014) VGG-16 tiene 13 capas convolucionales (y capas de agrupación 138 millones: se puede diseñar una red aproximadamente dos veces más profunda
máximas) y 2 capas completamente conectadas seguidas de 1 capa en comparación con AlexNet.
de salida con activación softmax. - Una variante más profunda de VGG-16 es VGG-19.
- Computacionalmente caro y no se puede utilizar con sistemas
de bajos recursos.

Inception-v1 (2014) También conocido como GoogleNet, tiene 22 capas con parámetros (o 5 millones - Utiliza conexiones escasas para superar el problema de
27 cuando se incluyen capas de agrupación). Hacia el final, información redundante y omite características irrelevantes
emplea una agrupación promedio. mapas
- Alta precisión con un coste computacional reducido.
- Su topología heterogénea requiere personalización.

Inception-v3 (2015) Inception-v3 tiene 48 capas con varios módulos de inicio (cada uno consta 23 millones: aumenta la precisión y reduce la complejidad computacional en
de capas de agrupación y filtros convolucionales con funciones de comparación con Inception-v1.
activación), capas de concatenación y capa(s) totalmente - Reduce el cuello de botella representacional.
conectada(s) junto con abandono y softmax. - Reemplaza fltros de gran tamaño por otros más pequeños.
- Su arquitectura es compleja y carece de homogeneidad.

ResNet-50 (2015) ResNet-50 tiene 50 capas con convolucional inicial 25,5 millones - Proporciona una velocidad de entrenamiento acelerada.ÿ
y capas de agrupación máxima, y agrupación promedio final y león -Reduce el efecto del problema del gradiente de fuga.
capas totalmente conectadas. En el medio, hay 3, 4, 6 y 3 bloques
residuales separados en 4 etapas donde cada bloque contiene 3 - Clasifica imágenes con alta precisión.
capas convolucionales.

Xcepción (2016) La arquitectura Xception tiene 36 capas convolucionales que 22,8 millones: Xception muestra pequeñas ganancias en el rendimiento de
forman la base de extracción de características de la red. Las clasificación en el conjunto de datos ImageNet y grandes
36 capas convolucionales están estructuradas en 14 módulos, ganancias en el conjunto de datos JFT en comparación con
todos los cuales tienen conexiones residuales lineales a su Inception v3.

alrededor, excepto el primero y el último módulo.

Inception-v4 (2016) Inception-v4 consta de dos secciones principales: un extractor de características 43 millones - Jerarquías profundas de características, representación de
y una capa totalmente conectada. El extractor de características características multinivel.ÿ - La velocidad de aprendizaje es lenta.
incluye varios bloques convolucionales, como 1 bloque de tallo, 14

bloques de inicio, 2 bloques de reducción y una capa de agrupación.


Los bloques de inicio se dividen en tres categorías, a saber, A, B y
C con 4, 7 y 3 bloques, respectivamente.

Origen-ResNet-v2 (2016) Inception-ResNet-v2 consta de 164 capas con 56 millones - Mejora la velocidad de entrenamiento.ÿ - Jerarquías profundas de
varios bloques convolucionales que incluyen 1 bloque de tallo, 20 características, representación de características multinivel.
bloques de inicio residual, 2 bloques de reducción y una capa de
agrupación. Los bloques de inicio residuales se dividen en tres
categorías, a saber, A, B y C con 5, 10 y 5 bloques, respectivamente.

ResNeXt-50 (2016) ResNeXt-50 tiene convolucional inicial y máx. 25 millones - Tiene topología homogénea. ÿ - Realiza convolución agrupada.
capas de agrupación y agrupación media final y capas totalmente
conectadas. En el medio, hay 3, 4, 6 y 3 bloques residuales
separados en 4 etapas donde cada bloque contiene 3 capas
convolucionales. En comparación con ResNet-50, aumenta la
cantidad de torres paralelas (cardinalidad = 32) dentro de cada
bloque residual.

DenseNet-121 La arquitectura DenseNet incluye 4 bloques densos. Cada capa en 8 millones: introduce profundidad o dimensión entre capas.ÿ: garantiza el máximo
(2016) un bloque denso está conectada con todas las demás capas. Los flujo de datos entre las capas de la red. ÿ - Evita el reaprendizaje
bloques densos, que consisten en convolución, agrupación, de mapas de características redundantes.
normalización por lotes y activación, están separados por capas de
transición.

13
Machine Translated by Google

8 Computación cognitiva (2021) 13: 1–33

carcinoma neuroendocrino [55, 74, 105]. La versión de doble vía de CNN fue
a Imágenes
utilizada por Kamnitsas et al. segmentar lesiones relacionadas con tumores,
100
lesiones traumáticas y accidentes cerebrovasculares isquémicos [109]. CNN
80
también fue utilizado por Fritscher et al. para la segmentación de volumen
60 [101] y por Cho et al. para encontrar estructuras anatómicas (nódulo pulmonar

40 para clasificar malignidad) [106] a partir de tomografías computarizadas (TC).


Se aplicó DBN en resonancias magnéticas para detectar el trastorno por déficit
20
de atención con hiperactividad [96] y en resonancias magnéticas cardíacas
0 para segmentar el ventrículo izquierdo del corazón [107]. Las GAN han ganado
DNN DBM DBN DA GAN RNN CNN popularidad en la síntesis de imágenes y el aumento de datos para reducir el sobreprecio.

Señales La aplicación de GAN en el aumento de datos y la traducción de imágenes se


b
100 revisó en [143] y el aumento de datos en las tareas de segmentación de CT se
realizó utilizando CycleGAN [144]. Se propuso un marco basado en GAN
80
llamado MedGAN para la traducción médica de imagen a imagen [145]. GAN
60 se utilizó como modelo de predicción de supervivencia para imágenes de

40 tomografía computarizada de tórax de pacientes que sufrían fbrosis pulmonar


idiopática [146, 147]. Halicek también utilizó GAN para sintetizar imágenes
20
hiperespectrales a partir de histología digitalizada de células de cáncer de
0 mama [148].
DNN DBM DBN DA GAN RNN CNN

Secuencias Señales
C
100
Se empleó un DA apilado para detectar emociones a partir de señales de
80
electroencefalografía (EEG) después de extraer características relevantes
60 mediante el análisis de componentes principales (PCA) y reducir el efecto no
40 estacionario mediante la adaptación de cambio de covariable [119]. Se aplicó
DBN para decodificar imágenes motoras mediante la clasificación de la señal
20
EEG [110]. Para un propósito similar, se utilizó CNN con características de
0 patrones espaciales comunes aumentadas [111]. Las señales de EEG también
DNN DBM DBN DA GAN RNN CNN
se clasificaron mediante DA después de extraer características como la
2015 2016 2017 2018 2019 ubicación, la hora y la frecuencia mediante CNN [112]. Li et al. usó DBN para
extraer características latentes de baja dimensión y seleccionar canales críticos

Fig. 3 Tendencias en la publicación que involucran diferentes arquitecturas para clasificar el estado afectivo usando señales de EEG [114].
de DL de 2015 a 2019 en tres tipos principales de datos: imágenes a, señales Además, Jia et al. usó un aprendizaje activo para entrenar DBN y RBM
b y secuencias c. El número de artículos se ha normalizado dentro de cada generativos para la clasificación [115]. Tripathi et al. utilizó un modelo basado
tipo de datos. Sin embargo, cabe señalar que la proporción del número de
en DNN y CNN para la clasificación de emociones [116].
publicaciones que involucran técnicas de DL aplicadas a diferentes tipos de
datos (imágenes, señales y secuencias) es de aproximadamente : 1 1:1. CNN se empleó para predecir convulsiones a través de la clasificación de
4 10
patrones de sincronización [118]. DBN [123] y CNN [122] se utilizaron para
decodificar la acción de movimiento de la base de datos de NinaPro. los

los tres tipos de datos que hemos considerado en el contexto de este artículo, El enfoque posterior también se utilizó en los repositorios MIT-BIH, INCART y
es decir, imágenes, señales y secuencias. SVDB [122]. Además, el Electrocardiograma (ECG)
Las arritmias se clasificaron utilizando DBN [120, 121] a partir de los datos
Imágenes proporcionados por la base de datos de arritmias del MIT-BIH. Zhu et al. usó
un modelo GAN con LSTM y CNN para generar señales de ECG con alta
La CNN se usó en imágenes histológicas de la mama para encontrar mitosis similitud morfológica [149]. Otro modelo GAN, RPSeqGAN, entrenado con
[108, 142] y para segmentar estructuras neuronales en imágenes de SeqGAN [150] generó datos de ECG arrítmicos con cinco períodos y mostró
microscopio electrónico (EMI) [103]. Havaei et al. utilizó CNN para segmentar una alta estabilidad y calidad de datos [151]. Luo y Lu también utilizan GAN
el tumor cerebral a partir de imágenes por resonancia magnética (IRM) [100] y para el aumento de datos de EEG [152]. Tú et al. [153] y Jiao et al. [154]
Hosseini et al. lo usó para el diagnóstico de la enfermedad de Alzheimer (EA) utilizaron un modelo basado en GAN para detectar convulsiones mediante
a partir de resonancias magnéticas [56, 97]. DBM [98] y RBM [99] se utilizaron señales de EEG y somnolencia del conductor mediante señales de EEG y
para detectar la EA y el deterioro cognitivo leve (DCL) a partir de resonancias electrooculografía (EOG), respectivamente. Singh et al. propuso un nuevo
magnéticas y tomografías por emisión de positrones (PET). Nuevamente, se marco GAN para eliminar el ruido del ECG [155].
usó CNN en MRI para detectar

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 9

Tabla 3 Aprendizaje profundo aplicado a datos biológicos

Escribe Datos [base/conjunto] arquitectura DL Tarea

Imágenes CUMPLIR DNN [95] identifcación del trastorno del autismo

Conjunto de datos TDAH-200 DBN [96] Detección de TDAH

Conjunto de datos ADNI CNN [97], DBM [98], DBN [99] Diagnóstico de EA/DCL
Conjunto de datos BRATS CNN [100] Segmentación de patología cerebral
Conjunto de datos de TC CNN [101] Segmentación rápida de imágenes médicas en 3D

CONDUCIR, STARE conjuntos de datos [ 102 ] Segmentación de los vasos sanguíneos de la retina

Conjunto de datos de desafío de segmentación de EM CNN [103] Segmento de membranas neuronales

LSTM [104] Segmentación de imágenes volumétricas biomédicas

Conjunto de datos IBSR, LPBA40 y OASIS CNN [105] Pelar el cráneo


Conjunto de datos LIDC-IDRI CNN [106] Clasifcación de malignidad de nódulos pulmonares
Conjunto de datos MICCAI 2009 LV DBN [107] Segmentación del VI del corazón
Conjunto de datos MITOS CNN [108] Detección de mitosis en cáncer de mama

Conjunto de datos PACS CNN [106] Clasificación de imágenes médicas


Conjunto de datos de TBI CNN [109] Segmentación de lesiones cerebrales

Señales Concurso BCI IV DBN [110], CNN [111–113] Decodificación de acción de movimiento

Conjunto de datos DEAP DBN [114, 115] Reconocimiento del estado afectivo

CNN [116] Clasificación de emociones

DESCAFEINADO [ 117 ]

Conjunto de datos de Friburgo CNN [118] predicción de convulsiones

MAHNOB-HCI AD [119] Reconocimiento de emociones

Base de datos de arritmias del MIT-BIH DBN [120, 121] Clasifcación de arritmias por ECG

MIT-BIH, INCART y SVDB CNN [122] Decodificación de movimiento

Base de datos NinaPro DBN [123], CNN [122] Decodificación de acción de movimiento

Secuencias CullPDB, CB513, conjuntos de datos CASP, CAMEO CNN [124] predicción de 2ps
SUEÑO CNN [125] Predicción de secuencias de ADN/ARN

DNI [126] Predecir una combinación de fármacos eficaz


Base de datos ENCODE CNN [127, 128] Identificación de expresión génica
Conjunto de datos ENCODE DGF CNN [129] Predecir la variante no codificante del gen
Base de datos GEO [ 130 ] Aumento de datos de expresión génica
Conjuntos de datos GWH y UCSC DBN [131] Predicción de uniones de empalme
Base de datos JASPAR y ENCODE CNN [132] Predicción de la proteína de unión al ADN
miRBoost RNN [133] Predicción de micro-ARN

Repositorio de datos de emparejamiento de miARN-ARNm LSTM [134] predicción de objetivos de micro-ARN

Banco de datos de proteínas (PDB) AD [135] Reconstrucción de la estructura de proteínas

SRBCT, tumor de próstata y MLL GE sbv IMPROVER DBN [136] Selección de características de genes/miARN

DBN [137] Enfermedades humanas y desarrollo de fármacos


base de datos TCGA AD [138] Detección de cáncer e identificación de genes

DBM [139]

DNN [140] Estimación de combinación de fármacos

UCSC, datos CGHV, base de datos SPIDEX CNN [141] Identificación de variantes genéticas

Secuencias [135]. Lee et al. aplicó un método no supervisado basado en DBN para
realizar la autopredicción de la unión de empalme en el nivel de ácido
El DA de eliminación de ruido apilado se ha utilizado para extraer bonucleico desoxirribonucleico (ADN) [131]. Combinando DBN con
características para el diagnóstico y la clasifcación del cáncer junto con aprendizaje activo, Ibrahim et al. ideó un método para seleccionar
la identifcación de genes relacionados a partir de datos de expresión grupos de características a partir de genes o ácidos microribonucleicos
génica (GE) [138]. GAN también se usó para identificar patrones de (miR NA) en función de los perfiles de expresión [136]. Para la
expresión a partir de datos de GE [156]. Se usó un modelo de investigación traslacional, Chen et al. utilizaron DBN bimodales. para
predecir las respuestas de las células humanas utilizando organismos modelo [137]. Sa
aprendizaje DA basado en plantillas para reconstruir las estructuras de proteínas

13
Machine Translated by Google

10 Computación cognitiva (2021) 13: 1–33

et al. aplicó un modelo híbrido CNN-DBN en los ARN para la predicción de los información de un número de diferentes sistemas de adquisición de imágenes
sitios y motivos de interacción de la proteína de unión al ARN (RBP) [157], y microscópicas.
Alipanahi et al. utilizó CNN para predecir las especificidades de secuencia de [D/ Otra biblioteca de imágenes, llamada Cell Image Library (CIL) [163], presenta
R]BP [125]. Denas y Taylor utilizaron CNN para preprocesar los datos generados más de 10ÿ000 conjuntos de datos únicos y 20 TB de imágenes, videos y datos
a partir de la inmunoprecipitación de cromatina seguida de la secuenciación de animaciones. Estos datos pertenecen a una amplia diversidad de organismos,
(ChIP-seq) y crearon perfiles de actividad del factor de transcripción de genes tipos de células y procesos celulares.
[127].
CNN fue utilizado por Kelley et al. para predecir la accesibilidad de la secuencia La base de datos Euro Bioimaging [164] proporciona datos de imágenes
de ADN [128], por Zeng et al. para predecir la PAD [132], de Zhou et al. [129] y biológicas y biomédicas con el fin de facilitar la colaboración entre diferentes
Huang y otros[141] para encontrar la variación del gen no codificante, y por Wang partes interesadas, incluidos científicos, la industria y las autoridades nacionales
et al. para predecir la estructura de la proteína secundaria (2ps) [124]. Parque et y europeas. Su misión es brindar acceso y servicios a técnicas de imagen y datos
al. utilizó LSTM para predecir el precursor de miARN [133] y Lee et al. [134] lo de bioimagen de última generación para científicos en Europa y más allá.
utilizó para predecir los objetivos de los precursores de miARN. GAN fue utilizado
por Marouf et al. para la generación realista de datos de RNA-seq de una sola Euro Bioimaging también incluye herramientas de análisis de imágenes.
célula [130], por Jiang et al. para predecir el gen de la enfermedad a partir de La HAPS es una base de datos de imágenes histológicas [165] que contiene
datos de RNA-seq [158], por Zhao et al. como un procedimiento semi-supervisado fotografías de resolución media/alta de imágenes microscópicas de células y
para predecir la unión a la diana del fármaco [159], y por Wang et al. para tejidos humanos que no tienen ningún derecho de autor. Otra base de datos de
identificar patrones de expresión a partir de datos de GE [156]. imágenes, Image Data Resource (IDR) [166], contiene conjuntos de datos
individuales de imágenes celulares y de tejidos. Varias categorías de imágenes
incluyen imágenes de lapso de tiempo, estudios de localización de proteínas,
imágenes de patología digital, estudio de levadura, detección de alto contenido
humano, etc. También es una API pública que facilita la visualización, el análisis
Fuentes de datos biológicos de acceso abierto
y el intercambio de datos de imágenes multi-D para biología celular. .

Las iniciativas de intercambio de datos han facilitado en gran medida la


El repositorio de imágenes médicas SICAS (SMIR) es un repositorio de
reproducción de resultados científicos, informados como datos cuantitativos
imágenes para fines de investigación médica. Dos de sus colecciones destacadas
procesados estadísticamente o datos cualitativos representativos cuidadosamente
incluyen tomografía computarizada de cuerpo completo post mortem [167] de 50
seleccionados [160]. En las últimas décadas, muchos repositorios de datos de
sujetos anonimizados de diferentes grupos de edad y género, y modelos de
acceso abierto se han puesto a disposición para este propósito [161]. De hecho,
tomografía computarizada, micro tomografía computarizada, segmentación y
muchos patrocinadores de investigación y revistas ahora requieren que los datos
forma de la cóclea [183].
utilizados para los estudios estén disponibles abiertamente para su verificación.
El Cancer Imaging Archive (TCIA) [168] contiene imágenes de TC, RM y
Para facilitar el desarrollo de métodos, aquí enumeramos los repositorios de
medicina nuclear (p. ej., PET) para diagnóstico clínico, biomarcadores e
datos de acceso abierto líderes y populares relacionados con los datos de
investigaciones interdisciplinarias. Stanford Tissue Microarray Database (TMA)
Secuencias, Imágenes y Señales que se resumen en las Tablas 4, 5 y 6,
[169] es una fuente de imágenes de tejidos microscópicos anotados y datos de
respectivamente.
expresión asociados. Los datos se pueden utilizar para estudiar biología celular.
El conjunto de datos de referencia de biosegmentación de UCSB [170] contiene
Imágenes imágenes celulares, subcelulares y de tejido en 2/3-D. Estos conjuntos de datos
se pueden utilizar para tareas de segmentación y clasificación.

La Tabla 4 enumera las principales fuentes de datos de acceso abierto, incluidas


las bases de datos y los conjuntos de datos individuales que brindan acceso a
los datos relacionados con la investigación de imágenes biológicas. En aras de
la simplicidad, estas fuentes se han agrupado en cuatro amplias áreas de Detección y diagnóstico de enfermedades
aplicación: procesamiento y análisis de imágenes [biomédicas], detección y
diagnóstico de enfermedades, procesamiento y análisis de neuroimágenes y Se ha adquirido una gran cantidad de datos de imágenes de pacientes con
segmentación, que se describen brevemente a continuación. trastornos neurológicos. La base de datos de Autism Brain Imaging Data
Exchange (ABIDE) [171] incluye conjuntos de datos de imágenes cerebrales de
autismo para estudiar el trastorno del espectro autista. El otro conjunto de datos
Procesamiento y análisis de imágenes biomédicas pertenece al trastorno por déficit de atención con hiperactividad (TDAH) [172] e
incluye 776 conjuntos de datos anatómicos y de IRMf en estado de reposo que
La colección Cell Centered Database (CCDB) [162] proporciona reconstrucciones se fusionan en los 8 sitios de imágenes independientes. La información fenotípica
de células y estructuras subcelulares con microscopía de luz y electrónica en 3- incluye edad, sexo, estado de diagnóstico, síntoma de TDAH medido, cociente
D de alta resolución. de inteligencia y medicación.
También contiene [2/3/4] proteína de distribución y estructura D

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 11

Tabla 4 Categorización según la aplicación de repositorios de datos de acceso abierto y conjuntos de datos pertenecientes a imágenes [bio/médicas/sanitarias/clínicas]

Solicitud Nombre Descripción Árbitro.

Procesamiento y análisis de imágenes biomédicas CCDB Imágenes de microscopio electrónico y de luz 2/3/4-D de alta resolución. Conjuntos de [162]
CIL datos de imágenes celulares y aplicación de biblioteca celular. [163]

Bioimagen europea Datos de imágenes biológicas y biomédicas Imagen [164]


HAPS microscópica de células y tejidos humanos Visualización, análisis [165]
IDR y uso compartido de datos de imágenes multi-D Tomografías computarizadas [166]
Sonríe post mortem de todo el cuerpo Imágenes de tomografía computarizada, [167]
TCIA resonancia magnética y PET de pacientes con cáncer Imágenes de tejido [168]
TMA microscópico de seres humanos 2D/ Imágenes 3D celulares, subcelulares [169]

UCSB BioSeg y de tejidos Conjuntos de datos de imágenes del cerebro del autismo [170]

Detección y diagnóstico de enfermedades. CUMPLIR Conjuntos de datos anatómicos/fMRI fusionados en los 8 sitios de imágenes [171]
TDAH-200 MCI, EA temprana y datos de diagnóstico de sujetos de control de edad [172]
ADNI avanzada Datos de mamografías multimodales y ecografías Radiografías de tórax [173]
BCDR para neumonía Imágenes histológicas de cáncer de mama Lupus , cerebro, [174]

Kaggle CXRayP resonancias magnéticas de próstata Casos de COVID-19 con imágenes de rayos [175]
MITOS X/CT de tórax Conjuntos de datos de resonancia magnética funcional y plataforma [176]
NAMIC de síntesis Imágenes de rayos X de tórax etiquetadas con diagnósticos Conjuntos [177]

nCOV-CXray de datos de resonancia magnética y plataforma de gestión de datos XNAT [178]

neurosynth Modalidades de imagen y datos de enfermedades cerebrales CT de huesos [179]


NIH temporales humanos proporciona datos de neuroimagen y software de kit de [180]
OASIS herramientas Mapas de regiones cerebrales y un conjunto de API de resonancia [181]

NI abierto magnética de cabeza completa para recopilar y compartir mapas estadísticos de [182]
Sonríe resonancia magnética cerebral, PET, S PECT, CT, MEG/EEG e imágenes ópticas [183]

Procesamiento y análisis de neuroimagen IXI [184]


LPBA40 [185]

NeuroVault.org [186]
NITRC [187]

OpenfMRI Conjuntos de datos de MRI y EEG multimodales [188]


Servicio de datos del Reino Unido conjunto de datos de IRMf [189]

Segmentación CONDUCIR Imágenes retinales digitales paciente diabético [190]


IBSR Resultados de segmentación de datos de resonancia magnética [191]
MIRAR FIJAMENTE
El conjunto de datos contiene imágenes retinianas crudas/etiquetadas [192]

Leyenda: CXRayP Neumonía de rayos X de tórax , JHDTI Imágenes de tensor de difusión Johns Hopkins

estado. La clasificación diagnóstica basada en imágenes es el objetivo principal enfermedad. Por otro lado, el conjunto de datos Open Neuroimaging (Open
del conjunto de datos ADHD 200. La ADNI (Iniciativa de neuroimagen de la NI) [182] contiene modalidades de imágenes y datos de enfermedades
enfermedad de Alzheimer [173]) es una base de datos popular y contiene cerebrales que se pueden utilizar para estudiar el sistema de apoyo a la toma
conjuntos de datos de neuroimagen de enfermedades neurodegenerativas, en de decisiones para la identificación de enfermedades.
particular, EA, MCI, EA temprana y tardía y sujetos de control de edad La reciente enfermedad del nuevo coronavirus o pandemia de COVID-19
avanzada. Los conjuntos de datos que ofrece este repositorio se dedican ha atraído a varios investigadores a centrar sus

principalmente al desarrollo de métodos novedosos para enfermedades atención en la detección de la nueva enfermedad por coronavirus.
relacionadas con la EA. Otro enfoque de conjunto de datos Los NIH [180]
ing en AD es el conjunto de datos de Open Access Series of Imaging Studies La base de datos de rayos X de tórax nCOV [178] contiene casos de
(OASIS) [181] . Contiene conjuntos de datos de resonancia magnética y una COVID-19 con imágenes de rayos X/TC de tórax. Los datos se pueden utilizar
plataforma de gestión de datos de código abierto (XNAT) para estudiar y para identificar la neumonía bacteriana frente a la viral frente a la COVID-19.
analizar la EA. Neurosynth [179] es otra base de datos más que incluye Kaggle aloja conjuntos de datos similares de rayos X de tórax [175] , que
literatura de fMRI (con algunos conjuntos de datos) y una plataforma de incluyen datos de escaneos de rayos X de tórax para detectar neumonía viral
síntesis para estudiar la estructura, funciones y y bacteriana tradicional.

13
Machine Translated by Google

12 Computación cognitiva (2021) 13: 1–33

Tabla 5 Categorización según la aplicación de repositorios de datos de acceso abierto y conjuntos de datos relacionados con señales biológicas

Solicitud Nombre Descripción Árbitro.

Detección de anomalías SAD mc-EEG Datos de EEG multicanal para tareas de conducción de atención sostenida [193]

Cuerpo EEG TUH Repositorio de conjuntos de datos, herramientas y documentos de EEG [194]
MIT-BIH-ARH Base de datos de ECG que contiene 48 registros [195]
PTB D-ECG Base de datos de ECG que contiene 549 registros [196]
TELEECG 250 registros de ECG con QRS anotados y máscaras de artefactos [197]

Interfaz hombre-máquina BNCI Varios conjuntos de datos de señales de IMC [198]

Representante de datos de EMG Varios conjuntos de datos EMG [199]


SEMG facial Contiene datos EMG de 15 participantes [200]
Base de datos NinaPro Datos cinemáticos y sEMG de 27 sujetos [201]
Detección de emociones/estados afectivos PROFUNDO Datos EMG/EEG registrados simultáneamente [202]
DESCAFEINADO MEG, hEOG, ECG, EMG del músculo trapecio, datos de video faciales [203]

Imaginar Conjuntos de datos de EEG de 31 sujetos mientras escuchan la voz [204]


MAHNOB-HCI Datos de EMG, ECG y respiración y temperatura de la piel [205]
SEMILLA Conjunto de datos de EEG para la emoción y la vigilancia [206]

Clasificación de imágenes motoras EEG-BCI-MI Señales de EEG de 13 sujetos con 60 000 ejemplos de MI [207]
EEG-MI-BCI Datos de EEG de BCI para tareas de MI [208]
EEG-MMI Datos de EEG de PhysioNet para la tarea MI [209]

Evaluación de la condición neurológica V-P300 BCI EEG seco de 16 electrodos de 71 sujetos (modo SP) EEG [210]

húmedo de 32 electrodos de 50 sujetos (modo SP) EEG húmedo [211]

de 32 electrodos de 38 sujetos (modo MPC) EEG húmedo de 32 [212]

electrodos de 44 sujetos (modo MPCC) [213]

Procesamiento y clasificación de señales competencia BCI Datos de EEG, ECoG y MEG de una variedad de aplicaciones BCI Conjunto de [214]

Desafío BCI-NER datos de EEG de 56 canales decodificados por un deletreador P300 [215]
DRÍADA Conjuntos de datos de EEG de 13 sujetos registrados en diversas condiciones [216]

FisioNet Varios conjuntos de datos de EEG, ECG, EMG y sEMG [217]


UCI ML Varios conjuntos de datos de ECG, EMG, sEMG [218]

Leyenda: imágenes de motor MI , imágenes /movimiento de motor MMI , potenciales relacionados con eventos ERP , EEG multicanal de conducción de atención sostenida SADmc- EEG, V-
P300 Visual P300, jugador individual SP , multijugador MP , BCI-SSVEP Potenciales evocados visuales de estado estacionario , EMG DataRep EMG
Repositorio de conjuntos de datos, arritmia ARH , ECG de diagnóstico D- ECG

El cáncer de mama es también otra enfermedad importante que puede e imágenes ponderadas por difusión. Estas imágenes se han recopilado de
tratarse a través de imágenes y esto ha atraído a una serie de bases de tres hospitales diferentes en Londres, Reino Unido.
datos que albergan imágenes de cáncer de mama. Otra base de datos, llamada Loni Probabilistic Brain Atlas (LPBA40) [185],
La base de datos del repositorio digital de cáncer de mama (BCDR) [174] contiene mapas de las regiones anatómicas del cerebro de 40 voluntarios
contiene mamografías multimodales y ecografías y datos del historial de humanos. Cada mapa genera un conjunto de resonancias magnéticas de
pacientes recopilados de 1734 pacientes anonimizados. Los datos se pueden cabeza completa, mientras que cada resonancia magnética describe para
utilizar para la detección de enfermedades y métodos de diagnóstico. Otro identificar 56 estructuras del cerebro, la mayoría de ellas se encuentra en la
conjunto de datos, MITOS [176], contiene imágenes histológicas de cáncer corteza. El estudio de los volúmenes de resonancia magnética de cráneo y
de mama (portaobjetos teñidos con hematoxilina y eosina). La detección de la clasificación de los mapas probabilísticos de resonancia magnética espacial
la mitosis y la evaluación de la atipia nuclear son usos clave. nativa son usos clave de LPBA40. NeuroVault.org [186] es un repositorio
basado en la web (API) para recopilar y compartir mapas estadísticos del
cerebro humano para estudiar las regiones del cerebro humano. La cámara
Procesamiento y Análisis de Neuroimagen de compensación de recursos y herramientas informáticas de neuroimagen
(NITRC) [187] proporciona una variedad de datos de imágenes, desde MRI
El conjunto de datos Information eXtraction from Images (IXI) [184] hasta PET, SPECT, CT, MEG/EEG e imágenes ópticas para analizar
proporciona 600 imágenes de resonancia magnética de sujetos sanos para neuroimágenes funcionales y estructurales. El conjunto de datos de Open
estudiar las funciones cerebrales. Estas imágenes se guardaron en formato fMRI [188] contiene imágenes de resonancia magnética adquiridas mediante
de archivo NIFTI y se adquirieron utilizando el protocolo: T1, T2, imágenes diferentes modalidades, incluida la magnetización ponderada por difusión y
ponderadas por densidad de protones; imágenes de angiografía por resonancia magnética;
ponderada en T1 preparada con adquisición rápida con eco de gradiente (MPRAGE)

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 13

Tabla 6 Categorización por aplicación de repositorios de datos de acceso abierto y conjuntos de datos pertenecientes a datos Omics

Solicitud Nombre Descripción Árbitro.

Análisis de bioensayos y diseño de fármacos. COVID-19 Conjuntos de datos de secuencias de genes, vías y bioensayos de COVID-19 [220]
PubChem Contiene estructuras compuestas, conjuntos de datos moleculares y herramientas. [221]

Análisis de trastornos genéticos Cáncer GeEx Diferentes conjuntos de datos del genoma del cáncer [222]
IGDD Datos de mutaciones en enfermedades genéticas comunes [223]
TCGA Contiene datos del genoma del cáncer. [224]
BDTNP Expresión génica 3D, datos de unión al ADN y ChAcD [225]
Investigación de ácidos nucleicos CODIFICAR Conjunto de datos del genoma humano [226]
ESP Contiene datos de secuenciación [227]
GEO Contiene expresión génica de alto rendimiento y genómica funcional [228]
conjuntos de datos

gnomAD Datos de secuenciación de genomas y exomas a gran escala [229]


GTEx Conjuntos de datos de expresión génica [230]
Armonizoma Colección de conjuntos de datos de genes y proteínas [231]
INSDC Contiene datos de secuencia de nucleótidos. [232]
IGSR Datos del genoma de varias etnias, edad y sexo. [233]
JASPAR Conjunto de datos de preferencias de unión al ADN del factor de transcripción [234]
NIHREM Conjuntos de datos del genoma humano [235]
NDS Incluye datos ómicos y de ciencias de la salud [236]

SysGenSim Herramientas bioinformáticas y conjunto de datos de secuencias de genes [237]

Análisis de estructura de proteínas AP Datos de proteínas, ácidos nucleicos y ensamblajes complejos [238]
SCOP2 Contiene clasificación estructural de proteínas. [239]
Alcance [240]
MB UCI 2ps y secuencias de genes de unión de empalme [241]

Estudio de vías de transducción de señales Naturaleza del NCI Interacciones moleculares y reacciones de las células. [242]
ruta de red Vías de transducción de señales en humanos [243]
reactoma Base de datos de reacciones, vías y procesos biológicos [244]

ómicas unicelulares miRBoost Los genomas de eucariotas que contienen al menos 100 miRNAs [245]
USD Proporciona datos biológicos para la levadura en ciernes y una herramienta de análisis. [246]

MRI y MRI multieco rápida de ángulo bajo (FLASH). También contiene conjuntos El Análisis Estructurado de la Retina (STARE) se inició en 1975. El proyecto
de datos de bioseñales para estudiar las regiones del cerebro y sus funciones. contiene conjuntos de datos de 400 imágenes retinales sin procesar, 10 imágenes
Estos se pueden usar como un conjunto de datos de referencia para diferenciar etiquetadas de arteria/vena y 80 imágenes con datos reales. Cada imagen está
el resultado de varias herramientas de análisis de neuroimagen. El servicio de anotada y el experto muestra las características en la imagen. El conjunto de
datos del Reino Unido [189] contiene conjuntos de datos T1/2, imágenes de datos se puede utilizar para la segmentación de vasos sanguíneos y la detección
tensor de difusión y fMRI de 22 pacientes que padecen tumores cerebrales que del nervio óptico.
pueden ser útiles para estudiar la planificación quirúrgica de tumores cerebrales.
El repositorio de segmentación cerebral de Internet (IBSR) brinda resultados
de segmentación de datos de MRI. El desarrollo de métodos de segmentación es
Segmentación la principal aplicación de este IBSR.

La segmentación es un paso importante en cualquier tubería de procesamiento Señales


de imágenes. Muchos conjuntos de datos mencionados anteriormente se pueden
utilizar con fines de segmentación. La Tabla 5 enumera los principales repositorios y conjuntos de datos de acceso
Centrándose en las enfermedades oculares, Digital Retinal Images for Vessel abierto (también conocidos como fuentes de datos) relacionados con las señales
Extraction (DRIVE) contiene imágenes retinales comprimidas en formato JPEG biológicas. Estas fuentes se asignan ampliamente a seis áreas de aplicación:
de 400 pacientes diabéticos de entre 25 y 90 años. Este conjunto de datos se detección de anomalías, interfaz hombre-máquina que incluye la interfaz cerebro-
puede utilizar para comprender la segmentación de los vasos sanguíneos en las máquina, así como investigación de rehabilitación, detección de emociones/
imágenes de la retina e identificar la retinopatía diabética. Otro conjunto de datos estados afectivos, clasificación de imágenes motoras, condición neurológica.

llamado

13
Machine Translated by Google

14 Computación cognitiva (2021) 13: 1–33

evaluación y procesamiento y clasificación de señales, que se describen en las conjuntos de datos de movimientos multidedos de 2 canales, 10 clases y 8 canales,
siguientes subsecciones. 15 clases; presión de uno o varios dedos en el volante; Prótesis de miembros
superiores multifuncionales controladas por EMG y conjuntos de datos de
Detección de anomalías reconocimiento de patrones de EMG.
Para EMG de superficie (sEMG), el conjunto de datos de sEMG facial contiene

La detección de anomalías es una de las principales áreas de aplicación en las que señales de sEMG faciales de los músculos corrugator supercilii, zygomaticus major,
los científicos han dedicado muchos esfuerzos. En este proceso, se han utilizado orbicularis oris, orbicularis oculi y maseter. Los datos archivados son de 15
con frecuencia varias fuentes de datos de acceso abierto, que en gran parte participantes (8 mujeres y 7 hombres) de entre 26 y 57 años (edad media 40,7 ± 9,6
contienen datos de EEG y ECG. años). Estos datos se pueden utilizar para la investigación de rehabilitación. Además,
Comenzando con las señales de EEG, el conjunto de datos SAD mc-EEG [193] la base de datos de NinaPro incluye datos cinemáticos y sEMG de 27 sujetos,
contiene señales de EEG de 32 canales de 27 sujetos registrados mientras mientras estos sujetos movían el dedo, la mano y la muñeca. Estos datos se pueden

realizaban una prueba de manejo. Es decir, las señales se adquirieron cuando cada emplear para estudiar biorrobótica y detección de actividad.
sujeto asistió a dos sesiones de realidad virtual de 90 minutos para conducir con
atención sostenida.
El corpus TUH EEG [194] también es un repositorio de datos de EEG clínico
de código abierto para datos, herramientas y documentación de EEG clínico. Los
principales conjuntos de datos incluyen detección de convulsiones, EEG anormal, Detección de emociones/estados afectivos

EEG con artefactos (introducidos por el movimiento ocular, masticación, escalofríos,


estallido de electrodos, electrodos estáticos y artefactos de cables y artefactos La detección de emociones y estados afectivos ha sido un campo de investigación
musculares), EEG para epilepsia, etc. muy activo a lo largo de los años. Se ha utilizado una combinación de diferentes
señales para detectar emociones y estados afectivos, y a continuación se describen
Con respecto a las señales de ECG, la base de datos de arritmias MIT-BIH [195] varias fuentes de datos que proporcionan estas señales.
incluye registros de ECG ambulatorios de 2 canales tomados de 47 sujetos para
estudiar la arritmia. Hay 48 registros de ECG completos y alrededor de 24 registros Una base de datos para el análisis de emociones usando señales fisiológicas
están disponibles gratuitamente. La base de datos de ECG de diagnóstico de PTB (DEAP) proporciona varios conjuntos de datos para analizar los estados afectivos
[196] comprende 549 registros de ECG tomados de 290 sujetos de edades humanos. Proporciona señales de EEG y sEMG de 32 voluntarios, mientras miraban
comprendidas entre 17 y 87 años utilizando un registrador de ECG convencional de videos musicales para analizar los estados afectivos. Estos voluntarios también
12 derivaciones y 3 derivaciones Frank. Cada calificaron el video y también se grabó la cara frontal de 22 voluntarios. DECAF es
un conjunto de datos multimodal para decodificar las respuestas fisiológicas del

el registro incluye 15 señales provenientes de estas derivaciones y cada sujeto fue usuario al contenido multimedia afectivo. Contiene magnetoencefalograma (MEG),
representado en 1 a 5 registros. Ambos conjuntos de datos se pueden utilizar para electroculograma horizontal (hEOG), ECG, EMG del músculo trapecio y datos de
la detección de anomalías. Otro conjunto de datos de ECG, el conjunto de datos video faciales de infrarrojo cercano para estudiar estados fisiológicos y mentales.
TELE-ECG [197] incluye 250 registros de ECG con QRS anotados y máscaras de Otro conjunto de datos multimodal es el MAH
artefactos. También incluye QRS y algoritmos de detección de artefactos para

estudiar QRS y detectar artefactos a partir de señales de ECG.


Conjunto de datos NOB-HCI [205] que incluye datos de ECG, respiración y
temperatura de la piel, además de señales de EEG de 32 canales de 30 sujetos,
mientras miraban clips de películas y fotos. Los diferentes sensores se sincronizaron
Interfaz hombre-máquina para registrar un conjunto de datos multimodal sincronizado. Se pidió a los sujetos
que etiquetaran su propio estado emocional.
El área de aplicación de la interfaz hombre-máquina se centra en la interfaz y
rehabilitación [cuerpo y cerebro]-máquina. Por otro lado, el conjunto de datos Imagined Emotion [204] proporciona señales
Esto se hace en gran parte a través de electromiografía (EMG) y, a veces, con de EEG registradas cuando los sujetos escuchaban grabaciones de voz. El SJTU
señales de EEG. Emotion EEG Dataset [206] contiene tres conjuntos de datos individuales (SEED,
La base de datos BNCI Horizon 2020 contiene más de 25 SEED-IV y SEED-VIG) de señales de EEG. En el conjunto de datos de SEED, se

conjuntos de datos como conjuntos de datos de EEG estimulado, conjuntos de registraron señales de EEG mientras los sujetos miraban clips de películas y
datos de BCI basados en electrocorticografía (ECoG), conjuntos de datos de BCI anotaron su estado emocional como positivo, negativo y neural. En el caso de SEED-
basados en potencial relacionado con eventos (ERP), aritmética mental, imágenes IV, se anotaron cuatro estados emocionales como felicidad, tristeza, miedo y neutral,
motoras (extraídas de EEG, EOG, fNIRS, EMG), conjuntos de datos de EEG/ mientras que el conjunto de datos de SEED-VIG contiene señales de EEG
Conjuntos de datos EOG de control neuroprotésico, conjuntos de datos ortográficos. relacionadas con la vigilancia cuando los sujetos conducían.
El modelado y diseño de dispositivos BMI son la aplicación clave de esta base de
datos. Mientras que el BNCI contiene una variedad de señales, el repositorio de
conjuntos de datos EMG [199] incluye señales únicas/

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 15

Clasificación de imágenes motoras Conjunto de datos BCI-NER [215]. Este conjunto de datos estaba destinado
principalmente al desarrollo metodológico de un algoritmo de detección de
La imaginería motora (MI) es otra área de investigación muy activa. Como errores adecuado para los sistemas BCI basados en P300. Los conjuntos de
resultado de un gran número de colaboradores de la comunidad, se han datos de competencia de BCI incluyen conjuntos de datos de EEG (p. ej.,
desarrollado muchos conjuntos de datos a partir de los cuales se describen a negatividad o positividad cortical, ensayos de prueba de retroalimentación,
continuación los más populares. escritura de teclas a su propio ritmo, paradigma de ortografía P300, datos de
El conjunto de datos de imágenes mentales electroencefalográficas imágenes motoras/mentales, EEG continuo, EEG con movimiento ocular),
cerebro-computadora (EEG-BCI-MI) [207] contiene 60 horas de registro de conjuntos de datos de ECoG (p. ej., dedo movimiento, señales de imágenes
EEG de 13 sujetos y 75 experimentos. Contiene alrededor de 60 000 ejemplos motoras/mentales en forma de EEG/ECoG) y conjunto de datos MEG (p. ej.,
de imágenes mentales, lo que equivale a aproximadamente 4,8 horas de movimiento de la muñeca). Estos conjuntos de datos se pueden utilizar para
registros de EEG (con 4600 ejemplos de MI) por participante. Los conjuntos el procesamiento de señales y métodos de clasificación para BMI. De manera
de datos se pueden utilizar para la rehabilitación de pacientes con trastornos similar, el conjunto de datos BCI-NER Challenge [215] proporciona señales de
del movimiento. Otro conjunto de datos de EEG para la interfaz MI cerebro- EEG de 56 canales de 26 sujetos que utilizan un deletreador P300.
computadora (EEG-MI-BCI) [208] contiene señales de EEG con ubicación de Además de los conjuntos de datos publicados para desafíos y
electrodos 3-D y EEG para estados no relacionados con tareas también. El competencias, existen repositorios que brindan conjuntos de datos enriquecidos
conjunto de datos se registró de 52 participantes y también contiene datos para esta área de aplicación. El DRYAD [216] es un repositorio versátil que
[fisiológicos/psicológicos] y señales EMG además del EEG. El conjunto de se ha presentado recientemente. Contiene una variedad de conjuntos de
datos se puede emplear para encontrar los factores humanos que influyen en datos grabados de EEG cuando 19 sujetos escuchan habla natural, habla en
el rendimiento de MI BCI. Otro conjunto de datos centrado en la señal de EEG tiempo invertido, atención en un cóctel y habla audiovisual ruidosa. El
se denomina conjunto de datos de imágenes/movimiento motor EEG (EEG- repositorio PhysioNet [217] contiene una gran cantidad de conjuntos de datos
MMI) [209] e incorpora 1500 (1 a 2 minutos) registros de EEG tomados de 109 neuroeléctricos y mioeléctricos. Como sugiere el nombre, es principalmente
voluntarios. El conjunto de datos se puede utilizar para diseñar sistemas BCI para datos fisiológicos. Estos conjuntos de datos pertenecen principalmente a
con fines de rehabilitación. señales como EEG, ECoG, EMG y ECG y se adquieren de muchos entornos
experimentales diversos. El repositorio UCI ML [218] contiene una gran
cantidad de diversos conjuntos de datos con aplicación directa a los métodos
de aprendizaje automático. Algunos conjuntos de datos de bioseñales
Evaluación de la condición neurológica relevantes incluyen señales de ECG, EEG y (s)EMG de diversas condiciones
experimentales y fisiológicas.
Hay varios conjuntos de datos visuales basados en P300 disponibles con

atributos de acceso abierto para realizar una variedad de evaluaciones de


condiciones neurológicas. Estos conjuntos de datos, V-P300 BCI, se componen
de datos registrados con electrodos secos o húmedos con 16 o 32 canales
Secuencias
mientras los sujetos jugaban el juego Brain Invaders [219]. Estos conjuntos de
La Tabla 6 enumera las principales fuentes de datos populares de acceso
datos se registraron utilizando diferentes modalidades de juego, como un solo
abierto pertenecientes a las diversas investigaciones relacionadas con la
jugador (16 electrodos secos [210] de 71 sujetos y 32 electrodos húmedos
ómica, que incluyen genómica, proteómica y metabolómica. Agrupadas en
[211] de 50 sujetos), multijugador en modo colaborativo (32 electrodos
seis amplias áreas de aplicación, a saber, análisis de bioensayos y diseño de
húmedos de 38 sujetos [212]), y modo de cooperación y competición
fármacos, análisis de trastornos genéticos, investigación de ácidos nucleicos,
multijugador (32 electrodos húmedos de 44 sujetos [213]).
análisis de estructuras de proteínas, estudio de vías de transducción de
señales y ómicas unicelulares, las siguientes subsecciones brindan breves
discusiones sobre las principales ómicas de acceso abierto. datos
fuentes.
Procesamiento y clasificación de señales

Para resolver varios problemas de clasificación y procesamiento de señales,


Análisis de bioensayos y diseño de fármacos
se han puesto a disposición varios conjuntos de datos en acceso abierto. La
mayoría de estos problemas se presentan a la comunidad en forma de
Desde diciembre de 2019, el mundo vive una pandemia provocada por el
desafíos con conjuntos de datos relevantes para resolverlos. Las competencias
virus SARS-CoV-2 (COVID-19). Impulsado por la necesidad de facilitar las
durante las reuniones de BCI han cumplido este propósito durante varios años
investigaciones en curso, el conjunto de datos del SARS-CoV-2 [220]
y han publicado conjuntos de datos (los conjuntos de datos de competencia
proporciona secuencias de genes, proteínas, vías y bioensayos para el SARS-
de BCI [214]) que todavía están disponibles con declaraciones de problemas
CoV-2 junto con compuestos utilizados en ensayos clínicos. Este conjunto de
relevantes y códigos de muestra para que otros los usen. El conjunto de datos
datos se puede utilizar para estudiar el proceso biológico/químico y el diseño
de desafío proporcionado por la Conferencia de ingeniería neuronal IEEE
de fármacos.
(NER2015) se conoce como

13
Machine Translated by Google

dieciséis
Computación cognitiva (2021) 13: 1–33

La base de datos PubChem [221] contiene millones de estructuras de diferentes proyectos de secuenciación. El conjunto de datos se puede utilizar
compuestas y conjuntos de datos descriptivos de moléculas químicas y sus para el diagnóstico de enfermedades y estudios genéticos. La base de datos
actividades frente a ensayos biológicos. Mantenido por el Centro Nacional de Genotype Tissue Expression (GTEx) [230] contiene conjuntos de datos de GE
Información Biotecnológica de los Institutos Nacionales de Salud de los Estados de 54 sitios de tejido sano recopilados de 1000 sujetos e imágenes histológicas.
Unidos, puede accederse libremente a través de una interfaz de usuario web y También incluye muestras del biobanco GTEx.
descargarse a través de FTP. También contiene servicios de software (como
trazado y agrupación). Se puede utilizar para estudios [gen/prote]-ómicos y La base de datos Harmonizome [231] proporciona detalles sobre genes y
diseño de fármacos. proteínas de 114 conjuntos de datos proporcionados por 66 recursos en línea
con 71927784 asociaciones entre 295496

atributos y 56720 genes. La base de datos internacional de secuencias de


nucleótidos [232], conocida popularmente como INSDC, corrobora los datos
Análisis de trastornos genéticos
biológicos de tres fuentes principales: i) el banco de datos de ADN de Japón
[247], ii) el archivo europeo de nucleótidos [248] y iii) GenBank [249]. Estas
La expresión del gen del cáncer (GE) [222] sirve como un pequeño repositorio
fuentes proporcionan el espectro de lecturas de datos sin procesar, a través de
que contiene varios conjuntos de datos de GE del cáncer que se pueden emplear
alineaciones y ensamblajes para anotaciones funcionales, enriquecidas con
para diseñar herramientas/algoritmos para la detección del cáncer. El repositorio información contextual relacionada con muestras y configuraciones
del atlas del genoma del cáncer (TCGA) [224] contiene más de 2,5 petabytes de
experimentales. Similar a esto, el International Genome Sample Resource
datos genómicos, epigenómicos, transcriptómicos y proteómicos. Contiene datos
(IGSR) [233] incluye datos de secuenciación del genoma del proyecto 1000
sobre 33 tipos diferentes de cáncer y más de 20.000 muestras. Estos datos son
genomas. Los datos del genoma se tomaron de personas de diversas etnias,
generados por el Instituto Nacional del Cáncer y el Instituto Nacional de
edades y sexos y el conjunto de datos final contiene datos de secuenciación de
Investigación del Genoma Humano. Este repositorio se utiliza para facilitar el
genes de 2504 individuos de 26 poblaciones. Estos datos se pueden utilizar
estudio genómico para mejorar la prevención, el diagnóstico y el tratamiento del
para el diagnóstico de enfermedades y estudios genéticos. Además, la base de
cáncer. Para analizar enfermedades específicas de la región, la base de datos
datos SysGenSim [237] incluye una herramienta de bioinformática y conjuntos
de enfermedades genéticas de la India (IGDD) [223] realiza un seguimiento de
de datos de prueba de referencia de StatSeq y DREAM 5 de Pula-Magdeburg
las mutaciones en los genes normales para las enfermedades genéticas
para estudiar la secuencia de genes.
notificadas en la India.

JASPAR [234] es una base de datos para el perfil de unión al ADN del factor
Investigación de ácidos nucleicos
de transcripción. Los datos abarcan seis grupos taxonómicos diferentes que
abarcan Vertebrata, Nematoda, Insecta, Plantae, Fungi y Urochordata. La base
La base de datos del Proyecto de red de transcripción de Drosophila de Berkeley
de datos se puede utilizar para la investigación de la genómica traslacional.
(BDTNP) [225] contiene conjuntos de datos relacionados con datos de expresión
génica en 3D, datos de unión de ADN in vivo e in vitro, así como datos de
El repositorio NIH Roadmap Epigenomics Mapping (NIHREM) [235] incluye
accesibilidad de cromatina (ChAcD). La investigación sobre GE y la detección
2804 conjuntos de datos, es decir, 1821 modificación de tono his, 360 DNasa,
de anomalías es la aplicación clave de los conjuntos de datos proporcionados
277 metilación de ADN y 166 conjuntos de datos de RNA-Seq. El repositorio
por esta base de datos.
proporciona 3.174 veces 150.210 millones de secuencias mapeadas del ser
La Enciclopedia de Elementos de ADN (ENCODE) [226] es una base de
humano y herramientas para analizar estos conjuntos de datos. Se puede utilizar
datos del genoma completo organizada por el Consorcio ENCODE. Contiene
para el mapeo de células madre y la selección de tejidos que son responsables
una gran cantidad de conjuntos de datos relacionados con la genómica funcional
de enfermedades humanas. Además, la base de datos conocida como Nature
y los datos de caracterización, incluidos los metadatos de humanos, gusanos,
Scientific Data (NSD) [236] incluye conjuntos de datos relacionados con ómica,
ratones y fy. Otra base de datos, llamada Exome Sequencing Project (ESP)
taxonomía y diversidad de especies, recursos matemáticos y de modelado,
[227], incluye conjuntos de datos del genoma que se pueden utilizar para
citometría, recursos centrados en organismos y datos de ciencias de la salud.
encontrar trastornos pulmonares y sanguíneos y su manejo y tratamiento. Gene
Esto se puede utilizar para estudiar y modelar diferentes aspectos de la genómica.
Expression Omnibus (GEO) [228] es un depósito de datos de genómica funcional
(microarreglo y secuencia) de acceso abierto. Esta base de datos se puede
utilizar para estudios genómicos y epigenómicos funcionales, como la metilación
del genoma, la estructura de la cromatina y las interacciones genoma-proteína.
Cuenta con el apoyo del Centro Nacional de Información Biotecnológica de la
Análisis de estructura de proteínas
Biblioteca Nacional de Medicina de EE . UU . [228]. La base de datos de
agregación del genoma (gnomAD) [229] contiene datos de secuenciación del
El banco de datos de proteínas (PDB) [238] contiene proteínas y ácidos nucleicos
genoma y del exoma a gran escala
con datos estructurales en 3D. Estos datos se obtienen con herramientas como
la cristalografía de rayos X, la espectroscopia de RMN y la criomicroscopía
electrónica. Incluye más de 135 mil

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 17

datos de proteínas, ácidos nucleicos y ensamblajes complejos. y patología relacionada con miARN. Saccharomyces Genome Database
Estos se pueden utilizar para comprender todos los aspectos de la (SGD) [246] también proporciona información biológica completa para la
biomedicina y la agricultura. levadura en ciernes Saccharomyces cerevi siae. También brindan una
La clasificación estructural de proteínas (SCOP) es un repositorio que herramienta de código abierto para buscar y analizar estos datos y, por lo
aloja conjuntos de datos de estructura de proteínas clasificados tanto, permiten el descubrimiento de relaciones funcionales entre
manualmente. La clasifcación se realizó en base a las secuencias de secuencias y productos genéticos en hongos y organismos superiores. El
aminoácidos y su similitud estructural. El objetivo principal es encontrar la estudio de la expresión del genoma, el transcriptoma y la biología
relación evolutiva entre las proteínas. Actualmente se mantienen dos computacional es la principal función del SGD.
versiones de SCOP.
SCOP Versión 2 (SCOP2) [239] es la base de datos SCOP actualizada
publicada en el primer trimestre de 2020. Por el contrario, SCOP-extended
(SCOPe) [240] es una versión ampliada del SCOP original mantenida por Herramientas de aprendizaje profundo de código abierto
UC Berkeley. SCOPe incluye muchas estructuras de proteínas clasificadas
nuevas a través de una fusión de curación manual y automática. Debido al creciente interés y los esfuerzos multidisciplinarios simultáneos
hacia DL en los últimos años, se han puesto a disposición de la comunidad
Las bases de datos de biología molecular de la UCI (UCI MB) contienen varias bibliotecas, marcos y plataformas de código abierto. Sin embargo,
tres bases de datos individuales: i) Estructura proteica secundaria [241], para un nuevo usuario de estas herramientas de minería de datos
que es un repositorio de banco que clasifica la estructura secundaria de biológicos, no siempre es sencillo conocer sus características, ventajas y
ciertas proteínas globulares; ii) Secuencias de genes de unión de empalme desventajas. En este proceso, uno de los principales obstáculos para un
[250], que contienen secuencias de genes de unión de empalme (ADN) de nuevo analista es seleccionar la arquitectura/modelo de DL apropiado y la
primates con la teoría de dominio imperfecto asociada; y iii) Secuencias de biblioteca relevante que proporcione implementaciones adecuadas de la
genes promotores [251], que contienen secuencias de genes promotores arquitectura seleccionada. Para introducir a un principiante en el campo
(ADN) de E. coli con teoría de dominio parcial. Los objetivos incluyen i) del análisis de datos biológicos utilizando estas herramientas de código
secuenciar y predecir la estructura secundaria de ciertas proteínas; ii) abierto, esta sección describe las herramientas en un estilo de tutorial que
estudiar secuencias de genes de unión de empalme (ADN) de primates indica sus características, pros y contras. El enfoque de la sección ha sido
con la teoría del dominio imperfecto asociado; iii) estudiar las secuencias revisar y resumir las herramientas de código abierto más populares, cuyo
del gen promotor (ADN) de E. Coli con la teoría del dominio parcial. objetivo es facilitar los desarrollos tecnológicos para la comunidad. Esta
completa colección contiene herramientas (también desarrolladas por

individuos) que están bien mantenidas con una cantidad razonable de


Estudio de vías de transducción de señales algoritmos implementados (es decir, arquitecturas de aprendizaje profundo).
En aras de la brevedad, se omiten las referencias de publicación individual
La base de datos de interacción de vías naturales del NCI [242] alberga de las herramientas y los lectores interesados pueden consultarlas en sus
vías de señalización celular (interacciones/reacciones moleculares) en respectivos sitios web desde las URL proporcionadas.
humanos. La base de datos se puede emplear para la investigación del cáncer.
La base de datos fue creada por el Instituto Nacional del Cáncer de EE.
UU., NIH, con la colaboración de Nature Publishing Group y publicada en
el último trimestre de 2006. Otra base de datos, NetPath [243], también
contiene vías de transducción de señales en humanos. La Tabla 7 resume las principales características y diferencias de las

Creado conjuntamente por la Universidad Johns Hopkins y el Instituto de distintas herramientas. Para medir el impacto y la aceptabilidad de una
Bioinformática (IOB) en India; incluye 45 vías de señalización que van herramienta en la comunidad, proporcionamos medidas basadas en
desde interacciones proteína-proteína hasta reacciones sustrato proteína- GitHub, como el número de estrellas, bifurcaciones y colaboradores. Estos
enzima, incluidas 10 vías principales del sistema inmunitario y 10 vías números son indicativos de la popularidad, madurez y difusión de una
relevantes para la regulación del cáncer. El otro, Reactome [244], es una herramienta en la comunidad.
base de datos de acceso abierto que alberga vías biológicas de procesos
metabólicos para la señalización hormonal en humanos. Creado a través Cafetería

de una colaboración entre América del Norte y Europa, puede usarse para
la investigación y el tratamiento del cáncer. Café (http://cafe.berkeleyvision.org/) es escalable, está escrito en C++ y
proporciona enlaces para Python y MATLAB.
ómicas unicelulares Dedicado a experimentar, entrenar e implementar modelos DL de
propósito general, este marco permite cambiar entre plataformas de
El conjunto de datos miRBoost [245] contiene los genomas de eucariotas desarrollo e implementación. Dirigida a aplicaciones de visión artificial, se
que contienen al menos 100 miARN. Este conjunto de datos se utiliza para considera la implementación más rápida de la CNN.
estudiar la regulación génica postranscripcional (PTGeR)

13
Machine Translated by Google

18 Computación cognitiva (2021) 13: 1–33

Tabla 7 Resumen de herramientas de aprendizaje profundo de código abierto (* a partir de julio de 2020)

Herramienta Plataforma Idioma(s) Estrellas* Tenedores* Aporte* Arquitectura DL compatible

Cafetería L, M, W, A Py, C++, Ma 30100 18200 266 CNN, RNN, GAN


Chainerc L Py 5300 1400 251 DA, CNN, RNN, GAN

DL4ja L, M, W sí 11500 4800 32 DA, CNN, RNN, RBM, LSTM, GAN

DyNeta L C++ 3000 687 117 CNN, RNN, LSTM

H2Oa L, M, W Ja, Py, R 4700 1700 132 CNN, R.N.N.


Kerasc L, M, W Py 47500 18000 816 CNN, RNN, DBN, GAN

lasaña L, M Py 3700 980 68 CNN, RNN, LSTM, GAN


MCTcÿÿ W C++ 16720 4400 197 CNN, DBN, RNN, LSTM
MXNeta L, M, W, A, I C++ 18500 6600 780 DA, CNN, RNN, LSTM, GAN
neonaÿÿ L, M Py 3800 846 78 DA, CNN, RNN, LSTM, GAN

PyTorchb L, M Py 37400 9500 1345 CNN, RNN, LSTM, GAN

Singapur L, M, W Py, C++, Sí 2000 499 46 CNN, RNN, RBM, DBM


TensorFlowa L, M, W Py, C++ 14300 80600 2450 CNN, RNN, RBM, LSTM, GAN
TF.Learnc L, M Py, C++ 9400 2400 120 CNN, BRNN, RNN, LSTM, GAN
Teanob L, M, W Py 9103 2500 332 CNN, RNN, RBM, LSTM, GAN
Antorchab L, M, W, A, I Lu, C, C++ 8495 2400 130 CNN, RNN, RBM, LSTM, GAN
Velesa L, M, W, A Py 891 185 10 DA, CNN, RNN, LSTM, RBM

L Linux/Unix, M MacOSX, W Windows, A Android, I iOS, CP multiplataforma, Py Python, Ja Java, Lu Lua, Ma Matlab
*Parámetros de GitHub (a partir del 1 de abril de 2020)
a
Licencia Apache2
b
Licencia BSD
C
Licencia MIT

ventajas Contras.

– Fácil de implementar; – El marco de Open Computing Language/Open Multi Processing API no es


– Los modelos preentrenados están disponibles; compatible.
– Mayor velocidad de entrenamiento;
– Utilizado para redes feedforward.
DeepLearning4j

Contras. DeepLearning4j (DL4J, https://deeplearning4j.org/), escrito en Java con bibliotecas


centrales en C/C++, es un marco de trabajo distribuido para la creación rápida de

– Requiere escribir código para generar nuevas capas; prototipos que se dirige principalmente a personas que no son de investigación.
– Menos soporte para redes recurrentes; Compatible con lenguajes compatibles con JVM (p. ej., Scala/
– No hay soporte para entrenamiento distribuido. Clojure), funciona en marcos de procesamiento distribuido (por ejemplo, Hadoop y
Spark). A través de Keras (ver sección 5.6) como una API de Python, permite
Encadenador importar modelos DL existentes desde otros marcos. Permite la creación de
arquitecturas NN mediante la combinación de arquitecturas NN superficiales
Encadenador (http://chainer.org/) es un marco DL proporcionado como biblioteca disponibles.
de Python. Además de la disponibilidad de técnicas de optimización populares y ventajas

cálculos relacionados con NN (por ejemplo, funciones de convolución, pérdida y


activación), la creación dinámica de gráficos hace que Chainer sea poderoso. – Admite la integración con marcos de Big Data Apache
Admite una amplia gama de arquitecturas DL, incluidas CNN, GAN, RNN y DA. Chispa y Hadoop;
– Admite plataformas de GPU y CPU distribuidas y es capaz de trabajar con tensor.
ventajas

– Una de las herramientas para liderar gráficos de computación dinámica/ Contras.

redes;

– Notablemente más rápido que otros marcos orientados a Python. – El marco de Open Computing Language no es compatible;

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 19

– La GUI es compatible con el flujo de trabajo y la visualización. ventajas

DyNet – Documentación rica;

– Una API de alto nivel para redes neuronales;


La biblioteca DyNet (https://dynet.readthedocs.io/), escrito en C++ con enlaces – Capacidad para ejecutarse sobre bibliotecas/marcos de aprendizaje profundo de
Python, es el sucesor de la 'biblioteca de redes neuronales C++'. En DyNet, los última generación como TensorFlow, CNTK o Theano.

gráficos computacionales se crean dinámicamente para cada ejemplo de


entrenamiento; por lo tanto, es computacionalmente eficiente y flexible. Dirigido a
aplicaciones de PNL, su especialidad está en CNN, RNN y LSTM. Contras.

– No se puede utilizar multi-GPU directamente;


ventajas – Requiere Theano como backend para compatibilidad con OpenMP y Theano/
TensorFlow/PlaidML como backend para OpenCL.
– Diseñado para ser eficiente para ejecutarse en CPU o GPU.
– Gráfico de cálculo dinámico como PyTorch y Chainer. lasaña

Contras. Lasaña (http://lasagne.readthedocs.io) La biblioteca DL está construida sobre


Theano. Permite múltiples clasificadores de entrada, salida y auxiliares. Admite
– En términos de TensorFlow, hay funciones limitadas disponibles. funciones de costos definidas por el usuario y proporciona muchas funciones de
optimización. Lasaña es compatible con CNN, GAN, RNN y LSTM.

H2O
ventajas

H2O (http://www.h2o.ai) es un software ML que incluye DL y análisis de datos.


Proporciona una interfaz unificada para otros marcos de DL como TensorFlow, – Lasagne es una biblioteca liviana para construir y entrenar algoritmos DL en
MXNet y Caffe. También admite el entrenamiento de modelos DL (CNN y RNN) Theano;
diseñados en R, Python, Java y Scala. – Las capas, los regularizadores y los optimizadores se pueden usar de forma independiente

abolladura;
ventajas – Se dispone de documentación clara;

– Admite entrenar la red en una GPU.


– Debido a sus capacidades de procesamiento paralelo distribuidas en memoria,
se puede utilizar para datos en tiempo real; Contras.

– Se admite GUI (llamado Flujo) para flujo de trabajo y visu


alización; – Comunidad pequeña que TensorFlow.
– Compatibilidad con GPU para Deep Water y NVIDIA;
– Entrenamiento rápido, manipulación de DataFrame eficiente en memoria; Kit de herramientas cognitivas de Microsoft
– Algoritmos fáciles de usar y bien documentados;
En sustitución de CNTK, el kit de herramientas cognitivas de Microsoft (MCT, https
Contras. ://cntk.ai/) está codificado principalmente en C++. Proporciona implementaciones
de varias reglas de aprendizaje y admite diferentes arquitecturas DL, incluidas
– Carece de las capacidades de manipulación de datos de R y Pandas DNN, CNN, RNN y LSTM.
marcos de datos; ventajas

– Lento en el aprendizaje y admite un modelo limitado que se ejecuta en


un momento. – Es un marco para feedforward DNN, CNN y RNN;

– Puede entrenar sistemas de producción muy rápido;


Keras – Puede lograr un rendimiento de vanguardia en el punto de referencia
Tareas;

El Keras basado en Python (https://keras.io/) biblioteca se utiliza sobre Theano o – Permitir la visualización de gráficos dirigidos.
TensorFlow. Sus modelos se pueden importar a DL4J (ver sección 5.3). Fue
desarrollado como una herramienta fácil de usar que permite una experimentación Contras.

rápida y una creación de prototipos fácil y rápida. Keras es compatible con CNN,
GAN, RNN y DBN [252]. – Menos apoyo de la comunidad;
– Difícil de instalar;

13
Machine Translated by Google

20 Computación cognitiva (2021) 13: 1–33

– Atraer el menor interés entre la comunidad investigadora. – Fácil de crear una capa y ejecutar en GPU.

MXNet Contras.

MXNet (https://mxnet.io/) framework permite definir, entrenar e implementar NN – Requiere escribir código de entrenamiento;
profundas (DA, CNN, GAN, RNN y LSTM) en una amplia gama de dispositivos, – Documentación limitada.

desde infraestructura en la nube hasta dispositivos móviles o incluso integrados (p.


ej., Raspberry Pi). Escrito en C++, es eficiente en memoria y es compatible con Go, Singa
JavaScript, Julia, MATLAB, Perl, Python, R y Scala.
Singa (https://singa.incubator.apache.org/), es una plataforma DL distribuida escrita
ventajas en C++, Java y Python.
Su arquitectura flexible permite que se ejecuten marcos de entrenamiento
– Un marco DL que tiene un impera de alto rendimiento sincrónicos, asincrónicos e híbridos. Admite una amplia gama de arquitecturas DL,
API activa; incluidas CNN, RNN, RBM y DBM.
– Soporte de lenguaje enriquecido;
– MXNet cuenta con soporte GPU avanzado; ventajas

– Altamente escalable.
– Los modelos preentrenados están disponibles;
Contras. – Admite el particionamiento de modelo/datos o híbrido, y entrenamiento sincrónico/
asincrónico/híbrido;
– Comunidad pequeña que TensorFlow; – Sistema de aprendizaje profundo distribuido y manejo de Big data.
– Pobre documentación de la API; – Ampliamente utilizado para el análisis de datos de atención médica.

– Menos popular entre la comunidad investigadora.


Contras.

Neón
– Sin soporte de procesamiento múltiple abierto.
Neón (www.nervanasys.com/technology/neon/) es un marco DL escrito en Python.
Proporciona implementaciones de varias reglas de aprendizaje, junto con funciones TensorFlow
de optimización y activación. Su compatibilidad con la arquitectura DL incluye CNN,
GAN, RNN, LSTM y DA. TensorFlow (www.tensorflow.org), escrito en C++ y Python, fue desarrollado por
Google y admite NN profundas a gran escala. Enmendado recientemente como
ventajas 'TensorFlow Fold', su capacidad para crear gráficos dinámicamente hizo que la
arquitectura fuera flexible, lo que permitió la implementación en una amplia gama de
– Mejores propiedades de visualización que otros marcos; dispositivos (p. ej., escritorio con múltiples CPU/GPU, servidor, dispositivos móviles,
– Aplicar optimización a nivel de carga de datos, etc.) sin necesidad de reescribir código [ 253, 254]. También contiene una
herramienta de visualización de datos llamada TensorBoard y es compatible con
Contras. muchas arquitecturas DL, incluidas CNN, GAN, RNN, LSTM y RBM [255].

– Comunidad pequeña que TensorFlow;


– Menos popular entre la comunidad investigadora. ventajas

PyTorch – Maneja datos a gran escala y opera en entornos heterogéneos;

PyTorch (http://pytorch.org/) proporciona módulos Torch en Python. Más que un – Tiempo de compilación más rápido que Theano;
contenedor, su profunda integración permite explotar las poderosas características – Abstracción de grafos computacionales;
de Python. Inspirado en Chainer, permite la creación de redes dinámicas para – Soporta paralelismo.
cargas de trabajo variables y es compatible con CNN, GAN, RNN y LSTM. – TensorBoard se utiliza para el flujo de trabajo y la visualización.

ventajas Contras.

– Los modelos preentrenados están disponibles; – Huella de memoria grande;


– Compatibilidad con OpenCL a través de un paquete mantenido por separado. – Hay menos modelos preentrenados disponibles;
– Combina fácilmente piezas modulares; – El gráfico computacional puede ser lento;

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 21

– Sin soporte para operaciones matriciales; Recientemente, los módulos DL de Facebook (fbcunn) que se centran en CNN se
– Dificultades en la depuración. han abierto como un complemento de Torch.
ventajas

TF.Aprender
- Fácil de usar;
TF.Learn (www.tflearn.org) es una API de Python de alto nivel basada en – Conveniente para usar con GPU;
TensorFlow (consulte la sección 5.13) . Admite la creación rápida de prototipos con – Los modelos preentrenados están disponibles;

capas NN modulares y múltiples optimizadores, entradas y salidas. Las arquitecturas – Altamente modular;
DL admitidas incluyen CNN, GAN, BRNN y LSTM. – Fácil de crear una capa y ejecutar en GPU.

ventajas Contras.

– Biblioteca DL modular y transparente construida sobre TensorFlow; – Formato de datos especial y requiere conversión;
– Requerir escribir código de entrenamiento;
– Proporciona una API de nivel superior para TensorFlow. – Menos documentación disponible.

Contras. Vélez

– Más lento en comparación con sus competidores. Velas (https://github.com/Samsung/veles) es una plataforma distribuida basada en
Python para el desarrollo rápido de aplicaciones DL. Proporciona servicios de
Teano aprendizaje automático y procesamiento de datos y es compatible con portátiles
IPython. Desarrollado por Samsung, una de sus ventajas es que admite OpenCL
Teano (www.deeplearning.net/software/theano/) es una biblioteca de Python que para programación paralela multiplataforma y permite la ejecución en plataformas
se basa en paquetes básicos como NumPy y SymPy. Define, optimiza y evalúa heterogéneas (por ejemplo, servidores, PC, dispositivos móviles e integrados). Las
expresiones matemáticas con tensores y sirvió como base para muchas bibliotecas arquitecturas DL admitidas incluyen DA, CNN, RNN, LSTM y RBM.
DL.

ventajas ventajas

– Alta flexibilidad; – soporte de plataforma distribuida;


– Alta estabilidad computacional; – Compatible con Jupyter Notebook;
– Muy adecuado para expresiones matemáticas basadas en tensores; – Admite OpenCL para el programa paralelo multiplataforma
– Bibliotecas de código abierto como Keras, Lasagne y Blocks construidas sobre ming
Theano;
– Capaz de visualizar filtros convolucionales, imágenes y Contras.

gráficos;
– Aumentan los envoltorios de alto nivel como Keras y Lasaña – Menos apoyo de la comunidad;
usabilidad – Atrae el interés de la comunidad investigadora.

Contras.

Comparación relativa de herramientas DL


– Difícil de aprender;

– Difícil de implementar; Para realizar una comparación relativa entre las herramientas de DL de código
– Implementado en una sola GPU; abierto disponibles, seleccionamos cuatro métricas que se detallan a continuación:

– Tiempo de compilación más lento que TensorFlow. tendencia en su uso, participación de la comunidad en su desarrollo, interoperabilidad
entre ellas y su escalabilidad (Fig. 4).
Antorcha

Iniciado en 2000, Torch (http://torch.ch/), una biblioteca ML y un marco de Tendencia

computación científica, ha evolucionado como una poderosa biblioteca DL. Las


funciones principales se implementan en C y el resto a través del lenguaje de Para evaluar la popularidad y la tendencia de las diversas herramientas de DL
secuencias de comandos LuaJIT hizo que Torch fuera súper rápido. Los gigantes entre los consumidores de DL, analizamos dos fuentes diferentes para evaluar la
del software como Facebook y Google utilizan Torch de forma extensiva. utilización de las herramientas.

13
Machine Translated by Google

22 Computación cognitiva (2021) 13: 1–33

a b MXNet Theano Otros d


Caffe Keras Antorcha Theano Tensorflow Café
100%
Mencion
(%)

80%
60%
Keras
40% DL4J
APRENDIZAJE PROFUNDO4J

Pytorch
20% 2015-01 2015-04 2015-07 2015-10 2016-01 2016-04 2016-07 2016-10 2017-01 2017-04 2017-07 2017-10 2018-01 2018-04 2018-07 2018-10 2019-01 2019-04 2019-07 2019-10

0%
TensorFlow

Tiempo (año-mes)

C mi

Memoria aplicación.

160 Lógica E/S


Configuración

140 tensorflow ASIC


DLL PLL E/S
Keras
Estrellas
Github
miles)
(en
Macro de memoria
40 FPGA
Café pyTorch informática
capacidad
Mayor

20 MXNet MCT ALU de control ALU


DRACMA
Teano TF.Aprender ALU ALU
Antorcha DL4j H2O _ GPU
SingaChainer Cache

0 Vélez Neón
lasaña DyNet DRACMA

UPC
2008 2014 2015 2016
Año de lanzamiento Mayor eficiencia energética

Fig. 4 Comparación relativa de herramientas DL. a Tendencia de popularidad de las contribuyentes. d En cuanto a la interoperabilidad entre las herramientas de DL, Keras
herramientas DL individuales según la mención en la búsqueda de Google generada permite la importación de modelos desde Cafe, MCT (CNTK), Theano y Ten sorFlow y
globalmente (datos cortesía: Google Trend). b Mención en artículos enviados al permite que DL4j importe. e Con respecto a la escalabilidad basada en hardware de
servidor de preimpresión arXiv durante el primer trimestre de 2020. c El efecto de la las herramientas DL, la mayoría de las herramientas brindan soporte para CPU y GPU,
participación de la comunidad en herramientas individuales se muestra por el tamaño mientras que FPGA y ASIC pueden ejecutar principalmente modelos preentrenados.
de la burbuja, que es producto del número normalizado de bifurcaciones de GitHub y

En primer lugar, extrajimos datos de búsqueda generados globalmente Comunidad


de Google Trends1 durante cinco años (enero de 2015 a diciembre de
2019) relacionados con términos de búsqueda que consisten en El puntaje de desarrollo basado en la comunidad para cada herramienta
ÿ[toolname] + DeepLearningÿ. Los datos mostraron un aumento progresivo discutida en la Sección 5 se calculó a partir de los parámetros de
de la búsqueda sobre TensorFlow desde su lanzamiento, seguido de popularidad del repositorio de GitHub (https://github.com/) (es decir,
Keras (Fig. 4a). En segundo lugar, extraer el contenido de alrededor de estrella, tenedor y colaboradores). El diagrama de burbujas que se
2000 documentos enviados al cs de arXiv.[CV | CL | LG | IA | NE], y muestra en la Fig. 4c representa la participación de la comunidad en el
categorías stat.ML, durante el primer trimestre de 2020 (es decir, de enero desarrollo de las herramientas que indican el año de lanzamiento estable
a marzo), por la presencia de los nombres de las herramientas [256]. inicial. Cada tamaño de burbuja en la figura, correspondiente a una
Como se ve en la Fig. 4b , que muestra el porcentaje de mención de cada herramienta, representa el efecto combinado normalizado de la bifurcación
herramienta individual en los documentos, las seis herramientas principales y los contribuyentes de esa herramienta. Se ve claramente que una parte
se identificaron como: PyTorch, TensorFlow, Keras, Cafe, MXNet y muy grande del esfuerzo de la comunidad se concentra en TensorFlow, seguido de Keras
Theano.

interoperabilidad

En los entornos de desarrollo multiplataforma actuales, una medida


importante para juzgar la flexibilidad de una herramienta es su
interoperabilidad con otras herramientas. En este sentido, Keras es el
más flexible cuyas redes neuronales de alto nivel son capaces de
1 ejecutarse sobre Tensor o Theano. Alternativamente,
https://trends.google.com

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 23

El modelo DL4j importa modelos de redes neuronales originalmente Los codificadores automáticos apilados o DA se compararon
configurados y entrenados con Keras que proporciona capas de utilizando la configuración experimental número 1 en la Tabla 8. Para
abstracción sobre los backends de TensorFlow, Theano, Cafe y CNTK estimar el rendimiento de las diversas herramientas en la implementación
(Fig. 4d). de DA, se apilaron tres codificadores automáticos (cantidad de capas
ocultas: 400, 200 y 100, respectivamente) con pesos vinculados y
Escalabilidad funciones de activación sigmoide. Se realizó un entrenamiento de red
de dos pasos en el conjunto de datos MNIST [261]. Como se informa en la Fig. 5
La escalabilidad basada en hardware es una característica importante (a, b), las actuaciones de varias herramientas DL se evalúan utilizando
de las herramientas individuales (Fig. 4e). El hardware actual para el tiempo de ejecución y el tiempo de entrenamiento. El tiempo de
dispositivos informáticos está dominado por unidades de procesamiento ejecución hacia adelante se refiere al tiempo requerido para evaluar el
de gráficos (GPU) y unidades de procesamiento central (CPU). Pero flujo de información a través de la red completa para producir el resultado
teniendo en cuenta el aumento de la capacidad informática y la eficiencia previsto para un lote de entrada, un conjunto de datos y una red. Por el
energética, se espera que en los próximos años se amplíe el papel de contrario, el tiempo de cálculo de gradiente mide el tiempo necesario
otros tipos de chips, incluidos los circuitos integrados específicos de la para entrenar herramientas DL. Los resultados sugieren que,
aplicación (ASIC) y los arreglos de puertas programables en campo independientemente de la cantidad de subprocesos de CPU utilizados o
(FPGA). Hasta ahora, DL se ha utilizado predominantemente a través GPU, Theano y Torch superan a TensorFlow tanto en gradiente como
de software. El requisito de aceleración de hardware, eficiencia en tiempos de avance (Fig. 5 a, b).
energética y mayor rendimiento ha impulsado el desarrollo de sistemas La configuración experimental número 2 (Tabla 8) se utilizó en la
DL basados en chipset. evaluación comparativa de RNN. La red LSTM adaptada [262] fue
diseñada con 10000 unidades de entrada y salida con dos capas y ~13
millones de parámetros. Como el rendimiento de RNN depende de la
Desempeño de Herramientas y Benchmark longitud de entrada, se utilizó una longitud de entrada de 32 para el
experimento. Como indican los resultados (Fig. 5 cf), MCT supera a
El poder de los métodos de DL radica en su capacidad para reconocer otras herramientas tanto en CPU como en las tres plataformas de GPU.
patrones para los que están capacitados. A pesar de la disponibilidad En las CPU, TensorFlow funciona un poco mejor que Torch (Fig. 5 c).
de varios hardware de aceleración (p. ej., [C/G] PU/FPGA multinúcleo), En GPU, Torch es el más lento con TensorFlow y MXNet funcionando
esta fase de entrenamiento requiere mucho tiempo, es engorrosa y de manera similar (Fig. 5 df).
desafiante desde el punto de vista computacional. Además, dado que
cada herramienta proporciona implementaciones de varias arquitecturas
DL y, a menudo, enfatiza componentes separados de ellas en diferentes
plataformas de hardware, seleccionar una herramienta adecuada para Tabla 8 Configuración de hardware de la configuración de evaluación

una aplicación se vuelve cada vez más difícil. Además, las diferentes Procesador ESN Memoria
herramientas de DL tienen diferentes objetivos, por ejemplo, Caffe se
1 Procesador : E5-1650a a 3,50 GHz 32 GB
enfoca en aplicaciones, mientras que Torch y Theano son más para la
GPU: Nvidia GeForce GTX Titán Xbÿÿ
investigación de DL.
2 Procesador : E5-2630c a 2,20 GHz 128GB
Para facilitar a los científicos la elección de la herramienta adecuada
GPU: Nvidia GeForce GTX 980dÿÿ
para su aplicación, los científicos compararon el rendimiento de las
GPU: Nvidia GeForce GTX 1080eÿÿ
herramientas populares con respecto a sus tiempos de entrenamiento
GPU: acelerador Tesla K80 con GK210 GPUsf
[257, 258]. Además, hasta donde sabemos, existen dos esfuerzos
3 Procesador : E5-2690c a 2,60 GHz 256GB
principales que brindan públicamente los detalles de evaluación
GPU: acelerador Tesla P100ÿÿ
comparativa de las diversas herramientas y marcos de DL [259, 260].
GPU: acelerador Tesla M40hÿÿ
Resumiendo esos trabajos seminales, a continuación proporcionamos
GPU: acelerador Tesla K80 con GK210 GPUsfÿÿ
el tiempo requerido para completar el proceso de capacitación como una
medida de rendimiento de cuatro arquitecturas DL diferentes (p. ej., Números de configuración experimental de ESN
a
FCN, CNN, RNN y DA) entre las herramientas populares (p. ej., Caffe, Procesador Intel Xeon v2
b
CNTK, MXNET , Theano, TensorFlow y Torch) en plataformas [C/G]PU 3072 núcleos, reloj base de 1000 MHz, memoria de 12 GB
multinúcleo. C
Procesador Intel Xeon v4
La Tabla 8 enumera las configuraciones experimentales utilizadas d
2048 núcleos, reloj base de 1126 MHz, memoria de 4 GB
en la evaluación comparativa de las herramientas especificadas. mi
2560 núcleos, reloj base de 1607 MHz, memoria de 8 GB
Durante el proceso se utilizaron principalmente tres configuraciones F
El acelerador Tesla K80 tiene dos GPU Tesla GK210 con 2496 núcleos,
diferentes, cada una con CPU Intel Xeon E5. Aunque la CPU era similar, Reloj base de 560 MHz, memoria de 12 GB
el hardware de la GPU era diferente: GeForce GTX Titan X, GTX 980, g 3584 núcleos, reloj base de 1189 MHz, memoria de 16 GB
GTX 1080, Tesla K80, M40 y P100. h
3072 núcleos, reloj base de 948 MHz, memoria de 12 GB

13
Machine Translated by Google

24 Computación cognitiva (2021) 13: 1–33

a Codificador automático apilado (CPU) b Codificador automático apilado (GPU-GTX Titan X)

256 Degradado Delantero 64 256 64


Degradado Delantero
128 1 6 12 1 6 12 32
128 32

64 64 dieciséis

dieciséis 8
32 32
4
dieciséis 8 dieciséis

2
8 8
4 1
4 4 0.5
2
2 2 0.25
1 1 1 0.125

C d
LSTM (CPU) LSTM (GPU-GTX980)
16384 1024
1248 16 32 64 128 256 512 1024 tensorflow
4096
256
1024 Teano
256 64
Antorcha
64 dieciséis

MCT
dieciséis

4
4

1 1 MXNet
mi F
LSTM (GPU-GTX1080) LSTM (GPU-Tesla K80)
4096 16384
64 128 256 512 1024 64 128 256 512 1024
1024 4096

1024
256
256
64
64
dieciséis

dieciséis

4 4

1 1

Fig. 5 Evaluación comparativa de codificador automático apilado o DA (a, b) y LSTM (cf) en plataformas de CPU y GPU. Los números en (a, c) indican la cantidad de
subprocesos de CPU empleados en el proceso de evaluación comparativa, y en (df) indican el tamaño del lote. En el caso de DA, el tamaño del lote fue de 64

Todavía una gran parte del análisis de patrones se realiza mediante Theano y Torch) [264] sugieren claramente que el proceso de
CNN; por lo tanto, nos enfocamos aún más en CNN e investigamos cómo entrenamiento de la red se acelera mucho en las GPU en comparación
las herramientas líderes se desempeñaron y escalaron en el entrenamiento con las CPU. Además, otro mensaje importante es que no todas las GPU
de diferentes redes de CNN en diferentes plataformas de GPU. La son iguales y todas las herramientas no se amplían al mismo ritmo. El
aceleración del tiempo de la GPU sobre la CPU se considera una métrica tiempo necesario para entrenar una red neuronal depende en gran
para este propósito. Los valores individuales se calculan utilizando los medida del marco de trabajo de DL que se utilice. En cuanto a la
scripts de referencia de DeepMark [259] en la configuración experimental plataforma de hardware, el acelerador Tesla P100 proporciona la mejor
número 3 (Tabla 8) para una iteración de entrenamiento por lote. El aceleración, siendo Tesla M40 el segundo y Tesla K80 el último entre los
tiempo necesario para ejecutar una iteración de entrenamiento por lote tres. En las CPU, TensorFlow logra el menor tiempo de entrenamiento, lo
es igual al tiempo necesario para completar una operación de propagación que indica un entrenamiento más rápido de la red.
hacia adelante seguida de una operación de propagación hacia atrás. La
Figura 6 resume el tiempo de entrenamiento por iteración por lote tanto En las GPU, Caffe suele proporcionar la mejor aceleración que la CPU,
para CPU como para GPU (eje y izquierdo) y la correspondiente pero TensorFlow y Torch realizan un entrenamiento más rápido que
aceleración de GPU sobre CPU (eje y derecho). Caffe. Aunque TensorFlow y Torch tienen rendimientos similares
Estos hallazgos para cuatro modelos de red CNN diferentes (es decir, (indicados por la altura de las líneas), Torch supera ligeramente a
Alexnet [92], GoogLeNet [94], Overfeat [263] y VGG [93]) disponibles en TensorFlow en la mayoría de las redes. Finalmente, la mayoría de las
cuatro herramientas (es decir, Caffe, TensorFlow, herramientas superan a Theano.

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 25

Problemas abiertos y perspectivas futuras identifique a continuación las deficiencias y los cuellos de botella de
los métodos populares, abra las preguntas de investigación y los
El cerebro tiene la capacidad de reconocer y comprender patrones desafíos, y describa las posibles direcciones que requieren atención
casi instantáneamente. Durante varias décadas, los científicos han en el futuro cercano.

intentado descifrar el mecanismo biológico del reconocimiento de En primer lugar, los métodos de DL generalmente requieren grandes conjuntos de datos.

patrones naturales que tiene lugar en el cerebro y traducir esos Aunque el costo de la computación está disminuyendo con el
principios en sistemas de IA. El creciente conocimiento sobre las aumento de la potencia y la velocidad computacional, no vale la pena
políticas de procesamiento de información del cerebro permitió que aplicar métodos de DL en casos de conjuntos de datos de tamaño
esta analogía fuera adoptada e implementada en los sistemas pequeño a moderado. Esto es particularmente así si se considera que
informáticos. Los avances tecnológicos recientes, la integración muchos de los métodos de DL realizan transformaciones geométricas
perfecta de diversas técnicas, una mejor comprensión de los sistemas continuas de una variedad de datos a otra con la suposición de que
de aprendizaje, la disminución de los costos de computación y la existen funciones de transferencia aprendibles que pueden realizar el
expansión de los sistemas informáticos potenciados por la potencia mapeo [266]. Sin embargo, en los casos en que las relaciones entre
computacional para alcanzar la computación a nivel humano en ciertos los datos son causales o muy complejas de aprender mediante
escenarios [265]. No obstante, muchos de estos métodos requieren transformaciones geométricas, los métodos de DL fallan
mejoras. Aunque es cierto que existen distinciones sobre cómo se independientemente del tamaño del conjunto de datos [267]. Además,
puede usar y aplicar un método basado en DL en datos biológicos, sin la interpretación de los resultados de alto nivel de los métodos de DL
embargo, los problemas y desafíos abiertos comunes son igualmente es difícil debido a la inadecuada comprensión profunda de las teorías
aplicables e importantes para los datos biológicos. Nosotros de DL, lo que hace que muchos de estos modelos se consideren como "caja negra".

a alexnet b GoogleLeNet
8192 UPC GPU Acelerar 100 32768 UPC GPU Acelerar 100

4096 16384

2048 75 8192 75

1024 4096
512 50 2048 50

256 tesla p100 1024 tesla p100


tesla k80 tesla k80
128 25 512 25
tesla m40 tesla m40
64 256
32 0 128 0

Antorcha Antorcha Antorcha Antorcha Antorcha Antorcha


el ean o el ean o el ean o el ean o el ean o el ean o
Caffe Ten so rflow Caffe Ten so rflow Caffe Ten so rflow Caffe Ten so rflow Caffe Ten so rflow Caffe Ten so rflow

C vencer d VGG

16384
UPC GPU Acelerar 100 65536
UPC GPU Acelerar 100

8192 32768

4096 75 16384 75
8192
2048
4096
1024 50 50
2048
512
tesla p100 1024 tesla p100
256 tesla k80 25 tesla k80 25
512
tesla m40 tesla m40
128 256
64 0 128 0

Antorcha Antorcha Antorcha Antorcha Antorcha Antorcha


el ean o el ean o el ean o el ean o el ean o el ean o
Caffe Ten so rflow Caffe Ten so rflow Caffe Ten so rflow Caffe Ten sor flow Caffe Ten so rflow Caffe Ten so rflow

Fig. 6 La aceleración del entrenamiento de CNN en diferentes herramientas de DL en varias GPU en comparación con la CPU. Los valores informados se calcularon para un
tamaño de lote de 128, excepto para VGG para el cual el tamaño de lote fue de 64

13
Machine Translated by Google

26 Computación cognitiva (2021) 13: 1–33

[268]. Además, como muchas otras técnicas de ML, DL también es Herramientas DL (p. ej., Keras, Chainer, Lasagne) y arquitecturas (p. ej.,
susceptible de clasificación errónea [269] y sobreclasificación [270]. DBN) que deben evaluarse comparativamente para proporcionar a los
usuarios una lista más completa para elegir. Además, los puntos de referencia
Además, la capacidad de explotar todos los beneficios que ofrecen los actualmente disponibles se realizan principalmente en datos no biológicos, y
repositorios de datos de acceso abierto, en términos de intercambio y su escalabilidad a datos biológicos es deficiente; por lo tanto, se necesitan
reutilización de datos, a menudo se ve obstaculizada por la falta de evaluaciones comparativas especializadas sobre datos biológicos.
estándares de datos de informes unificados y la falta de uniformidad de la
información notificada [271]. La procedencia de los datos, la conservación y Para obtener información de una imagen, una secuencia o un problema
la anotación de estos grandes datos biológicos también son grandes desafíos [272].
de análisis de señales, es posible que un algoritmo de DL seleccionado que
Además, a excepción de muy pocas grandes empresas, el poder de la utilice una biblioteca o una herramienta (p. ej., TensorFlow, Keras, PyTorch,
computación paralela y distribuida a través de la computación en la nube etc.) deba integrarse con un marco de big data (p. ej. , Hadoop, Spark, etc.).
sigue sin explorarse en gran medida para las técnicas de DL. Debido al En tales casos, la resolución de problemas en el modelo y la depuración del
hecho de que las técnicas de DL requieren un nuevo entrenamiento para código pueden ser un gran desafío para el diseñador del sistema debido a la
diferentes conjuntos de datos, el entrenamiento repetido se convierte en un ejecución paralela de múltiples subprocesos que no siempre se ejecutan de
cuello de botella para los entornos de computación en la nube. Además, en manera ordenada. La falta de documentación y transparencia de modelos
tales entornos distribuidos, las preocupaciones sobre la seguridad y la de estas bibliotecas puede hacer que sea imposible para el director del
privacidad de los datos aún prevalecen [273], y la capacidad de procesamiento proyecto estimar los esfuerzos necesarios para completar con éxito un
en tiempo real de los datos experimentales está subdesarrollada [274]. proyecto.

Para mitigar las deficiencias y abordar los problemas abiertos, es


necesario mejorar los fundamentos teóricos existentes de los métodos DL.
Se requiere que los modelos DL no solo puedan describir datos específicos, Conclusión
sino también generalizarlos sobre la base de datos experimentales, lo cual
es crucial para cuantificar el rendimiento de los modelos NN individuales Los diversos datos biológicos provenientes de diferentes dominios de
[275]. Estas mejoras deberían tener lugar en varias direcciones y abordar aplicación son de naturaleza multimodal, multidimensional y compleja. En
problemas como la evaluación cuantitativa de la eficiencia de aprendizaje la actualidad, una gran cantidad de estos datos están disponibles
del modelo individual y la complejidad computacional asociada en relación públicamente. El acceso asequible a estos datos vino con un gran desafío
con estrategias de ajuste de parámetros bien definidas, la capacidad de para analizar y reconocer patrones en ellos que requieren herramientas
generalizar y autoorganizarse topológicamente en función de las propiedades sofisticadas de ML para hacer el trabajo. Como resultado, muchas
basadas en datos. Además, para facilitar la interpretación intuitiva y menos herramientas analíticas basadas en ML se han desarrollado e informado en
engorrosa de los resultados del análisis, se deben incorporar nuevas las últimas décadas y este proceso se ha visto facilitado en gran medida por
herramientas para la visualización de datos en los marcos de DL. la disminución de los costos computacionales, el aumento de la potencia
informática y la disponibilidad de almacenamiento económico. Con la ayuda
de estas técnicas de aprendizaje, las máquinas han sido entrenadas para
Los desarrollos recientes en métodos combinados pertenecientes al comprender y descifrar patrones e interacciones complejos de variables en
aprendizaje de refuerzo profundo (LR profundo) se han aplicado popularmente datos biológicos. Para facilitar una difusión más amplia de las técnicas de DL
a muchos dominios de aplicación (para una revisión sobre RL profundo, aplicadas a datos biológicos y servir como punto de referencia, este artículo
consulte [276]). Sin embargo, los métodos de RL profunda aún no se han proporciona un estudio exhaustivo de la literatura sobre la aplicación de esas
aplicado a los problemas de reconocimiento de patrones biológicos. técnicas en datos biológicos y los repositorios de datos de acceso abierto
Por ejemplo, analizar y agregar patrones que cambian dinámicamente en relevantes. También enumera las herramientas y marcos de código abierto
datos biológicos provenientes de múltiples niveles podría ayudar a eliminar existentes que implementan varios métodos de DL y compara estas
la redundancia de datos y descubrir biomarcadores novedosos para la herramientas por su popularidad y rendimiento. Finalmente, concluye
detección y prevención de enfermedades. Además, se necesitan nuevos señalando algunos temas abiertos y proponiendo algunas perspectivas de
métodos de RL profunda para reducir el gran conjunto de datos de futuro.
entrenamiento etiquetados que se requiere actualmente.
Se requieren esfuerzos renovados para la estandarización, anotación,
conservación y procedencia de los datos y sus fuentes, además de garantizar Agradecimientos Los autores desean agradecer a los miembros de
acslab (http://www.acslab.info/) por sus valiosos debates.
la uniformidad de la información entre los diferentes repositorios. Además,
para mantenerse al día con el rápido crecimiento de los grandes datos, se
Contribuciones de los autores Este trabajo se llevó a cabo en estrecha
necesitan con urgencia infraestructuras informáticas potentes y seguras en colaboración entre todos los autores. MM y MSK concibieron la idea,
términos de computación distribuida, en la nube y paralela, adaptadas a desarrollaron el método y los experimentos, analizaron los datos obtenidos
estos mecanismos de aprendizaje tan bien entendidos. Por último, hay y escribieron el manuscrito. TMM y AH editado el manuscrito. Todos los
autores han contribuido, visto y aprobado el documento.
muchos otros populares

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 27

Cumplimiento de Normas Éticas 16. Hopfeld JJ. Las neuronas con respuesta graduada tienen propiedades
computacionales colectivas como las de las neuronas de dos estados.
Conflicto de intereses Los autores declaran que la investigación se realizó en PNAS. 1984;81(10):3088–92.
17. Ackley DH, Hinton GE, Sejnowski TJ. Un algoritmo de aprendizaje para
ausencia de cualquier relación comercial o fnanciera que pudiera interpretarse como
máquinas de Boltzmann. Ciencia cognitiva. 1985;9(1):147–69.
un potencial conflicto de intereses.
18. Salakhutdinov R, Mnih A, Hinton G. Máquinas restringidas de Boltzmann para
filtrado colaborativo. En: Proc. ICML; 2007. pág. 791–798.
Aprobación ética Este artículo no contiene ningún estudio con participantes
humanos o animales.
19. Maass W. Redes de neuronas en punta: la tercera generación de modelos de
redes neuronales. Red neuronal 1997;10(9):1659–71.
Consentimiento informado Como este artículo no contiene ningún estudio con
20. Heckerman D. Un tutorial sobre el aprendizaje con redes bayesianas. En:
participantes humanos o animales, el consentimiento informado no es aplicable.
Jordan MI, editor. Aprendizaje en Modelos Gráficos.
89. Springer Países Bajos; 1998. pág. 301–354.
Acceso abierto Este artículo tiene una licencia internacional Creative Commons 21. Cortes C, Vapnik V. Redes de vectores de soporte. Aprender Mach.
Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y 1995;20(3):273–97.
la reproducción en cualquier medio o formato, siempre que se otorgue el crédito 22. Yuan GX, Ho CH, Lin CJ. Avances recientes en la clasificación lineal a gran
correspondiente al autor o autores originales y a la fuente, proporcione un enlace a escala. Proc IEEE. 2012;100(9):2584–603.
la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u 23. Pescador RA. El uso de múltiples mediciones en problemas taxonómicos. Ana
otro material de terceros en este artículo están incluidos en la licencia Creative Eugenesia. 1936;7(2):179–88.
Commons del artículo, a menos que se indique lo contrario en una línea de crédito 24. Uysal I, Güvenir HA. Una descripción general de las técnicas de regresión
al material. Si el material no está incluido en la licencia Creative Commons del para el descubrimiento de conocimiento. Knowl Eng Rev. 1999;14(4):319–40.
artículo y su uso previsto no está permitido por la regulación legal o excede el uso 25. Rish I. Un estudio empírico del clasificador ingenuo de Bayes. En: Proc. 2001
permitido, deberá obtener el permiso directamente del titular de los derechos de IJCAI. vol. 3; 2001. pág. 41–46.
autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/ 26. Cover T, Hart P. Clasificación del patrón del vecino más cercano. IEEE
by/4.0/. Teoría Trans Inf. 1967;13(1):21–7.
27. Rabiner L, Juang B. Una introducción a los modelos ocultos de Markov.
Mag. IEEE ASSP. 1986;3(1):4–16.
28. Kohavi R, Quinlan JR. Tareas y métodos de minería de datos: clasificación:
descubrimiento del árbol de decisión. En: Klösgen W, Zytkow JM, editores.
Referencias manual de minería de datos y descubrimiento de conocimiento.
Nueva York, NY, EE. UU.: Oxford University Press, Inc.; 2002. pág. 267–276.
1. Coleman W. Biología en el siglo XIX: problemas de forma, función y
transformación. Cambridge; Nueva York: Cambridge University Press; 1977. 29. Hinton GE. Procedimientos de aprendizaje conexionista. Inteligencia artificial.
1989;40(1–3):185–234.
2. Magner LN. Una historia de las ciencias de la vida. 3ra ed. Nueva York: m. 30. Dempster AP, Laird NM, Rubin DB. Máxima probabilidad de datos incompletos
Dekker; 2002. a través del algoritmo EM. Método JR Stat Soc Serie B. 1977;39(1):1–38.
3. Brenner S. Historia de la ciencia. La revolución en las ciencias de la vida.
Ciencias. 2012;338(6113):1427–8. 31. Tishby N, Pereira FC, Bialek W. El método del cuello de botella de la
4. Shendure J, Ji H. Secuenciación de ADN de próxima generación. Nat Biotech información. En: Proc. 37 ACCCC. 1999. pág. 368-377.
nol. 2008;26(10):1135–45. 32. Kohonen T. Formación autoorganizada de mapas de características
5. Metzker ML. Tecnologías de secuenciación de próxima generación. Nat Rev. topológicamente correctos. Biol Cybernet. 1982;43(1):59–69.
Genet. 2010;11(1):31–46. 33. Agrawal R, Imieliÿski T, Swami A. Reglas de asociación minera entre conjuntos
6. Vadivambal R, Jayas DS. Bioimagen: principios, técnicas y aplicaciones. Boca de elementos en grandes bases de datos. En: Proc. ACM SIG MOD '93.
Raton, FL: CRC Press, Taylor & Francis Group; 2016. 1993. pág. 207–216.
34. Gordon AD. Una revisión de la clasificación jerárquica. JR Stat Soc Serie A
7. Poldrack RA, Farah MJ. Avances y desafíos en el sondeo del cerebro humano. General. 1987;150(2):119–37.
Naturaleza. 2015;526(7573):371–9. 35. Ball G, Hall D. ISODATA, un nuevo método de análisis de datos y clasificación
8. Lebedev MA, Nicolelis MAL. Interfaces cerebro-máquina: de la ciencia básica de patrones. Stanford, CA: Instituto de Investigación de Stanford; 1965.
a las neuroprótesis y la neurorrehabilitación. Phys Rev. 2017;97(2):767–837.
36. Dunn JC. Un pariente borroso del proceso ISODATA y su uso en la detección
9. Quackenbush J. Extrayendo biología de datos biológicos de alta dimensión. J de clústeres compactos bien separados. J Cibernet. 1973;3(3):32–57.
Exp Biol. 2007;210:1507–17.
10. Mattmann CA. Informática: una visión para la ciencia de datos. Naturaleza. 37. Juan AH. Algoritmos de agrupamiento. Nueva York, NY, EE. UU.: John Wiley
2013;493(7433):473–5. & Sons, Inc.; 1975.
11. Li Y, Chen L. Grandes datos biológicos: desafíos y oportunidades. Genómica 38. Kriegel HP, Kroger P, Sander J, Zimek A. Clustering basado en la densidad.
Proteómica Bioinformática. 2014;12(5):187–9. WIRES Data Min Knowl. 2011;1(3):231–40.
12. Marx V. Biología: Los grandes retos del big data. Naturaleza. 39. Ankerst M, Breunig MM, Kriegel HP, Sander J. OPTICS: ordenar puntos para
2013;498(7453):255–60. identificar la estructura de agrupamiento. En: Proc. ACM SIGMOD'99. 1999.
13. Tarca AL, Carey VJ, Chen Xw, Romero R, Draghici S. Aprendizaje automático pág. 49–60.
y sus aplicaciones a la biología. PLoS Comput Biol. 2007;3(6):e116. 40. Horgan RP, Kenny LC. Tecnologías ómicas: genómica, transcriptómica,
proteómica y metabolómica. Obstet Gynecol. 2011;13(3):189–95.
14. Hopfeld JJ. Redes neuronales artificiales. Dispositivos de circuitos IEEE Mag.
1988;4(5):3–10. 41. Libbrecht MW, Noble WS. Aplicaciones de aprendizaje automático en genética
15. Hecht-Nielsen R. Teoría de la red neuronal de retropropagación. En: Proc. y genómica. Nat Rev. Genet. 2015;16(6):321–32.
IJCNN 1989; 1989. pág. 593–605.

13
Machine Translated by Google

28 Computación cognitiva (2021) 13: 1–33

42. Lemm S, Blankertz B, Dickhaus T, Müller KR. Introducción al aprendizaje automático 63. Goodfellow I, Bengio Y, Courville A. Aprendizaje profundo. Cambridge, EE. UU.: MIT
para imágenes cerebrales. Neuroimagen. 2011;56(2):387–99. Press; 2016.
64. Saxe AM, McClelland JL, Ganguli S. Soluciones exactas a la dinámica no lineal del
43. Erickson BJ, Korfatis P, Akkus Z, Kline TL. Aprendizaje automático para imágenes aprendizaje en redes neuronales lineales profundas. En: Proc.
médicas. Radiografías. 2017;37(2):505–15. ICLR; 2014. pág. 1–22.
44. Kan A. Aplicaciones de aprendizaje automático en el análisis de imágenes celulares. 65. Schmidhuber J. Aprendizaje profundo en redes neuronales: una descripción general.
Inmunol Cell Biol. 2017;95(6):525–30. Red neuronal 2015;61:85–117.
45. Vidaurre C, Sannelli C, Müller KR, Blankertz B. Calibración coadaptativa basada en 66. Zeng D, Zhao F, Shen W, Ge S. Compresión y aceleración de la red neuronal para
aprendizaje automático para interfaces cerebro-computadora. la localización de puntos faciales. Cómputo Cognitivo. 2018;10(2):359–67.
Cómputo neural. 2010;23(3):791–816.
46. Mala S, Latha K. Selección de características en la clasificación de los movimientos 67. Salakhutdinov R, Hinton GE. Máquinas profundas de Boltzmann. En: Proc.
oculares mediante electrooculografía para el reconocimiento de actividad. Com AISTATS2009; 2009. pág. 448–455.
Matemáticas Met Med. 2014 diciembre;2014. 68. Geman S, Geman D. Relajación estocástica, distribuciones de Gibbs y la restauración
47. Mahmud M. Vassanelli S. Procesamiento y análisis de señales neuronales bayesiana de imágenes. IEEE Trans Patrón Anal Mach Intel. 1984;6(6):721–41.
extracelulares multicanal: estado del arte y desafíos.
Neurociencia frontal. 2016. pág. 10 69. Fischer A, Igel C. Una introducción a las máquinas restringidas de Boltzmann. En:
48. Lecun Y, Bengio Y, Hinton G. Aprendizaje profundo. Naturaleza. 2015 5;521(7553):436– Proc. CIARP 2012; 2012. pág. 14–36.
444. 70. Desjardins G, Courville AC, Bengio Y. Sobre el entrenamiento de máquinas
49. Yahaya SW, Lotf A, Mahmud M. Un enfoque de conjunto de detección de novedad Boltzmann profundas. CoRR. 2012;abs/1203.4416.
de consenso para la detección de anomalías en las actividades de la vida diaria. 71. Tieleman T. Training restringió las máquinas de Boltzmann utilizando aproximaciones
Computación blanda aplicada. 2019;83:105613. al gradiente de probabilidad. En: Proc. ICML; 2008. pág. 1064–1071.
50. Fabietti M, Mahmud M, Lotf A, Averna A, Guggenmo D, Nudo R, et al. Detección de
artefactos basada en redes neuronales en potenciales de campo locales registrados 72. Guo Y, Liu Y, Oerlemans A, Lao S, Wu S, Lew MS. Aprendizaje profundo para la
a partir de sondas neuronales implantadas crónicamente. comprensión visual: una revisión. Neurocomputación. 2016;187:27–48.
En: Proc. IJCNN; 2020. pág. 1–8.
51. Mahmud M, Kaiser MS, Hussain A, Vassanelli S. Aplicaciones del aprendizaje 73. Hinton GE, Osindero S, Teh YW. Un algoritmo de aprendizaje rápido para redes de
profundo y el aprendizaje por refuerzo a los datos biológicos. creencias profundas. Cómputo neuronal. 2006;18(7):1527–54.
IEEE Trans Neural Netw Learn Syst. 2018;29(6):2063–79. 74. Bi X, Zhao X, Huang H, Chen D, Ma Y. Clasificación funcional de la red cerebral para
52. Mahmud M, Kaiser MS, Hussain A. Aprendizaje profundo en la extracción de datos la detección de la enfermedad de Alzheimer con características profundas y

biológicos. arXiv:200300108 [cs, q-bio, estadística]. febrero de 2020; pág. máquina de aprendizaje extremo. Cómputo Cognitivo. 2020;12:513–527.
1–36. ArXiv: 2003.00108. Disponible en: http://arxiv.org/
abs/2003.00108. 75. Ravi D, Wong C, Deligianni F, Berthelot M, et al. Aprendizaje profundo para la
53. Dey N, Rajinikanth V, Fong SJ, Kaiser MS, Mahmud M. informática de la salud. Informe de salud IEEE J Biomed. 2017;21(1):4–21.
La optimización de grupos sociales ayudó a la entropía y la segmentación
morfológica de Kapur para la detección automática de la infección por COVID-19 a 76. Vincent P, Larochelle H, Lajoie I, Bengio Y, Manzagol PA.
partir de imágenes de tomografía computarizada. Cómputo Cognitivo. Autocodificadores de eliminación de ruido apilados: aprendizaje de representaciones
2020;12(5):1011–1023. útiles en una red profunda con un criterio de eliminación de ruido local. J Mach
54. Aradhya MVN, Mahmud M, Guru D, S Agrawal B, Kaiser MS. Aprenda Res. 2010;11:3371–408.
Enfoque basado en grupos de un disparo para la detección de COVID-19 a partir 77. Baldi P. Autoencoders, aprendizaje no supervisado y arquitectura profunda
de imágenes de rayos X de tórax. Cómputo Cognitivo. 2020; pág. 1–8. turas En: Proc. CIUTLV; 2012. pág. 37–50.
55. Noor MBT, Zenia NZ, Kaiser MS, Mahmud M, Al Mamun S. 78. Ranzato M, Poultney C, Chopra S, Cun YL. Aprendizaje eficiente de representaciones
Detección de enfermedades neurodegenerativas a partir de resonancias magnéticas: una breve dispersas con un modelo basado en energía. En: Proc.
revisión desde una perspectiva de aprendizaje profundo. En: Liang P, Goel V, Shan C, editores. PNI; 2006. pág. 1137-1144.
Cerebro Informar. Cham: publicación internacional de Springer; 2019. pág. 115– 79. Kingma DP, Welling M. Bayes variacional de codificación automática.
125. CoRR. 2014;abs/1312.6114.
56. Ali HM, Kaiser MS, Mahmud M. Aplicación de la red neuronal convolucional en la 80. Rifai S, Vincent P, Muller X, Glorot X, Bengio Y. Codificadores automáticos
segmentación de regiones cerebrales a partir de datos de resonancia magnética. contractivos: invariancia explícita durante la extracción de características.
En: Liang P, Goel V, Shan C, editores. Cerebro Informar. Cham: publicación En: Proc. ICML; 2011. pág. 833–840.
internacional de Springer; 2019. pág. 136–146. 81. Goodfellow I, Pouget-Abadie J, Mirza M, Xu B, Warde-Farley D, Ozair S, et al. Redes
57. Miah Y, Prima CNE, Seema SJ, Mahmud M, Kaiser MS. Comparación de rendimiento generativas adversarias. En: Avances en los sistemas de procesamiento de
de técnicas de aprendizaje automático en la identificación de demencia a partir de información neuronal; 2014. pág. 2672–2680.
conjuntos de datos clínicos de acceso abierto. En: Proc. ICACIn. 82. Isola P, Zhu JY, Zhou T, Efros AA. Traducción de imagen a imagen con redes
Springer, Singapur; 2020. pág. 79–89. antagónicas condicionales. En: Proc.IEEE CVPR; 2017. pág. 1125–1134.
58. Watkins J, Fabietti M, Mahmud M. SENTIDO: un cuantificador de rendimiento de los
estudiantes mediante el análisis de sentimientos. En: Proc. IJCNN; 2020. pág. 1–6. 83. Wang Z, Healy G, Smeaton AF, Ward TE. Uso de señales neuronales para evaluar la
calidad del rendimiento de la red adversaria generativa en la generación de
59. Rabby G, Azad S, Mahmud M, Zamli KZ, Rahman MM. TeKET: una técnica de imágenes faciales. Cómputo Cognitivo. 2020;12(1):13–24.
extracción de frases clave no supervisada basada en árboles. Cómputo Cognitivo.
2020;12(5):811–33. 84. Pascanu R, Gulcehre C, Cho K, Bengio Y. Cómo construir redes neuronales
60. Orojo O, Tepper J, McGinnity TM, Mahmud M. Una red de renta multi-recurrente recurrentes profundas. En: Proc. ICLR; 2014. pág. 1–13.
para la predicción del precio del petróleo crudo. En: Proc. SSCI; 2019. pág. 2940– 85. Elman JL. Encontrar estructura en el tiempo. Ciencia cognitiva. 1990;14(2):179–21111.
2945.
61. Ching T, et al. Oportunidades y obstáculos para el aprendizaje profundo en biología 86. Schuster M, Paliwal KK. Redes neuronales recurrentes bidireccionales. Proceso de
y medicina. bioRxiv. 2017; pág. 142760. señal de transmisión IEEE. 1997;45(11):2673–81.
62. Bengio Y. Aprendizaje de arquitecturas profundas para IA. Tendencias encontradas 87. Hochreiter S, Schmidhuber J. Memoria larga a corto plazo. Cómputo neuronal.
Mach Learn. 2009;2(1):1–127. 1997;9(8):1735–80.

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 29

88. Lipton ZC, Berkowitz J, Elkan C. Una revisión crítica de las redes neuronales 109. Kamnitsas K, Ledig C, Newcombe VFJ, Simpson J, et al. CNN 3D multiescala
recurrentes para el aprendizaje de secuencias. CoRR. mayo de 2015; CoRR: eficiente con CRF totalmente conectado para una segmentación precisa de
1506.00019. lesiones cerebrales. Anal de imagen médica. 2017;36:61–78.
89. Ma Y, Peng H, Khan T, Cambria E, Hussain A. Sentic LSTM: una red híbrida para 110. Lu N, Li T, Ren X, Miao H. Un esquema de aprendizaje profundo para la
el análisis de sentimiento basado en aspectos específicos. clasificación de imágenes motoras basado en máquinas restringidas de Boltzmann.
Cómputo Cognitivo. 2018;10(4):639–50. IEEE Trans Neural Syst Rehabil Ing. 2016; 99
90. Wiatowski T, Bölcskei H. Una teoría matemática de las redes neuronales 111. Yang H, Sakhavi S, Ang KK, Guan C. Sobre el uso de redes neuronales
convolucionales profundas para la extracción de características. Teoría de convolucionales y características CSP aumentadas para imágenes motoras
información trans IEEE. 2017;64(3):1845–66. de clases múltiples de clasificación de señales EEG. En: Proc. 37º IEEE EMBC;
91. LeCun Y, Bengio Y. Redes convolucionales para imágenes, voz y series 2015. pág. 2620–2623.
temporales. En: Arbib MA, editor. el manual de teoría del cerebro y redes 112. Tabar YR, Halici U. Un nuevo enfoque de aprendizaje profundo para la clasificación
neuronales. Cambridge, MA, EE. UU.: MIT Press; 1998. pág. 255–258. de señales de imágenes motoras EEG. J Neural Ing. 2017;14(1):016003.

92. Krizhevsky A, Sutskever I, Hinton GE. Clasificación de ImageNet con redes 113. Sakhavi S, Guan C, Yan S. Red neuronal lineal convolucional paralela para la
neuronales convolucionales profundas. En: Proc. PNI; 2012. pág. 1097-1105. clasificación de imágenes motoras. En: Proc. EUSIPCO; 2015. pág. 2786–2790.

93. Simonyan K, Zisserman A. Redes convolucionales muy profundas para el 114. Li K, Li X, Zhang Y, Zhang A. Reconocimiento del estado afectivo de EEG con
reconocimiento de imágenes a gran escala. CoRR. 2014;abs/1409.1556. redes de creencias profundas. En: Proc. BIBM; 2013. pág. 305–310.
94. Szegedy C, Liu W, Jia Y, Sermanet P, Reed S, Anguelov D, et al. Profundizando
con las circunvoluciones. En: Proc. CVPR2015; 2015. pág. 1–9. 115. Jia X, Li K, Li X, Zhang A. Un nuevo marco de aprendizaje profundo
semisupervisado para el reconocimiento de estados afectivos en señales de
95. Heinsfeld AS, Franco AR, Craddock RC, Buchweitz A, Meneguzzi F. Identificación EEG. En: Proc. BIBE IEEE; 2014. pág. 30–37.
del trastorno del espectro autista mediante el aprendizaje profundo y el conjunto 116. Tripathi S, Acharya S, Sharma R, Mittal S, et al. Uso de redes neuronales
de datos ABIDE. NeuroImagen: Clin. 2018;17:16 – 23. profundas y convolucionales para una clasificación precisa de las emociones
en el conjunto de datos DEAP. En: Proc. 29ª IAAI; 2017. pág. 4746–4752.
96. Kuang D, He L. Clasificación sobre TDAH con aprendizaje profundo. 117. Chen G, Zhu Y, Hong Z, Yang Z. EmocionalGAN: generación de ECG para
En: Proc. CCBD; 2014. pág. 27–32. mejorar la clasificación del estado emocional. En: Proc. AICS 2019. 2019. pág.
97. HosseiniAsl E, Gimelfarb GL, El-Baz A. Diagnóstico de la enfermedad de 309-313.
Alzheimer mediante una red convolucional 3D adaptable profundamente 118. Mirowski P, Madhavan D, LeCun Y, Kuzniecky R. Clasificación de patrones de
supervisada. CoRR. 2016;abs/1607.00556. sincronización de EEG para la predicción de convulsiones. Clin Neurofisiol.
98. Suk HI, Lee SW, Shen D. Representación de características jerárquicas y fusión 2009;120(11):1927–40.
multimodal con aprendizaje profundo para el diagnóstico de EA/DCL. 119. Jirayucharoensak S, Pan-Ngum S, Israsena P. Reconocimiento de emociones
Neuroimagen. 2014;101:569–82. basado en EEG utilizando una red de aprendizaje profundo con adaptación de
99. Li F, Tran L, Thung KH, Ji S, Shen D, Li J. Un modelo profundo robusto para cambio de covariable basada en componentes principales. Scientific World J.
mejorar la clasificación de pacientes con EA/DCL. Informe de salud IEEE J 2014;p. 1–10.
Biomed. 2015;19(5):1610–6. 120. Wu Z, Ding X, Zhang G. Un método novedoso para clasificar las arritmias de ECG
100. Havaei M, Guizard N, Larochelle H, Jodoin PM. Tendencias de aprendizaje utilizando redes de creencias profundas [artículo de revista]. Aplicación J Comp
profundo para la segmentación de patología cerebral focal en resonancia Intel. 2016;15:1650021.
magnética. En: Holzinger A, editor. Aprendizaje automático para la informática 121. Yan Y, Qin X, Wu Y, Zhang N, Fan J, et al. Una clasificación electrocardiográfica
de la salud: estado del arte y desafíos futuros. Cham: Springer; 2016. pág. 125– de dos derivaciones basada en una máquina Boltz-mann restringida.
148. En: Proc. BSN; 2015. pág. 1–9.
101. Fritscher K, Raudaschl P, Zafno P, Spadea MF, Sharp GC, et al. Redes neuronales 122. Atzori M, Cognolato M, Müller H. Aprendizaje profundo con redes neuronales
profundas para una segmentación rápida de imágenes médicas en 3D. En: convo lucionales aplicadas a datos de electromiografía: un recurso para la
Proc. MICCAI; 2016. pág. 158–165. clasificación de movimientos para manos protésicas.
102. Iqbal T, Ali H. Red antagónica generativa para imágenes médicas (MI-GAN). J Neurorobot frontal. 2016;10:9.
Med Syst. 2018;42(11):231. 123. Huanhuan M, Yue Z. Clasificación de señales de electrocardiograma con DBN.
103. Ciresan D, Giusti A, Gambardella L, Schmidhuber J. Las redes neuronales En: Proc. CSE de IEEE; 2014. pág. 7–12.
profundas segmentan la membrana neuronal en imágenes de microscopía electrónica.124. Wang S, Peng J, Ma J, Xu J. Predicción de estructura secundaria de proteínas
En: Proc. PNI; 2012. pág. 2843–2851. usando campos neurales convolucionales profundos. Informes científicos.
104. Stollenga MF, Byeon W, Liwicki M, Schmidhuber J. Parallel multidimensional 2016 noviembre; 6 (1).

LSTM, with application to fast biomedical volumetric image segmentation. En: 125. Alipanahi B, Delong A, Weirauch MT, Frey BJ. Predicción de las especificidades
Proc. PNI; 2015. pág. 2980–88. de secuencia de proteínas de unión a ADN y ARN mediante aprendizaje
profundo. Naturaleza Biotecnología. 2015;33(8):831–8.
105. Kleesiek J, Urban G, Hubert A, Schwarz D, Maier-Hein K, Bend szus M, et al. 126. Chen G, Tsoi A, Xu H, Zheng WJ. Prediga la combinación efectiva de fármacos
Extracción profunda del cerebro por resonancia magnética: una red neuronal mediante la red de creencias profundas y las huellas dactilares de la ontología.
convolucional 3D para la extracción del cráneo. Neuroimagen. 2016;129:460–9. J Biomed Informar. 2018;85:149–54.
106. Cho J, Lee K, Shin E, Choy G, Do S. Aprendizaje profundo de imágenes médicas 127. Denas O, Taylor J. Modelado profundo de la regulación de la expresión génica en
con el conjunto de datos PACS del hospital. CoRR. 2015;abs/1511.06348. un modelo de eritropoyesis. En: Proc. ICMLRL; 2013. pág. 1–5.
107. Ngo T, et al. Combinando el aprendizaje profundo y el conjunto de niveles para 128. Kelley DR, Snoek J, Rinn JL. Basset: aprendiendo el código regulador del genoma
la segmentación automatizada del ventrículo izquierdo del corazón de cardio accesible con redes neuronales convolucionales profundas. Genoma Res.
cine mr. Anal de imagen médica. 2017;35:159–71. 2016;26(7):990–9.
108. Ciresan D, Giusti A, Gambardella L, Schmidhuber J. Detección de mitosis en 129. Zhou J, Troyanskaya OG. Predicción de efectos de variantes no codificantes con
imágenes histológicas de cáncer de mama con redes neuronales profundas. modelo de secuencia basado en aprendizaje profundo. Métodos de la
En: Proc. MICCAI; 2013. pág. 411–4188. naturaleza. 2015;12(10):931–4.

13
Machine Translated by Google

30 Computación cognitiva (2021) 13: 1–33

130. Marouf M, et al. Generación realista in silico y aumento de datos de secuenciación de 151. Ye F, Zhu F, Fu Y, Shen B. Generación de ECG con redes antagónicas generativas de
ARN de una sola célula utilizando redes generativas antagónicas. Nat Comun. secuencia optimizadas por gradiente de políticas. Acceso IEEE. 2019;7:159369–
2020;11:166. 159378.
131. Lee T, Yoon S. Máquina de Boltzmann categórica restringida impulsada para la predicción 152. Luo Y, Lu BL. Aumento de datos de EEG para el reconocimiento de emociones utilizando
computacional de uniones de empalme. En: Proc. ICML; 2015. pág. 2483–2492. un Wasserstein GAN condicional. En: 2018 IEEE EMBC; 2018. pág. 2535–2538. ISSN:
1558-4615.
132. Zeng H, Edwards MD, Liu G, Giford DK. Arquitecturas de redes neuronales convolucionales 153. Usted S, et al. Detección automática no supervisada de convulsiones para convulsiones
para predecir la unión ADN-proteína. Bioinformática. 2016;32(12):121–7. de inicio focal registradas con EEG retroauricular utilizando una red antagónica
generativa de detección de anomalías. Informática Métodos Programas Biomed. 2020;
133. Park S, Min S, Choi H, Yoon S. deepMiRGene: Predicción de microARN precursor pág. 105472.
basada en redes neuronales profundas. CoRR. 2016;abs/1605.00017. 154. Jiao Y, Deng Y, Luo Y, Lu BL. Detección de somnolencia del conductor a partir de señales
EEG y EOG mediante redes GAN y LSTM. Neurocomputación. 2020;408:100-111.
134. Lee B, Baek J, Park S, Yoon S. deepTarget: marco de aprendizaje de extremo a extremo
para la predicción de objetivos de miARN utilizando redes neuronales recurrentes 155. Singh P, Pradhan G. Un nuevo marco de eliminación de ruido de ECG que utiliza una red
profundas. CoRR. 2016;abs/1603.09123. antagónica generativa. IEEE/ACM Trans Comput Biol Bioinform. 2020; pág. 3114–
135. Li H. Un método de reconstrucción de la estructura de proteínas basado en plantillas 3128.
utilizando el aprendizaje DA. J Proteómica Bioinform. 2016;9(12). 156. Wang X, Ghasedi Dizaji K, Huang H. Red adversarial generativa condicional para la
136. Ibrahim R, Yousri NA, Ismail MA, El-Makky NM. Selección de características de genes/ inferencia de la expresión génica. Bioinformática. 2018 09;34(17):i603–i611.
MiARN multinivel utilizando redes de creencias profundas y aprendizaje activo. En:
Proc. IEEE EMBC; 2014. pág. 3957–3960. 157. Pan X, Shen HB. Extracción de motivos de unión a proteínas de ARN con un nuevo
137. Chen L, Cai C, Chen V, Lu X. Aprendizaje transespecies de sistemas de señalización enfoque híbrido de integración de conocimiento entre dominios basado en aprendizaje
celular con redes bimodales de creencias profundas. Bioinformática. septiembre de profundo. BMC Bioinforme. 2017;18(1).
2015;31(18):3008–3015. 158. Jiang X, Zhao J, Qian W, Song W, Lin GN. Un modelo generativo de red adversaria para
138. Danaee P, Ghaeini R, Hendrix DA. Un enfoque de aprendizaje profundo para la detección la predicción de genes de enfermedades con datos de RNA-seq. Acceso IEEE.
del cáncer y la identificación de genes relevantes. En: Proc. Pac. 2020;8:37352–60.
Síntoma Biocomputación.. vol. 22; 2016. pág. 219–229. 159. Zhao L, Wang J, Pang L, Liu Y, Zhang J. GANsDTA: predicción de la afinidad de unión
139. Li Y, Fauteux F, Zou J, Nantel A, Pan Y. Predicción personalizada de genes con del fármaco al objetivo mediante GAN. Geneta delantera. 2020;10:1243.
mutaciones somáticas causantes de tumores basada en una máquina de Boltzmann
profunda multimodal. Neurocomputación. 2019;324:51–62. 160. Editorial. Compartir datos. biol celular nat. 2009 11;11(11):1273.
161. Señor PW, et al. Intercambio de datos a gran escala en las ciencias de la vida: estándares
140. Zhang T, Zhang L, Payne PRO, Li F. Predicción de combinación de fármacos sinérgicos de datos, incentivos, barreras y modelos de financiación (el 'Estudio conjunto de
mediante la integración de datos multiómicos en modelos de aprendizaje profundo. estándares de datos'). 2005. Disponible en: http://www.nesc.
arXiv:181107054 [cs, q-bio, estadística]. noviembre de 2018; ArXiv: 1811.07054. ac.uk/technical_papers/UKeS-2006-02.pdf.
Disponible en: http://arxiv.org/abs/1811.07054. 162. Martone ME, Ellisman MH, Sosinsky GE, Gupta A, Tran J, Wong W, et al. Base de datos
141. Huang Y, Gulko B, Siepel A. Predicción rápida y escalable de variantes no codificantes centrada en celdas. Colecciones digitales de la biblioteca de UC San Diego. 2017.
nocivas a partir de datos genómicos funcionales y de población. Geneta de la https://doi.org/10.6075/J0S180PX.
Naturaleza. 2017;49:618–24. 163. Ellisman M, et al. Biblioteca de imágenes de celdas. 2016. Disponible en: http://
142. Le EPV, Wang Y, Huang Y, Hickman S, Gilbert FJ. Inteligencia artificial en imagen www.cellimagelibrary.org/. Consultado el 4 de enero de 2020.
mamaria. Clín Radiol. 2019;74(5):357–66. 164. ERIC. Eurobioimagen. 2016. Disponible en: http://www.
143. Yi X, Walia E, Babyn P. Red antagónica generativa en imágenes médicas: una revisión. eurobioimaging.eu/. Consultado el 4 de enero de 2020.
Anal de imagen médica. 2019;58:101552. 165. Karkow W. Base de datos de imágenes de histología HAPS. 2008. Disponible en: http://
144. Sandfort V, Yan K, Pickhardt PJ, Summers RM. Aumento de datos utilizando redes haphistology.wikifoundry.com/. Consultado el 23 de enero de 2017.
adversariales generativas (CycleGAN) para mejorar la generalización en tareas de
segmentación de CT. Sci Rep. 2019;9(1):1–9. 166. Dundee U. IDR: recurso de datos de imagen. 2016. Disponible en:
https://idr.openmicroscopy.org/.
145. Armanious K, et al. MedGAN: traducción de imágenes médicas mediante GAN. Calcular 167. Kistler M. SMIR CT de cuerpo completo. SMIR. 2017. Disponible en: https://doi.org/
gráfico de imágenes médicas. 2020;79:101684. 10.1007/BF00337288.
146. Uemura T, et al. Modelo de predicción de supervivencia basado en GAN a partir de 168. Arkansas for Medical Sciences U. The Cancer Imaging Archive.
imágenes de TC de pacientes con fbrosis pulmonar idiopática. En: Chen PH, Deserno 2015. Disponible en: https://www.cancerimagingarchive.
TM, editores. Imágenes médicas 2020: Informática de imágenes para atención médica, red/. Consultado el 4 de enero de 2020.

investigación y aplicaciones. vol. 11318. 169. Marinelli RJ, et al. La base de datos de micromatrices de tejidos de Stanford.
SPIE; 2020. pág. 354 – 359. 2007. Disponible en: https://tma.stanford.edu. Consultado el 23 de enero de 2017.
147. Thambawita V, Hammer HL, Riegler M, Halvorsen P. GANEx: una línea completa de
experimentos GAN de entrenamiento, inferencia y evaluación comparativa. En: Proc. 170. Universidad de California SB. Conjunto de datos de referencia de biosegmentación de
2019 CBMI. 2019. pág. 1–4. UCSB. 2008. Disponible en: https://bioimage.ucsb.edu/
148. Halicek M, et al. Red adversaria generativa condicional para sintetizar imágenes investigación/biosegmentación. Consultado el 23 de enero de 2017.
hiperespectrales de células de cáncer de mama a partir de histología digitalizada. En: 171. PERMANECER. Intercambio de datos de imágenes cerebrales de autismo. 2012.
Tomaszewski JE, Ward AD, editores. Medical Imaging 2020: Patología digital, vol. Disponible en: https://goo.gl/n694sN. Consultado el 4 de enero de 2020.
11320. SPIE; 2020. pág. 198–205. 172. Milham MP. TDAH200. 2011. Disponible en: https://doi.
org/10.1007/BF00337288. Consultado el 4 de enero de 2020.
149. Zhu F, Ye F, Fu Y, Liu Q, Shen B. Generación de electrocardiogramas con una red 173. ANDÍ. Conjuntos de datos de la Iniciativa de neuroimagen de la enfermedad de Alzheimer
antagónica generativa LSTM-CNN bidireccional. (ADNI). 2009. Disponible en: https://adni.loni.usc.edu/.
Sci Rep. 2019;9(1):1–11. Consultado el 4 de enero de 2020.

150. Yu L, Zhang W, Wang J, Yu Y. Seqgan: Secuencia de redes antagónicas generativas con 174. López M. Repositorio digital de cáncer de mama. 2008. Disponible en: https://bcdr.eu/.
gradiente de políticas. En: Proc. 31ª Conferencia AAAI. Consultado el 8 de abril de 2020.
AI; 2017. pág. 2852–2858.

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 31

175. Mooney P. Imágenes de radiografía de tórax (neumonía) | Kaggle. Algoritmos de detección de QRS de la UNSW. 2016. Disponible en: http://
2018. Disponible en: https://doi.org/10.1007/BF00337288. arxiv.org/abs/1811.07054.
Consultado el 4 de enero de 2020. 198. 2020 BH. BNCIHorizonte2020. 2015. Disponible en: http://arxiv.
176. MITOS-ATIPIA. MITOS-ATYPIA-14 - Conjunto de datos. 2012. Disponibilidad org/abs/1811.07054. Consultado el 4 de enero de 2020.
disponible desde: https://doi.org/10.1007/BF00337288. Consultado el 4 de enero de 199. Khushaba RM. Repositorio de electromiogramas (EMG). 2012. Disponible en: http://
2020. arxiv.org/abs/1811.07054. Consultado el 6 de abril de 2020.
177. NAMIC. MIDAS - Alianza Nacional Comunitaria para Computación de Imágenes Médicas
(NAMIC). 2010. Disponible en: http://arxiv. 200. Rantanen V, et al. Interfaces miméticas: conjunto de datos EMG de superficie facial
org/abs/2003.00108. 2015. 2015. Disponible en: http://arxiv.org/abs/1811.07054.
178. Cohen JP, Morrison P, Dao L. Recopilación de datos de imágenes de COVID-19. 2020. Consultado el 4 de enero de 2020.

Disponible en: http://arxiv.org/abs/2003.00108. 201. Base de datos Atzori M. NinaPro prótesis de mano adaptativas no invasivas. 2012.
Consultado el 4 de enero de 2020. Disponible en: http://arxiv.org/abs/1811.07054.
179. Yarkoni T. Neurosynth. 2012. Disponible en: http://arxiv.org/ Consultado el 4 de enero de 2020.
abs/2003.00108. Consultado el 4 de enero de 2020. 202. Koelstra S, et al. Base de datos para análisis de emociones mediante señales fisiológicas.
180. NIH. Conjuntos de datos de rayos X de tórax del NIH. 2017. Disponible en: http:// 2011. Disponible en: http://arxiv.org/
arxiv.org/abs/2003.00108. Consultado el 4 de enero de 2020. abs/1811.07054. Consultado el 4 de enero de 2020.

181. LaMontagne PJ, et al. Serie de Estudios de Imágenes de Acceso Abierto (OASIS). 2019. 203. Abadi MK, et al. Base de datos multimodal basada en MEG para decodificar respuestas
Disponible en: http://arxiv.org/abs/2003.00108 fisiológicas afectivas. 2007. Disponible en: http://
182. Muschelli J. Conjuntos de datos abiertos de neuroimagen. 2015. Disponible en: http:// arxiv.org/abs/1811.07054. Consultado el 4 de enero de 2020.
arxiv.org/abs/2003.00108. Consultado el 4 de enero de 2020. 204. HeadIT de la Universidad de California SD. Emoción imaginada. 2009.
183. Reyes M. El conjunto de datos de modelado y generación de imágenes multiescala Disponible en: http://arxiv.org/abs/1811.07054. Consultado el 4 de enero de 2020.
HEAR-EU del oído interno humano. SMIR. 2017. Disponible en: http://
arxiv.org/abs/2003.001086. 205. Soleymani M, Lichtenauer J, Pun T, M P. Base de datos de etiquetado de HCI.
184. Conjunto de datos I. Conjuntos de datos de desarrollo cerebral. 2014. Disponible en: 2012. Disponible en: http://arxiv.org/abs/1811.07054. Consultado el 4 de enero de
http://arxiv.org/abs/2003.00108. Consultado el 4 de enero de 2020. 2020.

185. Shattuck DW, Mirza M, Adisetiyo V, Hojatkashani C, Salamon G, et al. Construcción de 206. Lu PBL. Conjuntos de datos SEED. 2013. Disponible en: http://arxiv.org/
un atlas probabilístico 3D de estructuras corticales humanas. Neuroimagen. 2008 abs/1811.07054. Consultado el 4 de enero de 2020.

febrero; 39 (3): 1064–1080. 207. Kaya M, Binli MK, Ozbay E, Yanar H, Mishchenko Y. Un gran conjunto de datos de
186. Gorgolewski KJ, et al. Neurobóveda. 2015. Disponible en: http:// imágenes de motores electroencefalográficos para interfaces de computadoras
arxiv.org/abs/2003.00108. Consultado el 4 de enero de 2020. cerebrales electroencefalográficas. compartir 2018;Colección. Disponible en: http://
187. Boekel W. Herramientas y recursos informáticos de neuroimagen que borran el conjunto www.nesc.ac.uk/technical_papers/
de datos interno. 2015. Disponible en: https://doi.org/10.1007/ UKeS-2006-02.pdf.
s12559-020-09751-3. Consultado el 4 de enero de 2020. 208. Cho MH y Ahn, Ahn S, Kwon M, C JS. Datos de apoyo para conjuntos de datos de EEG
188. Poldrack, et al. OPEN fMRI: un conjunto de datos de neuroimagen humana multimodal y para interfaz de computadora cerebral de imágenes motoras.
multisujeto. 2015. Disponible en: https://doi. Base de datos GigaScience. 2017. Disponible en: http://www.nesc.
org/10.1007/s12559-020-09751-3. Consultado el 4 de enero de 2020. ac.uk/technical_papers/UKeS-2006-02.pdf.
189. Pernet C, Gorgolewski K, Ian W. Conjunto de datos de neuroimagen de pacientes con 209. Schalk G, McFarland DJ, Hinterberger T, Birbaumer N, Wolpaw JR. Conjunto de datos de
tumores cerebrales. 2016. Disponible en: https://doi.org/10.1007/ imágenes/movimiento motor EEG. 2009. Disponible en: http://www.nesc.ac.uk/
s12559-020-09751-3. Consultado el 4 de enero de 2020. technical_papers/UKeS-2006-02.
190. van Ginneken B, Kerkstra S, Meakin J. DRIVE - Grand Challenge. 2004. Disponible en: pdf. Consultado el 6 de abril de 2020.
https://doi.org/10.1007/s12559- 210. Korczowski L, Ostaschenko E, Andreev A, Cattan G, Rodrigues PC, Gautheret V, et al.
020-09751-3. Brain Invaders sin calibración P300-
191. Repositorio SII. NITRC: IBSR: Información sobre herramientas/recursos. 2007. BCI basado en electrodos EEG secos Conjunto de datos (bi2014a). 2019.
Disponible en: https://doi.org/10.1007/s12559-020-09751-3. Disponible en: http://www.nesc.ac.uk/technical_papers/UKeS 2006-02.pdf. Consultado
Consultado el 4 de enero de 2020. el 4 de enero de 2020.
192. Goldbaum M. El Proyecto STARE. 1975. Disponible en: https:// 211. Korczowski L, Cederhout M, Andreev A, Cattan G, Rodrigues PL, Gautheret V, et al. Brain
doi.org/10.1007/s12559-020-09751-3. Invaders sin calibración P300-
193. Cao Z, Chuang M, King JT, Lin CT. Registros de EEG multicanal durante una tarea de basado en BCI con modulación de la duración del flash Dataset (bi2015a).
conducción de atención sostenida. Figshare. 2019. Disponible en: http://www.nesc.ac.uk/technical_papers/
2019;Colección. Disponible en: https://doi.org/10.1007/s12559- UKeS-2006-02.pdf. Consultado el 4 de enero de 2020.
020-09751-3. 212. Korczowski L, Ostaschenko E, Andreev A, Cattan G, Rodrigues PC, Gautheret V, et al.
194. Cuerpo EEG de la Universidad de Picone J. Temple. 2011. Disponible en: https://doi.org/ Brain Invaders Solo versus Collaboration: conjunto de datos de interfaz cerebro-
10.1007/s12559-020-09751-3. Consultado el 7 de abril de 2020. computadora basado en P300 multiusuario (bi2014b). 2019. Disponible en: http://
www.nesc.ac.uk/technical_
195. GB M, RG M. Base de datos de arritmias del MIT-BIH. 1999. Disponible en: https://doi.org/ documentos/UKeS-2006-02.pdf. Consultado el 4 de enero de 2020.
10.1007/s12559-020-09751-3. Consultado el 4 de enero de 2020. 213. Korczowski L, Cederhout M, Andreev A, Cattan G, Rodrigues PL, Gautheret V, et al. Brain
Invaders Cooperativo versus competitivo: conjunto de datos de interfaz cerebro-
196. Goldberger A, et al. PhysioBank, PhysioToolkit y PhysioNet: componentes de un nuevo computadora basado en P300 multiusuario (bi2015b). 2019. Disponible en: http://
recurso de investigación para señales fisiológicas complejas. 2003. Circulación. www.nesc.ac.uk/technical_
101(23):e215-e220. Disponible en: https://doi.org/10.1007/s12559-020-09751-3. documentos/UKeS-2006-02.pdf. Consultado el 4 de enero de 2020.
214. Competiciones BCI. Conjuntos de datos de competencia BCI. 2008. Disponible en: http://
197. Khamis H, Weiss R, Xie Y, Chang CW, Lovell NH, Redmond SJ. Base de datos de TELE www.nesc.ac.uk/technical_papers/UKeS-2006-02.
ECG: 250 registros de ECG de telesalud (recopilados con electrodos de metal seco) pdf. Consultado el 4 de enero de 2020.
con QRS anotados y máscaras de artefactos, y código MATLAB para la detección de 215. Desafío BCI NER2015. Desafío BCI @ NER 2015. 2015.
artefactos de UNSW y Disponible en: http://www.nesc.ac.uk/technical_papers/UKeS 2006-02.pdf. Consultado
el 4 de enero de 2020.

13
Machine Translated by Google

32 Computación cognitiva (2021) 13: 1–33

216. Broderick MPea. Los correlatos electrofisiológicos de la disimilitud semántica reflejan la 242. Schaefer CFAKSBJDMHTBKH. Base de datos de interacción de vías de NCI-Nature.
comprensión del habla narrativa natural, v3, Dryad; 2020. Disponible en: http:// 2009. Disponible en: http://haphistology.
www.nesc.ac.uk/technical_ wikifoundry.com/. Consultado el 10 de abril de 2020.
documentos/UKeS-2006-02.pdf. Consultado el 4 de enero de 2020. 243. Kandasamy K, et al. NetPath. 2010. Disponible en: http://
217. para señales fisiológicas complejas RR. fisionet. 1999. Disponible en: http:// haphistology.wikifoundry.com/. Consultado el 10 de abril de 2020.
www.cellimagelibrary.org/. Consultado el 4 de enero de 2020. 244. Stein L, D'Eustachio P, Hermjakob H, Wu G. Reactome. 2010.
218. Aha D. UCI ML repositorio. 1987. Disponible en: http://www. Disponible en: http://haphistology.wikifoundry.com/. Consultado el 10 de abril de 2020.
cellimagelibrary.org/. Consultado el 4 de enero de 2020.
219. Congedo M, et al. ”Brain Invaders”: un prototipo de un videojuego de código abierto 245. Tran VD. miRBoost. 2015. Disponible en: http://haphistology.
basado en P300 que funciona con la plataforma OpenViBE. En: Proc. BCI 2011; 2011. wikifoundry.com/. Consultado el 4 de enero de 2020.
pág. 280–283. 246. USD. Base de datos del genoma de Saccharomyces. 2012. Disponible en: http://
220. PubChem. Fuentes de datos de PubChem. 2020. Disponible en: http:// haphistology.wikifoundry.com/. Consultado el 4 de enero de 2020.
www.cellimagelibrary.org/. Consultado el 4 de enero de 2020. 247. DNAD-J. Banco de datos de ADN de Japón. 1980. Disponible en: http://
221. PubChem. Fuentes de datos de PubChem. 2005. Disponible en: http:// haphistology.wikifoundry.com/. Consultado el 4 de enero de 2020
www.cellimagelibrary.org/. Consultado el 4 de enero de 2020. 248. ENA. Archivo Europeo de Nucleótidos. 1990. Disponible en: http://
222. Biolaboratorio. Laboratorio de Bioinformática. 1999. Disponible en: http:// haphistology.wikifoundry.com/. Consultado el 4 de enero de 2020.
www.cellimagelibrary.org/. Consultado el 4 de enero de 2020. 249. GenBank. GenBank; 2013. Disponible en: https://idr.
223. Pradhan S, et al. Base de datos de enfermedades genéticas indias. 2011. Disponible en: openmicroscopy.org/. Consultado el 4 de enero de 2020.
http://www.cellimagelibrary.org/. Consultado el 4 de enero de 2020. 250. Noordewier MO, Towell GG, Shavlik JW. Conjunto de datos de secuencias de genes de
unión de empalme de UCI Molecular Biology (UCI MB). 1981.
224. Atlas TCG. La página de inicio del Atlas del Genoma del Cáncer [nciHome]. Disponible en: https://idr.openmicroscopy.org/. Consultado el 4 de enero de 2020.
2005. Disponible en: http://www.cellimagelibrary.org/.
Consultado el 4 de enero de 2020. 251. UCI-MB. Conjunto de datos de secuencias de genes promotores de UCI Molecular Biology
225. Red BDT. Proyecto de la Red de Transcripción de Berkeley Drosophila. 2001. Disponible (UCI MB). 1985. Disponible en: https://idr.openmicroscopy.
en: http://www.cellimagelibrary.org/. org/. Consultado el 4 de enero de 2020.
226. CODIFICAR. Enciclopedia de elementos de ADN. 2003. Disponible en: http:// 252. Manaswi NK. Entendiendo y trabajando con Keras. En: Aprendizaje profundo con
www.cellimagelibrary.org/. Consultado el 4 de enero de 2020. aplicaciones usando Python. Saltador; 2018. pág. 31–43.
227. NHLBI GO ESP. Servidor de variantes de exoma. 2011. Disponible en: http://

www.cellimagelibrary.org/. Consultado el 6 de abril de 2020. 253. Kunkel R, et al. TensorSCONE: un marco TensorFlow seguro que utiliza Intel SGX. CoRR.
228. Geo. Ómnibus de Expresión Génica. 2000. Disponible en: http:// 2019. pág. 1–12.
www.eurobioimaging.eu/. Consultado el 4 de abril de 2020. 254. Sun X, Peng X, Ding S. Generación de conversación emocional entre humanos y máquinas
229. Abreu M, et al. gnomAD. 2016. Disponible en: http://www. basada en la memoria a corto plazo. Cómputo Cognitivo. 2018;10(3):389–97.
eurobioimaging.eu/. Consultado el 6 de abril de 2020.
230. del MIT TBI, Harvar. Portal GTEx. 2012. Disponible en: http:// 255. Hao L, Liang S, Ye J, Xu Z. TensorD: una biblioteca de descomposición de tensores en
www.eurobioimaging.eu/. Consultado el 4 de enero de 2020. TensorFlow. Neurocomputación. 2018;318:196–200.
231. Rouillard AD, Gundersen GW, Fernandez NF, Wang Z, Monteiro CD, McDermott MG, et 256. Karpathy A. Un vistazo a las tendencias en el aprendizaje automático. 2017. Disponible
al. El armonizoma: una colección de conjuntos de datos procesados reunidos para en: https://idr.openmicroscopy.org/.
servir y extraer conocimientos sobre genes y proteínas. Base de datos 2016. 257. Bahrampour S, Ramakrishnan N, Schott L, Shah M. Estudio comparativo de marcos de
2016;07:baw100. software de aprendizaje profundo. CoRR. 2016;abs/1511.06435. ArXiv: 1511.06435.
232. INSDC. Colaboración internacional de la base de datos de secuencias de nucleótidos.
2016. Disponible en: http://www.eurobioimaging. 258. Shi S, et al. Evaluación comparativa de herramientas de software de aprendizaje profundo
UE/. Consultado el 4 de enero de 2020. de última generación. CoRR. 2016;abs/1608.07249.
233. TIGS de recursos. Proyecto 1000 Genomas. 2008. Disponible en: http:// 259. Marca profunda. Los puntos de referencia de aprendizaje profundo. 2017. Disponible en:
www.eurobioimaging.eu/. Consultado el 6 de abril de 2020. https://idr.openmicroscopy.org/. Consultado el 17 de diciembre de 2017.
234. JASPAR. JASPAR 2018: Una base de datos de acceso abierto de perfiles de unión de 260. Narang S. El código fuente y los datos experimentales de las herramientas de software
factores de transcripción. 2008. Disponible en: http://www. de aprendizaje profundo de última generación. 2017. Disponible en: https://
eurobioimaging.eu/. Consultado el 4 de enero de 2020. idr.openmicroscopy.org/. Consultado el 17 de diciembre de 2017.
235. Consorcio NREM. Proyecto de Epigenómica de hoja de ruta - Datos. 2007. 261. LeCun Y, Cortés C, Burges CJC. La base de datos MNIST de dígitos escritos a mano.
Disponible en: http://www.eurobioimaging.eu/. Consultado el 6 de abril de 2020. 1998. Disponible en: https://idr.openmicroscopy.
org/. Consultado el 4 de enero de 2020.
236. DSN. Datos científicos de la naturaleza. 2014. Disponible en: http://www. 262. Zaremba W, Sutskever I, Vinyals O. Regularización de redes neuronales recurrentes.
eurobioimaging.eu/. Consultado el 4 de enero de 2020. CoRR. 2014;abs/1409.2329.
237. SysGENSIM. SysGenSIM: conjuntos de datos de referencia. 2013. Disponible en: http:// 263. Sermanet P, Eigen D, Zhang X, Mathieu M, Fergus R, LeCun Y. OverFeat: reconocimiento
www.eurobioimaging.eu/. Consultado el 4 de enero de 2020. integrado, localización y detección mediante redes convolucionales. CoRR. 2013;abs/
238. en Investigación BMSEB, Educación. Banco de datos de proteínas RCSB - RCSB PDB. 1312.6229.
2015. Disponible en: http://www.eurobioimaging. 264. Murphy J. Puntos de referencia de aprendizaje profundo de las GPU NVIDIA Tesla P100
UE/. Consultado el 4 de enero de 2020. PCIe, Tesla K80 y Tesla M40; 201. Disponible en: https://idr.openmicroscopy.org/.
239. Murzin AG, Brenner SE, Hubbard TJP, Chothia C. Clasificación estructural de la base de Consultado el 4 de enero de 2020.
datos de proteínas 2. 2020. Disponible en: http:// 265. Mnih V, Kavukcuoglu K, Silver D, Rusu AA, Veness J, et al.
haphistology.wikifoundry.com/. Consultado el 10 de abril de 2020. Control a nivel humano a través del aprendizaje de refuerzo profundo.
240. Fox NK, Brenner SE, Chandonia JM. Clasifcación estructural de la base de datos de Naturaleza. 2015;518(7540):529–33.
proteínas - ampliada. 2018. Disponible en: http://haphistology. 266. Chollet F. Las limitaciones del aprendizaje profundo. 2017. Disponible en: https://
wikifoundry.com/. Consultado el 10 de abril de 2020. idr.openmicroscopy.org/. Consultado el 12 de diciembre de 2017.
241. Qian N, Sejnowski TJ. Conjunto de datos de estructura secundaria de proteínas de UCI 267. Zenil H., et al. . Un cálculo algorítmico de información para descubrimiento causal

Molecular Biology (UCI MB). 1988. Disponible en: http://haphistology. y sistemas de reprogramación. bioRxiv. 2017; pág. 185637.
wikifoundry.com/. Consultado el 4 de enero de 2020.

13
Machine Translated by Google

Computación cognitiva (2021) 13: 1–33 33

268. Shwartz-Ziv R, Tishby N. Abriendo la caja negra de las redes neuronales profundas a 282. Nahiduzzaman Md, Tasnim M, Newaz NT, Kaiser MS, Mah mud M. Detección temprana
través de la información. CoRR. 2017 Mar;abs/1703.00810. de caídas basada en aprendizaje automático para personas mayores con trastornos
269. Nguyen AM, Yosinski J, Clune J. Las redes neuronales profundas son fáciles de engañar: neurológicos mediante fusión de datos multimodal.
predicciones de alta confianza para imágenes irreconocibles. En: Mahmud M, Vassanelli S, Kaiser MS, Zhong N, editores.
En: Proc. CVPR; 2015. pág. 427–436. Cerebro Informar. Cham: publicación internacional de Springer; 2020. pág. 204–14.
270. Szegedy C, Zaremba W, Sutskever I, Bruna J, Erhan D, Goodfellow IJ, et al. Propiedades
intrigantes de las redes neuronales. En: CoRR. vol. abs/1312.6199; 2013. pág. 1–10. 283. Farah L, Hussain A, Kerrouche A, Ieracitano C, Ahmad J, Mah mud M. Un controlador
difuso altamente eficiente con entradas de alta reducción y funciones de membresía
271. Baker NA, Klemm JD, Harper SL, Gaheen S, Heiskanen M, Rocca-Serra P, et al. para un sistema fotovoltaico conectado a la red. Acceso IEEE. 2020;8:163225–37.
Estandarización de datos. Nanotecnología Nat. 2013;8(2):73.
284. Fabietti M, Mahmud M, Lotf A. Aprendizaje automático en el análisis de señales neuronales
272. Wittig U, Rey M, Weidemann A, Muller W. Gestión de datos y enriquecimiento de datos registradas de forma invasiva: fuentes de datos de acceso abierto disponibles. En:
para proyectos de biología de sistemas. J Biotecnología. 2017;261:229–237. Mahmud M, Vassanelli S, Kaiser MS, Zhong N, editores. Cerebro Informar. Cham:
publicación internacional de Springer; 2020. pág. 151–62.
273. Mahmud M, Rahman MM, Travalin D, Raif P, Hussain A.
Modelo de aplicación web basado en arquitectura orientada a servicios para el análisis 285. Chen L, Yan J, Chen J, Sheng Y, Xu Z, Mahmud M. Una canalización de aprendizaje de
colaborativo de señales biomédicas. Tecnología biomédica (Berl). 2012;57:780–3. temas basada en eventos para la extracción de literatura de neuroimagen.
23 de octubre de 2020 [citado el 22 de noviembre de 2020]; Disponible en: https://www.
274. Mahmud M, Pulizzi R, Vasilaki E, Giugliano M. Un marco basado en la web para el researchsquare.com/article/rs-95392/v1
procesamiento paralelo semi-en línea de señales neuronales extracelulares registradas 286. Nahian MJA, Ghosh T, Uddin MN, Islam MdM, Mahmud M, Kaiser MS. Hacia un marco de
por matrices de microelectrodos. En: Proc. seguimiento de caídas consciente de las emociones impulsado por la inteligencia
REUNIÓN MUNICIPAL; 2014. pág. 202–203. artificial adecuado para personas mayores con trastornos neurológicos. En: Mahmud
275. Angelov P, Sperduti A. Desafíos en el aprendizaje profundo. En: Proc. M, Vassanelli S, Kaiser MS, Zhong N, editores. Cerebro Informar. Cham: Springer
ESANN; 2016. pág. 489–495. International Publishing; 2020. pág. 275–86.
276. Arulkumaran K, Deisenroth MP, Brundage M, Bharath AA. Aprendizaje de refuerzo
profundo: una breve encuesta. Proceso de señal IEEE Mag. 2017;34(6):26–38. 287. Al Banna MdH, Ghosh T, Taher KA, Kaiser MS, Mahmud M. Un sistema de monitoreo para
pacientes con trastorno del espectro autista utilizando inteligencia artificial. En: Mahmud
277. Noor MB, Zenia NZ, Kaiser MS, Al Mamun S, Mahmud M. M, Vassanelli S, Kaiser MS, Zhong N, editores. Cerebro Informar. Cham: publicación
Aplicación del aprendizaje profundo en la detección de trastornos neurológicos a partir internacional de Springer; 2020. pág. 251–62.
de imágenes de resonancia magnética: una encuesta sobre la detección de la
enfermedad de Alzheimer, la enfermedad de Parkinson y la esquizofrenia. 288. Adiba FI, Islam T, Kaiser MS, Mahmud M, Rahman MA. Efecto de los corpus en la
Cerebro Informar. 2020;7(1):1-21. clasifcación de noticias falsas utilizando el clasifcador naive Bayes. Revista Internacional
278. Al Banna MH, Taher KA, Kaiser MS, Mahmud M, Rahman MS, Hosen AS, Cho GH. de Automatización, Inteligencia Artificial y Aprendizaje Automático. 2020;1(1):80–92.
Aplicación de la inteligencia artifcial en la predicción de terremotos: estado del arte y
retos futuros. Acceso IEEE. 2020;8:192880–192923. 289. Sumi AI, Zohora MostF, Mahjabeen M, Faria TJ, Mahmud M, Kaiser MS. fASSERT: un
sistema de asistencia difuso para niños con autismo que utiliza Internet de las cosas.
279. Jesmin S, Kaiser MS, Mahmud M. Artifcial e Internet de cosas de atención médica basadas En: Wang S, Yamamoto V, Su J, Yang Y, Jones E, Iasemidis L, et al., editores. Cerebro
en la atención de Alzheimer durante COVID 19. En: Mahmud M, Vassanelli S, Kaiser Informar. Cham: publicación internacional de Springer; 2018. pág. 403–12.
MS, Zhong N, editores. Cerebro Informar. Cham: publicación internacional de Springer;
2020. pág. 263–274. 290. Mahmud M, Kaiser MS, Rahman MM, Rahman MA, Shabut A, Al-Mamun S, et al. Un
modelo de gestión de confianza inspirado en el cerebro para garantizar la seguridad en
280. Ruiz J, Mahmud M, Modasshir M, Shamim Kaiser M, iniciativa de neuroimagen de la un marco de IoT basado en la nube para aplicaciones de neurociencia. Cómputo
enfermedad de Alzheimer para el conjunto 3D DenseNet en la clasificación de 4 vías Cognitivo. 1 de octubre de 2018; 10 (5): 864–73.
de la enfermedad de Alzheimer. En: Mahmud M, Vassanelli S, Kaiser MS, Zhong N, 291. Kaiser MS, Chowdhury ZI, Mamun SA, Hussain A, Mahmud M. Un sistema de control
editores. Cerebro Informar. Cham: publicación internacional de Springer; 2020. pág. 85– neurodifuso basado en la extracción de características de la señal del electromiograma
96. de superficie para sillas de ruedas con energía solar.
Cómputo Cognitivo. 1 de octubre de 2016; 8(5):946–54.
281. Rahman S, Sharma T, Mahmud M. Mejora del diagnóstico de alcoholismo: comparación
de clasificadores basados en instancias con redes neuronales para clasificar la señal
de EEG. En: Mahmud M, Vassanelli S, Kaiser MS, Zhong N, editores. Cerebro Informar.
Cham: publicación internacional de Springer; 2020. pág. 239–50.

13

También podría gustarte