Está en la página 1de 13

Machine Translated by Google

Revista de biotecnología 261 (2017) 194–206

Listas de contenidos disponibles en ScienceDirect

Revista de Biotecnología

página de inicio de la revista: www.elsevier.com/locate/jbiotec

Revisar

El sistema de información de enzimas BRENDA: de una base de datos a un sistema MARCOS


experto
I. Schomburg, L. Jeske, M. Ulbrich, S. Placzek, A. Chang, D. Schomburgÿ
Technische Universität Braunschweig, Centro Integrado de Biología de Sistemas de Braunschweig (BRICS), Rebenring 56, 38106 Braunschweig, Alemania

INFORMACIÓN DEL ARTÍCULO RESUMEN

Palabras clave: Las enzimas, que representan el grupo de proteínas más grande y, con mucho, el más complejo, desempeñan un papel
Base de datos de enzimas esencial en todos los procesos de la vida, incluido el metabolismo, la expresión génica, la división celular, el sistema inmunitario
Vías metabólicas y otros. Su función, también relacionada con la mayoría de enfermedades o el control del estrés, las convierte en objetivos
Reacciones catalizadas por enzimas
interesantes para la investigación y aplicaciones en biotecnología, tratamientos médicos o diagnóstico. Sus parámetros
La cinética de enzimas
funcionales y otras propiedades se recopilan, integran y ponen a disposición de la comunidad científica en la base de datos de
Enzimas y enfermedades
ENzimas de BRaunschweig (BRENDA). En los últimos 30 años, BRENDA se ha convertido en una de las bases de datos
Interacción enzima-ligando
biológicas más utilizadas en todo el mundo. Se describen y discuten los contenidos de los datos, el proceso de adquisición de
datos, la integración y el control de datos, las formas de acceder a los datos y las visualizaciones proporcionadas por el sitio web.

1. Introducción 1.2. Historia

1.1. Relevancia de las enzimas La recopilación de datos relacionados con enzimas de la literatura científica
comenzó en 1987 en el Centro Nacional Alemán de Investigación para
Las enzimas son esenciales para casi todos los procesos de la vida y vitales para Biotecnología en Braunschweig (GBF). De 1996 a 2007 continuó en la Universidad de
la biotecnología industrial o el diagnóstico médico. 30 a 40% de todos los genes Colonia y volvió a Braunschweig al departamento de Bioinformática y Biología de
codifican enzimas. Aceleran las reacciones químicas hasta en 16 órdenes de magnitud, Sistemas de la Technische Universität Braunschweig. Ahora se encuentra en el Centro
permiten rutas metabólicas coordinadas con precisión dentro de las células y son de Biología de Sistemas Braunschweig (BRICS) en http://www.brenda-enzymes.org.
indispensables cuando se trata de la defensa contra patógenos y otros procesos.
Muchos de ellos son muy específicos, mientras que otros lo son menos. Las funciones Los datos iniciales consistieron en una compilación de datos estructurados en
de las enzimas dependen de muchas características, como su secuencia, estructura formato textual y numérico, con un conjunto de datos para cada clase de enzima. Estos
tridimensional, estabilidad y sus interacciones con otras moléculas (Schomburg y se publicaron a partir de 1990 en una serie de 19 libros que cubren aproximadamente
Schomburg, 2016). 3000 clases de enzimas (Schomburg et al., 1990–1998). Entre 2001 y 2009 se publicó
una segunda edición que consta de 49 volúmenes que cubren aproximadamente 4900
A finales de los años 80 se hizo evidente que la estructura molecular o celular clases de enzimas (Schomburg y Schomburg, 2001–2006).
La función de las enzimas o su papel en los procesos patológicos depende de un gran Simultáneamente con los libros, se creó una presentación en Internet del sistema
número de propiedades diferentes, incluidas, por ejemplo, su especificidad de sustrato, de base de datos a partir de un primer sistema de consulta basado en texto en 1999
su estabilidad, su ubicación y muchas otras, y estas propiedades varían entre los (Schomburg et al., 2000; Schomburg et al., 2002). Desde entonces, se desarrolló hasta
diferentes organismos, aunque la reacción bioquímica general catalizada es la misma. convertirse en un sistema de información de enzimas completo y elaborado que abarca
lo mismo en la primera vista. más de 370 000 enzimas de 6300 clases de enzimas. Incluye una gran cantidad de
Estos datos, diferentes, por ejemplo, de la información de secuencias y estructuras información relacionada con las enzimas al combinar los datos funcionales anotados
3D, no están disponibles directamente, sino que están ocultos en millones de manualmente con secuencias genómicas, estructuras de enzimas y datos
publicaciones y deben extraerse y convertirse a una forma estructural. computarizados. Los datos adicionales recuperados por los algoritmos de minería de
Esto solo se puede manejar en un sistema de base de datos flexible y se puede texto tienen como objetivo proporcionar un conjunto completo de literatura para enzimas
acceder a través de un sitio web. clasificadas. Los valores calculados y la información sobre las reacciones catalizadas
y los compuestos que modulan las actividades enzimáticas, incluidas sus estructuras
moleculares, se suman al completo

ÿ Autor de correspondencia.
Dirección de correo electrónico: D.Schomburg@tu-braunschweig.de (D. Schomburg).

http://dx.doi.org/10.1016/j.jbiotec.2017.04.020
Recibido el 16 de febrero de 2017; Recibido en forma revisada el 11 de abril de 2017; Aceptado el 18
de abril de 2017 Disponible en línea el 21 de abril de 2017 0168-1656/ © 2017 Los autores. Publicado
por Elsevier BV Este es un artículo de acceso abierto bajo la licencia CC BY-NC-ND (http://creativecommons.org/licenses/BY-NC-ND/4.0/).
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

plataforma BRENDA de estos días (Chang et al., 2009; Chang et al., 2015; 1.3.1. Conversión de datos no estructurados ocultos en datos estructurados: datos manuales
Placzek et al., 2017). Desde 2015 BRENDA es miembro de la Asociación Alemana importación y extensión
La creación del núcleo de información BRENDA consta de los siguientes pasos:
Red de Infraestructura de Bioinformática (https://www.denbi.de/)
(ver Sección 5.3.).

1 Selección de artículos relevantes de PubMed (NCBI Resource


1.3. Importación e integración de datos
Coordinadores, 2015) y Scopus (Burnham, 2006)
2 Extracción de elementos de información de los artículos seleccionados
Las enzimas están clasificadas por el grupo de trabajo sobre enzimas de la IUBMB
3 Control de calidad de los elementos de información extraídos
(Unión Internacional de Bioquímica y Biología Molecular), según las reacciones catalizadas
4 Integración en la base de datos interna de BRENDA
(McDonald et al., 2009; McDonald
5 Adición de información estructural para nuevos ligandos enzimáticos
y Tipton, 2014). Una consecuencia de este concepto es que un cierto nombre
6 Integración de datos de datos externos de sitios web
no designa una sola proteína enzimática sino un grupo de proteínas con el
7 Cálculo previo de, por ejemplo, anotaciones genómicas, predicciones de ubicación,
misma propiedad catalítica. Cada clase de enzima individual, denominada por un
estadísticas, etc
El identificador de cuatro dígitos, el número EC, puede completarse con uno o
8 Integración en una base de datos principal
miles de enzimas diferentes de un gran número de organismos diferentes, cuya característica
9 Lanzamiento semestral a los usuarios
común es que todas son capaces de catalizar
la reacción especificada.
Independientemente de la actualización de la base de datos, la interfaz, consulta en
Los datos de BRENDA se extraen manualmente de la literatura primaria o se obtienen
gine y otros programas de software se optimizan continuamente.
de la integración de datos de otras fuentes o se adquieren
por minería de texto (y divulgada como tal). Cada entrada individual está conectada a un
1.3.1.1. Información sobre enzimas. La selección de artículos relevantes de
referencia, que cubre la literatura entre 1939 y 2016. También está conectado a un
PubMed y Scopus es un paso muy importante. 2,6 millones de documentos son
organismo y, cuando esté disponible, a una cepa y una secuencia
en PubMed bajo MeSH (Medical Subject Headings,
identificador de la enzima-proteína. Los datos anotados manualmente cubren ÿ60
Rogers, 1963) término "enzimas", más de 100.000 de las cuales
categorías agrupadas en 'Nomenclatura', 'Interacciones enzima-ligando',
apareció en 2015. Esto significa que solo una pequeña fracción de todos
'Parámetros funcionales', 'Información relacionada con el organismo', 'Enzima
Los papeles pueden ser aprovechados. El objetivo del proceso de selección es
Estructura', 'Propiedades moleculares', 'Bibliografía/Enlaces/Enfermedad'. Cada CE
identificar aquellos trabajos que dan una amplia visión general sobre la enzima en
la clase se actualiza periódicamente, los datos de las nuevas referencias seleccionadas se
pregunta. Dependiendo del estado del conocimiento para una determinada enzima
anotan y se incluyen (consulte la Tabla 1).
entre 1 y 700 artículos están incluidos en la base de conocimientos. los
La búsqueda bibliográfica se basa en una búsqueda combinada en PubMed y
tabla 1
Número de entradas en los campos de información de BRENDA seleccionados. Los números se refieren a básicos.
Scopus usando términos relacionados con las categorías de datos en BRENDA, es decir

información sobre los valores dados para una enzima específica en un organismo dado. nombres de enzimas, función de enzimas, reacciones (sustratos/productos),
y ocurrencia (organismo, tejidos, etc.).
Visión general
El primer paso en este proceso es la identificación de los diferentes
Clases EC 7,100
nombres usados para cada enzima. Aunque la IUBMB publica un
Proteínas 84,000
104,000
“nombre aceptado” para cada clase de enzima actualmente se enumeran ~79 000 sinónimos
Nombres de enzimas
ligandos 211,000 para las 6300 clases de EC. Estos anotados manualmente
Referencias 133,000 los sinónimos son esenciales para la identificación de la literatura relevante y también para
Solicitud 13,000
el proceso de extracción de texto (vide infra). Algunas enzimas
Ingeniería 80.000
se citan más a menudo con un sinónimo que con el "aceptado
Información relacionada con el organismo nombre". Un ejemplo destacado es la ribulosa bisfosfato carboxilasa.
Organismo 11,000
(EC 4.1.1.39) que comúnmente se conoce como RuBisCo.
Tejido de origen 97,000
Localización 33,000
Después de los pasos de selección y análisis manual, la literatura relevante
está anotado por científicos altamente calificados.
Reacción y especificidad
Sustratos/Productos
La versión actual de BRENDA (2017.1) cubre 6300 clases de enzimas activas (números
930,000
Cofactores 26,000 EC). BRENDA también contiene “preliminares
inhibidores 220,000 Números CE proporcionados por BRENDA”. Estos números están designados
Compuestos Activadores 28,000
con una “B” en la cuarta posición del número EC. Estas son enzimas que se encuentran
Metales e Iones 38,000
mediante anotaciones manuales en la literatura y difieren sustancialmente en la especificidad
Parámetros funcionales
de sustrato y la reacción de todas las enzimas actuales.
Valores de kilómetros 137,000
enzimas clasificadas. A veces son enzimas que cierran un hueco en un
Números de facturación 64.000
Valores Kcat/KM 21,000
vía metabólica o enzimas de una vía recién detectada en un
Actividad específica 48,000 organismo específico. Estas enzimas deben clasificarse dentro de la
Valores IC50 51,000 sistema jerárquico CE y están a la espera de la decisión final de la
Valores Ki 38,000
Comisión de Enzimas de la IUBMB.
Valores Pi 5,000
pH óptimos y rangos 53,000
Óptimos y rangos de temperatura 32,000 1.3.1.2. Datos de ligandos enzimáticos. Información sobre compuestos que interactúan
con enzimas como sustratos y productos, cofactores, inhibidores
Estructura de la enzima
Modificaciones postraduccionales 6,000 y las sustancias activadoras constituyen una parte importante de BRENDA (Scheer
Estructura cuaternaria 35,000 et al., 2011). Estas pueden ser "moléculas pequeñas" o macromoléculas como

Aislamiento y preparación
como proteínas, polinucleótidos y polisacáridos. en la bioquimica
Valores de estabilidad (pH, temperatura, oxidación, almacenamiento, orgánico 49,000 literatura, sin embargo, el uso de nombres compuestos es muy inconsistente.
Solvente) La nomenclatura sistemática de la IUPAC rara vez se usa, en lugar trivial
Purificación 33,000
nombres, abreviaturas y acrónimos se encuentran con mayor frecuencia (IUPAC,
Clonado 33,000
renaturalizado
2017). Actualmente BRENDA almacena 211.000 nombres de ligandos. Los 124.000
1,000
diferentes ligandos de moléculas pequeñas se encuentran en 170.000 diferentes

195
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

nombres en la literatura. Entre ellos se encuentran compuestos a los que se hace referencia organismos o enzimas a lo largo del árbol jerárquico taxonómico. Los resultados conducen a
en la literatura bajo hasta 70 nombres diferentes. 20.500 compuestos los datos de enzimas específicas y a las páginas de resumen de enzimas.
Poseer al menos dos nombres. El árbol se basa en la base de datos de taxonomía del NCBI (Federhen, 2012)
Muy a menudo, los nombres y siglas triviales no son únicos e incluso son que es el principal recurso para los organismos en BRENDA y complementado
utilizado para diferentes compuestos. Un mapeo exacto de ligandos sinónimos con denominaciones de cepas microbianas. Actualmente BRENDA contiene
sólo es posible a través de una comparación de sus estructuras químicas. Este 11.420 organismos diferentes. Los organismos y, cuando estén disponibles, las cepas
significa que para todos los ligandos se debe incluir la estructura química, en están vinculados a las páginas respectivas del NCBI y a la Diversidad bacteriana
la mayoría de los casos dibujados a mano y almacenados como "Molfiles", códigos InChI (Heller Metadatabase BacDive (Söhngen et al., 2016). Una pequeña cantidad de organismos, que
et al., 2015), y cifras. no están almacenados en el NCBI, son verificados por otras bases de datos o por la literatura
original.
1.3.1.3. Control de calidad. Los datos extraídos manualmente de cada artículo SCOPe (Fox et al., 2014) y CATH (Sillitoe et al., 2015) son dos
se canalizan a través de un flujo de trabajo de control elaborado que comienza con esquemas de clasificación jerárquica para estructuras 3D de proteínas. Están
Cientos de controles informáticos diferentes que controlan la formalidad implementado en BRENDA para permitir la identificación de la clase plegable
exactitud y la consistencia interna de los datos. Esto es seguido por de una enzima o la identificación de enzimas con un plegamiento similar en
controles manuales por dos científicos internos. Este proceso garantiza una niveles diferentes. Por ejemplo, el dominio similar al de Rossmann que se une a NAD(P) está
alta calidad de los datos antes de que sean procesados para el final asociado con 186 números EC diferentes.
Lanzamiento de la base de datos BRENDA. La rama de enfermedad de la ontología MeSH también es parte de la ontología
sección. Constituye la base para el acceso jerárquico a la parte de
2. Importación y compilación de la base de datos BRENDA BRENDA que cubre las relaciones enzima/enfermedad en DRENDA, el
Base de datos de enzimas relacionadas con enfermedades (Söhngen et al., 2011; Schomburg
Las bases de datos del sitio web de BRENDA constan de numerosas tablas et al., 2013).
que representan los datos anotados manualmente, así como los datos generados En la Tabla 2 se resume la cantidad de datos de todas las fuentes externas.

automáticamente o externos. La base de datos principal SQL completa que se origina en


el núcleo manual, la integración de datos y los procesos de minería de datos, y los datos 2.1.6. La ontología de tejidos BRENDA (BTO)
calculados están optimizados para un rendimiento de consulta rápido y actualmente Con el creciente conocimiento sobre la aparición de enzimas
consta de 550 mesas.
en tejidos y órganos se reconoció que muchas isoenzimas muestran
propiedades específicas de tejido. Para acceder, por ejemplo, a todas las enzimas que se producen en
2.1. Integración de datos y minería de datos hígado o en raíces de plantas el desarrollo de un organismo independiente
ontología para tejidos, órganos, estructuras anatómicas, partes de plantas, células
2.1.1. Información de secuencia tipos, líneas celulares y cultivos celulares demostraron ser esenciales. Basado en el
La información sobre las secuencias se recupera de UniProt (The UniProt reglas y formatos del Gene Ontology Consortium (The Gene
consorcio, 2017): Los datos se utilizan para complementar la formación BRENDA, para Ontology Consortium, 2015) ~6000 términos (enero de 2017) están organizados como un
calcular información adicional (por ejemplo, transmembrana gráfico acíclico dirigido. La mayoría de los términos se complementan con información sobre
hélices), y para calcular los patrones de secuencia de la enzima BrEPS (Bannert sinónimos, sobre su origen y definiciones. El BTO permite al usuario distinguir y asignar
et al., 2010). enzimas
debido a su ocurrencia y proporciona una plataforma fácil de usar para
2.1.2. Información de estructura 3D de enzimas realizar búsquedas simples o avanzadas (ver Fig. 1). Todas las entradas dentro
Las coordenadas de todas las estructuras 3D de enzimas conocidas se importan la ontología está directamente conectada a la enzima comprensiva
del Protein Data Bank (Berman et al., 2000) y analizado. En la formación de sitios activos o datos en BRENDA (Gremse et al., 2011).
de unión, sitios de glicosilación, disulfuro No solo para BRENDA, sino también en el campo de la proteómica, el BTO es
los puentes, etc. se extraen y se presentan a los usuarios en un 3D interactivo una de las ontologías importantes y recomendadas. es mientras tanto
visualización de gráficos moleculares. ampliamente utilizado en la comunidad de ciencias de la vida para evaluar muestras de tejido
(Harhay et al., 2010) o para mapear anotaciones de genes específicos de tejido al
2.1.3. Información de la ruta BTO (Greene et al., 2015; Santos et al., 2015). El vocabulario controlado de la BTO se utiliza
Las rutas metabólicas de BRENDA se amplían con las rutas de KEGG a menudo como un depósito/fuente para anotar, para
(Kanehisa et al., 2016) y MetaCyc (Caspi et al., 2014) con el fin de interpretar, o comparar sus datos correspondientes (Wittig et al., 2014).
proporcionar la posibilidad de comparar el contexto metabólico de una enzima en todos La plataforma URSA (Unveiling RNA Sample Annotation) incorpora
tres bases de datos en las páginas de resumen de enzimas (ver capítulo 3.2.1). el BTO para predecir señales de tejido/tipo celular en una muestra de expresión génica
(Lee et al., 2013). El Consorcio ProteomeXchange recomienda
2.1.4. genomas
utilizar el BTO como referencia durante el procedimiento de presentación
Los genomas del EMBL-EBI (Li et al., 2015) construyen la base para (Tutorial de envío de ProteomeXchange).
el explorador del genoma. Los genomas extraídos, las accesiones UniProt y
posiciones se complementan con nombres de proteínas y números EC derivados
2.1.7. Otras ontologías
de UniProt, de los números de EC predichos haciendo una búsqueda BLAST
En 2015 se vinculó el atlas de anatomía humana CAVEman al BTO
(Altschul et al., 1990) en UniRef (Suzek et al., 2015), y vías metabólicas KEGG. Para cada
gen, el vecindario que consta de tres Tabla 2
se calculan los genes de cada lado. Resumen de fuentes de datos externas integradas en BRENDA.

Fuente de datos Tipo de datos Monto


2.1.5. Datos convertidos para la navegación jerárquica
Algunos de los datos importados se convierten de un formulario tabular a un IUBMB Enzimas 6,896
representación en forma de árbol para un análisis jerárquico y adhesión de los NCBI Organismos 1,537,142
datos. Esto incluye: UniProt Secuencias 65.930.418
EBI del EMBL genomas 24,638
El EC Explorer (consulte el capítulo 3.1.1.3), una vista en forma de árbol de todas las
UniRef Adhesiones 54.163.854
clases de enzimas aprobadas actualmente, se crea en base a los datos proporcionados por
AP estructuras 3D 63,464
la IUBMB.
KEGG/Metaciclo caminos 7.600/6.812
El árbol de taxonomía permite al usuario buscar y examinar

196
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

Fig. 1. Vista sobre el término vaso sanguíneo en la ontología de tejidos BRENDA y las clases de EC conectadas.

conectar las enzimas humanas de BRENDA a la ontología detallada para Tabla 3


estructuras corporales, órganos y tejidos basados en la nomenclatura de Datos recuperados por minería de texto.

'Terminología anatómica' (FCAT, 1998). Los términos proporcionan enlaces directos


BRENDA AMENDA FRENDA UniProt
a los datos de enzimas funcionales, sus propiedades, especificidad y condiciones médicas manual
relevancia para dar una idea de los problemas biomédicos y la información relacionada con
la enfermedad en el cuerpo humano. Referencias 137.000 1.700.000 2.500.000
Organismo 83.000 400.000 700.000 Swiss-Prot
Además, se integran otras ontologías más especializadas y se conectan a las enzimas
Información 185.000
BRENDA apropiadas. Esto incluye ontologías como humana, ratón, Drosophila, anatomías TREMBL 4.3
fúngicas, millón
estructuras vegetales y la ontología génica. Información del tejido 91.000 320.000
subcelular 33.000 80.000
Localización
2.2. Extracción de textos

La anotación manual de datos de la literatura primaria está limitada a unos 10 000 apariciones de estos términos en los títulos y resúmenes procesados. los
artículos por año y (debido a limitaciones presupuestarias) no puede cubrir la literatura Los siguientes pasos difieren dependiendo del propósito específico.
completa. La base de datos BRENDA,
sin embargo, trata de dar una visión general completa de la literatura para cada clase de
2.2.1. Ocurrencia de enzimas en organismos/tejidos/localizaciones subcelulares
enzima proporcionando información básica como la aparición en
La base de datos FRENDA (Referencia completa de ENzyme DAta) se basa en
diferentes organismos. Esta información se recupera mediante minería de texto de
resúmenes de literatura de PubMed. Debido a las condiciones de la licencia de todas las co-ocurrencias de nombres de enzimas y organismos en los títulos y
resúmenes e incluye todas las combinaciones (Barthelmes et al., 2007).
los editores este proceso se limita actualmente a un análisis de
Títulos y resúmenes de PubMed y, por lo tanto, restringidos a la información. En un paso posterior, esto se procesa aún más para predecir la combinación importante
de enzima/organismo para cada artículo y para extender
se espera que se mencione en el mismo. Se basa en diccionarios extendidos y algoritmos
esto mediante el análisis de información de localización de órganos/tejidos y subcelulares
complejos. La fragmentación, el análisis y la
(Datos AMENDA). El post-procesamiento incluye validaciones automáticas
el control de calidad requiere semanas de tiempo de computadora en un clúster de alto
rendimiento. basado en la ontología de tejido BRENDA y exclusión creada manualmente
listas para AMENDA.
Los - actualmente - 26 millones de títulos y 16 millones de resúmenes de
Este análisis muestra que dentro del núcleo BRENDA manual alrededor del 6%
PubMed se dividen en palabras y oraciones. Los diccionarios para el texto.
de los papeles que mencionan enzimas son procesados, y por lo tanto entre
minería que comprende alrededor de 9.000 tejidos fuente, 80.000 nombres de enzimas,
Se incluye el 25% y el 40% de la información relevante.
2,2 millones de sinónimos de organismos, 170.000 términos de enfermedades, 130 millones
nombres de sustancias y 4.000 expresiones cinéticas son automáticamente
compilado En una evaluación manual, los términos ambiguos o falsos son 2.2.2. Datos cinéticos
eliminado En un proceso muy complejo, los datos cinéticos se extraen de los títulos
La primera parte de la minería de texto posterior (Tabla 3) identifica co y resúmenes. Esto incluye un análisis específico de posición de valores numéricos

197
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

valores relacionados con términos utilizados para la cinética enzimática, información sobre Escherichia coli (UniProt) y generalmente se asume para los organismos procarióticos.
enzimas, organismo y nombres de compuestos químicos. Desafortunadamente, la información
cinética rara vez se da en forma resumida, por lo que el número de valores obtenidos de esta
manera es limitado. Se identificaron 11.000 artículos con datos cinéticos y se extrajeron 13.000 2.4. La base de datos definitiva
valores cinéticos. Esto se suma a los 410.000 datos cinéticos obtenidos por el procesamiento
manual de pa completa En el último paso, se combina la información de las fuentes descritas. Las combinaciones
persona específicas de parámetros solicitadas con frecuencia se compilan previamente. Los molfiles de
ligandos se convierten en cifras para la visualización de ligandos y reacciones (consulte el capítulo
2.2.3. Datos de la enfermedad 3.2.6) y las huellas dactilares se calculan para la búsqueda de subestructuras (consulte el capítulo
Dado que la función o disfunción/deficiencia enzimática a menudo está relacionada con 3.1.1.2).
enfermedades o se utiliza para el diagnóstico, la inclusión de información sobre la enfermedad es
esencial. Los artículos en esta área no son adecuados para la extracción de información 3. La presentadora BRENDA
estructurada como se describe anteriormente. Para ello se desarrolló un proceso de minería de
textos que identifica trabajos que abordan el papel de las enzimas con respecto a las enfermedades Debido a un sistema complejo de varios servidores, balanceadores de carga y un sistema de
desde diferentes puntos de vista. Un primer paso basado en la co-ocurrencia para la identificación control de versiones, el host de BRENDA www.brenda-enzymes.org experimentó un tiempo de
de artículos relevantes y enfermedades relacionadas con enzimas es seguido por un paso de inactividad de 0 minutos en 2015 y 2016 e incluso se puede acceder a él durante las
clasificación basado en una técnica utilizada en el aprendizaje supervisado y la extracción de actualizaciones. Los motores de consulta y las páginas web se actualizan constantemente para
datos, así como en la clasificación, la llamada "máquina de vectores de soporte". . optimizar el acceso de los usuarios, que a menudo se basa en los comentarios de los usuarios.
La base de datos completa se convierte de la forma normal interna a una forma optimizada para
De esta forma se identifican 770.000 artículos para cubrir las relaciones enzima/enfermedad. tiempos de reacción cortos.
Se clasifican para brindar información sobre la interacción causal entre la enzima y la enfermedad Recientemente, se han realizado revisiones importantes de las páginas web de BRENDA: se
(450 000, 350 000 con el puntaje de confianza más alto), artículos que describen el tratamiento ha implementado una interfaz nueva y moderna para la página de entrada. Las páginas de
basado en enzimas (330 000) o el diagnóstico (380 000) y otros temas. Los usuarios pueden resumen de enzimas y ligandos se han revisado por completo, incluidas nuevas funciones de
elegir varias puntuaciones basadas en la precisión o la preferencia de recuperación. impresión y opciones para filtrar el contenido, ordenar todas las tablas u ocultar campos de datos.
Además, las aplicaciones Java del lado del cliente para la búsqueda de subestructuras (capítulo
Se encontraron 2000 clases de enzimas en artículos que describen interacciones causales, 3.1.1.2) y la visualización de estructuras 3D (capítulo 3.2.8) han sido sustituidas por aplicaciones
siendo las proteínas quinasas, monooxigenasas y ubiquitina transferasas las mencionadas con JavaScript.
mayor frecuencia. Se mencionan 3.600 términos de enfermedades en relación con las enzimas, y
las neoplasias/carcinomas e infecciones se mencionan con mayor frecuencia.
3.1. Acceso a datos: motor de consultas

2.3. Predicción de datos basada en el cálculo Los datos en BRENDA son, a diferencia de, por ejemplo, los datos contenidos en PubMed o
UniProt, almacenados en diferentes formatos. Son de tipo alfabético, numérico, estructural como
2.3.1. Asociación transmembrana o de membrana de enzimas estructuras químicas, reacciones, vías, ontologías y las estructuras de árbol mencionadas.
Para la predicción de la asociación transmembrana o de membrana de enzimas se usa
TMHMM (Krogh et al., 2001). El usuario no solo obtiene predicciones sobre las secuencias A menudo, los usuarios solicitan combinaciones de información como "enzimas que se producen
asociadas a la membrana de enzimas individuales, sino que también puede solicitar todas las en un determinado organismo y muestran una determinada especificidad de sustrato". De hecho,
clases de enzimas caracterizadas por un cierto número de hélices transmembrana. Para las la mayoría de los usuarios solo quieren tener una visión general rápida de la información completa
20.526.372 proteínas transmembrana predichas, se determina la ubicación del extremo N-terminal sobre una determinada clase de enzima, otros, sin embargo, están tratando de identificar una
y los puntos inicial y final. enzima para una determinada aplicación que requiere una combinación específica de propiedades
como una especificidad de pH o temperatura. y puede tener una amplia especificidad de sustrato.

2.3.2. Anotación del genoma, predicción de la función de los productos génicos ÿ EnzymeDetector El motor de consultas y las páginas web de BRENDA están diseñados para cubrir las
El rápido aumento del número de genomas secuenciados proporciona una valiosa fuente de necesidades de muchos tipos diferentes de usuarios con la menor cantidad de "clics" posible.
información sobre la aparición de enzimas en los organismos, siempre que se disponga de
una predicción fiable basada en la secuencia de la función de la enzima. Dado que un análisis 3.1.1. Página de
(Quester y Schomburg, 2011) mostró que los anfitriones de anotaciones genómicas estándar entrada La página de entrada se divide en tres partes. El encabezado presenta opciones
brindan diferentes predicciones de función para más de dos tercios de todas las enzimas, una para navegar rápidamente a diferentes herramientas de búsqueda ("ir a"), para volver a la página
vista agregada de los anfitriones de predicción más populares (NCBI, KEGG, UniProt, PATRIC de entrada ("INICIO") o para cambiar a una página que da acceso a todos los diferentes campos
(Gillespie et al., 2011)), Pfam-HMMs (Finn et al., 2016; Finn et al., 2015) se integró en el servicio de búsqueda ("Vista clásica"). Además, el encabezado da acceso a una página de inicio de
BRENDA y se combinó con los datos anotados manualmente en BRENDA, una búsqueda BLAST sesión, un formulario para abrir un ticket, un historial de búsqueda o una descripción general de
reciente, la minería de texto datos de AMENDA, y una predicción de la función enzimática basada todas las enzimas.
en patrones propios o togonales. Actualmente , En zymeDetector proporciona una colección En la parte principal de la página, el usuario puede simplemente ingresar un término de
completa de predicciones de la función enzimática de todo el genoma para más de 5000 genomas búsqueda en forma de búsqueda de Google y elegir el campo de búsqueda deseado (ver Fig. 2).
bacterianos y 200 arqueas, incluidos sus plásmidos (en http://edbs.tu-bs.de y vinculado en Para el campo de búsqueda predeterminado "Enzima o Ligando" se implementa una búsqueda
BRENDA). de vida que ofrece resultados instantáneos durante la entrada del término de búsqueda.

Además, seis mosaicos representan las seis estrategias de búsqueda diferentes más
elaboradas:

La combinación y agregación de predicciones de funciones génicas de diferentes fuentes y 3.1.1.1. Consultas basadas en texto. Las consultas basadas en texto brindan acceso a campos
obtenidas por diferentes métodos permite asignar una puntuación de confianza a cada predicción, alfanuméricos. Cubren la búsqueda de texto completo, la búsqueda avanzada y la posibilidad de
dependiendo del acuerdo de las diferentes fuentes. Luego, el usuario puede modificar los puntajes explorar las relaciones enzimas/enfermedad. La búsqueda avanzada permite al usuario combinar
predeterminados y decidir el puntaje de corte, que podría ser la suposición de que el 30 por ciento diferentes criterios de búsqueda.

de las proteínas son enzimas, un número probado para La búsqueda de texto completo incluye los comentarios e identifica el término de búsqueda

deseado en casi todas las partes de la base de datos. Como ejemplo

198
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

Fig. 2. La página de entrada de BRENDA que da acceso a varias opciones de búsqueda.

el término “aguas residuales” se encuentra en los campos aplicación, clonados, base de datos (CATH) y encabezados de temas médicos (MeSH). Todas las ontologías
inhibidores, títulos de referencia, tejidos fuente, actividad específica y sustratos (en la están conectadas a las enzimas BRENDA y las localizaciones donde sea posible.
mayoría de los casos en los comentarios).

3.1.1.2. Consultas basadas en estructuras. Como se mencionó, los compuestos 3.1.1.4. Visualización. Se han compilado varias visualizaciones como mapas de palabras,
bioquímicos se mencionan en la literatura a menudo con un gran número de términos mapas de rutas, explorador de genomas, reacciones catalizadas y estructuras de
muy diferentes, lo que hace que la búsqueda alfanumérica de nombres de compuestos proteínas en 3D que permiten un acceso rápido a los datos (comparar 3.2).
sea muy ineficiente. A menudo se busca información para una clase de compuestos que
comparten una determinada subestructura. La estrategia de consulta altamente eficiente
se basa en el uso de un editor molecular (JSME Editor basado en JavaScript (Bienfait y 3.1.1.5. Parámetros calculados. En la quinta categoría se puede acceder a parámetros
Ertl, 2013)) que permite al usuario ingresar una estructura química. El motor BRENDA predichos como hélices transmembrana o EnzymeDetector.
identifica este elemento estructural dentro de las 155 000 estructuras de ligandos en
BRENDA mediante un algoritmo de búsqueda de subestructura altamente optimizado. La
búsqueda de subestructuras se realiza en dos pasos: se realiza una preselección mediante 3.1.1.6. Información de soporte. Finalmente, una sexta categoría amplía los métodos de
escaneos de huellas dactilares, luego se verifican las estructuras restantes en busca de consulta de BRENDA al admitir herramientas como BTO y reacciones bioquímicas
coincidencias de subgráficos. El resultado es una lista de ligandos con todos los sinónimos, integradas de BRENDA, KEGG, MetaCyc y SABIO-RK (Wittig et al., 2012) (BKMS-react,
sus funciones y diagramas de estructura. La búsqueda puede limitarse a un determinado (Lang et al., 2011). ).
papel de la interacción del ligando con la enzima. Un pie de página se centra en la información de apoyo esencial y com
Completa la mejor experiencia de usuario.

3.1.1.3. Tree-browsing y consultas. La clasificación de enzimas, el árbol de taxonomía, el 3.2. Representación, visualización y exportación de datos
plegamiento de proteínas y varias ontologías se pueden explorar navegando en una
representación en forma de árbol de los datos o buscando un término o sinónimo 3.2.1. Página de resumen de
específico y brindando información sobre cuántas enzimas se encuentran en la rama enzimas La página de resumen de enzimas es la página a la que se accede con
particular. mayor frecuencia en BRENDA. Proporciona la cantidad completa y, a menudo, enorme
El Explorador de EC ofrece una descripción general de las clases de EC. Se muestra de varios datos de una enzima. La información sobre una enzima se divide en las
un breve resumen y un enlace a la información detallada de cada clase de EC. Además, categorías principales: nomenclatura de la enzima, interacciones enzima-ligando,
se puede mostrar el diagrama de reacción y se pueden descargar las secuencias parámetros funcionales, información relacionada con el organismo, datos de la estructura
conocidas y los identificadores de PDB. de la enzima, propiedades moleculares, enfermedades, referencias y enlaces a otras
El TaxTree Explorer permite al usuario buscar y navegar por organismos o enzimas bases de datos. Con el formulario de búsqueda en la parte superior de la página, el
a lo largo del árbol jerárquico taxonómico. Los resultados conducen a las páginas de usuario puede restringir los datos mostrados eligiendo una determinada referencia, una
resumen de enzimas, las secuencias y las vías metabólicas conocidas para el organismo accesión UniProt, un organismo o una lista de organismos. Además, los resultados se
seleccionado. pueden ampliar mediante aciertos de minería de texto. Para muchas enzimas con más de
Ontology Explorer da acceso a 35 ontologías diferentes, incluidas BRENDA Tissue 5 referencias, se muestra un mapa de palabras con términos específicos de enzimas
Ontology (BTO), CAVEman, Structural relacionados de títulos y resúmenes de PubMed (consulte el capítulo 3.2.4). Las diferentes
Clasificación de proteínas (SCOPe), la clasificación de la estructura de proteínas entradas se complementan con enlaces a la diversa gama de

199
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

BRENDA herramientas. Los organismos están conectados al TaxTree Explorer, reacciones Pasar el mouse sobre las áreas multicolores muestra el nombre de las rutas y un clic conduce
con diagramas de reacción, ID de UniProt a una vista de secuencia y las referencias a la directamente a los mapas correspondientes. En el lado izquierdo, el usuario encuentra un
página de resumen de referencia. menú con una lista alfabética de caminos y varias opciones de búsqueda.

3.2.2. Página de resumen de La búsqueda de enzimas o metabolitos específicos se puede realizar a través del nombre
ligandos La página de resumen de ligandos reúne todos los datos disponibles de un o el número CE o partes del mismo. Ingresar un término de búsqueda dará como resultado
ligando en BRENDA. Esta vista se divide en cuatro secciones. La formación básica del ligando un mapa general parcialmente coloreado que resalta las vías en las que está involucrada la
incluye una representación gráfica de la molécula, la fórmula de la suma química, la clave enzima o el metabolito de interés. Para comodidad de los usuarios, los colores se pueden
InChI, una lista de sinónimos y un enlace a las rutas metabólicas respectivas. La segunda cambiar individualmente. También es posible una búsqueda combinada de un ligando, una
parte describe las funciones como ligando enzimático en reacciones catalizadas por enzimas enzima y un género de organismo. La búsqueda de organismos se puede realizar en dos
y la función como activador o inhibidor. Todas las entradas están conectadas a un número conjuntos de información de la base de datos. El modo predeterminado vuelve a los datos de
EC y BRENDA verificados manualmente. Es posible ampliar los datos mostrados incluyendo los
la correspondiente referencia bibliográfica de BRENDA. La tercera sección comprende datos de minería de texto BRENDA de los datos AMENDA y FRENDA
parámetros cinéticos enzimáticos que incluyen constantes de inhibición.
Todas las referencias bibliográficas de la molécula y los hipervínculos a ChEBI (Hastings et subconjuntos

al., 2013) y PubChem (Kim et al., 2016) aparecen al final de la página de resumen de ligandos. Con frecuencia, el usuario busca una visión general de la capacidad metabólica de un
organismo o de un rango taxonómico de organismos. Esto se puede obtener mediante una
combinación de una búsqueda de organismos y la visualización de información taxonómica.
3.2.3. Página de resumen de referencia El rango taxonómico se indica mediante un esquema de colores. Cuanto más arriba en el
Cada unidad de información en BRENDA está conectada a una referencia bibliográfica, rango taxonómico, más claro se vuelve el color. Dentro de cada mapa, los nodos están
que se muestra directamente al lado del parámetro. Un clic en el ID de referencia abre una vinculados a los datos de BRENDA. Al hacer clic en un número de CE se accede a la página
página con el título de PubMed y la entrada de esta referencia (si está disponible en PubMed) de resumen de enzimas, mientras que al hacer clic en un metabolito se accede a la página de
y una compilación de todos los valores extraídos de este documento. resumen de ligandos, respectivamente.

higos. 4 y 5 muestran un ejemplo de cómo se puede recuperar la información taxonómica


3.2.4. Mapas de combinada con la ocurrencia de rutas para la bacteria Staphylococcus aureus. De este modo,
palabras Muchos usuarios desean tener una visión general rápida de la función especial, toda la información taxonómica sobre las enzimas, comenzando por el organismo de interés
la aplicación o las propiedades de una determinada enzima. Debido a la gran cantidad de y terminando con el nivel bacteriano, se resalta con una intensidad de color decreciente. El
información sobre una enzima almacenada en BRENDA, esto no siempre es posible usuario puede seleccionar un nivel taxonómico activando o desactivando los niveles
escaneando la página de resumen de enzimas. Para proporcionar al usuario una visión intermedios.
general inicial de los temas y hechos científicos publicados en el contexto de esta enzima, se Finalmente, este mapa de resultados también contiene la cobertura de los nodos resaltados
desarrollan mapas de palabras para 3.584 clases de CE donde se citan más de 5 referencias relacionados con el número de todos los nodos de enzimas en una vía mediante el mouseover.
en PubMed. Conectan la enzima con una colección de términos específicos extraídos de Esta característica distingue las vías BRENDA de las otras dos bases de datos de vías
resúmenes y títulos de artículos. principales KEGG y MetaCyc. Estas plataformas ofrecen un mapa general para todos los
organismos o mapas específicos de especies.
A partir de las listas de referencias de cada número EC obtenidas por el proceso de También hay bases de datos de vías que se centran en un solo organismo.
minería de texto se genera una distribución de frecuencia de términos para palabras con la Algunos ejemplos son SMPDB (The Small Molecule Pathway Database) para enzimas
misma raíz. Después de la ejecución de diversos métodos de filtrado, por ejemplo, la humanas (Jewison et al., 2014). La base de datos de metabolomas de levadura (YMDB, por
eliminación de palabras comunes que aparecen en muchos textos científicos diferentes, los sus siglas en inglés) es una base de datos seleccionada manualmente para metabolitos de
términos se clasifican según su especificidad enzimática. A continuación, se organizan como moléculas pequeñas que se encuentran o son producidos por Saccharomyces cerevisiae
máximo 50 de ellos en un mapa de palabras que se muestra en la página de resumen de (Ramirez Gaona et al., 2017).
enzimas y en las páginas de resultados de búsqueda. El tamaño de fuente de un término se
relaciona con su especificidad. Además, los términos están codificados por colores en las 3.2.6. Reacciones bioquímicas Las
categorías enzima, tejido de origen, localización, enfermedad, organismo, aplicación, ligando.
reacciones catalizadas por enzimas se representan en diagramas de estructura que
Las diferentes categorías están vinculadas a la respectiva página de consulta de BRENDA
consisten en imágenes de los ligandos involucrados creados durante la actualización de
para obtener más información. Por ejemplo, en el mapa de palabras de la enzima
BRENDA (consulte el capítulo 1.3). Los diagramas de reacción están disponibles en cada
acetilcolinesterasa, el ligando donepezilo (en azul claro), utilizado como medicamento para
página de resultados donde se menciona una reacción.
tratar la enfermedad de Alzheimer, está conectado con la página de resumen de ligandos (ver
Fig. 3).
3.2.7. explorador del genoma
El Genome Explorer visualiza las enzimas en su contexto genómico (es decir, tres genes
3.2.5. Mapas de ruta Desde
antes o después de su posición). El usuario puede elegir un genoma disponible de una lista
2016, BRENDA ha integrado mapas que muestran las enzimas en su contexto metabólico,
desplegable o realizar una búsqueda con un organismo, dentro de un rango taxonómico, para
lo que proporciona un acceso intuitivo alternativo a enzimas y metabolitos. El mapa completo
un número de EC o para una proteína específica. La consulta da como resultado una lista de
actual contiene 9.774 nodos para metabolitos y enzimas y 10.198 bordes que combinan
genomas. Después de elegir uno o más genomas, se visualizan los genomas. Genome
enzimas y reactivos en reacciones. Las reacciones están organizadas en 154 vías de
Explorer ofrece la posibilidad de moverse a lo largo del genoma, acercar o alejar, o hacer clic
diferentes tamaños. Casi todas las reacciones están conectadas a clases de EC. La versión
actual representa 1.674 clases de CE de las cuales 165 están completamente clasificadas, ya en un número de CE para abrir información detallada de la enzima.

sea porque la enzima para el paso metabólico respectivo aún no se ha descrito en la literatura
o porque la reacción es espontánea y no necesita un catalizador.
3.2.8. Estructuras 3D de proteínas
Para la visualización de estructuras 3D se utiliza el visor Jsmol (http://www.rcsb.org/pdb/

La página de entrada de la vía BRENDA muestra un mapa general multicolor. Las rutas home/home.do#Category-visualize). El visor ilustra el plegamiento de la proteína, así como
están coloreadas según su función metabólica como metabolismo central y energético, los enlaces disulfuro, los sitios activos, los sitios o regiones de unión y los sitios de glicosilación.
metabolismo de lípidos, metabolismo de aminoácidos, metabolismo de nucleótidos y Además, se muestran enlaces a la visualización de la enzima protonada (Bietz et al., 2014) o
cofactores, metabolismo de carbohidratos, fermentación y otro catabolismo, y xenobióticos y bolsas de enzima ( Volkamer et al., 2012) .
metabolismo secundario. En

200
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

Fig. 3. Mapa de palabras que muestra los términos específicos de la enzima de los títulos y resúmenes de PubMed para EC 3.1.1.7: la acetilcolinesterasa cataliza el paso inicial en la degradación del
neurotransmisor acetilcolina.

3.2.9. Estadísticas 3.2.11. BKMS-reaccionar


Las estadísticas de parámetros funcionales permiten al usuario visualizar y comparar Para el desarrollo de modelos metabólicos o para una evaluación de las capacidades
la distribución de valores completos de los parámetros numéricos almacenados en metabólicas de un determinado organismo, se requiere información completa sobre las
BRENDA, incluidos todos los parámetros cinéticos, así como el perfil de pH o la temperatura reacciones bioquímicas. Sin embargo, las reacciones almacenadas en la base de datos de
óptima de las clases de organismos. enzimas BRENDA y en las bases de datos KEGG y MetaCyc, o los valores cinéticos en
SABIO-RK son diferentes debido a diferentes prioridades (comparar el capítulo 5). Con el
fin de proporcionar al usuario de BRENDA una descripción completa de todas las reacciones
3.2.10. Salida SBML, SOAP Hay almacenadas en las bases de datos, se combinan en la base de datos de reacciones
tres formas de descargar datos del portal web de BRENDA, ya sea de forma interactiva, integrada BKMS-react que contiene actualmente 65ÿ367 reacciones únicas y 6644 números
por ejemplo, como archivos CSV o iniciados por programa como SBML oa través de SOAP. EC que se originan en BRENDA, KEGG, MetaCyc y SABIO-RK. . Las reacciones idénticas
Para la descarga de SBML, se debe especificar un organismo. La búsqueda se puede y redundantes se identifican alineando los metabolitos sobre la base del nombre de la
refinar utilizando otros criterios de búsqueda como el número CE. Además, se ofrece un molécula y las comparaciones de estructura.
servicio web SOAP para usuarios académicos. Después de un registro exitoso, los datos
de BRENDA se pueden descargar utilizando varios métodos, por ejemplo, "getKmValue" La información sobre las reacciones se complementa con números de EC, información
para extraer todas las entidades de valor KM en BRENDA. de rutas, hipervínculos a las distintas bases de datos, comentarios y una verificación de
estequiometría. Las reacciones estequiométricas desequilibradas están marcadas y faltan
átomos en el reactivo y el producto.

Fig. 4. Vías metabólicas con datos de enzimas curados manualmente para la bacteria Staphylococcus aureus que se muestra en azul oscuro. Las rutas con enzimas de organismos taxonómicamente
relacionados hasta el nivel bacteriano se indican con colores más claros.

201
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

Fig. 5. Enzimas de Staphylococcus aureus curadas manualmente para gluconeogénesis. Las enzimas de organismos taxonómicamente relacionados hasta el nivel bacteriano se indican con
colores más claros. Los nodos de enzimas y metabolitos están vinculados a la información de BRENDA correspondiente. Se puede mostrar más información sobre cometabolitos y cofactores a pedido.

lado se indican excluyendo las entradas donde solo faltan H2O o protones. 44.681 4. Soporte al usuario
reacciones de BRENDA (68% de todas las reacciones únicas), 3.191 de KEGG, 7.596
de MetaCyc y 444 de SABIO-RK ocurren solo en las bases de datos especificadas. 4.1. Comentarios de los usuarios

Se pueden encontrar 1348 reacciones en las cuatro bases de datos y 3542 en BRENDA,
KEGG y MetaCyc (ver Fig. 6). El rápido avance de la ciencia en las biociencias tiene una gran influencia en las
necesidades y expectativas de los científicos que acceden a las bases de datos
biológicas. Un contacto continuo con los usuarios a través del sitio web, en

Fig. 6. Distribución de reacciones únicas entre BRENDA, KEGG, MetaCyc y SABIO-RK en BKMS-react.

202
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

conferencias, cursos de enseñanza y cooperación son los requisitos esenciales para el comprende datos genómicos, información de nomenclatura de enzimas y mapas
desarrollo de infraestructuras de bioinformación orientadas a servicios. En base a estos metabólicos específicos del organismo. Las referencias bibliográficas se limitan a las
contactos y encuestas, los contenidos de datos en BRENDA se han ampliado continuamente obtenidas de la base de datos de clasificación de enzimas de la IUBMB. La característica
y el sitio web se ha renovado varias veces. Los contactos de los usuarios seguirán siendo principal de MetaCyc son las vías metabólicas y las enzimas, los genes y los sustratos y
un factor importante también en el desarrollo futuro de BRENDA. Se estableció un sistema cofactores fisiológicos implicados. No se incluyen inhibidores, ni datos cinéticos u otros
de tickets para proporcionar una interfaz web para que los usuarios envíen sus preguntas, datos enzimáticos.
sugieran nuevas enzimas, señalen inconsistencias en BRENDA o soliciten la integración Las estructuras 3D de proteínas enzimáticas se depositan y proporcionan en el Protein
de datos específicos en la base de datos. Data Bank PDB. Otras bases de datos, como FunTree (Furnham et al., 2012), que utiliza
la clasificación CATH para anotar y analizar familias de proteínas basadas en estructuras,
se basan en los datos cristalográficos depositados en ellas.
4.2. Tutoriales ÿ entrenamientos
Reactome (Fabregat et al., 2016) es una base de datos enfocada en humanos.
BRENDA ofrece diversas opciones para que los usuarios aprendan más sobre el Entre otras vías (señalización, transporte, expresión génica, etc.) describe procesos
contenido, el alcance y las diferentes herramientas, y cómo utilizar el sistema de información metabólicos en la célula. Su organización jerárquica sigue en gran medida la de Gene
de enzimas. El usuario puede estudiar los materiales de formación en línea, que contienen Ontology. La base de datos MEROPS (Rawlings et al., 2016) es un compendio especial de
una introducción, detalles sobre las funciones de búsqueda (búsqueda de ligandos rápida, peptidasas. La clasificación de familias y subfamilias se basa en la similitud de las
avanzada o de texto completo) o las funciones de búsqueda y exploración de ontologías secuencias de proteínas. Las enzimas modificadoras de carbohidratos se caracterizan en
(EC Explorer, BTO, TaxTree), secuencia y genomas. búsquedas y las herramientas de la base de datos CAZY (Lombard et al., 2014). La clasificación en familias y subfamilias se
visualización (mapas de palabras, mapas de caminos). Desde 2015, estos temas también basa principalmente en la similitud de secuencias de proteínas y el análisis filogenético.
se muestran en tutoriales en video que son particularmente útiles para principiantes. En el
pasado se realizaron sesiones de capacitación en varias universidades europeas.
Actualmente, en el contexto del proyecto de.NBI, se ofrecen cursos de capacitación de 2 Además, hay muchas otras bases de datos, en su mayoría más pequeñas, que
días. Estos están organizados para presentar la base de datos, iniciar discusiones y destacan aspectos específicos de las enzimas. Los mecanismos catalíticos de enzimas
demostrar aplicaciones prácticas. para 321 clases de EC están cubiertos en MACIE (Holliday et al., 2012) y EzCatDB
(Nagano et al., 2015), que cubre 871 enzimas diferentes según el tipo de reacción. En
SABIO-RK se pueden encontrar datos cinéticos detallados para una selección de
5. Discusión aproximadamente 17 300 reacciones catalizadas por enzimas. Las reacciones catalizadas
por enzimas se recopilan en RHEA (Morgat et al., 2017), un recurso de reacciones
BRENDA se inició en la segunda mitad de la década de 1980 en el laboratorio nacional bioquímicas curadas manualmente. Incluye las reacciones de los sitios web de nomenclatura
alemán de biotecnología cuando las enzimas comenzaron a explotarse a mayor escala de enzimas de la IUBMB (4794) más 4479 reacciones adicionales, incluidas las reacciones
como biocatalizadores para la producción de compuestos complejos y se hizo necesario de Swiss Lipids Knowledgebase y reacciones espontáneas que ocurren en sistemas
identificar enzimas adecuadas con la reacción correcta, especificidad de sustrato, y biológicos. (Aimo et al., 2015). La base de datos EAWAG-BBD (Ellis y Wackett, 2012) ,
estabilidad Comenzando con un objetivo bastante moderado de producir una especie de ahora ubicada en Suiza, se centra en la degradación de compuestos xenobióticos por parte
descripción general de una página para las clases de EC conocidas en ese momento que de microorganismos. Abarca ~1500 reacciones y 543 cepas de microorganismos.
estaba destinado a publicarse en forma de libro, la configuración inicial demostró ser
altamente preparada para el futuro como la forma de un altamente estructurado y se eligió
una representación de datos controlados que, mucho más tarde, podría convertirse
fácilmente en una base de datos relacional. 5.2. Uso de BRENDA ÿ casos de aplicación
El desarrollo de Internet, que fue capaz de transportar grandes cantidades de datos solo
desde mediados de los 90, ofreció la posibilidad de presentar los datos a través de la red, El sitio web de BRENDA es utilizado por 80 000 a 100 000 usuarios por mes.
primero en el EBI, desde 1999 directamente en la Universidad de Colonia. La gran mayoría de los usuarios está principalmente interesada en una o una pequeña
cantidad de enzimas. Por lo general, no citan a BRENDA en sus artículos ni mencionan la
Mientras tanto, BRENDA se ha convertido en una de las infraestructuras de URL, ni el artículo. Esto es diferente cuando los científicos utilizan una mayor parte de la
bioinformación más utilizadas en todo el mundo, a pesar de que el número de científicos información almacenada en BRENDA. Lamentablemente, el nombre BRENDA se eligió
dentro del equipo de BRENDA ha sido bastante bajo (1 a 5 a lo largo de los años, ahora antes de la era de Internet, por lo que, debido a que es idéntico a un nombre personal, es
4). Esto solo fue posible porque el equipo de BRENDA siempre tuvo una interacción imposible identificar la cantidad de páginas web que enlazan con BRENDA. Actualmente,
cercana con las diferentes comunidades de usuarios que trabajan con enzimas y respondió 1500 artículos citan publicaciones de BRENDA.
rápidamente al progreso científico en las biociencias, especialmente la secuenciación de
genes, proteínas y genomas, el progreso en el poder de cómputo, lo que permite elaborar El análisis de los títulos de estos documentos da una idea de la gama de aplicaciones.
datos procedimientos de integración y minería de texto y una mejora continua del motor de La breve selección que se muestra en la Fig. 7 no pretende calificar las aplicaciones, sino
consultas y la configuración informática. que se selecciona de aquellos documentos que se citan mucho más de 100 veces y deben
mostrar aplicaciones muy diversas. Además de la enzimología y la bioquímica, los
principales campos de uso de BRENDA incluyen la biotecnología, la investigación médica
5.1. BRENDA como recurso único para las biociencias y farmacéutica, la biología y el modelado de sistemas, la evolución y muchos otros. No se
mencionan aquí los artículos que describen otras bases de datos que dependen de los
Dada la amplia gama de parámetros específicos de enzimas y la cobertura de todo datos de BRENDA, como Transfac (Kaplun et al., 2016), ChEMBL (Bento et al., 2014),
tipo de enzimas de todos los organismos y el tamaño de la información que ofrece, Golm Metabolome Database (Hummel et al., 2013), the Catalytic Site Atlas (Furnham et
BRENDA es única. Esto se refleja en la gran cantidad de usuarios que acceden a la base al., 2014) y muchos otros.
de datos (hasta 100.000 usuarios por mes).
Por supuesto, hay otras bases de datos que proporcionan información metabólica y
de enzimas, datos sobre aspectos específicos de la enzima, que cubren una clase
específica de enzimas o brindan información sobre la ruta. Se discutirán brevemente los 5.3. BRENDA en infraestructura bioinformática de.NBI
más importantes.
La base de datos de secuencias anotadas UniProt contiene información funcional BRENDA cubre todo el complejo campo de la información relacionada con enzimas
básica sobre genes y proteínas secuenciados, incluidas las enzimas. KEGG (Enciclopedia en de.NBI (Red Alemana de Infraestructura de Bioinformática) y forma parte del centro de
de genes y genomas de Kyoto) servicio de Datos Biológicos. junto al

203
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

Fig. 7. Selección de títulos de publicaciones que representan los distintos casos de aplicación de BRENDA (Andreini et al., 2008; Bugrim et al., 2004; Chou and Voit, 2009; Chouchani et al., 2014; Duarte et al., 2007) ;
Feist et al., 2009; Hansen y Moran, 2011; Hollmann et al., 2011; Li et al., 2009; Shin et al., 2014; Shlomi et al., 2008; Sumner et al., 2003; Van Maris et al., 2007; Vary et al., 2007; Yamanishi et al., 2008).

contribución a la capacitación y educación de los grupos de interés especial y al Referencias


servicio y monitoreo del servicio, existe una colaboración con varios socios del proyecto
de de.NBI para intercambiar e integrar datos. Aimo, L., Liechti, R., Hyka-Nouspikel, N., Niknejad, A., Gleizes, A., Gotz, L., Kuznetsov, D., David, FP,
van der Goot, FG, Riezman, H ., Bougueleret, L., Xenarios, I., Bridge, A., 2015. La base de
BKMS-react, una base de datos no redundante para reacciones bioquímicas en
conocimientos de SwissLipids para la biología de los lípidos. Bioinformática 31, 2860–2866.
BRENDA (consulte el capítulo 3.2.1.1), se ha ampliado recientemente con 3.785
reacciones de SABIO-RK. Esta base de datos originalmente constaba de reacciones Altschul, SF, Gish, W., Miller, W., Myers, EW, Lipman, DJ, 1990. Herramienta básica de búsqueda de
alineación local. J. Mol. Biol. 215, 403–410.
de BRENDA, KEGG y MetaCyc. Se analizaron archivos SBML de SABIO-RK y las Andreini, C., Bertini, I., Cavallaro, G., Holliday, GL, Thornton, JM, 2008. Iones metálicos en catálisis
reacciones extraídas se integraron alineando sustratos y productos en función de su biológica: desde bases de datos de enzimas hasta principios generales. J. Biol. Inorg.
química 13, 1205–1218.
estructura química.
Bannert, C., Welfle, A., aus dem Spring, C., Schomburg, D., 2010. BrEPS: un protocolo flexible y
Además, los sitios web de BRENDA incluyen varios enlaces a los socios del automático para calcular perfiles de secuencia específicos de enzimas para una notación funcional.
proyecto de.NBI. Las clases de CE en BRENDA están vinculadas a los datos cinéticos BMC Bioinf. 11, 589.
Barthelmes, J., Ebeling, C., Chang, A., Schomburg, I., Schomburg, D., 2007. BRENDA:
de reacción de SABIO-RK. Además, hay enlaces a BacDive a través de información
AMENDA y FRENDA: el sistema de información de enzimas en 2007. Nucleic Acids Res.
sobre cepas de bacterias y arqueas en el TaxTree Explorer (consulte el capítulo 35, D511–D514.
3.1.1.3). Los enlaces a DogSiteScorer (Volkamer et al., 2012), un software para Bento, AP, Gaulton, A., Hersey, A., Bellis, LJ, Chambers, J., Davies, M., Krüger, FA, Light, Y., Mak, L.,
McGinchey, S., Nowotka, M ., Papadatos, G., Santos, R., Overington, JP, 2014. La base de datos
detectar posibles bolsas de unión, y ProToss (Bietz et al., 2014), una herramienta de de bioactividad de ChEMBL: una actualización. Ácidos Nucleicos Res. 42, D1083–D1090.
predicción de hidrógeno completamente automatizada para complejos proteína-ligando,
Berman, HM, Westbrook, J., Feng, Z., Gilliland, G., Bhat, TN, Weissig, H., Shindyalov, IN, Bourne, PE,
se insertan en la búsqueda de estructuras 3D. páginas de resultados en BRENDA. En
2000. El banco de datos de proteínas. Ácidos Nucleicos Res. 28, 235–242.
una cooperación adicional con el grupo Rarey de la Universität Hamburg, podría ser Bienfait, B., Ertl, P., 2013. JSME: un editor de moléculas gratuito en JavaScript. J. Cheminform.
posible crear una nueva vista web en BRENDA que aborde las interacciones enzima- 5, 24.
Bietz, S., Urbaczek, S., Schulz, B., Rarey, M., 2014. Protoss: un enfoque holístico para predecir tautómeros
ligando.
y estados de protonación en complejos proteína-ligando. J. Cheminform. 6, 12.
BRENDA da alta prioridad a la educación del usuario dentro del marco de la Bugrim, A., Nikolskaya, T., Nikolsky, Y., 2004. Predicción temprana del metabolismo y la toxicidad de
formación de.NBI. Cada año se organiza un taller de formación para usuarios con el fármacos: enfoque y modelado de biología de sistemas. Descubrimiento de drogas Hoy 9, 127–135.
Burnham, JF, 2006. Base de datos Scopus: una revisión. biomedicina Dígito. Libra 3, 1.
fin de ofrecer una visión general de la variedad de herramientas y todas las Caspi, R., Altman, T., Billington, R., Dreher, K., Foerster, H., Fulcher, CA, Holland, TA, Keseler, IM,
posibilidades para realizar búsquedas rápidas y avanzadas de enzimas. Además, se Kothari, A., Kubo, A., Krummenacker, M ., Latendresse, M., Mueller, LA, Ong, Q., Paley, S.,
Subhraveti, P., Weaver, DS, Weerasinghe, D., Zhang, P., Karp, PD, 2014. La base de datos MetaCyc
proporcionan folletos, ejercicios prácticos y videos de capacitación constantemente
de rutas metabólicas y enzimas y la colección BioCyc de bases de datos Pathway/Genome. Ácidos
actualizados (consulte el capítulo 4.2). Nucleicos Res. 42, D459–D471.
BRENDA está disponible gratuitamente para usuarios académicos y fines Chang, A., Scheer, M., Grote, A., Schomburg, I., Schomburg, D., 2009. BRENDA:
AMENDA y FRENDA el sistema de información de enzimas: nuevos contenidos y herramientas
educativos. Los usuarios comerciales necesitan obtener una licencia. Los derechos de en 2009. Nucleic Acids Res. 37, D588–D592.
licencia son esenciales para el mantenimiento y desarrollo de BRENDA. Chang, A., Schomburg, I., Placzek, S., Jeske, L., Ulbrich, M., Xiao, M., Sensen, CW,
Schomburg, D., 2015. BRENDA en 2015: desarrollos emocionantes en su 25º año de existencia.
Ácidos Nucleicos Res. 43, D439–D446.
Chou, I.-C., Voit, EO, 2009. Desarrollos recientes en la estimación de parámetros e identificación de
Fondos estructuras de sistemas bioquímicos y genómicos. Matemáticas. Biosci. 219, 57–83.
Chouchani, ET, Pell, VR, Gaude, E., Aksentijevic, D., Sundier, SY, Robb, EL, Logan, A., Nadtochiy, SM,
Ord, ENJ, Smith, AC, Eyassu, F., Shirley, R., Hu, C.-H., Dare, AJ, James, AM, Rogatti, S., Hartley,
Este trabajo fue financiado por el Ministerio Federal Alemán de Educación e RC, Eaton, S., Costa, ASH, Brookes, PS, Davidson, SM, Duchen, MR, Saeb -Parsy, K., Shattock,
Investigación (BMBF) [números de concesión 031A539D, 01KX1235, 0316188F y MJ, Robinson, AJ, Work, LM, Frezza, C., Krieg, T., Murphy, MP, 2014. La acumulación isquémica
de succinato controla la lesión por reperfusión a través de ROS mitocondriales. Naturaleza 515, 431–
031L0078G] y por el Niedersächsisches Ministerium für Wissenschaft und Kultur 435.
[74ZN1122]. Duarte, NC, Becker, SA, Jamshidi, N., Thiele, I., Mo, ML, Vo, TD, Srivas, R., Palsson,

204
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

BO, 2007. Reconstrucción global de la red metabólica humana basada en datos genómicos y bibliográficos. Li, W., Cowley, A., Uludag, M., Gur, T., McWilliam, H., Squizzato, S., Park, YM, Buso, N., Lopez, R., 2015. El EMBL-
proc. nacional Academia ciencia Estados Unidos 104, 1777–1782. EBI web de bioinformática y framework de herramientas programáticas . Ácidos Nucleicos Res. 43, W580–
Ellis, LB, Wackett, LP, 2012. Uso de la biocatálisis de la Universidad de Minnesota/ W584.
Base de datos de biodegradación para el estudio de la degradación microbiana. Microbio. información Exp. 2, 1. Lombard, V., Golaconda Ramulu, H., Drula, E., Coutombard, V., Golaconda Ramulu, H., Drula, E., Coutinho, PM,
FCAT, 1998. Terminologia Anatomica Terminología anatómica internacional. Thieme, Henrissat, B., 2014. La base de datos de enzimas activas en carbohidratos ( CAZy) en 2013. Ácidos nucleicos
Nueva York. Res. 42, D490–D495.
Fabregat, A., Sidiropoulos, K., Garapati, P., Gillespie, M., Hausmann, K., Haw, R., Jassal, B., Jupe, S., Korninger, McDonald, AG, Tipton, KF, 2014. Cincuenta y cinco años de clasificación de enzimas: avances y dificultades.
F., McKay, S., Matthews, L., May, B., Milacic, M., Rothfels, K., Shamovsky, V., Webber, M., Weiser, J., FEBRERO J. 281, 583–592.
Williams, M., Wu, G., Stein, L., Hermjakob, H., D'Eustachio, P., 2016. La base de conocimiento de la vía del McDonald, AG, Boyce, S., Tipton, KF, 2009. ExplorEnz: la fuente primaria de la
reactoma. Ácidos Nucleicos Res. Lista de enzimas IUBMB. Ácidos Nucleicos Res. 37, D593–D597.
44, D481–D487. Morgat, A., Lombardot, T., Axelsen, KB, Aimo, L., Niknejad, A., Hyka-Nouspikel, N., Coudert, E., Pozzato, M.,
Federhen, S., 2012. La base de datos de taxonomía del NCBI. Ácidos Nucleicos Res. 40, D136–D143. Pagni, M., Moretti, S. , Rosanoff, S., Onwubiko, J., Bougueleret, L., Xenarios, I., Redaschi, N., Bridge, A.,
Feist, AM, Herrgard, MJ, Thiele, I., Reed, JL, Palsson, BO, 2009. Reconstrucción de redes bioquímicas en 2017. Actualizaciones en Rhea, un recurso curado por expertos en reacciones bioquímicas. Ácidos Nucleicos
microorganismos. Nat. Rev. Microbiol. 7, 129–143. Res. 45, D415–D418.
Finn, RD, Clements, J., Arndt, W., Miller, BL, Wheeler, TJ, Schreiber, F., Bateman, A., Eddy, SR, 2015. Servidor Coordinadores de recursos, NCBI, 2015. Recursos de la base de datos del centro nacional de información
web HMMER: actualización de 2015. Ácidos Nucleicos Res. 43, W30–W38. biotecnológica. Ácidos Nucleicos Res. 44, D7–D19.
Nagano, N., Nakayama, N., Ikeda, K., Fukuie, M., Yokota, K., Doi, T., Kato, T., Tomii, K., 2015. EzCatDB: base de
Finn, RD, Coggill, P., Eberhardt, RY, Eddy, SR, Mistry, J., Mitchell, AL, Potter, SC, Punta, M., Qureshi, M., Sangrador- datos de reacciones enzimáticas, 2015 actualizar. Ácidos Nucleicos Res. 43, D453–D458.
Vegas, A., Salazar, GA , Tate, J., Bateman, A., 2016. La base de datos de familias de proteínas de Pfam: hacia
un futuro más sostenible. Ácidos Nucleicos Res. 44, D279–D285. Placzek, S., Schomburg, I., Chang, A., Jeske, L., Ulbrich, M., Tillack, J., Schomburg, D., 2017. BRENDA en 2017:
nuevas perspectivas y nuevas herramientas en BRENDA. Ácidos Nucleicos Res. 45, D380–D388.
Fox, NK, Brenner, SE, Chandonia, JM, 2014. SCOPe: clasificación estructural de proteínas extendida: integración
de datos SCOP y ASTRAL y clasificación de nuevas estructuras . Ácidos Nucleicos Res. 42, D304–309. Tutorial de presentación de ProteomeXchange: http://genesis.ugent.be/files/costore/practicals/
peptide_and_protein_identification_tutorial/source/software/PX_Submission/
Furnham, N., Sillitoe, I., Holliday, GL, Cuff, AL, Rahman, SA, Laskowski, RA, ProteomeXchange_Submission_Tutorial.pdf.
Orengo, CA, Thornton, JM, 2012. FunTree: un recurso para explorar la evolución funcional de las superfamilias Quester, S., Schomburg, D., 2011. EnzymeDetector: una función enzimática integrada pre
de enzimas definidas estructuralmente. Ácidos Nucleicos Res. 40, D776–D782. herramienta de dicción y base de datos. BMC Bioinf. 12, 376.
Ramirez-Gaona, M., Marcu, A., Pon, A., Guo, AC, Sajed, T., Wishart, NA, Karu, N., Djoumbou Feunang, Y.,
Furnham, N., Holliday, GL, de Beer, TA, Jacobson, JO, Pearson, WR, Thornton, JM, 2014. El atlas de sitios Arndt, D., Wishart, DS, 2017. YMDB 2.0: una versión significativamente ampliada de la base de datos del
catalíticos 2.0: catalogación de sitios catalíticos y residuos identificados en enzimas. Ácidos Nucleicos Res. 42, metaboloma de la levadura. Ácidos Nucleicos Res. 45, D440–D445.
D485–D489.
Gillespie, JJ, Wattam, AR, Cammer, SA, Gabbard, JL, Shukla, MP, Dalay, O., Rawlings, ND, Barrett, AJ, Finn, R., 2016. Veinte años de la base de datos MEROPS de enzimas proteolíticas: sus
Driscoll, T., Hix, D., Mane, SP, Mao, C., Nordberg, EK, Scott, M., Schulman, JR, Snyder, EE, Sullivan, DE, sustratos e inhibidores. Ácidos Nucleicos Res. 44, D343–D350.
Wang, C., Warren, A., Williams, KP, Xue, T., Yoo, HS, Zhang, C., Zhang, Y., Will, R., Kenyon, RW, Sobral,
BW, 2011. PATRIC: el recurso completo de bioinformática bacteriana con un enfoque en especies patógenas Rogers, FB, 1963. Encabezamientos de temas médicos. Toro. Medicina. Libra Asoc. 51, 114–116.
humanas . Infectar. inmune 79, 4286–4298. Söhngen, C., Chang, A., Schomburg, D., 2011. Desarrollo de un esquema de clasificación para
información enzimática relacionada con la enfermedad. BMC Bioinf. 12, 329.
Greene, CS, Krishnan, A., Wong, AK, Ricciotti, E., Zelaya, RA, Himmelstein, DS, Söhngen, C., Podstawka, A., Bunk, B., Gleim, D., Vetcininova, A., Reimer, LC, Ebeling, C., Pendarovski, C.,
Zhang, R., Hartmann, BM, Zaslavsky, E., Sealfon, SC, Chasman, DI, FitzGerald, GA, Dolinski, K., Grosser, Overmann, J., 2016. BacDive: la bacteria base de metadatos de diversidad en 2016. Nucleic Acids Res. 44,
T., Troyanskaya, OG, 2015. Comprender la función multicelular y la enfermedad con tejido humano -redes D581–D585.
específicas. Nat. Gineta. 47, 569–576. Santos, A., Tsafou, K., Stolte, C., Pletscher-Frankild, S., O'Donoghue, SI, Jensen, LJ,
Gremse, M., Chang, A., Schomburg, I., Grote, A., Scheer, M., Ebeling, C., Schomburg, D., 2011. The BRENDA 2015. Comparación exhaustiva de conjuntos de datos de expresión de tejidos a gran escala. Par. J. 3, e1054.
Tissue Ontology (BTO): el primer ontología de todos los organismos para fuentes de enzimas. Ácidos Nucleicos
Res. 39, D507–D513. Scheer, M., Grote, A., Chang, A., Schomburg, I., Munaretto, C., Rother, M., Söhngen, C., Stelzer, M., Thiele, J.,
Hansen, AK, Moran, NA, 2011. La expresión del genoma del áfido revela la cooperación entre el huésped y el Schomburg, D., 2011. BRENDA: el sistema de información de enzimas en 2011. Ácidos nucleicos. Res. 39,
simbionte en la producción de aminoácidos. proc. nacional Academia ciencia EE. UU. 108, 2849–2854. D670–D676.
Schomburg, D., Schomburg, I. (2001–2006). Manual Springer de enzimas. 2ª ed.
Harhay, GP, Smith, TP, Alexander, LJ, Haudenschild, CD, Keele, JW, Matukumalli, LK, Schroeder, SG, Van Tassell, Springer, Heidelberg.
CP, Gresham, CR, Bridges, SM, Burgess, SC, Sonstegard, TS, 2010 Un atlas de expresión génica bovina Schomburg, D., Schomburg, I., BRENDA: de una base de datos a un centro de excelencia.
revela nuevas características distintivas del tejido y evidencia para mejorar la anotación del genoma. Genoma Systembiologie.de Int. ed. 10, 2016, 18–21.
Biol. Schomburg, D., Salzmann, M., Stephan, D. (1990–1998). Manual de enzimas, vol. 1–17.
11, R102. Springer, Heidelberg.
Hastings, J., de Matos, P., Dekker, A., Ennis, M., Harsha, B., Kale, N., Muthukrishnan, V., Owen, G., Turner, S., Schomburg, I., Hofmann, O., Baensch, C., Chang, A., Schomburg, D., 2000. Datos de enzimas e información
Williams, M. , Steinbeck, C., 2013. La ontología y la base de datos de referencia ChEBI para la química metabólica: BRENDA, un recurso para la investigación en biología, bioquímica y medicina. Función génica.
biológicamente relevante: mejoras para 2013. Nucleic Acids Res. 41, D456–D463. Dis. 3–4, 109–118.
Schomburg, I., Chang, A., Hofmann, O., Ebeling, C., Ehrentreich, F., Schomburg, D., 2002.
Heller, SR, McNaught, A., Pletnev, I., Stein, S., Tchekhovskoi, D., 2015. InChI, la IUPAC BRENDA: un recurso para datos de enzimas e información metabólica. Tendencias Bioquímica.
identificador químico internacional. J. Cheminform. 7, 23. ciencia 27, 54–56.
Holliday, GL, Andreini, C., Fischer, JD, Rahman, SA, Almonacid, DE, Williams, ST, Pearson, WR, 2012. MACiE: Schomburg, I., Chang, A., Placzek, S., Söhngen, C., Rother, M., Lang, M., Munaretto, C., Ulas, S., Stelzer, M.,
exploración de la diversidad de reacciones bioquímicas. Grote, A., Scheer, M., Schomburg, D., 2013. BRENDA en 2013: reacciones integradas, datos cinéticos, datos
Ácidos Nucleicos Res. 40, D783–D789. de función enzimática, clasificación mejorada de enfermedades : nuevas opciones y contenidos en BRENDA.
Hollmann, F., Arends, IWCE, Buehler, K., Schallmey, A., Bühler, B., 2011. Oxidaciones mediadas por enzimas Ácidos Nucleicos Res. 41, D764–D772.
para el químico. química verde. 13, 226–265. Shin, S.-Y., Fauman, EB, Petersen, A.-K., Krumsiek, J., Santos, R., Huang, J., Arnold, M., Erte, I., Forgetta, V., Yang,
Hummel, J., Strehmel, N., Bölling, C., Schmidt, S., Walther, D., Kopka, J., 2013. Misa T.-P., Walter, K., Menni, C., Chen, L., Vasquez, L., Valdes, AM, Hyde, CL, Wang, V., Ziemek, D., Roberts, P. ,
búsqueda y análisis espectral usando la base de datos del metaboloma de golm. El manual de metabolómica Xi, L., Grundberg, E., Waldenberger, M., Richards, JB, Mohney, RP, Milburn, MV, John, SL, Trimmer, J., Theis,
vegetal. Wiley-VCH Verlag GmbH & Co. KGaA, págs. 321–343. FJ, Overington, JP, Suhre, K., Brosnan, MJ, Gieger, C., Kastenmüller, G., Spector, TD, Soranzo, N., 2014. Un
Sitio web de la IUPAC: https://iupac.org/. atlas de influencias genéticas en los metabolitos de la sangre humana. Nat. Gineta. 46, 543–550.
Jewison, T., Su, Y., Disfany, FM, Liang, Y., Knox, C., Maciejewski, A., Poelzer, J., Huynh, J., Zhou, Y.,
Arndt, D., Djoumbou , Y., Liu, Y., Deng, L., Guo, AC, Han, B., Pon, A., Wilson, M., Rafatnia, S., Liu,
P., Wishart, DS, 2014. SMPDB 2.0: grandes mejoras en la base de datos de rutas de moléculas Shlomi, T., Cabili, MN, Herrgard, MJ, Palsson, BO, Ruppin, E., 2008. Predicción basada en redes del metabolismo
pequeñas. Ácidos Nucleicos Res. 42, D478–D484. específico de tejido humano. Nat. Biotecnología. 26, 1003–1010.
Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M., 2016. KEGG como recurso de Sillitoe, I., Lewis, TE, Cuff, A., Das, S., Ashford, P., Dawson, NL, Furnham, N.,
referencia para la anotación de genes y proteínas. Ácidos Nucleicos Res. 44, D457–D462. Laskowski, RA, Lee, D., Lees, JG, Lehtinen, S., Studer, RA, Thornton, J., Orengo, CA, 2015. CATH:
anotaciones estructurales y funcionales completas para secuencias del genoma. Ácidos Nucleicos
Kaplun, A., Krull, M., Lakshman, K., Matys, V., Lewicki, B., Hogan, JD, 2016. Res. 43, D376–D381.
Establecimiento y validación de regiones reguladoras para la anotación de variantes y el análisis de Sumner, LW, Mendes, P., Dixon, RA, 2003. Metabolómica vegetal: fitoquímica a gran escala en la
expresiones. BMC Genomics 17 (2), 393. era de la genómica funcional. Fitoquímica 62, 817–836.
Kim, S., Thiessen, PA, Bolton, EE, Chen, J., Fu, G., Gindulyte, A., Han, L., He, J., He, S., Shoemaker, Suzek, BE, Wang, Y., Huang, H., McGarvey, PB, Wu, CH, 2015. Consorcio UniProt.
BA, Wang, J ., Yu, B., Zhang, J., Bryant, SH, 2016. Bases de datos de sustancias y compuestos de Clústeres UniRef: una alternativa completa y escalable para mejorar las búsquedas de similitud
PubChem. Ácidos Nucleicos Res. 44, D1202–D1213. de secuencias. Bioinformática 15 (31), 926–932.
Krogh, A., Larsson, B., von Heijne, G., Sonnhammer, EL, 2001. Predicción de la topología de proteínas El Consorcio de ontología de genes, 2015. Consorcio de ontología de genes: en el futuro. Nucleico
transmembrana con un modelo oculto de Markov: aplicación a genomas completos . J. Mol. Biol. Ácidos Res. 43, D1049–D1056.
305, 567–580. El consorcio UniProt, 2017. UniProt: la base de conocimiento universal de proteínas. Nucleico.
Lang, M., Stelzer, M., Schomburg, D., 2011. BKM-react, una base de datos de reacciones bioquímicas Ácidos Res. 45, D158–D169.
integradas. BMC Bioquímica. 12, 42. Van Maris, AJA, Winkler, AA, Kuyper, M., De Laat, WTAM, Van Dijken, JP, Pronk, JT, 2007. Desarrollo
Lee, YS, Krishnan, A., Zhu, Q., Troyanskaya, OG, 2013. Clasificación consciente de ontología de señales de una fermentación eficiente de xilosa en Saccharomyces cerevi siae: xilosa isomerasa como
de tejido y tipo celular en perfiles de expresión génica a través de plataformas y tecnologías . componente clave. Adv. Bioquímica Ing. Biotecnología. 108, 179–204.
Bioinformática 29, 3036–3044.
Li, B., Krishnan, VG, Mort, ME, Xin, F., Kamati, KK, Cooper, DN, Mooney, SD, Vary, PS, Biedendieck, R., Fuerch, T., Meinhardt, F., Rohde, M., Deckwer, W.-D., Jahn, D., 2007. Bacillus
Radivojac, P., 2009. Inferencia automatizada de mecanismos moleculares de enfermedad a partir megaterium: de una simple bacteria del suelo a una proteína industrial anfitrión de la producción.
de sustituciones de aminoácidos. Bioinformática 25, 2744–2750. aplicación Microbiol. Biotecnología. 76, 957–967.

205
Machine Translated by Google

I. Schomburg et al. Revista de biotecnología 261 (2017) 194–206

Volkamer, A., Kuhn, D., Grombacher, T., Rippmann, F., Rarey, M., 2012. Combinando Wittig, U., Rey, M., Kania, R., Bittkowski, M., Shi, L., Golebiewski, M., Weidemann, A., Müller, W., Rojas, I., 2014.
medidas globales y locales para predicciones de farmacocapacidad basadas en la estructura. J. Chem. información Challenges for an Base de datos de cinética de reacciones enzimáticas.
Modelo. 52, 360–372. FEBRERO J. 281, 572–582.
Wittig, U., Kania, R., Golebiewski, M., Rey, M., Shi, L., Jong, L., Algaa, E., Weidemann, A., Sauer-Danzwith, H., Mir, S. ., Yamanishi, Y., Araki, M., Gutteridge, A., Honda, W., Kanehisa, M., 2008. Predicción de redes de interacción fármaco-
Krebs, O., Bittkowski, M., Wetsch, E., Rojas, I., Müller, W., 2012. SABIO-RK: base de datos para la cinética de objetivo a partir de la integración de espacios químicos y genómicos. Bioinformática 24, i232–240.
reacciones bioquímicas. Ácidos Nucleicos Res.
40, D790–D796.

206

También podría gustarte