Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Revista de Biotecnología
Revisar
Palabras clave: Las enzimas, que representan el grupo de proteínas más grande y, con mucho, el más complejo, desempeñan un papel
Base de datos de enzimas esencial en todos los procesos de la vida, incluido el metabolismo, la expresión génica, la división celular, el sistema inmunitario
Vías metabólicas y otros. Su función, también relacionada con la mayoría de enfermedades o el control del estrés, las convierte en objetivos
Reacciones catalizadas por enzimas
interesantes para la investigación y aplicaciones en biotecnología, tratamientos médicos o diagnóstico. Sus parámetros
La cinética de enzimas
funcionales y otras propiedades se recopilan, integran y ponen a disposición de la comunidad científica en la base de datos de
Enzimas y enfermedades
ENzimas de BRaunschweig (BRENDA). En los últimos 30 años, BRENDA se ha convertido en una de las bases de datos
Interacción enzima-ligando
biológicas más utilizadas en todo el mundo. Se describen y discuten los contenidos de los datos, el proceso de adquisición de
datos, la integración y el control de datos, las formas de acceder a los datos y las visualizaciones proporcionadas por el sitio web.
1.1. Relevancia de las enzimas La recopilación de datos relacionados con enzimas de la literatura científica
comenzó en 1987 en el Centro Nacional Alemán de Investigación para
Las enzimas son esenciales para casi todos los procesos de la vida y vitales para Biotecnología en Braunschweig (GBF). De 1996 a 2007 continuó en la Universidad de
la biotecnología industrial o el diagnóstico médico. 30 a 40% de todos los genes Colonia y volvió a Braunschweig al departamento de Bioinformática y Biología de
codifican enzimas. Aceleran las reacciones químicas hasta en 16 órdenes de magnitud, Sistemas de la Technische Universität Braunschweig. Ahora se encuentra en el Centro
permiten rutas metabólicas coordinadas con precisión dentro de las células y son de Biología de Sistemas Braunschweig (BRICS) en http://www.brenda-enzymes.org.
indispensables cuando se trata de la defensa contra patógenos y otros procesos.
Muchos de ellos son muy específicos, mientras que otros lo son menos. Las funciones Los datos iniciales consistieron en una compilación de datos estructurados en
de las enzimas dependen de muchas características, como su secuencia, estructura formato textual y numérico, con un conjunto de datos para cada clase de enzima. Estos
tridimensional, estabilidad y sus interacciones con otras moléculas (Schomburg y se publicaron a partir de 1990 en una serie de 19 libros que cubren aproximadamente
Schomburg, 2016). 3000 clases de enzimas (Schomburg et al., 1990–1998). Entre 2001 y 2009 se publicó
una segunda edición que consta de 49 volúmenes que cubren aproximadamente 4900
A finales de los años 80 se hizo evidente que la estructura molecular o celular clases de enzimas (Schomburg y Schomburg, 2001–2006).
La función de las enzimas o su papel en los procesos patológicos depende de un gran Simultáneamente con los libros, se creó una presentación en Internet del sistema
número de propiedades diferentes, incluidas, por ejemplo, su especificidad de sustrato, de base de datos a partir de un primer sistema de consulta basado en texto en 1999
su estabilidad, su ubicación y muchas otras, y estas propiedades varían entre los (Schomburg et al., 2000; Schomburg et al., 2002). Desde entonces, se desarrolló hasta
diferentes organismos, aunque la reacción bioquímica general catalizada es la misma. convertirse en un sistema de información de enzimas completo y elaborado que abarca
lo mismo en la primera vista. más de 370 000 enzimas de 6300 clases de enzimas. Incluye una gran cantidad de
Estos datos, diferentes, por ejemplo, de la información de secuencias y estructuras información relacionada con las enzimas al combinar los datos funcionales anotados
3D, no están disponibles directamente, sino que están ocultos en millones de manualmente con secuencias genómicas, estructuras de enzimas y datos
publicaciones y deben extraerse y convertirse a una forma estructural. computarizados. Los datos adicionales recuperados por los algoritmos de minería de
Esto solo se puede manejar en un sistema de base de datos flexible y se puede texto tienen como objetivo proporcionar un conjunto completo de literatura para enzimas
acceder a través de un sitio web. clasificadas. Los valores calculados y la información sobre las reacciones catalizadas
y los compuestos que modulan las actividades enzimáticas, incluidas sus estructuras
moleculares, se suman al completo
ÿ Autor de correspondencia.
Dirección de correo electrónico: D.Schomburg@tu-braunschweig.de (D. Schomburg).
http://dx.doi.org/10.1016/j.jbiotec.2017.04.020
Recibido el 16 de febrero de 2017; Recibido en forma revisada el 11 de abril de 2017; Aceptado el 18
de abril de 2017 Disponible en línea el 21 de abril de 2017 0168-1656/ © 2017 Los autores. Publicado
por Elsevier BV Este es un artículo de acceso abierto bajo la licencia CC BY-NC-ND (http://creativecommons.org/licenses/BY-NC-ND/4.0/).
Machine Translated by Google
plataforma BRENDA de estos días (Chang et al., 2009; Chang et al., 2015; 1.3.1. Conversión de datos no estructurados ocultos en datos estructurados: datos manuales
Placzek et al., 2017). Desde 2015 BRENDA es miembro de la Asociación Alemana importación y extensión
La creación del núcleo de información BRENDA consta de los siguientes pasos:
Red de Infraestructura de Bioinformática (https://www.denbi.de/)
(ver Sección 5.3.).
información sobre los valores dados para una enzima específica en un organismo dado. nombres de enzimas, función de enzimas, reacciones (sustratos/productos),
y ocurrencia (organismo, tejidos, etc.).
Visión general
El primer paso en este proceso es la identificación de los diferentes
Clases EC 7,100
nombres usados para cada enzima. Aunque la IUBMB publica un
Proteínas 84,000
104,000
“nombre aceptado” para cada clase de enzima actualmente se enumeran ~79 000 sinónimos
Nombres de enzimas
ligandos 211,000 para las 6300 clases de EC. Estos anotados manualmente
Referencias 133,000 los sinónimos son esenciales para la identificación de la literatura relevante y también para
Solicitud 13,000
el proceso de extracción de texto (vide infra). Algunas enzimas
Ingeniería 80.000
se citan más a menudo con un sinónimo que con el "aceptado
Información relacionada con el organismo nombre". Un ejemplo destacado es la ribulosa bisfosfato carboxilasa.
Organismo 11,000
(EC 4.1.1.39) que comúnmente se conoce como RuBisCo.
Tejido de origen 97,000
Localización 33,000
Después de los pasos de selección y análisis manual, la literatura relevante
está anotado por científicos altamente calificados.
Reacción y especificidad
Sustratos/Productos
La versión actual de BRENDA (2017.1) cubre 6300 clases de enzimas activas (números
930,000
Cofactores 26,000 EC). BRENDA también contiene “preliminares
inhibidores 220,000 Números CE proporcionados por BRENDA”. Estos números están designados
Compuestos Activadores 28,000
con una “B” en la cuarta posición del número EC. Estas son enzimas que se encuentran
Metales e Iones 38,000
mediante anotaciones manuales en la literatura y difieren sustancialmente en la especificidad
Parámetros funcionales
de sustrato y la reacción de todas las enzimas actuales.
Valores de kilómetros 137,000
enzimas clasificadas. A veces son enzimas que cierran un hueco en un
Números de facturación 64.000
Valores Kcat/KM 21,000
vía metabólica o enzimas de una vía recién detectada en un
Actividad específica 48,000 organismo específico. Estas enzimas deben clasificarse dentro de la
Valores IC50 51,000 sistema jerárquico CE y están a la espera de la decisión final de la
Valores Ki 38,000
Comisión de Enzimas de la IUBMB.
Valores Pi 5,000
pH óptimos y rangos 53,000
Óptimos y rangos de temperatura 32,000 1.3.1.2. Datos de ligandos enzimáticos. Información sobre compuestos que interactúan
con enzimas como sustratos y productos, cofactores, inhibidores
Estructura de la enzima
Modificaciones postraduccionales 6,000 y las sustancias activadoras constituyen una parte importante de BRENDA (Scheer
Estructura cuaternaria 35,000 et al., 2011). Estas pueden ser "moléculas pequeñas" o macromoléculas como
Aislamiento y preparación
como proteínas, polinucleótidos y polisacáridos. en la bioquimica
Valores de estabilidad (pH, temperatura, oxidación, almacenamiento, orgánico 49,000 literatura, sin embargo, el uso de nombres compuestos es muy inconsistente.
Solvente) La nomenclatura sistemática de la IUPAC rara vez se usa, en lugar trivial
Purificación 33,000
nombres, abreviaturas y acrónimos se encuentran con mayor frecuencia (IUPAC,
Clonado 33,000
renaturalizado
2017). Actualmente BRENDA almacena 211.000 nombres de ligandos. Los 124.000
1,000
diferentes ligandos de moléculas pequeñas se encuentran en 170.000 diferentes
195
Machine Translated by Google
nombres en la literatura. Entre ellos se encuentran compuestos a los que se hace referencia organismos o enzimas a lo largo del árbol jerárquico taxonómico. Los resultados conducen a
en la literatura bajo hasta 70 nombres diferentes. 20.500 compuestos los datos de enzimas específicas y a las páginas de resumen de enzimas.
Poseer al menos dos nombres. El árbol se basa en la base de datos de taxonomía del NCBI (Federhen, 2012)
Muy a menudo, los nombres y siglas triviales no son únicos e incluso son que es el principal recurso para los organismos en BRENDA y complementado
utilizado para diferentes compuestos. Un mapeo exacto de ligandos sinónimos con denominaciones de cepas microbianas. Actualmente BRENDA contiene
sólo es posible a través de una comparación de sus estructuras químicas. Este 11.420 organismos diferentes. Los organismos y, cuando estén disponibles, las cepas
significa que para todos los ligandos se debe incluir la estructura química, en están vinculados a las páginas respectivas del NCBI y a la Diversidad bacteriana
la mayoría de los casos dibujados a mano y almacenados como "Molfiles", códigos InChI (Heller Metadatabase BacDive (Söhngen et al., 2016). Una pequeña cantidad de organismos, que
et al., 2015), y cifras. no están almacenados en el NCBI, son verificados por otras bases de datos o por la literatura
original.
1.3.1.3. Control de calidad. Los datos extraídos manualmente de cada artículo SCOPe (Fox et al., 2014) y CATH (Sillitoe et al., 2015) son dos
se canalizan a través de un flujo de trabajo de control elaborado que comienza con esquemas de clasificación jerárquica para estructuras 3D de proteínas. Están
Cientos de controles informáticos diferentes que controlan la formalidad implementado en BRENDA para permitir la identificación de la clase plegable
exactitud y la consistencia interna de los datos. Esto es seguido por de una enzima o la identificación de enzimas con un plegamiento similar en
controles manuales por dos científicos internos. Este proceso garantiza una niveles diferentes. Por ejemplo, el dominio similar al de Rossmann que se une a NAD(P) está
alta calidad de los datos antes de que sean procesados para el final asociado con 186 números EC diferentes.
Lanzamiento de la base de datos BRENDA. La rama de enfermedad de la ontología MeSH también es parte de la ontología
sección. Constituye la base para el acceso jerárquico a la parte de
2. Importación y compilación de la base de datos BRENDA BRENDA que cubre las relaciones enzima/enfermedad en DRENDA, el
Base de datos de enzimas relacionadas con enfermedades (Söhngen et al., 2011; Schomburg
Las bases de datos del sitio web de BRENDA constan de numerosas tablas et al., 2013).
que representan los datos anotados manualmente, así como los datos generados En la Tabla 2 se resume la cantidad de datos de todas las fuentes externas.
196
Machine Translated by Google
Fig. 1. Vista sobre el término vaso sanguíneo en la ontología de tejidos BRENDA y las clases de EC conectadas.
La anotación manual de datos de la literatura primaria está limitada a unos 10 000 apariciones de estos términos en los títulos y resúmenes procesados. los
artículos por año y (debido a limitaciones presupuestarias) no puede cubrir la literatura Los siguientes pasos difieren dependiendo del propósito específico.
completa. La base de datos BRENDA,
sin embargo, trata de dar una visión general completa de la literatura para cada clase de
2.2.1. Ocurrencia de enzimas en organismos/tejidos/localizaciones subcelulares
enzima proporcionando información básica como la aparición en
La base de datos FRENDA (Referencia completa de ENzyme DAta) se basa en
diferentes organismos. Esta información se recupera mediante minería de texto de
resúmenes de literatura de PubMed. Debido a las condiciones de la licencia de todas las co-ocurrencias de nombres de enzimas y organismos en los títulos y
resúmenes e incluye todas las combinaciones (Barthelmes et al., 2007).
los editores este proceso se limita actualmente a un análisis de
Títulos y resúmenes de PubMed y, por lo tanto, restringidos a la información. En un paso posterior, esto se procesa aún más para predecir la combinación importante
de enzima/organismo para cada artículo y para extender
se espera que se mencione en el mismo. Se basa en diccionarios extendidos y algoritmos
esto mediante el análisis de información de localización de órganos/tejidos y subcelulares
complejos. La fragmentación, el análisis y la
(Datos AMENDA). El post-procesamiento incluye validaciones automáticas
el control de calidad requiere semanas de tiempo de computadora en un clúster de alto
rendimiento. basado en la ontología de tejido BRENDA y exclusión creada manualmente
listas para AMENDA.
Los - actualmente - 26 millones de títulos y 16 millones de resúmenes de
Este análisis muestra que dentro del núcleo BRENDA manual alrededor del 6%
PubMed se dividen en palabras y oraciones. Los diccionarios para el texto.
de los papeles que mencionan enzimas son procesados, y por lo tanto entre
minería que comprende alrededor de 9.000 tejidos fuente, 80.000 nombres de enzimas,
Se incluye el 25% y el 40% de la información relevante.
2,2 millones de sinónimos de organismos, 170.000 términos de enfermedades, 130 millones
nombres de sustancias y 4.000 expresiones cinéticas son automáticamente
compilado En una evaluación manual, los términos ambiguos o falsos son 2.2.2. Datos cinéticos
eliminado En un proceso muy complejo, los datos cinéticos se extraen de los títulos
La primera parte de la minería de texto posterior (Tabla 3) identifica co y resúmenes. Esto incluye un análisis específico de posición de valores numéricos
197
Machine Translated by Google
valores relacionados con términos utilizados para la cinética enzimática, información sobre Escherichia coli (UniProt) y generalmente se asume para los organismos procarióticos.
enzimas, organismo y nombres de compuestos químicos. Desafortunadamente, la información
cinética rara vez se da en forma resumida, por lo que el número de valores obtenidos de esta
manera es limitado. Se identificaron 11.000 artículos con datos cinéticos y se extrajeron 13.000 2.4. La base de datos definitiva
valores cinéticos. Esto se suma a los 410.000 datos cinéticos obtenidos por el procesamiento
manual de pa completa En el último paso, se combina la información de las fuentes descritas. Las combinaciones
persona específicas de parámetros solicitadas con frecuencia se compilan previamente. Los molfiles de
ligandos se convierten en cifras para la visualización de ligandos y reacciones (consulte el capítulo
2.2.3. Datos de la enfermedad 3.2.6) y las huellas dactilares se calculan para la búsqueda de subestructuras (consulte el capítulo
Dado que la función o disfunción/deficiencia enzimática a menudo está relacionada con 3.1.1.2).
enfermedades o se utiliza para el diagnóstico, la inclusión de información sobre la enfermedad es
esencial. Los artículos en esta área no son adecuados para la extracción de información 3. La presentadora BRENDA
estructurada como se describe anteriormente. Para ello se desarrolló un proceso de minería de
textos que identifica trabajos que abordan el papel de las enzimas con respecto a las enfermedades Debido a un sistema complejo de varios servidores, balanceadores de carga y un sistema de
desde diferentes puntos de vista. Un primer paso basado en la co-ocurrencia para la identificación control de versiones, el host de BRENDA www.brenda-enzymes.org experimentó un tiempo de
de artículos relevantes y enfermedades relacionadas con enzimas es seguido por un paso de inactividad de 0 minutos en 2015 y 2016 e incluso se puede acceder a él durante las
clasificación basado en una técnica utilizada en el aprendizaje supervisado y la extracción de actualizaciones. Los motores de consulta y las páginas web se actualizan constantemente para
datos, así como en la clasificación, la llamada "máquina de vectores de soporte". . optimizar el acceso de los usuarios, que a menudo se basa en los comentarios de los usuarios.
La base de datos completa se convierte de la forma normal interna a una forma optimizada para
De esta forma se identifican 770.000 artículos para cubrir las relaciones enzima/enfermedad. tiempos de reacción cortos.
Se clasifican para brindar información sobre la interacción causal entre la enzima y la enfermedad Recientemente, se han realizado revisiones importantes de las páginas web de BRENDA: se
(450 000, 350 000 con el puntaje de confianza más alto), artículos que describen el tratamiento ha implementado una interfaz nueva y moderna para la página de entrada. Las páginas de
basado en enzimas (330 000) o el diagnóstico (380 000) y otros temas. Los usuarios pueden resumen de enzimas y ligandos se han revisado por completo, incluidas nuevas funciones de
elegir varias puntuaciones basadas en la precisión o la preferencia de recuperación. impresión y opciones para filtrar el contenido, ordenar todas las tablas u ocultar campos de datos.
Además, las aplicaciones Java del lado del cliente para la búsqueda de subestructuras (capítulo
Se encontraron 2000 clases de enzimas en artículos que describen interacciones causales, 3.1.1.2) y la visualización de estructuras 3D (capítulo 3.2.8) han sido sustituidas por aplicaciones
siendo las proteínas quinasas, monooxigenasas y ubiquitina transferasas las mencionadas con JavaScript.
mayor frecuencia. Se mencionan 3.600 términos de enfermedades en relación con las enzimas, y
las neoplasias/carcinomas e infecciones se mencionan con mayor frecuencia.
3.1. Acceso a datos: motor de consultas
2.3. Predicción de datos basada en el cálculo Los datos en BRENDA son, a diferencia de, por ejemplo, los datos contenidos en PubMed o
UniProt, almacenados en diferentes formatos. Son de tipo alfabético, numérico, estructural como
2.3.1. Asociación transmembrana o de membrana de enzimas estructuras químicas, reacciones, vías, ontologías y las estructuras de árbol mencionadas.
Para la predicción de la asociación transmembrana o de membrana de enzimas se usa
TMHMM (Krogh et al., 2001). El usuario no solo obtiene predicciones sobre las secuencias A menudo, los usuarios solicitan combinaciones de información como "enzimas que se producen
asociadas a la membrana de enzimas individuales, sino que también puede solicitar todas las en un determinado organismo y muestran una determinada especificidad de sustrato". De hecho,
clases de enzimas caracterizadas por un cierto número de hélices transmembrana. Para las la mayoría de los usuarios solo quieren tener una visión general rápida de la información completa
20.526.372 proteínas transmembrana predichas, se determina la ubicación del extremo N-terminal sobre una determinada clase de enzima, otros, sin embargo, están tratando de identificar una
y los puntos inicial y final. enzima para una determinada aplicación que requiere una combinación específica de propiedades
como una especificidad de pH o temperatura. y puede tener una amplia especificidad de sustrato.
2.3.2. Anotación del genoma, predicción de la función de los productos génicos ÿ EnzymeDetector El motor de consultas y las páginas web de BRENDA están diseñados para cubrir las
El rápido aumento del número de genomas secuenciados proporciona una valiosa fuente de necesidades de muchos tipos diferentes de usuarios con la menor cantidad de "clics" posible.
información sobre la aparición de enzimas en los organismos, siempre que se disponga de
una predicción fiable basada en la secuencia de la función de la enzima. Dado que un análisis 3.1.1. Página de
(Quester y Schomburg, 2011) mostró que los anfitriones de anotaciones genómicas estándar entrada La página de entrada se divide en tres partes. El encabezado presenta opciones
brindan diferentes predicciones de función para más de dos tercios de todas las enzimas, una para navegar rápidamente a diferentes herramientas de búsqueda ("ir a"), para volver a la página
vista agregada de los anfitriones de predicción más populares (NCBI, KEGG, UniProt, PATRIC de entrada ("INICIO") o para cambiar a una página que da acceso a todos los diferentes campos
(Gillespie et al., 2011)), Pfam-HMMs (Finn et al., 2016; Finn et al., 2015) se integró en el servicio de búsqueda ("Vista clásica"). Además, el encabezado da acceso a una página de inicio de
BRENDA y se combinó con los datos anotados manualmente en BRENDA, una búsqueda BLAST sesión, un formulario para abrir un ticket, un historial de búsqueda o una descripción general de
reciente, la minería de texto datos de AMENDA, y una predicción de la función enzimática basada todas las enzimas.
en patrones propios o togonales. Actualmente , En zymeDetector proporciona una colección En la parte principal de la página, el usuario puede simplemente ingresar un término de
completa de predicciones de la función enzimática de todo el genoma para más de 5000 genomas búsqueda en forma de búsqueda de Google y elegir el campo de búsqueda deseado (ver Fig. 2).
bacterianos y 200 arqueas, incluidos sus plásmidos (en http://edbs.tu-bs.de y vinculado en Para el campo de búsqueda predeterminado "Enzima o Ligando" se implementa una búsqueda
BRENDA). de vida que ofrece resultados instantáneos durante la entrada del término de búsqueda.
Además, seis mosaicos representan las seis estrategias de búsqueda diferentes más
elaboradas:
La combinación y agregación de predicciones de funciones génicas de diferentes fuentes y 3.1.1.1. Consultas basadas en texto. Las consultas basadas en texto brindan acceso a campos
obtenidas por diferentes métodos permite asignar una puntuación de confianza a cada predicción, alfanuméricos. Cubren la búsqueda de texto completo, la búsqueda avanzada y la posibilidad de
dependiendo del acuerdo de las diferentes fuentes. Luego, el usuario puede modificar los puntajes explorar las relaciones enzimas/enfermedad. La búsqueda avanzada permite al usuario combinar
predeterminados y decidir el puntaje de corte, que podría ser la suposición de que el 30 por ciento diferentes criterios de búsqueda.
de las proteínas son enzimas, un número probado para La búsqueda de texto completo incluye los comentarios e identifica el término de búsqueda
198
Machine Translated by Google
el término “aguas residuales” se encuentra en los campos aplicación, clonados, base de datos (CATH) y encabezados de temas médicos (MeSH). Todas las ontologías
inhibidores, títulos de referencia, tejidos fuente, actividad específica y sustratos (en la están conectadas a las enzimas BRENDA y las localizaciones donde sea posible.
mayoría de los casos en los comentarios).
3.1.1.2. Consultas basadas en estructuras. Como se mencionó, los compuestos 3.1.1.4. Visualización. Se han compilado varias visualizaciones como mapas de palabras,
bioquímicos se mencionan en la literatura a menudo con un gran número de términos mapas de rutas, explorador de genomas, reacciones catalizadas y estructuras de
muy diferentes, lo que hace que la búsqueda alfanumérica de nombres de compuestos proteínas en 3D que permiten un acceso rápido a los datos (comparar 3.2).
sea muy ineficiente. A menudo se busca información para una clase de compuestos que
comparten una determinada subestructura. La estrategia de consulta altamente eficiente
se basa en el uso de un editor molecular (JSME Editor basado en JavaScript (Bienfait y 3.1.1.5. Parámetros calculados. En la quinta categoría se puede acceder a parámetros
Ertl, 2013)) que permite al usuario ingresar una estructura química. El motor BRENDA predichos como hélices transmembrana o EnzymeDetector.
identifica este elemento estructural dentro de las 155 000 estructuras de ligandos en
BRENDA mediante un algoritmo de búsqueda de subestructura altamente optimizado. La
búsqueda de subestructuras se realiza en dos pasos: se realiza una preselección mediante 3.1.1.6. Información de soporte. Finalmente, una sexta categoría amplía los métodos de
escaneos de huellas dactilares, luego se verifican las estructuras restantes en busca de consulta de BRENDA al admitir herramientas como BTO y reacciones bioquímicas
coincidencias de subgráficos. El resultado es una lista de ligandos con todos los sinónimos, integradas de BRENDA, KEGG, MetaCyc y SABIO-RK (Wittig et al., 2012) (BKMS-react,
sus funciones y diagramas de estructura. La búsqueda puede limitarse a un determinado (Lang et al., 2011). ).
papel de la interacción del ligando con la enzima. Un pie de página se centra en la información de apoyo esencial y com
Completa la mejor experiencia de usuario.
3.1.1.3. Tree-browsing y consultas. La clasificación de enzimas, el árbol de taxonomía, el 3.2. Representación, visualización y exportación de datos
plegamiento de proteínas y varias ontologías se pueden explorar navegando en una
representación en forma de árbol de los datos o buscando un término o sinónimo 3.2.1. Página de resumen de
específico y brindando información sobre cuántas enzimas se encuentran en la rama enzimas La página de resumen de enzimas es la página a la que se accede con
particular. mayor frecuencia en BRENDA. Proporciona la cantidad completa y, a menudo, enorme
El Explorador de EC ofrece una descripción general de las clases de EC. Se muestra de varios datos de una enzima. La información sobre una enzima se divide en las
un breve resumen y un enlace a la información detallada de cada clase de EC. Además, categorías principales: nomenclatura de la enzima, interacciones enzima-ligando,
se puede mostrar el diagrama de reacción y se pueden descargar las secuencias parámetros funcionales, información relacionada con el organismo, datos de la estructura
conocidas y los identificadores de PDB. de la enzima, propiedades moleculares, enfermedades, referencias y enlaces a otras
El TaxTree Explorer permite al usuario buscar y navegar por organismos o enzimas bases de datos. Con el formulario de búsqueda en la parte superior de la página, el
a lo largo del árbol jerárquico taxonómico. Los resultados conducen a las páginas de usuario puede restringir los datos mostrados eligiendo una determinada referencia, una
resumen de enzimas, las secuencias y las vías metabólicas conocidas para el organismo accesión UniProt, un organismo o una lista de organismos. Además, los resultados se
seleccionado. pueden ampliar mediante aciertos de minería de texto. Para muchas enzimas con más de
Ontology Explorer da acceso a 35 ontologías diferentes, incluidas BRENDA Tissue 5 referencias, se muestra un mapa de palabras con términos específicos de enzimas
Ontology (BTO), CAVEman, Structural relacionados de títulos y resúmenes de PubMed (consulte el capítulo 3.2.4). Las diferentes
Clasificación de proteínas (SCOPe), la clasificación de la estructura de proteínas entradas se complementan con enlaces a la diversa gama de
199
Machine Translated by Google
BRENDA herramientas. Los organismos están conectados al TaxTree Explorer, reacciones Pasar el mouse sobre las áreas multicolores muestra el nombre de las rutas y un clic conduce
con diagramas de reacción, ID de UniProt a una vista de secuencia y las referencias a la directamente a los mapas correspondientes. En el lado izquierdo, el usuario encuentra un
página de resumen de referencia. menú con una lista alfabética de caminos y varias opciones de búsqueda.
3.2.2. Página de resumen de La búsqueda de enzimas o metabolitos específicos se puede realizar a través del nombre
ligandos La página de resumen de ligandos reúne todos los datos disponibles de un o el número CE o partes del mismo. Ingresar un término de búsqueda dará como resultado
ligando en BRENDA. Esta vista se divide en cuatro secciones. La formación básica del ligando un mapa general parcialmente coloreado que resalta las vías en las que está involucrada la
incluye una representación gráfica de la molécula, la fórmula de la suma química, la clave enzima o el metabolito de interés. Para comodidad de los usuarios, los colores se pueden
InChI, una lista de sinónimos y un enlace a las rutas metabólicas respectivas. La segunda cambiar individualmente. También es posible una búsqueda combinada de un ligando, una
parte describe las funciones como ligando enzimático en reacciones catalizadas por enzimas enzima y un género de organismo. La búsqueda de organismos se puede realizar en dos
y la función como activador o inhibidor. Todas las entradas están conectadas a un número conjuntos de información de la base de datos. El modo predeterminado vuelve a los datos de
EC y BRENDA verificados manualmente. Es posible ampliar los datos mostrados incluyendo los
la correspondiente referencia bibliográfica de BRENDA. La tercera sección comprende datos de minería de texto BRENDA de los datos AMENDA y FRENDA
parámetros cinéticos enzimáticos que incluyen constantes de inhibición.
Todas las referencias bibliográficas de la molécula y los hipervínculos a ChEBI (Hastings et subconjuntos
al., 2013) y PubChem (Kim et al., 2016) aparecen al final de la página de resumen de ligandos. Con frecuencia, el usuario busca una visión general de la capacidad metabólica de un
organismo o de un rango taxonómico de organismos. Esto se puede obtener mediante una
combinación de una búsqueda de organismos y la visualización de información taxonómica.
3.2.3. Página de resumen de referencia El rango taxonómico se indica mediante un esquema de colores. Cuanto más arriba en el
Cada unidad de información en BRENDA está conectada a una referencia bibliográfica, rango taxonómico, más claro se vuelve el color. Dentro de cada mapa, los nodos están
que se muestra directamente al lado del parámetro. Un clic en el ID de referencia abre una vinculados a los datos de BRENDA. Al hacer clic en un número de CE se accede a la página
página con el título de PubMed y la entrada de esta referencia (si está disponible en PubMed) de resumen de enzimas, mientras que al hacer clic en un metabolito se accede a la página de
y una compilación de todos los valores extraídos de este documento. resumen de ligandos, respectivamente.
sea porque la enzima para el paso metabólico respectivo aún no se ha descrito en la literatura
o porque la reacción es espontánea y no necesita un catalizador.
3.2.8. Estructuras 3D de proteínas
Para la visualización de estructuras 3D se utiliza el visor Jsmol (http://www.rcsb.org/pdb/
La página de entrada de la vía BRENDA muestra un mapa general multicolor. Las rutas home/home.do#Category-visualize). El visor ilustra el plegamiento de la proteína, así como
están coloreadas según su función metabólica como metabolismo central y energético, los enlaces disulfuro, los sitios activos, los sitios o regiones de unión y los sitios de glicosilación.
metabolismo de lípidos, metabolismo de aminoácidos, metabolismo de nucleótidos y Además, se muestran enlaces a la visualización de la enzima protonada (Bietz et al., 2014) o
cofactores, metabolismo de carbohidratos, fermentación y otro catabolismo, y xenobióticos y bolsas de enzima ( Volkamer et al., 2012) .
metabolismo secundario. En
200
Machine Translated by Google
Fig. 3. Mapa de palabras que muestra los términos específicos de la enzima de los títulos y resúmenes de PubMed para EC 3.1.1.7: la acetilcolinesterasa cataliza el paso inicial en la degradación del
neurotransmisor acetilcolina.
Fig. 4. Vías metabólicas con datos de enzimas curados manualmente para la bacteria Staphylococcus aureus que se muestra en azul oscuro. Las rutas con enzimas de organismos taxonómicamente
relacionados hasta el nivel bacteriano se indican con colores más claros.
201
Machine Translated by Google
Fig. 5. Enzimas de Staphylococcus aureus curadas manualmente para gluconeogénesis. Las enzimas de organismos taxonómicamente relacionados hasta el nivel bacteriano se indican con
colores más claros. Los nodos de enzimas y metabolitos están vinculados a la información de BRENDA correspondiente. Se puede mostrar más información sobre cometabolitos y cofactores a pedido.
lado se indican excluyendo las entradas donde solo faltan H2O o protones. 44.681 4. Soporte al usuario
reacciones de BRENDA (68% de todas las reacciones únicas), 3.191 de KEGG, 7.596
de MetaCyc y 444 de SABIO-RK ocurren solo en las bases de datos especificadas. 4.1. Comentarios de los usuarios
Se pueden encontrar 1348 reacciones en las cuatro bases de datos y 3542 en BRENDA,
KEGG y MetaCyc (ver Fig. 6). El rápido avance de la ciencia en las biociencias tiene una gran influencia en las
necesidades y expectativas de los científicos que acceden a las bases de datos
biológicas. Un contacto continuo con los usuarios a través del sitio web, en
Fig. 6. Distribución de reacciones únicas entre BRENDA, KEGG, MetaCyc y SABIO-RK en BKMS-react.
202
Machine Translated by Google
conferencias, cursos de enseñanza y cooperación son los requisitos esenciales para el comprende datos genómicos, información de nomenclatura de enzimas y mapas
desarrollo de infraestructuras de bioinformación orientadas a servicios. En base a estos metabólicos específicos del organismo. Las referencias bibliográficas se limitan a las
contactos y encuestas, los contenidos de datos en BRENDA se han ampliado continuamente obtenidas de la base de datos de clasificación de enzimas de la IUBMB. La característica
y el sitio web se ha renovado varias veces. Los contactos de los usuarios seguirán siendo principal de MetaCyc son las vías metabólicas y las enzimas, los genes y los sustratos y
un factor importante también en el desarrollo futuro de BRENDA. Se estableció un sistema cofactores fisiológicos implicados. No se incluyen inhibidores, ni datos cinéticos u otros
de tickets para proporcionar una interfaz web para que los usuarios envíen sus preguntas, datos enzimáticos.
sugieran nuevas enzimas, señalen inconsistencias en BRENDA o soliciten la integración Las estructuras 3D de proteínas enzimáticas se depositan y proporcionan en el Protein
de datos específicos en la base de datos. Data Bank PDB. Otras bases de datos, como FunTree (Furnham et al., 2012), que utiliza
la clasificación CATH para anotar y analizar familias de proteínas basadas en estructuras,
se basan en los datos cristalográficos depositados en ellas.
4.2. Tutoriales ÿ entrenamientos
Reactome (Fabregat et al., 2016) es una base de datos enfocada en humanos.
BRENDA ofrece diversas opciones para que los usuarios aprendan más sobre el Entre otras vías (señalización, transporte, expresión génica, etc.) describe procesos
contenido, el alcance y las diferentes herramientas, y cómo utilizar el sistema de información metabólicos en la célula. Su organización jerárquica sigue en gran medida la de Gene
de enzimas. El usuario puede estudiar los materiales de formación en línea, que contienen Ontology. La base de datos MEROPS (Rawlings et al., 2016) es un compendio especial de
una introducción, detalles sobre las funciones de búsqueda (búsqueda de ligandos rápida, peptidasas. La clasificación de familias y subfamilias se basa en la similitud de las
avanzada o de texto completo) o las funciones de búsqueda y exploración de ontologías secuencias de proteínas. Las enzimas modificadoras de carbohidratos se caracterizan en
(EC Explorer, BTO, TaxTree), secuencia y genomas. búsquedas y las herramientas de la base de datos CAZY (Lombard et al., 2014). La clasificación en familias y subfamilias se
visualización (mapas de palabras, mapas de caminos). Desde 2015, estos temas también basa principalmente en la similitud de secuencias de proteínas y el análisis filogenético.
se muestran en tutoriales en video que son particularmente útiles para principiantes. En el
pasado se realizaron sesiones de capacitación en varias universidades europeas.
Actualmente, en el contexto del proyecto de.NBI, se ofrecen cursos de capacitación de 2 Además, hay muchas otras bases de datos, en su mayoría más pequeñas, que
días. Estos están organizados para presentar la base de datos, iniciar discusiones y destacan aspectos específicos de las enzimas. Los mecanismos catalíticos de enzimas
demostrar aplicaciones prácticas. para 321 clases de EC están cubiertos en MACIE (Holliday et al., 2012) y EzCatDB
(Nagano et al., 2015), que cubre 871 enzimas diferentes según el tipo de reacción. En
SABIO-RK se pueden encontrar datos cinéticos detallados para una selección de
5. Discusión aproximadamente 17 300 reacciones catalizadas por enzimas. Las reacciones catalizadas
por enzimas se recopilan en RHEA (Morgat et al., 2017), un recurso de reacciones
BRENDA se inició en la segunda mitad de la década de 1980 en el laboratorio nacional bioquímicas curadas manualmente. Incluye las reacciones de los sitios web de nomenclatura
alemán de biotecnología cuando las enzimas comenzaron a explotarse a mayor escala de enzimas de la IUBMB (4794) más 4479 reacciones adicionales, incluidas las reacciones
como biocatalizadores para la producción de compuestos complejos y se hizo necesario de Swiss Lipids Knowledgebase y reacciones espontáneas que ocurren en sistemas
identificar enzimas adecuadas con la reacción correcta, especificidad de sustrato, y biológicos. (Aimo et al., 2015). La base de datos EAWAG-BBD (Ellis y Wackett, 2012) ,
estabilidad Comenzando con un objetivo bastante moderado de producir una especie de ahora ubicada en Suiza, se centra en la degradación de compuestos xenobióticos por parte
descripción general de una página para las clases de EC conocidas en ese momento que de microorganismos. Abarca ~1500 reacciones y 543 cepas de microorganismos.
estaba destinado a publicarse en forma de libro, la configuración inicial demostró ser
altamente preparada para el futuro como la forma de un altamente estructurado y se eligió
una representación de datos controlados que, mucho más tarde, podría convertirse
fácilmente en una base de datos relacional. 5.2. Uso de BRENDA ÿ casos de aplicación
El desarrollo de Internet, que fue capaz de transportar grandes cantidades de datos solo
desde mediados de los 90, ofreció la posibilidad de presentar los datos a través de la red, El sitio web de BRENDA es utilizado por 80 000 a 100 000 usuarios por mes.
primero en el EBI, desde 1999 directamente en la Universidad de Colonia. La gran mayoría de los usuarios está principalmente interesada en una o una pequeña
cantidad de enzimas. Por lo general, no citan a BRENDA en sus artículos ni mencionan la
Mientras tanto, BRENDA se ha convertido en una de las infraestructuras de URL, ni el artículo. Esto es diferente cuando los científicos utilizan una mayor parte de la
bioinformación más utilizadas en todo el mundo, a pesar de que el número de científicos información almacenada en BRENDA. Lamentablemente, el nombre BRENDA se eligió
dentro del equipo de BRENDA ha sido bastante bajo (1 a 5 a lo largo de los años, ahora antes de la era de Internet, por lo que, debido a que es idéntico a un nombre personal, es
4). Esto solo fue posible porque el equipo de BRENDA siempre tuvo una interacción imposible identificar la cantidad de páginas web que enlazan con BRENDA. Actualmente,
cercana con las diferentes comunidades de usuarios que trabajan con enzimas y respondió 1500 artículos citan publicaciones de BRENDA.
rápidamente al progreso científico en las biociencias, especialmente la secuenciación de
genes, proteínas y genomas, el progreso en el poder de cómputo, lo que permite elaborar El análisis de los títulos de estos documentos da una idea de la gama de aplicaciones.
datos procedimientos de integración y minería de texto y una mejora continua del motor de La breve selección que se muestra en la Fig. 7 no pretende calificar las aplicaciones, sino
consultas y la configuración informática. que se selecciona de aquellos documentos que se citan mucho más de 100 veces y deben
mostrar aplicaciones muy diversas. Además de la enzimología y la bioquímica, los
principales campos de uso de BRENDA incluyen la biotecnología, la investigación médica
5.1. BRENDA como recurso único para las biociencias y farmacéutica, la biología y el modelado de sistemas, la evolución y muchos otros. No se
mencionan aquí los artículos que describen otras bases de datos que dependen de los
Dada la amplia gama de parámetros específicos de enzimas y la cobertura de todo datos de BRENDA, como Transfac (Kaplun et al., 2016), ChEMBL (Bento et al., 2014),
tipo de enzimas de todos los organismos y el tamaño de la información que ofrece, Golm Metabolome Database (Hummel et al., 2013), the Catalytic Site Atlas (Furnham et
BRENDA es única. Esto se refleja en la gran cantidad de usuarios que acceden a la base al., 2014) y muchos otros.
de datos (hasta 100.000 usuarios por mes).
Por supuesto, hay otras bases de datos que proporcionan información metabólica y
de enzimas, datos sobre aspectos específicos de la enzima, que cubren una clase
específica de enzimas o brindan información sobre la ruta. Se discutirán brevemente los 5.3. BRENDA en infraestructura bioinformática de.NBI
más importantes.
La base de datos de secuencias anotadas UniProt contiene información funcional BRENDA cubre todo el complejo campo de la información relacionada con enzimas
básica sobre genes y proteínas secuenciados, incluidas las enzimas. KEGG (Enciclopedia en de.NBI (Red Alemana de Infraestructura de Bioinformática) y forma parte del centro de
de genes y genomas de Kyoto) servicio de Datos Biológicos. junto al
203
Machine Translated by Google
Fig. 7. Selección de títulos de publicaciones que representan los distintos casos de aplicación de BRENDA (Andreini et al., 2008; Bugrim et al., 2004; Chou and Voit, 2009; Chouchani et al., 2014; Duarte et al., 2007) ;
Feist et al., 2009; Hansen y Moran, 2011; Hollmann et al., 2011; Li et al., 2009; Shin et al., 2014; Shlomi et al., 2008; Sumner et al., 2003; Van Maris et al., 2007; Vary et al., 2007; Yamanishi et al., 2008).
204
Machine Translated by Google
BO, 2007. Reconstrucción global de la red metabólica humana basada en datos genómicos y bibliográficos. Li, W., Cowley, A., Uludag, M., Gur, T., McWilliam, H., Squizzato, S., Park, YM, Buso, N., Lopez, R., 2015. El EMBL-
proc. nacional Academia ciencia Estados Unidos 104, 1777–1782. EBI web de bioinformática y framework de herramientas programáticas . Ácidos Nucleicos Res. 43, W580–
Ellis, LB, Wackett, LP, 2012. Uso de la biocatálisis de la Universidad de Minnesota/ W584.
Base de datos de biodegradación para el estudio de la degradación microbiana. Microbio. información Exp. 2, 1. Lombard, V., Golaconda Ramulu, H., Drula, E., Coutombard, V., Golaconda Ramulu, H., Drula, E., Coutinho, PM,
FCAT, 1998. Terminologia Anatomica Terminología anatómica internacional. Thieme, Henrissat, B., 2014. La base de datos de enzimas activas en carbohidratos ( CAZy) en 2013. Ácidos nucleicos
Nueva York. Res. 42, D490–D495.
Fabregat, A., Sidiropoulos, K., Garapati, P., Gillespie, M., Hausmann, K., Haw, R., Jassal, B., Jupe, S., Korninger, McDonald, AG, Tipton, KF, 2014. Cincuenta y cinco años de clasificación de enzimas: avances y dificultades.
F., McKay, S., Matthews, L., May, B., Milacic, M., Rothfels, K., Shamovsky, V., Webber, M., Weiser, J., FEBRERO J. 281, 583–592.
Williams, M., Wu, G., Stein, L., Hermjakob, H., D'Eustachio, P., 2016. La base de conocimiento de la vía del McDonald, AG, Boyce, S., Tipton, KF, 2009. ExplorEnz: la fuente primaria de la
reactoma. Ácidos Nucleicos Res. Lista de enzimas IUBMB. Ácidos Nucleicos Res. 37, D593–D597.
44, D481–D487. Morgat, A., Lombardot, T., Axelsen, KB, Aimo, L., Niknejad, A., Hyka-Nouspikel, N., Coudert, E., Pozzato, M.,
Federhen, S., 2012. La base de datos de taxonomía del NCBI. Ácidos Nucleicos Res. 40, D136–D143. Pagni, M., Moretti, S. , Rosanoff, S., Onwubiko, J., Bougueleret, L., Xenarios, I., Redaschi, N., Bridge, A.,
Feist, AM, Herrgard, MJ, Thiele, I., Reed, JL, Palsson, BO, 2009. Reconstrucción de redes bioquímicas en 2017. Actualizaciones en Rhea, un recurso curado por expertos en reacciones bioquímicas. Ácidos Nucleicos
microorganismos. Nat. Rev. Microbiol. 7, 129–143. Res. 45, D415–D418.
Finn, RD, Clements, J., Arndt, W., Miller, BL, Wheeler, TJ, Schreiber, F., Bateman, A., Eddy, SR, 2015. Servidor Coordinadores de recursos, NCBI, 2015. Recursos de la base de datos del centro nacional de información
web HMMER: actualización de 2015. Ácidos Nucleicos Res. 43, W30–W38. biotecnológica. Ácidos Nucleicos Res. 44, D7–D19.
Nagano, N., Nakayama, N., Ikeda, K., Fukuie, M., Yokota, K., Doi, T., Kato, T., Tomii, K., 2015. EzCatDB: base de
Finn, RD, Coggill, P., Eberhardt, RY, Eddy, SR, Mistry, J., Mitchell, AL, Potter, SC, Punta, M., Qureshi, M., Sangrador- datos de reacciones enzimáticas, 2015 actualizar. Ácidos Nucleicos Res. 43, D453–D458.
Vegas, A., Salazar, GA , Tate, J., Bateman, A., 2016. La base de datos de familias de proteínas de Pfam: hacia
un futuro más sostenible. Ácidos Nucleicos Res. 44, D279–D285. Placzek, S., Schomburg, I., Chang, A., Jeske, L., Ulbrich, M., Tillack, J., Schomburg, D., 2017. BRENDA en 2017:
nuevas perspectivas y nuevas herramientas en BRENDA. Ácidos Nucleicos Res. 45, D380–D388.
Fox, NK, Brenner, SE, Chandonia, JM, 2014. SCOPe: clasificación estructural de proteínas extendida: integración
de datos SCOP y ASTRAL y clasificación de nuevas estructuras . Ácidos Nucleicos Res. 42, D304–309. Tutorial de presentación de ProteomeXchange: http://genesis.ugent.be/files/costore/practicals/
peptide_and_protein_identification_tutorial/source/software/PX_Submission/
Furnham, N., Sillitoe, I., Holliday, GL, Cuff, AL, Rahman, SA, Laskowski, RA, ProteomeXchange_Submission_Tutorial.pdf.
Orengo, CA, Thornton, JM, 2012. FunTree: un recurso para explorar la evolución funcional de las superfamilias Quester, S., Schomburg, D., 2011. EnzymeDetector: una función enzimática integrada pre
de enzimas definidas estructuralmente. Ácidos Nucleicos Res. 40, D776–D782. herramienta de dicción y base de datos. BMC Bioinf. 12, 376.
Ramirez-Gaona, M., Marcu, A., Pon, A., Guo, AC, Sajed, T., Wishart, NA, Karu, N., Djoumbou Feunang, Y.,
Furnham, N., Holliday, GL, de Beer, TA, Jacobson, JO, Pearson, WR, Thornton, JM, 2014. El atlas de sitios Arndt, D., Wishart, DS, 2017. YMDB 2.0: una versión significativamente ampliada de la base de datos del
catalíticos 2.0: catalogación de sitios catalíticos y residuos identificados en enzimas. Ácidos Nucleicos Res. 42, metaboloma de la levadura. Ácidos Nucleicos Res. 45, D440–D445.
D485–D489.
Gillespie, JJ, Wattam, AR, Cammer, SA, Gabbard, JL, Shukla, MP, Dalay, O., Rawlings, ND, Barrett, AJ, Finn, R., 2016. Veinte años de la base de datos MEROPS de enzimas proteolíticas: sus
Driscoll, T., Hix, D., Mane, SP, Mao, C., Nordberg, EK, Scott, M., Schulman, JR, Snyder, EE, Sullivan, DE, sustratos e inhibidores. Ácidos Nucleicos Res. 44, D343–D350.
Wang, C., Warren, A., Williams, KP, Xue, T., Yoo, HS, Zhang, C., Zhang, Y., Will, R., Kenyon, RW, Sobral,
BW, 2011. PATRIC: el recurso completo de bioinformática bacteriana con un enfoque en especies patógenas Rogers, FB, 1963. Encabezamientos de temas médicos. Toro. Medicina. Libra Asoc. 51, 114–116.
humanas . Infectar. inmune 79, 4286–4298. Söhngen, C., Chang, A., Schomburg, D., 2011. Desarrollo de un esquema de clasificación para
información enzimática relacionada con la enfermedad. BMC Bioinf. 12, 329.
Greene, CS, Krishnan, A., Wong, AK, Ricciotti, E., Zelaya, RA, Himmelstein, DS, Söhngen, C., Podstawka, A., Bunk, B., Gleim, D., Vetcininova, A., Reimer, LC, Ebeling, C., Pendarovski, C.,
Zhang, R., Hartmann, BM, Zaslavsky, E., Sealfon, SC, Chasman, DI, FitzGerald, GA, Dolinski, K., Grosser, Overmann, J., 2016. BacDive: la bacteria base de metadatos de diversidad en 2016. Nucleic Acids Res. 44,
T., Troyanskaya, OG, 2015. Comprender la función multicelular y la enfermedad con tejido humano -redes D581–D585.
específicas. Nat. Gineta. 47, 569–576. Santos, A., Tsafou, K., Stolte, C., Pletscher-Frankild, S., O'Donoghue, SI, Jensen, LJ,
Gremse, M., Chang, A., Schomburg, I., Grote, A., Scheer, M., Ebeling, C., Schomburg, D., 2011. The BRENDA 2015. Comparación exhaustiva de conjuntos de datos de expresión de tejidos a gran escala. Par. J. 3, e1054.
Tissue Ontology (BTO): el primer ontología de todos los organismos para fuentes de enzimas. Ácidos Nucleicos
Res. 39, D507–D513. Scheer, M., Grote, A., Chang, A., Schomburg, I., Munaretto, C., Rother, M., Söhngen, C., Stelzer, M., Thiele, J.,
Hansen, AK, Moran, NA, 2011. La expresión del genoma del áfido revela la cooperación entre el huésped y el Schomburg, D., 2011. BRENDA: el sistema de información de enzimas en 2011. Ácidos nucleicos. Res. 39,
simbionte en la producción de aminoácidos. proc. nacional Academia ciencia EE. UU. 108, 2849–2854. D670–D676.
Schomburg, D., Schomburg, I. (2001–2006). Manual Springer de enzimas. 2ª ed.
Harhay, GP, Smith, TP, Alexander, LJ, Haudenschild, CD, Keele, JW, Matukumalli, LK, Schroeder, SG, Van Tassell, Springer, Heidelberg.
CP, Gresham, CR, Bridges, SM, Burgess, SC, Sonstegard, TS, 2010 Un atlas de expresión génica bovina Schomburg, D., Schomburg, I., BRENDA: de una base de datos a un centro de excelencia.
revela nuevas características distintivas del tejido y evidencia para mejorar la anotación del genoma. Genoma Systembiologie.de Int. ed. 10, 2016, 18–21.
Biol. Schomburg, D., Salzmann, M., Stephan, D. (1990–1998). Manual de enzimas, vol. 1–17.
11, R102. Springer, Heidelberg.
Hastings, J., de Matos, P., Dekker, A., Ennis, M., Harsha, B., Kale, N., Muthukrishnan, V., Owen, G., Turner, S., Schomburg, I., Hofmann, O., Baensch, C., Chang, A., Schomburg, D., 2000. Datos de enzimas e información
Williams, M. , Steinbeck, C., 2013. La ontología y la base de datos de referencia ChEBI para la química metabólica: BRENDA, un recurso para la investigación en biología, bioquímica y medicina. Función génica.
biológicamente relevante: mejoras para 2013. Nucleic Acids Res. 41, D456–D463. Dis. 3–4, 109–118.
Schomburg, I., Chang, A., Hofmann, O., Ebeling, C., Ehrentreich, F., Schomburg, D., 2002.
Heller, SR, McNaught, A., Pletnev, I., Stein, S., Tchekhovskoi, D., 2015. InChI, la IUPAC BRENDA: un recurso para datos de enzimas e información metabólica. Tendencias Bioquímica.
identificador químico internacional. J. Cheminform. 7, 23. ciencia 27, 54–56.
Holliday, GL, Andreini, C., Fischer, JD, Rahman, SA, Almonacid, DE, Williams, ST, Pearson, WR, 2012. MACiE: Schomburg, I., Chang, A., Placzek, S., Söhngen, C., Rother, M., Lang, M., Munaretto, C., Ulas, S., Stelzer, M.,
exploración de la diversidad de reacciones bioquímicas. Grote, A., Scheer, M., Schomburg, D., 2013. BRENDA en 2013: reacciones integradas, datos cinéticos, datos
Ácidos Nucleicos Res. 40, D783–D789. de función enzimática, clasificación mejorada de enfermedades : nuevas opciones y contenidos en BRENDA.
Hollmann, F., Arends, IWCE, Buehler, K., Schallmey, A., Bühler, B., 2011. Oxidaciones mediadas por enzimas Ácidos Nucleicos Res. 41, D764–D772.
para el químico. química verde. 13, 226–265. Shin, S.-Y., Fauman, EB, Petersen, A.-K., Krumsiek, J., Santos, R., Huang, J., Arnold, M., Erte, I., Forgetta, V., Yang,
Hummel, J., Strehmel, N., Bölling, C., Schmidt, S., Walther, D., Kopka, J., 2013. Misa T.-P., Walter, K., Menni, C., Chen, L., Vasquez, L., Valdes, AM, Hyde, CL, Wang, V., Ziemek, D., Roberts, P. ,
búsqueda y análisis espectral usando la base de datos del metaboloma de golm. El manual de metabolómica Xi, L., Grundberg, E., Waldenberger, M., Richards, JB, Mohney, RP, Milburn, MV, John, SL, Trimmer, J., Theis,
vegetal. Wiley-VCH Verlag GmbH & Co. KGaA, págs. 321–343. FJ, Overington, JP, Suhre, K., Brosnan, MJ, Gieger, C., Kastenmüller, G., Spector, TD, Soranzo, N., 2014. Un
Sitio web de la IUPAC: https://iupac.org/. atlas de influencias genéticas en los metabolitos de la sangre humana. Nat. Gineta. 46, 543–550.
Jewison, T., Su, Y., Disfany, FM, Liang, Y., Knox, C., Maciejewski, A., Poelzer, J., Huynh, J., Zhou, Y.,
Arndt, D., Djoumbou , Y., Liu, Y., Deng, L., Guo, AC, Han, B., Pon, A., Wilson, M., Rafatnia, S., Liu,
P., Wishart, DS, 2014. SMPDB 2.0: grandes mejoras en la base de datos de rutas de moléculas Shlomi, T., Cabili, MN, Herrgard, MJ, Palsson, BO, Ruppin, E., 2008. Predicción basada en redes del metabolismo
pequeñas. Ácidos Nucleicos Res. 42, D478–D484. específico de tejido humano. Nat. Biotecnología. 26, 1003–1010.
Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M., Tanabe, M., 2016. KEGG como recurso de Sillitoe, I., Lewis, TE, Cuff, A., Das, S., Ashford, P., Dawson, NL, Furnham, N.,
referencia para la anotación de genes y proteínas. Ácidos Nucleicos Res. 44, D457–D462. Laskowski, RA, Lee, D., Lees, JG, Lehtinen, S., Studer, RA, Thornton, J., Orengo, CA, 2015. CATH:
anotaciones estructurales y funcionales completas para secuencias del genoma. Ácidos Nucleicos
Kaplun, A., Krull, M., Lakshman, K., Matys, V., Lewicki, B., Hogan, JD, 2016. Res. 43, D376–D381.
Establecimiento y validación de regiones reguladoras para la anotación de variantes y el análisis de Sumner, LW, Mendes, P., Dixon, RA, 2003. Metabolómica vegetal: fitoquímica a gran escala en la
expresiones. BMC Genomics 17 (2), 393. era de la genómica funcional. Fitoquímica 62, 817–836.
Kim, S., Thiessen, PA, Bolton, EE, Chen, J., Fu, G., Gindulyte, A., Han, L., He, J., He, S., Shoemaker, Suzek, BE, Wang, Y., Huang, H., McGarvey, PB, Wu, CH, 2015. Consorcio UniProt.
BA, Wang, J ., Yu, B., Zhang, J., Bryant, SH, 2016. Bases de datos de sustancias y compuestos de Clústeres UniRef: una alternativa completa y escalable para mejorar las búsquedas de similitud
PubChem. Ácidos Nucleicos Res. 44, D1202–D1213. de secuencias. Bioinformática 15 (31), 926–932.
Krogh, A., Larsson, B., von Heijne, G., Sonnhammer, EL, 2001. Predicción de la topología de proteínas El Consorcio de ontología de genes, 2015. Consorcio de ontología de genes: en el futuro. Nucleico
transmembrana con un modelo oculto de Markov: aplicación a genomas completos . J. Mol. Biol. Ácidos Res. 43, D1049–D1056.
305, 567–580. El consorcio UniProt, 2017. UniProt: la base de conocimiento universal de proteínas. Nucleico.
Lang, M., Stelzer, M., Schomburg, D., 2011. BKM-react, una base de datos de reacciones bioquímicas Ácidos Res. 45, D158–D169.
integradas. BMC Bioquímica. 12, 42. Van Maris, AJA, Winkler, AA, Kuyper, M., De Laat, WTAM, Van Dijken, JP, Pronk, JT, 2007. Desarrollo
Lee, YS, Krishnan, A., Zhu, Q., Troyanskaya, OG, 2013. Clasificación consciente de ontología de señales de una fermentación eficiente de xilosa en Saccharomyces cerevi siae: xilosa isomerasa como
de tejido y tipo celular en perfiles de expresión génica a través de plataformas y tecnologías . componente clave. Adv. Bioquímica Ing. Biotecnología. 108, 179–204.
Bioinformática 29, 3036–3044.
Li, B., Krishnan, VG, Mort, ME, Xin, F., Kamati, KK, Cooper, DN, Mooney, SD, Vary, PS, Biedendieck, R., Fuerch, T., Meinhardt, F., Rohde, M., Deckwer, W.-D., Jahn, D., 2007. Bacillus
Radivojac, P., 2009. Inferencia automatizada de mecanismos moleculares de enfermedad a partir megaterium: de una simple bacteria del suelo a una proteína industrial anfitrión de la producción.
de sustituciones de aminoácidos. Bioinformática 25, 2744–2750. aplicación Microbiol. Biotecnología. 76, 957–967.
205
Machine Translated by Google
Volkamer, A., Kuhn, D., Grombacher, T., Rippmann, F., Rarey, M., 2012. Combinando Wittig, U., Rey, M., Kania, R., Bittkowski, M., Shi, L., Golebiewski, M., Weidemann, A., Müller, W., Rojas, I., 2014.
medidas globales y locales para predicciones de farmacocapacidad basadas en la estructura. J. Chem. información Challenges for an Base de datos de cinética de reacciones enzimáticas.
Modelo. 52, 360–372. FEBRERO J. 281, 572–582.
Wittig, U., Kania, R., Golebiewski, M., Rey, M., Shi, L., Jong, L., Algaa, E., Weidemann, A., Sauer-Danzwith, H., Mir, S. ., Yamanishi, Y., Araki, M., Gutteridge, A., Honda, W., Kanehisa, M., 2008. Predicción de redes de interacción fármaco-
Krebs, O., Bittkowski, M., Wetsch, E., Rojas, I., Müller, W., 2012. SABIO-RK: base de datos para la cinética de objetivo a partir de la integración de espacios químicos y genómicos. Bioinformática 24, i232–240.
reacciones bioquímicas. Ácidos Nucleicos Res.
40, D790–D796.
206