Está en la página 1de 5

ARTICULO DEDUPLICACIÓN: Es una técnica especializada de compresión de datos para eliminar copias duplicadas de datos

repetidos.

Jane Hubert . Jean-Marc Nuzillard . Jean-Hugues Renault Phytochem Rev (2017) 16:55–95

Estrategias de deduplicación en la investigación de productos naturales: ¿cuántas herramientas y metodologías respaldan el


mismo concepto? Revisión 1990-2004

- Rápida identificación de sustancias conocidas para concentrar los esfuerzos en el descubrimiento de sustancias nuevas

Dereplicación" fue dada por Beutler et al. en ( 1990 ) como "un proceso de identificación rápida de quimotipos conocidos" 
evaluar la actividad de una variedad de extractos de plantas terrestres y marinas utilizando un ensayo de unión al receptor de forbol
dibutirato (PDBu) simple e identificar rápidamente los compuestos responsables de esta actividad sin invertir tiempo en el
fraccionamiento tradicional guiado por bioensayos o la elucidación de la estructura completa procedimientos

- estrategias clave para mejorar el rendimiento de los programas de selección de productos naturales
- 1990 "un proceso de identificación rápida de quimiotipos conocidos"
- En otros casos, la duplicación está totalmente integrada en estudios metabolómicos para el análisis químico no dirigido de
colecciones de extractos naturales o para la identificación dirigida de una clase predeterminada de metabolitos. la
metabolómica es el "estudio sistemático de las huellas únicas que dejan los procesos celulares específicos en su paso"

Introducción

-El rendimiento de los programas de selección de productos naturales sigue estando muy limitado por las inversiones en equipo,
mano de obra y tiempo requeridas para el aislamiento y la elucidación estructural de nuevos metabolitos con potentes propieda des
biológicas.

-Los sistemas de separación de palabras muy eficientes entre los instrumentos de separación y espectroscóp icos ahora permiten la
identificación de estructuras moleculares altamente complejas incluso dentro de mezclas complejas de compuestos

Problemas en el redescubrimiento  terminación en investigación

- Redescubrimiento luego de un largo tiempo de etapas de purificación e identificación


- Investigación redundante de cepas microbiológicas con problemas toxonomicos
- Seleccionar material que no
se conoce su posible actividad
biológica

-300000 compuestos descubiertos en


la biodiversidad, pero no todos tienen
investigación en actividad biológica.

- Base de datos usada: en la base de


datos de Web of Science reveló 358
resultados

-14 que no tratan con productos naturales y 30 resúmenes de reuniones no se tuvieron en cuenta

Categorías
Consideraciones técnicas.
Tecnica CL.
-La duplicación se refiere a la rápida identificación de metabolitos secundarios conocidos, es obvio que se requieren métodos
analíticos confiables, robustos, rápidos y sensibles para realizar un procedimiento eficiente de duplicación.
Sistemas cromatográficos analíticos y posibilidades de separación.
-La HPLC es robusta, fácil de usar y aplicable a una amplia variedad de compuestos y matriz compleja.
- (UHPLC) ha permitido una disminución notable de los tiempos de separación al tiempo que mejora la sensibilidad, la resolución y
la reproducibilidad en comparación con la HPLC.
-LC control de calidad, la caracterización química de extractos de plantas crudas o la huella digital de alto rendimiento
-(TLC o HPTLC)  técnica cromatográfica utilizada con frecuencia para el análisis preliminar de extractos naturales o para la
identificación rápida de compuestos conocidos dentro de mezclas simplificadas obtenidas después del prefraccionamiento de una
muestra natural cruda localización de metabolitos biológicamente activos directamente en placas de TLC.
-No se detallan, se usan con poco frecuencia…cromatografía de corriente contracorriente de alta velocidad (HSCCC), la
cromatografía de partición centrífuga (CPC), la cromatografía de fluidos supercríticos (SFC) o la electroforesis capilar (CE)
Detectores.
-DAD Espectros y tiempo de retención (Deduplicación con std)
-debido a la información estructural muy limitada recuperada de los sistemas de detección de UV o DAD simples, generalmente se
requieren otros instrumentos más potentes para evaluar la diversidad estructural de los productos naturale s.
Detección basada en MSR y RMN en flujos de trabajo de eliminación de duplicados de productos naturales

-EMtécnica de detección de alto rendimiento sensible, rápida y precisa hace uso de: masa exacta, la composición elemental, los
aductos y los patrones de fragmentación. Para trazas por cantidad pequeña para análisis.

-Detección de alto paso: LC acoplados a espectrómetros de masas de alta resolución como el Tiempo de vuelo (TOF), la Transformada
de Fourier (FT) o los dispositivos Orbitrap

-Moleculas pequeñas y volátiles o hidrófobas CG-EM , dereplicación de ácidos grasos

Desventaja: variabilidades en los conjuntos de datos sin procesar obtenidos de un analizador de masas a otro, lo que dificulta en gran
medida la creación de bases de datos de MS / MS

-La interpretación de los datos de MS es otro tema crítico que limita la velocidad de las estrategias de eliminación de datos

-Algunos software que sirven para el procesado en masas: MetFusion que usa subestructuras para evaluar similitudes espectrales y
químicas, ISIS que se basa en la predicción de patrones de fragmentación para la comparación de espectros, FingerID que compara
estructuras moleculares después de la predicción de características estructurales y FT-BLAST que se basa en el uso de un Base de
datos del árbol de fragmentación.

-Uso de red molecular, luego de obtener el patron de fragmentación, se hace la construcción molecular dependiendo del tipo de
compuesto Ej: diversidad química entre las cianobacterias marinas, para detectar automáticamente los noribosómicos relacionados
estructuralmente. péptidos en hongos filamentosos, o para investigar las interacciones moleculares interkingdom y los procesos de
intercambio metabólico dentro de las comunidades microbianas.

-RMNCon la llegada de los imanes de campo alto, las sondas capilares y criogénicas, la menor sensibilidad de la RMN en
comparación con los métodos analíticos basados en la EM ha sido compensada

-se han introducido productos de software y hardware sofisticados en los últimos años para promover análisis de RMN de alto
rendimiento, como los scripts NMRbot Python

Desventaja: Solventes, complejidad de patron de señales

-Con la llegada de los imanes de campo alto, las sondas capilares y criogénicas, la menor sensibilidad de la RMN en comparación
con los métodos analíticos basados en la EM ha sido compensada

-C-13 es poco abundante y bajo giromagnetico (siendo el 25% del de H)

Ventajas:

-C13, rango amplio de desplazamiento reduce superposición de señales, desacoplamiento

-1D-DOSY cuando se combina con experimentos de RMN 1D o 2D permite la adquisición de dato s espectrales completos de
polisacáridos de alto peso molecular directamente de extractos de agua caliente en bruto de especies de hongos sin necesidad de
ninguna etapa de purificación
Métodos LC / NMR o LC / SPE / NMR combinan el rendimiento de separación de la cromatografía líquida, el efecto de
concentración de SPE y la información estructural proporcionada por NMR

Ventajas:

-En el caso de LC / SPE / NMR, la principal ventaja es que la captura de picos en los cartuchos SPE aumenta significativamente la
concentración de analito y, por lo tanto, proporciona acceso a datos de RMN 2D en poco tiempo.
- LC / NMR se ha expandido rápidamente en los últimos años para la eliminación de duplicados de productos naturales,
especialmente para la comparación directa de perfiles de metabolitos en extractos pequeños usando 1H NMR antes de seguir
invirtiendo en procesos de aislamiento de escala preparativa más laboriosos
El papel crucial de las bases de datos de productos naturales y las herramientas informáticas.

-El éxito de un procedimiento de eliminación de datos para lograr la rápida caracterización de compuestos conocidos depende en
gran medida de la disponibilidad y la calidad de las bases de datos de productos naturales o las bibliotecas de cepas.

-Las bases de datos más completas incluyen el Dictionary of Natural Products (DNP) que contiene más de 260,000 estructuras
moleculares, el Dictionary of Marine Natural Products que contiene alrededor de 48,000 estructuras moleculares extraídas de
organismos marinos, el ACD / Labs NMRy las bases de datos ACD / Spectrus que proporcionan datos estructurales y espectrales
de muchos miles de compuestos sintéticos y naturales, la Base de Datos de Productos Naturales de la UCSD que contiene un gran
depósito de microorganismos y exosimbiontes, la Base de Datos del Metaboloma Humano , Napralert , la base de datos NuBBE
dedicada a la biodiversidad brasileña. La base de datos de secuencias de proteínas UniProtKB / Swiss -Prot, KnapSack , que es una
base de datos completa de relación de especies de plantas y metabolitos, y MarinLit , AntiMarin , AntiBase o Seaweed
MetaboliteBases de datos dedicadas a estructuras moleculares marinas y / o microbianas.

- Además de las bases de datos, las herramientas informáticas y las estadísticas multivariables han mejorado considerablemente la
automatización del procesamiento de datos analíticos y han contribuido sustancialmente a la mejora actual de las estrategias

Dereplicación y metabolómica: ¿Dónde trazar la línea?

-"perfil químico"  detección y / o identificación sistemática y / o cuantificación de una gama de compuestos


naturales. Dependiendo del propósito final y de la técnica analítica disponible, el perfilado químico se puede realizar como un análisis
de huellas dactilares (análisis global) o como un perfil específico. Un análisis de huellas dactilares representa un análisis global en
el que no se identifican necesariamente todos los metabolitos detectados.

-Metabolómica: análisis cualitativo y cuantitativo de todo el conjunto de metabolitos de bajo peso molecular presentes en un sistema
biológico, también cae dentro del alcance de un perfil químico. Sin embargo, más específicamente, la metabolómica es un campo
interdisciplinario que combina sistemas analíticos de alta resolución, estadísticas multivariadas y herramientas de minería de datos,
conocimiento químico y biológico y, a veces, modelado de redes metabólicas en un intento por comprender vías metabólicas,
relaciones gen-función o estados de Un organismo en respuesta a cambios ambientales, perturbaciones de drogas, filogenia,
variabilidades genotípicas o fenotípicas

- enfoque metabolómico dirigido para analizar un conjunto de metabolitos definidos en una muestra, mientras que un enfoque
metabólico "no dirigido" mucho más completo consiste en la detección y / o cuantificación de tantos metabolitos como sea posible
sin un conocimiento a priori de los objetivos de metabolitos.

- enfoques metabólicos dirigidos y no dirigidos ya han demostrado fuertes potencialidades, principalmente para el control de calidad
de los medicamentos herbarios, para la determinación de marcadores químicos en especies de plantas o para evaluar las correla ciones
entre la bioactividad y la composición

Identificación rápida de los principales compuestos en un solo extracto natural independientemente de la clase química
(DEREP1)

Establecer el perfil químico de un solo recurso natural utilizando un sistema analítico con guión y comparar directamente los datos
espectroscópicos obtenidos con las bibliotecas de metabolitos naturales.
-Se puede obtener fácilmente una visión global de las principales clases químicas
presentes en una especie natural y, en teoría, se pueden identificar rápidamente los
principales compuestos conocidos.
-Más de dos tercios de estos estudios se llevaron a cabo con extractos de plantas (base de
datos más desarrolladas), mientras que un grupo minoritario con esponjas marinas, algas
pardas y extractos de cianobacterias.
- flavonoides y los ácidos fenólicos siguen siendo, con mucho, los compuestos más
investigados, antrones, los iridoides, los terpenoides o los ácidos grasos.
- Otra ventaja es que, aunque la duplicación no proporciona información original sobre
nuevas estructuras químicas, los compuestos conocidos previamente todavía pueden
identificarse en el género
-la eficiencia de este enfoque de eliminación de datos depende en gran medida de la
calidad de las bibliotecas espectrales.

Flujos de trabajo de duplicación implicados en procedimientos de fraccionamiento


guiados por bioactividad (DEREP2)
-procedimientos de fraccionamiento guiado por bioactividad, en los cuales se
realizan ensayos farmacológicos o biológicos para determinar el aislamiento de los
constituyentes activos.
-evita perder tiempo y recursos al considerar inactivos, lo que implicaba
arbitrariamente compuestos "no interesantes", y se enfocaban solo en las
fracciones o metabolitos con una actividad biológica predefinida.
-con frecuencia se realiza un gran trabajo para purificar las fracciones bioactivas y
finalmente descubrir compuestos conocidos previamente .
-Plantas, en menor medida extractos marinos y microbianos.
-se basan con mayor frecuencia en LC / MS n y / o RMN para analizar las fracciones
biológicamente activas obtenidas después del pre-fraccionamiento del extracto
crudo.
Limitación: Sin embargo, se está volviendo evidente que los efectos biológicos de
un extracto natural probablemente se deban a un sinergismo de múltiples componentes .
- irrelevancia de la mayoría de los bioensayos in vitro en comparación con las condiciones in vivo o clínicas con re specto a la eficacia
y la biodisponibilidad de las muestras bajo examen

Procedimientos de eliminación de datos directamente aplicados a colecciones de extracto crudo (DEREP3)


-Extractos crudos de productos naturales se ha convertido en un paso crítico, ya sea para hacer frente a los potentes efectos sinérgicos
entre los componentes durante la evaluación biológica, o incluso para asegurar que el material que se examina sea interesante antes
de continuar con el fraccionamiento. o pasos de purificación.

- 30 extractos de algas de Nueva Zelanda mediante un método de RMN 2D basado


en la adición de espectros HSQC para construir una "máscara digital HSQC
apilada" que muestra fuertes similitudes entre los espectros como picos
intensos. Con el fin de mejorar las señales únicas presentes, lo que implica
compuestos potencialmente nuevos, la máscara se restó de cada espectro HSQC
individual. De esta manera, se aisló un nuevo bromofenol

-Una gama de estudios metabolómicos no dirigidos se ajustan perfectamente a las


estrategias de DEREP3 y proporcionan perspectivas interesantes, especialmente en
el perfil químico de extractos marinos o microbianos no explorados.

-El análisis directo de hongos directamente en extractos de fermentación utilizando


LC / MS, herramientas de reconocimiento de patrones y bases de datos se informó
en varios artículos como una alternativa eficiente para descubrir nuevas moléculas
con actividades desconocidas

Dereplicación y perfiles químicos específicos: dos términos que se derivan del


mismo enfoque (DEREP4)
-Analiza un grupo particular de moléculas que presentan un interés biológico o,
por el contrario, identificar componentes potencialmente tóxicos o no deseados de
extractos naturales crudos.

-Los enfoques DEREP4 también se usan comúnmente para evaluar la calidad de


los medicamentos botánicos que deben verificarse para determinar la autenticación,
contaminación e identificación de sustancias activas o validación de
seguridad. “marcadores químicos”

-los metabolitos naturales se analizaron mediante espectrometría de


masas. patrones de fragmentación muy similares.

Genética molecular y desreplicación taxonómica de cepas microbianas (DEREP5)


-obstaculizada actualmente por los laboriosos procesos de
aislamiento cuando se trabaja con caldos de cultivo y por la
limitada disponibilidad de bibliotecas estructurales y
espectrales para los metabolitos microbianos.
-Desarrollo de una serie de herramientas de eliminación de
datos basadas principalmente en características fenotípicas o
diferencias genéticas para seleccionar aislados microbianos a
nivel de especie.
El metagenoma se puede definir como un "genoma
colectivo" que incluye ADN microbiano aislado de todos los
microorganismos presentes en un hábitat.
Conclusión

Los procedimientos de duplicación ahora desempeñan un papel


destacado en el campo de la investigación de productos
naturales. El examen de todas las referencias bibliográficas
publicadas de 1990 a 2014 que involucran el concepto de
dereplicación revela claramente que se han desarrollado cinco
estrategias diferentes de eliminación gradual para cumplir objetivos específicos. El denominador común entre estos estudios es la
voluntad de acelerar el descubrimiento de sustancias biológicamente activas mediante la mejora de los métodos de caracterización de
los recursos naturales. La mayoría de los flujos de trabajo de eliminación de duplicados han abordado este problema mediante el uso de
estrategias de perfiles químicos dirigidos o no, a menudo en combinación con ensayos biológicos y herramientas informáticas para
evaluar la presencia de metabolitos activos en muestras naturales. mientras que otros han utilizado un enfoque taxonómico basado
principalmente en análisis genéticos para la clasificación y priorización de muestras. Es bastante claro que la calidad y la integridad de
las bases de datos de metabolitos pequeños y las bibliotecas de cepas microbianas siguen siendo los principales impedimentos para los
flujos de trabajo de eliminación de rendimiento de alto rendimiento. En consecuencia, el autor solo puede enfatizar la importancia de
encontrar una manera de vincular los datos espectrales recopilados entre laboratorios y, finalmente, homogeneizar estas bases de datos.

También podría gustarte