Está en la página 1de 4

Los genes marcadores como evaluación a las comunidades microbianas como uno de los

principales genes se pueden encontrar el 16s rRNA.


Las cantidades de datos no están estandarizados. El enfoque de las lecturas resultantes de la
plataforma de alto rendimiento clasifica y agrupa en cuestión de su similitud de secuencia con el
conjunto de datos taxonómicos de referencia se denomina phylotyping. Este agrupamiento estará
sesgado en la clasificación existente incluido sus errores de clasificación.
Hay otro en foque donde las lecturas de frecuencia se agrupan en función de secuencia. En lugar
de conjunto taxonómico, referencia a unidades taxonómicas operativas (OTUS). Para la
clasificación de OTU se una frecuencia de un umbral del 97% debido a errores de secuenciación.
Por otro lado, ya se ha sugerido la cohorte del 97% subestima la diversidad microbiana total, en la
actualidad se utiliza un limite del 98,65% para delinear una especie, organismos que comparten
este limite de sus secuencias de 16s rRNA pueden o no representar la misma especie.
En general la secuencia fenotípica o las secuencias del genoma completo no se pueden obtener
para la mayoría de las especies dentro de las comunidades microbianes estudiadas. Solo se puede
confiar en el en el gen 16s rRNA para asignar una clase taxonómica. Las plataformas principales
para denotar una pequeña subregión como (v3 v4) del gen 16s rRNA. El grado de conservación de
cada región puede variar el linaje.
Materiales y métodos
La mayor parte de este trabajo de basan en sepas tipo almacenadas en la base de datos silva de
alta calidad y seleccionada. La versión 119 de esta base de datos donde agrupa todas las especies
en función de su familia taxonómica, omitiendo aquellas familias que contienen en general menos
de 3 especies o aquellas con clasificación pendientes. Esta base de datos contiene para cada
especie solo una cepa tipo representada por una sola copia del gen 16s rRNA. Para estudiar el nivel
de variabilidad dentro de cada familia taxonómica, las secuencias de rARN 16s seleccionadas se
analizaron utilizando el paquete de software SSU (ALIGN) para determinar el grado de la
conservación evolutiva para cada posición dentro del gen 16s rRNA por familia, que se puede
cuantificar por familia, que se puede cuantificar asignado una puntación de bits de conservación a
cada posición dentro de este gen 16s rRNA que (que oscila entre 0 y 2 donde 0 indica una posición
muy variable y 2 una posición muy conservada).
FORMULA
bit score=log 2 ( 4 )−¿ ¿ ¿)
b
donde W es la longitud de la alineación y q 1es la frecuencia del nucleótido b en la posición l en la
alineación. Se definieron 9 regiones hipervariables junto con las regiones conservadas del 16s
secuencias de ARN utilizando el gen rRNA de Escherillia coli 16s como referencia utilizaremos la
mejora promedio de nuestro método de agrupación en clústeres DynamiC en comparación con el
enfoque predeterminado que usa un límite fijo del 97 % durante la agrupación en clústeres de
OTU. 

Número de ¿ OTUs using Dynamic−número de OTUs using 97 % cut−of ¿ ¿


Correct number of species
Resultados

En el escenario más ideal, cada OTU representaría una especie taxonómica, Posteriormente, para
cada familia taxonómica por separado, la conservación de cada posición dentro del gen 16S rRNA
se traduce en una puntuación de bits, que se trazó a través de un mapa de calor. Aunque las
familias seleccionadas contienen un número comparable de especies, cada familia mostró un perfil
diferente en cuanto al nivel de conservación en sus distintas regiones. Además, al comparar dos
familias, el patrón de su conservación en las diversas regiones no es consistente, por ejemplo, para
la familia Methanomicrobiaceae y la familia Methanosarcinaceae, aunque pertenecen a la misma
clase taxonómica, la primera familia muestra significativamente más conservación en V9 en
comparación con la última familia, mientras que lo contrario es cierto para la región V4.

Robustez del agrupamiento de OTU al combinar diferentes regiones


hipervariables y conservadas de 16S rRNA

El objetivo de este análisis es evaluar la posible fusión errónea de diferentes especies dentro de la
misma OTU. En el escenario más ideal, cada especie dentro de este análisis estaría representada
por una sola OTU, lo que implica que el número total de OTU sería igual al número de especies
analizadas.

Imagen El análisis se repitió dos veces, la primera vez se realizó sobre el número total de especies
dentro de cada familia, mientras que la segunda vez se realizó después de limpiar la base de datos
conservando solo una especie representativa por familia. La cantidad total de OTU que deben
devolverse es 10.857 para la base de datos completa y 9.199, 8.246 y 5.822 para la base de datos
seleccionada en base a un corte de 99 %, 98 % y 97 %, respectivamente.

Cuando se aplica el 97% de similitud comúnmente utilizado como límite para el paso de
agrupamiento de OTU en la base de datos LTP completa, según la combinación de regiones
hipervariables probadas, todas las especies se agrupan en un número total de OTU entre 2586 y
7948 (es decir, entre el 24% y el 73% del número esperado de UTO, respectivamente). Además, al
investigar el poder discriminatorio del amplicón de uso común que cubre las regiones V3–V4
utilizando la plataforma Illumina MiSeq, este enfoque de umbral del 97 % pudo devolver el 42 %
del número esperado de OTU. Por el contrario, para las regiones V1 y V2 por separado, el nivel de
sobrefusión, es decir, agrupar dos secuencias de diferentes especies en una OTU, pero que debería
terminar en OTU separadas, se encontró muy comparable al de la longitud total del gen 16S rRNA.

Corte dinámico dependiente de la familia para el agrupamiento de OTU.

Se desarrollo un nuevo que determina dinámicamente los limites aplicados en al paso de


agrupamiento de OTU.  El enfoque desarrollado dentro de este trabajo generalmente consta de
dos pasos: un paso de entrenamiento para cada familia taxonómica, la puntuación de corte para
un amplicón específico se calcula utilizando una base de datos de referencia (en nuestro caso, la
LTP), según la base de datos taxonómica LTP, se deriva el fragmento de secuencia
correspondiente a este amplicón, se deriva el fragmento de secuencia correspondiente a este
amplicón, Como consideramos que el 2,5% de estas distancias son valores atípicos, la distancia
correspondiente al percentil 2,5 se utiliza como límite de agrupación de OTU. Análisis de la
tabla aquí (primer paso cada lectura se asigna a una familia taxonómica específica). Un
segundo paso de ejecución, donde se produjeron tablas de búsqueda para cada uno de los
enfoques de ventana deslizante mencionados anteriormente (ventanas de 300 y 500 pb,
utilizando un desplazamiento de 50 pb). Usando una tabla de búsqueda de este tipo para crear
OTU por familia taxonómica, observamos que la fusión errónea de diferentes especies dentro de
la misma OTU se redujo al 24 %, mientras que el límite de agrupación predeterminado dio como
resultado una sobrefusión del 44 %. Sin embargo, dado que el puntaje de corte promedio
calculado sobre la tabla de búsqueda completa fue de 2,2 % y 2,4 % para 300 y 500 pb,
respectivamente, también comparamos nuestro enfoque con un enfoque tradicional de
agrupamiento de OTU utilizando un puntaje de distancia del 2 % como punto de corte. notamos
una mejora (es decir, un agrupamiento menos erróneo) con nuestro método en comparación
con el enfoque de corte rígido del 2 % (el 15 % de las especies se fusionó incorrectamente con
nuestro enfoque en comparación con el 22 % que utilizó el enfoque rígido) (datos no
mostrados). la herramienta DynamiC también se probó en los amplicones más utilizados hoy en
día, es decir, V1–V2, V3–V4, V4 y V4–V5 (ver archivo complementario 4), mostrando así una
mejora promedio del 7 %. 25 %, 22 % y 28 % para las regiones V1–V2, V3–V4, V4 y V4–V5,
respectivamente. Este método se tienen muchas dudas respecto a la eficiencia del tamaño de la
familia taxonómica.

Análisis comparativo usando datos simulados

Sin embargo, no se pudieron detectar las 56 especies en todas las muestras, es decir, no
se encontraron lecturas de secuenciación para algunas especies que teóricamente
deberían estar presentes. Esto podría deberse al hecho de que algunas de las especies
se agregaron en bajas concentraciones. Por lo tanto, el número de especies
detectables, como se informa en el archivo complementario 5, es en muchos casos
inferior a 56. En el caso más óptimo, el paso de agrupamiento de OTU debería devolver
un número de OTU correspondiente al número de especies detectables presentes en la
comunidad simulada.
Al inspeccionar el porcentaje de especies perdidas debido a la fusión excesiva, nuestro
enfoque propuesto conduce a una pérdida promedio de cuatro OTU en comparación
con seis OTU al aplicar el límite predeterminado del 97 %. En particular, nuestro
enfoque pudo separar con éxito las lecturas pertenecientes a especies estrechamente
relacionadas dentro de las comunidades simuladas como Chlorobium limicola, C. .
Aplicación en muestras de la vida real

Para ilustrar el rendimiento de nuestra metodología de tabla de búsqueda en


comparación con el enfoque predeterminado que utiliza un umbral fijo del 3
%, aplicamos ambos enfoques en muestras de microbiomas obtenidas de una amplia
gama de hábitats, es decir, microbiomas intestinales humanos, microbiomas del suelo y
de la rizosfera, microbiomas relacionados con digestión anaeróbica y microbiomas de
agua de enfriamiento.

Análisis de imagen

Para ilustrar en qué medida la aplicación de nuestro enfoque propuesto afectaría la


riqueza de especies, volvimos a evaluar la riqueza del conjunto de datos completo de
V3–V5 del conjunto de datos HMP para individuos sanos utilizando ambos
enfoques , produciendo 36 000 OTU y 29 000 respectivamente para la tabla de búsqueda
y el enfoque predeterminado , es decir, un aumento del 24 %. Estos resultados sugieren
que el enfoque predeterminado podría subestimar la riqueza de especies.

También podría gustarte