Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En el escenario más ideal, cada OTU representaría una especie taxonómica, Posteriormente, para
cada familia taxonómica por separado, la conservación de cada posición dentro del gen 16S rRNA
se traduce en una puntuación de bits, que se trazó a través de un mapa de calor. Aunque las
familias seleccionadas contienen un número comparable de especies, cada familia mostró un perfil
diferente en cuanto al nivel de conservación en sus distintas regiones. Además, al comparar dos
familias, el patrón de su conservación en las diversas regiones no es consistente, por ejemplo, para
la familia Methanomicrobiaceae y la familia Methanosarcinaceae, aunque pertenecen a la misma
clase taxonómica, la primera familia muestra significativamente más conservación en V9 en
comparación con la última familia, mientras que lo contrario es cierto para la región V4.
El objetivo de este análisis es evaluar la posible fusión errónea de diferentes especies dentro de la
misma OTU. En el escenario más ideal, cada especie dentro de este análisis estaría representada
por una sola OTU, lo que implica que el número total de OTU sería igual al número de especies
analizadas.
Imagen El análisis se repitió dos veces, la primera vez se realizó sobre el número total de especies
dentro de cada familia, mientras que la segunda vez se realizó después de limpiar la base de datos
conservando solo una especie representativa por familia. La cantidad total de OTU que deben
devolverse es 10.857 para la base de datos completa y 9.199, 8.246 y 5.822 para la base de datos
seleccionada en base a un corte de 99 %, 98 % y 97 %, respectivamente.
Cuando se aplica el 97% de similitud comúnmente utilizado como límite para el paso de
agrupamiento de OTU en la base de datos LTP completa, según la combinación de regiones
hipervariables probadas, todas las especies se agrupan en un número total de OTU entre 2586 y
7948 (es decir, entre el 24% y el 73% del número esperado de UTO, respectivamente). Además, al
investigar el poder discriminatorio del amplicón de uso común que cubre las regiones V3–V4
utilizando la plataforma Illumina MiSeq, este enfoque de umbral del 97 % pudo devolver el 42 %
del número esperado de OTU. Por el contrario, para las regiones V1 y V2 por separado, el nivel de
sobrefusión, es decir, agrupar dos secuencias de diferentes especies en una OTU, pero que debería
terminar en OTU separadas, se encontró muy comparable al de la longitud total del gen 16S rRNA.
Sin embargo, no se pudieron detectar las 56 especies en todas las muestras, es decir, no
se encontraron lecturas de secuenciación para algunas especies que teóricamente
deberían estar presentes. Esto podría deberse al hecho de que algunas de las especies
se agregaron en bajas concentraciones. Por lo tanto, el número de especies
detectables, como se informa en el archivo complementario 5, es en muchos casos
inferior a 56. En el caso más óptimo, el paso de agrupamiento de OTU debería devolver
un número de OTU correspondiente al número de especies detectables presentes en la
comunidad simulada.
Al inspeccionar el porcentaje de especies perdidas debido a la fusión excesiva, nuestro
enfoque propuesto conduce a una pérdida promedio de cuatro OTU en comparación
con seis OTU al aplicar el límite predeterminado del 97 %. En particular, nuestro
enfoque pudo separar con éxito las lecturas pertenecientes a especies estrechamente
relacionadas dentro de las comunidades simuladas como Chlorobium limicola, C. .
Aplicación en muestras de la vida real
Análisis de imagen