Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4genoma Ensamble Hydractiniaenes 230908 161252
4genoma Ensamble Hydractiniaenes 230908 161252
com
G3, 2023,13(8),jkad107
https://doi.org/10.1093/g3journal/jkad107 Acceso
anticipado Fecha de publicación: 18 de mayo de 2023
1Departamento de Neurociencias y Biología del Desarrollo, Universidad de Viena, Viena 1030, Austria
2Centro de Biología Cromosómica, Facultad de Ciencias Biológicas y Químicas, Universidad de Galway, Galway H91W2TY, Irlanda
3Departamento de Química Biológica, Universidad de California Irvine, Irvine, CA 92697-1700, EE. UU.
4Departamento de Ecología y Biología Evolutiva, Universidad de Kansas, Lawrence, KS 66045, EE. UU.
* Autor correspondiente: Oleg Simakov, Departamento de Neurociencias y Biología del Desarrollo, Universidad de Viena, Viena 1030, Austria, Correo electrónico: oleg.simakov@univie.ac . en;
Uri Frank, Centro de Biología Cromosómica, Facultad de Ciencias Biológicas y Químicas, Universidad de Galway, Galway H91W2TY, Irlanda, correo electrónico: uri.frank@universityofgalway.ie;
Tetsuo Kon, Departamento de Neurociencias y Biología del Desarrollo, Universidad de Viena, Viena 1030, Austria, Correo electrónico: kontetsuo@gmail.com
Abstracto
Hidractinia symbiolongicarpuses un organismo modelo pionero para la biología de células madre, siendo uno de los pocos animales con células madre
pluripotentes adultas (conocidas como células i). Sin embargo, la falta de disponibilidad de un ensamblaje genómico a nivel de cromosomas ha dificultado
una comprensión integral de los mecanismos reguladores de genes globales que subyacen a la función y evolución de las células i. Aquí, informamos el
primer ensamblaje del genoma a nivel cromosómico deH. simbiolongicarpus(HSymV2.0) utilizando secuenciación de lectura larga PacBio HiFi y andamio
Hi-C. El ensamblaje final tiene 483 Mb de longitud total y 15 cromosomas representan el 99,8% del ensamblaje. Se encontró que las secuencias repetitivas
representaban 296 Mb (61%) del genoma total; Proporcionamos evidencia de al menos dos períodos de expansión repetida en el pasado. En este
ensamblaje se predijo un total de 25.825 genes codificadores de proteínas, que incluyen el 93,1% del conjunto de genes de metazoos Benchmarking
Universal Single-Copy Orthologs (BUSCO). El 92,8% (23.971 genes) de las proteínas predichas estaban funcionalmente anotadas. ElH. simbiolongicarpus
El genoma mostró un alto grado de conservación macrosintética con elHidra vulgargenoma. Este ensamblaje genómico a nivel cromosómico deH.
simbiolongicarpusSerá un recurso invaluable para la comunidad de investigación que mejore los estudios biológicos amplios sobre este organismo
modelo único.
Palabras clave:hidractinia, ensamblaje del genoma a nivel de cromosoma, HSymV2.0, células madre, hidrozoos
integración aleatoria (künzelet al. 2010). Actualmente se encuentran disponibles 2022;cazetet al. 2023). Además, hay mapas de ligamiento genético
disponibles, que se componen de 15 grupos de ligamiento (Chenet al.
varios clones de animales transgénicos (Crisóstomo et al. 2022).
2023). Hasta el momento, la secuencia genómica disponible de
H. simbiolongicarpusestá limitado a un ensamblaje de nivel contig (>4800 simbiolongicarpo(Chenet al. 2023), fusionamos las secuencias contig
contigs) llamado Hsym_primary_v1.0 (https://research.nhgri.nih.gov/ basadas en las posiciones de los marcadores SNP y construimos 15
hydractinia/). La falta de disponibilidad de un ensamblaje genómico a secuencias pseudocromosómicas para el mapa de enlace genético
nivel de cromosomas ha dificultado la investigación de muchos aspectos materno y paterno. Estas secuencias de pseudocromosomas se alinearon
de la función de las células madre enhidractinia, como las interacciones con los 15 armazones a nivel cromosómico del ensamblaje HSymV2.0
promotor-potenciador. Como tal, la producción de un ensamblaje utilizando minimap2 v2.24 (Li 2018) con los parámetros “-ax asm5 –cs –
genómico a nivel cromosómico deH. simbiolongicarpusHa sido anticipado secundario=no”. Las alineaciones con calidad de mapeo 60 se conservaron
durante mucho tiempo por la comunidad científica y proporcionará un usando la vista de Samtools (Daneceket al. 2021). Los archivos de
panorama completo del genoma. alineación en formato BAM se convirtieron al formato PAF usando
Aquí, informamos el primer ensamblaje del genoma a nivel paftools de minimap2 v2.24. Finalmente, las alineaciones se visualizaron
cromosómico deH. simbiolongicarpus(HSymV2.0) utilizando secuenciación en diagramas de puntos usando D-GENIES (Cabanettes y Klopp 2018).
modelos genéticos que contenían codones de inicio y parada, excluyendo Figura complementaria 1a), el mismo individuo genético a partir del cual
aquellos que tenían codones de parada internos. Finalmente, las se preparó la primera versión del genoma. Un total de 34,0 Gb de lecturas
predicciones de los modelos genéticos de BRAKER2 y los modelos HiFi (66×)delH. simbiolongicarpusEl genoma se generó con una longitud
genéticos de Liftoff se integraron utilizando BEDTools (Quinlan y Hall 2010 de lectura N50 de 13,2 kb (tabla 1yFigura complementaria 1b). Realizamos
). Para validar la integridad de los modelos genéticos finales, se generaron el ensamblaje del genoma de novo delH. simbiolongicarpusgenoma
secuencias de proteínas a partir del ensamblaje HSymV2.0 y las usando Hifiasm (chenget al. 2021). El ensamblaje inicial del genoma
anotaciones del genoma utilizando GffRead (Pertea y Pertea 2020). Cada contiene 325 cóntigs con una longitud total de 483 Mb (Tabla 2). La
secuencia de proteína se examinó para detectar la presencia de longitud total del contig es comparable al tamaño del genoma estimado
secuencias homólogas en la base de datos NCBI-nr utilizando BLAST+ previamente (Francoet al. 2020). El contig N50 era de 28,8 Mb y el contig
v2.13.0 con los parámetros "-evalue 1e-05". La predicción del dominio de L50 era de 8 (Tabla 2). La longitud máxima del contig fue 42,6 Mb (Tabla 2
proteínas se realizó utilizando InterProScan v5.60-92.0 (Zdobnov y ). El contenido de GC fue del 35,85% (Tabla 2). También ensamblamos un
Figura 1.Ensamblaje del genoma a nivel cromosómico deH. simbiolongicarpus(HSymV2.0). a) Colonia deH. simbiolongicarpusmacho (clon 291-10) adherido a un portaobjetos de vidrio para
microscopio, que muestra pólipos de alimentación maduros (∼5 mm de altura), yemas de pólipos y red de estolones compartidos (los pólipos sexuales no se muestran ya que se desarrollan más
tarde). b) Mapa de contacto Hi-C que muestra los 15 andamios a nivel de cromosomas y las secuencias no colocadas (Un). Los andamios se ordenan por longitud y se les asignan números.
4 |G3,2023, vol. 13, núm. 8
contigs Todos los andamios Hi-C (HSymV2.0) Andamios a nivel de cromosomas Hsym_primary_v1.0
h. H. vulgaris
simbiolongicarpo
Número de Longitud ocupada Porcentaje de Número de Longitud ocupada Porcentaje de
elementos (pb) secuencia elementos (pb) secuencia
(85,2%), mientras que 75 existían como duplicados (7,9%) (Tabla 5). Estas puntuaciones base de datos no redundante (nr) (Figura 4ayTabla complementaria 2). Del total
BUSCO fueron mejores que las de las secuencias de proteínas predichas del de 20.985 genes que mostraron una homología significativa con los genes de la
ensamblaje Hsym_primary_v1.0 (Tabla 5). De todos los genes codificadores de base de datos NCBI-nr, 16.670 genes (79,4%) correspondieron a genes de
proteínas predichos en nuestro ensamblaje, 20.985 genes codificadores de proteínas Cnidaria (Figura 4a). 4.255 genes (20,3%) fueron afectados por genes de
(81,3%) tenían una homología significativa con las secuencias del NCBI. Bilateria (Figura 4a). Los restantes 42 (0,2%) y 18 (0,1%) genes alcanzaron el
6 |G3,2023, vol. 13, núm. 8
Figura 5.Diagrama de puntos de Oxford de ortólogos entreH. simbiolongicarpusyH. vulgaris. a) Diagrama de puntos de Oxford utilizando los 8.974 ortólogos. Para ambas especies, los ortólogos
se numeran secuencialmente según sus posiciones genómicas. Cada punto representa los ortólogos. b) Diagrama de puntos de Oxford utilizando ortólogos en los andamios 5 y 15 de
H. simbiolongicarpusensamblaje del genoma y aquellos en HVAEP3 y HVAEP5 delH. vulgarisensamblaje del genoma. c) Diagrama de puntos de Oxford usando
ortólogos en el andamio 2 y 14 deH. simbiolongicarpusensamblaje del genoma y aquellos en HVAEP7 y HVAEP14 delH. vulgarisensamblaje del genoma.
Conclusión Mb y N50 de 28,8 Mb. El siguiente andamiaje Hi-C dio como resultado 15
andamios a nivel de cromosomas que contienen el 99,8% del ensamblaje
En resumen, realizamos el ensamblaje del genoma de novo deH. total del genoma. Este ensamblaje HSymV2.0 es el primer ensamblaje
simbiolongicarpusy obtuvo secuencias contig con un tamaño de 483 genómico a nivel cromosómico deH. simbiolongicarpus. En
8 |G3,2023, vol. 13, núm. 8
En el ensamblaje HSymV2.0, predijimos 25.825 genes codificadores de Bernt M, Donath A, Jühling F, Externbrink F, Florentz C, Fritzsch G,
proteínas, y el 92,8% de estos genes (23.971 genes) estaban funcionalmente Pütz J, Middendorf M, Stadler PF. MITOS: anotación mejorada del
anotados. Las repeticiones y anotaciones genéticas del ensamblaje del genoma genoma mitocondrial de metazoos de novo. Mol Phylogenet Evol.
y el análisis comparativo del genoma entreH. simbiolongicarpusyH. vulgaris 2013;69(2):313–319. doi:10.1016/j.ympev.2012.08.023.
Destacar una evolución genómica única deH. simbiolongicarpus. Nuestro nuevo presagio de recursos humanos. El linaje de células intersticiales de la hidra: un sistema de células madre que
ensamblaje genómico a nivel de cromosomas deH. simbiolongicarpusserá un surgió temprano en la evolución. Ciencia de células J. 1996;109(6):1155–1164.
recurso importante para la biología de este organismo. También puede resultar doi:10. 1242/jcs.109.6.1155.
útil en estudios genómicos comparativos sobre la evolución de células madre Bosch TCG, David CN. células madre deHidra magnipapilatapuede diferenciar
en organismos multicelulares. se dividen en células somáticas y células de la línea germinal. Biol de desarrollo.
1987;121(1): 182–191. doi:10.1016/0012-1606(87)90151-5.
Bradshaw B, Thompson K, Frank U. Distintos mecanismos subyacen
El ensamblaje del genoma de Aedes aegypti utilizando Hi-C produce Pertea G, Pertea M. Utilidades GFF: GffRead y GffCompare. F1000Res.
andamios de longitud cromosómica. Ciencia. 2017;356(6333):92–95. 2020;9:Comunicación ISCB J-304. doi:10.12688/f1000research.23297.
doi:10.1126/science.aal3327. Plickert G, Frank U, Müller WA. Hydractinia, un modelo pionero para
Durand NC, Robinson JT, Shamim MS, Machol I, Mesirov JP, Lander biología de células madre y reprogramación de células somáticas hacia la
ES, Aiden EL. Juicebox proporciona un sistema de visualización de mapas de pluripotencia. Int J Dev Biol. 2012;56(6–7–8):519–534. doi:10.1387/ijdb.
contactos Hi-C con zoom ilimitado. Sistema celular. 2016a;3(1):99–101. 123502gp.
doi:10.1016/j.cels.2015.07.012. Quinlan AR, Hall IM. BEDTools: un conjunto flexible de utilidades para comparar
Durand NC, Shamim MS, Machol I, Rao SS, Huntley MH, Lander ES, características genómicas. Bioinformática. 2010;26(6):841–842. doi:10.
Aiden EL. Juicer proporciona un sistema de un solo clic para analizar 1093/bioinformática/btq033.
experimentos de resolución de bucle Hi-C. Sistema celular. 2016b;3(1):95– Quiroga-Artigas G, Duscher A, Lundquist K, Waletich J, Schnitzler
98. doi:10. 1016/j.cels.2016.07.002. CE. Eliminación de genes mediante electroporación de ARN en horquilla