4genoma Ensamble Hydractiniaenes 230908 161252

Traducido del inglés al español - www.onlinedoctranslator.
com
G3, 2023,13(8),jkad107
https://doi.org/10.1093/g3journal/jkad107 Acceso
anticipado Fecha de publicación: 18 de mayo de 2023
Informe del genoma
Ensamblaje del genoma a nivel cromosómico deHidractinia

symbiolongicarpus
Koto Kon-Nanjo,1Tetsuo Kon,1,* Helen R. Horkan,2febrimarsa,2Robert E. Steele,3Paulyn Cartwright,4Uri Frank,2,* Oleg
Descargado de https://academic.oup.com/g3journal/article/13/8/jkad107/7170730 por el usuario de Withers el 4 de septiembre de 2023.

Simákov1,*
1Departamento de Neurociencias y Biología del Desarrollo, Universidad de Viena, Viena 1030, Austria
2Centro de Biología Cromosómica, Facultad de Ciencias Biológicas y Químicas, Universidad de Galway, Galway H91W2TY, Irlanda
3Departamento de Química Biológica, Universidad de California Irvine, Irvine, CA 92697-1700, EE. UU.
4Departamento de Ecología y Biología Evolutiva, Universidad de Kansas, Lawrence, KS 66045, EE. UU.
* Autor correspondiente: Oleg Simakov, Departamento de Neurociencias y Biología del Desarrollo, Universidad de Viena, Viena 1030, Austria, Correo electrónico: oleg.simakov@univie.ac . en;
Uri Frank, Centro de Biología Cromosómica, Facultad de Ciencias Biológicas y Químicas, Universidad de Galway, Galway H91W2TY, Irlanda, correo electrónico: uri.frank@universityofgalway.ie;
Tetsuo Kon, Departamento de Neurociencias y Biología del Desarrollo, Universidad de Viena, Viena 1030, Austria, Correo electrónico: kontetsuo@gmail.com
Abstracto
Hidractinia symbiolongicarpuses un organismo modelo pionero para la biología de células madre, siendo uno de los pocos animales con células madre
pluripotentes adultas (conocidas como células i). Sin embargo, la falta de disponibilidad de un ensamblaje genómico a nivel de cromosomas ha dificultado
una comprensión integral de los mecanismos reguladores de genes globales que subyacen a la función y evolución de las células i. Aquí, informamos el
primer ensamblaje del genoma a nivel cromosómico deH. simbiolongicarpus(HSymV2.0) utilizando secuenciación de lectura larga PacBio HiFi y andamio
Hi-C. El ensamblaje final tiene 483 Mb de longitud total y 15 cromosomas representan el 99,8% del ensamblaje. Se encontró que las secuencias repetitivas
representaban 296 Mb (61%) del genoma total; Proporcionamos evidencia de al menos dos períodos de expansión repetida en el pasado. En este
ensamblaje se predijo un total de 25.825 genes codificadores de proteínas, que incluyen el 93,1% del conjunto de genes de metazoos Benchmarking
Universal Single-Copy Orthologs (BUSCO). El 92,8% (23.971 genes) de las proteínas predichas estaban funcionalmente anotadas. ElH. simbiolongicarpus
El genoma mostró un alto grado de conservación macrosintética con elHidra vulgargenoma. Este ensamblaje genómico a nivel cromosómico deH.
simbiolongicarpusSerá un recurso invaluable para la comunidad de investigación que mejore los estudios biológicos amplios sobre este organismo
modelo único.
Palabras clave:hidractinia, ensamblaje del genoma a nivel de cromosoma, HSymV2.0, células madre, hidrozoos
Introducción hidractiniaes el primer animal en el que las células madre y germinales

fueron descritas por August Weismann en el siglo XIX (Weismann 1883). El
Hidractinia symbiolongicarpuses una especie de cnidario hidrozoario colonial. El
animal tiene una población única de células madre pluripotentes adultas,
organismo se distribuye a lo largo de la costa este de América del Norte desde
conocidas como células madre intersticiales (i-células para abreviar). Las
Maine hasta Carolina del Sur (Buss y Yund 1989). En su hábitat natural,H.
células i producen continuamente progenitores para todos los linajes de
simbiolongicarpusForma colonias sobre caparazones de gasterópodos células germinales y somáticas (dubucet al. 2020;Varleyet al. 2023). Una
ocupados por cangrejos ermitaños. En el laboratorio,H. simbiolongicarpus sola célula i injertada de una colonia a otra puede autorrenovarse y
También pueden formar colonias en portaobjetos de vidrio y cultivarse en agua diferenciarse en todos los linajes somáticos y células germinales.Varleyet
de mar artificial. Se encuentran disponibles varias cepas de laboratorio para al. 2023). La pluripotencia deH. simbiolongicarpusi-cells contrasta con la
esta especie. Las colonias tienen zooides (pólipos) funcionalmente multipotencia deHidra vulgarCélulas i, que producen el linaje
especializados, incluido el pólipo alimentario (gastrozoide), el pólipo neuroglandular y las células germinales, pero no las células epiteliales
reproductivo (gonozoide) y el pólipo defensivo (dactilozoide), que están epidérmicas y gastrodérmicas (Bosch y David 1987;presagio 1996;
conectados por el tejido estolonal, un sistema gastrovascular compartido ( Hobmayeret al. 2012;julianoet al. 2014).H. simbiolongicarpuses un
Francoet al. 2020). Mientras forman colonias clonales,H. simbiolongicarpus excelente animal modelo para estudiar la función y evolución de las
También genera gametos diariamente, lo que proporciona un acceso células madre en organismos multicelulares (Plickertet al. 2012).
conveniente a la embriogénesis. Este rasgo facilita la manipulación de la El tamaño del genoma deH. simbiolongicarpusse estimó en 514 Mb (
expresión génica mediante la eliminación genética transitoria mediada por Francoet al. 2020).H. simbiolongicarpusTiene 15 cromosomas revelados
ARNi (dubucet al. 2020;Quiroga Artigaset al. 2020), edición del genoma mediada por el método de bandas G (Chenet al. 2023). Este número de
por CRISPR/Cas9 (gahanet al. 2016;Lijadoraset al. 2018), y transgénesis de cromosomas es similar en otros cnidarios comoH. vulgaris(Simákovet al.
integración aleatoria (künzelet al. 2010). Actualmente se encuentran disponibles 2022;cazetet al. 2023). Además, hay mapas de ligamiento genético
disponibles, que se componen de 15 grupos de ligamiento (Chenet al.
varios clones de animales transgénicos (Crisóstomo et al. 2022).
2023). Hasta el momento, la secuencia genómica disponible de
Recibió:06 de marzo de 2023.Aceptado:08 de mayo de 2023

© Th e Autor(es) 2023. Publicado por Oxford University Press en nombre de The Genetics Society of America.
Este es un artículo de Acceso Abierto distribuido bajo los términos de la Licencia de Atribución Creative Commons (https://creativecommons.org/licenses/by/4.0/), que permite la reutilización,
pordistribución y reproducción sin restricciones en cualquier medio, siempre que la obra original sea debidamente citado.
2 |G3,2023, vol. 13, núm. 8
H. simbiolongicarpusestá limitado a un ensamblaje de nivel contig (>4800 simbiolongicarpo(Chenet al. 2023), fusionamos las secuencias contig
contigs) llamado Hsym_primary_v1.0 (https://research.nhgri.nih.gov/ basadas en las posiciones de los marcadores SNP y construimos 15
hydractinia/). La falta de disponibilidad de un ensamblaje genómico a secuencias pseudocromosómicas para el mapa de enlace genético
nivel de cromosomas ha dificultado la investigación de muchos aspectos materno y paterno. Estas secuencias de pseudocromosomas se alinearon
de la función de las células madre enhidractinia, como las interacciones con los 15 armazones a nivel cromosómico del ensamblaje HSymV2.0
promotor-potenciador. Como tal, la producción de un ensamblaje utilizando minimap2 v2.24 (Li 2018) con los parámetros “-ax asm5 –cs –
genómico a nivel cromosómico deH. simbiolongicarpusHa sido anticipado secundario=no”. Las alineaciones con calidad de mapeo 60 se conservaron
durante mucho tiempo por la comunidad científica y proporcionará un usando la vista de Samtools (Daneceket al. 2021). Los archivos de
panorama completo del genoma. alineación en formato BAM se convirtieron al formato PAF usando
Aquí, informamos el primer ensamblaje del genoma a nivel paftools de minimap2 v2.24. Finalmente, las alineaciones se visualizaron
cromosómico deH. simbiolongicarpus(HSymV2.0) utilizando secuenciación en diagramas de puntos usando D-GENIES (Cabanettes y Klopp 2018).

de alta fidelidad (HiFi) de PacBio y andamiaje Hi-C. El ensamblaje final
tiene 483 Mb de longitud total con 15 cromosomas, lo que representa el Identificación de secuencias repetitivas.
99,8% del tamaño total del ensamblaje. Será un recurso invaluable para Se generó una biblioteca de repetición personalizada del ensamblaje del
estudiar los mecanismos reguladores moleculares que subyacen al genoma utilizando RepeatModeler v2.0.4 (Flynnet al. 2020) con parámetros
desarrollo, las células madre, la regeneración y su evolución. predeterminados. A continuación, se identificaron secuencias repetitivas
utilizando RepeatMasker v4.1.4 (http://www.repeatmasker.org) y la biblioteca
de repetición personalizada. En este paso también se generó una secuencia
Materiales y métodos enmascarada repetida del ensamblaje HSymV2.0. Finalmente, el resultado de
La cría de animales repetirMasker se resumió utilizando los scripts auxiliares de repetirMasker
Colonias deH. simbiolongicarpusse mantuvieron como se describió anteriormente ( v4.1.4. A modo de comparación, secuencias repetitivas en elH. vulgariscepa AEP
Francoet al. 2020). Los animales crecieron en portaobjetos de vidrio mantenidos en (cazetet al. 2023) fueron identificados utilizando la misma tubería.
agua de mar artificial a 20-22°C. Los animales se mantuvieron en un ciclo constante de
luz:oscuridad de 14:10. Anotación del genoma
El ensamblaje del genoma enmascarado repetido del ensamblaje HSymV2.0 se
Preparación y secuenciación de bibliotecas de utilizó para las predicciones genéticas. Identificamos la región codificante de
secuenciación de ADN. proteínas y la región no traducida (UTR) para cada gen, con una combinación de
Se extrajo ADN genómico de alto peso molecular de pólipos de alimentación predicción ab initio, predicción basada en homología y predicción basada en
masculinos (clon 291-10) deH. simbiolongicarpus. Se preparó una biblioteca transcriptoma utilizando BRAKER2 (Brunaet al. 2021). Para la predicción basada
PacBio HiFi según el protocolo del fabricante y se secuenció utilizando la en homología, obtuvimos la secuencia del genoma y la anotación deH. vulgaris
plataforma PacBio Sequel II. Para la preparación de la biblioteca Hi-C, se cepa 105 (GCA_022113875.1) de la base de datos del genoma del Centro
utilizaron pólipos de alimentación masculinos (clon 291-10) deH. Nacional de Información Biotecnológica (NCBI); la secuencia del genoma y la
simbiolongicarpusfueron congelados y molidos instantáneamente. Siguiendo anotación deH. vulgariscepa AEP (cazetet al. 2023) del Portal del Proyecto
las instrucciones del fabricante, se preparó una biblioteca Hi-C utilizando el kit Genoma Hydra AEP (https://research.nhgri.nih.gov/HydraAEP/); y la secuencia
Dovetail Omni-C (Canta Bio, n.º 21005). Se confirmó que la distribución del del genoma y la anotación del conjunto de referencia a nivel de contig deH.
tamaño de inserción de la biblioteca Hi-C estaba aproximadamente entre 350 simbiolongicarpus(Hsym_primary_v1.0) del Portal del Proyecto Genoma de
pb y 1000 pb utilizando el analizador de fragmentos Agilent (Agilent). La Hydractinia (https://research.nhgri.nih.gov/hydractinia/). Las secuencias de
biblioteca Hi-C se secuenció con lecturas de extremos emparejados de 150 pb proteínas se generaron a partir de las secuencias del genoma de referencia y
utilizando Illumina MiSeq mediante las instalaciones centrales de secuenciación las anotaciones del genoma utilizando GffRead (Pertea y Pertea 2020) con el
de próxima generación del BioCenter de Viena. parámetro “-S -J”. Para cada gen, se extrajo la isoforma más larga para la
predicción basada en homología. Luego, se fusionaron todas las secuencias de
Ensamblaje y andamiaje del genoma. proteínas. BRAKER2 se ejecutó en el ensamblaje del genoma enmascarado
Las estadísticas de la calidad de lectura de PacBio HiFi se calcularon repetido utilizando secuencias de proteínas homólogas con parámetros “–
utilizando NanoPlot v1.41.0 (De Costeret al. 2018). Las lecturas de PacBio epmode –softmasking”. Para la predicción basada en transcriptomas, utilizamos
HiFi se ensamblaron en secuencias contig utilizando Hifiasm v0.16.1-r375 ( lecturas de RNA-seq disponibles públicamente (números de acceso:
cheng et al. 2021) con parámetros predeterminados. Los andamios a nivel SRR1796501 – SRR1796515, SRR9331388 – SRR9331403 y SRR14265606 –
de cromosoma se construyeron con la combinación de las secuencias SRR14265626, SRR18686538 – SRR18686548). El ensamblaje del genoma
contig y las lecturas de secuenciación Hi-C. Las lecturas de Hi-C se enmascarado repetido se indexó utilizando STAR v2.7.10b (Dobínet al. 2013) con
alinearon con las secuencias contig utilizando Juicer v1.6 (Durandet al. el parámetro “–runMode genomeGenerate”. Las lecturas de RNA-seq se
2016b) con parámetros predeterminados. Luego, se realizó el andamiaje alinearon con el ensamblaje del genoma indexado utilizando STAR v2.7.10b con
Hi-C utilizando la tubería de ADN 3D (Dudchenkoet al. 2017) con los parámetros “–runMode alignReads –outSAMtype BAM SortedByCoordinate”.
parámetros “–editor-repeat-coverage 1000 -r 0”. Los andamios se Todos los archivos de alineación se fusionaron usando samtools merge (
seleccionaron manualmente utilizando Juicebox Assembly Tools v1.11.08 ( Danecek et al. 2021). Luego, se ejecutó BRAKER2 en el ensamblaje del genoma
Durandet al. 2016a). El ensamblaje final se denominó HSymV2.0. La enmascarado repetidamente utilizando el archivo bam fusionado con los
calidad y la integridad del ensamblaje se evaluaron utilizando QUAST parámetros “–softmasking”. Se agregaron regiones UTR a las predicciones
v5.2.0 (Gurevichet al. 2013) y evaluación comparativa de ortólogos basadas en transcriptomas utilizando BRAKER2 con parámetros “–softmasking –
universales de copia única (BUSCO) v5.2.2 (Simãoet al. 2015) con la base addUTR=on”. A partir de las predicciones iniciales del modelo genético, se
de datos metazoa odb10 (metazoa_odb10). produjeron modelos genéticos de consenso utilizando TSEBRA v1.0.3 (gabrielet
al. 2021). También transferimos las coordenadas del gen de anotación genética
Validación del ensamblaje del genoma con del ensamblaje Hsym_primary_v1.0 al ensamblaje HSymV2.0 usando la
H. simbiolongicarpusmapas de enlace herramienta Liftoff (Shumate y Salzberg 2020). Seleccionamos
Para anclar las secuencias contig del ensamblaje Hsym_primary_v1.0
a los mapas de enlace genético informados anteriormente deh.
K. Kon Nanjoet al.|3
modelos genéticos que contenían codones de inicio y parada, excluyendo Figura complementaria 1a), el mismo individuo genético a partir del cual
aquellos que tenían codones de parada internos. Finalmente, las se preparó la primera versión del genoma. Un total de 34,0 Gb de lecturas
predicciones de los modelos genéticos de BRAKER2 y los modelos HiFi (66×)delH. simbiolongicarpusEl genoma se generó con una longitud
genéticos de Liftoff se integraron utilizando BEDTools (Quinlan y Hall 2010 de lectura N50 de 13,2 kb (tabla 1yFigura complementaria 1b). Realizamos
). Para validar la integridad de los modelos genéticos finales, se generaron el ensamblaje del genoma de novo delH. simbiolongicarpusgenoma
secuencias de proteínas a partir del ensamblaje HSymV2.0 y las usando Hifiasm (chenget al. 2021). El ensamblaje inicial del genoma
anotaciones del genoma utilizando GffRead (Pertea y Pertea 2020). Cada contiene 325 cóntigs con una longitud total de 483 Mb (Tabla 2). La
secuencia de proteína se examinó para detectar la presencia de longitud total del contig es comparable al tamaño del genoma estimado
secuencias homólogas en la base de datos NCBI-nr utilizando BLAST+ previamente (Francoet al. 2020). El contig N50 era de 28,8 Mb y el contig
v2.13.0 con los parámetros "-evalue 1e-05". La predicción del dominio de L50 era de 8 (Tabla 2). La longitud máxima del contig fue 42,6 Mb (Tabla 2
proteínas se realizó utilizando InterProScan v5.60-92.0 (Zdobnov y ). El contenido de GC fue del 35,85% (Tabla 2). También ensamblamos un

Apweiler 2001). La anotación funcional genética se realizó utilizando andamio de ADN mitocondrial de 15,471 pb que contiene 13 proteínas,
eggNOG-Mapper v2.1.9 (Huerta-Cepaset al. 2019). La anotación del ARNr de subunidades pequeñas y grandes y ARNt de metionina y
genoma mitocondrial se realizó utilizando el servidor web MITOS (Berntet triptófano como otras especies de cnidarios (Figura complementaria 2) (
al. 2013). Para la visualización de la anotación del genoma mitocondrial, se Zouet al. 2012;linet al. 2019). Evaluamos la integridad del ensamblaje del
generó un archivo Genbank a partir de la secuencia del genoma genoma mediante la búsqueda de conjuntos de BUSCO en las secuencias
mitocondrial y su anotación utilizando la herramienta EMBOSS Seqret ( contig (Simãoet al. 2015). Utilizamos la base de datos de metazoos odb10
Arrozet al. 2000). El mapa del genoma mitocondrial se generó a partir del (metazoa_odb10) para este análisis. Identificamos 818 genes BUSCO
archivo Genbank utilizando ApE (Davis y Jorgensen 2022). completos de 954 genes BUSCO (85,7%), de los cuales 756 estaban
presentes como copias únicas (79,2%) y 62 como duplicados (6,5%).
Análisis de sintenia También identificamos 64 genes BUSCO fragmentados (6,7%). Es de

destacar que estas estadísticas de las secuencias contig son mejores que
Para identificar ortólogos entreH. simbiolongicarpusyH. vulgaris, se prepararon
las del ensamblado Hsym_primary_v1.0, el ensamblado de nivel contig
las isoformas proteicas más largas de los armazones a nivel de cromosomas
reportado anteriormente (Tabla 3). Por ejemplo, el contig N50 del
para ambas especies. Ambos conjuntos de genes se compararon
ensamblado actual es 13 veces mayor que el de Hsym_primary_v1.0 (28,8
recíprocamente utilizando blastp con parámetros predeterminados (Altschulet
Mb vs 2,2
al. 1990). Los pares de genes con mejores resultados recíprocos se identificaron
como ortólogos entre las dos especies. Para cada especie, cada ortólogo fue
numerado según su coordenada genómica. Los gráficos de Oxford se trazaron Tabla 1.Resumen de la secuenciación del genoma.
utilizando la función de trazado en R v4.2.2.
Experimento Secuenciación Número de base total Leer
plataforma lee (base) longitud
(pb)
Resultados y discusión
Entero PacBio 3.049.931 34.014.052.488 13.241
Ensamblaje del genoma a nivel cromosómico de genoma Secuela II (N50)
H. simbiolongicarpus(HSymV2.0) secuenciación
Hola-C iluminar 14.836.376 4.450.912.800 150×2
Se extrajo ADN genómico de alto peso molecular de colonias
MiSeq
masculinas (clon 291-10) deH. simbiolongicarpus(Figura 1ay
Figura 1.Ensamblaje del genoma a nivel cromosómico deH. simbiolongicarpus(HSymV2.0). a) Colonia deH. simbiolongicarpusmacho (clon 291-10) adherido a un portaobjetos de vidrio para
microscopio, que muestra pólipos de alimentación maduros (∼5 mm de altura), yemas de pólipos y red de estolones compartidos (los pólipos sexuales no se muestran ya que se desarrollan más
tarde). b) Mapa de contacto Hi-C que muestra los 15 andamios a nivel de cromosomas y las secuencias no colocadas (Un). Los andamios se ordenan por longitud y se les asignan números.
4 |G3,2023, vol. 13, núm. 8
Tabla 2.Estadísticas de montaje de laH. simbiolongicarpusgenoma.
contigs Todos los andamios Hi-C (HSymV2.0) Andamios a nivel de cromosomas Hsym_primary_v1.0
Longitud total (pb) 482.771.323 482.928.323 481.835.061 406.663.980

Número de secuencia total 325 84 15 4.840
Longitud máxima de secuencia (pb) 42.595.244 42.572.105 42.572.105 11.665.964
N50 (pb) 28.808.060 33.314.500 33.314.500 2.235.630
L50 8 7 7 48
Contenido de GC (%) 35,85 35,85 35,85 35.22
e integridad del ensamblaje HSymV2.0. El estudio anterior demostró que

Tabla 3.Puntuaciones BUSCO del ensamblaje del genoma.

H. simbiolongicarpustiene un sistema de determinación del sexo XX/XY y
Estudio actual Hsym_primary_v1.0 que el locus determinante del sexo está ubicado al final del grupo de
(HSymV2.0) enlace 4 (Chenet al. 2023). En ambos grupos de enlace, el grupo de enlace
4 se asignó al cromosoma 1 del conjunto HSymV2.0 (Figuras 2a y b).
BUSCO completos (C) 818 (85,7%) 796 (83,5%)
completo y 756 (79,2%) 722 (75,7%) Según este resultado, lo más probable es que el cromosoma sexual en el
BUSCO de una sola copia (S) conjunto HSymV2.0 sea el cromosoma 1 (Figura 2).
completo y duplicado 62 (6,5%) 74 (7,8%)
BUSCO (D)
BUSCO fragmentados (F) 64 (6,7%) 69 (7,2%) Identificación de secuencias repetitivas.
BUSCO faltantes (M) 72 (7,6%) 89 (9,3%) Para la identificación de secuencias repetitivas en el ensamblaje del genoma,
Total de grupos BUSCO 954 954 generamos una biblioteca de repetición personalizada de nuestro ensamblaje
buscado
del genoma usando RepeatModeler. Esta biblioteca contiene 2.300 familias
repetidas. Luego, se ejecutó RepeatMasker en el ensamblaje utilizando la
biblioteca personalizada. Las secuencias repetitivas representaron 296 Mb
Mb), y el número de contigs es inferior a una décima parte del de (61%) del ensamblaje HSymV2.0. Las secuencias repetitivas están compuestas
Hsym_primary_v1.0 (325 frente a 4.840,Tabla 2). Para construir un por repeticiones totales intercaladas (58,25%), repeticiones simples (0,70%) y
ensamblaje genómico a nivel de cromosoma, se generaron 14.836.376 otras (Tabla 4). El total de repeticiones intercaladas se puede dividir en
pares de lecturas Hi-C a partir de pólipos alimentarios masculinos (clon retroelementos (5,20%), transposones de ADN (4,94%), círculos rodantes (0,55%)
291-10) (Figura complementaria 3). El andamiaje Hi-C generó el y elementos no clasificados (48,11%). Entre los retroelementos, los LINE (3,01%)
ensamblaje final de 483 Mb de longitud con 15 cromosomas que resultaron ser los más abundantes (Tabla 4). Entre los transposones de ADN,
representan el 99,8% del tamaño total del ensamblaje (Figura 1byFigura Tc1-IS630-Pogo (0,48%) y hobo-Activador (0,33%) fueron los dos elementos
complementaria 4). El andamio N50 era de 33 Mb. El tamaño del andamio principales (Tabla 4). Estos resultados son similares al análisis repetido de laH.
más grande fue de 42,6 Mb. El tamaño total de las 69 secuencias no vulgaris genoma. En elH. simbiolongicarpusgenoma, la divergencia de
colocadas fue de 1,1 Mb. Cuatro de los 15 andamios (andamios 8, 11, 12 y secuencia de las repeticiones reveló al menos dos períodos discretos de
15) constan de contigs individuales (Figura complementaria 4). El mapa de expansión de repeticiones (Figura 3a). En cambio, en elH. vulgarisgenoma, se
contactos Hi-C del ensamblaje del genoma a nivel de cromosoma muestra mostró una expansión repetida más continua (Figura 3b), lo que también fue
un número bajo de interacciones transcromosómicas en nuestro indicado por el estudio anterior (Chapmanet al. 2010).
ensamblaje del genoma (Figura 1b). En cada cromosoma, la intensidad del
contacto Hi-C en la posición diagonal es más fuerte que la de la otra
posición. Esto indica que secuencias adyacentes de nuestro ensamblaje
Predicción genética y anotación funcional.
tienen un fuerte contacto. Estos hallazgos sugieren la integridad del
Para predecir genes codificadores de proteínas en el ensamblaje HSymV2.0,
ensamblaje del genoma a nivel de cromosomas. El conjunto final del
adoptamos una combinación de predicción ab initio: predicción basada en
genoma a nivel de cromosomas se denominó HSymV2.0.
homología y predicción basada en transcriptoma. Para la predicción basada en
homología, utilizamos secuencias de proteínas deH. vulgarisy
Comparación de HSymV2.0 con los mapas de ligamiento Hsym_primary_v1.0. Para la predicción basada en transcriptoma, las lecturas de
genético preexistentes y la identificación de cromosomas RNA-seq disponibles públicamente se alinearon con el ensamblaje utilizando el
sexuales alineador STAR (Dobínet al. 2013). Luego realizamos la anotación del genoma
Para evaluar más a fondo la integridad del ensamblaje HSymV2.0, usando BRAKER2 (Brunaet al. 2021) con evidencia de homología o evidencia de
comparamos nuestro ensamblaje genómico con los mapas de enlace transcriptoma. Finalmente, las anotaciones del genoma resultantes se
genético informados anteriormente deH. simbiolongicarpus(Chenet al. integraron utilizando TSEBRA (gabrielet al. 2021) para producir el modelo
2023). Con base en los loci de los marcadores SNP en el ensamblaje genético de consenso. También asignamos las coordenadas genéticas de la
Hsym_primary_v1.0, anclamos las secuencias contig de anotación genética del ensamblaje Hsym_primary_v1.0 al ensamblaje HSymV2.0
Hsym_primary_v1.0 a los mapas de enlace genético materno y paterno. usando la herramienta Liftoff (Shumate y Salzberg 2020). Finalmente,
Obtuvimos las secuencias de 15 pseudocromosomas maternos y predijimos un total de 25.825 genes codificadores de proteínas. De los 22.022
paternos. Luego, alineamos los pseudocromosomas maternos y paternos genes codificadores de proteínas en el ensamblaje Hsym_primary_v1.0, 21.686
con nuestros 15 armazones a nivel de cromosomas. Ambos conjuntos de genes (98,5%) se asignaron a 18.606 genes en el ensamblaje HSymV2.0 (Tabla
15 pseudocromosomas se asignaron de forma única a nuestros 15 complementaria 1). Los genes codificadores de proteínas predichos mostraron
andamios a nivel de cromosomas (Figuras 2a y b). Las alineaciones una longitud media del cuerpo del gen de 5.854 pb, una longitud media de la
resultantes también revelaron las relaciones colineales entre los 15 secuencia codificante (CDS) de 1.346 pb y un número medio de exones de 6,43.
armazones a nivel de cromosomas del ensamblaje HSymV2.0 y los Detectamos 888 genes BUSCO completos de un total de 954 genes BUSCO
pseudocromosomas maternos (Figura 2a) o pseudocromosomas paternos (93,1%) en las 25.825 proteínas predichas. Entre estos genes, 813 aparecieron
(Figura 2b). Estos resultados demuestran la contigüidad en copias únicas.

Figura 2.Colinealidad entre los andamios Hi-C del presente estudio y los mapas de ligamiento genético (Chenet al. 2023). a) Alineamientos de secuencia entre los andamios Hi-C y
los pseudocromosomas basados en el mapa de ligamiento genético materno. b) Alineamientos de secuencia entre los andamios Hi-C y los pseudocromosomas basados en el
mapa de ligamiento genético paterno.
Tabla 4.Resumen de los resultados de RepeatMasker.
h. H. vulgaris
simbiolongicarpo
Número de Longitud ocupada Porcentaje de Número de Longitud ocupada Porcentaje de
elementos (pb) secuencia elementos (pb) secuencia
Retroelementos 50.329 25.095.050 5.20 316.787 153.628.253 17.05

SENOS: 12.586 1.987.472 0,41 21,296 3.637.401 0,40
Penélope 9.072 2.726.592 0,56 52.322 17.817.731 1,98
Líneas: 27.013 14.541.672 3.01 281,818 140.096.759 15.55
CRE/SLACS 1.786 821.583 0,17 298 150,224 0,02
L2/CR1/Rex 9.860 6.205.894 1.29 207,793 111.582.339 12.39
R1/LOA/Jockey 0 0 0.00 659 166.379 0,02
R2/R4/NeSL 1.415 881.271 0,18 0 0 0.00
RTE/Bov-B 3,902 3.319.744 0,69 3.759 1.136.092 0,13
L1/CIN4 128 79,792 0,02 0 0 0.00
Elementos LTR: 10.730 8.565.906 1,77 13.673 9.894.093 1.10
BEL/Pao 1.500 1.411.183 0,29 2,320 2.078.705 0,23
Ty1/Copia 2,594 1.823.078 0,38 135 160.597 0,02
Gitano/DIRS1 5.721 4.579.944 0,95 9.802 6.193.847 0,69
retroviral 155 104,124 0,02 0 0 0.00
transposones de ADN 56.331 23.868.445 4.94 536.767 243.675.039 27.05
hobo-activador 3.454 1.578.931 0,33 183.730 81.989.900 9.10
Tc1-IS630-Pogo 11.142 2.305.486 0,48 128,135 56.913.582 6.32
En-Spm 0 0 0.00 0 0 0.00
PiggyBac 338 264,413 0,05 4.776 2.483.575 0,28
Turista/Preagio 5.311 1.339.873 0,28 6.623 1.752.620 0,19
Otro 3.354 1.092.285 0,23 30.175 13.042.137 1,45
círculos rodantes 9.783 2.673.725 0,55 6.653 3.214.957 0,36
Desclasificado: 410.631 232.360.741 48.11 764.256 184.468.711 20,48
Total intercalado 281.324.236 58,25 581.772.003 64,57
repite
ARN pequeño: 12,289 8.667.551 1,79 13,979 1.876.864 0,21
Satélites: 918 166.061 0,03 0 0 0.00
Repeticiones simples: 51.000 3.398.212 0,70 376.701 41.350.470 4.59
Baja complejidad: 10,920 531.858 0,11 49.800 2.588.884 0,29
Bases totales enmascaradas: 295.609.498 61.21 630.803.178 70.02
(85,2%), mientras que 75 existían como duplicados (7,9%) (Tabla 5). Estas puntuaciones base de datos no redundante (nr) (Figura 4ayTabla complementaria 2). Del total
BUSCO fueron mejores que las de las secuencias de proteínas predichas del de 20.985 genes que mostraron una homología significativa con los genes de la
ensamblaje Hsym_primary_v1.0 (Tabla 5). De todos los genes codificadores de base de datos NCBI-nr, 16.670 genes (79,4%) correspondieron a genes de
proteínas predichos en nuestro ensamblaje, 20.985 genes codificadores de proteínas Cnidaria (Figura 4a). 4.255 genes (20,3%) fueron afectados por genes de
(81,3%) tenían una homología significativa con las secuencias del NCBI. Bilateria (Figura 4a). Los restantes 42 (0,2%) y 18 (0,1%) genes alcanzaron el
6 |G3,2023, vol. 13, núm. 8

Fig. 3.Paisaje repetido intercalado de laH. simbiolongicarpusgenoma yH. vulgarisgenoma. a) Paisaje repetido intercalado deH. simbiolongicarpus. b) Paisaje repetido
intercalado deH. vulgaris. ElX-El eje representa el nivel de sustitución de Kimura para elementos repetidos de las secuencias de consenso (edad relativa). ElyEl eje
representa la abundancia relativa de cada familia repetida en el genoma. Las repeticiones activas antiguas se colocan en el lado derecho del gráfico y las repeticiones
activas recientes están en el lado izquierdo.
anotación. Por ejemplo,Piwi1es un marcador conocido para las células i (

Tabla 5.Puntuaciones BUSCO a partir de las proteínas predichas.
bradshawet al. 2015;gahanet al. 2016). En el ensamblaje HSymV2.0, Piwi1está
Estudio actual Hsym_primary_v1.0 en la cadena positiva de ADN en el cromosoma 13, que se extiende desde la
(HSymV2.0) posición del par de bases 16.493.941 a 16.509.130 (Figura 4c). Otro ejemplo es
el factor de transcripción AP2 (Tfap2). Este gen es un regulador del compromiso
BUSCO completos (C) 888 (93,1%) 882 (92,5%)
completo y 813 (85,2%) 785 (82,3%) de las células germinales (dubucet al. 2020).Tfap2se encuentra en el
BUSCO de una sola copia (S) cromosoma 5 desde la posición del par de bases 20.139.307 a 20.141.788 en la
completo y duplicado 75 (7,9%) 97 (10,2%) cadena positiva del ADN (figura 4d).
BUSCO (D)
BUSCO fragmentados (F) 20 (2,1%) 12 (1,3%)
BUSCO faltantes (M) 46 (4,8%) 60 (6,2%)
Total de grupos BUSCO 954 954
Análisis de sintonía entreH. simbiolongicarpus y
buscado H. vulgaris
Investigamos la relación sinténica entreH. simbiolongicarpusyH.
vulgaris. Se identificaron un total de 8.974 ortólogos (Tabla
complementaria 5). Generamos el diagrama de puntos de Oxford
Genes de esponja y placozoa, respectivamente. Identificamos que 22.199 genes entreH. simbiolongicarpusyH. vulgariscon estos ortólogos (Figura 5a
codificadores de proteínas (86,0%) tenían dominios proteicos utilizando InterProScan ( ). En general, este gráfico reveló que la sintenia a escala
Tabla complementaria 3) (Zdobnov y Apweiler 2001). También utilizamos eggNOG- cromosómica (macrosintenia) está altamente conservada sin
Mapper (Huerta-Cepaset al. 2019) para los genes codificadores de proteínas predichos colinealidad entre estas especies (Figura 5a). Además, los pares de
y encontró que 18,547 genes estaban funcionalmente anotados (Tabla cromosomas (andamio 5 y 15 deH. simbiolongicarpusvs HVAEP3 y
complementaria 4). En general, el 92,8% (23.971 genes) de todos los genes HVAEP5 delH. vulgaris, andamio 2 y 14 deH. simbiolongicarpusvs
codificadores de proteínas predichos tenían anotaciones funcionales respaldadas por HVAEP7 y HVAEP14 delH. vulgaris) mostró relaciones sinténicas que
una o más de las bases de datos anteriores (Figura 4b). Los genes del factor de células sugieren translocaciones intercromosómicas pasadas después de la
madre están bien predichos en nuestro genoma divergencia entre las especies (Figuras 5b yc).

Figura 4.Anotación genética del ensamblaje HSymV2.0. a) Resultados de búsqueda BLAST del total de 25.825 genes codificadores de proteínas predichos en la base de datos NCBI-nr. Se
identificaron un total de 20.985 coincidencias genéticas en la base de datos NCBI-nr. Las 20 principales especies de origen de los éxitos de BLAST se muestran como un diagrama de barras. El
gráfico circular insertado representa el resumen de los orígenes de las especies. La combinación de colores del gráfico de barras corresponde a la del gráfico circular insertado. b) Diagrama de
Venn que muestra anotaciones funcionales de los genes codificadores de proteínas predichos del ensamblaje HSymV2.0. c) Estructura genética dePiwi1en el cromosoma 13. d) Estructura genética
deTfap2en el cromosoma 5.
Figura 5.Diagrama de puntos de Oxford de ortólogos entreH. simbiolongicarpusyH. vulgaris. a) Diagrama de puntos de Oxford utilizando los 8.974 ortólogos. Para ambas especies, los ortólogos
se numeran secuencialmente según sus posiciones genómicas. Cada punto representa los ortólogos. b) Diagrama de puntos de Oxford utilizando ortólogos en los andamios 5 y 15 de
H. simbiolongicarpusensamblaje del genoma y aquellos en HVAEP3 y HVAEP5 delH. vulgarisensamblaje del genoma. c) Diagrama de puntos de Oxford usando
ortólogos en el andamio 2 y 14 deH. simbiolongicarpusensamblaje del genoma y aquellos en HVAEP7 y HVAEP14 delH. vulgarisensamblaje del genoma.
Conclusión Mb y N50 de 28,8 Mb. El siguiente andamiaje Hi-C dio como resultado 15
andamios a nivel de cromosomas que contienen el 99,8% del ensamblaje
En resumen, realizamos el ensamblaje del genoma de novo deH. total del genoma. Este ensamblaje HSymV2.0 es el primer ensamblaje
simbiolongicarpusy obtuvo secuencias contig con un tamaño de 483 genómico a nivel cromosómico deH. simbiolongicarpus. En
8 |G3,2023, vol. 13, núm. 8
En el ensamblaje HSymV2.0, predijimos 25.825 genes codificadores de Bernt M, Donath A, Jühling F, Externbrink F, Florentz C, Fritzsch G,
proteínas, y el 92,8% de estos genes (23.971 genes) estaban funcionalmente Pütz J, Middendorf M, Stadler PF. MITOS: anotación mejorada del
anotados. Las repeticiones y anotaciones genéticas del ensamblaje del genoma genoma mitocondrial de metazoos de novo. Mol Phylogenet Evol.
y el análisis comparativo del genoma entreH. simbiolongicarpusyH. vulgaris 2013;69(2):313–319. doi:10.1016/j.ympev.2012.08.023.
Destacar una evolución genómica única deH. simbiolongicarpus. Nuestro nuevo presagio de recursos humanos. El linaje de células intersticiales de la hidra: un sistema de células madre que
ensamblaje genómico a nivel de cromosomas deH. simbiolongicarpusserá un surgió temprano en la evolución. Ciencia de células J. 1996;109(6):1155–1164.
recurso importante para la biología de este organismo. También puede resultar doi:10. 1242/jcs.109.6.1155.
útil en estudios genómicos comparativos sobre la evolución de células madre Bosch TCG, David CN. células madre deHidra magnipapilatapuede diferenciar
en organismos multicelulares. se dividen en células somáticas y células de la línea germinal. Biol de desarrollo.
1987;121(1): 182–191. doi:10.1016/0012-1606(87)90151-5.
Bradshaw B, Thompson K, Frank U. Distintos mecanismos subyacen

Disponibilidad de datos regeneración oral versus aboral en el cnidarioHidractinia echinata.
Elife. 2015;4:e05506. doi:10.7554/eLife.05506.
El ensamblaje HSymV2.0, la anotación genética y los archivos
Brůna T, Hoff KJ, Lomsadze A, Stanke M, Borodovsky M. BRAKER2:
relacionados se han depositado en Figshare (https://doi.org/10.6084/
Anotación automática del genoma eucariota con GeneMark-EP+ y
m9.figshare.22126232.v1). El conjunto HSymV2.0 también se ha
AUGUSTUS respaldada por una base de datos de proteínas.
depositado en el NCBI con el número de acceso JARBIS000000000.
Bioinformación de genómica de NAR. 2021;3(1):lqaa108. doi:10.1093/
Las lecturas de PacBio HiFi están disponibles en Sequence Read
nargab/lqaa108.
Archive (SRA) con el número de acceso SRR23493933. Las lecturas de
Buss LW, Yund PO. Un grupo de especies hermanas de Hydractinia en el
Hi-C se han depositado en la SRA con el acceso SRR23493932.
Noreste de Estados Unidos. J Mar Biol Assoc Reino Unido.
Material suplementariodisponible en G3 en línea.
1989;69(4):857–874. doi:10.1017/S0025315400032215.
Cabanettes F, Klopp C. D-GENIES: diagrama de puntos de genomas grandes en un inter-
forma activa, eficaz y sencilla. PeerJ. 2018;6:e4958. doi:10.7717/
Agradecimientos
peerj.4958.
Los autores agradecen a Darrin Schultz (Universidad de Viena, Viena, Cazet JF, Siebert S, Little HM, Bertemes P, Primack AS, Ladurner P,
Austria), Thea Rogers (Universidad de Viena, Viena, Austria), Nina Achrainer M, Fredriksen MT, Moreland RT, Singh S,et al.Un mapa
Znidaric (Universidad de Viena, Viena, Austria) y Angela Caballero epigenético a escala cromosómica del genoma de Hydra revela
Alfonso (Universidad de Viena, Viena, Austria) por sus consejos sobre reguladores conservados del estado celular. Genoma Res. 2023;33(2):
el experimento Hi-C. Los autores agradecen a Atsushi Ogura 283–298. doi:10.1101/gr.277040.122.
(Instituto Nagahama de Biociencia y Tecnología, Nagahama, Japón), Chapman JA, Kirkness EF, Simakov O, Hampson SE, Mitros T,
Hiromasa Tabata (Instituto Nagahama de Biociencia y Tecnología, Weinmaier T, Rattei T, Balasubramanian PG, Borman J, Busam D,et al.
Nagahama, Japón) e Ikuyo Takemura (Instituto Nagahama de El genoma dinámico de Hydra. Naturaleza. 2010;464(7288): 592–596.
Biociencia y Tecnología, Nagahama, Japón) por sus consejos sobre el doi:10.1038/naturaleza08830.
análisis de andamios Hi-C. Los autores también agradecen a Juan Chen R, Sanders SM, Ma Z, Paschall J, Chang ES, Riscoe BM,
Daniel Montenegro Cabrera (Universidad de Viena, Viena, Austria) Schnitzler CE, Baxevanis AD, Nicotra ML. Determinación del sexo XY en
por sus consejos sobre la anotación del genoma. También un cnidario. BMC Biol. 2023;21(1):32. doi:10.1186/s12915-023-01532-2.
agradecemos a Laura Ryan por el cuidado de los animales, a Patricia
Calcagno por la imagen que aparece enFigura 1ay a los miembros de Cheng H, Concepción GT, Feng X, Zhang H, Li H. Haplotipo resuelto de
Frank Lab por su ayuda en la recolección de muestras. La mayoría de Montaje novo utilizando gráficos de montaje por fases con hifiasmo.
los cálculos se realizaron en el Life Science Compute Cluster (LiSC) de Métodos Nat. 2021;18(2):170–175. doi:10.1038/s41592-020-01056-5.
la Universidad de Viena. Chrysostomou E, Febrimarsa, DuBuc T, Frank U. Manipulación genética
en Hidractinia. Métodos Mol Biol. 2022;2450:419–436. doi:10.
1007/978-1-0716-2172-1_22.
Fondos De Coster W, D'Hert S, Schultz DT, Cruts M, Van Broeckhoven C.
Este trabajo fue apoyado por el premio Wellcome Trust Investigator Nanopack: visualización y procesamiento de datos de secuenciación
no. 210722/Z/18/Z a UF, por la Science Foundation Ireland Centre for de lectura larga. Bioinformática. 2018;34(15):2666–2669. doi:10.1093/
Research Training in Genomic Data Science (subvención n.° 18/CRT/ bioinformática/bty149.
6214) a HRH, el Austrian Science Fund FWF (I4353) a OS y KK-N ., la Danecek P, Bonfield JK, Liddle J, Marshall J, Ohan V, Pollard MO,
Fundación Científica Takeda a TK, la Fundación Mochida Memorial Whitwham A, Keane T, McCarthy SA, Davies RM,et al.Doce años de
para la Investigación Médica y Farmacéutica a TK y la Fundación SAMtools y BCFtools. Gigaciencia. 2021;10(2): giab008. doi:10.1093/
Internacional de Investigación Médica a TK gigascience/giab008.
Davis MW, Jorgensen EM. Ape, un editor de plásmidos: disponible gratuitamente
Programa de manipulación y visualización de ADN. Frente Bioinformar.
2022;2:818619. doi:10.3389/fbinf.2022.818619.
Declaración de conflictos de intereses Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, Batut P,
Chaisson M, Gingeras TR. STAR: alineador universal ultrarrápido de RNA-
Los autores declaran no tener conflictos de intereses.
seq. Bioinformática. 2013;29(1):15–21. doi:10.1093/bioinformática/bts635.
DuBuc TQ, Schnitzler CE, Chrysostomou E, McMahon ET, Febrimarsa
GJ, Buggie T, Gornik SG, Hanley S, Barreira SN, González P,et al. El factor de
Literatura citada
transcripción AP2 controla la inducción de células germinales de cnidarios.
Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. local basico Ciencia. 2020;367(6479):757–762. doi:10.1126/science.aay6782. Dudchenko
herramienta de búsqueda de alineación. J Mol Biol. 1990;215(3):403–410. doi:10. O, Batra SS, Omer AD, Nyquist SK, Hoeger M, Durand NC,
1016/S0022-2836(05)80360-2. Shamim MS, Machol I, Lander ES, Aiden AP,et al.De novo
El ensamblaje del genoma de Aedes aegypti utilizando Hi-C produce Pertea G, Pertea M. Utilidades GFF: GffRead y GffCompare. F1000Res.
andamios de longitud cromosómica. Ciencia. 2017;356(6333):92–95. 2020;9:Comunicación ISCB J-304. doi:10.12688/f1000research.23297.
doi:10.1126/science.aal3327. Plickert G, Frank U, Müller WA. Hydractinia, un modelo pionero para
Durand NC, Robinson JT, Shamim MS, Machol I, Mesirov JP, Lander biología de células madre y reprogramación de células somáticas hacia la
ES, Aiden EL. Juicebox proporciona un sistema de visualización de mapas de pluripotencia. Int J Dev Biol. 2012;56(6–7–8):519–534. doi:10.1387/ijdb.
contactos Hi-C con zoom ilimitado. Sistema celular. 2016a;3(1):99–101. 123502gp.
doi:10.1016/j.cels.2015.07.012. Quinlan AR, Hall IM. BEDTools: un conjunto flexible de utilidades para comparar
Durand NC, Shamim MS, Machol I, Rao SS, Huntley MH, Lander ES, características genómicas. Bioinformática. 2010;26(6):841–842. doi:10.
Aiden EL. Juicer proporciona un sistema de un solo clic para analizar 1093/bioinformática/btq033.
experimentos de resolución de bucle Hi-C. Sistema celular. 2016b;3(1):95– Quiroga-Artigas G, Duscher A, Lundquist K, Waletich J, Schnitzler
98. doi:10. 1016/j.cels.2016.07.002. CE. Eliminación de genes mediante electroporación de ARN en horquilla

Flynn JM, Hubley R, Goubert C, Rosen J, Clark AG, Feschotte C, Smit corta en embriones del hidroide marinoHidractinia symbiolongicarpus.
AF. Repetirmodeler2 para el descubrimiento genómico automatizado de Representante científico 2020;10(1):12806. doi:10.1038/s41598-020-69489-8.
familias de elementos transponibles. Proc Natl Acad Sci EE.UU. A. 2020;
117(17):9451–9457. doi:10.1073/pnas.1921046117. Rice P, Longden I, Bleasby A. EMBOSS: el estudio molecular europeo
Frank U, Nicotra ML, Schnitzler CE. El cnidario colonial Hydractinia. Paquete de software abierto de biología. Tendencias Genet. 2000;16(6):276–277.
Evodévo. 2020;11(1):7. doi:10.1186/s13227-020-00151-0. Gabriel L, Hoff doi:10.1016/S0168-9525(00)02024-2.
KJ, Brůna T, Borodovsky M, Stanke M. TSEBRA: tran- Sanders SM, Ma Z, Hughes JM, Riscoe BM, Gibson GA, Watson AM,
selector de script para BRAKER. Bioinformática BMC. 2021;22(1):566. Flici H, Frank U, Schnitzler CE, Baxevanis AD,et al.Activación del gen
doi:10.1186/s12859-021-04482-0. mediado por CRISPR/Cas9 en el hidroideHidractinia
Gahan JM, Bradshaw B, Flici H, Frank U. Las células madre intersticiales en symbiolongicarpus. Genómica BMC. 2018;19(1):649. doi:10.1186/
Hydractinia y su papel en la regeneración. Opinión actual Genet Dev. s12864-018-5032-z.
2016;40:65–73. doi:10.1016/j.gde.2016.06.006. Shumate A, Salzberg SL. Despegue: mapeo preciso de anotaciones genéticas
Gurevich A, Saveliev V, Vyahhi N, Tesler G. QUAST: evaluación de calidad ciones. Bioinformática. 2020;37(12):1639–1643. doi:10.1093/
Herramienta de desarrollo para ensamblajes de genomas. Bioinformática. bioinformática/btaa1016.
2013;29(8): 1072–1075. doi:10.1093/bioinformática/btt086. Simakov O, Bredeson J, Berkoff K, Marletaz F, Mitros T, Schultz DT,
Hobmayer B, Jenewein M, Eder D, Eder MK, Glasauer S, Gufler S, Hartl O'Connell BL, Estimado P, Martínez DE, Steele RE,et al.Sintenia
M, Salvenmoser W. Stemness en Hydra: una perspectiva actual. Int J profundamente conservada y evolución de los cromosomas de metazoos.
Dev Biol. 2012;56(6–7–8):509–517. doi:10.1387/ijdb.113426bh. Huerta- Ciencia avanzada. 2022;8(5):eabi5884. doi:10.1126/sciadv.abi5884.
Cepas J, Szklarczyk D, Heller D, Hernández-Plaza A, Forslund SK, Simão FA, Waterhouse RM, Ioannidis P, Kriventseva EV, Zdobnov EM.
Cook H, Mende DR, Letunic I, Rattei T, Jensen LJ,et al.eggNOG 5.0: un BUSCO: evaluación de la integridad del ensamblaje y la anotación del
recurso de ortología jerárquico, funcional y filogenéticamente anotado genoma con ortólogos de copia única. Bioinformática. 2015;31(19):
basado en 5090 organismos y 2502 virus. Ácidos nucleicos res. 3210–3212. doi:10.1093/bioinformática/btv351.
2019;47(D1):D309–D314. doi:10.1093/nar/gky1085. Varley Á, Horkan HR, McMahon ET, Krasovec G, Frank U. Pluripotent,
Juliano CE, Reich A, Liu N, Götzfried J, Zhong M, Uman S, Reenan RA, Las células madre adultas competentes de las células germinales subyacen a la
Wessel GM, Steele RE, Lin H. Las proteínas PIWI y los ARN que interactúan capacidad regenerativa de los cnidarios y al crecimiento clonal. Curr Biol.
con PIWI funcionan en las células madre somáticas de Hydra. Proc Natl 2023;33(10):1883– 1892.e3. doi:10.1016/j.cub.2023.03.039. Epub 2023 6 de abril.
Acad Sci EE.UU. A. 2014;111(1):337–342. doi:10.1073/pnas.1320965111. Weismann A. El origen de las células sexuales en las hidromedusas.
Künzel T, Heiermann R, Frank U, Müller W, Tilmann W, Bause M, (Título extranjero: Die Entstehung der Sexualzellen bei
Nonn A, Helling M, Schwarz RS, Plickert G. Potencial de migración y Hydromedusen). Jena: Gustav Fischer; 1883.
diferenciación de células madre en el cnidario Hydractinia analizado Zdobnov EM, Apweiler R. Interproscan: una plataforma de integración para
en quimeras y animales transgénicos eGFP. Biol de desarrollo. 2010; los métodos de reconocimiento de firmas en InterPro. Bioinformática.
348(1):120–129. doi:10.1016/j.ydbio.2010.08.017. 2001;17(9):847–848. doi:10.1093/bioinformática/17.9.847.
Li H. Minimap2: alineación por pares para secuencias de nucleótidos. Zou H, Zhang J, Li W, Wu S, Wang G. Genoma mitocondrial del
Bioinformática. 2018;34(18):3094–3100. doi:10.1093/ Medusa de agua dulce Craspedacusta sowerbyi y filogenética de
bioinformática/bty191. Medusozoa. Más uno. 2012;7(12):e51465. doi:10.1371/diario.
Lin J, Feng S, Wang L. Secuencia completa del genoma mitocondrial de teléfono.0051465.
Aequorea coerulescens. Recurso de la parte B del ADN mitocondrial. 2019;
4(2):2882–2883. doi:10.1080/23802359.2019.1660257. Editor: J. Parker

4genoma Ensamble Hydractiniaenes 230908 161252

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

4genoma Ensamble Hydractiniaenes 230908 161252

Cargado por

Copyright:

Formatos disponibles

Traducido del inglés al español - www.onlinedoctranslator.

Informe del genoma

Ensamblaje del genoma a nivel cromosómico deHidractinia

Descargado de https://academic.oup.com/g3journal/article/13/8/jkad107/7170730 por el usuario de Withers el 4 de septiembre de 2023.

Introducción hidractiniaes el primer animal en el que las células madre y germinales

Recibió:06 de marzo de 2023.Aceptado:08 de mayo de 2023

Descargado de https://academic.oup.com/g3journal/article/13/8/jkad107/7170730 por el usuario de Withers el 4 de septiembre de 2023.

Descargado de https://academic.oup.com/g3journal/article/13/8/jkad107/7170730 por el usuario de Withers el 4 de septiembre de 2023.

Análisis de sintenia También identificamos 64 genes BUSCO fragmentados (6,7%). Es de

Tabla 2.Estadísticas de montaje de laH. simbiolongicarpusgenoma.

Longitud total (pb) 482.771.323 482.928.323 481.835.061 406.663.980

e integridad del ensamblaje HSymV2.0. El estudio anterior demostró que

Descargado de https://academic.oup.com/g3journal/article/13/8/jkad107/7170730 por el usuario de Withers el 4 de septiembre de 2023.

Descargado de https://academic.oup.com/g3journal/article/13/8/jkad107/7170730 por el usuario de Withers el 4 de septiembre de 2023.

Tabla 4.Resumen de los resultados de RepeatMasker.

Retroelementos 50.329 25.095.050 5.20 316.787 153.628.253 17.05

Descargado de https://academic.oup.com/g3journal/article/13/8/jkad107/7170730 por el usuario de Withers el 4 de septiembre de 2023.

anotación. Por ejemplo,Piwi1es un marcador conocido para las células i (

Descargado de https://academic.oup.com/g3journal/article/13/8/jkad107/7170730 por el usuario de Withers el 4 de septiembre de 2023.

Descargado de https://academic.oup.com/g3journal/article/13/8/jkad107/7170730 por el usuario de Withers el 4 de septiembre de 2023.

Descargado de https://academic.oup.com/g3journal/article/13/8/jkad107/7170730 por el usuario de Withers el 4 de septiembre de 2023.

También podría gustarte