Está en la página 1de 3

Esqueleto Ensamblaje

1. Materiales y métodos (2 meses)


a. Secuenciación del genoma:
i. Secuenciamiento datos Illumina Short reads
ii. Secuenciación y construcción de lecturas PacBio
iii. Secuenciación y construcción de lecturas Hi-C.
b. Ensamblaje datos PacBio y Canu Assembler
c. Reducción de secuencias para generar representación Monoploide.
d. Polishing con datos Illumina y NGSEP.
e. Ensamblaje con datos Hi-C
f. Scaffolding usando genomas de referencia: ​S. spontaneum ​y R560​.
g. Anotacion Maker y Trinotate
i. Anotación estructural.
ii. Anotacion funcional.
iii. Identificación de dominios PFAM
iv. Identificación y clasificación de regiones repetitivas (TEs)
v. Identificación de genes resistentes a enfermedades
vi. Identificación de genes alta biomasa.
vii. Identificación de genes escasa floración.
viii. Identificación de inversiones y translocaciones
ix. Colinealidad entre genes
x. Duplicación de genes.
h. Mapeo e identificación de marcadores usando datos GBS y RADSeq.
i. Genotipificación con datos GBS y RADSeq.
j. Filogenia con genomas de especies cercanas a caña de azúcar.
k. Identificación de secuencias heredades de los parentales ​S. spontaneum​ y ​S.
officinarum ​(ray r750)
l. Análisis comparativo con el genoma de Sorgo.
m. Analisis comparativo con el genoma S. spontaneum.
n. Análisis comparativo con genoma R570.
o. Análisis de variantes alélicas.
p. Análisis de SNPs e Indels (indica paper)
q. Identificación de marcadores moleculares SNPs.
r. Análisis de diversidad genética.
s. Análisis filogenético
2. Resultados (2 meses)
a. Secuenciación del genoma
b. Ensamblaje genoma monoplode
c. Anotación funcional y estructural genoma
d. Análisis de colinealidad y sintenia r570
e. Análisis de colinealidad y sintenia con otras especies: sorghum, ​S. spontaneum.
f. Identificación de genes ligados a características de interés:
i. Genes de resistencia enfermedades.
ii. Genes ligados a alta biomasa.
iii. Genes ligados a escasa floración.
iv. Genes heredados de S. spontaneum y S. officinarum.
g. Estimación de diversidad genética usando datos GBS y RADseq.
3. Discusión de resultados.

Huella Molecular

1. Materiales y métodos (1 meses)


a. Lecturas GBS y Radseq
b. Genomas de referencia
c. Mapeo de datos, genotipado e identificación de SNPs (NGSEP)
i. Sorgo
ii. SP80-3280
iii. S. spontaneum
iv. CC 01-1940
d. Cálculos de similitud genética
i. Tassel
ii. CC-Dist NGSEP
e. Selección de SNPs más polimórficos
i. Filtros estándar y fuertes.
ii. Filtro Australianos
iii. Filtro Cenicaña
f. Algoritmo bootstrapping reducción de huella molecular.
g. Imputación de valores perdidos
h. Validación de huella molecular.
i. In silico: Análisis de similitud genética
ii. Tecnología de genotipificación: Fluidigm
2. Resultados (2 meses)
a. Genotipificación e identificación de SNPs con genomas de referencia.
b. Cálculos de Similitud genética por Dosis alélicas vs Genotipo.
c. Optimización de huella molecular usando filtros
i. Envio 1
ii. Envio 2
iii. Envio 3
iv. Comparación de Envíos.
d. Selección de mejor huella molecular generada por algoritmo de Bootstrapping.
e. Validación de marcadores SNPs usando tecnologías de genotipificación.
f. Características de SNPs huella molecular.
g. Análisis de diversidad genética usando huella molecular.
h. Análisis filogenético usando huella molecular.
i. Discusión de los resultados.
Construcción del paper:

4 meses

También podría gustarte