Está en la página 1de 2

Segundo taller Bioinformática

Estudiante: Luisa Fernanda Moncada Gomez

1. Averigüe acerca del proceso de curación realizado por RefSeq


● Procesamiento de curación (fallas de control de calidad y otros genes):
a. Reúna los datos disponibles
b. Revisar las asociaciones de secuencias del gen 2: los conflictos de datos se
resuelven mediante la revisión del personal del NCBI en colaboración con las
bases de datos colaboradoras; este proceso de revisión es fundamental para
representar con precisión genes estrechamente relacionados.
c. La curación puede proporcionar mejoras adicionales a la transcripción de
RefSeq y / o los registros de proteínas, que incluyen:
i. Información de secuencia
1. Eliminar vector, contaminación del enlazador
2. Extender UTR
3. Representar la secuencia óptima corrigiendo errores de
secuenciación o eligiendo qué variante polimórfica
representar, tal como se identifica en los informes publicados,
mediante análisis de secuencia interno o mediante
comunicación personal.
4. Representar registros de variantes de empalme cuando hay
suficientes datos inequívocos disponibles
ii. Información de la anotación:
1. Agregar publicaciones
2. Agregue una descripción resumida sobre la función del gen y
la proteína
3. Agregue una descripción de las variantes de la transcripción
4. Agregue anotaciones de características como productos de
proteínas maduras, señales y sitios de poliadenilación
5. Asegure la representación correcta de la biología atípica,
como selenoproteínas, deslizamiento ribosómico o sitios de
inicio de traducción sin AUG.
2. Tome un gen de su interés y caracteriselo a nivel de DNA, RNA y proteína en el
GenBank, con números de acceso y diferentes campos de interés. Haga lo
mismo en la BD EBI e identifique diferencias y similitudes

3. Averiguar la función de las siguientes bases de datos:



● Sequence-Tagged Sites(STSs): Son puntos de referencia únicos basados
​en secuencias en el genoma que son detectables mediante la reacción en
cadena de la polimerasa (PCR). La generación de STS se ha convertido en
una parte integral de las estrategias diseñadas para el mapeo de
cromosomas específicos, implica la identificación de fragmentos de ADN
clonados en una biblioteca (generalmente clones de cromosomas artificiales
de levadura (YAC)) y el establecimiento de su posición a lo largo del
cromosoma a través de regiones de secuencia conocida (STS).
● Genome Survey Sequences(GSSs): La división GSS de GenBank es
similar a la división EST, con la excepción de que la mayoría de las
secuencias son de origen genómico, en lugar de ADNc (ARNm). Cabe
señalar que se pueden derivar dos clases (productos atrapados en el exón y
productos atrapados en el gen) mediante un intermedio de ADNc. La división
GSS contiene (pero no se limita a) los siguientes tipos de datos:
❖ secuencias de encuesta genómica aleatorias de "lectura de una sola
pasada".
❖ secuencias finales de cósmido / BAC / YAC
❖ secuencias genómicas atrapadas en exones
❖ Secuencias de PCR de aluminio
❖ secuencias etiquetadas con transposones
● High-Throughput Genomic Sequence (HTGS): La división de secuencias
genómicas de alto rendimiento (HTG) se creó para que los datos de
secuencias genómicas inacabadas estén rápidamente disponibles para la
comunidad científica, contiene secuencias de ADN sin terminar generadas
por los centros de secuenciación de alto rendimiento que utilizan la
secuenciación tradicional de Sanger basada en clones. A las secuencias
HTG sin terminar que contienen contigs mayores de 2 kb se les asigna un
número de acceso y se depositan en la división HTG.

4. De que se trata el proyecto Unigene

UniGene es un sistema experimental para dividir automáticamente las secuencias de


GenBank en un conjunto no redundante de grupos orientados a genes. Cada grupo
UniGene contiene secuencias que representan un gen único, así como información
relacionada, como los tipos de tejido en los que se ha expresado el gen y la
ubicación del mapa.

https://www.ncbi.nlm.nih.gov/genbank/dbgss/
http://www.bioinfo.org.cn/relative/NCBI-UniGene.htm
https://www.ncbi.nlm.nih.gov/refseq/about/
https://www.ncbi.nlm.nih.gov/genbank/htgs/
https://www.sciencedirect.com/topics/biochemistry-genetics-and-molecular-biology/sequence
-tagged-site

También podría gustarte