Está en la página 1de 4

Biología molecular

Taller Bases de datos


Becerra, Miguel Ángel (A00372351); Montoya, Andrés Felipe (A00377911); Jaramillo,
Esteban (A00370107)
1. Secuencias de nucleótidos o aminoácidos en NCBI/GenBank:
a. En “locus”, ¿qué quiere decir “sequence length”? ¿Cuánto mide?
Sequence length se refiere al número de pares de bases de nucleótidos o
residuos de aminoácidos presentes en el registro de secuencia. Para este caso
se obtuvo una longitud de secuencia de 29891bp

b. ¿Qué información tiene el “accession”? ¿Cuál es el “accession” number?


La información que posee el accession es una combinación de letras y números única
para identificar un registro de secuencia. Los números de accession no cambian
incluso si la información del registro lo hace por petición del autor. Para este caso, el
accession number es MN975262

c. ¿De qué organismo proviene esa secuencia de ADN?


Proviene del “síndrome respiratorio agudo severo coronavirus 2

d. ¿Qué quiere decir CDS?


Es la región de nucleótidos que se corresponde con la secuencia de aminoácidos de
una proteína. La secuencia codificante incluye la localización de los codones de
inicio y parada. Los autores especifican la naturaleza de la CDS utilizando el
calificador

e. ¿Qué información se encuentra en “reference”?


Se encuentra información sobre las opiniones y discusiones originadas por los
autores, en base a los resultados reportados en el expediente

f. Si hace “click” sobre protein id, ¿qué encuentra?


Al hacer click en protein id lleva a una nueva página en donde el expediente
trata sobre la poliproteína orf1ab (síndrome respiratorio agudo severo
coronavirus 2) y toda la información referente a esta: accession; CDS;
sequence length; el organismo etc

2. Búsqueda de la secuencia de un gen/proteína de interés (1GFL) Green


Fluorescent Protein

a. ¿Qué es y qué hace BLAST? ¿Qué resultados se obtienen con esta


herramienta?
BLAST es una herramienta informática de alineamiento de secuencias de tipo
local; es decir, busca/compara similitudes entre secuencias de ADN o
proteínas en bases de datos científicas. Como resultado, BLAST arrojará una
lista de genes o proteínas similares a la que se solicitó comparar desde un
inicio. Adicionalmente, proporciona puntaje de similitud.
b. ¿Hay proteínas/genes homólogos a la proteína/gen que usted buscó?
Sí, hay al menos 100 secuencias similares a la propuesta inicialmente; tal
proteína se halla en medusas que viven en las aguas frías del norte del pacífico.
La 1GFL tiene propiedades bioluminiscentes, esta emite luz “amarilla” o
verdosa.
c. ¿Qué es el “query” y el “subject” en los alineamientos que usted está
analizando?
El query es la “consulta” en este caso, una proteína en secuencia FASTA. Por
otro lado, el subject es el “molde” o los resultados con los que se compara el
query
3. Utilizar ORF finder de NCBI como herramienta de predicción.
a. Ingrese a https://www.ncbi.nlm.nih.gov/orffinder/ y copie la secuencia de
nucleótidos desconocida. Hacer click en el recuadro “Submit” empleando las
opciones de búsqueda sugeridas por el programa.
i. ¿Cuántos ORFs obtienen?
R// La secuencia cuenta con 13 ORFs

ii. ¿Qué tipo de información obtienen con relación a los ORF?

Se obtiene el tamaño de la longitud, el codon exacto donde inicia y se detiene cada


ORF, y el sentido de la hebra, es decir, si esta es positiva o negativa

b. Para verificar si un ORF codifica para una proteína o secuencia en particular


emplee la herramienta SmartBlast (ubicada al lado izquierdo de la pantalla).
Los ORFs de mayor longitud por lo general, representan regiones
codificantes; seleccione el ORF de mayor longitud (indicar longitud) y haga
click en el recuadro “SmartBlast”.
i. ¿Cuál es la utilidad de esta herramienta?
R// La herramienta smarBlast es utilizada para identificar o verificar si en el
ORF seleccionado se codifica para una proteína o alguna secuencia
ii. ¿Qué resultados obtienen en general?

Iii. Adicionalmente haga un BLAST a esa secuencia desconocida. ¿Qué obtiene?


R// Se obtiene el titulo de la secuencia, el tipo de molecula que en este caso
es un aminoacido, el valor de la longitud de la secuencia (323), y la su id de
referencia (HHHJ97E701R). Ademas, tambien se muestra una lista de las
secuencias que producen alineamientos significativos.

4. Bioinformática: Diseño de primers o cebadores

a. La posición de los primers respecto al ADN (indique cuantos fragmentos


podría amplificar)

Podría amplificar 2 fragmentos


b. El tamaño del fragmento amplificado (indique el tamaño de cada
fragmento amplificado)

Secuencia de 911 nucleotidos


c. La Tm de los primers (explique qué es la Tm)
El “Tm” hace referencia a la temperatura óptima de funcionamiento del
primer. Por ejemplo, estos 5 primers.

d. ¿Se podría secuenciar este fragmento del gen?


Sí, el fragmento amplificado podría ser purificado y secuenciado utilizando
técnicas como la secuenciación de Sanger o la NGS
e. ¿Están los cebadores (primers) incluidos dentro de la secuencia del
producto de amplificación? Justifique la respuesta
Si

También podría gustarte