Becerra, Miguel Ángel (A00372351); Montoya, Andrés Felipe (A00377911); Jaramillo, Esteban (A00370107) 1. Secuencias de nucleótidos o aminoácidos en NCBI/GenBank: a. En “locus”, ¿qué quiere decir “sequence length”? ¿Cuánto mide? Sequence length se refiere al número de pares de bases de nucleótidos o residuos de aminoácidos presentes en el registro de secuencia. Para este caso se obtuvo una longitud de secuencia de 29891bp
b. ¿Qué información tiene el “accession”? ¿Cuál es el “accession” number?
La información que posee el accession es una combinación de letras y números única para identificar un registro de secuencia. Los números de accession no cambian incluso si la información del registro lo hace por petición del autor. Para este caso, el accession number es MN975262
c. ¿De qué organismo proviene esa secuencia de ADN?
Proviene del “síndrome respiratorio agudo severo coronavirus 2
d. ¿Qué quiere decir CDS?
Es la región de nucleótidos que se corresponde con la secuencia de aminoácidos de una proteína. La secuencia codificante incluye la localización de los codones de inicio y parada. Los autores especifican la naturaleza de la CDS utilizando el calificador
e. ¿Qué información se encuentra en “reference”?
Se encuentra información sobre las opiniones y discusiones originadas por los autores, en base a los resultados reportados en el expediente
f. Si hace “click” sobre protein id, ¿qué encuentra?
Al hacer click en protein id lleva a una nueva página en donde el expediente trata sobre la poliproteína orf1ab (síndrome respiratorio agudo severo coronavirus 2) y toda la información referente a esta: accession; CDS; sequence length; el organismo etc
2. Búsqueda de la secuencia de un gen/proteína de interés (1GFL) Green
Fluorescent Protein
a. ¿Qué es y qué hace BLAST? ¿Qué resultados se obtienen con esta
herramienta? BLAST es una herramienta informática de alineamiento de secuencias de tipo local; es decir, busca/compara similitudes entre secuencias de ADN o proteínas en bases de datos científicas. Como resultado, BLAST arrojará una lista de genes o proteínas similares a la que se solicitó comparar desde un inicio. Adicionalmente, proporciona puntaje de similitud. b. ¿Hay proteínas/genes homólogos a la proteína/gen que usted buscó? Sí, hay al menos 100 secuencias similares a la propuesta inicialmente; tal proteína se halla en medusas que viven en las aguas frías del norte del pacífico. La 1GFL tiene propiedades bioluminiscentes, esta emite luz “amarilla” o verdosa. c. ¿Qué es el “query” y el “subject” en los alineamientos que usted está analizando? El query es la “consulta” en este caso, una proteína en secuencia FASTA. Por otro lado, el subject es el “molde” o los resultados con los que se compara el query 3. Utilizar ORF finder de NCBI como herramienta de predicción. a. Ingrese a https://www.ncbi.nlm.nih.gov/orffinder/ y copie la secuencia de nucleótidos desconocida. Hacer click en el recuadro “Submit” empleando las opciones de búsqueda sugeridas por el programa. i. ¿Cuántos ORFs obtienen? R// La secuencia cuenta con 13 ORFs
ii. ¿Qué tipo de información obtienen con relación a los ORF?
Se obtiene el tamaño de la longitud, el codon exacto donde inicia y se detiene cada
ORF, y el sentido de la hebra, es decir, si esta es positiva o negativa
b. Para verificar si un ORF codifica para una proteína o secuencia en particular
emplee la herramienta SmartBlast (ubicada al lado izquierdo de la pantalla). Los ORFs de mayor longitud por lo general, representan regiones codificantes; seleccione el ORF de mayor longitud (indicar longitud) y haga click en el recuadro “SmartBlast”. i. ¿Cuál es la utilidad de esta herramienta? R// La herramienta smarBlast es utilizada para identificar o verificar si en el ORF seleccionado se codifica para una proteína o alguna secuencia ii. ¿Qué resultados obtienen en general?
Iii. Adicionalmente haga un BLAST a esa secuencia desconocida. ¿Qué obtiene?
R// Se obtiene el titulo de la secuencia, el tipo de molecula que en este caso es un aminoacido, el valor de la longitud de la secuencia (323), y la su id de referencia (HHHJ97E701R). Ademas, tambien se muestra una lista de las secuencias que producen alineamientos significativos.
4. Bioinformática: Diseño de primers o cebadores
a. La posición de los primers respecto al ADN (indique cuantos fragmentos
podría amplificar)
Podría amplificar 2 fragmentos
b. El tamaño del fragmento amplificado (indique el tamaño de cada fragmento amplificado)
Secuencia de 911 nucleotidos
c. La Tm de los primers (explique qué es la Tm) El “Tm” hace referencia a la temperatura óptima de funcionamiento del primer. Por ejemplo, estos 5 primers.
d. ¿Se podría secuenciar este fragmento del gen?
Sí, el fragmento amplificado podría ser purificado y secuenciado utilizando técnicas como la secuenciación de Sanger o la NGS e. ¿Están los cebadores (primers) incluidos dentro de la secuencia del producto de amplificación? Justifique la respuesta Si