Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRACTICAS CORREGIDAS
Integrantes:
Objetivos:
➔ Que el alumno se familiarice con la organización y los conceptos empleados en las bases de datos EMBL-
EBI (www.ebi.ac.uk) y NCBI (www.ncbi.nlm.nih.gov).
➔ Que el alumno conozca las principales bases de datos para la búsqueda de literatura científica.
➔ Que los alumnos comparen el tipo de información que pueden obtener de las diferentes bases de datos de
literatura científica.
➔
RESULTADOS
1
2. ¿Para qué sirven las bases de datos PubMed, PubMed Central y Bookshelf?
PubMed: Permite el acceso a las bases de datos compiladas por la NLM, MEDLINE y otras.
PubMed y PubMed Central: Contienen citas de artículos científicos.
Bookshelf: Sirve para citar libros.
3. ¿En cuántas bases de datos puedes encontrar información sobre gut microbiome
haciendo una búsqueda general en NCBI?
En 23 bases de datos
5. ¿Cuántas revisiones hay entre los artículos similares al artículo con el PMID:
23384445? Realiza la búsqueda en PubMed. 190 revisiones
PubMed Central también puede realizar ese tipo de búsquedas. PubMed tiene muchos
más registros que PMC, pero cuando la búsqueda incluye términos específicos, PubMed
2
no los incluirá porque no se encuentran en el abstract o título, sino en otra parte del texto
completo (e.g. resultados, métodos).
7. ¿En qué casos es más recomendable buscar en PubMed y, en qué casos sería mejor
PubMed Central?
Se utiliza PMC cuando se requiere consultar toda la información del artículo de interés y
en caso de realizar una búsqueda rápida y comparativa es conveniente utilizar PubMed.
También depende de que tan especifico sea el término buscado.
Las secciones del artículo que incluye para la búsqueda, por ejemplo, PubMed busca en
el título de la revista, el título del artículo, los autores y el abstract.
PubMed central incluye los campos de PubMed y anexa la introducción, los materiales y
métodos, resultados y discusión. PubMed Europe incluye los campos de búsqueda de
PubMed central y PubMed en una sola búsqueda y además busca en registros
específicos como textos de agronomía (que no se encuentran en PubMed de NCBI).
3
10. Usando la sintaxis de Europe PMC (europepmc.org/searchsyntax), indica de qué
forma puedes realizar las siguientes búsquedas:
II. Después ingresó en la barra de búsqueda lo siguiente con mayúsculas para delimitar la
búsqueda “ABSTRACT seguida de “gut microbiome” JOURNAL [Frontiers in genetics].
4
c. Artículos que contengan “gut microbiome” en el título.
5
REFERENCIAS
• Capítulo 2. Pevsner J. Bioinformatics and Functional Genomics. 3rd ed. Wiley
Blackwell, 2015.
• Help using Europe PMC [Internet]. Europe PMC.2020 [citado 22 de mayo
2020]. Disponible en: https://europepmc.org/Help
• PubMed User Guide [Internet]. https://pubmed.ncbi.nlm.nih.gov/help/.2020
[citado 22 mayo 2020]. Disponible en: https://pubmed.ncbi.nlm.gov/help/
6
PRACTICA 2. Búsquedas en las bases de datos públicas de
EMBL-EBI y de NCBI
Objetivos:
➔ Aplicar los conceptos aprendidos
➔ Desarrollar habilidades para el uso del portal Gene de (NCBI)
RESULTADOS
7
2. ¿A qué molécula corresponde el identificador NC_045512?
3. Indica qué tipo de información almacenan las siguientes bases de datos: RefSeq,
GenBank, Nucleotide, UniprotKB, ENA, PDB.
8
• GenBank: Es una base de datos de secuencias genéticas de los Institutos
Nacionales de Salud (NHI). En esta base de datos se encuentra una colección
anotada de todas las secuencias de ADN disponibles públicamente. Diseñada para
proporcionar y fomentar el acceso dentro de la comunidad científica a la información
de secuencia de ADN más actualizada y completa.
• Swiss Prot: Sección que contiene registros anotados manualmente con información
extraída de la literatura y análisis computacionales evaluados por el curador
9
6. La localización molecular de un gen está dada por el cromosoma (o número de
cromosoma), y los nucleótidos de las posiciones inicial y final. ¿Cuál es la
localización molecular del gen TRM3 de S. cerevisiae S288C?
7. ¿Cuáles son los identificadores de los genes Cypt4, Alpk2 y Stox1 de ratón en el
portal GENE?
10
8. Indica la secuencia en formato FASTA del gen ac (achaete) de la mosca de la fruta
(Drosophila melanogaster).
11
>NM_057476.3 Drosophila melanogaster achaete (ac), mRNA
AGAACAGAGCCAGCGCTGAAGCAAGGAGCATCGTCACACAATAACGTTATACTATCTCTTAAAATGGCTT
TGGGCAGCGAAAATCACTCTGTTTTCAACGACGACGAGGAGTCATCTTCGGCCTTTAATGGACCCTCTGT
TATCCGGAGAAATGCCCGGGAACGCAACCGCGTAAAGCAGGTCAACAATGGCTTCAGCCAACTACGACAA
CATATCCCTGCGGCCGTAATAGCCGATTTAAGCAATGGTCGCCGGGGAATTGGTCCCGGCGCCAATAAAA
AACTGAGCAAAGTTAGCACACTGAAAATGGCAGTAGAGTACATACGGCGCTTGCAGAAAGTTCTTCATGA
AAACGACCAGCAGAAACAGAAACAGTTGCATTTGCAGCAGCAACATTTGCACTTTCAGCAGCAGCAACAG
CATCAACACTTATACGCCTGGCACCAAGAGTTGCAGTTGCAATCTCCAACTGGCAGCACAAGTTCCTGCA
ACAGCATTAGCTCTTATTGCAAGCCAGCAACATCGACGATTCCGGGAGCAACACCTCCTAACAATTTTCA
TACCAAGTTGGAAGCCAGTTTTGAAGACTACCGTAACAATTCCTGCAGTTCTGGTACTGAAGATGAGGAC
ATCCTCGACTATATATCACTCTGGCAGGACGACCTGTAAAAAAACAGATCAAATCTTCAGCTATTGCTAG
TCGCACCCAACCATAACACACATCAAACCATTGATTGGCCAACAAGTATTACCTCAGCCACAAAGTATTT
ATATTCCCTAGAACTACCTTTTTGCCTTATAAATTAGTATTTAAGGTTTTATATAGTTTCTAAGGATAGT
TTCTAATGGAAGACAATTTATATTTAAGTTTTTTTTTATAGCATACATTGAGGACATTAAACTGATATAT
ATAAAAT
12
REFERENCIAS
• Xiong J. Introduction to Biological Databases. Essential Bioinformatics.
Cambridge: Cambridge University Press; 2006. p. 10–28.
• Robbins, Robert J.. 1994. Biological databases: A new scientific literature.
Publishing Research Quarterly, 10: 3-27.
• Rodrigo E. Bases de datos biológicas [Internet]. Tamaulipas: CINESTAV; 2013.
Disponible en: https://www.tamps.cinvestav.mx/~ertello/bioinfo/sesion04.pdf
13
PRACTICA 3: BLAST E INFLUENZA HUMANA
Objetivos:
➔ Que el alumno se familiarice con el uso de los programas BLASTN,
BLASTP y BLASTX.
➔ Que el alumno integre el tema actual BLAST con los temas revisados
previamente, como bases de datos de biomoléculas y diseño de oligos.
RESULTADOS
14
b) Correr el BLASTP con click en BLAST
15
❖ El único posible resultado que cumple con los criterios de búsqueda es la proteína
con el ID 5NWE.
16
❖ Debes dar clic en el apartado de Analyze these sequences, en el apartado Run
BLAST.
Debes observar que los ID de las cuatro proteínas están escritos en el recuadro de
Enter Query Sequence y además los siguientes campos deben ser especificados:
-De los posibles resultados generados solo hay una descripción coincide con el
identificador del PDB: Chain A, Neuraminidase [Influenza A virus].
17
❖ Proteína con la mutación identificada
18
b. ¿Qué otras sustituciones presenta esa secuencia?
19
a. ¿De dónde es la cepa con la que comparte mayor identidad y en qué año se aisló?
20
b. La secuencia obtenida de la muestra tomada de este paciente, ¿es una variante con
resistencia a oseltamivir?
21
3. El gen que codifica para la hemaglutinina es uno de los que se busca amplificar en
los ensayos de RT-PCR para detectar influenza, además permite determinar el tipo de
influenza del paciente (A o B).
22
b. ¿Se pueden considerar proteínas ortólogas de acuerdo con el método BDBH?
c. ¿En cuál de los dos BLAST se obtuvo un resultado con mejor e-value?
23
4. Supongamos que, en 2019, dos cepas de virus de la influenza, uno de tipo A y otro
B, fueron los causantes de un brote de influenza en California. La secuencia de los
genes que codifican para la hemaglutinina están disponibles en el GenBank con los
identificadores MN230189.1 y MN552750.1. Corre un BLASTN para alinear estas dos
secuencias y determinar las regiones con mayor y menor identidad.
¿Qué región del gen que codifican para la hemaglutinina se pueden amplificar para detectar
si un paciente presenta influenza A o B?
24
❖ Para alinear estas dos secuencias, activar la opción “Align two or more sequences”
❖ En Program selection poner la opción “Somewhat similar sequences” o
discontiguous megablast .
❖ Presionar en el recuadro azul que dice BLAST.
❖ Al correr el BLAST se despliega una ventana que muestra 1 resultado (que puede
tener diferente accesión de acuerdo si el virus de la influenza es tipo A o B
❖ En el apartado de alineamientos se observa la secuencia y la región de los
nucleótidos que codifican para la hemaglutinina. Con ello se puede detectar la región
a amplificar para detectar si alguien presenta influenza.
❖ Finalmente se observa que la secuencia con el accesión MN552750.1 tiene la
región a amplificar entre los nucleótidos 38 y 1050.
❖ La secuencia con el accession MN230189.1 tiene la región a amplificar entre los
nucleótidos 37 y 1094.
25
5. ¿Qué tipo de influenza tiene un paciente de quien se tomó una muestra y se obtuvo
la secuencia PRAC3?4 (disponible en secuencias_practica3.fa) de hemaglutinina?
26
27
REFERNCIAS:
28