Está en la página 1de 11

GUÍA DE PRÁCTICA N° 10

INTRODUCCIÓN A LA BIOINFORMÁTICA COMO RECURSO


BIOTECNOLÓGICO
(Búsqueda de similitudes en base de dados)

COMPETENCIAS

 Utiliza los recursos tecnológicos para comprender conceptos básicos de Genética y


Biología molecular.
 Conoce el fundamento del programa BLAST y utiliza eficientemente la búsqueda de
similitudes de secuencias de DNA
 Conocer el fundamento del algoritmo del programa BLAST
 Conocer y aplicar las diferentes modalidades con BLAST para buscar similitudes de
secuencias de aminoácidos y nucleótidos en bases de datos.
 Conocer y emplear las herramientas especializadas de BLAST para localizar
homologías remotas, analizar secuencias de genomas y buscar dominios conservados.

INTRODUCCIÓN

La comparación de secuencias de nucleótidos o proteínas provenientes de uno o diferentes


organismos es de gran importancia en Biología Molecular.

Al encontrar similitudes entre secuencias, los científicos pueden inferir la función de genes
secuenciados recientemente, predecir nuevos miembros de familias de genes y explorar
relaciones evolutivas. Ahora que se han secuenciado genomas completos la búsqueda de
similitud de secuencias es una tarea obligada que permite saber en cuantos otros organismos
se encuentran secuencias similares, en que regiones del genoma están codificadas, en cuantos
procesos metabólicos participan e incluso conocer regiones importantes para la regulación de
su función.

Aunque los algoritmos de programación dinámica garantizan el encontrar el alineamiento


“óptimo” entre dos secuencias, los programas que los utilizan requieren de tiempos de cómputo
y memoria muy grandes, por lo que no suelen ser convenientes para realizar búsquedas de
similitudes en grandes bases de datos. Por este motivo con frecuencia se utilizan algoritmos de
tipo heurístico que permiten encontrar soluciones, cercanas a las óptimas (sub-óptimas), pero
con requerimientos de tiempo y de memoria mucho menores que los anteriores.

BLAST es el acrónimo de Basic Local Alignment Search Tool y es la herramienta más utilizada
para buscar secuencias similares en bases de datos. BLAST integra diferentes variantes de
programas que se pueden utilizar para buscar diferentes tipos de secuencias contra diferentes
bases de datos. A su vez, BLAST es un algoritmo heurístico para buscar similitudes locales en
grandes bases de datos.

1
El algoritmo BLAST trata de localizar los segmentos más significativos de residuos alineados
entre dos secuencias, para lo cual el programa asume que un alineamiento significativo entre
dos secuencias relacionadas está integrado por palabras que tienen en común ambas
secuencias. Para alcanzar esta tarea el programa BLAST extrae todas las palabras de una
longitud predefinida w que integran a la secuencia problema.

BLAST utiliza teoría estadística para decidir qué tan significativos son los alineamientos desde
el punto de vista biológico.

Recursos informáticos:

Sitios WEB a utilizar:

http://www.ncbi.nlm.nih.gov/BLAST/ (Servidor BLAST del NCBI).

PROCEDIMIENTO

Consultar en la base de datos del NCBI la información relativa a la secuencia de la proteína con
número de acceso (NP_524326) y de la secuencia del mRNA mensajero con número deacceso
NM_079602. Identifique de que secuencias se tratan y a que organismo pertenecen

Descripción de la página principal de BLAST.

BLAST es en realidad una colección de diversos programas para la búsqueda de similitudes de


secuencias. El usuario debe seleccionar la aplicación más conveniente para el problema que
se desea estudiar. Al entrar a la página principal del programa BLAST del NCBI
(http://www.ncbi.nlm.nih.gov/BLAST/) se puede observar que el programa consta de 3
secciones principales (figura 1):

2
Figura 1: Secciones principales de la interfaz de usuario del programa BLAST del
NCBI. La primera de las secciones permite realizar búsquedas con BLAST en los
genomas de los organismos disponibles en el NCBI. La segunda sección permite utilizar
las aplicaciones “tradicionales” de BLAST para realizar búsquedas en bases de datos de
secuencias de aminoácidos o de nucleótidos. La tercera sección permite el acceso a
aplicaciones especializadas de BLAST

BLAST Assembled RefSeq genomes: Permite utilizar BLAST para realizar búsquedas de
similitudes en genomas específicos. En la página se muestran los accesos de BLAST para los
organismos más comunes, pero se dispone también de un acceso a la lista completa de los
genomas disponibles.
1. Basic BLAST: Contiene accesos directos a las diferentes aplicaciones básicas de BLAST para
la búsqueda en bases de datos de secuencias de aminoácidos y de nucleótidos, así como para
las opciones de BLAST traducido.
2. Specialized BLAST: Contiene accesos directos para aplicaciones especiales de BLAST tales
como la búsqueda de dominios conservados, analizar la posible contaminación de secuencias
con vectores, etc.

ANÁLISIS DE LAS RELACIONES FILOGENÉTICAS ENTRE LA SECUENCIA DEL


CROMATOGRAMA LIMPIA (PROCESADA) Y NCBI

Previamente…

- El ADN total se extrajo de cultivos bacterianos con el kit Invitrogen siguiendo las instrucciones
del fabricante.
- Los genes 16S rRNAs se amplifican por PCR utilizando los cebadores forward D1 y reverse D1
y luego es secuenciado por Sanger.
- Obtener la secuencia del 16S rRNAs:
- >Cepa 1
- ATGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCTGTAAGACTGGGAT
AACTCCGGGAAACCGGGGCTAATACCGGATGCTTGTTTGAACCGCATGGTTCAAAC
ATAAAAGGTGGCTTCGGCTACCACTTACAGATGGACCCGCGGCGCATTAGCTAGTT
GGTGAGGTAATGGCTCACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATC
GGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGA
ATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTT
TTCGGATCGTAAAGCTCTGTTGTTAGGGAAGAACAAGTACCGTTCGAATAGGGCGG
TACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGG
TAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGCAGGC
GGTTCCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAA
CTGGGGAACTTGAGTGCAGAAGAGGAGAGTGGAATTCCACGTGTAGCGGTGAAAT
GCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGA
CGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCAC
GCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCT
AACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGA
ATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGA
AGAACCTTA

3
- Ingresar a la página web del NCBI: https://www.ncbi.nlm.nih.gov/
- Ingresar a Submit para registrar data en la base de datos del NCBI

- Ingresar el tipo de secuencia que desea procesar y seleccionar suggest tool: Colocar
16S RNAr

- Seleccionar GenBank:

4
- A continuación, revisar el menú del proceso que se desea hacer: Overview, data, fasta,
source, processing. Luego seleccionar SUBMIT.

- Seleccionar LOG IN para crear una nueva accesión:

5
- Crear una nueva cuenta seleccionando Google Account y luego seleccionar crear
nueva cuenta en NCBI:

- Generar una nueva submisión:

6
- Ingresar la data solicitada tal como se observa en la imagen:

- Continuar con el proceso ingresando la información solicitada:

7
- Culminar el proceso y obtener el número de accesión:
Ejemplo:
Cepa Accession number
IcBac1.4 MT712198
IcBac2.1 MT733835
IcBac2.9 MT712198

1. En la página de NCBI, hacer click en BLAST

2. Luego, click en NUCLEOTIDE BLAST:

8
3. En la database, hacer click en rRNA/ITS database y en la lista seleccionar 16S RNA
ribosomal RNA sequence (Bacteria and Archaea) y click en BLAST:

9
4. Por cada cepa elegir los 10 primeros alineamientos (tiene que tener código y accesión)
que NCBI arroja en el análisis, las cuales deben tener porcentaje de similitud por
encima de 98%.

5. Seleccionar DOWNLOAD y elegir FASTA (COMPLETE SEQUENCE) y se descargará


el archivo FASTA (Text) en la parte final de la página:

10
NOTA: REALIZAR ESTE PROCESO POR CADA CEPA DE MANERA INDEPENDIENTE.
REPETIR ESTE PROCESO.

6. Se abre y se tiene este documento en Block de notas:

Guía para el reporte de la práctica.

1) Resumir en un cuadro el número de resultados significativos encontrados para la búsqueda de


homólogos del número de accesión MT733835

2) Investigue otros métodos más modernos que existan para buscar secuencias similares
en bases de datos.

11

También podría gustarte