Está en la página 1de 6

INTRODUCCIÓN A LAS

BASES DE DATOS
MOLECULARES
Identificación molecular de algas Prokariotas
Darío Achá Cordero, PhD.

Introducción

Las especies tienen características únicas que están determinadas en último término por su
información genética, la cual resume la identidad de cada especie. Debido a esto, es posible
diferenciar o identificar especies a partir de su información genética. Hay muchas formas de realizar
esto, sin embargo la más precisa es comparar las secuencias de nucleótidos de su DNA. Esto es
particularmente útil para poder identificar organismos cuyas características externas son difíciles de
diferenciar, como las bacterias o cuando no se dispone del organismo entero. Últimamente, esto ha
tenido extensas aplicaciones forenses.

Una de las grandes limitantes para poder usar las secuencias de DNA para identificar individuos,
especies, géneros, familias u otros es que generalmente no es prácticamente posible comparar todo
su genoma. Por tanto, se deben escoger genes que sirven de relojes moleculares y cuya estabilidad
es adecuada para la identificación de especies. El gen del 16S rRNA de las bacterias es un excelente
marcador molecular para identificar de géneros a dominios de bacterias. Por ello se han desarrollado
bases de datos capaces de identificar bacterias solo a partir de su secuencia de nucleótidos del 16S
rRNA. En este laboratorio utilizaremos un par de esas bases de datos para identificar una bacteria
cuya secuencia poseemos.

En el presente laboratorio se tratará de capacitar al estudiante en la búsqueda de información


científica. Además, se asociará la identificación de organismos con la información científica publicada
del organismo.

Metodología

Identificación de organismos con el RDP


En este laboratorio utilizaremos la base de datos del Ribosomal Database Project (RDP) y sus
herramientas para identificar a una especie. Cada estudiante tendrá cuatro secuencias distintas del
gen del 16S rRNA que corresponden a dos bacterias desconocidas (para el estudiante). Las
secuencias las podrán obtener del sitio de la materia adjuntas junto con esta guía. Ustedes también
tendrán una lista de usuarios y deberán identificar qué número de usuario son. Una vez identificado
su número de usuario por favor abran el archivo *.fa de su usuario correspondiente. Lo normal es
que su computadora no reconozca este tipo de archivo, pero lo pueden abrir con Block de Notas,
WordPad u otro procesador de texto. El archivo contiene dos secuencias (Fig. 1), cada una
identificada con un número de usuario y un número de identificación de su secuencia que es para
control del docente. Cada una de ellas tiene un nombre establecido en la primera línea. Utilice ese
nombre para la clasificación para diferenciar las dos secuencias.

Fig. 1. Como se ve el archivo con las secuencias a ser utilizadas en este laboratorio

Una vez que tengan las secuencias para realizar su trabajo entrarán a la página del Ribosomal
Database Project (http://rdp.cme.msu.edu/) (Fig. 2) (Cole et al. 2014), ahí ingresarán a la
herramienta classifier (Wang et al. 2007) para identificar a su bacteria. Tienen dos opciones, podrán
subir su archivo o podrán copiar la secuencia (solo la secuencia no el nombre). Al final anote toda la
clasificación de las dos bacterias. Luego, utilice la herramienta SEQMATCH. Seleccione el archivo con
las secuencias "Choose a file to upload", Cambie las opciones a: Strain: Both; Source: Isolates; Size:
>1200; Quality: Good; Taxonomy: Nomenclatural; KNN matches: 10. Juegue cambiando estas
características una vez obtenidos los primeros resultados. Analice que es lo que cambia e incluya
este análisis en la discusión de sus resultados.

De esta manera obtendrá los diez organismos más parecidos a sus bacterias. Anote cuales son y el
grado de semejanza. Esto se puede hacer seleccionando "view selectable matches.". También
cambie KNN a 1 y verá el organismo más cercanamente emparentado con los suyos. Anote sus
características.
Fig. 2. Captura de pantalla del sitio del RDP mostrando que herramientas se utilizarán en este
laboratorio.

Finalmente, dentro de esta sección de la práctica utilizará la función del Hierarchy Browser del RDP
para identificar a las Cianobacterias y determinará cuantas familias existen. Analice la simplicidad de
la identificación y las posibles complicaciones que podría tener este método de identificación de las
algas.

Identificación mediante el NCBI

Los estudiantes deberán utilizar el NCBI (http://www.ncbi.nlm.nih.gov/) para localizar información


sobre los dos organismos que identificaron. En caso de no acceder a la información por este medio
deberán utilizar el resto de los servidores. Para localizar información sobre su organismo de interés
en el NCBI:

• Ingrese el nombre de la especie identificada

• Presione search

• Explore que información obtiene

Ahora proceda a verificar que los datos colectado con el RDP coinciden con los contenidos del NCBI.
Esto le servirá para comparar bases de datos y estrategias de identificación.

El primer paso es ingresar a la herramienta BLAST (Fig. 3A). Una vez dentro del BLAST se debe
seleccionar Nucleotide BLAST (Fig. 3B). Luego introduzca su secuencia copiándola o subiendo el
archivo (Fig. 3C).
Fig. 3. Pagina principal del NCBI mostrando la ubicación de la aplicación BLAST (A), seguido de la
página principal de BLAST señalando como entrar a la base de datos de nucleótidos (B).
Una vez que se ha subido el archivo se debe seleccionar la configuración más adecuada. Dado que
estamos trabajando con el 16S rRNA debemos seleccionar la base de datos correspondiente y
finalmente presione el botón de BLAST (Fig. 4).

Fig. 4. Selección de opciones más apropiadas para buscar las secuencias más parecidas a las nuestras.

A continuación, y de forma inmediata aparecerá una pantalla de procesamiento de datos (Fig. 5). La
pantalla se recargará de forma automática hasta proporcionar los resultados. Esto podría demorar
unos segundos (típicamente) o varios minutos, dependiendo de cuan ocupado este el servidor en ese
momento.

Fig. 5. Página de procesamiento de las secuencias enviadas. Note que hay un número de solicitud.
Pueden guardar ese número si su computadora o Tablet se cuelgan para recuperar sus resultados.

Los resultados aparecerán automáticamente en la misma ventana (Fig. 6). En la misma podrán
seleccionar los resultados para cada una de las secuencias. También hay un link para obtener más
videos de ayuda. Explore todas las pestañas para poder identificar cada una de sus cepas y colecte la
información que crea necesaria para poder respaldar sus conclusiones. Averigüe como mínimo si las
especies más similares son las mismas que las reportadas mediante el RDP, determine si en el NCBI
puede identificar las mutaciones que distancian a su organismo del más similar encontrado, y
construya un árbol de distancias filogenéticas para cada uno de los organismos.

Fig. 6. Resultados generados por el BLAST y las diferentes opciones que nos proporciona.

Para las discusiones compare los resultados de ambas bases de datos y analice todo el proceso que
requeriría la obtención de esta identificación partiendo desde el organismo. Razone cuales las
ventajas, pero también cuales son las desventajas de esta alternativa de identificación y estudio de
las algas.

Referencias

Cole, J. R., Q. Wang, J. A. Fish, B. Chai, D. M. McGarrell, Y. Sun, C. T. Brown, A. Porras-Alfaro,


C. R. Kuske, and J. M. Tiedje. 2014. Ribosomal Database Project: data and tools for high
throughput rRNA analysis Nucl. Acids Res. 42(Database issue):D633-D642;
doi: 10.1093/nar/gkt1244 [PMID: 24288368]

Stephen F. Altschul, Thomas L. Madden, Alejandro A. Schäffer, Jinghui Zhang, Zheng Zhang, Webb
Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein
database search programs", Nucleic Acids Res. 25:3389-3402.

Wang, Q, G. M. Garrity, J. M. Tiedje, and J. R. Cole. 2007. Naïve Bayesian Classifier for Rapid
Assignment of rRNA Sequences into the New Bacterial Taxonomy. Appl Environ Microbiol.
73(16):5261-7.

También podría gustarte