Está en la página 1de 4

UNIVERSIDAD AUTONOMA DE NUEVO LEON

FACULTAD DE CIENCIAS BIOLOGICAS


ACADEMIA DE CIENCIAS Y DE PROTENAS.

Prctica No.2:
Bsqueda de secuencias en bases de datos.

INTRODUCCIN
Con la masificacin de las tecnologas de secuenciacin, el conocimiento que se
tiene sobre el componente gentico de los organismos ha crecido de manera
logartmica desde hace 10 aos. Muchos laboratorios se han encargado de descifrar el
genoma completo de diversas especies representativas de cada reino, incluyendo
anotaciones que permiten identificar los genes y dems secuencias regulatorias que dan
las instrucciones para formar a un organismo particular.

Al tener toda esta informacin, se ha vuelto indispensable el entender la


informacin como se encuentra almacenada en las bases de datos. En particular, son de
inters las bases de datos ENA del EMBL:EBI y de GenBank del NCBI. Ambas, junto con la
DDBJ comparten la informacin que almacenan, sin embargo, tienen diferencias
importantes, tanto en funcionalidad como en algunos casos, contenido.

OBJETIVO
Analizar el contenido, estructura e informacin de un par de secuencias reportadas en
las bases de datos GenBank y ENA, basado en el caso presentado.

RECURSOS
Computadora
Acceso a internet.
Ligas de bases de datos

National Center of Biotechnology


1. www.ncbi.nlm.nih.gov
information
2. European Bioinformatics Institute www.ebi.ac.uk

CASO:
Las enterobacterias son organismos Gram negativos que se pueden encontrar como
parte de la coleccin bacteriana normal intestinal de algunos organismos, incluido el
humano. Algunas bacterias pertenecientes a este gnero son patognicas y pueden
causar infecciones oportunistas. En otros estudios, tambin se ha involucrado a la
especie E. cloacae con cuadros de obesidad mrbida, por lo que es un organismo de
amplio inters cientfico.
Un investigador interesado en esto, encontr reportados en el NCBI dos secuencias
del genoma de este organismo:
NC_014121.1 y ECL_04451.

RESULTADOS

Para responder a las preguntas:

Mantener el orden de las preguntas.


Escribir la respuesta seguida de cada pregunta.

Toda respuesta debe describir el desarrollo llevado a cabo para generarla. Puede
incluir capturas de pantalla donde se seale y visualice claramente la seccin de inters
para la respuesta.

Escribir todas las preguntas, aunque a alguna no se le haya dado respuesta.

NOTA: El no cumplir con cualquiera de las indicaciones, implicar la sustraccin de 5 puntos por
cada instruccin no seguida.

1. Cul es la longitud de las secuencias reportadas y en que cromosoma se encuentran


localizadas? (3 ptos)
5314581 bp. En el nico cromosoma que dio de resultado
2. Pertenecen las secuencias a los mismos autores? (3 ptos)
Si, ya que es el mismo cromosoma
3. Tiene alguna de las secuencias un artculo cientfico para respaldar su publicacin? (3
ptos)
Si, journal j. bacteriol 192 (9) 2463-2464 (2010)
4. En qu fechas fueron publicadas? (3 ptos)
3 febrero 2010

5. El gen que codifica al RNA ribosomal 16S es utilizado para identificar especies de
bacterias. En ambas secuencias, en qu posicin se encuentra? (3 ptos)
270085, muchas veces se repiten porque los autores los confunfen
6. Comparando la informacin de la seccin Graphics del NCBI, Qu diferencias
encuentra? (5 ptos)
Grapfics que es donde aparece el mapa del cromosoma
7. Comparando la informacin reportada en el GenBank con el ENA, en cuanto a la
informacin de identificacin, qu diferencia observa?
(5 ptos)
ENA= cpoo se encuentra el genoma completo
8. Se trata de la misma secuencia? (2 ptos)
si
9. Qu clave de acceso le recomendara al investigador utilizar? (3 ptos)
FASTA secuencia cruda

DISCUSIN (NO DESCRIBIR METODOLOGA):


En la prctica se logr analizar el contenido, estructua e informacin de unas secuencias
reportadas en las bases de datos GenBank y ENA de una enterobacteria de la especie E.
Cloacae involucrada en cuadros de obesidad mrbida. En NCBI se encontraron secuencias
reportadas del genoma de ste organismo NC_014121.1 y ECL_04451. Al analizar las
secuencias se observ que el gen 16s que codifica al RNA ribosomal identific la especie de
la bacteria en la posicin 270085, se recomienda usar la clave de acceso FASTA secuencia
cruda, ya que es un formato basado en texto, utilizado para representar bien las secuencias
de cido nuclicos.

CONCLUSIN (NO DESCRIBIR METODOLOGA):


Se logr cumplir con los objetivos de la prctica al analizar las secuencias del organismo en el
caso ya planteado. Genbank es una base de datos primaria. Esto quiere decir que es un
repositorio de todas las secuencias de protenas y nucletidos disponibles. Genbank
est administrada por el NCBI (National Center for Biotechnology Information) que depende
del NIH (National Institutes of Health). A su vez el NCBI es parte de la International Nucleotide
Sequence Collaboration, que es un consorcio que tambin incluye al DNA Data Bank of Japan
(DDBJ) y al European Bioinformatics Institute (EBI) . Un laboratorio puede depositar secuencias
en cualquiera de los tres centros y la informacin est disponible para todos, porque las bases
de datos se actualiza cada da.

BIBLIOGAFA (EN FORMATO APA) (MNIMO 5):

COMPONENTE EVALUATORIO PUNTOS


Introduccin 10
Metodologa 10
Resultados 40
Discusin 30
Conclusin 10
TOTAL 100

También podría gustarte