Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE CIENCIAS
DEPARTAMENTO DE BIOLOGÍA
PROGRAMA DE BIOLOGÍA
ASIGNATURA: “BIOINFORMÁTICA”
TALLER 1:
USOS DE DIFERENTES BASES DE DATOS
Modo de entrega:
El NCBI (National Library of Medicina) desarrolló Entrez como una herramienta para
permitir a los usuarios interactuar y acceder a bases de datos de una amplia diversidad de
áreas. Desde el punto de vista informático, Entrez es una interface de usuario; es decir,
constituye el nexo entre el usuario y las bases de datos subyacentes, también llamadas
“repositorios”. En esta practica exploraremos Entrez y a su vez diversos recursos
bibliográficos y de secuencias biológicas. Otro de los sitios más importantes para la
búsqueda y análisis de bases de datos biológicas es el EMBL-EBI (European
Bioinformatics Institute. http://www.ebi.ac.uk/). Este, es similar en su estructura y
contenido al Entrez, pero se concentra más específicamente en el almacenamiento de
datos biológicos (no bibliográficos) y en herramientas de análisis.
Filtros de Búsqueda
Información
Información complementaria:
A pesar de que se usa la misma interfaz -- Entrez -- para consultar distintas bases de
datos, es lógico y entendible que existan ciertas características y modos de búsqueda que
sólo tienen sentido en una base de datos y no en otra. De hecho algunos de los criterios
usados para literatura (PubMed) no tienen sentido cuando uno busca secuencias de ADN
o proteínas (ej. Author).
A continuación les doy alguna lista de campos disponibles para buscar, y los criterios que
pueden usar para Entrez.
Entrez les permite restringir la búsqueda a uno o más organismos, usando el “tag”
[organism] o la forma corta del mismo tag [orgn]. Ejemplo:
Como términos de una búsqueda que utilice este “tag”, se puede usar cualquier
palabra que sea válida taxonómicamente. Siguiendo el ejemplo anterior podríamos
extender la búsqueda a kinasas provenientes de otros tripanosomas
Ejercicio. Comparen los resultados que obtienen utilizando las palabras con y sin el “tag”
[org]. Para hacer esto pueden utilizar el link 'Preview'.
002002[molwt]
002002:002009[molwt]
1998/02:2000/01/25[mdat]
3000:4000[slen]
[The sequence data described in this paper have been submitted to the dbGSS database
under the following GenBank accession nos.: AQ443439-AQ443513, AQ443743-
AQ445667, AQ902981-AQ911366, AZ049857-AZ051184, and AZ302116-AZ302563.]; y
pueden ser obtenidos fácilmente, así
AND AZ302116:AZ302563[accn]
ü Usando los índices. Entrez realiza las búsquedas sobre cierto tipo de
campos de la base de datos. Estos campos se encuentran indexados, y es
posible acceder a los índices para evaluar la eficacia de nuestra estrategia
de búsqueda.
ü Cuando realizan una búsqueda, prueben clickear en 'Preview/Index', esto
les permite acceder a un formulario para ver los índices y eventualmente
agregar un término a la búsqueda.
ü Seleccionen el campo de la base de datos que deseen ingresen un término
y dar clic en el botón 'Index'. Esto les permitirá navegar el índice para ese
9
ü Ver los índices, les permite ahora realizar búsquedas rápidas. Sabiendo que
existe un 'Feature Key' llamado 'promoter', podemos simplemente marcar
promoter[fkey]
En los links que siguen pueden encontrar listas con 'feature keys' válidos y sus 'qualifiers'
para usar en sus búsquedas:
Si miran los índices del campo 'Properties' van a ver varios items del tipo "gbdiv": gbdiv
bct, gbdiv est, gbdiv gss.
Estos corresponden a las distintas divisiones de GenBank. Por lo tanto para restringir una
búsqueda a una división en particular de GenBank pueden utilizar "gbdiv xxx"[properties]
en sus queries. Reemplacen en cada caso xxx con la correspondiente división de
GenBank.