Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bases de Datos
Bases de Datos
maxifigueroa@udec.cl
¿Por qué construir Bases de Datos?
- GenBank: https://www.ncbi.nlm.nih.gov/genbank/
- DDBJ: https://www.ddbj.nig.ac.jp/index-e.html
Conozcamos las 3 bases de datos de secuencias de Nucleótidos más usadas
El cómo presentar la información es muy importante
El tener la información en un formato estandar, permite la lectura cruzada entre bases de
datos y facilita el trabajo de las bases de datos secundarias para leer y obtener información
desde las bases de datos primarias
Formato básico general dentro de GeneBank
“Header” o
encabezado
“Feature table”
o tabla de
características
Secuencia
Formato básico general dentro de GeneBank
“Header” o
encabezado
“Feature table”
o tabla de
características
Secuencia
Si solo necistamos la secuencia, la mayoría de las
bases de datos trabajan con un formato uniformado
denominado FASTA
identificador
secuencia
https://www.uniprot.org
Junto a esta, tenemos una única base de datos de estructuras de proteínas, denominada Protein Data
Bank (PDB)
https://www.rcsb.org
Ejemplo de una entrada en UniProt: insulina humana
https://www.uniprot.org/uniprot/P01308
Ejemplo de una entrada en el Protein Data Bank
https://www.rcsb.org/structure/5BOP
N° aa
N° átomo X y z
Tipo de
átomo
Amino
ácido
Con la información de posición espacial (coordenadas x, y, z de cada átomo)
es posible leer la información y crear representaciones como la siguiente:
Bases de datos: Puntos importantes a retener
maxifigueroa@udec.cl