Está en la página 1de 4

Estudio sobre la base de datos Gene 3D

F. Nicolas Diaz S, Estudiante (20131273034), Sebastian Vargas V, Estudiante (20131273012).


Universidad Distrital Francisco José de Caldas (Facultad Tecnológica);
Ingeniería en Telecomunicaciones – Bioinformática
Bogotá, Colombia; Noviembre de 2014

Abstract—In this paper we make the study and calculation of II. PROCEDIMIENTO DE CONSULTA
the spectral attenuation coefficients for specific rainfall
intensities according to frequency for circular polarization Inicio de la aplicación web de Gene3D:
Horizontal done.

Key Words-attenuation, spectrum, polarization.

Index Terms—Component, formatting, style, styling, insert.


(key words)
Resumen— En este documento se hace una consulta sobre
funcionamiento de la base de datos Gene 3D, qué es y cómo se
hace una consulta en línea, para este caso el Accipitridae aguila
común y el Sitta carolinensis o trepador pechiblanco.

Palabras clave—Proteinas, familia, subfamilia, superfamilia.

I. INTRODUCCIÓN Figura 1. Pantalla de inicio de Gene3D.

Se obtiene toda la información del genoma de lo


Gene 3D es en principio una base de datos de CATCH v4.0
especímenes de la NCBI obteniendo la descripción de las
asignación de dominio de proteínas por secuencias ENSEMBL
proteínas:
y UniProt. CATCH es un clasificador de estructuras de
proteínas descargadas del banco de datos de proteínas. CATCH
agrupa ciertos dominios de proteínas en Superfamilias cuando
hay evidencia suficiente de que provienen del mismo ancestro.
Gene3D toma los dominios de familias y les asigna
millones de secuencias de proteínas utilizando el modelo oculto
de Markov. De esta manera se obtiene secuencias similares

En este documento se realiza la consulta de familia de dos


especies, el Accipitridae aguila común y el Sitta carolinensis o
trepador pechiblanco, para comprar la proteínas y ver a qué
tipo de familia pertenecen; por medio de la herramienta web
Gene3D. A continuación se muestra el procedimiento a seguir.
Figura 2. Descripción genética de la NCBI.

Se utiliza el buscador de proteínas, en donde se debe colocar la


descripción de proteínas obtenida en la NCBI de la especie
deseada, en este caso “NADH dehydrogenase”, como se
muestra en la figura 3. Y sus respectivos resultados en la figura
4.
Figura 3. Búsqueda de proteínas.

Figura 4.Resultados de la búsqueda.

Se obtienen todos los resultados que se obervan en la figura


5.
Se observa que la herramienta también genera una
secuencia de proteinas, la cual puede ser comparada con la
cualquier otra especie similar y ver si perteneces a la misma
familia.
Al poner el visor sobre la secuencia de proteína se observa
una referencia. Para el caso del Sitta carolinesis o trepador
pechiblanco es “Oxidored_q1 PF00361”
Realizando el mismo procedimiento para el Accipitridae Trepador Pechiblanco:
aguila común se obtiene:

Una vez obtenidas las secuencias en formato FASTA se


introducen en el CATCH o clasificador de familias, donde se
introduce la secuencia de proteína en formato FASTA y arroja
como resultado las regiones, superfamilias y función de
familia, como se muestra en la siguiente figura:

Los resultados son los mismos para las dos secuencias por
lo cual se concluye que pertenecen a las mismas regiones,
familias y superfamilias, la cuales son:

Secuencia: QUERY
Región Superfamilia Funcional Evaluación
21-161, DNA-directed RNA
III. SECUENCIA DE PROTEINAS 457-604, 3.90.1100.10 polymerase -like 2.1E-124
672-725 domain
La herramienta también genera una secuencia de proteínas DNA-directed RNA
en formato FASTA como se muestra en la siguiente figura: 162-240,
3.90.1110.10 polymerase -like 1.2E-57
359-456
domain
Águila: DNA-directed RNA
605-668 2.30.150.10 polymerase subunit 5.8E-20
beta -like domain
DNA-directed RNA
727-802 2.40.50.100 polymerase -like 3.9E-23
domain ½
DNA-directed RNA
803-833,
2.40.270.10 polymerase -like 1.4E-78
1085-1266
domain
DNA-directed RNA
839-950,
2.40.50.150 polymerase -like 2.2E-42
1070-1084
domain
Tabla de resultados CATCH.
Se concluye que ambas especies pertencen a la superfamilia
3.90.1100.10 y 3.90.1110.10 con ADN directo de ARN con
Polimerasa como dominio.

REFERENCIAS

[1] National Center for Biotechnology Information NCBI. Nov.


2014. 8600 Rockville Pike, Bethesda MD, 20894 USA
http://www.ncbi.nlm.nih.gov/
[2] Gene3D v12.0 2014. http://gene3d.biochem.ucl.ac.uk/
[3] CATCH / Gene3D, Protein Structure Classification Database by
I. Sillitoe, T. Lewis, D. Lee, J. Lees, C. Orengo is licensed under
a Creative Commons Attribution 4.0 International License.
2014. http://www.cathdb.info/

También podría gustarte