Está en la página 1de 5

MANUAL DE SWISS PROT

UN POCO DE HISTORIA

El swiss-prot es una base de datos de secuencias de proteína anotada, iniciada en 1986


y mantenida por el grupo de Amos Bairoch primero en el departamento de
bioquímica médica de la universidad de Ginebra y ahora en el instituto suizo de
la bioinformática (SIB) y de la biblioteca de datos de EMBL (ahora dependencia
de EMBL - el instituto europeo de la bioinformática (EBI). La base de datos de
la proteína del swiss-Prot consiste en entradas de la secuencia. Las entradas
de la secuencia se componen de diversos tipos de línea, cada uno con su
propio formato. Para la estandardización el Swiss-Prot propone un formato que
sigue de cerca la base de datos de la secuencia de nucleótido de EMBL.

El swiss-prot se distingue por cuatro características básicas:

• La anotación: proporciona información puntual sobre información de la


referencia bibliografìca y de los datos taxonómicos, se referencia datos
como las funciones de la proteína, semejanzas, las enfermedades que
ocasionan su deficiencia, conflictos de la secuencia y variantes.

• Redundancia mínima: Muchas bases de datos, tienen para cada


proteína datos por separado, de diversos autores; el swiss-prot asocia
todos los datos para evitar conflictos y si estos existen lo informa en la
tabla de características de la proteína.

• Integración con otras bases de datos: El swiss-prot provee a los


usuarios de bases de datos bio moleculares un grado de integración
entre los tres tipos de bases de datos de secuencia-relacionadas
(secuencias del ácido nucléico, secuencias de la proteína y estructuras
terciarias de la proteína) así como con colecciones de datos
especializadas, el swiis-prot remite a mas de cincuenta bases de datos
Las referencias recíprocas se proporcionan bajo la forma de indicadores
relacionados con la información a las entradas del swiis-Prot .

• La documentación: El swiis – prot distribuye una gran cantidad de


información en diferentes formatos, (Fasta, Blast, etc.) mucha de las
cuales han estado en la base de datos por mucho tiempo. TrEMBL es la
sección computadora-anotada de la base de conocimiento de UniProt.
Contiene traducciones de todas las regiones de la codificación en las
bases de datos del nucleótido de la proteína ordenada y extraída de
DDBJ/EMBL/GenBank, bases de datos externas. Al ingresar datos en
el TrEMBL se comparan con los existentes en DDBJ/EMBL/GenBank y
se generan los reportes para saber si los datos existen y generar la
respectiva referencia.

Para entender la funcionalidad del Swiss-prot realizaremos un ejercicio de


búsqueda de datos para la enfermedad del Herpes; para ello ingresamos al
Web site de swiss-prot http://www.expasy.org
Nos aparece una ventana como la mostrada en la figura; en la opción Search
escogemos una base de datos para el ejemplo Swiss-prot/TrEMBL, digitamos
la información de la búsqueda y luego GO.

Como resultado de la búsqueda nos ofrece los siguientes datos:


1. para esta consulta nos ofrece 16470 secuencias de proteínas halladas o
con asociación al herpes (numeral 1), además nos ofrece la
posibilidad de depurar los resultados cambiando el tipo de formato o
mediante la combinación de operadores, estos cambios los podemos
realizar en la parte inferior de la pagina, ingresando el nombre del
archivo o generando una lista para salvar los resultados los cuales se
almacenaran por una semana en un archivo temporal.

2. Seleccionamos un resultado que deseemos consultar, para lo cual en


este ejemplo damos click en ATI2_EHV1B (numeral 2). Mostrándonos la
siguiente ventana:

En la cual tenemos acceso a toda la información (numeral 1) como nombre de


la proteína, organismo en el que se hospeda, referencias taxonómicas, nombre
del gen, sinónimos, proteínas existentes. En cuanto a las referencias (numeral
2) nos enlaza con otras bases de datos que ofrecen información sobre la
proteína en este caso pubmed.

En la siguiente ventana observamos otras caracteristicas importantes como son


las referencias cruzadas mediante las cuales podemos relacionar la proteína
consultada con otras bases de datos como EMBL y las identificaciones de
referencia para ubicarlo en dichas bases de datos (numeral 1)
1

Información de los aminoácidos:


En la parte final de la búsqueda tenemos una característica muy importante
como es la información de la secuencia de la proteína donde se ilustra el
tamaño de la secuencia y se re ilustra en grupos de a 10 aminoácidos, para
este caso 747. En el final de la ventana tenemos acceso a varias herramientas
que pueden ser útiles para trabajar con la secuencia de la proteína.

Referencias bibliograficas:

www.expasy.org/cgi-bin/sprot-search-de?herpes
http://www.expasy.org/sprot/userman.html

Realizado y traducido por:


LUIS ENRIQUE HERRERA MORALES
Estudiante Ing. de sistemas IV. cod. 200741013
HUGO CHAPARRO
Estudiante Ing. de sistemas III. cod. 200742004