Está en la página 1de 5

PRACTICA: PREDICCION DE ESTRUCTURA DE PROTEINAS.

PREDICCIN DE ESTRUCTURA DE PROTENAS.


A continuacin se describen algunos pasos concretos a seguir para la prediccin de la estructura
tridimensional de una protena problema. Para realizar la prctica correctamente es necesario
disponer de un ordenador con conexin a internet, navegador y cuenta de correo electrnico. Los
enlaces actualizados a los diferentes servidores utilizados en la misma as como una revisin de
las secuencias problema propuestas y una coleccin de enlaces y software tiles se encuentran
en la direccin:

http://www.cab.inta.es/~LBIOINFO/courses/JBI2003

Secuencia de la protena problema:


La secuencia propuesta corresponde a una protena para la que no se ha determinado an, en
Agosto de 2003, su estructura tridimensional mediante mtodos experimentales. Debido al
rpido crecimiento y evolucin de las bases de datos y herramientas bioinformticas, se
actualizarn las secuencias problema y los enlaces de forma peridica.

>prot0
MASVRKAFPRRLVGLTSLRAVSTSSMGTLPKQVKIVEVGPRDGLQNEKSIVPTPVKIRLI
DMLSEAGLPVIEATSFVSPNWVPQMADHSDVLKGIQKFPGINYPVLTPNMKGFEEAVAAG
AKEVSVFGAVSELFTRKNANCSIEESFQRFAGVMQAAQAASISVRGYVSCALGCPYEGKV
SPAKVAEVAKKLYSMGCYEISLGDTIGVGTPGLMKDMLTAVMHEVPVTALGVHCHDTIGQ
ALANTLVALQMGVSVVDSSVAGLGGCPYAKGASGNLATEDLVYMLNGLGIHTGVNLQKLL
EAGDFICQALNRKTSSKVAQATCKL

1) Bsqueda de protenas homlogas.


El primer paso es la bsqueda de protenas homlogas utilizando sistemas basados en similitud de
secuencia:

BLAST (en el E.M.B.L.): http://dove.embl-heidelberg.de/Blast2/


Copiar la secuencia anterior en la ventana central. Elegir el programa "blastp" y la base de datos
"nrdb" (las diferentes opciones disponibles se pueden consultar en los enlaces contiguos).
De qu protena se trata?
Cul es la funcin de las protenas homlogas a ella?
Qu significa el grfico de lneas que acompaa a los resultados?
Probar nuevas bsquedas modificando los parmetros "filter" y "Matrix"
Una vez obtenido el resultado, copiar las secuencias seleccionadas y salvarlas localmente en un archivo
http://www.pdg.cnb.uam.es/cursos/hola/pages/practica/index.html[22/01/2013 01:40:01 p.m.]

PRACTICA: PREDICCION DE ESTRUCTURA DE PROTEINAS.

de texto.

2) Generacin de un alineamiento mltiple.


Una cantidad notable de informacin puede obtenerse a partir del alineamiento mltiple de los
miembros de una familia de protenas. Se utilizar el servidor "ClustalW" del European Bioinformatics
Institute:

ClustalW (E.B.I): http://www.ebi.ac.uk/clustalw/index.html


Copiar las secuencias del paso anterior en la ventana central.

Qu se puede comentar de la familia de protenas?


Hay algn parecido entre este resultado y el grfico de lneas anterior?
Se pueden localizar residuos conservados?
Y residuos conservados especficos de subfamilias?

3) Caractersticas 1D. Prediccin de estructura secundaria.


La prediccin de la estructura secundaria y otras caractersticas de la protena problema permite
conocer datos importantes relacionados con su estructura y funcin. Se utilizar una serie de servidores
de prediccin de caractersticas de estructura:

PredictProtein (http://cubic.bioc.columbia.edu/predictprotein/). Predicciones de estructura


secundaria, accesibilidad, segmentos transmembrana, coiled-coils, puentes disulfuro, motivos y
dominios.
Jpred (http://www.compbio.dundee.ac.uk/~www-jpred/). Prediccin de estructura secundaria.
Admite tambin alineamientos mltiples como entrada.
Psi-Pred (http://bioinf.cs.ucl.ac.uk/psipred/). Prediccin de estructura secundaria y topologa
transmembrana. Permite descargar los resultados de Psi-Blast que utiliza el programa.
SAM-T02 (http://www.cse.ucsc.edu/research/compbio/HMM-apps/). Prediccin de estructura
secundaria. Al igual que el anterior, se pueden obtener los perfiles HMM utilizados.
TMHMM (http://www.cbs.dtu.dk/services/TMHMM/). Topologa de hlices transmembrana.
SignalP (http://www.cbs.dtu.dk/services/SignalP/). Localizacin del pptido seal.
COILS (http://www.ch.embnet.org/software/COILS_form.html). Prediccin de la presencia de
coliled-coils.
Qu se puede concluir de los resultados de los diferentes servidores acerca de la estructura y
funcin de la protena problema?
Son los resultados idnticos? Por qu?
Consultar en la pgina del sistema de evaluacin contnua EVA la fiabilidad de cada uno de los
servidores utilizados.
Informacin funcional: Abrir la pgina de bsquedas en la base de datos Pfam y localizar la
familia a la que pertenece la secuencia problema. Qu informacin estructural y funcional
ofrece? Obtener la distribucin en especies de la familia de protenas. Obtener la distribucin de
dominios en los diferentes miembros de la misma.

4) Bsqueda de protenas homlogas de estructura conocida.


Para la bsqueda de protenas homlogas de estructura conocida utilizaremos de nuevo el servidor
Blast del EMBL:

http://www.pdg.cnb.uam.es/cursos/hola/pages/practica/index.html[22/01/2013 01:40:01 p.m.]

PRACTICA: PREDICCION DE ESTRUCTURA DE PROTEINAS.

BLAST (en el E.M.B.L.): http://dove.embl-heidelberg.de/Blast2/


Copiar la secuencia problema en la ventana central. Elegir el programa "blastp" y, en esta ocasin, la
base de datos "pdb" (la bsqueda se restringe a nicamente las protenas de estructura tridimensional
conocida presentes en la base de datos del Protein Data Bank).

Tiene la protena problema algn homlogo de estructura tridimensional conocida?


Si hay un resultado positivo (se considera como tal si al menos comparten un 30% de residuos
alineados idnticos), se puede utilizar el servidor SwissModel
(http://www.expasy.org/swissmod/SWISS-MODEL.html) de modelado por homologa para
obtener un modelo estructural de la protena problema. Si no hay un resultado positivo claro, se
puede intentar predecir el plegamiento de la protena problema utilizando tcnicas de threading.

5) Acceso a servidores de threading.


Abrir las pginas de acceso de al menos tres de los siguientes servidores de reconocimiento de
plegamiento:

PredictProtein (http://www.embl-heidelberg.de/predictprotein/predictprotein.html)
3D-PSSM (http://www.sbg.bio.ic.ac.uk/3dpssm/)
Psi-Pred/GenThreader (http://bioinf.cs.ucl.ac.uk/psipred/)
SAM-T02 (http://www.cse.ucsc.edu/research/compbio/HMM-apps/)
FUGUE (http://www-cryst.bioc.cam.ac.uk/~fugue/)
Utilizar los cuestionarios de cada pgina para lanzar la bsqueda en los distintos servidores. Los
resultados suelen obtenerse por e-mail y pueden tardar, dependiendo de la ocupacin del sistema, entre
unos minutos y varias horas.

Hay coincidencia en los resultados de los distintos servidores?


A qu puede deberse?
El grado de fiabilidad para cada uno de los resultados: es similar en todos los servidores?
Consultar en la pgina del sistema de evaluacin continua EVA la puntuacin de cada uno de
los servidores utilizados.
Construir una tabla con las 5 mejores predicciones de cada servidor. Consultar en la base de datos
PDB la estructura de cada uno de ellos y compararla (bases de datos CATH, FSSP, SCOP).

Cual es probablemente el plegamiento de la protena problema?


Podra adoptar otros plegamientos posibles?
Si se escogiese como protena problema alguno de sus homlogos obtenidos en el primer paso
de la prctica: Se obtendra el mismo resultado? Por qu?

6) Otras secuencias propuestas:

>prot1

http://www.pdg.cnb.uam.es/cursos/hola/pages/practica/index.html[22/01/2013 01:40:01 p.m.]

PRACTICA: PREDICCION DE ESTRUCTURA DE PROTEINAS.

MSRWKVVILCLLSFMFEIGHASFQCNPKTYDGAFLNIVCVCNATFCDEIEPIGEIAEGKA
IVYRSSLDGDRLKRMSMKMKEKLRKNESVNVTITIDASERFQNIFGFGGAFTDSAGDQFV
SLSETLQNYIVDSYFGKNGLEYNIGRVPIASCDFSTHEYSYDDVHDDFELKHFALPDEDL
KLKIPFIKKAIEKTEGNIQLFASPWSAPGWMKVTGRMRGGGAMRNDKRVYQAYADYFFKF
FEAYSSHAITFWGLTIQNEPSTGADMAWRWQTMNYTAETMRDFLKKYLGPKLKENKLTET
LKVMVLDDGRGLLPGWADTIFNDPEATKYADGVAVHWYGNLYSPAVLLDITQRHHPTKFI
FGTEACAGYAIHHGPLMGDWFTAENYASDIISDLNHHFTGWTDWNLCLDDMGGPTWVDNF
VDSPIIVNRTGQEFYKQPMFYAMGHFSKFLPRGSTRVFTKIEGNLAVSATSVVIEGGRRA
TVILSKASNSLLTRIVDSSTGFSIVLNLPPRSIHTVIWKKRK
>prot2
TTLSCKVTSVEAITDTVYRVRIVPDAAFSFRAGQYLMVVMDERDKRPFSMASTPDEKGFI
ELHIGASEINLYAKAVMDRILKDHQIVVDIPHGEAWLRDDEERPMILIAGGTGFSYARSI
LLTALARNPNRDITIYWGGREEQHLYDLCELEALSLKHPGLQVVPVVEQPEAGWRGRTGT
VLTAVLQDHGTLAEHDIYIAGRFEMAKIARDLFCSERNAREDRLFGDAFAFI
>prot3
RLSWYDPDFQARLTRSNSKCQGQLEVYLKDGWHMVCSQSWGRSSKQWEDPSQASKVCQRL
NCGVPLSLGPFLV TYTPQSSIICYGQLGSFSNCSHSRNDMCHSLGLTCLE
>prot4
MPVEKDLKTAYKALYDEKEPLKALHLYDEILKGSPTNLTALIFKAACLEKLYFGFSDWHSD
ATMENAKELLDKALMTAEGRGDRSKIGLVNFRYFVHFFNIKDYELAQSYFKKAKNLGYVDD
TLPLWEDRLETKLNKKNKKQKDSTNKHTIKPVESIENRGDNNSSHSPISPLKIETAPQESP
KFKIDWYQSSTSVTISLFTVNLPESKEQVNIYISPNDRRTLSISYQVPKSGSEFQYNAKLS
HEVDPKAVSLKIFPKKLEITLSKIDSTQWKKLEEDILTESSRLSDEGKNSDSATRLLSAET
ASKERLSYPSSSKKKIDWSKLDIDEEADEEAGSADSFFQKLYAGADPDTKRAMMKSFIESN
GTALSTDWEDVSKGTVKTSPPEGMEPKHW
>prot5
MSSGYSSLEEDEDFFFTARTSFFRRAPPGKSRSGQPDVEKEKETHNYLSKEEIKEKVHKYN
SAVTDKLKMTLNSNGIYTGFIKVQMELCKPAQPSPEPSSGGCMNTLHISSTNTVGEVIEAL
LRKFLVTESPTKFALYKRCHREDQVYACKLSDREHPLYLRLVAGPRTDTLSFVLREHEIGE
WEAFSLPELQNFLRILDKEEDEQLQSLKRRYTAYRQKLEEALGEVWKPG

Colecciones de enlaces y software tiles, as como acceso a la documentacin de diferentes cursos de


bioinformtica se puede encontrar en la direccin:

http://www.cab.inta.es/~LBIOINFO/

Last update: Sep., 2003

Paulino Gmez-Puertas <pagomez@cnb.uam.es>


BioInfo Lab.
Centro de Astrobiologia (CSIC- INTA).
Ctra. Torrejon - Ajalvir, Km 4.
Torrejon de Ardoz, 28850 Madrid.
http://www.pdg.cnb.uam.es/cursos/hola/pages/practica/index.html[22/01/2013 01:40:01 p.m.]

PRACTICA: PREDICCION DE ESTRUCTURA DE PROTEINAS.

SPAIN.
Phone: (+34) 91 520 64 15
Fax: (+34) 91 520 16 21

http://www.pdg.cnb.uam.es/cursos/hola/pages/practica/index.html[22/01/2013 01:40:01 p.m.]

También podría gustarte