Está en la página 1de 70

DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES

Modelado por homologa

Dra. Cristina Marino Buslje Septiembre 2006

Preedicin de la estructura de una protena


Es una de las tareas mas significantes abordadas en la biologa estructural computacional. Tiene por objeto determinar la estructura tridimensional de protenas a partir de su secuencia de aminocidos. En trminos mas formales, es la prediccin de la estructura terciaria por su estructura primaria. Dada la utilidad del conocimiento de la estructura de protenas en tareas tan valiosas como el diseo de drogas, este es un campo altamente activo de investigacin.

1i9b.pdb

El plegamiento de protenas es esencial


Secuencia Estructura Plegamiento
Protena plegada

Protena desplegada

Altamente mvil inactiva

Forma casi nica Precisamente ordenada Estable activa

Asociaciones especificas Reacciones especificas La funcin depende de la forma

1tc2.pdb

LAS PROTEINAS ESTAN FORMADAS POR DOMINIOS Dominio estructural


Dentro de una protena, un dominio estructural (dominio) es un elemento que se estabiliza por si mismo y generalmente se pliega independientemente del resto de la protena. Muchos dominios no son nicos de las protenas producto de un gen o una familia de genes, sino que aparecen en una gran variedad de protenas. Los dominios son frecuentemente nombrados segn la funcin biolgica en la que intervienen en la protena donde aparecen predominantemente, por ejemplo, el "calcium-binding domain de la calmodulina

3583 protenas contienen el dominio FN3

Asignacin de dominios Hay zonas de baja complejidad?


secuencia PPPQNNSSSSTP

Hay zonas trans membrana?


secuencia

Hay homologas parciales?


SH2 secuencia Kinasa Cys rich

La prediccin de estructura secundaria sugiere dominios?


secuencia Regin a helices Regin hojas b

Jerarqua SCOPE. Ej: 1tc2


Superfamily: PRTase-like
Lineage:

1.Root: scop 2.Class: Alpha and beta proteins (a/b)

Mainly parallel beta sheets (beta-alphabeta units)


3.Fold: PRTase-like

core: 3 layers, a/b/a; mixed beta-sheet of 6 strands, order 321456; strand 3 is antiparallel to the rest
Families:

4.Superfamily: PRTase-like

1.Phosphoribosyltransferases (PRTases) 2.Phosphoribosylpyrophosphatesynthetase

Jerarqua CATH Ej: 1tc2


Clase

Arquitectura (Fold)

Topologa (Superfamilia)

Homologous superfamily Sequence family

Ejemplo 1TC2 comparativo (tomado del PDB-Beta)

Typos de Modelado

Homology modelling

Fold recognition Modelling

Ab initio

Comparative protein (Homology Modelling)

modelling

Usa estructuras previamente resueltas como puntos de partida o moldes se basa en la razonable suposicin de que dos protenas homologas compartirn estructura similar

De novo Ab initio protein modelling


Predecir la estructura de una protena basndose solo en su secuencia. Las predicciones ab initio recaen en la hiptesis termodinmica del plegamiento, que postula que las estructuras nativas de una secuencia proteica, corresponde a un mnimo global de energa libre. Actualmente hay tres problemas principales a los que debe enfrentarse este campo de investigacin que son bsicamente: definir un sistema de scoring que diferencie estructuras nativas de las no nativas.

definir un campo de fuerzas para el cual la estructura con mnima energa libre global coincida con la estructura que conocemos como nativa.
El tiempo de computacin necesario que requiere una cadena polipeptdica para recorrer todas las posibilidades conformacionales.

Pasos para el modelado por homologia (homology modelling)

Busqueda de la protena homologa (molde en general) Alineamiento Seleccin del modelo Refinamiento del modelo Validacin del modelo

El proceso de modelado por homologa es cclico


Secuencia

Alineamiento

Validacin del modelo

Construccin del modelo

Hasta no obtener mejoras

Proceso de Modelado por homologa


Secuencia
Datos experimentales

Alineamiento mltiple de secuencias

Bsqueda en bases de datos

Asignacin de dominios

Homologo PDB

NO

Prediccin de estructura secundaria

Reconocimiento de plegamiento

SI

Anlisis de la familia de plegamiento Alineamiento de estructuras secundarias

SI

Homologo PDB

NO
Prediccin estructura terciaria

Modelado por homologia

Alineamiento de la secuencia a las estructuras

Modelo 3D de la protena

Basado en Bob Rusell

Cosas a tener en cuenta para evaluar una prediccin de plegamiento (Fold recognition):
Correr mas de un programa de Fold recognition En lo posible, correrlo sobre mas de un homologo.

Evaluar todas las salidas de un programa (no la primera) la solucin puede estar entre las 10.
Funcin de la protena de estructura desconocida. Funcin de la protena de estructura conocida. La familia de plegamiento FOLD FAMILY. Prediccin de estructura secundaria.

Datos experimentales

Tener todo dato experimental en mente a la hora de hacer un trabajo predictivo.

Comprobar si la prediccin concuerda con los resultados experimentales. En caso negativo, habr que re plantearse lo hecho.

Datos experimentales pueden guiar el proceso de prediccin ej:

Puentes disulfuro, restringen las posiciones de las cisteinas en el espacio. Datos espectroscpicos. Dan informacin del contenido de estructura secundaria. Mutagnesis dirigida, da informacin a cerca de que residuos intervienen en el centro activo o lugares de unin. Conocimiento de lugares proteolticos, modificaciones post-transduccionales, glucosilaciones, sugieren residuos accesibles. Sitios antignicos.

Etc.

Validacin de modelos

Validacin de modelos

Validacin de modelos

Procheck

Validacin de modelos

Validacin de modelos

Verify3D

Validacin de modelos

Datos experimentales Procheck Verify3D Prosa II Errat WhatCheck ProQ

Modelado de Loops

El modelado de Loops constituye un problema de homology Modelling dentro de la protena.

Modelado Knowledge based (por homologa)

Modelado ab initio (loop building)

Clasificacin de Loops

http://sbi.imim.es/cgi-bin/archdb//loops.pl

Clasificacin de Loops

Numero de clases Vs. Longitud del loop en ArchDB


Fernndez Fuentes, Narcs. Tesis doctoral UAB 2004

Clasificacin de Loops

b-a 3.1.1 (2 cons GLY. 1 PH)

b-b hairpin 5.1.1(1 cons GLY. 1 PH)

Fernndez Fuentes, Narcs. Tesis doctoral UAB 2004

a-b 4.1.1 (cons GLY PRO. 1 PH)

Modelado de Loops

Modelado de Loops

Modelado de Loops
ej: Knowlege based

http://manaslu.aecom.yu.edu/loopred/

http://www-cryst.bioc.cam.ac.uk/servers.html

ej: By satisfaction of spatial restrains

http://alto.compbio.ucsf.edu/modloop/

Errores mas frecuentes en modelos creados por homology modelling

Mala eleccin del template

Mal alineamiento entre template y la protena estructura desconocida.

el de

Mala eleccin del template Mal asignacin

1hht RNAdep-RNAPol. Bacteriophage phi-6 1c2p RNAdep-RNAPol. HCV

Mala eleccin del template Mal asignacin


RHDV

PV

HCV

Ribbon diagrams of RNA-dependent RNA polymerases shown from a similar vantage point

Mala eleccin del template Molde no adecuado

HCV

Ramachandran Plot statistics Most favoured regions [A,B,L] 835 Additional allowed regions [a,b,l,p] 102 Generously allowed regions [~a,~b,~l,~p] 5 Disallowed regions [XX] 4 Non-glycine and non-proline residues 946 Glycine residues 58 Proline residues 54 Total number of residues 1062

88.3%* 10.8% 0.5% 0.4%* 100.0%

Mala eleccin del template

HCV

Ramachandran Plot statistics Most favoured regions [A,B,L] 909 Additional allowed regions [a,b,l,p] 84 Generously allowed regions [~a,~b,~l,~p] 0 Disallowed regions [XX] 0 Non-glycine and non-proline residues 993 End-residues (excl. Gly and Pro) 8 Glycine residues 62 Proline residues 56 Total number of residues 1119

91.5% 8.5% 0.0% 0.0% 100.0%

Alineamiento parcialmente errneo

82-93

Alineamiento parcialmente errneo


Superposicin molde modelo

Parcialmente mal alineamiento

1C2P

unk

Modelado de Loops

Estudio Comparativo distintos softwares Para modelado por Homologa

76% 52% 42%

39%
38% 24% 19%

Akbar Nayeem. Et. Al. Protein Sci. 2006 15: 808-824

Estado del arte: CASP

http://predictioncenter.org/casp6/Ca sp6.html

6th Community Wide Experiment on the Gaeta (Italy) December 2004

Critical Assessment of Techniques for Protein Structure Prediction

Critical Assessment of Techniques for Protein Structure Prediction

Asilomar Conference Center, Pacific Grove, CA November 2006 (CASP7), 2006

Estado del arte: CAPRI

CAPRI: Critical Assessment of PRediction of Interactions

CAPRI community wide experiment on the comparative evaluation of protein-protein docking for structure prediction Hosted By EMBL/EBI-MSD Group

Utilidad de un modelo

EJEMPLO DE ESTUDIOS ESTRUCTURALES

M. A. Marti i Renom et. Al Current Protocols in Bioinformatics (2003) 5.1.1-5.1.3

Construccin de estructuras supramoleculares IR

Construccin de estructuras supramoleculares IR

ILGFR 1999

Identification of functional residues

Residues with backbone dihedral angles in strained conformation. Clusters of charged residues. Cavities or clefts in the protein structure. Surface properties such as hydrophobicity, planarity, size or shape. Energetics of the protein structure. Surface mapping of phylogenetic information.

Bsqueda de Patterns en estructuras terciarias no-homologas, intento de asignar funcin

Trazado evolutivo de residuos

Trazado evolutivo de residuos


Particin 1 Particin 2

Particin 7

Particin 8

Particin 9

Particin 10

Buried, Class-specific Buried, Conserved Exposed, Class-specific Exposed, Conserved

Trazado evolutivo de residuos

Trazado evolutivo de residuos

C.Axel Innis et. Al. Protein Engineering, Vol. 13, No. 12, 839-847. 2000

Dilucidacin del mecanismo de transduccin de seal (Interaccin Protena-Protena)

II I I I II I II II II I II 2tgi.pdb

Dilucidacin del mecanismo de transduccin de seal

Dilucidacin del mecanismo de transduccin de seal

Dilucidacin del mecanismo de transduccin de seal

Dilucidacin del mecanismo de transduccin de seal

Dilucidacin del mecanismo de transduccin de seal

Dilucidacin del mecanismo de transduccin de seal

Parantu K. Shah, Cristina Marino Buslje, R. Sowdhamini Proteins: Structure, Function, and Genetics Volume 45, Issue 4. 2001

Ejemplo de Docking Automtico

Receptor de nicotina/ conotoxina

Diseo de drogas TcHPRT

Diseo de drogas TcHPRT

Rigid superimposition on PRPP of: a) ALN ;b) OLP; c) PAM; d) RIS. Blue: N, Green: P, Grey: C, Red: O.

Daniel Fernandez, et. al.

Diseo de drogas TcHPRT

3.9A

Diseo de drogas TcHPRT

2.39A

Explicacin de datos experimentales y diseo de nuevos experimentos.

* RNA-dependent RNA-polimerase Tacaribe virus * 1c2p.pdb

8.8 %identity

1e3p.pdb

También podría gustarte