Está en la página 1de 28

DEISEÑO POR HOMOLOGÍA DE UNA

PROTEÍNA USANDO HERRAMIENTAS


BIOINFORMÁTICAS
¿QUÉ ES EL MODELADO POR HOMOLOGÍA?

Es un método que permite predecir la Estructura terciaria (3D) de una proteína deseada
(Diana) conociendo:

- Su secuencia de aminoácidos (Estructura primaria)


- La estructura terciaria de una homóloga (templete/molde) resuelta por rayos-X o NMR

¿EN QUÉ PRINCIPIOS SE BASA EL MODELADO POR HOMOLOGÍA?

- Secuencias similares adoptan estructuras similares


- En una familia, los residuos conservados en la secuencia, conservan la misma estructura
- La topología de los residuos del sitio activo también es conservada
- El proceso de evolución por selección natural “tolera” variaciones de la secuencia

¿EN QUÉ PRINCIPIOS SE BASA EL MODELADO POR HOMOLOGÍA?

- Secuencias similares adoptan estructuras similares


- En una familia, los residuos conservados Æ misma estructura
- La topología de los residuos del sitio activo también es conservada
Por que es importante Modelar proteínas?

 Existe una gran diferencia entre el número de secuencias


depositadas y las estructuras 3D disponibles en el PDB

 La determinación experimental de proteínas es un proceso


largo y costoso

 La diferencia puede acortarse con la ayuda de métodos


teóricos de predicción de estructuras

 Cerca del 50% de las secuencias que se determinan


actualmente son modeladas
La información estructural
de proteínas de parásitos en el PDB es muy escasa

Organism: Plasmodium Organism: Trypanosoma

P.v 8.1%

X-ray : 294 X-ray :389

Organism: Leishmania

X-ray : 181
Los genomas para muchos de estos organismos
han sido secuenciados casi en su totalidad y
reportados
¿EN QUÉ PRINCIPIOS SE BASA EL MODELADO POR HOMOLOGÍA?

- Secuencias similares adoptan estructuras similares


- En una familia, los residuos conservan la misma estructura
- La topología de los residuos del sitio activo también es conservada
Durante la evolución la estructura se
conserva más que la función y que la
secuencia

Estructura > Función > Secuencia


Las proteínas de secuencia similar, con un
origen evolutivo común, tienen una estructura
3D similar

2lao 3bki

periplasmic binding protein glutamate receptor 2

Length: 282
Identity: 63/282 (22.3%)
Similarity: 110/282 (39.0%)
La estructura de una proteína
se puede extrapolar a partir de una
homologa
Secuencia Modelo
SVYDAAAQLTADVKKDLRDSW
KVIGSDKKGNGVALMTTLFAD
NQETIGYFKRLGNVSQGMAND
KLRGHSITLMYALQNFIDQLD
NPDSLDLVCS…….

Plantilla
Modelado por
Modelado
Homología
por Homología
Secuencia problema
Modelado
BD de
Secuencias
Identificar secuencias
Homólogas
por Homología

Alinear las
Alinear Secuencias
Secuencias
Plantilla

BD de Identificar las proteínas


Estructuras con estructura 3D

Análisis y validación
Alineamiento de la estructura
Blanco-plantilla

Modelo(s) por
Modelo(s) por
Construir regiones Modelado de Homología
Homología
estructuralmente divergentes la Estructura

Refinamiento
MM - DM Modelo Final
COMPARACIÓN DE SECUENCIAS DE PROTEÍNA Y
CONSERVACIÓN DE SU ESTRUCTURA Y FUNCIÓN

Hay muchas maneras de comparar proteínas, pero entre ellas posiblemente la más
natural sea el alineamiento de sus secuencias.

Esto se debe, por un lado, a que la estructura primaria determina en gran medida el
plegamiento.

Por otro lado a que es la manera más sencilla de manipular proteínas en el cuaderno y
el ordenador.

Al alinear dos o más secuencias establecemos exactamente qué residuos de unas se


corresponden con los de otras.

Esta correspondencia es obvia cuando las secuencias son muy parecidas, pero se va
diluyendo a medida que las secuencias acumulan mutaciones.

La medida más utilizada para medir esta semejanza o divergencia es el % de


identidad de secuencia
COMPARACIÓN DE SECUENCIAS DE PROTEÍNA Y
CONSERVACIÓN DE SU ESTRUCTURA Y FUNCIÓN
COMPARACIÓN DE SECUENCIAS DE PROTEÍNA Y
CONSERVACIÓN DE SU ESTRUCTURA Y FUNCIÓN

Algoritmos de alineamiento y matrices de sustitución de aminoácidos.

En el ejemplo ya vimos cómo se pueden alinear dos secuencias. Ahora


revisaremos los tipos fundamentales de algoritmos de alineamiento, que
deberemos conocer para aplicar según nuestras necesidades:

 Alineamiento pareado. Alinea dos secuencias entre si.

 Alineamiento múltiple. Alinea tres o más secuencias entre si.

 Alineamiento global. Alinea secuencias completas, incluyendo en el


alineamiento resultante todos los residuos de todas las secuencias de
entrada.

 Alineamiento local. Optimiza el alineamiento de las subsecuencias que se


parecen y descarta el resto.
MODELOS EVOLUTIVOS DE
PROTEÍNAS
Los alineamientos, además de comparar secuencias, pueden usarse como estimadores
de homología. A diferencia de funciones cuantitativas como la identidad o la similitud,
la homología es una propiedad cualitativa binaria: se es homólogo o no. Como la
evolución ocurre generalmente a nivel de ADN, realmente se habla de genes homólogos
cuando se supone que son descendientes de un mismo gen ancestral, pero por
extensión hablamos también de proteínas homólogas.
MODELOS EVOLUTIVOS DE
PROTEÍNAS

Cuanto más cerca están


las ramas, más similares
son las secuencias. Los
números a lo largo de las
ramas representan el
número de diferencias de
aminoácidos.
MODELOS EVOLUTIVOS DE
PROTEÍNAS

Conservación de la estructura
y la secuencia del citocromo C
humano y el citocromo C2 de
la bacteria Rhodopseudomonas
viridis.
MODELOS EVOLUTIVOS DE
PROTEÍNAS
Cómo evolucionan las secuencias de genes y proteínas

Algunos mecanismos que provocan cambios en las


secuencias de genes son:

Mutación: cuando el ADN se replica se pueden


producir errores al realizar la copia; también pueden
introducirse mutaciones por efecto de agentes
externos (mutagénicos) como por ejemplo la luz
ultravioleta.

Duplicación: cuando un gen se duplica se abre una


puerta para la adquisición de nuevas funciones
biológicas. Las mutaciones en el nuevo gen son más
fácilmente tolerables. Estos genes pueden degenerar
convirtiéndose en pseudogenes.

Barajado de dominios: muchas proteínas están


constituidas por dominios. Mediante recombinación se
pueden barajar y producir nuevas combinaciones.
MODELOS EVOLUTIVOS DE
PROTEÍNAS
ÁRBOL FILOGENETICO  Genes homólogos son genes que se derivan de un gen
ancestral encontrado en un organismo ancestral.

 Genes parálogos. Genes que debido a una duplicación, ya


no comparten el último ancestro. Frecuentemente
tienen funciones distintas. Copias que tiene la
posibilidad de evolucionar.

Si el gen A se duplica dentro del organismo ancestral y una


copia evoluciona hacia una nueva función dando el gen B.

 Genes ortólogos. Genes que comparten el último


ancestro común y cuya divergencia se debe a la
especiación.

El gen A de chimpancés y el gen A de humanos se


consideran ortólogos así como el gen B de chimpancé y el
gen B de humanos ya que se originan por un evento de
especiación.
Dominio de proteína
Un dominio es un término más genérico que designa una región de una proteína
con interés biológico funcional o estructural. También se llama dominio a una
región de la estructura tridimensional de una proteína con una función concreta,
que incluye regiones no necesariamente contiguas en la secuencia de aminoácidos

motivos de plegamiento o estructura supersecundaria son la combinación de


varias unidades simples de estructura secundaria que están organizadas con
una geometría específica. 

Motivos de plegamiento de estructural b . (A) horquilla,


(B) Lámina, hoja b (meandro) y (C) Guarda griega
(Greca)
Propiedades fisicoquímicas la proteína:
 
MATSRAALCAVAVVCVVLAAACAPARAIHVGTPAAALFEEFKRTYGRAYETLAEEQQRLA
NFERNLELMREHQARNPHAQFGITKFFDLSEAEFAARYLNGAAYFAAAKRHAAQHYRKAR
ADLSAVPDAVDWREKGAVTPVKDQGACGSCWAFSAVGNIEGQWYLAGHELVSLSEQQLVS
CDDMNDGCDGGLMLQAFDWLLQNTNGHLHTEDSYPYVSGNGYVPECSNSSELVVGAQIDG
HVLIGSSEKAMAAWLAKNGPIAIALDASSFMSYKSGVLTACIGKQLNHGVLLVGYDMTGE
VPYWVIKNSWGGDWGEQGYVRVVMGVNACLLSEYPVSAHVRESAAPGTSTSSETPAPRPV
MVEQVICFDKNCTQGCRKTLIKANECHKNGGGGASMIKCSPQKVTMCTYSNEFCVGGGLC
FETPDGKCAPYFLGSIMNTCHYT

https://web.expasy.org/protparam/
Dominio de proteína

Buscar dominios con el programa Pfam


https://pfam.xfam.org/search#tabview=tab0
Proteína transmembrana

http://www.cbs.dtu.dk/services/TMHMM/
Alineamiento de la proteína para su identificación

https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAG
E_TYPE=BlastSearch&LINK_LOC=blasthome
.
https://www.ebi.ac.uk/Tools/msa/clustalo/

•Corresponden a las regiones


estructuralmente mas
estables de la proteína y a
elementos de estructura
secundaria.
•Altamente conservadas, y por
lo general, sin GAPs.
Estructura secundaria
http://www.cbs.dtu.dk/services/NetSurfP/
Generación de la estructura 3D de la proteína
Generación de la estructura 3D de la proteína
Validación

https://swissmodel.expasy.org/assess
PDBSum
Predicción del sitio activo
https://zhanggroup.org/BSpred/
 http://sts.bioe.uic.edu/castp/index.html?3igg

También podría gustarte