Está en la página 1de 12

PRACTICA COMPUTACIONAL III: Predicción de la

estructura terciaria de la proteína hipotética


BatCoVHKU5_gp5.
Nicolás Rodríguez Caviedes 1,*

1
Universidad Nacional de Colombia, Bogotá. nicrodriguezcav@unal.edu.co

Resultados y discusión
I. Identificación de la secuencia

La identificación de la proteína de interés se realizó mediante el uso de bases de datos NCB,


en donde la búsqueda inicial se llevó a cabo con el motor de búsqueda de ENTREZ (protein),
donde se encontró la siguiente proteína hipotética.

Imagen 1. Proteína hipotética de trabajo.

Posteriormente, para validar si la proteína presentaba una estructura tridimensional se empleó


la base de datos PubMed para la adquisición del DOI del artículo en el que se encontraba esta
proteína en específico, se revisó dicho artículo, de igual manera, en la base de datos PDB se
buscó tanto la secuencia de interés como el DOI y el título del investigación realizada, y no
se encontraron resultados positivos (imagen 2 a,b,c) una vez se comprobó que la proteína
hipotética carecía de una estructura tridimensional, se procedió con el estudio.

Imagen 2. Confirmación de la estructura tridimensional de la proteína.

II. Predicción de la estructura secundaria.

Secuencia.

mddsmdldld cviaqpssti vmmplspist rkrrrhpmnk rryakrrftp vepndiimcd


kpthcirlvf dqslrwvhfd gikniltdyd vifnpdlhvt valvcagngv tfsdltpltf
iladmllefn giftlgqtlv igareyhwlp qelktnvgka ipqakewlvd hgynvyhtgl
pthmslaklh sldfvqqsyv gskffikhsh tteyampvcl qviaidgekv dgrskplfqy
pihnhyrhyr acfpgr

• Chou-Fasman

Imagen 3. Predicción de la estructura secundaria empleando el modelo de Chou-Fasman.


• GOR

Imagen 4. Predicción de la estructura secundaria empleando el modelo GOR.

• Neutral Network

Imagen 5. Predicción de la estructura secundaria empleando el modelo de Neutra Network.

• Comparación.

Al comparar las predicciones obtenidas en esta base de datos, se pude observar la diferencia
en las probabilidades de cada sección de la secuencia de aminoácidos para tomar una
disposición en específico (alfa hélice o lamina beta) en donde se ve que en su mayoría, la
proteína tiene una alta concentración de láminas beta, esto se puede deber a su alto contenido
de leucina, que al presentar una estructura ramificada va a desestabilizar la estructura de alfa
hélice, de igual manera, los contenidos de prolina también son significativamente altos, este
aminoácido se caracteriza por ser el final de una alfa hélice, por lo que es de esperarse que
hayan más estructuras planas como las láminas alfas, finalmente, se observa que hay más
aminoácidos polares (hidrofílicos) los cuales también desestabilizan este tipo de estructuras.

Imagen 6. Comparación de las predicciones realizadas con base a su secuencia de


aminoácidos.

Finalmente, la base de datos computa una opción para hacer la comparación de las tres
funciones de predicción posible que tiene (imagen 6) en donde se aprecia que en los tres
métodos se encuentran secuencias repetidas en donde se puede hablar casi que de una
secuencia consenso, en donde la presencia de variaos residuos de histidina (H) codifica
siempre una alfa hélice por estabilización de puentes de hidrogeno internos paralelos al ee
longitudinal de la hélice, orientando su cadena lateral (anillo imidazol) hacia el exterior,
mientras que en la región de las láminas beta, se encuentra bajo el domino del ácido glutámico
(E) en donde las cadenas laterales (alifáticas) quedan hacia la parte superior o inferior de la
lámina.
III. Predicción de estructura terciaria.

• Ab initio

Imagen 7. Modelo 1 generado en Robetta unto con su posible desviación aproximada


respecto al modelo.

Imagen 8. Modelo 2 generado en Robetta unto con su posible desviación aproximada


respecto al modelo.
Imagen 9. Modelo 3 generado en Robetta unto con su posible desviación aproximada
respecto al modelo.

Imagen 10. Modelo 4 generado en Robetta unto con su posible desviación aproximada
respecto al modelo.

Imagen 11. Modelo 5 generado en Robetta unto con su posible desviación aproximada
respecto al modelo.

Esta herramienta es la mas robusta de las suministradas, el análisis de esta proteína duro
alrededor de 30 horas por lo que en principio se puede asumir a que este tal vez sea el
resultado mas cercano a la verdadera estructura terciaria de esta proteína, algo en común que
presentan los 5 modelos que nos arroja esta plataforma es que los modelos 1,2,3 y 5 presentan
las menores desviaciones posibles, mientras que el modelo 4 ya tiene un error
considerablemente mayor, además de esto, se observa que la concentración de estructuras
alfa hélice es menor a otras formas como las láminas beta y random coil

Una herramienta paralela de la página, se pudo comprobar la estructura secundaría, con


mayor abundancia de laminas beta.
Imagen 12. Estructura secundaria obtenida por TMHMM disponible como herramienta
alternativa en Robetta.

• Threading 1

En la base de datos https://toolkit.tuebingen.mpg.de/tools/hhpred se puede elucidar una


estructura terciaria gracias a la comparación con algunas secuencias reportadas en PBD en
donde se pude escoger aproximadamente la región de secuencias de aminoácidos a comparar,
en primer lugar, según la sugerencia de la base de datos, se trabajó con los aminoácidos de
la región central de esta proteína hipotética, en donde se encontró la siguiente similitud, sin
embargo esta proteína (4Z5V) tiene muchos menos aminoácidos que la proteína de objetivo,
pero aun así, es el mejor resultado obtenido en esta base de datos.

Imagen 13. Proteina 4Z5V con una secuencia similar a la proteína de interés.

• Threading 2

En la herramienta de I-TASSER se obtiene una gran cantidad de informacion, en donde


primeramente se puede identificar nuevamente la estructura secundaria, donde nuevamente
se ve la clara mayoria de la estructura de láminas beta, pero tambien se obsrva que la
estructura tiene una gran extencion de estructuras coil, el cual no se había discriminado en la
seccion de identificaccion de la estructura secundaria. Cabe resaltar que la prediccion de esta
posible conformacion es realizada, según la base de datos, con el facotr beta.

Imagen 13. Información de la estructura secundaria usando factor beta.

Además de esta información, identifica posibles homologías con otras proteínas reportadas
en PDB, en donde llama la atención que el resultado encontrado con la base de datos anterior
aparece en el puesto 3 en cuanto a la similitud, en este caso se nos indica que la proteína 2vfl
reportada en la imagen 15, donde pareciera que hay un punto de unión con un nucleótido
derivado del uracilo.

Imagen 14. Proteínas patrón usadas para la predicción de la estructura terciaria.


Imagen 15. Estructura terciaria de la proteína 2vfl usada para la predicción de la estructura
de la proteína de interés.

Posteriormente se nos presenta las 5 posibles predicciones más acordes según el modelo de
la base de datos, mediante un puntaje asignado por la misma base.

Imagen 16. Modelo 1 obtenido en la base de datos I-TASSER para la proteína de interés.
Imagen 17. Modelo 2 obtenido en la base de datos I-TASSER para la proteína de interés.

Imagen 18. Modelo 3 obtenido en la base de datos I-TASSER para la proteína de interés.
Imagen 19. Modelo 4 obtenido en la base de datos I-TASSER para la proteína de interés.

Imagen 20. Modelo 5 obtenido en la base de datos I-TASSER para la proteína de interés.

Es interesante que, aunque la primera parte de la plataforma nos daba una idea de una
estructura con bastantes láminas beta, en los modelos sugeridos un poco después se observa
que en su mayora es una estructura Coil, seguida de algunas alfa hélices, sin embargo, la base
de datos también nos indica estructuralmente las proteínas mas similares, en donde ahora si
se tiene una cantidad mayor de láminas beta según las predicciones de la estructura
secundaría.
Imagen 21. Proteínas mas parecidas estructuralmente a la proteína de interés.

• Homología

Esta base de datos (https://toolkit.tuebingen.mpg.de/tools/hhpred) se compara la secuencia


suministrada con una base de datos de muchas otras proteínas, en donde por similitud se
aproxima a una estructura tridimensional, en donde se puede confirmar que la mayoría de la
molécula presenta láminas beta y una pequeña cantidad es de hélices alfa. Además, se puede
observar el sitio activo, en el cual su sustrato es el GMP (guanosín monofosfato).

También podría gustarte