Está en la página 1de 8

Universidad de las Ciencias Informáticas

Título: Alineamiento múltiple de estructuras de proteínas.

Autora: Nara Lidia Pérez Solá


e-mail: nara@uci.cu

CIUDAD DE LA HABANA, CUBA

Octubre, 2007

1
Resumen
La comparación tridimensional o en el espacio de varias estructuras de proteínas, con el objetivo de encontrar residuos
espacialmente equivalentes, constituye, en la actualidad, una importante tarea a desarrollar en el campo de las investigaciones
bioinformáticas. Mediante la comparación, se pueden identificar las regiones conservadas entre proteínas diferentes, generar
hipótesis sobre sus relaciones evolutivas, predecir nuevas funcionalidades a partir de la comparación con otras proteínas mejor
estudiadas, así como, estudiar las enfermedades que son provocadas por mutaciones de las proteínas. Muchos trabajos han sido
desarrollados en los últimos años con este objetivo. Estos se diferencian entre sí por el método o algoritmo implementado, además
del nivel de la estructura y el número de proteínas que intervienen en el alineamiento. En el presente trabajo se describen los
diferentes tipos de métodos de comparación de proteínas, sus ventajas, desventajas, principales características y su importancia
para el estudio de las proteínas.

Palabras Claves:

¾ Alineamiento

¾ Estructuras de Proteínas

¾ Residuos

Abstract
The three-dimensional, or the space of some protein structures with the purpose of finding space equivalent remainders, is
nowadays an important task to be developed in the field of Bioinformatics investigations. By means of the comparison it is
possible to identify the spaces between different proteins, to generate hypothesis over its evolution as well as to foretell new
functions as the result of the comparison with other proteins studied before. Lots of research projects related to this matter have
been carried out all these years. These works are different according to, in the first place, the method or algorithm used, the level
of the structure and the number of protein that has to do with the alignment. In this work different methods to compare proteins,
advantages, disadvantages and the main characteristics are well described as well as its importance to further studies related to
proteins.

Keywords:

¾ Alignment

¾ Protein Structures

¾ Remainders

2
Introducción
Las proteínas representan las biomoléculas más abundantes dentro de los organismos vivos, pues constituyen más del 50% del
peso seco de las células. Estas desempeñan varias funciones, tales como: catalizadoras de reacciones metabólicas (enzimas), en el
transporte de Dióxido de Carbono y Oxígeno (Hemoglobina), en la protección inmunológica, en la coagulación sanguínea
(Fibrinógeno), entre otras. Prácticamente no existe proceso biológico en el cual no participe por lo menos una proteína. Se les
considera como el grupo de compuestos que mayor cantidad de funciones desempeñan en los seres vivos. Y es precisamente,
debido a este importante rol, que científicos y biólogos han invertido grandes esfuerzos y recursos en su estudio, para el análisis
de enfermedades y la elaboración de nuevos fármacos.

Las proteínas están constituidas por cadenas lineales de aminoácidos unidos mediante enlaces peptídicos, pueden estar formadas
por una o varias cadenas peptídicas y su estructura viene definida por cuatro niveles estructurales: estructura primaria, secundaria,
terciaria y cuaternaria.

La estructura primaria viene determinada por la secuencia de aminoácidos en la cadena proteica, es decir, el número de
aminoácidos presentes y el orden en que están enlazados. La conformación espacial de una proteína se analiza en términos de
estructura secundaria (plegamiento que la cadena polipeptídica adopta) y estructura terciaria (disposición tridimensional de todos
los átomos que componen la proteína). La asociación de varias cadenas polipeptídicas, origina un nivel superior de organización,
la llamada estructura cuaternaria.

La estructura terciaria de una proteína, es la responsable directa de sus propiedades biológicas y la cuaternaria, es el nivel más
complejo, el cual lo pueden tener, proteínas complejas, como: las enzimas y los anticuerpos.

Estructura primaria
Estructura Secundaria

3
Estructura Terciaria Estructura Cuaternaria

Fig. 1: Estructuras de una proteína.

A la hora de analizar la estructura de las proteínas, no se debe analizar solamente en sentido de la secuencia lineal de
los aminoácidos. Una misma secuencia lineal de aminoácidos puede adoptar múltiples conformaciones en el espacio.
Además un simple cambio en la secuencia o en el entorno en donde se pliegue la proteína, puede significar un cambio
en la disposición tridimensional de estas, y por lo tanto en su función.

Un alineamiento de secuencias es una comparación entre la cadena lineal de aminoácidos (estructura primaria) de dos o
más proteínas y un alineamiento de estructura, es otro tipo comparación de proteínas basado en el alineamiento de su
estructura tridimensional. Este proceso se aplica generalmente a la estructura terciaria de las proteínas.

Es importante entender la estrecha relación que existe entre la estructura de las proteínas y su función, ya que,
mutaciones en las proteínas, (modificaciones en los residuos originales) podrían ocasionar la pérdida o el mal
funcionamiento de la misma, alterando alguna vía metabólica.

En ocasiones sucede que una estructura completa de proteína no es la responsable de algunas de sus funciones sino que
solamente una porción de ella es la que interactúa con su entorno atribuyéndole determinada función. A esta parte de la
proteína que le atribuye cierta y determinada función se le denomina dominio.

En general se puede decir que: un dominio es una subestructura de una proteína que puede ser responsable de una
función particular. En términos geométricos, la idea intuitiva de un dominio estructural puede entenderse, como un
conjunto de aminoácidos de una proteína con elevado número de interacciones entre ellos y pocas interacciones con el
resto de los aminoácidos de la proteína que no pertenecen a dicho conjunto.

4
La comparación de estructuras tridimensionales de proteínas es una de las principales herramientas utilizadas para el
estudio de estas macromoléculas. Los métodos de comparación de estructuras de proteínas también juegan un rol
importante en la validación de otros métodos bioinformáticos, tales como, los métodos de alineamiento de secuencias y
los métodos de predicción del tipo de plegamientos. Y, un alineamiento múltiple de estructuras de proteínas es una
comparación entre varias estructuras de proteínas.

Desarrollo
Base de Datos estructurales de Proteínas: The Protein Data Bank (PDB)

En los últimos años, muchísimos métodos para realizar alineamientos múltiples de estructuras de proteínas han sido desarrollados,
siendo usados, en su gran mayoría, para construir bases de datos para la clasificación de estructuras de proteínas.

Debido a la importancia que representa el estudio de las estructuras de las proteínas, por la estrecha relación con su función, se
han desarrollado varias técnicas y tecnologías con el objetivo de determinar la estructura tridimensional de las proteínas, entre las
que podemos mencionar a la cristalografía de rayos X. Como resultado se ha creado una base de datos de estructura de proteínas.

La base de datos de la estructura de las proteínas también llamado PDB por sus siglas en inglés (protein data bank), contiene los
archivos con la posición de cada átomo en un eje de coordenadas tridimensional, que conforman una proteína. Este archivo de
coordenadas, no solo considera el esqueleto de la proteína sino todas aquellas moléculas con las que se haya resuelto en conjunto
con la estructura de la proteína.

Comparación de proteínas: Alineamiento Múltiple de estructuras de proteínas.

En los últimos años, como resultado del avance tecnológico, el número de secuencias y de estructuras de proteínas en sus
respectivas bases de datos se ha multiplicado, haciendo viables y necesarias el desarrollo de herramientas bioinformáticas que
permitan descubrir relaciones evolutivas y estructurales entre las proteínas. La comparación de proteínas es un proceso a partir del
cual, se pueden inferir estructuras y funcionalidades a partir de la similitud entre las secuencias o las estructuras de proteínas.

Un alineamiento de estructura, es otro tipo comparación de proteínas basado en el alineamiento de su estructura tridimensional.
Este tipo de alineamiento, trata de establecer equivalencias entre la conformación espacial de dos o más proteínas en busca de
residuos espacialmente equivalentes.

En un alineamiento de estructuras pueden intervenir dos o más proteínas. Además, debido a que éstos se apoyan en la información
sobre la conformación tridimensional de las proteínas, los métodos solo pueden ser usados en proteínas donde se conozca la
estructura. También es posible ejecutar un alineamiento con estructuras obtenidas, a partir de métodos de predicción de estructura.

5
Un alineamiento múltiple de estructuras de proteínas es una comparación entre varias estructuras de proteínas con la finalidad de
encontrar residuos espacialmente equivalentes. Este tipo de alineamiento no solo se realiza a partir de la información de la
estructura completa de las proteínas sino que también es usado para comparar dominios específicos. Por lo cual el alineamiento
múltiple de estructuras es una importante herramienta para la clasificación automática de dominios de proteínas.

Métodos para la realización de alineamientos de estructuras de proteínas.

En la actualidad se desarrollan muchos métodos para realizar alineamientos múltiples de estructuras de proteínas. La mayoría de
ellos, utilizan el cálculo del RMSD (Root Mean Square Deviation), que no es más que el cálculo de una distancia que expresa la
diferencia estructural de dos topologías. De este modo, cuanto menor sea el valor de RMSD de comparación de dos o más
estructuras, mayor es la similitud de las mismas. Pero este método puede fallar cuando la correspondencia estructural entre los
residuos de las proteínas comparadas no es evidente. Este efecto es obviado por algunos métodos, ya que se van seleccionando
trozos de proteínas para realizar la comparación estructural. A medida que los fragmentos seleccionados disminuyen de tamaño, la
superposición es mejor.

En los últimos años se han desarrollado varias metodologías para obtener comparaciones estructurales de proteínas no
relacionadas, sin embargo estas metodologías implican un gran número de cálculos y realizar un análisis global del PDB resulta
imposible. Otra importante limitación son los procedimientos matemáticos que se utilizan y las implicaciones geométricas que
suponen los algoritmos utilizados.

Uno de los métodos más populares es el DALI, el cual fue usado para construir la base de datos FSSP (Families of Structurally
Similar Proteins), en la cual todas las estructuras de proteínas conocidas son alineadas con las demás para determinar las proteínas
con estructuras semejantes y así su clasificación y donde cada proteína cristalizada tiene un fichero FSSP que contiene todos sus
homólogos estructurales.

El server de Dali permite consultar el fichero FSSP de una proteína, correr coordenadas tridimensionales contra la base de datos,
correr entre ellos dos conjuntos de coordenadas 3D, etc.

Otro de los métodos es el SSAP (Sequential Structure Alignment Program), el cual utiliza una doble programación dinámica para
obtener una superposición inicial, representando las estructuras secundarias como vectores. Este método es muy rápido y robusto,
es capaz de detectar similitudes globales entre las proteínas y entre los dominios estructurales locales y fue usado para modelar y
producir un esquema, para la clasificación jerárquica de proteínas conocida como CATH (Class, Architecture, Topology,
Homology), y que ha sido usado para construir la base de datos CATH Protein Structure Classification. Debido a la naturaleza
jerárquica del algoritmo, este es muy competente detectando las similitudes locales de las estructuras secundarias entre proteínas y
también maneja características tales como: la longitud variable o la introducción o la supresión de elementos de la estructura
secundaria.

6
El CE (Combinatorial Extension) es otro método, muy semejante al DALI, y al igual que este, también ha sido usado para
construir una base de datos para la clasificación de estructuras de proteínas. Este proporciona una reducción significativa en el
espacio de la búsqueda. CE no resuelve, las llamadas “similitudes no topológicas” donde el orden de los fragmentos polipéptidos
en las estructuras alineadas no sigue su orden en la secuencia.

Varias propiedades pueden ser utilizadas también con el algoritmo CE: superposición de estructuras, distancia entre los residuos,
propiedades ambientales, propiedades de la conformación

Otros de los métodos de alineamiento menos utilizados son: MAMMOTH MAMMOTH (Matching Molecular Models Obtained
From Theory) y el LGA (Zemla, 2003).

El MALECON, es un método progresivo combinado para el alineamiento múltiple de estructuras de proteínas desarrollado en el
Centro de Ingeniería Genética y Biotecnología de Cuba (CIGB). Éste busca en una librería de alineamientos de pares, tres
proteínas alineadas en las cuales un número específicos de aminoácidos esta consecuentemente alineado. Estos alineamientos son
progresivamente expandidos para incluir proteínas adicionales y más residuos espacialmente equivalentes sujetos a determinado
criterio. Esta acción incluye superponer las proteínas alineadas por sus residuos equivalentes y buscan los átomos de Cα
adicionales que se encuentran cerca en el espacio. Este método, aunque puede ser muy costoso en recursos y tiempo, es capaz de
encontrar semejanzas entre estructuras de proteínas, campo en el que, otros métodos no han mostrado resultados, obteniendo así
una mayor eficiencia al comparar estructuras de proteínas sin una similitud evidente.

Conclusiones
Muchos son los esfuerzos, que se dedican a diario al estudio de la estructura de las proteínas, y los métodos de comparación
tridimensional arrojan, a los especialistas de ese campo, valiosos conocimientos que han permitido el desarrollo de innumerables
fármacos así como la predicción de homologías entre las macromoléculas. De mas está resaltar la vital importancia del proceso de
alineamientos múltiple de estructuras de proteínas puesto que es una forma de mostrar DNA, RNA, o estructuras primarias para
resaltar las zonas de similitud, que podrían indicar relaciones funcionales o evolutivas entre los genes o proteínas consultados.

En otros casos, se puede detectar si la estructura de la proteína está modificada, ya que de ser así puede generar pérdida de
funciones, tales como: distrofia muscular y diversas encelopatías, debido a que las proteínas que participan en esos procesos
fundamentales, pierden su conformación original o estructura nativa. Cabe mencionar que más del 50% de los tipos de cáncer
humano encontrados hasta la fecha, se deben primordialmente a mutaciones en una proteína llamada: supresor de tumor p53.

El Centro de Ingeniería Genética y Biotecnología de Cuba, es una institución de desarrollo de alto nivel en la investigación,
desarrollo, producción y comercialización de productos biológicos a partir de métodos de la biotecnología moderna, con alta
capacidad científico técnica, que al igual que otras instituciones, tiene dirigido su desempeño a las investigaciones para la
elaboración de nuevos productos destinados a la salud humana, las producciones agropecuarias y el medio ambiente.

7
Referencias Bibliográficas
Mas Benavente, José Manuel. Comparación computacional de estructuras de proteínas. Aplicación al estudio de un
inhibidor de carboxipeptidasa como agente antitumoral. Universidad Autónoma de Barcelona. 2001. [Disponible en:
http://www.tesisenxarxa.net/TESIS_UAB/AVAILABLE/TDX-1108101-161657/ ]

Florencio Pazos Cabaleiro. Predicción de Características Estructurales a Partir de Secuencia. [Disponible en:
http://www.cnb.uam.es/~pazos/cam97/]

GenomaSur. GenomaSur. [Disponible en: http://www.genomasur.com/lectu.htm]

Gavilanes, José G. bbmi, Universidad Complutense. ¿Qué es una proteína? 2002. [Disponoble en:
http://www.bbm1.ucm.es/divul/proteina.html#Amino%E1cido]

Mañas, Juan Manuel González. Universidad del Pais Vasco. ESTRUCTURA DE LAS PROTEÍNAS. [Disponible
en: http://www.ehu.es/biomoleculas/PROT/PROT4.htm]

Dr. Jorge S. Raisman y Dra. Ana Maria Gonzalez. Proteínas: de la estructura primaria a la cuaternaria. 2005.
[Disponible en: http://fai.unne.edu.ar/biologia/macromoleculas/structup.htm]

Amit P. Singh y Douglas L. Brutlag. Hierarchical Protein Structure Superposition using both Secondary Structure
and Atomic Representations. [Disponible en:
http://64.233.179.104/scholar?hl=es&lr=&q=cache:sOWWg9B4iUQJ:www.cise.ufl.edu/class/cap5510fa04/reading/00
086.pdf+SSAP+(Sequential+Structure+Alignment+Program) ]

Ilya N. Shindyalov y Philip E. Bourne. 1998 [Disponible en:


http://72.14.205.104/search?q=cache:KNaz8LnZztMJ:cl.sdsc.edu/ce/ce.pdf+%22Protein+structure+alignment+by+incr
emental+combinatorial+extension+(CE)+of+the+optimal+path%22&hl=es&ct=clnk&cd=1&gl=cu ]

También podría gustarte