Briceño, S. Villegas, C.

Universidad de Chile
Facultad de Ciencias
Laboratorio de Bioquímica y Biología Molecular
BA4212-1
TRABAJO PRÁCTICO N° 2:
PDB, INTERACCIÓN PROTEÍNA-LIGANDO Y
COMPARACIÓN DE ESTRUCTURAS DE
PROTEÍNAS
Integrantes: Soledad Briceño

Catalina Villegas
Carrera: Biología ambiental
INTRODUCCIÓN
El reconocimiento de la estructura tridimensional de las proteínas es clave para

comprender la función de cada una de estas. En la actualidad, existen centros de datos que
proveen esta información, facilitando así el aprendizaje y la investigación; entre ellos, se encuentra
RCSB PDB, un centro de datos de EE.UU. abierto el público a través de un portal de internet sin
limitaciones de uso y sin cargos, que permite visualizar la estructura 3D de las proteínas y entrega
la información obtenida a partir de esta (Kouranov et al., 2006).
La función de muchas proteínas está mediada por su unión a un ligando, que puede ser
diversos tipos de moléculas. Esta interacción es momentánea, lo que permite la adaptación a las
condiciones; y específica, es decir, la proteína es capaz de reconocer al ligando y unirse a este
por medio del sitio de fijación, una zona de la proteína con propiedades complementarias a las del
ligando. Las proteínas que sufran mutaciones en sus secuencias pueden verse afectadas en su
funcionalidad, dependiendo del residuo que haya sido cambiado. Existen residuos de suma
importancia, ya que su presencia en una posición específica es significativa para la interacción
con el ligando, o bien, para la estructura tridimensional de la proteína. En particular, reemplazar un
aminoácido que interacciona directamente con el ligando a través de propiedades específicas y
propias de este, puede generar alteraciones en la unión proteína-ligando, causando una pérdida
sustancial para la función. Para profundizar en la relación proteína-ligando, durante este trabajo
práctico se analizó las proteínas t-rex y proteína de unión a L-leucina.
Otras familias de proteínas que se estudiarán en el práctico son las hemoglobinas,

provenientes de distintas especies y con variados grados de homología. Son estructuras
homólogas solo aquellas que comparten un ancestro común, y en este caso, como poseen misma
función, las estructuras debieran estar medianamente conservadas, para saber esto el programa
VMD nos permite compararlas no solo superponiendo su estructura (RMSD) sino que también
comparando su secuencia. La última proteína de importancia en el práctico es la
UDP-N-acetilglucosamina 2-epimerasa, como método alternativo para análisis de su estructura,
podemos usar la base de datos que nos da AlphaFold. Este es un sistema de inteligencia artificial
que aprende y es capaz de predecir estructuras de proteínas con una gran exactitud, incluso, es
capaz de predecir, aunque no con tanta exactitud, estructuras que con métodos experimentales no
se pueden obtener.
Por lo tanto, este práctico tiene como objetivo general, comprender la interacción
proteína-ligando y encontrar los puntos críticos (residuos específicos) de la proteína que hacen
posible esta interacción, en específico, comprender esta relación a partir de observaciones de las
interacciones electrostáticas que posibilitan la unión proteína ligando entre T-rex (código 3IKT) y
NAD. También corroborar la conservación evolutiva de estos puntos críticos, para ello se busca
comparar formas y secuencias de moléculas de hemoglobinas de diferentes especies. Siguiendo
con el objetivo de comprender la interacción proteína-ligando, se busca entender cómo varía la
proteína según su unión al ligando, para ello se compara distribuciones espaciales de la misma
proteína de unión a L-Leucina, pero una con el ligando y otra sin el ligando. Finalmente se tiene
como objetivo profundizar en el concepto de predicción de estructuras a partir de un algoritmo de
inteligencia artificial.
2
RESULTADOS Y DISCUSIÓN
I. Visualización interacción proteína-ligando con herramientas de RCSB PDB
Mediante el visualizador RCSB PDB es posible observar la estructura tridimensional de la

proteína con código 3IKT en PDB, como también la estructura del ligando unido a esta, que
corresponde a una molécula de NAD. De esta forma, se puede determinar los residuos de
aminoácidos unidos a la molécula por puentes de hidrógeno que permiten la relación
proteína-ligando, estos son enlistados en la Tabla I.
Tabla I. Datos de residuos de aminoácido unidos a NAD mediante puentes de hidrógeno.
Debido a que la cadena principal de todos los residuos tienen los mismos componentes, si
uno de los residuos unidos a través de la cadena principal fuese sustituido, este cambio no tendría
grandes consecuencias para la interacción con el ligando, a excepción de los casos en los que
dicha sustitución pudiese causar una alteración en el plegamiento de la proteína. Como se puede
observar en la Tabla I., de los siete residuos unidos a NAD, cuatro se unen a través de la cadena
principal y tres generan puentes de hidrógeno por medio del grupo R; por lo cual, sólo mutaciones
en estos últimos podrían afectar la unión con el ligando.
Algunas mutaciones que afectarían la unión con el ligando se podrían generar al sustituir el
residuo de ácido aspártico ASP 113, por un residuo cargado positivamente como puede ser
arginina, lisina o histidina, pues el ácido aspártico está cargado negativamente, reemplazarlo por
un AA con carga positiva hará que este segmento y el ligando se repelen. Lo mismo ocurrirá si se
intercambia el residuo de lisina LYS 118, por un residuo cargado negativamente, como ácido
aspártico o ácido glutámico.
II. Cambio conformacional inducido por unión de ligando
Usando Pymol se observan dos proteínas con igual secuencia y estructura, pero con
distribuciones espaciales distintas (Figura 1.a), denotadas con códigos 1-USK y 1-USG. Se logra
observar que la proteína en color azul cian (que corresponde a 1-USK) está más agrupada que la
proteína de color verde (1-USG). Utilizando una herramienta de alineamiento se puede
superponer una proteína sobre otra eligiendo aproximadamente la mitad de residuos conocidos,
de tal modo que disminuimos el RMSD de cada par de átomos correspondientes, las partes de las
proteínas no superpuestas (lado izquierdo de la Figura 1.b) muestran la diferencia de distribución
de forma más gráfica. Si se sigue la idea de que el ligando y la proteína tienen interacciones
3
electrostáticas, se puede pensar que la proteína con ligando será aquella que se cierre alrededor
de este, por ello, la proteína de color cian sería aquella que posee interacciones con el ligando; de
hecho, en la Figura 1.a se alcanza a observar el ligando en el centro de esta proteína.
(a) (b)
Figura 1: Estructura tridimensional de dos proteínas de unión a Leucina con diferentes distribuciones espaciales debido
a la interacción de una de ellas con Leucina. (a) Estructuras separadas de dos proteínas de unión a Leucina. (b)
Proteínas de unión a Leucina con alineamiento estructural de aproximadamente 115 aminoácidos.
Sumado a lo anterior, Pymol posee una herramienta que nos permite observar el ligando
incluyendo sus interacciones más importantes con los residuos de la proteína. Como es posible
observar, el ligando es una Leucina y posee puentes de hidrógeno desde su cadena principal
(grupo amida) hacía, principalmente los grupos R con hidrógenos dadores de la proteína (estos no
se observan, pero al estar unidos a un átomo muy electronegativo, quedan con cargas parciales
positivas). También se observan interacciones con los esqueletos de la proteína y algunas
moléculas de agua como intermediario.
(a) (b)
Figura 2: Estructura tridimensional de la zona de unión a ligando en las proteínas de unión a Leucina y la respectiva
interacción con el ligando (Leucina). (a) Ilustración de los puentes de hidrógeno entre la proteína y el ligando. (b)
Ligando en sitio de unión
III. Comparación de estructuras de proteínas homólogas
El concepto de homología se refiere a grupos de proteínas que poseen secuencias

similares porque presentan un origen evolutivo en común, es decir, si y sólo si presentan un
ancestro en común se puede clasificar como homólogas, y a partir de su porcentaje de identidad
entre las secuencias se puede determinar su cercanía. Las proteínas homólogas pueden ser de
dos tipos: ortólogos y parálogos. Las proteínas ortólogas son aquellas que poseen la misma
identidad de secuencia en distintas especies, y son parálogas aquellas que provienen del mismo
gen, en la misma especie pero que poseen funciones distintas.
4
Para comparar estructuras homólogas se usaron moléculas con misma funcionalidad pero
que fueron tomadas de distintas especies, es decir, que corresponden a proteínas ortólogas y la
similitud entre estas podría dar una pista de su relación filogenética. En este práctico se utilizaron
hemoglobinas, proteínas transportadoras de oxígeno, observadas a través del programa VMD,
que permite realizar un análisis de homología, para ello el programa hace el análisis según
similitud de la estructura proteína y según porcentaje de identidad de los residuos, en este último
punto hay que hacer la distinción de residuos idénticos y residuos similares. Los residuos similares
son aquellos que poseen propiedades similares como la carga, la polaridad, el tamaño, etc.,
también se llaman residuos similares a los que se observa con frecuencia un reemplazo de uno
por el otro. Por su parte, los residuos idénticos son, como lo dice la palabra, los mismos.
En la Figura 3 se observa la superposición de las tres proteínas y la comparación de los
residuos, aquellos estrictamente conservados se muestran en color azul (residuos identicos) y
cambios drásticos son representados de color rojo, los colores intermedios representan que tan
similares son, si se torna más hacia la el rojo, son residuos poco similares, y si se torna hacia el
azul, son residuos muy similares.
Figura 3: Superposición de la estructura tridimensional de tres hemoglobinas diferentes. Los segmentos con color azul
corresponden a residuos idénticos, el color rojo representa cambios drásticos en la secuencia de aminoácidos y los
azules más claros muestran segmentos poco conservados. La estructura de color amarillo corresponde al grupo HEM
de las tres hemoglobinas.
Cómo se logra visualizar en la Figura 3, la mayor parte de los residuos están conservados
en las tres moléculas de hemoglobina, aunque predominan los segmentos de baja conservación
por sobre aquellos altamente conservados. Por otra parte, la estructura asociada al código “1gdi”
contiene la mayor cantidad de residuos diferentes en comparación a las otras dos estructuras
(Figura 4).
Figura 4: Secuencia de residuos de aminoácidos de las tres estructuras de hemoglobinas con el código de una letra. En
el lado izquierdo se muestran los códigos de cada estructura, de arriba hacia abajo, se encuentran en el orden “1gdi” -
“1hbg” - “1jf4”. La fila a la derecha de cada uno de los códigos representa la secuencia de aminoácidos correspondiente
para cada estructura.
5
Algunos de los residuos más conservados guardan estrecha relación con el grupo HEM.
En la Figura 5 se observa un residuo de tirosina altamente conservado cercano al grupo HEM,
esta cercanía puede deberse a interacciones electrostáticas, pues el grupo HEM es el
responsable de la unión del oxígeno, por lo cuál debe presentar propiedades específicas para esta
unión, entre estas, puede presentar cargas complementarias a las del oxígeno para mediar esta
interacción. A su vez, la tirosina presenta en el extremo de su grupo R un átomo de oxígeno con
carga parcial que puede interaccionar con el grupo HEM. De este resultado se infiere que los
residuos directamente relacionados con la funcionalidad de la proteína son aquellos que no varían
en los procesos evolutivos, y aquellos que presentan más importancia estructural pueden ser
cambiado por residuos de mismas características fisicoquímicas
Figura 5: Estructura tridimensional de las tres hemoglobinas superpuestas. En amarillo se representa: a la izquierda el
grupo HEM y a la derecha residuos de tirosina altamente conservados.
Por otra parte, al utilizar las herramientas de Multiseq en VMD se pueden obtener los
valores de QH, RMSD y porcentaje de identidad, asociados al alineamiento y similitud de dos
estructuras y sus respectivas secuencias. El valor de QH corresponde a una métrica para la
homología estructural, puede variar entre 0 y 1, siendo 1 el valor máximo, lo cuál significa que las
estructuras son idénticas (O’Donoghue & Luthey-Schulten, 2005). Además RMSD (distancia entre
los átomos de proteínas superpuestas) nos indica que tan bien alineadas están las estructuras y
el porcentaje de identidad indican que tantos residuos idénticos poseen las estructuras
comparadas con respecto al total. En la Tabla II., se muestran los valores obtenidos para cada par
de estructuras. Los datos obtenidos concuerdan con lo mencionado anteriormente, la estructura
de código “1gdi” es la que más difiere de las demás estructuras, ya que al analizar con cada una
de las otras dos, se obtuvo un valor de QH de aproximadamente 0.6, lo cual, si bien no está entre
los valores mínimos para ser considerada una homología baja, es considerablemente menor al
valor de QH obtenido para el par “1hbg + 1jf4”, el cuál indica que las estructuras son
prácticamente idénticas. En cuanto a RMSD y porcentaje de identidad, se obtuvo una distancia
mayor entre los átomos “1gdi” con los átomos de “1hbg” y “1jf4” (2,8 aprox.) y un porcentaje de
identidad de 16,4% para los dos pares que involucran a “1gdi”. Al contrario de los pares “1gdi +
1hbg” y “1gdi + 1jf4”, el par “1hbg + 1jf4” arrojó un valor de QH muy cercano a 1, RMSD bastante
pequeño y un porcentaje de identidad de 92,5%, valores indicativos de una alta homología y buen
alineamiento.
6
Tabla II. Valores obtenidos de QH, RMSD y porcentaje de identidad al seleccionar cada uno de los 3 pares de
estructuras con la herramienta Multiseq en VMD.
De este análisis se puede inferir que, ya sea por QH, comparación estructural (RMSD) o
por porcentaje de identidad, existe una relación filogenética entre las hemoglobinas “1jf4” y “1hbg”
mucha más cercana comparada con “1gdi” lo que se ilustra en el árbol filogenético de la Figura 6.
Figura 6: Árbol filogenético creado a partir del porcentaje de identidad
IV. Predicción de estructuras 3D de proteínas mediante inteligencia artificial: Alphafold
AlphaFold es un sistema de inteligencia artificial, desarrollado por Deepmind, una

compañía dedicada a la investigación y desarrollo de inteligencia artificial. AlphaFold predice la
estructura tridimensional de las proteínas a partir de la secuencia de aminoácidos, es decir, a
partir de su estructura primaria. En asociación a esta IA, se ha creado un banco de datos dónde
investigadores de todas partes del mundo pueden acceder para complementar sus conocimientos
acerca de las estructuras de proteínas y agilizar el proceso de investigación (Kiersten & Rohit,
2021).
En esta ocasión se analizó la proteína de código Q9Y223 en Uniprot, que corresponde a

UDP-N-acetilglucosamina 2-epimerasa/N-acetilmanosamina quinasa. En la Figura 7, se muestra
una representación de la estructura tridimensional de esta proteína según la predicción de
Alphafold, en esta se observan dos dominios unidos por un segmento de color naranjo. Como es
posible apreciar, los dominios son principalmente de color azul oscuro, lo que, según la puntuación
de confiabilidad de Alphafold, corresponde a una predicción de confiabilidad muy alta. En
contraposición, el segmento que une ambos dominios, está coloreado de naranjo, lo cual significa
que tiene un puntaje de confiabilidad muy bajo.
7
Figura 7: Estructura tridimensional de la UDP-N-acetilglucosamina 2-epimerasa/N-acetilmanosamina quinasa, según la
predicción de Alphafold. En el costado izquierdo se muestra una leyenda descriptiva del código de colores utilizado por
Alphafold para identificar los segmentos según su puntaje de confiabilidad.
La predicción de la estructura de los dominios está respaldada por la información extraída de

bases de datos acerca de las radiografías realizadas a la proteína, es por ello que poseen una alta
confiabilidad. Por otra parte, la baja confiabilidad de la predicción de la estructura del segmento de
enlace entre los dominios (“linker”) puede deberse al desorden de esta estructura, por lo cual,
resulta muy difícil de cristalizar y también, predecir su estructura (Kiersten & Rohit, 2021).
CONCLUSIONES
En conclusión, en este práctico se logró profundizar en conceptos como interacciones con

ligando, conservación de estructuras en el proceso evolutivo, predicción de estructuras mediante
IA.
● Si bien los residuos en el sitio de unión de la proteína son fundamentales para la
interacción proteína-ligando; aquellos que interactúan a través de su grupo R, que es
específico para cada aminoácido, son aún más trascendentales para la interacción, pues,
de ser sustituidos, debe ser por un residuo de características fisicoquímicas similares o se
corre el riesgo de provocar una pérdida de función.
● La unión a ligando es transitoria y causa cambios en la conformación tridimensional de la
proteína. Las proteínas adaptan su estructura en presencia del ligando para favorecer la
interacción con este.
● La función de las proteínas está estrechamente relacionada con la estructura de estas, por
lo que es la estructura la característica más conservada, no así, la secuencia de residuos
de aminoácidos. Es por esto que, al analizar homología en proteínas que cumplen la
misma función, se observaron estructuras similares pero con secuencias de aminoácidos
distintas.
● AlphaFold es una herramienta muy útil para la predicción de estructuras. Sin embargo, aún
es un desafío la predicción de estructuras que son intrínsecamente desordenadas. En
métodos experimentales podemos obtener solo ciertas partes de la proteína, perdiendo
8
información de segmentos de la proteína que podrían tener valor trascendental para la
estructura y función, en cambio, Alphafold da una idea de lo que podría ser esta zona y de
cómo podría ser.
BIBLIOGRAFÍA
Kiersten M. Ruff, & Rohit V. Pappu (2021). AlphaFold and Implications for Intrinsically Disordered
Proteins. Journal of Molecular Biology. https://doi.org/10.1016/j.jmb.2021.167208
Kouranov A., Lei Xie, Joanna de la Cruz, Li Chen, John Westbrook, Philip E. Bourne, Helen M.
Berman, El portal de información RCSB PDB para genómica estructural, Nucleic Acids
Research , Volumen 34, Número suppl 1, 1 de enero de 2006, Páginas D302–D305,
https://doi.org/10.1093/nar/gkj120
O’Donoghue, P., & Luthey-Schulten, Z. (2005). Evolutionary Profiles Derived from the QR Factorization
of Multiple Structural Alignments Gives an Economy of Information. Journal of Molecular
Biology, 346(3), 875–894. https://doi.org/10.1016/j.jmb.2004.11.053

Briceño, S. Villegas, C.

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Briceño, S. Villegas, C.

Cargado por

Copyright:

Formatos disponibles

Universidad de Chile

Integrantes: Soledad Briceño

El reconocimiento de la estructura tridimensional de las proteínas es clave para

Otras familias de proteínas que se estudiarán en el práctico son las hemoglobinas,

I. Visualización interacción proteína-ligando con herramientas de RCSB PDB

Mediante el visualizador RCSB PDB es posible observar la estructura tridimensional de la

Tabla I. Datos de residuos de aminoácido unidos a NAD mediante puentes de hidrógeno.

II. Cambio conformacional inducido por unión de ligando

III. Comparación de estructuras de proteínas homólogas

El concepto de homología se refiere a grupos de proteínas que poseen secuencias

Figura 6: Árbol filogenético creado a partir del porcentaje de identidad

IV. Predicción de estructuras 3D de proteínas mediante inteligencia artificial: Alphafold

AlphaFold es un sistema de inteligencia artificial, desarrollado por Deepmind, una

En esta ocasión se analizó la proteína de código Q9Y223 en Uniprot, que corresponde a

La predicción de la estructura de los dominios está respaldada por la información extraída de

En conclusión, en este práctico se logró profundizar en conceptos como interacciones con

También podría gustarte