Está en la página 1de 14

Estructuras Biomoleculares.

Licenciatura en Bioinformática.

Trabajo Práctico N°1


Introducción a la visualización de
biomoléculas.
En bioinformática hay desarrollados numerosos programas para poder visualizar
estructuras de biomoléculas.
Principalmente estos programas están diseñados para trabajar con estructuras proteicas,
aunque también pueden usarse para trabajar con moléculas de ARN y estructuras
químicas más simples.
La oferta es variada y las diferencias son en calidad de la visualización, en dificultad
para aprender a usar las herramientas que cada programa ofrece como así también las
posibilidades que ofrecen para la manipulación de las estructuras.

Los siguientes programas son los mas conocidos en cuanto a visualización de


estructuras.

 Rasmol (http://rasmol.org/): Básico. Interfaz y posibilidades de manipulación


limitadas.

 Pymol (http://www.pymol.org/): Dificultad media pero posee muchas


funcionalidades interesantes, la estética es mejor con respecto a Rasmol y
permite uso de sentencias al estilo python para generar scripts que podemos
guardar para automatizar los trabajos.

 Cimera (http://www.cgl.ucsf.edu/chimera/): Es el de mayor complejidad y posee


muchas mas funciones que los dos anteriores
(http://www.cgl.ucsf.edu/chimera/).

 Jmol (http://jmol.sourceforge.net/index.es.html): La calidad no es muy buena,


pero es un applet de java, desarollado para ser embebido en servidores web.

 VMD (http://www.ks.uiuc.edu/Research/vmd/): Programa con nivel de


dificultad medio. Soporta el lenguaje de programación llamado TCL para hacer
scripting. Tiene varias herramientas para el análisis de dinámicas moleculares.

Este practico se llevará a cabo usando Pymol ya que es un muy buen programa y aunque
tiene una dificultad media de uso, vale la pena aprender a usarlo porque se consiguen
resultados muy buenos y con una calidad en las imágenes suficiente para formar parte
de publicaciones. Además, la capacidad de generar scripts personalizados, permite usar
esta herramienta en pipelines para generación de imágenes y películas a gran escala.

Introducción:
PyMol es un visor de moléculas de código abierto y auspiciado por usuarios. Fue creado
por Warren Lyford Delano y es comercializado por Delano Scientific LLC, una
compañía dedicada a la creación de herramientas accesibles universalmente para las
comunidades científicas y educacionales.

PyMol es indicado para producir imágenes 3D de alta calidad tanto de moléculas


pequeñas como de macromoléculas, como las proteínas. Es útil también para generar
animaciones de las moléculas.

El nombre PyMol se debe a que esta programado en lenguaje Python y por ello se puede
extender usando bibliotecas disponibles para Python como NumPy y Pylab.

2
Comenzar a usar PyMol:
Principalmente se trabajará con archivos en formato PDB, que es el tipo de fichero que
uno puede descargar de la base de datos PDB (Protein Data Bank) que consisten en un
conjunto de coordenadas tridimensionales (X, Y y Z) que le indican a los programas la
posición en el espacio de cada átomo. Puede verse la constitución de un archivo PDB
abriendo el fichero con el bloc de notas.

El archivo .pdb no solo contiene la información correspondiente a las coordenadas


atómicas de los diferentes elementos constituyentes de la macromolécula en cuestión,
sino que además contiene una gran cantidad de otra información denominada: meta
información. Las especificaciones para interpretar (y para generar) un archivo de tipo
pdb, pueden encontrarse en la página:
http://www.wwpdb.org/documentation/format33/v3.3.html.

Para comenzar a utilizar PyMol primero dirigirse al a pagina del PDB


http://www.rcsb.org/pdb/home/home.do.

Una vez allí en la parte que se muestra en la imagen:

Ingresar
1NZ0 que es el código correspondiente a la proteína RNAsa P de Thermotoga Marítima.

Analizaremos esta proteína ya que consiste de 4 cadenas polipeptídicas de relativamente


corta longitud lo cual es útil a los fines didácticos de esta actividad.

Una vez encontrada la molecula hacer click en download files como se muestra a
continuación:

Al hacer click se desplegara un menú y allí se debe seleccionar PDB file (text).
Para comenzar a trabajar, lo primero es iniciar el programa. Una vez iniciado se vera la
siguiente interfaz:

3
Como podemos observar tenemos dos componentes el primero en la parte superior es la
ventana de comandos, en la cual podemos escribir sentencias para que el programa las
ejecute. En la parte de abajo tenemos el visualizador donde veremos la molécula y los
cambios que hagamos sobre ella. En la parte derecha, el visualizador posee una especie
de menú en el cual podemos hacer cosas similares a las que podemos hacer mediante los
comandos aunque con algunas limitaciones.

Para comenzar debemos abrir el archivo .pdb que descargamos del Protein Data Bank.
Para ello debemos ir a File luego a Open.. y desde allí buscamos el archivo que
bajamos.

Una vez abierto veremos lo siguiente:

4
Esa es una representación en la cual observamos los atomos de la molecula con sus
cargas, pero esta no es una visualización muy útil, a la hora de identificar estructuras
secundarias, topologías de plegamientos, etc.

Formas de visualización:
PyMol permite visualizar las moléculas de 4 formas distintas

 Lines: Muestra los aminoácidos de la forma en que los enlaces entre los atomos
son líneas.
 Sticks: Muy similar a Lines
 Ribbon: Muestra el backbone de la proteína sin mostrar las cadenas laterales de
los aminoácidos.
 Cartoon: Muestra las estructuras secundarias de las proteinas (Hoja plegada beta,
hélices alfa y giros)

De todas las representaciones una de las más útiles es Cartoon ya que nos permite ver
las estructuras secundarias, lo cual nos da mucha información acerca de la arquitectura
de la proteína y por comparación con distintos motivos de plegamiento podemos inferir
rápidamente alguna función o identificar algún dominio en particular.

Desde línea de comandos para visualizar hacemos lo siguiente.

1) Escondemos todo, para ello escribimos. Hide all.


2) Mostramos todo en la forma de visualización deseada: show tipo_visualización,
conjunto de átomos
La anterior es una forma genérica de realizar una acción de cambio en la
visualización. Para este ejemplo debería ser show cartoon, all. En lugar de
cartoon podría ir lines, sticks o ribbon. Y en lugar de all puede ir cualquier

5
conjunto de átomos que queramos. Veremos más adelante como definir un
conjunto.

Manipulación de estructuras secundarias:

Para manipular las estructuras secundarias Pymol implementa una nomenclatura


específica.

Siempre que se hace referencia a una estructura secundaria se usa el comando ss


(secondary structure).

Para hacer referencia a cada tipo se usa el comando ss como sigue:

 ss ‘’: para las regiones de conexión entre hélices alfa y hojas plegadas beta.
 ss s: para las hojas plegadas beta
 ss h: para las hélices alfa
Conocido esto podemos entonces realizar otras acciones como darle un color especifico
a cada tipo de estructura secundaria o seleccionar solo las estructuras de un tipo en
particular. Estas acciones se explican más adelante.

Visor de secuencia:
Si usted desea ver la secuencia de nucleótidos o aminoácidos presente en su molécula,
puede activar la opción Sequence en el menú Display.

6
Allí podemos ver en nuestro caso, la secuencia nucleotídica de nuestra proteína.
Haciendo click sobre alguna de las letras observamos que se selecciona
automáticamente en la molécula el aminoácido marcado. Veremos más adelante otras
formas de selección.

Dar color a la estructura:


Para dar color a una estructura tenemos el comando color que se usa de la siguiente
manera: color color_deseado, grupo.

Ejemplo: color yellow, ss ‘’: colorea de color amarillo las regiones de conexión.
Color blue, ss s: colorea de colo azul las hojas plegadas beta.
Color orange, ss h: colorea de color naranja las hélices alfa.

Luego de ejecutar esos 3 comandos en la consola nuestra molécula nos quedara de la


siguiente forma:

Ahora que hemos sido capaces de colorear diferencialmente las estructuras secundarias
de la molécula vamos a ver como se seleccionan en Pymol los átomos o estructuras que
sean de interés.

Selección y determinación de conjuntos:


Anteriormente vimos que si seleccionábamos un aminoácido en la región del visor de
secuencia este se seleccionaba en la molécula. Esa es una forma muy practica de
seleccionar un aminoácido o un nucleótido, pudiéndose seleccionar varios nucleótidos
no contiguos presionando la tecla Ctrl y haciendo click en todos los nucleótidos /
aminoácidos que queramos seleccionar.

Pero es posible también hacer los siguientes tipos de selecciones:

 Seleccionar un tipo de estructura en particular

7
 Seleccionar todos los aminoácidos de un tipo en particular.
 Seleccionar un aminoácido especifico

Para todas estas selecciones usaremos el comando select.

Seleccionar un tipo de estructura en particular:


Para seleccionar un tipo de estructura en particular usamos el comando select de la
siguiente manera:

Select ss s: seleccionará todas las hojas plegadas beta


Select ss h: seleccionará todas las hélices alfa
Select ss ‘’: seleccionará todas las regiones de conexión.

Nota: Si observamos en la parte derecha del visualizador veremos que aparece un nuevo
elemento llamado (sele). Este elemento corresponde a nuestra selección.

Muchas veces tendremos que hacer varias


selecciones en nuestra molécula (sitios activos,
estructuras secundarias, aminoácidos modificados
y otras aéreas de interés) y en esos casos nos
conviene seleccionarlas una vez y ya tenerlas
disponibles para cuando tengamos que
manipularlas, sin tener que seleccionarlas
nuevamente.
Para ello podemos definir un conjunto. La forma
de hacerlo es hacer la selección y luego
renombrarla. Si observamos al lado del nombre
(sele) hay un conjunto de opciones (A S H L C).
Presionamos en A y seleccionamos la opción
Rename lo cual nos permitirá darle un nombre a la
selección, por ejemplo hélices si hemos ejecutado
el comando select ss h. La próxima vez podremos
ejecutar select hélices y quedaran seleccionadas
todas las hélices alfa. Este ejemplo no es muy útil
pero sirve a modo de ejemplificación. Hay casos en
que un sitio activo por ejemplo está compuesto por
muchos aminoácidos distantes entre sí y es muy útil generar un conjunto llamado
SitioActivo por ejemplo para poder seleccionarlo y modificarlo cada vez que
necesitemos y no tener que hacer las múltiples selecciones cada vez.

Seleccionar una cadena en particular de la molécula:


Como comentamos anteriormente nuestra molécula es una molécula dimerica
conformada por 4 cadenas polipeptidicas. La cadena A dimeriza con la cadena C y la
cadena B dimeriza con la cadena D.

Si observamos en la secuencia aminoacídica de la proteína, encima de la secuencia están


los números que indican la posición del residuo. En el extremo izquierdo podemos
observar los siguiente: /1NZ0__1//A. La letra A significa que en ese lugar comienza la
cadena A de la molécula y si nos corremos hacia la derecha en la secuencia llegaremos a
/B/ que indica el comienzo de la cadena B y así sucesivamente.

8
Para seleccionar una cadena, lo hacemos de la siguiente manera:

Select nombre, Chain X

En el caso de querer seleccionar la cadena A y que le pongamos como nombre cadenaA


deberíamos hacer lo siguiente:

Select cadenaA, Chain A

O podríamos hacer Select Chain A en el caso de que no queramos guardar el conjunto.

Seleccionar todos los aminoácidos de un tipo en particular.


Puede suceder que necesitemos seleccionar todos los aminoácidos de un tipo en
particular. Por ejemplo podemos querer ver donde se encuentran los residuos de cisteína
que estarían formando puentes disulfuro para darle estabilidad a nuestra molécula. En
nuestro caso la molécula no posee residuos de cisteína pero a los fines prácticos
seleccionaremos los residuos de arginina usando el comando:

select argininas, resn ARG

Esto genera un conjunto llamado argininas que contiene todos los residuos de arginina.

Podemos también seleccionar varios tipos de aminoácido usando:


select grupo, resn(ARG, PHE) por ejemplo que seleccionaría los residuos de arginina y
phenilalanina.

Observemos que luego de ejecutar esos comandos aparecen en la parte derecha del
visualizador los conjuntos argininas y grupo.

Seleccionar aminoácidos en posiciones específicas:


Podemos seleccionar aminoácidos en posiciones especificas usando el comando select
resi.

Por ejemplo en el caso de nuestra molécula se sabe que las subcadenas involucran
aminoácidos específicos para producir la dimerización
En el caso de las cadenas B y D, la cadena B pone en juego los aminoácidos Leu17,
Leu18 y Phe 21.

Podemos seleccionarlos de la siguiente manera:

select interface, resi 17+18+21

En este caso hemos generado un conjunto llamado interface que contiene los átomos
descriptos anteriormente.
En una próxima ocasión solo necesitamos ejecutar select interface para seleccionar el
conjunto.

Podemos también seleccionar un rango de aminoácidos de la siguiente manera:

9
select rango, (resi 14-20)

Y podemos hacer conbinaciones como la que sigue:

select grupo2, (resi 14-20,38, 45)

Seleccionar grupos diferentes a aminoácidos presentes en las moléculas:

Cuando tenemos una estructura proteica, casi la totalidad de los elementos en ella son
aminoácidos, pero hay veces en las que en la molécula se cristalizan ciertos grupos
químicos que no son aminoácidos y que cumplen ciertas funciones en la estructura de la
molécula, como en el caso de la Cadherina en la que hay grupos calcio que ayudan a
mantener cerca los aminoácidos que conforman el sitio activo. En nuestro caso en la
molécula hay 16 iones sulfato (SO4) cuya función es contribuir a la estabilidad proteica.

Para seleccionar los iones sulfato lo que debemos hacer el lo siguiente:

Select sulfatos, resn SO4.

A continuación podríamos elegir mostrar los sulfatos como esferas y pintarlos de algún
color en especial para poder lograr una mejor visualización.

Para ello vamos a ejecutar las siguientes instrucciones:

Hide all
Show cartoon, all
Color grey, all
Select sulfatos, resn SO4
Show spheres, sulfatos
Color sulfatos, orange

Una vez ejecutadas las instrucciones deberíamos ver una imagen como la siguiente:

10
En todos los casos en que existan grupos químicos incluidos en la estructura, solo
debemos ver con que nomenclatura se los referencia. Para ellos los buscamos en la
región Sequence del menú Display y hacemos un Select similar al que hicimos para los
sulfatos.

Superficie Proteica:

Una proteína si bien es una cadena de aminoácidos los cuales se ordenan formando
estructuras secundarias como las que hemos visto, ocupan un lugar en el espacio.

Este volumen que ocupa la proteína es importante ya que, analizando la superficie


proteica podemos identificar, por ejemplo, cavidades en la proteína o bolsillos donde se
alojaran los sustratos o por donde pueden ingresar los mismos.

Para poder ver la superficie hacemos lo siguiente:

Hide all

Show surface, chain A

Luego hacemos click derecho sobre el fondo y seleccionamos Zoom (vis) para centrar.

Veremos lo siguiente:

Podemos así mismo hacer combinaciones interesantes como la que sigue:

Menu Setting-> Transparency-> Surface -> 60%

Y luego ejecutamos
Show Cartoon, chain A
Color White, chain A

Observaremos lo siguiente:

11
En esta imagen podemos observar la estructura secundaria de la molécula y a la vez la
superficie.

Cambiar el color del fondo (Background):


Puede ser que para insertar nuestras imágenes en un trabajo, necesitemos modificar el
color de fondo a blanco.

Para ello debemos ejecutar el siguiente comando:

bg_color White o en lugar de White podemos elegir otro color de nuestra preferencia.

Mejorar la calidad para trabajos y publicaciones:

Para dar una acabado de mayor calidad a nuestra imagen ejecutamos el comando RAY que
procesa la imagen para darle mejores efectos de sobras, textura, etc.

12
Scripts:
Como hemos comentado, pymol ofrece la utilización de python como lenguaje de
programación y consiguientemente, la generación de scripts para realizar tareas
específicas. Hay una gran comunidad de usuarios de pymol quienes en muchos casos,
generan scripts que luego son puestos a disposición de la comunidad:

Conclusiones:
Los programas de visualización en un principio nos parecen un simple programa para
ver imágenes.

Pero como sabemos, cuando se dilucida la estructura de una proteína, esta no viene con
etiquetas que digan: En la posición x la proteína presenta un puente salino o los residuos
x,y y z forman el sitio activo. En la práctica cuando se trata de estudiar una estructura,
lo único que tenemos son puntos en el espacio que están codificados en los archivos
PDB. Con estos archivos tenemos que comenzar a jugar, visualizándolos de distintas
maneras.
Este juego consiste en analizar críticamente la estructura, ver si hay plegados
característicos presentes, analizar donde están los aminoácidos que generan
estabilizaciones en la estructura, ver donde se ubican las zonas hidrofílicas e
hidrofóbicas, observar como interaccionan entre si las distintas subunidades proteicas,
etc. Todo esto, nos puede llevar a un mejor entendimiento de la función de la proteína y
provee las bases para todo el diseño de fármacos basado en estructuras.

Bibliografía.
Methods in Modern Biophysics - Bengt Nölting – Springer – 2005.
Computacional Biochemistry and Biophysics – Oren Becker - 2001
Theoretical Biophysics - Dieter W. Heermann - Universitat Heidelberg – 2006
Termodinámica e Introducción a la Mecánica Estadística - Julio Gratton –Eudeba- 2003
Applied Biophysics – Tom Waigh – J. Wiley & Sons – 2007.
Biophysics - Vasantha Pattabhi & N. Gautham – Kluwer Pub. – 2002.
Introduction To Molecular Biophysics – J. Tuszynski & M. Kurzynski – CRC Press –
2003.
Biophysics, an introduction - R. Cotterill – J. Wiley & Sons - 2003
Modelling Molecular Structures – A. Hinchliffe - J. Wiley & Sons – 2003
What Is Life? - Erwin Schrodinger – Dublin Institute – 1943.

13
Thermodynamics - From Heat Engines to Dissipative Structures – I. Prigogine – 1998.

14

También podría gustarte