Está en la página 1de 12

Protemica: hacia

el entendimiento
del lenguaje de las protenas
Victoria Pando Robles y Csar Ferreira Batista )%gifZ\jXd`\ekf

/
'+
- ''

', '.
'(
')
* '*
. '-
,
+
'&

La revolucin en biologa molecular de los aos Las protenas son molculas orgnicas
80, ejemplificada por la facilidad con la que ac- complejas, formadas por aminocidos ordena-
tualmente se realizan amplificaciones, clona- dos en largas hileras o cadenas polipeptdicas
ciones y secuenciacin automatizada de ADN, mantenidas por enlaces qumicos entre el gru-
ha permitido en corto tiempo conocer el geno- po amino (NH2) de un aminocido y el grupo
ma completo de distintos organismos, incluido carboxilo (COOH) del siguiente aminocido. A
[b[Yjhe\eh[i_i
el del ser humano (http://www.ncbi.nlm.nih. este tipo de enlace se denomina enlace pept-
YhecWje]hW\_W

97
gov/). dico. Se conoce que en la naturaleza existen 20
Actualmente disponemos de un listado to- aminocidos, las posibilidades de ordenamien-
tal de genes que definen el genoma de una es- to de estos aminocidos en las protenas es
pecie, conocemos la secuencia de nucletidos 2020 (1x1026), es decir que la maquinaria celular
de sus genes y, a partir de ellas, podemos infe- puede producir millones de pptidos diferen-
rir con cierta confiabilidad las protenas que se tes con slo 20 aminocidos, mientras que los
expresan a partir de ese genoma. Sin embargo,
(%j\gXiXZ`e
4 nucletidos que conforman el ADN se orde-
este conocimiento no nos permite entender nan en slo 256 posibilidades. Estos nmeros
la funcin biolgica del gen. Por ejemplo: por evidencian la complejidad y variabilidad estruc-
qu el mono y el hombre son tan diferentes, tural que pueden presentar las protenas.
si comparten el 99% de su genoma? o qu Las protenas se encuentran en todos los
YbkbWi
condiciones fisiolgicas cambian en una clu- organismos, son las molculas biolgicas ms
j[`_Zei
la en un cuadro de enfermedad? En resumen, abundantes; por ejemplo, en la bacteria E. coli
del anlisis de los proyectos genmicos se ha constituyen ms del 50% de su peso seco, mien-
\bk_ZeiY[bkbWh[i
aprendido que el nmero de genes contenido tras que otras molculas como el ADN y el ARN
en el genoma de un organismo no correlacio- constituyen el 3% y el 20% respectivamente. Al
na con la complejidad del mismo y se infiere igual que otras macromolculas, como los ci-
que la complejidad morfolgica y funcional de dos nucleicos y los polisacridos (azcares), las
eucariotes superiores como el ser humano de- protenas son esenciales para el funcionamien-
pende de la regulacin de la expresin genti- to celular y, por ende, para la vida. Debido a su
ca y de las interacciones entre sus protenas. heterogeneidad estructural, las protenas par-

Biotecnologia V14 CS3.indd 97 11/14/07 5:00:23 PM


98 | Protemica: hacia el entendimiento del lenguaje de las protenas

ticipan en diferentes procesos celulares; mu- zan en diferentes compartimentos celulares,


chas son enzimas que catalizan diferentes re- como citoplasma, ncleo, retculo endoplsmi-
acciones qumicas vitales para el metabolismo co y aparato de Golgi. Las modificaciones post-
celular, otras tienen un papel estructural, como traduccionales son utilizadas en la clula como
las protenas del citoesqueleto, que mantienen un mecanismo de control, ya que stas sealan
la estructura y forma celular. Las protenas son la localizacin de las protenas y pueden alterar
fundamentales en la comunicacin celular, va su funcin. En los procariotes, como las bacte-
transduccin de seales; en la respuesta in- rias, el ARN se sintetiza en el citoplasma y pue-
mune; en el mantenimiento de la homeostasis de ser inmediatamente traducido en protenas,
celular y en el ciclo celular, ya que controlan y mientras que en eucariotes, el ARN se sintetiza
realizan la replicacin de las molculas de ADN en el ncleo y se transloca a travs de la mem-
permitiendo as que la informacin se conser- brana nuclear en el citoplasma, lugar donde se
ve de una generacin a otra. Las protenas son realiza la sntesis de protenas. La velocidad de
tambin un componente necesario de la dieta, sntesis de protenas es ms rpida en bacte-
ya que los animales no pueden sintetizar todos rias que en animales superiores; stas pueden
sus aminocidos. Sin embargo, otros organis- ensamblar 20 aminocidos por segundo. El ta-
mos, como las plantas, pueden fabricar todos mao de las protenas puede ser medido por el
los aminocidos por medio de la fotosntesis. nmero de aminocidos que contienen o por
Las protenas son fabricadas en la clula a su masa total, la cual es normalmente repor-
partir de la informacin gentica codificada en tada en unidades de masa atmica dalton. Un
el ADN, de acuerdo con el dogma central de la dalton (da) equivale a 1/12 de la masa atmica
biologa molecular. Cada protena tiene su pro- del 12C (carbono doce). Por ejemplo: las prote-
pia y nica secuencia de aminocidos, que es nas de la levadura tienen en promedio 466 a-a
especificada por la secuencia de nucletidos de tamao y 53 Kda de masa. La protena de
del gen que la codifica. Los genes contenidos mayor peso molecular conocida hasta ahora es
en el ADN son primero transcritos en ARN por la titina, componente del sarcmero muscular,
una enzima denominada ARN polimerasa. La tiene una masa de 3000 Kda y est formada
informacin contenida en el ARN es interpre- por una cadena de 27 000 aminocidos.
tada por una molcula transportadora de ami-
nocidos, conocida como ARN de transferencia,
y los ribosomas son los encargados de formar Protemica
la cadena polipeptdica que constituye la pro- El trmino proteoma fue acuado en 1994 para
tena. Las protenas son sintetizadas del extre- definir a todas las protenas que son expresa-
mo amino al extremo carboxilo . El mensaje das por un genoma en un tejido o en una clula.
contenido en el ARN es ledo por la maquinaria El proteoma de un organismo es un elemento
de sntesis protenica mediante un cdigo ge- altamente dinmico, ya que sus componentes
ntico universal que se que se lee en tripletes varan dependiendo del tejido, clula o compar-
o codones. Existen 64 codones que codifican timiento celular que se estudie y estos, a su vez,
para los 20 aminocidos, por lo que algunos pueden cambiar debido a alteraciones en su
aminocidos son codificados por ms de un co- ambiente, como situaciones de estrs, accin
dn. Por ejemplo: los codones CCU, CUC, CUA, de frmacos, requerimientos energticos, o su
CUG, UUA y UUG codifican para el aminocido estado fisiolgico (normal o patolgico). El cre-
leucina. El cdigo gentico especifica la snte- cimiento en el nmero de proyectos de investi-
sis de 20 aminocidos, sin embargo, estos re- gacin orientados al estudio de los genomas de
siduos pueden ser alterados qumicamente forma sistemtica, ha dado lugar a la aparicin
en la protena, a este evento se conoce como de nuevas tecnologas a gran escala (tipo high
modificacin postraduccional; stas se reali- throughput) que, en el caso de las protenas,

Biotecnologia V14 CS3.indd 98 11/14/07 5:00:24 PM


Protemica: hacia el entendimiento del lenguaje de las protenas | 99

se denomina Protemica. Esta puede dividirse que el proteoma humano est definido por
en protemica de expresin, que tiene como ob- muchos proteomas que son caractersticos de
jetivo la descripcin del proteoma total de un tipos celulares especficos (como las clulas del
tejido, fluido, tipo celular u organelo y las me- hgado) o que representan un estado fisiolgi-
diciones cuantitativas de los niveles de expre- co particular, normal o patolgico (el proteoma
sin protenica, y protemica funcional, que se de una persona con cncer gstrico, es distinto
encarga del estudio de la funcin de protenas al proteoma de un paciente con anemia, o al de
dentro de sistemas biolgicos (relaciona cam- una persona sana).
bios de expresin con una funcin determina- Para que un nio empiece a leer, primero
da) y la regulacin de su expresin, incluyendo debe aprender las letras, luego entender que el
las interacciones protenas-protena, protenas- orden de esas letras forma palabras y que las
ADN, protenas-ARN y las modificaciones post- palabras expresan ideas. Del mismo modo, los
traduccionales. investigadores primero descubrieron los nu-
La diferencia principal entre genmica y cletidos, luego que el orden de esos nucle-
protemica, es que el genoma puede ser visto tidos forma un gen y que los genes codifican
como una coleccin de genes cuya naturaleza protenas. Sin embargo, en la prctica primero
es esttica; es decir, no cambia entre clula y se pudo secuenciar a las protenas. En 1950, el
clula, mientras que el proteoma es una enti- investigador sueco E. Edman desarroll un m-
dad cambiante, es una coleccin dinmica de todo que permite saber el orden de los amino-
protenas que difieren de un individuo a otro, cidos en una protena, a la que se conoce como
o de una clula a otra. Por ejemplo, se predice degradacin de Edman. Durante muchos aos
que el nmero de protenas expresadas en el esta tcnica fue de vital importancia en la inves-
ser humano va de 50 mil a 500 mil. Cmo pue- tigacin bioqumica. La secuenciacin parcial de
de ser eso si el nmero de genes presentes en fragmentos protenicos y el ensamblaje de estas
nuestro genoma es de 25 mil? En primer lugar, secuencia permiti conocer en forma completa
esto se debe a que los genes no necesariamente la secuencia de aminocidos de algunas prote-
expresan una sola protena, por procesamiento nas. En 1958 F. Sanger obtuvo el Premio Nbel
diferencial de los transcritos de ARNm (madu- de Qumica debido a la secuenciacin completa
racin y empalme alternativo) se pueden gene- de la insulina, protena involucrada en el meta-
ran diversas protenas. Segundo, las protenas bolismo de la glucosa. Las secuencias parciales
presentan alrededor de 300 diferentes tipos de obtenidas por Edman tambin permitieron co-
modificaciones postraduccionales, incluyendo nocer los extremos amino terminal de muchas
fosforilacin, glicosilacin, acetilacin, deami- protenas y a, partir de esta secuencia de ami-
nacin, miristolacin, entre otras (www.abrf. nocidos, construir oligos de ADN que, median-
org/index.cfm/dm.home). Estas modificacio- te la accin de la ADN polimerasa, permiten el
nes pueden afectar la estructura, localizacin, aislamiento del gene que codifica la protena.
funcin y recambio, e implican funciones regu- Sin embargo, este mtodo de secuenciacin no
ladas por factores internos y externos a las c- es compatible con los anlisis a gran escala que
lulas, desencadenando procesos de expresin dominan el campo de las ciencias genmicas.
gentica diferencial. Esta consiste en que, pese Principalmente porque el nmero de aminoci-
a que todas las clulas de un individuo contie- dos secuenciados es limitado, en general no se
nen en su interior la misma informacin gen- excede de 30-40 a-a secuenciados por muestra,
tica, se producen diferencias en la intensidad, es lento (un ciclo/hora), lo que significa que para
momento de la expresin, o en la informacin secuenciar 30 a-a el equipo se demora 30 horas;
expresada. Como resultado de estas variacio- imagnense entonces secuenciar una protena
nes se produce la diferenciacin celular y pue- de 1000 aminocidos, o secuenciar y conocer el
den originarse determinadas patologas. Es as proteoma de una clula!

Biotecnologia V14 CS3.indd 99 11/14/07 5:00:24 PM


100 | Protemica: hacia el entendimiento del lenguaje de las protenas

La posibilidad de identificar protenas en de diferentes molculas, permitiendo as la


forma global surge gracias a la modernizacin identificacin de nucletidos, carbohidratos,
de la espectrometra de masa (EM). En 1985, lpidos y polmeros sintticos.
J. Fenn y K. Tanaka desarrollaron los sistemas
de ionizacin de macromolculas ESI y MALDI
respectivamente, por lo que se les galardon Herramientas de la protemica
con el Premio Nbel de Qumica 2002. El m- Desafortunadamente, las mismas caracte-
todo de ionizacin por electropulverizacin, rsticas que otorgan a las protenas su papel
ESI (electrospray ionization), permite la ioni- fundamental como molculas efectoras de la
zacin de molculas a partir de flujos lqui- funcin celular (diversidad qumica y estructu-
dos bajo aplicacin de alto voltaje, mientras ral y abundancia relativa) tambin dificultan su
que la ionizacin por el mtodo MALDI, pro- anlisis experimental. Actualmente no existe
duce iones por bombardeo con rayos lser de un diagrama de flujo nico para el anlisis pro-
muestras en estado slido auxiliado por ma- temico de una muestra, ya que las variables
trices cristalizables. Estas metodologas solu- como complejidad, mtodo de separacin, con-
cionaron la dificultad de generar iones a partir centracin y estabilidad de las protenas, ade-
de analitos no voltiles, como las protenas y ms de la plataforma tecnolgica disponible
polmeros. Desde entonces, la EM desplaz a para su anlisis, y muy especialmente el tipo
la secuenciacin de protenas por Edman, de- de pregunta biolgica que se pretende abordar,
bido a su sensibilidad (pmol-fmol), exactitud son los parmetros bsicos que determinan la
(100-5 ppm) y rapidez (minutos-segundos); eleccin de una estrategia de estudio. Por lo
esta vara de acuerdo a la complejidad del tanto, no existe una metodologa idnea para
anlisis y al equipo que se utilice. La espec- el estudio de proteomas en forma sistemtica.
trometra de masas permite la identificacin En consecuencia, la investigacin protemica
de protenas, el conocimiento de su estructu- es el resultado de la aplicacin de un conjunto
ra primaria, es decir, la secuencia de los ami- de tcnicas que permiten el estudio de prote-
nocidos que la conforman, la identificacin nas. A continuacin, se describir en forma re-
de sus modificaciones post-traduccionales, y sumida una metodologa para el anlisis pro-
la cuantificacin de la expresin protenica temico de una muestra (figura 1).
(protemica cuantitativa). Por otro lado, los 1) Separacin de las protenas. Una mues-
resultados obtenidos de la identificacin de tra proveniente de un sistema biolgico es una
protenas de un genoma determinado han mezcla compleja de protenas. Por lo tanto, las
permitido corregir datos genmicos. Los ge- muestras provenientes de clulas, tejidos u
nes se predicen en un genoma mediante el otro tipo de muestras biolgicas (sangre, orina,
uso de tcnicas de bioinformtica basadas en leche, lquido cfalo-raqudeo, semen, saliva,
caractersticas comunes de miles de genes lgrimas, etc.) se separan principalmente por
analizados. Sin embargo, estas predicciones tcnicas cromatogrficas y/o electroforticas,
no siempre son ciertas, sobre todo en genes las cuales son tecnologas robustas, verstiles
pequeos o en genes que no tienen homlo- y con alta capacidad de resolucin. Las ms
gos en otros genomas; por ejemplo, la tasa utilizadas son: electroforesis unidimensional
de error en la anotacin de 340 genes del ge- (SDS-PAGE) y bidimensional (2-D PAGE), elec-
noma de Mycoplasma genitalum es del 8%, si troforesis capilar, cromatografa lquida de alta
extrapolamos ese error en el genoma huma- resolucin (HPLC), cromatografa de afinidad,
no, imagnense las consecuencias. Por otro cromatografa de exclusin molecular y croma-
lado, es importante resaltar que la espectro- tografa de intercambio inico. La electrofore-
metra de masas es una tcnica analtica con sis bidimensional, por ejemplo, permite la sepa-
mltiples usos; realiza la medicin de masas racin de hasta 2000 protenas en un solo gel,

Biotecnologia V14 CS3.indd 100 11/14/07 5:00:25 PM


Protemica: hacia el entendimiento del lenguaje de las protenas | 101

Z_][ij_d[dp_c|j_YW
ffj_Zei

)%gifZ\jXd`\ekf fhej[dWZ[_dj[hi
*%\jg\Zkifd\kiX[\dXjXj

B9#CI bWi[h
/
'+
- ''
BWi[h
', '.
'(
')
* '*
. '-
,
+
'&
i_ij[cWiZ[_ed_pWY_d

[b[YjheifhWo C7B:?

WdWb_pWZeh[i_d_Yei JE<"?J"B?J"G"<J#?9H"JE<#JE<"B?J#EhX_jhWf"G#JE<"
B?J#jh_fb[gkWZhefbe
[b[Yjhe\eh[i_i :0RJen$BWXRJY)(Boi9'.$&/\hW]
(k]%+&kB
&*%)&%(&&''&0)'0*&FC JY)(:_][ij_edBoi#9HJ'.$&/\hW]c[djW

YhecWje]hW\_W JY)(Boi9'.$&/\hW] )'#+, HJ0 '$&,#'$/) 7L0 (, DB0 *$..;*


J0 !Yi_Z3(+$&&<kbbci(''..$&&6)+$&&Q)(+$&&#(&&&$&&S
.*'$( ''-&$(
)*

[if[YjheZ[cWiWi
)(
)&
(. /-&$(

(,
WXkdZWdY_Wh[bWj_lW

-+*$(
(*
+()$'

Z[j[Yjeh ((
(&

'.

(%j\gXiXZ`e ',
'*
,)*$'
.(&$'
/+($(

'(
'&(*$'
'&
/)/$'
. *,,$& ,+'$( '&&,$'
+&+$' -..$'
,,,$& -&+$& /('$' '&*($' ''(,$(
, ,(&$'
)+'$' ++-$'
* *)&$' ''&'$(
).,$/ +.,$& .-)$'
(
&
*&& +&& ,&& -&& .&& /&& '&&& ''&&

YbkbWi c%p

j[`_Zei
\bk_ZeiY[bkbWh[i

+%Xe}c`j`j[\[Xkfj

Figura 1.
Metodologa simplificada del anlisis protenico.

Biotecnologia V14 CS3.indd 101 11/14/07 5:00:25 PM


102 | Protemica: hacia el entendimiento del lenguaje de las protenas

mientras que la electroforesis unidimensional no es casual. En su mayora, los cortes trpticos


solamente 100. Estas tcnicas de aislamiento generan pptidos con masas moleculares en-
pueden utilizarse separadamente, en conjunto tre 1 y 2 KDa; permiten la diferenciacin entre
o en sistemas de flujo continuo, como la cro- los amino cidos lisina y glutamina (128 Da), ya
matografa multidimensional, tambin cono- que todas las lisinas estarn posicionadas en el
cida como MudPit (multidimensional protein C-terminal de los pptidos trpticos, y propicia
isolation technology), que contiene fase reversa la presencia de por lo menos dos cargas positi-
e intercambio inico en forma conjugada. La vas en el pptido (N-terminal y C-terminal con K
tecnologa de cromatografa lquida acoplada o R) que posibilitarn la transferencia de carga
a los espectrmetros de masas (LC-MS, liquid a travs de las ligaciones amdicas facilitando
chromatography-mass spectrometry) es utiliza- la fragmentacin. La descripcin del proceso
da para la separacin de pptidos provenientes de reduccin, alquilacin y digestin enzimti-
de protelisis enzimtica, pptidos sintticos o ca de una protena para su anlisis por EM es
pptidos nativos, por columnas de fase rever- apenas uno de los tantos procedimientos que
sa micro-capilares acoplado a sistemas de io- pueden efectuarse en el anlisis protemico.
nizacin tipo electrospray-MS. Esta tecnologa La identificacin de biomarcadores, determi-
permite la separacin de mezclas complejas de nacin de modificaciones postraduccionales,
pptidos y su anlisis simultaneo por espectro- cuantificacin, identificacin de mezclas com-
metra de masas. Este sistema es compatible plejas, entre otras aplicaciones, pueden involu-
con columnas capilares tipo RPn y MudPit de na- crar decenas de metodologas diferentes para
noflujo, que funcionan al mismo tiempo como el procesamiento de las muestras.
agujas de produccin de spray bajo la aplica- 3) Anlisis por espectrometra de masas.
cin de alto voltaje. En la actualidad, el sistema Este procedimiento involucra la ionizacin de
LC-MS es una de las ms verstiles y poderosas los componentes de la muestra en fase ga-
herramientas del anlisis protemico basado seosa, la separacin de las especies inicas re-
en la espectrometra de masas. sultantes de acuerdo a la relacin de su masa
2) Procesamiento de la muestra. El primer con su carga elctrica (m/z), utilizando campos
paso es la reduccin de los puentes de disulfuro electromagnticos en el vaco. Los espectr-
y la alquilacin de las cistenas. Tiene como ob- metros de masas poseen tres componentes
jetivo desnaturalizar las protenas permitiendo bsicos: un sistema de ionizacin, un analiza-
que se expongan los sitios especficos de corte dor de masas y un detector de iones (figura 2).
enzimtico y, a la vez, se evita la formacin de Hasta hace poco tiempo, solamente sustancias
dmeros. Estas modificaciones qumicas son de bajo peso molecular y relativamente vola-
fundamentales, ya que para el anlisis por EM tilizables podan ser sometidas a una ioniza-
se requiere que las protenas sean digeridas cin en fase gaseosa, mientras que especies
a pptidos con masas moleculares menores moleculares de mayores tamaos, tales como
que 3 KDa. Eso se debe a que las tecnologas las protenas, no se mantenan disueltas a ni-
de fragmentacin de protenas en espectr- vel molecular en fase gaseosa. Sin embargo,
metros de masas (para obtencin de secuen- el desarrollo de sistemas de ionizacin suaves,
cias) an son limitadas y pptidos con mayores como ESI o MALDI, permitieron el anlisis de
masas moleculares producen informaciones macromolculas, por lo que hoy en da la EM
estructurales no interpretables. La muestra, es la herramienta principal de la investigacin
reducida y alquilada, generalmente se digiere protemica. Para fines prcticos, la diferencia
con tripsina (enzima que corta especficamen- fundamental de los mtodos de ionizacin es
te en los C-terminales de lisina y arginina, ex- que el sistema MALDI utiliza muestras disuel-
cepto cuando stas son seguidas de prolina); tas en matrices slidas, mientras que el siste-
la eleccin de esta endoproteasa como enzima ma ESI utiliza muestras en fase lquida para la

Biotecnologia V14 CS3.indd 102 11/14/07 5:00:26 PM


Protemica: hacia el entendimiento del lenguaje de las protenas | 103

generacin de iones. Los analizadores de ma- en bancos de datos pblicos y privados, prin-
sas tienen mltiples funciones que varan de cipalmente porque ste se fundamenta en la
acuerdo a su tecnologa; fundamentalmente se correlacin de valores y diferencias aritmticas
refieren al control de los campos electromagn- de unidades de masas atmicas con la estruc-
ticos aplicados, que involucra la separacin de tura molecular de las protenas. Por lo tanto,
iones, la resolucin de cargas a nivel isotpico, pese la formidable e indispensable capacidad
la fragmentacin y la capacidad de operacin de procesamiento de datos que la informtica
en polaridades diferentes. Los analizadores de nos ofrece, el chequeo manual e integracin
masas ms usados son: tiempo de vuelo o TOF de los resultados obtenidos es una prctica
(time of flight), trampa de iones tridimensional muy recomendable.
o trampa de Paul o IT (ion trap), trampa de io- La identificacin de protenas a travs de
nes lineal o LIT (linear ion trap), quadropolo (Q), mapas peptdicos es la metodologa ms utili-
triplecuadropolo y FT-ICR (Fourier transform ion zada en los anlisis protemicos de los ltimos
cyclotron ressonance). Actualmente, debido al aos, principalmente debido a que la secuencia
rpido desarrollo de la tecnologa en el campo de una protena es nica y al ser cortada con
de la EM y de la protemica, existen espectr- una endoproteasa origina un patrn peptdi-
metros de masas que tienen ms de un anali- co especfico. Los valores exactos del conjunto
zador de iones; stos se denominan espectr- de las masas moleculares de los pptidos es la
metros hbridos, como TOF-TOF, LIT-Orbitrap, representacin nica de una determinada pro-
LIT-ETD, LIT-FT-ICR, Q-TOF, LIT-triple quadropolo, tena, ya que esta lista de masas moleculares
etc. Estos equipos presentan mejor resolucin, esta directamente relacionada con su estruc-
exactitud, sensibilidad y versatilidad en el an- tura primaria. El espectro de masas evidencia
lisis de pptidos y protenas. Por ello, son utili- la relacin masa/carga (m/z) de los pptidos
zados para secuenciar y cuantificar protenas, analizados y se convierte en una huella digital
identificar modificaciones post-traduccionales de la protena analizada (mass finger printing).
y, en general, en el estudio de muestras biol- Esta lista de masas moleculares medidas por
gicas complejas. Los detectores tienen como espectrometra de masas, es sometida a los
funcin detectar el flujo inico liberado por el programas de anlisis protemico (PROSPEC-
analizador, amplificarlo y transmitir esta seal TOR, MASCOT, ALDENTE, etc.) para su compa-
a la computadora, donde se registra en forma racin con las diferentes protenas de las bases
de un espectro de masas, los valores m/z que de datos, las cules son digeridas in silico, ge-
indican la masa de los iones son dibujados en nerando una lista de masas tericas. La com-
el eje de las coordenadas mientras que la inten- paracin entre el listado de masas experimen-
sidad de los mismos en el eje de las abscisas. tales y tericas es calificada por algoritmos
El espectro de masas evidencia el nmero de especficos y a cada comparacin se le asigna
componentes en la muestra y el peso molecu- una calificacin. Dependiendo de la exactitud
lar de cada componente. y resolucin de cada instrumento, slo unos
4) Anlisis de datos. La interpretacin de los cuantos pptidos son necesarios para la iden-
espectros de masas constituye la parte ms di- tificacin de la protena en las bases de datos.
fcil de esta metodologa. En esta etapa, la ex- Esta metodologa tiene el inconveniente que
periencia y la capacidad terica de dilucidacin las protenas sometidas para su identificacin
estructural del espectrometrista son funda- deben provenir de genomas secuenciados, de-
mentales, ya que involucra la interdependen- bido a que sta se realiza por comparacin de
cia del conocimiento, de los procesos qumicos masas moleculares donde uno o ms cambios
y bioqumicos aplicados a las muestras de pro- de aminocidos en su secuencia pueden origi-
tenas, con el conocimiento de bioinformtica nar resultados negativos. Otra manera de iden-
para la bsqueda e identificacin de protenas tificar protenas a travs de espectrometra de

Biotecnologia V14 CS3.indd 103 11/14/07 5:00:26 PM


104 | Protemica: hacia el entendimiento del lenguaje de las protenas

masas es mediante el anlisis de los espectros Lenguaje protenico


de fragmentacin de uno o ms pptidos, los y funcionamiento celular
cuales fueron generados por el corte de la pro- El funcionamiento celular depende de un com-
tena con una endoproteasa. Con esta tcnica plejo juego de interacciones entre cientos de
se obtienen datos de secuencia, lo que implica diferentes biomolculas (ADN, ARN, protenas,
una identificacin inequvoca de la protena en metabolitos, etc.), las cuales se encargan de
cuestin. Como mencionamos anteriormen- mantener la integridad, morfologa y funcio-
te, una de las caractersticas tecnolgicas no- namiento. Como mencionamos anteriormen-
tables de los espectrmetros de masas es la te, los genes almacenan la informacin para
capacidad de fragmentar ordenadamente los las funciones bsicas de las protenas; sin em-
pptidos en diferentes posiciones del enlace bargo, la dinmica celular de las protenas en
peptdico. Con est tcnica se obtiene informa- tiempo real, y la regulacin de la estructura
cin estructural de la protena que se est ana- protenica y su funcin, se realiza debido a la
lizando ya que los aminocidos que conforman reversibilidad de las modificaciones postraduc-
la protena son secuenciados. cionales (MPTs) especficas presentes en estas
La fragmentacin de pptidos se realiza mleculas. Durante los ltimos aos las MPTs
por diferentes metodologas tipo CID (collision han llamado la atencin de la comunidad cien-
induced dissociation), ETD (electron transfer dis- tfica en las reas de la biologa y ciencias bio-
sociation), PSD (post source decay), entre otras. mdicas, ya que se ha descubierto una serie de
En la tipo CID se selecciona un in especfico MPTs que antes no se conocan y que presen-
y se hace pasar por una celda de colisin que tan funciones vitales para la clula; por ejem-
contiene un gas inerte (argn, helio), el choque plo, la sumoilacin, modificacin relacionada
con este gas induce la fragmentacin. En la con la regulacin transcripcional y el ciclo ce-
tcnica ETD, a los iones seleccionados se adi- lular. Adems, se ha visto que estn presentes
cionan electrones a travs de un donador, ge- en todas las especies, desde las bacterias hasta
neralmente antraceno cargado, para producir el humano. Antes se consideraba que eran un
la fragmentacin. El PSD utiliza la fragmenta- mecanismo de regulacin en organismos su-
cin de iones metaestables durante el tiempo periores principalmente. En general el estudio
de vuelo en TOFs con reflectron. Los iones hijos de las MPTs se ha visto de manera reduccio-
generados por colisin son separados con base nista, con la idea de que un sitio modificado
a su relacin masa/carga (m/z) y registrados. representa una funcin reguladora. Por ello y
La fragmentacin de pptidos, segn la me- por las limitaciones tecnolgicas, cada tipo de
todologa utilizada, origina un corte especfico modificacin ha sido estudiada en una deter-
del enlace peptdico; consecuentemente, las minada protena, en un aminocido especfico
diferencias de masas moleculares entre los o en un nmero limitado de aminocidos. Sin
iones generados es la representacin de cada embargo, con el advenimiento de las ciencias
aminocido de la cadena polipeptdica, propor- genmicas y las tcnicas de estudio a gran es-
cionando de esta forma la secuencia del pp- cala, ahora es evidente que las modificaciones
tido (figura 2). Mediante la fragmentacin de qumicas en una determinada protena no slo
pptidos se determina tambin la presencia de pueden mediar una funcin biolgica, sino
modificaciones postraduccionales. La factibili- tambin funcionan para regular otras modi-
dad de este anlisis depende del tipo de anali- ficaciones que originan una funcin diferente
zador de iones que posea el espectrmetro de en la misma protena, o actuar en una sinfona
masas. de interacciones moleculares para modular la
estabilidad e integridad de una poblacin de
protenas. Actualmente, la presencia de mlti-
ples sitios de fosforilacin se reconoce como

Biotecnologia V14 CS3.indd 104 11/14/07 5:00:26 PM


Protemica: hacia el entendimiento del lenguaje de las protenas | 105

un importante mecanismo de regulacin de la cficos o soportes slidos fosfoamidados para


localizacin de las protenas, de su actividad el enriquecimiento de fosfopptidos. Para el
funcional y de la atenuacin de las interac- aislamiento de pptidos glicosilados, se utili-
ciones protena-protena y protena-ligando; zan lectinas o se generan de sitios especficos
aunque los detalles moleculares de este me- de N-glicolisaciones por tratamiento con PN-
canismo de regulacin siguen siendo objeto de Gasas y agua pesada (H2O18), entre otros. Pos-
estudio. Uno de los aportes ms significativos teriormente se define el sitio de modificacin
de la aplicacin de espectrometra de masas por espectrometra de masas.
en la biologa, ha sido la revelacin del cdigo Otro punto importante para dilucidar el
de las histonas, el cual regula la estructura y lenguaje protenico es la cuantificacin de
funcin de los nucleosomas en la cromatina. protenas presentes en un sistema biolgico
Este cdigo es un complejo mltiple de sitios determinado en un momento particular. Esto
de modificacin, donde la histona puede pre- se debe, principalmente, a que diferentes es-
sentar reacciones de metilacin, acetilacin, tudios demuestran que la regulacin celular
fosforilacin y ubiquitinacin. Estas modifica- no est dada por la presencia o ausencia de
ciones modulan la interaccin de las histonas una o varias protenas, sino que puede ser
con los cidos nucleicos y con factores pro- regulada por aumentos o disminuciones en
tenicos de regulacin durante la replicacin, la concentracin de una poblacin determi-
transcripcin y reparacin del ADN. nada de protenas. Por ejemplo: la transduc-
Un punto fundamental es el conocimien- cin de seales intracelulares mediada por
to de las modificaciones que ocurren en una receptores de cinasas de tirosina, tales como
protena en un determinado tiempo, bajo de- el factor de crecimiento epidermal (EGF), fue
terminadas condiciones y cmo estas modifi- estudiada por protemica cuantitativa en c-
caciones sealizan sus interacciones con otras lulas HELA estimuladas con EGF, para identi-
protenas. La marca de las MPTs se constituye ficar y cuantificar los fosfopptidos que cam-
en un cdigo molecular que dicta la confor- bian su patrn de expresin en respuesta a la
macin de protenas, su localizacin molecu- estimulacin. Se encontraron 6600 sitios de
lar, interacciones macromoleculares y activi- fosforilacin en tirosina en 2244 protenas;
dades, dependiendo del tipo de clula, tejido o el 40% de los sitos de fosforilacin son mo-
condiciones ambientales. Hoy en da, la meto- dulados al menos dos veces despus del est-
dologa idnea para la identificacin de MPTs mulo con EGF y, sorprendentemente, la ma-
es la espectrometra de masas. Sus resultados yora de protenas que tiene mltiples sitios
permiten dilucidar los principios moleculares y de fosforilacin muestran diferente cintica,
funcionales de la plasticidad de las protenas, lo que sugiere que ellas sirven de plataforma
debido a la caracterizacin y cuantificacin para integrar diferentes seales. Actualmen-
de las MPTs. Existen diferentes tcnicas para te, la nica metodologa que permite realizar
estudiar las MPTs, tantas como la existencia cuantificaciones a nivel molecular es la pro-
de modificaciones (recuerden que se ha re- temica cuantitativa, que bsicamente se
portado hasta la fecha alrededor de 300 MPTs realiza por dos procedimientos: 1) el marcaje
diferentes). En general, primero se separa y en- de protenas con fluorforos Cy, seguido de la
riquece la poblacin de protenas que se quie- separacin y anlisis de geles con el sistema
re identificar, para posteriormente realizar su DIGE (diference gel electrophoresis), finalizan-
caracterizacin molecular por espectrometra do con la identificacin de protenas por EM,
de masas. Por ejemplo, en el caso de amino- y 2) mediante la incorporacin de istopos
cidos fosforilados, se utilizan para su enrique- estables en cultivos celulares (marcaje me-
cimiento columnas IMAC (Fe, Ga, TiO2, etc), tablico) o reactivos qumicos con diferentes
columnas de afinidad con anticuerpos espe- istopos que marcan las protenas para su

Biotecnologia V14 CS3.indd 105 11/14/07 5:00:26 PM


106 | Protemica: hacia el entendimiento del lenguaje de las protenas

posterior anlisis por espectrometra de ma- raleza requieren grandes inversiones finan-
sas. Estas tcnicas son: ICAT (isotope-coded cieras, c) toman un tiempo razonable para su
affinity tags), SILAC (stable isotope labeling establecimiento y d) exigen recursos humanos
with amino acids in cell cultura), iTRAQ (iso- altamente capacitados.
baric tags for relative and absolute quantifi- Dada la relevancia de las unidades de servi-
cation) y AQUA (absolute quantification), las cio en protemica, tanto para la investigacin
cuales citamos a modo de referencia. bsica como para la investigacin biotecnol-
Finalmente, un elemento indispensable gica, la comunidad de investigadores del Insti-
para el entendimiento de la funcin de las tuto de Biotecnologa decidi la creacin de la
protenas es el conocimiento de su estructura Unidad de Protemica (UPRO-IBT) en junio de
tridimensional. Sin embargo, pese al desarrollo 2005. Esta unidad tiene como objetivo ofrecer
de la bioinformtica que permite la construc- servicios de anlisis protemico basados en la
cin de modelos estructurales in silico basado espectrometra de masas macromolecular. La
en homlogos estructurales, existe un gran UPRO es la primera y nica unidad de servicios
nmero de protenas con estructura tridimen- en su gnero a nivel nacional. Durante 2006 se
sionales no resueltas, como es el caso de las analizaron ms de ochocientos muestras de
protenas de membrana que representan un protenas para instituciones de investigacin
tercio del proteoma humano. Por esta razn, pblica y privada, as como para compaas par-
actualmente la comunidad cientfica inter- ticulares. Los servicios prestados por la UPRO
nacional y las compaas de alta tecnologa incluyen determinacin de masas moleculares
tienen como reto la integracin de metodolo- de protenas y pptidos, identificacin de pro-
gas complejas y laboriosas como la difraccin tenas por MALDI-TOF y ESI-MS/MS, secuencia-
de rayos X y la resonancia magntica nuclear cin parcial de protenas desconocidas, deter-
(RMN) al estudio de protenas a gran escala. minacin de modificaciones postraduccionales,
La posibilidad de integracin de estas tecno- determinacin de sitios de corte especficos de
logas no parece un proyecto a largo plazo, ya nuevas enzimas e identificacin de modifica-
que los espectrmetros de masas hbridos, ciones sintticas en protenas. Adicionalmente,
como los FT-ICR, utilizan sper magnetos para la UPRO es un centro protemico de referencia
el anlisis de protenas con alta exactitud, a nivel nacional debido a la formacin de recur-
acercndose de esta forma a la resolucin de sos humanos (tcnicos y de posgrado), al apoyo
los equipos de RMN. brindado a otros laboratorios de protemica y a
su empeo en promover y desarrollar la inves-
tigacin protemica en Mxico (http://www.
La Unidad de Protemica (UPRO) smp.org.mx). El significativo aumento de solici-
del Instituto de Biotecnologa tudes de servicio es consecuencia del creciente
de la UNAM inters de la comunidad cientfica nacional e
La bsqueda de respuestas para preguntas internacional en dilucidar a nivel cualitativo y
biolgicas complejas est directamente rela- cuantitativo la expresin gentica de los orga-
cionada con el dominio, la aplicacin y la dispo- nismos, y especialmente la expresin diferen-
nibilidad de alta tecnologa. En este sentido, la cial de protenas debida a distintas enfermeda-
creacin de unidades de servicio especializadas, des, estrs u otras alteraciones fsicoqumicas
a nivel regional o nacional, parece ser la mejor impuestas a los sistemas biolgicos. La UPRO
alternativa para la investigacin cientfica y mantiene un esfuerzo constante por mejorar
tecnolgica en pases en desarrollo. Las unida- su plataforma analtica y, de esta forma, ofrecer
des de protemica: a) son entidades tcnica y servicios de primer nivel al creciente nmero de
operacionalmente elaboradas, b) por su natu- usuarios.

Biotecnologia V14 CS3.indd 106 11/14/07 5:00:27 PM


Protemica: hacia el entendimiento del lenguaje de las protenas | 107

JY+*JhofHJ(-$+(/*#'(.HJ0($-,#)$+-7L0(/DB0)$&(;*
J0!Yi_Z3(+$&&<kbbci('),)$&&6)+$&&Q)-+$&&#'+&&$&&S

''(&$)
'&&
/+
/&
.+ '()+$) ''(&$) '&,)$) /&&$) -.-$( ,+,$( +(-$(

.&
-+ A : = O B C ; O = = 9 A
-&
-&.$( .)-$( '&&&$) '&+-$( '''*$( '('-$)
,+
'()+$)
,&
WXkdZWdY_Wh[bWj_lW

++ '),)$*
+&
*+
*&
')*+$)
)+
)& '('-$)

(+
(& '&&&$)
'+ -.-$( .)-$(
''//$' ')(-$)
'& ,+,$( -&.$( '&+-$( '(.*$(
/&&$) /.($( '''*$(
+ +&/$( +(-$( ++/$. ,(-$) ,.'$' -+-$( .'/$) .-'$' /(,$- '&*+$) '&,)$) ''.($.
)/.$(
&
*&& +&& ,&& -&& .&& /&& '&&& ''&& '(&& ')&& '*&& '+&&
c%p

Figura 2.
Tpico espectro de fragmentacin por CID. El espectro se
obtuvo en un espectrmetro de masas LC-MS (ionizacin
ESI y analizador trampa de iones tridimensional). El in
precursor de 1363.4 Da (z=1+) se dividi en fragmentos de
la serie b (azul) y de la serie y (rojo). Se muestra la secuen-
cia de aminocidos del in precursor, la cual al ser someti-
da al programa BLAST, resulta en la secuencia de la toxina
Tc54 del alacrn Tityus cambridgei.

Biotecnologia V14 CS3.indd 107 11/14/07 5:00:27 PM


108 | Protemica: hacia el entendimiento del lenguaje de las protenas

Bibliografa
Batista, C. V. et al., Scorpion toxins from Tityus cambridgei
that affect Na(+)-channels, en Toxicon, 40(5), 2002.
Jacob, D. J. et al., The Complete genome and proteome of Myco-
plasma mobile, en Genome Res., 14(8), 2004.
Olsen, J. V. et al., Global, in vivo, and site-specific phosphoryla-
tion dynamics in signaling networks, en Cell, 127(3), 2006.
Siusdak, G., Mass spectrometry in biotechnology, MCC Press,
San Diego, 2003.

Biotecnologia V14 CS3.indd 108 11/14/07 5:00:27 PM

También podría gustarte