Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Proreomica PDF
Proreomica PDF
el entendimiento
del lenguaje de las protenas
Victoria Pando Robles y Csar Ferreira Batista )%gifZ\jXd`\ekf
/
'+
- ''
', '.
'(
')
* '*
. '-
,
+
'&
La revolucin en biologa molecular de los aos Las protenas son molculas orgnicas
80, ejemplificada por la facilidad con la que ac- complejas, formadas por aminocidos ordena-
tualmente se realizan amplificaciones, clona- dos en largas hileras o cadenas polipeptdicas
ciones y secuenciacin automatizada de ADN, mantenidas por enlaces qumicos entre el gru-
ha permitido en corto tiempo conocer el geno- po amino (NH2) de un aminocido y el grupo
ma completo de distintos organismos, incluido carboxilo (COOH) del siguiente aminocido. A
[b[Yjhe\eh[i_i
el del ser humano (http://www.ncbi.nlm.nih. este tipo de enlace se denomina enlace pept-
YhecWje]hW\_W
97
gov/). dico. Se conoce que en la naturaleza existen 20
Actualmente disponemos de un listado to- aminocidos, las posibilidades de ordenamien-
tal de genes que definen el genoma de una es- to de estos aminocidos en las protenas es
pecie, conocemos la secuencia de nucletidos 2020 (1x1026), es decir que la maquinaria celular
de sus genes y, a partir de ellas, podemos infe- puede producir millones de pptidos diferen-
rir con cierta confiabilidad las protenas que se tes con slo 20 aminocidos, mientras que los
expresan a partir de ese genoma. Sin embargo,
(%j\gXiXZ`e
4 nucletidos que conforman el ADN se orde-
este conocimiento no nos permite entender nan en slo 256 posibilidades. Estos nmeros
la funcin biolgica del gen. Por ejemplo: por evidencian la complejidad y variabilidad estruc-
qu el mono y el hombre son tan diferentes, tural que pueden presentar las protenas.
si comparten el 99% de su genoma? o qu Las protenas se encuentran en todos los
YbkbWi
condiciones fisiolgicas cambian en una clu- organismos, son las molculas biolgicas ms
j[`_Zei
la en un cuadro de enfermedad? En resumen, abundantes; por ejemplo, en la bacteria E. coli
del anlisis de los proyectos genmicos se ha constituyen ms del 50% de su peso seco, mien-
\bk_ZeiY[bkbWh[i
aprendido que el nmero de genes contenido tras que otras molculas como el ADN y el ARN
en el genoma de un organismo no correlacio- constituyen el 3% y el 20% respectivamente. Al
na con la complejidad del mismo y se infiere igual que otras macromolculas, como los ci-
que la complejidad morfolgica y funcional de dos nucleicos y los polisacridos (azcares), las
eucariotes superiores como el ser humano de- protenas son esenciales para el funcionamien-
pende de la regulacin de la expresin genti- to celular y, por ende, para la vida. Debido a su
ca y de las interacciones entre sus protenas. heterogeneidad estructural, las protenas par-
se denomina Protemica. Esta puede dividirse que el proteoma humano est definido por
en protemica de expresin, que tiene como ob- muchos proteomas que son caractersticos de
jetivo la descripcin del proteoma total de un tipos celulares especficos (como las clulas del
tejido, fluido, tipo celular u organelo y las me- hgado) o que representan un estado fisiolgi-
diciones cuantitativas de los niveles de expre- co particular, normal o patolgico (el proteoma
sin protenica, y protemica funcional, que se de una persona con cncer gstrico, es distinto
encarga del estudio de la funcin de protenas al proteoma de un paciente con anemia, o al de
dentro de sistemas biolgicos (relaciona cam- una persona sana).
bios de expresin con una funcin determina- Para que un nio empiece a leer, primero
da) y la regulacin de su expresin, incluyendo debe aprender las letras, luego entender que el
las interacciones protenas-protena, protenas- orden de esas letras forma palabras y que las
ADN, protenas-ARN y las modificaciones post- palabras expresan ideas. Del mismo modo, los
traduccionales. investigadores primero descubrieron los nu-
La diferencia principal entre genmica y cletidos, luego que el orden de esos nucle-
protemica, es que el genoma puede ser visto tidos forma un gen y que los genes codifican
como una coleccin de genes cuya naturaleza protenas. Sin embargo, en la prctica primero
es esttica; es decir, no cambia entre clula y se pudo secuenciar a las protenas. En 1950, el
clula, mientras que el proteoma es una enti- investigador sueco E. Edman desarroll un m-
dad cambiante, es una coleccin dinmica de todo que permite saber el orden de los amino-
protenas que difieren de un individuo a otro, cidos en una protena, a la que se conoce como
o de una clula a otra. Por ejemplo, se predice degradacin de Edman. Durante muchos aos
que el nmero de protenas expresadas en el esta tcnica fue de vital importancia en la inves-
ser humano va de 50 mil a 500 mil. Cmo pue- tigacin bioqumica. La secuenciacin parcial de
de ser eso si el nmero de genes presentes en fragmentos protenicos y el ensamblaje de estas
nuestro genoma es de 25 mil? En primer lugar, secuencia permiti conocer en forma completa
esto se debe a que los genes no necesariamente la secuencia de aminocidos de algunas prote-
expresan una sola protena, por procesamiento nas. En 1958 F. Sanger obtuvo el Premio Nbel
diferencial de los transcritos de ARNm (madu- de Qumica debido a la secuenciacin completa
racin y empalme alternativo) se pueden gene- de la insulina, protena involucrada en el meta-
ran diversas protenas. Segundo, las protenas bolismo de la glucosa. Las secuencias parciales
presentan alrededor de 300 diferentes tipos de obtenidas por Edman tambin permitieron co-
modificaciones postraduccionales, incluyendo nocer los extremos amino terminal de muchas
fosforilacin, glicosilacin, acetilacin, deami- protenas y a, partir de esta secuencia de ami-
nacin, miristolacin, entre otras (www.abrf. nocidos, construir oligos de ADN que, median-
org/index.cfm/dm.home). Estas modificacio- te la accin de la ADN polimerasa, permiten el
nes pueden afectar la estructura, localizacin, aislamiento del gene que codifica la protena.
funcin y recambio, e implican funciones regu- Sin embargo, este mtodo de secuenciacin no
ladas por factores internos y externos a las c- es compatible con los anlisis a gran escala que
lulas, desencadenando procesos de expresin dominan el campo de las ciencias genmicas.
gentica diferencial. Esta consiste en que, pese Principalmente porque el nmero de aminoci-
a que todas las clulas de un individuo contie- dos secuenciados es limitado, en general no se
nen en su interior la misma informacin gen- excede de 30-40 a-a secuenciados por muestra,
tica, se producen diferencias en la intensidad, es lento (un ciclo/hora), lo que significa que para
momento de la expresin, o en la informacin secuenciar 30 a-a el equipo se demora 30 horas;
expresada. Como resultado de estas variacio- imagnense entonces secuenciar una protena
nes se produce la diferenciacin celular y pue- de 1000 aminocidos, o secuenciar y conocer el
den originarse determinadas patologas. Es as proteoma de una clula!
Z_][ij_d[dp_c|j_YW
ffj_Zei
)%gifZ\jXd`\ekf fhej[dWZ[_dj[hi
*%\jg\Zkifd\kiX[\dXjXj
B9#CI bWi[h
/
'+
- ''
BWi[h
', '.
'(
')
* '*
. '-
,
+
'&
i_ij[cWiZ[_ed_pWY_d
[b[YjheifhWo C7B:?
WdWb_pWZeh[i_d_Yei JE<"?J"B?J"G"<J#?9H"JE<#JE<"B?J#EhX_jhWf"G#JE<"
B?J#jh_fb[gkWZhefbe
[b[Yjhe\eh[i_i :0RJen$BWXRJY)(Boi9'.$&/\hW]
(k]%+&kB
&*%)&%(&&''&0)'0*&FC JY)(:_][ij_edBoi#9HJ'.$&/\hW]c[djW
[if[YjheZ[cWiWi
)(
)&
(. /-&$(
(,
WXkdZWdY_Wh[bWj_lW
-+*$(
(*
+()$'
Z[j[Yjeh ((
(&
'.
(%j\gXiXZ`e ',
'*
,)*$'
.(&$'
/+($(
'(
'&(*$'
'&
/)/$'
. *,,$& ,+'$( '&&,$'
+&+$' -..$'
,,,$& -&+$& /('$' '&*($' ''(,$(
, ,(&$'
)+'$' ++-$'
* *)&$' ''&'$(
).,$/ +.,$& .-)$'
(
&
*&& +&& ,&& -&& .&& /&& '&&& ''&&
YbkbWi c%p
j[`_Zei
\bk_ZeiY[bkbWh[i
+%Xe}c`j`j[\[Xkfj
Figura 1.
Metodologa simplificada del anlisis protenico.
generacin de iones. Los analizadores de ma- en bancos de datos pblicos y privados, prin-
sas tienen mltiples funciones que varan de cipalmente porque ste se fundamenta en la
acuerdo a su tecnologa; fundamentalmente se correlacin de valores y diferencias aritmticas
refieren al control de los campos electromagn- de unidades de masas atmicas con la estruc-
ticos aplicados, que involucra la separacin de tura molecular de las protenas. Por lo tanto,
iones, la resolucin de cargas a nivel isotpico, pese la formidable e indispensable capacidad
la fragmentacin y la capacidad de operacin de procesamiento de datos que la informtica
en polaridades diferentes. Los analizadores de nos ofrece, el chequeo manual e integracin
masas ms usados son: tiempo de vuelo o TOF de los resultados obtenidos es una prctica
(time of flight), trampa de iones tridimensional muy recomendable.
o trampa de Paul o IT (ion trap), trampa de io- La identificacin de protenas a travs de
nes lineal o LIT (linear ion trap), quadropolo (Q), mapas peptdicos es la metodologa ms utili-
triplecuadropolo y FT-ICR (Fourier transform ion zada en los anlisis protemicos de los ltimos
cyclotron ressonance). Actualmente, debido al aos, principalmente debido a que la secuencia
rpido desarrollo de la tecnologa en el campo de una protena es nica y al ser cortada con
de la EM y de la protemica, existen espectr- una endoproteasa origina un patrn peptdi-
metros de masas que tienen ms de un anali- co especfico. Los valores exactos del conjunto
zador de iones; stos se denominan espectr- de las masas moleculares de los pptidos es la
metros hbridos, como TOF-TOF, LIT-Orbitrap, representacin nica de una determinada pro-
LIT-ETD, LIT-FT-ICR, Q-TOF, LIT-triple quadropolo, tena, ya que esta lista de masas moleculares
etc. Estos equipos presentan mejor resolucin, esta directamente relacionada con su estruc-
exactitud, sensibilidad y versatilidad en el an- tura primaria. El espectro de masas evidencia
lisis de pptidos y protenas. Por ello, son utili- la relacin masa/carga (m/z) de los pptidos
zados para secuenciar y cuantificar protenas, analizados y se convierte en una huella digital
identificar modificaciones post-traduccionales de la protena analizada (mass finger printing).
y, en general, en el estudio de muestras biol- Esta lista de masas moleculares medidas por
gicas complejas. Los detectores tienen como espectrometra de masas, es sometida a los
funcin detectar el flujo inico liberado por el programas de anlisis protemico (PROSPEC-
analizador, amplificarlo y transmitir esta seal TOR, MASCOT, ALDENTE, etc.) para su compa-
a la computadora, donde se registra en forma racin con las diferentes protenas de las bases
de un espectro de masas, los valores m/z que de datos, las cules son digeridas in silico, ge-
indican la masa de los iones son dibujados en nerando una lista de masas tericas. La com-
el eje de las coordenadas mientras que la inten- paracin entre el listado de masas experimen-
sidad de los mismos en el eje de las abscisas. tales y tericas es calificada por algoritmos
El espectro de masas evidencia el nmero de especficos y a cada comparacin se le asigna
componentes en la muestra y el peso molecu- una calificacin. Dependiendo de la exactitud
lar de cada componente. y resolucin de cada instrumento, slo unos
4) Anlisis de datos. La interpretacin de los cuantos pptidos son necesarios para la iden-
espectros de masas constituye la parte ms di- tificacin de la protena en las bases de datos.
fcil de esta metodologa. En esta etapa, la ex- Esta metodologa tiene el inconveniente que
periencia y la capacidad terica de dilucidacin las protenas sometidas para su identificacin
estructural del espectrometrista son funda- deben provenir de genomas secuenciados, de-
mentales, ya que involucra la interdependen- bido a que sta se realiza por comparacin de
cia del conocimiento, de los procesos qumicos masas moleculares donde uno o ms cambios
y bioqumicos aplicados a las muestras de pro- de aminocidos en su secuencia pueden origi-
tenas, con el conocimiento de bioinformtica nar resultados negativos. Otra manera de iden-
para la bsqueda e identificacin de protenas tificar protenas a travs de espectrometra de
posterior anlisis por espectrometra de ma- raleza requieren grandes inversiones finan-
sas. Estas tcnicas son: ICAT (isotope-coded cieras, c) toman un tiempo razonable para su
affinity tags), SILAC (stable isotope labeling establecimiento y d) exigen recursos humanos
with amino acids in cell cultura), iTRAQ (iso- altamente capacitados.
baric tags for relative and absolute quantifi- Dada la relevancia de las unidades de servi-
cation) y AQUA (absolute quantification), las cio en protemica, tanto para la investigacin
cuales citamos a modo de referencia. bsica como para la investigacin biotecnol-
Finalmente, un elemento indispensable gica, la comunidad de investigadores del Insti-
para el entendimiento de la funcin de las tuto de Biotecnologa decidi la creacin de la
protenas es el conocimiento de su estructura Unidad de Protemica (UPRO-IBT) en junio de
tridimensional. Sin embargo, pese al desarrollo 2005. Esta unidad tiene como objetivo ofrecer
de la bioinformtica que permite la construc- servicios de anlisis protemico basados en la
cin de modelos estructurales in silico basado espectrometra de masas macromolecular. La
en homlogos estructurales, existe un gran UPRO es la primera y nica unidad de servicios
nmero de protenas con estructura tridimen- en su gnero a nivel nacional. Durante 2006 se
sionales no resueltas, como es el caso de las analizaron ms de ochocientos muestras de
protenas de membrana que representan un protenas para instituciones de investigacin
tercio del proteoma humano. Por esta razn, pblica y privada, as como para compaas par-
actualmente la comunidad cientfica inter- ticulares. Los servicios prestados por la UPRO
nacional y las compaas de alta tecnologa incluyen determinacin de masas moleculares
tienen como reto la integracin de metodolo- de protenas y pptidos, identificacin de pro-
gas complejas y laboriosas como la difraccin tenas por MALDI-TOF y ESI-MS/MS, secuencia-
de rayos X y la resonancia magntica nuclear cin parcial de protenas desconocidas, deter-
(RMN) al estudio de protenas a gran escala. minacin de modificaciones postraduccionales,
La posibilidad de integracin de estas tecno- determinacin de sitios de corte especficos de
logas no parece un proyecto a largo plazo, ya nuevas enzimas e identificacin de modifica-
que los espectrmetros de masas hbridos, ciones sintticas en protenas. Adicionalmente,
como los FT-ICR, utilizan sper magnetos para la UPRO es un centro protemico de referencia
el anlisis de protenas con alta exactitud, a nivel nacional debido a la formacin de recur-
acercndose de esta forma a la resolucin de sos humanos (tcnicos y de posgrado), al apoyo
los equipos de RMN. brindado a otros laboratorios de protemica y a
su empeo en promover y desarrollar la inves-
tigacin protemica en Mxico (http://www.
La Unidad de Protemica (UPRO) smp.org.mx). El significativo aumento de solici-
del Instituto de Biotecnologa tudes de servicio es consecuencia del creciente
de la UNAM inters de la comunidad cientfica nacional e
La bsqueda de respuestas para preguntas internacional en dilucidar a nivel cualitativo y
biolgicas complejas est directamente rela- cuantitativo la expresin gentica de los orga-
cionada con el dominio, la aplicacin y la dispo- nismos, y especialmente la expresin diferen-
nibilidad de alta tecnologa. En este sentido, la cial de protenas debida a distintas enfermeda-
creacin de unidades de servicio especializadas, des, estrs u otras alteraciones fsicoqumicas
a nivel regional o nacional, parece ser la mejor impuestas a los sistemas biolgicos. La UPRO
alternativa para la investigacin cientfica y mantiene un esfuerzo constante por mejorar
tecnolgica en pases en desarrollo. Las unida- su plataforma analtica y, de esta forma, ofrecer
des de protemica: a) son entidades tcnica y servicios de primer nivel al creciente nmero de
operacionalmente elaboradas, b) por su natu- usuarios.
JY+*JhofHJ(-$+(/*#'(.HJ0($-,#)$+-7L0(/DB0)$&(;*
J0!Yi_Z3(+$&&<kbbci('),)$&&6)+$&&Q)-+$&&#'+&&$&&S
''(&$)
'&&
/+
/&
.+ '()+$) ''(&$) '&,)$) /&&$) -.-$( ,+,$( +(-$(
.&
-+ A : = O B C ; O = = 9 A
-&
-&.$( .)-$( '&&&$) '&+-$( '''*$( '('-$)
,+
'()+$)
,&
WXkdZWdY_Wh[bWj_lW
++ '),)$*
+&
*+
*&
')*+$)
)+
)& '('-$)
(+
(& '&&&$)
'+ -.-$( .)-$(
''//$' ')(-$)
'& ,+,$( -&.$( '&+-$( '(.*$(
/&&$) /.($( '''*$(
+ +&/$( +(-$( ++/$. ,(-$) ,.'$' -+-$( .'/$) .-'$' /(,$- '&*+$) '&,)$) ''.($.
)/.$(
&
*&& +&& ,&& -&& .&& /&& '&&& ''&& '(&& ')&& '*&& '+&&
c%p
Figura 2.
Tpico espectro de fragmentacin por CID. El espectro se
obtuvo en un espectrmetro de masas LC-MS (ionizacin
ESI y analizador trampa de iones tridimensional). El in
precursor de 1363.4 Da (z=1+) se dividi en fragmentos de
la serie b (azul) y de la serie y (rojo). Se muestra la secuen-
cia de aminocidos del in precursor, la cual al ser someti-
da al programa BLAST, resulta en la secuencia de la toxina
Tc54 del alacrn Tityus cambridgei.
Bibliografa
Batista, C. V. et al., Scorpion toxins from Tityus cambridgei
that affect Na(+)-channels, en Toxicon, 40(5), 2002.
Jacob, D. J. et al., The Complete genome and proteome of Myco-
plasma mobile, en Genome Res., 14(8), 2004.
Olsen, J. V. et al., Global, in vivo, and site-specific phosphoryla-
tion dynamics in signaling networks, en Cell, 127(3), 2006.
Siusdak, G., Mass spectrometry in biotechnology, MCC Press,
San Diego, 2003.