Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Errores Comunes en El Análisis Basado en Espectrometría de Masas de Modificaciones Postraduccionales
Errores Comunes en El Análisis Basado en Espectrometría de Masas de Modificaciones Postraduccionales
Aunque las PTM isobáricas se definen como aquellas PTM que tienen pesos
moleculares idénticos (es decir, no se pueden distinguir solo con EM), hay una serie de
situaciones en las que las PTM particulares no son estrictamente isobáricas, pero
pueden identificarse erróneamente debido a errores de medición de masa de los tipos
particulares de espectrómetros de masas. La Figura 1 muestra cómo la precisión de
masa de los espectrómetros de masas puede afectar la capacidad de distinguir PTM
con masas contenidas dentro de las tolerancias especificadas. El impacto de la precisión
de la masa en la discernibilidad de los PTM es dramático cuando se emplean
espectrómetros de masas de baja resolución (por ejemplo, trampa de iones) en lugar de
espectrómetros de masas de alta resolución (por ejemplo, Q-TOF y Orbitrap). Por
ejemplo, dos modificaciones que se producen en los residuos de lisina: la trimetilación
(C3H6, 42.04695 Da) y la acetilación (C2H2O, 42.01057 Da) están muy próximas en su
masa. Además, ambos tipos de modificaciones con frecuencia ocurren conjuntamente
in vivo en la misma clase de moléculas (por ejemplo, histonas) [15-17]. La diferencia de
masa entre estos dos PTM es 0.03638 Da (es decir, 36 ppm de diferencia para un
péptido con 1000 Da). Ciertamente, los espectrómetros de masas de baja resolución,
como las trampas de iones, no tenían la capacidad de diferenciarlos. Aunque este tipo
de error podría no ser un problema con los espectrómetros de masas de alta resolución
de última generación, como Orbitraps [18] y TOF de alta definición [15] para la
proteómica de abajo hacia arriba, esta situación persiste en la proteómica de arriba
hacia abajo porque 0.03638 La diferencia de masa de Da sigue siendo de 1,8 ppm para
una proteína intacta de 20 000 Da (que es aproximadamente del tamaño de las
histonas). Otro ejemplo de este tipo es distinguir entre fosforilación (HPO3, 79.96633
Da) y O-sulfonación (SO3, 79.95682 Da). Estas dos PTM también comparten
exactamente los mismos sitios de modificaciones (es decir, serina, treonina y tirosina)
[19] y se ha informado que la sulfatación podría surgir de forma artificial del proceso de
tinción de plata [20]. La diferencia de masa entre estos dos PTM (sulfatación y
fosforilación) es de 0.00951 Da, que corresponde a 9.5 ppm para un péptido con 1000
Da. A veces, también se pueden observar modificaciones químicas que se consideran
artefactos. Por ejemplo, la glicinilación (C2H3NO, 57.021464 Da) se puede confundir
fácilmente con la carbamidometilación (C2H3NO, 57.02146 Da) y, de manera similar, la
modificación de ubiquitylation remanente, di-Gly (C4H6N2O2, 114.04292 Da) es
isobárica con dicarbamidometilación (C4H4N2292, 292, 214, 212, 214, 212 ].
Además, las sustituciones de aminoácidos también pueden imitar PTM si son isobáricas
con la masa de otros aminoácidos modificados. Por ejemplo, la metilación puede ocurrir
en ácido aspártico y residuos de ácido glutámico [22] y estos aminoácidos con la masa
añadida de grupos metilo (es decir, 14.01565 Da) son isobáricos con variantes de
aminoácidos (por ejemplo, V a I / L o D a E) . Por ejemplo, un péptido totalmente tríptico
(LVNELTEFAK) de albúmina de suero bovino, que se utiliza como proteína estándar en
muchos laboratorios de proteómica, podría identificarse erróneamente como un péptido
humano (LVNEVTEFAK) con metilación en E4, aunque el ion y6 existe y los distingue.
Como otro ejemplo, se ha descrito la conversión de ácido aspártico a ácido isoaspártico,
que es un cambio isobárico, por lo que es casi imposible diferenciarlos por masa a
menos que se utilicen métodos basados en electrones como ECD y ETD para la
fragmentación, lo que genera un diagnóstico único. iones (es decir, c + 57 o z * -57) [23,
24].
En la naturaleza, hay muchos más ejemplos de tales PTM isobáricas en el mundo de
las glucoproteínas, ya que los monosacáridos isoméricos pueden unirse como
secuencias de péptidos codificados. Hay más de 250 glicosiltransferasas en el genoma
humano, lo que puede conducir a la adición de glicanos a más del 50% del proteoma
humano [25]. Molecularmente, se sabe que ocho aminoácidos diferentes están
involucrados en enlaces de glucoproteína con más de 13 monosacáridos diferentes
usando más de 41 enlaces químicos diferentes [26]. Las estructuras de glicanos
isobáricos pueden ser presentadas por diversos isómeros estructurales a través de una
combinación de múltiples posiciones de enlace, centros anoméricos (es decir, o) y
estructuras de anillo (es decir, furanosa o piranosa). No es sorprendente que el número
de subestructuras de glicano se haya estimado en más de 10 000 [27]. Por lo tanto, se
deben desarrollar estrategias más nuevas en el futuro para caracterizar la naturaleza
precisa de las modificaciones de carbohidratos. Esperamos que las modificaciones de
los lípidos de la proteína puedan ser tan diversas como la glicosilación. Por ejemplo, las
modificaciones de los lípidos proteicos, como la N-acilación y la S-acilación, a menudo
permiten que las proteínas se anclen en las membranas celulares. Esto juega un papel
clave en diversas vías de señalización que implican, por ejemplo, la miristoilación N-
terminal del residuo de glicina de las tirosina quinasas Sí, Fyn y Lck, palmitoilación de
la cisteína N-terminal de la familia de proteínas hedgehog o la acilación de lisina por la
familia sirtuina [ 28, 29].
2 PTM asignados a una proteína / gen incorrecto
Muchos péptidos trípticos se comparten entre genes distintos o entre isoformas del
mismo gen debido a la identidad de secuencia. Una limitación importante de la EM es
que no puede ayudar de manera confiable a rastrear el origen de estos péptidos trípticos
para determinar qué gen (s) codifican las proteínas que se detectan en la muestra.
Además, la naturaleza isobárica de dos aminoácidos (es decir, leucina e isoleucina)
hace que la inferencia de proteínas sea más complicada [30]. Aunque se han realizado
esfuerzos [31, 32] para resolver computacionalmente los problemas de inferencia de
proteínas, este problema es inherente a la proteómica basada en la EM y siempre habrá
un cierto nivel de preocupación con respecto a qué productos proteicos de los genes se
identificaron realmente. 'Por lo tanto, todavía existe una necesidad urgente de métodos
más nuevos / ortogonales para complementar el tema de inferencia de proteínas que se
persigue desde hace mucho tiempo y que es más agudo en los experimentos de
proteómica de abajo hacia arriba. De la misma manera, los sitios PTM identificados en
los péptidos no pueden localizarse en una proteína cuando la secuencia del péptido en
sí no es exclusiva de una proteína. Como ilustración, Fyn, Hck, Lck, Src y Yes1
pertenecen a la familia de tirosina quinasa no receptora de Src cuya fosforilación
desempeña un papel importante en diversas vías de señalización. Sin embargo, debido
a que tienen una estructura de dominio similar y secuencias de aminoácidos altamente
relacionadas, puede ser difícil decidir qué proteína se fosforila como se ilustra en la Fig.
2. Los dominios de tirosina quinasa de las tirosina quinasas no receptoras Src son
altamente homólogos, lo que hace que algunos sean trípticos. péptidos idénticos /
isobáricos entre proteínas (Fig. 2A). Por ejemplo, dos fosfopéptidos isobáricos,
IIEDNEpYTAR y LIEDNEpYTAR, identificados a partir de un estudio fosfoproteómico,
donde IIEDNEpYTAR se observa en Hck quinasa, mientras que Fyn, Lck, Src y Yes
comparten LIEDNEpYTAR. Por lo tanto, la identificación de este fosfopéptido no puede
resolver el enigma de las quinasas fosforiladas correspondientes incluso con una buena
asignación espectral (Fig. 2B). En los estudios presentados por Zhong et al. [33], los
autores mostraron un aumento en la abundancia de este péptido en las células
estimuladas con TSLP, de lo cual se podría concluir que una o más de estas tirosina
quinasas no receptoras podrían estar hiperfosforiladas. Por lo tanto, la participación
exacta de estas quinasas en la señalización de TSLP aún permanece indecisa
basándose solo en estas identificaciones de péptidos. En realidad, este problema es
intrínseco a la convención de usar tripsina para la proteómica de abajo hacia arriba, ya
que la secuencia de péptidos completamente tríptica (I / LIEDNEYTAR) es compartida
por proteínas codificadas por cinco genes (Fyn, Src, Yes, Hck y Lck). Para superar este
problema, uno puede usar otra enzima como Lys-C para generar una secuencia
peptídica más larga a partir de la región de tirosina quinasa altamente homóloga que
puede ayudar a identificar un solo producto génico o reducir a menos alternativas. En el
escenario presentado, Lys-C produciría cuatro secuencias de péptidos diferentes a
partir de las proteínas en comparación con un péptido isobárico compartido por la
tripsina: un péptido (VADFGLARLIEDNEYTARQGAK) único para Src, otro péptido
(IADFGLARLIEDNEYTARQGAK) compartido entre Fyn y Yes y dos únicos pero
secuencias de péptidos isobáricos (IADFGLARI / LIEDNEYTAREGAK) compartidas
entre Hck y Lck. Por supuesto, el uso de enzimas proteolíticas adicionales puede
resolver muchas más ambigüedades relacionadas con los péptidos compartidos.
Otro problema es la coelución de dos (o más) péptidos con el mismo PTM en diferentes
sitios (dado que la secuencia de péptidos es la misma, los péptidos modificados son
obviamente isobáricos). Aquí, mostramos un ejemplo donde una mezcla de dos péptidos
fosforilados en tirosina que eluyeron estrechamente durante la cromatografía (Fig. 4).
Esta secuencia peptídica (YYEGYYAAGPGYGGR) con una fosforilación contiene cinco
residuos de tirosina que posiblemente podrían ser modificados por un resto fosfato. El
software de localización de sitios (PhosphoRS) asignó una probabilidad del 50% a Y5,
50% a Y6 y 0% a los otros tres sitios. Dado que no hay sitios con una probabilidad más
alta (por ejemplo, cuando se usa un umbral arbitrario del 75%), uno eliminaría ambos
sitios (Y5 e Y6) de la lista final de sitios identificados con confianza. Sin embargo, en
realidad, no hay duda de que existen dos fosfopéptidos diferentes con la secuencia
peptídica idéntica, se eluyeron y se cofragmentaron como lo demuestran dos iones y10
diferentes, uno con y el otro sin fosfato (Fig. 4). A este respecto, Thibault y sus colegas
han demostrado recientemente que del 3 al 6% de todos los péptidos fosforilados
identificados se encuentran en esta categoría de 'péptidos con el mismo PTM en
diferentes sitios' y que aproximadamente la mitad de ellos eluyen de la columna ( es
decir, dentro de 2 min) [40]. Sin embargo, aún es difícil determinar todos los
fosfopéptidos que existen en una muestra debido al potencial de sesgos sistemáticos,
como la eficiencia de la digestión del impedimento estructural diferencial, así como
debido a la estequiometría de esos fosfopéptidos isobáricos.
La mayoría de los sitios PTM se identifican desde enfoques proteómicos de abajo hacia
arriba mediante la búsqueda de espectros de masas en tándem contra bases de datos
de proteínas teóricas utilizando algoritmos de búsqueda de bases de datos. Los
componentes de tales tuberías computacionales afectan dramáticamente la
identificación de sitios PTM en el análisis. Actualmente, la identificación de péptidos
modificados postraduccionalmente por MS se basa principalmente en el análisis basado
en algoritmos de espectros de masas reales contra espectros de masas teóricos
generados a partir de bases de datos proteicas seleccionadas. Dos componentes
computacionales juegan papeles críticos en tales identificaciones PTM: el algoritmo en
sí y la base de datos que se busca. Aquí, discutimos los escenarios en los que los
péptidos con PTM se omitieron incorrectamente de la identificación: (i) La base de datos
no tenía la secuencia de péptidos: es decir, faltaba la proteína de interés, o la proteína
estaba presente pero correspondía a una variante diferente (por ejemplo, un aminoácido
cambio debido a una mutación o SNP), (ii) El algoritmo de búsqueda perdió la
identificación; y (iii) El usuario no especificó la modificación apropiada mientras buscaba.
Muy a menudo, muchos de los PTM no se especifican durante la búsqueda. Por ejemplo,
la modificación de lípidos y la glicosilación generalmente no se incluyen durante la
mayoría de los análisis de datos de rutina. Desafortunadamente, esto significa que las
tuberías de análisis actuales pierden rutinariamente muchas PTM interesantes ocultas
en los datos. Por ejemplo, una serie de modificaciones novedosas en los residuos de
lisina como la propionilación, la butirilación, la succinilación, la malonilación y la
glutarilación se han informado recientemente [49-52], mientras que otras modificaciones
como la hidroxilación y la metilación también se pueden observar con frecuencia en las
muestras [53]. La búsqueda de todos los PTM sigue siendo un área de investigación y
las estrategias más apropiadas que equilibran la sensibilidad y las tasas de
descubrimiento falso aún no se han explorado por completo, aunque se están probando.
Uno de los aspectos difíciles del análisis de datos para la identificación y localización de
PTM se refiere a la estimación de la confianza en los PTM identificados. Se pueden usar
todas las PTM posibles como modificaciones variables en la misma búsqueda o emplear
búsquedas iterativas utilizando múltiples conjuntos de PTM [54,55]. También se ha
informado que la "búsqueda abierta" podría ayudar a identificar muchos más péptidos
modificados [56, 57]. Aunque no existe una evaluación sistemática de qué estrategia
puede funcionar mejor para qué PTM, creemos que tales estudios sistemáticos deberían
llevarse a cabo en el futuro cercano utilizando conjuntos de datos estándar apropiados.
6.2 Enzima
Los péptidos con PTM son generalmente de baja abundancia, cuya detección se ve
afectada negativamente por el gran exceso de péptidos no modificados. Por lo tanto, los
análisis actuales de PTM a menudo emplean captura de afinidad enriqueciendo péptidos
que contienen PTM, agotando péptidos no modificados o separando péptidos
modificados por cromatografía. En el caso de los métodos basados en anticuerpos, la
mayoría, si no todos, los anticuerpos producidos contra PTM tienen alguna preferencia
a ciertas secuencias. Esta selectividad vagamente conocida conduce a la identificación
de péptidos preferidos de reactivos de captura, que se asocia con el nivel de abundancia
de las secuencias de péptidos modificados. Por lo tanto, los repetidos experimentos de
proteómica basados en afinidad por el mismo laboratorio u otros laboratorios
identificarían preferentemente los sitios modificados con PTM conocidos. Por lo tanto,
es bueno continuar desarrollando métodos más nuevos que complementen los métodos
actuales para minimizar este tipo de sesgo.
Las mediciones actuales del estado de PTM en cualquier proteoma se realizan a través
de la cuantificación de péptidos que contienen PTM. Sin embargo, una posibilidad en
abundancia del péptido modificado no implica necesariamente un cambio en la
extensión del sitio PTM. Por ejemplo, los cambios en la abundancia de la fosforilación
de proteínas podrían resultar de cambios en la abundancia de fosforilación en el sitio o
de cambios en la abundancia de la proteína misma. Por lo tanto, es importante evaluar
la abundancia de proteínas para una mejor interpretación de la fosforilación [90]. Otros
posibles problemas a considerar para el análisis de fosfoproteomía en la interpretación
de datos se han revisado en otra parte [91,92]. Como se muestra en la Fig. 6, una
relación SILAC que indica una disminución en la abundancia relativa de fosfopéptido
puede resultar de cuatro escenarios diferentes a nivel de proteína. Aunque SILAC se
usó aquí para discutir los problemas específicos relacionados con la interpretación, otros
tipos de métodos cuantitativos, incluidos iTRAQ y TMT, tienen problemas similares.
9 Discusión
Aquí, hemos discutido muchos aspectos de la tubería proteómica actual para el análisis
PTM en biología, donde debemos ser cautelosos. Antes de apresurarnos a sacar
conclusiones biológicas de los datos de espectrometría de masas, debemos tener en
cuenta los siguientes parámetros: (i) la resolución del espectrómetro de masas que se
está empleando; (ii) PTM isobáricos, modificaciones químicas y aminoácidos; (iii)
enzimas utilizadas; (iv) algoritmo de búsqueda; (v) bases de datos de proteínas; (vi)
parámetros de búsqueda de PTM; (vii) algoritmo de localización del sitio; (viii) coelución
de péptidos modificados; y (ix) interpretación de datos de cuantificación. Algunos de los
problemas que hemos enumerado se pueden resolver, por ejemplo, utilizando diferentes
proteasas, algoritmos múltiples, bases de datos de proteínas más curadas o parámetros
de búsqueda optimizados. Otros problemas pueden resolverse mediante mejoras en las
tuberías de bioinformática actuales, como la integración de diferentes bases de datos
PTM para una mejor y más completa anotación. Algunos problemas, como las PTM
isobáricas, pueden no resolverse simplemente mediante métodos proteómicos. Estos
problemas pueden resolverse mediante el uso de métodos bioquímicos distintos de la
EM o mediante una combinación de métodos. La siguiente lista de sugerencias se puede
utilizar como guía al realizar análisis PTM basados en MS. Sugerencia n. ° 1: Conozca
los errores en masa de las masas medidas por la EM empleada. Sugerencia n. ° 2:
Conozca explicaciones alternativas de las masas delta de PTM de interés. La Tabla 1
muestra una lista de masas isobáricas. Sugerencia # 3: Use la presencia de iones de
firma en los espectros de MS / MS para aumentar el nivel de confianza de los PTM
identificados. La Tabla 2 muestra una lista de iones de firma frecuentemente observados
en los datos de MS. Sugerencia n. ° 4: Emplee un análisis estadístico para evaluar la
probabilidad de localización en un sitio dado para identificar el aminoácido modificado
por PTM con mayor confianza. Sugerencia n. ° 5: Emplee enzimas que no sean tripsina
para identificar la proteína de interés con PTM. Sugerencia # 6: Conozca formas
alternativas de interpretar un resultado cuantitativo de PTM. Sugerencia n. ° 7: deposite
los datos de MS adquiridos en repositorios públicos como ProteomeXchange [93] y
MassIVE. Creemos que la difusión pública de los datos de proteómica en última
instancia permitirá la evaluación, validación cruzada, integración, análisis comparativo y
nuevos descubrimientos. Por último, uno debe entender que un análisis PTM estándar
basado en MS no proporciona ocupación del sitio PTM (es decir, estequiometría). Esto
se debe a que los péptidos modificados y no modificados se comportan de manera
desigual en la tubería proteómica, lo que hace difícil compararlos directamente en
función de sus respuestas relativas de MS. Otro factor de complicación es que algunas
PTM como la S-nitrosilación y la fosfo (ribosil) ación indicativa de mono- o poli-ADP-
ribosilación son menos estables durante la preparación de las muestras [94, 95], lo que
podría no permitir un verdadero medición del estado de modificación de las proteínas in
vivo. En nuestra experiencia, una evaluación cuidadosa de los péptidos modificados
postraduccionalmente a menudo está justificada y vale la pena, especialmente si va a
servir como la base de experimentos biológicos adicionales que pueden llevar mucho
tiempo. Este estudio fue apoyado por una subvención del Instituto Nacional del Cáncer
(CA184165 a AP) y la iniciativa del Consorcio de Análisis de Tumor Proteómico Clínico
del NCI (U24CA160036 a AP). Los autores han declarado no tener ningún conflicto de
intereses.