Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción
Las proteínas son las entidades funcionales primarias en cualquier sistema biológico. Por lo
tanto, la búsqueda por comprender cómo funcionan y los roles que desempeñan en biología y
medicina ha sido una preocupación importante de la bioquímica. Un prerrequisito
fundamental para comprender la función es la capacidad de identificar cualquier proteína
dada, con precisión y con el rigor suficiente para evitar afirmaciones y conclusiones erróneas.
Las proteínas, a diferencia del ADN de sus contrapartes genómicas parentales, contienen no
solo una serie lineal de aminoácidos, sino que también se pliegan en innumerables formas que
están influenciadas por más de 28 modificaciones postraduccionales conocidas (PTMS) [1],
cada una de las cuales se mantiene, con el potencial de decenas de miles de variaciones. Estas
y otras complicaciones habían hecho que la identificación de proteínas fuera particularmente
desafiante, hasta la aparición de la proteómica basada en espectrometría de masas (MS).
El término proteómica se acuñó por primera vez a principios de los años 90 [2] y es una rama
de la bioquímica que ha contribuido de manera importante a las herramientas / metodologías
que permiten la identificación de proteínas. La proteómica ha crecido exponencialmente en las
últimas dos décadas (como lo demuestran las> 68 000 publicaciones — búsqueda en PubMed).
Aunque la proteómica tiene un alcance mucho más amplio, el principio fundamental de la
proteómica es la capacidad de identificar y cuantificar conjuntos de proteínas (proteomas) que
se expresan en una dimensión temporal espacial particular, por una célula / tejido / organismo
específico, en condiciones definidas. La identificación y cuantificación se han logrado
históricamente utilizando dos enfoques principales. El primero implica la identificación de
antígenos en proteínas (y por lo tanto proteínas), a menudo usando anticuerpos o tecnologías
asociadas basadas en afinidad, mientras que el segundo usa secuenciación de proteínas
(recientemente por MS) y sus tecnologías asociadas.
Esta revisión guiará al lector a través de muchos aspectos fundamentales de estas
metodologías con un mayor enfoque en la EM y las tecnologías asociadas para permitir al
usuario seleccionar la mejor metodología, instrumentación y parámetros que puedan ajustarse
a su diseño experimental. Hay varias revisiones anteriores sobre elementos específicos de la
identificación de proteínas de la EM [3, 4], ninguna de ellas abarca el aliento total de la
identificación de proteínas como se explica en esta revisión. La combinación de los aspectos
analíticos y computacionales en un solo lugar no solo brinda una perspectiva única del futuro
del campo, sino que también ayuda a identificar obstáculos y oportunidades de manera
holística. Nos enfocamos en las dos formas más comunes de identificación de proteínas en la
proteómica, que son los anticuerpos: basados y basados en EM, con un mayor enfoque en EM,
ya que actualmente existe una mayor preponderancia del uso de EM en proteómica [5]. Otras
técnicas distintas de la EM se han revisado exhaustivamente en otros lugares y, por lo tanto,
merecen una mirada rápida en la siguiente sección.
En la siguiente sección, se discutirán brevemente las técnicas y estrategias que constituyen los
componentes principales de la identificación de moléculas biológicas por EM (resumidas en la
Figura 1). Una descripción detallada de todos los instrumentos está más allá del alcance de
esta revisión; sin embargo, su modo de operación y competencias funcionales se ilustrarán
exhaustivamente, ya que forman los cimientos críticos de todos los métodos computacionales
que siguen a su uso.
Figura 1.
Resumen de la información central generada durante los experimentos basados en MS. Las flechas
muestran la información experimental recopilada de cada paso del MS. Esta información es crucial para
permitir una identificación precisa de proteínas mediante análisis computacional.
Tabla 2. Características de las fuentes de ionización utilizadas en la EM.
Cromatografía de gases
Cromatografía líquida
CE es una forma de LC, en la que los componentes de la muestra atravesaron la fase líquida y
se separaron según su carga y tamaño. Las moléculas pasan a través de capilares de sílice
fundida bajo la influencia de un campo eléctrico de alto voltaje. La CE suele interactuar con la
MS a través de una fuente de ionización por electropulverización (ESI), aunque una tasa muy
baja (aprox. 200 nl / min) de vapores provoca problemas de compatibilidad. La CE es más
ventajosa que la GC y la LC en términos de eficiencia de separación y tamaño de la muestra y
se ha utilizado ampliamente en estudios de identificación de proteínas y descubrimiento de
biomarcadores [36-38].
Ionización
Para detectar y analizar los componentes de la muestra sobre la base de sus valores de
relación masa / carga, es necesaria la ionización de péptidos o moléculas. Esto se realiza
utilizando diferentes fuentes de ionización. Hasta ahora, se han diseñado una variedad de
fuentes de iones (ver Tabla 2), que generan especies cargadas positivamente (catiónicas) o
negativamente (aniónicas). El análisis bioinformático posterior depende en gran medida de la
entrada de configuración correcta del instrumento para una identificación precisa. La
ionización generalmente se realiza mediante la adición de energía a las moléculas de péptidos,
lo que resulta en la eliminación de uno o más electrones para producir monocargado ([M] + ·,
[M + H]+) o múltiple ([M + nH]n+) iones, respectivamente. Dependiendo del tipo de muestra y
las moléculas objetivo, la ionización de las moléculas se puede realizar dentro de la cámara de
vacío de MS (al vacío) o en el exterior a presión atmosférica (API). La ionización electrónica (EI),
la ionización química (CI) y la MALDI suelen ser técnicas al vacío [39-41], mientras que la API
incluye las técnicas ESI y APCI [42, 43]. La IE se considera una técnica de "ionización dura", ya
que se ejecuta mediante la colisión de un haz de electrones de alta energía con los iones
moleculares, lo que da como resultado una fragmentación. Por el contrario, ESI, CI, MALDI y
APCI se consideran técnicas de "ionización blanda", ya que retienen iones moleculares. Entre
todos los métodos de ionización disponibles, ESI y MALDI son actualmente ampliamente
favorecidos para la ionización de péptidos y proteínas debido a su mayor sensibilidad y
precisión de medición, diversos modos de separación y fácil implementación [44, 45]. Debido a
su compatibilidad con biomoléculas polares de gran tamaño [46], también han reemplazado
algunas de las técnicas primitivamente desarrolladas, incluidas la desorción de campo y plasma
(PD / FD), FAB e ionización por termopulverización (TSI) [47, 48].
Fragmentación
La fragmentación es un proceso de descomposición / ruptura de 'iones moleculares o
precursores' (o 'iones precursores'), recuperados de las fuentes de iones, en 'iones producto'
más pequeños (o 'iones fragmentos / hijos') y forma el núcleo de la EM 'secuenciación' y, por
tanto, identificación de péptidos / proteínas [50]. Este proceso, aunque técnicamente ocurre
en el analizador de masas, se analiza por separado para mayor brevedad. La fragmentación se
induce proporcionando energía adicional a los iones precursores cargados, ya sea en un
analizador simple o en un instrumento analizador doble (consulte la Sección: Analizadores de
masas). En MS en tándem (MS / MS o MS 2), los iones precursores / parentales de interés (que
tienen un rango m / z específico) son seleccionados por el primer analizador de masas y luego
pasados a las fuentes de fragmentación externas (ver Tabla 3) (también llamado una celda de
colisión) para crear posteriormente iones de producto, que luego se analizan en un segundo
analizador de masas para generar espectros secundarios detallados de cualquier molécula o
ion objetivo. Durante la fragmentación, la rotura de enlaces se produce en tres posiciones
diferentes en una cadena peptídica, y esto se basa en la "notación de fragmentación", donde
los iones producto se denominan iones a-x, b-y y c-z. Los iones formados por escisión de
enlaces entre Cα y carbono carbonilo son iones a-x, entre carbono carbonilo y nitrógeno son
iones b-y y entre nitrógeno y Cα son iones c-z.
La disociación inducida por colisión (CID) [51], la disociación por captura de electrones (ECD)
[52] y la disociación por transferencia de electrones (ETD) [53] son técnicas comúnmente
utilizadas para la fragmentación de iones peptídicos y tienen muchas aplicaciones en
proteómica [54-56]. Un factor crítico en la identificación computacional de proteínas también
se basa en la interpretación de la variedad de patrones de fragmentación de datos de MS.
Analizadores de masas
Un analizador de masas se considera la unidad central de procesamiento de MS. Realiza la
separación de iones según su relación masa / carga utilizando un campo eléctrico o magnético.
Los analizadores de masas funcionan en un entorno de vacío a bajas presiones (10 −4 a 10−7 Pa)
para que los iones puedan pasar a través de ellos de manera eficiente y sin interrupciones.
Existen diferentes tipos de analizadores de masas y se utilizan de forma independiente o en
combinación (Tabla 4), dependiendo de las moléculas objetivo y la información requerida. Los
iones atraviesan directamente de los analizadores al detector (MS) o a las celdas de colisión
entre dos analizadores, y luego al detector (MS / MS), donde se registran las intensidades, el
tiempo de retención y los valores m / z de los iones.
Técnica Iones padres Molécula objetivo Mecanismo Iones de producto Eficiencia / inconvenientes
Disociación inducida Cationes de proteínas / Péptidos de pequeño Calentamiento lento a través de iones b-y Pérdida de H2O, NH3 y PTM
por colisión (CID) o péptidos gaseosos tamaño (∼15 múltiples colisiones con átomos
disociación activada aminoácidos) de gas raros
por colisión (CAD)
Disociación por Cationes de proteína / Grandes fosfopéptidos Captura de electrones térmicos iones c-z Romper los enlaces S-S, preservar
captura de péptido gaseosos con intactos H2O, PO4 y PTM
electrones (ECD) carga múltiple
Disociación por Catión peptídico Péptidos de tamaño Transferencia de electrones del iones c-z Altamente eficiente y rápido,
transferencia de protonado con carga mediano a grande (15 a anión radical al catión peptídico preserva los PTM
electrones (ETD) múltiple 40 aminoácidos)
(reacción ion-ion)
Disociación Catión de péptido Péptidos de tamaño El aumento de la energía interna iones b-y, iones c-z Más secuencia y sitio específico
fotoinducida (PID) protonado con carga mediano de los iones peptídicos tras la (basado en la longitud de onda
única / múltiple irradiación con fotones. del láser de irradiación)
Disociación inducida Catión peptídico Pequeñas moléculas, El aumento de la energía interna iones b-y Una ganancia de altas energías
por superficie (SID) protonado péptidos, grandes debido a la colisión de iones internas incluso en colisiones de
multiplicado complejos no covalentes peptídicos en la superficie del baja energía.
líquido metálico / viscoso.
Tabla 4. Clasificación de los analizadores de masas, sus técnicas y características destacadas
Figura 2. Resumen de los pasos informáticos y computacionales. Los pasos computacionales (y las
herramientas correspondientes con referencias cruzadas en tablas) analizan y transforman los datos de
MS en bruto en información proteómica útil, incluido el descubrimiento de proteínas faltantes.
Conversión de datos de MS
La mayor parte del software de análisis de datos de MS requiere que los archivos de datos de
entrada se conviertan de formularios sin procesar a formatos estándar (como OpenXML). Los
datos sin procesar de MS se convierten en formatos mzXML, mzDATA y mzML utilizando las
herramientas MSconvert, RawConverter, Mascot Distiller, ReAdW, MassWolf y mzWiff
(consulte la Tabla 7). Además, TPP y PSI tratan los datos de MS en sus propios formatos de
archivo específicos, como pepXML, protXML y analysisXML. Los archivos pepXML y protXML
almacenan y analizan datos de nivel de péptidos y proteínas, respectivamente, mientras que
analysisXML almacena todo el análisis de identificación y cuantificación de espectros de MS.
Todas estas herramientas están disponibles gratuitamente y se resumen en la Tabla 7 para sus
formatos de datos admitidos y proveedores de MS compatibles.
Coincidencia espectral
Secuenciación de novo
Enfoque híbrido
Puntos clave