Está en la página 1de 14

TEORIA DE CONJUNTOS APLICADA A LA

CARACTERIZACIN MATEMATICA DE UNIN


DE PPTIDOS AL HLA CLASE II
Set Theory Applied To The Mathematical Characterization
Of Hla Class Ii Binding Peptides
Javier Rodrguez Velsquez, Md, Esp.1
Resumen
Las bases moleculares para el reconocimiento y la respuesta inmune estn en la
presentacin de pptidos antignicos. Se utilizaron la teora de conjuntos y los datos
experimentales para realizar una caracterizacin matemtica de la regin central de unin
del pptido mediante la definicin de 8 reglas asociadas a la unin al HLA clase II. Estas
reglas se aplicaron a 4 pptidos promiscuos, 25 secuencias peptdicas naturales de la
regin central, de las cuales 13 presentaron unin, mientras que los dems no, y 19
pptidos sintticos buscando diferenciar los pptidos. A excepcin de uno, todos los
pptidos de unin y no unin fueron caracterizados acertadamente. Esta metodologa
puede ser til para escoger pptidos clave en el desarrollo de vacunas.
Palabras clave: teora de conjuntos, unin al HLA clase II.
Summary
Antigen presentation contains the molecular basis for antigenic identification and
immune responses. The set theory and experimental data were used in order to develop
an union core region mathematic characterization through the defini- tion of 8 laws
associated to HLA class II binding. The laws were applied to 4 promiscuous peptides, 25
natural peptides sequences of core region: 13 binding peptides and 12 no binding peptides;
and
19 synthetic peptides looking to differentiate pep- tides. Only one peptide was not rightly
character- ized.This methodology may be used to choose key peptides in the development
of vaccine.
Key words: Set theory, HLA class II binding.
Introduccin
La teora de conjuntos permite diferenciar elementos particulares a partir de conjuntos
generales al realizar operaciones como la unin, la interseccin, la diferencia y la diferencia
simtrica [1].Las molculas presentadoras de antgenos (HLA) clase II son glicoprotenas
de membrana que se encuentran exclusivamente en las clulas. LA clase II presentan
pptidos a las clulas T CD4+ [1,2]. Cada molcula de HLA est anclada a la clula
mediante dominios transmembrana y citoplasmticos y posee una hendidura extracelular de unin al pptido. La hendidura de unin del HLA clase II es capaz de unir
pptidos de tamao variable, 10 a 24 aminocidos, debido a que sus extremos se encuentran abiertos [4-7], un tamao de 13 a 16 aminocidos ha sido observado con mayor
frecuencia en los pptidos de unin [8-11]. Anlisis de unin sugieren que nicamente una
regin central compuesta por 9 aminocidos es esencial para la unin pptido-HLA [12].
Estudios de dicha regin han relacionado aminocidos especficos en posiciones
especficas, denominados motivos de unin [8], construidos a partir de grupos
seleccionados de libreras M13 de pptidos presentados. El propsito de la presente
investigacin es construir una metodologa general, basada en la teora de conjuntos,
para caracterizar matemticamente la unin de pptidos a molculas de HLA clase II.

Definiciones
Conjunto: seleccin de elementos que cumplen una caracterstica comn definida
previamente.
A = {x | x P(x)}
Donde P(x) representa una caracterstica particular [1].
Sea S un conjunto que contiene dos con- juntos A y B.
Subconjunto: dados A y B dos conjuntos, A es subconjunto de B si para todo elemento
x, que pertenezca a A, entonces x tambin pertenece a B.
Unin: la unin de A y B (A U B) es el con- junto, el cual est formado por todos los
elementos x tales que pertenecen a A o a B, o a ambos.
Interseccin: la interseccin de A y B (A B) es el conjunto de todos los elementos x,
tales que pertenecen a los conjuntos A y B.
Metodologa
Se estudiaron 48 regiones centrales nonamricas, partiendo de cuatro pptidos
promiscuos: el HA, antgeno del virus de la influenza (MAT) y el CLIP, cadena invariante
unida a las molculas presentadoras antes de la presentacin antignica y la secuencia
IAKMKEKAS, pptido antignico de la malaria que se une a varios alelos [9], 13
pptidos que se unen al HLA clase II y 12 que no presentan unin, ms 19
secuencias peptdicas artificiales. Se dividieron en dos grupos: los de unin y no
unin, cada uno de estos grupos con 24 pptidos. Las medidas de unin fueron
realizadas con las tcnicas convencionales como el equilibrio de dilisis y las bases de
datos establecidas en las que se recopilan estas medidas.
Los pptidos son escogidos en este trabajo por varias razones: la primera, para poder
comparar pptidos naturales con sintticos que no se unan o que s lo hagan. Otra es la
de escoger pptidos promiscuos que se sabe se pueden unir a ms de un tipo de
molcula de HLA, lo que posible- mente podra orientar respecto a las capacidades de
unin de estas molculas. Precisamente, el CLIP es seleccionado en este estudio por
estar unido a la hendidura en todas las molculas HLA clase II para que pueda ser
comparado con los que se unen o no, naturales o sintticos. Todas las secuencias
fueron obtenidas de estudios de Hammer et al [10].
Para el anlisis de secuencias peptdicas se definieron 6 reglas asociadas a motivos de
unin, reconocidos segn los resultados experimentales [9]; en la primera posicin se
consideran 7 aminocidos hidrofbicos caractersticos de la unin como motivo [10];
adicionalmente motivos reportados para las posiciones 2 y 3 [10]; adems se defini una
regla matemtica independiente de los resultados experimentales.
Se construyeron conjuntos de pptidos asociados a cada una de estas reglas definidas.
Las reglas para la determinacin de los conjuntos son:
1. Presencia de Y, W, F, V, L, I o M en la posicin 1.
2. Presencia de R en la posicin 2.
3. Presencia de G o P en la posicin 3.
4. Presencia de V, L, M o A en la posicin 4.
5. Presencia de A, G, S, T, R o K en la posicin 6.
6. Presencia de L, Q, M o N en la posicin 7.
7. Presencia de L, M o A en la posicin 9.
8. Presencia de Y, W o F en la posicin 1 y la presencia de N y L en cualquier otra
posicin.

de Y, W o F en la posicin 1 y la presencia de N y L en cualquier otra posicin.


A partir de las reglas anteriores se definieron los siguientes conjuntos:
Sea S el conjunto de todas las posibles cadenas peptdicas de 9.
aminocidos.
A = {x S |Todos los x tales que cumplen la primera regla}
B = {x S |Todos los x tales que cumplen la segunda regla}
C = {x S | Todos los x tales que cumplen la cuarta regla}
D = {x S | Todos los x tales que cumplen la sptima regla}
E = {x S | Todos los x tales pertenecen a C
y no pertenecen a D}
F = {x S | Todos los x tales que cumplen la octava regla}
Posteriormente se evaluaron los 48 de pptidos mencionados, divididos en los dos
grupos, determinando primero, cules, y segundo cuantas reglas cumpla cada pptido
para, finalmente, encontrar cules reglas se cumplen simultneamente para los
pptidos que presentan unin en el lenguaje de la teora de conjuntos: restas,
intersecciones y uniones. Por tratarse de una
Metodologa matemtica, sta no requiere de anlisis estadsticos ni el uso de una
gran cantidad de datos experimentales.
Resultados
De 48 pptidos evaluados, 25 pptidos estn contenidos en el conjunto que
sealamos de unin y 23 en el conjunto de no unin; un solo pptido reportado como
de no unin, pertenece al conjunto de unin.
As, los pptidos que se unen estn contenidos en el conjunto K de unin:
K = (A B) U (A D) U (A E) U (B F). De forma simplificada:
K= (A (B U D U E)) U (B F)
Observando los datos experimentales, se evidencia que, para pptidos de unin, el
aminocido hidrofbico seleccionado en la primera posicin, junto con el aminocido
cargado Arginina R en la segunda (A B) es caracterstico del fenmeno de unin. Se
podra confirmar con las secuencias sintticas de unin y no unin, pero se observa que
an sin cumplir con los motivos de las 2 primeras reglas, puede darse la unin, o sea, el
incumpliendo la segunda, pues de los 14 pptidos naturales de unin ms los cuatro
promiscuos, 13 no cumplen con la segunda regla. Si no se da la segunda regla, el
conjunto de unin es ampliado por la regla A D, en el cual se toman los motivos
encontrados experimentalmente en la posicin 1 y 9, aunque no todos los pptidos la
cumplen. Slo la cumplen 8 secuencias de los 14 ppticos naturales y la mitad de los
promiscuos. Respecto a A E, se observa que la cumplen 3 secuencias de los pptidos
naturales y slo una de los promiscuos.
Observar los que se unen podra hacer pensar que la clave es la primera regla, pero
de 3 pptidos que no se unen, 2 cumplen con las reglas 1 y 5, y 1 con la 1.
Las reglas definidas para las posiciones 3, 4, 6 y 7 no permiten diferenciar los pptidos
que se unen de los que no, pues tanto pptidos de unin como de no unin pertenecen
indistintamente a los conjuntos asociados a estas reglas. Los peptidos sintticos de no
unin cumplen con las reglas 2, 5, 6 y 7 y no se unen, mientras que la mayora de los
elementos de los conjuntos asociados a las reglas 1, 2 y 7 son pptidos de unin. La
caracterizacin para los pptidos que no se unen fue del 95,7%, mientras que para
aquellos que se unen, la caracterizacin fue del 100%.
En la tabla 1 se enuncian los pptidos estudiados y se sealan con puntos en las
casillas cuntas reglas cumplen. Para los pptidos sintticos ver tabla 2.

Tabla 1. Reglas que satisfacen las cadenas peptdicas naturales de unin y no unin y
las promiscuas

secuencias naturales de union


1

WRVDNRRGL
WTKLTSDYL
YDRADAGWL
YKKMEAVKL
FRNVDGSGL
YKLVKAKWL
YFQDPALLL
YQYLYAQKS
LRDFWGNPL
YRRLYNGLK
YAFLHATDL
FTGGIGNKL
MVGLAADWL
FDPLLAVAD

Secuencias de promiscuos
MRMATPLL
M
YVKQNTLKL
de no

LKAEIAQRL
IAKMKEKAS

LSDNYTLDH

Secuencias naturales
unin

AEQAKVFSH

VTLPAKFYR

FGSGIHKIR

QGRVFLKGG

ASLVITDLT

DTVVVALDL

GSVQYPITK
AGGQNTVPG

KDKSGFWDR
AFTSNFNGR

Tabla 2. Reglas que satisfacen las cadenas peptdicas sintticas

Secuencias naturales de unin


2
3
4
5
6 7 8

YRSMAAAAA

VRSMAAAAA

FRSMAAAAA

IRSMAAAAA

MRSMAAAAA

LRSMAAAAA

WRSMAAAAA

Secuencias sintticas de no unin


PRSMAAAAA
KRSMAAAAA
DRSMAAAAA
HRSMAAAAA
KRSMAAAAA
RRSMAAAAA
SRSMAAAAA
TRSMAAAAA
ARSMAAAAA
NRSMAAAAA
QRSMAAAAA
GRSMAAAAA

Discusin:
ste es el primer trabajo en el que se analiza la unin de pptidos al HLA clase II a travs
de teora de conjuntos. Se encontr un comportamiento caracterizable a partir de reglas
halladas experimentalmente en cualquier pptido nonamrico, diferenciando con
operaciones matemticas los pptidos de unin de los que no se unen. La interseccin y
unin de los conjuntos definidos para reglas especficas permiti caracterizar
matemticamente regiones centrales de unin al HLA clase II, obviando la especificidad
allica de los pptidos que se unen. Se caracterizaron correctamente los pptidos de
unin, logrando una especificacin para todos los que se unen y desarrollando una
metodologa aplicable a cualquier secuencia de aminocidos. La secuencia
LRDFWGNPL cumple con 5 reglas; sin embargo, experimentalmente no presenta unin,
constituyendo una excepcin a la caracterizacin desarrollada. Existen secuencias
peptdicas que cumplen con la mayora de las reglas y, sin embargo, no se unen al HLA,
lo que probablemente muestra que no hay una relacin causa consecuencia entre la
cantidad de reglas cumplidas y la unin, sino un orden matemtico subyacente, en este
caso, con la mirada de la teora de conjuntos que aporta relaciones acausales para
entender el fenmeno. Sin embargo, el resultado de todas formas privilegia al conjunto A
como eje fundamental de la unin. El predominio de este conjunto y su combinacin
con otros, a excepcin de (BF) explica el resultado hallado. Por ejemplo, es interesante
notar que se pueden cumplir la mayora de las reglas sin que se presente unin, como en

las secuencias sintticas de no unin. Se gener una comprensin y operatividad


matemtica, basada en la teora de conjuntos que da un sentido de versatilidad e
integracin a los motivo experimentales que, por separado, difcilmente explicaran el
fenmeno de unin. La distribucin heterognea en algunos de los pptidos promiscuos y
naturales, comparada con los sintticos, puede ser explicada por la mayor probabilidad
de hacerpuentes de hidrgeno respecto a los sintticos y a la versatilidad de la
combinacin de motivos, comparada con la bsqueda artificial sinttica para comprender
el fenmeno.
Trabajos anteriores en prediccin de unin de pptidos han utilizado Artificial Neural
Networks [13], programacin lineal, motivos o vectores de mquina [14-16]. Las
aplicaciones computacionales requieren de una gran cantidad de datos para su
entrenamiento y las predicciones de estas metodologas generalmente estn
condicionadas a la poblacin de pptidos estudiada.
Este trabajo es independiente de la poblacin y del anlisis aislado de las reglas
experimentales para corroborar la caracterizacin desarrollada. Por ejemplo, con las
reglas para las posiciones
3, 4, 6 y 7 no se encontraron diferencias entre los grupos. La interseccin de todos los
conjuntos formados por las distintas reglas asignadas a las cadenas peptdicas es un
conjunto vaco y no da cuenta del fenmeno de unin, lo cual sugiere que por ms reglas
experimentales que se establezcan, el fenmeno de unin no se aclarar sino que,
probablemente, la construccin de una teora enmarcada en una serie de leyes podra
explicar el fenmeno.
En trabajos experimentales anteriores [10] se presenta la dependencia de la energa de
unin con el tamao del pptido que generalmente vara entre 13 y 16 aminocidos;
dicha energa disminuye si se reduce la cantidad de aminocidos en la cadena
peptdica. Para compensar esta prdida en secuencias ms cortas, se introducen
aminocidos especficos en posiciones de ancla- je. A partir de estos resultados
experimentales sera posible disear antgenos sintticos que se presenten por
molculas de HLA clase II con las longitudes consideradas en este trabajo.
Esta metodologa se basa en una generalizacin, una relacin para las reglas empricas
halla- das, encontrando con 5 de 8 reglas, y sus nuevas relaciones, la caracterizacin de
los pptidos que se unen y los que no. En las teoras fundamentales de la fsica [17] no
hay causas sino rdenes fsicos matemticos acausales para la descripcin y
comprensin del fenmeno estudiado; en este trabajo, el fenmeno de unin es
estudiado de igual manera. Esta metodologa puede caracterizar cualquier posible
secuencia nonamrica, caracterizando de forma objetiva y reproducible la unin, lo cual,
probablemente, pueda ser til en el diseo matemtico de vacunas eficientes, por
ejemplo, para el cncer, entre otras. De esta manera, se racionalizaran los recursos en
su desarrollo, dejando de lado el mtodo de ensayo error en la experimentacin actual.
Adicionalmente, se agilizara este proceso y, posiblemente, constituira un primer paso en
la comprensin de la interaccin, ligando un receptor especfico de la biologa molecular,
lo que sera de vital importancia para cualquier aplicacin mdica y biolgica en el futuro.
ste es un primer acercamiento con un diseo terico que busca caracterizar lo esencial
y la simplicidad con muy pocos casos, proyectando la posibilidad o no de construir una
teora

predictiva para este fenmeno, como funciona la fsica terica. Esta caracterizacin,
aplicada a la unin de estas molculas, podra tener

la ventaja de generar una medida general para cualquier pptido frente a los actuales
mtodos de bioinformtica que se estn especializando por alelos, mejorando esta
metodologa. Ms importante, respecto a la bioinformtica, es ver el fenmeno acausal
tericamente y permitir una aproximacin desde la fsica y la matemtica para poder,
tal vez, lograr predicciones desde la construccin de una teora.
Aplicaciones futuras: se disear una prueba para medir la posibilidad predictiva de esta
metodologa con bases de datos experimentales.
Conclusiones
1.
La teora de conjuntos permite representar simultneamente, de manera
sistemtica, la presencia o ausencia de motivos combinados para caracterizar
matemticamente la versatilidad del fenmeno de unin.
2. El fenmeno de unin puede ser comprendido de una manera ms sinttica y general
por esta metodologa, a diferencia del tratamiento particular por el nmero de motivos
aislados en diferentes posiciones especficas.
Referencias:
1.
Hrbacek K, Jech T. Introduction to set theory. 3ra ed. New York: Marcel Dekker,
Inc; 1999.
2.
Wang JH, Reinherz EL. Structural basis of T-cell recognition of peptides bound to
MHC molecules. MolImmunol 2002 May 38(14):1039-49. Review.
3.- Abbas A, Lichtman A, Pober J. Inmunologa celular molecular. 4 ed. Madrid: McGraw
Hill-Interame- ricana de Espaa; 2002.
4.
Madden DR. The three-dimensional structure of peptide-MHC complexes.
Annu Rev Immunol 1995;13:587-6
5.
Fremont DH, Hendrickson WA, Marrack P, Kappler J. Structures of an MHC
class II molecule with covalently bound single peptides. Science 1996 May
17;272(5264):1001-4.
6.
Brown JH, Jardetzky TS, Gorga JC, Stern LJ, Urban RG, Strominger JL, Wiley
DC. 3-Dimensional structure of the human class-II histocompatibility antigen HLADR1.
Nature 1993;364:33-39.
7.
Stern LJ, Brown JH, Jardetzky TS, Gorga JC, Urban RG, Strominger JL, Wiley DC.
Crystal structure of the human class II MHC protein HLA-DR1 complexed with an
influenza virus peptide. Nature 1994 Mar
17;368(6468):215-21.
8.
Hammer J, Takacs B, Sinigaglia F. Identification of a motif for HLA-DR1 binding
peptides using M13
Display Libraries J Exp Med 1992 Oct 1;176(4):1007-13.
9.
Hammer J, Valsasnini P, Tolba K, Bolin D, Higelin J, Takacs B, Sinigaglia F.
Promiscuous and allele-specific anchors in HLA-DR-Binding Peptides. Cell 1993 Jul
16;74(1):197-203.
10. Hammer J, Belunis C, Bolin D, Papadopoulos J, Walsky R, Higelin J, Danho W,
Sinigaglia F, Nagy ZA.

High-affinity binding of short peptides to major histocompatibility complex class II


molecules by anchor combinations. Proc Natl Acad Sci U S A 1994 May 10;91(10):445660

11. Busch J, Strang G, Howland K, Rothbard J. Degenerate binding of immunogenic


peptides to HLA-DR
proteins on B cell surfaces. Int Immunol 1990;2:443-448.

11 / Rev. Cienc. Salud. Bogot (Colombia) 6 (1): 9-15, enero-abril de


2008

12. Rammensee HG, Friede T, Stevanovic S. MHC ligands and peptide motifs: first
listing. Immunogenetics
1995;41(4):178-228.
13. Zhao Y, Pinilla C, Valmori D, Martin R, Simon R. Application of support vector
machines for T-cell epitopes prediction. Bioinformatics 2003 Oct 12;19(15):1978-84.
14. Southwood S, Sidney J, Kondo A, del Guercio MF, Appella E, Hoffman S, Kubo RT,
Chesnut RW, Grey HM, Sette A. Several common HLA-DR types share largely
overlapping peptide binding repertoires. J Immunol 1998 Apr 1;160(7):3363-73.
15. Brusic V, Rudy G, Honeyman M, Hammer J, Harrison L. Prediction of MHC class
II-binding peptides using an evolutionary algorithm and artificial neural network.
Bioinformatics 1998;14:121-30.
16.
Dnnes1, P., & Elofsson, A. Prediction of MHC class I binding peptides, using
SVMHC. BMC Bioinfor- matics 2002;3:25.
17. Fernndez-Raada A. Orden y caos. Introduccin. Barcelona: Prensa Cientfica.
Investig Cienc 1990.
Bibliografa:
http://www.scielo.org.mx/cgi-bin/wxis.exe/iah/

Rev. Cienc. Salud. Bogot (Colombia) 6 (1): 9-15, enero-abril de 2008


Javier Rodrguez Velsquez

Conceptos:
pptido.1. m. Bioqum. Molcula formada por la unin
covalente de dos o ms aminocidos.
aminocido.1. m. Qum. Sustancia qumica orgnica en cuya
composicin molecular entran un grupo amino y otro carboxilo.
20 de tales sustancias son los componentes fundamentales de
las protenas.
peptdico, ca.1. adj. Bioqum. Perteneciente o relativo a los pptidos.
versti1. adj. Que se vuelve o se puede volver fcilmente.
2. adj. Capaz de adaptarse con facilidad y rapidez a diversas
funciones.
3. adj. De genio o carcter voluble e inconstante.

unin.1. f. Accin y efecto de unir o unirse.

2. f. Correspondencia y conformidad de una cosa con


otra, en el sitio o composicin.

disjuntos.
1. m. pl. Mat. Los que no tienen ningn elemento
comn.
~ vaco.
1. m. Mat. El que no contiene ningn elemento.
n conjunto.
1. loc. adv. En su totalidad, sin atender a detalles.

También podría gustarte