Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diseño de Farmacos Escalona PDF
Diseño de Farmacos Escalona PDF
racional de frmacos
615.19-Esc-D
Diseo racional de frmacos / Julio Csar Escalona Arranz, Ramn Carrasco Velar y Juan
Alexander Padrn Garca. -- Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978959-16-0647-1. 45 pg.
1. Escalona Arranz, J. C.
2. Carrasco Velar, R.
3. Padrn Garca, J. A.
4. Qumica Farmacutica
Edicin: Dr. C. Ral G. Torricella Morales
Correccin: Luz Mara Rodrguez Cabral
Ministerio de Educacin Superior de la Repblica de Cuba,
2008
Editorial Universitaria, 2008
La Editorial Universitaria publica bajo licencia Creative Commons de tipo Reconocimiento
No Comercial Sin Obra Derivada, se permite su copia y distribucin por cualquier
medio siempre que mantenga el reconocimiento de sus autores, no haga uso
comercial de las obras y no realice ninguna modificacin de ellas. La licencia
completa puede consultarse en:
http://creativecommons.org/licenses/by-nc-nd/2.5/ar/legalcode
ISBN 978-959-16-0647-1
Editorial Universitaria
Calle 23 entre F y G, No. 564
El Vedado, Ciudad de La Habana
Cuba CP 10400
e-mail: torri@reduniv.edu.cu
Sitio Web: http://revistas.mes.edu.cu
Nota a la Edicin
El presente texto surge como resultado directo de los trabajos realizados en la tesis: Nuevos
descriptores atmicos y moleculares para estudios de estructura-acitividad. Aplicaciones, de Ramn
Carrasco Velar. El trabajo directo con los alumnos y el conocimiento de la necesidad de aprendizaje de
los mismos ha llevado a los autores a elaborar este libro, el cual constituye una herramienta para quienes
pretendan adentrarse en el campo del diseo de frmacos con la ayuda de la computador. Espero que
les sea de utilidad.
El Editor
ndice
INTRODUCCION
12
38
INTRODUCCION
La historia del medicamento se remonta a los orgenes de la sociedad humana. Desde los primeros
tiempos el hombre ha acudido a la naturaleza para obtener sustancias que, o bien le ayudaran a paliar
su dolor, los sntomas de sus enfermedades... o bien le facilitaran la obtencin del alimento (veneno
para la caza), sus relaciones sociales y religiosas (estimulantes y alucingenos), etc. Esta
circunstancia ha permitido disponer de una amplia informacin, que sometida a la observacin atenta
y al estudio crtico, ha dado lugar al planteamiento de ideas que, debidamente desarrolladas, han
llevado a la obtencin de nuevos medicamentos, de sustancias lderes. Esta historia previa es la causa
de que en la actualidad, el modelo de aproximadamente la mitad de los productos de que se dispone
sea de origen natural. Modelos que, obtenidos a partir de un organismo vivo, han sufrido diferentes
modificaciones en el laboratorio, encaminadas a obtener molculas ms potentes y menos txicas que
las originales, las cuales en realidad no haban sido diseadas para un tratamiento especfico.
El descubrimiento de un nuevo medicamento y su desarrollo posterior, son dos fases que condicionan
el logro de un nuevo producto, til en la teraputica. Se considera, de manera general, que el
descubrimiento comprende toda la fase necesaria para que podamos asegurar que el compuesto tiene
un perfil deseable de actividad; comprende desde la sntesis, el aislamiento de la fuente natural, o la
obtencin biotecnolgica y toda la fase preclnica, incluida la toxicologa; de manera tal que nos
confirmen que el compuesto es aceptable en cuanto eficacia y seguridad para su ensayo en seres
humanos. Comprende en un sentido ms amplio, un gran conjunto de actos que culminan en la
utilizacin teraputica de un nuevo medicamento (Figura1).
Esta fase de descubrimiento, o sea, desde la obtencin hasta la primera aplicacin en humanos, se
estima que dura aproximadamente 42,6 meses (3,55 aos) como promedio, en aquellos pases y
transnacionales farmacuticas con una amplia infraestructura investigativa. En pases con un nivel
menor de desarrollo, esta fase alcanza aproximadamente unos 5-6 aos.
La fase de desarrollo comprende la de los estudios clnicos y la del registro farmacutico, y se estima
que duren entre 68.6 meses y 30.3 meses respectivamente. Todo este largo proceso, desde su
obtencin hasta su registro comprende un total de 11.8 aos de investigacin, con un costo promedio
de 231 millones de dlares por cada nuevo medicamento que salga al mercado.
Lo ms alarmante es que slo una de cada 10 000 molculas ensayadas pasa a la fase de desarrollo,
una de cada 100 000 supera los ensayos clnicos y logra registrarse y slo 3 de cada 10 nuevos
medicamentos registrados recupera su inversin inicial. Esto genera una triste realidad, por cada
milln de molculas que se inician en esta larga cadena para la obtencin de un nuevo medicamento,
slo tres recuperan la inversin inicial. Por tal motivo el diseo racional de frmacos, constituye una
herramienta casi indispensable en el desarrollo actual de nuevos medicamentos, contribuyendo a un
aumento de las posibilidades de xitos y a un decrecimiento de los costos.
Estudio de tolerancia
Teratogenicidad
(dos especies)
Preparacin Farmacutica
Estudios de
tolerancia local
Tcnicas
estandarizadas
Tcnicas
comparadas
Farmacodinmica
Efectos
secundarios
Espectro de
actividad
Estudios
microbiolgicos
adicionales
Propuesta de dosis y niveles de dosificacin
INICIO DE LA FARMACOLOGA
Figura1. Fases necesarias para la generacin de un nuevo medicamento.
En tal sentido, la unin internacional de qumica pura y aplicada (IUPAC) public en ese mismo ao
1995 el conjunto de cualidades que deseaban los representantes de las principales compaas
farmacuticas que tuvieran sus qumicos farmacuticos2. Estas habilidades son:
Capacidad de insercin en grupos interdisciplinarios, como interface entre los cientficos del rea
biolgica (farmacologa, bioqumica, biologa molecular etc.)
Habilidad en la bsqueda de nuevos frmacos.
Conocimiento de cmo sintetizar molculas convenientes a ser evaluadas en ensayos biolgicos.
Entendimiento de las razones y la necesidad de porqu generar nuevos compuestos.
Conocimiento del diseo de frmacos.
Perspicacia a la hora de establecer relaciones de estructura-actividad, an con insuficientes datos.
Conocimiento de campos colaterales (fisiopatologa, biologa celular y gentica)
Rpida familiarizacin con las nuevas tecnologas.
I.2 METODOS VARIACIONALES.
En este acpite se considerar de forma breve con algunos ejemplos, la metodologa de este enfoque,
las circunstancias y cadenas de hechos que llevan al descubrimiento de nuevos compuestos
considerados como lderes o cabezas de serie y su posterior desarrollo, la aplicacin en definitiva, de
las tcnicas que de forma general se conocen como Variaciones estructurales.
I.2.1
Aunque en la bsqueda de una cabeza de serie se pueden aplicar varios mtodos los ms empleados
son:
El empleo de productos activos presentes en drogas utilizadas en la medicina tradicional.
Estudio de nuevos compuestos provenientes de la sntesis qumica o de la biotecnologa.
Ambos mtodos requieren de la existencia previa de una amplia batera de ensayos biolgicos
cuidadosamente diseados, que permitan determinar con rapidez y de manera inequvoca la
actividad biolgica de los nuevos compuestos.
En el caso de estudios de compuestos empleados en la medicina tradicional, es ms fcil, en
principio, el diseo de la prueba biolgica, ya que se cuenta con informacin previa de la actividad
prevista; se trata de comprobar simplemente de manera cientfica el empleo popular. Sin embargo,
cuando se desconoce la posible actividad, la batera de ensayos ha de ser lo suficientemente amplia,
en el intento de no perder ninguna informacin interesante. Lamentablemente, los costos asociados a
este tipo de estudios hacen que estos se vean limitados en nmero y en el espectro de acciones
biolgicas.
Otras vas de obtener un compuesto lder o cabeza de serie son:
Ganellin, CR., Mitscher, LA., Topolis, IG. Annu. Rep. Med. Chem., Vol 30, 1996.
A estas informaciones se le pueden unir, como se plante anteriormente, las obtenidas del estudio
del mecanismo de accin de los compuestos, as como consideraciones relativas a la bioqumica de
la enfermedad y procesos del organismo enfermo sobre el cual van a actuar los productos.
I.2.2
Una vez encontrada y definida la cabeza de serie se hace necesario la exploracin de la serie por
modulacin de su estructura con el fin de encontrar un producto mejor. El objetivo que se propone es
encontrar nuevos y mejores medicamentos con superior actividad, mejor biodisponibilidad, menor
toxicidad y reacciones secundarias mnimas. O sea, en otras palabras se refiere a qu voy a
modificar en el compuesto lder?. Esto se conoce como Variacin Molecular.
En la finalidad de esta tcnica se pueden distinguir:
a. Proteccin frente a la accin de sistemas enzimticos: Las -lactamasas son enzimas que
desdoblan el ncleo -lactmico de penicilinas y cefalosporinas inactivndolas. Para eso ocurre
una reaccin entre el grupo hidroxilo de un resto serina de la enzima que realiza un ataque
nucleoflico sobre el tomo de carbono carbonlico del anillo -lactmico. El grupo sustituyente
en la posicin 7 del anillo cefalospornico, juega un papel primordial para lograr la conformacin
espacial que impida la accin de las -lactamasas. Obsrvese que la sola sustitucin en R de un
=N-OH por un =N-OCH3 hace que disminuya 100 veces la potencia de los compuestos, debido a
una disposicin espacial diferente, que en el caso de los segundos, no logra impedir el ataque de
la enzima.
S
H2N
N
CCOHN
R'
O
7
N
R3
-
COO
R3
-(CH)2CH2OCONH2
-(CH)2CH2OCONH-CH3
-(CH)2CH2OCONH2
-(CH)2CH2OCONH-CH3
E. coli
S. aureus
=NOH
=NOH
=NOCH3
=NOCH3
MIC
0.025
0.025
0.2
0.2
MIC
0.1
0.1
0.8
0.8
HOOC CH CH2
NH2
CH2CH2CL
CH2CH2CL
(II)
8
+
N(CH3)2
NCH3
O
C CH
O
C CH
CH2OH
CH2OH
(III)
I.2.3
(IV)
En este tpico se enumerarn algunas de las estrategias a seguir para aumentar la eficacia del
compuesto lder. La pregunta ahora es: cmo modificar el compuesto lder?. Entre las estrategias
ms comunes se encuentran:
I.2.3.1 Sustitucin bioisotrica.
En un enunciado un tanto simplista, es razonable el hecho de que compuestos con una misma
actividad biolgica, deban poseer tambin una misma estructura, o al menos puntos comunes en las
partes responsables de la actividad, por lo que la sustitucin de grupos con igual distribucin
electrnica en la ltima capa e igual deslocalizacin del orbital puede conducir a la obtencin de
nuevos compuestos de inters farmacolgico.
Este mtodo es aplicable a las sulfas antibacterianas (V), en la cual la similitud electrnica del grupo
sulfamida al grupo carboxilo del cido p-aminobenzoico (PABA) (VI) provoca la equivocacin de
la bacteria. Ahora bien, no siempre las sustituciones bioisostricas generan una equidad en cuanto a
actividad. Ejemplos de este caso lo representan los antibiticos -lactmicos, en la serie de las
penemas (VII), oxapenemas (VIII) y carbapenemas (IX), en los que el cambio del tomo de azufre
por el de oxgeno, aumenta la reactividad del anillo -lactmico y lo convierte en una molcula
suicida que inactiva a las -lactamasas. La sustitucin entonces del oxgeno por el etileno (CH2)
disminuye nuevamente esta reactividad, incluso a valores inferiores que los de las penemas, por lo
que genera molculas menos activas, aunque an con utilidad farmacolgica.
En general, el trmino bioisosterismo se aplica para todo el conjunto de analogas que se pueden
establecer entre dos agrupaciones atmicas, incluyendo tanto elementos estricos como electrnicos,
y en general, todos cuantos sirvan para definir la estructura de una molcula.
O
O
C
NHR
S
H2N
H2N
O
O
(V)
S
R
O
(VII)
(VI)
O
R
COOH
R
COOH
(VIII)
(IX)
COOH
N
CH2
CH2
CH2
CH2
CH2
N(CH3)2
N(CH3)2
Imipramina
Promazina
CH3
HO
HO
OH
Morfina
N
Levofenol
CH 3
H 3C
CH 3
CH3
C OC2H 5
OC2H5
Meperidina
Metadona
10
Unin de elementos activos: Se trata de unir en una molcula, restos que han demostrado ser
activos en otras molculas.
De este tipo de estudio se desprende una evolucin en el peso relativo de las diferentes ciencias
implicadas en el diseo de nuevos medicamentos. Se observa en primer lugar un aumento progresivo
en la importancia que tienen los mtodos biolgicos como elemento de apoyo y decisin en el
planteamiento de las estrategias de sntesis, llegando a ser autnticas piezas claves en muchos casos.
Tambin se deduce la necesidad de disponer de tcnicas cada vez ms avanzadas en el campo del
anlisis instrumental, como base para la elucidacin estructural de los nuevos compuestos. Y siempre
como elemento fundamental, la colaboracin estrecha entre investigadores de diferentes
profesiones por la posibilidad de ofrecer puntos de vistas desde diferentes perspectivas.
.
I.3 SITUACIN ACTUAL Y TENDENCIAS FUTURAS.
Los avances previsibles en el campo de la biotecnologa, la biologa molecular y ciencias afines,
estn dando un nuevo enfoque al diseo de medicamentos. Por otro lado, la ingeniera gentica ha
ido ganando un espacio cada vez ms slido en la industria farmacutica fundamentalmente a partir
del ao 1993. Hacia finales del ao 1995 ya eran 180 los contratos de colaboracin firmados entre
compaa-compaa y compaa- instituto de investigacin en el rea de la ingeniera gentica y esta
cifra contina creciendo, involucrando cada vez ms a las principales transnacionales farmacuticas3.
Las principales asociaciones se resumen en la siguiente tabla:
Tabla 1 Principales contratos compaa farmacutica compaa de investigacin gentica.
Programa Gentico
Proyecto Genoma
Humano (HGS)
Incyte
Pharmaceuticals
Washington
University
Milleninium
Pharmaceuticals
Myriad Genetics
Sequana Therapeutics
Darwin Molecular Co.
Industria
Farmacutica
Takeda
E Merk
Pfizer
Abbott
Johnson & Johnson
Roche
BASF
Merck (USA)
Eli Lilly
Roche
Bayer
GlaxoWellcome
Rhne-Poulenc Rorer
11
12
E = E r + E + E + EVDW + E D + E H
Ecuacin 1.
donde Er define las deformaciones de la longitud de enlace (acortamiento-alargamiento), E se
relaciona con las distorsiones del ngulo de enlace, E es la energa de torsin del ngulo diedro por
rotacin de los enlaces y EVDW, ED y EH consideran las contribuciones de las interacciones de Van der
Walls, las repulsiones electrostticas y las asociaciones por puentes de hidrgeno, respectivamente.
Dado que la mecnica molecular supone una interpolacin de los datos experimentales existentes,
generalmente predice correctamente las geometras moleculares de los compuestos bajo estudio.
Estas geometras optimizadas se pueden utilizar como datos de entrada para los clculos mecnico
cunticos con el objetivo de comenzar la optimizacin total con una estructura previamente refinada.
Adems su uso principal en la actualidad es en el campo de las macromolculas, en las cuales los
mtodos de clculos mecnico-cunticos se tornan prohibitivos en cuanto a costo computacional
Por otra parte, el tratamiento cuntico de la materia esta basada en el principio de incertidumbre de
Heisenberg, segn el cual no es posible conocer simultneamente la posicin y el momento de una
13
partcula. Por esto es necesario abordar el problema desde el punto de vista estadstico, dada la
necesidad de poder encontrar una partcula en un lugar determinado y en un momento dado.
Otro concepto fundamental de la mecnica cuntica es que todas las cantidades dinmicas asociadas
a cada partcula estn cuantificadas. La energa de una partcula tiene un valor discreto, el cual es
mltiplo de una energa bsica y la constante de Plank. La ecuacin fundamental es la de
Schrdinger, que para el tomo de hidrgeno viene dada por la ecuacin:
14
15
los anteriores, pero todava existe una reduccin sustancial de las repulsiones electrnicas,
utilizando un conjunto mnimo de electrones de valencia, obviando todas las integrales que
implican el solapamiento de orbitales atmicos, excepto las integrales de resonancia
monocntricas y las integrales monocntricas de intercambio. En estos mtodos y en el mtodo
CNDO, las integrales de repulsin entre los orbitales atmicos del tomo A y cualquiera del
tomo B, forman un conjunto igual, tanto si son del tipo s, p, .
Los mtodos M.N.D.O (modified neglect of diatomic overlap), el AM1 (Austin model 1) y el
PM3 (parametric model 3) estn basados en la correcta inclusin del solapamiento de un centro,
negando u obviando solamente el solapamiento diferencial diatmico. A diferencia de los
mtodos CNDO, INDO y MINDO estos mtodos consideran un nmero adicional de integrales
bicntricas. As, para cada par de tomos no similares es necesario calcular 22 integrales a
diferencia de una nica integral a calcular en los mtodos CNDO, INDO y MINDO. Segn
Dewar, autor de los mtodos MNDO y AM1, el mtodo MNDO no describe correctamente la
energa de los enlaces por puentes de hidrgeno ni la de los aniones, as como sobrestima las
repulsiones electrnicas. Estas dificultades son mejoradas por el mtodo AM1 sin que ello
incremente el tiempo de cmputo. Posteriormente Stewart, uno de los colaboradores de Dewar
realiz una reparametrizacin del mtodo AM1 generando as el PM3. No obstante no se ha
logrado demostrar la superioridad de uno con respecto al otro (AM1 y PM3), por lo que en la
literatura actual es comn encontrarse trabajos que utilizan uno u otro mtodo indistintamente, sin
que eso atente contra la calidad de los resultados.
Por los motivos anteriormente descritos, los mtodos semiempricos han tenido un amplio uso en el
diseo de frmacos, toda vez que son mtodos que reproducen en gran medida las propiedades reales
de las molculas, invirtiendo para ello, poco tiempo de clculo; a diferencia de los mtodos ab initio
en los que el tiempo de clculo resulta en realidad una gran limitante. Sin embargo, es necesario
resaltar que los clculos ab initio son los que reproducen con mayor fiabilidad las caractersticas
estructurales de las molculas, divergiendo en no ms de un 2% con respecto a los datos
experimentales.
II.2 TECNICAS SAR O MODELACION MOLECULAR EN EL DESARROLLO DE
NUEVOS FARMACOS
De manera general, los mtodos que relacionan la estructura qumica con la actividad biolgica
asistidos por computadoras pueden dividirse en dos grandes categoras: los Mtodos de Modelacin
Molecular SAR (Structure Activity-Relationships) y los Mtodos QSAR (Quantitative Structure
Activity-Relationships).
Los mtodos SAR (Structure Activity-Relationships) consideran las propiedades de las molculas en
tres dimensiones y son importantes en ellos aspectos como el anlisis conformacional, la mecnicacuntica, los campos de fuerzas y los grficos moleculares interactivos. Estos ltimos permiten la
representacin y la manipulacin de la molcula en tres dimensiones, lo que proporciona una
informacin espacial que es esencial para comparar molculas y para estudiar la interaccin entre
ligandos y receptores macromoleculares. Estos estudios SAR son utilizados no slo en el diseo de
nuevos frmacos, sino que es aplicable al estudio de mecanismos de accin de los frmacos y a otras
ramas de la ciencia como la ingeniera de proteinas y la qumica de polmeros.
16
17
18
explicacin alternativa posible sera entonces el anlisis del volumen molecular de la misma. Si este
volumen es superior al calculado para el resto de las molculas, entonces esta seria una causa
razonable de la inactividad del mismo.
Si el conjunto de molculas estudiadas es lo suficientemente grande, se pueden llegar a determinar
mapas de volumen para diversos receptores, cuya comparacin puede permitir optimizar la actividad
de un compuesto con respecto a otro. Esta metodologa sirve para caracterizar la topografa de
receptores de los cuales no se conoce su estructura tridimensional, al permitir determinar tanto el
volumen asequible al farmacforo como el volumen adyacente que debe ser excluido de los ligandos.
Sobre esta base, Lloyd en 1986, lleg a proponer una estructura farmacfora comn para 14 clases
diferentes de frmacos que actan sobre el SNC.
Anlisis conformacional y quimiometra
El anlisis conformacional puede ser tratado como un problema multidimensional si se construyen
mapas de distancias y de torsin angular de los confrmeros obtenidos. Las matrices as obtenidas
son transformadas o simplificadas utilizando mtodos estadsticos clsicos como el anlisis de
componentes principales, anlisis factorial o por tcnicas clusters. Estos procedimientos son
conocidos como mtodos quimiomtricos y tienen como objetivo disminuir el nmero de variables a
analizar.
Este tipo de estudio necesita de un anlisis conformacional riguroso de cada una de las molculas a
analizar, pues puede ser que para un determinado frmaco, la conformacin activa no sea la ms
estable termodinmicamente, debido a que la energa libre de asociacin supera generalmente la
energa necesaria para que el ligando sufra un cambio conformacional. Esta limitante, hace que este
tipo de estudio sea muy complicado y que los resultados a obtener no sean siempre satisfactorios,
pues cada conformacin energticamente accesible, presupone una disposicin tridimensional
diferente de los grupos candidatos a interaccionar con el receptor. Es por eso que este tipo de anlisis
debe ir siempre acompaado de un mtodo quimiomtrico, en aras de reducir el nmero de
conformaciones a analizar.
Una forma comn de paliar esta dificultad es la bsqueda de un anlogo rgido que tenga este mismo
mecanismo de accin, plegando el resto de las molculas a la conformacin impuesta por l. No
obstante, existen casos en los que no se dispone de un anlogo de este tipo y otros, en los que este
anlogo rgido no es tan efectivo famacolgicamente, generando resultados, en este ltimo caso, con
un grado de error proporcional al grado de afinidad presentado por esta molcula.
Determinacin de las distancias geomtricas.
Este mtodo desarrollado inicialmente por Crippen y col.6 necesita de un riguroso anlisis
conformacional. En este tipo de estudio se proponen por superposicin molecular, distancias ptimas
a las que se deben encontrar los grupos capaces de interaccionar con el blanco molecular. Como la
matriz de distancia no vara ni con la rotacin ni con la traslacin, tambin es aplicable la
superposicin con anlogos rgidos. Con la informacin del volumen molecular anteriormente
descrito, se pueden adems dar explicaciones acerca de las diferencias entre agonistas y antagonistas.
6
19
Cuando la geometra y la naturaleza del sitio de unin se han calculado, es posible obtener por
diseo, compuestos con mayor capacidad de unin al receptor, pudindose calcular adems, la
energa de unin y predecir la energa con la que el nuevo compuesto interaccionar con el blanco
molecular. Como complemento, se han diseado algoritmos computarizados para buscar nuevas
clases de compuestos con una determinada actividad, comparando bibliotecas de fragmentos
moleculares de estructuras conocidas y seleccionando aquellas que mayores posibilidades tienen de
ajustarse a las medidas previamente calculadas para el sitio de unin.
Determinacin de los potenciales electrostticos moleculares.
Para que ocurra la formacin del complejo ligando-receptor, debe ocurrir el reconocimiento del
potencial electrosttico del ligando por el receptor. Esto hace que este tipo de estudio brinde una
informacin importante a la hora de determinar el farmacforo.
El clculo del mapa del potencial electrosttico de una molcula puede ser llevado a cabo por
mtodos de clculo mecnico-cunticos, ab initio o por mtodos de clculos de carga basados en el
incremento de la electronegatividad. No obstante, debe tenerse en cuenta en el anlisis
conformacional que se realice, que el potencial electrosttico es altamente dependiente de la
conformacin adoptada por el ligando, y por tanto, los resultados derivados de l dependern en gran
medida de los confrmeros empleados en el establecimiento del farmacforo y de la efectividad del
mtodo empleado para el anlisis conformacional.
Criterios de calidad de los modelos de farmacforos. Alcances y limitaciones
Independientemente de los resultados que estos tipos de anlisis generen, la calidad en la obtencin
de los farmacforos es menor que en aquellos casos en los que la estructura del blanco farmacolgico
es conocida, por lo que su contribucin al descubrimiento de nuevas molculas tiene un alcance
limitado. No obstante, en la actualidad las principales determinaciones de estas secuencias se realizan
con la utilizacin de estos mtodos, por la generalmente escasa informacin sobre las molculas
dianas.
Un modelo farmacforo ideal debe ser lo suficiente explicativo y predictivo para poder llenar los
siguientes criterios:7
1. Incluir y explicar las diversas series de compuestos qumicos reconocidos como activantes del
receptor en estudio.
2. Contener al menos un representante rgido y por otro lado representantes flexibles en los que las
conformaciones de mnima energa y otras conformaciones secundarias puedan ser analizadas.
3. Debe proponer la razn de la prdida de actividad en los anlogos inactivos con respecto a las
estructuras activas.
4. Debe ser capaz de discriminar estereoismeros, pues la estereoespecificidad es la principal
caracterstica de los receptores.
5. Debe ser distintivo entre agonistas y antagonistas.
7
Wermuth, CG., Langer, T. Pharmacophore identification, 3D QSAR in drug design, Cap I. Ed. Leiden, Germany,
1993.
20
21
Otra de las utilidades que brinda el conocimiento de los receptores estriba en la posibilidad de
estudiar la naturaleza de otras estructuras o receptores anlogas a l cuya estructura tridimensional se
desconozca. Esta tcnica se conoce como modelado de receptores farmacolgicos.
Teniendo en cuenta que la mayora de los datos de proteinas provienen de cristalografa de rayos X,
la cual se obtiene en estado cristalino, hace que el modelado de proteinas o de receptores
farmacolgicos afronte dos problemas bsicos:
1. El nmero de conformaciones en una proteina es enorme. Por ejemplo un receptor de tamao
pequeo, 250 aminocidos, posee unos 750 grados de libertad de ngulos torsionales. Si cada uno
de estos ngulos, tiene acceso a slo 4 valores de mnimos energticos el nmero terico de
conformaciones a adoptar por la proteina ser de 4750. Esto no ocurre cuando se dispone de datos
de RMN, que brinda los datos de los aspectos dinmicos del movimiento interno de la proteina.
Las tcnicas actuales de cristalografa de rayos X a baja resolucin han logrado mejorar estos
resultados.
2. La descripcin terica de la interaccin entre los tomos de una proteina requiere la formulacin
precisa de un potencial o campo de fuerza emprico que contengan trminos para representar los
enlaces covalentes, los ngulos de enlaces de hidrgeno, y las interacciones electrostticas y de
van der Waals. En la actualidad estos programas no son capaces de predecir a partir de una
estructura primaria la estructura tridimensional.
No obstante estas limitaciones, es posible predecir la estructura y propiedades de una proteina a
partir de la estructura tridimensional de otra proteina con un porciento de analoga razonable. De
esta forma se lograr tener la estructura aproximada de una proteina no conocida y por tanto
disear nuevos ligandos capaces de acoplarse al centro activo de la misma.
II.2.2 Consideraciones Finales
El modelado molecular contina su evolucin aplicando una gran variedad de mtodos
computacionales al problema de identificar las complejas relaciones existentes entre estructuras
moleculares y actividades biolgicas en cuanto a interacciones entre los tomos constituyentes. La
introduccin de nuevos mtodos de clculo y de computadoras cada vez ms potentes, generarn sin
dudas nuevos resultados que culminarn con la obtencin de estructuras novedosas cada vez ms
potentes y selectivas.
II.3 TECNICAS QSAR EN EL DESARROLLO DE NUEVOS FARMACOS
Estos mtodos estn basados en el empleo de tcnicas de correlacin entre la estructura qumica y la
actividad biolgica. En este tipo de tcnica, a las que el uso comn han designado con las siglas
QSAR (derivadas del trmino anglfono Quantitative Structure-Activity Relationships)8, la actividad
biolgica es interpretada como funcin de diferentes aspectos de la estructura qumica, y por lo tanto
dependiente de sta como se analizar ms adelante.
. Kubinyi H., Methods and Principles in Medical Chemistry Vol. 1. QSAR: Hansch Analysis and related approaches.
Editorial: VCH Verlag. RFA y VCH Publishers NY USA. Editor, H.F.Hebel, (1993).
22
La actividad biolgica del frmaco, producto de su interaccin con el receptor, es una funcin de las
caractersticas estructurales de la molcula. El modelo extratermodinmico de Hansch brinda una
explicacin matemtica del fenmeno en la siguiente ecuacin:
donde A es la actividad y fh(Xh), fe(Xe), fs(Xs) son funciones de ndices o parmetros hidrofbicos,
electrnicos o estricos respectivamente. El trmino extratermodinmico proviene de que las
relaciones se describen en trminos termodinmicos, aunque no se deducen de sus leyes.
Las aspectos fundamentales de la metodologa extratermodinmica pueden formalizarse en una serie
de puntos, la mayora de los cuales se extraen de la ecuacin fundamental, y es lo que se conoce
como el paradigma de Hansch, que establece que:
1. La actividad biolgica es funcin de la estructura del frmaco.
2. La estructura del frmaco implica ciertas propiedades globales como la hidrofobicidad,
refractividad molar, y solubilidad entre otras; y ciertas propiedades locales como la distribucin
de la hidrofobicidad, carga y volumen en determinadas posiciones de la molcula.
3. Estas propiedades globales y locales pueden ser cuantificadas mediante ciertos parmetros.
4. Siempre existe una funcin que relaciona los cambios de actividad biolgica con los cambios en
las propiedades globales y locales, aunque puede ser que no sea sencilla ni evidente.
Las funciones estructura-actividad que propone el mtodo extratermodinmico, constituye un mtodo
mediante el cual se pueden buscar los productos ms activos entre un conjunto de candidatos.
La metodologa de investigacin en el QSAR sigue, independientemente del modelo que se utilice,
pasos comunes que se hallan resumidos en la figura # 4. El punto de partida implica en todos los
casos la existencia de una cabeza de serie. Este producto, aunque reviste inters como modelo a
desarrollar, tiene propiedades susceptibles a ser mejoradas en aras de obtener siempre un producto lo
ms biodisponible posible.
Cuando se dispone de un prototipo, es preciso disear una serie de exploracin, que debe estar
constituida por un conjunto de anlogos del prototipo, para establecer las primeras relaciones
estructura-actividad. Los miembros de la serie de exploracin han de ser sintetizados y evaluados en
la actividad biolgica de inters.
Los miembros de la serie de exploracin estn constituidos por un ncleo comn, y unos
sustituyentes o fragmentos variables, que son caractersticos de cada producto de la serie. Dichos
sustituyentes variables han de ser identificados por descriptores, que sern utilizados como variables
independientes (Xi) en el modelo. Los valores de actividad biolgica (A) expresados regularmente
en forma logaritmica- se utilizan como variable dependiente.
23
Serie de exploracin
Identificacin
Sustituyentes
Actividad
Biolgica
Tratamiento de la muestra
Modelo matemtico
Productos ptimos
24
serie. Una serie en a cual las correlaciones entre los parmetros son mnimas se dice que la serie
es ortogonal.
Una vez definida y evaluada la actividad biolgica de la serie de experimentacin se procede al
tratamiento de la muestra, de la cual se obtiene un modelo matemtico que permitir predecir uno o
varios compuestos a los que les sern evaluadas sus actividades biolgicas y reincorporados, en caso
de no presentar una actividad ptima, a la serie de exploracin. Este proceso se repetir el nmero de
veces necesarias hasta lograr la eficacia esperada para el frmaco a obtener.
II.3.2 Tipos de estudios QSAR.
En la actualidad existen diferentes tcnicas por las que se puede desarrollar un estudio QSAR en
dependencia del tipo de tratamiento matemtico que se le d a la muestra y se pueden clasificar en:
QSAR tradicional
QSAR por redes de neuronas
QSAR tridimensional
25
entonces para el especialista consiste en poder asignar a esas componentes una significacin qumicofsica o estructural. Recordemos que cada una de ellas es el resultado de la combinacin lneal de
todos los descriptores, con sus respectivos pesos.
El anlisis de regresin mltiple, como se plante anteriormente, es el ms utilizado dentro del
QSAR tradicional. En l, una vez de establecidos los conjuntos de valores de las variables
independientes Xi y la actividad biolgica A, se obtiene un modelo en forma de ecuacin de una recta
(ecuacin 4), la cual describe la dependencia de la actividad (A) en funcin del conjunto de
descriptores (Xi) as como la magnitud de las contribuciones de cada uno de ellos.
A=f(Xi) + cte.
Ecuacin 4.
El modelo as obtenido ha de ser analizado en funcin de su calidad estadstica, para poder evaluar su
capacidad de prediccin. Cuanta mayor calidad estadstica tenga el modelo, ms confiables y exactas
sern las predicciones a realizar.
La calidad estadstica de un modelo se evala por diferentes estadgrafos. Los ms comnmente
aceptados son el coeficiente de regresin r, el valor F de Fischer y la desviacin estndar s. Cuanto
ms tienda a la unidad el valor de r, mejor ajuste tendrn los datos al modelo. El valor F correlaciona
la varianza explicada (r2) por el nmero de grados de libertad, con la varianza no explicada (1- r2)
por el nmero de variables del modelo. Cuanto ms alto es el porcentaje de varianza explicada por el
modelo mayor ser el valor de F, mientras que la existencia de variables con baja contribucin a la
explicacin de la varianza, tendern a disminuir dicho valor, que tiende a infinito en los mejores
modelos. La desviacin estndar s depende de la varianza no explicada y de los grados de libertad del
modelo y es una medida de cuanto se alejan los valores predichos por el modelo de la lnea, plano o
hiperplano. La tendencia a cero de este valor pudiera presuponer mayor calidad en la prediccin. Sin
embargo, esto puede conducir a modelos sobrepredictivos en los cuales se refleje exactamente el
comportamiento de la muestra pero que no sea posible utilizarlo para la extrapolacin de valores en
el caso de la prediccin de nuevos compuestos. Un valor de s es vlido cuando est en el mismo
orden de magnitud del error experimental de las mediciones de la variable dependiente (la actividad
biolgica).
En la ecuacin 5 se muestra el modelo de regresin lneal mltiple obtenido por nuestro grupo de
investigacin al correlacionar los datos reportados de actividad bactericida de un grupo de alcoholes
alifticos.
log MIC=31.88(6.95)**-2.10(0.17)P1QC***+2.16(0.62)EHOMO**
N=12
R=0.97
F=74.22
S=0.44
Ecuacin 5
Como se puede observar en esta ecuacin, la actividad bactericida, expresada como funcin
logartmica de la concentracin mnima inhibitoria (log MIC), es una funcin de dos ndices que
describen las caractersticas estructurales de la muestra de 12 alcoholes (n=12). Segn establece esta
ecuacin, la actividad aumentara con un decrecimiento en los valores del ndice P1QC, el cual slo
admite por definicin valores positivos, (observe el signo negativo delante del valor de la variable).
26
27
En dependencia de la naturaleza de los residuales y de los datos, as como del inters del
investigador, se seleccionar el tipo o los tipos de error a reportar. Cada uno de ellos brinda una
informacin que puede ser vlida en el anlisis de los resultados. Adems, en un estudio estadstico
determinado, no todos los integrantes de la muestra se ajustan necesariamente al modelo. La razn
puede ser, desde una mala seleccin de la muestra, hasta un comportamiento diferente en el medio
biolgico, por actuar por un mecanismo distinto o por enmascararse la actividad con reacciones
competitivas que sustraen al compuesto del medio. Otra razn puede ser la incapacidad de los
descriptores empleados (variables independientes) de reflejar los aspectos estructurales de inters en
un compuesto especfico. Todo esto hace que en un momento determinado, un elemento no se ajuste
a la recta, plano o hiperplano que describe el modelo. Toca entonces definir si ese comportamiento
que lo sita como outlier estadstico se debe a algo casual.
Outliers estadsticos son por definicin observaciones atpicas no frecuentes. Por la forma en que se
determina la lnea de regresin en la Regresin Mltiple, los outliers tienen una profunda influencia
en la pendiente de la lnea de regresin y en consecuencia, sobre el valor del coeficiente de
correlacin. Incluso un solo outlier es capaz de provocar estos cambios. Ellos representan errores al
azar que debemos ser capaces de controlar, pues pueden ser capaces no slo de incrementar el valor
de un coeficiente de correlacin sino tambin de disminuirlo. Por eso se recurre a lo que se conoce
como Anlisis de Residuales en el que se decide la exclusin o permanencia de del compuesto en
cuestin dentro de la muestra en estudio.
Son diferentes los tipos de residuales que se analizan para definir si un compuesto es o no outlier.
No es correcto al momento de hacer este anlisis, emplear un solo criterio de exclusin. Para eso se
emplea ms de uno, de los cuales haremos una breve resea, sin pretender presentarlos todos.
Criterio para la eliminacin de outliers
Cuando se trabaja con muestras reducidas (n 100), los coeficientes de la ecuacin de regresin no
son muy estables. Es decir, valores extremos pueden influir demasiado en los resultados de la
regresin. Por lo tanto, es aconsejable revisar diferentes criterios de eliminacin de outliers para
reiniciar el anlisis en los casos ms crticos despus de eliminarlos. En este trabajo analizaremos
como indicadores de la condicin de outliers los siguientes estadgrafos:
Residual estndar. Es el valor del residual, estandarizado (el valor observado menos el valor
predicho dividido por la raz cuadrada del residual cuadrtico medio). Lo utilizaremos como criterio
de exclusin absoluto si su valor es mayor que 3, aunque segn la naturaleza del problema, puede
oscilar entre 2 y 5.
Distancia de Mahalanobis. Si pensamos que las variables independientes de la ecuacin estn
definiendo un espacio multidimensional, podemos pensar tambin que en ese mismo espacio
podemos plotear el valor medio de cada variable independiente. A este pseudo punto medio del
espacio multidimensional se le llama centroide. La distancia de Mahalanobis es la distancia del
centroide al caso en el espacio multidimensional, y su medida da un ndice de si una observacin es o
no un outlier.
28
Residuales borrados. Es el valor estandarizado para cada caso, si este ha sido excluido del anlisis de
regresin. Si el residual borrado difiere mucho del residual estandarizado respectivo, entonces ese
caso es posiblemente un outlier porque su exclusin cambia la ecuacin de regresin.
Distancia de Cook. Indica la diferencia entre el valor del coeficiente de la variable independiente
calculado y el valor que se deba esperar despus que el caso se excluye Todas las distancias deben
ser aproximadamente de la misma magnitud. Si no es as, puede decirse que el caso respectivo vari
la estimacin de los coeficientes de regresin.
En ltima instancia, cuando un compuesto de la muestra resulta outlier en tres o ms criterios,
entonces se le puede considerar un verdadero outlier estadstico y se le excluye de la muestra, si no
existen consideraciones cualitativas de compromiso que fuercen su permanencia.
II.3.2.1.2 Anlisis grfico de resultados.
En estadstica, los grficos resultan de mucha utilidad para visualizar la informacin contenida en los
modelos. Esta forma de anlisis se aplica lo mismo al modelo en s como a los residuales.
Este tipo de grficos ilustra el comportamiento de los valores experimentales respecto a los predichos
por el modelo. El comportamiento ideal es cuando existe coincidencia entre ambos valores y por lo
tanto se superponen dando una lnea recta. La figura 5 es el resultado de plotear el valor predicho de
Area de Superficie Accesible a Disolvente contra los valores calculados por el mtodo DelPhi en una
muestra heterognea de 296 compuestos9, descrito por la ecuacin:
ASAD = 85.12(2.121) +60.19(1.886)1v- 40.743(2.648) 3v - 20.406(2.186)4
+27.128(1.626)1 + 8.505(2.638) 2q3 -26.822(4.553)4-15.441(2.360)5-9.569
(1.867)1 +10.768(2.310)1q3+15.878(4.072) 5q
R= 0.994 R2= 0.988 F(10,285)=2424.5 p<0.0000 S= 9.284 n=296
Ecuacin 6
Padrn, JA,. Carrasco, R., Marrero, J., Pardillo, E and Estrada, E. Use of Topological and Topographical Indexes in the
Prediction of the Solvent Accessible Surface Area. Quant Struct Act Relat.Submited
Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1
29
30
12
10
8
6
4
2
0
-2.5
-2 -1.5
-1 -0.5
0.5
1.5
2.5
3.5
Expected
Normal
10
Carrasco, R., Capote, R., Padrn, JA., and Estrada, E. Modeling Physico-chemical Properties of Organic Compounds
from Topological/Topographic Molecular Descriptors. J. Chem. Inf. and Comput. Sci., submited.
Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1
31
32
la red. Muchos usuarios de las RNAs desconocen lo que ocurre dentro de esa caja negra sin
embargo, continan aplicndola a su problema.
Las RNAs han sido aplicadas en qumica tanto para estudios de relacin estructura-propiedad como
estructura-actividad biolgica, de forma cualitativa y cuantitativa. En dependencia del tipo de trabajo
a realizar en un campo especfico debe seleccionarse el tipo de red a emplear. En los estudios QSAR
y QSPR es de uso comn los perceptrones multicapa para procesamiento cualitativo y cuantitativo de
las muestras. Las redes de Kohonen y Hopfinger se emplean preferentemente en problemas de
seleccin de variables para el establecimiento de los modelos y para definir muestras de
entrenamiento y prueba. se utiliza frecuentemente para establecer criterios de seleccin de variables
La seleccin del tipo de red y la definicin de su topologa se establece dependiendo del tipo de
trabajo a realizar en el campo especfico.
II.3.2.2.1 Teora de las redes de neuronas artificiales.
C apa
de
e ntra d a
C apa
o c ulta
C apa
de
s a lid a
33
cual quiere decir, que necesita conocer las respuestas a las entradas, por adelantado, o sea, la
actividad biolgica o propiedad. De manera comn, este tipo de red emplea las unidades
procesadoras en tres tipos de capas: de entrada, oculta y de salida. Cada unidad en una capa est
conectada a cada una de las unidades en las capas adyacentes con un peso o fuerza de conexin i. El
ajuste de estos pesos durante el proceso de optimizacin es lo que se realiza durante el entrenamiento
de la red. El valor de cada unidad en la capa de salida se compara con el valor diana que, en los
estudios de relacin estructura-actividad o estructura-propiedad son los valores experimentales de
dicha propiedad.
Mientras que en la regresin mltiple tenemos una tabla de n compuestos con y propiedades qumicofsicas y la actividad biolgica asociada a cada uno de los n compuestos, en las RN tendremos y
unidades en la capa de entrada y generalmente una unidad en la capa de salida (actividad o
propiedad) con usualmente una capa de unidades ocultas entre las capas de entrada y salida. Las
entradas a la red pueden ser cada uno de los valores y a cada una de las y neuronas para cada
compuesto. El valor diana para cada uno de los n compuestos ser la actividad biolgica o la
propiedad qumico-fsica, segn sea el caso.
A las redes a las que se les suministran los datos en la capa de entrada y producen una seal hacia la
capa de salida, se les llama feed-forward o de alimentacin hacia delante. El entrenamiento de la red
implica cambios iterativos de los pesos en las conexiones hasta que la seal de la neurona o neuronas
de la capa de salida se ajusta, dentro de ciertos valores lmites de error, con el valor diana en un
proceso de minimizacin del error. Hay diversas formas de alterar los pesos de la red pero uno de los
ms empleados es la regla delta.
La regla delta, dicha de forma cualitativa, est descrita por una expresin segn la cual, los cambios
en el peso de una conexin dada entre dos neuronas es funcin de dos parmetros denominados o
velocidad de aprendizaje para ajustar la velocidad a la cual la RN asimila la informacin, aprende,
durante el entrenamiento y un trmino (tambin se encuentra como notacin) llamado
momentum, que impide que la red quede atrapada en mnimos locales. Al inicio del entrenamiento, a
los pesos de las conexiones se les asignan valores al azar. Los datos para todos los compuestos se
pasan por la red (se transforman por la funcin de transferencia) y la respuesta de salida se compara
con el valor experimental, en nuestro caso la actividad, y se determina el error. Los pesos se ajustan
entonces para que los datos pasen por la red por segunda vez con el fin de reducir el error anterior.
Como la regla delta requiere el clculo de un error en la neurona de salida para calcular los errores
en las restantes neuronas, es que se les conoce como propagacin del error hacia detrs o
backpropagation errors, de ah su nombre. Este proceso se repite iterativamente hasta minimizar el
error por debajo de un valor fijado. Por ltimo, se puede calcular el coeficiente de correlacin entre el
valor observado de la actividad biolgica y el predicho por la red. Las redes de este tipo se emplean
cuando no se conoce la forma analtica del modelo (lineal, cuadrtico, etc.) o cuando se desea extraer
informacin no-lineal compleja del conjunto de datos.
II.3.2.2.2 Aplicaciones de las redes de neuronas en estudios QSAR.
Al igual que otros modelos matemticos de anlisis de datos, la calidad de los resultados depender
en buena medida de la calidad de los mismos, es decir, de la naturaleza de la muestra, as como de los
descriptores empleados para el establecimiento del modelo. La seleccin de una muestra de trabajo
34
puede ser en un momento determinado, un aspecto limitante; bien porque las condiciones
experimentales no permiten llenar vacos o la bibliografa no suministra la informacin necesaria. Es
un lugar comn el no disponer de los datos necesarios y suficientes, aunque la cantidad de ellos sea
extensa. Esta situacin obliga a trazar una estrategia en los estudios QSAR para la seleccin de las
muestras de entrenamiento y prueba. La aplicacin de la misma en el anlisis de regresin, permite
validar los resultados del modelo alcanzado en un conjunto de compuestos diferentes al utilizado para
desarrollar el modelo y as valorar su capacidad descriptiva. Por su parte, en el trabajo de RN se
precisa generalmente un tercer conjunto al que se llama de validacin, pues en RN es frecuente que
los programas presenten la opcin de salvar la mejor red segn los resultados alcanzados en la
muestra de entrenamiento o en la de prueba. En estos casos, este procedimiento le restara algo del
valor de generalizacin al resultado del aprendizaje, pues la red ya habra visto en algn momento a
la muestra de prueba. Por eso, ese tercer grupo de compuestos constituye el ltimo criterio para
validar los resultados.
Uno de los primeros trabajos aplicados a estudios QSAR fue un anlisis discriminante de un conjunto
de derivados anticancergenos de mitomicina. Se emple un conjunto de seis variables, dos de ellas
indicadoras y cuatro de sustituyente, se dividi la actividad en cinco categoras y se fij una capa
oculta de 12 neuronas (arquitectura 6 x 12 x 5) . La red entrenada fue capaz de clasificar
correctamente los 16 compuestos de la muestra de entrenamiento. Sin embargo, el elevado nmero de
conexiones (132) puede dar lugar a correlaciones casuales o a un ajuste excesivo, lo que en
terminologa de RN se conoce como memorizar; es decir, la red ha retratado la muestra y establecido
un patrn nico lo cual le impide hacer la generalizacin de su aprendizaje. Esto hace que si se le
presenta un grupo de compuestos no visto por ella anteriormente, no los reconocer pues su patrn
para identificar nuevas entidades se especializ en el conjunto de entrenamiento que se le suministr
previamente para el aprendizaje. Qu quiere decir este comportamiento? Que se ha sobreajustado
una superficie a la muestra de entrenamiento brindando un aparentemente buen comportamiento
pero, no permite la prediccin. Este problema fue identificado por Andrea (1990) el cual propuso un
parmetro , que puede ser empleado para caracterizar la relacin entre los puntos de datos y el
nmero de conexiones segn la expresin:
N o de puntos de datos
N o de conexiones
En ese trabajo se recomienda emplear valores de 1.8<<2.2 para evitar por una parte que la red
memorice, y por la otra, para evitar prdida de informacin por insuficiente nmero de conexiones.
En el ejemplo mencionado, =0.5 y por lo tanto, es posible que exista un sobreajuste. Sin embargo,
segn J. Zupan y J. Gasteiger11 la bsqueda de una arquitectura apropiada para una red resulta en la
prctica, un procedimiento de prueba y error.
11
Zupan, J. and Gasteiger, J. Neural Networks for Chemists. An Introduction, cap. 8; 1994.
Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1
35
Una capacidad de anlisis de la informacin que es exclusiva de las redes de neuronas, es la que nos
permite evaluar simultneamente en un mismo modelo, ms de una actividad. La incorporacin de
neuronas adicionales en la capa de salida es la que facilita esta opcin. En un trabajo actualmente en
curso, nos encontramos evaluando un sistema de redes en las que se evala simultneamente la
actividad de una familia de 65 cefalosporinas de diferentes generaciones frente a dos bacterias Gram
(+), S. aureus y E. cloacae. Para ese estudio la muestra se dividi tambin en tres: entrenamiento
(48), prueba (12) y validacin (5). Se lograron coeficientes de correlacin de 0.90 y 0.86, as como
errores relativos promedios de 5.3 y 6.7% para cada bacteria respectivamente. Esta tipo de anlisis es
imposible de realizar con otros mtodos multivariados.
II.3.2.3 QSAR tridimensional (3D-QSAR).
El QSAR tridimensional es una tcnica moderna que combina los aspectos relacionados en el estudio
QSAR clsico con los de los estudios SAR o de modelado molecular. En los estudios SAR de
anlogos, la eleccin se limita a si el compuesto es activo o inactivo. En la prctica, sin embargo, los
resultados se representan generalmente de forma numrica que refleja las diferencias cuantitativas en
la unin de uno u otro ligando. Por otro lado, el QSAR clsico si tiene en cuenta estos valores
numricos de las afinidades, pero para establecer un modelo por esta tcnica, no es posible considerar
compuestos estructuralmente diferentes, ya que en este tipo de anlisis, es indispensable el empleo de
una serie estructuralmente anloga. La necesidad de lograr una interfase entre ambos tipos de trabajos
necesit el desarrollo de un anlisis conceptualmente nuevo.
El primer logro en este sentido lo alcanzaron Cramer y colaboradores12 en 1988 al desarrollar el
anlisis comparativo de campos moleculares (CoMFA). La premisa bsica de este mtodo, es que el
muestreo adecuado de los campos elctricos y electrostticos alrededor de un conjunto de molculas
o frmacos, puede proporcionar toda la informacin necesaria para comprender las actividades
biolgicas.
12
Cramer, RD., Patterson, DE., Brunce, JD. J. Am. Chem. Soc. Vol 110, 1988.
36
Para hacer esto posible, se precisa del clculo de los campos de fuerzas por mecnica molecular, que
slo consideran las fuerzas estricas y electrostticas. Para lograrlo, se superponen todas las
molculas en las conformaciones presumiblemente activas y se calculan las energas de interaccin
estricas (van der Waals) y las electrostticas (Coulomb) entre cada una de las molculas de inters.
Posteriormente se recurre a la tcnica estadstica de los mnimos cuadrados parciales y se extraen las
variables que describen la varianza del conjunto de datos, los cuales se someten despus, a una
validacin cruzada. El anlisis de regresin lineal mltiple no es aplicable en esta tcnica, pues, la
cantidad de variables generada en estos estudios es muy elevado.
De manera general los pasos a seguir son los siguientes:
1. Postular la conformacin activa para el metabolito endgeno o para el frmaco ms activo.
2. Alinear el resto de las molculas y establecer a su alrededor una malla tridimensional como una
caja de puntos en el espacio potencial del receptor.
3. Calcular el campo que cada molcula ejercera sobre un tomo sonda situado en cada punto de la
malla.
4. Determinar una expresin lineal mediante la tcnica de mnimos cuadrados parciales que podra
consistir en un conjunto mnimo de puntos de la malla necesarios para distinguir los compuestos
sometidos a examen de acuerdo a las actividades determinadas experimentalmente.
5. Realizar la validacin cruzada del modelo (crossvalidation)
6. Ajustar la alineacin de los compuestos peor predichos y repetir los pasos anteriores hasta
encontrar la mayor alineacin posible.
Estos resultados del QSAR-3D producido por miles de trminos (en el QSAR tradicional el nmero
de trminos es ms reducido en funcin del tamao de la muestra), se pueden visualizar grficamente
en formas de mapas de contorno, pudiendo colorearse de diversos colores para resaltar la direccin y
magnitud de la interaccin. De tal manera, las regiones coloreadas aparecern en aquellas regiones en
donde las diferencias electrnicas y estricas produzcan una mayor variacin de la actividad.
II.3.3 Validacin de modelos.
Independientemente del tipo de anlisis QSAR empleado, el resultado final va a ser un modelo
matemtico. Para estar completamente seguros de que el modelo obtenido no resulta de un
ordenamiento al azar de los datos, es comn, segn las normas internacionales, verificar la calidad
del mismo.
El mtodo de regresin lineal mltiple proporciona los valores para los coeficientes que hacen que la
funcin matemtica propuesta explique al mximo, cmo varan las actividades. Independientemente
de esto, siempre quedar una varianza no explicada por el modelo -los residuales-, que corresponden
a los errores en las medidas de los datos de actividad y a posibles efectos no incluidos en l parmetros no considerados-. Mientras mayor sea la diferencia entre la varianza explicada sobre la no
explicada mayor ser la utilidad del modelo. Esto puede contrastarse con un anlisis de varianza y un
test de F. Cuando el modelo no es satisfactorio se obtiene la no significacin en el test.
Otro problema es que el modelo no sea predictivo, es decir, que la funcin propuesta no se cumpla
para productos no incluidos en la serie de exploracin. Este problema suele solucionarse realizando
37
una validacin cruzada (crossvalidation) al modelo, con el procedimiento conocido como leave-oneout. Este procedimiento consiste en un anlisis de regresin lineal que se repite tantas veces como
nmero de compuestos tenga la muestra, eliminando en cada uno de los anlisis a un compuesto. De
tal manera, en una muestra donde el nmero de estructuras evaluadas es 24 (n=24), se realizarn 24
anlisis de regresin con 23 compuestos, generando al final los valores promedios de los coeficientes
de correlacin (r2 rcross) y de las desviaciones estndar obtenidas (Spress). De esta forma se puede
conocer si el modelo mantiene su calidad estadstica independientemente de la presencia o ausencia
de algunas de las molculas estudiadas.
Si el valor de r2 rcross disminuye ostensiblemente con respecto al valor del coeficiente de
correlacin (r), eso significa que el modelo obtenido sustenta su valor estadstico sobre los datos
evaluados, pues la inclusin o eliminacin de un compuesto influye apreciablemente en los valores
del coeficiente de correlacin. De tal manera la ecuacin o modelo obtenido no tendr valor como
modelo predictivo. El lmite de disminucin de r2 rcross con respecto al coeficiente de correlacin
para que el modelo mantenga propiedades predictivas, est en dependencia del tipo de anlisis
estadstico empleado. Para el caso del 3D-QSAR, donde se utiliza el mtodo de los mnimos
cuadrados parciales (PLS), los valores de r2 rcross pueden disminuir hasta el valor de r20.6513; y en
el caso del QSAR tradicional donde se utiliza el mtodo de regresin mltiple, estos valores no deben
disminuir en ms de un 10%, en aras de disminuir el por ciento de error a la hora de realizar las
predicciones.
Otra forma de medir o evaluar la calidad de la ecuacin obtenida consiste en determinar la robustez
(q2) del mismo, y el mismo se calcula a travs de la ecuacin siguiente:
q2 = (SD-PRESS)/SD
ecuacin 8
donde SD es la sumatoria al cuadrado de las desviaciones estndares de los residuales y PRESS es la
sumatoria al cuadrado de los residuales. Este valor de q2 derivado de la validacin cruzada no es ms
que la habilidad del modelo para realizar la prediccin. En un modelo donde se obtenga un valor de
q2> 0.5 puede ser considerado como un modelo predictivo.
Para que el estudio de relaciones estructura-actividad se concluya con xito debe obtenerse un
modelo significativo y predictivo. An as, la validez del modelo estar siempre limitada al rango de
parmetros explorados por la serie de exploracin, fuera del cual nunca debe considerarse vlido. De
hecho, esta es la principal limitacin a la hora de buscar el ptimo de actividad predicho por un
modelo.
Cuando el modelo contiene slo trminos lineales, basta con buscar sustituciones que maximicen,
segn los valores que toma el ndice, los trminos con coeficientes positivos y minimicen los
trminos con coeficientes negativos. Esta operacin debe ser resuelta con mucho cuidado, pues los
procesos de maximizacin o minimizacin deben realizarse sobre la base de los valores que toma el
ndice, pues existen ndices que pueden tomar valores tanto positivos como negativos (las cargas,
energas, lipofilidad, etc.); mientras que otros slo poseen valores solamente positivos (los ndices
, etc.) o negativos (EHOMO y ELUMO).
13
Tong, W. Et al. Environ Health Perspect. Vol 105, No. 10, 1997.
38
Debe tenerse en cuenta, que si se rebasan los valores mximos y mnimos de la serie de exploracin,
los resultados a obtener en los nuevos compuestos no tienen porqu responder al modelo, pues esos
valores no fueron explorados y por tanto no incluidos en el mismo. Un ejemplo de esto puede ser un
modelo en el cual sea necesario el incremento del ndice . Este ndice, que slo toma valores
positivos, se incrementa cuando se aumentan los rdenes de enlaces y las ramificaciones en la
estructura qumica. Esto hace pensar que, en las molculas a disear, la inclusin de un mayor
nmero de dobles o triples enlaces, y el aumento de la ramificacin por utilizacin de las tcnicas
modulativas de la variacin molecular (ver captulo I), generara compuestos ms activos; sin
embargo este aumento de dobles o triples enlaces puede generar en la molcula una susceptibilidad al
metabolismo y metabolizarse rpidamente sin que esta llegue al sitio de interaccin con el blanco
teraputico. El incremento de la ramificacin, por su parte, puede generar un volumen superior al
permitido por el receptor y por tanto bloquear por impedimento estrico la interaccin del ligando
con el mismo. Estas consideraciones no pudieron ser recogidas evidentemente por el modelo, pues en
l este extremo de valores no fue considerado.
II.4. DESCRIPTORES MOLECULARES O INDICES
Bajo este trmino se agrupan una serie de parmetros que a travs de valores numricos representan
una informacin estructural, electrnica, estrica, as como una determinada propiedad qumico-fsica
de la molcula en estudio. Desde este punto de vista estos parmetros se clasifican en:
Indices basados en propiedades qumico-fsicas: Son aquellos, como lo dice su nombre, que
derivan de la determinacin experimental de una determinada propiedad qumico-fsica de la
molcula.
Indices mecnico-cunticos: Son aquellos que se determinan por clculos mecnico-cunticos.
Indices topolgicos y topogrficos: Son aquellos que se determinan a partir del grafo qumico, o
sea de la estructura qumica.
Descripcin
Logaritmo del coeficiente de particin
Refractividad Molecular
Constante de ionizacin
Momento dipolar
Tipo
Hidrofbico
Estrico
Electrnico
Electrnico
Referencia
Hansch, 1979
Hansch, 1973
Martin, 1978
Lien, 1982
Todos los parmetros anteriormente reflejados representan propiedades globales de la molcula. Este
tipo de parmetro tiene el inconveniente de que es necesario medir la propiedad, y muchas veces esto
presupone un trabajo laborioso; aunque muchos de estos ndices pueden ser determinados por
mtodos computacionales con aproximaciones bastantes exactas a la realidad experimental.
39
Es
MR
F,R
Descripcin
Constante hidrofbica del sustituyente
Constante de Hammett
Parmetro estrico de Taft
Refractividad Molar de sustituyente
Constantes del efecto inductivo y
resonante
Tipo
Hidrofbico
Electrnico
Estrico
Estrico
Electrnico
Referencia
Fuyita, 1964
Hammett, 1940
Taft, 1956
Hansch, 1973
Swain, 1968
40
ET
H0f
Nombre
Carga neta sobre el tomo A
Cargas netas ms negativa y positiva de la molcula
Cargas electrnicas nucleoflicas y electroflicas, calculadas a
partir de los orbitales ocupados y desocupados respectivamente.
Densidades electrnicas y del tomo A
Energas HOMO y LUMO. Significan las energas del ltimo
orbital ocupado y la del primer orbital sin ocupar respectivamente.
Superdeslocalizabilidad electroflica y nucleoflica.
Polarizabilidad Molecular
Momento dipolo molecular
Energa total de la molcula
Calor de formacin
Cargas Atmicas:
De acuerdo con la teora qumica clsica, todas las interacciones qumicas son por naturaleza o
electrostticas (polares) u orbitalarias (covalentes). Es una evidencia prctica, que las densidades
electrnicas locales o cargas, son importantes en muchas reacciones qumicas y en muchas
propiedades qumico-fsicas de las molculas. As, los descriptores basados en las cargas han sido
extensamente empleados como ndices de reactividad qumica y como medidores de las interacciones
intermoleculares dbiles tal y como ocurre en las interacciones inicas entre el frmaco y el receptor.
Las cargas parciales sobre los tomos han sido utilizadas como ndices de reactividad qumica
estacionarios. Las densidades electrnicas y por su parte, caracterizan la posible orientacin de
las interacciones qumicas, por lo que son consideradas ndices direccionales de reactividad. Por el
contrario, las densidades electrnicas y las cargas netas sobre los tomos son consideradas ndices de
reactividad no direccionales.
Energas de los orbitales moleculares:
Las energas HOMO y LUMO son los descriptores qumico-cunticos ms populares. Se ha
demostrado que estos orbitales juegan un papel muy importante en muchas de las reacciones
qumicas y en la formacin de los complejos de transferencia de cargas. De acuerdo con la teora de
los orbitales moleculares fronteras (FMO) de la reactividad qumica, la formacin de un estado de
transicin se debe a la interaccin entre los orbitales fronteras HOMO y LUMO de las especies
qumicas reaccionantes.
La energa HOMO est directamente relacionada con el potencial de ionizacin, y caracteriza la
susceptibilidad de la molcula a ser atacada por electrfilos. La energa LUMO est directamente
relacionada con la afinidad electrnica y caracteriza la afinidad de la molcula a ser atacada por
nuclefilos.
41
Superdeslocalizabilidades.
Este es un ndice de reactividad de los orbitales ocupados y no ocupados y est relacionada con la
contribucin hecha por el tomo, a la estabilizacin en la energa de formacin de un complejo de
transferencia de carga con una segunda molcula, o la capacidad del reaccionante de establecer
enlaces a travs de transferencia de cargas. La distincin hecha entre nucleoflica y electroflica estn
relacionadas con la naturaleza de la superdeslocalizabilidad, si esta es aceptora o donante
respectivamente. Las superdeslocalizabilidades son conocidas tambin como ndices de reactividad
dinmica. A diferencia de los ndices estticos (cargas), que describen molculas aisladas en su
estado base, los ndices dinmicos de reactividad se refieren a los estados transicionales en las
reacciones.
Polarizabilidad Molecular:
Se refiere a la polarizacin que puede sufrir una molcula por un campo elctrico externo, cuya
propiedad ms significativa es su relacin con el tamao molecular o el volumen molar. Se ha
demostrado que la polarizabilidad guarda relacin con el coeficiente de particin; de ah su
aplicabilidad en estudios de relacin estructura-actividad.
Momento dipolo:
La polaridad de una molcula guarda una estrecha relacin con varias propiedades fsico-qumicas.
El momento dipolo de la molcula es un reflejo de la polaridad global de la molcula.
Energas:
Las energas totales y los calores de formacin de las molculas son un reflejo de la estabilidad de las
mismas, por lo que el empleo de estos ndices puede conducir a la explicacin del fenmeno
estudiado.
II4.3 ndices topolgicos y topogrficos.
La topologa es aquella parte del lgebra que estudia las posiciones e interconexiones entre los
elementos de un conjunto. Esta rama de la ciencia, aplicada a la estructura qumica ha dado origen a
una disciplina llamada Topologa Molecular que analiza precisamente las posiciones y las
interconexiones entre los tomos de una molcula dada. De esta forma se lograra caracterizar
estructuralmente los compuestos.
Para definir dichos ndices se representan por puntos los tomos de la molcula (excluyendo a los de
hidrgeno) y por rayas o segmentos los enlaces. De tal manera se obtiene el grafo de la molcula o
grafo qumico como comnmente se conoce. Con posterioridad se construye la matriz topolgica
cuyos elementos toman el valor de uno o cero en dependencia de si el tomo i est enlazado o no al
tomo j. As se genera una matriz cuadrada de n filas por n columnas, siendo n el nmero de
vrtices del grafo o lo que es lo mismo el nmero de tomos. El resultado del clculo genera un valor
numrico que representa o describe la estructura qumica de la molcula, por lo que este tipo de
descriptores tienen una gran utilidad en los estudios QSAR.
42
De esta forma se pueden generar matrices de adyacencia y matrices de distancias entre vrtices. Las
matrices de adyacencia describen la unin o no entre tomos y la de distancias los nmeros de
tomos existentes entre un tomo X y otro no enlazado a l. Sirva como ejemplo ilustrativo de la
construccin de estas matrices la molcula de isopentano.
V2
e1
V1
e2
V3
V5
e3
e4
V4
0
1
= 0
0
0
1
0
1
0
0
0
1
0
1
1
Matriz de adyacencia
entre vrtices
0
0
1
0
0
0
0
0
0
0
1
D = 2
3
3
1 2 3 3
0 1 2 2
1 0 1 1
2 1 0 2
2 1 2 0
Matriz de distancia
Entre vrtices
Observe que para la matriz de adyacencia, al tomo o vrtice 1 (V1) le corresponden valores en la
matriz, de 0 para su relacin con los tomos 1, 3, 4 y 5 y valor de 1 con el vrtice 2 (V2), pues es
solamente con l, con quin se encuentra enlazado. As mismo para V3 le corresponden valores en la
matriz de 0 para los vrtices 1 y 3 y valores de 1 para los tomos 2, 4, 5. De esta forma se obtiene un
valor numrico que representa o describe la estructura molecular.
En la matriz de distancia, a V1 se le asignan valores de 0, 1, 2, 3 y 3, pues sta es el nmero de
mnimo de tomos que lo separan de los tomos 1, 2, 3, 4 y 5. Esta es otra forma de describir el grafo
qumico a travs de un valor numrico, pero utilizando en este caso las distancias mnimas que
separan un tomo de otro.
El grafo molecular puede ser subdividido en subgrafos en dependencia del nmero de ejes
interconectados al vrtice. Estos subgrafos se clasifican segn su orden (m) y su tipo (t).
El orden de un grafo no es ms que el nmero de ejes o enlaces que contiene el vrtice, considerando
como simples a los enlaces mltiples. Los tipos de los subgrafos por otro lado se clasifican en tres
tipos:
Tipo Camino (p), que son aquellos subgrafos que la valencia (nmero de enlaces) de sus vrtices
son menores o iguales que dos. Tngase en cuenta que los tomos de hidrgeno no se consideran
en el grafo molecular.
Tipo Cluster (c), constituido por aquellos subgrafos que tienen al menos algn vrtice con
valencia 3, 4 o mayor, pero ninguno con valencia de dos.
Tipo Camino-cluster (pc) Son los subgrafos que incluyen vrtices con valencias de dos, adems
de algunos con valencia de 3, 4 o mayor.
43
Estos ndices de conectividad mt corresponden en cada caso a la suma de todos los subgrafos de tipo
t y de orden m, y estn relacionados con la ecuacin 9:
n
m
m =
Sj
t j =1
m
Ecuacin 9
donde nm es el nmero de subgrafos tipo t y de orden m.
Los trminos mSj se definen como el inverso de la raz cuadrada del producto de las valencias de los
vrtices integrantes del subgrafo, Donde j define un subgrafo en particular (ver figura 12).
Sirva como ejemplos de subgrafos, la molcula de isopentano:
Tipo (t)
Orden (m)
1
Camino
Cluster
CaminoCluster
44
La definicin de algunos de los ndices obtenidos por esta metodologa aparecen recogidos en la tabla
siguiente:
NDICE
DEFINICIN
= [ (v ) (v )]
m
r =1
1/ 2
1 =
(vi ) (v j )K (v l +1 )
Conectividad molecular extendido
r =1
1/ 2
Conectividad de valencia
1 v =
v (vi ) v (v j )
l =1
1/ 2
i j
Para evitar el uso indiscriminado de este tipo de ndice, uno de los ms prestigiosos investigadores en
esta rea de la qumica ha propuesto que para la generacin de nuevos ndices de esta naturaleza,
estos deben cumplir los siguientes atributos:
Atributos deseables para los ndices topolgicos, segn Randic:
1. Interpretacin estructural directa. Indices basados en conceptos estructurales sencillos ayudan a
interpretar propiedades en trminos de estructura qumica.
2. Buena correlacin con al menos una propiedad. Esto sugiere el aspecto estructural dominante en
la propiedad.
3. Buena discriminacin de ismeros. Necesario cuando la propiedad en estudio cambia con el
ismero.
4. Localmente definidos. Es decir, que no se obtengan de forma global, sino localmente como en los
ndices de conectividad, en que se definen por la conectividad de cada tomo.
5. Generalizable a anlogos superiores. Por ejemplo, los ndices 1 , 2 , 3 ,,etc.
6. Linealmente independientes. Permite describir informacin estructural no contenida en otros
ndices.
7. Simplicidad. Facilita su interpretacin.
8. Que no estn basados en propiedades fsico-qumicas.
9. Que no estn relacionados de manera trivial con otros ndices.
10. Eficiencia de construccin. Facilita su clculo.
11. Basados en conceptos estructurales familiares.
12. Mostrar una dependencia correcta con el tamao. Las propiedades que dependen del tamao y en
general, la selectividad de los ndices disminuye con el tamao del grafo.
13. Tener cambios graduales con cambios graduales en la estructura.
45
No existe ningn criterio simple ni nico, para seleccionar qu parmetros deben utilizarse en un
estudio de relacin estructura-actividad. Ante un problema nuevo se debe comenzar a buscar en la
literatura trabajos previos realizados sobre el mismo tipo de productos, y de no encontrarse, sobre
productos parecidos o con la misma actividad. En general, en esta primera etapa, cualquier tipo de
informacin puede ser orientadora respecto a las caractersticas fsico-qumicas que pudieran
intervenir en la actividad, y por tanto cules son los parmetros ms adecuados para describirlas.
No obstante, es posible encontrarse en situaciones en las cuales no se disponga de ninguna
informacin previa; en esos casos, una solucin inteligente es seleccionar algunos parmetros
representativos de cada una de las propiedades fsico-qumicas, electrnicas, estricas y estructurales
de la molcula. Esta primera orientacin, aunque no genere un buen modelo, podr sealar cules de
estos parmetros tiene una mayor influencia en la actividad y por tanto aumentar el nmero de
ndices que describen la misma en un segundo intento de anlisis.
II.5 SITUACIN ACTUAL Y TENDENCIAS FUTURAS DEL DISEO DE FRMACOS
ASISTIDO POR COMPUTADORAS.