Está en la página 1de 50

Introduccin al diseo

racional de frmacos

JULIO CSAR ESCALONA ARRAnz


RAMN CARRASCO VELAR
JUAN ALEXANDER PADRN GARCA

Introduccin al diseo racional de


frmacos

Introduccin al diseo racional de


frmacos

Julio Csar Escalona Arranz


Ramn Carrasco Velar
Juan Alexander Padrn Garca

Todas las universidades en una: EDUNIV

615.19-Esc-D
Diseo racional de frmacos / Julio Csar Escalona Arranz, Ramn Carrasco Velar y Juan
Alexander Padrn Garca. -- Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978959-16-0647-1. 45 pg.
1. Escalona Arranz, J. C.
2. Carrasco Velar, R.
3. Padrn Garca, J. A.
4. Qumica Farmacutica
Edicin: Dr. C. Ral G. Torricella Morales
Correccin: Luz Mara Rodrguez Cabral
Ministerio de Educacin Superior de la Repblica de Cuba,
2008
Editorial Universitaria, 2008
La Editorial Universitaria publica bajo licencia Creative Commons de tipo Reconocimiento
No Comercial Sin Obra Derivada, se permite su copia y distribucin por cualquier
medio siempre que mantenga el reconocimiento de sus autores, no haga uso
comercial de las obras y no realice ninguna modificacin de ellas. La licencia
completa puede consultarse en:
http://creativecommons.org/licenses/by-nc-nd/2.5/ar/legalcode

ISBN 978-959-16-0647-1
Editorial Universitaria
Calle 23 entre F y G, No. 564
El Vedado, Ciudad de La Habana
Cuba CP 10400
e-mail: torri@reduniv.edu.cu
Sitio Web: http://revistas.mes.edu.cu

Nota a la Edicin

El presente texto surge como resultado directo de los trabajos realizados en la tesis: Nuevos
descriptores atmicos y moleculares para estudios de estructura-acitividad. Aplicaciones, de Ramn
Carrasco Velar. El trabajo directo con los alumnos y el conocimiento de la necesidad de aprendizaje de
los mismos ha llevado a los autores a elaborar este libro, el cual constituye una herramienta para quienes
pretendan adentrarse en el campo del diseo de frmacos con la ayuda de la computador. Espero que
les sea de utilidad.
El Editor

ndice
INTRODUCCION

CAPTULO I: DISEO DE FARMACOS. METODOS TRADICIONALES

I.1 CONSIDERACIONES GENERALES


I.2 METODOS VARIACIONALES
CAPITULO II: DISEO DE FARMACOS ASISTIDO POR COMPUTADORAS

12

II.1 METODOS DE CLCULO


II.2 TECNICAS SAR O MODELACION MOLECULAR EN EL DESARROLLO DE
NUEVOS FARMACOS
II.3 TECNICAS QSAR EN EL DESARROLLO DE NUEVOS FARMACOS
II.4. DESCRIPTORES MOLECULARES O INDICES

38

II.5 SITUACIN ACTUAL Y TENDENCIAS FUTURAS DEL DISEO DE FRMACOS


ASISTIDO POR COMPUTADORAS
45

J.C. Escalona, R. Carrasco y J. A. Padrn

INTRODUCCION
La historia del medicamento se remonta a los orgenes de la sociedad humana. Desde los primeros
tiempos el hombre ha acudido a la naturaleza para obtener sustancias que, o bien le ayudaran a paliar
su dolor, los sntomas de sus enfermedades... o bien le facilitaran la obtencin del alimento (veneno
para la caza), sus relaciones sociales y religiosas (estimulantes y alucingenos), etc. Esta
circunstancia ha permitido disponer de una amplia informacin, que sometida a la observacin atenta
y al estudio crtico, ha dado lugar al planteamiento de ideas que, debidamente desarrolladas, han
llevado a la obtencin de nuevos medicamentos, de sustancias lderes. Esta historia previa es la causa
de que en la actualidad, el modelo de aproximadamente la mitad de los productos de que se dispone
sea de origen natural. Modelos que, obtenidos a partir de un organismo vivo, han sufrido diferentes
modificaciones en el laboratorio, encaminadas a obtener molculas ms potentes y menos txicas que
las originales, las cuales en realidad no haban sido diseadas para un tratamiento especfico.
El descubrimiento de un nuevo medicamento y su desarrollo posterior, son dos fases que condicionan
el logro de un nuevo producto, til en la teraputica. Se considera, de manera general, que el
descubrimiento comprende toda la fase necesaria para que podamos asegurar que el compuesto tiene
un perfil deseable de actividad; comprende desde la sntesis, el aislamiento de la fuente natural, o la
obtencin biotecnolgica y toda la fase preclnica, incluida la toxicologa; de manera tal que nos
confirmen que el compuesto es aceptable en cuanto eficacia y seguridad para su ensayo en seres
humanos. Comprende en un sentido ms amplio, un gran conjunto de actos que culminan en la
utilizacin teraputica de un nuevo medicamento (Figura1).
Esta fase de descubrimiento, o sea, desde la obtencin hasta la primera aplicacin en humanos, se
estima que dura aproximadamente 42,6 meses (3,55 aos) como promedio, en aquellos pases y
transnacionales farmacuticas con una amplia infraestructura investigativa. En pases con un nivel
menor de desarrollo, esta fase alcanza aproximadamente unos 5-6 aos.
La fase de desarrollo comprende la de los estudios clnicos y la del registro farmacutico, y se estima
que duren entre 68.6 meses y 30.3 meses respectivamente. Todo este largo proceso, desde su
obtencin hasta su registro comprende un total de 11.8 aos de investigacin, con un costo promedio
de 231 millones de dlares por cada nuevo medicamento que salga al mercado.
Lo ms alarmante es que slo una de cada 10 000 molculas ensayadas pasa a la fase de desarrollo,
una de cada 100 000 supera los ensayos clnicos y logra registrarse y slo 3 de cada 10 nuevos
medicamentos registrados recupera su inversin inicial. Esto genera una triste realidad, por cada
milln de molculas que se inician en esta larga cadena para la obtencin de un nuevo medicamento,
slo tres recuperan la inversin inicial. Por tal motivo el diseo racional de frmacos, constituye una
herramienta casi indispensable en el desarrollo actual de nuevos medicamentos, contribuyendo a un
aumento de las posibilidades de xitos y a un decrecimiento de los costos.

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

Obtencin y caracterizacin qumica del producto.


Ensayos Preclnicos
Definicin del lugar y del mecanismo de accin
Desarrollo de la formulacin
Estudio de toxicidad

Estudio de tolerancia

Estudios de toxicidad subaguda en dos especies


Estudios suplementarios de toxicidad
aguda (otras vas y especies)

Teratogenicidad
(dos especies)

Informe final de los efectos


Desarrollo de mtodos para la determinacin de la
sustancia en el material biolgico
Farmacocintica y metabolizacin
(Modelos animales)

Preparacin Farmacutica

A veces, estudios toxicolgicos


en terceras especies.

Estudios de
tolerancia local

Farmacologa general de la sustancia

Tcnicas
estandarizadas

Tcnicas
comparadas

Farmacodinmica

Efectos
secundarios

Espectro de
actividad

Estudios
microbiolgicos
adicionales
Propuesta de dosis y niveles de dosificacin

INICIO DE LA FARMACOLOGA
Figura1. Fases necesarias para la generacin de un nuevo medicamento.

J.C. Escalona, R. Carrasco y J. A. Padrn

CAPTULO I: DISEO DE FARMACOS. METODOS TRADICIONALES


I.1 CONSIDERACIONES GENERALES
El desarrollo de medicamentos cada vez ms seguros, adecuados, especficos y efectivos en el
tratamiento de enfermedades, es una tarea que requiere del esfuerzo coordinado e inteligente de un
elevado nmeros de profesionales de distinta formacin y dedicacin, en la que la capacidad de
deduccin, la institucin y en muchos casos, la suerte, han jugado un papel fundamental.
Reconociendo la importante contribucin del azar en el resultado positivo de este esfuerzo, es preciso
matizar que su base est slidamente anclada en un diseo inteligente y racional ya que si slo se
acude al azar, es poco probable obtener medicamentos eficaces y seguros.
Si se conoce la base biolgica de una enfermedad o de un desarreglo metablico, es posible disear
un medicamento utilizando un mecanismo de aproximacin al proceso patolgico. Cuando se conoce
este proceso en su base molecular y se pueden definir las molculas implicadas en el mismo, es
posible disear medicamentos que interacten con la molcula responsable, de tal forma que la
modifique y se modifique as mismo la patologa.
Para conocer a profundidad el proceso fisiolgico, es necesario conocer la estructura tridimensional
de la(s) molcula(s) objetivo. Esto es posible pocas veces, sobre todo por la dificultad de obtener los
receptores en estado cristalino. Los mtodos ms utilizados en este sentido son la Resonancia
Magntica Nuclear, la cristalografa de rayos X y los clculos tericos de las fuerzas que mantienen
la configuracin de un sistema, ya sea por mecnica molecular o mecnica cuntica.
Todo esto provoca, que los especialistas que tomarn a la qumica farmacutica como profesin
dentro del rea del conocimiento cientfico, debern no slo especializarse en los aspectos
relacionados con la sntesis y la estructura qumica, sino que tendrn que ser capaces de dominar el
conjunto de ciencias biolgicas afines, que se encuentran en la interface del descubrimiento y el
desarrollo de un nuevo frmaco. El encabezamiento de una encuesta realizada a los qumicos
farmacuticos de las principales industrias farmacuticas del mundo en 1995, comenzaba con la
frase. Los qumicos farmacuticos involucrados en descubrimiento de los nuevos frmacos deben
ser sobresalientes qumicos en la sntesis orgnica y comprender las aproximaciones modernas al
anlisis de la relacin estructura-actividad, adems de la necesidad de dominar los conceptos de la
interface con otras disciplinas involucradas en el proceso del diseo de frmacos hecho que
evidencia la importancia del conocimiento de las ciencias biolgicas en los cientficos de esta rea de
la ciencia1.
En estas encuestas los resultados reflejaron que los trabajadores de la qumica farmacutica proponen
la necesidad el conocimiento de la modelacin molecular, bioqumica, farmacologa, fisiologa y
biologa molecular. Los porcientos de votaciones para estas disciplinas alcanzaron valores superiores
al 30 % de los encuestados.

Wess, G. DDT, Vol 1, No. 12, 1996.


Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

En tal sentido, la unin internacional de qumica pura y aplicada (IUPAC) public en ese mismo ao
1995 el conjunto de cualidades que deseaban los representantes de las principales compaas
farmacuticas que tuvieran sus qumicos farmacuticos2. Estas habilidades son:
Capacidad de insercin en grupos interdisciplinarios, como interface entre los cientficos del rea
biolgica (farmacologa, bioqumica, biologa molecular etc.)
Habilidad en la bsqueda de nuevos frmacos.
Conocimiento de cmo sintetizar molculas convenientes a ser evaluadas en ensayos biolgicos.
Entendimiento de las razones y la necesidad de porqu generar nuevos compuestos.
Conocimiento del diseo de frmacos.
Perspicacia a la hora de establecer relaciones de estructura-actividad, an con insuficientes datos.
Conocimiento de campos colaterales (fisiopatologa, biologa celular y gentica)
Rpida familiarizacin con las nuevas tecnologas.
I.2 METODOS VARIACIONALES.
En este acpite se considerar de forma breve con algunos ejemplos, la metodologa de este enfoque,
las circunstancias y cadenas de hechos que llevan al descubrimiento de nuevos compuestos
considerados como lderes o cabezas de serie y su posterior desarrollo, la aplicacin en definitiva, de
las tcnicas que de forma general se conocen como Variaciones estructurales.
I.2.1

Bsqueda de la cabeza de serie o compuesto lder.

Aunque en la bsqueda de una cabeza de serie se pueden aplicar varios mtodos los ms empleados
son:
El empleo de productos activos presentes en drogas utilizadas en la medicina tradicional.
Estudio de nuevos compuestos provenientes de la sntesis qumica o de la biotecnologa.
Ambos mtodos requieren de la existencia previa de una amplia batera de ensayos biolgicos
cuidadosamente diseados, que permitan determinar con rapidez y de manera inequvoca la
actividad biolgica de los nuevos compuestos.
En el caso de estudios de compuestos empleados en la medicina tradicional, es ms fcil, en
principio, el diseo de la prueba biolgica, ya que se cuenta con informacin previa de la actividad
prevista; se trata de comprobar simplemente de manera cientfica el empleo popular. Sin embargo,
cuando se desconoce la posible actividad, la batera de ensayos ha de ser lo suficientemente amplia,
en el intento de no perder ninguna informacin interesante. Lamentablemente, los costos asociados a
este tipo de estudios hacen que estos se vean limitados en nmero y en el espectro de acciones
biolgicas.
Otras vas de obtener un compuesto lder o cabeza de serie son:

Ganellin, CR., Mitscher, LA., Topolis, IG. Annu. Rep. Med. Chem., Vol 30, 1996.

J.C. Escalona, R. Carrasco y J. A. Padrn

Aislamiento de los productos responsables de una accin biolgica determinada y su posterior


identificacin y caracterizacin. Esto se cumple fundamentalmente en productos naturales que no
han sido reconocidos por el hombre. Ejemplos son las hormonas esteroidales, que llevara a la
identificacin de los esteroides, al cido araquidnico, que permiti el desarrollo de las
prostaglandinas y tromboxanos, la obtencin de potentes anticoagulantes a partir de venenos de
vboras, etc.
Deteccin y observacin de efectos secundarios o acciones biolgicas inesperadas durante el
empleo de compuestos activos. Ejemplos son la accin antiagregante de la aspirina por
inhibicin de la ciclooxigenasa (enzimas implicadas en la sntesis de prostaglandinas), la accin
diurtica de sulfas antibacterianas como la acetazolamina (por inhibicin de la anhidrasa
carbnica) entre otros muchos ejemplos.
Por observacin del metabolismo de los compuestos. En ocasiones, algunos de los metabolitos de
un frmaco presentan una actividad superior o diferente a la del propio frmaco de partida. La
sntesis de sulfonamidas bacterianas en consideracin del metabolismo del prontosil puede servir
de ejemplo para este tipo de bsqueda.
El anlisis de la actividad biolgica de productos intermedios de la sntesis de un frmaco. Tal es
el caso de las tiosemicarbazonas empleadas en la sntesis del sulfatiadiazol, que provocaron una
nueva estrategia para la terapia de la tuberculosis y el desarrollo de la Amiatizona.

A estas informaciones se le pueden unir, como se plante anteriormente, las obtenidas del estudio
del mecanismo de accin de los compuestos, as como consideraciones relativas a la bioqumica de
la enfermedad y procesos del organismo enfermo sobre el cual van a actuar los productos.
I.2.2

El desarrollo de una cabeza de serie: la variacin molecular.

Una vez encontrada y definida la cabeza de serie se hace necesario la exploracin de la serie por
modulacin de su estructura con el fin de encontrar un producto mejor. El objetivo que se propone es
encontrar nuevos y mejores medicamentos con superior actividad, mejor biodisponibilidad, menor
toxicidad y reacciones secundarias mnimas. O sea, en otras palabras se refiere a qu voy a
modificar en el compuesto lder?. Esto se conoce como Variacin Molecular.
En la finalidad de esta tcnica se pueden distinguir:

Mejora de la potencia del lder.


Eliminacin de efectos secundarios no deseados.
Potenciacin de acciones secundarias deseadas, ya sea por complemento sinrgico a la accin
principal o por s misma. Esta ltima se cumple en el caso del desarrollo de las sulfas diurticas
comentado con anterioridad.
Separacin de actividades en compuestos multiaccin. Tiene como objetivo potenciar alguna de
las acciones farmacolgicas sobre las dems, o eliminar algunas de ellas en beneficio de las otras.
Un ejemplo puede ser el desarrollo de antiinflamatorios esteroidales a los cuales se le busca la
disminucin de su efecto mineralocorticoide con un incremento de su efecto glucocorticoide.
Combinar actividades. Se trata de reunir en una entidad actividades diferentes que puedan actuar
en comn frente a desrdenes asociados. Tal es el caso de los antiinflamatorios con efecto
antiinflamatorio y analgsico para el tratamiento de enfermedades reumatoideas. Tambin la

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

asociacin de la actividad antiagregante a la de los vasodilatadores habituales para el tratamiento


de enfermedades vasculares, principalmente en ancianos.
Modificacin de la biodisponibilidad del frmaco lder. El descubrimiento de un nuevo frmaco
por lo general necesita un mejoramiento en su asequibilidad biolgica. Lo anterior pude
explicarse con varios ejemplos:

a. Proteccin frente a la accin de sistemas enzimticos: Las -lactamasas son enzimas que
desdoblan el ncleo -lactmico de penicilinas y cefalosporinas inactivndolas. Para eso ocurre
una reaccin entre el grupo hidroxilo de un resto serina de la enzima que realiza un ataque
nucleoflico sobre el tomo de carbono carbonlico del anillo -lactmico. El grupo sustituyente
en la posicin 7 del anillo cefalospornico, juega un papel primordial para lograr la conformacin
espacial que impida la accin de las -lactamasas. Obsrvese que la sola sustitucin en R de un
=N-OH por un =N-OCH3 hace que disminuya 100 veces la potencia de los compuestos, debido a
una disposicin espacial diferente, que en el caso de los segundos, no logra impedir el ataque de
la enzima.
S
H2N
N

CCOHN
R'
O

7
N

R3
-

COO

R3
-(CH)2CH2OCONH2
-(CH)2CH2OCONH-CH3
-(CH)2CH2OCONH2
-(CH)2CH2OCONH-CH3

E. coli

S. aureus

=NOH
=NOH
=NOCH3
=NOCH3

MIC
0.025
0.025
0.2
0.2

MIC
0.1
0.1
0.8
0.8

b. Incremento en la selectividad de la accin: Las mostazas nitrogenadas y su actividad


anticancerosa pueden servir de ejemplo. La mecloroetamina (I), surge a partir del tristemente
famoso gas mostaza empleado en la primera guerra mundial. Este compuesto, con el desarrollo
de nuevos citostticos se convirti en un frmaco excesivamente txico, por lo que deba
incrementarse la selectividad de su accin a las clulas tumorales. De esta manera se desarroll
el Mefalan (II), derivado de la fenilalanina.
CH2CH2CL
CH3 N
CH2CH2CL
(I)

HOOC CH CH2
NH2

CH2CH2CL
CH2CH2CL

(II)

c. Modificaciones para alterar la distribucin: Se utiliza cuando se desea excluir de algn


compartimento biolgico al frmaco. La atropina (III) y sus sales de amonio cuaternario (IV)
pueden servir de ejemplo. La formacin de esta sal aumenta la hidrofilia e impide al frmaco
atravesar la barrera hematoenceflica, sin alterarse las acciones anticolinrgicas perifricas.

J.C. Escalona, R. Carrasco y J. A. Padrn

8
+
N(CH3)2

NCH3
O
C CH

O
C CH

CH2OH

CH2OH

(III)

I.2.3

(IV)

Mtodo Variacional. Tipos de aplicacin.

En este tpico se enumerarn algunas de las estrategias a seguir para aumentar la eficacia del
compuesto lder. La pregunta ahora es: cmo modificar el compuesto lder?. Entre las estrategias
ms comunes se encuentran:
I.2.3.1 Sustitucin bioisotrica.
En un enunciado un tanto simplista, es razonable el hecho de que compuestos con una misma
actividad biolgica, deban poseer tambin una misma estructura, o al menos puntos comunes en las
partes responsables de la actividad, por lo que la sustitucin de grupos con igual distribucin
electrnica en la ltima capa e igual deslocalizacin del orbital puede conducir a la obtencin de
nuevos compuestos de inters farmacolgico.
Este mtodo es aplicable a las sulfas antibacterianas (V), en la cual la similitud electrnica del grupo
sulfamida al grupo carboxilo del cido p-aminobenzoico (PABA) (VI) provoca la equivocacin de
la bacteria. Ahora bien, no siempre las sustituciones bioisostricas generan una equidad en cuanto a
actividad. Ejemplos de este caso lo representan los antibiticos -lactmicos, en la serie de las
penemas (VII), oxapenemas (VIII) y carbapenemas (IX), en los que el cambio del tomo de azufre
por el de oxgeno, aumenta la reactividad del anillo -lactmico y lo convierte en una molcula
suicida que inactiva a las -lactamasas. La sustitucin entonces del oxgeno por el etileno (CH2)
disminuye nuevamente esta reactividad, incluso a valores inferiores que los de las penemas, por lo
que genera molculas menos activas, aunque an con utilidad farmacolgica.
En general, el trmino bioisosterismo se aplica para todo el conjunto de analogas que se pueden
establecer entre dos agrupaciones atmicas, incluyendo tanto elementos estricos como electrnicos,
y en general, todos cuantos sirvan para definir la estructura de una molcula.
O
O
C
NHR
S
H2N
H2N
O
O
(V)
S

R
O

(VII)

(VI)
O

R
COOH

R
COOH

(VIII)

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

(IX)

COOH

Introduccin al diseo racional de frmacos

I.2.3.2 Modulacin Molecular


Esta tcnica consiste en variar al compuesto lder con modificaciones limitadas tanto en extensin (la
molcula debe mantener las caractersticas iniciales) como en nmero (posiciones a modificar). Sin
embargo a pesar de restringirse aparentemente las posibilidades de variacin con esta tcnica, es muy
frecuente encontrar resultados positivos en su aplicacin.
De manera general existen tres formas diferentes de actuar:
Modulacin: Comprende isomerizacin, homologa, alquilacin, ramificacin, desalquilacin,
saturacin, insaturacin, cambio en la posicin de la insaturacin, desplazamiento de una funcin,
introduccin, sustitucin o eliminacin de heterotomos, introduccin de sistemas cclicos,
contraccin o extensin de ciclos, sustitucin de ciclos, etc.
S
N
CH2

N
CH2

CH2

CH2

CH2

CH2

N(CH3)2

N(CH3)2

Imipramina

Promazina

Fig. #2. Cambios de actividad secundaria por extensin del ciclo.

Simplificacin: En ocasiones, la molcula se rompe, en un intento de encontrar qu parte o partes


son responsables de la actividad biolgica que se est estudiando. Con este fin se disean
compuestos ms sencillos, que contengan aisladamente los fragmentos mencionados. Es
necesario aclarar que las partes responsables de la actividad no tienen necesariamente que
encontrarse unidas entre s, sino que pueden estar separadas por una serie de tomos que no
forman parte decisiva en la interaccin con el receptor. En estos estudios se necesita de un
verdadero conocimiento de la estructura tridimensional y del comportamiento conformacional del
compuesto.
CH 3
N
N

CH3

HO

HO

OH

Morfina
N

Levofenol
CH 3

H 3C

CH 3
CH3

C OC2H 5

OC2H5

Meperidina

Metadona

Fig. #3. Molculas obtenidas por la simplificacin de la molcula de morfina.

J.C. Escalona, R. Carrasco y J. A. Padrn

10

Unin de elementos activos: Se trata de unir en una molcula, restos que han demostrado ser
activos en otras molculas.

De este tipo de estudio se desprende una evolucin en el peso relativo de las diferentes ciencias
implicadas en el diseo de nuevos medicamentos. Se observa en primer lugar un aumento progresivo
en la importancia que tienen los mtodos biolgicos como elemento de apoyo y decisin en el
planteamiento de las estrategias de sntesis, llegando a ser autnticas piezas claves en muchos casos.
Tambin se deduce la necesidad de disponer de tcnicas cada vez ms avanzadas en el campo del
anlisis instrumental, como base para la elucidacin estructural de los nuevos compuestos. Y siempre
como elemento fundamental, la colaboracin estrecha entre investigadores de diferentes
profesiones por la posibilidad de ofrecer puntos de vistas desde diferentes perspectivas.
.
I.3 SITUACIN ACTUAL Y TENDENCIAS FUTURAS.
Los avances previsibles en el campo de la biotecnologa, la biologa molecular y ciencias afines,
estn dando un nuevo enfoque al diseo de medicamentos. Por otro lado, la ingeniera gentica ha
ido ganando un espacio cada vez ms slido en la industria farmacutica fundamentalmente a partir
del ao 1993. Hacia finales del ao 1995 ya eran 180 los contratos de colaboracin firmados entre
compaa-compaa y compaa- instituto de investigacin en el rea de la ingeniera gentica y esta
cifra contina creciendo, involucrando cada vez ms a las principales transnacionales farmacuticas3.
Las principales asociaciones se resumen en la siguiente tabla:
Tabla 1 Principales contratos compaa farmacutica compaa de investigacin gentica.
Programa Gentico
Proyecto Genoma
Humano (HGS)
Incyte
Pharmaceuticals
Washington
University
Milleninium
Pharmaceuticals
Myriad Genetics
Sequana Therapeutics
Darwin Molecular Co.

Industria
Farmacutica
Takeda
E Merk
Pfizer
Abbott
Johnson & Johnson
Roche
BASF
Merck (USA)
Eli Lilly
Roche
Bayer
GlaxoWellcome
Rhne-Poulenc Rorer

Otro de los grandes avances en el desarrollo de nuevos medicamentos lo constituye la qumica


combinatoria, mediante la cual es posible obtener en un tiempo relativamente corto hasta millones de
3

Beeley, LJ., Duckworth, DM. DDT, Vol 1, No. 11, 1996.


Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

11

Introduccin al diseo racional de frmacos

molculas relacionadas, pudiendo brindar compuestos candidatos a ensayos clnicos rpidos y de


bajos costos.
Esta novedosa tcnica, propuesta por Geysen en 1980, se basa en la combinacin de molculas
pertenecientes a un grupo qumico con otras pertenecientes a otro grupo. En un ejemplo sencillo se
tienen cuatro molculas: A1, A2, B1 y B2. Las molculas A1 y A2 son estructuralmente relacionadas, y
B1 y B2 pertenecen a otra clase de molcula. Si ambas clases de molculas pueden reaccionar entre s
entonces las combinaciones posibles seran A1-B1, A1-B2, A2-B1 y A2-B2.
Este ejemplo puede parecer muy simple, pero la realidad es que normalmente se trabaja con al menos
30 compuestos de cada grupo, esto generara un total de 30x30= 900 nuevos compuestos. Si a estos
se le agrega otro grupo qumico de 30 compuestos se obtendran un total de 27 000 nuevos
compuestos (30x30x30), todos ellos obtenidos de forma rpida4. Este enfoque, aplicado a la sntesis
de pptidos, proporciona en la prctica, la posibilidad de crear libreras de oligopptidos del orden
de millones de compuestos a partir de la enorme cantidad de combinaciones posibles, las cuales se
incrementan con la cantidad de aminocidos que se empleen en la sntesis.
Independientemente del avance de las tcnicas de obtencin de nuevos productos activos, el mtodo
de las variaciones estructurales siempre estar como mtodo de apoyo en el diseo de estrategias de
sntesis, formando parte de los equipos multidisciplinarios decididos a encontrar los mejores
medicamentos, pues en su esencia constituye un mtodo racional eficaz en el diseo de nuevos
frmacos.

Plunkett, MJ., Ellman JA. Scientific American, 1997.

J.C. Escalona, R. Carrasco y J. A. Padrn

12

CAPITULO II: DISEO DE FARMACOS ASISTIDO POR COMPUTADORAS


En la actualidad existen numerosos mtodos experimentales para determinar la estructura molecular
de una sustancia. Las espectroscopas ultravioleta (UV), infrarroja (IR), y fundamentalmente la de
masas y la de resonancia magntica nuclear H1 y de C13, as como las tcnicas de difraccin de rayos
X son las ms comunes. No obstante, el desarrollo alcanzado por la computacin y la qumica
computacional ha propiciado la generacin de sistemas que permitan calcular la geometra y la
energa molecular. Estos sistemas son capaces de generar datos con una amplia aplicacin en la
investigacin experimental, tanto para la interpretacin de los resultados obtenidos y la planificacin
de futuros, as como para deducir informacin no asequible experimentalmente.
II.1 METODOS DE CLCULO
En principio, se pueden considerar tres tipos de mtodos tericos de clculo para la obtencin de la
geometra de una molcula: los mtodos ab initio, los semiempricos y los de mecnica molecular. La
eleccin de uno u otro mtodo depende fundamentalmente del tamao de la molcula, la naturaleza
del problema planteado y del tiempo de clculo requerido.
En el caso de la mecnica molecular, aunque es el menos exacto de todos, requiere de menos tiempo
de clculo con respecto a los semiempricos y ab initio, y reproducen con buena precisin los valores
experimentales referentes a geometras y energas. Este mtodo se basa en los formulismos de la
espectroscopa vibracional, representando la molcula como un modelo mecnico de masas (ncleos)
unidas por fuerzas armnicas o elsticas (enlaces), las cuales se considera que poseen valores de
longitud y ngulo ideales o naturales que condicionan la geometra. Entonces la energa E de la
molcula se define como la desviacin de los parmetros ideales y es minimizada siguiendo un
algoritmo de optimizacin:

E = E r + E + E + EVDW + E D + E H
Ecuacin 1.
donde Er define las deformaciones de la longitud de enlace (acortamiento-alargamiento), E se
relaciona con las distorsiones del ngulo de enlace, E es la energa de torsin del ngulo diedro por
rotacin de los enlaces y EVDW, ED y EH consideran las contribuciones de las interacciones de Van der
Walls, las repulsiones electrostticas y las asociaciones por puentes de hidrgeno, respectivamente.
Dado que la mecnica molecular supone una interpolacin de los datos experimentales existentes,
generalmente predice correctamente las geometras moleculares de los compuestos bajo estudio.
Estas geometras optimizadas se pueden utilizar como datos de entrada para los clculos mecnico
cunticos con el objetivo de comenzar la optimizacin total con una estructura previamente refinada.
Adems su uso principal en la actualidad es en el campo de las macromolculas, en las cuales los
mtodos de clculos mecnico-cunticos se tornan prohibitivos en cuanto a costo computacional
Por otra parte, el tratamiento cuntico de la materia esta basada en el principio de incertidumbre de
Heisenberg, segn el cual no es posible conocer simultneamente la posicin y el momento de una

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

13

partcula. Por esto es necesario abordar el problema desde el punto de vista estadstico, dada la
necesidad de poder encontrar una partcula en un lugar determinado y en un momento dado.
Otro concepto fundamental de la mecnica cuntica es que todas las cantidades dinmicas asociadas
a cada partcula estn cuantificadas. La energa de una partcula tiene un valor discreto, el cual es
mltiplo de una energa bsica y la constante de Plank. La ecuacin fundamental es la de
Schrdinger, que para el tomo de hidrgeno viene dada por la ecuacin:

2 - (82m/h2) (E+ Z e2/r) = 0


Ecuacin 2
donde 2 es el operador diferencial, es la funcin de onda, h es la constante de Plank, y r la
distancia entre el electrn y el ncleo.
Para los tomos multielectrnicos, la ecuacin de Schrdinger, no puede ser resuelta, pues no es
posible la separacin de las variables. Para ello es preciso acudir a la expresin de Hartree, que
considera cada electrn independientemente, movindose en el campo del resto de los electrones y de
los ncleos. Teniendo en cuanta el principio de exclusin de Pauli, segn el cual no pueden existir
ms de dos electrones en una misma rbita, con dos espines diferentes, se obtiene la expresin de
Hartree-Fock; la cual expresada en forma analtica, no matricial, origina la ecuacin de Roothaan.
En prrafos anteriores hicimos mencin de que existen dos mtodos principales de clculos
mecnico-cunticos, en dependencia de las aproximaciones que se realizan:
1. Los mtodos ab initio
2. Los mtodos semiempricos
Los mtodos ab initio con el modelo hamiltoniano nos brindan una representacin completa de todas
las interacciones no relativsticas entre el ncleo y los electrones de la molcula, soluciones no
disponibles en la ecuacin de Schrdinger. La utilizacin de este algoritmo de clculo hace que los
mtodos ab initio necesiten un elevado tiempo de cmputo, que va a ser proporcional al nmero de
electrones de la molcula, dependiendo por lo tanto de la naturaleza de los tomos y del tamao de la
misma. Sirva como ejemplo la molcula de metano, para la cual es necesario resolver un total de
1080 integrales, 1035 de ellas dielectrnicas.
La gran mayora de los clculos ab initio utilizan la aproximacin del orbital, definida en el mtodo
de Hartree-Fock. Ellos incluyen interacciones configuracionales (CI), campos autoconsistentes
multiconfiguracionales (MC SCF), la teora de correlacin por pares de electrones (CPMET), y la
teora de las perturbaciones.
Una alternativa de clculo mecnico-cuntico lo ofrecen los mtodos semiempricos. Estos mtodos
han sido desarrollados dentro de la teora de los orbitales moleculares (SCF MO), pero sobre la base
de simplificaciones y aproximaciones introducidas al algoritmo de clculo, que hacen que los
tiempos de cmputo en computadoras normales (incluso microcomputadoras), se vea drsticamente
reducido con respecto a los mtodos ab initio, permitiendo una mayor utilizacin de los mismos. Hoy

J.C. Escalona, R. Carrasco y J. A. Padrn

14

da, es prctica comn la realizacin de clculos de optimizacin de geometra en molculas de


mediano tamao, con ms de 200 orbitales de base, en computadoras personales.
En tal sentido un mtodo semiemprico debe cumplir los siguientes requisitos:
1. Que sea lo suficientemente simple para poder calcular molculas relativamente grandes.
2. Que mantenga las principales interacciones intermoleculares: atraccin por los ncleos y
repulsin entre los electrones.
3. Que los resultados del clculo puedan ser interpretados, permitiendo la construccin de mtodos
cualitativos adecuados.
4. Que compensen por parametrizacin las insuficiencias del mtodo Hartree-Fock.
La principal aproximacin que realizan los mtodos semiempricos es que ellos desprecian las
integrales de solapamiento, teniendo solamente en cuenta los electrones de valencia de cada uno de
los tomos integrantes de la molcula, considerando los electrones internos como parte del ncleo no
polarizable. As, mientras el mtodo semiemprico NDDO calcula un total de 741 integrales para el
propano, un mtodo ab initio deber resolver un gran total de 38 226 integrales para la misma
molcula. Esto en tiempo de clculo se traducira en que, para realizarlos en una computadora con
capacidad de un milln de operaciones por minuto, el clculo semiemprico durara no ms de 5
minutos contra un total de 5 horas para el ab initio en la propia molcula de propano. En la actualidad
se cuenta con computadoras de mayor potencia y velocidad, con lo que es posible la realizacin de
clculos ab initio en un tiempo mucho menor que el expresado anteriormente.
En principio, cualquier mtodo semiemprico puede ser utilizado para el clculo de la geometra
optimizada de una molcula. El primer mtodo aplicado fue el de Hckel en 1931, luego le sigui el
PPP en 1935. A partir de este momento se han ido creando nuevos mtodos de clculos, cada uno de
los cuales se va haciendo ms complejo por el desarrollo lgico que va experimentando la
computacin, permitiendo realizar cada vez ms, operaciones complejas en un menor intervalo de
tiempo.
Los ms populares en orden cronolgico son los siguientes5:

La teora de Hckel extendida (EHT), la cual es una extensin de la aproximacin de electrones-


de Hckel que trata a todos los electrones de valencia de la molcula. Las integrales de
solapamiento son calculadas por las funciones tipo Slater, mientras que las repulsiones
electrnicas y nucleares son obviadas. Este mtodo ha sido utilizado preferentemente para
describir cualitativamente la estructura electrnica de sistemas moleculares. No obstante, al
obviar importantes interacciones electrnicas, las distribuciones de cargas calculadas son irreales.
El mtodo C.N.D.O. (complete neglect differential overlap) es el ms simple de los mtodos
semiempricos. En el se obvian el solapamiento de orbitales atmicos, tanto diatmicos como del
tomo simple, creando una aproximacin incorrecta en el sentido de que no existe justificacin
para no incluir el solapamiento diferencial de un tomo simple.
Los mtodos I.N.D.O (intermediate neglect differential overlap) y M.I.N.D.O (modified INDO)
se desarrollan bajo un compromiso en el cual el solapamiento de un centro es retenido en las
integrales de un centro. Estos mtodos representan una aproximacin ms real a la prctica que
Karelson, M., Lobanov, VS. Chem. Rev., Vol 96, 1996.
Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

15

los anteriores, pero todava existe una reduccin sustancial de las repulsiones electrnicas,
utilizando un conjunto mnimo de electrones de valencia, obviando todas las integrales que
implican el solapamiento de orbitales atmicos, excepto las integrales de resonancia
monocntricas y las integrales monocntricas de intercambio. En estos mtodos y en el mtodo
CNDO, las integrales de repulsin entre los orbitales atmicos del tomo A y cualquiera del
tomo B, forman un conjunto igual, tanto si son del tipo s, p, .
Los mtodos M.N.D.O (modified neglect of diatomic overlap), el AM1 (Austin model 1) y el
PM3 (parametric model 3) estn basados en la correcta inclusin del solapamiento de un centro,
negando u obviando solamente el solapamiento diferencial diatmico. A diferencia de los
mtodos CNDO, INDO y MINDO estos mtodos consideran un nmero adicional de integrales
bicntricas. As, para cada par de tomos no similares es necesario calcular 22 integrales a
diferencia de una nica integral a calcular en los mtodos CNDO, INDO y MINDO. Segn
Dewar, autor de los mtodos MNDO y AM1, el mtodo MNDO no describe correctamente la
energa de los enlaces por puentes de hidrgeno ni la de los aniones, as como sobrestima las
repulsiones electrnicas. Estas dificultades son mejoradas por el mtodo AM1 sin que ello
incremente el tiempo de cmputo. Posteriormente Stewart, uno de los colaboradores de Dewar
realiz una reparametrizacin del mtodo AM1 generando as el PM3. No obstante no se ha
logrado demostrar la superioridad de uno con respecto al otro (AM1 y PM3), por lo que en la
literatura actual es comn encontrarse trabajos que utilizan uno u otro mtodo indistintamente, sin
que eso atente contra la calidad de los resultados.

Por los motivos anteriormente descritos, los mtodos semiempricos han tenido un amplio uso en el
diseo de frmacos, toda vez que son mtodos que reproducen en gran medida las propiedades reales
de las molculas, invirtiendo para ello, poco tiempo de clculo; a diferencia de los mtodos ab initio
en los que el tiempo de clculo resulta en realidad una gran limitante. Sin embargo, es necesario
resaltar que los clculos ab initio son los que reproducen con mayor fiabilidad las caractersticas
estructurales de las molculas, divergiendo en no ms de un 2% con respecto a los datos
experimentales.
II.2 TECNICAS SAR O MODELACION MOLECULAR EN EL DESARROLLO DE
NUEVOS FARMACOS
De manera general, los mtodos que relacionan la estructura qumica con la actividad biolgica
asistidos por computadoras pueden dividirse en dos grandes categoras: los Mtodos de Modelacin
Molecular SAR (Structure Activity-Relationships) y los Mtodos QSAR (Quantitative Structure
Activity-Relationships).
Los mtodos SAR (Structure Activity-Relationships) consideran las propiedades de las molculas en
tres dimensiones y son importantes en ellos aspectos como el anlisis conformacional, la mecnicacuntica, los campos de fuerzas y los grficos moleculares interactivos. Estos ltimos permiten la
representacin y la manipulacin de la molcula en tres dimensiones, lo que proporciona una
informacin espacial que es esencial para comparar molculas y para estudiar la interaccin entre
ligandos y receptores macromoleculares. Estos estudios SAR son utilizados no slo en el diseo de
nuevos frmacos, sino que es aplicable al estudio de mecanismos de accin de los frmacos y a otras
ramas de la ciencia como la ingeniera de proteinas y la qumica de polmeros.

J.C. Escalona, R. Carrasco y J. A. Padrn

16

No obstante, se puede plantear que, el modelado molecular se refiere al uso de la qumica


computacional (clculos qumicos) combinada con grficos tridimensionales sobre computadoras, y
sus aspectos centrales pueden ser divididos en las siguientes componentes:
1.
2.
3.
4.

Generacin y optimizacin de la estructura molecular


Manipulacin y anlisis de las mismas.
Desarrollo de la hiptesis.
Prediccin de las actividades.

II.2.1 Bsqueda del farmacforo.


Independientemente de la va que se utilice para lograr un nuevo frmaco (ver captulo anterior) el
qumico farmacutico tendr al final una nueva estructura qumica que estar destinada a interactuar
de manera precisa con un blanco molecular, ya sea un receptor de membrana, un canal inico, una
enzima o una proteina transportadora. En la mayora de los casos, la nueva molcula identificada no
parece a primera vista similar a otras conocidas y de igual actividad, sin embargo el blanco molecular
es capaz de reconocer en ellos caractersticas similares, por lo que es una tarea del qumico
farmacutico identificar aquellos aspectos que tienen en comn estas molculas que le permiten ser
identificadas por el blanco biolgico y por tanto generar una respuesta farmacolgica. En estas
circunstancias, el anlisis estructural comparativo ayudado por computadoras constituye una
herramienta importante en la identificacin de estos aspectos similares.
La bsqueda en una serie de molculas de los aspectos estructurales indispensables para lograr la
unin al receptor y experimentar una actividad farmacolgica se conoce como bsqueda del
farmacforo. Este no es ms que el conjunto de grupos qumicos, unidos o no entre s, que todas las
molculas activas sobre un mismo receptor tienen en comn, y que son esenciales para el
reconocimiento por el mismo. Es comn asociar al farmacforo como un conjunto de tomos y no
como un conjunto de formas y propiedades electrnicas que son los aspectos identificados por las
enzimas y los receptores. El concepto de bioisosterismo tiene una alta aplicabilidad en el diseo de
frmacos debido a esta caracterstica.
Aunque por definicin propia el farmacforo es el mnimo conjunto de requisitos estructurales y
electrnicos indispensable para una determinada actividad, ello no implica que su presencia en
cualquier estructura qumica sea suficiente para esperar una respuesta farmacolgica. En tal sentido
puede ocurrir que otras partes de la molcula en experimentacin puedan interaccionar tambin con
el sitio activo del receptor, impidiendo as la activacin del mismo. Por ello la atribucin de actividad
farmacolgica por la presencia en la estructura del farmacforo debe estar condicionada por otros
requisitos como son:
1. El compuesto debe ser metablicamente estable, y capaz de ser transportado hasta el sitio de
interaccin con el receptor. Este es el caso de compuestos aparentemente ptimos para una
determinada actividad sin embargo resultan inactivos o poco activos por problemas de
biodisponibilidad.
2. El compuesto debe ser capaz de asumir la conformacin farmacfora, siendo importante el por
ciento que el mismo representa en el equilibrio conformacional de la molcula. As, confrmeros
farmacforos energticamente estables presentarn una mayor actividad que aquellos que, debido

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

17

a su inestabilidad energtica sean menos abundantes en el equilibrio y por lo tanto menos


disponibles a la hora de la interaccin con el receptor.
3. El compuesto no debe presentar en su estructura otras partes que le permitan una interaccin
parcial con el receptor, pues estara bloqueando la actividad del compuesto.
En la actualidad existen dos vas fundamentales de obtener el farmacforo y estas son:

Cuando no se conoce la estructura del receptor


Cuando se conoce la estructura del receptor

II.2.1.1 Obtencin del farmacforo cuando no se conoce la estructura del receptor.


En este caso, el trabajo est destinado a la bsqueda de las secuencias en la estructura qumica de
mltiples ligandos que se unan a un mismo receptor. Para esto, se utilizan una serie de programas
que permiten la visualizacin tridimensional de los ligandos, a travs de los cuales, se pueden realizar
rotaciones, traslaciones y operaciones de superposicin de las molculas. En sentido general se
pueden definir cinco mtodos computacionales a partir de los cuales puede definirse la estructura de
un farmacforo:
1.
2.
3.
4.
5.

Por anlisis de estructuras anlogas y mapeo del receptor.


Por anlisis conformacional y quimiometra.
Por determinacin de las distancias geomtricas.
Por determinacin de los potenciales electrostticos moleculares.
Por tcnicas de QSAR tridimensional.

Anlisis de estructuras anlogas y mapeo del receptor


En el anlisis de estructuras anlogas y mapeo del receptor se llevan a cabo dos pasos fundamentales.
En el primer paso es posible llegar a detectar, por superposicin de un conjunto de estructuras,
aquellas regiones de las molculas que son indispensables para la actividad, y aquellas que son
vulnerables a ser sustituidas con variaciones pequeas en la afinidad. La informacin as recopilada
puede orientar sobre la naturaleza de los grupos funcionales necesarios para la interaccin con el
receptor. En un segundo paso, la hiptesis establecida es verificada por determinacin de cual es la
disposicin tridimensional coincidente de estos grupos (conformaciones) para los compuestos en
estudio. El arreglo tridimensional obtenido para los grupos indispensables se convierte en un
candidato a farmacforo, el cual debe ser posteriormente evaluado en molculas activas sobre el
mismo blanco molecular y no incluidas en el estudio. El farmacforo as obtenido puede ser
consolidado por un anlisis de cargas y estableciendo los potenciales electrostticos del mismo.
Adicionalmente, es recomendable calcular el volumen del sitio de unin que est realmente
disponible para ser ocupado por los ligandos. El volumen mnimo lo proporciona la unin de los
volmenes de todas las molculas activas en aquellas conformaciones que sirvieron para proponer el
farmacforo. Una vez conseguido esto, se debe probar con molculas que posean estos mismos
grupos funcionales y sin embargo tengan muy poca o ninguna afinidad por el receptor. En el caso de
que una molcula sea capaz de adoptar una conformacin energticamente razonable, en la cual los
grupos farmacforos se encuentren correctamente alneados con los compuestos activos, una

J.C. Escalona, R. Carrasco y J. A. Padrn

18

explicacin alternativa posible sera entonces el anlisis del volumen molecular de la misma. Si este
volumen es superior al calculado para el resto de las molculas, entonces esta seria una causa
razonable de la inactividad del mismo.
Si el conjunto de molculas estudiadas es lo suficientemente grande, se pueden llegar a determinar
mapas de volumen para diversos receptores, cuya comparacin puede permitir optimizar la actividad
de un compuesto con respecto a otro. Esta metodologa sirve para caracterizar la topografa de
receptores de los cuales no se conoce su estructura tridimensional, al permitir determinar tanto el
volumen asequible al farmacforo como el volumen adyacente que debe ser excluido de los ligandos.
Sobre esta base, Lloyd en 1986, lleg a proponer una estructura farmacfora comn para 14 clases
diferentes de frmacos que actan sobre el SNC.
Anlisis conformacional y quimiometra
El anlisis conformacional puede ser tratado como un problema multidimensional si se construyen
mapas de distancias y de torsin angular de los confrmeros obtenidos. Las matrices as obtenidas
son transformadas o simplificadas utilizando mtodos estadsticos clsicos como el anlisis de
componentes principales, anlisis factorial o por tcnicas clusters. Estos procedimientos son
conocidos como mtodos quimiomtricos y tienen como objetivo disminuir el nmero de variables a
analizar.
Este tipo de estudio necesita de un anlisis conformacional riguroso de cada una de las molculas a
analizar, pues puede ser que para un determinado frmaco, la conformacin activa no sea la ms
estable termodinmicamente, debido a que la energa libre de asociacin supera generalmente la
energa necesaria para que el ligando sufra un cambio conformacional. Esta limitante, hace que este
tipo de estudio sea muy complicado y que los resultados a obtener no sean siempre satisfactorios,
pues cada conformacin energticamente accesible, presupone una disposicin tridimensional
diferente de los grupos candidatos a interaccionar con el receptor. Es por eso que este tipo de anlisis
debe ir siempre acompaado de un mtodo quimiomtrico, en aras de reducir el nmero de
conformaciones a analizar.
Una forma comn de paliar esta dificultad es la bsqueda de un anlogo rgido que tenga este mismo
mecanismo de accin, plegando el resto de las molculas a la conformacin impuesta por l. No
obstante, existen casos en los que no se dispone de un anlogo de este tipo y otros, en los que este
anlogo rgido no es tan efectivo famacolgicamente, generando resultados, en este ltimo caso, con
un grado de error proporcional al grado de afinidad presentado por esta molcula.
Determinacin de las distancias geomtricas.
Este mtodo desarrollado inicialmente por Crippen y col.6 necesita de un riguroso anlisis
conformacional. En este tipo de estudio se proponen por superposicin molecular, distancias ptimas
a las que se deben encontrar los grupos capaces de interaccionar con el blanco molecular. Como la
matriz de distancia no vara ni con la rotacin ni con la traslacin, tambin es aplicable la
superposicin con anlogos rgidos. Con la informacin del volumen molecular anteriormente
descrito, se pueden adems dar explicaciones acerca de las diferencias entre agonistas y antagonistas.
6

Crippen, GM. Et al. J. Med. Chem., Vol22, 1979.


Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

19

Introduccin al diseo racional de frmacos

Cuando la geometra y la naturaleza del sitio de unin se han calculado, es posible obtener por
diseo, compuestos con mayor capacidad de unin al receptor, pudindose calcular adems, la
energa de unin y predecir la energa con la que el nuevo compuesto interaccionar con el blanco
molecular. Como complemento, se han diseado algoritmos computarizados para buscar nuevas
clases de compuestos con una determinada actividad, comparando bibliotecas de fragmentos
moleculares de estructuras conocidas y seleccionando aquellas que mayores posibilidades tienen de
ajustarse a las medidas previamente calculadas para el sitio de unin.
Determinacin de los potenciales electrostticos moleculares.
Para que ocurra la formacin del complejo ligando-receptor, debe ocurrir el reconocimiento del
potencial electrosttico del ligando por el receptor. Esto hace que este tipo de estudio brinde una
informacin importante a la hora de determinar el farmacforo.
El clculo del mapa del potencial electrosttico de una molcula puede ser llevado a cabo por
mtodos de clculo mecnico-cunticos, ab initio o por mtodos de clculos de carga basados en el
incremento de la electronegatividad. No obstante, debe tenerse en cuenta en el anlisis
conformacional que se realice, que el potencial electrosttico es altamente dependiente de la
conformacin adoptada por el ligando, y por tanto, los resultados derivados de l dependern en gran
medida de los confrmeros empleados en el establecimiento del farmacforo y de la efectividad del
mtodo empleado para el anlisis conformacional.
Criterios de calidad de los modelos de farmacforos. Alcances y limitaciones
Independientemente de los resultados que estos tipos de anlisis generen, la calidad en la obtencin
de los farmacforos es menor que en aquellos casos en los que la estructura del blanco farmacolgico
es conocida, por lo que su contribucin al descubrimiento de nuevas molculas tiene un alcance
limitado. No obstante, en la actualidad las principales determinaciones de estas secuencias se realizan
con la utilizacin de estos mtodos, por la generalmente escasa informacin sobre las molculas
dianas.
Un modelo farmacforo ideal debe ser lo suficiente explicativo y predictivo para poder llenar los
siguientes criterios:7
1. Incluir y explicar las diversas series de compuestos qumicos reconocidos como activantes del
receptor en estudio.
2. Contener al menos un representante rgido y por otro lado representantes flexibles en los que las
conformaciones de mnima energa y otras conformaciones secundarias puedan ser analizadas.
3. Debe proponer la razn de la prdida de actividad en los anlogos inactivos con respecto a las
estructuras activas.
4. Debe ser capaz de discriminar estereoismeros, pues la estereoespecificidad es la principal
caracterstica de los receptores.
5. Debe ser distintivo entre agonistas y antagonistas.
7

Wermuth, CG., Langer, T. Pharmacophore identification, 3D QSAR in drug design, Cap I. Ed. Leiden, Germany,
1993.

J.C. Escalona, R. Carrasco y J. A. Padrn

20

6. Debe ser validado en su capacidad predictiva en el diseo de nuevos y ms potentes frmacos de


estructuras totalmente novedosas.
Las limitaciones fundamentales de este tipo de estudio estriban en que se discriminan las posibles
uniones alternativas que puedan ocurrir entre el ligando y el receptor, o incluso la unin en diferentes
sitios del propio receptor. Adems, se ignora las afinidades relativas perdiendo informacin sobre la
magnitud de la interaccin.
II.2.1.2 Obtencin del farmacforo cuando se conoce la estructura del receptor
El conocimiento de la estructura del receptor puede simplificar el estudio de identificacin del
farmacforo. No obstante, la tarea de determinacin de la estructura de una macromolcula como
estas, constituye en la actualidad un evento de gran dificultad.
Los primeros en describir una estructura y una conformacin detallada para una estructura celular
fueron los famosos genetistas Watson y Crick en 1953, con sus trabajos sobre el ADN. La doble
hlice del mismo, y la complementariedad que debe existir entre los pares de nucletidos hace que el
ADN sea un blanco farmacolgico de suma importancia, al que se pueden unir pequeas y medianas
molculas tanto por intercalacin en su doble hlice como impidiendo la formacin de la misma.
Por otro lado, la primera descripcin detallada sobre la estructura y conformacin de una proteina
data desde 1958, cuando Kendrew caracteriz por cristalografa de rayos X a la mioglobina de
ballena. Teniendo en cuenta que una gran cantidad de frmacos realizan su accin por unin a
enzimas o receptores peptdicos, es que este tipo de informacin estructural sobre las proteinas es de
gran utilidad en el diseo de frmacos.
En la actualidad existen bancos de datos de coordenadas atmicas (estructuras tridimensionales) de
macromolculas biolgicas, procedentes de cristalografa de rayos X y de resonancia magntica
nuclear. La mayor base de datos de macromolculas la constituye el banco de datos de proteinas
(PDB) de Brookhaven que cuenta en la actualidad con varios miles de estructuras de proteinas y
varios cientos de estructuras de cidos nucleicos.
Actualmente se ha logrado adems, la cristalizacin de las estructuras de receptores en su unin con
el ligando. De esta forma, es posible conocer cules son los grupos del ligando que interaccionan
directamente con el receptor, y cules son sus contrapartes en la proteina.
Con estos resultados es posible conocer la naturaleza de la unin, la flexibilidad del receptor, y las
interacciones que mantienen al ligando unido al mismo, pudiendo estimarse por tanto la energa de
estabilizacin de este complejo, y adems, el aporte por separado, de cada una de las regiones del
ligando. Mediante este tipo de estudio, es posible definirse entonces de manera ms precisa y exacta,
la naturaleza del farmacforo. Adems, la lectura en computadoras de estos datos del complejo
frmaco-receptor, permitir la manipulacin del ligando y la insercin de otros ligandos en la cavidad
de unin, pudiendo analizar la naturaleza de la interaccin entre estos nuevos sustratos con el
receptor. Esto permite tambin la insercin de estructuras construidas o diseadas para su ajuste
exacto al receptor, siendo fuente de generacin de nuevas entidades famacolgicamente activas.

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

21

Introduccin al diseo racional de frmacos

Otra de las utilidades que brinda el conocimiento de los receptores estriba en la posibilidad de
estudiar la naturaleza de otras estructuras o receptores anlogas a l cuya estructura tridimensional se
desconozca. Esta tcnica se conoce como modelado de receptores farmacolgicos.
Teniendo en cuenta que la mayora de los datos de proteinas provienen de cristalografa de rayos X,
la cual se obtiene en estado cristalino, hace que el modelado de proteinas o de receptores
farmacolgicos afronte dos problemas bsicos:
1. El nmero de conformaciones en una proteina es enorme. Por ejemplo un receptor de tamao
pequeo, 250 aminocidos, posee unos 750 grados de libertad de ngulos torsionales. Si cada uno
de estos ngulos, tiene acceso a slo 4 valores de mnimos energticos el nmero terico de
conformaciones a adoptar por la proteina ser de 4750. Esto no ocurre cuando se dispone de datos
de RMN, que brinda los datos de los aspectos dinmicos del movimiento interno de la proteina.
Las tcnicas actuales de cristalografa de rayos X a baja resolucin han logrado mejorar estos
resultados.
2. La descripcin terica de la interaccin entre los tomos de una proteina requiere la formulacin
precisa de un potencial o campo de fuerza emprico que contengan trminos para representar los
enlaces covalentes, los ngulos de enlaces de hidrgeno, y las interacciones electrostticas y de
van der Waals. En la actualidad estos programas no son capaces de predecir a partir de una
estructura primaria la estructura tridimensional.
No obstante estas limitaciones, es posible predecir la estructura y propiedades de una proteina a
partir de la estructura tridimensional de otra proteina con un porciento de analoga razonable. De
esta forma se lograr tener la estructura aproximada de una proteina no conocida y por tanto
disear nuevos ligandos capaces de acoplarse al centro activo de la misma.
II.2.2 Consideraciones Finales
El modelado molecular contina su evolucin aplicando una gran variedad de mtodos
computacionales al problema de identificar las complejas relaciones existentes entre estructuras
moleculares y actividades biolgicas en cuanto a interacciones entre los tomos constituyentes. La
introduccin de nuevos mtodos de clculo y de computadoras cada vez ms potentes, generarn sin
dudas nuevos resultados que culminarn con la obtencin de estructuras novedosas cada vez ms
potentes y selectivas.
II.3 TECNICAS QSAR EN EL DESARROLLO DE NUEVOS FARMACOS
Estos mtodos estn basados en el empleo de tcnicas de correlacin entre la estructura qumica y la
actividad biolgica. En este tipo de tcnica, a las que el uso comn han designado con las siglas
QSAR (derivadas del trmino anglfono Quantitative Structure-Activity Relationships)8, la actividad
biolgica es interpretada como funcin de diferentes aspectos de la estructura qumica, y por lo tanto
dependiente de sta como se analizar ms adelante.

. Kubinyi H., Methods and Principles in Medical Chemistry Vol. 1. QSAR: Hansch Analysis and related approaches.
Editorial: VCH Verlag. RFA y VCH Publishers NY USA. Editor, H.F.Hebel, (1993).

J.C. Escalona, R. Carrasco y J. A. Padrn

22

La actividad biolgica del frmaco, producto de su interaccin con el receptor, es una funcin de las
caractersticas estructurales de la molcula. El modelo extratermodinmico de Hansch brinda una
explicacin matemtica del fenmeno en la siguiente ecuacin:

ln A= fh(Xh) + fe(Xe) + fs(Xs) + cte


Ecuacin 3

donde A es la actividad y fh(Xh), fe(Xe), fs(Xs) son funciones de ndices o parmetros hidrofbicos,
electrnicos o estricos respectivamente. El trmino extratermodinmico proviene de que las
relaciones se describen en trminos termodinmicos, aunque no se deducen de sus leyes.
Las aspectos fundamentales de la metodologa extratermodinmica pueden formalizarse en una serie
de puntos, la mayora de los cuales se extraen de la ecuacin fundamental, y es lo que se conoce
como el paradigma de Hansch, que establece que:
1. La actividad biolgica es funcin de la estructura del frmaco.
2. La estructura del frmaco implica ciertas propiedades globales como la hidrofobicidad,
refractividad molar, y solubilidad entre otras; y ciertas propiedades locales como la distribucin
de la hidrofobicidad, carga y volumen en determinadas posiciones de la molcula.
3. Estas propiedades globales y locales pueden ser cuantificadas mediante ciertos parmetros.
4. Siempre existe una funcin que relaciona los cambios de actividad biolgica con los cambios en
las propiedades globales y locales, aunque puede ser que no sea sencilla ni evidente.
Las funciones estructura-actividad que propone el mtodo extratermodinmico, constituye un mtodo
mediante el cual se pueden buscar los productos ms activos entre un conjunto de candidatos.
La metodologa de investigacin en el QSAR sigue, independientemente del modelo que se utilice,
pasos comunes que se hallan resumidos en la figura # 4. El punto de partida implica en todos los
casos la existencia de una cabeza de serie. Este producto, aunque reviste inters como modelo a
desarrollar, tiene propiedades susceptibles a ser mejoradas en aras de obtener siempre un producto lo
ms biodisponible posible.
Cuando se dispone de un prototipo, es preciso disear una serie de exploracin, que debe estar
constituida por un conjunto de anlogos del prototipo, para establecer las primeras relaciones
estructura-actividad. Los miembros de la serie de exploracin han de ser sintetizados y evaluados en
la actividad biolgica de inters.
Los miembros de la serie de exploracin estn constituidos por un ncleo comn, y unos
sustituyentes o fragmentos variables, que son caractersticos de cada producto de la serie. Dichos
sustituyentes variables han de ser identificados por descriptores, que sern utilizados como variables
independientes (Xi) en el modelo. Los valores de actividad biolgica (A) expresados regularmente
en forma logaritmica- se utilizan como variable dependiente.

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

23

Es de particular importancia la calidad de la serie de exploracin a emplear, pues la calidad de las


predicciones van a estar condicionadas en gran medida al diseo ptimo de esta serie, para as tratar
de evitar fallos en la prediccin.
Prototipo o cabeza de seie

Serie de exploracin
Identificacin
Sustituyentes

Actividad
Biolgica

Tratamiento de la muestra

Modelo matemtico

Productos ptimos

Fig. #4 Diagrama sobre la metodologa de investigacin en estudios QSAR.


II.3.1 Eleccin de la serie
La calidad de una serie de exploracin viene definida principalmente por dos aspectos:
1. Disimilitud de la serie. Los productos de la serie deben ser, respecto a los parmetros elegidos,
diferentes entre s. No tiene sentido intentar estudiar cmo influye una caracterstica sobre la
actividad si slo se estudian productos similares respecto a esta caracterstica. Adems, puesto
que la serie debe ser una muestra del espacio experimental, el rango de variacin de las
caractersticas dentro de dicha serie debe ser equiparable a la que existe en el espacio
experimental.
2. Ortogonalidad de la serie. Los productos deben escogerse de tal forma que la variacin en las
caractersticas se produzca de manera independiente. Si la variacin de una propiedad X1 viene
siempre acompaada de la variacin en otra propiedad X2, no es posible conocer si el cambio de
actividad de unos a otros productos se debe al cambio en la propiedad X1 en la propiedad X2.
En estas situaciones se dice que las propiedades X1 y X2 se encuentran correlacionadas en la

J.C. Escalona, R. Carrasco y J. A. Padrn

24

serie. Una serie en a cual las correlaciones entre los parmetros son mnimas se dice que la serie
es ortogonal.
Una vez definida y evaluada la actividad biolgica de la serie de experimentacin se procede al
tratamiento de la muestra, de la cual se obtiene un modelo matemtico que permitir predecir uno o
varios compuestos a los que les sern evaluadas sus actividades biolgicas y reincorporados, en caso
de no presentar una actividad ptima, a la serie de exploracin. Este proceso se repetir el nmero de
veces necesarias hasta lograr la eficacia esperada para el frmaco a obtener.
II.3.2 Tipos de estudios QSAR.
En la actualidad existen diferentes tcnicas por las que se puede desarrollar un estudio QSAR en
dependencia del tipo de tratamiento matemtico que se le d a la muestra y se pueden clasificar en:

QSAR tradicional
QSAR por redes de neuronas
QSAR tridimensional

II.3.2.1 QSAR tradicional.


El mtodo tradicional incluye el tratamiento estadstico de los datos por mtodos multivariados, que
incluye el anlisis de regresin, anlisis cluster y anlisis por componentes principales, entre otras
tcnicas estadsticas. En ellos se valora la actividad biolgica como variable dependiente del conjunto
de descriptores moleculares que constituyen las variables independientes.
Como resultado de esto se obtienen modelos que describen la actividad biolgica como una
determinada funcin matemtica de los descriptores moleculares, bien sean estos estructurales,
qumico-fsicos, o ambos.
El mtodo estadstico ms familiar es la regresin mltiple, en la que se obtendr la ecuacin de una
recta, un plano, o de un hiperplano, segn sea el nmero de variables independientes incluida en la
expresin. En el caso del anlisis cluster, los datos y por lo tanto los compuestos de la muestra, se
agruparn por la semejanza entre ellos segn los valores de similitud que se le exijan.
El anlisis de componentes principales tiene como principal objetivo la reduccin de variables. A
diferencia de lo que pudiramos creer, en la prctica de la modelacin estructural el nmero de
descriptores es muy grande y la seleccin de los que mejor representan a la muestra en la actividad
biolgica estudiada es difcil de definir en ocasiones. En el anlisis por componentes principales, los
datos se combinan en una lnea recta. Esta lnea recta es rotada de diferentes formas y en cada una de
ellas se establecen los coeficientes de cada variable. Por lo tanto, en dependencia de la rotacin que
se haga, as variarn los valores de los coeficientes de cada descriptor estructural o qumico-fsico y
por ende su peso o influencia en este componente. Cada componente (resultado del ajuste a un
modelo lneal de todas las variables en las rotaciones efectuadas) se utiliza como una nueva variable.
Con estas nuevas variables se puede realizar un anlisis de regresin y determinar cual es la
componente ms importante o de mayor calidad para describir la muestra. Es prctica comn emplear
solamente aquellas que en su conjunto dan el mayor valor de varianza explicada. El problema
Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

25

entonces para el especialista consiste en poder asignar a esas componentes una significacin qumicofsica o estructural. Recordemos que cada una de ellas es el resultado de la combinacin lneal de
todos los descriptores, con sus respectivos pesos.
El anlisis de regresin mltiple, como se plante anteriormente, es el ms utilizado dentro del
QSAR tradicional. En l, una vez de establecidos los conjuntos de valores de las variables
independientes Xi y la actividad biolgica A, se obtiene un modelo en forma de ecuacin de una recta
(ecuacin 4), la cual describe la dependencia de la actividad (A) en funcin del conjunto de
descriptores (Xi) as como la magnitud de las contribuciones de cada uno de ellos.

A=f(Xi) + cte.
Ecuacin 4.

El modelo as obtenido ha de ser analizado en funcin de su calidad estadstica, para poder evaluar su
capacidad de prediccin. Cuanta mayor calidad estadstica tenga el modelo, ms confiables y exactas
sern las predicciones a realizar.
La calidad estadstica de un modelo se evala por diferentes estadgrafos. Los ms comnmente
aceptados son el coeficiente de regresin r, el valor F de Fischer y la desviacin estndar s. Cuanto
ms tienda a la unidad el valor de r, mejor ajuste tendrn los datos al modelo. El valor F correlaciona
la varianza explicada (r2) por el nmero de grados de libertad, con la varianza no explicada (1- r2)
por el nmero de variables del modelo. Cuanto ms alto es el porcentaje de varianza explicada por el
modelo mayor ser el valor de F, mientras que la existencia de variables con baja contribucin a la
explicacin de la varianza, tendern a disminuir dicho valor, que tiende a infinito en los mejores
modelos. La desviacin estndar s depende de la varianza no explicada y de los grados de libertad del
modelo y es una medida de cuanto se alejan los valores predichos por el modelo de la lnea, plano o
hiperplano. La tendencia a cero de este valor pudiera presuponer mayor calidad en la prediccin. Sin
embargo, esto puede conducir a modelos sobrepredictivos en los cuales se refleje exactamente el
comportamiento de la muestra pero que no sea posible utilizarlo para la extrapolacin de valores en
el caso de la prediccin de nuevos compuestos. Un valor de s es vlido cuando est en el mismo
orden de magnitud del error experimental de las mediciones de la variable dependiente (la actividad
biolgica).
En la ecuacin 5 se muestra el modelo de regresin lneal mltiple obtenido por nuestro grupo de
investigacin al correlacionar los datos reportados de actividad bactericida de un grupo de alcoholes
alifticos.

log MIC=31.88(6.95)**-2.10(0.17)P1QC***+2.16(0.62)EHOMO**
N=12
R=0.97
F=74.22
S=0.44
Ecuacin 5
Como se puede observar en esta ecuacin, la actividad bactericida, expresada como funcin
logartmica de la concentracin mnima inhibitoria (log MIC), es una funcin de dos ndices que
describen las caractersticas estructurales de la muestra de 12 alcoholes (n=12). Segn establece esta
ecuacin, la actividad aumentara con un decrecimiento en los valores del ndice P1QC, el cual slo
admite por definicin valores positivos, (observe el signo negativo delante del valor de la variable).

J.C. Escalona, R. Carrasco y J. A. Padrn

26

Un aumento de la actividad tambin se lograra incrementando el valor de la energa HOMO


(EHOMO), observe el signo positivo. El valor 31.88 es la constante o intercepto. De manera general,
segn lo establece el modelo, alcoholes con ndices bajos de P1QC y elevados valores de EHOMO
deben poseer mayor poder bactericida.
Si analizamos la calidad estadstica del modelo, observaremos que el mismo posee un alto coeficiente
de correlacin r=0.97, un valor bajo de desviacin estndar s=0.44, y un elevado valor de F, por lo
que el modelo debe tener una alta capacidad predictiva.
Consideraciones adicionales para el establecimiento de una ecuacin con calidad se tienen en funcin
del nmero de variables independientes a incluir en el modelo. La cantidad de variables, debe estar
limitada por el nmero de compuestos que forman parte de la serie de exploracin, de forma tal que,
la relacin existente entre ellos sea de una variable por cada 5 o 6 compuestos en la serie de
exploracin. La utilizacin de una cantidad excesiva de variables en una ecuacin de regresin puede
conducir a reproducciones de la muestra de entrenamiento eliminndole el valor predictivo al
modelo. Es necesario sealar adems que, mientras mayor nmero de variables se incluyan en la
ecuacin, mayor ser el nmero de parmetros a variar en el compuesto a obtener, hecho que se
puede tornar difcil en la prctica sinttica.
II.3.2.1.1 Anlisis de residuales
Otros estadgrafos empleados para determinar la calidad de un modelo son el error cuadrtico medio
(ECM), el error absoluto medio (EAM) y el error relativo medio (ERM). El error en la prediccin o
residual a quien se hace mencin, es la diferencia entre el valor observado o experimental y el valor
predicho (calculado) por el modelo. Su transformacin brinda informacin acerca de la calidad o
ajuste del modelo a nuestros datos y la forma de clculo es simple.
Error cuadrtico medio. Es el promedio del cuadrado de los residuales (diferencia entre el valor
observado y el valor predicho). Con l se resaltan los mayores valores de error y se elimina el efecto
de los valores negativos de los mismos.
Error absoluto medio. Es el promedio del valor absoluto de los residuales. De esta forma se eliminan
los signos negativos y positivos de los errores y permite el anlisis integral de los mismos,
independientemente que el error sea por sobreprediccin (valor predicho superior al observado) o por
subprediccin (valor predicho inferior al valor observado).
Error relativo medio. Con l es posible dar informacin de una manera clara, sobre el
comportamiento de los errores en toda la muestra. Se calcula sacando el promedio al cociente del
valor absoluto de los residuales entre el valor experimental y se da en forma de porciento. Al
dividirse el error absoluto entre el valor observado, se hace posible comparar todos los errores entre
s segn el peso que representan ellos para cada compuesto en cuestin. En este caso, teniendo en
cuenta que se trabaja generalmente en trminos de concentracin, aquellos compuestos cuya
respuesta biolgica se alcanza a valores mayores, su error, como es obvio, podr tener un valor
mayor tambin. En estos casos, analizar los resultados en trminos porcentuales del error, no
permitir que se desvirte el resultado por el peso que puedan tener en la muestra aquellos
compuestos con valores mayores de respuesta biolgica.
Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

27

Introduccin al diseo racional de frmacos

En dependencia de la naturaleza de los residuales y de los datos, as como del inters del
investigador, se seleccionar el tipo o los tipos de error a reportar. Cada uno de ellos brinda una
informacin que puede ser vlida en el anlisis de los resultados. Adems, en un estudio estadstico
determinado, no todos los integrantes de la muestra se ajustan necesariamente al modelo. La razn
puede ser, desde una mala seleccin de la muestra, hasta un comportamiento diferente en el medio
biolgico, por actuar por un mecanismo distinto o por enmascararse la actividad con reacciones
competitivas que sustraen al compuesto del medio. Otra razn puede ser la incapacidad de los
descriptores empleados (variables independientes) de reflejar los aspectos estructurales de inters en
un compuesto especfico. Todo esto hace que en un momento determinado, un elemento no se ajuste
a la recta, plano o hiperplano que describe el modelo. Toca entonces definir si ese comportamiento
que lo sita como outlier estadstico se debe a algo casual.
Outliers estadsticos son por definicin observaciones atpicas no frecuentes. Por la forma en que se
determina la lnea de regresin en la Regresin Mltiple, los outliers tienen una profunda influencia
en la pendiente de la lnea de regresin y en consecuencia, sobre el valor del coeficiente de
correlacin. Incluso un solo outlier es capaz de provocar estos cambios. Ellos representan errores al
azar que debemos ser capaces de controlar, pues pueden ser capaces no slo de incrementar el valor
de un coeficiente de correlacin sino tambin de disminuirlo. Por eso se recurre a lo que se conoce
como Anlisis de Residuales en el que se decide la exclusin o permanencia de del compuesto en
cuestin dentro de la muestra en estudio.
Son diferentes los tipos de residuales que se analizan para definir si un compuesto es o no outlier.
No es correcto al momento de hacer este anlisis, emplear un solo criterio de exclusin. Para eso se
emplea ms de uno, de los cuales haremos una breve resea, sin pretender presentarlos todos.
Criterio para la eliminacin de outliers
Cuando se trabaja con muestras reducidas (n 100), los coeficientes de la ecuacin de regresin no
son muy estables. Es decir, valores extremos pueden influir demasiado en los resultados de la
regresin. Por lo tanto, es aconsejable revisar diferentes criterios de eliminacin de outliers para
reiniciar el anlisis en los casos ms crticos despus de eliminarlos. En este trabajo analizaremos
como indicadores de la condicin de outliers los siguientes estadgrafos:
Residual estndar. Es el valor del residual, estandarizado (el valor observado menos el valor
predicho dividido por la raz cuadrada del residual cuadrtico medio). Lo utilizaremos como criterio
de exclusin absoluto si su valor es mayor que 3, aunque segn la naturaleza del problema, puede
oscilar entre 2 y 5.
Distancia de Mahalanobis. Si pensamos que las variables independientes de la ecuacin estn
definiendo un espacio multidimensional, podemos pensar tambin que en ese mismo espacio
podemos plotear el valor medio de cada variable independiente. A este pseudo punto medio del
espacio multidimensional se le llama centroide. La distancia de Mahalanobis es la distancia del
centroide al caso en el espacio multidimensional, y su medida da un ndice de si una observacin es o
no un outlier.

J.C. Escalona, R. Carrasco y J. A. Padrn

28

Residuales borrados. Es el valor estandarizado para cada caso, si este ha sido excluido del anlisis de
regresin. Si el residual borrado difiere mucho del residual estandarizado respectivo, entonces ese
caso es posiblemente un outlier porque su exclusin cambia la ecuacin de regresin.
Distancia de Cook. Indica la diferencia entre el valor del coeficiente de la variable independiente
calculado y el valor que se deba esperar despus que el caso se excluye Todas las distancias deben
ser aproximadamente de la misma magnitud. Si no es as, puede decirse que el caso respectivo vari
la estimacin de los coeficientes de regresin.
En ltima instancia, cuando un compuesto de la muestra resulta outlier en tres o ms criterios,
entonces se le puede considerar un verdadero outlier estadstico y se le excluye de la muestra, si no
existen consideraciones cualitativas de compromiso que fuercen su permanencia.
II.3.2.1.2 Anlisis grfico de resultados.
En estadstica, los grficos resultan de mucha utilidad para visualizar la informacin contenida en los
modelos. Esta forma de anlisis se aplica lo mismo al modelo en s como a los residuales.

Grficos de predichos vs observados

Este tipo de grficos ilustra el comportamiento de los valores experimentales respecto a los predichos
por el modelo. El comportamiento ideal es cuando existe coincidencia entre ambos valores y por lo
tanto se superponen dando una lnea recta. La figura 5 es el resultado de plotear el valor predicho de
Area de Superficie Accesible a Disolvente contra los valores calculados por el mtodo DelPhi en una
muestra heterognea de 296 compuestos9, descrito por la ecuacin:
ASAD = 85.12(2.121) +60.19(1.886)1v- 40.743(2.648) 3v - 20.406(2.186)4
+27.128(1.626)1 + 8.505(2.638) 2q3 -26.822(4.553)4-15.441(2.360)5-9.569
(1.867)1 +10.768(2.310)1q3+15.878(4.072) 5q
R= 0.994 R2= 0.988 F(10,285)=2424.5 p<0.0000 S= 9.284 n=296
Ecuacin 6

Padrn, JA,. Carrasco, R., Marrero, J., Pardillo, E and Estrada, E. Use of Topological and Topographical Indexes in the
Prediction of the Solvent Accessible Surface Area. Quant Struct Act Relat.Submited
Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

29

Figura 5. Valores predichos vs observados obtenidos por la ecuacin 6.


Grfico de Residuales vs Residuales Borrados
Con este tipo de grfico es posible ver de manera clara la estabilidad del modelo cuando se elimina
por pasos cada uno de los casos de la muestra. Segn esta forma de presentacin, aquellos residuales
borrados que no se ajusten a la recta, pueden ser analizados como potenciales outliers. Su
eliminacin y posterior anlisis de la ecuacin resultante, as como de los grficos correspondientes,
decidir si realmente el compuesto constituye o no un outlier. En la figura 6 se muestra el grfico de
Residuales vs Residuales Borrados correspondientes a la ecuacin anterior.

Figura 6.Grfico de residuales vs residuales borrados de la ecuacin 6


Segn este resultado hay al menos un compuesto con posibilidad de ser outlier. La exclusin del
mismo empeor la ecuacin de regresin (menor R, menor F y mayor s), y por lo tanto permaneci
en el modelo.

J.C. Escalona, R. Carrasco y J. A. Padrn

30

Grfico de distribucin de residuales estndar o de residuales puros.


En ocasiones resulta de inters al momento de la presentacin de los resultados, visualizar
grficamente la distribucin de residuales. Esta forma de presentacin en histogramas resulta muy
ilustrativa, sobre todo si se desea trasmitir al potencial lector la informacin directa y confiable del
rango de error en que incurre el modelo, as como su distribucin normal. Al analizar outliers a partir
de los residuales estndar se fijan en valores no mayores de 2, 3 o de hasta 5, segn los
objetivos y tareas concretas. Es decir, que los valores de error no se separen de los experimentales en
ms de 2, 3 o hasta 5 veces la desviacin estndar () del experimento.
La figura 7 muestra la distribucin de residuales estndar de un modelo de regresin para la
estimacin del coeficiente de particin octanol/agua en una muestra heterognea de 58 compuestos10,
dado por la ecuacin 7.
log P = 1.476(0.123)p1q- 0.463(0.036)HB1-6.657(1.204)p6 +6.492(1.352)p6 1.118(0.462)c3q - 0.621(0.273)
n=58 R= 0.965
R= 0.932
F(5,52)=142.69
p<0.000
s= 0.275
Ecuacin 7.
Distribution of Standard residual
20
18
16
14
No of obs

12
10
8
6
4
2
0
-2.5

-2 -1.5

-1 -0.5

0.5

1.5

2.5

3.5

Expected
Normal

Figura 7. Grfico de distribucin de residuales estndar para la ecuacin 7.


De la grfica anterior puede observarse que los residuales estndar no sobrepasan el valor de 3 y
que presentan una distribucin casi normal, compatible con la heterogeneidad de la muestra.

10

Carrasco, R., Capote, R., Padrn, JA., and Estrada, E. Modeling Physico-chemical Properties of Organic Compounds
from Topological/Topographic Molecular Descriptors. J. Chem. Inf. and Comput. Sci., submited.
Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

31

Introduccin al diseo racional de frmacos

II.3.2.2 QSAR por redes de neuronas.


A nuestro mundo civilizado de hoy se le ha dado en llamar la Sociedad de la Informacin. Esta
idea, expresada de otra forma: El dueo de la informacin es el dueo del mundo, ilustra el estado
actual de este aspecto de la vida del hombre en los finales del siglo XX. Es tan grande la cantidad de
informacin de todo tipo que se recibe por mltiples vas diariamente, que se hace evidente que
podemos quedar ahogados dentro de esa avalancha de conocimientos que nos llega. Cada vez
resulta ms difcil hallar el dato necesario dentro de la profusin de datos individuales.
El anlisis de datos en qumica no es algo nuevo. Durante aos se ha realizado por mtodos
estadsticos y tcnicas de reconocimiento de patrones. Pero tambin ha estado claro que el cerebro
del hombre recibe y analiza informacin de forma sui generis porque la adquisicin de conocimientos
por el cerebro humano no se realiza por mtodos estadsticos.
Las limitaciones propias de los mtodos mencionados condujeron a los sistemas expertos. Un
sistema experto tiene su punto de partida en una gran cantidad de informacin (base de datos), un
nmero considerable de reglas de conocimientos (base de conocimientos) y un mecanismo de
inferencia que une ambas bases y permite tomar decisiones. En el acpite sobre sistemas expertos, se
presentan ejemplos de estos sistemas basados en computadoras que permiten simular el razonamiento
del hombre en el dominio del saber especfico. Sin embargo, los sistemas expertos distan mucho de
ser perfectos. Estos mtodos requieren, para construir su base de conocimientos, muchas disciplinas
cientficas. Pero evidentemente, esta no es la va por la cual el cerebro adquiere el conocimiento.
Los avances en neurofisiologa, y las nuevas tcnicas experimentales como la electroencefalografa,
la tomografa axial computarizada, el tratamiento de imgenes por RMN, la tomografa de positrones
o la de fotones, han incrementado la comprensin de la anatoma del cerebro y de los procesos fsicoqumicos que ocurren en l. A partir de este conocimiento, se
disearon modelos matemticos de adquisicn de
conocimientos del cerebro humano llamados Redes de neuronas
artificiales (RNA), o simplemente, Redes de Neuronas (RN).
Los modelos de redes neuronales se basan en la interaccin
colectiva y en paralelo de una gran cantidad de procesadores
simples que simulan la conducta de las neuronas biolgicas. La
manera como las neuronas se encuentran interconectadas
determina la arquitectura o topologa de la red. Cada neurona
por ejemplo, puede estar conectada con todas las restantes (red
de Hopfield), estar basada en una sola capa de neuronas
Figura 8 Red de Hopfield
organizada en un plano con una topologa definida (red de
Kohonen), o pueden estar organizadas por capas (perceptrn
multicapa). En la figura 8 se muestra un ejemplo de red de Hopfield en la que se indican con flechas
de diferentes tipos la conexin de tres de las 10 neuronas que la constituyen. La figura 9 es un
ejemplo de red de Kohonen bidimensional.
Una RNA la podemos considerar una caja negra que acepta un conjunto de datos, los procesa y
brinda una o ms salidas. La funcin de procesar es a lo que comunmente se le llama aprendizaje de

J.C. Escalona, R. Carrasco y J. A. Padrn

32

la red. Muchos usuarios de las RNAs desconocen lo que ocurre dentro de esa caja negra sin
embargo, continan aplicndola a su problema.
Las RNAs han sido aplicadas en qumica tanto para estudios de relacin estructura-propiedad como
estructura-actividad biolgica, de forma cualitativa y cuantitativa. En dependencia del tipo de trabajo
a realizar en un campo especfico debe seleccionarse el tipo de red a emplear. En los estudios QSAR
y QSPR es de uso comn los perceptrones multicapa para procesamiento cualitativo y cuantitativo de
las muestras. Las redes de Kohonen y Hopfinger se emplean preferentemente en problemas de
seleccin de variables para el establecimiento de los modelos y para definir muestras de
entrenamiento y prueba. se utiliza frecuentemente para establecer criterios de seleccin de variables
La seleccin del tipo de red y la definicin de su topologa se establece dependiendo del tipo de
trabajo a realizar en el campo especfico.
II.3.2.2.1 Teora de las redes de neuronas artificiales.

Una RNA consiste de un nmero de unidades de


procesamiento conectadas entre s usualmente, pero no
siempre en diferentes capas. Aqu slo expondremos el tipo
de red conocida como perceptrn multicapa por ser la ms
ampliamente aplicada en estudios QSAR y QSPR, en el que
la arquitectura ms empleada es la de una capa de entrada,
una oculta y una de salida. Esta arquitectura ha demostrado
ser suficiente para la resolucin de problemas en este campo
con el mximo de economa en el gasto computacional.

C apa
de
e ntra d a

C apa
o c ulta

C apa
de
s a lid a

Figura 10. Perceptrn multicapa

Cada unidad de procesamiento o neurona realiza varias


funciones en analoga muy simplificada al compararla con
los cientos que realizan las neuronas biolgicas,
pero que a los efectos de modelo resultan
suficientes. Ellas reciben los datos en la unidad
de entrada, los pasan a la unidad de
procesamiento, aplican una funcin de
transferencia y producen una salida (fig. 10). La
funcin de transferencia es generalmente una
sigmoide pero pueden ser otras funciones; el
propsito de esta funcin de transferencia es
simular o mimetizar las funciones de las
neuronas biolgicas las que envan un impulso o
seal si la seal recibida o dato est por encima
de un cierto umbral de valor.

Hay diferentes algoritmos para el aprendizaje de


las redes de neuronas, pero el ms ampliamente
Figura 9. Red de Kohonen
empleado por los quimiomtricos es el conocido
como
feed-forward
backpropagation,
o
simplemente backpropagation. Este procedimiento utiliza un mtodo de aprendizaje supervisado, lo
Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

33

Introduccin al diseo racional de frmacos

cual quiere decir, que necesita conocer las respuestas a las entradas, por adelantado, o sea, la
actividad biolgica o propiedad. De manera comn, este tipo de red emplea las unidades
procesadoras en tres tipos de capas: de entrada, oculta y de salida. Cada unidad en una capa est
conectada a cada una de las unidades en las capas adyacentes con un peso o fuerza de conexin i. El
ajuste de estos pesos durante el proceso de optimizacin es lo que se realiza durante el entrenamiento
de la red. El valor de cada unidad en la capa de salida se compara con el valor diana que, en los
estudios de relacin estructura-actividad o estructura-propiedad son los valores experimentales de
dicha propiedad.
Mientras que en la regresin mltiple tenemos una tabla de n compuestos con y propiedades qumicofsicas y la actividad biolgica asociada a cada uno de los n compuestos, en las RN tendremos y
unidades en la capa de entrada y generalmente una unidad en la capa de salida (actividad o
propiedad) con usualmente una capa de unidades ocultas entre las capas de entrada y salida. Las
entradas a la red pueden ser cada uno de los valores y a cada una de las y neuronas para cada
compuesto. El valor diana para cada uno de los n compuestos ser la actividad biolgica o la
propiedad qumico-fsica, segn sea el caso.
A las redes a las que se les suministran los datos en la capa de entrada y producen una seal hacia la
capa de salida, se les llama feed-forward o de alimentacin hacia delante. El entrenamiento de la red
implica cambios iterativos de los pesos en las conexiones hasta que la seal de la neurona o neuronas
de la capa de salida se ajusta, dentro de ciertos valores lmites de error, con el valor diana en un
proceso de minimizacin del error. Hay diversas formas de alterar los pesos de la red pero uno de los
ms empleados es la regla delta.
La regla delta, dicha de forma cualitativa, est descrita por una expresin segn la cual, los cambios
en el peso de una conexin dada entre dos neuronas es funcin de dos parmetros denominados o
velocidad de aprendizaje para ajustar la velocidad a la cual la RN asimila la informacin, aprende,
durante el entrenamiento y un trmino (tambin se encuentra como notacin) llamado
momentum, que impide que la red quede atrapada en mnimos locales. Al inicio del entrenamiento, a
los pesos de las conexiones se les asignan valores al azar. Los datos para todos los compuestos se
pasan por la red (se transforman por la funcin de transferencia) y la respuesta de salida se compara
con el valor experimental, en nuestro caso la actividad, y se determina el error. Los pesos se ajustan
entonces para que los datos pasen por la red por segunda vez con el fin de reducir el error anterior.
Como la regla delta requiere el clculo de un error en la neurona de salida para calcular los errores
en las restantes neuronas, es que se les conoce como propagacin del error hacia detrs o
backpropagation errors, de ah su nombre. Este proceso se repite iterativamente hasta minimizar el
error por debajo de un valor fijado. Por ltimo, se puede calcular el coeficiente de correlacin entre el
valor observado de la actividad biolgica y el predicho por la red. Las redes de este tipo se emplean
cuando no se conoce la forma analtica del modelo (lineal, cuadrtico, etc.) o cuando se desea extraer
informacin no-lineal compleja del conjunto de datos.
II.3.2.2.2 Aplicaciones de las redes de neuronas en estudios QSAR.

Al igual que otros modelos matemticos de anlisis de datos, la calidad de los resultados depender
en buena medida de la calidad de los mismos, es decir, de la naturaleza de la muestra, as como de los
descriptores empleados para el establecimiento del modelo. La seleccin de una muestra de trabajo

J.C. Escalona, R. Carrasco y J. A. Padrn

34

puede ser en un momento determinado, un aspecto limitante; bien porque las condiciones
experimentales no permiten llenar vacos o la bibliografa no suministra la informacin necesaria. Es
un lugar comn el no disponer de los datos necesarios y suficientes, aunque la cantidad de ellos sea
extensa. Esta situacin obliga a trazar una estrategia en los estudios QSAR para la seleccin de las
muestras de entrenamiento y prueba. La aplicacin de la misma en el anlisis de regresin, permite
validar los resultados del modelo alcanzado en un conjunto de compuestos diferentes al utilizado para
desarrollar el modelo y as valorar su capacidad descriptiva. Por su parte, en el trabajo de RN se
precisa generalmente un tercer conjunto al que se llama de validacin, pues en RN es frecuente que
los programas presenten la opcin de salvar la mejor red segn los resultados alcanzados en la
muestra de entrenamiento o en la de prueba. En estos casos, este procedimiento le restara algo del
valor de generalizacin al resultado del aprendizaje, pues la red ya habra visto en algn momento a
la muestra de prueba. Por eso, ese tercer grupo de compuestos constituye el ltimo criterio para
validar los resultados.
Uno de los primeros trabajos aplicados a estudios QSAR fue un anlisis discriminante de un conjunto
de derivados anticancergenos de mitomicina. Se emple un conjunto de seis variables, dos de ellas
indicadoras y cuatro de sustituyente, se dividi la actividad en cinco categoras y se fij una capa
oculta de 12 neuronas (arquitectura 6 x 12 x 5) . La red entrenada fue capaz de clasificar
correctamente los 16 compuestos de la muestra de entrenamiento. Sin embargo, el elevado nmero de
conexiones (132) puede dar lugar a correlaciones casuales o a un ajuste excesivo, lo que en
terminologa de RN se conoce como memorizar; es decir, la red ha retratado la muestra y establecido
un patrn nico lo cual le impide hacer la generalizacin de su aprendizaje. Esto hace que si se le
presenta un grupo de compuestos no visto por ella anteriormente, no los reconocer pues su patrn
para identificar nuevas entidades se especializ en el conjunto de entrenamiento que se le suministr
previamente para el aprendizaje. Qu quiere decir este comportamiento? Que se ha sobreajustado
una superficie a la muestra de entrenamiento brindando un aparentemente buen comportamiento
pero, no permite la prediccin. Este problema fue identificado por Andrea (1990) el cual propuso un
parmetro , que puede ser empleado para caracterizar la relacin entre los puntos de datos y el
nmero de conexiones segn la expresin:

N o de puntos de datos
N o de conexiones

En ese trabajo se recomienda emplear valores de 1.8<<2.2 para evitar por una parte que la red
memorice, y por la otra, para evitar prdida de informacin por insuficiente nmero de conexiones.
En el ejemplo mencionado, =0.5 y por lo tanto, es posible que exista un sobreajuste. Sin embargo,
segn J. Zupan y J. Gasteiger11 la bsqueda de una arquitectura apropiada para una red resulta en la
prctica, un procedimiento de prueba y error.

11

Zupan, J. and Gasteiger, J. Neural Networks for Chemists. An Introduction, cap. 8; 1994.
Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

35

En otra aplicacin, se trabaj con una muestra heterognea de


cefalosporinas (fig. 11) con variaciones estructurales en las
1
R7
6
2
7
5
8
posiciones 7 y 3 del anillo cefalospornico y se utiliz la
3
N 4
R3
actividad medida frente a E. coli como respuesta biolgica. Se
O
dividi la muestra de 104 derivados en tres: de entrenamiento
CO OH
(n=57), prueba (27) y validacin (20). Se lograron
Figura 11. Frmula general de las predicciones aceptables para un modelo cuantitativo tan
cefalosporinas
heterogneo. El error relativo en la prediccin para las
muestras de entrenamiento y prueba es de 7.7% y para la
muestra de validacin de 7.9%. En otro trabajo utilizando esa misma muestra, se lograron modelos
para el S. aureus con errores relativos para las muestras de entrenamiento y prueba de 6.9% y de
10.5% para la muestra de validacin. Estos resultados se consideran muy buenos, teniendo en cuenta
la elevada heterogeneidad de la muestra.
CO NH

Una capacidad de anlisis de la informacin que es exclusiva de las redes de neuronas, es la que nos
permite evaluar simultneamente en un mismo modelo, ms de una actividad. La incorporacin de
neuronas adicionales en la capa de salida es la que facilita esta opcin. En un trabajo actualmente en
curso, nos encontramos evaluando un sistema de redes en las que se evala simultneamente la
actividad de una familia de 65 cefalosporinas de diferentes generaciones frente a dos bacterias Gram
(+), S. aureus y E. cloacae. Para ese estudio la muestra se dividi tambin en tres: entrenamiento
(48), prueba (12) y validacin (5). Se lograron coeficientes de correlacin de 0.90 y 0.86, as como
errores relativos promedios de 5.3 y 6.7% para cada bacteria respectivamente. Esta tipo de anlisis es
imposible de realizar con otros mtodos multivariados.
II.3.2.3 QSAR tridimensional (3D-QSAR).
El QSAR tridimensional es una tcnica moderna que combina los aspectos relacionados en el estudio
QSAR clsico con los de los estudios SAR o de modelado molecular. En los estudios SAR de
anlogos, la eleccin se limita a si el compuesto es activo o inactivo. En la prctica, sin embargo, los
resultados se representan generalmente de forma numrica que refleja las diferencias cuantitativas en
la unin de uno u otro ligando. Por otro lado, el QSAR clsico si tiene en cuenta estos valores
numricos de las afinidades, pero para establecer un modelo por esta tcnica, no es posible considerar
compuestos estructuralmente diferentes, ya que en este tipo de anlisis, es indispensable el empleo de
una serie estructuralmente anloga. La necesidad de lograr una interfase entre ambos tipos de trabajos
necesit el desarrollo de un anlisis conceptualmente nuevo.
El primer logro en este sentido lo alcanzaron Cramer y colaboradores12 en 1988 al desarrollar el
anlisis comparativo de campos moleculares (CoMFA). La premisa bsica de este mtodo, es que el
muestreo adecuado de los campos elctricos y electrostticos alrededor de un conjunto de molculas
o frmacos, puede proporcionar toda la informacin necesaria para comprender las actividades
biolgicas.

12

Cramer, RD., Patterson, DE., Brunce, JD. J. Am. Chem. Soc. Vol 110, 1988.

J.C. Escalona, R. Carrasco y J. A. Padrn

36

Para hacer esto posible, se precisa del clculo de los campos de fuerzas por mecnica molecular, que
slo consideran las fuerzas estricas y electrostticas. Para lograrlo, se superponen todas las
molculas en las conformaciones presumiblemente activas y se calculan las energas de interaccin
estricas (van der Waals) y las electrostticas (Coulomb) entre cada una de las molculas de inters.
Posteriormente se recurre a la tcnica estadstica de los mnimos cuadrados parciales y se extraen las
variables que describen la varianza del conjunto de datos, los cuales se someten despus, a una
validacin cruzada. El anlisis de regresin lineal mltiple no es aplicable en esta tcnica, pues, la
cantidad de variables generada en estos estudios es muy elevado.
De manera general los pasos a seguir son los siguientes:
1. Postular la conformacin activa para el metabolito endgeno o para el frmaco ms activo.
2. Alinear el resto de las molculas y establecer a su alrededor una malla tridimensional como una
caja de puntos en el espacio potencial del receptor.
3. Calcular el campo que cada molcula ejercera sobre un tomo sonda situado en cada punto de la
malla.
4. Determinar una expresin lineal mediante la tcnica de mnimos cuadrados parciales que podra
consistir en un conjunto mnimo de puntos de la malla necesarios para distinguir los compuestos
sometidos a examen de acuerdo a las actividades determinadas experimentalmente.
5. Realizar la validacin cruzada del modelo (crossvalidation)
6. Ajustar la alineacin de los compuestos peor predichos y repetir los pasos anteriores hasta
encontrar la mayor alineacin posible.
Estos resultados del QSAR-3D producido por miles de trminos (en el QSAR tradicional el nmero
de trminos es ms reducido en funcin del tamao de la muestra), se pueden visualizar grficamente
en formas de mapas de contorno, pudiendo colorearse de diversos colores para resaltar la direccin y
magnitud de la interaccin. De tal manera, las regiones coloreadas aparecern en aquellas regiones en
donde las diferencias electrnicas y estricas produzcan una mayor variacin de la actividad.
II.3.3 Validacin de modelos.
Independientemente del tipo de anlisis QSAR empleado, el resultado final va a ser un modelo
matemtico. Para estar completamente seguros de que el modelo obtenido no resulta de un
ordenamiento al azar de los datos, es comn, segn las normas internacionales, verificar la calidad
del mismo.
El mtodo de regresin lineal mltiple proporciona los valores para los coeficientes que hacen que la
funcin matemtica propuesta explique al mximo, cmo varan las actividades. Independientemente
de esto, siempre quedar una varianza no explicada por el modelo -los residuales-, que corresponden
a los errores en las medidas de los datos de actividad y a posibles efectos no incluidos en l parmetros no considerados-. Mientras mayor sea la diferencia entre la varianza explicada sobre la no
explicada mayor ser la utilidad del modelo. Esto puede contrastarse con un anlisis de varianza y un
test de F. Cuando el modelo no es satisfactorio se obtiene la no significacin en el test.
Otro problema es que el modelo no sea predictivo, es decir, que la funcin propuesta no se cumpla
para productos no incluidos en la serie de exploracin. Este problema suele solucionarse realizando

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

37

una validacin cruzada (crossvalidation) al modelo, con el procedimiento conocido como leave-oneout. Este procedimiento consiste en un anlisis de regresin lineal que se repite tantas veces como
nmero de compuestos tenga la muestra, eliminando en cada uno de los anlisis a un compuesto. De
tal manera, en una muestra donde el nmero de estructuras evaluadas es 24 (n=24), se realizarn 24
anlisis de regresin con 23 compuestos, generando al final los valores promedios de los coeficientes
de correlacin (r2 rcross) y de las desviaciones estndar obtenidas (Spress). De esta forma se puede
conocer si el modelo mantiene su calidad estadstica independientemente de la presencia o ausencia
de algunas de las molculas estudiadas.
Si el valor de r2 rcross disminuye ostensiblemente con respecto al valor del coeficiente de
correlacin (r), eso significa que el modelo obtenido sustenta su valor estadstico sobre los datos
evaluados, pues la inclusin o eliminacin de un compuesto influye apreciablemente en los valores
del coeficiente de correlacin. De tal manera la ecuacin o modelo obtenido no tendr valor como
modelo predictivo. El lmite de disminucin de r2 rcross con respecto al coeficiente de correlacin
para que el modelo mantenga propiedades predictivas, est en dependencia del tipo de anlisis
estadstico empleado. Para el caso del 3D-QSAR, donde se utiliza el mtodo de los mnimos
cuadrados parciales (PLS), los valores de r2 rcross pueden disminuir hasta el valor de r20.6513; y en
el caso del QSAR tradicional donde se utiliza el mtodo de regresin mltiple, estos valores no deben
disminuir en ms de un 10%, en aras de disminuir el por ciento de error a la hora de realizar las
predicciones.
Otra forma de medir o evaluar la calidad de la ecuacin obtenida consiste en determinar la robustez
(q2) del mismo, y el mismo se calcula a travs de la ecuacin siguiente:

q2 = (SD-PRESS)/SD
ecuacin 8
donde SD es la sumatoria al cuadrado de las desviaciones estndares de los residuales y PRESS es la
sumatoria al cuadrado de los residuales. Este valor de q2 derivado de la validacin cruzada no es ms
que la habilidad del modelo para realizar la prediccin. En un modelo donde se obtenga un valor de
q2> 0.5 puede ser considerado como un modelo predictivo.
Para que el estudio de relaciones estructura-actividad se concluya con xito debe obtenerse un
modelo significativo y predictivo. An as, la validez del modelo estar siempre limitada al rango de
parmetros explorados por la serie de exploracin, fuera del cual nunca debe considerarse vlido. De
hecho, esta es la principal limitacin a la hora de buscar el ptimo de actividad predicho por un
modelo.
Cuando el modelo contiene slo trminos lineales, basta con buscar sustituciones que maximicen,
segn los valores que toma el ndice, los trminos con coeficientes positivos y minimicen los
trminos con coeficientes negativos. Esta operacin debe ser resuelta con mucho cuidado, pues los
procesos de maximizacin o minimizacin deben realizarse sobre la base de los valores que toma el
ndice, pues existen ndices que pueden tomar valores tanto positivos como negativos (las cargas,
energas, lipofilidad, etc.); mientras que otros slo poseen valores solamente positivos (los ndices
, etc.) o negativos (EHOMO y ELUMO).

13

Tong, W. Et al. Environ Health Perspect. Vol 105, No. 10, 1997.

J.C. Escalona, R. Carrasco y J. A. Padrn

38

Debe tenerse en cuenta, que si se rebasan los valores mximos y mnimos de la serie de exploracin,
los resultados a obtener en los nuevos compuestos no tienen porqu responder al modelo, pues esos
valores no fueron explorados y por tanto no incluidos en el mismo. Un ejemplo de esto puede ser un
modelo en el cual sea necesario el incremento del ndice . Este ndice, que slo toma valores
positivos, se incrementa cuando se aumentan los rdenes de enlaces y las ramificaciones en la
estructura qumica. Esto hace pensar que, en las molculas a disear, la inclusin de un mayor
nmero de dobles o triples enlaces, y el aumento de la ramificacin por utilizacin de las tcnicas
modulativas de la variacin molecular (ver captulo I), generara compuestos ms activos; sin
embargo este aumento de dobles o triples enlaces puede generar en la molcula una susceptibilidad al
metabolismo y metabolizarse rpidamente sin que esta llegue al sitio de interaccin con el blanco
teraputico. El incremento de la ramificacin, por su parte, puede generar un volumen superior al
permitido por el receptor y por tanto bloquear por impedimento estrico la interaccin del ligando
con el mismo. Estas consideraciones no pudieron ser recogidas evidentemente por el modelo, pues en
l este extremo de valores no fue considerado.
II.4. DESCRIPTORES MOLECULARES O INDICES
Bajo este trmino se agrupan una serie de parmetros que a travs de valores numricos representan
una informacin estructural, electrnica, estrica, as como una determinada propiedad qumico-fsica
de la molcula en estudio. Desde este punto de vista estos parmetros se clasifican en:

Indices basados en propiedades qumico-fsicas: Son aquellos, como lo dice su nombre, que
derivan de la determinacin experimental de una determinada propiedad qumico-fsica de la
molcula.
Indices mecnico-cunticos: Son aquellos que se determinan por clculos mecnico-cunticos.
Indices topolgicos y topogrficos: Son aquellos que se determinan a partir del grafo qumico, o
sea de la estructura qumica.

II.4.1 Indices basados en propiedades qumico-fsicas


Las propiedades qumico-fsicas en una molcula pueden reflejar la interaccin de dicha molcula
con el receptor. Entre los parmetros qumico-fsicos ms empleados en el QSAR se encuentran:
Smbolo
log P
MR
pka

Descripcin
Logaritmo del coeficiente de particin
Refractividad Molecular
Constante de ionizacin
Momento dipolar

Tipo
Hidrofbico
Estrico
Electrnico
Electrnico

Referencia
Hansch, 1979
Hansch, 1973
Martin, 1978
Lien, 1982

Todos los parmetros anteriormente reflejados representan propiedades globales de la molcula. Este
tipo de parmetro tiene el inconveniente de que es necesario medir la propiedad, y muchas veces esto
presupone un trabajo laborioso; aunque muchos de estos ndices pueden ser determinados por
mtodos computacionales con aproximaciones bastantes exactas a la realidad experimental.

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

39

Existen adems ndices fragmentales derivados de la parametrizacin del ndice global en un


conjunto de derivados de una cabeza de serie, en la cual slo varan los sustituyentes en una o varias
posiciones de ste. De tal manera, el ndice fragmental se calcula por la diferencia existente entre el
ndice global de la molcula cabeza de serie y el ndice global para la molcula analizada. El valor
as obtenido representa la contribucin del sustituyente sobre el ncleo bsico.
De este modo pueden caracterizarse propiedades locales de la molcula, pero tambin propiedades
globales, tomando en consideracin el carcter aditivo de cada uno de los valores fragmentales que
constituyen la molcula final. De tal modo que se hace innecesaria la sntesis previa de los productos
a caracterizar. Entre estas constantes fragmentarias las ms utilizadas son:
Smbolo

Es
MR
F,R

Descripcin
Constante hidrofbica del sustituyente
Constante de Hammett
Parmetro estrico de Taft
Refractividad Molar de sustituyente
Constantes del efecto inductivo y
resonante

Tipo
Hidrofbico
Electrnico
Estrico
Estrico
Electrnico

Referencia
Fuyita, 1964
Hammett, 1940
Taft, 1956
Hansch, 1973
Swain, 1968

III4.2 ndices mecnico-cunticos.


En cualquier estudio QSAR, la obtencin de un coeficiente de correlacin significativo est
condicionado en gran medida a la utilizacin de descriptores que logren reproducir el fenmeno
estudiado, independientemente del origen del mismo.
El desarrollo reciente de la computacin ha hecho posible el clculo mecnico-cuntico de las
estructuras qumicas. Estos clculos qumicos-cunticos ha generado un creciente inters en la
obtencin de ndices que en un principio, puedan expresar todas las propiedades electrnicas y
geomtricas de las molculas, as como, sus interacciones. Es precisamente, la qumica cuntica, la
que brinda una informacin electrnica ms detallada, que en muchos casos no es posible cuantificar
experimentalmente.
Para un estudio QSAR lo importante a obtener de estos clculos qumico-cunticos son ndices que
permitan describir las caractersticas electrnicas y energticas de las molculas. Debido a la amplia
informacin que pueden contener estos descriptores tericos, su utilizacin en estudios QSAR puede
tener dos grandes ventajas:
1. Los compuestos y sus varios fragmentos y sustituyentes pueden ser directamente sobre la base
exclusiva de su estructura molecular.
2. El mecanismo de accin propuesto para los frmacos a estudiar puede estar directamente
relacionado con la reactividad qumica calculada.
Consecuentemente, los modelos QSAR obtenidos con la utilizacin de ndices o descriptores
moleculares de esta naturaleza, incluirn informacin de la naturaleza de las fuerzas intermoleculares
envueltas en la accin del o de los frmacos.

J.C. Escalona, R. Carrasco y J. A. Padrn

40

A continuacin se relacionan los principales ndice mecnico-cunticos empleados en los estudios


QSAR5:
Definicin
Qa
Qmin, Qmax
qE,A, qN,A
qA,, qA,
HOMO LUMO
SE,A, SN,A

ET
H0f

Nombre
Carga neta sobre el tomo A
Cargas netas ms negativa y positiva de la molcula
Cargas electrnicas nucleoflicas y electroflicas, calculadas a
partir de los orbitales ocupados y desocupados respectivamente.
Densidades electrnicas y del tomo A
Energas HOMO y LUMO. Significan las energas del ltimo
orbital ocupado y la del primer orbital sin ocupar respectivamente.
Superdeslocalizabilidad electroflica y nucleoflica.
Polarizabilidad Molecular
Momento dipolo molecular
Energa total de la molcula
Calor de formacin

Cargas Atmicas:
De acuerdo con la teora qumica clsica, todas las interacciones qumicas son por naturaleza o
electrostticas (polares) u orbitalarias (covalentes). Es una evidencia prctica, que las densidades
electrnicas locales o cargas, son importantes en muchas reacciones qumicas y en muchas
propiedades qumico-fsicas de las molculas. As, los descriptores basados en las cargas han sido
extensamente empleados como ndices de reactividad qumica y como medidores de las interacciones
intermoleculares dbiles tal y como ocurre en las interacciones inicas entre el frmaco y el receptor.
Las cargas parciales sobre los tomos han sido utilizadas como ndices de reactividad qumica
estacionarios. Las densidades electrnicas y por su parte, caracterizan la posible orientacin de
las interacciones qumicas, por lo que son consideradas ndices direccionales de reactividad. Por el
contrario, las densidades electrnicas y las cargas netas sobre los tomos son consideradas ndices de
reactividad no direccionales.
Energas de los orbitales moleculares:
Las energas HOMO y LUMO son los descriptores qumico-cunticos ms populares. Se ha
demostrado que estos orbitales juegan un papel muy importante en muchas de las reacciones
qumicas y en la formacin de los complejos de transferencia de cargas. De acuerdo con la teora de
los orbitales moleculares fronteras (FMO) de la reactividad qumica, la formacin de un estado de
transicin se debe a la interaccin entre los orbitales fronteras HOMO y LUMO de las especies
qumicas reaccionantes.
La energa HOMO est directamente relacionada con el potencial de ionizacin, y caracteriza la
susceptibilidad de la molcula a ser atacada por electrfilos. La energa LUMO est directamente
relacionada con la afinidad electrnica y caracteriza la afinidad de la molcula a ser atacada por
nuclefilos.

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

41

Introduccin al diseo racional de frmacos

Superdeslocalizabilidades.
Este es un ndice de reactividad de los orbitales ocupados y no ocupados y est relacionada con la
contribucin hecha por el tomo, a la estabilizacin en la energa de formacin de un complejo de
transferencia de carga con una segunda molcula, o la capacidad del reaccionante de establecer
enlaces a travs de transferencia de cargas. La distincin hecha entre nucleoflica y electroflica estn
relacionadas con la naturaleza de la superdeslocalizabilidad, si esta es aceptora o donante
respectivamente. Las superdeslocalizabilidades son conocidas tambin como ndices de reactividad
dinmica. A diferencia de los ndices estticos (cargas), que describen molculas aisladas en su
estado base, los ndices dinmicos de reactividad se refieren a los estados transicionales en las
reacciones.
Polarizabilidad Molecular:
Se refiere a la polarizacin que puede sufrir una molcula por un campo elctrico externo, cuya
propiedad ms significativa es su relacin con el tamao molecular o el volumen molar. Se ha
demostrado que la polarizabilidad guarda relacin con el coeficiente de particin; de ah su
aplicabilidad en estudios de relacin estructura-actividad.
Momento dipolo:
La polaridad de una molcula guarda una estrecha relacin con varias propiedades fsico-qumicas.
El momento dipolo de la molcula es un reflejo de la polaridad global de la molcula.
Energas:
Las energas totales y los calores de formacin de las molculas son un reflejo de la estabilidad de las
mismas, por lo que el empleo de estos ndices puede conducir a la explicacin del fenmeno
estudiado.
II4.3 ndices topolgicos y topogrficos.
La topologa es aquella parte del lgebra que estudia las posiciones e interconexiones entre los
elementos de un conjunto. Esta rama de la ciencia, aplicada a la estructura qumica ha dado origen a
una disciplina llamada Topologa Molecular que analiza precisamente las posiciones y las
interconexiones entre los tomos de una molcula dada. De esta forma se lograra caracterizar
estructuralmente los compuestos.
Para definir dichos ndices se representan por puntos los tomos de la molcula (excluyendo a los de
hidrgeno) y por rayas o segmentos los enlaces. De tal manera se obtiene el grafo de la molcula o
grafo qumico como comnmente se conoce. Con posterioridad se construye la matriz topolgica
cuyos elementos toman el valor de uno o cero en dependencia de si el tomo i est enlazado o no al
tomo j. As se genera una matriz cuadrada de n filas por n columnas, siendo n el nmero de
vrtices del grafo o lo que es lo mismo el nmero de tomos. El resultado del clculo genera un valor
numrico que representa o describe la estructura qumica de la molcula, por lo que este tipo de
descriptores tienen una gran utilidad en los estudios QSAR.

J.C. Escalona, R. Carrasco y J. A. Padrn

42

De esta forma se pueden generar matrices de adyacencia y matrices de distancias entre vrtices. Las
matrices de adyacencia describen la unin o no entre tomos y la de distancias los nmeros de
tomos existentes entre un tomo X y otro no enlazado a l. Sirva como ejemplo ilustrativo de la
construccin de estas matrices la molcula de isopentano.
V2

e1
V1

e2

V3

V5

e3

e4
V4

0
1

= 0

0
0

1
0
1
0
0

0
1
0
1
1

Matriz de adyacencia
entre vrtices

0
0
1
0
0

0
0

0
0

0
1

D = 2

3
3

1 2 3 3
0 1 2 2

1 0 1 1

2 1 0 2
2 1 2 0

Matriz de distancia
Entre vrtices

Observe que para la matriz de adyacencia, al tomo o vrtice 1 (V1) le corresponden valores en la
matriz, de 0 para su relacin con los tomos 1, 3, 4 y 5 y valor de 1 con el vrtice 2 (V2), pues es
solamente con l, con quin se encuentra enlazado. As mismo para V3 le corresponden valores en la
matriz de 0 para los vrtices 1 y 3 y valores de 1 para los tomos 2, 4, 5. De esta forma se obtiene un
valor numrico que representa o describe la estructura molecular.
En la matriz de distancia, a V1 se le asignan valores de 0, 1, 2, 3 y 3, pues sta es el nmero de
mnimo de tomos que lo separan de los tomos 1, 2, 3, 4 y 5. Esta es otra forma de describir el grafo
qumico a travs de un valor numrico, pero utilizando en este caso las distancias mnimas que
separan un tomo de otro.
El grafo molecular puede ser subdividido en subgrafos en dependencia del nmero de ejes
interconectados al vrtice. Estos subgrafos se clasifican segn su orden (m) y su tipo (t).
El orden de un grafo no es ms que el nmero de ejes o enlaces que contiene el vrtice, considerando
como simples a los enlaces mltiples. Los tipos de los subgrafos por otro lado se clasifican en tres
tipos:
Tipo Camino (p), que son aquellos subgrafos que la valencia (nmero de enlaces) de sus vrtices
son menores o iguales que dos. Tngase en cuenta que los tomos de hidrgeno no se consideran
en el grafo molecular.
Tipo Cluster (c), constituido por aquellos subgrafos que tienen al menos algn vrtice con
valencia 3, 4 o mayor, pero ninguno con valencia de dos.
Tipo Camino-cluster (pc) Son los subgrafos que incluyen vrtices con valencias de dos, adems
de algunos con valencia de 3, 4 o mayor.

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

Introduccin al diseo racional de frmacos

43

Estos ndices de conectividad mt corresponden en cada caso a la suma de todos los subgrafos de tipo
t y de orden m, y estn relacionados con la ecuacin 9:
n

m
m =
Sj

t j =1
m

Ecuacin 9
donde nm es el nmero de subgrafos tipo t y de orden m.
Los trminos mSj se definen como el inverso de la raz cuadrada del producto de las valencias de los
vrtices integrantes del subgrafo, Donde j define un subgrafo en particular (ver figura 12).
Sirva como ejemplos de subgrafos, la molcula de isopentano:
Tipo (t)

Orden (m)
1

Camino

Cluster

CaminoCluster

Figura 12. Subgrafos del isopentano

J.C. Escalona, R. Carrasco y J. A. Padrn

44

La definicin de algunos de los ndices obtenidos por esta metodologa aparecen recogidos en la tabla
siguiente:
NDICE

DEFINICIN

= [ (v ) (v )]
m

Conectividad Molecular (Randic)

r =1

1/ 2

1 =
(vi ) (v j )K (v l +1 )
Conectividad molecular extendido

r =1

1/ 2

donde (vi), (vj), (vl+1) son los grados de


los vrtices en la cadena considerada
m

Conectividad de valencia

1 v =
v (vi ) v (v j )
l =1

1/ 2

i j

Para evitar el uso indiscriminado de este tipo de ndice, uno de los ms prestigiosos investigadores en
esta rea de la qumica ha propuesto que para la generacin de nuevos ndices de esta naturaleza,
estos deben cumplir los siguientes atributos:
Atributos deseables para los ndices topolgicos, segn Randic:
1. Interpretacin estructural directa. Indices basados en conceptos estructurales sencillos ayudan a
interpretar propiedades en trminos de estructura qumica.
2. Buena correlacin con al menos una propiedad. Esto sugiere el aspecto estructural dominante en
la propiedad.
3. Buena discriminacin de ismeros. Necesario cuando la propiedad en estudio cambia con el
ismero.
4. Localmente definidos. Es decir, que no se obtengan de forma global, sino localmente como en los
ndices de conectividad, en que se definen por la conectividad de cada tomo.
5. Generalizable a anlogos superiores. Por ejemplo, los ndices 1 , 2 , 3 ,,etc.
6. Linealmente independientes. Permite describir informacin estructural no contenida en otros
ndices.
7. Simplicidad. Facilita su interpretacin.
8. Que no estn basados en propiedades fsico-qumicas.
9. Que no estn relacionados de manera trivial con otros ndices.
10. Eficiencia de construccin. Facilita su clculo.
11. Basados en conceptos estructurales familiares.
12. Mostrar una dependencia correcta con el tamao. Las propiedades que dependen del tamao y en
general, la selectividad de los ndices disminuye con el tamao del grafo.
13. Tener cambios graduales con cambios graduales en la estructura.

Ciudad de La Habana : Editorial Universitaria, 2008. ISBN 978-959-16-0647-1

45

Introduccin al diseo racional de frmacos

II4.4 Criterios de seleccin de parmetros.

No existe ningn criterio simple ni nico, para seleccionar qu parmetros deben utilizarse en un
estudio de relacin estructura-actividad. Ante un problema nuevo se debe comenzar a buscar en la
literatura trabajos previos realizados sobre el mismo tipo de productos, y de no encontrarse, sobre
productos parecidos o con la misma actividad. En general, en esta primera etapa, cualquier tipo de
informacin puede ser orientadora respecto a las caractersticas fsico-qumicas que pudieran
intervenir en la actividad, y por tanto cules son los parmetros ms adecuados para describirlas.
No obstante, es posible encontrarse en situaciones en las cuales no se disponga de ninguna
informacin previa; en esos casos, una solucin inteligente es seleccionar algunos parmetros
representativos de cada una de las propiedades fsico-qumicas, electrnicas, estricas y estructurales
de la molcula. Esta primera orientacin, aunque no genere un buen modelo, podr sealar cules de
estos parmetros tiene una mayor influencia en la actividad y por tanto aumentar el nmero de
ndices que describen la misma en un segundo intento de anlisis.
II.5 SITUACIN ACTUAL Y TENDENCIAS FUTURAS DEL DISEO DE FRMACOS
ASISTIDO POR COMPUTADORAS.

El avance sostenido que ha experimentado la bioqumica y la biologa molecular en la identificacin


de macromolculas dianas, y de secuencias de nucletidos y aminocidos, unido a los poderosos
sistemas computacionales, hacen posible en la actualidad, el estudio de preferencias
configuracionales, de la naturaleza y las magnitudes de las fuerzas interatmicas que gobiernan su
interaccin, as como el comportamiento dinmico del complejo ligando-receptor. Estos
procedimientos ayudan al mejor entendimiento del comportamiento de estos sistemas a nivel
subcelular, permitiendo establecer comparaciones entre los datos tericos y los experimentales, e
incluso realizar predicciones cuantitativas.
Teniendo en cuenta los avances que promete tener la farmacologa molecular, es de suponer que el
futuro del diseo de frmacos no est destinado como hasta el presente, a la obtencin de sustancias
que puedan ser reconocidas por los receptores o que modulen la sntesis, metabolismo o recaptacin
de los neurotransmisores, sino que estar orientado a obtener sustancias que acten sobre los sistemas
enzimticos activadores de la cascada de eventos que lleva consigo una respuesta farmacolgica.
Entindase por sistemas enzimticos activadores de la cascada de eventos a las proteinas G o
cualquiera de sus subunidades, las enzimas formadoras de mensajeros secundarios y las proteinaquinasas entre otras.
El hecho de que no siempre es mejor actuar sobre los receptores lo sugiere el hecho de que frente a
una exposicin continua del agonista o del antagonista, se producen fenmenos de desensibilizacin
o supersensibilidad, que pueden ser responsables de nuevas alteraciones fisiolgicas. El influir
mediante estos frmacos sobre estos mecanismos intermediarios entre el receptor y el efector,
pueden dar origen a sustancias muy selectivas que operen sobre las clulas que padezcan la
disfuncin.

También podría gustarte