Está en la página 1de 11

AFINIDAD DE UNIN AL RECEPTOR ESTROGNICO.

ESTUDIO QSAR DE LA SERIE 2-ARILBENZOTIOFENO


J. C. Escalona Arranz, A. Lenzano Delfn, Y. Arencibia Glvez, M. Rodrguez Alfaro, D. Garca Falcn, R. Prez Ross Departamento de Farmacia, Universidad de Oriente

Resumen
Se realiz un estudio de relacin estructura actividad (QSAR) a 74 compuestos pertenecientes a la serie del 2-arilbenzotiofeno, divididos en un grupo de prueba y otro de validacin con 64 y 10 compuestos, respectivamente. Como variable dependiente se utiliz la afinidad de unin al receptor estrognico, y como variables independientes se emplearon varios descriptores de naturaleza qumico-fsica y qumico-cuntica, adems de aquellos de carcter topolgico y topogrfico. El mtodo de clculo qumico-cuntico empleado para la optimizacin de las estructuras fue el MNDO-PM3, mientras que los modelos matemticos son obtenidos por tcnicas de regresin lineal mltiple y de redes de neuronas. Se valoran tres modelos, dos de ellos obtenidos por redes neuronales, los cuales tienden a ser superiores al obtenido por el mtodo de Regresin Lineal Mltiple. Se proponen stos dos modelos, los cuales son aplicables segn la naturaleza de la muestra en estudio. En ambos casos se obtienen valores de r> 0,93 y r 2 > 0,86, errores absolutos medios por debajo de 0,156 y de errores relativos medios de prediccin para los compuestos de la serie de validacin inferiores al 20 %. La variable volumen molar aparece como la de mayor peso en los modelos obtenidos, demostrando una vez ms las restricciones estricas que impone el receptor estrognico al ligando, convirtindolo en un receptor altamente selectivo incluso ante el resto de las hormonas esteroideas. Palabras clave: relacin estructura actividad, mtodo de clculo qumico-cuntico.

Abstract
A QSAR study of 74 compounds from 2-arylbenzothiophene serie was made. The whole date, 74 compounds, was divided in two; test and validation groups with 64 and 10 compound each one. The binding affinity on oestrogen receptor was used as dependent variable and several physicochemical, quantum-chemical and topological and topographic descriptors as independent variables. MNDO-PM3 quantum chemical method was employed for the structure geometric optimization; while Multiple Lineal Regression and Neural Network were employed as techniques for obtain the mathematical models. According to the nature of the data set we proposed two models, both obtain with neural network techniques, with good statistical values r> 0,93; r 2> 0,86; AAE< 0,156 (Average Absolute Error), and the average relative error in the prediction of validation group compounds was lower than 20 %. Molar Volume was the most important variable in all models, denoting the well-known steric restriction in the Estrogen receptor binding site, making this receptor highly selective even to the other steroidal hormones. Keywords: business structure, method of quantum chemical calculations.

Vol. XX, N 1, 2008

47

Introduccin
La actividad estrognica, es un rea que ha sido de gran inters cientfico desde la antigedad por su papel en la perpetuacin de la especie. Independientemente del desarrollo cientfico actual, todava no se dispone de frmacos totalmente efectivos y lo suficientemente inocuos para el tratamiento de enfermedades asociadas a su carencia o exceso. A nivel molecular, se han identificado dos receptores estrognicos, los cuales son conocidos como ER y ER. Los compuestos que interaccionan con este receptor se unen en el dominio LDB (Ligand Binding Domain), originando la liberacin de protenas llamadas chaperonas, e induciendo un cambio en la configuracin del receptor, lo cual a su vez permite su unin a la regin promotora del gen diana, responsable de la actividad reguladora del gen. Una vez que el receptor estrognico dmero se ha unido al ligando, se produce el reclutamiento de protenas adicionales llamadas correguladoras, que disparan la activacin o represin de genes especficos /1/ . Los cambios conformacionales en el receptor condicionan la preferencia a un tipo u otro de coactivadores, convirtindolo en la clave reguladora de la actividad biolgica /2/. Este mecanismo de accin es muy complejo, pues el receptor se localiza en el ncleo de la clula diana en forma inactiva, asociado a varias protenas inhibitorias las cuales son removidas por los cambios conformacionales inducidos por la interaccin con el ligando activador /3/. El receptor estrognico activo y dimerizado con actividad transcripcional, forma parte de un gran complejo el cual incluye al ligando, el DNA diana y a las protenas asociadas al receptor /4/. Esta complejidad bioqumica indica, que la actividad estrognica est influenciada por muchos factores tales como la naturaleza de la unin al ligando, el tipo de clula, la secuencia del DNA que responde al receptor, y el contexto del promotor del DNA unido a ste. De este modo, un mismo compuesto puede desarrollar diferentes actividades en varios tipos de clulas interaccionando con el mismo receptor /5, 6/. Se ha podido establecer una diferencia bioqumica y farmacolgica entre ambos subtipos

de receptores, observndose divergencias en la composicin de aminocidos de los ER y , creando ER con diversos papeles transcripcionales, lo que permite a ambos receptores regular la actividad de genes diferentes y promover distintos efectos clnicos sin afectar los niveles de afinidad frmaco-receptor; en otras palabras, el sitio de unin del ligando al receptor permanece invariable en ambos subtipos, radicando la diferencia de stos en los otros dominios de unin. Es posible plantear que los ER realizan funciones como activadores de genes de transcripcin, y los ER , como represores /1/. Recientemente se ha demostrado que el gen humano CYP2A6, el cual es expresado tradicionalmente en el hgado, es tambin expresado en tejidos mamarios, en el ovario, tero, testculo y glndula adrenrgica. La expresin de este gen en estos nuevos tejidos ocurre gracias a una induccin directa de los estrgenos de manera dependiente al receptor estrognico, explicando las evidencias clnicas del incremento del metabolismo de la nicotina en pacientes con altos niveles de estrgenos /7/. No obstante, este gen constituye slo uno de los casi 2 000 genes regulados por los estrgenos en estudios experimentales, 700 de ellos de forma primaria /8/. A nivel fisiolgico, los estrgenos naturales tales como el 17 -estradiol y la estrona desempean un papel importante en el mantenimiento de los rganos reproductores femeninos, las glndulas mamarias y otras caractersticas sexuales. En aos recientes se observ, que su accin no slo se limitaba a estos rganos, demostrando que eran capaces de estimular diversos tejidos del sistema cardiovascular, del sistema nervioso central y del msculo-esqueleto tanto en mujeres como en hombres /9, 10/. Despus de la menopausia, la produccin de estrgenos declina dramticamente, produciendo un amplio rango de efectos patolgicos en especial la osteoporosis y las enfermedades arteriocoronarias. Los ER se expresan en tero, hgado, mama y rin; los ER, en tejidos no reproductivos como hueso, cerebro, hipfisis, tracto urinario, aparato cardiovascular y prstata, adems

48 Vol. XX, N 1, 2008

en tejidos reproductivos como ovario y testculo. Ambos receptores se presentan en ovarios, cerebro, hueso, sistema cardiovascular y mamas. Un suplemento de estrgeno esteroidal reduce la frecuencia y severidad de estas patologas, pero incrementa el riesgo de cncer endometrial y de mamas. Existen frmacos de nuevo tipo, que son capaces de mimetizar el efecto de los esteroides naturales en los tejidos del sistema cardiovascular, del sistema nervioso central y del msculo-esqueleto sin mostrar actividad apreciable sobre el tejido uterino y el mamario. Estos frmacos son conocidos como moduladores selectivos del receptor estrognico /1/. El raloxifeno, es el frmaco lder de este tipo de compuestos, el cual es derivado de la serie 2-arilbenzotiofeno, la que ha sido extensamente evaluada en aras de desarrollar nuevos derivados ms efectivos /12, 13/. Con estos mismos fines, pero abordando el tema desde el punto de vista terico, a travs de estudios de relacin cuantitativa estructuraactividad (QSAR), el presente trabajo intenta analizar las influencias de diferentes grupos qumicos sobre el ncleo del 2-arilbenzotiofeno en la unin al LBD del receptor estrognico, empleando datos reportados en la literatura /10/.

en base diez (log10) logrando una mayor homogeneidad entre los valores de la muestra empleada, y ajustando la muestra a una distribucin normal. Las estructuras y sus correspondientes actividades se recogen en la tabla 1.

Procesamiento de los datos


El procesamiento de los datos se realiz en una microcomputadora Acer Open Pentium III, sobre el sistema operativo Microsoft Windows XP professional. La muestra fue dividida en dos grupos: un grupo de entrenamiento integrado por el 85 % y otro de validacin integrado por el 15 % de las estructuras en estudio. La seleccin de los compuestos de validacin se realiz mediante un anlisis cluster por el mtodo de agrupamiento K-means, utilizando el software Statistica /14/, versin 5.0, eligiendo de cada cluster un compuesto. En esta seleccin se tuvo en cuenta adems que la mayora de las subseries analizadas estuvieran representadas, al menos, por un elemento. Con la serie de entrenamiento se desarrollaron todos los modelos, en cambio, los pertenecientes a la serie de validacin se emplearon exclusivamente en la evaluacin de la capacidad predictiva de los modelos obtenidos. Se emple la siguiente secuencia de trabajo: - Anlisis tradicional con las estructuras completas utilizando los ndices globales. - Anlisis por fragmentacin de la molcula, en la cual el anillo benzotiofeno constituye el fragmento A, y el sustituyente 2-arilo el fragmento B. Se determinaron los descriptores para cada fragmento (tabla 1).

Metodologa
Seleccin de las estructuras en estudio
Se utilizaron todos los compuestos pertenecientes a la serie del 2-arilbenzotiofeno, reportados en el trabajo realizado por Grease /10/ en 1998. Como variable de actividad se emple la afinidad de unin al receptor estrognico de los 74 compuestos ensayados. La misma se obtiene al evaluar la capacidad de desplazamiento del 17b-estradiol ligado con la lnea de clulas MCF-7. Esta es una variable de gran importancia teniendo en cuenta que para este grupo de compuestos, la actividad est condicionada, en un primer nivel, a la capacidad de unin y acople del frmaco al receptor, independientemente del subtipo que se trate. Para su procesamiento estadstico, los valores de actividad se expresan en forma de logaritmo

Obtencin y optimizacin de las estructuras


La obtencin y generacin de las estructuras se realiz mediante el programa Hyperchem versin 5.1 para Windows. Las estructuras as obtenidas fueron convertidas en ficheros *.MOP para su clculo qumico-cuntico. A la molcula se le realiz una optimizacin de la geometra, incluyndole la opcin FORCE, para el anlisis de frecuencias.

Vol. XX, N 1, 2008

49

TABLA 1. ESTRUCTURA QUMICA Y ACTIVIDAD BIOLGICA DE LOS COMPUESTOS EN ESTUDIO


O O

4 6
S

R
Compuestos Raloxifeno 4A 4B 4C 5B 5B 5C 5E 5F 5G 5I 5J 8F 9B 9C 9D 9E 9G 9H 9I 9J 9K 9L 10A 10K 10T 11A 11B 11C 11D 11E 11F 11G 11H 11I 11J 11L R 6-OH 6-OCH3 6-OH 6-OCH3 6-OH 6-Cl 6-OH 6-OH 7-OH 5,6,7(OCH3)3 4-OH 5-OH 4,6 (OH)2 5,6 (OH)2 6-N(CH3)3 5-F, 6-OH 5-CH3, 6-OH 5,7-(CH3)2, 4,7-(CH3)2, 6-OCH3 6-OCH3 6-OCH3 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 66R 4-OH 4-OCH3 4-OCH3 4-OCH3 4-OH 4-OH 4-Cl 4-OH 4-CH3 4-F 4-OH 4-OCH3 4-OH 4-OH 4-OH 4-OH 4-OH 4-OH 4-OH 4-OH 4-OH 4-OH 4-CH2OH 3,42-OH 3-OH 2-CH3 3-F 4-C2H5 4-CH-(CH3)2 4-(CH2)3 4-Fenil 4-SCH3 4-CH2SC2H5 Log

1
Fragmento A Fragmento B
Comp, 11M 11N 11O 11P 11Q 11R 11S 13A 13B 13C 13D 13E 13F 13G 13H 13I 13J 13K 13l 16A 16B 16C 22A 22D 22G 22H 22I 23A 23B 23C 23D 23E 23F 23G 23H 23I 23J R 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-CO2CH3 6-CONH2 6-COCH3 66-C?CH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH 6-OH

R
R 4-CF3 2-CH3, 4-OH 2-OCH3, 4-OH 3-CH3, 4-OH 3-Cl, 4-OH 3-F, 4-OH 3,5-(CH3)2, 4-OH 1Naftil 2Naftil 4-OH, 1Naftil 2-Tienil 3-Tienil 2-CH3 2-C2H5 2-CH-(CH3)2 2- Ciclopentil 2- Ciclohexil 2-Ciclohexil 4-O-fenilo 4-NO2 4-Piridil 4-Piridil N-Oxido 4-OH 4-OH 4-OH 4-OH 4-OH 4-CO2CH3 4-CO2C2H5 4-CO2H 4-CONH2 4-CONHCH3 4-CON(CH3)2 4-COCH3 4-PO3(C2H5)2 4- C?CH 4-CH=CH2 4Log -2,097 -0,387 -0,769 -0,886 -0,921 -0,699 -0,921 -0,699 -1,174 -0,796 -0,523 -0,699 -0,824 -0,886 -0,824 -1,097 -1,046 -1,046 -0,721 -1,301 -1,252 -2,301 -2,000 -2,000 -2,097 -2,000 -1,538 -1,155 -1,222 -1,921 -1,409 -1,796 -1,398 -1,125 -2,000 -0,921 -1,000

-0,469 -2,699 -2,699 -2,222 -1,137 -2,097 -2,523 -1,337 -2,222 -1,155 -0,721 -1,699 -1,301 -2,699 -1,000 -1,301 -2,000 -2,398 -1,009 -1,155 -2,301 -2,699 -2,046 -2,699 -2,000 -2,000 -1,208 -1,244 -0,769 -0,398 -0,538 -1,921 -1,523 -2,000 -1,959 -1,398 -1,155

4,5-Fenil, 6-OH

50 Vol. XX, N 1, 2008

Los clculos se realizaron por el mtodo semiemprico MNDO-PM3 /5/ del software MOPAC /16/ versin 6.0, 1990, que utiliza los ficheros *.MOP generados anteriormente. Otros parmetros de optimizacin empleados fueron: GNORM=0.01, PRECISE, GEO-OK, BONDS, VECTORS, y EF o algoritmo de seguimiento de vectores propios. Una vez optimizadas, a cada molcula se le realiz un clculo SCF, incluyndole la opcin FORCE para el analisisde frecuencias. El resultado de los clculos fue obtenido a travs de los ficheros de salida generados por el MOPAC de extensin *. OUT, *. RSM.

El principal criterio de detencin del entrenamiento fue el de disminucin del error promedio. La capa de salida est condicionada a una, y el nmero de neuronas ocultas se fue optimizando durante el proceso de entrenamiento, reportndose el modelo de mejores estadgrafos con un menor nmero de neuronas ocultas.

Resultados y discusin
Seleccin de las estructuras en estudio
Al total de 74 compuestos a los que se le determin esta actividad, se le realiz un anlisis cluster para la seleccin de las estructuras que formaran parte del grupo de validacin. Este tratamiento gener un total de diez grupos, de cada uno de los cuales se tom un compuesto, tratndose de que todas las subseries estuvieran representadas. Los compuestos seleccionados fueron: 5C, 5E, 9B. 11I, 11J, 11Q, 13G, 13J, 23E y 23I.

Determinacin de las variables


Para la determinacin de los descriptores se emplearon los programas MODEST /17/ (Molecular Design Tools) versin 2.0, y ACD/Chem Sketch /18/, versin 3.50, los cuales ofrecen una amplia gama de variables de naturaleza mecnico-cuntica, y 78 de naturaleza topolgica y topogrfica en sus combinaciones caminos clusters. Se emplearon, adems, ndices de cargas locales ubicados en las regiones importantes de la interaccin de estas estructuras con el receptor estrognico.

Afinidad de unin al recetor estrognico. Anlisis por regresin lineal mltiple


El mejor modelo determinado por el mtodo de regresin lineal mltiple es obtenido por el anlisis de fragmentacin de la molcula, luego de eliminar los compuestos 9E, 9H y 16C por tratarse de outliers estadsticos. La misma se describe en la siguiente ecuacin: Log(RBA) = - 9,99(1,34) (q)PC4-A+ 8,39(0,86) C3-A + 1,27(0,41) Q3 - 8,85( 1,28) Q1 - 0,01(0,002) MV + 0,23(0,06) EHOMO-B + 2,94(0,78) (q)PC5-A + 1,2979(0,6518) ELUMO-A + 5,68( 1,23) (1) n= 61; r= 0,8831; F(8,52)= 23,0350; s= 0,3357 p<0,0000 con un nivel de significacin de: 0,00000; 0,00000; 0,00327; 0,00000; 0,00000;0,00070; 0,00044;0,04498; 0,00000, respectivamente. Los valores de los parmetros: coeficiente de correlacin, desviacin estndar y del estadgrafo F, reflejan una ecuacin con aceptable calidad estadstica.

Tcnicas de estudio
El procesamiento de la muestra se llev a cabo mediante dos tcnicas: regresin lineal mltiple, empleando el software Statistica versin 5.0, utilizando el mtodo Foward stepwise, y la opcin de determinacin del intercepto segn lo incluya el modelo; y por redes neuronales, valindose del programa NeuroShell /19/, versin 2.0. En el caso de las redes neuronales, se decidi evaluar dos modelos, uno prefijando las variables que fueron incluidas en el modelo de regresin lineal mltiple, y otro empleando variables sin prefijar. Para este ltimo caso, se realiz un anlisis cluster por el mismo mtodo K-means, empleando el nmero entero ms cercano a la raz cuadrada del total de compuestos de la serie de entrenamiento; asignando as las variables que integraran la capa externa de la red. La arquitectura de la red empleada fue la conocida como Backpropagation con tres capas.

Vol. XX, N 1, 2008

51

TABLA 2. VALORES DE ACTIVIDAD PREDICHOS POR EL MODELO OBTENIDO POR REGRESIN LINEAL MLTIPLE A LOS COMPUESTOS DE LA SERIE DE VALIDACIN

La capacidad predictiva de un modelo es su cualidad ms deseada. La tabla 2 muestra los valores de actividad predichos por este modelo para los compuestos que forman parte del grupo de validacin, as como sus residuales y errores relativos de la prediccin. Como se observa en la tabla anterior, el error relativo promedio para los diez compuestos de validacin, es de un 23,188 %, es decir que la prediccin cuantitativa de la actividad de unin al receptor estrognico por esta ecuacin tiene un acierto superior al 75 % de efectividad, un valor aceptable para este tipo de fenmeno tan complejo como el que trata de describir, y para una muestra tan grande y diversa estructuralmente. No obstante a esto, los compuestos 9C y 11J estn mal predichos con valores de error relativo medio superior al 40 %. Eliminando los mismos al tratarlos como outliers, obtenemos un buen valor promedio para la prediccin de 15,949 %. La afinidad de unin al receptor est influenciada, en orden de importancia, segn los pesos de las variables, por los descriptores (q)PC4-A, MV, C3-A, (q)PC 5-A , E HOMO-B , E LUMO-A, Q 1 y Q 3, respectivamente. Segn describe el modelo, ambos fragmentos de la molcula A y B influyen en la afinidad de unin al receptor estrognico, no obstante existe un predominio de ndices representativos del fragmento A, y son los que junto al volumen molar tienen mayor importancia en esta interaccin. Adems, hay una marcada incidencia, dentro de la ecuacin obtenida, de ndices relacionados con las cargas o con

las densidades electrnicas. Esto concuerda con las observaciones referentes a la estabilizacin del complejo frmaco receptor a travs de enlaces por puentes de hidrgenos entre grupos ubicados en los extremos de los fragmentos A y B, adems de interacciones de tipo hidrofbica en la zona de los anillos que conforman el fragmento A /20/. Tal y como expresa la ecuacin, la afinidad de unin al receptor estrognico se ve favorecida por el decrecimiento del volumen molar (MV). Este es un parmetro estrico que representa el espacio o volumen que ocupa la molcula. Este comportamiento est acorde con lo establecido en la literatura, donde se expresan las restricciones en el orden estrico que deben tener los frmacos que se unen al receptor estrognico y las consecuencias que puede traer consigo un incremento en el largo de las cadenas sustituyentes. Obsrvese la baja afinidad de los compuestos 23H, 11H, 11L, 11I, entre otros. Por otro lado, un decrecimiento de los valores del ndice (q)PC4-A favorece la actividad. Este es un ndice topogrfico ponderado por la carga neta, y expresa que combinaciones cluster 3 camino 1 donde existan elevados valores de carga neta deben ser evitados, no obstante si esa misma combinacin incluye un camino ms (q)PC5-A, entonces un incremento de estos valores cursar con un aumento de afinidad. Las subseries 8 y 9 son las que incluyen ramificaciones en el fragmento A, y estas variaciones se hacen apreciables cuando hay sustituciones heteroatmicas.

52 Vol. XX, N 1, 2008

Obsrvese, cmo los valores de afinidad al receptor de los compuestos 8F y 9D con combinaciones cluster 3 camino 2 son superiores a la del compuesto 9E con combinacin cluster 3 camino 1. La aparente excepcin de esto lo constituye el compuesto 9H con mayor actividad, pero es de notar que se trata de un sustituyente flor, de pequeo volumen molar, y por tanto, ajustable a las consideraciones expuestas para este ndice con anterioridad. Los valores de carga neta sobre los tomos tambin son referenciados en la ecuacin. Para el caso particular de Q1, se trata de un tomo de carbono aromtico de densidad carga negativa y su relacin con la actividad es de orden inverso. Esta es una zona que interacciona con el receptor de manera hidrofbica, y en donde la caracterstica planal del anillo aromtico es de crucial importancia en el ajuste del frmaco al receptor, toda vez que se trata de una zona de alto impedimento estrico. Por ello, el decrecimiento de la carga negativa genera una zona apolar e hidrfoba que garantiza la estabilidad del complejo frmaco receptor. El ndice Q3 se dispone sobre el tomo de hidrgeno del hidroxilo fenlico. Sus valores positivos deben incrementarse para favorecer la actividad. Este comportamiento es algo esperado, pues este tomo forma enlace de hidrgeno con el receptor, tal y como se ha documentado ampliamente en la bibliografa consultada /21,22/. La energa de los orbitales fronteras est tambin referida en la ecuacin. Los mismos se encuentran deslocalizados en ambos fragmentos alrededor de los hidroxilos fenlicos y del grupo ceto de la cadena lateral. Este comportamiento es tambin predecible, pues son precisamente estos hidroxilos fenlicos los que participan en la interaccin qumica por puente de hidrgeno con el receptor. Para realizar un anlisis detallado de los compuestos eliminados como outliers estadsticos se realiza un anlisis cluster con las variables del modelo, obtenindose tres clusters en el tercero, de los cuales se incluyen todos los outliers. La diferencia entre los valores medios de las variables de cada cluster es mnima, con excepcin del ndice volumen molar, en el cual los compuestos pertenecientes al cluster 3 presentan los menores valores para dicha variable.

Esta divergencia matemtica se hace palpable cuando se realiza unanlisis de varianza a estos cluster, en la cual se confirma una diferencia altamente significativa entre clusters para la variable volumen molar, siendo sta la nica variable que cumple esta condicin, evidenciando an ms la relevancia que tiene este ndice en la descripcin de la actividad. No obstante, es importante sealar que el modelo considera como outliers estadsticos a todos los compuestos de la muestra en estudio con sustituyentes electroatractores en posicin 5 (9C, 9E y 9H). Estas sustituciones podran provocar cambios, aunque no estadsticamente significativos por el volumen tan grande de muestra, en los valores de las variables (q)PC4-A, C3-A, (q)PC5-A, ELUMO-A, Q1 y Q3.

Anlisis por redes de neuronas


Para las variables incluidas en el modelo de regresin lineal mltiple
La red seleccionada para describir este fenmeno incluy ocho descriptores y seis neuronas en la capa oculta. Los valores de los estadgrafos obtenidos para la misma se refieren a continuacin: r=0,933; r2= 0,8696; ECM*= 0,054; EAM**= 0,154 * Error Cuadrtico Medio ** Error Absoluto Medio La buena calidad de estos parmetros es palpable. Elevados valores de los coeficientes r y r2 expresan una alta relacin entre la variable dependiente con respecto a las independientes y, adems, un elevado por ciento del error experimental queda explicado en el modelo obtenido. En comparacin con el modelo de regresin lineal mltiple, esta red logra mejores parmetros estadsticos incluyendo la totalidad de la de los compuestos. Las redes neuronales tienen como desventaja, con respecto al anlisis de regresin, que no es posible estimar la influencia de cada una de las variables en el mismo, y por tanto, la interpretacin qumica y farmacolgica del fenmeno se hace ms difcil. Esto es lo que se ha hecho llamar "la caja negra", pues se conoce lo que entra y lo que sale de la red, pero se hace muy difcil o casi imposible interpretar lo que ocurre en su interior. No obstante,

Vol. XX, N 1, 2008

53

a pesar de esta limitacin, su capacidad de predecir fenmenos de toda naturaleza las ha convertido en una herramienta potente ampliamente utilizada por varias ramas de la ciencia. Sin embargo, esta red de neuronas presenta ventajas con respecto a una red normal. El hecho de que utilice variables ya obtenidas en un modelo de regresin lineal mltiple, hace que la interpretacin de sus influencias resulte ms fcil con respecto a una red normal; en donde se carece de referencias sobre la relacin entre las variables independientes y la actividad. No obstante, se debe tener en cuenta que una red de neuronas plantea relaciones no lineales, y por tanto, no superponibles a los resultados de un modelo por regresin. La importancia de cada descriptor en el modelo se refleja tradicionalmente con los pesos de las variables incluidas en la red, siendo las de mayor influencia Q1, MV, C 3-A, E LUMO-A, (q)PC 4-A, EHOMO-B, Q 3, y (q)PC5-A; sin embargo, el anlisis de varianza entre variables refleja que el volumen molar, la energa del orbital HOMO para el fragmento B y las combinaciones cluster 3 entre las aristas (C3-A) son las que presentan diferencias significativas entre los datos, y por tanto, son las que pueden brindar una mayor informacin.

Tal y como se ha discutido en los modelos anteriores, el volumen o tamao de la molcula influye decisivamente sobre el ajuste con el receptor. A menores volmenes, mayores actividades, aunque hay que tener en cuenta que existe un ncleo bsico el cual debe ser respetado. Obsrvese el caso del compuesto 13F el que presenta menor volumen molar entre las estructuras en estudio, sin embargo no se encuentra dentro de las ms activas. Los 20 compuestos de mayor afinidad de unin al receptor presentan un mismo valor para el ndice C3A; todos ellos poseen el ncleo del 2-arilbenzotiofeno 6-OH sustituido, por lo que se infiere que este ncleo no tolera nuevas sustituciones o modificaciones. Obsrvese el valor de actividad para el compuesto 5F con un tomo de cloro en la misma posicin y las actividades de las estructuras pertenecientes a la subserie 22 con otros sustituyentes en 6, todos ellos de menor afinidad de unin al receptor. Las sustituciones adicionales al 6-OH provocan un incremento del ndice C3-A y una disminucin de la afinidad, por ejemplo los compuestos 9D, 9E, 9H, 91, 9J. 9K y 9L, confirmando esto las observaciones anteriores. Los valores predichos por este modelo para los compuestos que conforman la muestra de validacin aparecen recogidos en la tabla 3.

TABLA 3. VALORES DE ACTIVIDAD PREDICHOS POR LA RED CON LAS VARIABLES PREFIJADAS PARA LOS COMPUESTOS DE LA SERIE DE VALIDACIN

Tal y como se observa en la tabla 3, el error relativo medio de la prediccin es poco ms del 20 %, sin embargo, si eliminamos el compuesto 11J por considerarlo como outlier estadstico, este error desciende hasta un 18,368 %. La mala prediccin de este compuesto, as como, para los otros dos

compuestos de esta subserie 11, puede ser debido a la naturaleza no hidroxlica del sustituyente en posicin 4, y al hecho de que en la red se incluye slo un descriptor relacionado con el fragmento B. Es notorio resaltar el hecho de que el compuesto 11J se mantiene como outlier estadstico en ambos

54 Vol. XX, N 1, 2008

modelos obtenidos por estas diferentes tcnicas, demostrando su comportamiento anmalo. A pesar de los hechos de que los estadgrafos son mejores que los del modelo de regresin, de que los errores relativos medios son menores, y de que slo un compuesto es excluido del anlisis; consideramos que esta red tiene mayores posibilidades de prediccin para series donde se modifique principalmente el fragmento A.

ligeramente el resto de los parmetros. Como desventaja en relacin con la anterior red, se presenta el hecho de que al emplear variables que no fueron incluidas en un modelo de regresin, las inferencias de influencias qumicas de estos ndices sobre la actividad son an ms imprecisas. Segn el grfico de los pesos de las variables que brinda el programa, la influencia de las mismas en el modelo tiene el siguiente orden: P1, Q4, Q3, XP1, MV, P1, MR y P. De este anlisis se infiere que la red en su aprendizaje considera a las variables de cargas o corregidas por ellas (P1, Q4 y Q3) como de gran importancia. Esto est de acuerdo con las consideraciones referidas anteriormente en cuanto a las interacciones por enlace de hidrgeno y de tipo hidrofbica. Si tomamos en cuenta los valores de actividad para los compuestos ms activos e inactivos, y realizamos un anlisis cluster o de agrupamiento, podemos tener una idea de la influencia de las variables incluidas en el modelo segn sus valores medios. De tal forma se aprecia que los compuestos ms activos presentan bajos valores de volumen molar y de P1, adems de elevados valores para el ndice Q3, por lo que se infiere que los compuestos ms activos sern los que menos restricciones estricas le impongan al receptor, menores combinaciones donde se incluyan heterotomos (P1) y altos valores de carga positiva sobre el tomo de posicin 6 que le permitan una interaccin ptima al receptor. En la tabla 4 el error relativo medio de la prediccin se encuentra alrededor del 23 %, y si se eliminan los compuestos 5E y 13J por considerarlos como outliers estadsticos este error desciende hasta un 11,858 %. En este caso se observa que ambos compuestos han sido predichos en exceso, o sea, que se les propone una actividad superior a la verdadera. Estos outliers se encuentran en un grupo o cluster donde se localizan los ms activos de la serie; sin embargo ,ellos presentan una actividad moderada. A pesar de encontrarse, segn el anlisis cluster de sus descriptores, estrechamente relacionados; no existe una relacin qumica palpable entre ambos, por lo que su comportamiento diferente al resto puede estar relacionado con el acceso al sitio de unin al receptor, o sea, a su capacidad de atravesar

Para variables obtenidas por anlisis cluster


Ocho fueron el nmero de variables seleccionadas luego del anlisis cluster. Se procur que la variable seleccionada de cada cluster fuera lo ms representativa posible del conjunto, donde se agrupa y que no hubiera sido seleccionada en los modelos anteriores; tratando de encontrar en la medida de lo posible nuevas variables que explicaran esta unin al receptor estrognico. A manera de excepcin se dej como variable el volumen molar, por la extremada importancia que mostr en los modelos anteriores. La red desarrollada incluy los siguientes descriptores: P1, P1, Q3, Q4, MR, MV, P, XP1, las cuales son descriptores globales de las molculas estudiadas, para evitar as que el desigual nmero de descriptores de un fragmento u otro dentro de la capa externa, condicionen o limiten las capacidades predictivas de la red a obtener. La mejor red obtenida incluyendo estas variables, y con ocho neuronas en la capa oculta arroj los siguientes resultados: r= 0,943 r2= 0,8817 ECM= 0,049 EAM= 0,127 * Error Cuadrtico Medio ** Error Absoluto Medio Estos parmetros muestran una aceptable calidad estadstica. Los elevados valores de los coeficientes r y r2 expresan una alta relacin entre la variable dependiente con respecto a las independientes y, adems, un elevado por ciento del error experimental queda explicado en el modelo obtenido. En comparacin con los modelos anteriores, ste presenta mejores estadgrafos reduciendo apreciablemente el error absoluto medio, y mejorando

Vol. XX, N 1, 2008

55

las barreras biolgicas existentes entre el sitio de aplicacin y el receptor. A pesar de esto, existen compuestos a los cuales se les predice casi

exactamente su verdadera actividad, lo que convierte a esta red en una adecuada herramienta de prediccin.

TABLA 4. VALORES DE ACTIVIDAD PREDICHOS POR LA RED CON LAS VARIABLES OBTENIDAS POR ANLISIS CLUSTER PARA LOS COMPUESTOS DE LA SERIE DE VALIDACIN

Concluciones
- Un total de tres modelos fueron obtenidos para la actividad en estudio por dos mtodos diferentes. En sentido general el mtodo de redes neuronales ofreci los mejores resultados. Este resultado en cierta manera es algo previsto, pues el mtodo de Regresin Lineal Mltiple fija una relacin lineal entre la actividad y las variables independientes, forzando el modelo a este tipo de comportamiento, a diferencia del de redes de neuronas; en el cual las relaciones entre la variable dependiente y los descriptores qumicos pueden ser de cualquier tipo. - La red donde se incluyeron los ndices provenientes del anlisis de regresin presenta estadgrafos de menor calidad que la realizada por seleccin de variables por mtodo cluster, sin embargo, su capacidad predictiva en los compuestos de la serie de validacin es superior a la anterior. No obstante, presenta como limitante el hecho de incluir un solo descriptor del fragmento B de la molcula, pudiendo provocar imprecisiones

se modifique fundamentalmente el fragmento A de la molcula. En caso de que se manipule la totalidad de la molcula, la red propuesta es aquella obtenida por el anlisis cluster. - En los dos primeros modelos, el compuesto 11J representa un outlier, sin embargo este mismo compuesto es bien predicho por el modelo obtenido en la segunda red de neuronas. El hecho de que los dos primeros modelos utilicen las mismas variables puede explicar el porqu de esta igualdad de comportamiento entre ellos y divergencia con respecto al tercero. Las diferencias entre ellos con respecto al resto de los outliers son debidas a las diferentes variables y mtodos utilizados. - La variable volumen molar aparece con un elevado peso en los tres modelos obtenidos, demostrando las restricciones estricas que establece el receptor estrognico hacindolo altamente selectivo incluso ante el resto de las hormonas esteroideas. Es destacable, adems el hecho que los compuestos con mayor actividad,

56 Vol. XX, N 1, 2008

presentan una nica sustitucin en el fragmento A, reservada casi exclusivamente a un grupo hidroxilo en posicin 6. - Otras sustituciones adicionales decrecen la afinidad. En el fragmento B parece haber una mayor flexibilidad en cuanto a la posibilidad de sustitucin, pues aunque se ha descrito la importancia de un grupo que interacte por puente de hidrgeno con la macromolcula, ubicado preferentemente en posicin 4', existen compuestos que carecen de ello y sin embargo presentan una afinidad muy elevada. El compuesto 11D puede ser ejemplo de ello. Adems, es de destacar el papel de un grupo metilo en posicin 2', el cual incrementa los valores de afinidad en rdenes superiores incluso al compuesto cabeza de serie. Obsrvesen las actividades de los compuestos 11D y 11N. - En sentido general se confirma el hecho de que el receptor estrognico es de gran complejidad, como lo es tambin el grupo de sustancias que interaccionan con l. No obstante, este trabajo demuestra la valides de los estudios QSAR en la interpretacin de la naturaleza de las interacciones qumicas con el medio biolgico con quien interacta. - Los modelos propuestos son considerados como buenos, pues sus parmetros estadsticos y su capacidad de prediccin superan los estndares internacionales para este tipo de compuestos. En el caso particular de la serie 2-arilbenzotiofeno estudios QSAR anteriores, consideran como muy buenos valores de r2 igual a 0,78; en cambio, en el presente el valor mnimo de r2 reportado es de 0,87.

2. J.M. Hall, D.P. McDonnell, K.S. Korach. Allosteric Regulation of Estrogen Receptor Structure, Function, and Coactivator Recruitment by Different Estrogen Response Elements. Molecular Endocrinology Vol. 16 Num. 3, 2002 pgs. 469486. 3 D.P. Mc Doncel, J.D. Norris. Analysis of the molecular pharmacology of estrogen receptor agonists and antagonists provides insights into the mechanism of action of estrogen in bone. Osteoporosis Int.; suppl. 1, 1997, pgs 29-34. 4 J.A. Katzenellenbogen, B.W. OMalley, B.S. Katzenellenbogen. Tripartite steroid hormone receptor pharmacology: Interaction with multiple effector sites as a basis for the cell and promoter specific action in these hormones. Mol. Endocrinol. 10, 1996 pgs. 119-131. 5 D.P. Mc Doncel, et al. Analysis of estrogen receptor function in vitro reveals three distinct classes of antiestrogens. Mol. Endocrinol, 9, 1996, pgs. 659-669. 6 P. Webb. Tamoxifen activation of the estrogen receptor/AP1 pathway: potential origin for the cell-specific estrogen-like effects of antiestrogens. Mol. Endocrinol. 9, 1995, pgs 443456. 7 E. Higashi, et al. Human CYP2A6 Is Induced by Estrogen via Estrogen Receptor. Drug Metabolism and Disposition, 2007. 8 V. Bourdeau, J. Deschnes, D. Laperrire, M. Aid, J.H. White, S. Mader. Mechanisms of primary and secondary estrogen target gene regulation in breast cancer cells. Nucleic Acids Research. 2007. 9 E.P. Smith, et al. Estrogen resistance caused by mutation in the estrogen receptor gen in man. New England J. Med., 331, 1994, pgs. 1056-1061. 10 D.R. Ciocca, L.M. Vargas Roig. Estrogen receptor in human nontarget tissues: Biological and clinical implications. Endocrinol. Rev., 16, 1995, pgs. 35-62. 11 T.A. Grease, J.A. Dodge. Selective Estrogen Receptor Modulators (SERMs). Current Pharmaceutical Design, 4, 1998, pgs. 35-62. 12 T.A. Grease. Structure-activity relationships of selective estrogen receptor modulators: Modification to the 2arylbenzothiophene core of raloxifene. J. Med. Chem, 40, 1997, pgs. 146-167. 13 T.A. Grease, et all. Synthesis and Pharmacology of conformationally restricted raloxifene analogues: Highly Potent selective estrogen receptor modulators. J. Med. Chem, 41, 1998, pgs 1212-1217. 14 E. Cunha, R. Martins, M. Albuquerque, R. Alencastro. LIV3D-QSAR model for estrogen receptor ligands. Journal of Molecular Modeling, Vol. 10, Num. 4, 2004, pgs. 297-304.

Bibliografa
1. Navarro. Moduladores selectivos del receptor estrognico. Su utilidad en la mujer posmenopusica. Rev Cubana Endocrinol. Vol. 12 Num. 2, 2001 pgs. 124-127.

Vol. XX, N 1, 2008

57

También podría gustarte