Está en la página 1de 19

Revista de Matematica: Teor y Aplicaciones 2009 16(1) : 159177 a cimpa ucr issn: 1409-2433

evaluacion de un algoritmo de recocido simulado con superficies de respuestas


Maria Beatriz Bernabe Loranca Jos E. Espinosa Rosales e Javier Ram rez Recibido/Received: 20 Feb 2008 Aceptado/Accepted: 8 Dic 2008

Resumen En la solucin al problema de conglomerado geogrco est impl o a a cito un proceso de clasicacin combinatorio sobre unidades geogrcas. La agregacin propuesta en o a o este trabajo considerara como funcin objetivo la minimizacin de distancias entre o o los objetos a agrupar con el n de lograr la compacidad geogrca (tan deseable en a problemas de diseo geogrco). Este problema es NP duro [1], por lo que es necen a sario el uso de mtodos heur e sticos para obtener una solucin satisfactoria tanto en o la bondad de las soluciones como en tiempo de cmputo en problemas grandes. La o discusin se centra en evaluar la calidad de las soluciones obtenidas bajo procedimieno tos sistemticos. Este trabajo presenta la modelacin del problema de conglomerado a o geogrco, el uso de un algoritmo de Recocido Simulado en el algoritmo de partia cionamiento con el n de obtener soluciones aproximadas y nalmente, para evaluar la calidad de las soluciones generadas, la aplicacin de un Diseo de Experimentos o n Box-Behnken y Supercies de Respuestas para encontrar un balance y adecuacin de o los valores de los parmetros de Recocido Simulado en el control de la obtencin de a o buenas soluciones.

Palabras clave: conglomerado geogrco, evaluacin de parmetros, supercies de rea o a spuestas.


Abstract
Departamento de Sistemas, DEPFI, Universidad Nacional Autnoma de Mxico, Mxico D.F.; y Faco e e ultad de Ciencias de la Computacin, Benemrita Universidad Autnoma de Puebla, Puebla, Mxico. o e o e E-Mail: beatriz.bernabe@gmail.com Facultad de Ciencias F sico Matemticas, Benemrita Universidad Autnoma de Puebla. E-Mail a e o pepe-espinosa@hotmail.com. Universidad Autnoma Metropolitana Unidad Azcapotzalco, Departamento de Sistemas, Avenida San Pablo 180, 02200 Mxico D.F., Mxico. E-Mail: jararo@correo.azc.uam.mx e e

159

160

rez M. B. Bernabe J. E. Espinosa J. Ram

Rev.Mate.Teor.Aplic. (2009) 16(1)

The solution of the geographical clustering problem includes a combinatorial classication of the geographical units. The aggregation proposed in this work requires an objective function that minimizes the distance between the objects that will be clustered together, in order to achieve geo-graphical compactness (a desirable goal in problems of geographical design). Because this problem is NP hard [10], it is usually solved with heuristic methodologies that can proportionate satisfactory so-lutions in a reasonable amount of computational time, even for large problems. The main purpose of this research, it is to propose a Box-Behnken experimental design applied into the responses surface, in order to evaluate the quality of the generated solutions. The balance and adequacy of Simulated Annealings parameters would help to control and direct the heuristic method to obtain good solutions for the partitioning problem.

Keywords: Geographical Clustering, Experimental Design, Responses Surface, Simulated Annealing. Mathematics Subject Classication: 62H30, 62K20.

Introduccin o

El problema de Conglomerado Geogrco (CG) consiste en la clasicacin de unidades a o geogrcas (UG) sujetas al cumplimiento de ciertos criterios como el de compacidad a geomtrica, que es el nos ha ocupado en los ultimos trabajos [3, 4, 5]. Las UG que se e han considerado corresponden a AGEBSs (reas Geoestad sticas Bsicas) [24]. a Dada la complejidad combinatoria del problema de CG [1, 13, 14, 18, 23], en este trabajo se presenta una propuesta matemtica y computacional para plantear y resolver a la tarea espec ca de agrupacin geogrca bajo el cumplimiento de una medida de disio a militud como funcin objetivo. El problema se centra entonces en minimizar dicha funcin o o de costo entendida como compacidad sobre AGEBS. Para optimizar esta funcin objetivo o se utiliza un mtodo de gran eciencia en la resolucin heur e o stica de problemas dif ciles de optimizacin combinatoria: Recocido Simulado (RS). Con el propsito de cuanticar o o la calidad de las soluciones generadas se ha aplicado una metodolog estad a stica factorial [15].

1.1

Aspectos generales de CG

El problema de CG cae en la categor de Dise o Territorial (DT) de donde se desprende la a n cual desprende una gran diversidad de problemas que han sido abordados desde diferentes a ngulos [1, 8, 9, 13, 16, 23]. En trminos generales, DT puede ser visto como un problema de agrupacin de reas e o a geogrcas peque as (reas bsicas o unidades geogrcas bsicas) en grupos geogrcos a n a a a a a ms grandes llamados territorios, de tal forma que la agrupacin aceptable es aquella a o ultima que cumpla con criterios predeterminados del problema que ocupa [23]. Estos criterios a cumplir obedecen a la naturaleza de un particular problema donde restricciones espaciales son muy demandadas [1, 7, 17, 21]. La condicin NP-duro de un problema de DT implica resolver un gran n mero de tareas o u geogrcas donde destaca el proceso de clasicacin sujeto al cumplimiento de una funcin a o o

algoritmo de recocido simulado con superficies de respuesta

161

de costo que minimice distancias entre los objetos a agrupar [1]. A nivel internacional han existido esfuerzos similares encaminados a generar de manera automtica agrupaciones a geogrcas. Sin embargo, y hasta donde sabemos, ninguno ha abordado la agregacin a o del territorio utilizando un mtodo de optimizacin combinatoria como apoyo para la e o generacin de grupos considerando como unidades territoriales a los AGEBS. o En Mxico, se cuenta con importantes contribuciones pioneras para esta l e nea de investigacin, como lo son parcelacin de territorio nacional y distritacin electoral [18, 24]. En o o o ambos casos consideran a las manzanas como las unidades geogrcas a agrupar (lo que a facilita establecer la compacidad geomtrica entre manzanas recurriendo a la geometr e a computacional como una excelente herramienta). Sin embargo, al considerar AGEBS como unidades geogrcas para clasicar, los mtodos de adyacencia conocidos para obtener tal a e compacidad, no facilitan el proceso dado que los AGEBS estn separadas por distancias a no uniformes y su estructura espacial es heterognea entre cada UG. Justamente esta es e la naturaleza espacial de los AGEBS en Mxico. e Debido al carcter combinatorio del problema CG, la propuesta de este trabajo se a sit a en el dise o, desarrollo e implementacin de un algoritmo de particionamiento sobre u n o unidades geogrcas AGEBS de una zona metropolitana. Para evitar la generacin de a o m nimos locales, en este algoritmo se hace necesaria la insercin de mtodos heur o e sticos, donde la funcin de costo considera los aspectos fundamentales de agregacin territorial: o o compacidad para ubicacin geogrca de los datos. o a Con la inclusin de RS es posible escapar favorablemente de m o nimos locales y al mismo tiempo mejorar el desempe o del algoritmo de particionamiento que hemos dise ado. Por n n otro lado de Experimentos Box-Benhken y Supercies de Respuestas [15] para obtener condiciones favorables de ajuste de parmetros de la heur a stica y contar con valores que posibiliten la obtencin de soluciones subptimas de calidad en problemas peque os. o o n Dado que actualmente no se disponen de metodolog claras para determinar cmo as o calibrar parmetros de una heur a stica para lograr calidad de soluciones, nuestra aportacin o se centra justamente en este punto. Conscientes de que RS tiene propiedades de parmetros a que la denen y que el control de estos bajo procesos sistemticos permiten encontrar a bondad en los resultados, en este trabajo estamos presentando una tcnica para balancear e estos parmetros que orienten a la generacin de soluciones buenas y cercanas al ptimo a o o para CG. Se han considerado trabajos sobre clasicacin bajo criterios de minimizacin de diso o tancias que han sido de apoyo en este art culo pero sin ofrecer mtodos sistemticos que dee a muestren cmo la variacin de sus parmetros hacen que sus instancias garanticen buenas o o a soluciones. En particular PAM (Partitioning Around Mediods) propuesto por Kaufman y Rousseeuw (1987) [10, 19], es un buen algoritmo de particionamiento exacto con la desventaja de tener alto costo computacional [19]. Sin embargo, ha sido necesario implementar PAM para clasicar AGEBS con el n de obtener una solucin exacta y comparar las o soluciones generadas por RS para problemas peque os y los hemos utilizado para calibrar n los parmetros de la heur a stica. Los datos que hemos considerado a clasicar corresponden a los AGEBS de la Zona Metropolitana del Valle de Toluca (ZMVT) [24]. Las variables de clasicacin estn cono a formadas por 57 variables socioeconmicas disponibles para dichas reas. o a

162

rez M. B. Bernabe J. E. Espinosa J. Ram

Rev.Mate.Teor.Aplic. (2009) 16(1)

Se ha integrado a RS al algoritmo de particionamiento que presentamos en la seccin o 2. La estrategia consiste en elegir k AGEBS como centroides de manera aleatoria para identicar el n mero de grupos (conglomerados). Aquellos AGEBS que no son centroides u sern parte de un determinado grupo si la distancia hacia el centroide es menor que la a distancia hacia otro centroide. Considerada as una solucin inicial, se crea una solucin o o vecina de la misma manera eligiendo nuevos k centroides. Se compara esta solucin vecina o (solucin actual) con la solucin inicial para determinar que tan buena es con respecto a o o la anterior. Una vez que se ha obtenido una solucin nal se hace necesario proponer mtodos para o e validar la calidad de la solucin [2]. Para ello, bajo la aplicacin de Box-Benhken, hemos o o encontrado un conjunto de instancias para ser evaluadas y a su vez con la aplicacin de la o metodolog de Supercies de Respuestas se obtuvieron valores para la calibracin de los a o parmetros de RS que facilitan la generacin de soluciones hacia un m a o nimo global. En congruencia con lo descrito anteriormente, el documento se encuentra organizado como sigue: esta introduccin como seccin 1, se describe el dise o de un modelo de o o n optimizacin para cluster geogrco en la siguiente seccin. Para dar inicio a la validacin o a o o de los parmetros, en el apartado 3 se presentan las instancias y validacin del modelo a o estad stico experimental. En la seccin 4 se concluye la validacin de los resultados y o o nalmente en la seccin 5 presentamos las conclusiones y trabajo futuro. o

Un modelo matemtico para cluster geogrco a a

Existen diversas propuestas para resolver problemas de agregacin geogrca, una de ellas o a es el dise o de zonas donde los autores lo implementaron con un algoritmo gentico [1]. De n e acuerdo con esta propuesta, el modelo para el problema del CG para AGEBS se presenta en esta seccin (Modelo CG). En el problema de CG las UG son AGEBS, cada AGEB o est separado por distancias diferentes de estructura geomtrica no uniforme debido a que a e las AGEBS son datos espaciales [6, 7], su ubicacin geogrca est dada por latitud y o a a longitud lo que ha facilitado el clculo de distancias entre las AGEBS. a Se resuelve la agrupacin de AGEBS de tal forma que las AGEBS que componen los o grupos estn entre ellas muy cercanas geogrcamente donde se requiere el uso de una e a funcin de costo que minimice distancias entre estas. Bsicamente, la estrategia se basa o a en elegir aleatoriamente AGEBS como centroides que determinan el n mero de grupos. u Aquellos AGEBS no centroides que tengan la distancia ms corta hacia un determinado a centroide-AGEB, son los integrantes de un grupo. Esta idea informal es la que se entiende como compacidad geomtrica. Denir formalmente compacidad no es simple [21], sin e embargo, en la denicin 1 se plantea la compacidad para UG [6, 22]: o Denicin 1. Compacidad o Si denotamos por Z = {1, 2, . . . , n} al conjunto de n objetos a clasicar, se trata de dividir Z en k grupos {G1 , G2 , . . . , Gk } con k < n, de tal forma que:
k i=1

Gi = Z

Gi Gj = , i = j

algoritmo de recocido simulado con superficies de respuesta

163

|Gi | 1, i = 1, 2, . . . , k Un grupo Gm con |Gm | > 1 es compacto si para cada objeto t Gm cumple:
iGm

min d(t, i) <

jZGm

min d(t, j), i = t.

(CV 1)

Un grupo Gm con |Gm | = 1 es compacto si su objeto t cumple: min d(t, i) > min d(j, l), f = m.
iZ{t} j,lGf

El criterio de vecindad entre objetos para lograr la compacidad est dado por los pares a de distancias descritos en (CV 1). Con la idea de la denicin 1 y con el n de resolver el problema de CG, se presenta la o siguiente modelacin: o

2.1

Modelo para conglomerado geogrco (Modelo CG) a

Sea UG el n mero total de AGEBS. Sea el conjunto inicial de n UG, U G = {x1 , x2 , . . . , xn }, u donde: xi es la isima unidad geogrca, (i es el e a ndice de UG), y k es el n mero de u zonas (grupos). Dado que se desean formar grupos y para referirnos a stos, denimos: Zi e como el conjunto de las UG que pertenecen a la zona i, Ct es el centroide, y d(i, j) es la distancia euclidiana del nodo i al nodo j (de un AGEB a otro). Entonces se tienen como restricciones: Zi = para i = 1, . . . , k (los grupos no son vac os), Zi Zj = para i = j k (no existen AGEBS repetidos en distintos grupos), y i=1 Zi = U G (la unin de todos los o grupos son todos los AGEBS). Una vez que se ha decidido el n mero k de centroides ct , t = 1, . . . , k, a utilizar hay u que seleccionarlos en forma aleatoria y enseguida asignar los AGEBS a los centroides de la siguiente manera: para cada AGEB i
t=1,...,k

min {d(i, ct )}

cada AGEB es asignado al centroide ms cercano ct . a Para cada valor de k se calcula la suma de las distancias de los AGEBS asignados a cada centroide y se escoge el m nimo y nit es el n mero de iteraciones. Esto puede u expresarse como:
k k=1,...,nit

min

min
t=1 ict

d(i, ct )

(1)

2.2

Algoritmo de recocido simulado para la obtencin de soluciones subo o ptimas en CG

Para garantizar la generacin de buenas soluciones, se requiere de la inclusin de una o o heur stica dentro del algoritmo de particionamiento de CG. Se ha considerado a RS por ser conocido como un mtodo eciente que escapa satisfactoriamente de ptimos locales e o [11, 12]. RS es un mtodo de b squeda por entornos caracterizado por un criterio de e u

164

rez M. B. Bernabe J. E. Espinosa J. Ram

Rev.Mate.Teor.Aplic. (2009) 16(1)

aceptacin de soluciones vecinas que se adapta a lo largo de su ejecucin. Hace uso de o o las variables ya conocidas: Temperatura inicial Ti , Temperatura nal Tf , alfa () y L(t). Estos parmetros son los que se eval an en la seccin siguiente. a u o En RS, el criterio de Metropolis que permite aceptar soluciones vecinas se dene como sigue. Denicin 2. Criterio de Metropolis. o Sea (S, C) un caso de un Problema de Optimizacin Combinatorio e i y j dos soluciones o con costo C(i) y C(j) respectivamente. Entonces el criterio, de Metropolis, para j es: 1 PT {aceptar j} = exp
C(i)C(j) T

si C(j) < C(i) si C(j) > C(i)

T > 0 es el parmetro de control, denominado generalmente temperatura. Si se permite a que T alcance valores sucientemente peque os ya no habr ms movimientos a peores n a a soluciones y la convergencia ser a un ptimo local [11, 12]. a o El siguiente algoritmo de RS puede ser adaptable prcticamente a cualquier problema a de optimizacin combinatoria. o Algoritmo de RS (RS 1) Sean C(s) el costo de la solucin actual y V (s) una vecindad o Seleccionar una solucin inicial sn o Seleccionar una temperatura inicial Ti > 0 Seleccionar funcin de reduccin de temperatura o o Seleccionar un n mero de iteraciones nrep u Seleccionar un criterio de parada REPETIR REPETIR seleccionar aleatoriamente una solucin s V (sn ) o = C(s) C(s0 ) si < 0 entonces sn = s si no generar aleatoriamente x U (0, 1) si x < exp(/t), sn = s n si no hasta que cuenta-iteraciones = nrep t = (t) Hasta criterio de parada Por otro lado, el algoritmo (RS 1), permite adecuarse al problema de CG. Se implementar la funcin de Costo 1 del Modelo CG con una variante sencilla del algoritmo a o anterior y se ha escrito en pseudococdigo con el n de que sea adaptable al algoritmo de o particionamiento para CG. Pseudocdigo de RS (RS 2) o INPUT (T0 , , L(t), Tf )

algoritmo de recocido simulado con superficies de respuesta

165

T T0 (Valor inicial del parmetro de control) a Sact Genera solucin inicial o WHILE T Tf DO (Condicin de parada) o BEGIN FOR cont 1 TO L(T ) DO (Velocidad de Enfriamiento (T )) BEGIN Scand Selecciona solucin N(Sact) (Generacin de una nueva solucin) o o o costo(Scand) costo(Sact) (Clculo de la diferencia de costos) a IF U (0, 1) < e(/T ) OR (Aplicacin del criterio de aceptacin) o o END T (T ) (Mecanismo de enfriamiento) END {Escribe como solucin la mejor de las Sact visitadas} o Finalmente el algoritmo de particionamiento para AGEBS con la inclusin de RS2 o para CG queda integrado de la manera descrita en la seccin siguiente. o

2.3

Algoritmo de recocido simulado y particionamiento para cluster geogrco (RS-CG) a

Sea n el n mero de objetos a clasicar. u U Gij denota que el objeto i est asignado al centroide j a i = 1, . . . , n; j = 1, . . . , k Sea M = {M1 , M2 , . . . , Mk } una solucin de K centroides o T0 es la temperatura inicial Tf es la temperatura nal L(t) es el n mero de iteraciones que se van a realizar con la misma temperatura u 1. Inicio Obtiene Solucin inicial o Generar aleatoriamente centroides iniciales M = M1 , M2 , . . . , Mk Cualquier ageb puede ser centroide obtenido de forma aleatoria costo act Costo(M) Esta asignacin representa ya una Solucin inicial, es una Solucin propuesta generada o o o por el paso anterior. En los siguientes pasos se genera otra Solucin (Solucin vecina) o o para determinar qu tan buena es con respecto a la actual y decidir si se cambia o no la e Solucin actual. o Mientras T Tf mientras el sistema No est frio e Para cont = 1 hasta L(t) hacer nmero de ciclos a realizar con la misma temperatura (parametro de RS) u C Genera una Solucin aleatoria o se genera la Solucin que se compara con * o costo cand Costo(C)

166

rez M. B. Bernabe J. E. Espinosa J. Ram

Rev.Mate.Teor.Aplic. (2009) 16(1)

se obtiene el costo de Solucin candidata que se ha generado o costo cand costo act diferencia de costos para obtener el valor de probabilidad de aceptacin de la solucin cano o didata Si U (0, 1) < eT < 0 hacer o si la probabilidad de aceptacin an es alta o u MC si se acepta la Solucin candidata o costo act costo cand Fin Si Fin para T (T ) se est enfriando el sistema a Fin Mientras Fin 2. Funcin Costo (Sol) o determina qu tan buena es la solucin SOL, es decir, qu tanto minimiza el objetivo e o e i1 inicializa primer objeto cost 0 Mientras i n para cada objeto en U g hacer si U gi no es centroide entonces dmin dist(Sol1 , U gi ) representa la distancia del objetoi hacia Sol1 (primer centroide donde Sol representa al conjunto de todos los centroides. Se calcula la distancia cada objeto a su centroide ms a cercano, (distancia de un objeto i que no es centroide hacia Sol1 que es el centroide 1) j2 paso al segundo centroide Mientras j k Si dist (Solj , U gi ) < dmin se calcula la distancia del objeto i hacia Solj (otro centroide) dmin dist(Solj , U gi ) Fin si j j +1 paso al siguiente centroide Fin Mientras cost cost + dmin Fin si i i+1 Fin Mientras

algoritmo de recocido simulado con superficies de respuesta

167

Costo (Sol) cost Una vez implementado (RS CG) y para observar la diferencia entre un ptimo y o las soluciones que genera dicho algoritmo, estas se han comparado con los resultados de PAM dado que su proceso de clasicacin agota todas las combinaciones posibles y crea o un valor exacto en problemas peque os pero con alto costo computacional [10, 20]. n

Ajuste de parmetros a

Una de las pruebas que es importante realizar sobre los resultados obtenidos es evaluar la calidad de los resultados usando para esto un mtodo sistemtico que permita identicar e a el efecto de los parmetros de control sobre el valor de la funcin de costo, modelar la a o dependencia de esta funcin respecto a los parmetros y nalmente poder hacer un estudio o a sobre la inuencia de los parmetros en la b squeda por encontrar m a u nimos ya sea locales o generales de la funcin [2]. Para ello hemos considerado un dise o experimental de o n supercies de respuestas que nos ha permitido observar los efectos descritos en el prrafo a anterior. Este tipo de experimento es una prueba o serie de pruebas en las cuales se inducen cambios deliberados en algunas variables de entrada del sistema mientras otras se mantienen jas, de tal forma que es posible identicar las fuentes de los cambios en las variables de salida [15].

3.1

Diseo de un experimento que permita modelar los resultados del n efecto de los predictores de la funcin de costo o

La metodolog de supercies de respuesta es una combinacin de tcnicas de dise o y a o e n anlisis de experimentos que, utilizadas en forma secuencial, permiten determinar condia ciones de operacin que son ptimos locales para el problema a tratar. Una funcin o o o compleja suave puede aproximarse localmente (es decir, en zonas peque as de la regin n o de operacin) mediante polinomios de orden bajo. Si la zona donde se realiza la aproxo imacin local est lejos de la zona donde se encuentra un mximo local entonces un o a a polinomio de primer orden deber ser una buena aproximacin. En cambio, si la zona a o est cerca del mximo local ser necesario utilizar un polinomio de segundo orden para a a a describir a la funcin [15]. o El anlisis sistematizado que hemos mencionado se desarroll utilizando un dise o a o n tipo Box-Behnken (BB), este tipo de dise o por sus caracter n sticas es fcil de llevar a a cabo deniendo niveles adecuados de los parmetros de dise o, adems de que es un a n a dise o rotable o sea con igual varianza para todos los puntos de experimentacin que se n o encuentran a la misma distancia del centro del dise o, y por otro lado es posible hacer exn perimentos secuenciales para estudiar los efectos individuales de los parmetros de control a y los efectos combinados de los mismos de manera simultanea. Otra de las ventajas de este dise o es que permite modelar los resultados con una funcin de segundo orden y por n o lo tanto desarrollar un anlisis del comportamiento de la funcin de costo utilizando la a o metodolog de supercies de respuesta. Los dise os BB se forman combinado factoriales a n

168

rez M. B. Bernabe J. E. Espinosa J. Ram

Rev.Mate.Teor.Aplic. (2009) 16(1)

Parmetro a Ti Tf A L(t) Grupos

Nivel Alto 5500 0.1 0.99 5 24

Nivel Central 5250 0.055 0.985 4 18

Nivel bajo 5000 0.01 0.98 3 12

Tabla 1: Niveles y parmetros utilizados en el experimento BB para el problema CG. a

2k con dise o de bloques incompletos. Los dise os resultantes suelen ser ms ecientes en n n a trminos del n mero de corridas facilitando su generacin [15]. e u o Para nuestro problema se ha utilizado un dise o BB con cinco parmetros de control n a que giran alrededor de 24 grupos, el cual es un n mero que habla sobre un buen punto de u inexin en la agrupacin [3, 5]. Con esta informacin introducida a BB, el experimento o o o resultante ha sido una muestra de 46 corridas signicativas dado se han utilizado cuatro puntos centrales [15]. La eleccin de los niveles de los parmetros usados en la construccin o a o del experimento obedece a los resultados obtenidos por el mtodo heur e stico, lo que ha permitido denir una regin de experimentacin. Los niveles integrados se muestran en la o o tabla 1. Con estos nivles y el dise o BB se han llevado a cabo las 46 corridas experimentales n que se muestran en la tabla 2. La nomenclatura utilizada en la tabla es: C (corrida), Ti (Temperatura Inicial), Tf (Temperatura nal), (alpha), Lt (L(t)), G (Grupos), FC (Funcin Objetivo). En esta tabla, para la corrida 29 se obtiene el ptimo 14.12 para 12 o o grupos y para la corrida 31 se obtiene el ptimo 9.279 para 24 grupos. o Las guras 1 y 2 muestran el comportamiento de la heur stica para dos casos: 24 grupos que se ha identicado como el experimento ms conable y 12 grupos como el a menos adecuado, es decir, al comparar la diferencia de la funcin de costo contra las o instancias de la tabla 2 para 24 grupos, notamos que el valor es menor que la diferencia de otra funcin de costo hacia las corridas restantes. Para las corridas asociadas a 12 grupos o se observa que la diferencia que existe hacia el valor exacto es mayor que las corridas respectivas para 18 y 24 grupos. En dichas guras se observa el costo de la funcin o objetivo contra el n mero de iteraciones. Cada caso se ha extra de la tabla anterior u do eligiendo la corrida 36 como aquella que mejor se ha acercado al ptimo siendo el principal o parmetro de referencia el n mero de grupos. En la corrida 36 observamos que con 24 a u grupos y con los parmetros de Ti = 5500, Tf = .055, = .985, L(t) = 4, se gener un a o costo de la funcin objetivo de 11.2403, el ms cercano al ptimo obtenido por PAM que o a o es de 9.279. En contraste con el tiempo que logra PAM para generar la solucin exacta o que fue de 17 horas [6], RS con 3049 iteraciones, 2183 soluciones aceptadas, reduce el costo computacional a un segundo.

algoritmo de recocido simulado con superficies de respuesta

169

C 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Ti 5500 5000 5500 5250 5250 5250 5250 5250 5250 5250 5250 5000 5500 5000 5500 5250 5250 5250 5250 5250 5250 5250

Tf 0.01 0.1 0.1 0.055 0.055 0.055 0.055 0.01 0.1 0.01 0.1 0.055 0.055 0.055 0.055 0.055 0.055 0.055 0.055 0.01 0.1 0.01

0.985 0.985 0.985 0.98 0.99 0.98 0.99 0.985 0.985 0.985 0.985 0.98 0.98 0.99 0.99 0.985 0.985 0.985 0.985 0.98 0.98 0.99

Lt 4 4 4 3 3 5 5 4 4 4 4 4 4 4 4 3 5 3 5 4 4 4

G 18 18 18 18 18 18 18 12 12 24 24 18 18 18 18 12 12 24 24 18 18 18

FC 13.588 14.034 14.122 13.917 14.129 13.235 13.893 16.216 16.55 11.539 12.029 16.302 14.110 13.916 13.955 15.635 16.084 12.331 11.638 13.520 14.304 13.3445

C 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46

Ti 5000 5500 5000 5500 5250 5250 5250 5250 5000 5500 5000 5500 5250 5250 5250 5250 5250 5250 5250 5250 5250 5250

Tf 0.055 0.055 0.055 0.055 0.055 0.055 0.055 0.055 0.055 0.055 0.055 0.055 0.01 0.1 0.01 0.1 0.055 0.055 0.055 0.055 0.055 0.055

0.985 0.985 0.985 0.985 0.98 0.99 0.98 0.99 0.985 0.985 0.985 0.985 0.985 0.985 0.985 0.985 0.985 0.985 0.985 0.985 0.985 0.985

Lt 3 3 5 5 4 4 4 4 4 4 4 4 3 3 5 5 4 4 4 4 4 4

G 18 18 18 18 12 12 24 24 12 12 24 24 18 18 18 18 18 18 18 18 18 18

FC 13.660 13.535 14.026 13.067 16.850 17.108 12.215 11.728 16.696 16.783 11.884 11.240 13.558 13.211 13.700 14.760 13.927 13.822 13.583 13.989 13.639 12.901

Tabla 2: Corridas experimentales determinadas por el experimento BB.

170

rez M. B. Bernabe J. E. Espinosa J. Ram

Rev.Mate.Teor.Aplic. (2009) 16(1)

Figura 1: Corrida 36 con 24 grupos.

Figura 2: Corrida 17 con 12 grupos.

3.2

Vericacin del modelo experimental o

En la gura 3 se observan los resultados de vericacin del modelo, concluyendo que los o datos se comportan normalmente, que el modelo de segundo orden es adecuado y que no existen efectos de una corrida a otra en el experimento.

Figura 3: Vericacin del modelo. o Una vez desarrollado este experimento y analizando la informacin obtenida, se ha o ajustado los resultados con un modelo de regresin de segundo orden, obtenindose la o e ecuacin de prediccin mostrada en la tabla 3. o o

algoritmo de recocido simulado con superficies de respuesta

171

Trmino e Constant TI TF alfa l(t) grupos TI*TI TF*TF alfa*alfa L(t)*L(t) grupos*grupos TI*TF TI*alfa TI*l(t) TI*grupos TF*alpha TF*l(t) TF*grupos alfa*L(t) alfa*grupos l(t)*grupos

Coeciente 16963.0 -0.5 358.1 -31921.4 -16.2 6.2 0.0 -0.4 15020.8 -0.1 0.0 0.0 0.4 0.0 0.0 -395.8 7.8 0.1 22.3 -6.2 0.0

SE Coef 6707.0 0.2 1106.2 13443.1 49.8 8.3 0.0 84.0 6801.6 0.2 0.0 0.0 0.2 0.0 0.0 1116.3 5.6 0.9 50.2 8.4 0.0

T 2.529 -2.360 0.324 -2.375 -0.326 0.742 1.301 -0.005 2.208 -0.692 2.323 0.028 2.220 -0.831 -0.727 -0.355 1.401 0.152 0.445 -0.742 -1.138

P 0.018 0.026 0.749 0.026 0.747 0.465 0.205 0.996 0.037 0.495 0.029 0.978 0.036 0.414 0.174 0.726 0.173 0.880 0.660 0.465 0.266

Tabla 3: Regresin de segundo orden, con S = 0.5023, R2 = 93.8% y R2 = 88.8%. o

172

rez M. B. Bernabe J. E. Espinosa J. Ram

Rev.Mate.Teor.Aplic. (2009) 16(1)

Validacin de la variacin de los parmetros o o a

En esta seccin mostramos las grcas de supercies de respuestas y de prediccin que o a o son obtenidas con el modelo descrito en la seccin anterior. Se presentan los grcos o a de contorno que a su vez son generadas por conclusiones que responden al anlisis de a las supercies de respuesta. Esto es, al identicarse en que regiones se alcanzan valores cercanos al ptimo de la funcin objetivo, y con el n de observar grcamente este o o a comportamiento, se han gracado contornos que revelan como esta funcin se ajusta para o regiones donde los parmetros de prediccin de la misma son los adecuados. a o

Figura 4: Funcin de costo 1. o

Figura 5: Funcin de costo 2. o

En la funcin de costo 1 se ha mantenido ja la temperatura inicial, alfa y el n mero de o u iteraciones. Como se puede observar al cambiar la temperatura nal y el n mero de grupos, u se logra un m nimo de la funcin de costo para temperaturas nales peque as y grandes o n n meros de grupos. La funcin de costo 2 muestra el efecto sobre la funcin de costos u o o de variar la temperatura inicial y el n mero de grupos considerados en el experimento, u se ha mantenido en niveles jos la temperatura nal, y el n mero de iteraciones para u L(t). En este punto se concluye que se logra un m nimo de la funcin de costo para una o temperatura inicial alta y el mayor n mero de grupos posibles (Figuras 4 y 5). u La gura 6 revela el resultado de la modelacin de la funcin de costo manteniendo jas o o la temperatura inicial y nal con . Considerando el comportamiento antes observado, el m nimo contin a apareciendo para el mayor numero de grupos, sin embargo en este caso u el mejor m nimo corresponde a un n mero bajo de iteraciones, incrementando su valor al u crecer el n mero de iteraciones. Este comportamiento es contrastante. En la funcin de u o costo-4 se ha mantenido ja la temperatura inicial, la temperatura nal y el n mero de u iteraciones, nuevamente encontramos que esta funcin es m o nima para un numero grande de grupos, en este caso adems observamos que alfa debe ser grande para lograr el mejor a m nimo; este comportamiento es consistente con lo observado en las anteriores guras. Del anlisis de las grcas de modelacin antes mostradas podemos concluir lo siguiena a o te: 1. La funcin de costo siempre tiene un m o nimo para el n mero mayor de grupos. u

algoritmo de recocido simulado con superficies de respuesta

173

Figura 6: Funcin de costo 3. o

Figura 7: Funcin de costo 4. o

2. El m nimo ocurre para un n mero de iteraciones peque as en el clculo. u n a 3. El valor de alfa debe ser grande 4. La temperatura nal debe ser peque a. n 5. Y la temperatura inicial alta. Este anlisis permite acotar la magnitud de los parmetros de impacto de la funcin de a a o costo, para buscar que esta sea un m nimo. A continuacin presentamos algunas grcas o a de contorno donde se obtienen m nimos de la funcin de costos, cuando hacemos uso de o las conclusiones antes obtenidas.

4.1

Grco de contornos (curvas de nivel) a

La gura 8 representa la curva de nivel de la funcin de costos ajustada para regiones o cercanas al ptimo para 24 grupos. o En el contorno para 24 grupos se ha jado Tf a .01, (alfa) a .98 y 24 grupos en la regin donde se observan funciones de costo m o nimas. Se distingue el comportamiento de la funcin de costo para valores de Ti y L(t) cercanos al ptimo y al mismo tiempo destaca o o el m nimo de la FC obtenido con los mejores parmetros. a

4.2

Optimizacin de la funcin de costo usando el modelo de regresin o o o

Recurriendo al modelo de segundo orden, en la siguiente gura se ha encontrado que con la variacin de todos los parmetros en conjunto sin jar a alguno en particular, es posible o a obtener un valor muy cercano al ptimo. Siendo el costo real de la funcin objetivo de o o 9.27 para 24 grupos, el m nimo alcanzado en este caso es de y = 10.3597 y est dado por a los parmetros de Ti = 5477.6723, Tf = 0.102, = .980 y L(t) = 4.9775. a

174

rez M. B. Bernabe J. E. Espinosa J. Ram

Rev.Mate.Teor.Aplic. (2009) 16(1)

Figura 8: Contorno para 24 grupos.

Figura 9: Representacin del modelo de segundo orden para 24 grupos. o

algoritmo de recocido simulado con superficies de respuesta

175

Conclusiones

De los resultados obtenidos en este trabajo, hemos podido concluir que los parmetros de a la heur stica de recocido simulado implementada para el problema de cluster geogrco, a son sensibles para diferentes condiciones. a.) En trminos generales entre mayor sea el n mero de grupos ms cerca estamos del e u a o ptimo. b.) La temperatura inicial debe estar prxima a 5000 unidades independientemente del o n mero de grupos el costo de la funcin objetivo converge al ptimo. u o o c.) Al jar la temperatura nal y alfa en los contornos, la variacin de los otros parmetros o a restantes debe estar bajo control tal y como se muestra en las grcas de contorno de a la seccin anterior. Se ha determinado entonces que para los 3 contornos resultantes, o jando .01 para temperatura nal y .98 en alfa se logra un buen m nimo en la funcin o de costo. d.) Cuando se han considerado la variacin de todos los parmetros, es claro que un valor o a de alfa de .980 debe ser exigido mientras que la temperatura nal debe ser peque a n con un valor de .01. Dado que el experimento se inici a partir de los resultados analizados en corridas o emp ricas donde se determin que 24 era un buen n mero de grupos [3, 5], el dise o que o u n hemos presentado en este trabajo fue alimentado tal y como se muestra en la tabla 1. Con estos datos se desarroll todo el trabajo correspondiente. No se report en este art o o culo el proceso para encontrar un punto estacionario debido a que no pudo ser observable y por tanto no logramos encontrar la ecuacin cannica, tan util en experimentos como el o o que hemos descrito. Una de las l neas de trabajo a seguir parte de justamente este punto: ampliar el experimento con un mayor n mero de grupos debido que este fue determinante u para alcanzar un m nimo. Suponemos que al aumentar el valor de los parmetros y generar ms instancias, el a a experimento siendo ms extenso dar lugar a encontrar la ecuacin cannica. a a o o Por otro lado se est trabajando con la heur a stica de vecindad variable para el problema de cluster geogrco y construir un dise o de experimentos para esta heur a n stica. Finalmente estamos reportando la inclusin de un Sistema de Informacin Geogrca o o a con el n de revelar los resultados en mapas de tal forma que sea evidente la agrupacin o geogrca compacta [21]. a

Referencias
[1] Bao, F.; Lobo, V.; Painho, M. (2004) Applying genetic algorithms to zone deca sign, in Springer Verlag.

176

rez M. B. Bernabe J. E. Espinosa J. Ram

Rev.Mate.Teor.Aplic. (2009) 16(1)

[2] Barr R.S.; Golden J.P.; Resende M.G.C.; Stewart W.R. (1995) Designing and Reporting on Computational Experiments with Heuristics Methods, Journal of Heuristics, 1: 932. [3] Bernbe, L.B.; Lpez, S. (2004) Statistical classicatory analysis applied to populaa o tion zones, 8th. World Multiconference on Systemics, Cybernetics and Informatics, Orlando. [4] Bernbe, L.B.; Osorio, M.A.; Duque, J.C. (2006) Clasicacin sobre zonas gea o ogrcas: un enfoque de optimizacin combinatoria para el problema de regionala o izacin, XIII CLAIO Congreso Latino-Iberoamericano de Investigacin Operativa, o o Montevideo. [5] Bernbe, L.B.; Aguirre, V.R.; Lpez, S.R. (2004) Application of non-supervised a o classication to population data, ICEEE/CIE2004, International Conference on Electrical and Electronics Engineering, Acapulco. ISBN 0-7803-8531-4. [6] Bernbe, L.B. (2006) Desarrollo de un modelo para la determinacin de zonicacin a o o o ptima, Proyecto de tesis doctoral en desarrollo, Posgrado de Ingenier UNAM, a Investigacin de Operaciones. o [7] Cli, A.D.; Haggett, P.; Ord, J.K.; Bassett, K.A.; Davies, R.B. (1975), Elements of Spatial Structure: a Quantitative Approach. Cambridge University Press, Cambridge. [8] Hess S.W.; Samuels S.A. (1971) Experiences with a sales districting model: criteria and implementation, Management Science, Series B: Application 18: 4154. [9] Kalcsics, J.; Nickel, S.; Schrder, M. (2005) Towards a Unied Territory Design o Approach. Applications, Algorithms and GIS Integration. Universitt des Saarlandes, a Germany. [10] Kaufman, L.; Rousseeuw, P. (1987) Clustering by means of medoids, Statistical Data Analysis: 405416. [11] Kirkpatrick, S.; Gelatt, D.; Vecchi, M.P. (1983) Optimization by simulated annealing, Science 220: 671680. [12] Lebster, I. (1995) Adaptative simulated annealing, in: (ASA): lesson learned. Technical Report, Control and Cybernetic, McLean VA. [13] Macmillan, W.; (2001) Redistricting in a GIS environment: an optimization algorithm using switching points, Journal of Geographical Systems 3: 16780. [14] Mehrotra, A.; Johnson, E.; Nemhauser, G. (1998) An optimization based heuristic for political districting, Management Science 44: 11001114. [15] Montgomery, D. (1991) Design and Analisis of Experiments, 2nd edition. Wiley, New York.

algoritmo de recocido simulado con superficies de respuesta

177

[16] Murtagh F. (1985) A survey of algorithms for contiguityconstrained clustering and related problems, Computer Journal 28: 8288. [17] Openshaw S.; Taylor P. (1981) The modiable area unit problem, in: N. Wrigley & R. Bennett(Eds.) Quantitative Geography, London: 6070. [18] Romero, D.; Burguete, J.; Mart nez, E.; Velasco, J. (2004) Parcelacin del territorio o nacional: un enfoque de optimizacin combinatoria para la construccin de marcos o o de muestreo en hogares, INEGI, Mxico. e [19] Rousseeuw, P.J.; Hubert, M.; Struyf, A. (1997) Clustering in an object-oriented environment, Journal of Statistical Software 1: 210. [20] MapX Developers Guide, MapInfo corporation, Troy NY. [21] Takeshi, S. (2004) A model of contiguity for spatial unit allocation, Geographical Analysis, Institute for Geoinformation, Technical University of Viena, Austria, ISSN 0016-7363. [22] Zamora, A.E. (2006) Implementacin de un algoritmo compacto y homogneo para o e la clasicacin de zonas geogrcas AGEBs bajo una interfaz grca, Tesis de o a a Ingeniera en Ciencias de la Computacin, BUAP, Puebla. o [23] Zoltners, A.; Sinha, P. (1983) Towards a unied territory alignment: a review and model, Management Science 29: 12371256. [24] http://www.inegi.gob.mx, Instituto Nacional de Estad stica, Geograf e Ina fomtica (INEGI), Mxico. a e

También podría gustarte