La Heurística Búsqueda Tabú Aplicada Al Diseño de Bases de Datos Distribuidas

La Heurstica Bsqueda Tab aplicada al Diseo de
Bases de Datos Distribuidas

Laura Cruz Reyes
Maria Del Carmen Laurence Santillan
lcruzr@avantel.net
madelcal@itcm.edu.mx
Raquel Alicia Vega Leal
Laura Velez Chong
alyvega@hotmail.com
lpvc21@hotmail.com
Luis ngel Hernndez Trevio
arcangelt80@hotmail.com
Departamento de Sistemas y Computacin
Instituto Tecnolgico de Ciudad Madero
Ave. 1 de Mayo y Sor Juana Ins de la Cruz S/N Col. Los Mangos
(01833) 210 04 15 Conmutador, (01833) 210 29 02,Centro de Cmputo
Resumen
En este artculo se proponen algunas
estrategias para automatizar los parmetros
de control del algoritmo de Bsqueda Tab .
Se muestran los resultados experimentales
obtenidos en la solucin del problema del
diseo de la distribucin en bases de datos
distribuidas, el cual es formulado mediante
el modelo matemtico de optimizacin
combinatoria
denominado
FURD.
Finalmente se hace un anlisis comparativo
de los resultados obtenidos por el algoritmo
Bsqueda Tab contra los obtenidos por
Recocido
Simulado
y
Aprendizaje
Reforzado.
1. Introduccin
Dentro del diseo de la distribucin
se encuentra el problema de la ubicacin de
datos que se ha demostrado, es un problema
NP-completo [1,2], es decir a medida que
crece el tamao del problema, el tiempo de
solucin
computacional
crece
exponencialmente. El modelo matemtico
FURD [3], formula una solucin a este
problema, el cual pertenece a la clase NPcompleto[4], esto hace imprctico obtener
buenas
soluciones
en
un
tiempo
computacional
factible
mtodos exactos.
aplicando
los
El mtodo heurstico Bsqueda Tab

(BT) es un procedimiento de bsqueda por
entornos para resolver problemas de
optimizacin combinatoria [5], el cual no
garantiza encontrar la solucin ptima, pero
promete una buena solucin en un tiempo
computacional factible.
En este documento se presenta una
implementacin del mtodo BT con
memoria de trmino corto para la solucin
del problema de la distribucin; y un anlisis
comparativo del desempeo del algoritmo de
BT propuesto y otros algoritmos de
bsqueda
heurstica
como
Recocido
Simulado y Aprendizaje Reforzado.
1
2. Modelo Matemtico
En esta seccin se describe un
modelo de programacin entera (binaria)
para resolver el problema de la
fragmentacin, ubicacin
y reubicacin
Proyecto apoyado parcialmente por CONACYT Y
COSNET clave 643.01-P
dinmica de datos, el cual se ha denominado

FURD[3]. En este modelo de optimizacin,
la decisin de almacenar un atributo m en un
sitio j se representa por la variable binaria
x mj. En l, x mj = 1 si el atributo m se almacena
en el sitio j, y x mj=0 en caso contrario.
wj = indica si existe algn atributo en el

sitio j;
ykj = indica si la consulta k acceder a uno
o ms atributos localizados en el
sitio j;
ami = matriz que indica la ubicacin previa
de los atributos en los sitios
2.1 Funcin Objetivo

2.2. Restricciones del Modelo
La funcin objetivo modela los
costos de transmisin y el acceso a los datos
usando cuatro trminos: el primer trmino
modela
los
costos
de
transmisin
ocasionados para satisfacer las consultas de
todos los sitios; el segundo modela los
costos por acceder varios fragmentos; el
tercer trmino modela los costos de
almacenamiento de los fragmentos en los
sitios; el cuarto trmino modela los costos de
transmisin requeridos para migrar los datos
de un nodo a otro, considerando de esta
forma la naturaleza dinmica de los SBDDs.
min z = f
k
ki m
c x
km km ij mj
c f ki y + c w +
kj
2 j
i k
j 1
j
a mi c ij d m x mj
m
Donde
f ki =
Frecuencia de emisin de la
consulta k desde el sitio i;
qkm = parmetro de uso, qkm =1 si la
consulta k usa el atributo m, en
caso contrario qkm = 0;
lkm = nmero
de
paquetes
de
comunicacin
necesarios
para
transportar el atributo m requerido
por la consulta k;
cij = costo de comunicacin entre el
sitio i y el sitio j;
c1 = costo por acceder a cada fragmento;
c2 = costo por ubicar un fragmento en un
sitio;
El modelo incluye cuatro restricciones: la

primera especfica que cada atributo debe ser
almacenado solamente en un sitio; la
segunda que cada atributo debe ser ubicado
en un sitio en donde se ejecute al menos una
consulta que involucre el atributo; las
ltimas dos restricciones fuerzan a que las
variables wj y ykj tomen un valor, asociado a
x mj.
Ms detalles de este modelo se pueden
encontrar en [3, 6].
3. Mtodo de Solucin
La implementacin del algoritmo de
BT presentada en este documento, maneja
los elementos bsicos de este tipo de
bsqueda: Memoria de trmino corto basada
en recencia, movimientos de atributos
mltiples, y como criterio de terminacin se
aplica un nmero mximo de iteraciones.
Establecer
los
valores
ms
apropiados de los parmetros de control es
complicado y no existe una regla para ello,
por lo que se establecen de acuerdo a la
naturaleza del problema y a la experiencia
del investigador. Por lo que en esta seccin
se presenta una revisin de los trabajos
relacionados con la automatizacin de
dichos parmetros, los cuales sirvieron de
base para desarrollar las estrategias
propuestas en ste trabajo.
3.1. El mtodo de Bsqueda Tab
3.2. Revisin de trabajos previos
El
mtodo
heurstico Bsqueda
Tab es un procedimiento de bsqueda
general para resolver problemas de
optimizacin combinatoria. Este proceso
inicia con una solucin factible x*N y
N X (donde X es el conjunto de todas las
soluciones factibles y N es el conjunto de
todas las soluciones factibles vecinas a x), y
z* como el valor de la funcin objetivo para
x * , y busca alcanzar un mnimo global por
movimientos paso a paso[7]. Mientras no se
cumpla el criterio de terminacin, se repite
el siguiente proceso: se genera una lista de
movimientos candidatos; se selecciona el
mejor movimiento en base a z(x) y se agrega
ste a la lista tab; se actualiza tanto la
solucin x
como su correspondiente
solucin z(x); finalmente si z(x) < z*,
entonces z* se actualiza con el valor de z(x)
y x* con x, siendo estos respectivamente, el
mejor valor de la funcin objetivo y la mejor
solucin del experimento. La Figura 1
muestra el algoritmo de BT implementado.
El algoritmo de Bsqueda Tab se ha

implementado para la solucin de una gran
variedad de problemas de optimizacin
combinatoria [7, 8, 9, 10], sin embargo son
pocos los artculos que especifican los
valores de todos los parmetros de control
del algoritmo y las estructuras de datos
utilizadas. Adems, como ya se mencion,
no existen reglas para esto. A continuacin
se describe la forma en que otros
investigadores determinaron algunos de
stos parmetros.
3.2.1 Tamao de la lista tab
El tamao de la lista tab es
importante para el desempeo de la
bsqueda, si se maneja un valor apropiado se
producen soluciones rpidas y de buena
calidad; el nmero de veces que se alcanza
el ptimo es influenciado por el tamao de la
lista tab [7, 9, 10]. Dos estrategias
propuestas son:
Inicio
x* = una solucin factible inicial
z* = el valor de la funcin objetivo para x*
x = x* , z (x) = z*
Mientras no cumpla el criterio de terminacin
Generar una lista de movimientos candidatos.
Seleccionar un movimiento admisible con el
mayor valor de la funcin objetivo z (x).
Actualizar la lista tab, registrando como
prohibido el movimiento seleccionado.
x = x , z(x) = z(x)
Si z(x) < z*
entonces z* = z(x) , x* = x
Fin Mientras
Fin
Figura 1. Algoritmo de BT.
Definir una longitud de la lista tab fija

[8];
Definir una lista dinmica de longitud
variable; el tamao se debe genera
aleatoriamente para
cada movimiento
seleccionado [8, 9].
3.2.2 Tenencia
La Tenencia es la duracin, en
nmero de iteraciones, que un atributo (o
movimiento) puede permanecer como tab
activo. Durante este periodo el movimiento
permanece como prohibido y no puede
formar parte de una nueva solucin [5]. El
valor de la tenencia es crucial para el
desempeo de BT, con un valor apropiado
las probabilidades de obtener soluciones de
calidad son altas [7]. Dos estrategias
propuestas son:
Mantener un valor esttico; una

constante tal como 7 [5];
Que la tenencia sea igual al tamao
de la lista de candidatos [7].
3.2.3 Tamao de la lista de candidatos

En algunas situaciones donde la
vecindad N(x) es grande o es costoso
evaluar sus elementos, las estrategias de la
lista de candidatos son esenciales para
restringir
el
nmero
de
soluciones
examinadas en una iteracin dada. [5]. Dos
estrategias propuestas son:
La lista de candidatos es generada

aleatoriamente con un tamao fijo.
[7],
Adaptar la lista de candidatos al
tamao del problema.
3.2.4 Estructura de datos de la lista tab

La lista tab guarda un registro de
los movimientos prohibidos (o atributos tab
activos), es importante identificar una
estructura de datos sencilla para que su
manejo sea rpido; usar una estructura de
datos compleja incrementa el tiempo de
actualizacin de la lista. Dos estrategias
propuestas son:
Una matriz [8];

Una cola. [7,10]
3.2.5 Criterio de terminacin

Es el conjunto de condiciones que
deben cumplirse para terminar la bsqueda.
El proceso de bsqueda puede terminar
porque ya se alcanz un cierto nmero de
iteraciones, o bien por el criterio de
convergencia que detiene el algoritmo
despus de obtener la mejor solucin y
reconocer que no hay cambios durante un
periodo de tiempo razonable. Dos estrategias

propuestas son:
Por nmero fijo de iteraciones [9, 11,

12];
Por nmero fijo de iteraciones y por
convergencia [10,13].
4. Implementacin del mtodo de

Bsqueda Tab
El
algoritmo presentado en este
documento se implement usando memoria
de trmino corto con recencia, e incluye los
elementos bsicos de BT que a continuacin
se describen.
a) Tamao de la lista de candidatos
Un valor alto en este parmetro
puede llevar a encontrar buenas soluciones,
pero el tiempo necesario para evaluar un
gran nmero de candidatos puede ser
elevado. La estrategia de regulacin aplicada
en esta investigacin maneja una lista de
candidatos dinmica, es decir, varia con el
tamao en bytes de las instancias que
resuelve. La siguiente expresin es utilizada
para obtener el tamao de la lista de
candidatos: Si el total de bytes de la
instancia
es menor a 11,000 entonces
LCANDI es igual a 4, de lo contrario
LCANDI es igual a una veintava parte de la
raz cuadrada del total de bytes de la
instancia.
b) Tamao de la lista tab
Inicialmente se manej una lista tab
de longitud fija igual a 100, se observ que
para las instancias pequeas era demasiado
grande, mientras que para las instancias
grandes resultaba insuficiente. Se propuso
variar el tamao de la lista en forma
adaptiva, calculando su tamao con la
expresin LCANDI / 2, donde LCANDI es
igual tamao de la lista de candidatos. Esta
estrategia alcanza buenos tiempos en los
La forma como se lleg al

establecimiento de estos parmetros se
describe en la seccin 6 de este documento.
5. Generacin de Casos de Prueba
Los casos de prueba generados para
la experimentacin
se obtuvieron de la
siguiente manera:
Casos de prueba artificiales
a) Se generaron dos instancias
bsicas
(D3_2_2 y D10_4_8), cuya solucin se
Valor de la
Solucin
Z(x)
Tamao
(bytes)
e) Criterio de Aspiracin
El criterio de aspiracin da cierta
flexibilidad a la bsqueda; es decir, el
estatus tab de una solucin o movimiento
puede ser ignorado si se cumplen ciertas
condiciones. Entonces esta solucin puede
ser considerada admisible [1]. El criterio
aplicado fue aspiracin por objetivo global,
que consiste en que la aspiracin de un
movimiento se satisface si el movimiento
produce una solucin mejor que la mejor
obtenida.
Nombre del
Problema
Consultas
d) Criterio de Terminacin
Para el criterio de terminacin se
eligi la estrategia por nmero fijo de
iteraciones; inicialmente se manej un valor
de 30 iteraciones pero no se obtenan buenas
soluciones, se experiment con otros valores
y finalmente este parmetro se fij en 500
iteraciones.
Casos de prueba Aleatorios

Se generan los problemas en forma aleatoria,
para algunos de estos problemas se
desconoce la solucin ptima debido a que
el software de optimizacin combinatoria del
que se dispone no soporta ese tamao de
instancias. Para mas detalles ver [14].
Sitios
c) Tenencia
Para la tenencia se aplic la
estrategia propuesta por Glover [5] que
asigna un valor fijo a este parmetro, el valor
elegido fue 7.
obtuvo mediante un software de

optimizacin combinatoria.
b) Las nuevas instancias se obtuvieron
matemticamente a partir de las instancias
bsicas derivadas de las instancias
D_3_2_2, por lo cual sus soluciones son
conocidas. La Tabla 1 muestra los casos
de prueba pequeos.
Atrib.
problemas pequeos, sin embargo en las

instancias mayores, el tiempo de ejecucin
es muy elevado, por lo que actualmente este
parmetro tiene un valor fijo de 7.
D3_2_2
3
2
2
108
302.2
D6_4_4
6
4
4
308
604.4
D12_8_8
12
8
8
1044
1208.8
D24_16_16
24 16 16
3860
2417.6
D48_32_32
48 32 32
14868
4835.2
D96_64_64
96 64 64
38388
9670.4
D192_128_128 192 128 128 231444 19340.8
D384_256_256 384 256 256 921620 38681.6
D768_512_512 768 512 512 3678228 77363.2
Tabla 1. Casos de prueba artificiales derivados de la
instancia D3_2_2
6. Experimentos Computacionales
La implementacin del algoritmo de
BT se desarroll en el compilador de
Borland C versin 4.10, para
la
experimentacin se utiliz una computadora
personal Pentium II de 175 MHz con sistema
operativo Windows 98. Se realizaron ocho
experimentos, utilizando como entrada los
casos de prueba mencionados en la seccin
anterior. Cada experimento consisti en
ejecutar 30 corridas para cada problema. En
todos los experimentos los programas hacen
cada experimento se enlistan las estrategias

probadas y los mecanismos de clculo de los
valores de los parmetros de control del
algoritmo implementado.
Parmetros de control
Numero de
Experimento
uso de memoria dinmica para el

almacenamiento de las estructuras de datos
de la instancia correspondiente. La Tabla 2
muestra los experimentos realizados. Para
Estrategias
En todos los experimentos se implement
memoria de trmino corto, con recencia.
Para almacenar las estructuras de datos de
las instancias su us memoria dinmica.
a) Parmetros Constantes: Todos.

b) Estructura de datos de la Lista Tab:
arreglo esttico.
150
100
500

cola esttica.
150
100
500

cola esttica.
10
100
500

cola esttica.
50
100
500

cola esttica.
100
100
500
LCANDI
2
500
500
500
a) Parmetros Constantes: T, ITER.

b) Parmetros Adaptivos: LCANDI,
TAMLIST. (LCANDI vara segn el
nmero de atributos)
c) Estructura de datos de la Lista Tab:
cola esttica.
LCANDI
(Tamao de la lista de
candidatos)
TAMLIST
(Tamao de
lista Tab)
T
(Tenencia)
ITER
Nm. de
iteraciones
10, si atributos < 100,

50, si 100 <= atributos <
500,
100, si atributos >=500.
Donde
Atributos = Numero de
atributos de la Base de
datos.
a) Parmetros Constantes: T, ITER.

b) Parmetros Adaptivos: LCANDI,
LCANDI
TAMLIST. (LCANDI vara segn el 10 + 12 ( atributos / 100 )
2
nmero de atributos)
c) Estructura de datos de la Lista Tab:
cola esttica.
a) Parmetros Constantes: TAMLIST, T, 4, si TotalBytes < 11000
ITER.
sqrt( TotalBytes)/20, en
b) Parmetros Adaptivos: LCANDI. caso contrario
7
(LCANDI vara segn el tamao en
Bytes)
c) Estructura de datos de la Lista Tab: TotalBytes = tamao en
cola esttica.
bytes del problema.
Tabla 2. Relacin de experimentos desarrollados.
7. Anlisis comparativo
7.1. Comparacin entre las diferentes
estrategias de bsqueda tab
En esta seccin se presenta un
anlisis de los resultados que se obtuvieron
al aplicar las estrategias descritas en la tabla
2 las cuales se incorporaron en la bsqueda
tab para resolver el problema del diseo de
la distribucin de datos modelado por
FURD. Se realizan comparaciones de estas
estrategias con la finalidad de seleccionar
una de ellas para ser comparada
posteriormente
con
otros
mtodos
heursticos sobre tres clases de instancias.
En las Tablas 3 y 4 se presentan los
resultados del desempeo mostrado por el
mtodo heurstico de bsqueda tab. Las
instancias consideradas tanto en estas tablas
como en la Tabla 5, son las instancias
derivadas de la instancia bsica D3_2_2,
antes descrita. Se comparan ocho algoritmos

identificados como T1, T2, ..., T8, en los que
se integraran respectivamente los ocho
conjuntos de estrategias de la tabla 2. Como
ya se mencion cada uno se diferencia de
los dems por el tipo de memoria utilizada,
y el manejo de los parmetros de control.
En la Tabla 3 se indica el valor
promedio de la solucin generado por cada
algoritmo en cada instancia. Para obtener
este dato se corrieron 30 veces cada uno de
los algoritmos sobre cada uno de los casos
de prueba. Estos mismos resultados pueden
ser observados de manera grfica en la
Figura 2, en la cual el eje x representa el
tamao de las instancias medido en bytes, y
el eje y el valor promedio de la solucin.
Esta figura muestra que los algoritmos
heursticos tienden a producir las mejores
soluciones
a medida que incrementa el
tamao de la instancia.
Tamao de
Valor Promedio de la funcin objetivo
la instancia
en bytes
T1
T2
T3
T4
T5
T6
T7
T8
116
302.2
302.2
302.2
302.2
302.2
302.2
302.2
302.2
324
604.4
604.4
604.4
604.4
604.4
604.4
604.4
604.4
1076
1208.8
1208.8
1208.8
1208.8
1208.8
1208.8
1208.8
1208.8
3924
2417.6
2417.6
2417.6
2417.6
2417.6
2417.6
2417.6
2417.6
14996
4835.2
4835.2
4835.2
4835.2
4835.2
4835.2
4835.2
4835.2
58644
9670.4
9670.4
9920.47
9670.4
9670.4
9670.4
9670.4
9670.4
231956
19340.76 19340.76 20591.09 20215.99 19340.76 19340.76 19340.76 19340.76
992644
38681.61 38681.61 61187.94 47184.01 38681.61 38681.61 38681.61 38681.61
3680276
77363.78 77363.78 186139.14 186139.14 77363.78 77363.78 81114.84 77363.78
Tabla 3 Resultados obtenidos al aplicar bsqueda tab sobre instancias generadas de la duplicacin de la instancia
D3_2_2. La cantidad indicada en cada celda corresponde al valor promedio de la solucin en 30 corridas de cada
algoritmo sobre cada instancia.
200000
180000
160000
Z Promedio
140000
120000
100000
80000
T1
T2
T3
T4
T5
T6
T7
T8
60000
40000
20000
0
-20000
100
1000
10000
100000
1000000
Tamao de la instancia en bytes
Figura 2. Resultados de aplicar ocho algoritmos de bsqueda tab sobre instancias derivadas de
instancia D_3_2_2.
Adems de cuantificar el valor de la

solucin, tambin se midi el esfuerzo
computacional requerido por cada uno de los
algoritmos. En este ltimo caso se reporta el
tiempo de CPU medido en segundos. Esto es
indicado en la Tabla 4 en la cual se muestra
el tiempo promedio requerido por cada
algoritmo sobre cada una de las instancias en
Tamao de la
instancia en
bytes
116
324
1076
3924
14996
58644
231956
992644
3680276
30 corridas. De igual manera, los datos de la

Tabla 4 son representados grficamente en la
Figura 3, en la cual el eje x representa el
tamao de las instancias medido en bytes, y
el eje y el tiempo promedio en segundos. En
esta figura se puede apreciar la superioridad
de los algoritmos.
Tiempo promedio (segundos)

T1
T2
T3
T4
T5
T6
T7
0.25
0.27
0.02
0.02
0.18
0.02
0.02
0.57
0.58
0.04
0.04
0.39
0.04
0.04
1.48
1.41
0.09
0.1
0.93
0.1
0.1
4.1
3.75
0.24
0.24
2.48
0.26
0.24
13.08
11.56
0.75
0.75
7.64
0.82
0.74
46.28
41.05
2.74
2.75
27.39
2.87
2.72
181.12 149.16
9.86
9.8
99.14
52.63 22.07
842.75 793.21 55.61 56.79 508.56 277.11 254.54
4115.3 4069.97 274.57 274.44 2644.39 2864.12 2597.08
T8
0.01
0.02
0.04
0.1
0.44
3.21
23.38
260.15
2589.23
Tabla 4. Tiempo promedio utilizado al aplicar ocho algoritmos de bsqueda tab sobre instancias de la
clase d3_2_2. El tiempo es promediado sobre 30 corridas de cada algoritmo sobre cada instancia.
Comparacin de 8 diferentes tcnicas de Bsqueda Tab
Tiempo promedio (segundos)
4000
3000
2000
T1
T2
T3
T4
T5
T6
T7
T8
1000
0
100
1000
10000
100000
1000000
Tamao de la instancia en bytes

Figura 3. Tiempo promedio utilizado al aplicar ocho algoritmos de bsqueda tab sobre instancias
generadas de la duplicacin de la instancia D3_2_2. El tiempo es promediado sobre 30 corridas de
cada algoritmo sobre cada instancia.
Se
realiz
un
anlisis
de
costo/beneficio simplificado en el que se
comparan los ocho diferentes algoritmos de
bsqueda tab, el cual se presenta en la
Tabla 5. La finalidad de este anlisis es
elegir el mejor algoritmo de bsqueda tab
para contrastarlo posteriormente con otras
tcnicas. Para cada una de las instancias se
realiz una seleccin de los mejores
algoritmos en base al tiempo de cmputo
requerido (columna 2), y a la calidad de la
solucin obtenida por cada uno de ellos
(columna 3). Se puede observar que para
cada instancia se seleccionaron varios
algoritmos en base al tiempo de cmputo,
esto es debido a que existe una diferencia de
tiempo relativamente pequea entre ellos.
Todos los algoritmos seleccionados en base
a la calidad de la solucin obtuvieron el
valor ptimo. Para la seleccin presentada en

la columna 4 se considera tanto el tiempo de
cmputo como la calidad de la solucin.
Para las seis primeras instancias se eligi
entre los algoritmos que obtienen la solucin
ptima aquellos que son considerados los
mejores en tiempo. En el caso de las ltimas
tres instancias los algoritmos que obtienen la
solucin ptima no son precisamente los
mejores en tiempo, pero se considera que es
aceptable esperar esas diferencias en tiempo
a fin de obtener una solucin de mayor
calidad, en este caso el valor ptimo. Por
tanto para estas tres ltimas instancias se
seleccion de los algoritmos que obtienen la
solucin ptima aquellos que tienen menor
tiempo aunque no sean considerados como
los mejores en tiempo.
Tamao de
la instancia
en bytes
116
324
1076
3,924
14,996
58,644
231,956
992,644
3,680,276
Mejores algoritmos en base al

tiempo de cmputo requerido
Mejores algoritmos en
base a la calidad de la
solucin
Mejores algoritmos en
base a tiempo y calidad
de la solucin
T1, T2,..., T8
T1, T2,..., T8
T1, T2, T4, T5, T6, T7, T8

T1, T2, T5, T6, T7, T8
T3, T4, T6, T7, T8

T4, T6, T7, T8
T7, T8
T1, T2, T5, T6, T8
T8
T1, T2,..., T8
T3, T4, T6, T7, T8
T3, T4
Tabla 4. Seleccin de algoritmos de bsqueda tab en base al tiempo de cmputo requerido y la

calidad de la solucin obtenida.
Clase de instancia
Generadas a partir de la instancia D3_2_2
Aleatorias
Aleatorias
Rango del tamao en Orden de Dominacin

bytes
116 - 231,956
AR y T8, RS
992,644 - 3,680,276
AR, T8, RS
660 - 133,140
AR, RS, T8
528,404
AR, T8, RS
17,112 61,484
RS, T8, AR
83,032 102,380
T8, RS, AR
Tabla 5. Mapa de desempeo de los algoritmos.
Puede observarse que el algoritmo T8

aparece entre los mejores para todas las
instancias.
Cabe
mencionar
que
es
considerado entre los mejores slo tomando
en cuenta las instancias y los algoritmos
indicados en la Tabla 5, esto no garantiza
que as suceda para todas las clases de
instancias y otros mtodos heursticos. En
este caso el algoritmo T8 es el algoritmo que
se eligi, por que aparece entre los mejores
para todas las instancias consideradas en este
caso.
las tcnicas de Bsqueda Tab (T8) [15]

seleccionada en la seccin anterior,
Aprendizaje Reforzado (AR) [16] y
Recocido Simulado (RS) [14]; aplicadas a la
solucin del problema de la distribucin de
datos modelado por FURD. En la Tabla 6 se
presenta un mapa del desempeo en el que
se resume los resultados obtenidos,
mostrando el orden de dominacin de los
algoritmos, es decir en que orden los
algoritmos fueron ms efectivos sobre cada
conjunto de instancias.
7.2. Comparacin de Bsqueda Tab,

Recocido
Simulado
y
Aprendizaje
Reforzado
Se puede observar que la eleccin de

los algoritmos depende del tipo de instancias
al que son aplicados y del tamao de las
mismas. Por lo que sera de gran inters
establecer un mtodo para determinar que
algoritmo es el ms adecuado para cada
En esta seccin se muestra el

resultado de una comparacin emprica entre
clase de instancias con la finalidad de

obtener mejores soluciones al problema que
se est resolviendo.
8. Conclusiones y trabajos futuros
La calidad de los trabajos obtenidos

es alentadora, es posible refinar las
estrategias propuestas a fin de obtener
mejores tiempos y automatizar la totalidad
de los parmetros de regulacin
9. Referencias
En este documento se muestra la

factibilidad de resolver el modelo FURD
mediante el mtodo heurstico Bsqueda
Tab.
Es factible automatizar los parmetros de
la bsqueda, lo que libera al usuario de
decidir valores fijos que pudieran afectar
de manera positiva o negativa el
desempeo de sta.
La experimentacin mostr el efecto de
los parmetros en el desempeo de la
bsqueda
La eleccin de una estructura de datos

apropiada para la lista tab influye en el
desempeo de la bsqueda.
Los resultados obtenidos mostraron que

el mtodo es prometedor para problemas
de escala pequea y grande.
En base a la experimentacin realizada

se puede concluir que el desempeo de
los algoritmos considerados depende del
tipo de instancias al que son aplicados y
de la magnitud de las mismas. Es decir,
un algoritmo puede ser considerado
como el mejor para un conjunto de
instancias, mientras que para otro
conjunto de instancias este mismo
algoritmo
no
genere
resultados
satisfactorios y otro sea considerado
como el mejor. Por tanto sera de gran
inters investigar que algoritmo es el
ms adecuado para cada clase de
instancias con la finalidad de obtener
mejores soluciones al problema que se
est resolviendo.
Apers P.M.G.,Data Allocations

in
Distributed
Databases
Systems ACM Transactions on
Database Systems, Vol 13, No.
3, pages 263- 304, sep 1988.
Lin Xuemin, Orlowska Mara
and Zhang Yanchun, On Data
Allocation With the Minimum
Overall Communication Costs In
Distributed Database Design
Proc. of ICCI- 93, IEEE Press.
Prez J., Pazos R.,Rodrguez G.,
Fraustro
J.,
Vlez
A.:
Fragmentacin,
ubicacin
y
reubicacin dinmica en bases de
datos distribuidas. En: II Jornadas de
investigacin y docencia en bases de
datos. Madrid (1997) 110-119.
Cruz Reyes Laura, Automatizacin
del diseo de la fragmentacin
vertical y ubicacin en bases de
datos distribuidas usando mtodos
heursticos y exactos. Tesis MCC.,
ITESM(1999).
Glover Fred, Laguna Manuel, Tabu
Search,
Kluwer
Academic
Publishers
(1997).
Prez J., Pazo R.,Rodrguez G.,
Fraustro
J.,
Vlez
A.:
Fragmentacin
vertical
y
reubicacin dinmica en bases de
datos distribuidas. En: Memorias
primer encuentro de computacin
ENC97, Quertaro, Mxico(1997)
54-62.
Morales Luis B., Scheduling a
bridge club by Tabu Search,
Mathematics
Magazine,
IIMAS,
U.N.A.M.(1997)
10
11
12
13
14
15
U.N.A.M.(1997)
Daz
Rivera
Lorenza
Illanes,
Optimizacin de ruta de vehculos
mediante Bsqueda Tab, Tesis de
Maestra
en
Ciencias
I.T.E.S.M.(1992)
Rolland Erick, Tabu Search and
Algorithms Animation: The Case of
the P-Median Problem, School of
Management,
University
of
California, Riverside, Colloguium
1995.
Mori Hiroyuki y Usami Takayuki,
Unit Commitment using Tabu
Search
with
Restricted
Neighbothood, Meiji University,
Kawasaky Japan.(1996).
Laguna Manuel,
Marti Rafael y
Valls
Vicente,
Arc
Crossing
Minimization
in
Hierarchical
Digraphs with Tabu, Graduate
School of Bussines, University of
Colorado.(1996)
Gonzlez Velarde Jos Luis, Laguna
Manuel,A Tabu Search Method for
Coloring Sparse Random Graphs,
Centro de Sistemas Integrados de
Manufactura,
ITESM,
Graduate
School of Business, University of
Colorado.(1999)
Laguna Manuel, Marti Rafael y
Campos Vicente, Intensification and
Diversification with Elite Tabu
Search Solutions for the linear
Ordering Problem, University of
Colorado,
Universidad
de
Valencia.(1998).
Vlez
Chong
Laura
Patricia;
Esquema
de
enfriamiento
adaptativo para el algoritmo de
aceptacin por umbral aplicado al
diseo de bases de datos
distribuidas, Tesis de Maestra;
Instituto Tecnolgico de Len;
2000.
Prez
Reyes
Karla
Yazmn;
Evaluacin del Modelo FURD
usando Tab Search, Reporte
16 Colunga
Rodrguez
lvaro
Abraham, Muoz Hernndez Luz
del Carmen, Ramrez Morales Mara
de Lourdes; Agente inteligente de
aprendizaje reforzado aplicado al
diseo de bases de datos
distribuidas, Tesis de Licenciatura
asesorado por Juan Javier Gonzlez
Barbosa; Instituto Tecnolgico de
Cd. Madero; 2001.

La Heurística Búsqueda Tabú Aplicada Al Diseño de Bases de Datos Distribuidas

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

La Heurística Búsqueda Tabú Aplicada Al Diseño de Bases de Datos Distribuidas

Cargado por

Copyright:

Formatos disponibles

La Heurstica Bsqueda Tab aplicada al Diseo de

Bases de Datos Distribuidas

El mtodo heurstico Bsqueda Tab

dinmica de datos, el cual se ha denominado

wj = indica si existe algn atributo en el

2.1 Funcin Objetivo

El modelo incluye cuatro restricciones: la

3.1. El mtodo de Bsqueda Tab

3.2. Revisin de trabajos previos

El algoritmo de Bsqueda Tab se ha

Definir una longitud de la lista tab fija

Mantener un valor esttico; una

3.2.3 Tamao de la lista de candidatos

La lista de candidatos es generada

3.2.4 Estructura de datos de la lista tab

Una matriz [8];

3.2.5 Criterio de terminacin

periodo de tiempo razonable. Dos estrategias

Por nmero fijo de iteraciones [9, 11,

4. Implementacin del mtodo de

La forma como se lleg al

Casos de prueba Aleatorios

obtuvo mediante un software de

problemas pequeos, sin embargo en las

cada experimento se enlistan las estrategias

uso de memoria dinmica para el

a) Parmetros Constantes: Todos.

a) Parmetros Constantes: Todos.

a) Parmetros Constantes: Todos.

a) Parmetros Constantes: Todos.

a) Parmetros Constantes: Todos.

a) Parmetros Constantes: T, ITER.

10, si atributos < 100,

a) Parmetros Constantes: T, ITER.

antes descrita. Se comparan ocho algoritmos

Tamao de la instancia en bytes

Adems de cuantificar el valor de la

30 corridas. De igual manera, los datos de la

Tiempo promedio (segundos)

Comparacin de 8 diferentes tcnicas de Bsqueda Tab

Tiempo promedio (segundos)

Tamao de la instancia en bytes

valor ptimo. Para la seleccin presentada en

Mejores algoritmos en base al

T1, T2, T4, T5, T6, T7, T8

T3, T4, T6, T7, T8

T1, T2, T5, T6, T8

T3, T4, T6, T7, T8

Tabla 4. Seleccin de algoritmos de bsqueda tab en base al tiempo de cmputo requerido y la

Rango del tamao en Orden de Dominacin

Tabla 5. Mapa de desempeo de los algoritmos.

Puede observarse que el algoritmo T8

las tcnicas de Bsqueda Tab (T8) [15]

7.2. Comparacin de Bsqueda Tab,

Se puede observar que la eleccin de

En esta seccin se muestra el

clase de instancias con la finalidad de

La calidad de los trabajos obtenidos

En este documento se muestra la

La eleccin de una estructura de datos

Los resultados obtenidos mostraron que

En base a la experimentacin realizada

Apers P.M.G.,Data Allocations