Está en la página 1de 12

La Heurstica Bsqueda Tab aplicada al Diseo de

Bases de Datos Distribuidas


Laura Cruz Reyes
Maria Del Carmen Laurence Santillan
lcruzr@avantel.net
madelcal@itcm.edu.mx
Raquel Alicia Vega Leal
Laura Velez Chong
alyvega@hotmail.com
lpvc21@hotmail.com
Luis ngel Hernndez Trevio
arcangelt80@hotmail.com
Departamento de Sistemas y Computacin
Instituto Tecnolgico de Ciudad Madero
Ave. 1 de Mayo y Sor Juana Ins de la Cruz S/N Col. Los Mangos
(01833) 210 04 15 Conmutador, (01833) 210 29 02,Centro de Cmputo
Resumen
En este artculo se proponen algunas
estrategias para automatizar los parmetros
de control del algoritmo de Bsqueda Tab .
Se muestran los resultados experimentales
obtenidos en la solucin del problema del
diseo de la distribucin en bases de datos
distribuidas, el cual es formulado mediante
el modelo matemtico de optimizacin
combinatoria
denominado
FURD.
Finalmente se hace un anlisis comparativo
de los resultados obtenidos por el algoritmo
Bsqueda Tab contra los obtenidos por
Recocido
Simulado
y
Aprendizaje
Reforzado.
1. Introduccin
Dentro del diseo de la distribucin
se encuentra el problema de la ubicacin de
datos que se ha demostrado, es un problema
NP-completo [1,2], es decir a medida que
crece el tamao del problema, el tiempo de
solucin
computacional
crece
exponencialmente. El modelo matemtico
FURD [3], formula una solucin a este
problema, el cual pertenece a la clase NPcompleto[4], esto hace imprctico obtener
buenas
soluciones
en
un
tiempo

computacional
factible
mtodos exactos.

aplicando

los

El mtodo heurstico Bsqueda Tab


(BT) es un procedimiento de bsqueda por
entornos para resolver problemas de
optimizacin combinatoria [5], el cual no
garantiza encontrar la solucin ptima, pero
promete una buena solucin en un tiempo
computacional factible.
En este documento se presenta una
implementacin del mtodo BT con
memoria de trmino corto para la solucin
del problema de la distribucin; y un anlisis
comparativo del desempeo del algoritmo de
BT propuesto y otros algoritmos de
bsqueda
heurstica
como
Recocido
Simulado y Aprendizaje Reforzado.
1

2. Modelo Matemtico
En esta seccin se describe un
modelo de programacin entera (binaria)
para resolver el problema de la
fragmentacin, ubicacin
y reubicacin
Proyecto apoyado parcialmente por CONACYT Y
COSNET clave 643.01-P

dinmica de datos, el cual se ha denominado


FURD[3]. En este modelo de optimizacin,
la decisin de almacenar un atributo m en un
sitio j se representa por la variable binaria
x mj. En l, x mj = 1 si el atributo m se almacena
en el sitio j, y x mj=0 en caso contrario.

wj = indica si existe algn atributo en el


sitio j;
ykj = indica si la consulta k acceder a uno
o ms atributos localizados en el
sitio j;
ami = matriz que indica la ubicacin previa
de los atributos en los sitios

2.1 Funcin Objetivo


2.2. Restricciones del Modelo
La funcin objetivo modela los
costos de transmisin y el acceso a los datos
usando cuatro trminos: el primer trmino
modela
los
costos
de
transmisin
ocasionados para satisfacer las consultas de
todos los sitios; el segundo modela los
costos por acceder varios fragmentos; el
tercer trmino modela los costos de
almacenamiento de los fragmentos en los
sitios; el cuarto trmino modela los costos de
transmisin requeridos para migrar los datos
de un nodo a otro, considerando de esta
forma la naturaleza dinmica de los SBDDs.
min z = f
k

ki m

c x

km km ij mj

c f ki y + c w +
kj
2 j
i k
j 1
j
a mi c ij d m x mj
m

Donde
f ki =

Frecuencia de emisin de la
consulta k desde el sitio i;
qkm = parmetro de uso, qkm =1 si la
consulta k usa el atributo m, en
caso contrario qkm = 0;
lkm = nmero
de
paquetes
de
comunicacin
necesarios
para
transportar el atributo m requerido
por la consulta k;
cij = costo de comunicacin entre el
sitio i y el sitio j;
c1 = costo por acceder a cada fragmento;
c2 = costo por ubicar un fragmento en un
sitio;

El modelo incluye cuatro restricciones: la


primera especfica que cada atributo debe ser
almacenado solamente en un sitio; la
segunda que cada atributo debe ser ubicado
en un sitio en donde se ejecute al menos una
consulta que involucre el atributo; las
ltimas dos restricciones fuerzan a que las
variables wj y ykj tomen un valor, asociado a
x mj.
Ms detalles de este modelo se pueden
encontrar en [3, 6].
3. Mtodo de Solucin
La implementacin del algoritmo de
BT presentada en este documento, maneja
los elementos bsicos de este tipo de
bsqueda: Memoria de trmino corto basada
en recencia, movimientos de atributos
mltiples, y como criterio de terminacin se
aplica un nmero mximo de iteraciones.
Establecer
los
valores
ms
apropiados de los parmetros de control es
complicado y no existe una regla para ello,
por lo que se establecen de acuerdo a la
naturaleza del problema y a la experiencia
del investigador. Por lo que en esta seccin
se presenta una revisin de los trabajos
relacionados con la automatizacin de
dichos parmetros, los cuales sirvieron de
base para desarrollar las estrategias
propuestas en ste trabajo.

3.1. El mtodo de Bsqueda Tab

3.2. Revisin de trabajos previos

El
mtodo
heurstico Bsqueda
Tab es un procedimiento de bsqueda
general para resolver problemas de
optimizacin combinatoria. Este proceso
inicia con una solucin factible x*N y
N X (donde X es el conjunto de todas las
soluciones factibles y N es el conjunto de
todas las soluciones factibles vecinas a x), y
z* como el valor de la funcin objetivo para
x * , y busca alcanzar un mnimo global por
movimientos paso a paso[7]. Mientras no se
cumpla el criterio de terminacin, se repite
el siguiente proceso: se genera una lista de
movimientos candidatos; se selecciona el
mejor movimiento en base a z(x) y se agrega
ste a la lista tab; se actualiza tanto la
solucin x
como su correspondiente
solucin z(x); finalmente si z(x) < z*,
entonces z* se actualiza con el valor de z(x)
y x* con x, siendo estos respectivamente, el
mejor valor de la funcin objetivo y la mejor
solucin del experimento. La Figura 1
muestra el algoritmo de BT implementado.

El algoritmo de Bsqueda Tab se ha


implementado para la solucin de una gran
variedad de problemas de optimizacin
combinatoria [7, 8, 9, 10], sin embargo son
pocos los artculos que especifican los
valores de todos los parmetros de control
del algoritmo y las estructuras de datos
utilizadas. Adems, como ya se mencion,
no existen reglas para esto. A continuacin
se describe la forma en que otros
investigadores determinaron algunos de
stos parmetros.
3.2.1 Tamao de la lista tab
El tamao de la lista tab es
importante para el desempeo de la
bsqueda, si se maneja un valor apropiado se
producen soluciones rpidas y de buena
calidad; el nmero de veces que se alcanza
el ptimo es influenciado por el tamao de la
lista tab [7, 9, 10]. Dos estrategias
propuestas son:

Inicio
x* = una solucin factible inicial
z* = el valor de la funcin objetivo para x*
x = x* , z (x) = z*
Mientras no cumpla el criterio de terminacin
Generar una lista de movimientos candidatos.
Seleccionar un movimiento admisible con el
mayor valor de la funcin objetivo z (x).
Actualizar la lista tab, registrando como
prohibido el movimiento seleccionado.
x = x , z(x) = z(x)
Si z(x) < z*
entonces z* = z(x) , x* = x
Fin Mientras
Fin
Figura 1. Algoritmo de BT.

Definir una longitud de la lista tab fija


[8];
Definir una lista dinmica de longitud
variable; el tamao se debe genera
aleatoriamente para
cada movimiento
seleccionado [8, 9].

3.2.2 Tenencia
La Tenencia es la duracin, en
nmero de iteraciones, que un atributo (o
movimiento) puede permanecer como tab
activo. Durante este periodo el movimiento
permanece como prohibido y no puede
formar parte de una nueva solucin [5]. El
valor de la tenencia es crucial para el
desempeo de BT, con un valor apropiado
las probabilidades de obtener soluciones de
calidad son altas [7]. Dos estrategias
propuestas son:

Mantener un valor esttico; una


constante tal como 7 [5];
Que la tenencia sea igual al tamao
de la lista de candidatos [7].

3.2.3 Tamao de la lista de candidatos


En algunas situaciones donde la
vecindad N(x) es grande o es costoso
evaluar sus elementos, las estrategias de la
lista de candidatos son esenciales para
restringir
el
nmero
de
soluciones
examinadas en una iteracin dada. [5]. Dos
estrategias propuestas son:

La lista de candidatos es generada


aleatoriamente con un tamao fijo.
[7],
Adaptar la lista de candidatos al
tamao del problema.

3.2.4 Estructura de datos de la lista tab


La lista tab guarda un registro de
los movimientos prohibidos (o atributos tab
activos), es importante identificar una
estructura de datos sencilla para que su
manejo sea rpido; usar una estructura de
datos compleja incrementa el tiempo de
actualizacin de la lista. Dos estrategias
propuestas son:

Una matriz [8];


Una cola. [7,10]

3.2.5 Criterio de terminacin


Es el conjunto de condiciones que
deben cumplirse para terminar la bsqueda.
El proceso de bsqueda puede terminar
porque ya se alcanz un cierto nmero de
iteraciones, o bien por el criterio de
convergencia que detiene el algoritmo
despus de obtener la mejor solucin y
reconocer que no hay cambios durante un

periodo de tiempo razonable. Dos estrategias


propuestas son:

Por nmero fijo de iteraciones [9, 11,


12];
Por nmero fijo de iteraciones y por
convergencia [10,13].

4. Implementacin del mtodo de


Bsqueda Tab
El
algoritmo presentado en este
documento se implement usando memoria
de trmino corto con recencia, e incluye los
elementos bsicos de BT que a continuacin
se describen.
a) Tamao de la lista de candidatos
Un valor alto en este parmetro
puede llevar a encontrar buenas soluciones,
pero el tiempo necesario para evaluar un
gran nmero de candidatos puede ser
elevado. La estrategia de regulacin aplicada
en esta investigacin maneja una lista de
candidatos dinmica, es decir, varia con el
tamao en bytes de las instancias que
resuelve. La siguiente expresin es utilizada
para obtener el tamao de la lista de
candidatos: Si el total de bytes de la
instancia
es menor a 11,000 entonces
LCANDI es igual a 4, de lo contrario
LCANDI es igual a una veintava parte de la
raz cuadrada del total de bytes de la
instancia.
b) Tamao de la lista tab
Inicialmente se manej una lista tab
de longitud fija igual a 100, se observ que
para las instancias pequeas era demasiado
grande, mientras que para las instancias
grandes resultaba insuficiente. Se propuso
variar el tamao de la lista en forma
adaptiva, calculando su tamao con la
expresin LCANDI / 2, donde LCANDI es
igual tamao de la lista de candidatos. Esta
estrategia alcanza buenos tiempos en los

La forma como se lleg al


establecimiento de estos parmetros se
describe en la seccin 6 de este documento.
5. Generacin de Casos de Prueba
Los casos de prueba generados para
la experimentacin
se obtuvieron de la
siguiente manera:
Casos de prueba artificiales
a) Se generaron dos instancias
bsicas
(D3_2_2 y D10_4_8), cuya solucin se

Valor de la
Solucin
Z(x)

Tamao
(bytes)

e) Criterio de Aspiracin
El criterio de aspiracin da cierta
flexibilidad a la bsqueda; es decir, el
estatus tab de una solucin o movimiento
puede ser ignorado si se cumplen ciertas
condiciones. Entonces esta solucin puede
ser considerada admisible [1]. El criterio
aplicado fue aspiracin por objetivo global,
que consiste en que la aspiracin de un
movimiento se satisface si el movimiento
produce una solucin mejor que la mejor
obtenida.

Nombre del
Problema

Consultas

d) Criterio de Terminacin
Para el criterio de terminacin se
eligi la estrategia por nmero fijo de
iteraciones; inicialmente se manej un valor
de 30 iteraciones pero no se obtenan buenas
soluciones, se experiment con otros valores
y finalmente este parmetro se fij en 500
iteraciones.

Casos de prueba Aleatorios


Se generan los problemas en forma aleatoria,
para algunos de estos problemas se
desconoce la solucin ptima debido a que
el software de optimizacin combinatoria del
que se dispone no soporta ese tamao de
instancias. Para mas detalles ver [14].

Sitios

c) Tenencia
Para la tenencia se aplic la
estrategia propuesta por Glover [5] que
asigna un valor fijo a este parmetro, el valor
elegido fue 7.

obtuvo mediante un software de


optimizacin combinatoria.
b) Las nuevas instancias se obtuvieron
matemticamente a partir de las instancias
bsicas derivadas de las instancias
D_3_2_2, por lo cual sus soluciones son
conocidas. La Tabla 1 muestra los casos
de prueba pequeos.

Atrib.

problemas pequeos, sin embargo en las


instancias mayores, el tiempo de ejecucin
es muy elevado, por lo que actualmente este
parmetro tiene un valor fijo de 7.

D3_2_2
3
2
2
108
302.2
D6_4_4
6
4
4
308
604.4
D12_8_8
12
8
8
1044
1208.8
D24_16_16
24 16 16
3860
2417.6
D48_32_32
48 32 32
14868
4835.2
D96_64_64
96 64 64
38388
9670.4
D192_128_128 192 128 128 231444 19340.8
D384_256_256 384 256 256 921620 38681.6
D768_512_512 768 512 512 3678228 77363.2
Tabla 1. Casos de prueba artificiales derivados de la
instancia D3_2_2

6. Experimentos Computacionales
La implementacin del algoritmo de
BT se desarroll en el compilador de
Borland C versin 4.10, para
la
experimentacin se utiliz una computadora
personal Pentium II de 175 MHz con sistema
operativo Windows 98. Se realizaron ocho
experimentos, utilizando como entrada los
casos de prueba mencionados en la seccin
anterior. Cada experimento consisti en
ejecutar 30 corridas para cada problema. En
todos los experimentos los programas hacen

cada experimento se enlistan las estrategias


probadas y los mecanismos de clculo de los
valores de los parmetros de control del
algoritmo implementado.
Parmetros de control

Numero de
Experimento

uso de memoria dinmica para el


almacenamiento de las estructuras de datos
de la instancia correspondiente. La Tabla 2
muestra los experimentos realizados. Para
Estrategias
En todos los experimentos se implement
memoria de trmino corto, con recencia.
Para almacenar las estructuras de datos de
las instancias su us memoria dinmica.

a) Parmetros Constantes: Todos.


b) Estructura de datos de la Lista Tab:
arreglo esttico.

150

100

500

a) Parmetros Constantes: Todos.


b) Estructura de datos de la Lista Tab:
cola esttica.

150

100

500

a) Parmetros Constantes: Todos.


b) Estructura de datos de la Lista Tab:
cola esttica.

10

100

500

a) Parmetros Constantes: Todos.


b) Estructura de datos de la Lista Tab:
cola esttica.

50

100

500

a) Parmetros Constantes: Todos.


b) Estructura de datos de la Lista Tab:
cola esttica.

100

100

500

LCANDI
2

500

500

500

a) Parmetros Constantes: T, ITER.


b) Parmetros Adaptivos: LCANDI,
TAMLIST. (LCANDI vara segn el
nmero de atributos)
c) Estructura de datos de la Lista Tab:
cola esttica.

LCANDI
(Tamao de la lista de
candidatos)

TAMLIST
(Tamao de
lista Tab)

T
(Tenencia)

ITER
Nm. de
iteraciones

10, si atributos < 100,


50, si 100 <= atributos <
500,
100, si atributos >=500.
Donde
Atributos = Numero de
atributos de la Base de
datos.

a) Parmetros Constantes: T, ITER.


b) Parmetros Adaptivos: LCANDI,
LCANDI
TAMLIST. (LCANDI vara segn el 10 + 12 ( atributos / 100 )
2
nmero de atributos)
c) Estructura de datos de la Lista Tab:
cola esttica.
a) Parmetros Constantes: TAMLIST, T, 4, si TotalBytes < 11000
ITER.
sqrt( TotalBytes)/20, en
b) Parmetros Adaptivos: LCANDI. caso contrario
7
(LCANDI vara segn el tamao en
Bytes)
c) Estructura de datos de la Lista Tab: TotalBytes = tamao en
cola esttica.
bytes del problema.
Tabla 2. Relacin de experimentos desarrollados.

7. Anlisis comparativo
7.1. Comparacin entre las diferentes
estrategias de bsqueda tab
En esta seccin se presenta un
anlisis de los resultados que se obtuvieron
al aplicar las estrategias descritas en la tabla
2 las cuales se incorporaron en la bsqueda
tab para resolver el problema del diseo de
la distribucin de datos modelado por
FURD. Se realizan comparaciones de estas
estrategias con la finalidad de seleccionar
una de ellas para ser comparada
posteriormente
con
otros
mtodos
heursticos sobre tres clases de instancias.
En las Tablas 3 y 4 se presentan los
resultados del desempeo mostrado por el
mtodo heurstico de bsqueda tab. Las
instancias consideradas tanto en estas tablas
como en la Tabla 5, son las instancias
derivadas de la instancia bsica D3_2_2,

antes descrita. Se comparan ocho algoritmos


identificados como T1, T2, ..., T8, en los que
se integraran respectivamente los ocho
conjuntos de estrategias de la tabla 2. Como
ya se mencion cada uno se diferencia de
los dems por el tipo de memoria utilizada,
y el manejo de los parmetros de control.
En la Tabla 3 se indica el valor
promedio de la solucin generado por cada
algoritmo en cada instancia. Para obtener
este dato se corrieron 30 veces cada uno de
los algoritmos sobre cada uno de los casos
de prueba. Estos mismos resultados pueden
ser observados de manera grfica en la
Figura 2, en la cual el eje x representa el
tamao de las instancias medido en bytes, y
el eje y el valor promedio de la solucin.
Esta figura muestra que los algoritmos
heursticos tienden a producir las mejores
soluciones
a medida que incrementa el
tamao de la instancia.

Tamao de
Valor Promedio de la funcin objetivo
la instancia
en bytes
T1
T2
T3
T4
T5
T6
T7
T8
116
302.2
302.2
302.2
302.2
302.2
302.2
302.2
302.2
324
604.4
604.4
604.4
604.4
604.4
604.4
604.4
604.4
1076
1208.8
1208.8
1208.8
1208.8
1208.8
1208.8
1208.8
1208.8
3924
2417.6
2417.6
2417.6
2417.6
2417.6
2417.6
2417.6
2417.6
14996
4835.2
4835.2
4835.2
4835.2
4835.2
4835.2
4835.2
4835.2
58644
9670.4
9670.4
9920.47
9670.4
9670.4
9670.4
9670.4
9670.4
231956
19340.76 19340.76 20591.09 20215.99 19340.76 19340.76 19340.76 19340.76
992644
38681.61 38681.61 61187.94 47184.01 38681.61 38681.61 38681.61 38681.61
3680276
77363.78 77363.78 186139.14 186139.14 77363.78 77363.78 81114.84 77363.78
Tabla 3 Resultados obtenidos al aplicar bsqueda tab sobre instancias generadas de la duplicacin de la instancia
D3_2_2. La cantidad indicada en cada celda corresponde al valor promedio de la solucin en 30 corridas de cada
algoritmo sobre cada instancia.

200000
180000
160000

Z Promedio

140000
120000
100000
80000

T1
T2
T3
T4
T5
T6
T7
T8

60000
40000
20000
0
-20000
100

1000

10000

100000

1000000

Tamao de la instancia en bytes

Figura 2. Resultados de aplicar ocho algoritmos de bsqueda tab sobre instancias derivadas de
instancia D_3_2_2.

Adems de cuantificar el valor de la


solucin, tambin se midi el esfuerzo
computacional requerido por cada uno de los
algoritmos. En este ltimo caso se reporta el
tiempo de CPU medido en segundos. Esto es
indicado en la Tabla 4 en la cual se muestra
el tiempo promedio requerido por cada
algoritmo sobre cada una de las instancias en

Tamao de la
instancia en
bytes
116
324
1076
3924
14996
58644
231956
992644
3680276

30 corridas. De igual manera, los datos de la


Tabla 4 son representados grficamente en la
Figura 3, en la cual el eje x representa el
tamao de las instancias medido en bytes, y
el eje y el tiempo promedio en segundos. En
esta figura se puede apreciar la superioridad
de los algoritmos.

Tiempo promedio (segundos)


T1
T2
T3
T4
T5
T6
T7
0.25
0.27
0.02
0.02
0.18
0.02
0.02
0.57
0.58
0.04
0.04
0.39
0.04
0.04
1.48
1.41
0.09
0.1
0.93
0.1
0.1
4.1
3.75
0.24
0.24
2.48
0.26
0.24
13.08
11.56
0.75
0.75
7.64
0.82
0.74
46.28
41.05
2.74
2.75
27.39
2.87
2.72
181.12 149.16
9.86
9.8
99.14
52.63 22.07
842.75 793.21 55.61 56.79 508.56 277.11 254.54
4115.3 4069.97 274.57 274.44 2644.39 2864.12 2597.08

T8
0.01
0.02
0.04
0.1
0.44
3.21
23.38
260.15
2589.23

Tabla 4. Tiempo promedio utilizado al aplicar ocho algoritmos de bsqueda tab sobre instancias de la
clase d3_2_2. El tiempo es promediado sobre 30 corridas de cada algoritmo sobre cada instancia.

Comparacin de 8 diferentes tcnicas de Bsqueda Tab

Tiempo promedio (segundos)

4000

3000

2000

T1
T2
T3
T4
T5
T6
T7
T8

1000

0
100

1000

10000

100000

1000000

Tamao de la instancia en bytes


Figura 3. Tiempo promedio utilizado al aplicar ocho algoritmos de bsqueda tab sobre instancias
generadas de la duplicacin de la instancia D3_2_2. El tiempo es promediado sobre 30 corridas de
cada algoritmo sobre cada instancia.

Se
realiz
un
anlisis
de
costo/beneficio simplificado en el que se
comparan los ocho diferentes algoritmos de
bsqueda tab, el cual se presenta en la
Tabla 5. La finalidad de este anlisis es
elegir el mejor algoritmo de bsqueda tab
para contrastarlo posteriormente con otras
tcnicas. Para cada una de las instancias se
realiz una seleccin de los mejores
algoritmos en base al tiempo de cmputo
requerido (columna 2), y a la calidad de la
solucin obtenida por cada uno de ellos
(columna 3). Se puede observar que para
cada instancia se seleccionaron varios
algoritmos en base al tiempo de cmputo,
esto es debido a que existe una diferencia de
tiempo relativamente pequea entre ellos.
Todos los algoritmos seleccionados en base
a la calidad de la solucin obtuvieron el

valor ptimo. Para la seleccin presentada en


la columna 4 se considera tanto el tiempo de
cmputo como la calidad de la solucin.
Para las seis primeras instancias se eligi
entre los algoritmos que obtienen la solucin
ptima aquellos que son considerados los
mejores en tiempo. En el caso de las ltimas
tres instancias los algoritmos que obtienen la
solucin ptima no son precisamente los
mejores en tiempo, pero se considera que es
aceptable esperar esas diferencias en tiempo
a fin de obtener una solucin de mayor
calidad, en este caso el valor ptimo. Por
tanto para estas tres ltimas instancias se
seleccion de los algoritmos que obtienen la
solucin ptima aquellos que tienen menor
tiempo aunque no sean considerados como
los mejores en tiempo.

Tamao de
la instancia
en bytes
116
324
1076
3,924
14,996
58,644
231,956
992,644
3,680,276

Mejores algoritmos en base al


tiempo de cmputo requerido

Mejores algoritmos en
base a la calidad de la
solucin

Mejores algoritmos en
base a tiempo y calidad
de la solucin

T1, T2,..., T8

T1, T2,..., T8

T1, T2, T4, T5, T6, T7, T8


T1, T2, T5, T6, T7, T8

T3, T4, T6, T7, T8


T4, T6, T7, T8
T7, T8

T1, T2, T5, T6, T8

T8

T1, T2,..., T8

T3, T4, T6, T7, T8

T3, T4

Tabla 4. Seleccin de algoritmos de bsqueda tab en base al tiempo de cmputo requerido y la


calidad de la solucin obtenida.

Clase de instancia
Generadas a partir de la instancia D3_2_2
Generadas a partir de la instancia D10_4_8
Generadas a partir de la instancia D10_4_8
Aleatorias
Aleatorias

Rango del tamao en Orden de Dominacin


bytes
116 - 231,956
AR y T8, RS
992,644 - 3,680,276
AR, T8, RS
660 - 133,140
AR, RS, T8
528,404
AR, T8, RS
17,112 61,484
RS, T8, AR
83,032 102,380
T8, RS, AR

Tabla 5. Mapa de desempeo de los algoritmos.

Puede observarse que el algoritmo T8


aparece entre los mejores para todas las
instancias.
Cabe
mencionar
que
es
considerado entre los mejores slo tomando
en cuenta las instancias y los algoritmos
indicados en la Tabla 5, esto no garantiza
que as suceda para todas las clases de
instancias y otros mtodos heursticos. En
este caso el algoritmo T8 es el algoritmo que
se eligi, por que aparece entre los mejores
para todas las instancias consideradas en este
caso.

las tcnicas de Bsqueda Tab (T8) [15]


seleccionada en la seccin anterior,
Aprendizaje Reforzado (AR) [16] y
Recocido Simulado (RS) [14]; aplicadas a la
solucin del problema de la distribucin de
datos modelado por FURD. En la Tabla 6 se
presenta un mapa del desempeo en el que
se resume los resultados obtenidos,
mostrando el orden de dominacin de los
algoritmos, es decir en que orden los
algoritmos fueron ms efectivos sobre cada
conjunto de instancias.

7.2. Comparacin de Bsqueda Tab,


Recocido
Simulado
y
Aprendizaje
Reforzado

Se puede observar que la eleccin de


los algoritmos depende del tipo de instancias
al que son aplicados y del tamao de las
mismas. Por lo que sera de gran inters
establecer un mtodo para determinar que
algoritmo es el ms adecuado para cada

En esta seccin se muestra el


resultado de una comparacin emprica entre

clase de instancias con la finalidad de


obtener mejores soluciones al problema que
se est resolviendo.
8. Conclusiones y trabajos futuros

La calidad de los trabajos obtenidos


es alentadora, es posible refinar las
estrategias propuestas a fin de obtener
mejores tiempos y automatizar la totalidad
de los parmetros de regulacin

9. Referencias

En este documento se muestra la


factibilidad de resolver el modelo FURD
mediante el mtodo heurstico Bsqueda
Tab.
Es factible automatizar los parmetros de
la bsqueda, lo que libera al usuario de
decidir valores fijos que pudieran afectar
de manera positiva o negativa el
desempeo de sta.
La experimentacin mostr el efecto de
los parmetros en el desempeo de la
bsqueda

La eleccin de una estructura de datos


apropiada para la lista tab influye en el
desempeo de la bsqueda.

Los resultados obtenidos mostraron que


el mtodo es prometedor para problemas
de escala pequea y grande.

En base a la experimentacin realizada


se puede concluir que el desempeo de
los algoritmos considerados depende del
tipo de instancias al que son aplicados y
de la magnitud de las mismas. Es decir,
un algoritmo puede ser considerado
como el mejor para un conjunto de
instancias, mientras que para otro
conjunto de instancias este mismo
algoritmo
no
genere
resultados
satisfactorios y otro sea considerado
como el mejor. Por tanto sera de gran
inters investigar que algoritmo es el
ms adecuado para cada clase de
instancias con la finalidad de obtener
mejores soluciones al problema que se
est resolviendo.

Apers P.M.G.,Data Allocations


in
Distributed
Databases
Systems ACM Transactions on
Database Systems, Vol 13, No.
3, pages 263- 304, sep 1988.
Lin Xuemin, Orlowska Mara
and Zhang Yanchun, On Data
Allocation With the Minimum
Overall Communication Costs In
Distributed Database Design
Proc. of ICCI- 93, IEEE Press.
Prez J., Pazos R.,Rodrguez G.,
Fraustro
J.,
Vlez
A.:
Fragmentacin,
ubicacin
y
reubicacin dinmica en bases de
datos distribuidas. En: II Jornadas de
investigacin y docencia en bases de
datos. Madrid (1997) 110-119.
Cruz Reyes Laura, Automatizacin
del diseo de la fragmentacin
vertical y ubicacin en bases de
datos distribuidas usando mtodos
heursticos y exactos. Tesis MCC.,
ITESM(1999).
Glover Fred, Laguna Manuel, Tabu
Search,
Kluwer
Academic
Publishers
(1997).
Prez J., Pazo R.,Rodrguez G.,
Fraustro
J.,
Vlez
A.:
Fragmentacin
vertical
y
reubicacin dinmica en bases de
datos distribuidas. En: Memorias
primer encuentro de computacin
ENC97, Quertaro, Mxico(1997)
54-62.
Morales Luis B., Scheduling a
bridge club by Tabu Search,
Mathematics
Magazine,
IIMAS,
U.N.A.M.(1997)

10

11

12

13

14

15

U.N.A.M.(1997)
Daz
Rivera
Lorenza
Illanes,
Optimizacin de ruta de vehculos
mediante Bsqueda Tab, Tesis de
Maestra
en
Ciencias
I.T.E.S.M.(1992)
Rolland Erick, Tabu Search and
Algorithms Animation: The Case of
the P-Median Problem, School of
Management,
University
of
California, Riverside, Colloguium
1995.
Mori Hiroyuki y Usami Takayuki,
Unit Commitment using Tabu
Search
with
Restricted
Neighbothood, Meiji University,
Kawasaky Japan.(1996).
Laguna Manuel,
Marti Rafael y
Valls
Vicente,
Arc
Crossing
Minimization
in
Hierarchical
Digraphs with Tabu, Graduate
School of Bussines, University of
Colorado.(1996)
Gonzlez Velarde Jos Luis, Laguna
Manuel,A Tabu Search Method for
Coloring Sparse Random Graphs,
Centro de Sistemas Integrados de
Manufactura,
ITESM,
Graduate
School of Business, University of
Colorado.(1999)
Laguna Manuel, Marti Rafael y
Campos Vicente, Intensification and
Diversification with Elite Tabu
Search Solutions for the linear
Ordering Problem, University of
Colorado,
Universidad
de
Valencia.(1998).
Vlez
Chong
Laura
Patricia;
Esquema
de
enfriamiento
adaptativo para el algoritmo de
aceptacin por umbral aplicado al
diseo de bases de datos
distribuidas, Tesis de Maestra;
Instituto Tecnolgico de Len;
2000.
Prez
Reyes
Karla
Yazmn;
Evaluacin del Modelo FURD
usando Tab Search, Reporte

16 Colunga
Rodrguez
lvaro
Abraham, Muoz Hernndez Luz
del Carmen, Ramrez Morales Mara
de Lourdes; Agente inteligente de
aprendizaje reforzado aplicado al
diseo de bases de datos
distribuidas, Tesis de Licenciatura
asesorado por Juan Javier Gonzlez
Barbosa; Instituto Tecnolgico de
Cd. Madero; 2001.

También podría gustarte