Está en la página 1de 6

Comparativa de tres cruzas y cuatro mutaciones para el problema

de asignacin de tareas en sistemas de cmputo heterogneo


Jos Carlos Soto Monterrubio1, Hctor Joaqun Fraire Huacuja1, Aurelio Alejandro
Santiago Pineda1
1

Instituto Tecnolgico de Ciudad Madero

soto190@gmail.com, automatas2002@yahoo.com.mx, alx.santiago@gmail.com


Resumen
Este trabajo se enfoca en el problema de asignacin de tareas independientes en
sistemas de cmputo heterogneo. La principal contribucin es un estudio comparativo de
diversas cruzas y mutaciones para el problema de consumo de energa para tareas sin
precedencias en clsteres heterogneos. Dentro de este comparativo se propone una mutacin
que aprovecha caractersticas del problema, la cual se denomina balanceo de carga. Para el
control de la energa se usa la tcnica de escalamiento dinmico de voltaje y frecuencia
(DVFS, por sus siglas en ingls). La comparacin se desarroll utilizando el algoritmo
multiobjetivo NSGA-II.
Palabras clave: asignacin de tareas, comparacin de operadores genticos, multiobjetivo.
1. Introduccin
Los sistemas de cmputo de alto rendimiento (HCP, High Performance Computing)
requieren altas cantidades de energa [1], estos sistemas se encuentran en una gran variedad
de escenarios tales como en la NASA o WallStreet [2]. HPC tambin se conocen como sper
computadoras y estn compuestas por un conjunto de mquinas interconectadas en una
plataforma de red. La National Unversity of Defense Technology (NUDT) en China tiene el
sistema HPC ms grande con 3,120,000 ncleos con un desempeo de 33.9 Pflops y un
consumo de energa de 17.89 MW [3]. Ms ncleos proveen ms poder de cmputo pero esto
implica un mayor consumo de energa. Un mayor uso de energa para ejecutar aplicaciones
aumenta el gasto econmico y los problemas de calentamiento.
El HCSP (Heterogenous Computing Scheduling Problem) con DVFS (Dynamic
Voltaje and Frequency Scaling) est formado por un HPC heterogneo y un conjunto de
tareas que deben de ser asignadas a una mquina del HPC. El makespan es la diferencia que
existe entre el tiempo de inicio de la primera tarea y el tiempo en que finaliza la ltima tarea
del conjunto. Este problema trata de encontrar la mejor asignacin de tareas en mquinas que
produzca el menor makespan, y adems de generar el menor consumo de energa.

2. Definiciones y conceptos
Esta seccin presenta los conceptos bsicos usados en optimizacin multi-objetivo basado en
optimalidad de Pareto. Estas definiciones son tomadas de [4].
Definicin 1. Problema de optimizacin mulit-objetivo (MOP).
Dado un vector funcin = [& , ( , , * ()] y su espacio de soluciones posibles
, el MOP consiste en encontrar un vector que optimice un vector funcin (). Sin
prdida de generalidad se asumen nicamente funciones de minimizacin.
Definicin 2. Dominancia de Pareto.
Un vector domina (se denota como ) si 2 2 ( 4 ) para toda funcin en
hay al menos una tal que 2 < 2 ().
Definicin 3. ptimo de Pareto.
Un vector es ptimo de Pareto si no existe 4 tal que 4 .
Definicin 4. Conjunto de ptimo de Pareto.
Dado un MOP, el conjunto de ptimo de Pareto es definido como { }.
Definicin 5. Frente de Pareto.
Dado un MOP y su conjunto de ptimo de Pareto , el frente de Pareto se define como
= .
3. Descripcin del problema
El problema tratado ocurre en los clsteres HPC, donde las mquinas son usadas para ejecutar
una gran carga de tareas. Se asumen las siguientes condiciones: las mquinas son capaces de
usar DVFS, las mquinas son heterogneas, nicamente se reciben tareas sin precedencias,
el desempeo de una mquina no es afectada por las dems mquinas. Cada mquina tiene
diferentes niveles de configuracin para las velocidades de procesamiento.
Dado un conjunto de tareas = {& , ( , , B }, un conjunto de mquinas heterogneas =
{& , ( , , * }, los tiempos de ejecucin de cada tarea en cada mquina =
{&,& , &,( , , B,* }. El mnimo makespan producido por la asignacin de mquina/tarea que
minimice:
*
HI&
(

2,H 2 H )

(1)

Debido a que las mquinas incluyen tecnologa DVFS y son heterogneas, existen diferentes
niveles de voltaje para cada mquina H tiene asociada una velocidad relativa. Cuando el

voltaje ms alto es seleccionado la velocidad es igual a 1 (ejecucin normal en ), cuando se


selecciona un voltaje ms bajo la velocidad relativa es disminuida. El tiempo de ejecucin
4
relativo 2,H
es calculado con la siguiente ecuacin.
4
2,H
=

2,H

(2)

Dado un conjunto de tareas , y un conjunto de mquinas heterogneas y sus respectivos


niveles de voltaje H = 2,& , 2,( , , 2,S H de diferentes tamaos . La energa
mnima es producida por la asignacin de mquinas/voltaje/tarea que minimice:
*
( 4
H,T
2,H

(3)
2 H

HI&

Donde es el ndice del voltaje seleccionado en H , la tecnologa DVFS se utiliza en el


consumo de energa, la funcin objetivo de energa para el makespan es modificada de la
siguiente manera:
*
HI&
(

(4)

4
2,H
2 H )

El MOP estudiado consiste en encontrar las asignaciones de mquina/voltaje/tarea que


minimice (4) y (3).
4. Operadores genticos
En los algoritmos genticos el vector de variables de decisin se denomina cromosoma.
Actualmente el cromosoma es representado por una estructura de datos particular. La
representacin del cromosoma para este trabajo es el de la Fig. 1 el cual asigna una mquina
y una configuracin de voltaje para cada tarea .


Figura 1. Representacin del cromosoma.

El algoritmo gentico consiste de tres operadores genticos la seleccin, cruza y mutacin.


La seleccin es un mecanismo probabilstico que favorece a los individuos ms aptos para
tener descendencia. La cruza es un intercambio de secciones del cromosoma entre dos
individuos para formar uno nuevo. La mutacin es un cambio aleatorio en el cromosoma del
individuo.
Uno de los mejores algoritmos multiobjetivo es el NSGAII [5] el cual consta de dos
mecanismos importantes: fast nondominanted sort el cual se encarga de ordenar el conjunto

de soluciones en diversos conjuntos de soluciones no dominadas . Crowding distance


assignment permite asignar un valor de calidad a una solucin.
Para la seleccin se utilizaron las soluciones que se encuentran en el frente cero si no se llena
el nmero deseado de padres se toman de los siguientes frentes. Las cruzas implementadas
son las siguientes. Cruza uniforme (C1): cada gen del padre tiene el 50% de pasar al hijo Fig.
3 (a). Cruza en punto medio (C2): el cromosoma se divide en dos segmentos y cada uno pasa
a un hijo diferente Fig. 3 (b). Cruza en dos puntos (C3): el cromosoma se divide en tres
segmentos y cada segmento pasa a un hijo diferente Fig. 3 (c). Cruza multipunto (C4): se
selecciona un nmero aleatoriamente el cual indica en cuanto segmentos se dividir el
cromosoma Fig. 3 (d).


Figura 2. Representacin de las cruzas.

Se implement una mutacin en la que se modifica el 10% del cromosoma (M1). Una
mutacin en la que cada gen tiene el 5% de cambiar (M2). Se propone una mutacin (M3)
que est basada en la idea del balanceo de cargas la cual consiste en distribuir el peso de las
mquinas. Esta mutacin selecciona aleatoriamente una tarea que se encuentra en una
mquina que genera makespan y la cambia a otra mquina aleatoriamente Fig. 4.


Figura 3. Mutacin de balanceo de carga.

5. Experimentacin
Para la experimentacin se utiliz un conjunto de cuarenta instancias proporcionadas por el
Dr. Pecero Snchez de la universidad de Luxemburgo. El experimento consisti en 50
pruebas independientes por cada combinacin de cruza y mutacin. Para medir la calidad de
los resultados se utilizaron los indicadores de calidad (IQ) de Hypervolume (HV),
Generational Distance (GD) y Generalized Spread (GS), para medir volumen, distribucin
del frente y diversidad respectivamente.
6. Resultados
En la Tabla 1 la primera, tercera y quinta columna muestran la combinacin de
cruza/mutacin. La segunda, cuarta y sexta columna muestran los IQ de HV, GD y GS,
respectivamente.
Tabla 1. Resultados de la experimentacin.

Cruza-Mutacin
C1M3
C1M2
C1M1
C4M1
C4M3
C4M2
C2M1
C2M3
C2M2
C3M1
C3M3
C3M2

HV
0.776390
0.775394
0.774734
0.769459
0.768544
0.767315
0.528142
0.520752
0.516562
0.510700
0.506926
0.506756

Cruza-Mutacin
C1M3
C1M1
C1M2
C4M1
C4M3
C4M2
C2M1
C2M2
C3M1
C2M3
C3M3
C3M2

GD
0.004160
0.004252
0.004577
0.005542
0.005808
0.005811
0.075285
0.075713
0.076519
0.077973
0.078446
0.078886

Cruza-Mutacin
C4M1
C4M2
C4M3
C2M1
C3M1
C2M2
C3M2
C2M3
C1M2
C1M3
C1M1
C3M3

GS
0.745476
0.745545
0.747649
0.758623
0.759231
0.759893
0.773652
0.777252
0.783733
0.793533
0.794606
0.794631

7. Conclusiones
De la Tabla 1 podemos observar que la mejor combinacin para HV y GD es la combinacin
de C1 con M3, adems de que C1 obtiene los mejores resultados para cualquiera de las tres
mutaciones. En cambio para obtener mejor diversidad es mejor utilizar la C4 con la M1. De
los resultados obtenidos podemos observar que el aprovechar caractersticas propias del
problema obtenemos mejores resultados. Parte de las contribuciones es la mutacin propuesta
en este trabajo denominada balanceo de carga la cual consiste en identificar que elemento del
cromosoma est aportando mayor peso y tratar de cambiar dicho elemento identificado a otro
valor.

Referencias

[1] W.-c. Feng, The importance of being low power in high performance computing, de
CTWatch Quarterly, vol. 1, 2005, pp. 11-20.
[2] T. J. W., I. R. Center y D. Feitelson, A Survey of Scheduling in Multiprogrammed Parallel
Systems, IBM T. J. Watson Research Center, 1994.
[3] TOP500.org, The 43rd top500 list, ISC14, Leipzig, Germany, 2014.
[4] A. S. Pineda, H. J. F. Huacuja, B. Dorronsoro, J. E. Pecero, C. G. Santillan, J. J. G. Barbosa y J. C.
S. Monterrubio, A survey of decomposition methods for multi-objective optimization, de
Recent Advances on Hybrid Approaches for Designing Intelligent Systems, vol. 547, O. Castillo,
P. Melin, W. Pedrycz y J. Kacprzyk, Edits., Tijuana, Springer International Publish, 2014.
[5] D. K., A. S., P. A. y M. T., A fast elitist nondominated sorting genetic algorithm for multiobjective optimization: Nsga-ii., In Proceedings of the 6th International Conference on
Parallel Problem Solving from Nature, vol. 1917, 2000.
[6] D. K., A. S., P. A. y M. T., A fast elitist non-dominated sorting algorithm for multi-objective
optimization: Nsga-ii, Proceedings of the 6th International Conference on Parallel Problem
Solving from Nature, vol. 1917, n Lecture Notes in Computer Science, 2000.

También podría gustarte