Está en la página 1de 3

CAR Caribe

Nader Abu Fakhr, Oscar Bastardo, Jos Caraballo, Jos Cols


Facultad de Ingeniera Informtica
Universidad Catlica Andrs Bello, extensin Guayana
Ciudad Guayana, Venezuela
naderst@gmail.com, osalbr.14@gmail.com, samuelcaraballorivas@gmail.com, josecolsg@gmail.com

Resumen Entre los sistemas de computacin distribuida


existen clusters. Estos ltimos consisten en un conjunto de
computadores fuerte o dbilmente acoplados que trabajan en
armona, de tal forma que muchos aspectos del sistema pueden
ser vistos como pertenecientes a un solo computador, cuando en
realidad puede ser un gran nmero de nodos. CAR Caribe es un

personales y de las estaciones de trabajo. En cierto punto, se


volvi financiera y tcnicamente atractivo construir un
supercomputador, mediante el uso de tecnologa comercial y
accesible, al interconectar una coleccin de computadores
relativamente simples en una red de alta velocidad. En
prcticamente todos los casos, los clusters se utilizan para
programacin paralela en donde un slo programa (de alto
cmputo) se ejecuta en paralelo en mltiples mquinas.

cluster de alto rendimiento con fines acadmicos, construido en la


Universidad Catlica Andrs Bello, extensin Guayana. Est
formado por 12 computadores personales (11 nodos de cmputo
y un nodo maestro) conectados a una red de cmputo
FastEthernet, por lo que su arquitectura es Beowulf. CAR
Caribe utiliza la distribucin Rocks 6.0 Mamba, la cual est
basada en CentOS 6.2, como sistema operativo.

Figura 1. Ejemplo de cluster


Palabras clavecluster; rocks mamba; computacin de alto
rendimiento;

computacin

distribuida,

paradigmas

de

programacin.
Abstract Among distributed computing systems we can find
clusters. A computer cluster consists of a set of strong or loosely
connected computers that work together, so that in many aspects
they can be viewed as a single system. CAR Caribe is a highperformance cluster with academic proposes, built at the
Universidad Catlica Andrs Bello, extensin Guayana. It
consists of 12 PCs (11 compute nodes and a master node)
interconnected with a FastEthernet network, so its architecture is
Beowulf. CAR Caribe uses Rocks 6.0 Mamba distribution, which
is based on CentOS 6.2, operating system.
Keywords cluster, rocks mamba, high performance
computing; distributed computing; programming paradigms.

I. INTRODUCCIN
Los sistemas de computacin distribuidos denominados
clusters son aquellos cuyo hardware subyacente consiste en
una coleccin de estaciones de trabajo o PCs similares,
conectados estrechamente mediante una red de rea local de
alta velocidad. Adicionalmente, cada nodo ejecuta el mismo
sistema operativo.
Los clusters se volvieron populares con la disminucin del
precio y el aumento del rendimiento de los computadores

Un ejemplo conocido de un cluster es el basado en Linux


Beowulf, del cual se muestra la configuracin general en la
Fig. 1. Cada cluster consiste en una coleccin de nodos de
cmputo que son controlados y accedidos mediante un nodo
maestro. Tpicamente, el maestro maneja la asignacin de
nodos a un programa paralelo en particular, mantiene una cola
de trabajos solicitados, y provee una interfaz para los usuarios
del sistema. Como tal, el maestro ejecuta el middleware
necesario para la ejecucin de programas y gestin del cluster,
mientras los nodos de cmputo a menudo no necesitan nada
ms que un sistema operativo estndar. [1]
II. ARQUITECTURA DE CLUSTER
Los clusters son sistemas distribuidos compuestos por un
conjunto de computadoras autnomas, interconectadas,
trabajando juntas en forma cooperativa como un nico recurso
integrado, para esto se cuenta con una capa denominada
middleware.
El middleware es un software que provee servicios ms all
de los que provee el sistema operativo para permitir que varios
componentes del sistema distribuido se comuniquen. Por otra
parte, el middleware brinda una capa de abstraccin o
transparencia que permite ver el sistema distribuido como un
nico sistema.
Clusters que requieren balanceo de carga, por ejemplo
servidores web, utilizan arquitecturas de cluster para ofrecer

soporte a un gran nmero de usuarios, donde cada solicitud es


dirigida a un nodo especfico, logrando de esta manera
paralelismo de tareas sin cooperacin de mltiples nodos, dado
que el objetivo principal del sistema es ofrecer rpido acceso a
informacin compartida. Sin embargo, clusters que requieren
realizar clculos complejos para un nmero pequeo de
usuarios necesitan aprovechar la capacidad del procesamiento
paralelo que ofrece el sistema y la divisin del mismo trabajo
computacional entre varios nodos.
III. ARQUITECTURA BEOWULF

de computadores. Algunos de estos Rolls son: SGE, Condor,


JAVA y Ganglia.
Sin embargo Rocks exige los siguientes requerimientos
mnimos:

Nodos de cmputo: 30 GB de HDD; 1 GB de RAM; al


menos una NIC (Network Interface Card); y que el
orden de arranque (boot) en la BIOS sea CD, PXE
(Arranque por red) y HDD.

Nodo master (frontend): 30 GB de HDD; 1 GB de


RAM; al menos dos NIC, una para la red pblica y la
otra para la red privada de cmputo; el orden de
arranque (boot) en la BIOS, normalmente, es CD,
HDD.

Es un sistema de cmputo paralelo basado en clusters de


ordenadores personales conectados a travs de redes
informticas estndar, sin el uso de equipos desarrollados
especficamente para la computacin paralela.
Fue desarrollado por primera vez en 1994 por Donald
Becker y Thomas Sterling en la NASA, mediante la agrupacin
de 16 procesadores Intel DX4 de 100MHz, los interconectaron
con tecnologa Ethernet a 10Mbps, en equipos viejos con
Linux instalado como sistema operativo.

V. DESCRIPCIN DE CAR CARIBE


CAR Caribe es un Cluster de Alto Rendimiento bajo una
arquitectura Beowulf con propsitos acadmicos. El sistema
operativo instalado en el cluster es CentOS 6.2 de la
distribucin Rocks Mamba 6.0 de 32 bits.

Beowulf es un concepto, por lo que no hay componentes


exclusivos. Un cluster Beowulf es por lo general un grupo de
computadores que utiliza software de cdigo abierto.

Actualmente CAR Caribe cuenta con 11 nodos de cmputo


y su respectivo frontend, todos interconectados en una red
Ethernet. Las caractersticas de hardware de cada uno de estos
nodos son las siguientes:

Sus principales usos son: Simulaciones, biotecnologa,


mercado de valores, entre otros.

Procesador Intel Pentium D 925 de dos ncleos con un


reloj de 3.0 GHz.

IV. ROCKS CLUSTER


Rocks es una distribucin de cdigo abierto para clusters
basados en Linux que permite a usuarios finales construir
clusters de alto rendimiento fcilmente.

1 GB de RAM, excepto el frontend que cuenta con 1.5


GB.

Disco duro de 80 GB a 5200 RPM.

Fue iniciada por la NPACI y la SDSC en el 2000, y fue


financiada inicialmente en parte por una subvencin de la NSF
(2000-2007) pero actualmente est financiada por la siguiente
subvencin de la NSF.

Una interfaz de red FastEthernet. Por otra parte, el


frontend tiene dos interfaces de red, una interfaz para
la red de cmputo y otra interfaz para la red pblica.

Rocks se bas inicialmente en la distribucin Red Hat


Linux. Sin embargo las versiones ms modernas de Rocks
estn basadas en CentOS, con un instalador modificado
llamado Anaconda. Este simplifica la instalacin de todos los
nodos de cmputo. Rocks incluye muchas herramientas (tales
como MPI) que no forman parte de CentOS, pero son los
componentes integrales que hacen un grupo de ordenadores en
un cluster de alto rendimiento.

Para la interconexin de los nodos se realiza a travs de un


Switch Linksys de 16 puertos FastEthernet.
La topologa de la red de CAR Caribe se muestra en la
siguiente figura:

La ventaja de utilizar Rocks para construir y mantener


clusters es que permite construirlos de manera sencilla, pero
gestionar su software puede ser complicado. Tal complejidad
aumenta durante los procesos de instalacin y expansin del
cluster. Rocks provee mecanismos para controlar la
complejidad de dichos procesos.
Por otra parte, las instalaciones de Rocks pueden ser
personalizadas con paquetes de software adicionales llamados
Rolls. Los "Rolls" extienden el sistema integrando
automticamente
los
mecanismos
de
gestin
y
empaquetamiento usado por el software base, simplificando
ampliamente la instalacin y configuracin de un gran nmero

Figura 2. Topologa CAR Caribe


En la Figura 2 se puede observar que el frontend est
conectado a dos redes, la red de cmputo 192.168.0.0/24 y la
red pblica 192.168.110.0/24.

El frontend tiene como requisito que solo se le puede


asignar IP esttica. Sin embargo, no se cuenta con una IP
pblica esttica por parte del ISP. En consecuencia, se utiliza
una IP esttica local y el servidor Wiki UCAB G que se
observa en la Figura 2 para utilizar el mecanismo NAT, lo cual
permite acceder desde Internet al frontend de CAR Caribe a
travs de los servicios SSH para administracin y HTTP para
monitoreo.
VI. INSTALACIN DE CAR CARIBE
Se realiz la instalacin y configuracin de Rocks Mamba
6.0 en el nodo master (Frontend). Previo a esto, se
configuraron los roles o paquetes que se instalaron con la
distribucin de Rocks; adems se configuraron dos interfaces
de red en el frontend, una pblica para administracin del
cluster desde la red y otra privada para los nodos de cmputo.
En este sentido, una vez instalado y configurado el frontend
se procedi a instalar los nodos de cmputo haciendo uso del
comando insert-ethers. Este comando pone a la escucha de
solicitudes DHCP al frontend. Seguido de esto, se encendieron
los nodos de cmputo, que hacen una solicitud DHCP al
frontend para descargar la imagen del S.O. ubicada en el
frontend va red e iniciar su instalacin.
Por ltimo, se configuraron los nodos de cmputo para
evitar la reinstalacin de Rocks en caso de que se apaguen

inesperadamente y se cre un comando para encender y apagar


todos los nodos de cmputo.
VII. ADMINISTRACIN DE CAR CARIBE
El frontend cuenta con acceso a travs de SSH en la red de
la interfaz pblica a la cual se puede acceder remotamente a
travs de Internet. Por otra parte, se tienen comandos como
nodes start que permite iniciar todos los nodos de cmputo y
nodes shutdown que apaga dichos nodos.
Por otra parte, se tiene un servicio web de Rocks que,
haciendo uso del servicio ganglia, permite monitorear la
utilizacin de recursos del cluster, por ejemplo: carga de CPU,
uso de memoria, estado de los nodos cmputo, entre otros.
Adems, Rocks tiene un conjunto de comandos que facilitan la
configuracin y gestin del cluster.
REFERENCIAS
[1] A. S. Tanembaun, M.V.Steen. Distributed Systems:
Principles and
Paradigms. 3ra ed. Pearson Prentice Hall. pp
17-18. 2007.

También podría gustarte