Está en la página 1de 12

Cluster (informtica)

El trmino cluster se aplica a los conjuntos o conglomerados de computadoras construidos


mediante la utilizacin de componentes de hardware comunes y que se comportan como si fuesen
una nica computadora. La tecnologa de clusters ha evolucionado en apoyo de actividades que
van desde aplicaciones de supercmputo y software de misiones crticas, servidores Web y
comercio electrnico, hasta bases de datos de alto rendimiento, entre otros usos.
El cmputo con clusters surge como resultado de la convergencia de varias tendencias actuales
que incluyen la disponibilidad de microprocesadores econmicos de alto rendimiento y redes de
alta velocidad, el desarrollo de herramientas de software para cmputo distribuido de alto
rendimiento, as como la creciente necesidad de potencia computacional para aplicaciones que la
requieran.
Los clusters son usualmente empleados para mejorar el rendimiento y/o la disponibilidad por
encima de la que es provista por un solo computador tpicamente siendo ms econmico que
computadores individuales de rapidez y disponibilidad comparables.
De un cluster se espera que presente combinaciones de los siguientes servicios:
1. Alto rendimiento
2. Alta disponibilidad
3. Equilibrio de carga
4. Escalabilidad
La construccin de los ordenadores del cluster es ms fcil y econmica debido a su flexibilidad:
cluster homogneo: pueden tener todos la misma configuracin de hardware y sistema operativo.

cluster semi-homogneo: diferente rendimiento pero con arquitecturas y sistemas operativos


similares.
cluster heterogneo: o tener diferente hardware y sistema operativo, lo que hace ms fcil y
econmica su construccin.
Para que un cluster funcione como tal, no basta solo con conectar entre s los ordenadores, sino
que es necesario proveer un sistema de manejo del cluster, el cual se encargue de interactuar con
el usuario y los procesos que corren en l para optimizar el funcionamiento.
Historia
El origen del trmino y del uso de este tipo de tecnologa es desconocido pero se puede
considerar que comenz a finales de los aos 50 y principios de los aos 60.
La base formal de la ingeniera informtica de la categora como un medio de hacer trabajos
paralelos de cualquier tipo fue posiblemente inventado por Gene Amdahl de IBM, que en 1967
public lo que ha llegado a ser considerado como el papel inicial de procesamiento paralelo: la Ley
de Amdahl que describe matemticamente el aceleramiento que se puede esperar paralelizando
cualquier otra serie de tareas realizadas en una arquitectura paralela.
Este artculo define la base para la ingeniera de la computacin tanto multiprocesador y
computacin clster, en donde el principal papel diferenciador es si las comunicaciones
interprocesador cuentan con el apoyo "dentro" de la computadora (por ejemplo, en una
configuracin personalizada para el bus o la red de las comunicaciones internas) o "fuera" del
ordenador en una red "commodity".
En consecuencia, la historia de los primeros grupos de computadoras es ms o menos
directamente ligado a la historia de principios de las redes.
Utilizando el concepto de una red de conmutacin de paquetes, el proyecto ARPANET logr crear
en 1969 lo que fue posiblemente la primera red de computadoras bsico basadas en el cluster de
computadoras por cuatro tipos de centros informticos (cada una de las cuales fue algo similar a
un "cluster" pero no un "comodity cluster" como hoy en da lo entendemos).
El proyecto ARPANET creci y se convirti en lo que es ahora Internet - que se puede considerar
como "la madre de todos los clusters".
El primer producto comercial de tipo cluster fue ARCnet, desarrollada en 1977 por Datapoint pero
no obtuvo un xito comercial y los clusteres no consiguieron tener xito hasta que en 1984
VAXcluster produjeran el sistema operativo VAX/VMS.

Otros dos principios comerciales de clusteres notables fueron el Tandem Himalaya (alrededor
1994 de con productos de alta disponibilidad) y el IBM S/390 Parallel Sysplex (tambin alrededor
de 1994, principalmente para el uso de la empresa).
La historia de los clusters de computadoras estara incompleta sin sealar el papel fundamental
desempeado por el desarrollo del software de Parallel Virtual Machine (PVM). Software de fuente
abierta basado en comunicaciones TCP/IP permiti la creacin de un superordenador virtual - un
cluster HPC - realizada desde cualquiera de los sistemas conectados TCP/IP.
De forma libre los clusters heterogneos han constituido la cima de este modelo logrando
aumentar rpidamente en FLOPS globalmente y superando con creces la disponibilidad incluso de
los ms caros superordenadores.
PVM y el empleo de PC y redes de bajo costo llev, en 1993, a un proyecto de la NASA para
construir supercomputadoras de clusters.
Beneficios de la Tecnologa Cluster
Las aplicaciones paralelas escalables requieren: buen rendimiento, baja latencia, comunicaciones
que dispongan de gran ancho de banda, redes escalables y acceso rpido a archivos. Un cluster
puede satisfacer estos requerimientos usando los recursos que tiene asociados a l.
La tecnologa cluster permite a las organizaciones incrementar su capacidad de procesamiento
usando tecnologa estndar, tanto en componentes de hardware como de software que pueden
adquirirse a un costo relativamente bajo.
Clasificacin de los Clusters
El trmino cluster tiene diferentes connotaciones para diferentes grupos de personas. Los clusters
pueden clasificarse con base en sus caractersticas. Se pueden tener clusters de alto rendimiento
(HPC High Performance Clusters), clusters de alta disponibilidad (HA High Availability) o
clusters de alta eficiencia (HT High Throughput).
Alto rendimiento: Son clusters en los cuales se ejecutan tareas que requieren de gran capacidad
computacional, grandes cantidades de memoria, o ambos a la vez. El llevar a cabo estas tareas
puede comprometer los recursos del cluster por largos periodos de tiempo.
Alta disponibilidad: Son clusters cuyo objetivo de diseo es el de proveer disponibilidad y
confiabilidad. Estos clusters tratan de brindar la mxima disponibilidad de los servicios que
ofrecen. La confiabilidad se provee mediante software que detecta fallos y permite recuperarse
frente a los mismos, mientras que en hardware se evita tener un nico punto de fallos.

Alta eficiencia: Son clusters cuyo objetivo de diseo es el ejecutar la mayor cantidad de tareas en
el menor tiempo posible. Existe independencia de datos entre las tareas individuales. El retardo
entre los nodos del cluster no es considerado un gran problema.
Los clusters pueden tambin clasificar como Clusters de IT Comerciales (Alta disponibilidad, Alta
eficiencia) y Clusters Cientficos (Alto rendimiento).
Componentes de un Cluster
En general, un cluster necesita de varios componentes de software y hardware para poder
funcionar:
Nodos
Sistemas Operativos
Conexiones de Red
Middleware
Protocolos de Comunicacin y servicios
Aplicaciones
Ambientes de Programacin Paralela
Nodo
Se refiere a un unidad lgica o funcional de MySQL Cluster, y a veces se denomina como nodo de
cluster. Hay tres tipos de nodo requeridos para implementar un MySQL Cluster. Son:
Nodos de administracin (MGM)
Nodos SQL (MySQL server)
Nodos de datos
Sistemas Operativos
Debe ser de fcil uso y acceso y permitir adems mltiples procesos y usuarios.
Conexiones de Red

Los nodos de un cluster pueden conectarse mediante una simple red Ethernet, o puede utilizar
tecnologas especiales de alta velocidad como Fast Ethernet, Gigabit Ethernet, Myrinet, Infiniband,
SCI.
Middleware
El middleware es un software que generalmente acta entre el sistema operativo y las
aplicaciones con la finalidad de proveer:
Un interfaz nico de acceso al sistema, denominado SSI (Single System Image), el cual genera
la sensacin al usuario de que utiliza un nico computador muy potente;
Herramientas para la optimizacin y mantenimiento del sistema: migracin de procesos,
checkpoint-restart (detener uno o varios procesos, migrarlos a otro nodo y continuar su
funcionamiento), balanceo de carga, tolerancia a fallos, etc.;
Escalabilidad: debe poder detectar automticamente nuevos nodos conectados al cluster para
proceder a su utilizacin.
Existen diversos tipos de middleware, como por ejemplo: MOSIX, Condor, Open MOSIX,
OpenSSI, entre otros.
Ambientes de Programacin Paralela
Los ambientes de programacin paralela permiten implementar algoritmos que hagan uso de
recursos compartidos: CPU (Central Processing Unit), memoria, datos y servicios.
Sistemas Clusters Implementados
Beowulf
Fue construido por Donald Becker y Thomas Sterling en 1994. Fue construido con 16
computadores personales con procesadores Intel DX4 de 200 MHz, que estaban conectados a
travs de un switch Ethernet. El rendimiento terico era de 3.2 GFlops.
Berkeley NOW
El sistema NOW de Berkeley estuvo conformado por 105 estaciones de trabajo Sun Ultra 170,
conectadas a travs de una red Myrinet. Cada estacin de trabajo contena un microprocesador
Ultra1 de 167 MHz, cach de nivel 2 de 512 KB, 128 MB de memoria, dos discos de 2.3 GB,
tarjetas de red Ethernet y Myrinet. En abril de 1997, NOW logr un rendimiento de 10 GFlops.
Google

Durante el ao 2003, el cluster Google lleg a estar conformado por ms de 15.000 computadores
personales. En promedio, una consulta en Google lee cientos de megabytes y consume algunos
billones de ciclos del CPU.
Cluster PS2
En el ao 2004, en la Universidad de Illinois en Urbana-Champaign, Estados Unidos, se explor el
uso de consolas Play Station 2 (PS2) en cmputo cientfico y visualizacin de alta resolucin. Se
construy un cluster conformado por 70 PS2; utilizando Sony Linux Kit (basado en Linux Kondora
y Linux Red Hat) y MPI.
Cluster X
En la lista TOP 500 de noviembre de 2004 fue considerado el sptimo sistema ms rpido del
mundo; sin embargo, para julio de 2005 ocupa la posicin catorce. Cluster X fue construido en el
Tecnolgico de Virginia en el 2003; su instalacin fue realizada por estudiantes del Tecnolgico.
Est constituido por 2200 procesadores Apple G5 de 2.3 GHz. Utiliza dos redes: Infiniband 4x para
las comunicaciones entre procesos y Gigabit Ethernet para la administracin. Cluster X posee 4
Terabytes de memoria RAM y 176 Terabytes de disco duro, su rendimiento es de 12.25 TFlops. Se
lo conoce tambin como Terascale.
Red Espaola de Supercomputacin
En el ao 2007 se crea la Red Espaola de Supercomputacin compuesta por 7 clusters
distribuidos en distintas instituciones espaolas, entre los que se encuentra el supercomputador
Marenostrum (el cluster ms veloz en el momento de su puesta en funcionamiento).
Todos los clusters estn formados por un nmero variable de nodos con procesadores PowerPC
970 a 2.2GHz interconectados con una red Myrinet. El rendimiento de las mquinas oscilan entre
los casi 65 TeraFLOPS proporcionados por las ms de 10000 CPUs de Marenostrum, los casi 16
TeraFLOPS de Magerit con 2400 procesadores o los casi 3 TeraFLOPS de los 5 nodos restantes.

Servidor
En informtica, un servidor es un tipo de software que realiza ciertas tareas en nombre de los usuarios. El
trmino servidor ahora tambin se utiliza para referirse al ordenador fsico en el cual funciona ese
software, una mquina cuyo propsito es proveer datos de modo que otras mquinas puedan utilizar esos
datos.
Este uso dual puede llevar a confusin. Por ejemplo, en el caso de un servidor web, este trmino podra
referirse a la mquina que almacena y maneja los sitios web, y en este sentido es utilizada por las
compaas que ofrecen hosting o hospedaje. Alternativamente, el servidor web podra referirse al software,
como el servidor de http de Apache, que funciona en la mquina y maneja la entrega de los componentes
de los pginas web como respuesta a peticiones de los navegadores de los clientes.
Los archivos para cada sitio de Internet se almacenan y se ejecutan en el servidor. Hay muchos servidores
en Internet y muchos tipos de servidores, pero comparten la funcin comn de proporcionar el acceso a
los archivos y servicios.
Un servidor sirve informacin a los ordenadores que se conecten a l. Cuando los usuarios se conectan a
un servidor pueden acceder a programas, archivos y otra informacin del servidor.
En la web, un servidor web es un ordenador que usa el protocolo http para enviar pginas web al
ordenador de un usuario cuando el usuario las solicita.
Los servidores web, servidores de correo y servidores de bases de datos son a lo que tiene acceso la
mayora de la gente al usar Internet.
Algunos servidores manejan solamente correo o solamente archivos, mientras que otros hacen ms de un
trabajo, ya que un mismo ordenador puede tener diferentes programas de servidor funcionando al mismo
tiempo.
Los servidores se conectan a la red mediante una interfaz que puede ser una red verdadera o mediante
conexin va lnea telefnica o digital.
Tipos de Servidores.
Servidores de Aplicaciones (Application Servers): Designados a veces como un tipo de middleware
(software que conecta dos aplicaciones), los servidores de aplicaciones ocupan una gran parte del
territorio entre los servidores de bases de datos y el usuario, y a menudo los conectan.
Servidores de Audio/Video (Audio/Video Servers): Los servidores de Audio/Video aaden capacidades
multimedia a los sitios web permitindoles mostrar contenido multimedia en forma de flujo continuo
(streaming) desde el servidor.

Servidores de Chat (Chat Servers): Los servidores de chat permiten intercambiar informacin a una gran
cantidad de usuarios ofreciendo la posibilidad de llevar a cabo discusiones en tiempo real.
Servidores de Fax (Fax Servers): Un servidor de fax es una solucin ideal para organizaciones que
tratan de reducir el uso del telfono pero necesitan enviar documentos por fax.
Servidores FTP (FTP Servers): Uno de los servicios ms antiguos de Internet, File Transfer Protocol
permite mover uno o ms archivos...Leer ms
Servidores Groupware (Groupware Servers): Un servidor groupware es un software diseado para
permitir colaborar a los usuarios, sin importar la localizacin, va Internet o va Intranet corporativo y
trabajar juntos en una atmsfera virtual.
Servidores IRC (IRC Servers): Otra opcin para usuarios que buscan la discusin en tiempo real, Internet
Relay Chat consiste en varias redes de servidores separadas que permiten que los usuarios conecten el
uno al otro va una red IRC.
Servidores de Listas (List Servers): Los servidores de listas ofrecen una manera mejor de manejar listas
de correo electrnico, bien sean discusiones interactivas abiertas al pblico o listas unidireccionales de
anuncios, boletines de noticias o publicidad.
Servidores de Correo (Mail Servers): Casi tan ubicuos y cruciales como los servidores web, los
servidores de correo mueven y almacenan el correo electrnico a travs de las redes corporativas (va
LANs y WANs) y a travs de Internet.
Servidores de Noticias (News Servers): Los servidores de noticias actan como fuente de distribucin y
entrega para los millares de grupos de noticias pblicos actualmente accesibles a travs de la red de
noticias USENET.
Servidores Proxy (Proxy Servers): Los servidores proxy se sitan entre un programa del cliente
(tpicamente un navegador) y un servidor externo (tpicamente otro servidor web) para filtrar peticiones,
mejorar el funcionamiento y compartir conexiones.
Servidores Telnet (Telnet Servers): Un servidor telnet permite a los usuarios entrar en un ordenador
husped y realizar tareas como si estuviera trabajando directamente en ese ordenador.
Servidores Web (Web Servers): Bsicamente, un servidor web sirve contenido esttico a un navegador,
carga un archivo y lo sirve a travs de la red al navegador de un usuario. Este intercambio es mediado por
el navegador y el servidor que hablan el uno con el otro mediante HTTP.

Nombre del Servidor

Sistema operativo

4D WebSTAR

AOLserver

Unix
Windows 2000
Windows 95/98
Windows ME
Windows NT 4.0
Windows Server 2003
Windows XP

Apache

NetWare
OS/2
Unix
Windows 95/98
Windows NT 4.0

BadBlue

Windows 2000
Windows 95/98
Windows ME
Windows NT 4.0
Windows XP

Baikonur Web App Server

Windows 95/98
Windows NT 4.0

Covalent Enterprise Ready Server

AIX
HP-UX
Linux
Red Hat Linux
SUSE Linux
Solaris
Windows 2000
Windows Server 2003

ESAWEB

VM/CMS

Enterprise WebServer for NetWare

NetWare

GoAhead WebServer

Linux
NetWare
Solaris
Windows 2000
Windows 95/98

Hawkeye

Linux

iTools

MacOS X Server

Java Server

HP-UX

IRIX
Linux
OS/2
Solaris
Windows 95/98
Windows NT 4.0
Jigsaw

Java_VM
Solaris
Windows 95/98
Windows NT 4.0

Microsoft Internet Information Services

Windows Server 2003

RapidSite

BSD
IRIX
Windows 2000
Windows Server 2003

RomPager Embedded Web Server

Embedded

Roxen WebServer

Linux
MacOS X Server
Solaris
Windows 2000
Windows Server 2003
Windows XP

Sambar Server

Red Hat Linux


Windows 2000
Windows 95/98
Windows ME
Windows NT 4.0
Windows Server 2003
Windows XP

Savant

Windows 2000
Windows 95/98
Windows ME
Windows NT 4.0

Servertec Internet Server

AIX
HP-UX
Linux
Solaris
Windows 2000
Windows 95/98
Windows ME
Windows NT 4.0

Windows Server 2003


Windows XP
Shadow Web Server

MVS

SimpleServer:WWW

Windows 2000
Windows 95/98
Windows ME
Windows NT 4.0
Windows XP

Sun Java System Web Server

Red Hat Linux


Solaris
Windows 2000
Windows XP

Tcl Web Server

Linux
MacOS
Unix
Windows NT 4.0

URL Live!

Windows 2000
Windows 95/98
Windows ME
Windows NT 4.0
Windows XP

Viking

Windows 2000
Windows 95/98
Windows NT 4.0
Windows XP

vqServer

AIX
BSD
Be OS
Digital UNIX
HP-UX
IRIX
Java_VM
Linux
MacOS
OS/2
SCO OpenServer
Solaris
Windows 95/98
Windows NT 4.0

WN

AIX

BSD
Digital UNIX
HP-UX
IRIX
Linux
SCO OpenServer
Solaris
WebBase

Windows 2000
Windows 95/98
Windows NT 4.0

Xitami

AIX
BSD
Be OS
Digital UNIX
HP-UX
Linux
OS/2
SCO OpenServer
Solaris
VMS
Windows 2000
Windows 95/98
Windows ME
Windows NT 4.0
Windows Server 2003
Windows XP

Zeus Web Server

AIX
BSD
HP-UX
IRIX
Linux
MacOS X Server
SCO OpenServer
Solaris
Tru64 Unix

También podría gustarte