Está en la página 1de 10

GRID COMPUTING

La computacin grid (o en malla) es una tecnologa que permite utilizar de forma coordinada
recursos heterogneos (entre ellos cmputo, almacenamiento y aplicacionesespecficas) que
no estn sujetos a un control centralizado. En este sentido es una forma de computacin
distribuida, en la cual los nodos participantes recursos pueden ser de iguales o distintas
arquitecturas y cubrir toda la gama de potencia de cmputo, desde embebidos y hasta
supercomputadores.
Tpicamente, los sistemas que forman parte de una malla estn interconectados
mediante redes de rea extensa (por ejemplo Internet). Desarrollado en mbitos cientficos a
principios de los aos 1990, su entrada al mercado comercial sigui la idea de la
llamada Utility computing.
El trmino grid se refiere a una infraestructura que permite la integracin y el uso colectivo
de ordenadores de alto rendimiento, redes y bases de datos que son propiedad y estn
administrados por diferentes instituciones. Puesto que la colaboracin entre instituciones
envuelve un intercambio de datos, o de tiempo de computacin, el propsito del grid es
facilitar la integracin de recursos computacionales. Universidades, laboratorios de
investigacin o empresas se asocian para formar grids para lo cual utilizan algn tipo
de software que implemente este concepto.
En la computacin grid, las redes pueden ser vistas como una forma de computacin
distribuida donde un supercomputador virtual est compuesto por una serie de
computadores agrupados para realizar grandes tareas.

Un grid es un sistema de computacin distribuido que permite cooordinar computadoras de


diferente hardware y software y cuyo fin es procesar una tarea que demanda una gran cantidad
de recursos y poder de procesamiento.

Grid Computing

Facilita la posibilidad de compartir, acceder y gestionar informacin, mediante la colaboracin


de varios nodos (computadoras que forman el grid).

Qu es?
Llamamos grid al sistema de computacin distribuido que permite compartir recursos no
centrados geogrficamente para resolver problemas de gran escala. Los recursos compartidos
pueden ser ordenadores (PC, estaciones de trabajo,
supercomputadoras, PDA, porttiles, mviles, etc), software, datos e informacin,
instrumentos especiales (radio, telescopios, etc.) o personas/colaboradores.
La computacin grid ofrece muchas ventajas frente a otras tecnologas alternativas. La
potencia que ofrecen multitud de computadores conectados en red usando grid es
prcticamente ilimitada, adems de que ofrece una perfecta integracin de sistemas y
dispositivos heterogneos, por lo que las conexiones entre diferentes mquinas no generarn
ningn problema. Se trata de una solucin altamente escalable, potente y flexible, ya que
evitarn problemas de falta de recursos (cuellos de botella) y nunca queda obsoleta, debido a
la posibilidad de modificar el nmero y caractersticas de sus componentes.
Estos recursos se distribuyen en la red de forma transparente pero guardando unas pautas
de seguridad y polticas de gestin de carcter tanto tcnico como econmico. As pues, su
objetivo ser el de compartir una serie de recursos en la red de manera
uniforme, segura, transparente, eficiente y fiable, ofreciendo un nico punto de acceso a un
conjunto de recursos distribuidos geogrficamente en diferentes dominios de administracin.
Esto nos puede llevar a pensar que la computacin Grid permite la creacin de empresas
virtuales. Es importante saber que una grid es un conjunto de maquinas distribuidas que
ayudan a mejorar el trabajo sobre software pesados.

Historia[editar]
El trmino computacin grid tiene su origen en el comienzo de los aos noventa como una
metfora para hacer que el acceso a la potencia de los computadores sea tan sencillo como
acceder a una red elctrica. La metfora de la red elctrica para el computacin accesible en
seguida se volvi cannica cuando Ian Foster y Carl Kesselman publicaron su trabajo seminal,
The Grid: Blueprint for a new computer infrastructure (1999).
Las ideas de grid (incluidas aquellas de la computacin distribuida, programacin orientada a
objetos y servicios Web) fueron reunidas por Ian Foster, Carl Kesselman, y Steve Tuecke,
conocidos como los padres de la grid.1 Lideraron el esfuerzo por la creacin del Globus
Toolkit incorporando no slo la gestin de la computacin, sino tambin la gestin del
almacenamiento, aprovisionamiento de seguridad, traslado de datos, monitorizacin, y un
conjunto de herramientas para el desarrollo de servicios adicionales basados en la misma
infraestructura, incluyendo la negociacin de los acuerdos, mecanismos de notificacin,
servicios de activacin y agregacin de informacin. Mientras que Globus Toolkit se mantiene
como el estndar de facto para soluciones de creacin de redes, otras herramientas han sido

creadas para responder a una serie de servicios necesarios para crear una red empresarial o
global.
En 2007, el trmino computacin en la nube se hizo popular, lo cual es conceptualmente
similar a la definicin cannica de Foster de la computacin grid (en trminos de recursos de
computacin consumidos tal como la electricidad en una red elctrica).

FUNCIONAMIENTO DE LA COMPUTACIN GRID


El grid descansa sobre un software, denominado middleware, que asegura la
comunicacin transparente entre diferentes dispositivos repartidos por todo el
mundo. La infraestructura grid integra un motor de bsqueda que no slo
encontrar los datos que el usuario necesite, sino tambin las herramientas para
analizarlos y la potencia de clculo necesaria para utilizarlas. Al final del
proceso, el grid distribuir las tareas de computacin a cualquier lugar de la red
en la que haya capacidad disponible y enviar los resultados al usuario.
El objetivo final del grid es poder utilizar recursos remotos que nos permitan
realizar tareas que no podramos abordar en nuestra mquina o centro de
trabajo. La idea va ms all del simple intercambio de ficheros, se trata del
acceso directo a software, ordenadores y datos remotos, as como el acceso y
control de otros dispositivos (sensores, telescopios, etc.). Los recursos son
agrupados dinmicamente para resolver problemas concretos, formando
organizaciones virtuales. La existencia de conexiones de red rpidas y fiables es
un requisito indispensable para poder exportar el grid a escala mundial y esto es
algo que ahora por fin es viable, gracias a la proliferacin de las redes de banda
ancha (xDSL, HFC, LMDS, UMTS/HSDPA, satlite, etc.).
El verdadero inters del grid radica en el uso eficiente de los recursos. Se
necesitan mecanismos para repartir el trabajo de forma automtica y eficiente
entre una gran cantidad de recursos, reduciendo las colas de espera de los
distintos usuarios. En principio, tendremos informacin sobre los diferentes
trabajos que se han enviado y, ya que todo se est ejecutando en ordenadores,
podemos calcular cul sera la asignacin ptima de recursos.
Puesto que los recursos que son compartidos pertenecen a personas muy
distintas, la seguridad es esencial, y se centra en los siguientes aspectos: poltica
de accesos (qu es lo que se va a compartir, a quin se le permite el acceso, y

bajo qu condiciones), autenticacin (mecanismos para garantizar la identidad


de un usuario o de un recurso concreto), y autorizacin (procedimiento para
averiguar si una determinada operacin es consistente con las relaciones que se
han definido previamente de cara a compartir recursos). Otro aspecto muy
importante es la estandarizacin: todas las aplicaciones que se ejecuten en
un grid, deben poder funcionar en cualquier otro.
En la segunda generacin de la red de acceso multimedia de banda ancha basado
en ADSL, supone la consolidacin de sta tecnologa y se pretende emplear
servicios basados slo en IP: como difusin de video sobre IP o telefona de
calidad sobre IP. Hoy en da, las interfaces Ethernet son mucho ms baratas que
las ATM y prcticamente igual de eficientes; adems, es una tecnologa menos
compleja y ms conocida. Precisamente, la introduccin de ADSL se ha visto
ralentizada, sobre todo en sus inicios, debido a los costes de infraestructura, as
como a la lentitud y coste de su instalacin y configuracin.

Caractersticas

Capacidad de balanceo de sistemas: no habra necesidad de calcular la capacidad de


los sistemas en funcin de los picos de trabajo, ya que la capacidad se puede reasignar
desde la granja de recursos a donde se necesite;

Alta disponibilidad. con la nueva funcionalidad, si un servidor falla, se reasignan los


servicios en los servidores restantes;

Reduccin de costes: con esta arquitectura los servicios son gestionados por "granjas
de recursos". Ya no es necesario disponer de "grandes servidores" y podremos hacer uso
de componentes de bajo coste. Cada sistema puede ser configurado siguiendo el mismo
patrn;

Se relaciona el concepto de grid con la nueva generacin del protocolo IP. El nuevo protocolo
de Internet IPv6 permitir trabajar con una Internet ms rpida y accesible. Una de las ideas
clave en la superacin de las limitaciones actuales de Internet IPv4 es la aparicin de nuevos
niveles de servicio que harn uso de la nueva capacidad de la red para intercomunicar los
ordenadores.
Este avance en la comunicacin permitir el avance de las ideas de grid computing al utilizar
como soporte la altsima conectividad de Internet. Es por ello que uno de los campos de
mayor innovacin en el uso del grid computing, fuera de los conceptos de supercomputacin,
es el desarrollo de un estndar para definir los Grid Services frente a los actuales Web
Services.

Entre sus ventajas principales tenemos:

Gran poder de procesamiento. Al combinar el poder de varias


computadoras se puede procesar ms datos.
Aprovechamiento de recursos existentes. Se puede usar computadoras
en los momentos en que no son utilizadas para que ayuden con el
procesamiento de datos en la grid.
No hay limite por espacio fsico. Los equipos que forman la grid pueden
estar a gran distancia entre s. Incluso pueden estar en diferentes continentes.
Brinda flexibilidad ante posibles fallos. Si una mquina que forma parte
del grid falla, el sistema lo reconoce y enva los datos no procesados a otra
maquina.
Ahorro en costos. Cuando se necesita una gran capacidad de
procesamiento incurrir en gastos de equipos con ese poder no es una buena
idea para medianas y pequeas compaias por lo que una Grid es una opcin
viable y considerablemente mas barata.

Desventajas de la Grid.

Necesita de algunos servicios para poder funcionar: internet, conexin las


24 horas los 365 dias del ao con banda ancha, seguridad informtica.

Aun no existen muchas aplicaciones que hagan uso de la potencia de un


Grid.

Comunicacin lenta y no uniforme.

Dificultad para sincronizar los procesos de todos los equipos.

Su utilidad se limita para procesamiento en paralelo. Por ahora no es apto


para bases de datos transaccionales ni para el procesamiento complejo en
serie.

Algunos tipos de aplicacin no pueden ser puestos en forma paralela. Aqu


existe el dilema de que tipo de problema se puede resolver con el Grid y cual
no.

ARQUITECTURA DE GRID
Habitualmente se describe la arquitectura del grid en trminos de capas,
ejecutando cada una de ellas una determinada funcin. Las capas ms altas son
las ms cercanas al usuario y las inferiores las ms prximas a las redes de
computacin, distinguiendo entre:

Capa de aplicacin. Formada por todas las aplicaciones de los usuarios,


portales y herramientas de desarrollo que soportan esas aplicaciones. Es la
capa que ve el usuario y que proporciona el llamado serviceware, que recoge
las funciones generales de gestin tales como la contabilidad del uso
del grid que hace cada usuario.

Capa de middleware. Responsable de proporcionar herramientas que


permiten que los distintos recursos participen de forma coordinada y segura
en un entorno gridunificado.
Capa de recursos. Constituida por los recursos que son parte del grid:
ordenadores, supercomputadoras, sistemas de almacenamiento, catlogos
electrnicos de datos, bases de datos, sensores, etc.
Capa de red. Encargada de asegurar la conexin entre los recursos que
forman el grid.

Para poder hacer todo lo anterior, las aplicaciones que se desarrollen para ser
ejecutadas en un ordenador concreto, tendrn que adaptarse para poder invocar
los servicios adecuados y utilizar los protocolos correctos. Sin embargo, una vez
adaptadas al grid, miles de usuarios podrn usar las mismas aplicaciones,
utilizando las capas de middleware para adaptarse a los posibles cambios en el
tejido del grid.

Middleware
De todas estas capas, la ms interesante es el middleware, el autntico cerebro
del grid, que se ocupa de las siguientes funciones:

Encontrar el lugar conveniente para ejecutar la tarea solicitada por el usuario.


Optimizar el uso de recursos que pueden estar muy dispersos.
Organizar el acceso eficiente a los datos.
Autenticar los diferentes elementos.
Ejecutar las tareas.
Monitorizar el progreso de los trabajos en ejecucin.
Gestionar automticamente la recuperacin frente a fallos.
Avisar cuando se haya terminado la tarea y devolver los resultados.

El middleware est formado por muchos programas software; algunos de estos


programas actan como agentes (agents) y otros como intermediarios (brokers),
negociando entre s, de forma automtica, en representacin de los usuarios
del grid y de los proveedores de recursos. Un elemento fundamental
del middleware son los metadatos (datos sobre los datos), que contienen, entre
otras cosas, toda la informacin sobre el formato de los datos y dnde se
almacenan (a veces en varios sitios distintos). Los agentes individuales presentan
los metadatos referidos a los usuarios, datos y recursos. Por otro lado, los
intermediarios se encargan de las negociaciones entre mquinas para la
autenticacin y autorizacin de los usuarios, de definir los acuerdos de acceso a
los datos y recursos y, en caso de que corresponda, el pago por los mismos.
Cuando queda establecido el acuerdo, un intermediario planifica y las tareas de
cmputo y supervisa las transferencias de datos necesarias para acometer cada
trabajo concreto. Al mismo tiempo, una serie de agentes supervisores especiales
optimizan las rutas a travs de la red y monitorizan la calidad del servicio.

Figura 2: Concepto de middleware.

APLICACIONES DEL GRID


Las instituciones y organismos ms interesadas en el desarrollo del grid son,
principalmente, las que comparten un objetivo comn y que, para poder
alcanzarlo, lo ms efectivo es compartir sus recursos: Gobiernos y
organizaciones internacionales (respuesta a desastres, planificacin urbana,
etc.); sanidad (anlisis
rpido
de
imgenes
mdicas
complejas,
etc.); educacin (creacin de aulas virtuales, teleconferencias, etc.), empresas
y grandes corporaciones (clculos complejos, reuniones virtuales, etc.).
Los beneficios del grid, gracias a la integracin de recursos distribuidos, estn
teniendo repercusin en muchsimos campos, de entre los que cabe destacar:
medicina (imgenes, diagnosis y tratamiento), ingeniera gentica y
biotecnologa (estudios en genmica y protemica), nanotecnologa (diseo de
nuevos materiales a escala molecular), ingeniera (diseo, simulacin, anlisis de
fallos y acceso remoto a instrumentos de control), y recursos naturales y medio
ambiente (previsin meteorolgica, observacin del planeta, modelos y
prediccin de sistemas complejos).

Figura 3: Aplicacin del grid en la bioinformtica.

El grid en los centros acadmicos y de investigacin


La computacin distribuida empez a ser escalada a niveles globales con la
madurez de Internet en los aos 90. Dos proyectos en particular han demostrado
que el concepto es totalmente viable y eficiente, incluso ms de lo que los
expertos auguraban en un principio: Distributed.net y SETI@home.
Distributed.net emplea miles de ordenadores distintos para crackear cdigos de
encriptacin (RC5-64, CSC, DES-III, DES-II-1, DES-II-1, RC5-56, etc.). Fundado en
1997, el proyecto ha crecido hasta abarcar hoy en da ms de 60.000 usuarios
alrededor de todo el mundo. El poder de cmputo de Distributed.net ha ido
creciendo hasta llegar a ser el equivalente a ms de 160.000 computadoras PII
266MHz trabajando 24 horas al da, 7 das a la semana, y 365 das al ao.

SETI@home ha sido el proyecto de computacin distribuida ms popular de la


historia, cuyo objetivo era la bsqueda de vida extraterreste mediante la
deteccin de su tecnologa de comunicaciones, buscando patrones que
demuestren inteligencia en las ondas de radio procedentes del espacio. Para ello,
cualquier persona que quisiera colaborar poda descargarse un salvapantallas
gratuito (de este modo aprovechaba los ciclos del ordenador slo cuando ste no
estaba en uso), que instalado en su ordenador analiza seales del espacio
captadas con el radiotelescopio de Arecibo en Puerto Rico. El software se hizo
pblico el 17 de mayo del 1999 y, desde entonces hasta su finalizacin el 15 de
diciembre de 2005, ms de 5 millones de voluntarios han instalado el programa
en su ordenador, se han conseguido un total acumulado de dos millones de aos
de tiempo de CPU y se han analizado alrededor de 50 TB de datos, convirtiendo
al proyecto en el mayor computador virtual de la historia de la humanidad por
anlisis realizados. En la actualidad, SETI@Home sigue en funcionamiento pero
integrado en BOINC (Berkeley Open Infrastructure for Network Computing ), un
proyecto basado en recursos de redes abiertas con los mismos principios que el
proyecto original. La nueva infraestructura continuar con la bsqueda de
seales de radio extraterrestres, pero ahora adems la potencia de CPU de los
participantes se dedicar tambin a investigar sobre otras tareas, como el
cambio climtico, la astronoma y la cura de enfermedades.
El sector ms involucrado en todo el mundo en la puesta a punto de
plataformas grid en el desarrollo de aplicaciones adaptadas a esta nueva
tecnologa es, sin lugar a dudas, el de la investigacin. En Espaa las principales
universidades e instituciones de investigacin han participado intensamente en
diversos proyectos sobre grid, tanto nacionales como internacionales, entre
otros: IRISGrid, Damien", HealthGrid, CrossGrid, Enabling Grids for eScience in Europe, etc. Existen ya varios agentes grid disponibles para colaborar
activamente en este tipo de proyectos, por ejemplo, en Grid.org de United
Devices, cualquiera puede bajarse uno, instalarlo y configurarlo, para colaborar
activamente en el desarrollo de esta fascinante tecnologa y, a la vez,
desempear una labor altamente solidaria (por ejemplo, ayudando al
descubrimiento de nuevos frmacos y vacunas contra algunas de las
enfermedades ms terribles de nuestra Era).

También podría gustarte