Está en la página 1de 6

Sistemas distribuidos: Clster

En este apartado voy a explicar lo que es y consiste bsicamente un sistema distribuido (clster). Definicin: Un clster es un conjunto de ordenadores que estn conectados entre s por medio de una red, para compartir recursos con el objetivo de realizar tareas y funciones como si fuesen un nico ordenador (memoria distribuida).

Sirve para cuando queramos realizar tareas que necesiten grandes requerimientos de memoria y CPU y para ahorrarnos horas de trabajo en tareas y operaciones. Tipos de Cluster: Hay 3 tipos de cluster: High Performance o Alto rendimiento. High Availability o Alta Disponibilidad. High Reliability o Alta Confiabilidad.

Alto Rendimiento El objetivo es mejorar el rendimiento, de tiempo o precisin, para la solucin de un problema.

Este tipo suele estar ligado a solucionar los siguientes problemas: Clculos matemticos Mejora de grficos Compilacin de programas Descifrado de cdigos Rendimiento del sistema operativo

Alta disponibilidad Los clsteres de alta disponibilidad estn destinados a mejorar los servicios que ofrecen las empresas de cara a los clientes de una red, ya sea local o de internet. Fundamentalmente tienen dos caractersticas: Fiabilidad Disponibilidad

Alta confiabilidad Con alta confiabilidad se trata de aportar la mxima confianza es un entorno en el cual se necesita saber que el sistema siempre se va a comportar de una forma determinada, como por ejemplo sistemas de respuesta a tiempo real. Suele ser usado para entornos de tipo empresarial, necesitando un hardware especializado. Clster Google: Google necesitara muchsima potencia para abastecer los servicios de todos los usuarios del mundo, una media de 40 millones de bsquedas diarias. Para conseguir esta potencia Google desarroll varios servidores, cada uno de ellos formado por un clster. Consiguiendo as la potencia necesaria para todas las peticiones. Cada clster de Google se compone de 359 racks (estructura parecida a una estantera para organizar los nodos), 31654 nodos, 63184 CPUs, 126.368 GHz de potencia de procesamiento, 63.184 Gbytes de RAM y 2.527 Tbytes de espacio en disco duro.

Un ejemplo claro de un clster es la siguiente imagen:

Elementos necesarios: Dos o ms nodos (ordenadores) compuestos al menos por un microprocesador, una memoria y una interfaz para que se puedan comunicar con la red del clster. Hardware apropiado al tipo de clster que vamos a utilizar. Tarjeta de red. Un medio de transmisin entre ellos como por ejemplo RJ-45. Software de sistema y un software de aplicacin.

Software de sistema Podemos usar distintos sistemas operatios para conseguir el funcionamiento del cluster, como son: Ubuntu server Windows Server OpenMosix ParallelKnoppix Pelican

Software de Aplicacin Dependiendo del sistema operativo que vayamos a utilizar necesitaremos unos paquetes o programas: En el caso de Linux: HeartBeat: ejecuta los servicios en los nodos. HeartBeat-Stonith: es una tcnica HeartBeat que se encarga de controlar que cuando un servidor est cado no interfiera en el funcionamiento del cluster.

En el caso del Windows: A partir de Windows 2003 server los servidores ya viene preparado con el software necesario. Para mejorar el rendimiento en Windows server 2008 podemos usar Failover clster.

El siguiente paso ser la instalacin del cluster. Montar un clster con Linux: http://root-neztgul.blogspot.com/2008/08/como-montar-un-cluster-conlinux.html

CONCEPTO DE LOS ALGORITMOS DE CLUSTERING


El Clustering es una tcnica estadstica que permite una generacin automtica de grupos en los datos. Incluso, existen algoritmos de Clustering que permiten la generacin de grupos jerrquicos, consiguiendo una mayor abstraccin y representacin de la informacin para poder recuperarla ms eficiente. En cuanto a los factores que influyen en el Clustering son: Propiedades o atributos a gestionar de los objetos que representan el conjunto de datos. Funcin matemtica que mide la distancia entre dos objetos. Las funciones tpicas son la distancia Manhattan, la distancia Eucldea, el producto escalar y dems. Las restricciones a las que est sujeto el conjunto de datos a clasificar, principalmente una a destacar: la eleccin del nmero de clsteres: existen muchos criterios y todos ellos basados en heursticas basadas en el clculo de distancias entre los objetos.

Uso del Clustering en la extraccin de informacin


En la extraccin de la informacin la tcnicas basadas en Clustering son muy comunes para aquellos casos donde no existan conjuntos de entrenamiento, la informacin cambia dinmicamente o se pretende extraer propiedades o clases de informacin. En el dominio de la extraccin de la informacin se distinguen dos aplicaciones muy tiles: Extraccin de correferencias en los nombres de una frase. Se trata de relacionar nombre y pronombres que se refieren a la misma persona, cosa, lugar, fecha... Por ejemplo, en la frase "Bill Clinton fue a Nigeria para hablar con los trabajadores del SIDA. Despus, el presidente de USA y su mujer fueron de viaje a China..." se tiene una primera clase que es Bill Clinton y una serie de nombres y pronombres que le referencian: "el presidente de USA" y "su". Sacar relaciones de texto es un problema NP-duro, pero mediante tcnicas de Clustering y mediante la adicin de restricciones, se puede resolver con bastante menor costo computacional, tanto en tiempo como en memoria.

Correferencias de frases en diferentes documentos. Recuperar cadenas de caracteres en distintos ficheros y que hagan referencia al mismo contexto. Esto es de gran utilidad para los buscadores y recuperadores de informacin que actualmente incluye el Windows Vista y anteriormente Mac OS , la recuperacin de informacin no slo consiste en el nombre del archivo, sino que tambin comprueba la informacin y el contexto de dentro de cada archivo o fichero.

Fuentes: http://extraccionrecuperacionnosupervisada.50webs.com/clustering.html por Javier Moya Amador

http://root-neztgul.blogspot.mx/2008/11/sistemas-distribuidos-cluster.html recuperado el 18 de noviembre de 2008

También podría gustarte