Está en la página 1de 14

GENERACIN FUTUROS SISTEMAS

INFORMTICOS

Presentados Por: Juan Carlos Calderon Condori

ABSTRACTO
La replicacin de datos es un mtodo prctico y eficaz para
lograr el acceso de datos eficiente y tolerante a fallos en las
redes. Tradicionalmente, los sistemas de replicacin de
datos mantienen toda una rplica en cada sitio donde un
archivo es replicado, proporcionando un modelo de slo
lectura. Estas soluciones requieren enormes recursos de
almacenamiento para almacenar la totalidad conjunto de
rplicas y no permiten la modificacin de datos eficiente
para evitar el problema de la coherencia. En este trabajo se
propone un nuevo mtodo de replicacin, se llama el
esquema de replicacin (BRS), que proporciona tres
ventajas principales sobre los enfoques tradicionales:
optimizar el uso del almacenamiento, mediante la creacin
de subreplicas; aumentar el rendimiento de acceso a datos,
mediante la aplicacin de tcnicas de E / S en paralelo; y
proporcionar la posibilidad de modificar las rplicas,
mediante el mantenimiento de la coherencia entre las
actualizaciones de una manera eficiente.

1. INTRODUCCIN
Gestin de datos es un problema importante en entornos de rejilla.
La cuadrcula de datos se compone de cientos de distribucin
geogrfica computadoras y recursos de almacenamiento
generalmente ubicados bajo diferentes dominios administrativos.
El objetivo de una cuadrcula de datos es facilitar intercambio de
datos y recursos. El tamao de los datos gestionados por redes de
datos est creciendo continuamente, y ya ha llegado Petabytes,
como en el Proyecto de almacn de datos Atlas.
Hay dos servicios bsicos de gestin de datos en una cuadrcula de
datos:
Servicios para la transferencia de datos, y servicios para la gestin
de rplica. El servicio principal para la gestin de los datos es el
protocolo GridFTP, una extensin de FTP que proporciona una
transferencia de datos eficiente y seguro y el acceso a archivos de
gran tamao en entornos grid

2. TRABAJO RELACIONADOS
El movimiento de datos en las redes est bsicamente hecha
posible mediante el uso de dos mecanismos: GridFTP y RFT.
GridFTP es una implementacin del protocolo FTP para redes, y es
ampliamente utilizado para la segura mover grandes cantidades de
datos entre redes. Tiene varias ventajas: alto rendimiento paralelo
aplicacin corrientes; la transferencia de datos coordinada por el
uso de mltiples nodos de computacin en el origen y destino;
apoya diversas opciones de seguridad, incluyendo Infraestructura
Red de Seguridad (IGS); descargas parciales de una archivo de
gran tamao; y el reinicio automtico de las transferencias fallidas.
El confiable Transferencia de archivos (RFT) El servicio es un
servicio web que proporciona interfaces para controlar y supervisar
las transferencias de archivos de terceros utilizando Servidores
GridFTP. RFT puede detectar una variedad de fallas y reiniciar lal
transferencia de archivos desde el punto de falla.

3. ESQUEMA DE REPLICACIN
BRANCH (BRS)
En esta seccin un nuevo esquema de replicacin
llamado BRANCH. Una rplica R (ver Fig. 1) se
define como un conjunto de subreplicas disjuntos,
Ri (fragmentos de archivos) que, en conjunto,
contienen todos los datos almacenados en los
archivos raz o archivo original (RR). Formalmente,
podemos definir una rplica como de la siguiente
manera:

Fig. 1. Diferencias entre la replicacin jerrquica (arriba) y la


replicacin rama Branch (parte inferior).

En la Fig. 2, se muestra un rbol con tres niveles de replicacin. El archivo


original (raz) se encuentra en la WEB 1. El segundo nivel de replicacin
est formado por SITIO 2 y SITIO 3: la articulacin de sus datos es toda
una rplica, y su interseccin es el conjunto vaco. En el
Asimismo, la subreplica en SITIO 2 es la rama branch-replicado en SITIO 4
SITIO 5. Siguiendo este esquema, un rbol de replicacin de datos, donde
estamos puede ver que cada nivel es toda una rplica, se crea. Por otra
parte, una toda rplica se puede conseguir uniendo diferentes
combinaciones de rplicas sub, de modo que una rplica puede estar
compuesta de rplicas con sub diferentes profundidades en el rbol de la
replicacin. Por ejemplo, podemos obtener una rplica de unirse a los
sitios 2, 6, y 7, o unirse a los sitios 3, 4, y 5. De esta manera, utilizando
BRS Evita perder demasiado espacio replicar todo el archivo, pero un
nivel de alta tolerancia a fallos todava est asegurada. La rplica
definido por las hojas de los rboles se llama rplica de terminal. Las
principales caractersticas de BRS son los siguientes:
Rplica de raz. En este algoritmo, un nodo de almacenamiento solo
soporta el archivo original, llamado rplica de raz. Esta rplica es
siempre completa y almacena el archivo original. Inicialmente, se elige
la rplica de raz cuando se crea el archivo.
Replicacin paralelo. Para crear una nueva rplica, n apuntar nodos
han de ser seleccionado para almacenar la subreplicas. La unin de
todos la subreplicas ser la rplica original. BRS divide lgicamente la

De esta manera, podemos reducir el tiempo de


replicacin en comparacin

3.1. RPLICA DE UBICACIN DE


SERVICIO (SPI)
Con el fin de proporcionar un mtodo estndar para la ubicacin
rplica utilizamos el modelo de recursos de espacio de nombres de
servicios (RNS). RNS es una especificacin del archivo de cuadrcula
Grupo de Trabajo del Sistema (GFS-WG) de Global Grid Forum que
permite la construccin de un uniforme, global, espacio de nombres
jerrquico usando un servicio web. Define un threetier nombrando la
arquitectura consiste en nombres de interfaz humana (hin), nombres
lgicos (LN), y las referencias de punto final (ER), donde el punto
final de referencias son URL, nombres de archivo, los metadatos, u
otros objetos. Ya est dos niveles de indireccin: nombres de interfaz
humanos a lgica nombres y nombres lgicos hasta el punto final
referencias. Este segundo nivel de direccin tiene la ventaja de
utilizar un nombre lgico para representar una referencia lgica, y
por lo tanto, los nombres lgicos puede ser referenciado y resueltos
de forma independiente del espacio de nombres jerrquico

Se modelado un prototipo de este servicio que incluye el


archivo metadatos con la informacin descrita
anteriormente necesitaba ayuda BRS. Dado un nombre de
interfaz humana, podemos obtener a travs de la lista de
RNS nombres de lgicas correspondientes con todas las
rplicas del archivo. Esta lista se pasa a un Servicio de
Optimizacin de la reproduccin (ROS) para obtener la
mejor rplica para el cliente.
Cuatro mtricas se utilizan en ROS para elegir una rplica:

4. MODELADO BRS
En esta seccin se muestra el modelo analtico utilizado para
evaluar la el acceso, creacin y actualizacin de una rplica en BRS.
Fig. 4 muestra la modelo bsico para el acceso de datos: un cliente
debe cruzar dos LAN y una WAN para acceder a los datos. La Tabla
1 muestra las definiciones y notaciones utilizadas por el modelo. Se
han obtenido los parmetros de disco desde un disco comercial

efiniciones y notaciones para el modelo de acceso a datos.


Variable

Descripcin

Valor

Tamao del archivo

1GB

red de rea local de latencia

0.5 ms

Red de rea amplia latencia

variable

Ancho de banda de red de rea local

1 GB/s

Ancho de banda de red de rea amplia

2 GB/s

Velocidad de transferencia de disco

40 MB/s

Promedio de disco tiempo de bsqueda

8.5 ms

El tiempo medio de latencia de disco

4.16 ms

Gracias