Está en la página 1de 23

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

INTAGRANTES Henri Guarnizo Cristina Ocampo Byron Ochoa Gonzalo Piedra

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Un sistema de archivos distribuido (distributed file system, DFS) es una implementacin distribuida del modelo clsico de tiempo compartido de un sistema de archivos, donde mltiples usuarios comparten archivos y recursos de almacenamiento. El propsito de un DFS es soportar la misma clase de compartimiento cuando los archivos estn dispersos fsicamente entre los diversos sitios de un sistema distribuido.

Antecedentes

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Un sistema distribuido es un conjunto de mquinas dbilmente acopladas interconectadas mediante una red de comunicacin. Se emplea el trmino mquina para designar una computadora o una estacin de trabajo.
Estructura; Para saber como es la estructura de un DFS necesitamos definir los trminos: Servicio Servidor Cliente

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Servicio: Es una entidad de software que corre en una o ms mquinas y proporciona un tipo particular de funcin a clientes que no se conocen por adelantado. Servidor: Es el software de servicio que corre en una sola mquina. Cliente: Es un proceso que puede llamar a un servicio empleando operaciones que forman su interfaz de cliente .

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Una interfaz de cliente para un servicio de archivos se forma mediante un conjunto de operaciones de archivos primitivos tales como el de crear, borrar, leer o escribir en un archivo. El componente principal de hardware que controla a un servidor de archivos es un conjunto de dispositivos locales de almacenamiento secundarios tales como discos magnticos.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Otros Antecedentes de un DFS:


Un DFS es un sistema de archivos cuyos clientes, servidores y dispositivos de almacenamiento estn dispersos entre las mquinas de un sistema distribuido. La medida de desempeo ms importante de un DFS es la cantidad de tiempo necesaria para satisfacer las diversas solicitudes de servicios. Un DFS idealmente debera aparecer a sus clientes como un sistema de archivos convencional y centralizado. El espacio de almacenamiento global administrado por un DFS est compuestos de diferentes espacios de almacenamiento ms pequeos localizados remotamente.

NOMENCLATURA Y TRANSPARENCIA

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Una nomenclatura es un tipo de mapeo entre objetos lgicos y fsicos, por ejemplo: los usuarios manejan objetos de datos lgicos representados por nombres de archivos, en tanto que el sistema se encarga de manipular los bloques fsicos de datos almacenado en disco. En un DFS transparente se agrega una nueva dimensin a la abstraccin: como la de ocultar el lugar en la red donde se localiza dicho archivo.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Estructura de Nomenclatura: Existen dos tipos de nomenclatura para los mapeos de nombres en un DFS: Transparencia de ubicacin: el nombre de un archivo no revela pista alguna de la ubicacin del almacenamiento fsico del archivo. Independencia de la ubicacin: el nombre de un archivo no necesita modificarse cuando cambia la ubicacin del almacenamiento fsico del archivo.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Otros aspectos que pueden diferenciar la independencia y transparencia de ubicacin esttica: Separar los datos de la ubicacin segn lo exhibe la independencia de ubicacin para proporcionar una mejor abstraccin para los archivos. Los usuarios pueden compartir archivos remotos, simplemente nombrando a los archivos en una forma transparente a la ubicacin , como si los archivos fueran locales. La independencia de ubicacin separa la jerarqua de nomenclatura de la jerarqua de los dispositivos de almacenamiento y de la estructura entre computadoras.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Esquema de Nomenclatura: Existen tres enfoques principales para los esquemas en un DFS: El ms sencillo es aquel en el cual a los archivos se les asigna un nombre que es una ubicacin del nombre de su anfitrin y el nombre local, lo cual garantiza un nombre nico en todo el sistema. El segundo enfoque fue popularizado por el sistema de archivos de red de Sun (Network File System, NFS), el cual proporciona medios para ligar directorios remotos a directorios locales, dando de esta forma la apariencia de un rbol coherente de directorios. En el tercer enfoque, se logra una integracin total de los sistemas de archivos, aqu podemos notar que su estructura es isomrfica con respecto a la estructura de un sistema de archivos convencional, pero sin embargo los diversos archivos especiales, como los de UNIX y los directorios binarios de la mquina, hacen que esta meta sea difcil de alcanzar.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Tcnicas de Implementacin: La implementacin que posee o que tiene una nomenclatura transparente requiere una provisin para el mapeo de un nombre de archivo en la ubicacin asociada. Para una mejor disponibilidad de la informacin de mapeo podemos emplear mtodos como la replicacin, el uso de cachs o ambos si es necesario. Podemos introducir identificadores de archivos de bajo nivel independientes de la ubicacin, los cuales nos servirn para hacer actualizaciones simples y la vez consistentes de una determinada informacin en memoria. La implementacin de rboles de directorios tipo UNIX utilizando estos identificadores de bajo nivel independientes de la ubicacin, hace que toda la jerarqua sea invariante bajo la migracin de unidades componentes.

Acceso a Archivos Remotos

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Un mecanismo de servicio remoto es aquel mediante el cual la solicitudes de acceso se entregan al servidor, la mquina del servidor realiza los accesos y los resultados se envan de regreso al usuario Para asegurar un desempeo razonable en un mecanismo de servicio remoto podemos emplear una forma de uso de cachs que en los archivos convencionales, el raciocinio para el uso de cachs es reducir la E/S de disco, mientras que en los DFS, la meta es reducir tanto el trfico en la red como en la E/S de disco.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Esquema bsico de uso de cachs: Si los datos necesarios para satisfacer la solicitud de acceso no se encuentran ya en cach, entonces se lleva una copia de dichos datos desde el servidor al sistema del cliente. Los accesos se realizan en la copia que est en cach. Una poltica de reemplazo por ejemplo: los menos recientemente usados mantienen limitado el tamao de la cach. Los archivos se siguen identificando con una copia que reside en la mquina del servidor, pero aqu las copias o partes del archivo estn dispersas en diferentes cachs. El tamao del bloque y el tamao total de la cach tienen una importancia obvia en los esquemas de uso de cachs con bloques

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Ubicacin de cachs: Las cachs de disco tienen una ventaja muy clara sobre las cachs de memoria principal: como es su confiabilidad. Las modificaciones que se hacen a datos en cach se pierden durante una cada de dicha cach; es decir solo se mantienen en memoria voltil Por lo tanto si los datos que se encuentran en cach se mantienen en disco siguen estando ah durante la recuperacin, por lo que ya no es necesarios traerlos nuevamente.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Ventajas de cachs de memoria principal: Permiten tener estaciones de trabajo sin discos. Pueden accederse ms rpidamente a sus datos. La tendencia actual en la tecnologa es haca memorias con mayor capacidad y menor costo. Las cachs de servidores estarn en memoria principal independientemente de donde se encuentren ubicadas las cachs de usuario. Si en la mquina del usuario tambin se usa cachs de memoria principal se puede crear un solo mecanismo de uso de cachs para que sea utilizado tanto por el servidor como el usuario.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Polticas de actualizacin de cachs: La poltica ms sencilla es la de escribir datos en el disco tan pronto como son colocados en cualquier cach. Una de las ventajas de esta poltica de escritura directa es la confiabilidad; es decir, se pierde poca informacin cuando falla un el sistema de un cliente. Una alternativa es la poltica de escritura demorada, que es donde retrasamos las actualizaciones en la copia maestra.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Variantes de estas polticas: Una de estas variantes consiste en vaciar un bloque cuando est a punto de ser expulsado de la cach del cliente Otra variante de la escritura demorada consiste en escribir datos de regreso al servidor cuando se cierra el archivo, cabe sealar que sta poltica se utiliza ms en el sistema Andrew. Adems la poltica de escritura de cierre requiere que se demore el proceso de cierre mientras el archivo se est escribiendo.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Consistencia: Una mquina cliente se enfrenta al problema de decidir si una copia de los datos en cach es o no consistente con la copia maestra. Para ello existen dos enfoques para verificar la validez de los datos en cach. 1. Enfoque iniciado por el cliente: aqu el cliente inicia una verificacin de validez en la que se pone en contacto con el servidor y verifica si los datos locales son consistentes con su copia maestra. 2. Enfoque iniciado por el servidor: el servidor registra para cada cliente las partes de los archivos que colocan en cach, para cuando el servidor detecte una inconsistencia potencial poder reaccionar. Un potencial de inconsistencia ocurre cuando un archivo es colocado en cach por dos clientes diferentes en modo de conflicto

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

Comparacin entre el uso de cachs y de servicios remotos: Una comparacin entre estos dos tiene que ver con un incremento potencial en el desempeo y una disminucin en la simplicidad tanto de los cachs como los servicios remotos. Entre sus ventajas y des ventajas que stos presentan tenemos: Un nmero considerable de los accesos remotos puede ser manejado eficientemente por la cach local cuando se hace uso de cachs. El trabajo total adicional de la red en la transmisin de grandes porciones de datos es menor que cuando se transmiten series de respuestas a solicitudes especficas.

SISTEMAS DE ARCHIVOS DISTRIBUIDOS

El problema de consistencia, es la principal desventaja del uso de cachs, debido a que en los patrones de acceso que exhiben escrituras poco frecuentes el uso de cachs es superior. Para que el uso de cachs confiera un beneficio la ejecucin deber realizarse en mquinas con discos locales o grandes memorias principales. En el caso del uso de cachs, debido a que los datos se transfieren en masa entre el servidor y el cliente y no en respuesta a las necesidades especficas de una operacin sobre archivos, la interfaz inferior entre mquinas es diferente de la interfaz de usuario superior.

También podría gustarte