Sistemas de Archivos

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE INGENIERIA
ESCUELA DE CIENCIAS Y SISTEMAS
MANEJO E IMPLEMENTACIN DE ARCHIVOS
SECCIN A-
INVESTIGACIN SISTEMAS DE
ARCHIVOS
LUISA FERNANDA GATICA MOTA

201114505
GUATEMALA 07 DE ABRIL DE 2015
Sistemas de Archivos
Google File System
Google
Google utiliza un Sistema de archivos llamado Google File System, tambin
conocido como GoogleFS, GFS o GooFS. Este sistema surgi como una mejora
al primer sistema de archivos BigFiles creado por Lary Page y Sergay Brin,
quienes tambin son creadores de Google. Google File System es un sistema
de archivos distribuidos el cual, adems de almacenar la informacin del gestor
de bsquedas en internet, tambin es utilizado para las aplicaciones en lnea
de Google Inc. tales como Google Maps, Google Drive, Google Mail, Google
Video, Google Apps, entre otros.
El sistema de archivos distribuido est diseado para almacenar grandes
cantidades de datos bsicos que sean accedidos de manera rpida. Google File
System maneja la informacin en nodos, los cuales estn divididos en dos, el
nodo Maestro y los Chunks (ver imagen 1).
Imagen 1: Forma de almacenamiento y acceso de los datos en Google File System
Un nodo maestro almacena la informacin del archivo, tambin conocida como

metadata, la cual incluye la ubicacin de los Chunks donde est la informacin
para que al acceder a un archivo el nodo maestro devuelva la ubicacin de los
chunks y as poder acceder la informacin real del archivo desde la aplicacin
que lo solicit. Los nodos maestros son almacenados y manejados en el Master

Server (ver imagen 2).
Imagen 2: Master Server de Google File System
Los Chunks almacenan las porciones de informacin, las cuales son bloques de
tamao fijo de 64 bytes, los cuales muy pocas veces son modificados y no se
eliminan, por lo cual no generan mucha fragmentacin. Al ser un sistema de
archivos distribuidos los bloques de un archivo se almacenan en varios
servidores y tambin se replican por lo menos tres veces, algunos de mayor
importancia se replican ms veces, en distintos servidores para garantizar que
se mantengan los datos por si algn servidor llega a fallar, ya que los
servidores, llamados Chunk Server, en los que se almacenan son originalmente
de costo bajo, de poca capacidad y utilizan sistema operativo de GNU/Linux
(ver imagen 3).
Imagen 3: Chunk Server de Google File System
Hadoop
Yahoo!
Yahoo utiliza y contribuye al proyecto Hadoop, el cual es un framework de
software que utiliza un sistema de archivos distribuidos llamado Hadoop
Distributed File System (HDFS), el cual est inspirado en el sistema de archivos
de Google, descrito anteriormente, fue creado por Doug Cutting. Hadoop se
construye mediante el lenguaje de programacin java.
El sistema de archivos distribuidos tiene una arquitectura capaz de gestionar
archivos de gran tamao distribuyndolos en distintas ubicaciones, este
sistema maneja todo tipo de archivos, videos, imgenes, audio, registro,
estructurados, entre otros. Un cluster de Hadoop, al igual que Google, utiliza un
nodo maestro y muchos esclavos.
El nodo maestro, tambin llamado Namenode, almacena la informacin sobre
el archivo, como la ubicacin de los bloques, el nombre, los permisos, entre
otros. Estos metadatos es informacin pequea que se almacena en memoria
principal para que acceder a ella sea ms rpido. Los otros nodos son los
esclavos, tambin llamados datanodes, estos se encargan de recuperar y
almacenar los bloques de datos, estos bloques, al igual que Google, son de
tamao fijo de 64 MB, con lo cual se reduce la fragmentacin ya que los
bloques no cambian sus datos.
Para garantizar la seguridad de los datos, estos se replican en distintos host, a
diferencia de Google, el replicado consiste en que los datos se almacenan en
tres nodos distintos, dos en el mismo rack y el otro en uno diferente; estos
nodos replicados se comunican para actualizar los valores por si alguno cambia
y as equilibrar los datos y mantener la rplica exacta (ver imagen 4).
Imagen 4: Sistema Distribuido de Datos de Hadoop usado por Yahoo!
Amazon S3
Amazon
Amazon ofrece un almacenamiento a los usuarios que utiliza el sistema
Amazon S3, una caracterstica importante de este servicio es que no tiene
lmite de almacenamiento, ya que el cliente slo paga por lo que actualmente
est utilizando. Los datos almacenados estn distribuidos por el Data Center de
Amazon.
Para organizar los datos Amazon utiliza el concepto de buckets, los cuales son
la carpeta de almacenamiento de un usuario, de donde se encuentran los datos
en s; los objetos son la informacin que se almacena la cual, al contrario de
Google y hadoop es de tamao variable desde 1 byte hasta 5 GibaBytes, y a su
vez almacenan tambin la informacin del archivo llamada metadata, lo
contrario con los sistemas anteriores que separan la metadata de los archivos.
Para acceder a la informacin se utilizan llaves, cada bucket tiene su
identificador nico, al igual que los objetos tienen sus llaves nicas de
identificacin, por lo que al momento de acceder a un objeto se busca como
identificador_bucket + llave_Objeto.
Imagen 5: Cubeta de almacenamiento de Amazon S3
Consultas de fuentes electrnicas

1. Google File System, http://es.wikipedia.org/wiki/Google_File_System .
Autor desconocido, fecha 31 de marzo de 2015
2. Google File System (GFS),
http://www.fing.edu.uy/inco/cursos/sistoper/recursosEnlaces/presentacio
n-gfs.pdf . Autor Mario A. del Riego.
3. GOOGLE FILE SYSTEM (GFS),
http://www.uio.no/studier/emner/matnat/ifi/INF5100/h10/undervisningsm
ateriale/gfs.pdf . Autor Hans Vatne Hansen.
4. Hadoop, http://es.wikipedia.org/wiki/Hadoop . Autor desconocido, fecha
26 de febrero de 2015.
5. Hadoop Y Su Sistema De Archivo Distribuido HDFS, Pura Infraestructura
Para BigData, http://datosintensos.blogspot.com/2012/09/hadoop-y-susistema-de-archivo.html . Autor Jos A Cuartas M, fecha 25 de
septiembre de 2012
6. Qu es Hadoop?. http://momentotic.com/2013/05/16/que-es-hadoop/ .
Autor ngel Leo-Revilla, fecha 16 mayo de 2013.
7. Amazon S3. http://en.wikipedia.org/wiki/Amazon_S3 . Autor desconocido,
fecha 7 de abril de 2015.
8. Por qu utilizar S3, el sistema de almacenamiento de Amazon.
http://www.maestrosdelweb.com/por-que-utilizar-s3-el-sistema-dealmacenamiento-de-amazon/ . Autor Daniel Garcia, fecha 4 de marzo de
2008.
9. Amazon S3. http://aws.amazon.com/es/s3/ . Autor Amazon Web Services,
Inc.

Sistemas de Archivos

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Sistemas de Archivos

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA

LUISA FERNANDA GATICA MOTA

Imagen 1: Forma de almacenamiento y acceso de los datos en Google File System

Un nodo maestro almacena la informacin del archivo, tambin conocida como

que lo solicit. Los nodos maestros son almacenados y manejados en el Master

Imagen 2: Master Server de Google File System

Imagen 3: Chunk Server de Google File System

Imagen 4: Sistema Distribuido de Datos de Hadoop usado por Yahoo!

Imagen 5: Cubeta de almacenamiento de Amazon S3

Consultas de fuentes electrnicas

También podría gustarte