Está en la página 1de 18

INSTITUTO TECNOLOGICO SUPERIOR DE MISANTLA

Unidad 6 Administrador de archivos


6.1 Sistema de archivos
Lic. En Informtica Fco. Rogelio Prez Parra 24/11/2011

Introduccin a los conceptos de lo que un sistema de archivos, su administracin, y los diferentes tipos de sistemas de archivos existentes.

Tabla de contenido
Sistemas de Archivos ........................................................................................................ 3 Introduccin ................................................................................................................. 3 Conceptos generales .................................................................................................... 4 Sistema de Archivos...................................................................................................... 5 Organizacin y acceso a archivos (File organizittion and access) .................................... 7 a. Pilas ........................................................................................................................ 8

b. Archivos Secuenciales............................................................................................ 8 c. Archivos Secuenciales indexados .......................................................................... 9

d. Archivos Indexados ................................................................................................ 9 e. Archivos Directos o de Dispersin ....................................................................... 10 Tipos de Sistemas de Archivos ................................................................................... 11 BSD FFS ................................................................................................................... 11 HFS+ (Mac OS) ........................................................................................................ 13 NTFS (Windows) ..................................................................................................... 14 Ext ........................................................................................................................... 15 Irix XFS .................................................................................................................... 16

Sistemas de Archivos
Introduccin
La mayora de los usuarios de los ordenadores estn ms o menos familiarizados con lo que un sistema de archivos tiene, lo que es un archivo, lo que es un directorio, y as sucesivamente. Este conocimiento se obtiene a partir de experiencia directa con los ordenadores. En lugar de basar nuestro anlisis en anteriores experiencias, que pueden variar de un usuario a otro, vamos a empezar de nuevo y pensar en el problema de almacenar informacin en una computadora, y luego avanzar desde all. El principal propsito de las computadoras es crear, manipular, almacenar y recuperar de datos. Un sistema de archivos proporciona el mecanismo para apoyar estas tareas. El ms alto nivel de un sistema de archivos es una forma de organizar, almacenar, recuperar y administrar informacin sobre un medio de almacenamiento permanente, como un disco. Los sistemas de archivos gestionan el almacenamiento permanente y forman parte integrante de todos los sistemas operativos. Hay muchos enfoques diferentes para la tarea de gestionar permanente de almacenamiento. En un extremo estn los sistemas de archivo sencillo que imponen restricciones como para los usuarios molestias y facilitar el uso del sistema de archivos difcil. En el otro extremo estn las tiendas de objetos persistentes y orientados a objetos de bases de datos que resumen toda la nocin de almacenamiento permanente para que nunca el usuario y el programador, incluso tengan que ser conscientes de ello. El problema del almacenamiento de la informacin, recuperar y manipular en una computadora es de carcter general, basta con que hay muchas soluciones al problema.

Conceptos generales
Cuando se habla de sistemas de archivos hay muchos trminos para referirse a ciertas conceptos, y por lo tanto es necesario definir cmo se har referencia especfica a la conceptos que componen un sistema de archivos. Tenemos una lista de los trminos desde el principio, cada edificio en la definicin anterior. Disco: Un medio de almacenamiento permanente de un determinado tamao. Un disco tambin tiene un tamao del sector o bloque, que es la unidad mnima que el disco puede leer o escribir. El tamao del bloque de la mayora de los discos modernos es de 512 bytes. Bloque: La unidad ms pequea de escritura de un disco o sistema de archivos. todo lo que un sistema de archivos no se compone de las operaciones realizadas en los bloques. Un sistema de archivos bloque es siempre el mismo tamao o ms grande (en mltiplos enteros) que el disco de tamao de bloque. Particin: Un subconjunto de todos los bloques en un disco. Un disco puede tener varias particiones. Volumen: El nombre que damos a una coleccin de bloques en algunos de almacenamiento medio (es decir, un disco). Es decir, un volumen puede ser de todos los bloques en un solo disco, una parte del nmero total de bloques en un disco, o puede incluso abarcar varios discos y ser todos los bloques en varios discos. El trmino "volumen" se utiliza para referirse a un disco o particin que se ha inicializado con un sistema de archivos. Superbloque: El rea de un volumen en un sistema de archivos almacena su informacin crtica de volumen mientras que un superbloque por lo general contiene informacin como qu tan grande es el volumen, el nombre de un volumen, y as sucesivamente. Metadatos: Un general termreferring a la informacin de que se trata de algo pero no forman parte directa de l. Por ejemplo, el tamao de un archivo es muy importante informacin sobre un archivo, pero no es parte de los datos en el archivo. Journaling: Un mtodo de asegurar la exactitud de los metadatos del sistema de archivos incluso en la presencia de fallas de energa o reinicios inesperados. I-node: El lugar donde un sistema de archivos almacena todos los metadatos necesarios sobre un archivo. El i-node tambin ofrece la conexin con el contenido del archivo y cualquier otro dato asociado al archivo. El trmino "i-nodo" es histrico y se origin en Unix. Un i-node es tambin se conoce como un bloque de control de archivos (FCB) o registro del archivo.

Extent: Un nmero de bloque de inicio y una longitud de bloques sucesivos en un disco. Por ejemplo, una medida podra empezar en el bloque 1000 y continuar por 150 bloques. Las extensiones son siempre contiguas. Las extensiones son tambin conocidas como bloque de carreras. Atributo: nombre (como una cadena de texto) y el valor asociado al nombre. El valor puede tener un tipo definido (cadena, entero, etc.), o puede ser simplemente datos arbitrarios.

Sistema de Archivos
La otra categora amplia de llamadas al sistema se relaciona con el sistema de archivos. Como ya se apunt, una funcin importante del sistema operativo es ocultar las peculiaridades de los discos y otros dispositivos de E/S y presentar al programador un modelo abstracto, aseado y bonito, de archivos independientes del dispositivo. Es obvio que se necesitan llamadas al sistema para crear, eliminar, leer y escribir archivos. Antes de que un archivo pueda leerse, debe abrirse, y despus de leerse debe cerrarse, as que tambin se incluyen llamadas para hacer estas cosas. A fin de contar con un lugar para guardar los archivos, los S.O tienen el concepto de directorio como mecanismo para agrupar los archivos. Por tanto, se necesitan llamadas al sistema para crear y eliminar directorios. Tambin se incluyen llamadas para poner un archivo existente en un directorio, y para quitar un archivo de un directorio. Las entradas de directorio pueden ser archivos u otros directorios. Este modelo tambin da pie a una jerarqua el sistema de archivos como se muestra en la Fig. 1-6.

Las jerarquas de procesos y de archivos estn organizadas como rboles, pero hasta ah llega la similitud. Las jerarquas de procesos no suelen ser muy profundas (casi nunca tienen ms de tres niveles), en tanto que las de archivos comnmente tienen cuatro, cinco o incluso ms niveles de profundidad. Las jerarquas de procesos por lo regular tienen una vida corta, generalmente de unos cuantos minutos como mximo, en tanto que la jerarqua de directorios podra existir durante aos. La propiedad y proteccin tambin es diferente para los procesos y para los archivos. Tpicamente, slo un proceso padre puede controlar o incluso acceder a un proceso hijo, pero casi siempre existen mecanismos para permitir que los archivos y directorios sean ledos por un grupo ms amplio que slo el propietario. Cada archivo dentro de la jerarqua de directorios se puede especificar dando su nombre de ruta a partir del tope de la jerarqua de directorios, el directorio raz. Semejantes nombres de ruta absolutos consisten en la lista de directorios por los que se debe pasar partiendo del directorio raz para llegar al archivo, separando los componentes con diagonales. En la Fig. 1-6, la ruta del archivo CSJOJ es IP rofesorado/Prof Ruiz/Cursos/CSJOJ. La diagonal inicial indica que la ruta es absoluta, es decir, que comienza en el directorio raz. En todo momento, cada proceso tiene un directorio de trabajo actual, en el cual se buscan los archivos cuyos nombres de ruta no comienzan con una diagonal. Por ejemplo, en la Fig. 1-6, si /Profesorado/Prof. Ruiz fuera el directorio de trabajo, el empleo del nombre de ruta Cursos/ CSJOI se referira al mismo archivo que el nombre de ruta absoluta dado en el prrafo anterior. Los procesos pueden cambiar de directorio de trabajo emitiendo una llamada al sistema que especifique el nuevo directorio de trabajo. Los archivos y directorios en MINIX se protegen asignando a cada uno un cdigo de proteccin binario de 9 bits. El cdigo de proteccin consiste en tres campos de 3 bits, uno para el propietario, uno para otros miembros del grupo del propietario (el administrador del sistema divide a los usuarios en grupos) y uno para toda la dems gente. Cada campo tiene un bit para acceso de lectura, uno para acceso de escritura y uno para acceso de ejecucin. Estos tres bits se conocen como bits rwx. Por ejemplo, el cdigo de proteccin rwxr-x--x significa que el propietario puede leer, escribir o ejecutar el archivo, otros miembros del grupo pueden leer o ejecutar (pero no escribir) el archivo, y el resto de la gente puede ejecutar (pero no leer ni escribir) el archivo. En el caso de un directorio, x indica permiso de bsqueda. Un guin significa que el permiso correspondiente est ausente.

Antes de poder leer o escribir un archivo, es preciso abrirlo, y en ese momento se verifican los permisos. Si est permitido el acceso, el sistema devuelve un entero pequeo llamado descriptor de archivo que se usar en operaciones subsecuentes. Si el acceso est prohibido, se devuelve un cdigo de error. Otro concepto importante en MINIX es el de sistema de archivos montado. Casi todas las computadoras personales tienen una o ms unidades de disco flexible en las que pueden insertarse y de las que pueden retirarse disquetes. A fin de contar con una forma congruente de manejar estos medios removibles (y tambin los CD-ROM, que tambin son removibles), MINIX permite conectar el sistema de archivos del disco flexible al rbol principal. Considere la situacin de la Fig. 1-7(a). Antes de la llamada MOUNT, el disco en RAM (disco simulado en la memoria principal) contiene el sistema de archivos raz, o primario, y la unidad O contiene un disquete que contiene otro sistema de archivos.

Organizacin y acceso a archivos (File organizittion and access)


La organizacin de archivos se refiere a la estructura lgica de los registros determinada por la manera en que se accede a ellos. La organizacin fsica del archivo en almacenamiento secundario depende de la estrategia de agrupacin y de la estrategia de asignacin de archivos. Para seleccionar una organizacin de archivos hay diversos criterios que son importantes: Acceso Rpido para recuperar la informacin Fcil actualizacin Economa de almacenamiento Mantenimiento simple. Fiabilidad para asegurar la confianza de los datos.

La prioridad relativa de estos criterios va a depender de las aplicaciones que va a usar el archivo. El numero de alternativas de organizacin de archivos que se han implementado o propuesto es inmanejable, incluso para un libro dedicado a los sistemas de archivos. La mayor parte de las estructuras empleadas en los sistemas reales se encuadran en una de estas categoras o puede implementarse como una combinacin de estas:

a. b. c. d. e.

Pilas (The pile) Archivos secuenciales (sequential file) Archivos Secuenciales indexados. (indexed sequential file) Archivos indexados.(indexed file) Archivos directos o de dispersin (direct, or hashed, file).

a. Pilas
La forma menos complicada de organizacin de archivos puede denominarse la pila. Los datos se recolectan en el orden en que llegan. Cada registro consiste en una rfaga de datos. El propsito de la pila es simplemente acumular la masa de datos y guardarlo. Como no hay estructura para el archivo de la pila. el acceso a registro es por bsqueda exhaustiva..Si se quiere todos los registros que contienen un campo particular o que tienen un valor determinado para ese campo, debe buscarse en el archivo entero. Los archivos de pilas se aplican cuando los datos se recogen y almacenan antes de procesarlos o cuando no son fciles de organizar. Este tipo de archivo usa bien el espacio cuando los datos almacenados varan en tamao y en estructuras. Este tipo de archivos no se adapta a la mayora de las aplicaciones.

b. Archivos Secuenciales
La forma ms comn de estructura de archivo es el archivo secuencial. En este tipo de archivo, un formato fijo es usado para los registros. Todos los registros tienen el mismo tamao, constan del mismo nmero de campos de tamao fijo en un orden particular. Como se conocen la longitud y la posicin de cada campo, solamente los valores de los campos se necesitan almacenarse; el nombre del campo y longitud de cada campo son atributos de la estructura de archivos. Un campo particular, generalmente el primero de cada registro se conoce como el campo clave. El campo clave identifica unvocamente al registro. as, los valores de la clave para registros diferentes son siempre diferentes. Los archivos secuenciales son tpicamente utilizados en aplicaciones de proceso de lotes Y son ptimos para dichas aplicaciones si se procesan todos los registros.

La organizacin secuencias de archivos es la nica que es fcil de usar tanto en disco como en cinta. Para las aplicaciones interactivas que incluyen peticione s o actualizaciones de registros individuales, los archivos secuenciales ofrecen un rendimiento pobre. Normalmente un archivo secuencial se almacena en bloques, en un orden secuencial simple de los registros. La organizacin fsica del archivo en una cinta o disco se corresponde exactamente con la ubicacin lgica del archivo. En este caso, el procedimiento para ubicar los nuevos registros en un archivo de pila separado, llamado archivo de registro (log file) o archivo de transacciones. Peridicamente, se realiza una actualizacin por lotes que mezcla el archivo de registro con el archivo maestro para producir un nuevo archivo en secuencia correcta de claves.

c. Archivos Secuenciales indexados


Un mtodo popular para superar las desventajas de los archivos secuenciales es el del archivo secuencias indexado. El archivo secuencial indexado mantiene las caractersticas bsicas de los archivos secuenciales: los registros estn organizados en una secuencia basada en un campo. Dos caractersticas se aaden: un ndice del archivo para soportar los accesos aleatorios y un archivo de desbordamiento (overflow). El ndice provee una capacidad de bsqueda para llegar rpidamente a las proximidades de un registro deseado. El archivo de desbordamiento (overflow) es similar al archivo de registro usado en un archivo secuencial, pero esta integrado de forma que los registros del archivo de desbordamiento se ubican en la direccin de un puntero desde si registr precedente. En la estructura secuencial indexada ms simple, se usa un solo nivel de indexacin. El ndice, en este caso, es un archivo secuencial simple. Cada registro del archivo ndice tiene dos campos: un campo clave, que es el mismo que el campo clave del archivo principal y un puntero al archivo principal. Para encontrar un campo especfico se busca en el ndice hasta encontrar el valor mayor de la clave que es igual o precede al valor deseado de la clave. La bsqueda contina en el archivo principal a partir de la posicin indicada por el puntero.

d. Archivos Indexados
Los archivos secuenciales indexados retienen la limitacin del archivo secuencial: la eficacia en el procesamiento se limita al basado en un nico campo del archivo. Cuando es necesario buscar un registro basndose en algn otro atributo distinto del campo clave ambas formas de archivo secuencial no son adecuadas. En algunas aplicaciones esta flexibilidad es deseable. Para alcanzar esta flexibilidad, se necesita una estructura que utilice mltiples ndices, uno para cada tipo de campo que pueda ser objeto de la bsqueda.

Se suelen utilizar dos tipos de ndices. Uno ndice exhaustivo contiene una entrada para cada registro del archivo principal. Otro ndice parcial contendr entradas a los registros donde este el campo de inters. Con registros de longitud variable, algunos registros no contendrn todos los campos. Los archivos indexados son muy utilizados en aplicaciones donde es critica la oportunidad de la informacin y donde los datos son rara vez procesados de forma exhaustiva. e. Archivos Directos o de Dispersin Los archivos directos explotan la capacidad de los discos para acceder directamente a cualquier bloque de direccin conocida. Como en los archivos secuenciales y secuenciales indexados, se requiere un campo clave en cada registro. Sin embargo, aqu no hay concepto de ordenamiento secuencial.

Tipos de Sistemas de Archivos


Cada sistema operativo tiene su propio sistema de archivo nativo cada una con una mezcla interesante de caractersticas. Una seccin slo proporciona detalles de fondo en el sistema de archivos de inters histrico (BSD FFS), los sistemas de archivos tradicionales modernos (Linux ext2), Macintosh HFS, y otros avanzados sistemas de archivos actuales (WindowsNT'sNTFS y XFS de SGI IRIX). Histricamente, los sistemas de archivos proporcionan un mtodo simple de gestin de almacenamiento. Los sistemas de archivos ms bsicos de apoyo tienen una simple estructura jerrquica o directorios y archivos. Este diseo ha sido testigo de muchas implementaciones.

BSD FFS El FFS BSD mejora en el rendimiento y la fiabilidad de los anteriores sistemas de archivos de Unix y fij el estndar para casi una dcada en trminos de la robustez y velocidad. En su esencia, la ECA consiste en un superbloque, un bloque de mapa de bits, un mapa de bits de i-nodo, y una serie de i-nodes preasignados. Este diseo sigue siendo la base fundamental de muchos sistemas de archivo. La primera (y sencillo) FFS tcnica utilizada para mejorar el rendimiento de previos sistemas de archivos de Unix era usar mucho mayor tamao de los archivos de bloques del sistema. ECA utiliza tamaos de bloques que son un poder superior o igual a 4096 bytes dos. Esta tcnica slo represent el doble de rendimiento respecto a los anteriores los sistemas de archivos. La leccin es clara: un disco de lectura contigua proporciona ancho de banda mucho mayor que tener que tratar de leer los diferentes bloques de un archivo. Es imposible exagerar la importancia de esto. La lectura o escritura de bloques contiguos de un disco es sin duda la forma ms rpida posible de acceder a los discos y probablemente lo seguir siendo en el futuro previsible. Mayor tamao de los bloques tienen un costo: el espacio en disco desperdiciado. Un archivo de 1 byte todava consume un bloque del sistema de archivos entero. De hecho, McKusick informa que con una De 4096 bytes de bloque del sistema de archivos y un conjunto de archivos de alrededor de 775 MB de tamao, es 45,6% de gastos indirectos para almacenar los archivos (es decir, el sistema de archivos utiliza 353 MB de extra el espacio para almacenar los archivos). ECA supera esta limitacin tambin la gestin de fragmentos dentro de un bloque. Los fragmentos pueden ser tan pequeos como 512 bytes, aunque ms tpicamente son 1024 bytes. El uso de fragmentos en FFS permite utilizar un tamao de bloque grande para archivos ms grandes, mientras que no prdida de cantidades excesivas de espacio para archivos pequeos.

El FFS tcnica siguiente utiliza para mejorar el rendimiento consiste en minimizar el disco movimiento de la cabeza. Otro lugar comn en las unidades de disco es que el tiempo de bsqueda para mover los cabezales del disco de una parte de un disco a otro es considerable. A travs de una cuidadosa organizacin de la distribucin de datos en el disco, el sistema de archivos puede reducir al mnimo los tiempos de bsqueda. Para lograr esto, FFS introdujo el concepto de grupos de cilindros. Un grupo de cilindros intentos de aprovechar la geometra de un disco (Es decir, el nmero de cabezas, pistas, cilindros y sectores por pista) para mejorar rendimiento. Fsicamente a un grupo de cilindros es la coleccin de todos los bloques en la misma pista en todos los diferentes jefes de un disco (Figura 3-1).

En esencia, un grupo de cilindros es un corte vertical del disco. El rendimiento beneficio de esta organizacin es que la lectura de bloques sucesivos en un cilindro nico grupo que consiste en cambiar las cabezas. Conmutacin de las cabezas del disco es una descarga elctrica operacin y por lo tanto mucho ms rpido que una operacin mecnica, tales como moviendo la cabeza.

HFS+ (Mac OS) El sistema de ficheros utilizado por Apple desde la dcada de los noventa es el sistema jerrquico HFS (Hierarchical File System). Este sistema de ficheros fue introducido en los ordenadores Macintosh de la compaa a partir de la produccin de su sistema operativo Mac OS 8.1 en 1998. Los reproductores de vdeo y msica digital, iPod, utilizan una variante de este sistema de ficheros HFS+, que a su vez se dio paso al nuevo sistema operativo de Apple, el Mac OS X. HFS+ es una versin mejorada del sistema de ficheros HFS. Esta versin soporta indexamiento de datos, cuotas, tamaos de ficheros mucho ms grandes (bloques de 32 bits en vez de los usuales de 16) y cambiaron el uso de font para el nombrado de sus ficheros, de Mac OS Roman a Unicode. Otras de las mejoras a este sistema de ficheros incluyen: Nombres de ficheros de hasta 255 caracteres. Manejo de memoria con bloques continuos ms pequeos (32 bits). Los atributos de ficheros y directorios pueden ser extendidos para uso futuro. El sistema de codificacin de datos se estandariz (Unicode). El tamao mximo de ficheros es de 2^63 bytes. El sistema de ficheros HFS+ es un sistema de ficheros robusto y como la mayora de los sistemas indexados, nicamente indexa los metadatos de la informacin. Aunque este sistema de ficheros no es el ms avanzado en el mercado, s ha sido de gran uso y utilidad para la compaa Apple ya que sus ventajas y funciones le han provisto a la misma de la capacidad de desarrollar un sistema operativo robusto, eficiente y seguro que lo han hecho competir directamente con el lder en la industria, la compaa Microsoft.

NTFS (Windows) El sistema de ficheros NTFS (New Technology File System) introducido al mercado por la compaa Microsoft en 1993 vino a remplazar al sistema de ficheros FAT en sus nuevos y ms robustos sistemas operativos. Todos los sistemas operativos que emergieron a partir de Windows NT utilizan este sistema de ficheros. Hay muchas mejoras que fueron introducidas con NTFS a los sistemas de ficheros Microsoft. Entre las principales encontramos que los sistemas NTFS permiten el control de datos a travs de permisos controlados por listas de acceso (ACL). Tambin se incorpor al sistema de ficheros NTFS las ligas rgidas, la capacidad de tener mltiples flujos de datos, el uso de estructuras avanzadas de datos y la incorporacin de metadatos junto a los ficheros. Finalmente, este nuevo sistema de ficheros incorpor tcnicas utilizadas en los sistemas de ficheros UNIX y LINUX como el sistema de indexamiento de datos. Existen cinco diferentes versiones de NTFS hoy en da. Las primeras tres versiones, 1.0 - 1.2 fueron desarrolladas exclusivamente para el uso de Windows NT. A partir de la versin 3.0, podemos encontrar NTFS en sistemas operativos mucho ms modernos como Windows 2000. Mejoras a esta misma versin aparecieron con el ttulo de NTFS v3.1, 4.0, 5.0 y 6.0, los cuales son el sistema de ficheros que actualmente promueve la compaa Microsoft en sus ms modernos sistemas operativos como Windows XP, Windows 2003 Server y Windows Vista. A diferencia de los dems sistemas operativos, Windows en cualquiera de sus versiones utiliza una abstraccin de datos basadas en letras para que los usuarios distingan los diferentes discos o particiones de sus sistemas de ficheros. Tal es el caso del directorio central del sistema operativo C:\WINDOWS\ el cual representa el directorio Windows en la particin primaria del disco. La letra C es la ms comn en este sistema de ficheros y es la que representa normalmente la particin central del medio y en la cual se carga el sistema operativo durante el arranque. La tradicin de utilizar la letra C como identificador de disco viene desde los primeros sistemas de ficheros de la compaa y desde la aparicin de su primer sistema operativo, MSDOS, donde podamos encontrar las letras A y B, representando discos foppy y la letra C representando el disco rgido.

Ext El sistema de ficheros ext, del ingls Extended File System, es el primer sistema de ficheros nativo de Linux (que fue desarrollado especfcamente para Linux) y fue incorporado al ncleo de Linux desde enero de 1993. Es la primera versin de ext3 y fue el sistema de ficheros predeterminado para Linux por muchos aos, mismo que todava se encuentra en uso. ext3 El sistema de ficheros ext3, del ingls Third Extended File System, fue aadido al ncleo de Linux desde la versin 2.4.15 en noviembre de 2001 y es el mas comnmente utilizado en Linux, aun cuando no es el nico sistema de ficheros nativo de Linux que incluye caractersticas de journaling (reiserfs tambin lo ofrece). Este tipo de sistemas de ficheros, comparados con ext2, mejora la capacidad de recuperacin de fallas, ya que mantienen un fichero especial llamado un journal que es utilizado para reparar cualquier inconsistencia en el sistema de ficheros que ocurra como resultado de un apagado no limpio de el ordenador, como puede ser una falla en la energa elctrica o en el software, sin necesidad de correr ninguna prueba de consistencia en el sistema de ficheros durante el reinicio despus del apagado no limpio, ya que garantiza la consistencia interna. El tiempo de recuperacin de una falla depende directamente del tamao del journal que se utiliza para mantener la consistencia. Con el tamao predeterminado, la recuperacin se logra en aproximadamente un segundo. Con respecto a la velocidad, an cuando se escriben algunos datos ms de una vez, ext3 es ms veloz que ext2 debido a que el Journaling optimiza el movimiento de la cabeza del disco duro. ext2 El sistema de ficheros ext2, del ingls Second Extended File System, es el predeterminado para versiones anteriores de Linux. Fue desarrollado como una versin mejorada del sistema de ficheros ext. Tiene las mismas caractersticas que ext3, con la nica diferencia de que ext2 no provee las caractersticas de journaling. Cuando se trata de un disco duro pequeo (de unos cuantos Gigabytes), es recomendable utilizar ext2 en lugar de ext3 como sistema de ficheros, ya que la caracterstica de journaling requiere que se aparte una porcin del disco para el journal, sin embargo dicha caracterstica es de utilidad limitada en sistemas de ficheros pequeos. La razn consiste en que durante el reinicio despus de un apagado no limpio, ext2 requiere que el programa e2fsck corra una prueba de consistencia y repare cualquier inconsistencia antes de que el sistema de ficheros pueda ser montado, lo cual demora unos cuantos minutos en el caso de sistemas de ficheros pequeos pero en el caso de sistemas de ficheros con varios Gigabytes puede llegar a demorar horas. Dentro de los sistemas de ficheros nativos de Linux, ext2 es el ms porttil, debido a que es en el que ms se facilita transferir informacin desde y hacia otros sistemas de ficheros.

Irix XFS El sistema operativo Irix, una versin de Unix de SGI, ofrece una muy sofisticasistema de archivos cado, XFS. XFS soporta journaling, archivos de 64 bits, y par muy paralelo operacin. Una de las principales fuerzas que rigen el desarrollo de XFS fue el apoyo a los sistemas de archivos de gran tamao-los sistemas de archivos con decenas o cientos de gigabytes de almacenamiento en lnea, millones de archivos y archivos de gran tamao que abarca muchos gigabytes. XFS es un sistema de archivos para "Big Iron". Mientras que XFS soporta todas las abstracciones tradicionales de un sistema de archivos, que departes de manera espectacular en su puesta en prctica de esas abstracciones. XFS es diferente de la aplicacin directa de un sistema de archivos en su gestin de espacio libre en disco, i-nodos, los datos de archivo y el contenido del directorio. Como se expuso anteriormente, themost comn bloques de forma libre en el disco tomanage en un sistema de archivos es utilizar un mapa de bits con 1 bit por bloque. XFS en su lugar utiliza un par de rboles B + para gestionar el espacio libre en disco. XFS se divide un disco hasta en grandes trozos de tamao denominados grupos de distribucin (un trmino con un significado similar en BFS). Cada grupo mantiene la asignacin de un par de B + rboles que la informacin de registro sobre el espacio libre en el grupo de asignacin. Uno de los registros de los rboles B + espacio libre ordenados por el nmero inicial del bloque. El B + otros tipos de rboles por los bloques libres su longitud. Este programa ofrece la posibilidad de que el sistema de archivos para encontrar libre espacio en disco basado en la proximidad tanto al espacio ya asignado o base en la medida que necesite. Es evidente que esta organizacin ofrece ventajas significativas para los eficiente para encontrar el bloque de la derecha de espacio en disco para un archivo determinado. La nica desventaja potencial de este esquema es que el B + rboles bothmaintain la misma informacin en diferentes formas. Esta duplicacin puede causar inconsistencias si, por cualquier razn, los dos rboles pierden la sincronizacin. Debido a que XFS es diario, sin embargo, esto no es generalmente un problema. XFS tambin no asignar previamente los i-nodos como se hace en archivos tradicionales sistemas Unix TEM. En XFS, en lugar de tener una mesa de tamao fijo de i-nodos, cada asignacin grupo asigna bloques de disco para i-nodos en una funcin de las necesidades. XFS almacena la ubicacin de los i-nodos en un rbol B + en cada asignacin de los grupos-una muy inusual la organizacin. Los beneficios son claros: no hay espacio en disco desperdiciado por archivos innecesarios y no hay lmites en el nmero de archivos despus de crear el sistema de archivos.

XFS utiliza mapas de medida para gestionar los bloques asignados a un archivo. Un exmapa de la tienda es una direccin de bloque de inicio y una longitud (expresada como un nmero de bloques). En lugar de simplemente mantener una lista de bloques de tamao fijo con acceso directo, bloques indirectos, doble indirectos, y el triple de indirectos, XFS vuelve a utilizar los rboles B +. El rbol B + es un ndice por el bloque de desplazamiento en el fichero que los mapas de medida. Es decir, la extensin que conforman un archivo se almacenan en un rbol B + ordenados por el cual posicin de los archivos que corresponden. Los rboles B + XFS permite usar extensiones de tamao variable. El costo es de que el la aplicacin es mucho ms difcil que usar bloques de tamao fijo. La ventaja es que una pequea cantidad de datos en una medida muy grande puede asignar regiones de un archivo. XFS Puede asignar hasta dos millones de bloques con un punto del mapa. Otra salida de un sistema de archivos tradicional es que XFS usa B + rboles para almacenar el contenido de un directorio. Un sistema de archivos tradicionales tiendas de la contiendas de campaa de un directorio en una lista lineal. El almacenamiento de entradas de directorio no lineal escala bien cuando hay cientos o miles de artculos. XFS utiliza de nuevo B + rboles para almacenar las entradas de un directorio. El tipo de rbol B + las entradas de base en su nombre, lo que hace que las bsquedas de archivos especficos en un directorio muy eficiente. Este uso de los rboles B + permite XFS para administrar eficientemente los directorios con varios cientos de miles de entradas.

El ltimo aspecto que sobresale en XFS es su apoyo a los paralelos de I / O. Gran parte de alta gama de hardware de SGI es altamente paralelas, con algunas mquinas de la ampliacin de hasta 1024 procesadores. Apoyar de grano fino de bloqueo era esencial para XFS. Aunque la mayora de los sistemas de archivos permiten el mismo archivo para abrir mltiples veces, suele haber un bloqueo alrededor del i-nodo que impide que cierto acceso simultnea en el archivo. XFS elimina esta limitacin y permite que una sola escritor / multireader acceso a los archivos. Para los archivos que residen en la cach del bfer, este permite mltiples CPUs para copiar los datos al mismo tiempo. Para los sistemas con grandes arreglos de discos, lo que permite mltiples lecturas para acceder al archivo permite que mltiples remisiones que pondrn en cola a los controladores de disco.

Bibliografa Practical File System Design:The Be File System, Dominic Giampaolo Andrew S. Tanenbaum. Sistemas Operativos Modernos. Ed. Pearson