P. 1
Estructuras Almacenamiento de Archivos

Estructuras Almacenamiento de Archivos

|Views: 5|Likes:
Publicado porManuel Gonzalez

More info:

Published by: Manuel Gonzalez on Oct 10, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

10/10/2013

pdf

text

original

1

Tema: Almacenamiento y estructuras de archivos

2

Contenido
Resumen ejecutivo ................................................................................................................................. 3 Introducción ............................................................................................................................................. 6 Almacenamiento y estructuras de archivos ....................................................................................... 7 Jerarquías de memoria y dispositivos de almacenamiento. ........................................................... 7 Almacenamiento de bases de datos ................................................................................................... 8 Dispositivos de almacenamiento secundario ..................................................................................... 8 Descripción del hardware de los dispositivos de disco. ................................................................... 8 Dispositivos de almacenamiento en cinta magnética. ..................................................................... 9 Almacenamiento de bloques en el búfer .......................................................................................... 10 Ubicación de los registros de fichero en disco. ............................................................................... 10 Registros y tipos de registros. ............................................................................................................ 10 Ficheros, registros de longitud fija y longitud variable. .................................................................. 10 Bloqueo de registros y registros extendidos frente a no extendidos. .......................................... 10 Cabeceras de fichero........................................................................................................................... 11 Operaciones sobre ficheros ................................................................................................................ 11 Ficheros de registros desordenados (ficheros heap) ..................................................................... 13 Ficheros de registros ordenados (ficheros ordenados) ................................................................. 13 Técnicas de dispersión ........................................................................................................................ 15 Dispersión interna ................................................................................................................................ 15 Dispersión externa para los ficheros de disco ................................................................................. 16 Otras organizaciones principales de ficheros .................................................................................. 17 Ficheros de registros mezclados ....................................................................................................... 17 Paralelismo del acceso al disco mediante la tecnología RAID ..................................................... 17 Organizaciones y niveles de RAID .................................................................................................... 18 Nuevos sistemas de almacenamiento .............................................................................................. 19 Redes de área de almacenamiento .................................................................................................. 19 Almacenamiento conectado a la red ................................................................................................. 19 Conclusión ............................................................................................................................................. 20 Anexos .................................................................................................................................... 21 Bibliografía .............................................................................................................................. 22

Un disco es un dispositivo de acceso aleatorio. un registro es una colección de valores de datos. En el nivel de almacenamiento secundario tenemos discos magnéticos. DRAM. podemos almacenar parte de un registro en un bloque y el resto en otro. Los datos se almacenan en forma de registros. Siempre que el registro es más grande que el bloque. Jerarquías de memoria y dispositivos de almacenamiento. Cuando el tamaño del bloque es mayor que el tamaño del registro. Para aumentar la capacidad. Bloqueo de registros y registros extendidos frente a no extendidos. Descripción del hardware de los dispositivos de disco.3 Resumen ejecutivo Almacenamiento y estructuras de archivos Los modos de almacenamiento forman una jerarquía que incluyen 2 categorías: Almacenamiento principal: incluye los medios de almacenamiento en los que la CPU puede operar. En el nivel de almacenamiento principal tenemos a la memoria cache. si los registros no tienen permitido sobrepasar los . cada círculo es una pista. los discos ópticos y las cintas. los discos se ensamblan como paquetes de discos. Registros y tipos de registros. CD-ROM y DVD. para utilizar este espacio desaprovechado. el bloque puede contener varios registros. Los registros normalmente describen entidades y sus atributos. la información se almacena en la superficie del disco en círculos concéntricos. Almacenamiento de bases de datos La mayoría de las bases de datos se almacenan en almacenamiento secundario. debemos usar organización extendida. el mecanismo que lee y escribe un bloque es la cabeza de lectura/escritura del disco. Almacenamiento secundario: incluye los discos magnéticos.

 Nivel 4: utilizan la segmentación de datos a nivel de bloque. se dice que es organización no extendida. y cuando se quiere leer algún dato en el disco. Una cabecera de fichero contiene información sobre un fichero que los programas del sistema necesitan para acceder a los registros. Y consiste en la escritura de los datos en dos discos físicos idénticos que funciona como uno lógico. el objetivo del RAID es igualar las diferencias en cuanto a velocidad y rendimiento entre los discos. hasta que el primero sea reparado. la memoria y los microprocesadores. Las relaciones entre registros de varios ficheros se pueden representar mediante campos de conexión (podría entenderse como forein key. ellos usan RAID. Disco dedicado a paridad .4 límites de un bloque.  Nivel 1: Discos en espejo. Mejora de la fiabilidad con RAID Para reducir los fallos en los disco se implementara una técnica de redundancia que se denomina espejo (mirroring). si este presenta fallas. Varios discos dedicados a paridad. Mejora del rendimiento con RAID La mejora de rendimiento seria la utilización de segmentación de datos para lograr un mayor tiempo de respuesta en la solicitud de lectura y escritura de datos. no cuenta con redundancia (espejos).  Nivel 2: utiliza una redundancia al estilo de la memoria utilizando códigos Hamming división por bits. Ficheros de registros mezclados Existen situaciones donde las entidades o los registros deban interrelacionarse de distintas formas. buenas características en escritura. se utiliza el otro disco.  Nivel 3: utiliza un disco de paridad sencilla que cuenta con el controlador de disco para determinar el disco que ha fallado. Paralelismo del acceso al disco mediante la tecnología RAID Los dispositivos de almacenamiento secundario cuentan con mayor rendimiento y aumentado su fidelidad. Organizaciones y niveles de RAID  Nivel 0: utiliza segmentación.

*Close (cerrar). Técnicas de dispersión Otro tipo de organización de ficheros está basado en la dispersión. . *Modify (modificar). es decir. según el cual los registros se guardan en el fichero en el mismo orden en que se insertan. Guarda información redundante adicional para protección contra fallos de disco múltiple. Ficheros de registros desordenados Es el tipo de organización más sencillo y básico. denominado campo de ordenación. los registros se insertan al final del fichero.5  Nivel 5: distribuye los datos y la información de paridad por todos los discos. Operaciones sobre ficheros Las operaciones sobre ficheros se pueden agrupar en operaciones de recuperación y operaciones de actualización. *Find (o Locate) (buscar). que proporciona un acceso muy rápido a los registros bajo ciertas condiciones de búsqueda. *Reset (reiniciar). *Insert (insertar). *Delete (borrar). *Open (abrir). Ficheros de registros ordenados Los registros de un fichero se pueden ordenar físicamente en el disco en función de los valores de uno de sus campos.  Nivel 6: Esquema de redundancia P + Q. *Read (o Get) (leer u obtener). *FindNext (buscar siguiente).

Esta es una pequeña introducción a lo que es el tema de estructura de datos y almacenamiento para las bases de datos. .6 Introducción Hoy en día los dispositivos de almacenamiento y memorias han transcendido fronteras debido a las nuevas capacidades que han aparecido. inserción. Como es bien sabido las computadoras poseen dos importantes memorias (primaria o RAM y secundaria o ROM) con las funciones de acceder a las direcciones de memoria y el almacenamiento de los datos. Prácticamente estas memorias son generalizaciones de la gran gama de dispositivos disponibles actualmente y que se podrían descomponer en varias jerarquías dependiendo del tipo de almacenamiento. por lo tanto se debieron encontrar nuevas estructuras de datos o ficheros para mejorar los tiempos de respuesta tanto en consulta. también se han tenido que implementar nuevas técnicas con respecto a lo que guarda una base de datos. ya que los tamaños en almacenamiento han aumentado considerablemente. actualización y borrado de los datos. Con los avances que han surgido en memoria secundaria.

La ventaja de la DRAM es su bajo coste. Los CD-ROM almacenan los datos ópticamente y los lee mediante un láser. son de alta densidad que usa tecnología EEPROM (memoria de solo lectura programable y borrable electrónicamente). Por lo general las Base de Datos permanentes residen en el almacenamiento secundario y se leen en el primario. En el nivel de almacenamiento principal tenemos a la memoria cache. Almacenamiento secundario o terciario: incluye los discos magnéticos. las cintas en el extremo más caro de la jerarquía. la memoria Flash. los DVD es un estándar reciente en discos ópticos. pero tienen un acceso más lento.7 Almacenamiento y estructuras de archivos Los modos de almacenamiento forman una jerarquía que incluyen 2 categorías: Almacenamiento principal o primario: incluye los medios de almacenamiento en los que la CPU puede operar. Entre la DRAM y el almacenamiento en disco magnético hay otra memoria. así como el almacenamiento en masa en forma de CD-ROM y DVD y finalmente. los discos WORM (escribir una vez. que es una RAM estática. terabytes. pero de poca capacidad. las memorias cache. muy popular debido a que no es volátil. son baratos. El siguiente nivel en el almacenamiento principal es la DRAM dinámica que proporciona el área de trabajo para que la CPU almacene programas y datos (memoria principal). Jerarquías de memoria y dispositivos de almacenamiento. megabytes. Los programas residen y se ejecutan en la DRAM. . primero se copian en el almacenamiento principal. Las memorias jukebox ópticos utilizan un array de bandejas CD-ROM. su ventaja es su alta velocidad de acceso. La memoria cache la utiliza la CPU para acelerar la ejecución de los programas. como la memoria principal de la PC. Micro). gigabytes. leer muchas veces). Esta categoría da un acceso rápido a los datos. los discos ópticos y las cintas. En el nivel de almacenamiento secundario y terciario. Los medios removibles o extraíbles están considerados como terciario. la jerarquía incluye los discos magnéticos. La capacidad de almacenamiento se mide en kilobytes. Tienen gran capacidad. La CPU no puede procesar directamente los datos almacenados en un almacenamiento secundario o terciario. el problema es que debe borrarse y escribirse un bloque entero simultáneamente (USB. pero muy lenta.

Los datos almacenados en el disco se organizan como ficheros de registros. y los grandes paquetes de disco que se usan en los servidores y los mainframes tienen capacidad de cientos de GB. 3-El coste de almacenamiento por unidad es inferior para el almacenamiento secundario en disco. Un fichero heap (desordenado) coloca los registros en el disco sin un orden particular. 2-Las circunstancias de perdida de datos son menores en los secundarios. Hay varias organizaciones principales de ficheros. los discos duros almacenan desde cientos de MB hasta decenas de GB. los disquetes que se utilizaban con los microcomputadoras almacenaban de 400kb a 1-5MB. Un fichero disperso utiliza una función de dispersión (hash) aplicada a un campo concreto (para determinar la ubicación de un registro en el disco). Descripción del hardware de los dispositivos de disco.8 Por último. . Los jukeboxes de cintas que contienen un banco de cintas que se catalogan y pueden cargarse automáticamente en las unidades de cinta. Almacenamiento de bases de datos La mayoría de las bases de datos se almacenan en almacenamiento secundario por: 1-Porque son muy grandes para entrar en la memoria principal. las cintas magnéticas se utilizan para archivar y para el almacenamiento de las copias de seguridad de los datos. Un fichero ordenado mantiene los registros por el valor de un campo particular. Dispositivos de almacenamiento secundario Veremos características de los dispositivos de almacenamiento de disco magnético y de la cinta magnética. La capacidad de un disco es el número de bytes que puede almacenar. añadiendo los registros nuevos al final. Observe la imagen 1 en anexos.

000 rpm. En los paquetes de disco. Son dispositivos de acceso secuencial. una por cada superficie. hay otro retardo. cada uno de esos círculos es una pista. El controlador de disco. En un disquete. Los tiempos de búsqueda típicos son de 1 a 10 msegs en la sobremesa y de 3 a 8 msegs en los servidores. Por lo tanto. a 15.9 Para aumentar la capacidad. Para transferir un bloque de disco. Dispositivos de almacenamiento en cinta magnética. es la suma del tiempo de búsqueda. el disco gira siempre que se inicia una solicitud de lectura o escritura. Los paquetes de disco con varias superficies están controlados por varias cabezas de L/E. es lo que se conoce como tiempo de transferencia del bloque. el controlador de disco primero debe colocar mecánicamente la cabeza de lectura/escritura en la pista correcta. dada su dirección. o 2 mseg. los discos se ensamblan como paquetes de discos. . que es una parte de un sistema denominado unidad de disco. que se produce mientras el principio del bloque deseado gira hasta su posición bajo la cabeza. el tiempo por rotación es de 4mseg y el retardo rotacional medio es el tiempo por media revolución. por ejemplo. el tiempo total para localizar y transferir un bloque arbitrario. aún se necesita algo más de tiempo para transferir datos. controla esta y su interacción con el sistema. muchas superficies. Por último. las pistas de las distintas superficies que tienen el mismo diámetro reciben el nombre de cilindro. Un disco es un dispositivo de acceso aleatorio. que incluye muchos discos. la división de una pista en bloques de disco(o página) es establecida por el sistema operativo durante el formateo del disco. denominado retardo rotacional o latencia. Este retardo depende de las rpm del disco. Siguiendo esto. dada su dirección. El tiempo requerido para ello es el tiempo de búsqueda. el mecanismo hardware actual que lee y escribe un bloque es la cabeza de lectura/escritura del disco. incrustado en la unidad de disco. La información se almacena en la superficie del disco en círculos concéntricos de poca anchura. el retardo rotacional y el tiempo de transferencia del bloque.

Los registros normalmente describen entidades y sus atributos. Los datos normalmente se almacenan en forma de registros. Un registro consta de una colección de valores o elementos de datos relacionados. registros de longitud fija y longitud variable. Un puntero al final del primer bloque apunta al bloque que contiene el resto del registro. Un fichero es una secuencia de registros. Esta organización se llama extendida porque los registros pueden abarcar más de un bloque. Ubicación de los registros de fichero en disco. Bloqueo de registros y registros extendidos frente a no extendidos. el bloque puede contener varios registros. se dice que el fichero está compuesto por registros de longitud variable. Si el fichero hay registros que tienen tamaños diferentes. donde cada valor está formado por uno a más bytes y corresponde a un campo concreto del registro. se dice que el fichero está compuesto por registros de longitud fija. Los registros de un fichero deben asignarse a bloques de disco porque es la unidad de transferencia de datos entre el disco y la memoria. Si cada registro del fichero tiene el mismo tamaño. se pueden reservar varios búferes en la memoria principal para acelerar la transferencia. . Cuando el tamaño del bloque es mayor que el tamaño del registro. Para utilizar este espacio desaprovechado. Observe la imagen 2 en anexos. Una colección de nombres de campos y sus correspondientes tipos de datos constituyen un tipo de registro. Registros y tipos de registros.10 Usa bobina de cinta. son importantes para la copia de seguridad de las bases de datos. Almacenamiento de bloques en el búfer Cuando es necesario transferir varios bloques desde el disco a la memoria principal. podemos almacenar parte de un registro en un bloque y el resto en otro. no se usa para almacenar datos online. Ficheros.

*Find (o Locate) (buscar). debemos usar organización extendida. Cabeceras de fichero. y recupera su cabecera. se utilizan diferentes verbos para indicar si el registro localizado será . se dice que es organización no extendida.11 Siempre que el registro es más grande que el bloque. Presentamos a continuación un conjunto de operaciones representativas. Las segundas modifican el fichero mediante la inserción o la eliminación de registros. Prepara el fichero para la lectura o escritura. En ocasiones. *Reset (reiniciar). Busca el primer registro que satisface una condición de búsqueda. incluye información para determinar las direcciones de disco de los bloques del fichero y las descripciones de formato del registro. Operaciones sobre ficheros Las operaciones sobre ficheros se pueden agrupar en operaciones de recuperación y operaciones de actualización. Las primeras no cambian ningún dato del fichero. Las operaciones de localización y acceso a los registros de un fichero varían de un sistema a otro. Una cabecera de fichero contiene información sobre un fichero que los programas del sistema necesitan para acceder a los registros. que se convierte en el registro actual. Asigna los búferes apropiados para albergar los bloques del fichero. El puntero del fichero apunta al registro del búfer. Transfiere el bloque que contiene ese registro a un búfer de la memoria principal (si todavía no está en el búfer). o modificando los valores de los campos. puesto que únicamente localizan ciertos registros para que los valores de sus campos se puedan examinar o procesar. Establece el puntero del fichero al principio del mismo. Si los registros no tienen permitido sobrepasar los límites de un bloque. Hace que el puntero de un fichero abierto apunte al principio del fichero. *Open (abrir).

El registro se almacena en el búfer y se convierte en el registro actual. Completa el acceso al fichero liberando los búferes y ejecutando cualquier otra operación de limpieza necesaria. En los sistemas de bases de datos. lo que puede hacer necesario leer del disco el siguiente bloque del fichero. en caso contrario. *Read (o Get) (leer u obtener). Si el fichero simplemente se ha abierto o reiniciado. Busca el primer registro que satisface una condición de búsqueda y. Busca el siguiente registro que satisface la condición de búsqueda. devuelve el siguiente registro. transfiriendo ese bloque a un búfer de la memoria principal (si todavía no se encuentra allí). continúa localizando los N . *Modify (modificar). el registro devuelto es el primero o el siguiente que satisface esa condición. *Close (cerrar). después. Transfiere los bloques que contienen los N registros a un búfer de la memoria principal (si todavía no están allí). Si con la operación especificamos una condición. Copia el registro actual desde el búfer a una variable de programa del programa de usuario. Sean devuelve el primer registro.1 siguientes registros que satisfacen la misma condición.12 recuperado o actualizado. escribiendo el registro en el búfer y escribiendo el búfer en el disco para reflejar la inserción. como. *Find (o Locate) o (buscar). Inserta un registro nuevo en el fichero localizando el bloque donde se inseliará el registro. *Sean. se pueden aplicar operaciones de grupo al fichero. *Insert (insertar). Localiza todos los registros del fichero que satisfacen una condición de búsqueda. Borra el registro actual y (finalmente) actualiza el fichero en disco para reflejar el borrado. *Delete (borrar). por ejemplo. *FindNext (buscar siguiente). . las siguientes: *FindAll (buscar todo). Transfiere el bloque en el que se encuentra el registro a un búfer de la memoria principal (si todavía no se encuentra aquí). Modifica los valores de algunos campos del registro actual y actualiza el fichero en disco para reflejar la modificación. Este comando también puede hacer avanzar el puntero del registro actual al siguiente registro del fichero.

bloque a bloque. Si el campo de ordenación también es un campo clave (un campo que garantiza un valor exclusivo en cada registro) del fichero. por todo el fichero. pues es raro ejecutar sobre ellos operaciones de actualización. Ficheros de registros ordenados (ficheros ordenados) Los registros de un fichero se pueden ordenar físicamente en el disco en función de los valores de uno de sus campos. *Reorganize (reorganizar). Esto conduce a un fichero ordenado o secuencial. entonces el campo se . denominado campo de ordenación. Algunos ficheros pueden ser estáticos. En la cabecera del fichero se guarda la dirección del último bloque del fichero. Sin embargo. los registros se insertan al final del fichero.13 *FindOrdered (buscar ordenados). Normalmente. Una organización de fichero satisfactoria debe ejecutar tan eficazmente como sea posible las operaciones que esperamos aplicar frecuentemente al fichero Ficheros de registros desordenados (ficheros heap) Es el tipo de organización más sencillo y básico. La inserción de un registro nuevo es muy eficaz. es decir. se añade el registro nuevo y se reescribe el bloque de nuevo en el disco. Esta organización se conoce como fichero heap o pila. según el cual los registros se guardan en el fichero en el mismo orden en que se insertan. la búsqueda de un registro utilizando cualquier condición de búsqueda implica una búsqueda lineal. otros. Recupera todos los registros del fichero en un orden específico. las técnicas de borrado requieren una reorganización periódica del fichero para reclamar el espacio inutilizado correspondiente a los registros borrados. El último bloque de disco del fichero se copia en el búfer. pueden cambiar más a menudo pues se les están aplicando operaciones de actualización constantemente. los denominados archivos dinámicos. Inicia el proceso de reorganización. esperamos utilizar unas condiciones de búsqueda más que otras.

(* b es el número de bloques del fichero *) while (u 2': 1) do begin i +-. la lectura de los registros en el orden marcado por los valores de la clave de ordenación es extremadamente eficaz porque no se necesita una ordenación. I +-. end.b.1. En primer lugar. leer el bloque i del fichero en el búfer.i .14 denomina clave de ordenación del fichero.(l + u) div 2. encontrar el siguiente registro al actual según el orden de la clave de ordenación. if K < (valor del campo clave de ordenación del primer registro en el bloque i) then u +-. En segundo lugar. que constituye una mejora respecto a las búsquedas lineales. . Los registros ordenados tienen algunas ventajas sobre los ficheros desordenados.1 else if K> (valor del campo clave de ordenación del último registro en el bloque i) then I +-. u +-. el uso de una condición de búsqueda basándose en el valor de un campo clave de ordenación ofrece un acceso más rápido cuando se utiliza la técnica de búsqueda binaria. goto noencontrado.i + 1 else if el registro con el campo clave de ordenación = K está en el búfer then goto encontrado else goto noencontrado. normalmente no requiere acceder a bloques adicionales porque el siguiente registro se encuentra en el mismo bloque que el actual (a menos que el registro actual sea el último del bloque). Búsqueda binaria en una clave de ordenación de un fichero de disco. En tercer lugar.

. En la mayoría de los casos. el campo de dispersión también es un campo clave del fichero. La dispersión también se utiliza como una estructura de búsqueda interna dentro de un programa. siempre que se acceda a un grupo de registros exclusivamente utilizando el valor de un campo Dispersión interna En los ficheros internos. tenemos M slots cuyas direcciones corresponden a los índices del array. Elegimos una función de dispersión que transforma el valor del campo de dispersión en un entero entre Oy M-l. en cuyo caso se denomina clave de dispersión (o clave hash). Esta organización se denomina normalmente fichero disperso o fichero hash. Técnicas de dispersión Otro tipo de organización de ficheros está basado en la dispersión.. En estos casos. . que proporciona un acceso muy rápido a los registros bajo ciertas condiciones de búsqueda.1. la dispersión normalmente se implementa como una tabla de dispersión mediante el uso de un array de registros. porque el espacio del campo de dispersión (el número de valores posibles que un campo de dispersión puede tomar) es normalmente mucho más grande que el espacio de direcciones (el número de direcciones disponibles para los registros). La condición de búsqueda debe ser una condición de igualdad sobre un solo campo. por tanto. realizamos una búsqueda lineal para el acceso aleatorio. El problema con la mayoría de las funciones de dispersión es que no garantizan que valores distintos se dispersen a direcciones distintas. denominado campo de dispersión o campo hash. Estas funciones pueden ser: *función h(K) = K mod M y *reversible. Vamos a suponer que el índice del array va de O a M .15 La ordenación no ofrece ninguna ventaja para el acceso aleatorio u ordenado de los registros basándose en los valores de otros campos no ordenados del fichero.

porque cuantos más registros encajen en un cubo más posible será que se dispersen al mismo cubo sin causar problemas . A partir de la posición ocupada especificada por la dirección de dispersión. cada uno de los cuales almacena varios registros. se añade un campo puntero a cada ubicación de registro. Para este método.16 Una colisión se produce cuando el valor del campo de dispersión de un registro que se está insertando se dispersa a una dirección que ya contiene un registro diferente. debemos insertar el registro nuevo en alguna otra posición. el programa comprueba las posiciones subsiguientes en orden hasta encontrar una posición sin utilizar (vacía). La función de dispersión mapea una clave a un número de cubo relativo. El proceso de encontrar otra posición se denomina resolución de colisiones. Se conserva entonces una lista enlazada de registros de desbordamiento por cada dirección de dispersión. *Dispersión múltiple. Dispersión externa para los ficheros de disco La dispersión para los ficheros de disco se denomina dispersión externa. Si se produce otra colisión. se conservan varias ubicaciones de dispersión. Hay varios métodos para resolver una colisión: *Direccionamiento abierto. Adicionalmente. *Encadenamiento. normalmente extendiendo el array con algunas posiciones de desbordamiento. puesto que su dirección de dispersión está ocupada. Una tabla almacenada en la cabecera del fichero convierte el número de cubo en la correspondiente dirección de bloque del disco. en lugar de asignar una dirección de bloque absoluta al cubo. Una colisión se resuelve colocando el registro nuevo en una ubicación de desbordamiento sin utilizar y estableciendo el puntero de la ubicación de la dirección de dispersión ocupada a la dirección de esa ubicación de desbordamiento. El problema de las colisiones es menos grave con los cubos. En esta situación. El programa aplica una segunda función de dispersión si la primera desemboca en una colisión. el espacio de direcciones de destino se compone de cubos. Para ajustar las características del almacenamiento en disco. el programa utiliza el desbordamiento abierto o aplica una tercera función de dispersión y utiliza después el direccionamiento abierto si es necesario. Un cubo puede ser un bloque de disco o un grupo de bloques contiguos.

además su implementación puede aumentar la eficiencia. el cual utiliza el paralelismo para mejorar el rendimiento del disco. El objetivo del RAID es igualar las diferencias en cuanto a velocidad y rendimiento entre los discos.17 Otras organizaciones principales de ficheros Ficheros de registros mezclados Existen situaciones donde las entidades o los registros deban interrelacionarse de distintas formas. La solución de natural es la utilización de una matriz grande de pequeños discos independientes que actúan como un solo disco lógico. y a partir de su forein key. entre los importantes avances de estos dispositivos se encuentra el desarrollo de RAID. completar los datos solicitados. a esto se le denomina segmentación de datos. que significaba Matriz redundante de discos baratos (Redundant Arrays Inexpensive Disks). pueden agruparse físicamente en el disco. Las relaciones entre registros de varios ficheros se pueden representar mediante campos de conexión (podría entenderse como forein key). La imagen 4 representa como se observaría la segmentación de datos o striping. El concepto de agrupamiento físico de tipos de objetos para almacenar juntos los objetos relacionados en un fichero mixto. separando los datos de forma compartida por varios discos haciéndolo parecer grande y de acceso rápido. Para recuperar información se usarían referencias de campo lógicas que consisten en la utilización de un dato del registro de relación con otro del registro original. la memoria y los microprocesadores. A menudo se implementan estos tipos de registros. debido a que su utilización es frecuente. Pero la i de RAID ha cambiado su significado por "independientes". Árboles B y otras estructuras de datos como organización primaria En pocas palabras estas estructuras de datos se pueden adaptar perfectamente a la organización de los ficheros para la ubicación de registros de disco. . Paralelismo del acceso al disco mediante la tecnología RAID Los dispositivos de almacenamiento secundario cuentan con mayor rendimiento y aumentado su fidelidad.

 Nivel 2: utiliza una redundancia al estilo de la memoria utilizando códigos Hamming división por bits. (aseguración de un fichero). y cuando se quiere leer algún dato en el disco. Varios discos dedicados a paridad.  Nivel 4: utilizan la segmentación de datos a nivel de bloque. además la segmentación puede realizarse a nivel de bits. cuenta con n probabilidades de fallos.  Nivel 1: Discos en espejo. buenas características en escritura. Otra solución al problema de la fiabilidad es almacenar información extra que normalmente no es necesaria.18 Mejora de la fiabilidad con RAID Se dice que n discos. . para reducir estos fallos se implementan técnicas para aumentar la fiabilidad de los datos. pero que puede utilizarse para reconstruir la información perdida en caso de un fallo en el disco.Y consiste en la escritura de los datos en dos discos físicos idénticos que funciona como uno lógico. Disco dedicado a paridad  Nivel 5: distribuye los datos y la información de paridad por todos los discos.  Nivel 3: utiliza un disco de paridad sencilla que cuenta con el controlador de disco para determinar el disco que ha fallado.  Nivel 6: Esquema de redundancia P + Q. se utiliza el otro disco. Mejora del rendimiento con RAID Prácticamente la mejor opción para la mejora de rendimiento seria la utilización de segmentación de datos para lograr un mayor tiempo de respuesta en la solicitud de lectura y escritura de datos. Guarda información redundante adicional para protección contra fallos de disco múltiple. la segmentación y el patrón utilizado para calcular la información redundante. Y se pueden los niveles del RAID van del 0 al 6.  Nivel 0: utiliza segmentación. y a nivel bloques. no cuenta con redundancia (espejos). Para reducir los fallos en los disco se implementara una técnica de redundancia que se denomina espejo (mirroring). si este presenta fallas. hasta que el primero sea reparado. Organizaciones y niveles de RAID El RAID cuenta con diferentes organizaciones basadas en combinaciones de dos factores.

Aquí es donde aparece la implementación de los dispositivos NAS (Almacenamiento conectado a la red.  Buenas capacidades de aislamiento que permitan añadir sin complicaciones nuevos periféricos y servidores. En una SAN. sino que simplemente permiten la adición de almacenamiento para compartir ficheros. los periféricos de almacenamiento online están configurados como nodos en una red de alta velocidad y se pueden conectar y desconectar de los servidores con mucha flexibilidad. pero las empresas se han visto en la necesidad de moverse de un centro de datos fijo y estático orientado a las operaciones. Por consiguiente están utilizando lo que se denomina Redes de área de almacenamiento (SAN. Esto debido al coste de administración de los datos resulta sumamente caro.19 Nuevos sistemas de almacenamiento Redes de área de almacenamiento Ha existido una creciente demanda del almacenamiento de los datos en internet. como buzones de correo electrónico. contenido web. multimedia y aplicaciones comerciales.  Hasta 10 kilómetros de separación entre un servidor y un sistema de almacenamiento utilizando los cables de fibra óptica apropiados. Storage Area Networks). . Las principales ventajas exigibles para el SAN son las siguientes:  Conectividad "varios a varios" flexible entre los servidores y los dispositivos de almacenamiento utilizando hubs y switches de canal de fibra. a una infraestructura más flexible y dinámica para sus requisitos de procesamiento de información. etcétera. En pocas palabras un NAS puede almacenar cualquier dato que aparezca en forma de ficheros. Almacenamiento conectado a la red Con el crecimiento de los datos digitales. copias de seguridad remotas del sistema. y se puede decir que son servidores que no proporcionan ninguno de los servicios de un servidor común. el almacenamiento de estas se ha vuelto extremadamente importante. NetworkAttached Storage).

memoria DRAM. Los datos generalmente se almacenan como ficheros de registros. las CPU utiliza de memoria para almacenar los datos. Tras el desarrollo de este trabajo se pudo aprender que esta memoria puede ser: El almacenamiento principal (brinda un acceso rápido a los datos. cintas. o modificando los valores de los campos Finalmente tenemos que estos registros se pueden organizar como pilas o se pueden utilizar estructuras como arboles B y matrices RAID. y el almacenamiento secundario (tiene gran capacidad. estas son: Almacenamiento principal y almacenamiento secundario. El almacenamiento principal incluye La memoria caché. y estos ficheros por lo general se clasifican en ficheros heap (los registros se insertan al final del fichero).20 Conclusión Como todos sabemos. ficheros ordenados(se ordenan físicamente en el disco en función de los valores de uno de sus campos) y ficheros disperso o hash. memoria RAM. únicamente localizan ciertos registros para que los valores de sus campos se puedan examinar o procesar. son baratos. También se pueden realizar operaciones sobre estos ficheros. pero tienen un acceso más lento). Hoy en día la mayoría de Bases de Datos utilizan la memoria secundaria para almacenar los datos principalmente porque son muy grandes para entrar en la memoria principal y porque las circunstancias de pérdida de datos son menores. La memoria secundaria incluye discos magnéticos. Las segundas modifican el fichero mediante la inserción o la eliminación de registros. Almacena variables y programas para trabajar con ellos. . pero de poca capacidad). Las operaciones sobre ficheros se pueden agrupar en operaciones de recuperación y operaciones de actualización. discos compactos. Las primeras no cambian ningún dato del fichero.

Discos magnéticos Imagen 3 Ejemplo de registros Imagen 4 Striping . Imagen 2.21 Anexos Imagen 1. Jerarquía de memoria.

A. estructuras básicas de ficheros y dispersión. Ruano. Shamkaut B.22 Bibliografía EImusri.co%2Fmoodle%2Ffile. Almacenamiento y estructura de archivos.R. Almacenamiento en disco. Sudarshan. 389-425). Fundamentos de Sistemas de bases de Datos (5 ed. U. S. A. 449-478).eWU .52434380.d. F..co. A. Recuperado: http://www.. Fundamentos de bases de datos (4ta edición)(pp.unicauca.google. S. Madrid: PEARSON EDUCACiÓN S. Navathe (2007). (2012).cr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=9&ved=0CGAQFjAI&url=http %3A%2F%2Fpis. Silberschatz.edu.)(pp.ppt&ei=7Z48UobSN4aK9gT Aj4GoBw&usg=AFQjCNGXywKIX_QVDMTKvghbEt6WA0qoUw&bvm=bv.php%2F59%2FExposiciones%2F20062%2FALMACENAMIENTO_Y_ESTRUCTURAS_DE_ARCHIVOS_1. Madrid: McGRAW-HILL/INTERAMERICANA DE ESPAÑA.. Almacenamiento y Estructura de Archivos.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->