1

Tema: Almacenamiento y estructuras de archivos

2

Contenido
Resumen ejecutivo ................................................................................................................................. 3 Introducción ............................................................................................................................................. 6 Almacenamiento y estructuras de archivos ....................................................................................... 7 Jerarquías de memoria y dispositivos de almacenamiento. ........................................................... 7 Almacenamiento de bases de datos ................................................................................................... 8 Dispositivos de almacenamiento secundario ..................................................................................... 8 Descripción del hardware de los dispositivos de disco. ................................................................... 8 Dispositivos de almacenamiento en cinta magnética. ..................................................................... 9 Almacenamiento de bloques en el búfer .......................................................................................... 10 Ubicación de los registros de fichero en disco. ............................................................................... 10 Registros y tipos de registros. ............................................................................................................ 10 Ficheros, registros de longitud fija y longitud variable. .................................................................. 10 Bloqueo de registros y registros extendidos frente a no extendidos. .......................................... 10 Cabeceras de fichero........................................................................................................................... 11 Operaciones sobre ficheros ................................................................................................................ 11 Ficheros de registros desordenados (ficheros heap) ..................................................................... 13 Ficheros de registros ordenados (ficheros ordenados) ................................................................. 13 Técnicas de dispersión ........................................................................................................................ 15 Dispersión interna ................................................................................................................................ 15 Dispersión externa para los ficheros de disco ................................................................................. 16 Otras organizaciones principales de ficheros .................................................................................. 17 Ficheros de registros mezclados ....................................................................................................... 17 Paralelismo del acceso al disco mediante la tecnología RAID ..................................................... 17 Organizaciones y niveles de RAID .................................................................................................... 18 Nuevos sistemas de almacenamiento .............................................................................................. 19 Redes de área de almacenamiento .................................................................................................. 19 Almacenamiento conectado a la red ................................................................................................. 19 Conclusión ............................................................................................................................................. 20 Anexos .................................................................................................................................... 21 Bibliografía .............................................................................................................................. 22

cada círculo es una pista. para utilizar este espacio desaprovechado. los discos ópticos y las cintas. Los datos se almacenan en forma de registros. podemos almacenar parte de un registro en un bloque y el resto en otro. CD-ROM y DVD.3 Resumen ejecutivo Almacenamiento y estructuras de archivos Los modos de almacenamiento forman una jerarquía que incluyen 2 categorías: Almacenamiento principal: incluye los medios de almacenamiento en los que la CPU puede operar. el bloque puede contener varios registros. la información se almacena en la superficie del disco en círculos concéntricos. Almacenamiento secundario: incluye los discos magnéticos. Siempre que el registro es más grande que el bloque. Registros y tipos de registros. Bloqueo de registros y registros extendidos frente a no extendidos. Jerarquías de memoria y dispositivos de almacenamiento. En el nivel de almacenamiento secundario tenemos discos magnéticos. un registro es una colección de valores de datos. Para aumentar la capacidad. Descripción del hardware de los dispositivos de disco. En el nivel de almacenamiento principal tenemos a la memoria cache. Almacenamiento de bases de datos La mayoría de las bases de datos se almacenan en almacenamiento secundario. Un disco es un dispositivo de acceso aleatorio. DRAM. el mecanismo que lee y escribe un bloque es la cabeza de lectura/escritura del disco. debemos usar organización extendida. si los registros no tienen permitido sobrepasar los . los discos se ensamblan como paquetes de discos. Los registros normalmente describen entidades y sus atributos. Cuando el tamaño del bloque es mayor que el tamaño del registro.

 Nivel 3: utiliza un disco de paridad sencilla que cuenta con el controlador de disco para determinar el disco que ha fallado. Y consiste en la escritura de los datos en dos discos físicos idénticos que funciona como uno lógico. la memoria y los microprocesadores. y cuando se quiere leer algún dato en el disco.  Nivel 2: utiliza una redundancia al estilo de la memoria utilizando códigos Hamming división por bits. Mejora de la fiabilidad con RAID Para reducir los fallos en los disco se implementara una técnica de redundancia que se denomina espejo (mirroring). hasta que el primero sea reparado. ellos usan RAID. Varios discos dedicados a paridad. Las relaciones entre registros de varios ficheros se pueden representar mediante campos de conexión (podría entenderse como forein key. el objetivo del RAID es igualar las diferencias en cuanto a velocidad y rendimiento entre los discos. buenas características en escritura. Una cabecera de fichero contiene información sobre un fichero que los programas del sistema necesitan para acceder a los registros. Ficheros de registros mezclados Existen situaciones donde las entidades o los registros deban interrelacionarse de distintas formas. se utiliza el otro disco. Disco dedicado a paridad .  Nivel 1: Discos en espejo.  Nivel 4: utilizan la segmentación de datos a nivel de bloque. Mejora del rendimiento con RAID La mejora de rendimiento seria la utilización de segmentación de datos para lograr un mayor tiempo de respuesta en la solicitud de lectura y escritura de datos. se dice que es organización no extendida. no cuenta con redundancia (espejos). Organizaciones y niveles de RAID  Nivel 0: utiliza segmentación. Paralelismo del acceso al disco mediante la tecnología RAID Los dispositivos de almacenamiento secundario cuentan con mayor rendimiento y aumentado su fidelidad.4 límites de un bloque. si este presenta fallas.

5  Nivel 5: distribuye los datos y la información de paridad por todos los discos. *Read (o Get) (leer u obtener). es decir. según el cual los registros se guardan en el fichero en el mismo orden en que se insertan. *Reset (reiniciar). . Ficheros de registros desordenados Es el tipo de organización más sencillo y básico. Operaciones sobre ficheros Las operaciones sobre ficheros se pueden agrupar en operaciones de recuperación y operaciones de actualización. *Delete (borrar). Técnicas de dispersión Otro tipo de organización de ficheros está basado en la dispersión. que proporciona un acceso muy rápido a los registros bajo ciertas condiciones de búsqueda. denominado campo de ordenación. *Insert (insertar). *Find (o Locate) (buscar). *Close (cerrar). los registros se insertan al final del fichero. *Modify (modificar). Guarda información redundante adicional para protección contra fallos de disco múltiple. Ficheros de registros ordenados Los registros de un fichero se pueden ordenar físicamente en el disco en función de los valores de uno de sus campos. *Open (abrir). *FindNext (buscar siguiente).  Nivel 6: Esquema de redundancia P + Q.

Prácticamente estas memorias son generalizaciones de la gran gama de dispositivos disponibles actualmente y que se podrían descomponer en varias jerarquías dependiendo del tipo de almacenamiento. actualización y borrado de los datos. ya que los tamaños en almacenamiento han aumentado considerablemente. Con los avances que han surgido en memoria secundaria. Como es bien sabido las computadoras poseen dos importantes memorias (primaria o RAM y secundaria o ROM) con las funciones de acceder a las direcciones de memoria y el almacenamiento de los datos. por lo tanto se debieron encontrar nuevas estructuras de datos o ficheros para mejorar los tiempos de respuesta tanto en consulta. .6 Introducción Hoy en día los dispositivos de almacenamiento y memorias han transcendido fronteras debido a las nuevas capacidades que han aparecido. Esta es una pequeña introducción a lo que es el tema de estructura de datos y almacenamiento para las bases de datos. inserción. también se han tenido que implementar nuevas técnicas con respecto a lo que guarda una base de datos.

La memoria cache la utiliza la CPU para acelerar la ejecución de los programas. La CPU no puede procesar directamente los datos almacenados en un almacenamiento secundario o terciario. terabytes. Almacenamiento secundario o terciario: incluye los discos magnéticos. son baratos. leer muchas veces). Jerarquías de memoria y dispositivos de almacenamiento. Tienen gran capacidad. En el nivel de almacenamiento secundario y terciario. el problema es que debe borrarse y escribirse un bloque entero simultáneamente (USB. los DVD es un estándar reciente en discos ópticos. gigabytes. pero muy lenta. los discos WORM (escribir una vez. la jerarquía incluye los discos magnéticos. la memoria Flash. primero se copian en el almacenamiento principal. Los medios removibles o extraíbles están considerados como terciario. El siguiente nivel en el almacenamiento principal es la DRAM dinámica que proporciona el área de trabajo para que la CPU almacene programas y datos (memoria principal). megabytes. las memorias cache. Los CD-ROM almacenan los datos ópticamente y los lee mediante un láser. La ventaja de la DRAM es su bajo coste. los discos ópticos y las cintas. son de alta densidad que usa tecnología EEPROM (memoria de solo lectura programable y borrable electrónicamente). . así como el almacenamiento en masa en forma de CD-ROM y DVD y finalmente. En el nivel de almacenamiento principal tenemos a la memoria cache. las cintas en el extremo más caro de la jerarquía. Micro). pero de poca capacidad. que es una RAM estática. Entre la DRAM y el almacenamiento en disco magnético hay otra memoria. Los programas residen y se ejecutan en la DRAM. Las memorias jukebox ópticos utilizan un array de bandejas CD-ROM.7 Almacenamiento y estructuras de archivos Los modos de almacenamiento forman una jerarquía que incluyen 2 categorías: Almacenamiento principal o primario: incluye los medios de almacenamiento en los que la CPU puede operar. muy popular debido a que no es volátil. su ventaja es su alta velocidad de acceso. Esta categoría da un acceso rápido a los datos. pero tienen un acceso más lento. La capacidad de almacenamiento se mide en kilobytes. como la memoria principal de la PC. Por lo general las Base de Datos permanentes residen en el almacenamiento secundario y se leen en el primario.

Hay varias organizaciones principales de ficheros.8 Por último. Los jukeboxes de cintas que contienen un banco de cintas que se catalogan y pueden cargarse automáticamente en las unidades de cinta. Los datos almacenados en el disco se organizan como ficheros de registros. las cintas magnéticas se utilizan para archivar y para el almacenamiento de las copias de seguridad de los datos. los discos duros almacenan desde cientos de MB hasta decenas de GB. Descripción del hardware de los dispositivos de disco. añadiendo los registros nuevos al final. . Un fichero heap (desordenado) coloca los registros en el disco sin un orden particular. La capacidad de un disco es el número de bytes que puede almacenar. Un fichero disperso utiliza una función de dispersión (hash) aplicada a un campo concreto (para determinar la ubicación de un registro en el disco). Almacenamiento de bases de datos La mayoría de las bases de datos se almacenan en almacenamiento secundario por: 1-Porque son muy grandes para entrar en la memoria principal. 3-El coste de almacenamiento por unidad es inferior para el almacenamiento secundario en disco. Observe la imagen 1 en anexos. los disquetes que se utilizaban con los microcomputadoras almacenaban de 400kb a 1-5MB. Un fichero ordenado mantiene los registros por el valor de un campo particular. Dispositivos de almacenamiento secundario Veremos características de los dispositivos de almacenamiento de disco magnético y de la cinta magnética. 2-Las circunstancias de perdida de datos son menores en los secundarios. y los grandes paquetes de disco que se usan en los servidores y los mainframes tienen capacidad de cientos de GB.

Para transferir un bloque de disco. Los paquetes de disco con varias superficies están controlados por varias cabezas de L/E. Por lo tanto. que se produce mientras el principio del bloque deseado gira hasta su posición bajo la cabeza. las pistas de las distintas superficies que tienen el mismo diámetro reciben el nombre de cilindro. o 2 mseg. controla esta y su interacción con el sistema. el tiempo total para localizar y transferir un bloque arbitrario. muchas superficies. el mecanismo hardware actual que lee y escribe un bloque es la cabeza de lectura/escritura del disco. el retardo rotacional y el tiempo de transferencia del bloque. La información se almacena en la superficie del disco en círculos concéntricos de poca anchura. es la suma del tiempo de búsqueda. el disco gira siempre que se inicia una solicitud de lectura o escritura. cada uno de esos círculos es una pista. Dispositivos de almacenamiento en cinta magnética. Un disco es un dispositivo de acceso aleatorio. Por último. el controlador de disco primero debe colocar mecánicamente la cabeza de lectura/escritura en la pista correcta.000 rpm. dada su dirección. En los paquetes de disco. En un disquete. una por cada superficie. denominado retardo rotacional o latencia.9 Para aumentar la capacidad. Son dispositivos de acceso secuencial. que incluye muchos discos. a 15. la división de una pista en bloques de disco(o página) es establecida por el sistema operativo durante el formateo del disco. Los tiempos de búsqueda típicos son de 1 a 10 msegs en la sobremesa y de 3 a 8 msegs en los servidores. el tiempo por rotación es de 4mseg y el retardo rotacional medio es el tiempo por media revolución. Siguiendo esto. hay otro retardo. . Este retardo depende de las rpm del disco. es lo que se conoce como tiempo de transferencia del bloque. los discos se ensamblan como paquetes de discos. dada su dirección. que es una parte de un sistema denominado unidad de disco. incrustado en la unidad de disco. El controlador de disco. El tiempo requerido para ello es el tiempo de búsqueda. aún se necesita algo más de tiempo para transferir datos. por ejemplo.

Cuando el tamaño del bloque es mayor que el tamaño del registro. Bloqueo de registros y registros extendidos frente a no extendidos. donde cada valor está formado por uno a más bytes y corresponde a un campo concreto del registro. registros de longitud fija y longitud variable. Registros y tipos de registros. se dice que el fichero está compuesto por registros de longitud fija. Un registro consta de una colección de valores o elementos de datos relacionados. Los registros de un fichero deben asignarse a bloques de disco porque es la unidad de transferencia de datos entre el disco y la memoria. podemos almacenar parte de un registro en un bloque y el resto en otro. el bloque puede contener varios registros. Los registros normalmente describen entidades y sus atributos. . se pueden reservar varios búferes en la memoria principal para acelerar la transferencia. Almacenamiento de bloques en el búfer Cuando es necesario transferir varios bloques desde el disco a la memoria principal. Un puntero al final del primer bloque apunta al bloque que contiene el resto del registro. no se usa para almacenar datos online.10 Usa bobina de cinta. son importantes para la copia de seguridad de las bases de datos. Los datos normalmente se almacenan en forma de registros. Observe la imagen 2 en anexos. Para utilizar este espacio desaprovechado. Ubicación de los registros de fichero en disco. Una colección de nombres de campos y sus correspondientes tipos de datos constituyen un tipo de registro. Un fichero es una secuencia de registros. se dice que el fichero está compuesto por registros de longitud variable. Esta organización se llama extendida porque los registros pueden abarcar más de un bloque. Si cada registro del fichero tiene el mismo tamaño. Si el fichero hay registros que tienen tamaños diferentes. Ficheros.

puesto que únicamente localizan ciertos registros para que los valores de sus campos se puedan examinar o procesar. Establece el puntero del fichero al principio del mismo. En ocasiones. Prepara el fichero para la lectura o escritura. Cabeceras de fichero. debemos usar organización extendida. se dice que es organización no extendida. Si los registros no tienen permitido sobrepasar los límites de un bloque. *Find (o Locate) (buscar). Presentamos a continuación un conjunto de operaciones representativas. que se convierte en el registro actual.11 Siempre que el registro es más grande que el bloque. y recupera su cabecera. Las segundas modifican el fichero mediante la inserción o la eliminación de registros. Operaciones sobre ficheros Las operaciones sobre ficheros se pueden agrupar en operaciones de recuperación y operaciones de actualización. Transfiere el bloque que contiene ese registro a un búfer de la memoria principal (si todavía no está en el búfer). incluye información para determinar las direcciones de disco de los bloques del fichero y las descripciones de formato del registro. *Open (abrir). Asigna los búferes apropiados para albergar los bloques del fichero. o modificando los valores de los campos. *Reset (reiniciar). Hace que el puntero de un fichero abierto apunte al principio del fichero. Las primeras no cambian ningún dato del fichero. se utilizan diferentes verbos para indicar si el registro localizado será . Una cabecera de fichero contiene información sobre un fichero que los programas del sistema necesitan para acceder a los registros. Las operaciones de localización y acceso a los registros de un fichero varían de un sistema a otro. El puntero del fichero apunta al registro del búfer. Busca el primer registro que satisface una condición de búsqueda.

Transfiere el bloque en el que se encuentra el registro a un búfer de la memoria principal (si todavía no se encuentra aquí). Sean devuelve el primer registro. *Delete (borrar). Inserta un registro nuevo en el fichero localizando el bloque donde se inseliará el registro. Copia el registro actual desde el búfer a una variable de programa del programa de usuario. continúa localizando los N . *Sean. *Insert (insertar). Completa el acceso al fichero liberando los búferes y ejecutando cualquier otra operación de limpieza necesaria. después. Este comando también puede hacer avanzar el puntero del registro actual al siguiente registro del fichero. Modifica los valores de algunos campos del registro actual y actualiza el fichero en disco para reflejar la modificación. Si con la operación especificamos una condición. lo que puede hacer necesario leer del disco el siguiente bloque del fichero. *Modify (modificar). *Find (o Locate) o (buscar). las siguientes: *FindAll (buscar todo). se pueden aplicar operaciones de grupo al fichero. Si el fichero simplemente se ha abierto o reiniciado. Busca el siguiente registro que satisface la condición de búsqueda. . *FindNext (buscar siguiente).12 recuperado o actualizado. Localiza todos los registros del fichero que satisfacen una condición de búsqueda. por ejemplo. *Close (cerrar). El registro se almacena en el búfer y se convierte en el registro actual. devuelve el siguiente registro. como.1 siguientes registros que satisfacen la misma condición. transfiriendo ese bloque a un búfer de la memoria principal (si todavía no se encuentra allí). escribiendo el registro en el búfer y escribiendo el búfer en el disco para reflejar la inserción. el registro devuelto es el primero o el siguiente que satisface esa condición. Borra el registro actual y (finalmente) actualiza el fichero en disco para reflejar el borrado. Transfiere los bloques que contienen los N registros a un búfer de la memoria principal (si todavía no están allí). Busca el primer registro que satisface una condición de búsqueda y. En los sistemas de bases de datos. en caso contrario. *Read (o Get) (leer u obtener).

pueden cambiar más a menudo pues se les están aplicando operaciones de actualización constantemente. pues es raro ejecutar sobre ellos operaciones de actualización. *Reorganize (reorganizar). Esto conduce a un fichero ordenado o secuencial.13 *FindOrdered (buscar ordenados). Inicia el proceso de reorganización. bloque a bloque. En la cabecera del fichero se guarda la dirección del último bloque del fichero. según el cual los registros se guardan en el fichero en el mismo orden en que se insertan. las técnicas de borrado requieren una reorganización periódica del fichero para reclamar el espacio inutilizado correspondiente a los registros borrados. Una organización de fichero satisfactoria debe ejecutar tan eficazmente como sea posible las operaciones que esperamos aplicar frecuentemente al fichero Ficheros de registros desordenados (ficheros heap) Es el tipo de organización más sencillo y básico. Normalmente. Esta organización se conoce como fichero heap o pila. El último bloque de disco del fichero se copia en el búfer. Si el campo de ordenación también es un campo clave (un campo que garantiza un valor exclusivo en cada registro) del fichero. entonces el campo se . la búsqueda de un registro utilizando cualquier condición de búsqueda implica una búsqueda lineal. Algunos ficheros pueden ser estáticos. denominado campo de ordenación. Sin embargo. se añade el registro nuevo y se reescribe el bloque de nuevo en el disco. los registros se insertan al final del fichero. esperamos utilizar unas condiciones de búsqueda más que otras. los denominados archivos dinámicos. es decir. otros. por todo el fichero. La inserción de un registro nuevo es muy eficaz. Ficheros de registros ordenados (ficheros ordenados) Los registros de un fichero se pueden ordenar físicamente en el disco en función de los valores de uno de sus campos. Recupera todos los registros del fichero en un orden específico.

. que constituye una mejora respecto a las búsquedas lineales. encontrar el siguiente registro al actual según el orden de la clave de ordenación.(l + u) div 2. la lectura de los registros en el orden marcado por los valores de la clave de ordenación es extremadamente eficaz porque no se necesita una ordenación.1. Los registros ordenados tienen algunas ventajas sobre los ficheros desordenados. el uso de una condición de búsqueda basándose en el valor de un campo clave de ordenación ofrece un acceso más rápido cuando se utiliza la técnica de búsqueda binaria.14 denomina clave de ordenación del fichero.i + 1 else if el registro con el campo clave de ordenación = K está en el búfer then goto encontrado else goto noencontrado. Búsqueda binaria en una clave de ordenación de un fichero de disco. goto noencontrado.1 else if K> (valor del campo clave de ordenación del último registro en el bloque i) then I +-. I +-.b. leer el bloque i del fichero en el búfer. u +-. En primer lugar. En segundo lugar. En tercer lugar. normalmente no requiere acceder a bloques adicionales porque el siguiente registro se encuentra en el mismo bloque que el actual (a menos que el registro actual sea el último del bloque). if K < (valor del campo clave de ordenación del primer registro en el bloque i) then u +-.i . (* b es el número de bloques del fichero *) while (u 2': 1) do begin i +-. end.

siempre que se acceda a un grupo de registros exclusivamente utilizando el valor de un campo Dispersión interna En los ficheros internos. que proporciona un acceso muy rápido a los registros bajo ciertas condiciones de búsqueda. En estos casos. La condición de búsqueda debe ser una condición de igualdad sobre un solo campo... por tanto. Vamos a suponer que el índice del array va de O a M . Elegimos una función de dispersión que transforma el valor del campo de dispersión en un entero entre Oy M-l.1.15 La ordenación no ofrece ninguna ventaja para el acceso aleatorio u ordenado de los registros basándose en los valores de otros campos no ordenados del fichero. el campo de dispersión también es un campo clave del fichero. Estas funciones pueden ser: *función h(K) = K mod M y *reversible. tenemos M slots cuyas direcciones corresponden a los índices del array. En la mayoría de los casos. denominado campo de dispersión o campo hash. Técnicas de dispersión Otro tipo de organización de ficheros está basado en la dispersión. La dispersión también se utiliza como una estructura de búsqueda interna dentro de un programa. porque el espacio del campo de dispersión (el número de valores posibles que un campo de dispersión puede tomar) es normalmente mucho más grande que el espacio de direcciones (el número de direcciones disponibles para los registros). en cuyo caso se denomina clave de dispersión (o clave hash). la dispersión normalmente se implementa como una tabla de dispersión mediante el uso de un array de registros. . El problema con la mayoría de las funciones de dispersión es que no garantizan que valores distintos se dispersen a direcciones distintas. Esta organización se denomina normalmente fichero disperso o fichero hash. realizamos una búsqueda lineal para el acceso aleatorio.

Un cubo puede ser un bloque de disco o un grupo de bloques contiguos. En esta situación. *Encadenamiento. El proceso de encontrar otra posición se denomina resolución de colisiones. *Dispersión múltiple. se añade un campo puntero a cada ubicación de registro. Si se produce otra colisión. el programa utiliza el desbordamiento abierto o aplica una tercera función de dispersión y utiliza después el direccionamiento abierto si es necesario. A partir de la posición ocupada especificada por la dirección de dispersión. Dispersión externa para los ficheros de disco La dispersión para los ficheros de disco se denomina dispersión externa. el programa comprueba las posiciones subsiguientes en orden hasta encontrar una posición sin utilizar (vacía). Adicionalmente. Una colisión se resuelve colocando el registro nuevo en una ubicación de desbordamiento sin utilizar y estableciendo el puntero de la ubicación de la dirección de dispersión ocupada a la dirección de esa ubicación de desbordamiento. Se conserva entonces una lista enlazada de registros de desbordamiento por cada dirección de dispersión. La función de dispersión mapea una clave a un número de cubo relativo. en lugar de asignar una dirección de bloque absoluta al cubo. El problema de las colisiones es menos grave con los cubos. Para este método. puesto que su dirección de dispersión está ocupada. se conservan varias ubicaciones de dispersión. porque cuantos más registros encajen en un cubo más posible será que se dispersen al mismo cubo sin causar problemas . normalmente extendiendo el array con algunas posiciones de desbordamiento. cada uno de los cuales almacena varios registros. el espacio de direcciones de destino se compone de cubos. Para ajustar las características del almacenamiento en disco. Una tabla almacenada en la cabecera del fichero convierte el número de cubo en la correspondiente dirección de bloque del disco. El programa aplica una segunda función de dispersión si la primera desemboca en una colisión.16 Una colisión se produce cuando el valor del campo de dispersión de un registro que se está insertando se dispersa a una dirección que ya contiene un registro diferente. Hay varios métodos para resolver una colisión: *Direccionamiento abierto. debemos insertar el registro nuevo en alguna otra posición.

Las relaciones entre registros de varios ficheros se pueden representar mediante campos de conexión (podría entenderse como forein key). Árboles B y otras estructuras de datos como organización primaria En pocas palabras estas estructuras de datos se pueden adaptar perfectamente a la organización de los ficheros para la ubicación de registros de disco. y a partir de su forein key. El objetivo del RAID es igualar las diferencias en cuanto a velocidad y rendimiento entre los discos.17 Otras organizaciones principales de ficheros Ficheros de registros mezclados Existen situaciones donde las entidades o los registros deban interrelacionarse de distintas formas. que significaba Matriz redundante de discos baratos (Redundant Arrays Inexpensive Disks). completar los datos solicitados. el cual utiliza el paralelismo para mejorar el rendimiento del disco. Para recuperar información se usarían referencias de campo lógicas que consisten en la utilización de un dato del registro de relación con otro del registro original. . a esto se le denomina segmentación de datos. A menudo se implementan estos tipos de registros. entre los importantes avances de estos dispositivos se encuentra el desarrollo de RAID. El concepto de agrupamiento físico de tipos de objetos para almacenar juntos los objetos relacionados en un fichero mixto. además su implementación puede aumentar la eficiencia. la memoria y los microprocesadores. La imagen 4 representa como se observaría la segmentación de datos o striping. Pero la i de RAID ha cambiado su significado por "independientes". Paralelismo del acceso al disco mediante la tecnología RAID Los dispositivos de almacenamiento secundario cuentan con mayor rendimiento y aumentado su fidelidad. La solución de natural es la utilización de una matriz grande de pequeños discos independientes que actúan como un solo disco lógico. debido a que su utilización es frecuente. pueden agruparse físicamente en el disco. separando los datos de forma compartida por varios discos haciéndolo parecer grande y de acceso rápido.

Guarda información redundante adicional para protección contra fallos de disco múltiple. Mejora del rendimiento con RAID Prácticamente la mejor opción para la mejora de rendimiento seria la utilización de segmentación de datos para lograr un mayor tiempo de respuesta en la solicitud de lectura y escritura de datos. cuenta con n probabilidades de fallos. y cuando se quiere leer algún dato en el disco.  Nivel 2: utiliza una redundancia al estilo de la memoria utilizando códigos Hamming división por bits. pero que puede utilizarse para reconstruir la información perdida en caso de un fallo en el disco. . para reducir estos fallos se implementan técnicas para aumentar la fiabilidad de los datos. hasta que el primero sea reparado. además la segmentación puede realizarse a nivel de bits. (aseguración de un fichero). Otra solución al problema de la fiabilidad es almacenar información extra que normalmente no es necesaria.  Nivel 3: utiliza un disco de paridad sencilla que cuenta con el controlador de disco para determinar el disco que ha fallado.  Nivel 0: utiliza segmentación. no cuenta con redundancia (espejos). se utiliza el otro disco. la segmentación y el patrón utilizado para calcular la información redundante. Disco dedicado a paridad  Nivel 5: distribuye los datos y la información de paridad por todos los discos. Para reducir los fallos en los disco se implementara una técnica de redundancia que se denomina espejo (mirroring).  Nivel 4: utilizan la segmentación de datos a nivel de bloque. si este presenta fallas.18 Mejora de la fiabilidad con RAID Se dice que n discos.  Nivel 1: Discos en espejo. buenas características en escritura. Varios discos dedicados a paridad. Organizaciones y niveles de RAID El RAID cuenta con diferentes organizaciones basadas en combinaciones de dos factores. Y se pueden los niveles del RAID van del 0 al 6.Y consiste en la escritura de los datos en dos discos físicos idénticos que funciona como uno lógico.  Nivel 6: Esquema de redundancia P + Q. y a nivel bloques.

 Hasta 10 kilómetros de separación entre un servidor y un sistema de almacenamiento utilizando los cables de fibra óptica apropiados. a una infraestructura más flexible y dinámica para sus requisitos de procesamiento de información. En una SAN. etcétera.  Buenas capacidades de aislamiento que permitan añadir sin complicaciones nuevos periféricos y servidores. contenido web. copias de seguridad remotas del sistema. Storage Area Networks). Aquí es donde aparece la implementación de los dispositivos NAS (Almacenamiento conectado a la red. . los periféricos de almacenamiento online están configurados como nodos en una red de alta velocidad y se pueden conectar y desconectar de los servidores con mucha flexibilidad. Las principales ventajas exigibles para el SAN son las siguientes:  Conectividad "varios a varios" flexible entre los servidores y los dispositivos de almacenamiento utilizando hubs y switches de canal de fibra. Por consiguiente están utilizando lo que se denomina Redes de área de almacenamiento (SAN. NetworkAttached Storage). como buzones de correo electrónico. pero las empresas se han visto en la necesidad de moverse de un centro de datos fijo y estático orientado a las operaciones.19 Nuevos sistemas de almacenamiento Redes de área de almacenamiento Ha existido una creciente demanda del almacenamiento de los datos en internet. y se puede decir que son servidores que no proporcionan ninguno de los servicios de un servidor común. Esto debido al coste de administración de los datos resulta sumamente caro. sino que simplemente permiten la adición de almacenamiento para compartir ficheros. En pocas palabras un NAS puede almacenar cualquier dato que aparezca en forma de ficheros. el almacenamiento de estas se ha vuelto extremadamente importante. Almacenamiento conectado a la red Con el crecimiento de los datos digitales. multimedia y aplicaciones comerciales.

ficheros ordenados(se ordenan físicamente en el disco en función de los valores de uno de sus campos) y ficheros disperso o hash. únicamente localizan ciertos registros para que los valores de sus campos se puedan examinar o procesar. Las operaciones sobre ficheros se pueden agrupar en operaciones de recuperación y operaciones de actualización. Hoy en día la mayoría de Bases de Datos utilizan la memoria secundaria para almacenar los datos principalmente porque son muy grandes para entrar en la memoria principal y porque las circunstancias de pérdida de datos son menores. cintas. . y estos ficheros por lo general se clasifican en ficheros heap (los registros se insertan al final del fichero). memoria DRAM. Las segundas modifican el fichero mediante la inserción o la eliminación de registros. Almacena variables y programas para trabajar con ellos. discos compactos. El almacenamiento principal incluye La memoria caché. son baratos. las CPU utiliza de memoria para almacenar los datos. pero tienen un acceso más lento). Los datos generalmente se almacenan como ficheros de registros. memoria RAM. pero de poca capacidad).20 Conclusión Como todos sabemos. o modificando los valores de los campos Finalmente tenemos que estos registros se pueden organizar como pilas o se pueden utilizar estructuras como arboles B y matrices RAID. y el almacenamiento secundario (tiene gran capacidad. Las primeras no cambian ningún dato del fichero. También se pueden realizar operaciones sobre estos ficheros. Tras el desarrollo de este trabajo se pudo aprender que esta memoria puede ser: El almacenamiento principal (brinda un acceso rápido a los datos. estas son: Almacenamiento principal y almacenamiento secundario. La memoria secundaria incluye discos magnéticos.

Discos magnéticos Imagen 3 Ejemplo de registros Imagen 4 Striping . Imagen 2. Jerarquía de memoria.21 Anexos Imagen 1.

Ruano.edu. 389-425).ppt&ei=7Z48UobSN4aK9gT Aj4GoBw&usg=AFQjCNGXywKIX_QVDMTKvghbEt6WA0qoUw&bvm=bv.d.A.co%2Fmoodle%2Ffile.22 Bibliografía EImusri. A.. Sudarshan. Navathe (2007). Fundamentos de bases de datos (4ta edición)(pp. U. Silberschatz. S.co. Madrid: PEARSON EDUCACiÓN S.google. Almacenamiento en disco.unicauca.52434380.eWU .)(pp.R. Almacenamiento y Estructura de Archivos. S. Fundamentos de Sistemas de bases de Datos (5 ed.php%2F59%2FExposiciones%2F20062%2FALMACENAMIENTO_Y_ESTRUCTURAS_DE_ARCHIVOS_1.. 449-478). (2012). F. A. Almacenamiento y estructura de archivos. Shamkaut B.cr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=9&ved=0CGAQFjAI&url=http %3A%2F%2Fpis. Recuperado: http://www. Madrid: McGRAW-HILL/INTERAMERICANA DE ESPAÑA.. estructuras básicas de ficheros y dispersión.

Sign up to vote on this title
UsefulNot useful