Está en la página 1de 32

Administracin de Base de Datos

Almacenamiento Ing. Ronald Prez


rrperez@unimet.edu.ve rperez@shopepk.com

Agenda Cach y Memoria Principal Memoria flash Discos magnticos Jerarqua de Almacenamiento RAID (Redudant Arrays of Independent Disk) Niveles de RAID Eleccin del nivel del RAID Comparacin de conjuntos RAID Ajustes de E/S para los tipos RAID Rendimiento en reconstruccin Recomendaciones Organizacin de registros Almacenamiento con Diccionario de Datos

Cach y Memoria Principal Cach: la forma de almacenamiento ms rpida y costosa; voltil; gestionada por el hardware del sistema. Memoria principal:
Acceso rpido (10s a 100s de nanosegundos) Generalmente demasiado pequea (o demasiado costosa) para almacenar la base de datos completa Normalmente se utilizan capacidades de unos pocos Gigabytes. Las capacidades han crecido y los costes por byte han disminuido de manera constante y rpida Voltil : el contenido de la memoria principal normalmente se pierde si se produce un fallo de alimentacin o una cada del sistema.

Memoria flash
Los datos se mantienen ante un fallo de alimentacin Los datos se pueden escribir una sola vez en una posicin, pero una posicin se puede borrar y escribir de nuevo Pueden soportar slo un nmero limitado de ciclos de escritura/borrado. El borrado se tiene que hacer sobre bancos enteros de memoria La lectura es aproximadamente tan rpida como la de memoria principal Pero la escritura es lenta (pocos microsegundos), el borrado es an ms lento El coste por unidad es similar al de la memoria principal Ampliamente utilizado en dispositivos embebidos tales como cmaras digitales tambin conocida como EEPROM (Electrically Erasable Programmable Read-Only Memory)

Discos magnticos
Los datos se almacenan en discos giratorios, y que se leen/escriben magnticamente Es el principal medio de almacenamiento de datos a largo plazo; tpicamente almacenan bases de datos enteras. Los datos se deben mover de disco a memoria principal para acceder a ellos, y escritos de nuevo hacia el disco si se modifican Los accesos son mucho ms lentos que a memoria principal Acceso directo es posible leer datos de disco en cualquier orden, al contrario que en las cintas magnticas Las capacidades actuales llegan hasta a cientos de GB Mucha mayor capacidad y menor coste/byte que la memoria principal/flash Crece de manera constante y rpida con las mejoras tecnolgicas (factor de 2 a 3 cada 2 aos) Sobrevive a fallos de corriente y cadas del sistema Los fallos de disco pueden destruir datos, pero son muy infrecuentes

Jerarqua de Almacenamiento

Almacenamiento primario

Almacenamiento secundario o en lnea

Almacenamiento terciario o fuera de lnea

RAID (Redudant Arrays of Independent Disk)


Tcnicas de organizacin de disco que gestionan una gran cantidad de discos, proporcionando la imagen de un solo disco de:
Gran capacidad y alta velocidad utilizando varios discos en paralelo, y Alta disponibilidad almacenando datos de forma redundante, de tal manera que los datos se pueden recuperar an cuando un disco falle

El paralelismo en un sistema de disco tiene dos objetivos principales:


Equilibrar la carga de varios accesos de pequeo tamao para incrementar las prestaciones Paralelizar accesos de gran tamao para reducir el tiempo de respuesta. Generalmente, se realiza a nivel de bloque, con n discos, el bloque i de un fichero va al disco (i mod n) + 1 Las peticiones de diferentes bloques se pueden ejecutar en paralelo si los bloques estn en discos distintos Una peticin de una secuencia grande de bloques puede utilizar todos los discos en paralelo

Niveles de RAID: 0 a 6

Niveles de RAID
Nivel 0: No redundancia Aplicaciones de alta disponibilidad donde no sea crtico la perdida de informacin

Nivel 1: Buen comportamiento en escritura Disco espejo

Nivel 5: Paridad distribuida brazos entrelazados

con

RAID 0+1
No redundante y en espejo. este nivel combina las tcnicas de divisin en franjas y de duplicacin en espejo.

RAID 2
Cdigos de correccin de errores tipo memoria, con este nivel la franja est compuesta por un nico bit y se utiliza cdigos hamming como esquema de redundancia.

RAID 3
Paridad con entrelazado de bit. este nivel proporciona redundancia almacenando informacin de paridad en uno de los discos matriz. esta informacin de paridad puede utilizarse para recuperar los datos de otros discos en caso de que estos fallen. este nivel utiliza menos espacio de almacenamiento que RAID 1, pero el disco de paridad puede convertirse en un cuello de botella.

RAID 4
Paridad con entrelazo de bloque. en este nivel la franja es el bloque del disco, mantenindose un bloque de paridad en un disco independiente para una serie de bloques correspondientes almacenados en otros discos. Si uno de los discos falla, puede usar usarse el bloque de paridad junto con los bloques correspondientes de los otros discos para restaurar los bloques del disco fallido.

RAID 5
Paridad distribuida con entrelazado de bloques. Este nivel de datos de paridad como mecanismo de introduccin de redundancia, de forma similar a RAID 3, pero distribuye en franjas los datos de paridad entre todos los discos, en forma similar a como se distribuyen en franjas los datos de origen. esto reduce la posibilidad de que el disco de paridad se convierta en un cuello de botella.

RAID 6
Redundancia P+Q, este nivel es similar a RAID 5, pero se introducen datos redundantes adicionales como proteccin frente a fallos mltiples de disco. en lugar de emplear esquemas de paridad, se utiliza correccin de errores.

Eleccin del nivel del RAID


Factores a tener en cuenta al elegir un nivel de RAID: Costo econmico extras de los requisitos de almacenamiento en disco. Requisitos de rendimiento en trminos del nmero de operaciones de entrada/salida. Rendimiento cuando falla un disco. Rendimiento durante la reconstruccin.

Comparacin de conjuntos RAID

Tipo de RAID RAID 0 (conjunto dividido sin paridad) RAID 1 (volumen reflejado) RAID 5 (conjunto dividido con paridad distribuida) RAID 10 (conjunto en espejo)

Tolerancia de errores Ninguna

Rendimiento Mejor lectura y escritura

Puede fallar un disco Buena lectura, escritura aceptable Puede fallar un disco Excelente lectura, escritura bastante pobre. Puede fallar la mitad Excelente lectura y de los discos (pero escritura no los discos de un par reflejado)

Ajustes de E/S para los tipos RAID

Tipo de RAID

Clculo de E/S por disco

RAID 0 (conjunto dividido sin (lectura + escritura)/nmero de discos paridad)

RAID 1 (volumen reflejado)


RAID 5 (conjunto dividido con paridad distribuida) RAID 10 (conjunto en espejo)

[lecturas +(2 x escrituras)]/2


[lecturas +(4 x escrituras)]/nmero de discos E/S por disco =[lecturas + (2 x escrituras)]/nmero de discos

Rendimiento en reconstruccin
El rendimiento en la reconstruccin de un sistema RAID puede ser un factor importante si se necesita un aporte continuo de datos, como ocurre en los sistemas de bases de datos de alto rendimiento. RAID de Nivel 0 se usa en aplicaciones de alto rendimiento donde la seguridad de los datos no es crtica. RAID de Nivel 1 presenta la reconstruccin ms sencillo pero con el sistema ms caro RAID de Nivel 3 (2) raramente se usa dado que la distribucin de bloques da mejores resultados para grandes transferencias

Rendimiento en reconstruccin
RAID de Nivel 5 (4) es una gran opcin para aplicaciones donde los datos se leen frecuentemente y se escriben raramente. RAID de Nivel 6 no se soporta actualmente en casi ninguna implementacin RAID, pero es recomendable en aplicaciones en las cuales la seguridad de datos es muy importante
Requisitos Almacenamiento RAID de nivel 1 RAID de nivel 5 Moderado Alto Entrada/Salida Alto Moderado

Recomendaciones
La configuracin optima del disco para un servidor de base de datos depende del uso esperado de ese servidor. Cuando ms se utilice un servidor de base de datos, ms conjuntos de unidades debera dedicar a los componentes individuales del servidor. Un diseo bsico de un servidor de base de datos con un uso medio incluye tres conjuntos de unidades fsicas. Correspondindose cada uno con unidades lgicas. Un volumen se reserva para el S.O. Un segundo para los registros de transacciones. Un tercero para las bases de datos.

Recomendaciones
Oracle recomienda utilizar RAID 1 para los archivos del registro rehacer. Para los archivos de bases de datos, Oracle recomienda 5 (si el coste adicional en escritura es aceptable) o en caso contrario, RAID 1 o RAID 0+1. Para SQL Server se recomienda normalmente RAID 1. para la unidad que contiene el registro de transacciones se recomienda RAID 1 0 RAID 10. Para la unidad de base de datos, la eleccin se reduce normalmente a RAID 10 o RAID 5.

Organizacin de registros
Generalmente se usa un archivo separado para almacenar los registros de cada relacin de la base de datos. Existen organizaciones de archivos en agrupaciones en las cuales se guardan en el mismo archivo registros de relaciones diferentes

Archivos en montculo
En la organizacin de archivos en montculo se puede colocar cualquier registro en cualquier parte del archivo en que haya espacio suficiente.

No hay ninguna ordenacin de los registros. Generalmente slo hay un archivo por relacin

Archivos en montculo
En la organizacin de archivos secuenciales los registros se guardan en orden secuencial, basado en el valor de la clave de bsqueda (no tiene por qu ser una clave principal o una superclave) de cada registro

Hash
En la organizacin asociativa (hash) de archivos se calcula una funcin de asociacin de algn atributo de cada registro. El resultado de la funcin de asociacin especifica el bloque del archivo en el que se colocar el registro. Est muy relacionado con la creacin de ndices

Almacenamiento con Diccionario de Datos

Catlogo del sistema


Un sistema de bases de datos relacional necesita tener datos sobre las relaciones, como por ejemplo el esquema:

Los nombres de las relaciones. Los nombres de los atributos de cada relacin. Los dominios y las longitudes de los atributos. Los nombres de las vistas definidas en la base de datos y las definiciones de esas vistas. Las restricciones de integridad.

Datos adicionales
Datos de los usuarios del sistema Los nombres de los usuarios autorizados La informacin de las cuentas de los usuarios Contraseas u otra informacin usada para autentificar a los usuarios Datos de informacin estadstica y descriptiva Nmero de tuplas de cada relacin Mtodo de almacenamiento utilizado para cada relacin La organizacin del almacenamiento (secuencial, asociativa o con montculos)

Datos adicionales
Datos sobre los ndices de cada una de las relaciones: El nombre del ndice El nombre de la relacin para la cual se crea el ndice Los atributos sobre los cuales se define el ndice El tipo de ndice formado

Ficheros de Base de Datos

Ficheros de control
Almacenan la informacin (fichero binario) para mantener y verificar la integridad de la Base de Datos: estructura, nombre y fecha de creacin de la base de datos, nombre de los ficheros de datos y de los ficheros de redo log Guarda tambin informacin de sincronizacin: estado de los ficheros cuando se cerr la base de datos, tiempo de cierre Tambin es necesario para su recuperacin.

Ficheros de parmetros
Define las caractersticas de la instancia y se lee cuando esta arranca, configurndola segn el valor de los parmetros.

También podría gustarte