Documentos de Académico
Documentos de Profesional
Documentos de Cultura
RAID
Concepto
En términos generales y partiendo de su acrónimo en ingles Redundant Array of
Independent Disks (RAID) es un sistema que permite combinar el
almacenamiento de un grupo de dispositivos independientes, en una única
unidad virtual de almacenamiento o múltiples unidades virtuales.
• En un grupo completo
• En más de un grupo
• En parte de un grupo
• Rendimiento y redundancia
• Costos de hardware
• Capacidad de almacenamiento (escalabilidad)
Soluciones RAID pueden estar basadas en hardware especializado o
herramientas de software.
De forma general, los RAID han sido utilizados desde hace muchos años por
empresas, debido a la especial importancia de sus datos y de la necesidad de
preservarlos y asegurar su redundancia. Éstas cuentan con uno o varios
servidores que se dedican específicamente a gestionar este almacén de
información, con hardware específicamente diseñado para este uso y con un
escudo de protección frente a amenazas externas que evitarán el acceso
indebido a ellos. Normalmente, en estos almacenes se utilizan discos duros
idénticos en prestaciones y tecnología de fabricación, para que su escalabilidad
sea óptima.
Pero en la actualidad, casi todos nosotros podremos utilizar un sistema RAID si
tenemos una placa base relativamente nueva y con un chipset que implemente
este tipo de instrucciones internas. Tan solo necesitaremos varios discos
conectados a nuestra paca base para empezar a configurar un RAID desde Linux,
Mac o Windows.
En caso de que nuestro equipo no implemente esta tecnología, necesitaremos
una controladora RAID para gestionar el almacén directamente desde hardware,
aunque en este caso el sistema será susceptible a fallos de esta controladora,
algo que por ejemplo no ocurre si lo gestionamos mediante software.
Estructura
Hardware RAID
• El arreglo es administrado por una controladora de disco que contiene un
software embebido (firmware) para RAID.
• La capa de software del computador accede a un único dispositivo virtual
de almacenamiento. El arreglo está oculto y es administrado por el
controlador RAID.
• Las soluciones de hardware RAID pueden ser:
Tarjetas controladoras RAID
Gabinetes externos conectados a puertos SCSI, Fiber Channel, otros
Gabinetes externos conectados en red (storage área network – SAN)
Tarjetas controladoras
Directamente instaladas en el computador (ej: PCI) reciben la conexión de los
dispositivos generalmente a través de interfaces estándar (ej: IDE, SATA, otros).
Contiene un BIOS para administración, configuración y mantenimiento del RAID.
Es importante asegurar que es soportada por el OS (ej: Linux).
Gabinetes externos
• Conectados a través de puertos de alto rendimiento (ej: SCSI, Fiber
Channel, otros).
• Aparecen como un punto de montaje externo(no requieren módulos
especiales a nivel de kernel).
• Alto costo incial y de mantenimiento (generalmente soluciones
propietarias).
Storage Area Networks (SAN)
• Varias plataformas de almacenamiento interconectadas a través de una
red de alta velocidad.
• Conectada a diferentes partes de la LAN aumentando el rendimiento hacia
el sistema de almacenamiento.
• Se está convirtiendo en la tendencia en organizaciones distribuidas de
gran escala.
Software RAID
• El arreglo es administrado a nivel de kernel.
• El kernel mantiene la organización de los datos en varios discos mientras
presenta un solo dispositivo virtual a la capa de aplicaciones.
• Se ha popularizado en las últimas décadas debido a:
Mayor capacidad de CPU a bajos costos
Muchos sistemas operativos (ej: Linux) proveen soporte y
funcionalidades de RAID como parte del software.
Niveles de RAID
• Diferentes aplicaciones requieren implementaciones de diferentes
estructuras de RAID. Estas diferentes estructuras se conocen como
niveles.
• Diferentes niveles de RAID ofrecen diversidad de compromiso entre
rendimiento y redundancia.
• La selección del nivel adecuado requiere un alto entendimiento de las
necesidades de sus aplicaciones y usuarios (incluyendo escalabilidad).
Conceptos
Stripping
RAID 0
El primer de RAID que tenemos es el denominado Nivel 0 o conjunto dividido. En
este caso, no tenemos redundancia de datos, ya que la función de este nivel es
la de distribuir los datos que se almacenan entre los distintos discos duros que
están conectados al equipo.
El objetivo de implementar un RAID 0 es la de proporcionar buenas velocidades
de acceso a los datos que estén guardados en los discos duros, ya que la
información esta equitativamente repartida en ellos para tener acceso
simultáneo a mayor cantidad de datos con sus discos funcionando en paralelo.
RAID 0 no tiene información de paridad ni redundancia de datos, por lo que, si se
rompe una de las unidades de almacenamiento, perderemos todos los datos que
había en su interior, a menos que tengamos realizadas copias de seguridad
externas a esta configuración.
Para realizar un RAID 0 debemos de prestar atención al tamaño de los discos
duro que lo forman. En este caso será el disco duro de menor tamaño el que
determine el espacio añadido en el RAID. Si tenemos un disco duro de 1 TB y otro
de 500 GB en la configuración, el tamaño del conjunto funcional será de 1 TB,
cogiendo el disco duro de 500 GB y otros 500 GB del disco de 1 TB. Es por esto
que lo ideal será utilizar discos duros de igual tamaño para poder utilizar todo el
espacio disponible en el conjunto diseñado.
RAID 1
RAID 5
También llamado sistema distribuido con paridad. Éste sí que se utiliza con más
frecuencia en la actualidad que los niveles 2, 3 y 4, concretamente en dispositivos
NAS. En este caso la información es almacenada de forma dividida en bloques
que se reparten entre los discos duros que formen el RAID. Pero además se
genera un bloque de paridad para asegurar la redundancia y poder reconstruir la
información en caso de que un disco duro se corrompa. Este bloque de paridad
se almacenará en una unidad distinta a los bloques de datos que están
implicados en el bloque calculado, de esta forma la información de paridad
estará almacenada en un disco distinto a donde están los bloques de datos
implicados.
En este caso, también necesitaremos al menos tres unidades de
almacenamiento para asegurad la redundancia de datos con paridad, y
solamente se tolerará el fallo en una unidad a la vez. En caso de romperse dos
de forma simultánea, perderemos la información de paridad, y al menos uno de
los bloques de datos implicados. Existe una variante RAID 5E en donde se
introduce un disco duro de reserva para minimizar el tiempo de reconstrucción
de datos, si una de las principales fallas.
RAID 10