Está en la página 1de 10

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS


CARRERA DE SOFTWARE

Integrantes: Asignatura: Sistemas Operativos

• Eduardo Chávez Zumba Tarea: RAID, concepto, estructura y


• Samuel Hereira Díaz niveles.
• Joel Villao de la S
Curso: SOF-S-MA-3-1

RAID

Concepto
En términos generales y partiendo de su acrónimo en ingles Redundant Array of
Independent Disks (RAID) es un sistema que permite combinar el
almacenamiento de un grupo de dispositivos independientes, en una única
unidad virtual de almacenamiento o múltiples unidades virtuales.

Mayor rendimiento y confiabilidad mediante lectura/escritura simultanea de


datos en múltiples dispositivos (físicos o virtuales). Recordando que:
Dispositivos físicos, por ejemplo, grupo de discos duros.

Dispositivos virtuales, por ejemplo, particiones en un grupo de discos que


podrían ser:

• En un grupo completo

• En más de un grupo

• En parte de un grupo

• En parte de más de un grupo

Diferentes esquemas de lectura/escritura conocido como niveles (RAIDs levels).


El nivel para elegir depende de las necesidades en cuanto:

• Rendimiento y redundancia
• Costos de hardware
• Capacidad de almacenamiento (escalabilidad)
Soluciones RAID pueden estar basadas en hardware especializado o
herramientas de software.
De forma general, los RAID han sido utilizados desde hace muchos años por
empresas, debido a la especial importancia de sus datos y de la necesidad de
preservarlos y asegurar su redundancia. Éstas cuentan con uno o varios
servidores que se dedican específicamente a gestionar este almacén de
información, con hardware específicamente diseñado para este uso y con un
escudo de protección frente a amenazas externas que evitarán el acceso
indebido a ellos. Normalmente, en estos almacenes se utilizan discos duros
idénticos en prestaciones y tecnología de fabricación, para que su escalabilidad
sea óptima.
Pero en la actualidad, casi todos nosotros podremos utilizar un sistema RAID si
tenemos una placa base relativamente nueva y con un chipset que implemente
este tipo de instrucciones internas. Tan solo necesitaremos varios discos
conectados a nuestra paca base para empezar a configurar un RAID desde Linux,
Mac o Windows.
En caso de que nuestro equipo no implemente esta tecnología, necesitaremos
una controladora RAID para gestionar el almacén directamente desde hardware,
aunque en este caso el sistema será susceptible a fallos de esta controladora,
algo que por ejemplo no ocurre si lo gestionamos mediante software.

HARDWARE VS. SOFTWARE


Esta es una de las primeras decisiones que se debe tomar.
Hardware RAID: Uso de procesadores dedicados (generalmente ubicados en
controladoras de disco) para realizar las operaciones del arreglo.
Software RAID: Uso del CPU del computador para realizar operaciones del
arreglo implementadas a nivel de kernel.

Estructura

Hardware RAID
• El arreglo es administrado por una controladora de disco que contiene un
software embebido (firmware) para RAID.
• La capa de software del computador accede a un único dispositivo virtual
de almacenamiento. El arreglo está oculto y es administrado por el
controlador RAID.
• Las soluciones de hardware RAID pueden ser:
Tarjetas controladoras RAID
Gabinetes externos conectados a puertos SCSI, Fiber Channel, otros
Gabinetes externos conectados en red (storage área network – SAN)

Tarjetas controladoras
Directamente instaladas en el computador (ej: PCI) reciben la conexión de los
dispositivos generalmente a través de interfaces estándar (ej: IDE, SATA, otros).
Contiene un BIOS para administración, configuración y mantenimiento del RAID.
Es importante asegurar que es soportada por el OS (ej: Linux).

Gabinetes externos
• Conectados a través de puertos de alto rendimiento (ej: SCSI, Fiber
Channel, otros).
• Aparecen como un punto de montaje externo(no requieren módulos
especiales a nivel de kernel).
• Alto costo incial y de mantenimiento (generalmente soluciones
propietarias).
Storage Area Networks (SAN)
• Varias plataformas de almacenamiento interconectadas a través de una
red de alta velocidad.
• Conectada a diferentes partes de la LAN aumentando el rendimiento hacia
el sistema de almacenamiento.
• Se está convirtiendo en la tendencia en organizaciones distribuidas de
gran escala.

Software RAID
• El arreglo es administrado a nivel de kernel.
• El kernel mantiene la organización de los datos en varios discos mientras
presenta un solo dispositivo virtual a la capa de aplicaciones.
• Se ha popularizado en las últimas décadas debido a:
Mayor capacidad de CPU a bajos costos
Muchos sistemas operativos (ej: Linux) proveen soporte y
funcionalidades de RAID como parte del software.

Software RAID en Linux


Muchas distribuciones soportan RAID de forma nativa a nivel de kernel.
Herramientas maduras (ej: mdadm) que permiten crear, consultar, sincronizar y
dar mantenimiento completo a los dispositivos RAID.

Niveles de RAID
• Diferentes aplicaciones requieren implementaciones de diferentes
estructuras de RAID. Estas diferentes estructuras se conocen como
niveles.
• Diferentes niveles de RAID ofrecen diversidad de compromiso entre
rendimiento y redundancia.
• La selección del nivel adecuado requiere un alto entendimiento de las
necesidades de sus aplicaciones y usuarios (incluyendo escalabilidad).

Conceptos
Stripping

• Técnica de segmentación lógica de los datos que luego son accedidos de


forma secuencial en diferentes dispositivos de almacenamiento.
• Provee un mayor rendimiento en la velocidad de acceso a los datos
almacenados en múltiples dispositivos.
• La falla de un dispositivo causa la perdida de todos los datos.
• Según lo anterior el porcentaje de falla es la suma del porcentaje de falla
de cada dispositivo.
Mirroring

• Técnica en la cual se crean replicas en tiempo real del volumen lógico de


un dispositivo en otros dispositivos físicos.
• Ofrece alta disponibilidad de los datos debido a las múltiples réplicas de
los datos (redundancia).
• De forma adicional provee mejoras en el rendimiento de acceso a los
datos (lectura) en múltiples dispositivos.
• Implementaciones de esta técnica representan un alto costo debido a la
réplica de cada dispositivo.
Parity

• Se genera un conjunto de datos de redundancia a partir de dos o más


conjuntos de datos primarios aplicando la función Boolena XOR.
• Con los datos de redundancia se puede reconstruir los datos de algunos
de los conjuntos de datos primarios.
• Aunque no implica duplicar por completo los datos primarios, esta técnica
puede ocasionar bajo rendimiento en la velocidad de escritura en un RAID.
• Esta técnica aplica a todo un grupo de dispositivos o a segmentos
distribuidos a través de todo el grupo de dispositivos.
• En términos de RAID hablamos de dos tipos de paridad:
• Paridad dedicada → Los datos de paridad de dos o Paridad dedicada más
dispositivos son almacenados en un dispositivo adicional
• Paridad distribuida → Los datos de paridad son distribuidos entre los
dispositivos del arreglo.

RAID 0
El primer de RAID que tenemos es el denominado Nivel 0 o conjunto dividido. En
este caso, no tenemos redundancia de datos, ya que la función de este nivel es
la de distribuir los datos que se almacenan entre los distintos discos duros que
están conectados al equipo.
El objetivo de implementar un RAID 0 es la de proporcionar buenas velocidades
de acceso a los datos que estén guardados en los discos duros, ya que la
información esta equitativamente repartida en ellos para tener acceso
simultáneo a mayor cantidad de datos con sus discos funcionando en paralelo.
RAID 0 no tiene información de paridad ni redundancia de datos, por lo que, si se
rompe una de las unidades de almacenamiento, perderemos todos los datos que
había en su interior, a menos que tengamos realizadas copias de seguridad
externas a esta configuración.
Para realizar un RAID 0 debemos de prestar atención al tamaño de los discos
duro que lo forman. En este caso será el disco duro de menor tamaño el que
determine el espacio añadido en el RAID. Si tenemos un disco duro de 1 TB y otro
de 500 GB en la configuración, el tamaño del conjunto funcional será de 1 TB,
cogiendo el disco duro de 500 GB y otros 500 GB del disco de 1 TB. Es por esto
que lo ideal será utilizar discos duros de igual tamaño para poder utilizar todo el
espacio disponible en el conjunto diseñado.

RAID 1

Esta configuración también es llamada espejo o “mirroring” y es una de las más


comúnmente utilizadas para proporcionar redundancia de datos y buena
tolerancia a fallos. En este caso, lo que estamos haciendo es crear un almacén
con información duplicada en dos discos duros, o dos conjuntos de discos duros.
Cuando almacenamos un dato, este se replica inmediatamente en su unidad
espejo para así tener dos veces el mismo dato almacenado.
A ojos del sistema operativo, solamente tenemos una unidad de
almacenamiento, a la que accedemos para leer los datos de su interior. Pero en
caso de que esta falle, automáticamente se buscará el dato en la unidad
replicada. También es interesante para aumentar la velocidad de lectura de
datos, ya que podremos leer la información de forma simultánea de las dos
unidades en espejo.

RAID 5

También llamado sistema distribuido con paridad. Éste sí que se utiliza con más
frecuencia en la actualidad que los niveles 2, 3 y 4, concretamente en dispositivos
NAS. En este caso la información es almacenada de forma dividida en bloques
que se reparten entre los discos duros que formen el RAID. Pero además se
genera un bloque de paridad para asegurar la redundancia y poder reconstruir la
información en caso de que un disco duro se corrompa. Este bloque de paridad
se almacenará en una unidad distinta a los bloques de datos que están
implicados en el bloque calculado, de esta forma la información de paridad
estará almacenada en un disco distinto a donde están los bloques de datos
implicados.
En este caso, también necesitaremos al menos tres unidades de
almacenamiento para asegurad la redundancia de datos con paridad, y
solamente se tolerará el fallo en una unidad a la vez. En caso de romperse dos
de forma simultánea, perderemos la información de paridad, y al menos uno de
los bloques de datos implicados. Existe una variante RAID 5E en donde se
introduce un disco duro de reserva para minimizar el tiempo de reconstrucción
de datos, si una de las principales fallas.

RAID 10

RAID 10 proporciona buenas velocidades debido a la distribución del RAID 0, pero


reduce la capacidad disponible de un dispositivo a la mitad (asumiendo que
todos los discos de la matriz tienen la misma capacidad).
Ahora tendremos un nivel principal de tipo 0 que divide los datos almacenados
entre los distintos subniveles. A su vez tendremos varios subniveles de tipo 1
que se encargarán de replicar los datos en los discos duros que tengan en su
interior.
En este caso la tolerancia a fallos nos va a permitir que se puedan romper todos
los discos de un subnivel a excepción de uno, y será necesario que al menos
quede un disco sano en cada uno de los subniveles para no perder información.

También podría gustarte