Está en la página 1de 8

RAID

RAID viene del ingls Redundant Array of Independent Disks que significa conjunto redundante de discos independientes, (aunque originalmente era por Redundant Array Inexpensive Disks conjunto redundante de discos baratos) se refiere a un sistema de almacenamiento de datos que usa mltiples unidades de almacenamiento de datos (discos duros o SSD) entre los que se distribuyen o replican los datos. Dependiendo de su configuracin, los beneficios de un RAID respecto a un nico disco son uno o varios de los siguientes: mayor integridad, mayor tolerancia a fallos, mayor throughput (rendimiento) y mayor capacidad. En el nivel ms simple, un RAID combina varios discos duros en una sola unidad lgica. As, en lugar de ver varios discos duros diferentes, el sistema operativo ve uno solo. Los RAIDs suelen usarse en servidores y normalmente (aunque no es necesario) se implementan con unidades de disco de la misma capacidad. Se encuentran tambin como opcin en las computadoras personales ms avanzadas. Esto es especialmente frecuente en las computadoras dedicadas a tareas intensivas y que requiera asegurar la integridad de los datos en caso de fallo del sistema. Los sistemas basados en software son mucho ms flexibles (permitiendo, por ejemplo, construir RAID de particiones en lugar de discos completos y agrupar en un mismo RAID discos conectados en varias controladoras) y los basados en hardware aaden un punto de fallo ms al sistema (la controladora RAID).

NIVELES DE RAID
Los niveles ms comnmente son: RAID 0: Conjunto dividido RAID 1: Conjunto en espejo RAID 5: Conjunto dividido con paridad distribuida

RAID 0 (Data Striping)


Llamado conjunto dividido, volumen dividido, volumen seccionado distribuye los datos equitativamente entre dos o ms discos sin informacin de paridad que proporcione redundancia. Se usa normalmente para incrementar el rendimiento, aunque tambin puede utilizarse como forma de crear un pequeo nmero de grandes discos virtuales a partir de un gran nmero de pequeos discos fsicos. Puede crearse con discos de diferentes tamaos, pero el espacio de almacenamiento

aadido al conjunto estar limitado por el tamao del disco ms pequeo (por ejemplo, si un disco de 300 GB se divide con uno de 100 GB, el tamao del conjunto resultante ser slo de 200 GB, ya que cada disco aporta 100GB). Una buena implementacin de un RAID 0 dividir las operaciones de lectura y escritura en bloques de igual tamao, por lo que distribuir la informacin equitativamente entre los dos discos. Tambin es posible crear un RAID 0 con ms de dos discos, si bien, la fiabilidad no es buena pues para que el conjunto falle es suficiente con que lo haga cualquiera de sus discos.

RAID 1
Un RAID 1 crea una copia exacta (o espejo) de un conjunto de datos en dos o ms discos. Esto resulta til cuando el rendimiento en lectura es ms importante que la capacidad. Un conjunto RAID 1 slo puede ser tan grande como el ms pequeo de sus discos. Un RAID 1 clsico consiste en dos discos en espejo, lo que incrementa exponencialmente la fiabilidad respecto a un solo disco; es decir, para que el conjunto falle es necesario que lo hagan todos sus discos. Ya que todos los datos estn en dos o ms discos el rendimiento de lectura se incrementa; es decir, un RAID 1 puede estar leyendo simultneamente dos datos diferentes en dos discos diferentes, por lo que su rendimiento se duplica. Al escribir, el conjunto se comporta como un nico disco, dado que los datos deben ser escritos en todos los discos del RAID 1. Por tanto, el rendimiento no mejora.

RAID 2
Usa divisin a nivel de bits con un disco de paridad dedicado. Se usa rara vez en la prctica. Uno de sus efectos secundarios es que normalmente no puede atender varias peticiones simultneas, debido a que por definicin cualquier simple bloque de datos se dividir por todos los miembros del conjunto, residiendo la misma direccin dentro de cada uno de ellos. As, cualquier operacin de lectura o escritura exige activar todos los discos del conjunto, suele ser un poco lento porque se producen cuellos de botella. Son discos paralelos pero no son independientes (no se puede leer y escribir al mismo tiempo).

RAID 3
Un RAID 3 divide los datos a nivel de bytes en lugar de a 1 nivel de bloques y usa un cdigo de Hamming para

la correccin de errores. Los discos son sincronizados por la controladora para funcionar al unsono. ste es el nico nivel RAID original que actualmente no se usa. Permite tasas de transferencias extremadamente altas. Tericamente, un RAID 3 necesitara 39 discos en un sistema informtico moderno: 32 se usaran para almacenar los bits individuales que forman cada palabra y 7 se usaran para la correccin de errores. En el ejemplo del grfico, una peticin del bloque A formado por los bytes A1 a A6 requerira que los tres discos de datos buscaran el comienzo (A1) y devolvieran su contenido. Una peticin simultnea del bloque B tendra que esperar a que la anterior concluyese.

RAID 4
Tambin conocido como IDA (acceso independiente con 2 discos dedicados a la paridad ) usa divisin a nivel de bloques con un disco de paridad dedicado. Necesita un mnimo de 3 discos fsicos. El RAID 4 se diferencia del anterior porque divide a nivel de bloques en lugar de a nivel de bytes. Esto permite que cada miembro del conjunto funcione independientemente cuando se solicita un nico bloque. Si la controladora de disco lo permite, un conjunto RAID 4 puede servir varias peticiones de lectura simultneamente. En principio tambin sera posible servir varias peticiones de escritura simultneamente, pero al estar toda la informacin de paridad en un solo disco, ste se convertira en el cuello de botella del conjunto. En el grfico de ejemplo anterior, una peticin del bloque A1 sera servida por el disco 0. Una peticin simultnea del bloque B1 tendra que esperar, pero una peticin de B2 podra atenderse concurrentemente.

RAID 5
Un RAID 5 es una divisin de datos a nivel de bloques distribuyendo la informacin de paridad entre todos los discos miembros del conjunto. Tiene bajo coste de redundancia. Generalmente se implementa con soporte hardware para el clculo de la paridad. Necesitar un mnimo de 3 discos para ser implementado. Cada vez que un bloque de datos se escribe en un RAID 5, se genera un bloque de paridad dentro de la misma divisin (stripe). Un bloque se compone a menudo de muchos sectores consecutivos de disco. Una serie de bloques (un bloque de cada uno de los discos del conjunto) recibe el nombre colectivo de divisin (stripe). Si otro bloque, o alguna porcin de un bloque, es escrita en esa misma divisin, el bloque de paridad (o una parte del mismo) es recalculada y vuelta a escribir. El disco utilizado por el bloque de paridad est escalonado de una divisin a la siguiente, de ah el

trmino bloques de paridad distribuidos. Las escrituras en un RAID 5 son costosas en trminos de operaciones de disco y trfico entre los discos y la controladora. La diferencia entre el RAID 4 y el RAID 5 es que, en el Modo Interno de Recuperacin de Datos, el 3 RAID 5 puede ser ligeramente ms rpido, debido a que, cuando el CRC y la paridad estn en el disco que fall, los clculos no tienen que realizarse, mientras que en el RAID 4, si uno de los 2 La paridad consiste en aadir un bit, denominado bit de paridad, que indique si el nmero de los bits de valor 1 en los discos de datos falla, los clculos tienen que ser realizados en cada acceso.
datos precedentes es par o impar.

El fallo de un segundo disco provoca la prdida completa de los datos.


3

La comprobacin de redundancia cclica (CRC) es un cdigo de deteccin de errores usado frecuentemente

en redes digitales y en dispositivos almacenamiento detectar cambios accidentales en los datos. ilimitado, pero El nmero mximo de discos de en un grupo depara redundancia RAID 5 es tericamente en la prctica es comn limitar el nmero de unidades. Los inconvenientes de usar grupos de redundancia mayores son una mayor probabilidad de fallo simultneo de dos discos, un mayor tiempo de reconstruccin y una mayor probabilidad de hallar un sector irrecuperable durante una reconstruccin.

RAID 6
Un RAID 6 ampla el nivel RAID 5 aadiendo otro bloque de paridad, por lo que divide los datos a nivel de bloques y distribuye los dos bloques de paridad entre todos los miembros del conjunto. El RAID 6 no era uno de los niveles RAID originales. Al igual que en el RAID 5, en el RAID 6 la paridad se distribuye en divisiones (stripes), con los bloques de paridad en un lugar diferente en cada divisin. El RAID 6 es ineficiente cuando se usa un pequeo nmero de discos pero a medida que el conjunto crece y se dispone de ms discos la prdida en capacidad de almacenamiento se hace menos importante, creciendo al mismo tiempo la probabilidad de que dos discos fallen simultneamente. El RAID 6 proporciona proteccin contra fallos dobles de discos y contra fallos cuando se est reconstruyendo un disco. En caso de que slo tengamos un conjunto puede ser ms adecuado que usar un RAID 5 con un disco de reserva (hot spare). La capacidad de datos de un conjunto RAID 6 es n-2, siendo n el nmero total de discos del conjunto.

RAID 5E y RAID 6E
Se suele llamar RAID 5E y RAID 6E a las variantes de RAID 5 y RAID 6 que incluyen discos de reserva. Estos discos pueden estar conectados y preparados (hot spare) o en espera (standby spare). En los RAIDs 5E y RAID 6E, los discos de reserva estn disponibles para cualquiera de las unidades miembro. No suponen mejora alguna del rendimiento, pero s se minimiza el tiempo de reconstruccin (en el caso de los discos hot spare) y las labores de

administracin cuando se producen fallos. Un disco de reserva no es realmente parte del conjunto hasta que un disco falla y el conjunto se reconstruye sobre el de reserva.

Niveles RAID anidados


Muchas controladoras permiten anidar niveles RAID, es decir, que un RAID pueda usarse como elemento bsico de otro en lugar de discos fsicos. Resulta instructivo pensar en estos conjuntos como capas dispuestas unas sobre otras, con los discos fsicos en la inferior. Los RAIDs anidados se indican normalmente uniendo en un solo nmero los correspondientes a los niveles RAID usados, aadiendo a veces un + entre ellos. Por ejemplo, el RAID 10 (o RAID 1+0) consiste conceptualmente en mltiples conjuntos de nivel 1 almacenados en discos fsicos con un nivel 0 encima, agrupando los anteriores niveles 1. En el caso del RAID 0+1 se usa ms esta forma que RAID 01 para evitar la confusin con el RAID 1. Sin embargo, cuando el conjunto de ms alto nivel es un RAID 0 (como en el RAID 10 y en el RAID 50), la mayora de los vendedores eligen omitir el +, a pesar de que RAID 5+0 sea ms informativo. Al anidar niveles RAID, se suele combinar un nivel RAID que proporcione redundancia con un RAID 0 que aumenta el rendimiento. Con estas configuraciones es preferible tener el RAID 0 como nivel ms alto y los conjuntos redundantes debajo, porque as ser necesario reconstruir menos discos cuando uno falle. (As, el RAID 10 es preferible al RAID 0+1 aunque las ventajas administrativas de dividir el espejo del RAID 1 se perderan.) Los niveles RAID anidados ms comnmente usados son: RAID 0+1: Un espejo de divisiones RAID 1+0: Una divisin de espejos RAID 30: Una divisin de niveles RAID con paridad dedicada RAID 100: Una divisin de una divisin de espejos RAID 10+1: Un Espejo de espejos

RAID 0+1
Un RAID 0+1 (tambin llamado RAID 01, no debe confundirse con RAID 1) es un RAID usado para replicar y compartir datos entre varios discos. La diferencia entre un RAID 0+1 y un RAID 1+0 es la localizacin de cada nivel RAID dentro del conjunto final: un RAID 0+1 es un espejo de divisiones.

Como puede verse en el diagrama, primero se crean dos conjuntos RAID 0 (dividiendo los datos en discos) y luego, sobre los anteriores, se crea un conjunto RAID 1 (realizando un espejo de los anteriores). La ventaja de un RAID 0+1 es que cuando un disco duro falla, los datos perdidos pueden ser copiados del otro conjunto de nivel 0 para reconstruir el conjunto global. Sin embargo, aadir un disco duro adicional en una divisin, es obligatorio aadir otro al de la otra divisin para equilibrar el tamao del conjunto. Adems, el RAID 0+1 no es tan robusto como un RAID 1+0, no pudiendo tolerar dos fallos simultneos de discos salvo que sean en la misma divisin. Es decir, cuando un disco falla, la otra divisin se convierte en un punto de fallo nico. Adems, cuando se sustituye el disco que fall, se necesita que todos los discos del conjunto participen en la reconstruccin de los datos.

RAID 1+0
Un RAID 1+0, a veces llamado RAID 10, es parecido a un RAID 0+1 con la excepcin de que los niveles RAID que lo forman se invierte: el RAID 10 es una divisin de espejos. En cada divisin RAID 1 pueden fallar todos los discos salvo uno sin que se pierdan datos. Sin embargo, si los discos que han fallado no se reemplazan, el restante pasa a ser un punto nico de fallo para todo el conjunto. Si ese disco falla entonces, se perdern todos los datos del conjunto completo. Como en el caso del RAID 0+1, si un disco que ha fallado no se reemplaza, entonces un solo error de medio irrecuperable que ocurra en el disco espejado resultara en prdida de datos. El RAID 10 es a menudo la mejor eleccin para bases de datos de altas prestaciones, debido a que la ausencia de clculos de paridad proporciona mayor velocidad de escritura.

RAID 30
El RAID 30 o divisin con conjunto de paridad dedicado es una combinacin de un RAID 3 y un RAID 0. El RAID 30 proporciona tasas de transferencia elevadas combinadas con una alta fiabilidad a cambio de un coste de implementacin muy alto. La mejor forma de construir un RAID 30 es combinar dos conjuntos RAID 3 con los datos divididos en ambos conjuntos. El RAID 30 permite que falle un disco de cada conjunto RAID 3. Hasta que estos discos que fallaron sean reemplazados, los otros discos de cada conjunto que sufri el fallo son puntos nicos de fallo para el conjunto RAID 30 completo. En otras palabras, si alguno de ellos falla se perdern todos los datos del conjunto. El tiempo de recuperacin necesario (detectar y responder al fallo del disco y reconstruir el conjunto sobre el disco nuevo) representa un periodo de vulnerabilidad para el RAID.

RAID 100
Un RAID 100, a veces llamado tambin RAID 10+0, es una divisin de conjuntos RAID 10. El RAID 100 es un ejemplo de RAID cuadriculado, un RAID en el que conjuntos divididos son a su vez divididos conjuntamente de nuevo. Todos los discos menos unos podran fallar en cada RAID 1 sin perder datos. Sin embargo, el disco restante de un RAID 1 se convierte as en un punto nico de fallo para el conjunto degradado. A menudo el nivel superior de divisin se hace por software. Los principales beneficios de un RAID 100 (y de los RAIDs cuadriculados en general) sobre un nico nivel RAID son mejor rendimiento para lecturas aleatorias y la mitigacin de los puntos calientes de riesgo en el conjunto. Por estas razones, el RAID 100 es a menudo la mejor eleccin para bases de datos muy grandes, donde el conjunto software subyacente limita la cantidad de discos fsicos permitidos en cada conjunto estndar. Implementar niveles RAID anidados permite eliminar virtualmente el lmite de unidades fsicas en un nico volumen lgico.

RAID 10+1
Un RAID 10+1, es un reflejo de dos RAID 10. Se utiliza en los llamados Network RAID que aceptan algunas cabinas de datos. Es un sistema de alta disponibilidad por red, lo que permite la replicacin de datos entre cabinas a nivel de RAID, con lo cual se simplifica ampliamente la gestin de replicacin de cabinas. El RAID 10+1, tratndose de espejos de RAID10 que tienen una gran velocidad de acceso, hace que el rendimiento sea muy aceptable.

RAID 50
Un RAID 50, a veces llamado tambin RAID 5+0, combina la divisin a nivel de bloques de un RAID 0 con la paridad distribuida de un RAID 5, siendo pues un conjunto RAID 0 dividido de elementos RAID 5. Un disco de cada conjunto RAID 5 puede fallar sin que se pierdan datos. Sin embargo, si el disco que falla no se reemplaza, los discos restantes de dicho conjunto se convierten en un punto nico de fallo para todo el conjunto. Si uno falla, todos los datos del conjunto global se pierden. El tiempo

necesario para recuperar (detectar y responder al fallo de disco y reconstruir el conjunto sobre el nuevo disco) representa un periodo de vulnerabilidad del conjunto RAID. La configuracin de los conjuntos RAID repercute sobre la tolerancia a fallos general. Una configuracin de tres conjuntos RAID 5 de siete discos cada uno tiene la mayor capacidad y eficiencia de almacenamiento, pero slo puede tolerar un mximo de tres fallos potenciales de disco. El RAID 50 mejora el rendimiento del RAID 5, especialmente en escritura, y proporciona mejor tolerancia a fallos que un nivel RAID nico. Este nivel se recomienda para aplicaciones que necesitan gran tolerancia a fallos, capacidad y rendimiento de bsqueda aleatoria. A medida que el nmero de unidades del conjunto RAID 50 crece y la capacidad de los discos aumenta, el tiempo de recuperacin lo hace tambin.

También podría gustarte