Está en la página 1de 33

Universidad Autnoma

Gabriel Ren Moreno


FACULTAD: CIENCIAS DE LA COMPUTACION Y
TELECOMUNICACIONES

Docente

: Ing. Leonardo Vargas Pea

Integrantes: Jim Adonay Calzadilla


Carlos Mauricio Gareca
Marcos Salvatierra Snchez
Carlos Liders Gutierrez U.
Rene Camargo Leon
Walter Fernando Claros Vega
Materia

: Gestion y Administracin de Redes

Santa Cruz Bolivia

Tutorial RAID: cmo elegir el nivel RAID adecuado

Los grupos RAID pueden parecer ms complejos de lo que realmente


son. Esto se debe a que, actualmente, hay aproximadamente 12 tipos
o variedades distintas de RAID disponibles en el mercado (y an son
ms las que se han desarrollado). Sin embargo, para la gran mayora
de pequeas y medianas empresas (PYMEs), slo hay seis niveles
RAID realmente relevantes. Elegir el nivel RAID adecuado depender
del tipo de datos de las aplicaciones, del nivel de relevancia de esos
datos y del nmero de usuarios. Antes de nada, es necesario tener
unos conocimientos bsicos sobre lo que puede hacer cada uno de
estos seis niveles RAID.
RAID 0
Una RAID 0 divide o reparte los datos entre todas las unidades del
grupo RAID. La ventaja de la RAID 0 es que ofrece un mayor
rendimiento de los datos. El inconveniente es que aunque carecer de
redundancia mejora el rendimiento, cualquier fallo o avera en uno de
los discos conlleva una prdida total de los datos.
RAID 0 es la mejor opcin cuando es primordial obtener un mayor
rendimiento del almacenamiento, cuando el presupuesto es muy
limitado y cuando una posible prdida de los datos no supone mayor
problema. Por ejemplo, algunos datos que funcionan bien en este
nivel son los archivos temporales de edicin de fotografa o vdeo.
RAID 1
Una RAID 1 duplica en espejo todos los datos de cada unidad de
forma sincronizada a una unidad de duplicacin exacta. Si se produce
algn fallo o avera en alguna de las unidades, no se pierde ningn
dato. La ventaja de utilizar una RAID 1 es disponer de un mayor
rendimiento de lectura multiusuario, puesto que pueden leerse ambos
discos al mismo tiempo. La desventaja es que el costo de la unidad de
almacenamiento por byte usable se multiplica por dos, puesto que se
necesitan dos unidades para almacenar los mismos datos.
Elija una RAID 1 para aplicaciones que requieran de una red de
seguridad (es decir, cuando no pueda permitirse la posibilidad de
que se pierdan o estropeen los datos de la aplicacin) adems de
lecturas aleatorias de alto rendimiento. Un buen ejemplo para este
tipo de RAID puede ser la base de datos de slo lectura de una tienda

de venta al por menor no virtual. Una RAID 1 tambin es una buena


eleccin para sistemas de nivel bsico en los que slo estn
disponibles dos unidades, como en el caso de un pequeo servidor de
archivos.
RAID 10 (es decir, RAID 1+0 y RAID 0+1)
Una RAID 10 es la combinacin de una RAID 0 y una RAID 1. La
ventaja de utilizar una RAID 10 es disponer de la redundancia de la
RAID 1 y del nivel de rendimiento de la RAID 0. El rendimiento del
sistema durante la reconstruccin de una unidad tambin es
sensiblemente superior en comparacin con los niveles RAID basados
en paridad (es decir, la RAID 5 y la RAID 6). Esto se debe al hecho de
que los datos no necesitan realizar procesos de regeneracin de la
informacin de la paridad porque sta se copia de la otra unidad
replicada. El inconveniente es el costo, muy superior (normalmente,
entre un 60 y un 80% ms caro) al de los niveles RAID con paridad.
Hay dos tipos de RAID 10. El primero es la RAID 0+1, en la que se
dividen los datos entre mltiples discos y, despus, se duplican en
espejo los discos distribuidos en un grupo de discos idntico. La
segunda clase es la RAID de nivel 1+0, que duplica en espejo los
datos en los casos en los que las rplicas se han distribuido entre
distintas unidades.
Debera decantarse por las RAID 10 cuando utilice aplicaciones que
requieran del alto rendimiento de una RAID 0 y de la incomparable
proteccin de los datos que ofrece una RAID 1. Las bases de datos
transaccionales en lnea suelen encajar en este perfil.
RAID 5
La RAID 5 est diseada para ofrecer el nivel de rendimiento de una
RAID 0 con una redundancia ms econmica y es el nivel RAID ms
habitual en la mayora de empresas. Lo consigue distribuyendo
bloques de datos entre distintas unidades y repartiendo la paridad
entre ellas. No se dedica ningn disco a la paridad de forma exclusiva.
Las ventajas de utilizar una RAID 5 consisten en poder realizar
operaciones de lectura y escritura de forma solapada (es decir, en
poder hacer un uso ms eficiente de las unidades de disco), lo que
acelera

los

pequeos

procesos

de

escritura

en

un

sistema

multiprocesador y facilita una cantidad de almacenamiento usable


superior al de la RAID 1 o 10 (dado que la redundancia acarrea una
reduccin del almacenamiento de, aproximadamente, el 20%, en vez
del 50%). La proteccin de los datos reside en la informacin de la
paridad que se utiliza para reconstruir los datos si una unidad del
grupo RAID falla o sufre una avera. Entre los inconvenientes, se
encuentran: la necesidad de un mnimo de tres (y, normalmente,
cinco) discos por grupo RAID, un nivel de rendimiento del sistema de
almacenamiento significativamente inferior mientras se lleva a cabo
la reconstruccin de una unidad, y la posibilidad de perder totalmente
los datos de un grupo RAID si falla una segunda unidad mientras se
est

realizando

la

reconstruccin

de

la

primera.

Adems,

el

rendimiento de lectura suele ser inferior al de otras modalidades de


RAID porque los datos de la paridad se distribuyen entre cada una de
las unidades.
Debera decantarse por una RAID 5 para la gran mayora de
aplicaciones, siempre y cuando las unidades de disco no sean
unidades SATA de gran capacidad. Las unidades SATA tienen ciclos de
trabajo ms cortos que las unidades SAS o de canal de fibra, e ndices
MTBF inferiores. Y, dado que las unidades SATA tienen una gran
capacidad (de 500 a 1000 GB), los tiempos de reconstruccin son
muy largos y conllevan una degradacin del rendimiento del
controlador. Las unidades SATA de gran capacidad tambin aumentan
la probabilidad de que se produzca un fallo o avera en una segunda
unidad, lo que ocasionara una pDRida total de los datos.
RAID 6
La RAID 6 es similar a la RAID 5 e incluye un segundo sistema de
paridad distribuido entre las unidades del grupo RAID. La ventaja de
utilizar una RAID 6 es que la segunda paridad sirve de proteccin ante
una posible prdida de los datos en caso de que falle o se avere una
segunda unidad dentro del grupo RAID. Esto hace que las unidades
SATA de gran capacidad sean ms viables y econmicas que la RAID 1
o la RAID 10. El inconveniente de utilizar una RAID 6 es que se
obtiene un nivel de rendimiento del sistema de almacenamiento

mucho menor cuando se est llevando a cabo la reconstruccin de


dos unidades de forma simultnea (normalmente, por debajo del
20%).
Debera decantarse por una RAID 6 en el caso de unidades SATA de
gran capacidad y aplicaciones que puedan tolerar un nivel de
rendimiento reducido en ciertas ocasiones. Algunas aplicaciones que
encajan en este perfil son los archivos de datos multimedia no
dinmicos como los JPEGs y el vdeo en streaming.
RAID 50 (tambin conocida como RAID 5+0 y RAID 0+5)
La RAID 50 es la combinacin de una RAID 0 y una RAID 5. Toma
grupos RAID 5 y los distribuye como si fueran RAID 0, lo que aumenta
el nivel de rendimiento. La ventaja de la RAID 50 es su mayor
rendimiento en comparacin con la RAID 5 estndar. Las desventajas
son su mayor costo y que tiene menos capacidad usable.
Existen dos variedades de RAID 50. La RAID 0+5 utiliza mltiples
grupos de RAID 5 distribuidos en un solo grupo RAID. Esto hace que la
fiabilidad del grupo RAID aumente, ya que, ahora, puede tolerar que
una unidad falle o se avere en uno o en ambos conjuntos de RAID 5
sin que se pierdan los datos. La RAID 5+0, la RAID 50 ms habitual,
toma grupos de RAID 5 y los distribuye como si fueran RAID 0.
Debera decantarse por la RAID 50 para aplicaciones en las que sea
importante el ahorro econmico de las RAID 5 y en las que tambin se
necesite un mejor rendimiento.
Definicin de los niveles de RAID
RAID 0
Caractersticas: El disco despliega los datos a travs de dos o ms
unidades de disco con el fin de mejorar el rendimiento de I/O
realizando I/O paralelos. Una ensima parte de los datos se encuentra
en cada una de las unidades de disco, siendo n el nmero de
discos.
Aplicaciones: Proporciona alto rendimiento para lecturas y escrituras.
Sin embargo, no hay redundancia de datos. La RAID 0 por s sola
nicamente se debera utilizar para aplicaciones que puedan tolerar
pDRidas de acceso a datos que se pueden obtener desde otras
fuentes.

RAID 1
Caractersticas: Los discos en espejo proporcionan proteccin de
datos y un rendimiento de lectura mejorado. La RAID 1 duplica los
datos a travs de dos o ms discos, de forma que los discos son
idnticos entre s. La RAID 1 utiliza la proteccin n+n multiplicando
por dos el nmero de dispositivos necesarios.
Aplicaciones: OLTP de lectura intensiva y otros datos transaccionales
para alto rendimiento y alta disponibilidad. Otras aplicaciones que se
pueden beneficiar de la RAID 1 son el correo electrnico, los sistemas
operativos, los ficheros de aplicaciones y los entornos intensivos de
acceso aleatorio y de lectura.
RAID 0+1
Caractersticas: La distribucin y la duplicacin de los datos para
proporcionar

alto

rendimiento

(distribucin)

disponibilidad

(duplicacin) usando un nmero de dispositivos n+n. La prdida de


una unidad de disco no afecta al rendimiento o a la disponibilidad,
como sera el caso con la RAID
0 mientras que la distribucin del disco mejora el rendimiento.
Aplicaciones: Las aplicaciones OLTP y las intensivas en I/O que
requieren alto rendimiento y alta disponibilidad. Esto incluye los
registros de transaccin, los ficheros del diario y los ndices de las
bases de datos donde el clculo de costos se basa en dlares por I/O,
en comparacin con dlares por unidad de almacenamiento.
RAID 1+0 (RAID 10)
Caractersticas: Parecido al RAID 0+1, duplica y distribuye datos para
proporcionar alto rendimiento (distribucin) y alta disponibilidad
(duplicacin) usando un nmero de dispositivos n+n. La diferencia
reside en distribuir grupos de discos juntos y despus duplicar los
grupos de distribucin.
Aplicaciones: Las aplicaciones OLTP y las intensivas en I/O que
requieren alto rendimiento y alta disponibilidad. Esto incluye los
registros de transaccin, los ficheros del diario y los ndices de las
bases de datos donde el clculo de costos se basa en dlares por I/O,
en comparacin con dlares por unidad de almacenamiento.
RAID 3

Caractersticas: Distribuye con paridad dedicada a nivel de byte y


tiene una nica unidad de disco dedicada que almacena la
informacin de paridad usando un mtodo de n+1 en trminos del
nmero de dispositivos necesarios.
Aplicaciones: Esto proporciona un buen rendimiento para imgenes
de video, geofsica, ciencias naturales u otras aplicaciones de
procesamiento secuencial. La RAID 3, sin embargo, no se adapta bien
a

las

aplicaciones

que

requieren

operaciones

simultneas

de

entrada/salida de mltiples usuarios o de flujos de entrada/salida.

RAID 4
Caractersticas: Igual que la RAID 3, pero con proteccin de paridad a
nivel de bloques.
Aplicaciones: La utilizacin de la cache de lectura y escritura funciona
bien con los entornos de ficheros.
RAID 5
Caractersticas: La distribucin de discos y la proteccin de paridad
rotativa usando un nmero n+1 de componentes proporcionan una
buena disponibilidad con un buen rendimiento para mltiples usuarios
simultneos y flujos de entrada/salida. Mediante la utilizacin de una
unidad de disco conectable en caliente, los datos se pueden
reconstruir (reconstruccin de la unidad) para protegerse de un
segundo fallo una vez completado.
Aplicaciones: Reduce el nmero de componentes requeridos mientras
que proporciona una buena disponibilidad, un buen rendimiento para
lecturas, el rendimiento de la escrituras se ve afectado si no se utiliza
la cache de escritura. Entre las aplicaciones adecuadas para la RAID 5
se encuentran los datos de referencia, las tablas de bases de datos
intensivas en lecturas, la comparticin de ficheros generales y las
aplicaciones Web.
RAID 6
Caractersticas: La distribucin del disco con paridad rotativa usando
unidades de doble paridad destinadas a reducir el riesgo de
disponibilidad de datos durante una reconstruccin de la unidad de
disco, concretamente cuando se utilizan unidades de disco SATA y de

Canal de fibra de ms capacidad. El problema con la RAID 6 y con


cualquier esquema de paridad de mltiples unidades es la sobrecarga
del rendimiento al hacer clculos de paridad cuando se escriben datos
o se reconstruye a partir de una unidad de disco que ha fallado.
Aplicaciones: En general, si est buscando lectura y escritura de alto
rendimiento, considere la utilizacin de unidades de disco ms
pequeos y evite la RAID 6. Si, por otro lado, lo que busca es
almacenar grandes cantidades de datos en las que se puedan llevar a
cabo reconstrucciones en segundo plano, la RAID 5 y la RAID 6
pueden se apropiadas si se configuran segn sus necesidades de
aplicaciones.
La Gua didctica de la de RAID

Una Introduccin a RAID


La Necesidad para RAID
Datos de listar & Redundancia
Los Tipos Diferentes de RAID
Tool para la Eficacia del Almacenamiento
Cost & Problemas de la Actuacin
Fiabilidad en Problemas RAID
Tool para la Fiabilidad
Glosario
Referencias

Una Introduccin a RAID


el RAID simboliza Serie Redundante de Discos Baratos.
el RAID es la organizacin de discos mltiples en una actuacin
grande, alta el disco lgico.
El disco forma los datos de la raya por los discos mltiples y los
accede en paralelo lograr:
los datos ms Altos transfieren las proporciones en los accesos de
los datos grandes y
que I/O ms Alto est en los accesos de los datos pequeos.
Datos que tambin rayan los resultados en carga del uniforme que
equilibra por todos los discos, eliminando las manchas calientes que

por otra parte satura un nmero pequeo de discos, mientras la


mayora de discos se sienta ocioso.
Pero....
El disco grande forma, sin embargo es muy vulnerable a los fracasos
del disco. Una serie del disco con cien los discos ms probablemente
son cien veces para fallar que un solo disco. Un MTTF (el malotiempo-a-fracaso) 500,000 horas para un solo disco implican un MTTF
de 500,000/100 es decir 5000 horas para una serie del disco con cien
discos.
As....
La solucin al problema de ms bajo fiabilidad en las series del disco
es mejorar la disponibilidad del

el sistema. Esto puede lograrse

empleando la redundancia en la forma de error-corregir los cdigos a


tolere los fracasos del disco. Una serie del disco redundante puede
retener los datos ahora para el ms tiempo cronometre que un

el

solo disco indefenso.


No confunda entre la fiabilidad y disponibilidad.
La fiabilidad es qu bien que un sistema puede trabajar sin cualquier
fracaso en sus componentes. Si hay un el fracaso, el sistema no era
fiable.
La disponibilidad es qu bien que un sistema puede trabajar en
tiempos de un fracaso. Si un sistema puede incluso trabajar en

la

presencia de un fracaso de uno o ms componentes del sistema, se


dice que el sistema est disponible.
La redundancia mejora la disponibilidad de un sistema, pero no puede
mejorar la fiabilidad. La fiabilidad slo puede aumentarse mejorando
a tecnologas industriales o el individuo menor usando

los

componentes en un sistema.

Las desventajas debido a la Redundancia


Cada vez hay un escriba el funcionamiento, hay un cambio de datos.
Este cambio tambin, tiene que ser reflejado

en los discos que

guardan la informacin redundante. Esto empeora la actuacin de

escribe en redundante el disco forma comparado a la actuacin de


significativamente escribe en el non las series del disco redundantes.
Tambin, guardando la informacin redundante consistente en la
presencia de I/O coexistente

el funcionamiento y la posibilidad de

cadas del sistema pueden ser difciles.

La Necesidad para RAID


Puede resumirse la necesidad para RAID en dos puntos dados debajo.
Las dos palabras claves son
Redundante y Serie.
Que Una serie de discos mltiples accedi en paralelo dar el
throughput mayor que un solo
el disco.
El datos Redundante en los discos mltiples proporciona la
tolerancia de la falta.
Con tal de que el hardware de RAID y software realizan los verdaderos
accesos paralelos en los paseos mltiples, habr una mejora de la
actuacin encima de un solo disco.
Con un solo disco duro, usted no puede protegerse contra los costos
de un fracaso del disco, el tiempo, exigido obtener e instalar un disco
del reemplazo, reinstale el sistema operativo, restaure los archivos de
las cintas auxiliares, y repite toda la entrada de los datos realizada
desde que el ltimo apoyo era hecho.
Con los discos mltiples y un esquema de redundancia conveniente,
su sistema puede quedarse en marcha cuando un el disco falla, e
incluso mientras el disco del reemplazo est instalndose y sus datos
restauraron.
Para crear un ptimo costo-efectivo RAID configuracin, nosotros
necesitamos lograr simultneamente las metas siguientes:
Maximize el nmero de discos que se acceden en paralelo.
Minimize la cantidad de espacio del disco que se usa para los datos
redundantes.
Minimize el arriba exigi lograr las metas anteriores.

Datos de Listar y
La redundancia
Hay 2 conceptos importantes para ser entendido en el plan y
aplicacin de series del disco:
1. los datos rayando, para la actuacin mejorada.
2. la redundancia para la disponibilidad mejorada.

Datos de Listar
Datos que raya transparentemente distribuye los datos encima de los
discos mltiples hacerles aparecer como un solo ayuno,

el disco

grande. Rayando mejora la actuacin de I/O agregado permitindole a


I/Os mltiple ser reparado en

paralelo. Hay 2 aspectos a este

paralelismo.
El Mltiplo de , las demandas independientes pueden repararse en
paralelo por los discos separados. Esto disminuye

el tiempo del

queueing visto por las demandas de I/O.


que las Solas, mltiples demandas del bloque pueden ser reparadas
por discos mltiples que actan en la co-ordenacin.
Esto aumenta la proporcin del traslado eficaz vista por una sola
demanda. La actuacin beneficia aumente con el nmero de discos
en la serie. Desgraciadamente, un nmero grande de discos baja la
fiabilidad global de la serie del disco.
La mayora de las organizaciones de serie de disco redundantes
puede distinguirse basado en 2 rasgos:
1. el granularity de datos que entrelazan y
2. la manera en que los datos redundante se computa y guard por la
serie del disco.
Los datos entrelazando o pueden estar bien formado grano o tosco
form grano.
La multa form grano el disco forma conceptualmente entrelace los
datos en las unidades relativamente pequeas para que todo el I/O
las demandas, sin tener en cuenta su tamao, acceden todos los
discos en la serie del disco. Esto resulta en muy alto

los datos

transfieren la proporcin para todo el I/O pide pero tiene las


desventajas que slo un I/O lgicos piden la lata est en el servicio
en cualquier momento dado y todos los discos deban gastar el
posicionamiento de tiempo para cada demanda.
Las series del disco formadas grano toscas entrelazan los datos en las
unidades relativamente grandes para que I/O pequeo pida la
necesidad

acceda slo un nmero pequeo de discos mientras las

demandas grandes pueden acceder todos los discos en la serie del


disco.
Esto

permite

simultneamente
grandes

mltiple
mientras

pequeo
todava

que

pide

permitiendo

ser
las

reparado
demandas

para ver las proporciones del traslado ms altas se

permitidas el lujo de usando los discos mltiples.

La redundancia
Subsecuentemente el nmero ms grande de discos baja la fiabilidad
global de la serie de discos, es importante a

la redundancia

incorporada en la serie de discos para tolerar los fracasos del disco y


permitir para el continuo el funcionamiento del sistema sin cualquier
prdida de datos.
La incorporacin de redundancia en las series del disco plantea dos
problemas:
1. seleccionando el mtodo por computar la informacin redundante.
La mayora de las series de los discos redundantes

hoy use la

paridad, aunque algn uso Hamming o Caa-Solomon los cdigos.


2. seleccionando un mtodo para la distribucin de la informacin
redundante por la serie del disco. El mtodo de la distribucin puede
ser clasificado en 2 esquemas diferentes:

Los Esquemas de que la informacin redundante concentrada

sobre un nmero pequeo de discos.


Esquemas de que distribuyen la informacin redundante
uniformemente por todos los discos.

Los tales esquemas son generalmente ms deseables porque ellos


evitan manchas calientes y otro equilibrio de carga

problemas

sufridos por esquemas que no distribuyen la informacin redundante


uniformemente.
Finalmente, es importante mencionar que seleccionara entre los
muchos posibles datos que rayan y

los esquemas de redundancia

involucran el tradeoffs complejo entre la disponibilidad, actuacin y


costo que se ha discutido en las prximas secciones.

RAID bsico
Las organizaciones
Hay que muchos tipos de RAID y algunos del importante se
introducen debajo:
Non-redundante (RAID Level 0)
Una serie del disco non-redundante, o RAID nivelan 0, tiene el costo
ms bajo de cualquier organizacin de RAID porque

no emplea la

redundancia en absoluto. Este esquema ofrece la actuacin mejor


desde que nunca necesita

para poner al da la informacin

redundante. Sorprendentemente, no tiene la actuacin mejor. La


redundancia

esquemas en que los datos dobles, como reflejar,

pueden realizar bien leen selectivamente por las demandas fijando


en el disco con el ms corto esperaron busca y los retrasos rotatorios.
Sin,

la redundancia, cualquier solo fracaso del disco producir la

datos-prdida. Las series del disco Non-redundantes son ampliamente


usado excelente-computando los ambientes dnde la actuacin y
capacidad, en lugar de la fiabilidad, es el primero involucra.
Los bloques secuenciales de datos son escrito por los discos mltiples
en las rayas, como sigue:

El tamao de un bloque del dato que est conocido como la "anchura


de la raya" vara con la aplicacin, pero siempre es por lo menos tan

grande como el tamao del sector de un disco. Cuando llega


momento para leer atrs este secuencial
los datos, todos los discos pueden leerse en paralelo. En un sistema
operativo multi-atareando, hay una probabilidad alta que incluso los
accesos del disco non-secuenciales guardarn todos los discos que
trabajan en paralelo.
Reflejado (la CORRERA Nivelado 1)
La solucin tradicional, llam reflejando o sombreando, usa los tantos
discos dos veces como un redundante la serie del disco. Siempre que
los datos se escriba a un disco que el mismo dato tambin se escribe
a un redundante

el disco, para que hay siempre dos copias de la

informacin. Cuando el datos se lee, puede recuperarse del disco con


la formacin de colas de espera ms corta, busque y los retrasos
rotatorios. Si un disco falla, la otra copia es

repare las demandas.

Reflejando frecuentemente se usa en las aplicaciones del banco de


datos dnde la disponibilidad

y tiempo de la transaccin es ms

importante que la eficacia del almacenamiento.

Memoria-Style(RAID Nivelado 2)
Los sistemas de memoria han proporcionado a la recuperacin de los
componentes fallados mucho menos costo que reflejando usando los
cdigos de Hamming. Los cdigos de Hamming contienen la paridad
para los subconjuntos solapando distintos de componentes. En una
versin de este esquema, cuatro discos requieren tres discos
redundantes, uno menos, que reflejando. Desde el nmero de discos
redundantes es proporcional al leo del nmero total de los discos en
el sistema, la eficacia del almacenamiento aumenta como el nmero
de aumentos de discos de datos.

Si un solo componente falla, algunos de los componentes de paridad


tendrn los valores incoherentes, y el

el componente fallado es el

contenido comn por cada subconjunto incorrecto. La informacin


perdida es recuperado leyendo los otros componentes en un
subconjunto, incluso el componente de paridad, y poniendo

el

pedazo perdido a 0 o 1 para crear el valor de paridad apropiado por


ese subconjunto. As, los discos redundantes mltiples

se necesita

identificar el disco fallado, pero nico se necesita recuperar la


informacin perdida.
En usted es desprevenido de paridad, usted puede pensar en el disco
redundante como tener la suma de todos los datos en los otros
discos. Cuando un disco falla, usted puede substraer todos los datos
en los discos buenos forme el disco de paridad; la informacin
restante debe ser la informacin perdida. La paridad simplemente es
esta suma modulo 2.
Un RAID 2 sistema normalmente tendra los tantos discos de los datos
como el palabra tamao de la computadora,

tpicamente 32.

Adems, RAID 2 exige al uso de discos extras guardar un cdigo errorcorregiendo para la redundancia. Con 32 discos de los datos, un RAID
2 sistema requerira 7 discos adicionales para un Hammingcode ECC.
Semejante serie de 39 discos era el asunto de una patente americana
concedido a la Corporacin de Unisys en 1988, pero ningn producto
comercial fue soltado en la vida.
Por varios razones, incluso el hecho que las unidades de disco
modernas contienen su propio ECC interior, RAID 2 no es un esquema
de serie de disco prctico.

La Paridad pedazo-entrelazada (RAIDLevel 3)

Uno puede mejorar en memoria-estilo que el disco de ECC forma


notando que, el componente de memoria diferente los fracasos,
directores del disco pueden identificar fcilmente qu disco ha
fallado. As, uno puede usar una sola paridad en lugar de un juego de
discos de paridad recupere la informacin perdida.
En un pedazo-entrelaz, serie de disco de paridad, el datos se
entrelaza pedazo-sabio conceptualmente encima de los discos de los
datos, y un solo disco de paridad se agrega para tolerar algn solo
fracaso del disco. Cada uno ley que la demanda accede todos los
discos de los datos y cada uno escriben todos los discos de los datos
y el disco de paridad a los accesos de la demanda. As, slo una
demanda

puede repararse en un momento. Porque el disco de

paridad contiene slo paridad y ningn datos, el disco de paridad, no


pueda participar adelante lee, mientras resultando en ligeramente
baje ledo la actuacin que para la redundancia

esquemas que

distribuyen la paridad y datos encima de todos los discos. Pedazoentrelazado, las series de disco de paridad son

frecuentemente

usado en aplicaciones que requieren el bandwidth alto pero no las


proporciones de I/O altas. Ellos tambin son

ms simple al

instrumento que RAID nivela 4, 5, y 6.


Aqu, el disco de paridad es escrito de la misma manera como la
paridad mordi en la Memoria de Acceso de Azar normal (El RAM),
dnde es el Exclusivo O de los 8, 16 o 32 pedazos de los datos. En el
RAM, la paridad se usa para descubrir los errores de datos de solopedazo, pero no puede corregirlos porque no hay informacin
disponible a determine qu momento es incorrecto. Con las unidades
de disco, sin embargo, nosotros confiamos en el director del disco
para informar
un datos ley el error. Sabiendo los datos de qu disco est
extraando, nosotros podemos reconstruirlo como el Exclusivo O
(XOR) de discos de los datos todo restantes ms el disco de paridad.

Como un ejemplo simple, suponga nosotros tenemos 4 discos de los


datos y un disco de paridad. Los pedazos de la muestra son:

El pedazo de paridad es el XOR de estos cuatro pedazos de los datos


que pueden calcularse sumndolos y

escribiendo un 0 si la suma

incluso es y un 1 si es impar. Aqu la suma de Disco 0 a travs de


Disco 3 est "3", para que

la paridad es 1. Ahora si nosotros

intentamos leer este datos atrs, y encuentra que Disco 2 da un error


ledo, nosotros pueda reconstruir Disco 2 como el XOR de todos los
otros discos, incluso la paridad. En el ejemplo, el la suma de Disco 0,
1, 3 y la Paridad es "3", para que los datos en Disco 2 deben ser 1.
La Paridad bloque-entrelazada (RAID Level 4)
Los bloque-entrelazamos, la serie de disco de paridad es similar a los
pedazo-entrelazamos, serie de disco de paridad slo que el datos se
entrelaza por los discos de tamao arbitrario en lugar de en
momentos. El tamao de estos bloques se llama la unidad rayando.
Lea las demandas ms pequeo que el acceso de la unidad rayando
slo un solo disco del dato. Escriba las demandas deben poner al da
el datos pedido bloquea y tambin debe computar y pone al da el
bloque de paridad.
Para grande escribe ese bloques del toque en todos los discos, la
paridad se computa fcilmente por exclusivo-or'ing el nuevo

los

datos para cada disco. Para pequeo escriba demandas que ponen al
da slo un disco de los datos, la paridad se computa por notando
cmo el nuevo datos difiere de los datos viejos y aplicando esas
diferencias al bloque de paridad.

Pequeo escriba as las demandas requieren I/Os a cuatro disco: uno


escribir los nuevos datos, dos leer los datos viejos y vieja paridad por
computar la nueva paridad, y uno escribir la nueva paridad. Esto es
llamado un

leer-modificar-escriba el procedimiento. Porque un

bloque-entrelaz, la serie de disco de paridad tiene slo una paridad


disco que debe ponerse al da en todos escribe los funcionamientos,
el disco de paridad puede volverse un cuello de botella fcilmente.
Debido a esta limitacin, la serie de disco de paridad distribuda
bloque-entrelazada se prefiere universalmente encima de los bloqueentrelazamos, serie de disco de paridad.

La Distribudo-paridad bloque-entrelazada (RAID Nivele 5)


La serie de disco de distribudo-paridad bloque-entrelazada elimina el
paridad disco cuello de botella presente en

la serie de disco de

paridad bloque-entrelazada distribuyendo la paridad uniformemente


encima de todos los discos. Un la ventaja adicional, frecuentemente
pasada por alto a distribuir la paridad es que tambin distribuye los
datos encima de todos los discos en lugar de encima de todos menos
uno. Esto permite todos los discos para participar reparando lea los
funcionamientos en contraste con los esquemas de redundancia con
los discos de paridad especializados en que el disco de paridad no
pueda participar reparando lea las demandas. La serie de disco de
distribudo-paridad bloque-entrelazada tiene

el mejor pequeo lea,

grande escriba actuacin de cualquier serie de disco de redundancia.


Pequeo escriba las demandas son

algo ineficaz compar con los

esquemas de redundancia como reflejar sin embargo, debido al


necesite realizar leer-modificar-escriba los funcionamientos para

poner al da la paridad. sta es la actuacin mayor la debilidad de


RAID las 5 series del disco niveladas.
El mtodo exacto distribua la paridad en el disco de distribudoparidad bloque-entrelazado forma la lata

afecte la actuacin. La

figura siguiente ilustra la distribucin de paridad izquierdo-simtrica.

Cada cuadrado corresponde a una unidad de la raya. Cada columna


de

los cuadrados corresponden a un disco. P0 computa la paridad

encima de la raya unidades 0, 1, 2 y 3,; P1 computa

la paridad

encima de la raya unidades 4, 5, 6, y 7 etc. (la fuente: Referencia 1)


Una propiedad til de la distribucin de paridad izquierdo-simtrica es
que

siempre

que

usted

cruce

el

rayando

las

unidades

secuencialmente, usted acceder cada disco una vez antes de


acceder cualquier dispositivo del disco. Esta propiedad reduce que el
disco choca al reparar las demandas grandes.

La redundancia de P+Q (RAID Level 6)


La paridad es un cdigo de redundancia capaz de corregir cualquier
solo, mismo-identificando el fracaso. Como el disco grande

se

consideran las series, los fracasos mltiples son se necesitan los

posibles y ms fuertes cdigos. Es ms, cuando un disco falla en la


serie

del

disco

paridad-protegido,

mientras

recuperando

los

volmenes del disco fallado requiere leyendo los volmenes de todos


non-faltados los discos con xito. La probabilidad de encontrar un
uncorrectable ledos el error durante la recuperacin pueden ser
significantes. As, aplicaciones con ms severo

los requisitos de

fiabilidad requieren error ms fuerte que corrige los cdigos.


Una vez el tal esquema, la redundancia de P+Q llamada, usa CaaSolomon los cdigos para proteger contra a a dos fracasos del disco
que usan el mnimo desnudo de dos series del disco redundantes. El
P+Q las series del disco redundantes

es estructuralmente muy

similar al disco de distribudo-paridad bloque-entrelazado forma y


opera en mucho la misma manera. En particular, P+Q que las series
del

disco

redundantes

tambin

realizan

pequeo

escriben

funcionamientos que usan un leer-modificar-escriba el procedimiento,


slo que en lugar de cuatro el disco accede por escriba

las

demandas, P+Q que las series del disco redundantes requieren seis
disco accede debido a la necesidad de poner al da ambos los `P ' y
`Q ' la informacin.
Los Espejos rayados (RAID Level 10)
RAID 10 no se mencion en el 1988 artculo original que defini RAID
1 a travs de RAID 5. El trmino se usa para significar la combinacin
de RAID 0 ahora (rayando) y RAID 1 (reflejando).

Los Discos son

reflejado en los pares para la redundancia y mejor la actuacin,


entonces el datos est rayado por el mltiplo

los discos para la

actuacin mxima. En el diagrama debajo de, Discos 0 & 2 y Discos 1


& se reflejan los 3 pares.
Obviamente, RAID 10 usos ms espacio del disco para proporcionar
los datos redundantes que RAID 5. Sin embargo, l tambin
proporciona una ventaja de la actuacin leyendo de todos los discos
en paralelo mientras eliminando el escriba

la multa de RAID 5.

adems, RAID 10 da bien la actuacin que RAID 5 mientras un paseo


fallado el unreplaced de los restos. Bajo RAID 5, cada uno intentado

ledo del paseo fallado puede realizarse slo leyendo todos los otros
discos. En RAID 10, un disco fallado puede recuperarse por un solo lea
de su el par reflejado.

La herramienta para calcular eficacia del almacenamiento dada el


nmero de discos y los RAID nivele (la fuente: Referencia 3)
Los RAID Sistemas Necesidad Cinta Apoyos Merece la pena. Incluso
cuando usted usa una redundancia

forme planes gusta reflejar o

RAID 5 o RAID 10, usted todava debe hacer los apoyos de la cinta
regulares de su el sistema. Hay varias razones por insistir en esto,
entre ellos:
RAID no lo protege de los fracasos del disco mltiples. Mientras un
disco est apagado la lnea para cualquiera razone, su serie del disco
no es totalmente redundante.
los apoyos de la cinta Regulares le permiten recuperar de prdida
de los datos que no se relaciona a un fracaso del disco.
Esto incluye errores humanos, errores del hardware, y errores del
software.

El costo & Actuacin de problemas


Hay

tres

consideraciones

importantes

mientras

haciendo

una

seleccin acerca de que el nivel de RAID es ser usado para un viz del
sistema. el costo, actuacin y fiabilidad.

Hay muchas maneras diferentes de medir estos parmetros para el


eg. la actuacin podra medirse como I/Os por segundo por el dlar,
bytes por segundo o tiempo de la contestacin. Nosotros tambin
podramos comparar los sistemas a

el mismo costo, la misma

capacidad del usuario total, la misma actuacin o la misma fiabilidad.


El mtodo usado grandemente depende de la aplicacin y la razn
para comparar. Por ejemplo, en

transaccin que procesa las

aplicaciones la base primaria para la comparacin sera I/Os por


segundo por el dlar mientras en las aplicaciones cientficas nosotros
seramos interesados ms en los bytes por segundo por el dlar. En
algunos sistemas heterogneos como los servidores del archivo
ambos I/O por segundo y bytes por segundo puede ser importante. A
veces es importante considerar la fiabilidad como la base para la
comparacin.
Echando una mirada ms ntima al RAID nivela que nosotros
observamos que la mayora de los niveles es similar a nosotros.
RAID nivelan 1 y RAID nivelan pueden verse 3 series del disco como
un subclass de RAID el 5 disco nivelado

las series. Tambin RAID

nivelan 2 y RAID nivelan generalmente se encuentran 4 series del


disco para ser inferiores a RAID nivele 5 series del disco. Del problema
de seleccionar entre RAID nivela 1 a travs de 5 es un subconjunto de
el problema ms general de escoger una paridad apropiada el tamao
de grupo y la unidad rayando para RAID nivele 5 series del disco.
Algunas Comparaciones
Dado debajo es una mesa que compara el throughput de varias
redundancia forma planes para cuatro tipos de demandas de I/O. Las
demandas de I/O son lee bsicamente y escribe qu es dividido en
pequeo (lee

& escribe) y el grande. Recordando el hecho que

nuestro datos se ha extendido encima de los discos mltiples (datos


que rayan), un pequeo se refiere a una demanda de I/O de una
unidad rayando mientras una demanda de I/O grande se refiere a las
demandas de una raya llena (una unidad de la raya de cada disco en
un error que corrige el grupo).

G: El nmero de discos en un grupo de correccin de error.


La tabla sobre clasifica el rendimiendo mximo por dlar el nivel 0
relativo para RAID nivela 0, 1, 3, 5 y 6.
Para los propsitos prcticos nosotros consideramos RAID nivela 2 & 4
inferior a RAID nivele 5 disco las series, para que nosotros no
mostramos las comparaciones.
El costo de un sistema es directamente proporcional al el nmero de
discos que usa en la serie del disco. As la mesa nos muestra eso
dado RAID al costo equivalente nivele 0 y RAID nivelan 1 sistemas,
los RAID nivelan 1 sistema puede sostener la mitad el nmero de
pequeo escribe por segundo que un nivel de RAID que 0 sistema
puede sostener. Equivalentemente el costo de pequeo escribe es
dos veces como caro en un nivel de RAID 1 sistema como en un nivel
de RAID 0 sistema.
La mesa tambin muestra eficacia del almacenamiento de cada nivel
de RAID.
La eficacia del almacenamiento es aproximadamente el lo inverso el
costo de cada unidad de pariente de capacidad de usuario a un nivel
de RAID 0 sistema. El almacenamiento la eficacia es igual al
performance/cost mtrico para grande escribe.

Las figuras sobre el grfico el mtrica del performance/cost de la


mesa sobre para RAID 1, 3, 5, nivela

y 6 encima de un rango de

paridad los tamaos de grupo.


El performance/cost de RAID los 1 sistemas nivelados son equivalente
al performance/cost de RAID los 5 sistemas nivelados cuando la
paridad el tamao de grupo es igual a 2.
El performance/cost de RAID los 3 sistemas nivelados siempre son
menos de o igualan al

performance/cost de RAID los 5 sistemas

nivelados. Esto se espera dado que un nivel de RAID 3 sistema es un


el subclass de RAID 5 sistemas nivelados derivados restringiendo el
tamao de la unidad rayando tal que todas las demandas acceda una
raya de paridad de datos exactamente.

Desde la configuracin de RAID los 5 sistemas nivelados no estn


sujetos a semejante restriccin, el performance/cost de RAID los 5
sistemas nivelados nunca pueden estar menos de eso de un

RAID

equivalentes nivelan 3 sistema. Claro las tales generalizaciones son


especficas a los modelos de disco

las series usaron en los

experimentos anteriores. En la realidad, una aplicacin especfica de


un nivel de RAID 3 sistema pueda tener el performance/cost bueno
que una aplicacin especfica de un nivel de RAID 5 sistema.
La pregunta de que RAID nivelan para usar se expresa bien como la
configuracin ms general las preguntas acerca del tamao del grupo
de paridad y unidad rayando. Para un tamao de grupo de paridad de
2, reflejar es deseable, mientras para una unidad rayando muy
pequea RAID nivelan se satisfaran 3.
La figura debajo de las parcelas el mtrica del performance/cost de la
mesa sobre para RAID nivela 3, 5 & 6.

Fiabilidad
La fiabilidad de cualquier sistema de I/O se ha puesto tan importante
como su actuacin y costo. Esta parte del la gua didctica:
Reviews la fiabilidad bsica proporcionada por una serie de disco de
paridad bloque-entrelazada
Lists y discute tres factores que pueden determinar la fiabilidad
potencial de series del disco.
La redundancia en las series del disco es motivada por la necesidad
de luchar los fracasos del disco. Dos llave factoriza el MTTF(MeanTime-a-fracaso) y MTTR(Mean-Time-a-reparacin) es de preocupacin
primaria en estimando la fiabilidad de cualquier disco. Seguir son
algunos formulae durante el tiempo malo entre los fallos:
RAID nivelan 5

La serie del disco con dos disco redundante por el grupo de


paridad (el eg: la redundancia de P+Q)

N - nmero total de discos en el sistema


G - nmero de discos en el grupo de paridad
Los factores la Fiabilidad conmovedora
Tres factores que pueden afectar la fiabilidad de series del disco
dramticamente son:
Sistema cadas
no corrige los bit-errores
Correlacion a fallas de disco
Cadas del sistema
Las cada del sistema se refiere a cualquier evento como un fracaso
de poder, error del operador, la avera del hardware, o cada del
software que puede interrumpir un funcionamiento de I/O a una serie
del disco.
Cosas as choca puede interrumpir escribe los funcionamientos,
mientras produciendo estados dnde el datos se pone al da y la
paridad no se pone al da o viceversa.
En cualquier embale, la paridad es incoherente y no puede usarse en
el evento de un fracaso del disco. Pueden aplicarse tcnicas como el
hardware redundante y suministros de poder hacer cosas as choca
menos frecuente.
Las cadas del sistema pueden causar las inconsistencias de paridad
en los dos pedazo-entrelazados y pueden bloque-entrelazar el disco
forma, pero el problema slo es de preocupacin prctica en las
series del disco bloque-entrelazadas.
Para, la fiabilidad propone, el sistema choca en las series del disco
bloque-entrelazadas es similar a los fracasos del disco en eso ellos
pueden producir la prdida de la paridad correcta para rayas durante
que se modificaron el la cada.
No corrige los bit-errores

La mayora no corrige los bit-errores se genera porque el datos es


incorrectamente escrito o gradualmente daado como las edades de
los medios de comunicacin magnticas. Estos errores slo se
descubren cuando nosotros intentamos leer los datos.
Nuestra interpretacin de un correctable pedazo error proporciones es
que ellos representan la proporcin a que los errores se descubre
durante lee del disco durante el funcionamiento normal de la unidad
de disco.
Un acercamiento con que puede usarse o a menos que la redundancia
es intentar proteger contra los errores de bit prediciendo cuando un
disco est a punto de fallar.
VAXsimPLUS, un producto del DIC, los amonestadores las
advertencias emitidas por los discos y notifica a un operador cuando
se siente que el disco est a punto de fallar.

Correlacin a fallas de disco


Causas: Los factores medioambientales e industriales comnes.
Por ejemplo, un accidente podra aumentar la proporcin de fracaso
grandemente para todos los discos en una serie del disco para un
el periodo corto de tiempo. En general, olas de poder, fracasos de
poder y encendiendo los discos simplemente y fuera de puede poner
la tensin en los componentes elctricos de todos los discos afectado.
Los discos tambin comparten comn apoye el hardware; cuando
este hardware falla, puede llevar al mltiplo, los fracasos del disco
simultneos.
Los discos generalmente ms probablemente son o fallar muy
temprano o muy tarde en sus vidas.
Fracasar temprano frecuentemente causado por defectos del
transente durante que no se puede haber descubierto el fabricante
quemadura-en el proceso.

Tarde los fracasos ocurren cuando un disco lleva fuera. Los fracasos
del disco puestos en correlacin reducen la fiabilidad grandemente de
el disco forma hacindolo muy ms probablemente que un fracaso del
disco inicial se seguir estrechamente pueden reconstruirse fracasos
del disco adicionales antes del disco fallado.
Media-Tiempo-de Datos-Perdidos (MTTDL).
Seguir son algunos formularios para calcular el Media-Tiempo-de
Datos-Perdidos (MTTDL).
En un bloque entrelazado la serie del disco paridad-protegido, la
prdida de los datos es posible a travs de lo siguiente tres comn
las maneras:
los fracasos del disco dobles
sistema cada seguida por un fracaso del disco
falla de disco seguido por un error de bit no corregible durante la
reconstruccin
Los tres modos de fracaso anteriores son las combinaciones de
fracaso ms duras, en eso nosotros, actualmente, no tenemos
cualquier tcnica para proteger contra ellos sin sacrificar la actuacin.

RAID Nivel 5

Las Caractersticas de fracaso para la RAID las 5 Series del Disco


Niveladas
P+Q Arreglo de Disco

Falla caractersticas P+Q Arreglo de Disco


p(disk) = La probabilidad de leer todos los sectores en un disco
(deriv del tamao del disco, el tamao del sector, y BER)
La herramienta para Fiabilidad que Usa las Ecuaciones Anteriores.

Glosario

RAIDArreglo de Redundante de Discos Economicos


MTTF-- Media-Tiempo-de Datos-Perdidos
El intervalo medio de tiempo que un componente operar antes de
fallar. Vea las Funciones de Fracaso debajo.
MTTR-- Media-Tiempo-A-reparacin
La media cantidad de tiempo necesit reparar un componente,
recupera un sistema, o por otra parte restaura
repare despus de un fracaso. Vea las Funciones de Fracaso debajo.
MTBF--los Malo-Time-entre-fracasos
MTBF = MTTR + MTTR
MTTDL-- Media-Tiempo-datos-prdida
Una fiabilidad mtrico. MTTDL es una funcin de MTTF, MTTR, el
nmero total de discos en el sistema,
(N), y paridad el tamao de grupo (G).
Funciones de fallos.
Cuando una base de tiempo es determinada, pueden expresarse los
fracasos de varias maneras: el fracaso cumulativo funcione, la
funcin de intensidad de fracaso, la funcin de proporcin de fracaso,
y el tiempo malo al fracaso la funcin. El func de fracaso cumulativo el tion (tambin llam la funcin de valor mala) denota el promedio
que los fracasos cumulativos asociaron con cada punto de tiempo. La
funcin de intensidad de fracaso representa la proporcin de cambio
de la funcin de fracaso cumulativa. La funcin de proporcin de
fracaso (o llam la proporcin de riesgo, o la proporcin de
ocurrencia de fracasos) se define como la proporcin de fracaso
instantnea a un cronometre t, dado que el sistema no ha fallado a a
t. El tiempo malo al fracaso (MTTF) la funcin representa el tiempo
esperado que el prximo fracaso se observar. (MTTF tambin est
conocido como MTBF, el tiempo malo entre los fracasos.) la Nota que
las tres medidas anteriores estn estrechamente-relacionadas y
podran ser traducido entre si con.

Medida de tiempo a reparar y Disponibilidad. Otra cantidad


relacionada para cronometrar es el tiempo malo para reparar
(MTTR) que representa el tiempo esperado hasta que un sistema se
reparara despus de un fracaso es observado. Cuando el MTTF y
MTTR para un sistema son moderados, su disponibilidad puede
obtenerse.
La disponibilidad--es la probabilidad que un sistema est disponible
cuando necesit. Tpicamente, es moderado por

ECC--Cdigo de Correccin de Error


BERTaza de Bit de Error
p(disk)--La probabilidad de leer todos los sectores en un disco (deriv
del tamao del disco, el tamao del sector, y BER)
G--la paridad el tamao de grupo es decir, nmero de discos en el
grupo de paridad
N--el nmero total de discos en un sistema de la serie redundante
busque tiempo--la Cantidad de tiempo necesit mover la cabeza a la
posicin radial correcta del disco.
La latencia rotatoria--la Cantidad de tiempo necesit para el sector
deseado para rodar bajo la cabeza del disco.

Referencias.
[1] Peter M. Chen, Edward K. Lee, Garth A. Gibson, Randy H. Katz and David A.
Patterson.
RAID: High-Performance, Reliable Secondary Storage. ACM Computing
Surveys.
[2] http://www.consensys.com/html/rzma1_raid_disk_array__overvie.html
[3] http://umunhum.stanford.edu/tools/jsdt.html
[4] D.A. Patterson and J.L. Hennessy, Computer Architecture: A Quantitative
Approach, 2nd
edition, Morgan-Kaufmann, 1996.
[5] E K Lee, R H Katz,"Performance Consequences of Parity Placement in
Disk Arrays"
[6] E K Lee, R H Katz, "An Analytic Performance Model of Disk Arrays and
its Applicaton"
[7] E K Lee, "Software and Performance issues in the Implementation of
a RAID prototype"

[8] P M chen, G A Gibson, R H Katz, D A Patterson, "An Evaluation of


Redundant Array of
Disks using an Amdhal 5890"
[9] P M Chen, D A Patterson,"Maximizing Performance in a striped Disk
Array"

También podría gustarte