Documentos de Académico
Documentos de Profesional
Documentos de Cultura
RAID es una forma de almacenar los mismos datos en distintos lugares (por tanto de modo redundante) en mltiples discos duros. Al colocar los datos en discos mltiples, las operaciones I/O (input/output, de entrada y salida) pueden superponerse de un modo equilibrado, mejorando el rendimiento del sistema. Dado que los discos mltiples incrementan el tiempo medio entre errores (mean time between failure, MTBF), el almacenamiento redundante de datos incrementa la tolerancia a fallos. Un RAID, para el sistema operativo, aparenta ser un slo disco duro lgico. El RAID emplea la tcnica conocida como "striping" (bandeado o creacin de bandas), que incluye la particin del espacio de almacenamiento de cada disco en unidades que van de un sector (512 bytes) hasta varios megabytes. Las bandas de todos los discos estn interpaginadas (interleaved) y se accede a ellas en orden. En un sistema de un solo usuario donde se almacenan grandes registros (como imgenes mdicas o de otro tipo), las bandas generalmente se establecen para ser muy pequeas (quiz de 512 bytes) de modo que un solo registro est ubicado en todos los discos y se pueda acceder a l rpidamente leyendo todos los discos a la vez. En un sistema multiusuario, un mejor rendimiento demanda que se establezca una banda lo suficientemente ancha para contener el registro de tamao tpico o el de mayor tamao. Esto permite acciones I/O superpuestas en los distintos discos.
Reconstruccin y Regeneracin Cuando un disco falla la informacin redundante en los discos y los datos en los discos buenos son usados para regenerar la informacin de disco averiado. Striping Es el acto de unir dos o ms discos fsicos en un solo disco lgico con el fin de dividir los datos entre los diferente discos para ofrecer una significativa mejora en el rendimiento del conjunto de los discos. Los datos son divididos a travs de los discos. La lectura y escritura es compartida La bsqueda de datos clsica fuerza a la lectura y escritura a no recordar su posicin Resultando ms movimientos de cabezas y peor eficiencia
La lectura de datos es etiquetada y reordenada. Los movimientos de las cabezas de lectura escritura se realizan mas eficientemente cuando se buscan datos.
El rendimiento general del sistema aumenta ya que pueden funcionar de forma paralela con los diferentes discos del conjunto. Dependiendo del nivel de RAID que escojamos, si uno de los discos del conjunto falla, la unidad contina funcionando, sin prdida de tiempo ni de datos. La reconstruccin de los datos del disco que ha fallado se hace de forma automtica sin intervencin humana. En el caso de algunos sistemas operativos la regeneracin de datos se hace desde software por ejemplo en el Windows NT, aunque en estos sistemas se pueden usar controladoras RAID que s regeneraran los datos automticamente. La capacidad global del disco aumentar, ya que se suman las capacidades de los diferentes discos que componen el conjunto.
Novell Netware incluye, desde hace algn tiempo, soporte para arreglos de discos. El espejado y la duplicacin de discos son ejemplos de arreglos basados en software. Ms recientemente fabricantes independientes han ofrecido al mercado arreglos de discos basados en software que pueden correr en formato NLM (Netware Loadable Module) sobre un Servidor Netware. Las soluciones de arreglos basadas en hardware son principalmente implementadas mediante el uso de controladoras SCSI (Small Computer System Interface) especializadas, las cuales a menudo estn dotadas de procesadores propios para liberar a la CPU del sistema de la tarea de control y de cachs para mejorar an ms el desempeo. Para Netware cualquiera de las dos soluciones, software o hardware, ser visualizada como un nico y gran disco virtual. As pues un arreglo de discos ofrecer un mejor desempeo debido a que dividir en forma automtica los requerimientos de lectura/escritura entre los discos que lo conforman. Por ejemplo, si una operacin de lectura/escritura involucra a cuatro bloques de 4 Kb cada uno, entonces un arreglo de 4 discos podra, tericamente, entregar cuatro veces la tasa de operacin de un disco nico, esto debido a que el disco nico slo podra atender a un bloque en forma simultnea, mientras que en el arreglo cada disco podra manejar un slo bloque cada uno y como operan al mismo tiempo En la prctica, sin embargo, dichos niveles no se obtienen debido, principalmente, a la carga de trabajo inherente al control del propio arreglo. Adems el uso de varios discos se emplea para construir cierto nivel de redundancia de los datos y es este nivel de redundancia y la forma de implementarlo lo que crea los niveles de RAID.
pueden ser implementados por cualquiera de las categoras, sin perjuicio de suelan ser implementados en forma de arreglos independientes. Striping y mirroring RAID a niveles 0, 1 y 0 & 1 puede ser implementado, tanto en forma de arreglos independientes o paralelos. NetWare lo implementa como arreglos independientes a nivel del propio Sistema Operativo y, por lo tanto, no precisa de hardware o software adicional.
Tipos de RAID
un Ofrece Como ya se mencionaron hay al menos nueve tipos de RAID adems de grupo no redundante (RAID-0) el Esta tcnica tiene bandeado paro no tiene redundancia de datos. mejor rendimiento pero no tolerancia a los fallos.
RAID-0.
RAID 0:
Este tipo de arreglo utiliza una tcnica llamada "striping", la cual distribuye la informacin en bloques entre los diferentes discos. Es el nico nivel de RAID que no duplica la informacin, por lo tanto no se desperdicia capacidad de almacenamiento. Se requieren mnimo dos discos. Ventajas: RAID-0 permite acccesar ms de un disco a la vez, logrando una tasa de transferencia ms elevada y un rpido tiempo de acceso. Por no utilizar espacio en informacin redundante, el costo por Megabyte es menor. Desventaja: No existe proteccin de datos. No existe informacin en cuanto a Paridad. Ambientes donde implementarlo: Es una buena alternativa en sistemas donde sea ms importante el rendimiento que la seguridad de los datos. Es decir ambientes que puedan soportar una prdida de tiempo de operacin para poder reemplazar el disco que falle y reponer toda la informacin.
RAID-1.
Este tipo tambin se conoce como creacin de discos espejo y consiste de al menos dos discos duros que duplican el almacenamiento de datos. No hay bandeado. El rendimiento de la lectura se mejora pues cualquiera de los dos discos puede leerse al mismo tiempo. El rendimiento de escritura es
el mismo que el del almacenamiento en un solo disco. El RAID-1 proporciona el mejor rendimiento y la mejor tolerancia a fallos en un sistema multiusuario.
RAID 1:
Este nivel de RAID usa un tipo de configuracin conocido como "mirroring", ya que la informacin de un disco es completamente duplicada en otro disco. As mismo, tambin se puede duplicar el controlador de disco (duplexing). Se desperdicia el 50% de la capacidad y slo maneja dos discos.
Ventajas: Se protege la informacin en caso de falla tanto del disco como del controlador (en caso de duplex), ya que si un disco suspende su operacin el otro continua disponible. De este modo se evita la prdida de informacin y las interrupciones del sistema debido a fallas de discos. Desventajas: Gran consumo de necesidades hardware, 100% paridad y coste alto pues es necesario el doble de discos.
RAID-2.
Este tipo usa bandeado en todos los discos, con algunos de estos dedicados a almacenar informacin de verificacin y correccin de errores (error checking and correcting, ECC). No tiene ninguna ventaja sobre el RAID-3.
RAID-3.
Este tipo usa bandeado y dedica un disco al almacenamiento de informacin de paridad. La informacin de verificacin de errores (ECC) incrustada se usa para detectar errores. La recuperacin de datos se consigue calculando el O exclusivo (XOR) de la informacin registrada en los otros discos. Dado que una operacin I/O accede a todos los discos al mismo tiempo, el RAID3 no puede traslapar I/O. Por esta razn, el RAID-3 es mejor para sistemas de un solo usuario con aplicaciones que contengan grandes registros.
Ambientes donde implementarlo: RAID-1 est diseado para sistemas donde la disponibilidad de la informacin es esencial y su reemplazo resultara difcil y costoso (ms costoso que reponer el disco en s). Tpico en escrituras aleatorias pequeas con tolerancia a fallas. El problema de este tipo de arreglos es el costo que implica duplicar los discos. RAID 3: Conocido tambin como "striping con paridad dedicada", utiliza un disco de proteccin de informacin separado para almacenar informacin de control codificada. Esta informacin de control codificado o paridad proviene de los datos almacenados en los discos y permite la reconstruccin de la informacin en caso de falla. Se requieren mnimo tres discos y se utiliza la capacidad de un disco para la informacin de control.
Ventajas: RAID-3 proporciona una alta disponibilidad del arreglo, as como una tasa de transferencia elevada, mejorando de ese modo el rendimiento del sistema. Desventajas: Un disco de paridad dedicado puede convertirse en un cuello de botella porque cada cambio en el grupo RAID requiere un cambio en la informacin de paridad. No plantea una solucin al fallo simultneo en dos discos. Est especialmente recomendado para aplicaciones que requieran archivos de datos de un gran tamao (vdeo, imgenes, DataWare House). Ambientes donde implementarlo: Es tpico para transferencia larga de datos en forma serial, tal como aplicaciones de imgenes o video
RAID-4.
Este tipo usa grandes bandas, lo cual significa que podemos leer registros de cualquier disco individual. Esto nos permite aprovechar la I/O traslapada para las operaciones de lectura. Dado que todas las operaciones de escritura tienen que actualizar el disco de paridad, no es posible la superposicin I/O para ellas. El RAID-4 no ofrece ninguna ventaja sobre el RAID5.
RAID-5. Este tipo incluye un grupo rotatorio de paridad, con lo que resuelve
las limitaciones de escritura en RAID-4. As, todas las operaciones de lectura y escritura pueden superponerse. El Raid 5 almacena informacin de paridad pero no datos redundantes (aunque la informacin de paridad puede usarse para reconstruir datos). El RAID-5 exige al menos tres y usualmente cinco discos en el conjunto. Es mejor para los sistemas multiusuario en los cuales el rendimiento no es crtico, o que realizan pocas operaciones de escritura.
Ventajas: Es el esquema de proteccin de informacin ms usado comnmente, ya que proporciona un buen rendimiento general con una mnima prdida de capacidad. Adems el sistema tiene suficiente redundancia para ser tolerante a fallos. Desventajas: Menores prestaciones que en RAID 1. No plantea una solucin al fallo simultneo en dos discos. Ambientes donde implementarlo: Es recomendable para aplicaciones intensas de entrada/salida y de lectura/escritura, tal como procesamiento de transacciones.
Ventajas: Este nivel ofrece un 100% de redundancia de la informacin y un soporte para grandes volmenes de datos, donde el precio no es un factor importante. Desventajas: Coste elevado, gran overhead y 100% de redundancia
Cuando se tienen sistemas crticos que tienen que estar disponibles y funcionando 24 horas al da, 365 das al ao, hay que intentar minimizar los fallos que puedan afectar al funcionamiento normal del sistema. Fallos van a ocurrir, pero existen tcnicas y configuraciones que ayudan a tener sistemas redundantes, en los que ciertas partes pueden fallar sin que esto afecte al funcionamiento del mismo. En un sistema informtico actual, existen muchos componentes necesarios para que este funcione, cuantos ms componentes, mas probabilidad tenemos que algo falle. Estos problemas pueden ocurrir en el propio servidor, fallos de discos, fuentes de alimentacin, tarjetas de red, etc. y en la infraestructura necesaria para que el servidor se pueda utilizar, componentes de red, acceso a internet, sistema elctrico,.... A continuacin vamos a ir comentando algunas de las tcnicas usadas para obtener sistemas redundantes. El grado de redundancia de un sistema, depender de su importancia y del dinero que perdamos cuando el sistema no est disponible por un fallo. No nos merecer la pena invertir en 'redundancia', si la inversin necesaria para tener un sistema redundante cuesta ms de lo que perderamos en dinero, reputacin y horas de trabajo, si el sistema fallara. Las tcnicas y configuraciones de las que hablamos a continuacin no son exclusivas de sistemas Linux. Se pueden aplicar en su gran mayora a otros sistemas operativos y plataformas. Nosotros nos centraremos en Linux por ser el tema principal de "El rincn de Linux".
Discos
Los discos duros son los dispositivos donde se graban los datos. El fallo mas comn en un servidor es el fallo de un disco duro. Si el servidor tiene
solamente un disco y esta falla, fallara el servidor al completo y no podremos acceder a los datos contenidos en el mismo. Existen por ello tcnicas que nos ayudan a minimizar este problema y a que el servidor siga funcionando y no pierda datos incluso cuando falle algn disco duro. Lo ms normal tambin, es que se puedan sustituir los discos que fallan sin necesidad de apagar el servidor (HotSwap) La tcnica mas comn es la llamada RAID (redundant array of independent disks) [Espaol |Ingles]. Con esta tcnica creamos un conjunto de discos redundantes que nos pueden ayudar, tanto a aumentar la velocidad y el rendimiento del sistema de almacenamiento, como a que el sistema siga funcionando aunque algn disco falle. Existen implementaciones por software y hardware y diferentes configuraciones RAID, siendo las ms comunes RAID1, RAID5 y RAID10.
Tarjetas de red
La tarjeta de red es el dispositivo que permite al servidor comunicarse con el resto del mundo. Es por ello muy comn que los servidores tengan como mnimo 2 tarjetas de red, para garantizar que esta comunicacin no se corte en caso de fallo de una de las tarjetas. En Linux existe adems una tcnica llamada 'Bonding", por la cual podemos utilizar 2 o ms tarjetas de red como si fueran un nico dispositivo, sumando las capacidades de las mismas y teniendo redundancia en el caso que alguna de las tarjetas falle.
Fuentes de alimentacin
La fuente de alimentacin es la encargada de proporcionar electricidad al servidor. Tambin es comn que los servidores tengan 2 o ms fuentes de alimentacin conectadas a diferentes sistemas elctricos, para garantizar el suministro en el caso que una de las fuentes o uno de los sistemas elctricos fallen. Lo ms normal es que se puedan sustituir las fuentes de alimentacin que fallan sin necesidad de apagar el servidor (HotSwap). Otros componentes del sistema como routers, switches, gabinetes de discos, etc. suelen utilizar la misma tcnica de redundancia.
Si queremos redundancia en el sistema elctrico, no hace falta decir que no solo los servidores tienen que tener dobles conexiones, routers, switches y en definitiva cualquier componente del sistema que utilice electricidad debera de tener fuentes de alimentacin redundantes (conectadas). Como se suele decir, tu sistema solo ser tan seguro, estable y redundante como el componente ms dbil del mismo. No es la primera vez, por ejemplo, que en un centro de datos, grupos de servidores con redundancia a todos los niveles han quedado incomunicados porque estaban conectados a un switch que ha fallado por no tener un sistema redundante de suministro elctrico.
Tarjeta de red o NIC: Es un dispositivo electrnico que permite a una DTE (Data Terminal Equipment), ordenador o impresora, acceder a una red y compartir recursos
Cables de red: Para interconectar los diferentes componentes, existen muchos y variados tipos, siendo los ms comunes el cable de par trenzado y el de fibra ptica
Lneas de conexin: a la red de rea amplia, WAN (por ejemplo Internet) Cualquiera de estos componentes puede fallar, dejando al sistema
incomunicado. Pero existen tcnicas para evitar que esto ocurra, lo que se suele hacer es configurar la red, para que al menos existan 2 caminos diferentes entre dos componentes A y B. En el grafico siguiente tenemos un esquema, en el que podes ver como configurar una red con redundancia doble desde el servidor hasta Internet. De esta manera se puede estropear un router, un switch y una tarjeta de red a la vez sin que perdamos conectividad. El mismo esquema se podra ampliar para tener redundancia triple o cudruple de los componentes.
Un ejemplo de clster con balaceo de cargas conectado a un gabinete de discos (Disk array) para almacenar la informacin. Tpico uso para servidores de ficheros y web.
Un ejemplo de clster con balaceo de cargas conectado una base de datos para almacenar la informacin. Tpico uso para web.
Un ejemplo de clster con balaceo de cargas para un sistema de correo que proporcione IMAP y SMTP a sus usuarios. En fin, esto es todo lo que tena pensado contar en esta introduccin a sistemas informticos redundantes. Existe mucha informacin en Internet si quieres profundizar en el tema. Lo ms importante es tener conocimientos, de red y administracin y saber cmo funcionan los diferentes componentes de un sistema. La experiencia y estudios de estas materias os ayudaran a tener sistemas ms estables y redundantes.