Está en la página 1de 117

LA FALTA DE IMPLEMENTACION DE UN SISTEMA DE TOLERANCIA DE FALLAS FACTORES: No existe un presupuesto para implementar dicho sistema en la sala de computo.

. No existe un plan diseado respecto al sistema de Tolerancia de Fallas. El personal no est actualizado con respecto a los avances para tolerar las fallas ya sean por hardware o software. El encargado de la sala de cmputo nunca pens en las posibles fallas que pueden ocurrir o solo se concentro en las fallas que son predecibles y no en falla impredecibles. SOLUCIN: La Implementacin de un sistema de Tolerancia de Fallas para aumentar la fiabilidad del Sistema que posee la Sala de Computo. OBJETIVOS: OBJETIVOS GENERALES: Es prevenir, eliminar y/o tolerar las amenazas que se presentar en el hardware o software OBJETIVOS ESPECIFICOS: Estudiar las diferentes fallas que pueden ser impredecibles ya sea por hardware o software. Identificar y clasificar las amenazas (fallas, errores, averas, etc.). Detallar los diferentes medios a nuestra disposicin para prevenir, eliminar y/o tolerar las amenazas. VARIABLES: VARIABLE DEPENDIENTE:

VARIABLE INDEPENDIENTE:

MARCO TEORICO

TEMA 1: TCNICA DE TOLERANCIA DE FALLAS

1.

TOLERANCIAS DE FALLAS

I.

Introduccin

La tolerancia a fallos es un aspecto crtico para aplicaciones a gran escala, ya que aquellas simulaciones que pueden tardar del orden de varios das o semanas para ofrecer resultados deben tener la posibilidad de manejar cierto tipo de fallos del sistema o de alguna tarea de la aplicacin. Sin la capacidad de detectar fallos y recuperarse de estos, dichas simulaciones pueden no llegar a completarse. Es ms, algunos tipos de aplicaciones requieren ser ejecutadas en un entorno tolerante a fallos debido al nivel de seguridad requeridos. De cualquier forma, en ciertos casos debera haber algn modo de detectar y responder automticamente a ciertos fallos del sistema o al menos ofrecer cierta informacin al usuario en el caso de producirse un fallo. Actualmente, el mbito de aplicacin de las tcnicas de tolerancia a fallos se ha extendido a todos aquellos contextos en los que el funcionamiento incorrecto de un computador, o de una de sus partes, puede comportar importantes prdidas humanas y/o econmicas. As pues, una buena solucin informtica debe, entre otras muchas cosas, ser fcil de utilizar y mantener, y en caso de problemas, debe ofrecer un comportamiento seguro y robusto, asegurando la continuidad del servicio ofrecido (es decir, tolerando la ocurrencia del problema) u ofreciendo un procedimiento de parada (o avera) del sistema controlado y, en la medida de lo posible, inocuo tanto para los usuarios, como para sus datos y operaciones. Como todos sabemos no es lo mismo una pequea red de PC,s que podamos tener en casa, que una red corporativa de una gran empresa en la que los PC,s se cuentan por cientos y los servidores por decenas. Cuando en casa tenemos un problema con el PC y la solucin mas sencilla es restaurar el sistema operativo junto con los programas que manejamos mas habitualmente ademas de nuestros documentos personales, el nico problema que se nos plantea es calcular el tiempo que vamos a necesitar para la reinstalacin del equipo y ver si tenemos a mano los drivers de todos los elementos hardware que tenemos instalados. En cambio, si el fallo se produjese en un servidor de un hospital, por ejemplo, podra dejar sin funcionamiento todo un sistema de asignacin de ambulancias, citaciones, horarios de quirfanos, etc Para evitar semejante caos es necesario que un equipo informtico o mejor todava, toda una red sea capaz de poder superar una situacin de fallo que provoque prdida de informacin y por consiguiente caos y perdida de rendimiento y dinero para la empresa u organizacin. Al conjunto de medidas empleadas para evitar la perdida de informacin en equipos informticos debido a errores tcnicos se le denomina Tolerancia a Fallos o lo que es lo mismo, capacidad de superar un fallo tcnico sin que se produzcan prdidas de informacin y seguir funcionando como si nada hubiese pasado. Dichas medidas se engloban en medidas software y medidas hardware. Aumentar la fiabilidad de un sistema: Prevencin de fallos :se trata de evitar, antes de que el sistema entre en funcionamiento, que se introduzcan fallos

Tolerancia de fallos :se trata de conseguir que el sistema contine funcionando aunque se produzcan fallos

En ambos casos el objetivo es desarrollar sistemas con modos de fallo bien definidos. No son incompatibles El objetivo de tolerancia de fallas Se caracteriza por dividirse en tres fases. 1. 2. Se estudian las diferentes fallas que pueden ser impredecibles o predecibles ya sea en hardware o software. A continuacin, se identifican y clasifican las amenazas (fallos, errores, fluctuaciones de corriente elctrica, averas, etc) que son susceptibles de perturbar el correcto funcionamiento de de una red, centro de computo, etc. En la tercera fase se detallan los distintos medios a nuestra disposicin para prevenir, eliminar y/o tolerar las amenazas.

3.

II.

Sistema de Almacenamiento tolerante a Fallas

Las unidades de disco son dispositivos que pueden fallar con cierta facilidad como el desgaste de la cabeza de lectura por apagarlo repentinamente o por que el disco esta fragmentado, cuando sector MBR esta defectuoso. Por lo cual hay dos formas muy conocidas para tolerancia de fallas para los discos: instalando discos de copias de seguridad (backup) y la otra forma es instalando unidades RAID.

Copias de Seguridad (backup) Esta opcin la tienen muchos ordenadores, en la cual existen dos discos: principal del cual se har una copia a la que llamaremos disco imagen o espejo estos discos estarn conectados por una controlador de disco o adaptador SCSI. *SCSI: (Small Computer System Interface): Es una tarjeta para expansin de capacidades que permite la conexin de varios tipos de dispositivos internos SCSI ("Small Computer System Interface"), esto es principalmente discos duros y puertos. La tarjeta controladora se inserta dentro de las ranuras de expansin "Slots" integradas en la tarjeta principal ("Motherboard") y se atornilla al gabinete para evitar movimientos y por ende fallas. Este tipo de tarjetas integran uno varios puertos para conectar los dispositivos externos tales como unidades lectoras de CDROM, escneres y algunos tipos de impresoras entre otros. Actualmente se utilizan para la adaptacin del estndar SCSI en las tarjetas principales (Motherborad) que carezcan Tarjeta controladora SCSI, con conector SCSI 68 terminales externo y
60 terminales interno.

de este tipo de conectividad. Lo cual permite que cuando falle el disco principal puedes seguir trabajando con el disco imagen pero una desventaja seria si falla el controlador el disco imagen seria obsoleto por eso se puede crear la duplicacin de disco lo cual es igual que el disco imagen pero la diferencia es que tanto el disco principal tienen su controlador cada uno. Unidades RAID (Redundant Array of

Inexpensive Disks): Conjunto de Discos Baratos describen bsicamente esta fabulosa solucin hardware contra fallos. RAID se compone bsicamente de una controladora a la que se conectan una serie de discos duros en los que la informacin se graba de tal manera que si falla uno de los discos, el resto sigue funcionando de forma eficaz ya que conocen exactamente la informacin perdida. Esta capacidad de la tecnologa RAID para salir de situaciones comprometidas se basa en 6 tipos de funcionamiento diferentes, pero antes de describirlos veamos un pequeo ejemplo para entender mejor porqu dicha tecnologa resulta tan beneficiosa.

Significa matriz redundante de discos independientes. RAID es un mtodo de combinacin de varios discos duros para formar una nica unidad lgica en la que se almacenan los datos de forma redundante. Ofrece mayor tolerancia a fallos y ms altos niveles de rendimiento que un slo disco duro o un grupo de discos duros independientes. En este mtodo, la informacin se reparte entre varios discos, usando tcnicas como el entrelazado de bloques (RAID nivel 0) o la duplicacin de discos (RAID nivel 1) para proporcionar redundancia, reducir el tiempo de acceso, y/o obtener mayor ancho de banda para leer y/o escribir, as como la posibilidad de recuperar un sistema tras la avera de uno de los discos. Un RAID, para el sistema operativo, aparenta ser un slo disco duro lgico (LUN). La tecnologa RAID protege los datos contra el fallo de una unidad de disco duro. Si se produce un fallo, RAID mantiene el servidor activo y en funcionamiento hasta que se sustituya la unidad defectuosa. RAID ofrece varias opciones, llamadas niveles RAID, cada una de las cuales proporciona un equilibrio distinto entre tolerancia a fallos, rendimiento y coste. Todos los sistemas RAID suponen la prdida de parte de la capacidad de almacenamiento de los discos, para conseguir la redundancia o almacenar los datos de paridad. Los sistemas RAID profesionales deben incluir los elementos crticos por duplicado: fuentes

de alimentacin y ventiladores redundantes y Hot Swap. De poco sirve disponer de un sistema tolerante al fallo de un disco si despus falla por ejemplo una fuente de alimentacin que provoca la cada del sistema.

Funcionamiento del RAID Bsicamente el RAID es un sistema el cual permite almacenar informacin en una cantidad de discos (n), de tal forma que agilice el proceso maquina-disco. El sistema RAID evitar en lo ms posible la prdida de data de la siguiente manera: Los discos optimizados para RAID poseen circuitos integrados que detecta si el disco est fallando, de ser as este circuito se encargar por encima del tiempo real de sacar la informacin y almacenarla en los otros discos, o si es el caso en el "hot spare". Un hot spare es un disco que permanece siempre en el sistema esperando a que otro se estropee y l entre directamente en funcionamiento. Una de las ventajas del sistema RAID es la posibilidad, con los discos hot swap, de conectarlos y desconectarlos en "caliente", es decir, que si un disco falla no har falta el apagar el sistema para remplazarlo. Ventajas de los discos RAID El rendimiento general del sistema aumenta ya que pueden funcionar de forma paralela con los diferentes discos del conjunto. Dependiendo del nivel de RAID que escojamos, si uno de los discos del conjunto falla, la unidad contina funcionando, sin prdida de tiempo ni de datos. La reconstruccin de los datos del disco que ha fallado se hace de forma automtica sin intervencin humana. En el caso de algunos sistemas operativos la regeneracin de datos se hace desde software por ejemplo en el Windows NT, aunque en estos sistemas se pueden usar controladoras RAID que s regeneraran los datos automticamente. La capacidad global del disco aumentar, ya que se suman las capacidades de los diferentes discos que componen el conjunto. Tipos de RAID RAID 0

Este tipo de arreglo utiliza una tcnica llamada "striping", la cual distribuye la informacin en bloques entre los diferentes discos. Es el nico nivel de RAID que no duplica la informacin, por lo tanto no se desperdicia capacidad de almacenamiento. Se requieren mnimo dos discos.

Ventajas: RAID-0 permite acccesar ms de un disco a la vez, logrando una tasa de transferencia ms elevada y un rpido tiempo de acceso. Por no utilizar espacio en informacin redundante, el costo por Megabyte es menor. Desventaja: No existe proteccin de datos. No existe informacin en cuanto a Paridad. Ambientes donde implementarlo: Es una buena alternativa en sistemas donde sea ms importante el rendimiento que la seguridad de los datos. Es decir ambientes que puedan soportar una prdida de tiempo de operacin para poder reemplazar el disco que falle y reponer toda la informacin. RAID 1:

Este nivel de RAID usa un tipo de configuracin conocido como "mirroring", ya que la informacin de un disco es completamente duplicada en otro disco. As mismo, tambin se puede duplicar el controlador de disco (duplexing). Se desperdicia el 50% de la capacidad y slo maneja dos discos. Ventajas: Se protege la informacin en caso de falla tanto del disco como del controlador (en caso de duplex), y a q u e si un disco suspende su operacin el otro continua disponible. De este modo se evita la prdida de informacin y las interrupciones del sistema debido a fallas de discos. Desventajas: Gran consumo de necesidades hardware, 100% paridad y coste alto pues es necesario el doble de discos. Ambientes donde implementarlo: RAID-1 est diseado para sistemas donde la disponibilidad de la informacin es esencial y su reemplazo resultara difcil y costoso (ms costoso que reponer el disco en s). Tpico en escrituras aleatorias pequeas con tolerancia a fallas. El problema de este tipo de arreglos es el costo que implica duplicar los discos.

RAID 3:

Conocido tambin como "striping con paridad dedicada", utiliza un disco de proteccin de informacin separado para almacenar informacin de control codificada. Esta informacin de control codificada o paridad proviene de los datos almacenados en los discos y permite la reconstruccin de la informacin en caso de falla. Se requieren mnimo tres discos y se utiliza la capacidad de un disco para la informacin de control.

Ventajas: RAID-3 proporciona una alta disponibilidad del arreglo, as como una tasa de transferencia elevada, mejorando de ese modo el rendimiento del sistema. Desventajas: Un disco de paridad dedicado puede convertirse en un cuello de botella porque cada cambio en el grupo RAID requiere un cambio en la informacin de paridad. No plantea una solucin al fallo simultneo en dos discos. Est especialmente recomendado para aplicaciones que requieran archivos de datos de un gran tamao (vdeo, imgenes, DataWare House). Ambientes donde implementarlo: Es tpico para transferencia larga de datos en forma serial , tal como aplicaciones de imgenes o video

RAID 5:

Este nivel de RAID es conocido como "striping con paridad distribuida", ya que la informacin se reparte en bloques como RAID-0, pero un bloque de cada disco se dedica a la paridad. Es decir la data codificada se aade como otro sector que rota por los discos igual que los datos ordinarios. Se requieren mnimo tres discos.

Ventajas:

Es

el

esquema

de

proteccin de informacin ms usado comnmente, ya que proporciona un buen rendimiento general con una mnima prdida de capacidad. Adems el sistema tiene suficiente redundancia para ser tolerante a fallos. Desventajas: Menores prestaciones que en RAID 1. No plantea una solucin al fallo simultneo en dos discos.

Ambientes donde implementarlo: Es recomendable para aplicaciones intensas de entrada/salida y de lectura/escritura, tal como procesamiento de transacciones.

RAID 10: Es un nivel de arreglo de discos, donde la informacin se distribuye en bloques como en RAID-0 adicionalmente, cada disco se duplica como RAID-1 , creando un segundo nivel de arreglo. Se conoce como "striping de arreglos duplicados". Se requieren, dos canales, dos discos para cada canal y se utiliza el 50% de la capacidad para informacin de control. Tambin se le conoce como RAID

Ventajas: Este nivel ofrece un 100% de redundancia de la informacin y un soporte para grandes volmenes de datos, donde el precio no es un factor importante. Desventajas: Coste elevado, gran overhead y 100% de redundancia Ambientes donde implementarlo: Ideal para sistemas de misin crtica donde se requiera mayor confiabilidad de la informacin, ya que pueden fallar dos discos inclusive (uno por cada canal) y los datos todava se mantienen en lnea. Es apropiado tambin en escrituras aleatorias pequeas. 2.

TOLERANCIA A FALLAS DEL SERVIDOR Existen las siguientes tcnicas siguientes en cuanto a la tolerancia a fallas: Mtodos para reparar el disco duro Seguimiento de Operaciones Duplicacin de Directorios Cuenta de Usuario y Duplicado de Seguridad Proteccin del Sistema Operativo contra los errores de las aplicaciones software Cerrar archivo

Capacidad de Repararen forma directa el Disco Duro En una reparacin directa, el sistema operativo almacena temporalmente los datos que no pueden escribirse de forma inmediata debido a un problema del disco en esta posicin, por ejemplo por daos en la superficie del disco Y localizara otra zona otra zona del disco que este libre de errores, donde escribir los datos almacenados. Seguimiento de Operaciones Implica el mantenimiento de un cuaderno llamado diario hasta que se escribe el disco. Tambin llamado anotacin de operaciones en el que se mantiene las anotaciones de todas las operaciones recientes antes de que se escriban en el disco. Los sistemas de bases de datos tambin tienen la posibilidad de dar seguimiento a las operaciones. Duplicacin de Directorios Se pueden realizar copias de seguridad de ciertos archivos o carpetas .Los servicios de duplicacin se encargan de la copia de las carpetas y los archivos desde un servidor a otro o desde un servidor a una estacin de trabajo. Duplicacin de Seguridad y cuentas de usuarios Se conserva la informacin de las cuentas pero los usuarios no pueden acceder a sus hasta que la informacin no se haya reconstruido. Se protege los datos con la duplicacin regular de los datos en otro servidor de la red y la copia de seguridad de forma regular de los datos en una cinta. Tolerancia de Fallas para un SAM es tener dos o ms servidores en un dominio de Microsoft. El primer dominio (PDC) tiene la copia de seguridad de la base de datos .Cada uno de los controladores de dominio de seguridad (BDC) tiene una copia actualizada de forma regular de la base de datos 3. SOFTWARE DE TOLERANCIA A FALLOS PARA SERVIDORES Si el servidor falla, la aplicacin es restaurada en el servidor 'spare' o de espera automtica. Fujitsu Siemens Computers acaba de anunciar el lanzamiento de su software de alta disponibilidad, x10sure, una solucin de alta tolerancia a fallos para servidores Windows y aplicaciones. Gracias a este software, si el servidor falla, la aplicacin es restaurada en el servidor spare o de espera automtica. X10sure ha sido desarrollada para medianas y grandes empresas con el precio ms rentable del mercado, desde 9.200 euros para 5 nodos.

Permite la recuperacin automtica del sistema con los requisitos de configuracin mnimos, la consolidacin de la estructura y la continuidad del negocio. Ofrece un bajo riesgo de implementacin y una mnima complicacin para el usuario. Garantiza la mxima flexibilidad y sus usuarios consiguen una mayor rentabilidad, gracias a la implementacin de servidores reales y virtuales. Ha sido desarrollada para incorporarla en negocios con economa de escala, ya que maximiza la inversin en el futuro. Para Sergio Reiter, Responsable de Servidores PRIMERGY de Fujitsu Siemens Computers, esta nueva solucin es la llave para el xito de las medianas y grandes empresas. Ofrece la mejor alternativa en eficacia y fiabilidad para las estructuras tecnolgicas actuales. Nuestros usuarios podrn gozar del mximo rendimiento con el menor coste del mercado. Es una solucin rompedora en precio y tecnologa que sirve para cualquier aplicacin y, sobretodo, cuenta con un failover automtico. Ahora, nuestro software de alta disponibilidad, adem{s de ser nico, refuerza nuestra posicin y tecnologa. Segn han sealado los responsables, cuando se produce un incidente en los servidores, el hardware asociado es capaz de detectar el subsistema que falla y obrar en consecuencia para restablecer el sistema en segundos. Lo que consigue x10sure es monitorizar los servidores y el almacenamiento. En el caso de que un servidor de produccin caiga, la aplicacin automticamente lo rearranca en un servidor de espera. Si el almacenamiento falla, los datos o el acceso a los mismos puede ser automticamente restablecido. X10sure est en la actualidad disponible a travs del canal de distribucin. Para Reiter estamos satisfechos del gran producto que hoy presentamos y que representa, sin lugar a dudas, una gran oportunidad de negocio para nuestro canal de distribucin, especialmente para los clientes con necesidades de alta disponibilidad y consolidacin, pero bajo el prisma de la rentabilidad

4.

PROTEGER EL SISTEMA OPERATIVO Un sistema operativo protegido funciona en una zona de la memoria que esta separada de los dems programas, esto funciona en modo protegido para protegerse de los problemas del mal funcionamiento de algn programa. Bloquear los archivos y los registros El bloque es un proceso que realiza el sistema operativo para impedir que dos usuarios accedan y actualicen la misma informacin al mismo tiempo. Los sistemas operativos modernos realizan un bloqueo a nivel de registro lo que permite que muchos usuarios accedan y actualicen el mismo archivo pero no el mismo registro de este archivo.

Utilizar un Sistema de alimentacin Ininterrumpida El principal objetivo de un sistema de alimentacin ininterrumpida (SAI) es proteger a los equipos elctricos de los cortes y de las fluctuaciones de la tensin elctrica .Un SAI es una caja llena de bateras recargables que proporcionan energa de forma temporal, hasta que los equipos de la red se pueden apagar de forma segura. Los cortes de intermitentes de tensin provocan que los discos que los discos se paren de repente. Las unidades del disco y la memoria RAM son propensos a sufrir daos en un apagn. Hay dos tipos de SAIs: Los online-.Proporcionan energa elctrica a los equipos directamente desde sus bateras Los offline-.Conecta los equipos a la fuente de energa principal hasta que detecta una repentina reduccin de la tensin y en ese momento conmutan sus bateras para que sean estas las que proporcionen la tensin necesaria

5.

SISTEMA DE ALIMENTACIN ININTERRUMPIDA

Un SAI (Sistema de Alimentacin Ininterrumpida), tambin conocido por sus siglas en ingls UPS (UninterruptiblePowerSupply: suministro de energa ininterrumpible) e incorrectamente generalizado como No break, es un dispositivo que gracias a sus bateras, puede proporcionar energa elctrica tras un apagn a todos los dispositivos que tenga conectados. Otra de las funciones de los SAI es la de mejorar la calidad de la energa elctrica que llega a los aparatos, filtrando subidas y bajadas de tensin y eliminando armnicos de la red en el caso de Corriente Alterna. Dos son los criterios a tener en cuenta al elegir un SAI: - Potencia que consume la totalidad del Sistema Informtico - Problemas elctricos, cortes, microcortes etc., que deben resolverse ON-LINE La red alimenta al cargador de bateras y al ondulador (Fig. 1). De este modo nos encontramos con las bateras en paralelo con el ondulador, por tanto cualquier corte o microcorte queda suplido por las bateras. Se garantiza el aislamiento de la red, por medio del transformador separador existente en el cargador de bateras. La tensin de salida la proporciona el ondulador siempre, por tanto, se garantiza la estabilizacin de salida, la estabilidad en frecuencia y la ausencia de perturbaciones. No existe transferencia Red-Sai ni Sai-Red, puesto que es el ondulador, quien est permanente trabajando y suministrando energia a la salida.

Existe tambin la posibilidad de BYPASS, (Fig. 1-A), el cual debe garantizar, por redundancia, el suministro a la salida en caso de fallo de red. La presencia incorporacin del Bypass no debe ir en detrimento del poder de sobrecarga del ondulador, puesto que no debe ser usual, la intervencin del mismo, en las sobrecargas de conexin de los equipos informticos, ya que en caso de ausencia de Red, no se podra conectar la carga, pese a tener las bateras en condiciones. Como puede observarse en la figura, el conmutador de la salida, esta normalmente en la posicin "O", por tanto el ondulador alimenta la carga y el control del Bypass supervisa esta alimentacin, en caso de producirse alguna anomala, el conmutador cambia a la posicin "R", ser por tanto, la Red quien alimentar a la carga en estas circunstancias. Cuando el control del Bypass, observe restaurado el funcionamiento del ondulador, haya desaparecido la anomala que ha provocado la intervencin, devolver la alimentacin al ondulador. Es importante observar que, dado que el Bypass, se comporta como sistema redundante de seguridad, en la intervencin del mismo no debe perderse el aislamiento, caracterstica fundamental que debe aportar un SAI ON-LINE, por tanto, el Bypass deber incorporar transformador-separador, para garantizar sta caracterstica durante su intervencin. Esta caracterstica, es fcilmente olvidada por algunos equipos, que consiguen reducidas dimensiones, al incorporar tcnicas de alta frecuencia. Esta tecnologa, la primera

histricamente en ser utilizada, es la que aporta mayor grado de proteccin en su salida, ya que sta, es totalmente independiente de la entrada. Las condiciones de trabajo extremas desde un punto de vista de red elctrica, es decir, referentes a la entrada, dependen de la concepcin del cargador de bateras, a los que actualmente ya se dota de corrector de cos. de p, con lo cual se consume corriente senoidal a la entrada, a la vez que se consigue bajar los niveles de tensin de red, a los que todava se carga la batera. El ondulador, construido generalmente con tecnologa PWM y semiconductores MOSFET o IGBT, aporta las caractersticas de salida. En cualquier caso, sta topologa, la ms segura y de mayor grado de proteccin, es cara y voluminosa, lo cual da paso a las siguientes topologas, cuyaevolucin tiende siempre a imitar las prestaciones de una configuracin ON-LINE. OFF-LINE Parte del criterio de reducir costes, por ello la base es proteger slo en caso de necesidad, de tal forma que la red alimenta a la carga normalmente y tan slo interviene el ondulador en caso de fallo de red red excesivamente baja o alta , mediante la accin del conmutador C (Fig. 2). Podramos decir, que la red est controlada dentro de un intervalo de tensin mxima y mnima, y por tanto la carga que estamos alimentando, deber soportar los lmites de tensin a los que interviene el equipo. Normalmente no se produce un aislamiento entrada-salida y existe un inevitable tiempo de transferencia Red-Sai-Red. Dicho tiempo puede llegar a ser muy corto (1mS), sin embargo durante este tiempo, son los condensadores de filtro de la carga quienes mantienen la energa.

Como podr observarse, existen los mismos bloques que en una configuracin ON-LINE, cargador de bateras, bateras y ondulador, sin embargo se le aade un bloque ms, que es el supervisor de red, elemento que permite detectar un posible fallo de sta y conmutar "C", para que sea el ondulador, quien pase a alimentar la salida. Bajo este criterio, el ondulador slo trabajar el tiempo de descarga de la batera, apurandose hasta el lmite, las caractersticas de los semiconductores de potencia. A su a vez, la batera es cargada de forma lenta por el cargador, cuando existen condiciones correctas de red. Queda a criterio del fabricante, la eleccin de los lmites de dimensionado y temperatura de trabajo de los distintos componentes, para conseguir un equipo con una determinada fiabilidad-coste.

Conclusiones: Siendo la topologa OFF-LINE, las ms econmica y en muchos casos, suficiente, dista de ser la ms adecuada para realizar una proteccin total, parmetros como aislamiento, tiempo de transferencia y lmites de proteccin por red alta-baja, son normalmente subyugados a criterios econmicos. El lmite normalmente ms conflictivo, es el punto de intervencin, donde el ondulador empieza a trabajar y por tanto a utilizar batera, puesto que el equipo detecta la tensin de red baja. El Sai OFF-LINE, es til prcticamente, slo en lugares donde la red es estable y la proteccin a realizar, es frente a cortes momentneos de suministro. IN-LINE Es una nueva tcnica, de conocimiento reciente, cuyo origen es de una firma americana, quien lo aplic a equipos de elevada potencia, a fin de mejorar la fiabilidad y expectativas de vida. Comercialmente se utiliza como si de ON-LINE se tratara, por ello existen marcas que al ON-LINE autntico lo nombran como "verdadero" o "doble conversin". Originariamente, si est correcta-mente construido, las prestaciones y caractersticas que aporta, son prcticamente de ON-LINE. El sistema se basa en utilizar un ondulador reversible, capaz tanto de generar, como de rectificar para cargar la batera. Manteniendo al ondulador en marcha y variando la tensin y la fase generada por ste, se logra cargar adecuadamente la batera. Una etapa estabilizadora en la entrada, es obligada, para mantener al ondulador en los lmites tolerables de trabajo como cargador y un elaborado filtraje protegen al propio ondulador de picos de sobretensin, provenientes de la red, que lo estropearan. Debe prestarse atencin, al aislamiento electrico que pueda o no, incorporar el bypass.

6.

COPIAS DE SEGURIDAD EN LAS ESTACIONES DE TRABAJO

Puede utilizar el asistente para programar la creacin de una copia de seguridad cuando desee o en intervalos regulares. 7. PLAN DE SEGURIDAD Introduccin Hasta este punto se ha realizado un completo anlisis de la situacin de la empresa en lo que se refiere a la seguridad de la informacin. A continuacin se van a detallar las posibles soluciones que debe implantar la empresa para conseguir establecer un nivel de seguridad de su informacin adecuado para evitar prdidas y daos de activos. Plan de seguridad A la hora de realizar el anlisis de la empresa, se han detectado ciertas vulnerabilidades graves como por ejemplo que no exista un replicado de la informacin, que no existan polticas de acceso a la informacin o la ms importante, que los responsables de la empresa no tengan conciencia de la importancia de dotar a su empresa de unas adecuadas medidas de seguridad para proteger la informacin de la misma. Para conseguir reducir el riesgo de la empresa se van a detallar las medidas que se debern emplear para conseguir que consiga ponerse al da en la seguridad de su informacin y elementos informticos. Dentro de las medidas a emplear para eliminar las vulnerabilidades y dotar ala empresa de una seguridad adecuada, se pueden distinguir varios tipos:Medidas preventivas: Medidas que se debern implantar en la empresa para prevenir la posible explotacin de una vulnerabilidad por parte de una amenaza. Medidas correctoras: Medidas que se debern implantar en la empresa para corregir problemas o fallos debidos a amenazas que se han materializado.Riesgos asumibles: Pueden existir vulnerabilidades de la empresa que no sean sensibles a que un riesgo las explote, por lo que esa vulnerabilidad no es necesaria que sea tenida en cuenta a la hora de establecer las medidas de seguridad. . Medidas aplicadas a problemas de Hardware En el anlisis realizado dentro de la empresa se han detectado varios fallos en el correcto mantenimiento y seguridad del equipamiento Hardware disponible, sobre todo debido a la ausencia de un sistema de almacenamiento centralizado, lo que pone en grave riesgo la integridad de la informacin almacenada dentro de dicho Hardware. Algunas medidas aplicables para evitar prdidas: Medidas preventivas a adoptar dentro de la empresa:-Instalacin de un servidor de almacenamiento centralizado donde se almacene toda la informacin generada dentro de la empresa y que garantice un acceso adecuado, y seguro, a la misma cuando sea necesario. -

Disponer de copias de respaldo almacenadas en servidores exteriores ala empresa para prevenir posibles fallos de Hardware. Dispositivos SAI (Sistemas de Alimentacin Ininterrumpida) para evitar posibles fallos de los equipos debidos a cortes de energa repentinos.Tener contratado un buen servicio tcnico que asegure una rpida reparacin y puesta en marcha de los equipos si se produce un fallo. Medidas correctoras a adoptar dentro de la empresa:-Tener contratado un buen servicio tcnico que asegure una rpida reparacin y puesta en marcha de los equipos si se produce un fallo. Restauracin de copias de Backup en el caso de haberse producido una prdida de datos. Riesgos asumibles en la empresa:-Fallo en alguna estacin PC o porttil durante un periodo inferior a 24horas

Software Fallos debidos a amenazas que pueden afectar al Software que emplea la empresa para desarrollar su actividad de negocio. Pueden ser evitados.

Desarrollar un Plan para Reconstruir Desastres El administrador de red es responsable de disponer un plan de contingencia en caso que ocurra un desastre .Tal plan debe incluir un plan de seguridad y opciones de tolerancia a fallas, incluidos los procedimientos de tolerancia a fallas siguientes: discos Almacenar las ltimas copias de seguridad en otra ubicacin Contar con redundancia de almacenamiento en disco, por ejemplo un disco imagen Instalar un SAI Comprar equipos de repuesto Instalar cable adicional En la instalacin de la red, para disponer de cables de Comprar sistemas operativos que dispongan de opciones de tolerancia a fallas Establecer un plan para realizar copias de seguridad en discos, con rotacin de

o unidades RAID

seguridad por si se quiere redisear la red. Un plan de reconstruccion en caso de desastres debera tener una cuenta lo siguiente: Que el sistema de cintas se estropee e impida realizar la restauracion de las copias Que los problemas del sistema operativo no se puedan localizar inmediatamente Que una o varias CPUs se estropean Que varios discos no puedan funcionar

de seguridad

Que se estropeen unas cuantas cintas de las copias de seguridad Que ocurra un desastre natural

Plan de Seguridad de Recuperacin ante Desastres


Un plan de recuperacin ante desastres es un proceso de recuperacin que cubre los datos, el hardware y el software crtico, para que un negocio pueda comenzar de nuevo sus operaciones en caso de un desastre natural o causado por humanos. Esto tambin debera incluir proyectos para enfrentarse a la prdida inesperada o repentina de personal clave, aunque esto no sea cubierto en este artculo, el propsito es la proteccin de datos. Ante la amenaza de un desastre o despus de que ya ha ocurrido lo nico que nos puede salvar es la forma en que nos prevenimos antes de que ocurriera. Es por eso que es vital tener un Plan de Recuperacin ante Desastres (DRP - Disaster Recovery Plan).

Prevencin ante los desastres Enviar respaldos fuera de sitio semanalmente para que en el peor de los casos no se pierda ms que los datos de una semana.

Incluir el software as como toda la informacin de datos, para facilitar la recuperacin. Si es posible, usar una instalacin remota de reserva para reducir al mnimo la prdida de datos. Redes de rea de Almacenamiento (SANs) en mltiples sitios son un reciente desarrollo (desde 2003) que hace que los datos estn disponibles inmediatamente sin la necesidad de recuperarlos o sincronizarlos. Protectores de lnea para reducir al mnimo el efecto de oleadas sobre un delicado equipo electrnico. El suministro de energa ininterrumpido (SAI). La prevencin de incendios - ms alarmas, extintores accesibles. El software del antivirus. El seguro en el hardware.

El plan

Para asegurar la continuidad del negocio, es recomendable partir de la siguiente premisa: "Siempre desear lo mejor y planear para lo peor". En un buen plan existen diferentes factores que hay que tomar en cuenta. Los ms importantes son: El rbol telefnico: para notificar todo el personal clave del problema y asignarles tareas enfocadas hacia el plan de recuperacin. Reservas de memoria: si las cintas de reserva son tomadas fuera de sitio es necesario grabarlas. Si se usan servicios remotos de reserva se requerir una conexin de red a la posicin remota de reserva (o Internet). Clientes: la notificacin de clientes sobre el problema reduce al mnimo el pnico. Instalaciones: teniendo sitios calientes o sitios fros para empresas ms grandes. Instalaciones de recuperacin mviles estn tambin disponibles en muchos proveedores. Trabajadores con conocimiento. Durante desastre a los empleados se les requiere trabajar horas ms largas y ms agotadoras. Debe haber un sistema de apoyo para aliviar un poco de tensin. La informacin de negocio. Las reservas deben estar almacenadas completamente separadas de la empresa (Cummings, Haag y 2005 McCubbrey). La seguridad y la fiabilidad de los datos es clave en ocasiones como estas. Proceso de recuperacin

Comprar nuevo equipo (el hardware) o reparar o quitar virus, etc. Llamar el abastecedor de software e instalar de nuevo el software. Recuperar los discos de almacenaje que estn fuera de sitio.

Reinstalar todos los datos de la fuente de respaldo. Volver a ingresar los datos de las pasadas semanas. Tener estrategias peridicas de respaldos de base de datos.

Software Recomendados
Replication Server Es el software de replicacin de bases de datos que enva y sincroniza datos satisfaciendo las necesidades competitivas, incluyendo garanta de entrega e inteligencia comercial en tiempo real sin cadas operativas. OpenSwitch Una solucin que garantiza a los sistemas disponibilidad ininterrumpida sin complicaciones. Adaptive Server Enterprise Cluster Edition Reduce los costos operativos, brindando una infraestructura de bases de datos que permite al rea de TI mejorar los niveles del servicio de aplicaciones, reducir los costos del centro de datos y crear una infraestructura de datos para el crecimiento futuro del negocio. Mirror Activator Una solucin para la continuidad del negocio y la recuperacin de desastres para bases de datos de misin crtica. Acronis Backup & Recovery Advance 11 Server Ayuda a ser copias de seguridad y recuperar informacin de los discos duros que estn daados. Otras formas de Recuperar informacin Es la de pedir o buscar ayuda en empresas que se dedican a dar soporte a las empresas a recuperarse ante un desastre y de esta forma no pierdan dinero ante un desastre.Los

especialistas en reconstrucciones tienen computadoras, sistemas de seguridad, redes y acceso a internet para mantener la operatividad de la organizacin despus de un desastre.

Sistemas distribuidos tolerantes a fallas


La promesa de los sistemasdistribuidos slo se puede cumplir cuando a la base hardware adecuada sele aaden polticas y mecanismos tolerantes a fallas. El objetivo deldiseo y construccin de sistemas tolerantes a fallas consiste engarantizar que el sistema contine funcionando de manera correcta comoun todo, incluso en presencia de fallas.

Se dice que un sistema falla cuandono cumple su especificacin. En algunos casos, como en un sistema deordenamiento distribuido de productos en un supermercado, una fallapodra provocar la falta de algunos productos en la tienda. En otroscasos, como en un sistema distribuido para el control de trfico areo,una falla podra ser catastrfica. Como las computadoras y los sistemasdistribuidos se utilizan cada vez ms en misiones donde la seguridad escrtica, la necesidad de soportar las fallas cada vez es mayor.

Un sistema consiste de un conjuntode componentes de hardware y software y son diseados para proveer unservicio especfico. Los componentes de un sistema pueden estarinterrelacionados entre ellos. Un desperfecto de un sistema ocurrecuando el sistema no desempea estos servicios de la maneraespecificada. Un estado errneo en un sistema es un estado en el cualpodra conducir a un fallo en el sistema. Un fallo es una condicinfsica anormal, las causas de un fallo incluyen: errores de diseo (comoerrores en la especificacin del sistema o en la implementacin),problemas de fabricacin, deterioro por el uso u otros problemasexternos (como condiciones ambientales adversas, interferenciaelectromagntica, entradas imprevistas o el mal uso del sistema). Unerror es una parte del estado del sistema la cual difiere de los valoresesperados.

Unerror del sistema puede ser visto como una manifestacin de malfuncionamiento del sistema, el cual podra conducir a un fallo delsistema. Es necesario entonces, que el sistema sea capaz de recuperarsede las fallas, necesitamos deshacernos del estado de error del sistema,en otras palabras, la recuperacin de un fallo, es un proceso queinvolucra la restauracin de un estado errneo a un estado libre deerror. CLASIFICACIN Y PROPIEDADES DE FALLAS EN SISTEMAS DISTRIBUIDOS.

Clasificacin de fallas

Las fallas de un sistema de cmputo pueden clasificarse como sigue:

Falla de procesos:en una falla de proceso,la ejecucin arroja un resultado incorrecto, los procesos provocan queel sistema se desve de las especificaciones y el proceso puedesuspender su progreso. Ejemplos de errores que causan la falla de losprocesos son los interbloqueos, tiempo expirado, violacin deproteccin, error en la entrada provista por el usuario, violaciones deconsistencia (puede ocurrir si se emplea la tcnica de control deconcurrencia optimista). Dependiendo del tipo de error que cause que unproceso falle, este proceso puede ser abortado o reiniciado desde unestado anterior. Por ejemplo, un proceso interbloqueado puede serrestablecido desde un estado anterior, donde este puede tratar deadquirir nuevamente recursos. Por otro lado, entradas errneas requierenque el proceso se aborte.

Falla del sistema:una falla de un sistemaocurre cuando el procesador falla en la ejecucin. Esto es causado porerrores de software y problemas de hardware (como errores de CPU, fallaen la memoria principal, falla en el bus, falla de energa, etc.). En elcaso de una falla de sistema, el sistema es detenido y reiniciado en unestado correcto. El estado correcto puede estar en algn estadopredefinido o en un estado anterior (punto de revisin) del sistemaguardado en un almacenamiento no voltil.

Una falla del sistema puede ser clasificado como sigue:

Falla de amnesia:ocurre cuando se reiniciael sistema en un estado predefinido, y no depende del estado del sistemaantes de la falla. No se conoce el estado que tena el sistema antes dela falla.

Falla de amnesia parcial:ocurre cuando se reiniciael sistema y se conoce parte del estado que presentaba antes de ocurrirla falla. Tambin se predefine un estado inicial para fallas.

Falla de pausa:ocurre cuando el sistema se reinicia al mismo estado en que se encontraba antes de la falla.

Falla de aborto (halting):ocurre cuando un sistema nunca se reinicializa.

Falla en medio de almacenamiento secundario:se dice que ocurre unafalla en medio de almacenamiento cuando los datos almacenados no puedenser accedidos (cualquiera de sus partes o en su totalidad). La causa deesta falla normalmente es provocada por error de paridad, dao de lascabezas lectoras, partculas de polvo depositadas en el medio. En casode una falla en el medio de almacenamiento secundario, sus contenidos seencuentran alterados y deberan ser reconstruidos desde una versin delarchivo, que se toma del registro histrico de actividades del archivo.Para tolerar una falla del medio de almacenamiento secundario, elsistema puede ser configurado con un sistema de discos espejos. Unsistema de disco espejo generalmente son dos discos fsicamenteindependientes que se comunican con la memoria y/o con el CPU a travsde controladores y buses

independientes. Esto hace que el almacenamientode datos en un disco sea la imagen del otro. As, un sistema puedetolerar fallas de un disco de subsistema.

Falla en los medios de comunicacin:una falla de un medio decomunicacin, ocurre cuando un sitio no puede comunicarse con otro sitiooperacional de la red. Esto es ocasionado por la falla del nodo deconmutacin y/o por los enlaces de comunicacin del sistema. La falla deun nodo de conmutacin incluye la falla del sistema y la falla dealmacenamiento secundario, por otro lado, la falla de enlace incluye unaruptura fsica y ruido en los canales de comunicacin. Note que unafalla en un medio de comunicacin (esto depende de la topologa y laconectividad) puede no causar la prdida total de las facilidades decomunicacin. Por ejemplo, una falla en el medio de comunicacin puedesimplemente causar una prdida del mensaje, la recepcin de un mensajecon algunos errores, o la particin de una red donde un segmento desitios pueden ser incomunicados con los sitios en otro segmento, aunquelos sitios dentro de un segmento pueden comunicarse entre s.

RECUPERACIN DE ERRORES.

Recordemos que un error es esa partedel estado del sistema que es distinto de los valores esperados y quepueden conducir a la falla de un sistema, la recuperacin de una fallaes un proceso que involucra la recuperacin de estados errneos a unestado libre de error. Hay dos enfoques para la recuperacin de unestado de error a un estado libre de error.

Si la naturaleza del error y losdaos causados por la falla pueden ser completamente calculados,entonces es posible remover esos errores del estado del proceso (osistema) y habilitar el movimiento hacia adelante del proceso a unestado libre de error. Esta tcnica es conocida como recuperacin haciaadelante.

Si no es posible prever lanaturaleza de las fallas y remover todos los errores en el estado delproceso (o sistema), entonces el estado del proceso puede ser restauradoa un estado previo libre de error. Esta tcnica es conocida comorecuperacin de error hacia atrs.

Note que la recuperacin del errorhacia atrs es ms simple que la recuperacin del error hacia adelante,ya que es independiente de la falla y de los errores causados por lafalla. Adems un sistema puede recuperarse de una falla arbitraria porla restauracin a un estado previo. Esto generalmente habilita que larecuperacin hacia atrs sea provista como un mecanismo de recuperacingeneral para cualquier tipo de proceso.

Los principales problemas asociados con la recuperacin hacia atrs son:

Penalidad en rendimiento:la sobrecarga de trabajo para restaurar el estado del proceso a un estado anterior libre de errores puede resultar muy alto.

No esta garantizado que las fallas no ocurrirn nuevamente cuando se inicialice el procesamiento desde un estado anterior.

Algunos componentes del estado delsistema pueden ser irrecuperables. Por ejemplo, el dinero dispuesto enun cajero automtico no puede recuperarse.

La tcnica de recuperacin haciadelante, por otro lado, provoca una menor sobrecarga, porque slo esaspartes del estado que se desviaron de un valor esperado necesitan sercorregidas. Sin embargo, esta tcnica puede ser usada solo cuando losdaos debido a fallas pueden ser calculados correctamente, por lo tanto,este no es un concepto tan general como la recuperacin de error haciaatrs y no puede ser provista como un mecanismo general para recuperarerrores.

Recuperacin de error hacia atrs

En la recuperacin de error haciaatrs, un proceso es restaurado a un estado anterior con la esperanza deque el estado anterior este libre de errores. Los puntos en laejecucin de un proceso en los cuales los procesos pueden serrestaurados ms tarde se conocen como puntos de recuperacin. Se diceque un punto de recuperacin es recuperado cuando el estado actual de unproceso es remplazado por el estado del proceso en el punto derecuperacin. Los conceptos anteriores y la discusin que sigue sonaplicables tambin a nivel del sistema. Una recuperacin hecha a nivelde proceso es simplemente un subconjunto de acciones necesarias pararecuperar el sistema completo. En la recuperacin del sistema, todos losprocesos que fueron activados necesitan ser restaurados a susrespectivos puntos de recuperacin y los datos modificados (en elalmacenamiento secundario) por los procesos necesitan ser restaurados asu estado apropiado.

Hay dos formas de implementar unarecuperacin de error hacia atrs, a saber, el enfoque basado en laoperacin y el enfoque basado en estado. Estos enfoques son explicadosen el contexto de el siguiente sistema modelo.

Sistema modelo.El sistema que adoptamosconsiste de una mquina simple. La mquina esta conectada a un sistemade almacenamiento secundario y a un sistema de almacenamiento estable(ver figura 1.1.). Un almacenamiento que no

pierde informacin en unevento de falla del sistema es conocido como un almacenamiento estable.Cuando un proceso accesa a un objeto dato almacenado en un mediosecundario, el objeto dato es trado a la memoria principal si este nose encuentra ya en la memoria. Si el acceso es una operacin escribir,la copia del objeto en la memoria principal es actualizada. El objetodato es eventualmente actualizado cuando la copia del objeto en lamemoria principal es liberado al disco por el esquema de paginacin ocuando el proceso de actualizacin del objeto termina. El almacenamientoestable es usado para almacenar los registros histricos y los puntosde recuperacin. El contenido de ambos, almacenamiento secundario yalmacenamiento estable pueden sobrevivir a las fallas del sistema. Sinembargo, el contenido del almacenamiento estable es mucho ms seguro queel almacenamiento secundario. Se asume que los datos en elalmacenamiento secundario son peridicamente archivados.

Figura 1.1.Mquina que est conectada a un sistema de almacenamiento secundario y a un sistema de almacenamiento estable.

Enfoque basado en la operacin

En el enfoque basado en laoperacin, todas las modificaciones que son hechas al estado de unproceso son registrados con suficiente detalle, as los estados previosdel proceso pueden ser restaurados dando marcha atrs a todos loscambios hechos al estado. El registro de la actividad del sistema esconocido como registro histrico.

Considere un entorno basado entransacciones donde las transacciones modifican una base de datos. Ental ambiente es deseable tener la capacidad de comprometer o deshacerlas modificaciones realizadas por una transaccin. El comprometer(commit) es una accin la cual indica que el proceso o la transaccin deactualizacin se ha completado con xito, y por lo tanto los cambioshechos a la base de datos pueden ser permanentes. Note que incluso antesde comprometer una transaccin, si se modific pudo haber sidoregistrada en la base de datos por el esquema de paginacin. Por lotanto, si una transaccin no ha sido comprometida, la actualizacin dela base de datos podr deshacerse. Por otro lado, si una parte de labase de datos se pierde por un error de medio de almacenamiento, deberaser posible reconstruir esa parte.

Protocolo de escritura inmediata (Updating-in-place)

Bajo este esquema de actualizacinde escritura inmediata, cada operacin de actualizacin (escritura) a unobjeto, se actualiza el objeto y los resultados en un registro segraban en un medio de almacenamiento estable, el cul, al final de lasoperaciones, tendr suficiente informacin para deshacer y rehacercompletamente las operaciones. La informacin registrada incluye: (1) Elnombre del objeto, (2) El estado antiguo del objeto (usado paradeshacer) y (3) El nuevo estado del objeto (usado para rehacer).

Una operacin de actualizacin recuperable puede ser implementada como una coleccin de operaciones como sigue:

Operacinhacer, la cual hace la accin (actualizacin) y la escribe en el registro histrico.

Operacindeshacer, la cual, dado un registro histrico escrito por una operacin hacer, deshace la accin realizada por la operacin hacer.

Operacinrehacer, la cual, dado un registro histrico escrito por una operacin hacer, rehace la accin especificada por la operacin hacer.

Operacin opcionalvisualizacin, la cual visualiza el registro histrico.

Cuando una transaccin no estcomprometida o falla, los cambios hechos por la transaccin a la base dedatos pueden deshacerse, usando operacionesdeshacer(undo). Por otro lado, si una porcin de la base de datos va a ser reconstruida, entonces se utiliza la operacinrehacer(redo) sobre la porcin guardada previamente de la base de datos.

El principal problema con la actualizacin inmediata es que la operacinhacerno se puededeshacer, si el sistema se daadespus de una operacin de actualizacin pero antes de que el registrohistrico sea almacenado. Este problema es resuelto por el protocolo deescritura de registro anticipado (write-ahead-log).

Protocolo de escritura de registro anticipado

En el protocolo de escritura deregistro anticipado, una operacin de actualizacin recuperable seimplementa por las siguientes operaciones:

Actualizacin de un objeto solo despus de que el registrodeshaceres guardado.

Antes de comprometer la actualizacin, los registrosrehacerydeshacerson guardados.

Al reiniciar el sistema despus del fallo (de hardware o alguna otra razn), puede ser necesariodeshacerlos cambios hechos por latransaccin que estaba en progreso al momento que ocurri el fallo. Porotro lado, en el reinicio, las operaciones derehacerpodran haber sidorealizadas si los objetos actualizados estuvieron en la memoriaprincipal en el momento en que fall el sistema. Por lo tanto, ambasacciones dedeshaceryrehacerdeberan trabajarcorrectamente, aun bajo fallas repetitivas, si los protocolosactualizacin al momento o de escritura de registro anticipado sonusados. Note que tambin la escritura del registro histrico en cadaoperacin de actualizacin es caro en trminos de requerimiento dealmacenamiento y la CPU sufre de sobrecarga innecesaria especialmente silos fallos son raros.

Enfoque basado en estado

En el enfoque basado en estado, parala recuperacin, el estado completo de un proceso es guardado cuando seestablece un punto de verificacin y la recuperacin de un procesoinvolucra reincorporarle el estado guardado y reiniciar la ejecucin delproceso desde ese estado. Al proceso de guardado del estado tambin sele conoce como tomar un punto de verificacin. El punto de recuperacin,en los que se encuentra un punto de verificacin a menudo se le refierecomo punto de revisin. Al proceso de restauracin de un proceso a unestado anterior se le refiere como rolar al procesos hacia atrs(rolling back), y el proceso de reiniciar la ejecucin en un estadoanterior consume tiempo de CPU y retarda la terminacin del proceso, espreferible retroceder a un estado ms reciente tanto como sea posible.Por lo tanto, se acostumbra establecer muchos puntos de revisin.

Pgina sombra.Un caso especial delenfoque de recuperacin basado en estado es la tcnica basada en pginassombra. Bajo esta tcnica, solo una parte del estado del sistema esguardado para facilitar la recuperacin. Sin embargo cuando un procesoquiere modificar un objeto, la pgina que contiene al objeto esduplicada y mantenida en un medio estable. Desde este punto en adelante,solo una de las copias recibir todas las modificaciones hechas por elproceso. La otra copia no modificada es conocida como pgina sombra. Siel proceso falla, la copia modificada es descartada y se restablece labase de datos en el estado anterior. Si el proceso se comprometiexitosamente, entonces la pgina sombra es descartada y la pginamodificada es hecha parte de la base de datos.

ELEMENTOS DE LAS ESTRATEGIAS TOLERANTES A FALLAS.

Un sistema puede ser diseado paraque sea tolerante a falla desde dos puntos de vista. Un sistema puedeocultar la falla

o puede en caso de ocurrir una falla corregirla yseguir funcionando. Cuando el sistema se disea para ocultar la falla,cuando ocurre una falla continua con sus funciones especficas. Por otrolado un sistema diseado para corregir una falla puede o no ejecutarfunciones especficas, sin embargo, puede seguir acciones pararecuperacin. Estrategia tolerante a fallas

Redundancia.Con este enfoque, elsistema puede emplear varios procesos, muchos componentes de hardware,muchas copias de datos, etc. Cada uno con independencia en el modo de lafalla, (es decir, si un componente falla no afecta la operacin de otrocomponente).

Tcnica para sistemas tolerantes a fallas.

Protocolo de compromiso. Protocolo de eleccin.

La primera tcnica se utiliza parasistemas que pueden hasta cierto punto corregir las fallas y el segundo,el protocolo de eleccin, es utilizado para sistemas que oculten lasfallas.

Efectos de las fallas ms comunes.

Un proceso muere.Cuando un proceso muere,es importante que los recursos asignados al proceso sean recuperados, deotra manera pueden estar perdidos permanentemente.

La mquina falla.Cuando una mquina falla,todos los procesos ejecutndose en esa mquina se mueren. La diferenciacon el caso anterior es, como detectar la falla.

La red falla.Una falla de enlace de comunicacin puedeparticionar la red ensub-redes, haciendo imposible la

comunicacin entre nodos localizadosen sub-redes diferentes. Un proceso no puede notar la diferencia entreuna falla de mquina y una falla de enlace de comunicacin, dependiendode la red, en algunos casos se pueden detectar falla de mquina. En lasredes que no detectan falla de mquina (Ethernet), el diseo tolerante afalla debe asumir que la mquina puede estar en operacin y que losprocesos en ella estn activos. Acciones atmicas y compromiso

La actividad de un sistema esgobernada por una secuencia de primitivas u operaciones atmicas queejecuta permanentemente. Generalmente, una instruccin a nivel demquina, es indivisible, instantnea, y no puede ser interrumpida (amenos que ocurra una falla), corresponde a una operacin atmica. Sinembargo es deseable disponer de un conjunto de instrucciones quecompletan una cierta tarea y hacemos que este grupo sea una operacinatmica.

El concepto de accin atmica seextiende al concepto de atomicidad desde un nivel de instruccin demquina hasta una secuencia de instrucciones o un grupo de procesos loscuales deben ellos mismos ser ejecutados atmicamente. Las accionesatmicas forman un bloque bsico en la construccin de operacionestolerantes a fallas.

Una transaccin agrupa una secuenciade acciones (sobre una base de datos) y al grupo se le trata como unaaccin atmica que mantiene la consistencia de la base de datos.

En los sistemas distribuidos, variosprocesos pueden coordinarse para ejecutar una tarea. Sus acciones debenser atmicas con respectos a los otros procesos. Como ejemplo, en unsistema de base de datos distribuidos, una transaccin debe procesarseen cada sitio o en ninguno para mantener la integridad de la base dedatos. Esto es atomicidad global. El protocolo que permite unaatomicidad global es el protocolo de compromiso.

Protocolo de compromiso de dos fases

Este protocolo asume que uno de losprocesos cooperativos acta como coordinador, otros procesos se lesrefiere como subordinados (se asume que los subordinados se ejecutan endiferentes sitios). ste protocolo asume que se dispone de un medio dealmacenamiento estable en cada sitio y que se encuentra activo elprotocolo de escritura de registro anticipado. Al inicio de latransaccin, el coordinador enva el mensaje inicio de transaccin acada subordinado.

Fase 1. En el sitio del coordinador.

El coordinador enva el mensaje solicitud de compromiso a cada subordinado, para solicitarles el compromiso.

El coordinador espera la respuesta de todos los subordinados.

En cada sitio subordinado.

Al recibir el mensaje solicitud decompromiso, un subordinado toma las siguientes acciones. Si latransaccin ejecutndose en su sitio termina satisfactoriamente, escribelos registrosdeshaceryrehaceren un medio estable y enva un mensaje de acuerdo al coordinador. En otro caso, enva el mensaje abortar al coordinador.

Fase 2. En el sitio del coordinador.

Si todos los subordinados respondende acuerdo y el coordinador tambin est de acuerdo, entonces elcoordinador escribe el registro compromiso en el registro histrico.Luego enva el mensaje compromiso a todos los subordinados. En otrocaso, el coordinador enva el mensaje abortar a todos lossubordinados.

El coordinador espera un mensaje de reconocimiento de cada subordinado.

Si el mensaje reconocimiento no esrecibido por el coordinador despus de un perodo de tiempo, elcoordinador reenva el mensaje compromiso/abortar a los subordinados.

Si se reciben todos los reconocimientos, el coordinador escribe el registro completo al registro histrico.

En cada sitio subordinado.

Al recibir el mensaje compromiso,un subordinado libera todos los recursos, ejecuta la transaccin y envaun reconocimiento.

Al recibir el mensaje abortar, un subordinado deshace la transaccin utilizando el registrodeshacer, libera todos los recursos, y enva un reconocimiento.

Cuando no hay fallas ni prdidas de mensajes, es fcil ver que todos los sitios se comprometern incluyendo al coordinador.

Protocolo de compromiso en presencia de fallas de sitio

Suponga que el coordinador fallaantes de escribir el registro compromiso. En la recuperacin, elcoordinador difunde el mensaje abortar a todos los subordinados. Todoslos subordinados que estaban de acuerdo con el compromiso simplementedeshacen la transaccin utilizando el registrodeshacery abortan. Otrossubordinados solamente abortarn la transaccin. Note que todos lossubordinados se bloquean mientras no reciban el mensaje abortar. Suponer que el coordinador falladespus de escribir el registro compromiso pero antes de escribir elregistro completo. En la recuperacin, el coordinador difunde elmensaje compromiso a todos los subordinados y espera elreconocimiento. En este caso tambin los subordinados se bloqueanmientras no reciban el mensaje compromiso.

Suponer que el coordinador falladespus de escribir el registro completo. En la recuperacin, no haynada que pueda ser hecho por la transaccin.

Si un subordinado falla en la fase1, el coordinador puede abortar la transaccin porque no recibe ningunarespuesta del subordinado fallido.

Suponer que un subordinado falla en la fase 2, esto es, despus de escribir los registrosdeshaceryrehacer. En la recuperacin, elsubordinado debe consultar con el coordinador si debe abortar (es decir,si debe ejecutar una operacindeshacer) o comprometer la transaccin. Note que el comprometer significa realizar una operacinrehacerporque el subordinado pudo fallar antes de actualizar la base de datos.

En el caso de falla en latransmisin de mensajes, el protocolo de dos fases perder mucho tiempoenviando mensajes y posiblemente la transaccin no se ejecute. Elprotocolo de compromiso de dos fases garantiza la atomicidad global, suprincipal desventaja es que es un protocolo con bloqueo, existe otroprotocolo de compromiso sin bloqueo el cual se sale del alcance de estematerial. Protocolo de eleccin Una tcnica comn la cual proveetolerancia a fallas en sistemas distribuidos es la replicacin de datosen mltiple sitios. Si un sitio no esta disponible, los datos se puedenobtener de otras copias en otros sitios. El protocolo de compromisopuede ser utilizado para actualizar mltiples copias de datos, pero noes resistente en el caso de que se presenten mltiples fallas de sitios,fallas del medio de comunicacin y fraccionamiento de red. En elprotocolo de compromiso, cuando un sitio no es recuperable, elcoordinador enva mensajes en repetidas ocasiones y eventualmente decideabortar la transaccin, por ello se niega el acceso a los datos. Sinembargo, es deseable que un sitio contine operando aunque otros tenganfallas, o por lo menos, un fragmento debe seguir funcionado cuando elsistema se ha fragmentado. Una bien conocida tcnica para el manejo dedatos replicados es el mecanismo de eleccin. Con el mecanismo deeleccin, a cada replica se le asigna algn nmero de votos y un procesodebe reunir la mayora de votos antes de que pueda acceder a unareplica. El mecanismo de eleccin es ms tolerante a fallas que elprotocolo de compromiso en el sentido de que permite el acceso a datosbajo fragmentacin de red, fallas de sitios y prdida de mensajes con elcompromiso de mantener la integridad de los datos. Existen dos mtodosde eleccin, el mtodo esttico y el dinmico, en este materialabarcaremos solamente el mtodo de eleccin esttico.

Protocolo de eleccin esttico Sistema modelo.Las replicas se almacenanen sitios diferentes. Cada operacin de acceso a archivo debe obtener unbloqueo apropiado. El bloqueo otorga reglas que permiten: unaescritura y ninguna lectura o mltiples lecturas y ninguna escrituraen el acceso simultneo a archivos. Se asume que cada sitio tiene unmanejador de bloqueo que ejecuta las operaciones relacionadas albloqueo, y a cada archivo se le asocia un nmero de versin, el cual nosdice el nmero de veces que un archivo ha sido actualizado. El nmerode versin se almacena en un medio estable, y cada operacin deescritura exitosa en una replica, actualiza su nmero de versin.

Idea bsica.La esencia del algoritmode eleccin el cual controla el acceso a datos replicados es como sigue:A cada replica se le asigna un cierto nmero de votos. Esta informacinse almacena en un medio estable. Se permite una operacin de lectura oescritura si se obtiene un cierto nmero de votos, qurum de lectura oqurum de escritura, respectivamente, de los procesos participantes.

Cuando un proceso ejecutndose en el sitioirealiza una solicitud de operacin de lectura o escritura a un archivo, se inicia el siguiente protocolo:

El sitioihace una solicitud de bloqueo al manejador local.

Cuando se acuerda la solicitud, el sitioienva un mensaje de solicitud de voto a todos los sitios.

Cuando un sitiojrecibe el mensajesolicitud de voto, hace una solicitud de bloqueo al manejador debloqueo local, si se acuerda la solicitud de bloqueo, entonces devuelveel nmero de versin de su replica (VNj) y el nmero de votos asignados a la replica (Vj) al sitioi.

El sitioidecide tiene o no el qurum, basndose en las respuestas recibidas en tiempo de la siguiente manera (Pdenota el conjunto de sitios que respondieron).

Seavel nmero total de votos asignados a todas las copias. Los valores parar(qurum de lectura) yw(qurum de escritura) son seleccionados de tal manera que:

r+w>v;

w>v/2

Si la solicitud fue de lectura, entonces el total de votos obtenido es: vr= Sumavk, dondekP.

Si la solicitud fue de escritura: El qurum de escritura es igual a la suma de votos del conjuntoQ, dondeQse determina de la siguiente manera:

vw= Sumavk, kQ

SeaM= max {VNj : jP},Q= {jP : VNj=M} si su copia de archivo est actualizada. La copia est actualizado si el nmero de versin es igual aM. Si la copia no estaactualizada, la copia actualizada se obtiene de un sitio que la tengaactualizada. Una vez que la copia actualizada se tiene localmente, elsitioiejecuta el siguiente paso.

Si la solicitud es de lectura, el sitioi, lee la copia local. Si la solicitud es de escritura, el sitioiactualiza la copia local . Una vez que

todos los accesos a la copia han concluido, el sitioiactualizaVNiy enva todas las actualizaciones yVNia todos los sitios enQ. Notar que la operacin de escritura actualiza solamente las copias actualizadas. Despus el sitioihace una solicitud de liberacin de bloqueo a su manejador de bloqueo local y a todos los sitios enP.

Todos los sitios que reciben laactualizacin la ejecutan en sus copias locales, y al recibir unasolicitud de liberar bloqueo liberan el bloqueo.

Los valores seleccionados pararywcombinado con la idea de que las operaciones de escritura actualizan solamente las copias actualizadas garantiza lo siguiente:

Ninguna copia obsoleta es actualizada por una operacin de escritura.

Existe un subconjunto de replicas que estn actualizadas cuyos votos totales sonw.

El qurum de escriturawes los suficientemente grande tal que no permite escrituras simultneas sobre dos subconjuntos distintos de replicas.

TECNOLOGA RAID: Tolerancia a fallos

Como todos sabemos no es lo mismo una pequea red de PC,s que podamos tener en casa, que una red corporativa de una gran empresa en la que los PC,s se cuentan por cientos y los servidores por decenas. Cuando en casa tenemos un problema con el PC y la solucin mas sencilla es restaurar el sistema operativo junto con los programas que manejamos mas habitualmente ademas de nuestros documentos personales, el nico problema que se nos plantea es calcular el tiempo que vamos a necesitar para la reinstalacin del equipo y ver si tenemos a mano los drivers de todos los elementos hardware que tenemos instalados. En cambio, si el fallo se produjese en un servidor de un hospital, por ejemplo, podra dejar sin funcionamiento todo un sistema de asignacin de ambulancias, citaciones, horarios de quirfanos, etc Para evitar semejante caos es necesario que un equipo informtico o mejor todava, toda una red sea capaz de poder superar una situacin de fallo que provoque prdida de informacin y por consiguiente caos y perdida de rendimiento y dinero para la empresa u organizacin. Al conjunto de medidas empleadas para evitar la perdida de informacin en equipos informticos debido a

errores tcnicos se le denomina Tolerancia a Fallos o lo que es lo mismo, capacidad de superar un fallo tcnico sin que se produzcan prdidas de informacin y seguir funcionando como si nada hubiese pasado. Dichas medidas se engloban en medidas software y medidas hardware. Medidas Software Las medidas Software empleadas para evitar perdidas de informacin las podemos encontrar en el propio sistema operativo (Windows NT Server por ejemplo) o en programas especficos diseados para prevenir y avisar de posibles fallos en los equipos u orientados a salvaguardar la informacin de los discos en otros elementos externos tales como CD,s CINTAS o Disco Magneto-pticos. Tomando como ejemplo Windows NT 4.0 Server podemos observar que este sistema operativo posee capacidad para un restablecimiento del sistema en caso de que se produzca un fallo del disco o discos duros, para recuperar datos perdidos en ficheros, para realizar una recuperacin del sistema ante un fallo de configuracin y sobre todo, posee un sistema de alarmas que avisan de un posible error hardware antes de que ste deje a la mquina inoperativa. Estas capacidades podemos encontrarlas entre otros sitios, en el Visor de Sucesos del Sistema Operativo o en la Administracin de la energa elctrica / SAI a la que est conectada la mquina. Ejemplo de aplicaciones destinadas a garantizar la integridad de la informacin de uno o varios discos pueden ser aplicaciones de chequeo del equipo (Sisoft SANDRA 2000, CheckIT 5.0, QAplus), aplicaciones de copias de Seguridad (WinZip, WinRAR, Windows Backup, PCBackup) o aplicaciones para generar imgenes de disco que copien exactamente y sin ningn tipo de variacin el contenido de los discos seleccionados en otros dispositivos tales como CDROM, Discos Zip, Magneto-pticos CINTAS, etc.. con el fin de garantizar una restauracin exacta del sistema en caso de fallo. Como hemos visto anteriormente, ciertos sistemas operativos son capaces de hacer un seguimiento preventivo de la maquina donde estn instalados pero, son capaces de reparar un disco estropeado, recuperar la informacin y seguir funcionando como si nada hubiese pasado? Evidentemente No, por lo que en un caso de error hardware debemos apoyarnos adems de las medidas software, en ciertas medidas hardware que garanticen una salida a este tipo de fallos. Medidas Hardware En medidas hardware se engloban todos aquellos dispositivos que han sido diseados con el fin de evitar perdidas de informacin por errores de la mquina donde estn instalados o por causas ajenas a sta, tales como los fatdicos cortes de energa elctrica. Dichos dispositivos, como norma general, se usan slo en entornos corporativos aunque desde hace un tiempo parece ser que la tendencia del mercado es introducirlos en el hogar del usuario domestico con el fin de, por supuesto, vender mas pero tambin de hecha una mano a todas aquellas personas que hoy comienzan a usar el PC de casa para trabajar.

SAI : La energa de reserva La SAI (Sistema de Alimentacin Ininterrumpida) tambin conocida con las siglas inglesas UPS es quiz uno de los dispositivos RAID ms clebres que se han introducido en nuestras casas. No es mas que una batera recargable que detecta las altas y bajas tensiones de la red elctrica y los cortes completos de sta, proporcionando al PC una tensin estable en todo momento y durante un tiempo determinado que depende del modelo de SAI con el fin de evitar averas tcnicas y por supuesto, evitar perdidas de informacin debido a irregularidades del fluido elctrico. Para que os hagis una idea, seguramente muchos de vosotros habris sufrido algn corte de luz que os ha dejado sin ese preciado trabajo que estabais haciendo o ha echado por tierra vuestra impresionante partida de Unreal, Quake o Hexxen porque no la habas grabado. Pues bien todos estos problemas desaparecen con la SAI y su capacidad de proporcionar energa elctrica durante el tiempo suficiente para que podamos grabar nuestro trabajo y apagar el equipo de forma correcta. Se trata de un elemento que no requiere mantenimiento y que en algunos modelos incluye un conector para el cable telefnico del modem con lo que tambin protege a ste de las sobretensiones de la lnea telefnica. Dispositivos de almacenamiento Bajo ese nombre un tanto abstracto y gris se esconden todos aquellos dispositivos en los que podemos almacenar informacin del PC para que sta quede grabada de forma externa a la mquina y pueda ser recuperada en caso de fallo. Alguien podra preguntar si se pueden incluir los disquetes de 3 en este apartado. Bajo mi opinin NO pueden incluirse porque aunque son dispositivos de almacenamiento externo, son extremadamente delicados y pequeos por lo que no cumplen ninguna de las dos caractersticas fundamentales de estos dispositivos: primera, seguridad y fiabilidad a la hora de guardar la informacin y segunda, poseer un tamao que permita guardar gran cantidad de informacin en el menor nmero de discos o cintas posible. Dispositivos de almacenamiento pueden ser Grabadoras / Regrabadoras de CD,s, unidades Zip, Jaz, Magneto-pticas o unidades de cinta. De todos stos el nico dispositivo exclusivo para almacenar copias de seguridad son las cintas ya que su elevado coste y fiabilidad las hacen casi exclusivas para la empresa. Por el contrario, como todos sabemos, el resto de dispositivos los podemos usar para guardar cualquier tipo de informacin que queramos a parte de usarlas como dispositivos de copia de seguridad.

Tolerancias de Fallas
III. Introduccin

La tolerancia a fallos es un aspecto crtico para aplicaciones a gran escala, ya que aquellas simulaciones que pueden tardar del orden de varios das o semanas

para ofrecer resultados deben tener la posibilidad de manejar cierto tipo de fallos del sistema o de alguna tarea de la aplicacin. Sin la capacidad de detectar fallos y recuperarse de estos, dichas simulaciones pueden no llegar a completarse. Es ms, algunos tipos de aplicaciones requieren ser ejecutadas en un entorno tolerante a fallos debido al nivel de seguridad requeridos. De cualquier forma, en ciertos casos debera haber algn modo de detectar y responder automticamente a ciertos fallos del sistema o al menos ofrecer cierta informacin al usuario en el caso de producirse un fallo. Actualmente, el mbito de aplicacin de las tcnicas de tolerancia a fallos se ha extendido a todos aquellos contextos en los que el funcionamiento incorrecto de un computador, o de una de sus partes, puede comportar importantes prdidas humanas y/o econmicas. As pues, una buena solucin informtica debe, entre otras muchas cosas, ser fcil de utilizar y mantener, y en caso de problemas, debe ofrecer un comportamiento seguro y robusto, asegurando la continuidad del servicio ofrecido (es decir, tolerando la ocurrencia del problema) u ofreciendo un procedimiento de parada (o avera) del sistema controlado y, en la medida de lo posible, inocuo tanto para los usuarios, como para sus datos y operaciones. Como todos sabemos no es lo mismo una pequea red de PC,s que podamos tener en casa, que una red corporativa de una gran empresa en la que los PC,s se cuentan por cientos y los servidores por decenas. Cuando en casa tenemos un problema con el PC y la solucin mas sencilla es restaurar el sistema operativo junto con los programas que manejamos mas habitualmente ademas de nuestros documentos personales, el nico problema que se nos plantea es calcular el tiempo que vamos a necesitar para la reinstalacin del equipo y ver si tenemos a mano los drivers de todos los elementos hardware que tenemos instalados. En cambio, si el fallo se produjese en un servidor de un hospital, por ejemplo, podra dejar sin funcionamiento todo un sistema de asignacin de ambulancias, citaciones, horarios de quirfanos, etc Para evitar semejante caos es necesario que un equipo informtico o mejor todava, toda una red sea capaz de poder superar una situacin de fallo que provoque prdida de informacin y por consiguiente caos y perdida de rendimiento y dinero para la empresa u organizacin. Al conjunto de medidas empleadas para evitar la perdida de informacin en equipos informticos debido a errores tcnicos se le denomina Tolerancia a Fallos o lo que es lo mismo, capacidad de superar un fallo tcnico sin que se produzcan prdidas de informacin y seguir

funcionando como si nada hubiese pasado. Dichas medidas se engloban en medidas software y medidas hardware. Aumentar la fiabilidad de un sistema: Prevencin de fallos :se trata de evitar, antes de que el sistema entre en funcionamiento, que se introduzcan fallos Tolerancia de fallos :se trata de conseguir que el sistema contine funcionando aunque se produzcan fallos En ambos casos el objetivo es desarrollar sistemas con modos de fallo bien definidos. No son incompatibles El objetivo de tolerancia de fallas Se caracteriza por dividirse en tres fases. 4. Se estudian las diferentes fallas que pueden ser impredecibles o predecibles ya sea en hardware o software. 5. A continuacin, se identifican y clasifican las amenazas (fallos, errores, fluctuaciones de corriente elctrica, averas, etc) que son susceptibles de perturbar el correcto funcionamiento de de una red, centro de computo, etc. 6. En la tercera fase se detallan los distintos medios a nuestra disposicin para prevenir, eliminar y/o tolerar las amenazas.

IV.

Sistema de Almacenamiento tolerante a Fallas


Las unidades de disco son dispositivos que pueden fallar con cierta facilidad como el desgaste de la cabeza de lectura por apagarlo repentinamente o por que el disco esta fragmentado, cuando sector MBR esta defectuoso. Por lo cual hay dos formas muy conocidas para tolerancia de fallas para los discos: instalando discos de copias de seguridad (backup) y la otra forma es instalando unidades RAID. Copias de Seguridad (backup) Esta opcin la tienen muchos ordenadores, en la cual existen dos discos: principal del cual se har una copia a la que llamaremos disco imagen o espejo estos discos estarn conectados por una controlador de disco o adaptador SCSI. *SCSI: (Small Computer System Interface)

Interfaz estndar para transferencia de datos entre perifricos en el bus de la computadora. Tanto la placa madre como el dispositivo deben soportar y disponer de un controlador SCSI. Es utilizado especialmente en dispositivos como los discos duros CD/DVD, etc., aunque, en principio, cualquier dispositivo podra soportar el SCSI, como impresoras o escneres. El SCSI se utiliza en computadoras que necesitan de alto rendimiento. La compatibilidad para dispositivos SCSI puede agregarse a travs de una tarjeta de expansin a la placa madre. Dos interfaces SCSI pueden ser incompatibles pues existen muchas variantes (incluso aunque est estandarizado en ANSI). El sucesor del SCSI paralelo es el SAS Caractersticas de SCSI paralelo El SCSI bsico permite conectar hasta 8 dispositivos, y el ms avanzado 16. El ms bsico permite transferencias de 5 MB/s y el ms rpido 640 MB/s. Intefaz SCSI-1 Fast SCSI FastWide SCSI Ultra SCSI Ultra Wide SCSI Ultra2 SCSI Ultra2 Wide SCSI Ultra3 SCSI Ultra-320 SCSI Conector IDC50; Centronics C50 IDC50; Centronics C50 2 x 50-pin (SCSI-2) 1 x 68-pin (SCSI-3) IDC50 68-pin 50-pin 68-pin; 80-pin (SCA/SCA-2) 68-pin; 80-pin (SCA/SCA-2) 68-pin; 80-pin (SCA/SCA-2) Reloj 5 MHz 10 MHz 10 MHz 20 MHz 20 MHz 40 MHz 40 MHz 40 MHz DDR 80 MHz DDR Mximos Longitud Dispositivos 6m 1,5 a 3 m 8 8

Velocidad 5 MB/s 10 MB/s

20 MB/s

1,5 a 3 m

16

20 MB/s 40 MB/s 40 MB/s 80 MB/s

1,5 a 3 m 1,5 s 3 m SD SD

8 16 8 16

160 MB/s

SD

16

320 MB/s

SD

16

Ultra-640 SCSI

68-pin; 80-pin

160 MHz DDR

640 MB/s

16

Estndares SCSI y tipos de conexiones SCSI - 1 Es un estndar obsoleto, creado a mediados de los 80s. Usaba un bus de 8 bits con drivers de colector abierto single-ended (asimtricos), con los cuales se realizaban transferencias asncronas de datos y comandos. Los drivers (y receptores) fueron fabricados con tecnologa bipolar con lo cual la mayor consideracin se pone al Bus de DC y la terminacin pasiva. Utiliza conectores internos y externos de baja densidad con 50 pines, al conector externo de baja densidad se le conoce como conector Centronics o conector SCSI-1. SCSI - 2 Es un estndar completo que define las capas fsica y de protocolo, el cual utiliza transferencias asncronas de comandos y transferencias sncronas de datos; a velocidades de 20 Megatransferencias / segundo, es decir 10 Mbytes/sec. El SCSI-2 se define usando tecnologa bipolar con colector abierto o con transceivers asimtricos de lgica negativa, terminacin activa o pasiva y transcievers con bus diferencial basados en la EIA485 permitida para SCSI-2. Los conectores usados son: para tipo A, interno de baja densidad con 50 pines, externo de baja densidad tipo Centronics y el externo de alta densidad con 50 pines, llamado conector SCSi-2. Los conectores B para bus wide (de 16 bits) resultaron imprcticos ya que requeran un conector de 68 pines de alta densidad. Este estndar fue considerado poco factible debido a la estructura de sus comandos y a su interface elctrica, finalmente termin adoptndose hasta 1994. SCSI - 3 Es un estndar que cambi en toda su estructura, ahora cubre las capaz fsicas y los protocolos bsicos especficos para cada interface, la capa de comandos primarios (SPC) y la capa del protocolo especfico. Esta capa del protocolo especfico contiene, dentro del bloque de comandos (SBC), los comandos para interface con disco duro, el flujo de comandos para unidades de cinta (SSC), comandos del controlador para arreglos RAID (SCC), Comandos de multimedia (MMC) e incluye comandos de servicio (SES), etc.; todo esto da como resultado un modelo con estructura global (SAM). Interface paralela SCSI (SPI)

Este estndar define las conexiones elctricas y seales del bus paralelo, su conjunto de comandos queda definido por el protocolo SPI (SCSI Interlock Protocol), el cual define el conector P de 68 pines de alta densidad para wide bus en un mismo cable y a ste se le refiere como conector SCSI-3. El estndar SPI incluye velocidades hasta de FAST SCSI (las velocidades del Wide Fast SCSI son de 20Mbytes/sec), las interfaces elctricas son definidas en trminos de tecnologa CMOS con terminacin a los 0.2 Volts en vez de los 0.5. El cable A se le llama SCSI-2, pero no se le incluye en la SPI (Este estndar se adopta en 1995, pero se vuelve obsoleto para julio de 1999, pasando al SPI-2). Fast - 20 Este estndar se le conoce como Ultra-SCSI y duplica la velocidad del SPI a los 20 Megatransfers/Sec, y a los 40 MB/Sec en wide bus. No es un estndar completo solo incluye la seccin requerida para el Fast-20, las dems secciones usan el SPI (se adopta en 1996 y se vuelve obsoleto para 1999, pasando al SPI-2). SPI - 2 Conocido como Ultra2-SCSI, duplica nuevamente la velocidad a FAST-40, 40 Megatransfers/Sec o a 80 Mbytes/Sec en wide bus, usando una nueva interface elctrica, de bajo voltage diferencial llamada LVD SCSI. Para velocidades arriba de Fast SCSI no se puede ser asimtrica, Este estndar incluye el SIP, con conector VHDCI de 68 pines y el conector SCA-2 (Single Connector Attachement), tambin se incluyen los conectores SCSI-2 A y SPI P. Este estndar es un documento completo que no hace referencias a estndares anteriores, solo una para todas las interfaces paralelas con velocidades de hasta Fast-40 (se adopt en 1999 y reemplaz los SPI, SIP y Fast-20). SPI - 3 Nuevamente, este estndar dobla la velocidad a Fast-80DT, conocida como Ultra3 SCSI o Ultra 160 con 80 Megatransfers/Sec o 160 Mbytes/Sec en wide bus. Con este estndar se dieron muchos cambios; Fast-80DT es el nico wide bus, vuelve obsoletos los HVD SCSI y el bus de datos de 32 bits con cable Q. Adems, define: temporizacin para LVD SCSI en los flancos de subida y bajada de la seal de relog de REQ/ACK, Doble transicin (DT) en wide bus, verificacin por ciclo redundante (CRC), validacin de dominio en SDV-TR, empaquetado de mensajes y comandos, y Quick arbitration. Este estndar es un documento que no hace referencia a ningn otro anterior y solo una referencia para toda interface paralela con velocidad de hasta Fast-80DT. Hace obsoletos los HVD, SCAM y el bus de datos de 32 bits. SPI - 4 En ste nuevamente se duplica la velocidad a Fast-160DT, se le conoce como Ultra-320 SCSI-160 Megatransfers/Sec y 320 Mbytes/Sec solo en wide bus.

EPI (Enhanced Parallel Interface) Su reporte tcnico describe como disear sistemas SCSI, las longitudes da cables y cargas son definidas por los parmetros elctricos donde se permite tomar ventaja de menores cargas y cables que soportan mayores velocidades de transferencia. Este reporte tcnico describe como trabajar dispositivos de 68 pines (wide) y de 50 (narrow) en el mismo sistema. El EPI incluye documentacin sobre "Expanders", Bridging expanders, switches y conectores comunes los cuales no estn documentados en el estndar. Referencia Rpida para Cables SCSI-1 Cable externo A es el de conector Centronics de 50 pines (C50M) con espaciado de 85 mil o 2.16 mm SCS-2 Cable externo A es el de conector de alta densidad con 50 pines (MiniD50M) con espaciado de 50 mil o 1.27 mm SCSI-3 Cable externo P es el de conector de alta densidad de 68 pines (MiniD68M) con espaciado de 50 mil o 1.27 mm SCSI SPI-2 cable externo P de muy alta densidad (VHDCI), incorrectamente llamado SCSI-4 o 5, es el de conector de 68 pines VHDCI (0.8mm o 68mil) (Nota: Los SCSI-4 y 5 no son estndares, el SCSI-3 se subdividi en documentos separados.) SCSI-1, SCSI-2 cable externo A es el de cable plano con conector de 50 pines con espaciado de 100 mil o 2.54 mm SCSI-3 cable externo P es el de cable plano de alta densidad con conector de 68 pines con espaciado de 50 mil o 1.27 mm Observa si el conector de tu interface SCSI es de 50 pines; en cuyo caso se trata de un sistema narrow, o si el conector es de 68 pines; entonces es un wide.

Para determinar si tu interface es diferencial o asimtrica necesitars un multmetro. Desconecta el cable de tu interface (Antes de DESCONECTAR el cable SCSI siempre APAGA tu computadora y dispositivos SCSI) y mide la resistencia entre los pines 2 y 24 si el conector es de 50 pines de alta densidad o centronics, entre los pines 2 y 33 si el conector es de 68 pines o entre los pines 3 y 49 si el conector es DB50. SI la medicin es de unos cuantos dcimos de Ohm o menos entonces tienes una interface asimtrica, si la medicin es poco menos de 1 Ohm (o 1 Ohm inclusive) entonces tu interface es diferencial. Conectores SCSI

Host or Host Adapter Connector Most SCSI SLOW (5 Mbyte/sec) computers and host adapters use the Centronicstype 50-pin connector. Also some 8bit Fast computers and host adapters. Old Sun and DG Computers Many 8-bit SCSI FAST (Hasta 10 Mbytes/sec) computers and host adapters use this 50-pin HighDensity connector. Apple/Mac and some older Sun 8bit workstations . All FAST/WIDE (16-bit)

SCSI-3 computers and host adapters plus old DEC single-ended SCSI use this 68-pin High Density connector. Standard connection for systems using hot swappable drives. SCA interface drives connect to a SCSI backplane that provides power, configuratio n settings such as SCSI ID, and termination of the SCSI bus Si requieres informacin adicional o quieres saber si tu interface es LVD (Low Voltage Differential) lee al FAQ de Paralan, su glosario de trminos sobre SCSI es muy bueno. Te recomiendo que tambin visites la pgina de Adaptec (por supuesto que todo est en ingls)

The Low Byte is sometimes called the Low Data Byte.

The High Byte is sometimes called the High Data Byte.

El presente trabajo es una compilacin de informacin de diferentes fuentes, as que no me interesa ganar dinero de esto y el nico objetivo es DIVULGAR INFORMACIN CONFIABLE EN NUESTRO PROPIO IDEOMA

Introduccin
SCSI inici con un bus narrow (conector de 50 pines) transfiriendo un byte a la vez y creci a un bus wide (conector de 68 u 80 pines) transfiriendo 2 bytes a la vez en SCSI-3 SPI. En SPI-2 se agreg el LVD SCSI permitiendo transferencias a alta velocidad con un plan de crecimiento. El SCSI est siguiendo bsicamente las reglas de las Leyes de Moore; duplica su rendimiento con cada generacin. SPI-3 agreg un SCSI empaquetado con lo que se redujeron los excesos en el protocolo. El conector SCA-2 de 80 pines integr las seales de configuracin y alimentacin para dispositivos hot pluggin que se conectan a backplane. Estos dispositivos solo deben ser usados en sistemas con backplane. Las siete generaciones SCSI (ver tabla arriba) pueden correr en el mismo bus lgico, solo se requiere aislar el bus LVD SCSI de alta velocidad del bus lento SE o del segmento de bus HVD. Las interfaces SCSI ofrecen diferentes maneras de mejorar la conexin entre los dispositivos y los arreglos SCSI como las cajas SCSI RAID (Redundant array of independent disks) o las JBODs (Just a box of Disks). Para SCSI RAID se utiliza el protocolo Fibre channel (usa comunicacin serial por twisted pair, coaxial y fibra ptica)

Estndares SCSI y tipos de conexiones


SCSI - 1 Es un estndar obsoleto, creado a mediados de los 80s. Usaba un bus de 8 bits con drivers de colector abierto single-ended (asimtricos), con los cuales se realizaban transferencias asncronas de datos y comandos. Los drivers (y receptores) fueron fabricados con tecnologa bipolar con lo cual la mayor consideracin se pone al Bus de DC y la terminacin pasiva. Utiliza conectores internos y externos de baja densidad con 50 pines, al conector externo de baja densidad se le conoce como conector Centronics o conector SCSI-1. SCSI - 2 Es un estndar completo que define las capas fsica y de protocolo, el cual utiliza transferencias asncronas de comandos y transferencias sncronas de datos; a velocidades de 20 Megatransferencias / segundo, es decir 10 Mbytes/sec. El SCSI-2 se define usando tecnologa bipolar con colector abierto o con transceivers asimtricos de lgica negativa, terminacin activa o pasiva y transcievers con bus diferencial basados en la EIA485 permitida para SCSI-2. Los conectores usados son: para tipo A, interno de baja densidad con 50 pines, externo de baja densidad tipo Centronics y el externo de alta densidad con 50 pines, llamado conector SCSi-2. Los conectores B para bus wide (de 16 bits) resultaron imprcticos ya que requeran un conector de 68 pines de alta densidad. Este estndar fue considerado poco factible debido a la estructura de sus comandos y a su interface elctrica, finalmente termin adoptndose hasta 1994. SCSI - 3 Es un estndar que cambi en toda su estructura, ahora cubre las capaz fsicas y los protocolos bsicos especficos para cada interface, la capa de comandos primarios (SPC) y la capa del protocolo especfico. Esta capa del protocolo especfico contiene, dentro del bloque de comandos (SBC), los comandos para interface con disco duro, el flujo de comandos para unidades de cinta (SSC), comandos del controlador para arreglos RAID (SCC), Comandos de multimedia (MMC) e incluye comandos de servicio (SES), etc.; todo esto da como resultado un modelo con estructura global (SAM). Interface paralela SCSI (SPI)

Este estndar define las conexiones elctricas y seales del bus paralelo, su conjunto de comandos queda definido por el protocolo SPI (SCSI Interlock Protocol), el cual define el conector P de 68 pines de alta densidad para wide bus en un mismo cable y a ste se le refiere como conector SCSI-3. El estndar SPI incluye velocidades hasta de FAST SCSI (las velocidades del Wide Fast SCSI son de 20Mbytes/sec), las interfaces elctricas son definidas en trminos de tecnologa CMOS con terminacin a los 0.2 Volts en vez de los 0.5. El cable A se le llama SCSI-2, pero no se le incluye en la SPI (Este estndar se adopta en 1995, pero se vuelve obsoleto para julio de 1999, pasando al SPI-2). Fast - 20 Este estndar se le conoce como Ultra-SCSI y duplica la velocidad del SPI a los 20 Megatransfers/Sec, y a los 40 MB/Sec en wide bus. No es un estndar completo solo incluye la seccin requerida para el Fast-20, las dems secciones usan el SPI (se adopta en 1996 y se vuelve obsoleto para 1999, pasando al SPI2). SPI - 2 Conocido como Ultra2-SCSI, duplica nuevamente la velocidad a FAST-40, 40 Megatransfers/Sec o a 80 Mbytes/Sec en wide bus, usando una nueva interface elctrica, de bajo voltage diferencial llamada LVD SCSI. Para velocidades arriba de Fast SCSI no se puede ser asimtrica, Este estndar incluye el SIP, con conector VHDCI de 68 pines y el conector SCA-2 (Single Connector Attachement), tambin se incluyen los conectores SCSI-2 A y SPI P. Este estndar es un documento completo que no hace referencias a estndares anteriores, solo una para todas las interfaces paralelas con velocidades de hasta Fast-40 (se adopt en 1999 y reemplaz los SPI, SIP y Fast-20). SPI - 3 Nuevamente, este estndar dobla la velocidad a Fast-80DT, conocida como Ultra3 SCSI o Ultra 160 con 80 Megatransfers/Sec o 160 Mbytes/Sec en wide bus. Con este estndar se dieron muchos cambios; Fast-80DT es el nico wide bus, vuelve obsoletos los HVD SCSI y el bus de datos de 32 bits con cable Q. Adems, define: temporizacin para LVD SCSI en los flancos de

subida y bajada de la seal de relog de REQ/ACK, Doble transicin (DT) en wide bus, verificacin por ciclo redundante (CRC), validacin de dominio en SDV-TR, empaquetado de mensajes y comandos, y Quick arbitration. Este estndar es un documento que no hace referencia a ningn otro anterior y solo una referencia para toda interface paralela con velocidad de hasta Fast-80DT. Hace obsoletos los HVD, SCAM y el bus de datos de 32 bits. SPI - 4 En ste nuevamente se duplica la velocidad a Fast-160DT, se le conoce como Ultra-320 SCSI-160 Megatransfers/Sec y 320 Mbytes/Sec solo en wide bus. EPI (Enhanced Parallel Interface) Su reporte tcnico describe como disear sistemas SCSI, las longitudes da cables y cargas son definidas por los parmetros elctricos donde se permite tomar ventaja de menores cargas y cables que soportan mayores velocidades de transferencia. Este reporte tcnico describe como trabajar dispositivos de 68 pines (wide) y de 50 (narrow) en el mismo sistema. El EPI incluye documentacin sobre "Expanders", Bridging expanders, switches y conectores comunes los cuales no estn documentados en el estndar. Referencia Rpida para Cables SCSI-1 Cable externo A es el de conector Centronics de 50 pines (C50M) con espaciado de 85 mil o 2.16 mm SCS-2 Cable externo A es el de conector de alta densidad con 50 pines (MiniD50M) con espaciado de 50 mil o 1.27 mm SCSI-3 Cable externo P es el de conector de alta densidad de 68 pines (MiniD68M) con espaciado de 50 mil o 1.27 mm SCSI SPI-2 cable externo P de muy alta densidad (VHDCI), incorrectamente llamado SCSI-4 o 5, es el de conector de 68 pines VHDCI (0.8mm o 68mil) (Nota: Los SCSI-4 y 5 no son estndares, el SCSI-3 se subdividi en documentos separados.) SCSI-1, SCSI-2 cable externo A es el de cable plano con conector de 50 pines con espaciado de 100 mil o 2.54 mm

SCSI-3 cable externo P es el de cable plano de alta densidad con conector de 68 pines con espaciado de 50 mil o 1.27 mm

Qu tipo de Interface tengo?


Lo ms importante es determinar si se trata de una interface diferencial (HVD) o asimtrica (Single-ended) y se es de 16 bits (wide) o de 8 bits (narrow). Solo sigue estos pasos: Observa si el conector de tu interface SCSI es de 50 pines; en cuyo caso se trata de un sistema narrow, o si el conector es de 68 pines; entonces es un wide. Para determinar si tu interface es diferencial o asimtrica necesitars un multmetro. Desconecta el cable de tu interface (Antes de DESCONECTAR el cable SCSI siempre APAGA tu computadora y dispositivos SCSI) y mide la resistencia entre los pines 2 y 24 si el conector es de 50 pines de alta densidad o centronics, entre los pines 2 y 33 si el conector es de 68 pines o entre los pines 3 y 49 si el conector es DB50. SI la medicin es de unos cuantos dcimos de Ohm o menos entonces tienes una interface asimtrica, si la medicin es poco menos de 1 Ohm (o 1 Ohm inclusive) entonces tu interface es diferencial.

Conectores SCSI

Host or Host Adapter

Connector Most SCSI SLOW (5 Mbyte/sec) computers and host adapters use the Centronics-type 50-pin connector. Also some 8-bit Fast computers and host adapters.

Old Sun and DG Computers

Many 8-bit SCSI FAST (Hasta 10 Mbytes/sec) computers and host adapters use this 50-pin HighDensity connector. Apple/Mac and some older Sun 8bit workstations. All FAST/WIDE (16-bit) SCSI-3 computers and host adapters plus old DEC single-ended SCSI use this 68-pin High Density connector.
Standard connection for systems using hot swappable drives. SCA interface drives connect to a SCSI backplane that provides power, configuration settings such as SCSI ID, and termination of the SCSI bus

Si requieres informacin adicional o quieres saber si tu interface es LVD (Low Voltage Differential) lee al FAQ de Paralan, su glosario de trminos sobre SCSI es muy bueno. Te recomiendo que tambin visites la pgina de Adaptec (por supuesto que todo est en ingls)

The Low Byte is sometimes called the Low Data Byte.

The High Byte is sometimes called the High Data Byte.

El presente trabajo es una compilacin de informacin de diferentes fuentes, as que no me interesa ganar dinero de esto y el nico objetivo es DIVULGAR INFORMACIN CONFIABLE EN NUESTRO PROPIO IDEOMA Definicin de tarjeta controladora SCSI Es una tarjeta para expansin de capacidades que permite la conexin de varios tipos de dispositivos internos SCSI ("Small Computer System Interface"), esto es principalmente discos duros y puertos. La tarjeta controladora se inserta dentro de las ranuras de expansin "Slots" integradas en la tarjeta principal ("Motherboard") y se atornilla al gabinete para evitar movimientos y por ende fallas. Este tipo de tarjetas integran uno varios puertos para conectar los dispositivos externos tales como unidades lectoras de CD-ROM, escneres y algunos tipos de impresoras entre otros. Actualmente se utilizan para la adaptacin del estndar SCSI en las tarjetas principales (Motherborad) que carezcan de este tipo de conectividad.

Figura 1. Tarjeta controladora SCSI, marca Adaptec, modelo 3892B365, con conector SCSI 68 terminales externo y 60 terminales interno.

Caractersticas generales de la tarjeta controladora SCSI + Se utilizan en tarjetas principales para poder adaptar la tecnologa de discos duros y puertos SCSI a una tarjeta con tecnologa de conectores IDE. + Cuentan con un conector especial que permite insertarlas en las ranuras de expansin de la tarjeta principal. + Estos dispositivos son muy utilizados para grandes servidores de grandes empresas principalmente. + Existen tarjetas principales con conectores SCSI integrados, por lo que se puede prescindir de la controladora.

Dispositivos internos que puede manejar la tarjeta controladora SCSI + Dispositivos de almacenamiento magntico: principalmente discos duros y algunos tipos de unidades pticas lectoras de CD-ROM.

Figura 2. Disco duro interno SCSI de 3.5", interno para computadora de escritorio, marca Maxtor 68 Pines, capacidad 36 GB,

Partes que componen la tarjeta controladora SCSI Los componentes son visibles, ya que no cuenta con cubierta protectora; son bsicamente los siguientes:

1.- Panel de conector SCSI: tienen la funcin de interconectar los discos duros y unidades pticas tipo SCSI con la tarjeta principal ("Motherboard"). 2.- Tarjeta: es la placa plstica sobre la cul se encuentran montados todos los chips y circuitos. 3.- Conector para la ranura: es el encargado de transmitir datos entre los puertos de la tarjeta y la tarjeta principal ("Motherboard"). 4.- Placa de sujecin: es metlica y permite soportar los puertos as como la sujecin hacia el chasis del gabinete. 5.- Puerto: permite la conexin de dispositivos externos SCSI con la tarjeta y su respectiva comunicacin con la tarjeta principal ("Motherboard"). Figura 3. Esquema de partes de la tarjeta controladora SCSI. Partes de la tarjeta controladora IDE y sus partes.

Tipos de conectores para las ranuras Se muestran los conectores comenzando con los mas recientes y su respectiva ranura de expansin, hasta los mas antiguos. - PCI ("Peripheral Components Interconect"): integra una capacidad de datos de 32 bits y 64 bits para el microprocesador Intel Pentium, tiene una velocidad de transferencia de hasta 125.88 Megabytes/s (MB/s) a 503.54 MB/s respectivamente, cuentan con una velocidad interna de trabajo de 33 MHz para 32 bits y 66 MHz para 64 bits. - ISA-16 ("Industry Standard Architecture - 16"): maneja datos a 16 bits, tienen una velocidad de transferencia de hasta 20 Megabytes/s (MB/s), cuentan con una velocidad interna de trabajo de 4.77 MHz, 6 Mhz, 8 MHz y 10 MHz. - ISA-8 ("Industry Standard Architecture - 8"): maneja datos a 8 bits, tiene una velocidad de transferencia de hasta 20 Megabytes/s (MB/s) y cuentan con una velocidad interna de trabajo de 4.77 MHz, 6 Mhz, 8 MHz y 10 MHz. Conect or Descripci n Conector de la tarjeta y su respectiv a ranura Conector de la tarjeta y su respectiv a ranura Imagen

PCI

ISA 16

ISA 8

Conector de la tarjeta y su respectiv a ranura

Puertos que puede manejar la tarjeta controladora SCSI Hay varios tipos de puertos y estndares SCSI, se muestra 1 de los mas comunes: Nombre del puerto SCSI 68

Usos Para conectar unidades lectoras de cintas, impresoras y escneres.

Esquema

Versiones del estndar SCSI para tarjetas y dispositivos + SCSI-I: cuenta con una velocidad de transferencia de datos de 5 MB/s, cuenta con un conector de 50 pines para los dispositivos y soporta 7 de ellos. + SCSI-II: cuenta con una velocidad de transferencia de datos de 10 MB/s, cuenta con un conector de 50 pines para los dispositivos y soporta 7 de ellos. + UltraSCSI SCSI III: cuenta con una velocidad de transferencia de datos de 20 MB/s, cuenta con un conector de 50 pines y alta densidad para los dispositivos y soporta 7 de ellos. + Ultra WideSCSI: cuenta con una velocidad de transferencia de datos de 40 MB/s, cuenta con un conector de 68 pines y alta densidad para los dispositivos y soporta 15 de ellos. + Ultra 2 SCSI: cuenta con una velocidad de transferencia de datos de 80 MB/s, cuenta con un conector de 68 pines y alta densidad para los dispositivos y soporta 15 de ellos.

Usos especficos de la tarjeta controladora SCSI Se usa en los siguientes casos: a) Para utilizar tecnologa SCSI en una tarjeta principal con conectores IDE. b) Si se necesita alta velocidad de transmisin de datos entre el disco duro y el resto del sistema.

c) Si las caractersticas de la placa no tienen la capacidad requerida por el usuario.

6.3.1 Interfaz SCSI: Aspectos fsicos


1 Sinopsis

Con objeto de que el lector pueda tener una visin lo ms cercana posible al hardware que se encontrar cuando tenga que habrselas con un dispositivo SCSI, comentamos a continuacin algunas de las caractersticas fsicas ms sobresalientes de estos dispositivos.
2 Cables

Una caracterstica especial de esta interfaz, que la distingue de otras. Por ejemplo, ATA/IDE, es que los dispositivos pueden estar dentro del equipo (en la misma caja que la placa-base) o fuera, como dispositivos externos (esta caracterstica ha sido copiada por la interfaz Serial-ATA). En uno y otro caso se suelen utilizar cables de tipo distinto. Los dispositivos internos se conectan a un bus de cable plano. Este cable suele terminar en un conector en la parte posterior del equipo en el que se puede conectar una prolongacin externa. El conductor correspondiente al pin 1 del conector suelen estar pintado de rojo. Los cables externos son redondos y apantallados, formados por 25 o 34 pares trenzados y organizados en capas. Situando al interior los que transmiten seales de mayor velocidad (REQ y ACK); las lneas de control en una capa intermedia, y las de datos en la capa exterior. Ls pginas adjuntas muestran las disposiciones de pares y asignacin de pines en cables externos de 68 y 50 conductores respectivamente ( SE/HDV68 SE/HDV-50). Nota: La pantalla debe ser conectada a la carcasa del conector, pero no a las lneas de tierra de las seales SCSI.

3 Extensores

Las distintas tecnologa y tipos de cables empleados (medios fsicos de transporte), hacen que en ocasiones, sea necesario conectar dispositivos de distinto tipo. Tambin puede presentarse la necesidad de ampliar la distancia de ciertos dispositivos externos sobre la mxima permitida. Para resolver el problema se utilizan dispositivos especiales denominados extensores ("expanders"); regeneradores (de seal), y convertidores, que pueden realizar distintas funciones. El esquema de utilizacin se muestra en las figuras adjuntas [1]. Disponen de su propia fuente de alimentacin para los circuitos convertidores & amplificadores de seal.
4 Terminadores de BUS

Como muchos otros buses (por ejemplo Ethernet de cable coaxial), los buses SCSI requieren de ciertos adaptadores de impedancia en sus extremos, que mitiguen o anulen la capacidad de reflexin de las seales que se origina en los dispositivos de transmisin (especialmente en los de alta frecuencia). En el bus SCSI, los terminadores pueden ser de varios tipos:

Terminador pasivo (resistencias). Es la forma ms simple y econmica. Consiste en dos resistencias por lnea: una de 220 Ohms entre TERMPWR y la seal, y otro de 330 Ohms entre la lnea de seal y tierra. Es la solucin ms econmica, pero con el inconveniente de que las fluctuaciones en la tensin de TERMPWR (Term Power), producen elevaciones de tensin en las seales, lo que puede producir errores. La norma SCSI-2 recomienda terminadores activos siempre que sea posible para los sistemas SE. Por su parte la tecnologa HVD utiliza exclusivamente es te tipo de terminador. Terminador activo. Para evitar los inconvenientes de las fluctuaciones en la tensin TERMPWR del sistema pasivo, se utilizan reguladores de tensin que las minimizan. En este caso se utiliza una sola resistencia de 110 Ohms desde el regulador a la lnea de seal, lo que es ms parecido a la impedancia del cable SCSI. El resultado son menores reflexiones, mayor estabilidad de la seal y menor tasa de errores. FTP ("Force Perfect Termination"). En realidad este sistema no est reconocido en las especificaciones SCSI, aunque es la solucin adoptada por diversos fabricantes. Existen diversos diseos todos ellos basados en diodos derivadores que intentan compensar las diferencias de impedancia entre el cable SCSI y el dispositivo. Terminador LVD. Una tipo de terminador activo diseado especficamente para los buses LVD. Est recogido en las especificaciones SPI-2 y SPI-3 ( 6.3).

Terminador LVD/MSE. Es una variedad multimomdo del anterior. Dependiendo de la tensin existente en la seal DIFFSENSE del cable, estos serminadores se configuran como LVD o SE. La mayora de los nuevos diseos incluyen este tipo de terminador.

El tipo de terminador depende del tipo de bus SCSI utilizado. Por lo general los terminadores pasivos son adecuados para distancias cortas y buses lentos y lentos (8 bits y 5 MHz). Para distancias largas, que suelen presentarse en dispositivos externos y velocidades altas se recomiendan los activos. Nota: Los buses SCSI son muy sensibles a la calidad de los cables y a su correcta terminacin, por lo que debe prestarse especial atencin a estos elementos (incluyendo los conectores), en especial en equipos de altas prestaciones. Recuerde que la primera causa de problemas en sistemas SCSI se deriva de una inadecuada terminacin del bus. Los terminadores son obligatorios en ambos extremos (fsicos) del bus. Por lo general, tanto el adaptador host, como el resto de dispositivos SCSI disponen de un terminador integrado (auto-terminacin), que puede ser activado y desactivado. En el caso de que el dispositivo sea uno de los extremos del bus, el auto-terminador debe ser activado (es lo que suele ocurrir cuando el dispositivo es el propio controlador host). Si por el contrario, no es el elemento terminal, debe desactivarse. En caso que el ltimo dispositivo no disponga de esta caracterstica de auto-terminacin, debe emplearse un mdulo terminador externo en el extremo correspondiente del bus.
5 Conectores SCSI

Para la conexin de los dispositivos al bus SCSI, se utilizan diversos tipos de conectores, algunos de los cuales se muestran en las figuras, donde puede apreciarse la gran variedad utilizada. En la mayora de los casos se muestran ambos conectores, macho (M) y hembra (F). Esta ltima, montada generalmente en el lado del dispositivo, mientras que el macho suele estar en el lado del cable. Ejemplo Tipo IDC50M 50 IDC50F HD68M 68 HD68F Pin es Uso Narro w: SCSI1 y 2, Ultra SCSI Ultra2 LVD y Ultra Wide Cometario Interno 8 bit

Interno/Externo. aproximadamente 1 7/8" de ancho (47 mm)

CN50M

SCSI3 SCSI1y SCSI2 50

Externo. Denominado tambin Centronics C50. Utilizado por la mayora de los adaptadores lentos (5 MB/s) y por algunos rpidos (10 MB/s). Externo. Aproximadament e 1 3/8" (35 mm) de ancho. Adaptado res de 50 pines de alta densidad utilizados por muchos dispositivos FAST SCSI de 8 bits. Externo.

CN50F

HD50M

SCSI2y SCSI3 50

HD50F

DB25M

SCSI1

25 DB25F

Utilizado por antiguos Macs, dispositivos Zip, escaners y antiguas estaciones de trabajo SUN. Externo Apple PowerBooks

HDI30M

30

DB50M 50 DB50F DB37M DB37F VHDCI -M 68

SCSI1

Utilizados en las antiguas estaciones Sparc de Sun y Data General

37

SCSI1

Ultra SCSI 2y3

"Very HighDensity Connector Interface". Popular en las tarjetas RAID. El macho es de 0.8 mm Utilizado en cmaras digitales en Japon Utilizado en los antiguos sistemas rs6000 de IBM

VHDCI -F

HPCN5 0

50

HDCN 60
6 Jumpers de configuracin SCSI

60

Los controladores de los discos SCSI son ms sofisticados que los IDE/ATA, y en consecuencia, suelen disponer de ms ajustes ("jumpers") de control. Adems, en lo que se refiere al tipo y nmero de jumpers utilizados, tienden a variar mucho entre los distintos fabricantes y modelos . Los ms importantes y frecuentes son los que se citan a continuacin. Aunque debemos advertir que algunas unidades SCSI tienen caractersticas especiales que se controlan mediante jumpers adicionales, y que algunas otras los han sustituido por comandos software que son enviados mediante el adaptador host. Es frecuente que los jumpers de estas unidades estn agrupados en lo que se denomina el bloque de opciones ("option block").

Identificacin de unidad (SCSI Device ID): Se refiere a los jumpers que configuran el nmero de unidad dentro de la cadena SCSI (recuerde que cada

unidad debe disponer de un nmero de identificacin nico 6.3). Las unidades SCSI de conector estrecho pueden tener un conjunto de 3 jumpers, con lo que puede asignrseles un nmero de 0 a 7, mientras que las anchas tienen 4, con lo que la seleccin puede variar entre 0 y 15 (algunas unidades no utilizan jumpers para configurar la identificacin del dispositivo). Activador del terminador (Termination Activate): Algunas unidades incluyen un terminador de bus que puede ser activado si la unidad es la ltima de la cadena SCSI ( 6.3). Este jumper activa o desactiva dicho terminador interno. No todas las unidades disponen de esta opcin de auto-terminacin. Desactivar autor-arranque (Disable Auto Start): Esta opcin avisa a la unidad para no arrancar en el mismo instante en que se conecta la energa, sino esperar a una orden de arranque desde el bus SCSI. Es una medida que se utiliza para evitar un excesivo consumo de energa en el arranque. Algunos fabricantes han invertido el sentido de este jumper. Por defecto sus unidades no arrancan automticamente, sino que permanecen a la espera de la seal del bus; en este caso la instalacin del jumper habilita el arranque automtico. Retardar auto-arranque (Delay Auto Start): En este caso el jumper indica al dispositivo que arranque de forma automtica pero no de forma inmediata, sino despus de cierto nmero de segundos despus que se ha establecido el suministro de energa. Su utilidad es tambin disminuir el consumo total en el arranque cuando se instalan sistemas con muchas unidades (discos duros) SCSI. Rotacin escalonada (Stagger Spin): Es una versin mejorada de la anterior (arranque retardado). Cuando se instala esta opcin en un sistema con muchos dispositivos SCSI, cada unidad retarda su arranque un tiempo que se calcula multiplicando su nmero de identificacin por una constante. Esto garantiza que en ningn caso habr dos unidades que arranquen simultneamente. Ancho/Estrecho (Narrow/Wide): Algunas unidades disponen de un jumper que controla su modo de funcionamiento ancho o estrecho. Forzar SE (Force SE): Esta opcin permite que las nuevas unidades Ultra2, Wide Ultra2, Ultra160, Ultra160+ o cualquier otro dispositivo que utilice tecnologa de bus LVD ("Low voltage differential") sea forzado a utilizar la tecnologa Terminacin Simple SE ("Single Ended") [2]. Desactivar paridad (Disable parity): Esta opcin desactiva el control de paridad en el bus SCSI. Se utiliza para garantizar la compatibilidad de las nuevas unidades con los controladores antiguos que no implementaban este control.

La figura muestr a el esque ma del "Bloqu e de opcion es" de una unidad de disco duro SCSI Quantu m Atlas 10K.

A continuacin se incluyen algunas especificaciones de montaje relativas a otra unidad SCSI. En este caso es un disco Seagate ST12400N.

SEAGATE TECHNOLOGY, INC. ST-12400N SCSI-2 Fast (Hawk 2) /-----------\ | REAR VIEW | \-----------/ (ST-12400N only)

(C)opyright 1993

50 pin I/O Cable Connection | J1/------------------------1\ /---------\ -|:::::::::::::::::::::::::|-| 0 0 0 0 |-\-------------------------/ \-5-G-G-12/

TOP (HDA) BOTTOM

/-----------------\ | RIGHT SIDE VIEW | \-----------------/ BACK /-\ J2

(Both ST-12400N and ST-12400NC)

12345678

TOP (HDA)

FRONT

OF DRIVE

J1|----------------------P-W-A----------------------- OF \-/ :::::::: BOTTOM DRIVE |||||||| |Terminator Power /||||||\ Reserved /|Terminator Power -/||||\- Start Delay (12 secs * ID) | Enable T-Res --/||\-- Motor Start | Parity Enable ---/\--- Write Protect | | | /--------------------------------\ \-| Termination Power-source Table | |----------------------------------------------\ |-----....-----....-----PWA edge----| | | | 1 2 1 2 1 2 | | /-\ /-\ /---\ A Drive Supplies Bus | | |o|o o|o| \o-o/ B Drive Supplies Own | | \o/o o\o/ o o C Bus Supplies Drive | | A B C | \---------Default------------------------------/ /----------------\ | LEFT SIDE VIEW | \----------------/

(ST-12400N only) If these ID jumpers are used, then ID jumpers shown in front view ARE NOT USED.

FRONT TOP (HDA) J5 /--1\ /-\BACK OF --------P-W-A-------------------------------|:::|-|J1 OF DRIVE BOTTOM \---/ \-/DRIVE ||| ID 1 -/|\- ID 4 ID 2 /------------\ | FRONT VIEW | \------------/

(Both ST-12400N and ST-12400NC)

TOP (HDA) J6 /-----1\ --P-W-A--------------------------|::::::|* BOTTOM \------/ | 123456 LED -/ |||||| ID 4 /||||\ Reserved ID 2 -/||\- Remote LED (pin-3 +5v) ID 1 --/\-- Spindle Synchronization (pin-6 REF SIG+, default If these ID jumper are used, then jumper installed) ID jumpers shown in left side view J5 or 80 pin I/O cable ARE NOT USED. ST-12400N Hawk 2

UNFORMATTED CAPACITY (MB) ________________2537 FORMATTED CAPACITY (xx SECTORS) (MB) _____2148 AVERAGE SECTORS PER TRACK ________________83 rounded down ACTUATOR TYPE ____________________________ROTARY VOICE COIL TRACKS ___________________________________49,799 CYLINDERS ________________________________2,621 user HEADS ______PHYSICAL______________________19 DISCS (3.5 in) ___________________________10 MEDIA TYPE _______________________________THIN FILM RECORDING METHOD _________________________ZBR RLL (1,7) INTERNAL TRANSFER RATE (mbits/sec)________26.8 to 45.6 EXTERNAL TRANSFER RATE (mbyte/sec) _______5 Async EXTERNAL TRANSFER RATE (mbyte/sec) _______10 Sync SPINDLE SPEED (RPM) ______________________5,411 AVERAGE LATENCY (mSEC) ___________________5.54 BUFFER ___________________________________256/1024 KByte Read Look-Ahead, Adaptive, Multi-Segmented Cache INTERFACE ________________________________SCSI-2 FAST ASA SECTORS PER DRIVE ________________________ TPI (TRACKS PER INCH) ____________________3000 AVERAGE ACCESS (ms) (read/write)__________9.0/10.5 Drive level without controller overhead SINGLE TRACK SEEK (ms) ___________________1 MAX FULL SEEK (ms) _______________________19 MTBF (power-on hours) ____________________500,000 SHOCK (G's): operating (Read/Write) __________10 nonoperating ____________________60 ACOUSTICS (typ/max dBA) __________________/ POWER REQUIREMENTS: +12V START-UP (amps) _2.0 +12V TYPICAL (amps) __0.54 +5V START-UP (amps) __0.8 +5V TYPICAL (amps) ___0.43 TYPICAL (watts) ______9 MAXIMUM (watts) ______ WRITE PRECOMP (cyl) ______________________N/A REDUCED WRITE CURRENT (cyl) ______________N/A LANDING ZONE (cyl) _______________________AUTO PARK IBM AT DRIVE TYPE ________________________0 or NONE Physical: Height (inches/mm): Width (inches/mm): Depth (inches/mm): Weight (lbs/kg): 1.63/41.4 4.00/101.6 5.75/146.1 2.5/0.99

Already low-level formatted at the factory with twelve spare sectors per cylinder and two spare cylinders/unit. ZBR = Zone Bit Recording = Variable sectors per track Seagate reserves the right to change, without notice, product offerings or specifications. (08/09/94)

6.3 La Interfaz SCSI 1 Antecedentes

La historia de la interfaz SCSI se remonta a 1979, cuando Shugart Associates, un fabricante de discos, buscaba una interfaz para sus futuras unidades. La intencin era conseguir una interfaz que soportara un direccionamiento lgico de bloques en lugar del sistema CHS, Cilindro, Cabeza y Sector ( 6.2) que se vena utilizando. Adems deba proporcionar una interfaz paralela de 8 bits en lugar de las seales analgicas serie que utilizaban por entonces las controladoras, as como una serie de comandos genricos en sustitucin de las lneas de control que acompaaban a las lneas de datos. La interfaz fue denominada SASI (Shugart Associates Systems Interface), y su especificacin inclua algunos comandos de 6 Bytes y una interfaz de terminacin sencilla. A finales de 1981, Shugart y NCR ("National Cash Register"), un fabricante de ordenadores, presentaron la especificacin al comit ANSI, que la acept como documento de trabajo bajo el nombre de SCSI ("Small Computer System Interface"), pronunciado scuzzi. En el periodo siguiente se le aadieron muchas mejoras importantes, incluyendo la capacidad de los dispositivos de competir por el uso del bus (arbitraje); desconectar y reconectar temporalmente del bus durante la ejecucin de comandos, y tener ms de un adaptador host en un bus SCSI. En 1984 se present al ANSI un borrador con la propuesta del estndar cuando ya existan en el mercado muchos de los nuevos dispositivos. El estndar fue aprobado en 1986 como SCSI-1.
2 La interfaz SCSI

En realidad SCSI es un tipo de bus; la interfaz SCSI, conocida tambin como adaptador host, adopta la forma de una tarjeta que se inserta en una ranura de la placa base, de la que sale un bus (cable), en el que se pueden conectar varios dispositivos. Este adaptador host es en realidad un puente entre el bus SCSI y el bus de la placa-base [5]. Desde el punto de vista del Sistema, los dispositivos SCSI son muy eficientes. Soportan comandos del tipo "Rebobina esta cinta" o "Formatea este disco" sin intervencin del procesador, con lo que se ahorra tiempo de proceso. Esto es especialmente importante en sistemas multitarea como Unix, Linux, OS/2, Novell Netware y los sistemas MS, a partir de Windows 95. El bus SCSI es muy flexible, y no solo permite conectar discos, tambin otros, perifricos, como escneres, unidades de cinta, CD-ROM, DVDs, Etc. Estos dispositivos integran la electrnica necesaria que los independiza del adaptador host, y permite que este ignore las caractersticas concretas de cada dispositivo conectado. Nota: Como puede verse, las "controladoras" SCSI estn embebidas en los propios dispositivos, sin embargo, en el lenguaje coloquial a veces nos referimos al adaptador host como la "controladora SCSI".

Como todo lo relativo a esta tecnologa tan cambiante (del hardware), la interfaz SCSI ha sufrido sucesivas implementaciones y mejoras: Existen variantes: SCSI-1, SCSI-2, SCSI3, Fast-SCSI, Wide-SCSI, Ultra-2 SCSI, Ultra 320 SCSI, Fiber Channel SCSI... Este interfaz es el que se considera mas profesional y de mayor rendimiento, por lo que se utiliza en equipos de altas prestaciones. Puede alcanzarse velocidades de 320 MB/s.
3 Anchura del bus SCSI

Existen dos anchuras de bus SCSI: Estrecho (de 8 bits) y ancho (de 16 bits). El primero fue el definido en el estndar SCSI-1. Por su parte, el bus ancho fue definido en el estndar SCSI-2. Este ltimo ha ido incrementando su popularidad desde su introduccin, ya que permite utilizar dispositivos de 16 bits y el doble de ancho de banda que el "estrecho" para cualquier frecuencia utilizada en el bus (ms detalles sobre los cables y otros detalles del hardware SCSI, en la pgina siguiente 6.3.1). El SCSI ancho requera utilizar un nuevo tipo de cable (denominado "B") de 68 pines en lugar del tradicional cable de 50 pines del bus estrecho denominado cable A. Pronto se vio que la utilizacin de dos tipos de cables era molesto y costoso, por lo que se defini un nuevo tipo de cable de 68 pines denominado "P". Nota: El cable muy ancho ("Very wide") de 32 bits, que requera dos cables de 68 conductores, fue definido en el estndar SCSI-2, aunque nunca fue aceptado por los fabricantes debido a su costo. Despus de cierto tiempo fue finalmente eliminado de la norma en SPI-3 [7]. La necesidad de prestaciones cada vez ms altas, especialmente para los discos duros, motiv el abandono del bus SCSI estrecho en favor del ancho, lo que ha generado algunos malentendidos en la terminologa. Tradicionalmente el bus estrecho era considerado el estndar (por defecto), y no se haca ninguna mencin a la palabra "Estrecho". Por ejemplo, decir Ultra SCSI implica operacin en bus estrecho; los buses anchos operando a velocidad Ultra fueron denominados Wide Ultra SCSI. Desde luego por el tiempo en que se cre el estndar Ultra2 SCSI, los buses estrechos comenzaban a perder popularidad, por lo que la mayora de las unidades Ultra2 son anchas, y mucha gente dej de decir explcitamente Wide Ultra2 SCSI, diciendo en su lugar Ultra2 SCSI, aunque la primera es la denominacin tcnicamente correcta.

Los mtodos de transferencia superiores a Ultra2 han acabado por eliminar completamente los buses estrechos. Los estndares SPI-3 y SPI-4 se refieren exclusivamente a implementaciones de bus ancho. Es posible mezclar dispositivos anchos y estrechos en el mismo bus, pero existen tres cuestiones que deben ser tenidas en cuenta: la anchura fsica del cable; el modo de operacin utilizado, SE, HVD o LVD y los terminadores. La primera puede resolverse mediante convertidores especiales que permiten pasar de un tipo de cable a otro (ver figura). La segunda se resuelve utilizando adaptadores host especialmente diseados para admitir ambos tipos de dispositivos, o mediante extensores adecuados ( 6.3.1).
4 La cadena SCSI; identificacin

El cable SCSI tipo A (estrecho) permite conectar hasta 8 dispositivos fsicos, recomendndose que su longitud no exceda de 3 metros [1]. Cada dispositivo de canal debe competir por el uso del bus, y se identifica por un nmero ID de identificacin (0/7) que se selecciona en la propia unidad y que determina adems su prioridad. El propio adaptador (host) se cuenta como un dispositivo, por lo que en realidad pueden conectarse 7 dispositivos por canal (cable). Los dispositivos de mayor ID tienen prioridad ms elevada. De forma que el 7 es el de prioridad ms alta. El cable tipo P (ancho) permite conectar hasta 16 dispositivos, numerados del 0 al 15. En este caso, las prioridades de los ID aadidos (8 al 15) aumenta progresivamente a partir del 8, aunque el 15 tiene menor prioridad que el 0. Como consecuencia, el orden de prioridades en orden creciente es como sigue: 8, 9, 10, 11, 12, 13, 14, 15, 0, 1, 2, 3, 4, 5, 6, 7 Generalmente pueden instalarse hasta cuatro adaptadores host por mquina; cada uno con hasta 7/14 dispositivos segn el tipo de cable. Adems existen adaptadores multicanal que disponen de varios cables. Como el adaptador host cuenta como un dispositivo, debe tener su propia ID, y es frecuente que venga seleccionado por defecto como 7 por el fabricante (la prioridad ms alta). La seleccin de la ID de cada unidad se realiza por jumpers (en binario, para lo que se necesitan 3 jumpers) o por una sencilla rueda o botn que hace que cambie el nmero asignado a la unidad [2]. Recuerde que la identificacin de cada unidad del bus no tiene ninguna relacin con su posicin fsica dentro del mismo. Nota: Tener en cuenta que algunos sistemas exigen que el disco de arranque est seleccionado con una ID especfica. En las antiguos adaptadores Adaptec [3] la ID del disco de arranque deba ser 0, en las modernas puede ser cualquiera. Actualmente existe una generacin de dispositivos SCSI dotados de tecnologa SCAM ("SCSI Configuted AutoMatically"), que permite que el nmero ID del dispositivo pueda

ser cambiado dinmicamente. Esta tecnologa permite que los adaptadores host puedan asignar los nmeros ID de los dispositivos conectados en el bus de forma automtica (una especie de Plug and Play), con lo que se evita la posibilidad de conflictos. Adems de lo anterior, la interfaz SCSI permite asignar un nmero de identificacin LUN ("Logical Unit Number") a cada unidad lgica definida dentro de cada unidad fsica. Con independencia de las limitaciones que pudiera imponer el SO, las unidades SCSI pueden contener hasta 15 particiones. Como consecuencia de lo anterior, la identificacin completa de una unidad SCSI comprende los siguientes parmetros:

Nmero de adaptador (pueden coexistir varios en el sistema) Nmero de canal (nmero de cable). Como se ha indicado, un adaptador puede ser multicanal y disponer de varios cables. Nmero de dispositivo (unidad fsica) ID dentro del canal. Hemos sealado que este nmero no depende de la posicin fsica dentro del cable, sino de una asignacin que puede efectuarse por hardware (tambin automticamente), y que la prioridad depende de este nmero. Nmero de particin lgica LUN dentro de cada unidad.

Como puede verse, esta interfaz permite una gran adaptabilidad y posibilidad de crecimiento. Como se ha dicho, los dispositivos SCSI integran en s mismos la lgica de control (en este sentido son anlogos a los dispositivos IDE). En realidad, un disco IDE y uno SCSI son idnticos, salvo que el SCSI tiene adems un adaptador para el bus incluido en la controladora, y no puede ser conectado directamente a la placa-base como el IDE; tiene que conectarse al bus SCSI.
5 Modos de operacin

Desde el punto de vista elctrico se han utilizado tres tecnologas en este bus:

SE ("Single Ended") Terminacin simple. Seal por diferencial de alto voltaje HVD ("High Voltage Differential"), basada en EIA485 Sea- por diferencial de bajo voltaje LVD ("Low Voltage Differential").

SE es la forma inicial de transportar la seal de 8 bits sobre cables de 50 conductores. Cada seal es referenciada respecto a tierra, por lo que hay 8 pares seal/referencia (16 conductores) para la seal.

Como el sistema SE se mostraba demasiado sensible al ruido; para aumentar la velocidad se ide el sistema de voltaje diferencial, ahora denominado HVD (diferencial alto). Este mtodo utiliza dos lneas para cada seal, de forma que una es inversa de la otra, utilizando la lgica estndar de 5 V. que vena usndose en la electrnica del PC desde sus orgenes. La seal medida es la diferencia de ambas (de ah el nombre "Diferencial"). Aunque ms costoso, HVD es menos propenso al ruido que el anterior, permitiendo mayores velocidades y longitudes de cable.

Cuando se intent sobrepasar el lmite de 40 MB/s del sistema HVD, se descubri que las seales podan cambiar ms rpidamente si la tensin utilizada era menor, por lo que se mantuvo el esquema diferencial pero utilizando una lgica de 3 V. A esta nueva forma se la denomin de diferencial bajo LVD. Nota: La mayor facilidad de conmutacin y menor consumo elctrico (menor calentamiento y disipacin de energa) que lleva aparejada la disminucin de la tensin de funcionamiento, no fue un descubrimiento exclusivo de la tecnologa SCSI. En realidad los desarrollos se sumaron a la tendencia dominante de disminuir la tensin de trabajo en los circuitos digitales, donde las propias placas-base tambin empezaban a abandonar los 5 Voltios de la tecnologa TTL ("Transistor Transistor Logic") tradicional, en favor de lgicas LWTTL ("Low Voltage TTL") y ECL ("Emitter Coupled Logic") de 3.3 V.

El problema de la norma LVD es que no era compatible elctricamente con las anteriores. Como se haba mantenido especial cuidado en que los nuevos estndares fuesen compatibles hacia atrs, se desarrollaron controladoras LVD hbridos o multimodo, denominados LVD/MSE ("Low Voltage Differential / Multimode Single Ended"), que funcionaban como SE cuando estn conectados a un bus SE. Actualmente solo se fabrican controladores LVD. Nota: La compatibilidad SE/LVD requiere un adaptador para el cable, ya que SE utiliza un cable estrecho y los dispositivos LVD utilizan el cable ancho. Respecto a la compatibilidad HVD/LVD, en realidad nunca ha existido. En caso necesario debe utilizarse un adaptador especial (Extensores 6.3.1).
6 Instalacin lgica

El adaptador host debe instalarse de forma que no colisione con el resto de los dispositivos instalados en el equipo (direcciones E/S, IRQ y canal DMA utilizados). Aunque la moderna tecnologa PnP resuelve bastante bien este tipo de problemas. Por supuesto es conveniente que el adaptador soporte la norma ASPI (ver a continuacin). Es posible montar sistemas que dispongan de unidades de disco SCSI y normales (por ejemplo ATA/IDE). Ya sea como unidades aisladas o coexistiendo con otro tipo. Las unidades SCSI aparecen en el setup de la BIOS como "No instalado". Cada unidad SCSI que se conecte al sistema debe tener sus propios controladores ("Drivers"), que normalmente son suministrados por el fabricante, aunque los discos duros son una excepcin, dado que suelen venir incluidos en todos los Sistemas Operativos. En principio estos "drivers" eran especficos para cada conjunto de dispositivo/adaptador (host), lo que constitua un autntico problema. Para resolverlo ha surgido una interfaz universal denominada ASPI ("Advanced SCSI Programming Interface"), de modo que los fabricantes de dispositivos SCSI solo tienen que proporcionar drivers que comuniquen con la interfaz ASPI.

Nota: la Interfaz avanzada del programador SCSI (ASPI) fue desarrollada inicialmente por Adaptec como una interfaz para enviar comandos a los adaptadores host. Posteriormente ha sido adoptada por el resto de los fabricantes. Actualmente est considerada como el mtodo estndar para acceder a los dispositivos SCSI y ATAPI/IDE ( 6.1). Tcnicamente la interfaz ASPI consiste en una capa de software que acta de front-end entre los programas y el adaptador host, haciendo que aquellos puedan ser independientes del adaptador concreto utilizado. Los controladores ASPI aceptan comandos ASPI normalizados, y ejecutan los pasos necesarios para enviar comandos ASCII al destino. Por ejemplo, los adaptadores host Adaptec AHA-152x y AHA-274x son muy diferentes, pero la interfaz ASPI para ellas es la misma. Desde el punto de vista del usuario, la interfaz ASPI es una capa de software que se encarga de manejar la comunicacin entre todo tipo de software y los perifricos que se adaptan a esta norma. Por ejemplo, grabadoras de CDs. En ocasiones ocurre que alguno de sus mdulos sea alterado como consecuencia de instalaciones de software. Para que el conjunto funcione correctamente es necesario que todos los mdulos ASPI sean de la misma versin y estn actualizados. El sitio de Adaptec www.adaptec.com es un buen sitio para buscar los ltimos drivers para los sistemas operativos Windows (o el sitio del fabricante de su adaptador SCSI). Adaptec ha creado una utilidad denominada ASPICHK que explora el sistema y determina si los mdulos ASPI son de la misma versin (uno de los motivos de problema ms frecuentes) y funcionan correctamente.
6.1 DOS y Windows

Los Sistemas Windows 95 y posteriores cuentan con adaptacin ASPI automtica, en cambio el MS-DOS no acepta directamente comandos ASPI, a menos que sea cargado el controlador correspondiente, lo que se realiza en el fichero config.sys por ejemplo: DEVICEHIGH /L:2,14912 =ASPI3X70.SYS
6.2 Linux

Debemos recordar que la asignacin que realizan los Sistemas Operativos de los dispositivos SCSI, se realiza en el momento de la carga inicial del Sistema, en funcin del escano que se realiza sobre el hardware instalado. El resultado es que la adicin o eliminacin de un dispositivo puede originar el cambio de denominacin del resto de la cadena en el prximo arranque del Sistema. En el caso de los dispositivos SCSI, la asignacin de estos dispositivos es complicada, ya que pueden coexistir distintos tipos en un mismo canal: discos, unidades de cinta, DVDs, etc. Adems los controladores RAID, que son muy frecuentes con estas unidades de altas prestaciones, se presentan como una nica unidad frente al bus del Sistema, aunque en realidad pueden contener varias unidades fsicas de disco (cada una con su propia divisin interna). Finalmente, algunos dispositivos, como unidades de CDs; DVDs y dispositivos de

almacenamiento USB (discos mviles), utilizan una emulacin IDE-SCSI que los hace aparecer con sus propios adaptadores. La asignacin que hace Linux de los dispositivos SCSI depende del orden en que aparecen los dispositivos durante la carga inicial, y responde a las siguientes reglas:
/dev/s /dev/sd /dev/st Designacin genrica de las unidades SCSI Designacin genrica de las unidades de discos SCSI Designacin genrica de las unidades de cinta SCSI Designacin genrica de las unidades CD SCSI

/dev/sr /dev/scd
/dev/sg

Recientemente algunos sistemas Linux han cambiado la forma de controlar los dispositivos SCSI, de forma que aparecen todos mediante una designacin genrica de este tipo seguida de un nmero. Por ejemplo, /dev/sg0; /dev/sg1; etc. Para conocer cual es la correspondencia con la designacin tradicional puede utilizarse la utilidad sg_map. Por ejemplo, en un caso determinado produce la siguiente salida:

/dev/sg0 /dev/sda
/dev/sda /dev/sda1 /dev/sda2 ... Primera Unidad en el primer canal del primer controlador host Primera unidad lgica en la primera unidad. Segunda unidad lgica en la primera unidad

La mejor forma de comprobar las unidades SCSI montadas en el sistema es el comando sginfo -l. A continuacin se muestra la salida en un caso determinado: /dev/scd0 /dev/sr0 /dev/sg0 [=/dev/sda scsi0 ch=0 id=0 lun=0] Tambin mediante la orden dmesg | grep scsi, que en el caso anterior, produce el sigiente resultado:

scsi0 : SCSI emulation for USB Mass Storage devices Attached scsi CD-ROM sr0 at scsi0, channel 0, id 0, lun 0 sr0: scsi-1 drive A continuacin puede obtenerse los detalles de cada unidad con el mismo condado. Por ejemplo, para los detalles de la unidad anterior sera: sginfo -a /dev/scd0
7 Estndares SCSI

Algunos de los estndares son bastante confusos y tienen varias versiones, adems, la terminologa adoptada por los diversos fabricantes no es homognea con la terminologa oficial. Nota: En general, cuando se habla de bus SCSI se sobreentiende una conexin paralela; abreviadamente SPI ("SCSI Parallel Interface"), de la que existen diversos estndares (SPI, SPI-2, SPI-3, SPI-4 y SPI-5). Aunque tambin existen estndares SCSI para conexin serie, como la utilizada en SCSI-FCP . A continuacin se muestra un resumen y una cronologa de la evolucin del bus SPI.

Estndar SASI

Comentario 1979 Shugart Associates Systems Interface. En realidad no fue un estndar sino la solucin tcnica de un fabricante. Como se ha indicado, el primer estndar SCSI se public en 1986. Opera sobre un bus asncrono de 8 bits a unos 2 MB/s, sobre cables de 50 conductores, denominado cable A, con una longitud mxima de 6 metros. Este cable deba estar dotado de un terminador pasivo (resistencias) de 132 ohmios adaptador). 6.3.1; admite 7 dispositivos (adems del

SCSI-1

Tena el problema de que muchos de sus comandos eran optativos, por lo que haba gran posibilidad que un dispositivo concreto no respondiese exactamente como se esperaba. Para subsanar el problema, un grupo de fabricantes se agruparon para adoptar un conjunto de 18 comandos bsicos, que se denomin CCS y que fuese admitido por todos los perifricos. Este conjunto de comandos fue la base de lo que luego sera el estndar SCSI-2.

SCSI-2

Aprobado en 1989, es una ampliacin de la especificacin SCSI-1 que introdujo una mayor velocidad operativa y algunas otras mejoras.

Opera sobre un bus sncrono a 5 y 10 MB/s, esta ltima denominada Fast-SCSI-2, sobre un bus de 8 bits, aunque existe una versin de 16 bits denominada Wide-SCSI-2. Esta ltima admite un mximo de 15 dispositivos (adems del adaptador) en el mismo bus. Las versiones de 8 y 16 bits utilizan cables de 50 y 68 conductores respectivamente, este ltimo denominado cable P. Esta norma define un terminador de cable activo (regulado por voltaje) que mejora la integridad de la transmisin; mejora la normalizacin de los comandos, e introduce la posibilidad de enviar al dispositivo una cola de comandos que este ejecutar de la forma que estime ms conveniente. Esta habilidad es especialmente til en Sistemas Operativos multiproceso en los que diversas tareas pueden enviar diversos comandos a la misma unidad.
SCSI-3 En este punto el estndar se desglosa en una serie de normas independientes que comprenden tres reas: Juego de rdenes (comandos); protocolos de transporte y capa fsica. En consecuencia, a partir de aqu no puede hablarse propiamente de SCSI-4, SCSI-5, Etc. porque cada especificacin sigue un desarrollo independiente.

Nota: Esta arquitectura es conocida como SAM-2 ("SCSI Architecture Model"), en contraposicin a SAM (o SAM-1) que se refiere a las normas anteriores (todo-en-uno). Las normas relativas al juego de rdenes se dividen en dos grupos; las que son comunes a todos los dispositivos ("Primary Command Set") SPC, SPC-2, SPC-3, y las que son especficas de un determinado tipo de dispositivo (discos, escaneres, cintas, Etc) que tienen sus propias siglas:

Block commands (por ejemplo, discos); SBC, SBC-2 Reduced Block Commands (discos); RBC Stream Commands (dispositivos de cinta); SSC, SSC-2, SSC-3 Media Changer Commands (jukeboxs); SMC, SMC-2 Multi Media Commands (DVDs); MMC, MMC2, MMC-3, Etc. Enclosure Services; SES, SES-2. Controller Commands (p.e. dispositivos RAID); SCC, SCC-2. Object-based Storage Devices; OSD. Management Server Commands; MSC.

Las especificaciones relativas a los protocolos de transporte adoptan sus propias siglas. Algunas relativas a una arquitectura serie emergente y a las tecnologas que permiten compatibilizarlas con el estndar serie ATA (ver a continuacin). Siglas como ; FCP ("Fibre Channel Protocol"); SSP ("Serial SCSI Protocol"); SMP ("Serial Management Protocol"); FCP (" Fibre Channel Protocol") y STP ("Serial ATA Tunneling Protocol"). Finalmente, las especificaciones relativas a la capa fsica tienen tambin sus propias denominaciones [6]: SPI ("SCSI Parallel Interface") SPI-2 SPI-3, SPI-4; SAS ("Serial Attached SCSI"). Etc. A partir de aqu se introdujeron mejoras que extendan la funcionalidad de SCSI-2 manteniendo compatibilidad descendente con las antiguas versiones. Existen buses de 8 y 16 bits sobre cables A y cables P, y se introduce la tecnologa SCAM . Simultneamente la maquinaria de mrketing introduca nombres que hicieron ms o menos fortuna, como Ultra-X SCSI y Fast-Y SCSI.
Fast-Wide SCSI Ultra-SCSI Aparecida en 1992 incorpora los estndares SPI/SIP. Consigue tasas de transferencia de 20 MB/s. Aparecida en 1995, proporciona una amplitud de banda doble, acercndola al siguiente nivel de rendimiento, pero manteniendo los cables, conexione y alojamientos existentes. Permite velocidades de transferencia de 20 MB/s con 8 bits y de 40 MB/s con 16 bits. Ultra-2 Aparecida en 1997. Sigue la norma SPI-2 ("SCSI Parallel Interface") y alcanza 80 MB/s. Utiliza la seal por diferencial de bajo voltaje LVD ("Low Voltage Differential") antes comentada. Aparece en 1999 y consigue velocidades de 160 MB/s con la norma SPI-3. Incluye un sistema CRC ("Cyclic Redundancy Chec") de deteccin y correccin de errores.

Ultra-3

Paralelamente a los esfuerzos anteriores, haban estado desarrollarse soluciones serie para el bus SCSI. Conocidas bajo las siglas SAS ("Serial Attached SCSI") cuentan con un

protocolo de transporte especfico; SSP ("Serial SCSI Protocol"); su evolucin como estndar independiente ha sido el siguiente:
Estndar FCP Comentario Aparece en 1995 con el nombre de canal de fibra ("Fibre channel"). Utiliza enlaces pticos a 100 MB/s. Las primera realizaciones prcticas se efectuaron en el campo de los superordenadores. Posteriormente se extendieron al mbito de servidores departamentales y equipos profesionales de gama alta. Es conocida tambin como FC-AL ("Fiber Channel Arbitrared Loop") Esta norma de 1998 es conocida tambin como FireWire e IEEE 1394. Alcanza 50 MB/s y est pensada para enlaces inalmbricos. En el 2002 se mejora el estndar anterior de canal de fibra, alcanzndose 200 MB/s. Puede conectar hasta 126 dispositivos en un mismo bus. En el mismo ao (2002) aparece este nuevo estndar conocido como InfiniBand. Alcanza 250 MB/s. Aparecido en 2003, es un estndar SCSI para su utilizacin en enlaces Ethernet a 100 MB/s. Conocido tambin como GigaBit Ethernet. 2003 Comienzan los estudios para una especificacin serie unificada. En Enero de este ao Seagate introduce en el mercado el primer dispositivo de disco SAS sobre un equipo HP.

SBP-2

FCP-2

SRP

iSCSI

SAS

A partir de 2002, los esfuerzos en el desarrollo de nuevas interfaces serie tienden a converger en una arquitectura nica que englobe los dos estndares serie que venan utilizndose; SAS (Serial Attached SCSI) y SATA ("Serial ATA/ATAPI"). En este ao, la STA ("SCSI Trade Association y el Grupo de Trabajo SAS ("Serial Attached SCSI Working Group") anuncian un acuerdo de colaboracin. En Enero del ao siguiente, el STA y el Grupo de Trabajo SATA II ("Serial ATA Working Group") acuerdan aunar esfuerzos para armonizar sus respectivas especificaciones.

8 Evolucin

A la fecha (2004) los dispositivos SCSI, principalmente discos, siguen siendo la eleccin de preferencia en sistemas de gama alta, en los que se exigen altas prestaciones. Sin embargo estn perdiendo protagonismo en favor del estndar Serial-ATA, que alcanza velocidades que empiezan a ser comparables a una fraccin del costo de aquellos. Otros dispositivos que usaban conexin SCSI, como escaners y cintas utilizan conexiones USB-2.
9 BWebografa

STA, "SCSI Trade Association"

www.scsita.org/

Un buen punto de informacin sobre esta tecnologa, es esta asociacin, que engloba a los fabricantes de este tipo de dispositivos. Uno de sus comits, denominado T10 se encarga de los estndares www.t10.org/.

Librera Virtual WWW

www.scsilibrary.com/

La seccin SCSI de la Librera Virtual WWW es otra buena fuente de informacin Inicio.

[1] La longitud mxima autorizada depende del estndar. Lgicamente es menor para los dispositivos ms rpidos. [2] Tenga en cuenta que la segunda causa de fallo ms frecuente en la instalacin de unidades SCSI est en la inadecuada seleccin del nmero de unidad. [3] Adaptec es actualmente (2002) uno de los fabricantes de adaptadores host SCSI ms importantes. [4] Informacin obtenida del sistema de ayuda del programa CD-R Diagnostics 1.4 Copyright 1997-1999, CD-ROM Productions [5] Algunas placas-base avanzadas disponen de controladora SCSI integrada. En especial las destinadas a servidores de gama alta. [6] Como puede verse, en algunos casos, las especificaciones engloban aspectos de la capa de transporte y la fsica. [7] La tercera generacin de la interfaz paralela SCSI fue denominada Interfaz paralela SCSI-3 (SCSI Parallel Interface-3) o abreviadamente SPI-3.

uno. Unidades RAID (Redundant Array of Inexpensive Disks): Conjunto de Discos Baratos describen bsicamente esta fabulosa solucin hardware contra fallos. RAID se compone bsicamente de una controladora a la que se conectan una serie de discos duros en los que la informacin se graba de tal manera que si falla uno de los discos, el resto sigue funcionando de forma eficaz ya que conocen exactamente la informacin perdida. Esta capacidad de la tecnologa RAID para salir de situaciones comprometidas se basa en 6 tipos de funcionamiento diferentes, pero antes de describirlos veamos un pequeo ejemplo para entender mejor porqu dicha tecnologa resulta tan beneficiosa.

Significa matriz redundante de discos independientes. RAID es un mtodo de combinacin de varios discos duros para formar una nica unidad lgica en la que se almacenan los datos de forma redundante. Ofrece mayor tolerancia a fallos y ms altos niveles de rendimiento que un slo disco duro o un grupo de discos duros independientes. En este mtodo, la informacin se reparte entre varios discos, usando tcnicas como el entrelazado de bloques (RAID nivel 0) o la duplicacin de discos (RAID nivel 1) para proporcionar redundancia, reducir el tiempo de acceso, y/o obtener mayor ancho de banda para leer y/o escribir, as como la posibilidad de recuperar un sistema tras la avera de uno de los discos. Un RAID, para el sistema operativo, aparenta ser un slo disco duro lgico (LUN). La tecnologa RAID protege los datos contra el fallo de una unidad de disco duro. Si se produce un fallo, RAID mantiene el servidor activo y en funcionamiento hasta que se sustituya la unidad defectuosa. RAID ofrece varias opciones, llamadas niveles RAID, cada una de las cuales proporciona un equilibrio distinto entre tolerancia a fallos, rendimiento y coste. Todos los sistemas RAID suponen la prdida de parte de la capacidad de almacenamiento de los discos, para conseguir la redundancia o almacenar los datos de paridad. Los sistemas RAID profesionales deben incluir los elementos crticos por duplicado: fuentes de alimentacin y ventiladores redundantes y Hot Swap. De poco sirve disponer

de un sistema tolerante al fallo de un disco si despus falla por ejemplo una fuente de alimentacin que provoca la cada del sistema.
Niveles de RAID La eleccin de los diferentes niveles de RAID va a depender de las necesidades del usuario en lo que respecta a factores como seguridad, velocidad, capacidad, coste, etc. Cada nivel de RAID ofrece una combinacin especfica de tolerancia a fallos (redundancia), rendimiento y coste, diseadas para satisfacer las diferentes necesidades de almacenamiento. La mayora de los niveles RAID pueden satisfacer de manera efectiva slo uno o dos de estos criterios. No hay un nivel de RAID mejor que otro; cada uno es apropiado para determinadas aplicaciones y entornos informticos. De hecho, resulta frecuente el uso de varios niveles RAID para distintas aplicaciones del mismo servidor. Oficialmente existen siete niveles diferentes de RAID (0-6), definidos y aprobados por el el RAID Advisory Board (RAB). Luego existen las posibles combinaciones de estos niveles (10, 50,...). Los niveles RAID 0, 1, 0+1 y 5 son los ms populares. RAID 0: Disk Striping "La ms alta transferencia, pero sin tolerancia a fallos".

Tambin conocido como "separacin fraccionamiento". Los datos se desglosan en pequeos segmentos y se distribuyen entre varias unidades. Este nivel de "array" o matriz no ofrece tolerancia al fallo. El fallo de cualquier disco de la matriz tendra como resultado la prdida de los datos y sera necesario restaurarlos desde una copia de seguridad. Por lo tanto, RAID 0 no se ajusta realmente al acrnimo RAID. Consiste en una serie de unidades de disco conectadas en paralelo que permiten una transferencia simultnea de datos a todos ellos, con lo que se obtiene una gran velocidad en las operaciones de lectura y escritura. La velocidad de transferencia de datos aumenta en relacin al nmero de discos que forman el conjunto. Esto representa una gran ventaja en operaciones secuenciales con ficheros de gran tamao. Por lo tanto, este array es aconsejable en aplicaciones de tratamiento de imgenes, audio, video o CAD/CAM, es decir, almacenamiento a gran velocidad pero que no requiera tolerancia a fallos. Se necesita un mnimo de dos unidades de disco para implementar una solucin RAID 0.

RAID 1: Mirroring "Redundancia. Ms rpido que un disco y ms seguro"

Tambin llamado "Mirroring" o "Duplicacin" (Creacin de discos en espejo). Se basa en la utilizacin de discos adicionales sobre los que se realiza una copia en todo momento de los datos que se estn modificando. RAID 1 ofrece una excelente disponibilidad de los datos mediante la redundancia total de los mismos. Para ello, se duplican todos los datos de una unidad o matriz en otra. De esta manera se asegura la integridad de los datos y la tolerancia al fallo, pues en caso de avera, la controladora sigue trabajando con los discos no daados sin detener el sistema. Los datos se pueden leer desde la unidad o matriz duplicada sin que se produzcan interrupciones. RAID 1 es una alternativa costosa para los grandes sistemas, ya que las unidades se deben aadir en pares para aumentar la capacidad de almacenamiento. RAID 1 es una buena solucin para las aplicaciones que requieren redundancia cuando hay slo dos unidades disponibles. Los servidores de archivos pequeos son un buen ejemplo. Se necesita un mnimo de dos unidades para implementar una solucin RAID 1 RAID 2: "Acceso paralelo con discos especializados. Redundancia a travs del cdigo Hamming"

El RAID nivel 2 adapta la tcnica usada para detectar y corregir errores en memorias de estado slido. RAID 2 no ha sido a penas implementado en productos comerciales, lo que tambin es debido a que requiere caractersticas especiales en los discos y no usa discos estndares.

RAID 3: "Acceso sncrono con un disco dedicado a paridad"

Dedica un nico disco al almacenamiento de informacin de paridad. La informacin de ECC (Error Checking and Correction) se usa para detectar errores. La operacin I/O accede a todos los discos al mismo tiempo. Se necesita un mnimo de tres unidades para implementar una solucin RAID 3. RAID 4: "Acceso Independiente con un disco dedicado a paridad."

Dedica un disco para guardar la informacin de paridad de los otros discos. Este nivel de RAID se implementa poco comercialmente. Se necesita un mnimo de tres unidades para implementar una solucin RAID 4. La diferencia con el RAID 3 est en que se puede acceder a los discos de forma individual. RAID 5: "Acceso independiente con paridad distribuida."

Este array ofrece tolerancia al fallo, pero adems, optimiza la capacidad del sistema permitiendo una utilizacin de hasta el 80% de la capacidad del conjunto de discos. Esto lo consigue mediante el clculo de informacin de paridad y su almacenamiento alternativo por bloques en todos los discos del conjunto. Si cualquiera de las unidades de disco falla, se puede recuperar la informacin en tiempo real, sobre la marcha, mediante una simple operacin de lgica de O exclusivo, sin que el servidor deje de funcionar. As pues, para evitar el problema de cuello de botella que plantea el RAID 4 con el disco de comprobacin, el RAID 5 no asigna un disco especfico a esta misin sino que asigna un bloque

alternativo de cada disco a esta misin de escritura. Al distribuir la funcin de comprobacin entre todos los discos, se disminuye el cuello de botella y con una cantidad suficiente de discos puede llegar a eliminarse completamente, proporcionando una velocidad equivalente a un RAID 0. RAID 5 es el nivel de RAID ms eficaz y el de uso preferente para las aplicaciones de servidor bsicas para la empresa. Comparado con otros niveles RAID con tolerancia a fallos, RAID 5 ofrece la mejor relacin rendimiento-coste en un entorno con varias unidades. Este nivel de array es especialmente indicado para trabajar con sistemas operativos multiusuarios. Se necesita un mnimo de tres unidades para implementar una solucin RAID 5. Su resultado ptimo de capacidad se obtiene con siete o ms unidades. RAID 5 es la solucin ms econmica por megabyte, que ofrece la mejor relacin de precio, rendimiento y disponibilidad para la mayora de los servidores. RAID 6: "Acceso independiente con doble paridad"

Similar al RAID 5, pero incluye un segundo esquema de paridad distribuido por los distintos discos y por tanto ofrece tolerancia extremadamente alta a los fallos y a las cadas de disco, ofreciendo dos niveles de redundancia. Hay pocos ejemplos comerciales en la actualidad, ya que su coste de implementacin es mayor al de otros niveles RAID, ya que las controladoras requeridas que soporten esta doble paridad son ms complejas y caras que las de otros niveles RAID. As pues, comercialmente no se implementa. Combinacin de Niveles RAID Algunos Niveles RAID pueden combinarse en un mismo Arreglo de Discos. Es muy comn encontrar Sistemas Disk Array que admiten la combinacin de 0+1 es decir, un striping de discos (RAID 0) espejados (RAID 1). Esta combinacin requiere de por lo menos 4 discos (un mnimo de 2 discos en striping ms igual cantidad espejando ese striping). Esta combinacin brinda alta confiabilidad y velocidad, pero es ideal para bajas capacidades (el 50% de los discos est dedicado a la redundancia).

La tolerancia a fallas y la capacidad Un Sistema Disk Array configurado en un Nivel RAID tolerante a fallas, ocupar determinada capacidad para albergar los datos de paridad. Tomemos como ejemplo un Sistema Disk Array compuesto por 4 discos de 20GB cada uno, de modo que nuestro Sistema tendr 80GB de capacidad total (4 x 20GB). Si lo configuramos en RAID 1, el 50% de la capacidad total estar dedicada a la redundancia, de modo que tendremos 40GB de capacidad disponible para albergar datos. Si al mismo sistema lo configuramos en RAID 3 o en RAID 5, un 20% de la capacidad total estar dedicada a los datos de paridad de manera que tendremos (aprox.) 60GB disponibles para almacenar datos. Si en cambio lo configuramos en RAID 3 o en RAID 5 ms un disco en hot-spare para que tolere la falla de dos discos, tendremos entonces 40GB de capacidad disponible. Back-up El Disk Array y el Back-Up Un Disk Array nos brinda seguridad de trabajo con nuestros datos, ya que en caso que falle algn componente o de hecho, se dae alguno de los discos rgidos, el Sistema seguir funcionando ininterrumpidamente y Ud. no perder sus datos -dependiendo de los niveles de seguridad que Ud. haya elegido-. Sin embargo, tener los datos en un Sistema Disk Array no significa que los datos estn resguardados. El resguardo de datos se hace para que sea lo que fuere que ocurra con nuestros discos rgidos, ya sean fallas del hardware, errores o siniestros -como robo, incendio, inundaciones, boicot, error humano, derrumbes en el edificio donde est el sistema, etc.- que provoquen la prdida parcial o total de nuestros datos; tengamos una copia de los datos de el da anterior o por lo menos de una semana atrs. Esa copia es el backup, que debe realizarse sobre una cinta o un medio ptico, y debe guardarse en un lugar fsico distinto y alejado de donde se encuentran los discos. Entonces un Sistema Disk Array requiere indefectiblemente el Back-up.

Actualmente, todo el mundo experimenta el continuo incremento de la cantidad de datos que necesita archivar, consultar y transmitir. Los datos de computacin son de misin crtica y nadie debera poner en riesgo sus negocios por no haberse preocupado de resguardar sus datos. Una estrategia de back-up adecuada es el seguro ms efectivo contra incendios, inundaciones, crash de discos, errores humanos, robos, boicots o virus. Todas esas cosas pueden provocar la prdida de sus datos y con ellos los datos de sus clientes, sus proyectos, y negocios; o -en el mejor de los casos- horas y horas de operaciones para recuperar los datos. Adems de sus funciones de backup, un sistema de almacenamiento en cinta es til en otras aplicaciones como el almacenamiento jerrquico, el archivo, o la distribucin de datos. Recordar que: Slo hay dos tipos de datos... Los datos que han sido 'backupeados" y los que no se han perdido... TODAVIA.

El costo de no hacer back-up Una posibilidad diaria: que ocurra un desastre. Y actualmente, puede ocurrir. Incluso muy frecuentemente ocurre la prdida de archivos aislados. El costo de recuperar esos datos puede ser muy significativo. La prdida de archivos y datos, implica una gran prdida de tiempo y tambin la prdida de negocios o clientes en situaciones crticas o si no puede encontrar la informacin cuando la necesita.
RAID es una forma de almacenar los mismos datos en distintos lugares (por tanto de modo redundante) en mltiples discos duros. Al colocar los datos en discos mltiples, las operaciones I/O (input/output, de entrada y salida) pueden superponerse de un modo equilibrado, mejorando el rendimiento del sistema. Dado que los discos mltiples incrementan el tiempo medio entre errores (mean time between failure, MTBF), el almacenamiento redundante de datos incrementa la tolerancia a fallos. Un RAID, para el sistema operativo, aparenta ser un slo disco duro lgico. El RAID emplea la tcnica conocida como "striping" (bandeado o creacin de bandas), que incluye la particin del espacio de almacenamiento de cada disco en unidades que van de un sector (512 bytes) hasta varios megabytes. Las bandas de todos los discos estn interpaginadas (interleaved) y se accede a ellas en orden. En un sistema de un solo usuario donde se almacenan grandes registros (como imgenes mdicas o de otro tipo), las bandas generalmente se establecen para ser muy pequeas (quiz de 512 bytes) de modo que un solo registro est ubicado en todos los discos y se pueda acceder a l rpidamente leyendo todos los discos a la vez. En un sistema multiusuario, un mejor rendimiento demanda que se establezca una banda lo suficientemente ancha para contener el registro de tamao tpico o el de mayor tamao. Esto permite acciones I/O superpuestas en los distintos discos. 3. Funcionamiento del RAID Bsicamente el RAID es un sistema el cual permite almacenar informacin en una cantidad de discos (n), de tal forma que agilice el proceso maquina-disco. El sistema RAID evitar en lo ms posible la prdida de data de la siguiente manera: Los discos optimizados para RAID poseen circuitos integrados que detecta si el disco est fallando, de ser as este circuito se encargar por encima del tiempo real de sacar la informacin y almacenarla en los otros discos, o si es el caso en el "hot spare". Un hot spare es un disco que permanece siempre en el sistema esperando a que otro se estropee y l entre directamente en funcionamiento. Una de las ventajas del sistema RAID es la posibilidad, con los discos hot swap, de conectarlos y desconectarlos en "caliente", es decir, que si un disco falla no har falta el apagar el sistema para remplazarlo. Otras de las ventajas de RAID: 1. Reconstruccin y Regeneracin Cuando un disco falla la informacin redundante en los discos y los datos en los discos buenos son usados para regenerar la informacin de disco averiado. Striping Es el acto de unir dos o ms discos fsicos en un solo disco lgico con el fin de dividir los datos entre los diferente discos para ofrecer una significativa mejora en el rendimiento del conjunto de los discos. Los datos son divididos a travs de los discos. La lectura y escritura es compartida La bsqueda de datos clsica fuerza a la lectura y escritura a no recordar su posicin resultando ms movimientos de cabezas y peor eficiencia

La lectura de datos es etiquetada y reordenada. Los movimientos de las cabezas de lectura - escritura se realizan mas eficientemente cuando se buscan datos. Ventajas de los discos RAID El rendimiento general del sistema aumenta ya que pueden funcionar de forma paralela con los diferentes discos del conjunto. Dependiendo del nivel de RAID que escojamos, si uno de los discos del conjunto falla, la unidad contina funcionando, sin prdida de tiempo ni de datos. La reconstruccin de los datos del disco que ha fallado se hace de forma automtica sin intervencin humana. En el caso de algunos sistemas operativos la regeneracin de datos se hace desde software por ejemplo en el Windows NT, aunque en estos sistemas se pueden usar controladoras RAID que s regeneraran los datos automticamente. La capacidad global del disco aumentar, ya que se suman las capacidades de los diferentes discos que componen el conjunto. Porqu usar RAID? Las operaciones de I/O a disco son relativamente lentas, primordialmente debido a su carcter mecnico. Una lectura o una escritura involucra, normalmente, dos operaciones. La primera es el posicionamiento de la cabeza lecto/grabadora y la segunda es la transferencia desde o hacia el propio disco. El posicionamiento de la cabeza est limitado por dos factores: el tiempo de bsqueda (seek time) y el retardo por el giro del disco hasta la posicin de inicio de los datos (latencia rotacional). La transferencia de datos, por su parte, ocurre de a un bit por vez y se ve limitada por la velocidad de rotacin y por la densidad de grabacin del medio Una forma de mejorar el rendimiento de la transferencia es el uso de varios discos en paralelo; esto se basa en el hecho de que si un disco solitario es capaz de entregar una tasa de transferencia dada, entonces dos discos seran capaces, tericamente, de ofrecer el doble de la tasa anterior; lo mismo sucedera con cualquier operacin. La adicin de varios discos debera extender el fenmeno hasta un punto a partir del cual algn otro componente empezar a ser el factor limitante. Muchos administradores o encargados de sistemas intentan llevar a cabo esta solucin en forma bsicamente manual, distribuyendo la informacin entre varios discos de tal forma de intentar asegurar una carga de trabajo similar para cada uno de ellos. Este proceso de "sintona" podra dar buenos resultados de no ser por dos factores principales: No consigue mejorar las velocidades de transferencia de archivos individuales, slo mejora la cantidad de archivos accesados en forma concurrente. Es obvio que el balance no es posible de mantener en el tiempo debido a la naturaleza eminentemente dinmica de la informacin. Una forma bastante ms efectiva de conseguir el objetivo es el uso de un arreglo de discos, el cual segn la definicin del RAID Consultory Board es "una coleccin de discos que integran uno o ms subsistemas combinados con un software de control el cual se encarga de controlar la operacin del mismo y de presentarlo al Sistema Operativo como un slo gran dispositivo de almacenamiento". Dicha pieza de software puede ser integrada directamente al Sistema Operativo o residir en el propio arreglo; as como el arreglo puede ser interno o externo. Novell Netware incluye, desde hace algn tiempo, soporte para arreglos de discos. El espejado y la duplicacin de discos son ejemplos de arreglos basados en software. Ms recientemente fabricantes independientes han ofrecido al mercado arreglos de discos basados en software que pueden correr en formato NLM (Netware Loadable Module) sobre un Servidor Netware. Las soluciones de arreglos basadas en hardware son principalmente implementadas mediante el uso de controladoras SCSI (Small Computer System Interface) especializadas, las cuales a menudo estn dotadas de procesadores propios para liberar a la CPU del sistema de la tarea de control y de cachs para mejorar an ms el desempeo. Para Netware cualquiera de las dos soluciones, software o hardware, ser visualizada como un nico y gran disco virtual. As pues un arreglo de discos ofrecer un mejor desempeo debido a que dividir en forma automtica los requerimientos de lectura/escritura entre los discos que lo conforman. Por ejemplo, si una operacin de lectura/escritura involucra a cuatro bloques de 4 Kb cada uno, entonces un arreglo de 4 discos podra, tericamente, entregar cuatro veces la tasa de operacin de un disco nico, esto debido a que el disco nico slo podra atender a un bloque en forma simultnea, mientras que en el arreglo cada disco podra manejar un slo bloque cada uno y como operan al mismo tiempo

En la prctica, sin embargo, dichos niveles no se obtienen debido, principalmente, a la carga de trabajo inherente al control del propio arreglo. Adems el uso de varios discos se emplea para construir cierto nivel de redundancia de los datos y es este nivel de redundancia y la forma de implementarlo lo que crea los niveles de RAID. Arreglos paralelos vs. independientes Arreglos paralelos: stos son aquellos en que cada disco participa en todas las operaciones de entrada/salida. Este tipo de arreglo ofrece tasas altsimas de transferencia debido a que las operaciones son distribuidas a travs de todos los discos del arreglo y ocurren en forma prcticamente simultnea. La tasa de transferencia ser muy cercana, 95%, a la suma de las tasas de los discos miembros, mientras que los ndices de operaciones de entrada/salida sern similares a las alcanzadas por un disco individual. En espaol: un arreglo paralelo accesar slo un archivo a la vez pero lo har a muy alta velocidad. Algunas implementaciones requieren de actividades adicionales como la sincronizacin de discos. Los RAID de niveles 2 y 3 se implementan con arreglos paralelos. Arreglos independientes: son denominados as aquellos arreglos en los cuales cada disco integrante opera en forma independiente, an en el caso de que le sea solicitado atender varios requerimientos en forma concurrente. Este modelo ofrece operaciones de entrada/salida sumamente rpidas debido a que cada disco est en posicin de atender un requerimiento por separado. De esta forma las operaciones de entrada/salida sern atendidas a una velocidad cercana, 95%, a la suma de las capacidades de los discos presentes, mientras que la tasa de transferencia ser similar a la de un disco individual debido a que cada archivo est almacenado en slo un disco. Los niveles 4 y 5 de RAID se implementan con arreglos independientes, mientras que los niveles 0 y 1 pueden ser implementados por cualquiera de las categoras, sin perjuicio de suelan ser implementados en forma de arreglos independientes. Stripping y mirroring RAID a niveles 0, 1 y 0 & 1 puede ser implementado, tanto en forma de arreglos independientes o paralelos. Netware lo implementa como arreglos independientes a nivel del propio Sistema Operativo y, por lo tanto, no precisa de hardware o software adicional. 5. Tipos de RAID Como ya se mencionaron hay al menos nueve tipos de RAID adems de un grupo no redundante (RAID-0) RAID-0. Esta tcnica tiene bandeado paro no tiene redundancia de datos. Ofrece el mejor rendimiento pero no tolerancia a los fallos. RAID-1. Este tipo tambin se conoce como creacin de discos espejo y consiste de al menos dos discos duros que duplican el almacenamiento de datos. No hay bandeado. El rendimiento de la lectura se mejora pues cualquiera de los dos discos puede leerse al mismo tiempo. El rendimiento de escritura es el mismo que el del almacenamiento en un solo disco. El RAID-1 proporciona el mejor rendimiento y la mejor tolerancia a fallos en un sistema multiusuario. RAID-2. Este tipo usa bandeado en todos los discos, con algunos de estos dedicados a almacenar informacin de verificacin y correccin de errores (error checking and correcting, ECC). No tiene ninguna ventaja sobre el RAID3. RAID-3. Este tipo usa bandeado y dedica un disco al almacenamiento de informacin de paridad. La informacin de verificacin de errores (ECC) incrustada se usa para detectar errores. La recuperacin de datos se consigue calculando el O exclusivo (XOR) de la informacin registrada en los otros discos. Dado que una operacin I/O accede a todos los discos al mismo tiempo, el RAID-3 no puede traslapar I/O. Por esta razn, el RAID-3 es mejor para sistemas de un solo usuario con aplicaciones que contengan grandes registros. RAID-4. Este tipo usa grandes bandas, lo cual significa que podemos leer registros de cualquier disco individual. Esto nos permite aprovechar la I/O traslapada para las operaciones de lectura. Dado que todas las operaciones de escritura tienen que actualizar el disco de paridad, no es posible la superposicin I/O para ellas. El RAID-4 no ofrece ninguna ventaja sobre el RAID-5. RAID-5. Este tipo incluye un grupo rotatorio de paridad, con lo que resuelve las limitaciones de escritura en RAID-4. As, todas las operaciones de lectura y escritura pueden superponerse. El Raid 5 almacena informacin de paridad pero no datos redundantes (aunque la informacin de paridad puede usarse para reconstruir datos). El RAID-5 exige al menos tres y usualmente cinco discos en el conjunto. Es mejor para los sistemas multiusuario en los cuales el rendimiento no es crtico, o que realizan pocas operaciones de escritura. RAID-6. Este tipo es similar al RAID-5, pero incluye un segundo esquema de paridad distribuido por los distintos

discos y por tanto ofrece tolerancia extremadamente alta a los fallos y las cadas de disco. Hay pocos ejemplos comerciales en la actualidad. RAID-7. Este tipo incluye un sistema operativo incrustado de tiempo real como controlador, haciendo las operaciones de cach a travs de un bus de alta velocidad y otras caractersticas de un ordenador sencillo. Un vendedor ofrece este sistema. RAID-10. Este tipo ofrece un conjunto de bandas en el que cada banda es un grupo de discos RAID-1. Esto proporciona mejor rendimiento que el RAID-1, pero a un costo mucho mayor. RAID-53. Este tipo ofrece un conjunto de bandas en el cual cada banda es un conjunto de discos RAID-3. Esto proporciona mejor rendimiento que el RAID-3, pero a un costo mucho mayor. Pero de todos estos los que ms destacan son los niveles 0,1,3,5, y 10 o RAID 0&1. Todos los dems vienen siendo variaciones de estos ltimos. En la siguiente pgina explicaremos ms a fondo las ventajas y la forma de configuracin de estos ltimos niveles. RAID 0: Este tipo de arre glo utili za una tcnica llamada "striping", la cual distribuye la informacin en bloques entre los diferentes discos. Es el nico nivel de RAID que no duplica la informacin, por lo tanto no se desperdicia capacidad de almacenamiento. Se requieren mnimo dos discos. RAID 0 Ventajas: RAID-0 permite acccesar ms de un disco a la vez, logrando una tasa de transferencia ms elevada y un rpido tiempo de acceso. Por no utilizar espacio en informacin redundante, el costo por Megabyte es menor. Desventaja: No existe proteccin de datos. No existe informacin en cuanto a Paridad. Ambientes donde implementarlo: Es una buena alternativa en sistemas donde sea ms importante el rendimiento que la seguridad de los datos. Es decir ambientes que puedan soportar una prdida de tiempo de operacin para poder reemplazar el disco que falle y

reponer toda la informacin. RAID 1: Este nivel de RAID usa un tipo de configuracin conocido como "mirroring", ya que la informacin de un disco es completamente duplicada en otro disco. As mismo, tambin se puede duplicar el controlador de disco (duplexing). Se desperdicia el 50% de la capacidad y slo maneja dos discos. RAID 1 Ventajas: Se protege la informacin en caso de falla tanto del disco como del controlador (en caso de duplex), ya que si un disco suspende su operacin el otro continua disponible. De este modo se evita la prdida de informacin y las interrupciones del sistema debido a fallas de discos. Desventajas: Gran consumo de necesidades hardware, 100% paridad y coste alto pues es necesario el doble de discos.

Ambientes donde implementarlo: RAID-1 est diseado para sistemas donde la disponibilidad de la informacin es esencial y su reemplazo resultara difcil y costoso (ms costoso que reponer el disco en s). Tpico en escrituras aleatorias pequeas con tolerancia a fallas. El problema de este tipo de arreglos es el costo que implica duplicar los discos. RAID 3: Conocido tambin como "striping con paridad dedicada", utiliza un disco de proteccin de informacin separado para almacenar informacin de control codificada. Esta informacin de control codificada o paridad proviene de los datos almacenados en los discos y permite la reconstruccin de la informacin en caso de falla. Se requieren mnimo tres discos y se utiliza la capacidad de un disco para la informacin de control. RAID 3 Ventajas: RAID-3 proporciona una alta disponibilidad del arreglo, as como una tasa de transferencia elevada, mejorando de ese modo el rendimiento del sistema. Desventajas: Un disco de paridad dedicado puede convertirse en un cuello de botella porque cada cambio en el grupo RAID requiere un cambio en la informacin de paridad. No plantea una solucin al fallo simultneo en dos discos. Est especialmente recomendado para aplicaciones que requieran archivos de datos de un gran tamao (vdeo, imgenes, DataWare House). Ambientes donde implementarlo: Es tpico para transferencia larga de datos en forma serial , tal como aplicaciones de imgenes o video RAID 5: Este nivel de RAID es conocido como "striping con paridad distribuida", ya que la informacin se reparte en bloques como RAID-0, pero un bloque de cada disco se dedica a la paridad. Es decir la data codificada se aade como otro sector que rota por los discos igual que los datos ordinarios. Se requieren mnimo tres discos. RAID 5 Ventajas: Es el esquema de proteccin de informacin ms usado comnmente, ya que proporciona un buen rendimiento general con una mnima prdida de capacidad. Adems el sistema tiene suficiente redundancia para ser tolerante a fallos. Desventajas: Menores prestaciones que en RAID 1. No plantea una solucin al fallo simultneo en dos discos. Es recomendable para aplicaciones lectura/escritura, tal como RAID 10: Es un nivel de arreglo de distribuye en bloques como en RAIDAmbientes donde implementarlo: intensas de entrada/salida y de procesamiento de transacciones. discos, donde la informacin se 0 adicionalmente, cada disco se duplica como RAID-1 , creando un segundo nivel de arreglo. Se conoce como "striping de arreglos duplicados". Se requieren, dos canales, dos discos para cada canal

y se utiliza el 50% de la capacidad para informacin de control. Tambin se le conoce como RAID 0&1 RAID 10 Ventajas: Este nivel ofrece un 100% de redundancia de la informacin y un soporte para grandes volmenes de datos, donde el precio no es un factor importante. Desventajas: Coste elevado, gran overhead y 100% de redundancia Ambientes donde implementarlo: Ideal para sistemas de misin crtica donde se requiera mayor confiabilidad de la informacin, ya que pueden fallar dos discos inclusive (uno por cada canal) y los datos todava se mantienen en lnea. Es apropiado tambin en escrituras aleatorias pequeas. Glosario Hot swap: Son discos que se reemplazan en caliente. Esto quiere decir que si alguno de los discos RAID se estropeara fsicamente bastara con quitarlo y poner otro sin tener que apagar el sistema. Hot spare: Disco sobrante. Es un disco que permanece siempre en el sistema esperando a que uno se estropee y l entre directamente en funcionamiento. Integridad de los datos: es la capacidad que tiene un disco de aguantar un error de grabacin, de corrupcin o prdida de datos. Para tal efecto se tiene que seleccionar un disco RAID o una alternativa. El nivel de integridad es uno de los primeros criterios que se han de investigar. Mirroring: Haciendo espejo. Es un nivel de RAID (el nivel 1) que pasa por hacer una copia ntegra de un disco en otro. Paridad: es una informacin redundante que es guardada para regenerar datos perdidos por un error en el disco. La paridad se genera haciendo un XOR sobre los datos de los discos y aguardndolo en otro disco o en un disco dedicado a este efecto, esto depender del nivel RAID que usemos. RAID: Redundat Array of Inexpensive Disk Conjunto de discos con informacin redundante de bajo costo. Reconstruccin o regeneracin: Cuando un disco falla la informacn redundante en los discos y los datos en los discos buenos son usados para regenerar la informacn del disco averiado. Striping: es el acto de unir dos o ms discos fsicos en un solo disco lgico con el fin de dividir los datos entre los diferentes discos para ofrecer una significativa mejora en el rendimiento del conjunto de los discos.

RAID
En informtica, el acrnimo RAID (del ingls Redundant Array of Independent Disks), conjunto redundante de discos independientes, anteriormente conocido como Redundant Array of Inexpensive Disks, conjunto redundante de discos baratos) hace referencia a un sistema de almacenamiento que usa mltiples discos duros o SSD entre los que se distribuyen o replican los datos. Dependiendo de su configuracin (a la que suele llamarse nivel), los beneficios de un RAID respecto a un nico disco son uno o varios de los siguientes: mayor integridad, mayor tolerancia a fallos, mayor throughput

(rendimiento) y mayor capacidad. En sus implementaciones originales, su ventaja clave era la habilidad de combinar varios dispositivos de bajo coste y tecnologa ms antigua en un conjunto que ofreca mayor capacidad, fiabilidad, velocidad o una combinacin de stas que un solo dispositivo de ltima generacin y coste ms alto. En el nivel ms simple, un RAID combina varios discos duros en una sola unidad lgica. As, en lugar de ver varios discos duros diferentes, el sistema operativo ve uno solo. Los RAID suelen usarse en servidores y normalmente (aunque no es necesario) se implementan con unidades de disco de la misma capacidad. Debido al decremento en el precio de los discos duros y la mayor disponibilidad de las opciones RAID incluidas en los chipsets de las placas base, los RAID se encuentran tambin como opcin en las computadoras personales ms avanzadas. Esto es especialmente frecuente en las computadoras dedicadas a tareas intensivas y que requiera asegurar la integridad de los datos en caso de fallo del sistema. Esta caracterstica no est obviamente disponible en los sistemas RAID por software, que suelen presentar por tanto el problema de reconstruir el conjunto de discos cuando el sistema es reiniciado tras un fallo para asegurar la integridad de los datos. Por el contrario, los sistemas basados en software son mucho ms flexibles (permitiendo, por ejemplo, construir RAID de particiones en lugar de discos completos y agrupar en un mismo RAID discos conectados en varias controladoras) y los basados en hardware aaden un punto de fallo ms al sistema (la controladora RAID). Todas las implementaciones pueden soportar el uso de uno o ms discos de reserva (hot spare), unidades preinstaladas que pueden usarse inmediatamente (y casi siempre automticamente) tras el fallo de un disco del RAID. Esto reduce el tiempo del perodo de reparacin al acortar el tiempo de reconstruccin del RAID.

Contenido
[ocultar]

1 Niveles RAID estndar o 1.1 RAID 0 (Data Striping) o 1.2 RAID 1 o 1.3 RAID 2 o 1.4 RAID 3 o 1.5 RAID 4 o 1.6 RAID 5 o 1.7 RAID 6 o 1.8 RAID 5E y RAID 6E 2 Niveles RAID anidados o 2.1 RAID 0+1 o 2.2 RAID 1+0 o 2.3 RAID 30 o 2.4 RAID 100 o 2.5 RAID 50

3 Niveles RAID propietarios o 3.1 Paridad doble o 3.2 RAID 1.5 o 3.3 RAID 7 o 3.4 RAID S o RAID de paridad o 3.5 Matrix RAID o 3.6 Linux MD RAID 10 o 3.7 IBM ServeRAID 1E o 3.8 RAID Z 4 Posibilidades de RAID o 4.1 Lo que RAID puede hacer o 4.2 Lo que RAID no puede hacer 5 Vase tambin 6 Notas 7 Productores de Raid Hardware 8 Enlaces externos

[editar] Niveles RAID estndar


Los niveles RAID ms comnmente usados son:

RAID 0: Conjunto dividido RAID 1: Conjunto en espejo RAID 5: Conjunto dividido con paridad distribuida

[editar] RAID 0 (Data Striping)

Diagrama de una configuracin RAID 0.

Un RAID 0 (tambin llamado conjunto dividido o volumen dividido) distribuye los datos equitativamente entre dos o ms discos sin informacin de paridad que proporcione redundancia. Es importante sealar que el RAID 0 no era uno de los niveles RAID originales y que no es redundante. El RAID 0 se usa normalmente para incrementar el rendimiento, aunque tambin puede utilizarse como forma de crear un pequeo nmero de grandes discos virtuales a partir de un gran nmero de pequeos discos fsicos. Un RAID 0 puede ser creado con discos de diferentes tamaos, pero el espacio de almacenamiento aadido al conjunto estar limitado por el tamao del disco ms pequeo (por ejemplo, si un disco de 300 GB se divide con uno de 100 GB, el tamao del conjunto resultante ser slo de 200 GB, ya que cada disco aporta 100GB). Una buena implementacin de un RAID 0 dividir las operaciones de lectura y escritura en bloques de igual tamao, por lo que distribuir la informacin equitativamente entre los dos discos. Tambin es posible crear un RAID 0 con ms de dos discos, si bien, la fiabilidad del conjunto ser igual a la fiabilidad media de cada disco entre el nmero de discos del conjunto; es decir, la fiabilidad total medida como MTTF o MTBF es (aproximadamente) inversamente proporcional al nmero de discos del conjunto (pues para que el conjunto falle es suficiente con que lo haga cualquiera de sus discos).

Diagrama de una configuracin RAID 1.

[editar] RAID 1
Un RAID 1 crea una copia exacta (o espejo) de un conjunto de datos en dos o ms discos. Esto resulta til cuando el rendimiento en lectura es ms importante que la capacidad. Un conjunto RAID 1 slo puede ser tan grande como el ms pequeo de sus discos. Un RAID 1 clsico consiste en dos discos en espejo, lo que incrementa exponencialmente la fiabilidad respecto a un solo disco; es decir, la probabilidad de fallo del conjunto es igual al producto de las probabilidades de fallo de cada uno de los discos (pues para que el conjunto falle es necesario que lo hagan todos sus discos).

Adicionalmente, dado que todos los datos estn en dos o ms discos, con hardware habitualmente independiente, el rendimiento de lectura se incrementa aproximadamente como mltiplo lineal del nmero del copias; es decir, un RAID 1 puede estar leyendo simultneamente dos datos diferentes en dos discos diferentes, por lo que su rendimiento se duplica. Para maximizar los beneficios sobre el rendimiento del RAID 1 se recomienda el uso de controladoras de disco independientes, una para cada disco (prctica que algunos denominan splitting o duplexing). Como en el RAID 0, el tiempo medio de lectura se reduce, ya que los sectores a buscar pueden dividirse entre los discos, bajando el tiempo de bsqueda y subiendo la tasa de transferencia, con el nico lmite de la velocidad soportada por la controladora RAID. Sin embargo, muchas tarjetas RAID 1 IDE antiguas leen slo de un disco de la pareja, por lo que su rendimiento es igual al de un nico disco. Algunas implementaciones RAID 1 antiguas tambin leen de ambos discos simultneamente y comparan los datos para detectar errores. La deteccin y correccin de errores en los discos duros modernos hacen esta prctica poco til. Al escribir, el conjunto se comporta como un nico disco, dado que los datos deben ser escritos en todos los discos del RAID 1. Por tanto, el rendimiento no mejora. El RAID 1 tiene muchas ventajas de administracin. Por ejemplo, en algunos entornos 24/7, es posible dividir el espejo: marcar un disco como inactivo, hacer una copia de seguridad de dicho disco y luego reconstruir el espejo. Esto requiere que la aplicacin de gestin del conjunto soporte la recuperacin de los datos del disco en el momento de la divisin. Este procedimiento es menos crtico que la presencia de una caracterstica de snapshot en algunos sistemas de archivos, en la que se reserva algn espacio para los cambios, presentando una vista esttica en un punto temporal dado del sistema de archivos. Alternativamente, un conjunto de discos puede ser almacenado de forma parecida a como se hace con las tradicionales cintas.

[editar] RAID 2

RAID 2 Un RAID 2 divide los datos a nivel de bits en lugar de a nivel de bloques y usa un cdigo de Hamming para la correccin de errores. Los discos son sincronizados por la controladora para funcionar al unsono. ste es el nico nivel RAID original que actualmente no se usa. Permite tasas de trasferencias extremadamente altas.

Tericamente, un RAID 2 necesitara 39 discos en un sistema informtico moderno: 32 se usaran para almacenar los bits individuales que forman cada palabra y 7 se usaran para la correccin de errores.

[editar] RAID 3

Diagrama de una configuracin RAID 3. Cada nmero representa un byte de datos; cada columna, un disco. Un RAID 3 usa divisin a nivel de bytes con un disco de paridad dedicado. El RAID 3 se usa rara vez en la prctica. Uno de sus efectos secundarios es que normalmente no puede atender varias peticiones simultneas, debido a que por definicin cualquier simple bloque de datos se dividir por todos los miembros del conjunto, residiendo la misma direccin dentro de cada uno de ellos. As, cualquier operacin de lectura o escritura exige activar todos los discos del conjunto, suele ser un poco lento porque se producen cuellos de botella. Son discos paralelos pero no son independientes (no se puede leer y escribir al mismo tiempo). En el ejemplo del grfico, una peticin del bloque A formado por los bytes A1 a A6 requerira que los tres discos de datos buscaran el comienzo (A1) y devolvieran su contenido. Una peticin simultnea del bloque B tendra que esperar a que la anterior concluyese.

[editar] RAID 4

Diagrama de una configuracin RAID 4. Cada nmero representa un bloque de datos; cada columna, un disco.

Un RAID 4, tambin conocido como IDA (acceso independiente con discos dedicados a la paridad) usa divisin a nivel de bloques con un disco de paridad dedicado. Necesita un mnimo de 3 discos fsicos. El RAID 4 es parecido al RAID 3 excepto porque divide a nivel de bloques en lugar de a nivel de bytes. Esto permite que cada miembro del conjunto funcione independientemente cuando se solicita un nico bloque. Si la controladora de disco lo permite, un conjunto RAID 4 puede servir varias peticiones de lectura simultneamente. En principio tambin sera posible servir varias peticiones de escritura simultneamente, pero al estar toda la informacin de paridad en un solo disco, ste se convertira en el cuello de botella del conjunto. En el grfico de ejemplo anterior, una peticin del bloque A1 sera servida por el disco 0. Una peticin simultnea del bloque B1 tendra que esperar, pero una peticin de B2 podra atenderse concurrentemente.

[editar] RAID 5

Diagrama de una configuracin RAID 5. Un RAID 5 usa divisin de datos a nivel de bloques distribuyendo la informacin de paridad entre todos los discos miembros del conjunto. El RAID 5 ha logrado popularidad gracias a su bajo coste de redundancia. Generalmente, el RAID 5 se implementa con soporte hardware para el clculo de la paridad. RAID 5 necesitar un minimo de 3 discos para ser implementado. En el grfico de ejemplo anterior, una peticin de lectura del bloque A1 sera servida por el disco 0. Una peticin de lectura simultnea del bloque B1 tendra que esperar, pero una peticin de lectura de B2 podra atenderse concurrentemente ya que seria servida por el disco 1. Cada vez que un bloque de datos se escribe en un RAID 5, se genera un bloque de paridad dentro de la misma divisin (stripe). Un bloque se compone a menudo de muchos sectores consecutivos de disco. Una serie de bloques (un bloque de cada uno de los discos del conjunto) recibe el nombre colectivo de divisin (stripe). Si otro bloque, o alguna porcin de un bloque, es escrita en esa misma divisin, el bloque de paridad (o una parte del mismo) es recalculada y vuelta a escribir. El disco utilizado por el bloque de paridad est escalonado de una divisin a la siguiente, de ah el trmino bloques de

paridad distribuidos. Las escrituras en un RAID 5 son costosas en trminos de operaciones de disco y trfico entre los discos y la controladora. Los bloques de paridad no se leen en las operaciones de lectura de datos, ya que esto sera una sobrecarga innecesaria y disminuira el rendimiento. Sin embargo, los bloques de paridad se leen cuando la lectura de un sector de datos provoca un error de CRC. En este caso, el sector en la misma posicin relativa dentro de cada uno de los bloques de datos restantes en la divisin y dentro del bloque de paridad en la divisin se utilizan para reconstruir el sector errneo. El error CRC se oculta as al resto del sistema. De la misma forma, si falla un disco del conjunto, los bloques de paridad de los restantes discos son combinados matemticamente con los bloques de datos de los restantes discos para reconstruir los datos del disco que ha fallado al vuelo. Lo anterior se denomina a veces Modo Interino de Recuperacin de Datos (Interim Data Recovery Mode). El sistema sabe que un disco ha fallado, pero slo con el fin de que el sistema operativo pueda notificar al administrador que una unidad necesita ser reemplazada: las aplicaciones en ejecucin siguen funcionando ajenas al fallo. Las lecturas y escrituras continan normalmente en el conjunto de discos, aunque con alguna degradacin de rendimiento. La diferencia entre el RAID 4 y el RAID 5 es que, en el Modo Interno de Recuperacin de Datos, el RAID 5 puede ser ligeramente ms rpido, debido a que, cuando el CRC y la paridad estn en el disco que fall, los clculos no tienen que realizarse, mientras que en el RAID 4, si uno de los discos de datos falla, los clculos tienen que ser realizados en cada acceso. El RAID 5 requiere al menos tres unidades de disco para ser implementado. El fallo de un segundo disco provoca la prdida completa de los datos. El nmero mximo de discos en un grupo de redundancia RAID 5 es tericamente ilimitado, pero en la prctica es comn limitar el nmero de unidades. Los inconvenientes de usar grupos de redundancia mayores son una mayor probabilidad de fallo simultneo de dos discos, un mayor tiempo de reconstruccin y una mayor probabilidad de hallar un sector irrecuperable durante una reconstruccin. A medida que el nmero de discos en un conjunto RAID 5 crece, el MTBF (tiempo medio entre fallos) puede ser ms bajo que el de un nico disco. Esto sucede cuando la probabilidad de que falle un segundo disco en los N-1 discos restantes de un conjunto en el que ha fallado un disco en el tiempo necesario para detectar, reemplazar y recrear dicho disco es mayor que la probabilidad de fallo de un nico disco. Una alternativa que proporciona una proteccin de paridad dual, permitiendo as mayor nmero de discos por grupo, es el RAID 6. Algunos vendedores RAID evitan montar discos de los mismos lotes en un grupo de redundancia para minimizar la probabilidad de fallos simultneos al principio y el final de su vida til. Las implementaciones RAID 5 presentan un rendimiento malo cuando se someten a cargas de trabajo que incluyen muchas escrituras ms pequeas que el tamao de una divisin (stripe). Esto se debe a que la paridad debe ser actualizada para cada escritura,

lo que exige realizar secuencias de lectura, modificacin y escritura tanto para el bloque de datos como para el de paridad. Implementaciones ms complejas incluyen a menudo cachs de escritura no voltiles para reducir este problema de rendimiento. En el caso de un fallo del sistema cuando hay escrituras activas, la paridad de una divisin (stripe) puede quedar en un estado inconsistente con los datos. Si esto no se detecta y repara antes de que un disco o bloque falle, pueden perderse datos debido a que se usar una paridad incorrecta para reconstruir el bloque perdido en dicha divisin. Esta potencial vulnerabilidad se conoce a veces como agujero de escritura. Son comunes el uso de cach no voltiles y otras tcnicas para reducir la probabilidad de ocurrencia de esta vulnerabilidad.

[editar] RAID 6

Diagrama de una configuracin RAID 6. Cada nmero representa un bloque de datos; cada columna, un disco; p y q, cdigos Reed-Solomon. Un RAID 6 ampla el nivel RAID 5 aadiendo otro bloque de paridad, por lo que divide los datos a nivel de bloques y distribuye los dos bloques de paridad entre todos los miembros del conjunto. El RAID 6 no era uno de los niveles RAID originales. El RAID 6 puede ser considerado un caso especial de cdigo Reed-Solomon.1 El RAID 6, siendo un caso degenerado, exige slo sumas en el campo de Galois.2 Dado que se est operando sobre bits, lo que se usa es un campo binario de Galois ( ). En las representaciones cclicas de los campos binarios de Galois, la suma se calcula con un simple XOR. Tras comprender el RAID 6 como caso especial de un cdigo Reed-Solomon, se puede ver que es posible ampliar este enfoque para generar redundancia simplemente produciendo otro cdigo, tpicamente un polinomio en (m = 8 significa que estamos operando sobre bytes). Al aadir cdigos adicionales es posible alcanzar cualquier nmero de discos redundantes, y recuperarse de un fallo de ese mismo nmero de discos en cualquier puntos del conjunto, pero en el nivel RAID 6 se usan dos nicos cdigos. Al igual que en el RAID 5, en el RAID 6 la paridad se distribuye en divisiones (stripes), con los bloques de paridad en un lugar diferente en cada divisin.

El RAID 6 es ineficiente cuando se usa un pequeo nmero de discos pero a medida que el conjunto crece y se dispone de ms discos la prdida en capacidad de almacenamiento se hace menos importante, creciendo al mismo tiempo la probabilidad de que dos discos fallen simultneamente. El RAID 6 proporciona proteccin contra fallos dobles de discos y contra fallos cuando se est reconstruyendo un disco. En caso de que slo tengamos un conjunto puede ser ms adecuado que usar un RAID 5 con un disco de reserva (hot spare). La capacidad de datos de un conjunto RAID 6 es n-2, siendo n el nmero total de discos del conjunto. Un RAID 6 no penaliza el rendimiento de las operaciones de lectura, pero s el de las de escritura debido al proceso que exigen los clculos adicionales de paridad. Esta penalizacin puede minimizarse agrupando las escrituras en el menor nmero posible de divisiones (stripes), lo que puede lograrse mediante el uso de un sistema de archivos WAFL.

[editar] RAID 5E y RAID 6E

RAID 5E Se suele llamar RAID 5E y RAID 6E a las variantes de RAID 5 y RAID 6 que incluyen discos de reserva. Estos discos pueden estar conectados y preparados (hot spare) o en espera (standby spare). En los RAID 5E y RAID 6E, los discos de reserva estn disponibles para cualquiera de las unidades miembro. No suponen mejora alguna del rendimiento, pero s se minimiza el tiempo de reconstruccin (en el caso de los discos hot spare) y las labores de administracin cuando se producen fallos. Un disco de reserva no es realmente parte del conjunto hasta que un disco falla y el conjunto se reconstruye sobre el de reserva.

[editar] Niveles RAID anidados


Muchas controladoras permiten anidar niveles RAID, es decir, que un RAID pueda usarse como elemento bsico de otro en lugar de discos fsicos. Resulta instructivo

pensar en estos conjuntos como capas dispuestas unas sobre otras, con los discos fsicos en la inferior. Los RAID anidados se indican normalmente uniendo en un solo nmero los correspondientes a los niveles RAID usados, aadiendo a veces un + entre ellos. Por ejemplo, el RAID 10 (o RAID 1+0) consiste conceptualmente en mltiples conjuntos de nivel 1 almacenados en discos fsicos con un nivel 0 encima, agrupando los anteriores niveles 1. En el caso del RAID 0+1 se usa ms esta forma que RAID 01 para evitar la confusin con el RAID 1. Sin embargo, cuando el conjunto de ms alto nivel es un RAID 0 (como en el RAID 10 y en el RAID 50), la mayora de los vendedores eligen omitir el +, a pesar de que RAID 5+0 sea ms informativo. Al anidar niveles RAID, se suele combinar un nivel RAID que proporcione redundancia con un RAID 0 que aumenta el rendimiento. Con estas configuraciones es preferible tener el RAID 0 como nivel ms alto y los conjuntos redundantes debajo, porque as ser necesario reconstruir menos discos cuando uno falle. (As, el RAID 10 es preferible al RAID 0+1 aunque las ventajas administrativas de dividir el espejo del RAID 1 se perderan.) Los niveles RAID anidados ms comnmente usados son:

RAID 0+1: Un espejo de divisiones RAID 1+0: Una divisin de espejos RAID 30: Una divisin de niveles RAID con paridad dedicada RAID 100: Una divisin de una divisin de espejos

[editar] RAID 0+1

Diagrama de una configuracin RAID 0+1. Un RAID 0+1 (tambin llamado RAID 01, que no debe confundirse con RAID 1) es un RAID usado para replicar y compartir datos entre varios discos. La diferencia entre un RAID 0+1 y un RAID 1+0 es la localizacin de cada nivel RAID dentro del conjunto final: un RAID 0+1 es un espejo de divisiones.3

Como puede verse en el diagrama, primero se crean dos conjuntos RAID 0 (dividiendo los datos en discos) y luego, sobre los anteriores, se crea un conjunto RAID 1 (realizando un espejo de los anteriores). La ventaja de un RAID 0+1 es que cuando un disco duro falla, los datos perdidos pueden ser copiados del otro conjunto de nivel 0 para reconstruir el conjunto global. Sin embargo, aadir un disco duro adicional en una divisin, es obligatorio aadir otro al de la otra divisin para equilibrar el tamao del conjunto. Adems, el RAID 0+1 no es tan robusto como un RAID 1+0, no pudiendo tolerar dos fallos simultneos de discos salvo que sean en la misma divisin. Es decir, cuando un disco falla, la otra divisin se convierte en un punto de fallo nico. Adems, cuando se sustituye el disco que fall, se necesita que todos los discos del conjunto participen en la reconstruccin de los datos. Con la cada vez mayor capacidad de las unidades de discos (liderada por las unidades serial ATA), el riesgo de fallo de los discos es cada vez mayor. Adems, las tecnologas de correccin de errores de bit no han sido capaces de mantener el ritmo de rpido incremento de las capacidades de los discos, provocando un mayor riesgo de hallar errores fsicos irrecuperables. Dados estos cada vez mayores riesgos del RAID 0+1 (y su vulnerabilidad ante los fallos dobles simultneos), muchos entornos empresariales crticos estn empezando a evaluar configuraciones RAID ms tolerantes a fallos que aaden un mecanismo de paridad subyacente. Entre los ms prometedores estn los enfoques hbridos como el RAID 0+1+5 (espejo sobre paridad nica) o RAID 0+1+6 (espejo sobre paridad dual). Son los ms habituales por las empresas.[cita requerida]

[editar] RAID 1+0

Diagrama de una configuracin RAID 10. Un RAID 1+0, a veces llamado RAID 10, es parecido a un RAID 0+1 con la excepcin de que los niveles RAID que lo forman se invierte: el RAID 10 es una divisin de espejos.3

En cada divisin RAID 1 pueden fallar todos los discos salvo uno sin que se pierdan datos. Sin embargo, si los discos que han fallado no se reemplazan, el restante pasa a ser un punto nico de fallo para todo el conjunto. Si ese disco falla entonces, se perdern todos los datos del conjunto completo. Como en el caso del RAID 0+1, si un disco que ha fallado no se reemplaza, entonces un solo error de medio irrecuperable que ocurra en el disco espejado resultara en prdida de datos. Debido a estos mayores riesgos del RAID 1+0, muchos entornos empresariales crticos estn empezando a evaluar configuraciones RAID ms tolerantes a fallos que aaden un mecanismo de paridad subyacente. Entre los ms prometedores estn los enfoques hbridos como el RAID 0+1+5 (espejo sobre paridad nica) o RAID 0+1+6 (espejo sobre paridad dual). El RAID 10 es a menudo la mejor eleccin para bases de datos de altas prestaciones, debido a que la ausencia de clculos de paridad proporciona mayor velocidad de escritura.

[editar] RAID 30

Diagrama de una configuracin RAID 30. El RAID 30 o divisin con conjunto de paridad dedicado es una combinacin de un RAID 3 y un RAID 0. El RAID 30 proporciona tasas de transferencia elevadas combinadas con una alta fiabilidad a cambio de un coste de implementacin muy alto. La mejor forma de construir un RAID 30 es combinar dos conjuntos RAID 3 con los datos divididos en ambos conjuntos. El RAID 30 trocea los datos en bloque ms pequeos y los divide en cada conjunto RAID 3, que a su vez lo divide en trozos an menores, calcula la paridad aplicando un XOR a cada uno y los escriben en todos los discos del conjunto salvo en uno, donde se almacena la informacin de paridad. El tamao de cada bloque se decide en el momento de construir el RAID.Etc... El RAID 30 permite que falle un disco de cada conjunto RAID 3. Hasta que estos discos que fallaron sean reemplazados, los otros discos de cada conjunto que sufri el fallo son puntos nicos de fallo para el conjunto RAID 30 completo. En otras palabras, si alguno de ellos falla se perdern todos los datos del conjunto. El tiempo de recuperacin necesario (detectar y responder al fallo del disco y reconstruir el conjunto sobre el disco nuevo) representa un periodo de vulnerabilidad para el RAID.

[editar] RAID 100

RAID 100. Un RAID 100, a veces llamado tambin RAID 10+0, es una divisin de conjuntos RAID 10. El RAID 100 es un ejemplo de RAID cuadriculado, un RAID en el que conjuntos divididos son a su vez divididos conjuntamente de nuevo. Todos los discos menos unos podran fallar en cada RAID 1 sin perder datos. Sin embargo, el disco restante de un RAID 1 se convierte as en un punto nico de fallo para el conjunto degradado. A menudo el nivel superior de divisin se hace por software. Algunos vendedores llaman a este nivel ms alto un MetaLun o Soft Stripe. Los principales beneficios de un RAID 100 (y de los RAID cuadriculados en general) sobre un nico nivel RAID son mejor rendimiento para lecturas aleatorias y la mitigacin de los puntos calientes de riesgo en el conjunto. Por estas razones, el RAID 100 es a menudo la mejor eleccin para bases de datos muy grandes, donde el conjunto software subyacente limita la cantidad de discos fsicos permitidos en cada conjunto estndar. Implementar niveles RAID anidados permite eliminar virtualmente el lmite de unidades fsicas en un nico volumen lgico.

[editar] RAID 50

RAID 50.

Un RAID 50, a veces llamado tambin RAID 5+0, combina la divisin a nivel de bloques de un RAID 0 con la paridad distribuida de un RAID 5, siendo pues un conjunto RAID 0 dividido de elementos RAID 5. Un disco de cada conjunto RAID 5 puede fallar sin que se pierdan datos. Sin embargo, si el disco que falla no se reemplaza, los discos restantes de dicho conjunto se convierten en un punto nico de fallo para todo el conjunto. Si uno falla, todos los datos del conjunto global se pierden. El tiempo necesario para recuperar (detectar y responder al fallo de disco y reconstruir el conjunto sobre el nuevo disco) representa un periodo de vulnerabilidad del conjunto RAID. La configuracin de los conjuntos RAID repercute sobre la tolerancia a fallos general. Una configuracin de tres conjuntos RAID 5 de siete discos cada uno tiene la mayor capacidad y eficiencia de almacenamiento, pero slo puede tolerar un mximo de tres fallos potenciales de disco. Debido a que la fiabilidad del sistema depende del rpido reemplazo de los discos averiados para que el conjunto pueda reconstruirse, es comn construir conjuntos RAID 5 de seis discos con un disco de reserva en lnea (hot spare) que permite empezar de inmediato la reconstruccin en caso de fallo del conjunto. Esto no soluciona el problema de que el conjunto sufre un estrs mximo durante la reconstruccin dado que es necesario leer cada bit, justo cuando es ms vulnerable. Una configuracin de siete conjuntos RAID 5 de tres discos cada uno puede tolerar hasta siete fallos de disco pero tiene menor capacidad y eficiencia de almacenamiento. El RAID 50 mejora el rendimiento del RAID 5, especialmente en escritura, y proporciona mejor tolerancia a fallos que un nivel RAID nico. Este nivel se recomienda para aplicaciones que necesitan gran tolerancia a fallos, capacidad y rendimiento de bsqueda aleatoria. A medida que el nmero de unidades del conjunto RAID 50 crece y la capacidad de los discos aumenta, el tiempo de recuperacin lo hace tambin.

[editar] Niveles RAID propietarios


Aunque todas las implementaciones de RAID difieren en algn grado de la especificacin idealizada, algunas compaas han desarrollado implementaciones RAID completamente propietarias que difieren sustancialmente de todas las dems.

[editar] Paridad doble

Diagrama una configuracin RAID de doble paridad. Una adicin frecuente a los niveles RAID existentes es la paridad doble, a veces implementada y conocida como paridad diagonal.4 Como en el RAID 6, hay dos conjuntos de informacin de chequeo de paridad, pero a diferencia de aqul, el segundo conjunto no es otro conjunto de puntos calculado sobre un sndrome polinomial diferente para los mismos grupos de bloques de datos, sino que se calcula la paridad extra a partir de un grupo diferente de bloques de datos. Por ejemplo, sobre el grfico tanto el RAID 5 como el RAID 6 calcularan la paridad sobre todos los bloques de la letra A para generar uno o dos bloques de paridad. Sin embargo, es bastante fcil calcular la paridad contra mltiples grupos de bloques, en lugar de slo sobre los bloques de la letra A: puede calcularse la paridad sobre los bloques de la letra A y un grupo permutado de bloques. De nuevo sobre el ejemplo, los bloques Q son los de la paridad doble. El bloque Q2 se calculara como A2 xor B3 'xor P3, mientras el bloque Q3 se calculara como A3 xor P2 xor C1 y el Q1 sera A1 xor B2 xor C3. Debido a que los bloques de paridad doble se distribuyen correctamente, es posible reconstruir dos discos de datos que fallen mediante recuperacin iterativa. Por ejemplo, B2 podra recuperarse sin usar ninguno de los bloque x1 ni x2 mediante el clculo de B3 xor P3 xor Q2 = A2, luego A2 xor A3 xor P1 = A1, y finalmente A1 xor C3 xor Q1 = B2. No es recomendable que el sistema de paridad doble funcione en modo degradado debido a su bajo rendimiento.

[editar] RAID 1.5


RAID 1.5 es un nivel RAID propietario de HighPoint a veces incorrectamente denominado RAID 15. Por la poca informacin disponible, parece ser una implementacin correcta de un RAID 1. Cuando se lee, los datos se recuperan de ambos discos simultneamente y la mayora del trabajo se hace en hardware en lugar de en el controlador software.

[editar] RAID 7
RAID 7 es una marca registrada de Storage Computer Corporation, que aade cachs a un RAID 3 o RAID 4 para mejorar el rendimiento.

[editar] RAID S o RAID de paridad


RAID S es un sistema RAID de paridad distribuida propietario de EMC Corporation usado en sus sistemas de almacenamiento Symmetrix. Cada volumen reside en un nico disco fsico, y se combinan arbitrariamente varios volmenes para el clculo de paridad. EMC llamaba originalmente a esta caracterstica RAID S y luego la rebautiz RAID de paridad (Parity RAID) para su plataforma Symmetrix DMX. EMC ofrece tambin actualmente un RAID 5 estndar para el Symmetrix DMX.

[editar] Matrix RAID

Diagrama una configuracin Matriz RAID. Matrix RAID (matriz RAID) es una caracterstica que apareci por vez primera en la BIOS RAID Intel ICH6R. No es un nuevo nivel RAID. El Matrix RAID utiliza dos o ms discos fsicos, asignando partes de idntico tamao de cada uno de ellos diferentes niveles de RAID. As, por ejemplo, sobre 4 discos de un total de 600GB, se pueden usar 200 en raid 0, 200 en raid 10 y 200 en raid 5. Actualmente, la mayora de los otros productos RAID BIOS de gama baja slo permiten que un disco participen en un nico conjunto. Este producto est dirigido a los usuarios domsticos, proporcionando una zona segura (la seccin RAID 1) para documentos y otros archivos que se desean almacenar redundantemente y una zona ms rpida (la seccin RAID 0) para el sistema operativo, aplicaciones, etctera.

[editar] Linux MD RAID 10

RAID 10 La controladora RAID software del kernel de Linux (llamada md, de multiple disk, disco mltiple) puede ser usada para construir un conjunto RAID 1+0 clsico, pero tambin permite un nico nivel RAID 10 con algunas extensiones interesantes.3 En particular, soporta un espejado de k bloques en n unidades cuando k no es divisible por n. Esto se hace repitiendo cada bloque k veces al escribirlo en un conjunto RAID 0 subyacente de n unidades. Evidentemente esto equivale a la configuracin RAID 10 estndar. Linux tambin permite crear otras configuraciones RAID usando la controladora md (niveles 0, 1, 4, 5 y 6) adems de otros usos no RAID como almacenamiento multirruta y LVM2.

[editar] IBM ServeRAID 1E

Diagrama una configuracin RAID 1E.

La serie de adaptadores IBM ServeRAID soportan un espejado doble de un nmero arbitrario de discos, como se ilustra en el grfico. Esta configuracin es tolerante a fallos de unidades no adyacentes. Otros sistemas de almacenamiento como el StorEdge T3 de Sun soportan tambin este modo.

[editar] RAID Z
El sistema de archivos ZFS de Sun Microsystems implementa un esquema de redundancia integrado parecido al RAID 5 que se denomina RAID Z. Esta configuracin evita el agujero de escritura del RAID 55 y la necesidad de la secuencia leer-modificar-escribir para operaciones de escrituras pequeas efectuando slo escrituras de divisiones (stripes) completas, espejando los bloques pequeos en lugar de protegerlos con el clculo de paridad, lo que resulta posible gracias a que el sistema de archivos conoce la estructura de almacenamiento subyacente y puede gestionar el espacio adicional cuando lo necesita.

[editar] Posibilidades de RAID


[editar] Lo que RAID puede hacer

RAID puede mejorar el uptime. Los niveles RAID 1, 0+1 o 10, 5 y 6 (sus variantes, como el 50) permiten que un disco falle mecnicamente y que aun as los datos del conjunto sigan siendo accesibles para los usuarios. En lugar de exigir que se realice una restauracin costosa en tiempo desde una cinta, DVD o algn otro medio de respaldo lento, un RAID permite que los datos se recuperen en un disco de reemplazo a partir de los restantes discos del conjunto, mientras al mismo tiempo permanece disponible para los usuarios en un modo degradado. Esto es muy valorado por las empresas, ya que el tiempo de no disponibilidad suele tener graves repercusiones. Para usuarios domsticos, puede permitir el ahorro del tiempo de restauracin de volmenes grandes, que requeriran varios DVD o cintas para las copias de seguridad. RAID puede mejorar el rendimiento de ciertas aplicaciones. Los niveles RAID 0, 5 y 6 usan variantes de divisin (striping) de datos, lo que permite que varios discos atiendan simultneamente las operaciones de lectura lineales, aumentando la tasa de transferencia sostenida. Las aplicaciones de escritorio que trabajan con archivos grandes, como la edicin de vdeo e imgenes, se benefician de esta mejora. Tambin es til para las operaciones de copia de respaldo de disco a disco. Adems, si se usa un RAID 1 o un RAID basado en divisin con un tamao de bloque lo suficientemente grande se logran mejoras de rendimiento para patrones de acceso que implique mltiples lecturas simultneas (por ejemplo, bases de datos multiusuario).

[editar] Lo que RAID no puede hacer

RAID no protege los datos. Un conjunto RAID tiene un sistema de archivos, lo que supone un punto nico de fallo al ser vulnerable a una amplia variedad de riesgos aparte del fallo fsico de disco, por lo que RAID no evita la prdida de datos por estas causas. RAID no impedir que un virus destruya los datos, que stos se corrompan, que sufran la modificacin o borrado accidental por parte del usuario ni que un fallo fsico en otro componente del sistema afecten a los datos. RAID no simplifica la recuperacin de un desastre. Cuando se trabaja con un solo disco, ste es accesible normalmente mediante un controlador ATA o SCSI incluido en la mayora de los sistemas operativos. Sin embargo, las controladoras RAID necesitan controladores software especficos. Las herramientas de recuperacin que trabajan con discos simples en controladoras genricas necesitarn controladores especiales para acceder a los datos de los conjuntos RAID. Si estas herramientas no los soportan, los datos sern inaccesibles para ellas. RAID no mejora el rendimiento de todas las aplicaciones. Esto resulta especialmente cierto en las configuraciones tpicas de escritorio. La mayora de aplicaciones de escritorio y videojuegos hacen nfasis en la estrategia de buffering y los tiempos de bsqueda de los discos. Una mayor tasa de transferencia sostenida supone poco beneficio para los usuarios de estas aplicaciones, al ser la mayora de los archivos a los que se accede muy pequeos. La divisin de discos de un RAID 0 mejora el rendimiento de transferencia lineal pero no lo dems, lo que hace que la mayora de las aplicaciones de escritorio y juegos no muestren mejora alguna, salvo excepciones. Para estos usos, lo mejor es comprar un disco ms grande, rpido y caro en lugar de dos discos ms lentos y pequeos en una configuracin RAID 0. RAID no facilita el traslado a un sistema nuevo. Cuando se usa un solo disco, es relativamente fcil trasladar el disco a un sistema nuevo: basta con conectarlo, si cuenta con la misma interfaz. Con un RAID no es tan sencillo: la BIOS RAID debe ser capaz de leer los metadatos de los miembros del conjunto para reconocerlo adecuadamente y hacerlo disponible al sistema operativo. Dado que los distintos fabricantes de controladoras RAID usan diferentes formatos de metadatos (incluso controladoras de un mismo fabricante son incompatibles si corresponden a series diferentes) es virtualmente imposible mover un conjunto RAID a una controladora diferente, por lo que suele ser necesario mover tambin la controladora. Esto resulta imposible en aquellos sistemas donde est integrada en la placa base. Esta limitacin puede obviarse con el uso de RAID por software, que a su vez aaden otras diferentes (especialmente relacionadas con el rendimiento).
2001)

Fiabilidad y tolerancia

de fallos
Objetivos
Veremos

cules son los factores que

afectan a la fiabilidad de un sistema Tambin veremos algunas tcnicas para tolerar fallos de Software

Fallos de funcionamiento
Los

fallos de funcionamiento de un sistema pueden tener su origen en


Una especificacin inadecuada Errores de diseo del software Averas en el hardware Interferencias transitorias o permanentes en las comunicaciones
Nos

centraremos en el estudio de los errores de software

Conceptos bsicos

La

fiabilidad (reliability) de un sistema es una medida de su conformidad con una especificacin autorizada de su comportamiento Una avera (failure) es una desviacin del comportamiento de un sistema respecto de su especificacin Las averas se manifiestan en el comportamiento externo del sistema, pero son el resultado de errores (errors) internos Las causas mecnicas o algortmicas de los errores se llaman fallos (faults)

Fallos encadenados
Los

fallos pueden ser consecuencia de averas en los

componentes del sistema (que son tambin sistemas)


averia fallo error averia fallo

Tipos de fallos
Fallos

transitorios permanentes

desaparecen solos al cabo de un tiempo ejemplo: interferencias en comunicaciones


Fallos

permanecen hasta que se reparan ejemplo: roturas de hardware, errores de diseo de software
Fallos

intermitentes

fallos transitorios que ocurren de vez en cuando ejemplo: calentamiento de un componente de hardware

Debe impedirse que los fallos de todos estos tipos causen averas

Tipos de avera (failure modes)

Prevencin y tolerancia de fallos


Hay

dos formas de aumentar la fiabilidad de un sistema:


Prevencin de fallos
Se trata de evitar que se introduzcan fallos en el sistema antes de que entre en funcionamiento

Tolerancia de fallos
Se trata de conseguir que el sistema contine funcionando aunque se produzcan fallos En ambos casos el objetivo es

desarrollar sistemas con tipos de averas bien definidos

Prevencin de fallos
Se

realiza en dos etapas:

Evitacin de fallos
Se trata de impedir que se introduzcan fallos durante la construccin del sistema

Eliminacin de fallos
Consiste en encontrar y eliminar los fallos que se producen en el sistema una vez construido

Tcnicas de evitacin de fallos


Hardware

Utilizacin de componentes fiables Tcnicas rigurosas de montaje de subsistemas Apantallamiento de hardware


Software

Especificacin de requisitos rigurosa o formal Mtodos de diseo comprobados Lenguajes con abstraccin de datos y modularidad Utilizacin de entornos de desarrollo con computador (CASE) adecuados para gestionar los componentes

Tcnicas de eliminacin de fallos


Comprobaciones

Revisiones de diseo Verificacin de programas Inspeccin de cdigo


Pruebas

(tests)

Son necesarias, pero tienen problemas:


no pueden ser nunca exhaustivas

slo sirven para mostrar que hay errores, no que no los hay a menudo es imposible reproducir las condiciones reales los errores de especificacin no se detectan

Limitaciones de la prevencin de fallos


Los

componentes de hardware fallan, a pesar de las tcnicas de prevencin


La prevencin es insuficiente si
la frecuencia o la duracin de las reparaciones es inaceptable no se puede detener el sistema para efectuar operaciones de mantenimiento Ejemplo: naves espaciales no

tripuladas La alternativa es utilizar tcnicas de tolerancia de fallos

Grados de tolerancia de fallos


Tolerancia

completa (fail operational)

El sistema sigue funcionando, al menos durante un tiempo, sin perder funcionalidad ni prestaciones
Degradacin

aceptable (fail soft, graceful degradation)


El sistema sigue funcionando con una prdida parcial de funcionalidad o prestaciones hasta la reparacin del fallo
Parada

segura (fail safe)

El sistema se detiene en un estado que asegura la integridad del entorno hasta que se repare el fallo

El grado de tolerancia de fallos necesario depende de la aplicacin

Redundancia
La

tolerancia de fallos se basa en la redundancia Se utilizan componentes adicionales para detectar los fallos y recuperar el comportamiento correcto

Esto

aumenta la complejidad del sistema y puede introducir fallos adicionales Es mejor separar los componentes tolerantes del resto del Sistema

Redundancia en hardware
Redundancia

esttica

Los componentes redundantes estn siempre activos Se utilizan para enmascarar los fallos Ejemplo:
Redundancia modular triple ( N), TMR/NMR Redundancia dinmica

Los componentes redundantes se activan cuando se detecta un fallo Se basa en la deteccin y posterior recuperacin de los fallos Ejemplos:
sumas de comprobacin bits de paridad

Tolerancia de fallos de software


Tcnicas

para detectar y corregir errores de diseo Redundancia esttica


Programacin con N versiones
Redundancia

dinmica

Dos etapas: deteccin y recuperacin de fallos Bloques de recuperacin


Proporcionan recuperacin hacia atrs

Excepciones
Proporcionan recuperacin hacia adelante

Programacin con N versiones


Diversidad

de diseo

N programas desarrollados independientemente con la misma especificacin sin interacciones entre los equipos de desarrollo
Ejecucin

concurrente

proceso coordinador (driver)

intercambia datos con los procesos que ejecutan las versiones

todos los programas tienen las mismas entradas las salidas se comparan si hay discrepancia se realiza una votacin

Redundancia dinmica en software


Cuatro etapas:
1. Deteccin de errores
no se puede hacer nada hasta que se detecta un error

2. Evaluacin y confinamiento de los daos


diagnosis: averiguar hasta dnde ha llegado la informacin errnea

3. Recuperacin de errores
llevar el sistema a un estado correcto, desde el que pueda seguir funcionando (tal vez con funcionalidad parcial)

4. Reparacin de fallos
Aunque el sistema funcione, el fallo puede persistir y hay que Repararlo

También podría gustarte