Está en la página 1de 12

Sistemas modulares: Evolucin de la confiabilidad

Por Neil Rasmussen Suzanne Niles

Informe interno N 76

Resumen ejecutivo
La naturaleza demostr desde los comienzos que, en un sistema complejo, los diseos modulares son los que sobreviven y se desarrollan. Un importante factor que contribuye a esa capacidad es la ventaja clave en trminos de confiabilidad que ofrece la tolerancia a las fallas, en virtud de la cual un sistema modular, ante la falla de ciertos mdulos, puede seguir operando con los mdulos que funcionan correctamente mientras se realizan las reparaciones necesarias. En el campo de los centros de datos, la nocin de diseo modular ya se ha instalado en las nuevas arquitecturas que ofrecen tolerancia a las fallas para servidores y sistemas de almacenamiento. A medida que los centros de datos siguen evolucionando y adoptando elementos del diseo de la naturaleza, la infraestructura fsica para redes crticas (NCPI) tambin debe evolucionar para dar cabida a nuestras estrategias de supervivencia, recuperacin y crecimiento.

2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

Introduccin
La modularidad es una tcnica establecida para organizar y simplificar un sistema complejo. Desde los ejemplos ms elementales (las pilas de una linterna) hasta los ms complejos (las clulas de un organismo), el xito histrico de la modularidad es difcil de cuestionar. No obstante, cuando se trata de sistemas creados por el hombre que estn por atravesar un proceso de transicin evolutiva del diseo monoltico al modular, puede haber escepticismo y comienzos lentos hasta que la modularidad se instale y comience a rendir los frutos inherentes a su probada eficacia.

La infraestructura fsica para redes crticas (NCPI) de los centros de datos se encuentra en esa etapa de transicin. Mientras que las ventajas evidentes desde el punto de vista fsico de la arquitectura de bloques de construccin escalabilidad, flexibilidad, simplicidad y transportabilidad se comprenden con facilidad y no suelen cuestionarse demasiado, en la industria bajo anlisis un aspecto del diseo modular se ha convertido en objeto de debate: la confiabilidad.

La aplicacin de la simple modalidad clsica de anlisis de la confiabilidad de sistemas a esta nueva forma de hacer las cosas (ms partes implican mayor riesgo de fallas) resulta, en el mejor de los casos, incompleta y, en el peor de los casos, engaosa. En este informe s e pretende ilustrar, mediante estudios de casos, el hecho de que la modularidad no solo brinda los beneficios que resultan ms obvios y fciles de entender, sino un beneficio ms sutil, menos comprendido y ms importante en trminos de confiabilidad: la tolerancia a las fallas. La capacidad de tolerancia a las fallas inherente al diseo modular proporciona una nueva y potente defensa contra las fallas, al introducir en los sistemas complejos una estrategia de confiabilidad que no solo resulta adecuada, sino superior a lo buscado.

Estudio de caso tomado de la naturaleza: Primeras formas de vida


La historia de la modularidad es mucho ms antigua que
Foto cortesa de David Walker, Brian Darnton

los centros de datos y las pilas de linternas. Algunos de los sistemas no modulares ms antiguos los organis mos unicelulares vivan en la Tierra hace tres mil millones de aos. El registro fsil de esos organismos revela que desarrollaron conchas, tentculos, bocas, brazos, pinzas y otras tantas estructuras intrincadas. Algunos adquirieron tamaos sorprendente s, hasta seis pulgadas (15 centmetros) de ancho. Esos complejos diseos

Primera forma de vida unicelular compleja

2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

unicelulares monolticos dominaron la cadena alimentaria elemental de la Tierra durante miles de millones de aos.

Ms tarde, hace unos 500 millones de aos, surgieron los organismos multicelulares. En tan solo decenas de millones de aos, evolucionaron tan rpido que echaron por tierra tres mil millones de aos de evolucin de los complicados organismos unicelulares y, reemplazando a estos ltimos, se convirtieron en la forma de vida dominante.

La modularidad como ventaja de los organismos multicelulares


Por qu prevaleci la estructura modular y multicelular sobre la arraigada estructura monoltica?

Escalabilidad y capacidad de crecimiento. El crecimiento de los sistemas, tanto en trminos de tamao como de incorporacin de nuevas capacidades, se lograba con el solo agregado de mdulos (clulas) que podan interactuar con las existentes empleando interfaces estndar.

Primera forma de vida multicelular

Proceso de duplicacin ms simple. Duplicar cierta cantidad de clulas ms pequeas y menos complejas era ms sencillo, rpido y confiable que duplicar un nica clula complicada. Capacidad de contar con funciones especializadas por mdulo. La delegacin y especializacin de las tareas de las clulas proporcionaba los n iveles de eficacia y eficiencia propios del trabajo en equipo. En los primeros organismos multicelulares, un tipo de clula poda cumplir la funcin de locomocin, otro, la de proteccin, otro, la de percepcin de la presencia de alimento, y as sucesivamente. Rpida adaptacin al entorno. Mediante el agregado, la eliminacin o la modificacin de clulas, era posible poner a prueba cambios estructurales incrementales con mayor rapidez, a fin de adoptarlos o rechazarlos. Tolerancia a las fallas. Gracias a las clulas redundantes, no se degradaba el sistema ante la falla de clulas individuales, lo que permita la "reparacin concurrente de clulas sin tiempo de inactividad del sistema (discapacidad o muerte en este caso).

El ltimo atributo mencionado arriba, la tolerancia a las fallas, es una ventaja clave en trminos de confiabilidad de los sistemas modulares respecto de los monolticos. La modularidad divide un sistema en piezas ms pequeas, lo que facilita la redundancia de los componentes, a fin de q ue ante la falla de uno, o varios, de ellos no se vea afectado de manera adversa el funcionamiento del sistema. Con un simple raspn, la piel humana puede perder cientos de clulas; sin embargo, nuestro cuerpo no deja de funcionar a causa de esa prdida. Otras clulas siguen adelante mientras se hacen las reparaciones necesarias. Los humanos no inventamos la modularidad: somos modulares. Con billones de mdulos (clulas) por persona, da a da vivimos en carne propia las ventajas de la tolerancia a las fallas.
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

Estudio de caso tomado del campo de la informtica: Unidades de disco


En los tiempos en que los centros de datos estaban compuestos de grandes computadoras (mainframe), los dispositivos de almacenamiento eran voluminosos discos duros de diseo exclusivo, con platos metlicos de 14 pulgadas ubicados uno sobre otro, elaborados mecanismos de lectura y escritura, y gabinetes del tamao de una lavadora. En 1978, en IBM patentaron la idea de usar sistemas de discos ms pequeos, pero no la llevaron adelante porque pensaron que una estructura de ese tipo nunca sera tan confiable como los diseos monolticos convencionales. El estudio y la puesta en prctica de la tolerancia a las fallas recin empezaban a desarrollarse, y bsicamente estaban restringidas a l a industria aeroespacial, en la que la falla de componentes de sistemas electrnicos poda costar vidas.1
Mainframe IBM 3370 Almacenamiento en disco Foto IBM Archives, reproduccin autorizada

En 1987, los investigadores de Berkeley advirtieron la creciente brecha entre la velocidad computacional y la velocidad de acceso para almacenamiento , y vieron el surgimiento de las unidades de disco externas para las computadoras personales como una oportunidad para emplearlas como bloques de construccin de un sistema que ofreciera tasas de transferencia de datos ms veloces. Un ao ms tarde presentaron un estudio histrico, "Razones para implementar Conjuntos de discos redundantes econmicos (RAID) (A Case for Redundant Arrays of Inexpensive Disks (RAID)), en el que proponan diversos esquemas para escritura de datos (niveles RAID) que podan emplear esos sistemas para almacenar, recuperar y restablecer datos. En 1990, la teora y el hardware se fundieron en la utilizacin de los discos de 5,25 pulgadas para computadoras personales, que haban evolucionado tanto como para ofrecer la capacidad, el rendimiento y la confiabilidad necesarios para su uso en los primeros sistemas RAID. Esos nuevos dispositivos de almacenamiento modulares ofrecan distintas relaciones entre redundancia y velocidad de lectura y escritura, y ocupaban una fraccin del espacio en el piso necesario para instalar los grandes dispositivos de almacenamiento que reemplazaron.

Hoy, en el marco de una realidad en la que las operaciones informticas son el centro de casi toda industria, incluidas las reas de salud y actividades militares, los centros de datos pueden ser esenciales. Y tanto es as que una falla podra ocasionar la prdida de vidas. Por lo tanto, la tolerancia a las fallas es cada vez ms importante para su diseo, incluso independientemente de lo que dictaminen los intereses econmicos. 2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

La modularidad como ventaja de los sistemas RAID


Por qu prevalecieron los sistemas RAID sobre los antiguos dispositivos de almacenamiento monolticos?

Escalabilidad y capacidad de crecimiento. Es posible aumentar fcilmente la capacidad de almacenamiento aumentando la cantidad de mdulos por sistema, o agregando sistemas.

Sistema RAID

Proceso de duplicacin ms simple. Es mucho ms fcil producir las mltiples unidades pequeas que funcionan como mdulos del sistema RAID que las grandes y complicadas unidades de antes. Capacidad de contar con funciones especializadas por mdulo. Las diferentes unidades de un sistema RAID pueden emplearse para obtener mayor capacidad de almacenamiento, velocidad de acceso o redundancia, segn cul sea el nivel RAID definido para el sistema. Asimismo, los sistemas RAID en s mismos pueden considerarse mdulos en una escala mayor, y puede asignarse una aplicacin diferente a cada sistema RAID. Rpida adaptacin al entorno. Es posible agregar o eliminar unidades, y modificar fcilmente el nivel RAID para contemplar las relaciones deseadas entre capacidad, velocidad y redundancia. Tolerancia a las fallas. Los esquemas de escritura de datos de los sistemas RAID incorporan niveles de redundancia tales que permiten recuperar datos cuando falla una unidad.

Para sorpresa de sus diseadores, la entusiasta recepcin de los sistemas RAID en el mercado no se debi tanto a la mayor velocidad que ofrecan el objetivo que impuls su diseo sino a la mayor confiabilidad que proporcionaba la caracterstica de tolerancia a las fallas. Hasta que los autores del estudio de 1988 mostraron las posibilidades de tolerancia a las fallas del diseo RAID durante presentaciones en vivo no hacan ms que retirar una unidad sin que se interrumpiera el funcionamiento del sistema, haba predominado la forma tpica, aunque errnea, de interpretar la confiabilidad, previa al desarrollo del concepto de tolerancia a las fallas: un sistema integrado por unidades mltiples deba ser menos confiable porque tena ms piezas.

Estudio de caso tomado del campo de la informtica: Servidores Blade


Los servidores Blade son el elemento central en el proceso de transicin hacia el diseo modular que est registrndose mientras escribimos el presente informe. Durante muchos aos, los servidores autosoportados tradicionales crecieron en tamao y velocidad, y les fueron asignadas cada vez ms tareas a medida que la informtica en red s e expanda. A medida que surgan nuevas necesidades se incorporaban servidores en los centros de datos, por lo general como solucin rpida, sin demasiada coordinacin ni planificacin. No era raro que los operadores de centros de datos advirtieran que se haban
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

agregado servidores sin su conocimiento. La consecuente complejidad de los bloques y el cableado cada vez generaba ms confusin, errores e inflexibilidad.

Los servidores Blade, cuya aparicin data de 2001, son un ejemplo puro y muy simple de la arquitectura modular: las unidades de un chasis de servidores Blade son idnticas desde el punto de vista fsico, tienen procesadores idnticos, y pueden configurarse y emplearse para cualquier fin que desee el usuario. Su lanzamiento sum muchos de los b eneficios de la modularidad al campo de los servidores: escalabilidad, facilidad de duplicacin,
Servidores convencionales

funciones especializadas y adaptabilidad.

Pero si bien esas ventajas clsicas de la arquitectura modular han hecho que los servidores Blade tengan cada vez ms presencia en los centros de datos, su mximo potencial no se aprovechar hasta tanto no se implemente de manera generalizada una capacidad clave del diseo modular: la tolerancia a las fallas. No hace mucho que se encuentran disponibles en el mercado con valores accesibles los servidores Blade que ofrecen tolerancia a las fallas servidores que tienen incorporada una lgica de failover para transferir la operacin de las unidades que presentan fallas a las que funcionan correctamente . Los niveles de confiabilidad de esos servidores sobrepasarn los alcanzados con las tcnicas habituales en la actualidad, que consisten en emplear software redundante y clusters de servidores individuales. As, los servidores Blade constituirn la arquitectura de servidores dominante en los centros de datos. Con la automatizacin de la funcin de tolerancia a las fallas, los analistas de la industria pronostican una rpida migracin a los servidores Blade en el curso de los prximos cinco aos.

La modularidad como ventaja de los servidores Blade


Por qu prevalecern los servidores Blade sobre los servidores autosoportados ms voluminosos?

Escalabilidad y capacidad de crecimiento. Es posible aumentar fcilmente la capacidad computacional mediante la incorporacin de mdulos (unidades Blade). Proceso de duplicacin ms simple. Es mucho ms fcil producir mltiples unidades Blade pequeas que servidores enteros. El suministro de energa, los ventiladores del sistema de refrigeracin, las conexiones de la red y otros componentes de respaldo se encuentran centralizados en el chasis y son compartidos por las unidades Blade, lo que simplifica la estructura.

Servidor Blade (10 unidades Blade en un chasis)

2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

Capacidad de contar con funciones especializadas por mdulo. Cada unidad Blade independiente pueden configurarse con las a plicaciones de software que desee el usuario. Rpida adaptacin al entorno. Es posible agregar o eliminar unidades Blade en funcin de las necesidades de negocios o financieras, as como reconfigurarlas para ejecutar distintas aplicaciones. Tolerancia a las fallas. Gracias a la lgica de failover incorporada, que transfiere sin inconvenientes la operacin de las unidades que presentan fallas a otras, es posible hacer frente a la falla de una unidad de manera automtica.

La cambiante definicin de falla en el campo de los sistemas informticos


Los estudios de casos precedentes revelan el predominio del diseo modular sobre el complejo diseo monoltico, que responde a motivos inherentes a la naturaleza de la modularidad. Uno de esos motivos, la tolerancia a las fallas, tiene gran importancia para el futuro de los centros de datos. Cuando todos los servidores y dispositivos de almacenamiento de los centros de datos ofrezcan la caracterstica de tolerancia a las fallas, cambiar la definicin de falla en el contexto informtico.

Imaginemos dos casos de fallas diferentes que pueden producirse en un centro de datos (Figura 1). A la derecha se ilustra la falla de todos los racks, como la que se producira en el caso de que fallara la nica UPS grande que protege todo el centro de datos, lo que causara la cada de la carga. A la derecha se muestra la falla de un rack. En los centros de datos convencionales, a los ojos de los gerentes de Sistemas, en ambos casos se tratara de la misma falla, porque en el caso de la falla de un rack la interdependencia de servidores, sistemas de discos, switches y routers seguramente causara efectos en cascada que dejaran inactivo todo el centro de datos.

A medida que comienzan a imponerse los nuevos diseos modulares basados en conjuntos de componentes tanto para la actividad computacional como para el almacenamiento, los gerentes de Sistemas comienzan a ver la falla ilustrada a la izquierda un rack como un tipo de falla menos mala, dado que la redundancia de recursos ahora ofrece la posibilidad de supervivencia del centro de datos incluso ante la falla de las unidades independientes. A medida que las arquitecturas que ofrecen tolerancia a las fallas se difundan, los centros de datos admitirn una mayor cantidad de fallas de unidades sin que se produzca la cada total de los sistemas. Cuando sea un hecho la capacidad de tolerar fallas sin inconvenientes que prometen desde sus comienzos los servidores Blade, los centros de datos podrn permanecer activos ante la falla de un rack, o incluso de dos, tres o ms.

2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

Figura 1 Dos casos de fallas que pueden producirse en un centro de datos


Vista de planta, cuatro hileras de ocho racks cada una

Falla un rack

Fallan todos los racks

Implicaciones para la NCPI


El nuevo paradigma de la gestin de fallas la expectativa de que inevitablemente algunos mdulos fallarn, combinada con un esquema slido que permita superar las fallas tiene implicaciones respecto del modo en que la nueva arquitectura informtica debera verse protegida por su infraestructura fsica para redes crticas. Por ejemplo, a medida que los centros de datos ofrecen mayor tolerancia a las fallas en su capa informtica, resultar insatisfactorio ofrecer proteccin de energa con una nica UPS grande, dado que la falla de esa UPS hara caer todo el sistema, un resultado innecesario en un centro de datos tolerante a las fallas capaz de superar la prdida de un rack. Si las unidades UPS se encuentran distribuidas en todo el centro de datos, a razn de una UPS por rack, la falla de cualquiera de las unidades UPS solo interrumpir el funcionamiento de un rack, no de todo el sistema. A pesar del mayor nmero de unidades UPS, que aumenta las probabilidades de fallas de unidades UPS independientes, el sistema puede tolerar esas fallas. Si para que quede fuera de funcionamiento todo el sistema deben fallar tres racks, debern fallar tres unidades UPS simultneamente para que se produzca la cada del sistema, evento muy poco probable, mucho menos probable que la falla de una nica UPS grande. Por ese motivo, la teora de la confiabilidad respalda enfticamente las arquitecturas de energa y refrigeracin modulares distribuidas a medida que los sistemas informticos ofrecen mayor grado de tolerancia a las fallas.

NCPI monoltica vs. NCPI modular


La arquitectura de la infraestructura fsica para redes crticas (NCPI) ha permanecido en gran medida invariable en los 30 aos de historia de los centros de datos. Desde las salas de cmputos ms pequeas hasta las infraestructuras empresariales ms grandes, el modelo persistente de infraestructura
2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

fsica ha consistido en una planta centralizada para el suministro de proteccin de energa y refrigeracin. La implementacin de esa clase de infraestructura da como resultado una configuracin nica y monoltica de equipos y conexiones. Al reemplazar una arquitectura como la descrita por un diseo modular, no solo se posibilita que la NCPI respalde adecuadamente los equipos informticos modulares y tolerantes a las fallas, sino que los propios componentes de la NCPI pueden aprovechar los beneficios de la modularidad, incluidas las ventajas de confiabilidad que ofrece la tolerancia a las fallas.
UPS monoltica centralizada

La modularidad como ventaja de la NCPI


Por qu reemplazar la NCPI modular a la NCPI monoltica convencional?

Escalabilidad y capacidad de crecimiento. Una NCPI modular puede dimensionarse para contemplar los requisitos informticos del centro de datos en un momento dado, y crecer en funcin de las necesidades. Esta ventaja es especialmente importante en relacin con l a NCPI, dado que, segn las prcticas tradicionales, se implementan sistemas de energa y refrigeracin para ofrecer soporte a los requisitos informticos mximos proyectados, lo que genera un importante desperdicio tanto en concepto de gastos de capital como operativos.

Proceso de duplicacin ms simple. El diseo modular implica producir una gran cantidad de unidades pequeas, en lugar de una pequea cantidad de grandes unidades. El mayor volumen de produccin implica menos defectos; el diseo ms simple y pequeo implica mayor grado de automatizacin y menos trabajo manual durante la produccin, lo que implica menos defectos.

Capacidad de contar con funciones especializadas por mdulo. Las unidades de proteccin de energa y refrigeracin pueden producirse en una variedad de configuraciones para satisfacer las necesidades especficas de disponibilidad y refrigeracin de diferentes partes del centro de datos.

Rpida adaptacin al entorno. Con la incorporacin de nuevos equipos y los cambios de los componentes informticos cada dos o tres aos, los elementos del centro de datos se revisan permanentemente. Los nuevos equipos pueden tener diferentes tamaos o formas, diferentes requisitos de energa o refrigeracin, diferentes tomacorrientes, etctera. Es posible
UPS modular por rack

expandir o reconfigurar la NCPI modular fcilmente para contemplar los requisitos de IT cambiantes.

2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

10

Tolerancia a las fallas. As como los equipos informticos tolerantes a fallas permiten la operacin continua del centro de datos cuando falla un com ponente informtico, los equipos tolerantes a fallas de la NCPI permiten la operacin continua de los sistemas de energa o refrigeracin cuando falla un componente de la NCPI. La tolerancia a las fallas se logra mediante la implementacin de unidades de N CPI redundantes, o mediante la redundancia interna de los componentes que integran esas unidades de NCPI, por ejemplo, trabajando con mdulos de potencia adicionales en una UPS.

Al igual que en los estudios de casos anteriores, los primeros cuatro atributos precedentes son necesarios para el xito del diseo, pero el quinto la tolerancia a las fallas es esencial. Ms aun, como el centro de datos depende absolutamente de la energa y la refrigeracin para su funcionamiento, es tan importante contar con niveles de confiabilidad basados en la tolerancia a las fallas en la NCPI como en los equipos informticos que esta protege. Un centro de datos tolerante a fallas que no cuente con el respaldo de una NCPI tolerante a las fallas no tendra ms sentido que un puente colgante con un pedestal slido pero con cables dbiles.

Conclusin
La transicin del diseo monoltico al modular constituye un camino evolutivo natural para los sistemas complejos, a causa de las ventajas que ofrece el segundo en cuanto a eficiencia, flexibilidad y confiabilidad. El anlisis de casos de xito permite advertir ms fcilmente las posibilidades que ofrece la modularidad para introducir mejoras importantes, incluso revolucionarias en sistemas que fueron monolticos desde su concepcin y que nunca fueron comprendidos de otra forma. La tolerancia a las fallas y otros atributos clave de la modularidad escalabilidad, adaptabilidad, y capacidad de especializacin y duplicacin son tan evidentes, e inevitables, en los sistemas modulares creados por el hombre como lo eran en los naturales.

El mundo informtico ya ha sido testigo de las ventajas mencionadas con el surgimiento de diseos modulares para esquemas de almacenamiento y tareas computacionales: sistemas RAID y servidores Blade. Y ms importante aun, los centros de datos ya estn preparados para seguir el ejemplo de industrias como la aeroespacial, e implementar en todos sus sistemas la ventaja de la modularidad que se aplica a los sistemas de misin crtica desde la dcada de 1970: la tolerancia a las fallas. En la nocin de tolerancia a las fallas se admite el hecho de que el control cuidadoso de la calidad de los componentes es solo el primer paso hacia la confiabilidad de los sistemas, y que la operacin continua de los sistemas ante la falla de componentes es la tctica ms importante en materia de confiabilidad.

2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

11

A medida que la modularidad y la tolerancia a las fallas se convierten en el nuevo modelo de diseo de centros de datos, la infraestructura fsica para redes crticas debe avanzar en la misma direccin, tanto para proteger los centros de datos con eficacia como para aprovechar los beneficios de la modularidad a fin de mejorar sus propios niveles de eficiencia, flexibilidad y confiabilidad.

Informes internos relacionados


Informe interno de APC N 117, Infraestructura fsica para redes crticas: Optimizacin del valor de negocio Informe interno de APC N 116, Estandarizacin y modularidad en la Infraestructura fsica para redes crticas

Acerca de los autores


Neil Rasmussen es uno de los fundadores y Director de Tecnologa de American Power Conversion. En APC, administra el mayor presupuesto mundial de Investigacin y Desarrollo dedicado al tema de la infraestructura de energa, refrigeracin y racks para redes crticas; los principales centros de desarrollo de productos se ubican en Massachusetts, Missouri, Dinamarca, Rhode Island, Taiwn e Irlanda. En la actualidad, lidera los proyectos de APC para el desarrollo de soluciones modulares escalables para centros de datos.

Antes de fundar APC en el ao 1981, Neil recibi los ttulos de Bachelor y Master en Ingeniera Elctrica del MIT, donde realiz su tesis sobre el anlisis de una fuente de potencia de 200 mW para un reactor de fusin Tokamak. Desde 1979 hasta 1981, trabaj para MIT Lincoln Laboratories en sistemas de almacenamiento energtico de volante y sistemas de energa elctrica solar.

Suzanne Niles es autora de informes internos para el Centro de Estudios de la Infraestructura Fsica para Redes Crticas (NCPI) de APC. Estudi matemticas en el Wellesley College y obtuvo el ttulo de Bachelor en Ciencias Informticas en el MIT, con una tesis sobre reconocimiento de caracteres manuscritos. Ha contribuido a la formacin de pblicos diversos por ms de 25 aos utilizando diferentes medios, desde manuales de software hasta fotografas y canciones para nios.

2005 American Power Conversion. Todos los derechos reservados. Queda prohibida la utilizacin, reproduccin, fotocopiado, transmisin o almacenamiento en cualquier sistema de recuperacin de cualquier tipo de esta publicacin, en todo o en parte, sin el consentimiento escrito del titular del derecho de autor. www.apc.com Rev 2005-0

12

También podría gustarte