Está en la página 1de 14

Confiabilidad

Cmo calcular la disponibilidad o confiabilidad de un sistema?

Administradores
1

1. Introduccin

arquitectura distribuida
hacen que ms gente tenga acceso a los recursos internos del computador, Pero se ha incrementado el riesgo de penetracin externa a travs de las lneas de comunicacin. Uno de los objetivos claves de los sistemas distribuidos es proporcionar fcil acceso a los datos. A menos que se tomen medidas en contrario, los sistemas distribuidos ofrecen fcil acceso autorizado y no autorizado.
3

2. Confiabilidad
En sistemas no redundantes En sistemas redundantes

En sistemas no redundantes
Definicin de tres trminos: MTBF: tiempo medio entre fallas MTTR: tiempo medio para reparar A: disponibilidad Tiempo medio entre fallas y tiempo medio para reparar son lo que el nombre implica y son aplicados a cualquier componente del sistema. Tiempo medio para reparar, en el caso de un sistema, incluye la recuperacin de la base de datos y el tiempo para reejecucin.
5

Disponibilidad es la fraccin de tiempo en que cualquier componente se encuentra operacional, y est definido por la siguiente relacin: disponibilidad:

A=

MTBF MTBF + MTTR

Disponibilidad puede ser definida a nivel de sistema o subsistema usando la misma relacin, donde MTBF viene a ser el tiempo para cualquier falla. El tiempo medio tpico para reparar es del orden de 30 a 60 minutos para sistemas no-redundantes, si el personal y los repuestos estn en el sitio adecuado.
6

La disponibilidad de un subsistema o sistema puede ser calculada desde las disponibilidades de sus componentes. Si todos los componentes de un sistema deben estar operativos (esto es, no-redundante) para que el sistema este operacional, la disponibilidad A del sistema esta dada por el producto de las disponibilidades de cada uno de sus componentes Ai como sigue:

A( sistema ) = ( Ai )
Para tener un sistema no-redundante confiable, cada componente del sistema debe ser confiable.
7

Ejercicio 1
Si un nodo tiene 10 componentes (discos, procesadores, memorias), cada uno con una confiabilidad de 0.99, Cul es la disponibilidad completa del nodo?

A (nodo) = (0.99)10 ~ 0.9 = 90%

Ejercicio 2
Si un sistema tiene 10 nodos, cada uno con disponibilidad de 90%, Cul es la disponibilidad del sistema? A (sistema) = (0.9)10 ~ 0.348 ~ 34,8%

conclusiones
Un sistema batch debera tener alrededor de 95% de disponibilidad para ser til, y un sistema interactivo debera tener un 98% de disponibilidad. As, la disponibilidad de los nodos debera ser muy alta (alrededor de 0.995) y la disponibilidad de los componentes en un nodo debe ser al menos del orden de 0.999 de confiabilidad.

10

Confiabilidad en sistemas redundantes


Un sistema redundante es un sistema el cual tiene dos o ms componentes de cada tipo. La redundancia permite que un sistema sea failsoft. Las tcnicas de redundancia y failsoft han sido usadas por la industria militar y aerospacial por muchos aos para alcanzar una alta confiabilidad. Una base de datos replicada es un ejemplo de sistema distribuido redundante.
11

La confiabilidad A de un sistema redundante, donde un componente debe ser operacional para que el sistema sea operacional, est dado por: A
(sistema)

= 1 - (1 - Ai)

donde Ai es la disponibilidad del i-esimo componente.

12

Si el sistema est compuesto de dos nodos (uno respaldo del otro), cada uno de los cuales tiene una disponibilidad de 0.99, la confiabilidad del sistema es: A (sistema) = 1 - (1-0.99)2 = 0.9999 As un sistema redundante de dos nodos tiene una disponibilidad muy alta, comparado con un sistema con un slo nodo con la misma disponibilidad.

13

Sin embargo, a pesar que la disponibilidad puede ser muy alta con un sistema redundante, la mantencin puede ser un problema. Si el tiempo medio entre fallas para un nodo es 1.000 horas, entonces un sistema de 20 nodos, requiere mantencin cada 50 horas en algn nodo, para mantener la disponibilidad muy alta. Un nivel alto de redundancia y de mantencin puede ser muy caro.
14

También podría gustarte