Está en la página 1de 3

Otras technologies:

MTBF (acrónimo de Mean Time Between Failures) es la media aritmética (promedio) del
tiempo entre fallos de un sistema. El MTBF es típicamente parte de un modelo que asume
que el sistema fallido se repara inmediatamente (el tiempo transcurrido es cero), como
parte de un proceso de renovación. En cambio, el MTTF (Mean Time To Failure) mide el
tiempo medio entre fallo con la suposición de un modelo en que el sistema fallido no se
repara.

RTO (Recovery Time Objective)


Expresa el tiempo durante el cual una organización pueda tolerar la falta de funcionamiento de sus
aplicaciones y la caída de nivel de servicio asociada, sin afectar a la continuidad del negocio.

La respuesta dependerá de la criticidad de cada aplicación. Aquí de nuevo debemos analizar cada
caso; no será lo mismo la aplicación que da servicio a las cajas en una gran superficie, que la
aplicación para el cálculo de la nómina, que se ejecuta una vez al mes.

Recuperación de desastres

Pasos a seguir para recuperar las aplicaciones y los datos en caso de contingencia:

 Restaurar el ordenador (dependiendo del tipo de problema pueden ser minutos, horas o días).
 Restaurar las copias de seguridad
 Reanudar la operación

A partir de este punto se deberán repetir las transacciones que faltan, desde el momento de la
caída hasta el momento de la recuperación, que serán más cuanto mayor sean RPO y RTO.

Costes de Recuperación de Desastres


Definir los valores de RPO y RTO le puede proporcionar resultados sorprendentes que podrían no
ser aceptables para la gestión. Una vez fijados, podrá establecer su estrategia de recuperación, que
llevará asociados unos costes que varían en función precisamente del RPO y del RTO.
RPO (Recovery Point Objective)
RPO se refiere al volumen de datos en riesgo de pérdida que la organización considera tolerable.
¿Las transacciones de cuánto tiempo estamos dispuestos a perder, o a tener que reintroducir al
sistema?

La respuesta va a depender del volumen de transacciones por unidad de tiempo, y de los


mecanismos de backup, pero siempre aumenta el volumen de datos ‘huérfanos’ a medida que pasa
el tiempo desde la última copia de seguridad.

El RPO determina el objetivo de posible pérdida máxima de datos introducidos desde el último
backup, hasta la caída del sistema, y no depende del tiempo de recuperación. La casuística es
amplísima, y aquí se ilustran algunos casos:

Dependiendo del tipo de Backup:


 Caso 1: Backup diario en cinta a las 09:00 PM.

 Caso 2: Varios ‘Snapshots’ durante el día.


Dependiendo de la naturaleza del negocio:
 Caso 3: La gestión de las transacciones bursátiles no puede parar, no se puede perder ni
demorar ni una sola transacción, su RPO es 0.
 Caso 4: Un almacén robotizado se parará si no tiene sistema, y con mucho movimiento estará
en situación de colapso en pocos minutos.

MTD:
La suma de RTO y WRT se define como el tiempo de inactividad máximo tolerable
(MTD) que define la cantidad total de tiempo que puede interrumpirse un proceso de
negocios sin causar consecuencias inaceptables. Este valor debe ser definido por el
equipo de administración comercial o por alguien como CTO, CIO o gerente de TI.

WRT:
En esta etapa, todos los sistemas se recuperan, la integridad del sistema o los datos
se verifican y todos los sistemas críticos pueden reanudar las operaciones normales.
El tiempo de recuperación de trabajo (WRT) determina la cantidad máxima de tiempo
tolerable que se necesita para verificar la integridad del sistema o de los datos. Esto
podría ser, por ejemplo, verificar las bases de datos y los registros, asegurándose de
que las aplicaciones o servicios se estén ejecutando y estén disponibles. En la
mayoría de los casos, esas tareas las realiza el administrador de la aplicación, el
administrador de la base de datos, etc. Cuando se verifican y / o recuperan todos los
sistemas afectados por el desastre, el entorno está listo para reanudar la producción
nuevamente.

También podría gustarte