Documentos de Académico
Documentos de Profesional
Documentos de Cultura
RTO (Recovery Time Objective) : Otras Technologies
RTO (Recovery Time Objective) : Otras Technologies
MTBF (acrónimo de Mean Time Between Failures) es la media aritmética (promedio) del
tiempo entre fallos de un sistema. El MTBF es típicamente parte de un modelo que asume
que el sistema fallido se repara inmediatamente (el tiempo transcurrido es cero), como
parte de un proceso de renovación. En cambio, el MTTF (Mean Time To Failure) mide el
tiempo medio entre fallo con la suposición de un modelo en que el sistema fallido no se
repara.
La respuesta dependerá de la criticidad de cada aplicación. Aquí de nuevo debemos analizar cada
caso; no será lo mismo la aplicación que da servicio a las cajas en una gran superficie, que la
aplicación para el cálculo de la nómina, que se ejecuta una vez al mes.
Recuperación de desastres
Pasos a seguir para recuperar las aplicaciones y los datos en caso de contingencia:
Restaurar el ordenador (dependiendo del tipo de problema pueden ser minutos, horas o días).
Restaurar las copias de seguridad
Reanudar la operación
A partir de este punto se deberán repetir las transacciones que faltan, desde el momento de la
caída hasta el momento de la recuperación, que serán más cuanto mayor sean RPO y RTO.
El RPO determina el objetivo de posible pérdida máxima de datos introducidos desde el último
backup, hasta la caída del sistema, y no depende del tiempo de recuperación. La casuística es
amplísima, y aquí se ilustran algunos casos:
MTD:
La suma de RTO y WRT se define como el tiempo de inactividad máximo tolerable
(MTD) que define la cantidad total de tiempo que puede interrumpirse un proceso de
negocios sin causar consecuencias inaceptables. Este valor debe ser definido por el
equipo de administración comercial o por alguien como CTO, CIO o gerente de TI.
WRT:
En esta etapa, todos los sistemas se recuperan, la integridad del sistema o los datos
se verifican y todos los sistemas críticos pueden reanudar las operaciones normales.
El tiempo de recuperación de trabajo (WRT) determina la cantidad máxima de tiempo
tolerable que se necesita para verificar la integridad del sistema o de los datos. Esto
podría ser, por ejemplo, verificar las bases de datos y los registros, asegurándose de
que las aplicaciones o servicios se estén ejecutando y estén disponibles. En la
mayoría de los casos, esas tareas las realiza el administrador de la aplicación, el
administrador de la base de datos, etc. Cuando se verifican y / o recuperan todos los
sistemas afectados por el desastre, el entorno está listo para reanudar la producción
nuevamente.