Está en la página 1de 10

Siniestros Contingencia Continuidad del negocio BCP DRP Cloud Computing.

ting. Virtualizacin Seguridad Estndares DRaaS RPO RTO Costos

Siniestros
Arquitectura Avanzada 2011

Natalia Maurer

INTRODUCCIN..................................................................................................................... 2 SINIESTRO ........................................................................................................................ 2 CONTINGENCIA ................................................................................................................. 2 PLAN DE CONTINUIDAD DEL NEGOCIO O BCP ..................................................................... 2 PLAN DE RECUPERACIN ANTE DESASTRES O DRP ............................................................. 2 RECUPERACIN ANTE DESASTRES O DR ................................................................................ 2 DR EN LA NUBE .................................................................................................................... 3 VENTAJAS DE HACER DR EN LA NUBE ................................................................................. 3 DESVENTAJAS DE HACER DR EN LA NUBE .......................................................................... 4 SEGURIDAD EN LA NUBE........................................................................................................ 4 SAS 70 (STATEMENT ON AUDITING STANDARDS)............................................................... 4 SSAE 16 (STATEMENT ON STANDARDS FOR ATTESTATION ENGAGEMENTS) ........................ 5 HIPPA (HEALTH INSURANCE PORTABILITY AND ACCOUNTABILITY ACT)............................ 5 PCI DSS (PAYMENT CARD INDUSTRY DATA SECURITY STANDARD) .................................... 5 DRAAS (DISASTER RECOVERY AS A SERVICE) ........................................................................ 5 RECOVERY POINT OBJECTIVE (RPO) ................................................................................. 6 RECOVERY TIME OBJECTIVE (RTO)................................................................................... 6 RENDIMIENTO .................................................................................................................. 6 CONSISTENCIA .................................................................................................................. 6 SEPARACIN GEOGRFICA ................................................................................................. 6 PLAN DE DR EN LA NUBE .......................................................................................................7 DR TRADICIONAL...............................................................................................................7 DR EN LA NUBE ..................................................................................................................7 ALTERNATIVAS DE DR EN LA NUBE........................................................................................ 8 UN EJEMPLO PRCTICO ......................................................................................................... 8 CONCLUSIN ........................................................................................................................ 9 REFERENCIAS ....................................................................................................................... 9

Introduccin
El tema a tratar durante el presente trabajo es siniestros. Empezaremos definiendo algunos trminos:

Siniestro
[RAE] Dao de cualquier importancia que puede ser indemnizado por una compaa aseguradora. [WIKIPEDIA] Se refiere a un accidente o incidente que ha causado graves daos a personas o a la propiedad. Nos ocuparemos de los daos a la continuidad del negocio producidos por una contingencia que inhabilita (o degrada) el centro de cmputos.

Contingencia
[RAE] posibilidad de que algo suceda o no suceda. Riesgo.

Plan de continuidad del negocio o BCP


Define las acciones a tomar en caso que una determinada contingencia inhabilite algn rea de operaciones o tecnologa. El objetivo del plan es permitir la recuperacin de las operaciones crticas del negocio. El BCP incluye al plan de recuperacin ante desastres o DRP (Disaster Recovery Plan).

Plan de recuperacin ante desastres o DRP


Define las acciones a tomar en caso que una determinada contingencia inhabilite el centro de cmputos. Su objetivo es permitir la recuperacin de las operaciones crticas de IT. Es el conjunto de polticas, procedimientos, normas y lineamientos relacionados con la recuperacin luego de un desastre natural o inducido por humanos.

Recuperacin ante desastres o DR


Un plan de recuperacin ante desastres de IT es crtico para la continuidad del negocio. Si ocurriese un desastre, la supervivencia de la compaa depende de su habilidad para replicar los sistemas de IT y los datos que posee. La recuperacin ante desastres desde la perspectiva de IT consiste en asegurarse que los sistemas y los datos pueden recuperarse en caso de una contingencia. Ya sea que un desastre afecte el entorno de produccin u ocurra un corte por un perodo prolongado de tiempo, lo importante es poder recuperarse y tener los sistemas y los datos resguardados y para que vuelvan a estar disponibles. Las alternativas para elegir el DRP que ms se ajusta a una empresa dependen de 2 cosas: El RTO (Recovery Time objective): es cun rpido necesita recuperarse del desastre El presupuesto que tenga la empresa para dedicarle al DRP. Ambas cosas estn muy relacionadas. Por ejemplo, si la empresa necesita recuperar sus datos en un perodo de 7 das, va a ser mucho ms barato que si necesita recuperar los datos y la infraestructura en 5 minutos.

DR del modo tradicional


En una primera instancia, para soportar DR dentro de las instalaciones de la organizacin debemos: Usar redundancia de los sistemas/datos: por ejemplo usando RAID. Asegurar la provisin constante de energa: sin sobretensiones o picos.

Proteger a los sistemas de acceso fsico no autorizado. Medidas de seguridad para evitar y controlar incendios. Implementar IDS, IPS y otras medidas de seguridad.

El prximo nivel en la estrategia organizaciones para DR consiste en: Resguardo de datos usando cintas Resguardo de datos en data centers remotos. Alta disponibilidad de la infraestructura de IT usando una ubicacin off-site replicada.

Las organizaciones que hacen uso de las estrategias mencionadas, deben incurrir en importantes gastos para configurar el centro de recuperacin. Tambin ocurre que estas compaas tienen inconvenientes para prever el crecimiento que van a tener a lo largo del tiempo.

DR en la nube
En la actualidad, la mayora de las compaas estn analizando varias alternativas para proteger sus datos y duplicar su infraestructura. Una alternativa que salta a la vista es la nube. Los servicios de DR provistos a travs de la nube le brindan a la empresa la capacidad y la flexibilidad para hacer resguardos remotos, reduccin de costos y alta disponibilidad de los sistemas de IT para permitir la continuidad del negocio. El uso de cloud computing cambia la forma en que se encara la recuperacin ante contingencias, bajando el costo al mismo tiempo que reduce el RTO. En la nube los servidores estn virtualizados, entonces en lugar de solo resguardar los datos, ahora podemos resguardar el servidor completo off-site. Es sencillo tomar una instantnea del servidor todas las noches, y enviarla off-site. Entonces en este caso estamos hablando de hacer resguardos y recuperarlos en cuestin de horas en lugar de en das.

Ventajas de hacer DR en la nube


Le permite a la organizacin enfocar sus inversiones en las actividades del negocio en lugar de usarlas para centros de DR. Permite incrementar la infraestructura, aunque no haya sido previsto durante la planificacin del DR. Existes mltiples proveedores de servicios en la nube en mltiples ubicaciones geogrficas. Esto permite resguardar en distintas reas alrededor del mundo. Reduce la necesidad de espacio en data centers, infraestructura IT y recursos de IT. Permite que compaas ms pequeas tengan soluciones de DR que antes solo se encontraban en grandes empresas. Pueden incorporarse recursos a la nube rpidamente con costos que escalan lentamente sin requerir grandes inversiones anticipadas.

Desventajas de hacer DR en la nube


Si la empresa no tiene conexin a internet por interrupciones de servicio, ya sea debido al proveedor o a un DoS distribuido, va a perder su acceso a la nube. Cuestiones de seguridad que hay que tener en cuenta a la hora de decidir qu cosas van a estar en la nube. Es muy importante elegir un proveedor confiable que este alineado con los requisitos de la compaa.

Seguridad en la nube
Una preocupacin comn cuando se pasa a la nube es la seguridad en lo que concierne a proteccin de datos y privacidad, seguridad fsica y seguridad de las aplicaciones. La mayora de las empresas tienen un 95% de sus datos no sensibles. La recomendacin usual es poner todos los datos no sensibles en la nube y tener un sistema de resguardo distinto para el 5% restante. Es importante asegurarse que el data center que la empresa elija se tome la seguridad en serio. Lo importante es saber en qu data center y en qu servidor se estn almacenando los datos. Tambin se puede verificar que estn aplicando las medidas de seguridad necesarias: Ver si son auditados en SSAE 16 o SAS 70 Ver si tienen clientes que son certificados HIPPA o PCI. Si ofrecen firewalls, antivirus y deteccin de intrusos.

SAS 70 (Statement on Auditing Standards )


SAS 70 fue el estndar original internacionalmente reconocido para el reporte de los procesos operativos y prcticas de un data center. Hay 2 tipos de reportes SAS 70. El tipo I reporta los controles operacionales. El

tipo II es ms minucioso y reporta qu tan efectivos son dichos controles en un perodo especfico de tiempo (6 meses).

SSAE 16 (Statement on Standards for Attestation Engagements)


En abril del 2010, el AICPA (American Institute of Certified Public Accountants) anunci el retiro de SAS 70 para ser reemplazado por SSAE 16 y estndares refinados. SSAE 16 es efectivo desde el 11 de junio del 2011.Tambin tiene 2 tipos de informes, el primero mira el diseo y el segundo analiza la efectividad.

HIPPA (Health Insurance Portability and Accountability Act)


Standard para proteger informacin sensible de pacientes. Toda compaa que maneja registros de pacientes debe asegurar que se estn implementando y siguiendo las medidas se seguridad para proteger los procesos, las redes y el acceso fsico a los datos.

PCI DSS (Payment Card Industry Data Security Standard)


Standard requerido por cualquier compaa que acepta pagos con tarjetas de crdito. La intencin es proteger los datos del dueo de la tarjeta construyendo una red segura, protegiendo los datos almacenados, controlando el acceso y manteniendo polticas de seguridad de datos.

DRaaS (Disaster Recovery as a Service)

Las compaas se estn dando cuenta que muchas aplicaciones pueden ponerse a disposicin como servicios y DR no es la excepcin. Esto da como resultado el modelo de Disaster Recovery as a Service (DRaas) o DR bajo demanda. DRaaS est adquiriendo popularidad entre las empresas, principalmente por su modelo de precios pay as you use (solo luego del desastre se paga por un servicio ms poderoso y ms caro para correr las aplicaciones) que permite bajar costos y usar plataformas virtuales automatizadas que pueden reducir tiempo de recuperacin luego de una falla. Las plataformas virtuales automatizadas implican que en una primera instancia solo se

sincronizan a la nube una pequea porcin de los datos, pero al detectar un desastre se sincronizan todos los recursos adicionales.

Requisitos clave de un servicio de DR


Los requerimientos pueden estar basados en decisiones del negocio, como el costo monetario del tiempo de inactividad de los sistemas o la prdida de datos, o en el rendimiento y la precisin de las aplicaciones.

Recovery Point Objective (RPO)


Tolerancia de prdida de datos. En un sistema de DR representa el punto en el tiempo del resguardo de datos ms reciente previo al fallo.

Recovery Time Objective (RTO)


Tiempo de inactividad aceptado del sistema. Incluye el tiempo para detectar el fallo, preparar los servidores que sean necesarios en el sitio alternativo, inicializar la aplicacin fallida y realizar la reconfiguracin necesaria de la red (para re-rutear los pedidos). Tener un RTO muy bajo permite la continuidad del negocio, permitiendo que una aplicacin aparente haber permanecido operativa a pesar del desastre.

Rendimiento
Impacto en la operacin normal luego de la recuperacin. Para que un servicio de DR sea til, debera tener un impacto mnimo en la performance de la aplicacin.

Consistencia
Precisin en los datos de la aplicacin y las salidas. El servicio de DR debe asegurar que luego de que ocurre un fallo, la aplicacin puede recuperarse en un estado consistente.

Separacin geogrfica
El sitio de DR nunca debera ser impactado por el mismo desastre que el primario. Ambos sitios deberan estar geogrficamente separados para asegurar que un nico desastre no impacte a ambos.

El nivel de proteccin de datos y la velocidad de recuperacin dependen mecanismo de backup utilizado y la los recursos disponibles en el sitio alternativo. En general, los servicios de DR caen bajo una de las siguientes categoras: Hot Backup Site: proporciona un conjunto de servidores espejados que estn en stand-by disponibles para correr las aplicaciones cuando ocurre el desastre, proporcionando RTO y RPO mnimos. Suelen usar replicacin asincrnica para prevenir las prdidas de datos ocasionadas por el desastre. Warm Backup Site: busca mantener el sitio alternativo al da usando replicacin sincrnica o asincrnica dependiendo del RPO necesario. Tambin existen servidores en stand-by disponibles en caso de un desastre, pero se mantienen en un estado warm, lo cual significa que puede llevar un tiempo corto que estn online. Cold Backup site: los datos suelen replicarse peridicamente al sitio alternativo, lo cual conlleva un RPO ms elevado. Los servidores en el sitio alternativo no estn inmediatamente disponibles, sino que pueden pasar horas o das hasta que el hardware est disponible luego del desastre. O sea que el RTO tambin es ms elevado. Es ms difcil soportar la continuidad del negocio con este tipo de servicio, pero son una alternativa de mucho menor costo para aplicaciones que no requieren una alta disponibilidad.

Plan de DR en la nube
El proceso de elaborar un plan de DR empieza con la identificacin y priorizacin de las aplicaciones, los servicios y los datos. Debe determinarse para cada uno el tiempo de inactividad aceptado (downtime) antes de que produzca un impacto significativo en el negocio. Luego la prioridad y el RTO van a determinar la alternativa de DR. Una combinacin de costo y objetivos de recuperacin son los que marcan distintos niveles de recuperacin ante desastres.

DR Tradicional
Un sitio secundario de DR significa invertir en espacio adicional de data center, conectividad y servidores. Tambin conlleva costos operativos adicionales (energa, HVAC, mantenimiento, personal).

DR en la nube
Proporciona instantneas de mquinas virtuales de servidores fsicos o virtuales del data center primario. La empresa paga por almacenar las instantneas en un estado suspendido y la replicacin de datos desde el sitio primario y el secundario. Solo paga la IaaS en caso de un desastre para poner online el substituto del sitio primario. El sitio de DR en la nube puede tenerse online en segundos o minutos. Esto se traduce en una prdida de datos de ese intervalo de tiempo solamente.

Un sitio fsico de DR opera solo durante la sincronizacin de datos o en caso de un desastre. El tiempo que toma ponerlo operativo es mayor que en el caso de DR en la nube, resultando en una prdida de datos. Si no hay conectividad disponible con el sitio secundario, se pueden llegar a requerir operaciones manuales para iniciar las operaciones en el sitio de DR.

El sitio de DR en la nube puede dispararse usando una notebook con acceso a internet desde cualquier lado.

Alternativas de DR en la nube
Aplicaciones y DR administrados por el proveedor
Una alternativa cada vez ms popular es poner tanto el sitio primario como el sitio de DR en la nube, y tener ambos manejados por el proveedor. Esto permite que las empresas tengan todos los beneficios de cloud computing. Se elimina de esta forma la necesidad infraestructura dentro de la compaa. En este caso, la eleccin del proveedor del servicio y la negociacin de los acuerdos de nivel de servicio (SLA) son de vital importancia. Al darle el control al proveedor del servicio, la empresa tiene que estar absolutamente segura de que el proveedor es capaz de brindar servicio ininterrumpido dentro del SLA definido, tanto para el sitio primario como para el de DR.

Resguardo y recuperacin desde la nube


En este caso, las aplicaciones y los datos permanecen dentro de la organizacin. Los datos son resguardados en la nube y recuperados a hardware de la empresa en caso de un desastre. En otras palabras, el resguardo en la nube se vuelve un substituto del resguardo remoto en cintas.

Resguardo y recuperacin en la nube


Los datos no se recuperan a la infraestructura propia de la empresa, sino a mquinas virtuales en la nube. Esto requiere tanto almacenamiento como recursos en la nube. La recuperacin puede realizarse cuando ocurre el desastre o de forma continua (pre-staging). Hacerlo continuamente permite mantener las virtuales relativamente al da a travs de resguardos programados, lo cual es de utilidad si se tienen RTOs bajos.

Replicacin a mquinas virtuales en la nube


Para aplicaciones que requieren RTO y RPO agresivos, la replicacin es la opcin a elegir. La replicacin a mquinas virtuales puede usarse para proteger tanto las instancias de produccin locales de la empresa como las de la nube. La replicacin sirve tanto para cloud-VM-to-cloud-VM como para on-premises-to-cloud-VM.

Para que el mecanismo funcione de forma eficiente, sera ideal llevar a cabo una optimizacin WAN entre la empresa y la nube. Tambin es importante probar el plan de DR peridicamente para asegurarse que funcione correctamente y que se cumplen los requisitos de RTO y RPO.

Un ejemplo prctico
Tomemos como ejemplo Online Tech (una empresa estadounidense que maneja data centers) y su manejo de recuperacin ante desastres. Online Tech movi toda su infraestructura IT (23 servidores) a una nube privada propia a fines del 2009. Tomaron sus 23 servidores, los convirtieron en servidores virtuales y en la actualidad corren sus 23 servidores virtuales en 2 servidores fsicos y un entorno SAN (storage rea network). En lo que respecta a la recuperacin ante desastres, lo que hacen es resguardar los 23 servidores virtuales a un data center secundario a 90 kilmetros de distancia y tambin tienen un servidor separado (un warm site) para levantar esos servidores en caso de que algo le ocurra a su infraestructura primaria.

La experiencia de Online Tech fue muy positiva. Ellos mencionan las siguientes ventajas: Su trabajo es mucho ms sencillo desde que pasaron a la nube, tanto en el despliegue como en sus resguardos diarios. Prueban su DRP cada seis meses y les lleva solamente 4 horas. Su RTO baj dramticamente. Bajaron sus costos.

Conclusin
DRaaS es una solucin emergente para organizaciones que quieren controlar su propia infraestructura pero no mantener sistemas de DR ellos mismos. Con DRaaS una organizacin no construye directamente un sitio para contingencias, sino que confa en un proveedor para que lo haga. Las ventajas que proporciona la nube en cuanto a elasticidad y reduccin de costos son beneficios significativos en un escenario de DR. Sin embargo, muchas de las complejidades siguen existiendo y es esencial llevar a cabo el proceso con cuidado y responsabilidad para asegurarse que el plan de contingencia va a funcionar y proveer el nivel de servicio requerido.

Referencias

http://resource.onlinetech.com/private-cloud-computing-how-it-changes-disaster-recovery/ http://cssinnovations.blogspot.com/2010/11/how-cloud-computing-can-help-in.html http://www.prnewswire.com/news-releases/moving-into-the-cloud-essential-for-small-business-disasterrecovery-123805424.html http://blog.netmagicsolutions.com/article/disaster-recovery-as-a-service-draas/

También podría gustarte