Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Pfgmap505 PDF
Pfgmap505 PDF
(UCI)
Enero 2008
UNIVERSIDAD PARA LA COOPERACIN INTERNACIONAL
(UCI)
PROFESOR TUTOR
________________________________
LECTOR No.1
________________________________
LECTOR No.2
SUSTENTANTE
DEDICATORIA
i
AGRADECIMIENTOS
ii
INDICE
Dedicatoria..i
Agradecimientosii
ndice..iii
ndice de Cuadros..viii
ndice de Figuras..ix
Listado de Abreviaturas....x
Resumen Ejecutivo..xii
1-Introduccin.......................1
2- Marco Terico......................6
negocio (BIA)12
iii
por desastre....24
iv
2.7 Administracin de Cambios (ITIL).........................................................68
3 - Marco metodolgico..........................................................................................71
v
4.1 Creacin del equipo del proyecto96
4.1.3.1 Patrocinador.98
y Desarrollo.100
5 Conclusiones y Recomendaciones...124
vi
6 Bibliografa127
ANEXOS.130
ANEXO 1.131
ANEXO 2.136
ANEXO 3.137
vii
NDICE DE CUADROS
Cuadro 1. Mximo tiempo permitido para estar sin sistema por tipo de industria8
viii
NDICE DE FIGURAS
de 12 horas......16
ix
LISTADO DE ABREVIATURAS
AR........Anlisis de Riesgos
x
MTD.......Siglas en ingls del trmino mximo tiempo de cada tolerable (Maximal
Time Down)
xi
RESUMEN EJECUTIVO
El trmino desastre, de acuerdo a Toigo (1989), significa la interrupcin del
negocio debido a la prdida o incapacidad de acceso a los elementos que
contienen la informacin necesaria para la operacin normal de la organizacin. El
autor se refiere a la prdida o interrupcin de las funciones que procesan los datos
de la compaa o a una prdida en s de la informacin. La prdida de datos
puede presentarse debido a borrados accidentales, intencionales o por la
destruccin de los medios que almacenan la informacin de la empresa. Esta
prdida puede ser causada por fenmenos naturales o inducida por el factor
humano.
Para mitigar las consecuencias que podra causar un desastre, nacen los planes
de recuperacin por desastre o DRP por sus siglas en ingls (Disaster Recovery
Planning), los cuales consisten bsicamente en las acciones para recuperarse en
caso de que se presente un desastre. Incluye la planeacin de pasos para evitar
riesgos, mitigarlos o transferirlos a alguien ms por medio de seguros. El DRP es
aplicable a todos los aspectos de un negocio, sin embargo se utiliza normalmente
en el contexto de operaciones para el procesamiento de datos. (Hiatt, 2000)
El negocio del procesamiento de tarjetas de crdito, mueve diariamente una
cantidad de dinero tal, que requiere una alta disponibilidad (entre 99% y 100%) de
los sistemas informticos que soportan este procesamiento. Dada la competencia
que se desarrolla en el mercado de las tarjetas de crdito, un fallo en los sistemas
de informacin, que impida completar las transacciones que ingresan a estos
sistemas, puede significar prdidas importantes, tanto monetarias como en la
imagen de las compaas emisoras de tarjetas. Por lo anterior, es de gran valor
para las compaias procesadoras de tarjetas de crdito, contar con un plan de
contingencias, que le permita continuar con el negocio, en caso de que se
presente un imprevisto que impacte los sistemas que soportan el normal
funcionamiento de este negocio.
El objetivo general de este proyecto consisti en disear una gua que le permita a
la organizacin crear un procedimiento de recuperacin ante desastre, natural o
inducido, para el sistema informtico de tarjeta de crdito ubicado en el centro de
datos de un grupo financiero, tal que pueda ser ejecutado por personal tcnico
externo al sitio de desastre y en pocas horas se pueda restablecer el servicio
normalmente brindado.
Como parte de los objetivos especficos, se dise una gua para crear un plan de
mantenimiento que garantice que el procedimiento a definir se mantenga vigente y
finalmente se dieron los lineamientos para crear un plan de simulacros de
desastre que ayude a comprobar la efectividad del plan maestro.
xii
La metodologa que se utiliz para satisfacer los objetivos antes mencionados
consisti en una mezcla de teoras, a saber, la de administracin profesional de
proyectos que recomienda el PMI (Project Management Institute), la cual se utiliz
para desarrollar el plan de recuperacin por desastre (DRP) y el marco de trabajo
que provee ITIL (Information Technology Infrastructure Library) el cual se utiliz
como soporte, tanto para crear el plan de mantenimiento del DRP como para
desarrollar el plan de simulacin o validacin del DRP, el cual pretende comprobar
que el DRP planeado funciona. Como proceso de administracin de riesgos, se
utiliz la metodologa ABCD, creada por la organizacin EDS, lder mundial de
outsourcing.
xiii
1
1-INTRODUCCIN
Un desastre dentro de una organizacin puede significar muchas cosas, desde
una prdida importante de datos hasta un desastre natural que destruye la
infraestructura tecnolgica de la organizacin. Cualquier evento que cause una
interrupcin en la operacin normal del negocio se considera un desastre. Sin un
plan efectivo para recuperacin de desastres, la mayora de organizaciones no
sobreviven ante interrupciones importantes de su negocio.
Los planes para darle continuidad a una actividad, realmente no son nuevos,
diariamente se convive tanto con estos que se hace imperceptible su utilizacin.
Sea cual sea la medida que se tome para afrontar un riesgo, las acciones buscan
siempre alguno de los siguientes objetivos: mitigar, evitar o transferir el riesgo
identificado.
El presente trabajo, pretende crear una gua que permita crear un procedimiento o
plan de recuperacin a seguir en caso de que se presente un desastre (natural o
inducido) en el sistema informtico de una compaa procesadora de tarjetas de
crdito, de manera que los procesos se puedan habilitar en un sitio alterno y la
procesadora contine su operacin normal desde otro lugar mientras se recupera
el sitio original.
Por lo tanto el trabajo a realizar en este proyecto tiene un enfoque para ser
aplicado en una procesadora de tarjeta de crdito, organizacin que tiene
centralizada la operacin diaria de tarjeta de crdito de una o ms instituciones
financieras. Esto significa, en trminos generales, que todas las gestiones,
sistemas y procesos relacionados con una tarjeta de crdito de un Banco
procesado, son ejecutadas por medio de los sistemas de informacin de la
procesadora.
transaccin que pase por sus sistemas, es decir, sobre todas las transacciones
enviadas y recibidas por cada ente involucrado, tales como las operadoras de
tarjeta de crdito, las compaas emisoras, las compaas adquirentes de
comercios, las marcas de tarjeta como VISA, se cobra una comisin que
multiplicada por cientos de transacciones diarias representan miles de dlares
cada da. Por lo anterior, la disponibilidad de los sistemas de informacin que
soportan todas estas transacciones y la necesidad de asegurar la continuidad de
este negocio se convierten en un asunto de vital importancia para las
organizaciones relacionadas con el proceso.
El sitio alterno o lugar escogido para hospedar los sistemas que se van a utilizar
como medida de contingencia en caso de desastre tambin es una parte
importante que se debe tomar en cuenta en este tipo de proyectos. Los sitios
alternos varan desde una simple rea cerca del centro de operaciones hasta el
alquiler de un lugar exclusivo para esta funcin en una empresa especializada y
con reconocimiento mundial para este tipo de actividades. Estos ltimos cuentan
con todas las facilidades en equipo, infraestructura y seguridad, sin embargo,
tienen un alto costo el cual se vuelve relativo cuando se habla de que puede ser la
diferencia entre seguir o no en el negocio.
procesos operativos diarios realizados por el centro de datos, tales como cierre de
cajas, fines de da, generacin de reportes, entre otros.
2- MARCO TERICO
El trmino desastre, de acuerdo a Toigo (1989), significa la interrupcin del
negocio debido a la prdida o incapacidad de acceso a los activos que contienen
la informacin requeridos para la operacin normal. El autor se refiere a la prdida
o interrupcin de las funciones que procesan los datos de la compaa o a una
prdida en s de los datos. La prdida de datos puede presentarse debido a
borrados accidentales o intencionales o por la destruccin de los medios de
almacenamiento. Esta prdida puede ser causada por fenmenos naturales o
inducida por el factor humano.
Cuadro 1. Mximo tiempo permitido para estar sin sistema por tipo de industria.
(Hiatt, 2000)
Industria
Financiera 2.0
Distribucin 3.3
Miscelneas 4.8
Manufactura 4.9
Aseguradoras 5.6
Promedio 4.8
0 1 2 3 4 5 6 7
Das
Aunque el estudio de la Universidad de Minnesota tiene ms de 20 aos, muchos
expertos consideran que su grado de exactitud an se mantiene. (Hiatt, 2000)
Servicio al cliente
Operaciones internas
Asuntos legales
Asuntos financieros.
La razn ms comn para que los datos de una compaa no puedan ser
recuperados es debido a fallas al salvar la informacin en una copia de respaldo.
Como muestra el Cuadro 3, los errores humanos causan el dao ms grande.
(Hiatt, 2000).
17
Causas Porcentaje
Errores humanos no intencionales 50-80%
Empleados deshonestos 10-17%
Desastres naturales 10-15%
Sabotaje de empleados 3-4%
Agua 2-3%
Personas ajenas a la compaa 1-3%
Localizacin geogrfica
Topografa del rea
Proximidad a fuentes de poder, fuentes de agua o aeropuertos
Grado de accesibilidad a la organizacin.
Historial de interrupciones
Historial del rea a las amenazas naturales
Respaldo de datos
Permitir que los servicios de informacin puedan ser reiniciados tan rpido
como fsicamente sea posible luego de alguna falla en los sistemas de
informacin.
Requerimientos de negocio
Requerimiento legal
Acceso restringido
Facilidad de acceso a los activos las 24 horas del da, los 365 das del ao.
Construccin resistente a los desastres
Sistemas para prevencin de incendios
Fuentes alternas de poder.
Controles ambientales adecuados.
Proteccin ante magnetismos
Comunicaciones a prueba de fallas
Personal de seguridad con el entrenamiento adecuado
Las mejores prcticas dictan que los planes se deben actualizar al menos una vez
al ao. Sin embargo las condiciones de la organizacin podran hacer que se
requieran revisiones ms continuas. La siguiente lista ayuda a determinar cuando
un plan debe ser actualizado (Weil, 2004):
Las pruebas dan un alto grado de confiabilidad de que el plan funciona. Cada
problema es diferente, pero un plan que ha sido validado tiene muchas
probabilidades de ser exitoso cuando se requiera aplicar. Entre los beneficios ms
importantes que se obtienen al probar el plan se encuentran (Weil, 2004):
Los pasos para construir el plan son los siguientes (Weil, 2004):
Por lo anterior, este proyecto debe tener una mezcla de varios mtodos:
Metodologa del PMI, el framework ITIL y la metodologa ABCD de EDS para la
administracin de riesgos. Esto garantiza que los elementos esenciales del plan,
durante todo su ciclo de vida, estarn soportados por las mejores prcticas que
ofrecen estas metodologas.
27
Gestin de Capital
Riesgo
Risk
G e s t i n de l a s O p e r a c i o n e s
atolaInvestment
Inversin
G e s t i n del P o r t a f o l i o
Riesgo
Riesgo
Risk toal Riesgo
Risk
Total al
Desempeo
Performance Valor * al Crecimiento
to Growth
Riesgo
Risk
atolos Proyectos
Projects
Risk
Planeacin del
Management
Planning
Riesgo
Risk Identification
Deteccin de Riesgos
Gestin
Risk Risk
Evaluacin Risk Analysis
Anlisis de Riesgos
Management Assessment
Del Riesgo
Del Riesgo
Risk Prioritization
Priorizacin de Riesgos
Plan Response
Risk de Respuesta
Planning
Al Riesgo
Control
Risk Risk Resolution
Resolucin de Riesgos
Del Riesgo
Control
Comunicacin de Supuestos
El Plan
En ABCD, los riesgos son identificados al capturar y analizar los supuestos que se
han hecho mientras se crea el plan. De esta forma, los supuestos hechos durante
la planeacin son utilizados para identificar lo que podra atentar contra el alcance
de los objetivos del proyecto. Por lo tanto, los supuestos estn efectivamente
referenciados al plan y el plan provee un mayor enfoque hacia el proceso de
administracin de riesgos.
Este enfoque mantiene los riesgos especficos con una visin de futuro y ayuda a
asegurar que el plan se mantenga siempre actualizado.
Incertidumbre y Riesgo
El principio en general busca que se tome una opcin entre bueno, alta
confiabilidad y malo, baja confiabilidad.
Evaluacin de riesgos
32
Priorizacin de riesgos
Control de riesgos
Definicin de issues
Por ejemplo, un issue podra iniciarse con lo siguiente: Tengo un issue con el
hardware. Algunos posibles issues ABCD que se derivan de ste son:
Priorizacin de Issues
A los issues se les debe otorgar una clasificacin segn su criticidad de acuerdo
a la importancia relativa de cada uno de estos. Las clasificaciones de criticidad
son ROJO, AMARILLO y VERDE. Es importante definir lo que cada clasificacin
significa de acuerdo a cada proyecto. Entender la relacin de cada clasificacin
ayuda a mantener la consistencia en el proceso de priorizacin. Algunas
posibilidades se muestran a continuacin en el Cuadro 4:
34
Los issues deben ser de vida corta, dado que son problemas que deben
priorizarse lo ms pronto posible, por lo tanto debe identificarse y registrarse la
fecha para la cual se requiere una fecha de respuesta. La fecha de resolucin y el
grado de criticidad juntos proveen el proceso de priorizacin de cada issue. Por
ejemplo un issue ROJO a resolverse en 5 das es ms importante que un issue
AMARILLO con una resolucin en 2 semanas.
Anlisis de Supuestos
Los supuestos pueden ser explcitos y se registran en muchas reas, por ejemplo
especificaciones, estndares, propuestas, modelos de costo y por supuesto en los
planes. Muchos supuestos son implcitos y solo se revelan al hacer un anlisis
detallado. Al principio es normal que existan muchos issues y pocos supuestos.
Sin embargo, una vez que el proceso de planeamiento est en camino, los
issues son efectivamente cerrados al generarse nuevos supuestos.
36
Formulando un Supuesto
Los supuestos deben ser sentencias especficas con respecto a lo que se necesita
que ocurra para que se de un resultado exitoso. Los supuestos deben formularse
en futuro, ser fcilmente entendible, referirse solo a un aspecto del trabajo y ser
descritos en forma positiva.
Sensibilidad:
Estabilidad:
Bastante confiable
38
Incmodo
Muy incmodo (es muy probable que el supuesto resulte ser incorrecto)
Estabilidad
De Supuestos D
Cada
Estabilidad
Incremento
C Riesgo
Incremento
Sensibilidad
A B C D
Sensibilidad
Del Proyecto
Es parte integral de la metodologa, que se registren las razones por las cuales se
clasific un supuesto dentro del diagrama Sensibilidad/Estabilidad. Este registro le
da a cualquiera que revise esta clasificacin un claro entendimiento del por qu un
supuesto se clasific de determinada forma. Esto mejora la comunicacin y le
39
Los supuestos y riesgos son identificados por medio del Anlisis de Supuestos,
otorgando a cada supuesto una clasificacin de sensibilidad y estabilidad. Para
ayudar a entender, la clasificacin de sensibilidad se pone primero cuando se
estn mostrando ambas clasificaciones en forma de doble letra.
Las clasificaciones AC, AD, BC, BD, CA, CB, DA y DB son riesgos potenciales.
Esto es porque son inestables o sensibles. Esos supuestos deben ser revisados
40
con los expertos de forma regular y se deben identificar acciones que mantendrn
bajas las clasificaciones.
Por ejemplo:
El supuesto es que.
Criticidad
Controlabilidad
Probabilidad
Tiempo
Criticidad
La criticidad es usada para mostrar el impacto del riesgo sobre los factores crticos
de xito (FCEs) del proyecto. Generalmente se usa como el medio principal para
priorizar los riesgos, aunque es preferible un proceso de priorizacin completo
usando todos los parmetros. La criticidad est descrita en trminos de
semforo, rojo, amarillo o verde segn los FCEs.
Rojo
Amarillo
Verde
Controlabilidad
Muy Confiable. La administracin puede tener mucho control sobre el riesgo. Hay
planes de accin que demuestran ser satisfactorios.
Probabilidad
Ejemplo.
Seis desarrolladores Oracle son requeridos para Enero 12, y no se tiene ninguno
en la organizacin. La experiencia muestra que se requieren dos semanas para
obtener aprobacin de reclutamiento externo y seis semanas ms para completar
el ejercicio de reclutamiento. Este conocimiento generar al menos dos fechas
finales de accin: El reclutamiento debe iniciar en Diciembre 1 (seis semanas
antes de la necesidad), y la aprobacin debe estar para Noviembre 18
Conforme inicia cada accin, la fecha cambiar a la fecha en que debe iniciar la
siguiente accin. De esta forma, siempre ser obvio qu punto del plan de
mitigacin est fallando, por ejemplo, cuando una actividad no ha iniciado a
tiempo. Esto puede funcionar como disparador para invocar las acciones de
contingencia, o a una revisin crtica de la posibilidad de xito de lo que queda
pendiente del proyecto.
Habiendo identificado los riesgos y decidido cual mitigar y cual aceptar, el objetivo
de la Administracin de Riesgos es que stos sean eventualmente cerrados. La
mayora de riesgos se cierran cuando han sido exitosamente mitigados o cuando
han impactado, la minora se cierra debido a cambios en las circunstancias del
proyecto independientemente de las acciones de mitigacin.
45
Precisin
Todos los escenarios de costos debern estar sustentados por la informacin que
llev a obtener un total, para permitir a otros ver la derivacin de estos escenarios,
juzgar su exactitud o precisin y estar de acuerdo o cuestionarlos.
Los costos que han sido calculados deben mostrarse en los reportes de riesgos
que se envan a la administracin y a los altos niveles de la organizacin. Estos
administradores debe usar su experiencia y conocimiento para revisar los costos
mostrados en los reportes de riesgos y estar de acuerdo o hacer los
cuestionamientos respectivos.
Inicialmente, los costos totales relacionados con los riesgos, deben ser calculados
por el rea de la organizacin donde se identifica el riesgo, por ejemplo,
proyectos, desarrollo, contabilidad, etc. usando la informacin disponible por ese
nivel.
A nivel general, es vital asegurarse que no haya doble conteo, es decir que un
riesgo no se utilice sobre un mismo efecto ms de una vez, o donde un riesgo
afecte a ms de un rea. Si es necesario se debe generar un supuesto /riesgo
separado.
Costo de la Mitigacin
Cuando un riesgo ha sido identificado, se deben explorar las opciones para mitigar
este riesgo. La estabilidad del supuesto debe proveer una indicacin inmediata del
trabajo requerido para mitigar este riesgo. El encargado de riesgos es
normalmente la persona que estima el costo del plan de mitigacin. El resultado
se revisa con los encargados de otras reas afectadas para identificar si otros se
estn viendo impactados, si lo estn los costos probablemente sern ms altos.
La priorizacin permite que recursos limitados sean dirigidos a atender los riesgos
ms crticos.
Grficos de Burbuja
Es relativamente difcil manejar tres parmetros para priorizar los riesgos. Los
diagramas de burbuja son tiles para combinar esos parmetros de forma grfica
generando un simple perfil de riesgos que puede ser entendido por personal no
especialista.
La criticidad se representa sobre el eje vertical, con los riesgos crticos (Rojo)
tocando el eje X.
49
El origen del grfico, donde se juntan los ejes, representa el (los) objetivo(s)
crtico(s) del proyecto. Si se permite que un riesgo (en la burbuja) impacte el
origen, esto es por definicin, un riesgo que frena el proyecto. Por lo tanto, un
perfil de riesgo es ms aceptable en la medida en que se aleje del origen.
Se debe tener cuidado cuando se evala la calidad general del portafolio por
medio del grfico de burbujas, ya que los riesgos que estn lejos del origen
podran ser mal administrados de manera que se pueden acercar al impacto. Por
otro lado, los riesgos cerca del origen pueden ser administrados muy de cerca en
escalas de tiempo muy cortas. El grfico es solo una foto de las clasificaciones ya
que estas se mueven en el tiempo y no da detalle de los riesgos.
50
El anlisis del diagrama de burbuja puede producir una priorizacin de primer nivel
acerca de los riesgos del proyecto al mostrar:
La criticidad del riesgo con respecto a los FCEs del programa o proyecto
(Rojo, Amarillo, Verde)
Los riesgos ms serios son aquellos que estn cerca del origen, stos son
urgentes y tienen alta criticidad. Los siguientes son aquellos que estn cerca del
eje X (alta criticidad), o los del eje Y (urgentes). Esto es til para pensar en
trminos de arcos concntricos, centrados sobre el origen del grfico, donde los
riesgos ms cerca del origen son los de ms alta prioridad, etc.
Los riesgos deben ser atacados tanto desde un nivel estratgico como desde un
nivel tctico. El enfoque estratgico busca tendencias y causas subyacentes para
grupos de riesgos, de manera que un conjunto de acciones puedan atacar ms de
un riesgo. El enfoque tctico toma cada riesgo de forma independiente de manera
que estos son atacados de forma individual.
El enfoque tctico se ejecuta primero ya que cada riesgo debe atacarse lo antes
posible. Es decir no se debe esperar a tener un conjunto de riesgos similares para
atacarlos en conjunto.
Enfoques Tcticos
La mayora de riesgos son atacados individualmente (un plan de accin para cada
riesgo) para direccionarlos al supuesto subyacente. Los supuestos que son
colocados dentro del rea C y D de la matriz de Sensibilidad/Estabilidad son
inestables y/o representan riesgos significantes, siendo peligroso continuar sin
tomar accin.
D
Accin requerida
Para des-sensibilizar
C Supuestos
Estabilidad
Accin requerida
B Para estabilizar
A B C D
Sensibilidad del Proyecto
Rojo 7 15 4 19 45
Amarillo 12 19 15 26 72
Verde 10 6 12 12 40
Total 29 40 31 57 157
Los pasos que deben seguirse para mitigar un riesgo pueden ser divididos en
simples o complejos. Algunos riesgos pueden ser resueltos rpidamente, por
ejemplo por medio de una llamada telefnica o una simple tarea. Para estos
riesgos, monitorear el estatus de las acciones identificadas en el Reporte del
Registro de Riesgos es suficiente y minimiza la burocracia. Es importante que
estas acciones documentadas claramente identifiquen qu se necesita hacer,
quin lo har y cundo ser completado. En la administracin de riesgos muchas
acciones simples pueden ser identificadas.
55
Los riesgos que requieren una administracin ms compleja, por ejemplo, donde
las actividades de mitigacin planeadas se extienden sobre un periodo de ms de
cinco das hombre, pueden requerir recursos y tiempo significativos para
resolverlas, y para estas, se recomienda un Plan para Manejo de Riesgos (PMR),
estos planes pueden incorporarse a los planes normales del proyecto.
Resumen del PMR (Cules son los pasos necesarios para alcanzar los
objetivos)
56
Stakeholders
Formar sub-proyectos
Tambin puede ser til revisar los manejadores de riesgo para identificar mejor el
o los cursos de accin.
58
Hay una gran diferencia entre cerrar un plan y detenerlo. Los PMRs deben
detenerse si no hay resultados exitosos. El cierre solo debe autorizarse cuando
los objetivos han sido alcanzados. Es realmente crtico que un PMR sea detenido
o cerrado en el momento apropiado.
Ya no es necesario
Asegurarse que todos los cambios necesarios producto del PMR estn
incorporados al plan principal del proyecto, a la documentacin y a las
especificaciones.
Administrador de Riesgos
Cierra el plan cuando los objetivos han sido alcanzados, tambin cierra el
riesgo si es necesario.
Valida que los objetivos hayan sido alcanzados y que los detalles han sido
documentados en el Registro de Riesgos.
Trminos de Referencia
Para los riesgos existentes, el dueo del riesgo debe reportar el progreso
de los planes/acciones.
Asegurarse que los PMRs estn integrados en el plan principal del proyecto
Historial del CI
Atributos de un CI
Serie o nmero
Modelo
Licencia
Tipo
Versin
Relaciones de un CI
Conectado a
Parte de
Copia de
3 - MARCO METODOLGICO
Finaliza como descriptiva, ya que una vez revisados los libros relacionados con la
recuperacin de sistemas en caso de desastre, en los que se validaron los
principios de este tema y las recomendaciones sobre temas como las
comunicaciones y anlisis de riesgos, se procede a describir los aspectos que
deben tomarse en cuenta al crear un plan de recuperacin por desastre, es decir a
crear una gua, fundamentada en la teora encontrada, aplicada de acuerdo a la
informacin extrada de las entrevistas a los expertos de cada rea del
departamento de Tecnologa de una empresa procesadora de tarjetas de crdito.
La metodologa se aplicacar con el objetivo de crear una gua para que los
potenciales usuarios de este trabajo puedan crear los siguientes planes:
,
3.2.1 Identificacin de reas a recuperar
i. Inicio
ii. Adquisicin de la informacin
iii. Anlisis de la informacin
iv. Documentacin
v. Presentacin de reportes a la administracin
II - ADQUISICIN DE LA INFORMACIN:
Se debe hacer una reunin con la administracin para determinar los niveles
aceptables de riesgo. En sntesis se deben definir las siguientes variables (Burtles,
2007):
Resumen ejecutivo
Objetivos
Alcance
Metodologa utilizada para reunir y analizar los datos
Resumen de la informacin encontrada
81
Con base en el inventario de equipos que se obtiene luego del anlisis BIA
mencionado en los puntos anteriores, se debe realizar un proceso de adquisicin
de equipo para efectos de construir un laboratorio para pruebas.
Una vez que se tiene el equipo en el sitio destinado para el laboratorio, se debe
proceder con la configuracin del equipo, instalacin de todos los programas
necesarios para su correcto funcionamiento, tales como el sistema operativo,
programas cliente para acceso a base de datos, configuraciones de los
programas, entre otros. Posteriormente se procede con la construccin una red
aislada del ambiente productivo de manera que cualquier cambio en el ambiente
82
Medio: DVD
Periodicidad: SEMANAL
Medio: CINTA
Servidor XYXZ, Datawarehouse..2300 GB
Servidor XYXX, Tarjeta crdito800 GB
Se deben examinar los sitios que son candidatos a utilizar como lugar alternativo
para recuperarse en caso de un desastre en el lugar donde estos sitios ofrecen
sus servicios. Algunos de los cuestionamientos que se deben hacer son los
siguientes:
Evaluacin del hardware y software del sitio alterno. Se debe asegurar que la
informacin y el equipo son los necesarios para cumplir con los objetivos de
recuperacin.
Este proyecto parte del supuesto de que la organizacin cuenta con una poltica
de administracin de cambios. En trminos generales el proceso de
administracin de cambios busca asegurar que solo se utilicen mtodos y
procedimientos estandarizados para el manejo de cambios en los programas y
equipo utilizado en la organizacin.
ANUALMENTE
SEMESTRALMENTE
CONTINUAMENTE
3. Responsable de la comunicacin
4. Distribucin de la comunicacin
7. Consideraciones especiales
93
Tipo (1) Propsito (2) Responsa- Distribu- Medio (5) Frecuen- Considera-
ble (3) cin (4) cia (6) cines
especiales (7)
Reuniones Informar a Luis Morera / Equipo del Reunin De Lunes por Se debe distribuir
con el Comit la gerencia de la proyecto presencial medio, la agenda
Ejecutivo Organizacin Director del en la sala de anticipadamente
acerca del avance proyecto capacitacin 09:00 AM
del proyecto y los de la
resultados Comit Empresa
obtenidos al Ejecutivo Se debe generar
momento. una minuta de la
Comunicar reunin la cual
los principales ser guardada en
issues del la carpeta del
proyecto, sobre proyecto.
todo los que
requieren de la
intermediacin de
la alta gerencia
Comunicac
in de cambios en
el alcance o los
objetivos
Aprobar y
tomar decisiones
Reuniones de Resolver los Director del Gerente de Reunin Cada Martes, Se debe generar
liderazgo asuntos proyecto Infraestructu- presencial una minuta de la
extendido. relacionados a los ra en la sala de 09:00 AM reunin la cual
recursos del Gerente de capacitacin ser guardada en
proyecto Desarrollo de la la carpeta del
Director del Empresa proyecto.
Proyecto
Administra-
Seguimiento al dor de la Base
cronograma de Datos
Expertos
invitados
Aprobar y tomar
decisiones
94
Tipo (1) Propsito (2) Responsa- Distribu- Medio (5) Frecuen- Considera-
ble (3) cin (4) cia (6) cines
especiales (7)
Reunin de Actualizar a la Director del Equipo del Reunin Cada Informal
seguimiento audiencia con proyecto proyecto presencial Mircoles,
con el equipo informacin en la sala de
del proyecto corporativa, local y capacitacin 09:00 AM
del equipo del de la
proyecto Empresa
Boletines por Comunicar asuntos Liderazgo de Empleados de Correo Por demanda Publicar en el
Correo importantes del toda la toda la electrnico web site, seccin
Electrnico proyecto a toda la organizacin organizacin de noticias.
organizacin
Director del
proyecto
Finalmente, al finalizar cada fase del proyecto o cuando el director del proyecto lo
considere, se deben generar sesiones de lecciones aprendidas en las cuales se
analicen las oportunidades de mejora y se fortalezcan las ideas que han tenido
95
xito a lo largo del ciclo de vida del proyecto. El resultado de una sesin de
lecciones aprendidas debe almacenarse en la carpeta del proyecto en forma de
minuta de manera que se convierta en un activo ms de la organizacin.
96
4.1.3.1 Patrocinador
Roles
Responsabilidades
Tomar las decisiones al final de cada fase. Ejemplo, autorizacin del proyecto,
aprobaciones, aceptaciones, entre otros.
Recibir el estado del proyecto peridicamente por parte del director del
proyecto.
Roles
Planificador. Debe asegurarse que se est creando un plan integral que sea
suficiente para cumplir con los objetivos del proyecto.
Responsabilidades
Roles
Responsabilidades
Roles
Tanto los lderes tcnicos como el arquitecto tienen un rol de couching con el
resto del equipo del proyecto.
Responsabilidades
Roles
Responsabilidades
Proveer a tiempo y de forma eficiente los datos que requieran los diferentes
equipos para ejecutar sus actividades.
Roles
Como administrador del centro de datos conoce las tareas operativas que
se realizan el mismo, incluyendo, periodicidad de las actividades,
herramientas utilizadas y su localizacin, dependencias y responsables de
ejecutarlas.
Responsabilidades
Roles
Responsabilidades
Roles
El usuario experto tiene un rol similar al del tester pero su papel se limita a
probar el correcto funcionamiento de las aplicaciones finales, el tester
prueba integralmente.
104
Responsabilidades
Responsable Contribuye
Juan Prez
Carlos R.
Mara Rojas
Jorge Salazar
Luis Morera
Luisa Vindas
Ana Lpez
Andrs Rojas
Diego Quirs
Mario Rojas
Silvia Salas
Gabriel Daz
Juan C. Mora
Rosa Vargas
Sensibilidad.
Estabilidad:
c. Incmodo
d. Muy incmodo (es muy probable que el supuesto resulte ser incorrecto)
3) Cmo me aseguro
que los expertos en
bases de datos
estarn disponibles el
5 de Junio?
4) Cmo me aseguro
que los expertos en
las aplicaciones
Front-End estarn
disponibles el 10 de
Junio?
Se atrasa el
cronograma si se
debe reprogramar
la aplicacin o
sistema
110
15) Se requiere
gestionar algo
directamente en las
marcas?
1 2 3 4 6 7 17- 18
Supuestos que deben ser revisados con los expertos de forma regular ya
que corresponden a riesgos potenciales.
8 9 10 12 13 14 15 16
5 11
113
SUPUESTO de Desarrollo
Al realizar la actividad
Se cuenta con el Recoleccin de
cdigo fuente de
todas las aplicaciones Instaladores se valida
a respaldar que faltan instaladores.
IMPACTO
ACCIN
Podran quedar
fuera del plan Definir un equipo que
aplicaciones
busque los instaladores.
clave para el
buen Si no se encuentran se
funcionamiento
del negocio debe revalidar la
criticidad de la aplicacin
Se atrasa el
cronograma si se que falta y definir si se
debe reprogramar debe reprogramar e
la aplicacin o
sistema informar del impacto.
SUPUESTO Gerente
Tres das antes del envo
Infraestructura
El proveedor de las del equipo no se tiene
mquinas puede
entregar el producto confirmacin del
en una semana luego proveedor
de hacer el pedido
IMPACTO ACCION
Validar impacto en el
115
plan e informar al
respecto.
SUPUESTO
Director del Proyecto Una semana antes de
Se cuenta con cada actividad no se
suficiente personal
para atender el da a tiene confirmacin de la
da del negocio y los disponibilidad de los
requerimientos del
proyecto recursos asignados a la
tarea.
IMPACTO
SUPUESTO Gerente
Al realizar pruebas no se
Infraestructura
La comunicacin obtienen las mtricas
entre la organizacin
y el sitio alterno es necesarias.
menor a 3 segundos
ACCIN
IMPACTO
SUPUESTO
Director del Proyecto Antes de iniciar el
Se cuenta con un proyecto no se puede
medio manual o
automtico para obtener un contrato
enviar los respaldos Courier para enviar las
de las bases de datos
al sitio alterno cintas al sitio alterno.
IMPACTO ACCION
Factor principal para
implementar el plan Contratar lneas de
comunicacin con un
ancho de banda mayor y
colocar servidores
espejo en ambos sitios.
Validar costos y
comunicar el impacto.
IMPACTO ACCION
SUPUESTO Intercambio
No se puede localizar un
Si se requiere experto en las oficinas
gestionar algo
directamente en las de las marcas.
marcas se tiene la
colaboracin de las ACCION
mismas
Contratar el servicio en
IMPACTO
las marcas.
Las actividades de
Intercambio/Autori-
zaciones pueden
quedar incompletas
SUPUESTO
Director del Proyecto En el contrato de
Se cuenta con arrendamiento del sitio
personal dedicado a
darle mantenimiento alterno no se brinda el
al hardware/software servicio.
implementado en el
sitio alterno
ACCION
IMPACTO
Contratar el servicio con
El plan pierde
efectividad y vigencia la empresa
administradora del sitio
remoto
118
Memoria: 4 GB
(installed) / 32 GB (max) -
DDR II SDRAM -
Advanced ECC - 667
MHz - PC2-5300
$120.000,00 total
$20.000,00 total
Hardware 4 Computadoras
personales
Sitio Remoto Idem anterior Idem anterior
7 Servidores de
base de datos
2 Switches
1 Enrutador
1 Modem Satelital
Laboratorio
4 Licencias de
cliente Sybase
2 Licencias de
SQLServer,
7 Licencias de
Windows 2003 Server
2 Administradores
de Bases de Datos
8 Analistas calculados
2 Especialistas en en $1,500 c\u durante
Infraestructura 3 meses.
1 Director de
Proyectos
Total $7,350
Total $2,695
Por lo tanto,
Los restantes procesos del rea de Gestin de Costos, a saber, preparacin del
presupuesto de costos y el control de los costos, no se toman en cuenta en esta
gua dado que son parte de la puesta en prctica del proyecto de recuperacin en
caso de desastre, utilizando o no esta gua.
124
5 Conclusiones y Recomendaciones
Ocuparse por la continuidad del negocio debe ser una de las principales
estrategias que deben desarrollar las organizaciones modernas, ya que, como se
ha demostrado vastamente, un desastre ocurre cuando menos se espera y de
esto depende, en la mayora de los casos, la continuidad o el final de una
empresa. Esto significa que debe dedicarse un rubro importante del presupuesto,
al desarrollo, implementacin y mantenimiento de un plan que garantice la
continuidad de la operacin.
A lo largo del trabajo desarrollado en esta tesis, se trat de plasmar una gua que
le permita al lector conocer las principales actividades que debe desarrollar para
implementar un plan de recuperacin por desastre. Se tom como base una
empresa de tecnologa que brinda el servicio de procesamiento de datos para
organizaciones financieras, especficamente en el campo de tarjetas de crdito.
El objetivo general de este proyecto consisti en disear una gua, con una serie
de aspectos relevantes, que debe tomar en cuenta un Gerente de Proyectos a la
hora de formular un plan de recuperacin por desastre en el sistema informtico
de una compaa procesadora de tarjeta de crdito. Como objetivos especficos
se plante la creacin de una gua para crear un plan de mantenimiento que le
otorgue vigencia al plan maestro y un plan de simulacros que permita comprobar
la efectividad del plan de recuperacin.
125
Recomendaciones
Se requiere del apoyo y soporte de la alta gerencia, quienes deben participar
como patrocinadores del proyecto tomando decisiones de forma proactiva.
Es necesaria una participacin activa de toda la organizacin, ya sea como
parte del equipo del proyecto o como ejecutores del procedimiento en caso de
desastre.
No se debe perder de vista la operacin diaria de la organizacin. Este tipo de
proyectos absorben mucho tiempo y recursos, por lo que se debe analizar la
necesidad de nuevas contrataciones de personal de manera que el proyecto
no afecte el da a da de la organizacin.
En la medida de lo posible, se recomienda utilizar como sitio alterno, una
empresa con experiencia que se dedique a brindar este tipo de servicios.
El sitio alterno escogido debe estar localizado geogrficamente lejos del sitio
normal de operacin. Por ejemplo, la operacin diaria en Costa Rica y el sitio
alterno en Estados Unidos.
Las aplicaciones, sistemas y datos deben estar instalados en el sitio alterno,
de manera que el plan se concentre en el levantamiento y validacin de los
sistemas. Esto evita el costo de tener que instalar todo desde cero en caso de
desastre y facilita el mantenimiento del sitio alterno.
Es importante determinar el tiempo mnimo que la operacin puede estar fuera
de servicio en caso de desastre y la cantidad mxima de datos que podra
estar dispuesta a perder. A partir de esta informacin se deben desarrollar los
procedimientos de recuperacin.
Finalmente, se debe tener muy claro, cules son los eventos o circunstancias
que implican declarar la organizacin en desastre. En otras palabras, tener
claro cul es el disparador del plan de recuperacin por desastre.
127
6 - BIBLIOGRAFA
ANEXOS
131
ANEXO No.1
ANEXO No.2
ANEXO No.3