Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Pgina 1 de 14
1. Objetivo ................................................................................................................... 2 2. mbito de Aplicacin .................................................................................................. 2 3. Alcance .................................................................................................................... 2 4. Desarrollo ................................................................................................................. 2 4.1. Actividad: Detectar y Registrar .................................................................................. 2 4.1.1. Detectar el Incidente ............................................................................................ 2 4.1.2. Registrar el Incidente ........................................................................................... 2 4.2. Actividad: Categorizar y Priorizar ............................................................................... 2 4.2.1. Categorizar ......................................................................................................... 3 4.2.2. Priorizar ............................................................................................................. 3 4.3. Actividad: Realizar Diagnostico Inicial ........................................................................ 3 4.3.1. Realizar Diagnostico Inicial ................................................................................... 3 4.3.2. Asignar el Incidente ............................................................................................. 3 4.3.3. Validar Asignacin ............................................................................................... 3 4.3.4. Tomar Incidente .................................................................................................. 3 4.4. Actividad: Investigar y Diagnosticar ........................................................................... 3 4.4.1. Investigar la Falla ................................................................................................ 3 4.4.2. Documentar Actividades ....................................................................................... 4 4.4.3. Asignar Como Pendiente ....................................................................................... 4 4.5. Actividad: Resolver y Cerrar ...................................................................................... 4 4.5.1. Resolver ............................................................................................................. 4 4.5.2. Validar solucin ................................................................................................... 4 4.5.3. Cerrar ................................................................................................................ 4 4.6. Actividad: Gestionar Incidentes Mayores .................................................................... 4 4.6.1. Escalar al Incident Manager .................................................................................. 4 4.6.2. Validar Criticidad ................................................................................................. 4 4.6.3. Abrir el Bridge ..................................................................................................... 4 4.6.4. Comunicar Incidente ............................................................................................ 4 4.6.5. Escalar Jerrquicamente ....................................................................................... 5 4.6.6. Enviar Actualizacin ............................................................................................. 5 4.6.7. Cerrar el Bridge ................................................................................................... 5 4.6.8. Enviar Informe Preliminar ..................................................................................... 5 4.6.9. Informar en daily y weekly ops .............................................................................. 5 4.6.10.Enviar informe final ............................................................................................. 5 5. Anexo ...................................................................................................................... 6 5.1. Tabla RACI ............................................................................................................. 6 5.2. Circuitos ................................................................................................................. 8 5.3. Roles y Responsabilidades ...................................................................................... 12 5.4. Checklist de los Puntos de Control ........................................................................... 13 5.5. Factores Crticos de xito y KPI ............................................................................... 13 6. Glosario.................................................................................................................. 14 7. Log de Auditora ...................................................................................................... 14
Revisor: J. Nuez
Autorizador: C. Pregoni
Pgina 2 de 14
1. Objetivo
El objetivo del proceso es restaurar la operacin normal del servicio afectado lo ms rpido posible, minimizando el impacto en el negocio y asegurando que se mantengan los niveles acordados de calidad y disponibilidad.
2. mbito de Aplicacin
Regional
3. Alcance
El alcance de este proceso es cualquier evento que interrumpa o pueda interrumpir un servicio, y que sea comunicado por los usuario a travs del service desk o por una interfaz entre Gestin de Eventos y Gestin de Incidentes.
4. Desarrollo
El proceso estar conformado por 6 actividades principales: Detectar y Registrar Categorizar y Priorizar Realizar Diagnstico Inicial Investigar y Diagnosticar Resolver y Cerrar Gestionar Incidentes Crticos
4.1. Actividad: Detectar y Registrar En esta actividad se realiza la identificacin de incidentes y la registracin en la herramienta de gestin. Entrada: Escalamiento Jerrquico, Incident Manager, Reporte del usuario, Personal de TI, Gestin de Cambios, Gestin de Request, Gestin de Eventos Salida: Incidente registrado 4.1.1. Detectar el Incidente Los incidentes pueden producirse cuando un usuario se contacta con la Mesa de Ayuda para reportar una falla, cuando se detecta un incidente por parte de un rea de IT, por la deteccin de un evento por parte de las herramientas de monitoreo, como resultado de un cambio fallido, cuando un Incident Manager detecta el mismo o cuando es escalado jerrquicamente. 4.1.2. Registrar el Incidente Se registra el incidente en la herramienta de gestin, completando los campos requeridos. 4.2. Actividad: Categorizar y Priorizar En esta actividad se realiza la categorizacin del incidente y la priorizacin de acuerdo a la matriz de prioridad. Entrada: Incidente registrado Salida: Incidente priorizado y categorizado
Autor: I. Simon Padros Area/Sector: Procesos IT Regionales Revisor: J. Nuez Autorizador: C. Pregoni
Pgina 3 de 14
Categorizar el incidente para determinar el origen de la falla acorde al rbol de categoras. 4.2.2. Priorizar Priorizar el incidente en base al impacto y a la urgencia (cun rpido precisa el negocio que el proceso sea resuelto), utilizando como referencia la matriz. 4.3. Actividad: Realizar Diagnostico Inicial En esta actividad el primer nivel debe realizar un primer diagnstico del incidente y lo escala en el caso que no pueda resolverlo. El grupo que lo recibe debe validar la asignacin, y en caso que sea vlida, tomar el incidente. Entrada: Incidente priorizado y categorizado Salida: Incidente con asignacin aceptada 4.3.1. Realizar Diagnostico Inicial El primer nivel, usando la informacin disponible en la CMDB, la base de soluciones y los procedimientos especficos de la mesa debe realizar un primer diagnstico del incidente. Tambin tiene que asociar el CI correspondiente. 4.3.2. Asignar el Incidente Si el primer nivel no puede resolver el incidente, o el incidente estaba asignado incorrectamente, dentro del formulario de incidente correspondiente, se selecciona el grupo de solucin que debe trabajar en el incidente. 4.3.3. Validar Asignacin El especialista asignado ingresa a la herramienta de gestin y verifica que el incidente est asignado correctamente. Si corresponde a su grupo, toma el incidente, si no lo vuelve a asignar al grupo correspondiente si lo conoce, caso contrario lo enva al grupo que le asign el ticket. 4.3.4. Tomar Incidente El responsable de continuar la investigacin de la falla, se asigna a su usuario el incidente en cuestin. 4.4. Actividad: Investigar y Diagnosticar En esta actividad se debe investigar la falla y encontrar un diagnstico final para poder luego aplicar la solucin. Se deben documentar todas las acciones que se realicen. Entrada: Incidente asignado Salida: incidente con el diagnstico realizado 4.4.1. Investigar la Falla El analista que tiene asignado el incidente, usando la informacin disponible en la CMDB, la base de soluciones y los procedimientos especficos del rea, debe realizar un diagnstico del incidente. En el caso que sea necesario, deber contactar a los proveedores para que lo ayuden con la solucin.
Revisor: J. Nuez
Autorizador: C. Pregoni
Pgina 4 de 14
Todas las actividades realizadas en este paso deben ser registradas en la herramienta de gestin correspondiente. 4.4.3. Asignar Como Pendiente En los casos en los que se espere una respuesta del cliente para poder continuar con la investigacin, el incidente debe quedar en estado pendiente. 4.5. Actividad: Resolver y Cerrar En esta actividad se realiza la resolucin y cierre del incidente. Entrada: Incidente con diagnstico realizado Salida: Incidente cerrado 4.5.1. Resolver De acuerdo al diagnstico del mismo, debe aplicarse la solucin del incidente. Puede ser una nueva solucin o aplicarse una solucin existente. 4.5.2. Validar solucin Se debe validar con el usuario que la solucin aplicada sea realmente lo que resuelve el incidente. 4.5.3. Cerrar Los incidentes pasan a estado cerrado luego de la confirmacin del usuario o despus de un tiempo establecido. 4.6. Actividad: Gestionar Incidentes Mayores En este actividad se realiza la gestin de los incidentes crticos y altos*. Entrada: Incidente crtico o alto* Salida: Incidente resuelto 4.6.1. Escalar al Incident Manager Informar telefnicamente al Incidente Manager, o al siguiente nivel de escalamiento hasta hacer contacto y recibir confirmacin. 4.6.2. Validar Criticidad El Incident Manager confirma si realmente es un incidente crtico o alto*. Si no lo es, el proceso sigue el flujo de resolucin del incidente normal. 4.6.3. Abrir el Bridge El Incident Manager realiza la apertura del bridge de comunicacin, agregando a todo el personal involucrado en la resolucin del incidente. La primer actividad del bridge consiste en validar si es realmente un Incidente crtico o alto*. El bridge se mantiene activo hasta la resolucin final del incidente, y la confirmacin por parte del negocio. 4.6.4. Comunicar Incidente Se enva la comunicacin (placa) de incidente crtico o alto* segn corresponda a la lista de distribucin correspondiente para cada pas.
Autor: I. Simon Padros Area/Sector: Procesos IT Regionales Revisor: J. Nuez Autorizador: C. Pregoni
Pgina 5 de 14
4.6.5. Escalar Jerrquicamente Informar telefnicamente al Incidente Manager, o al siguiente nivel de escalamiento hasta hacer contacto y recibir confirmacin. El Incident Manager ejecuta el siguiente nivel de escalamiento, transcurrido el tiempo estipulado en el escalamiento jerrquico. En los casos de los incidentes alto*, el escalamiento es slo hasta el nivel gerencial de operaciones local y regional, dejando la decisin de continuar el escalamiento en la figura del gerente de operaciones. En los casos del incidente crtico, se activan los sucesivos niveles de escalamiento jerrquico, durante todo el ciclo de vida del incidente crtico finalizando con la resolucin del mismo. 4.6.6. Enviar Actualizacin El Incident Manager enva a la lista de distribucin correspondiente, una actualizacin de estado y avance, cada 15 minutos de vida del incidente, comenzando desde que es informado. 4.6.7. Cerrar el Bridge Una vez que el Incidente est resuelto, el Incident Manager cierra el bridge. 4.6.8. Enviar Informe Preliminar Transcurridas 24 horas desde la solucin del incidente, el grupo resolutor debe adjuntar en el registro de la herramienta de gestin, el informe preliminar de incidente crtico, utilizando el modelo correspondiente. 4.6.9. Informar en daily y weekly ops El Incident Manager debe informar lo ocurrido en la daily ops y en la weekly. 4.6.10. Enviar informe final
Transcurridas 48 horas desde la solucin del incidente se actualiza el informe preliminar con la versin completa.
Revisor: J. Nuez
Autorizador: C. Pregoni
Pgina 6 de 14
Tarea / Rol Detectar el Incidente Registrar el Incidente Categorizar y Priorizar Tarea / Rol Categorizar Priorizar Realizar Diagnostico Inicial Tarea / Rol Realizar diagnostico inicial Asignar Incidente Validar Asignacin Tomar Incidente Investigar y Diagnosticar Tarea / Rol Investigar la falla Documentar Actividades Asignar como pendiente Resolver y Cerrar
Revisor: J. Nuez
Autorizador: C. Pregoni
Pgina 7 de 14
Gestionar Incidentes Mayores Tarea / Rol Escalar al Incident Manager Validar criticidad Abrir el bridge Comunicar incidente critico Escalar jerrquicamente Enviar actualizacin Cerrar el bridge Enviar informe Informar en daily y weekly ops Enviar informe final R: Responsable A: Accountable C: Consulted I: Informed Analista de Primer Nivel R Analista de Segundo Nivel R Incident Manager R-A R-A R-A R-A R-A R-A R-A R-A R-A R-A
Revisor: J. Nuez
Autorizador: C. Pregoni
Pgina 8 de 14
Gestin de Cambios
Gestin de Request
CI1 CI2
Es realmente un incidente?
SI
NO
Gestin de Request
Es mayor?
NO
SI
CI5
SI
Gestin de Problemas
Se modifica CI?
NO SI
SI
CI7
Se deriva de un proyecto?
NO
CI3 CI4
Fin
Revisor: J. Nuez
Autorizador: C. Pregoni
Pgina 9 de 14
Detectar y Registrar
1.1 - GESTION DE INCIDENTES - Detectar y Registrar
Incident Manager
Usuario
Esc. Jerrquico
Personal de TI
Gestin de Eventos
Gestin de Request
Gestin de Cambios
NO
Gestin de Request
CI1 CI2
Mximo
Ir a 1.2
Categorizar y Priorizar
1.2 - GESTION DE INCIDENTES - Categorizar y Priorizar
De 1.1
Es mayor?
SI
Ir a 1.6
NO Ir a 1.3
Revisor: J. Nuez
Autorizador: C. Pregoni
Pgina 10 de 14
Ir a 1.5
No
Precisa derivacin?
NO
Ir a 1.4
Revisor: J. Nuez
Autorizador: C. Pregoni
Pgina 11 de 14
De 1.3 CMDB
Mximo
SI
CI5
SI
Gestin de Problemas
Se modifica CI? NO
SI
Gestin de Cambios
CI7
SI
Gestin de Cambios
Resolver y Cerrar
1.5 - GESTION DE INCIDENTES Resolver y Cerrar
De 1.4
De 1.3
Gestin de Problemas
Gestin de Cambios
Ir a 1.2.2
NO
1.5.3 Cerrar
FIN
Revisor: J. Nuez
Autorizador: C. Pregoni
Pgina 12 de 14
De 1.2.2
CI10
Lista de Distribucin
Ir a 1.3 NO Mayor?
CI9 C11 CI12 CI13
CI3 CI14
Resuelto?
SI
CI15 CI16
CI17
FIN
NO Ir a 1.4
5.3. Roles y Responsabilidades Rol Process Owner de Gestin de incidentes Responsabilidad Llevar a cabo el rol genrica de Process Owner para el proceso de Gestin de Incidentes Disear modelos de incidentes y flujos de trabajo Trabajar con otros dueos procesos para asegurar que haya un enfoque integrado para el diseo e implementacin de Gestin de Problemas, Gestin de Problemas, Gestin de Eventos, Gestin de Acceso y Gestin de Solicitudes Llevar a cabo rol genrico de Process Manager para Gestin de incidentes Planificar y gestionar el soporte para las herramientas y el proceso de Gestin de Incidentes Coordinar las interfaces entre la Gestin de Problemas y otros procesos de la Gestin de servicios Servir de intermediario con todos los grupos de resolucin de incidentes para garantizar la rpida resolucin de incidentes dentro de objetivos de los SLA Servir de intermediario con los proveedores, contratistas, etc. para asegurarse que terceras partes cumplan con sus obligaciones contractuales, especialmente con respecto a la resolucin de incidentes y el suministro de informacin relacionada con el problema y los datos Organizar, ejecutar, documentar y todas las actividades de seguimiento relativas a las revisiones de problemas importantes
Revisor: J. Nuez Autorizador: C. Pregoni
Pgina 13 de 14
Atencin y registro de incidentes Resolucin de incidentes en primer nivel Seguimiento de incidentes Comunicacin con los usuarios de TI Restaurar los servicios interrumpidos en el tiempo requerido por los usuarios de la organizacin, normalmente documentado en el acuerdo de nivel de servicio Documentar progreso, resolucin y respuestas a las llamadas de servicio Realizar bsquedas de soluciones de incidentes o llamadas de servicio en la Base de Errores Conocidos Escalar Incidentes crticos al Incident Manager Resolucin de todos los incidentes asignados por la Mesa de Servicios Seguimiento de los incidentes asignados al grupo Reclasificar los incidentes en los casos que sea necesario Reasignar los incidentes a otros grupos de soporte, de acuerdo al procedimiento de escalamiento Restaurar los servicios interrumpidos en el tiempo requerido por los usuarios de negocio, normalmente documentado en el acuerdo de nivel de servicio Documentar la resolucin y respuestas a los incidentes asignados Realizar bsquedas de soluciones de incidentes en la Base de Errores Conocidos o Base Histrica de Incidentes Escalar Incidentes crticos al Incident Manager
5.5. Factores Crticos de xito y KPI CSF Resolver incidentes tan rpido como sea posible minimizando el impacto en el negocio KPI Tiempo medio de resolucin de incidentes por impacto Porcentaje de incidentes por estado Porcentaje de incidentes resueltos por la mesa de servicios (sin necesidad de escalarlo) Nmero y porcentaje de incidentes resueltos de manera remota, sin la necesidad de una visita presencial Nmero de incidentes resueltos antes de que impacte al negocio (ej. incidentes levantados por gestin de eventos y resueltos antes que impacte en el negocio)
Revisor: J. Nuez
Autorizador: C. Pregoni
Pgina 14 de 14
Mantener la satisfaccin de los usuarios con respecto de los servicios de TI Incrementar la visibilidad y la comunicacin de los incidentes al negocio y a TI
Nmero total de incidentes (como una medida de control) Cantidad de incidentes pendientes (sin resolver/cerrar) para cada servicio Nmero y porcentaje de incidentes mayores para cada servicio de TI Puntaje promedio en las encuestas de satisfaccin (total y por categora) Porcentaje de encuestas contestadas vs encuestas enviadas Cantidad de llamadas u otros contactos de los usuarios, en promedio, sobre incidentes ya reportados Cantidad de quejas de los usuarios sobre el contenido y calidad de la comunicacin de incidentes Porcentaje de incidentes gestionados dentro de los tiempos definidos en el SLA (segn el impacto y la urgencia) Nmero y porcentaje de incidentes asignados incorrectamente Nmero y porcentaje de incidentes categorizados incorrectamente
Alinear las actividades y las prioridades de la gestin de incidentes con el negocio Asegurar que se usen mtodos y procesos estandarizados para gestionar los incidentes para mantener la confianza del negocio en TI
6. Glosario
Trmino Descripcin
7. Log de Auditora
Fecha
27/11/2012 29/11/2012 05/04/2013
Versin
2.0 2.0 2.0
Observaciones
Versin Inicial Revisin Procesos IT Agregado Puntos de Control
Autor
R. Lombardi I. Simon Padros F. De Rentis
Revisor: J. Nuez
Autorizador: C. Pregoni