Está en la página 1de 51

0.

Definición

Es un proceso mediante el cual se gestionan los


eventos que ocurren que no son parte del servicio
acordado.

Procura minimizar las interrupciones al negocio,


restaurando el servicio a los Niveles Acordados.
Normalmente este proceso es el primero en
implementarse luego del Centro de Servicio.

La capacidad de resolver antes que registrar.


1. Introducción
 Incidente: cualquier evento que no sea parte de la operación
estándar y normal de un servicio, y que causa o pueda causar, una
interrupción o desviación en la calidad de un servicio.
 Solicitudes de Servicio: eventos que no reflejan fallos en la
Infraestructura TI. Se gestionan como incidentes aunque no lo
son.
 Problema: la causa desconocida de uno o más eventos. Algunos
incidentes pueden descubrir un fallo o problema en la
Infraestructura de TI.
 Error conocido (Known Error – KE): un problema del que se
han identificado las causas:
 Puede resolverse con un cambio
 Puede documentarse una solución temporal (workaround)
 Puede no resolverse
 Workaround (soluciones temporales): es una solución temporal
que restaura el servicio.
2. Objetivo
 Restaurar el servicio normal tan pronto sea posible y dentro de
lo acordado
 Minimizar el impacto negativo de un incidente en el negocio
 Identificar mejoras al Servicio proactivamente
 Revisar la exactitud de los detalles de la Configuración
 Minimizar el riesgo de Incidentes perdidos
 Asegurar el cumplimiento de los SLAs
 Calidad
 Tiempos
 Disponibilidad
 Recolectar la información de la Gestión
3. El Proceso
Detección,
Comunicación y
Registro

Centro de Clasificación y
Servicio a Clientes Apoyo Inicial

Comunicación
Solicitud si
de
• Seguimiento
Servicio
• Dueño

Solicitud de Servicio
Procedimiento de
no
• Monitor
• Comunicación
Comparación

Investigación y
Diagnóstico

Resolución y
Recuperación

Cierre del
Se debe evitar
Incidente registrar un
incidente dos veces
4. Relaciones

Gestión de
Release
Gestión de Niveles
de Servicio

Centro de Gestión de Gestión del


Servicio Incidentes Gestión de Cambio
Configuración

Gestión de
Problemas
5. Actividades
 Detección y Registro
 Notificación humana o automatizada
 Registro de las actividades y asignación de un número
 Clasificación y Apoyo inicial
 Identificar la razón y registrar los detalles
 Buscar errores conocidos y CIs
 Clasificar: categoría, impacto, urgencia y prioridad
 Actualizar: soluciones temporales y RFCs
 Encaminar si no es posible una solución temporal o
permanente
 Notificar Gestión de Problemas de nuevos problemas, o
de múltiples incidentes sin constancia previa
5. Actividades (continúa)
 Investigación y Diagnóstico
 Equipo de apoyo, conducir análisis detallado
 Entendimiento de posibles soluciones temporales
 Incidentes sin resolver se encaminan a la siguiente línea de soporte:
 Funcional (horizontal): se escala de cualquier nivel a cualquier nivel
 Jerárquica (vertical): se escala a niveles sucesivos.

 Los incidentes resueltos se pasan al Centro de Servicio para cerrarlos


 Resolución y Recuperación
 Se provee una solución temporal o una resolución

 Acciones de recuperación

 Si se requiere, se envía un RFC

 Cerrar el incidente
 El Centro de Servicio confirma que se ha resuelto

 Se identifica en la categoría de cierre

 Se confirma la clasificación

 Se cierra el incidente
5. Actividades (continúa)
 Propiedad, monitorización, seguimiento y comunicaciones
 Monitorizar el progreso y escalarlo cuando se requiera
 Mantener los usuarios informados del progreso
 Proveer información de la gestión
 Involucrar Gestión de Problemas en caso de incidentes
mayores

Incidentes mayores
 Los de mayor impacto y los que consumen grandes cantidades de
tiempo son los candidatos para Incidente Mayor
 El Gestor de Problemas realiza reuniones regulares con los actores
principales para decidir acciones de seguimiento
 El Centro de Servicio se asegura de registrar todas las decisiones y
acciones
 Especialistas pueden apoyar en la solución, para que el Centro de
Servicio continúe con la atención de primera línea
6. Control
 Gestor de Incidentes
 Identificar las partes faltantes en el proceso
 Identificar conflictos con los acuerdos
 Seguir el desarrollo de los procesos
 Identificar las tendencias
 Gestión de Línea TI
 El progreso de la resolución del proceso
 El ciclo horario del incidente e los distintos grupos de soporte
 Gestión de Niveles de Servicio
 Calidad de los servicios brindados
 Informes para clientes
 Cumplimiento de los Acuerdos
 Gestores de proceso de otros procesos
 Número de incidentes informados y registrados
 Número de incidentes resueltos
 Estado de los incidentes sin resolver
 Incidentes por periodo
 Incidentes por categoría, prioridad y grupo de soporte
7. Costes

 Definición de procesos
 Formación e instrucción del personal
 Herramientas para dar soporte
 Personal
 Una Base de Datos de Configuración actualizada y fiable
8. Rol – Gestor de Incidentes

 Monitorización de la eficacia y la eficiencia de los procesos


 Controla el trabajo de los grupos de soporte
 Hace recomendaciones para mejorar
 Desarrolla y mantiene el Sistema de Gestión de Incidentes
Campos de un registro de Incidente
 Número único
 Detalles de clasificación
 Fecha de registro
 Quién lo envía
x
 Detalles del contacto Impacto
 Síntomas
n
 Categorías Prioridad

 Impacto, Urgencia y Prioridad


y
 CIs respectivos Urgencia

 Personal de Soporte
 Problema o error conocido
 Fecha de resolución
 Categoría de Cierre
 Detalles de cada respuesta dada
 Nombre de quien responde
 Fechas de las respuestas
Niveles de Apoyo
Primer Nivel Segundo Nivel Tercer Nivel Nivel n
Detectar y
de Soporte de Soporte de Soporte de Soporte
Registrar

SI Solicitud
Detectar y
de
Registrar
Servicio

Soporte
Inicial
escalado

NO Soporte
Se resolvió Inicial Soporte
Inicial

NO
Resolución Se resolvió
NO
Se resolvió

Resolución
Resolución

Cerrar
aprendizaje Fuente OGC
Resumen del Módulo
Centro de
Servicio y Unidades de Soporte

Entradas Proceso de Gestión de Incidentes Salidas


• Incidentes Detección, • Actualizaciones
Nuevos y Activos Comunicación y y Soluciones de
• Detalles de Registro Incidentes
Problemas y de • Solicitudes de
Clasificación y
errores conocidos Apoyo Inicial
Servicio para
• Cambios RFCs
completados • Actualizaciones

Comunicación
• Detalles de Solicitud si al usuario
CMDB de
Servicio • Seguimiento • Métricas e
• Detalles de SLA Informes
• Propiedad
Solicitud de Servicio
Procedimiento de
no
• Monitor
Investigación y
Diagnóstico • Informar

Resolución y
Recuperación

Cierre del
Incidente
Preguntas Frecuentes

1) ¿Cuándo actúan los niveles de soporte?

2) ¿Quién controla los incidentes, el Centro de Servicio o la


Gestión de Incidentes?
3) ¿Resuelve o no resuelve la Gestión de Incidentes?

4) ¿Cuándo participa la Gestión de Problemas dentro de las


actividades de la Gestión de Incidentes?
5) ¿Quién define la prioridad de un incidente?
Pregunta del Examen
¿Qué proceso de ITIL es responsable de enviar una
solicitud de RFC?

 Gestión de Versiones
 Gestión del Cambio
 Gestión de Incidentes
 Gestión de Configuración

El objetivo del proceso de Gestión de Incidentes es:


 Atender todas las llamadas de los usuarios
 Resolver los problemas
 Restablecer el servicio tan pronto sea posible
 Registrar los Cambios en la MCDB
Actividad GRUPAL
 En su Organización existen los servicios de Mesa de Ayuda,
por lo tanto defina:

 Como es el proceso de registro de incidente?


 Una alta de usuario, es un requerimiento de servicio o un incidente?
 Comente sobre la herramienta que utilizan para el registro de
Incidentes

Facilitar el entregable en una hoja por grupo (45 minutos)


EJEMPLO DE GESTION DE INCIDENTES
 El service desk del banco central de reserva ha recibido
una llamada telefonica de la secretaria de la Gerencia
de Estudios Económicos y Monetarios, acerca de un
incidente con la impresora de la gerencia, la cual
imprime manchas en los documentos impresos.
 Originado el incidente la Gestión de Incidencias
empieza a resolver la interrupción del servicio TI de
acuerdo al siguiente procedimiento:
 Registro y Clasificación del Incidente
 Consulta a la B.D de Conocimiento
 Escalado
 Solución
 Resolución y Cierre
EJEMPLO DE GESTION DE INCIDENTES
 1.- Registro y Clasificación: El service desk procede a la
creación del registro del incidente asignándole un
numero de registro.
 Se clasifica el incidente como de bajo impacto, ya que los
documentos a imprimir pueden ser derivados a otra
impresora.
 A partir de la llamada el Service desk otorga al incidente
la categoria de registrado y activado
 2.- Consulta a la B.D de Conocimiento: Se consulta a la
base de datos del conocimiento y se verifica si existe
una solución preestablecida, de tal forma que no se
recurra al escalado.
 Como la solución del incidente no se encuentra en la
B.D del conocimiento, escapa a las posibilidades del
Service Desk, por lo que el inicdente escala a un nivel
superior de soporte.
 3.- Escalado: En el escalado la solución del incidente
puede ser a nivel técnico o a nivel de altos responsables
del dpto T.I. De acuerdo al nivel se decide que
corresponde al escalado técnico
 4.- Solución: El personal técnico revisa internamente
la impresora y determina que un componente llamado
fusor necesita ser cambiado.
Gestión de Incidentes

 La Gestión de Incidentes tiene como objetivo resolver cualquier


incidente que cause una interrupción en el servicio de la manera más
rápida y eficaz posible.
 La Gestión de Incidentes no debe confundirse con la Gestión de
Problemas, pues a diferencia de esta última, no se preocupa de
encontrar y analizar las causas subyacentes a un determinado incidente
sino exclusivamente a restaurar el servicio. Sin embargo, es obvio, que
existe una fuerte interrelación entre ambas.
Introducción y Objetivos

 Los objetivos principales de la Gestión de


Incidentes son:
 Detectar cualquiera alteración en los servicios TI.
 Registrar y clasificar estas alteraciones.
 Asignar el personal encargado de restaurar el servicio
según se define en el SLAcorrespondiente.
:

Esta actividad requiere un estrecho contacto con los usuarios,


por lo que el Centro de Servicios (Service Desk) debe
jugar una papel esencial en el mismo.
El siguiente diagrama resume el proceso de gestión de
incidentes
 Aunque el concepto de incidencia se asocia naturalmente con cualquier
malfuncionamiento de los sistemas de hardware y software según el
libro de Soporte del Servicio de ITIL®un incidente es:
 “Cualquier evento que no forma parte de la operación estándar de un
servicio y que causa, o puede causar, una interrupción o una reducción
de calidad del mismo”.
 Por lo que casi cualquier llamada al Centro de Servicios puede
clasificarse como un incidente, lo que incluye a las Peticiones de
Servicio tales como concesión de nuevas licencias, cambio de
información de acceso, etc. siempre que estos servicios se consideren
estándar.
 Cualquier cambio que requiera una modificación de la
infraestructura no se considera un servicio estándar y requiere el inicio
de una Petición de Cambio (RFC) que debe ser tratada según los
principios de la Gestión de Cambios.
 Los principales beneficios de una correcta Gestión de
Incidentes incluyen:

 Mejorar la productividad de los usuarios.


 Cumplimiento de los niveles de servicio acordados en el SLA.
 Mayor control de los procesos y monitorización del servicio.
 Optimización de los recursos disponibles.
 Una CMDB más precisa pues se registran los incidentes en relación con
los elementos de configuración.
 Y principalmente: mejora la satisfacción general de clientes y usuarios.
 Por otro lado una incorrecta Gestión de Incidentes puede
acarrear efectos adversos tales como:
 Reducción de los niveles de servicio.
 Se dilapidan valiosos recursos: demasiada gente o gente del
nivel inadecuado trabajando concurrentemente en la
resolución del incidente.
 Se pierde valiosa información sobre las causas y efectos de
los incidentes para futuras reestructuraciones y
evoluciones.
 Se crean clientes y usuarios insatisfechos por la mala y/o
lenta gestión de sus incidentes.
 Las principales dificultades a la hora de implementar la Gestión de
Incidentes se resumen en:
 No se siguen los procedimientos previstos y se resuelven las incidencias
sin registrarlas o se escalan innecesariamente y/o omitiendo los
protocolos preestablecidos.
 No existe un margen operativo que permita gestionar los “picos” de
incidencias por lo que éstas no se registran adecuadamente e impiden
la correcta operación de los protocolos de clasificación y escalado.
 No están bien definidos los niveles de calidad de servicio ni los
productos soportados. Lo que puede provocar que se procesen
peticiones que no se incluían en los servicios previamente acordados
con el cliente.
Clasificación del Incidente

 Es frecuente que existan múltiples incidencias concurrentes por lo que


es necesario determinar un nivel de prioridad para la resolución de las
mismas.
 El nivel de prioridad se basa esencialmente en dos parámetros:

 Impacto: determina la importancia del incidente dependiendo de


cómo éste afecta a los procesos de negocio y/o del número de usuarios
afectados.
 Urgencia: depende del tiempo máximo de demora que acepte el
cliente para la resolución del incidente y/o el nivel de servicio acordado
en el SLA.
 También se deben tener en cuenta factores auxiliares tales como el
tiempo de resolución esperado y los recursos necesarios: los incidentes
“sencillos” se tramitarán cuanto antes.
 Dependiendo de la prioridad se asignarán los recursos necesarios para
la resolución del incidente.
 La prioridad del incidente puede cambiar durante su ciclo de vida. Por
ejemplo, se pueden encontrar soluciones temporales que restauren
aceptablemente los niveles de servicio y que permitan retrasar el cierre
del incidente sin graves repercusiones.
 Es conveniente establecer un protocolo para determinar, en primera
instancia, la prioridad del incidente.
 El siguiente diagrama nos muestra un posible
“diagrama de prioridades” en función de la urgencia e
impacto del incidente:
Escalado y Soporte

 Es frecuente que el Centro de Servicios no se vea capaz de resolver en


primera instancia un incidente y para ello deba recurrir a un
especialista o a algún superior que pueda tomar decisiones que se
escapan de su responsabilidad. A este proceso se le
denomina escalado.
 Básicamente hay dos tipos diferentes de escalado:
 Escalado funcional: Se requiere el apoyo de un especialista de más
alto nivel para resolver el problema.
 Escalado jerárquico: Debemos acudir a un responsable de mayor
autoridad para tomar decisiones que se escapen de las atribuciones
asignadas a ese nivel, como, por ejemplo, asignar más recursos para la
resolución de un incidente específico.
 El proceso de escalado puede resumirse gráficamente*
como sigue

El escalado puede incluir más niveles en grandes


organizaciones, o por el contrario , integrar
diferentes niveles en el caso de PYMES
Registro

 La admisión y registro del incidente es el primer y necesario


paso para una correcta gestión del mismo.
 Las incidencias pueden provenir de diversas fuentes tales
como usuarios, gestión de aplicaciones, el mismo Centro
de Servicios o el soporte técnico, entre otros.
 El proceso de registro debe realizarse inmediatamente pues
resulta mucho más costoso hacerlo posteriormente y se
corre el riesgo de que la aparición de nuevas incidencias
demore indefinidamente el proceso
 La admisión a tramite del incidente: el Centro de Servicios debe de ser capaz
de evaluar en primera instancia si el servicio requerido se incluye en el SLA del
cliente y en caso contrario reenviarlo a una autoridad competente.
 Comprobación de que ese incidente aún no ha sido registrado: es moneda
corriente que más de un usuario notifique la misma incidencia y por lo tanto
han de evitarse duplicaciones innecesarias.
 Asignación de referencia: al incidente se le asignará una referencia que le
identificará unívocamente tanto en los procesos internos como en las
comunicaciones con el cliente.
 Registro inicial: se han de introducir en la base de datos asociada la
información básica necesaria para el procesamiento del incidente (hora,
descripción del incidente, sistemas afectados...).
 Información de apoyo: se incluirá cualquier información relevante para la
resolución del incidente que puede ser solicitada al cliente a través de un
formulario específico, o que pueda ser obtenida de la propia CMDB (hardware
interrelacionado), etc.
 Notificación del incidente: en los casos en que el incidente pueda afectar a
otros usuarios estos deben ser notificados para que conozcan como esta
incidencia puede afectar su flujo habitual de trabajo.
Clasificación
 La clasificación de un incidente tiene como objetivo principal el recopilar toda
la información que pueda ser de utilizada para la resolución del mismo.
 El proceso de clasificación debe implementar, al menos, los siguientes pasos:
 Categorización: se asigna una categoría (que puede estar a su vez subdividida
en más niveles) dependiendo del tipo de incidente o del grupo de trabajo
responsable de su resolución. Se identifican los servicios afectados por el
incidente.
 Establecimiento del nivel de prioridad: dependiendo del impacto y la
urgencia se determina, según criterios preestablecidos, un nivel de prioridad.
 Asignación de recursos: si el Centro de Servicios no puede resolver el
incidente en primera instancia designara al personal de soporte técnico
responsable de su resolución (segundo nivel).
 Monitorización del estado y tiempo de respuesta esperado: se asocia un
estado al incidente (por ejemplo: registrado, activo, suspendido, resuelto,
cerrado) y se estima el tiempo de resolución del incidente en base
al SLA correspondiente y la prioridad.
Análisis, Resolución y Cierre de Incidentes
 En primera instancia se examina el incidente con ayuda de
la KB para determinar si se puede identificar con alguna
incidencia ya resuelta y aplicar el procedimiento asignado.
 Si la resolución del incidente se escapa de las posibilidades
del Centro de Servicios éste redirecciona el mismo a un
nivel superior para su investigación por los expertos
asignados. Si estos expertos no son capaces de resolver el
incidente se seguirán los protocolos de escalado
predeterminados.
 Durante todo el ciclo de vida del incidente se debe
actualizar la información almacenada en las
correspondientes bases de datos para que los agentes
implicados dispongan de cumplida información sobre el
estado del mismo.
Si fuera necesario se puede emitir una Petición de Cambio (RFC).
Si la incidencia fuera recurrente y no se encuentra una solución
definitiva al mismo se deberá informar igualmente a la Gestión de
Problemas para el estudio detallado de las causas subyacentes.

 Cuando se haya solucionado el incidente se:


 Confirma con los usuarios la solución satisfactoria del
mismo.
 Incorpora el proceso de resolución a la KB.
 Reclasifica el incidente si fuera necesario.
 Actualiza la información en la CMDB sobre los
elementos de configuración (CI)implicados en el
incidente.
 Cierra el incidente.
Control del Proceso
 La correcta elaboración de informes forma parte esencial en el proceso de Gestión de
Incidentes.
 Estos informes deben aportar información esencial para, por ejemplo:
 La Gestión de Niveles de Servicio: es esencial que los clientes dispongan de
información puntual sobre los niveles de cumplimiento de los SLAs y que se adopten
medidas correctivas en caso de incumplimiento.
 Monitorizar el rendimiento del Centro de Servicios: conocer el grado de satisfacción del
cliente por el servicio prestado y supervisar el correcto funcionamiento de la primera
línea de soporte y atención al cliente.
 Optimizar la asignación de recursos: los gestores deben conocer si el proceso de escalado
ha sido fiel a los protocolos preestablecidos y si se han evitado duplicidades en el proceso
de gestión.
 Identificar errores: puede ocurrir que los protocolos especificados no se adecuen a la
estructura de la organización o las necesidades del cliente por lo que se deban tomar
medidas correctivas.
 Disponer de Información Estadística: que puede ser utilizada para hacer proyecciones
futuras sobre asignación de recursos, costes asociados al servicio, etc
 Por otro lado una correcta Gestión de Incidentes requiere de una
infraestructura que facilite su correcta implementación. Entre ellos cabe
destacar:
 Un correcto sistema automatizado de registro de incidentes y relación con los
clientes
 Una Base de Conocimiento (KB) que permita comparar nuevos incidentes con
incidentes ya registrados y resueltos. Una (KB) actualizada permite:
 Evitar escalados innecesarios.
 Convertir el “know how” de los técnicos en un activo duradero de la
empresa.
 Poner directamente a disposición del cliente parte o la totalidad de estos
datos (a la manera de FAQs) en una Extranet. Lo que puede permitir que a
veces el usuario no necesite siquiera notificar la incidencia.
 Una CMDB que permita conocer todas las configuraciones actuales y el
impacto que estas puedan tener en la resolución del incidente.
 Para el correcto seguimiento de todo el proceso es indispensable la
utilización de métricas que permitan evaluar de la forma más objetiva
posible el funcionamiento del servicio. Algunos de los aspectos clave a
considerar son:
 Número de incidentes clasificados temporalmente y por prioridades.
 Tiempos de resolución clasificados en función del impacto y la
urgencia de los incidentes.
 Nivel de cumplimiento del SLA.
 Costes asociados.
 Uso de los recursos disponibles en el Centro de Servicios.
 Porcentaje de incidentes, clasificados por prioridades, resueltos en
primera instancia por el Centro de Servicios.
 Grado de satisfacción del cliente.
Caso Práctico
 El Service Desk de "Cater Matters" ha recibido una
llamada del encargado de suministros del comedor de uno
de sus clientes.
 Dicho encargado informa de que a pesar de haber
solicitado una nueva partida de helados hace unos días a
través de la web ésta aún no se ha recibido y apenas quedan
reservas en sus frigoríficos
 El operador del Service Desk busca en la base de datos de
pedidos y confirma que se realizo el pedido hace varios días
pero también observa que éste se ha guardado
defectuosamente.
 El operador intenta desde su puesto repetir la orden pero el
sistema sigue fallando.
El operador toma, basándose en los protocolos establecidos, las siguientes
decisiones:
 Evalúa la prioridad: aunque el impacto es bajo, el incidente es urgente
pues el cliente necesita rápidamente el suministro.
 Registra los datos del incidente.
 Consulta la Base de Conocimiento para investigar si el incidente es
consecuencia de un error conocido y cuales son las posibles
soluciones temporales
 Propone una solución temporal al cliente: indica una zona reservada de
la web desde la que se pueden realizar pedidos "urgentes" vía email.
 Contacta con el departamento de sistemas previendo que el incidente
pueda repetirse a lo largo de la mañana.
 Consulta, mediante la aplicación que monitoriza las existencias de
almacén, la disponibilidad de los helados solicitados.
 Tranquiliza al cliente asegurándole que mediante su servicio express
recibirá los helados solicitados antes del mediodía
Por otro lado el departamento de sistemas:
 Realiza una serie de pruebas y comprueba que, de manera general, el sistema
funciona correctamente.
 No consigue identificar la causa del incidente.
 Contacta con el Service Desk y propone que se eleve el problema a la Gestión
de Problemas pero pre-calificando su prioridad como baja.
El Service Desk recibe la información y determina que:
 Dado el bajo impacto del incidente y el hecho de que se haya proporcionado al
cliente una solución temporal satisfactoria no se requiere un escalado superior.
 Registra la solución temporal del incidente junto a la información
proporcionada por el departamento de sistemas.
 Da por cerrado el incidente

También podría gustarte