Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ha pasado casi un mes desde que escribí mi ultimo post sobre ITIL y si alguno pensó
que estaba vagando o simplemente me había aburrido de escribir, déjenme decirles que
uno de mis principales defectos (o quizás virtud….) es estar siempre estudiando algo, lo
que me resta tiempo para cosas como escribir en mi blog y demás actividades de ocio.
Bueno hoy pienso dar un paso mas para ir concluyendo mis posts sobre ITIL v3; hasta
el momento ya he escrito 4 posts y no quiero caer pesado pero les recomiendo leer los
posts anteriores para entender todo el contexto de ITIL.
- Introducción a ITIL v3
- Estrategia del Servicio
- Diseño del Servicio
- Transición del Servicio
Con esas cuantas líneas arriba he tratado de resumir lo que hace la Operación del
Servicio y que entramos a analizar en este mismo instante:
Se tiene una aplicación llamada “ABC” programada en Java que utiliza una BD Oracle,
esta aplicación es accedida mediante un browser por los clientes quienes agregan
información de manera diaria.
Cierto día, los chicos de SO reciben un correo de sistema CACTI (sistema que
monitorea el ancho de banda de la red) indicando que el consumo del ancho de banda de
la red se ha incrementando en un 40% desde las 12pm hasta las 4pm. A los 2 días de
recibido este correo, llega otro correo del sistema CACTI indicando que el disco duro
del servidor de BD ha pasado el 80% de su capacidad y que se recomienda liberar
espacio. Al tercer día (y justo fin de mes) llama un cliente indicando que el sistema
“ABC” no funciona y que no puede adjuntar información y que necesita hacerlo lo antes
posible porque tiene que terminar su trabajo de fin de mes, a los 10 minutos de esta
llamada se reciben 5 nuevas llamadas de otros usuarios con el mismo inconveniente.
Evento: Aumento del consumo del ancho de banda en un 40% (lo mas seguro es que
algún usuario estaba agregando bastante información)
Alerta: Uso del disco duro en un 80%
Incidente: Primera llamada del usuario que no puede adjuntar archivos
Problema: 5 clientes que no pueden usar el sistema el fin de mes
Workaround (Solución temporal): Montar nuevo disco duro para aumentar el espacio
en disco
KnowError (Error conocido-KE): Este error se ha presentado con anterioridad y el
procedimiento de solución y causa del problema esta documentada.
Reactivo: Personas que actúan solo frente a un aviso o problema.
Proactivo: Personas que están en búsqueda de la mejora continua
A partir de este punto se crean nuevos paradigmas: Calidad del Servicio Vs. Costo del
servicio. Es que nosotros como TI podríamos decirle al cliente que el tiempo de
respuesta frente a la caída de un servicio será de solo 10 minutos pero necesitamos:
¿Es esto posible? la mejor idea es siempre buscar un equilibrio entre la calidad del
servicio y el costo de modo que se pueda cumplir con los requerimientos del negocio.
Los procesos en la Operación del servicio son:
- Gestión de Incidentes
- Gestión de Eventos
- Cumplimiento de Solicitudes
- Gestión de Problemas
- Gestión de Accesos
GESTION DE INCIDENTES
El objetivo principal de la Gestión de incidentes es restaurar los niveles normales del
servicio lo mas rápido posible, asegurando el cumplimiento del SLA (calidad, tiempo y
disponibilidad)
El
diagrama explica la relación entre un incidente, problemas, KE (error conocido),
workaround (solución temporal) y un RFC (solicitud de cambio).
Cuando hablamos de incidentes es inevitable hablar de escalamiento, imaginemos que
llaman por un problema de red, la persona que le contesta no puede ayudarlo entonces
pasa a otra persona que conoce mas del asunto y si esta persona no puede, pasa a un
certificado en CCNA y así sucesivamente; a este proceso se le llama ESCALAMIENTO
y existen 2 tipos:
¿Dónde lo registro?
ITIL v3 no especifica donde registrarlo pero se recomienda tener una herramienta de
registro de incidentes que nos ayudara para los reportes y futuras auditorias de TI.
No quiero irme por las ramas con el tema de auditoria pero en empresas serias existe
algo que se llama CONTROL INTERNO (Auditoria Interna) que registra todos los
incidentes que deberían concordar con nuestra BD de incidentes.
¿Qué registro?
Pues absolutamente todo!!! ITIL recomienda registrar lo siguiente:
Registrar 2 veces el mismo evento es uno de los principales errores que se comente en la
GESTION DE INCIDENTES.
Clasificación, comparación y apoyo inicial
La imagen superior muestra un ejemplo de clasificación, ITIL no te dice como debes
clasificarlo eso depende de los procesos de la organización, de la misma manera la
clasificación por prioridad debe regirse a políticas particulares dentro de la
organización.
Después de haber detectado el problema la gestión de incidentes debe tratar de resolver
de manera rápida, ellos son la primera línea de defensa, son EL APOYO INICIAL. Para
tratar de resolver el incidente y restablecer el funcionamiento correcto se ayuda de la
BD de Errores conocidos y la BD de Workarounds (soluciones temporales), si a pesar
de ello no se puede solucionar el incidente se procede a escalar el incidente.
Hay que tener cuidado en NO REPETIR EL TRABAJO y esto pasa por una
COMPARACION de síntomas de otros incidentes.
Investigación y diagnostico
Después de haber sido detectado, registrado, clasificado y no haber podido resolver el
problema de manera rápida, pasamos a la investigación del incidente hasta dar con la
causa del problema. Este proceso puede pasar por distintos niveles de escalamiento y de
expertos.
Resolución y Recuperación
Se dio con la causa del problema y se provee de un workaround y se restablece el
servicio; si es necesario un cambio se le comunica a la GESTION DE CAMBIOS.
Hay otros temas que también hay tener en cuenta como por ejemplo MANTENER AL
USUARIO SIEMPRE INFORMADO!, ¿cómo piensa el usuario? el usuario cuando
nadie lo llama piensa que nadie se esta encargando de resolver su problema y luego
vienen las quejas!!! es mejor mantener al usuario siempre informado.
Otro tema muy importante es el MAL ESCALAMIENTO, muchas veces se abusa del
escalamiento y cualquier problema es ESCALADO rápidamente distrayendo a los
especialista en temas que no son importantes. (ESTA ES PREGUNTA DE
CERTIFICACION ITIL).
Y por ultimo y quizás el mayor problema que presenta la gestión de incidentes es la
falta de un SLA y Catalogo de servicios, cuando estos documentos no están presentes
cualquier problema relación con tecnología va ser automáticamente asignado al área de
TI sin importar temas como tiempo y recursos.
No olvidar que ITIL cuantifica todo, por ello nosotros debemos ser capaces de tener
reportes de la gestión de incidentes que respondan a las siguientes preguntas:
GESTION DE EVENTOS
Sobre los evento ITIL v3 no hace demasiado hincapié pero debemos tener bien claro lo
siguiente:
CUMPLIMIENTO DE SOLICITUDES
ITIL v3 establece un proceso para atender las solicitudes de los usuarios. Los objetivos
de este proceso es:
- Establecer un procedimiento estándar de solicitud de servicios, por ejemplo el estándar
podría ser ingresar a una pagina web y responder ciertas preguntas.
- Realizar cambios menores que no sean críticos en la organización y que tampoco
puedan tener un impacto en el servicio, por ejemplo la solicitud de cambio de
contraseña de un usuario para algún sistema especifico; por lo general este tipo de
cambios no necesitan un RFC (Request For Change).
- Establecer mecanismos y protocolos de respuesta a inquietudes y preguntas de
usuarios.
GESTION DE PROBLEMAS
La Gestión de problemas administra todo el ciclo de vida del problema, desde que se
inicia hasta que se tiene una solución al problema, entonces aquí salta una pregunta:
“¿Que es un problema para ITIL?”.
ITIL hace un diferencia importante entre incidente y problema, un incidente es algo
pequeño, algo asilado quizás o cuyo impacto es menor; en cambio un problema es un
incidente recurrente, un incidente que afecta a muchos usuarios o un incidente de un
gran impacto.
Algunos conceptos:
KnowError (KE – Error conocido): ITIL apunta a que todo problema debe ser resuelto y
dar como resultado un KE, un KE es entender la causa de la falla y no necesariamente
conocer la solución, es decir ITIL recomienda tener registrado todos los errores en una
BD, Base de Datos de Errores conocidos (KEDB).
Control de problemas
- Define e investiga los problemas y su principal función es transformar los problemas
en KE.
- La principal fuente de información para el registro de problemas es la BD del registro
de incidentes.
Control de Errores
- Se ocupa de resolver Errores Conocidos (KE) mediante la Gestión de Cambios, la
Gestión de problemas se encarga de todo el ciclo de vida del problema lo que quiere
decir que debe estar monitoreando el cambio que sera realizado por la Gestión de
Cambios.
Como en todos los procesos de ITIL con la BD de los Errores Conocidos nosotros
debemos poder sacar informes de gestión: cantidad de problemas resueltos, tiempo
tomado para resolver problemas, costos asociados con los problemas, etc.
GESTION DE ACCESO
La gestión de acceso lo que hace es brindar derechos a los usuarios para facilitarles el
uso de uno o varios servicios. Por ejemplo el día de mañana va ingresar un nuevo
Director General a la organización, esta persona debe tener acceso a ciertos sistemas
que normalmente no son accedidos por cualquier trabajador convencional, ESTO ES EL
TRABAJO DE LA GESTION DE ACCESO.
- Introducción a ITIL v3
- Estrategia del Servicio
- Diseño del Servicio
- Transición del Servicio
- Service Operation – Parte I
Es evidente que para poder entender en su totalidad este post, les recomiendo antes
haber leído los posts arriba mencionados. La Operación del Servicio (SO) se encarga de
mantener que todos los servicios funcionen correctamente siempre, se encarga de las
operaciones del día a día y son los que tienen contacto directo con los usuarios.
¿Quienes son los que realizan este trabajo? Existe un grupo humano encargado de
realizar esta laboriosa y a veces tedioso trabajo, ellos son los chicos de SERVICE
DESK.
Si alguien pensó que la respuesta a la pregunta era HELP DESK, no lo culpo porque es
la respuesta mas lógica y la que seguro la mayoría de las personas, que inclusive están
envueltos en el mundo de IT, hubieran respondido.
ITIL v3 indica que Service Desk actúa sobre la Gestión de eventos, Gestión incidentes y
cumplimiento de solicitudes. ¿Actúa sobre la Gestión de problemas y la Gestión de
Acceso? La respuesta es obvia, NO!! la Gestión de problemas se toma cierto tiempo
para poder encontrar la causa del problema y generar un Know Error y un RFC por lo
que se infiere que en la Gestión de problemas actúan los especialistas; de la misma
manera en la Gestión de Acceso son personas con cierto nivel de autorización quienes
son capaces de poder dar los privilegios correspondientes a los usuarios.
Service Desk además cumple un ROL importante, Service Desk es el único punto de
contacto para atender servicios, a esto ITIL llama SPOC. Aquí entra un poco de cultura
organizacional, aquí unos ejemplos:
Estoy seguro que alguna vez han escuchado estas frases,verdad? y ¿como resolver este
problema? la solución no están sencilla y tomar la decisión de cambiar esto y no
contestar llamadas personalizadas pasa por un cambio en la cultura organizacional y de
los usuarios, un cambio gradual es lo ideal; además de un cambio de tecnología también
como por ejemplo agregar mas números telefónicos a la central de Service Desk.
Service Desk Local: Es el clásico service desk de una empresa, donde existe un grupo
de usuarios locales y un solo centro de servicio.
Service Desk Centralizado: El mejor ejemplo aquí son las organizaciones que prestan
servicios de Service Desk a otras organizaciones, por ejemplo las organizaciones que
brindan soporte a los Bancos. Aquí existen múltiples usuarios y un solo centro de
servicio.
Service Desk Virtual de Servicios Centralizados: Aquí el ejemplo son las grandes
empresas de Internet, por ejemplo MySQL Support (La versión Enterprise de MySQL
brinda este servicio) tiene diferentes centros de Servicio: uno para Latinoamérica, otro
para China, etc etc pero todos son contactados por un único medio, mediante la creación
de un ticket mediante su pagina web.
La imagen superior explica las maneras en como Service Desk recibe solicitudes de
atención: correo, vía telefónica, vía web, etc y además no olvidemos que cualquier tipo
de servicio, CUALQUIER!!! debe ser recibido por Service Desk.
El factor humano juega aquí un rol muy importante, el factor humano debe:
Informes de Gestión
Como en todos los procesos de ITIL, debemos ser capaces de poder tener informes
detallados sobre nuestro Service Desk.
Hasta aquí llego este post, he tratado de cubrir lo mas que he podido todo el tema sobre
Service Desk, además les comparto un video que encontré en Youtube sobre Service
Desk, es bastante corto pero resumen muy bien este tema. Saludos a todos y gracias por
sus comentarios.