Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estrategia Ti
Estrategia Ti
Ajay Singh
Vicepresidente y Director General de Service Assurance, BMC Software
Tabla de contenidos
Resumen ejecutivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Cosecha de beneficios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
»» Menos interrupciones de negocio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7
»» Entrega de servicio mejorada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
»» Reducción de costes y aumento de la eficiencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Conclusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Resumen ejecutivo
¿Siente que está en una noria que va cada vez más deprisa? Intentar mantener los niveles acordados de rendimiento y disponibilidad
para los servicios que proporciona supone un reto desalentador. Pero no puede limitarse a mantener el status quo para mantener
las crecientes exigencias de los negocios. Si su organización es como la mayoría, las unidades de negocio exigirán más servicios
conforme la tecnología se integre profundamente en el negocio. Su entorno de TI se volverá más complejo conforme adopte
tecnologías, como la virtualización y metodologías de integración, como la arquitectura orientada al servicio (SOA). Y cada vez
tendrá más presión para mejorar el servicio y reducir costes. Da la impresión de que nunca llegará al nivel exigido.
Entonces, ¿qué puede hacer? Según Gartner,1 “La pregunta que hay que hacerse es, ‘¿pueden las organizaciones de TI satisfacer
las expectativas de negocio trabajando más duro y de la misma forma que lo hicieron en el pasado?’ La respuesta debe ser un
sonoro ‘No.’ Para cumplir las exigencias de negocio a la hora de conseguir niveles mayores de rendimiento y disponibilidad,
mientras se añaden servicios y se reducen costes, hay que modernizar la TI.”
Gartner describe la modernización de TI como “una renovación completa de la cultura de TI con el objetivo específico de desarrollar
un portfolio de procesos que permitirán a los equipos de TI acercarse al negocio conforme se produzca el aumento de la demanda.”2
Un importante conjunto de procesos a desarrollar debe soportar service assurance, o, como se le denomina a veces, la concienciación
de servicio.
Las soluciones de Business Service Management (BSM) están disponibles hoy día para ayudarle a modernizar la TI a través de
una garantía de servicio más eficaz. BSM es una estrategia integral y una plataforma unificada que ayuda a las organizaciones de
TI a reducir sus costes y maximizar el valor del negocio. Las soluciones BSM soportan la garantía del servicio (service assurance) —
una disciplina esencial de BSM — otorgando a la TI varias capacidades importantes, como la capacidad de anticipar eventos,
predecir su impacto y responder automáticamente antes de que los eventos resulten en la degradación o interrupción de los
servicios de negocio. Con estas soluciones reducirá el número de procesos manuales, gestionará las operaciones de forma
proactiva y evitará incidentes que podrán tener un impacto negativo en los ingresos.
En el presente documento se explica la acuciante necesidad de modernizar la TI. Describe el modo en que la sólida capacidad
de service assurance, habilitada por las soluciones de BSM disponibles, le permite satisfacer esta necesidad y ofrecer así
ventajas de negocios convincentes. Estas ventajas incluyen una mayor eficacia del personal de TI, la mejora del suministro
de servicios, reducción de riesgos y menores costes.
1
Haga más con menos
La infraestructura de TI de la mayoría de las organizaciones aumenta su complejidad rápidamente, gracias a SOA y a la virtuali
zación la TI también tiene que cumplir con toda una serie de estrictos requisitos regulatorios y demostrar este cumplimiento
para satisfacer a los auditores. Además, el negocio continúa pidiendo a la TI que añada más servicios.
Así que, ¿cómo puede ponerse al nivel y entregar más servicios por menos? La respuesta es trabajar de forma más inteligente
“modernizando” su acercamiento a service assurance. Esto obliga a realizar una serie de mejoras, como consolidar los procesos
de service assurance, automatizarlos siempre que sea posible, pasar de un modo de operación reactivo a otro predictivo, sim
plificar el diagnóstico de problemas, dar prioridad al trabajo en función del impacto en el negocio y mejorar su comunicación
con el mismo.
Necesita modernizar su acercamiento a service assurance, consolidando y estandarizando procesos, integrándolos en distintos
grupos y asegurando el gobierno adecuado. Además, los procesos que implemente se deben basar en las mejores prácticas
para maximizar su eficacia y efectividad. Muchas organizaciones están volviendo a procesar y controlar frameworks, como IT
Infrastructure Library® (ITIL®) y Control Objectives for Information and related Technology (COBIT), para obtener una guía en los
procesos de mejores prácticas y en la implementación de gobierno.
Es importante mirar más allá de la automatización de las tareas rutinarias. Las organizaciones de TI, de todos los sectores,
se enfrentan a cambios continuos en varias áreas, como cambios en la infraestructura de TI y cambios en los perfiles de carga
de trabajo. Seguir con estos cambios, usando procesos manuales, se ha convertido en algo poco práctico debido a la naturaleza
cada vez más dinámica del entorno de TI. En consecuencia, es importante esforzarse mucho para automatizar los procesos
manuales adaptados, para poder aumentar su agilidad a la hora de adaptarse a los cambios.
De la reacción a la predicción
Muchas organizaciones de TI tienden a tratar los problemas de rendimiento y disponibilidad de forma reactiva. Y en consecuencia,
muchos problemas acaban suponiendo una degradación del servicio. Un planteamiento mucho mejor es el de anticipar proble
mas y tratarlos antes de que lleguen a afectar a la calidad del servicio. Con un planteamiento predictivo, podrá analizar eventos
y tendencias, evaluar su impacto a corto y largo plazo en la calidad del servicio, y tratar con eventos problemáticos antes de que
tengan un impacto en la calidad del servicio. Esto necesita una capacidad de predicción tanto a corto como a largo plazo.
La predicción a corto plazo exige capacidad para analizar eventos de infraestructura de TI, como picos de carga de trabajo,
y cuando ocurra, determinar en casi tiempo real si suponen una amenaza inmediata a la calidad del servicio y alertar al personal
de operaciones de TI. Es importante no obstante, no añadir más alarmas al torrente de alarmas que inundan por lo general los
centros de datos actuales, informando de eventos que no suponen una amenaza a la calidad del servicio. Con un análisis y gestión
de eventos inteligente podrá distinguir entre variaciones de operación normales y anormales. Esta capacidad le permitirá reaccionar
rápidamente frente a eventos problemáticos sin tener que alarmar innecesariamente al personal de TI.
2
La predicción a largo plazo implica ser capaz de detectar problemas que podrían presentar una amenaza para la calidad del
servicio en el futuro. Estos temas están relacionados por lo general con la capacidad. Por ejemplo, si continúa la tendencia
actual de crecimiento de uso, un servidor particular excederá su capacidad de procesamiento en los próximos cuatro meses
y el rendimiento sufrirá. Para cortar esta degradación, será necesario añadir capacidad al servidor antes de ese momento.
Una predicción a largo plazo requiere la capacidad de analizar tendencias de uso así como la de predecir déficits de capacidad que
impliquen retrasos y actuar antes de que la consecuencia de todo sea la degradación del servicio. Mediante una planificación
inteligente de la capacidad, podrá eliminar los gastos innecesarios por comprar más recursos de TI, mientras se asegura de que
la capacidad requerida está ahí cuando se necesite. También podrá maximizar la utilización de recursos para derivar el máximo
retorno de su inversión en recursos de TI.
Algunas organizaciones ya disfrutan de los beneficios que supone una gestión de la capacidad más efectiva. Una compañía
farmacéutica a nivel mundial eliminó las compras de hardware de servidor durante 24 meses, ahorró 7 millones de dólares
en compras previstas de hardware y software y multiplicó por tres la densidad virtual de máquina. Una compañía de servicios
financieros ahorró 2,2 millones de dólares en un periodo de dos años al evitar la compra de 400 servidores.
Puede simplificar y acelerar el análisis de causa-raíz proporcionando al personal de TI las herramientas e información necesarias
que serán de utilidad a los técnicos para analizar de forma rápida e inteligente los temas que determinarán las causas probables.
Las herramientas deben aprovechar y consolidar la información recopilada por el sistema y guiar al personal a la hora de analizar
esta información para centrarse en las causas. Esta guía reduce MTTR y reduce también los niveles de conocimiento que se
exigen al personal.
Un servidor que ejecuta una aplicación utilizada por diseñadores gráficos en el departamento de marketing deja de funcionar.
Unos minutos más tarde, un servidor web que ejecuta una aplicación de pedidos de cara al cliente cae por debajo del nivel
de rendimiento acordado. Se considera que un servidor que no funciona es un problema más grave que una disminución
del rendimiento.
Por lo general, el personal de TI resolverá los dos problemas siguiendo el principio de que el primer problema que entra es el
primer problema que se resuelve (first in, first out) o bien atendiendo a criterios de gravedad. En cualquier caso, ésto se traducirá
en la resolución del problema en el servidor de gráficos en primer lugar. No obstante, la importancia para el negocio de una
aplicación de cara al cliente será ciertamente superior que la de una aplicación de gráficos. El personal de TI deberá, por los
tanto, solucionar el problema en primer lugar en el servidor de la aplicación de cara al cliente.
Para establecer prioridades en función del impacto en el negocio, el personal necesita comprender las relaciones de los com
ponentes de la infraestructura de TI con los servicios que admiten y las prioridades de negocio de esos servicios. Esto requiere
ofrecer al personal una visión de la infraestructura que muestre la correspondencia de los componentes con los servicios y las
prioridades de negocio de los servicios.
Es importante asignar prioridades. Con la priorización de incidentes, CARFAX, un proveedor líder de historiales de vehículos,
obtuvo más de 4,4 millones de dólares en ingresos por año gracias a una reducción del 82 % en las tasas de errores mensuales y
en un 74,6% en la reducción mensual del tiempo de inactividad.
3
que indiquen la calidad de servicio desde la perspectiva del usuario final, por ejemplo, la disponibilidad general de una aplicación
de planificación de recursos de empresa o el promedio de tiempo transcurrido desde la recepción de un pedido online de un cliente
hasta el envío de la confirmación de pedido por correo electrónico.
También es importante establecer acuerdos de nivel de servicio (SLAs) con medidas que tengan sentido para los usuarios de
negocio y para gestionar la calidad de servicio basándose en estos acuerdos. De esta manera podrá establecer expectativas con
más sentido y comunicar al negocio su éxito cuando cumpla estas expectativas.
La información en la CMDB está compartida por todos los grupos de la TI, permitiéndoles trabajar con información coherente y
exhaustiva. Al permitir que se comparta la información, la CMDB reúne a grupos que antes estaban organizados en un silo.
También ofrece a cada grupo una imagen completa y no limitada del entorno de TI, de forma que se puede obtener una mayor
visión del alcance y el impacto de la disponibilidad y los problemas de rendimiento.
Busque una CMDB creada en una arquitectura federada que permita el acceso a la información dispersa por la empresa sin tener
que mover esta información o duplicarla en la CMDB. La arquitectura debe permitir la ampliación de la CMDB para cumplir las
necesidades de las organizaciones por muy grandes que sean.
Algunas soluciones proporcionan un nivel adicional de correlaciones basadas en la topología que muestra una relación de eventos
basados en servicios. La correlación de topología de servicio tiene en consideración a los eventos generados por la infraestructura
de TI que admiten un servicio de negocio particular que hay que correlacionar.
Las correlaciones basadas en la topología y en el tiempo se pueden ver como un filtro de dos etapas que consolida los eventos
para permitir al personal de TI comprender mejor sus relaciones. Los filtros de dos etapas reducen algo la avalancha de eventos.
Sin embargo se necesita todavía que el personal de TI responda a eventos que, aunque pueden estar relacionados con el tiempo
o con la topología, pueden estar dentro de una banda operativa aceptable y no problemática.
Las soluciones de gestión de BSM ya están disponibles y usan un planteamiento más avanzado para el procesamiento de eventos.
Estas soluciones preceden a los filtros de correlación basados en topología y en tiempo con un nivel adicional de filtrado que
distingue entre un comportamiento normal y anormal. Este filtro primario sólo lo pasan los eventos que indican unas condiciones
fuera de la banda operativa normal.
4
La Figura 1 muestra una comparación del filtrado de eventos de dos y tres niveles. Como ilustra la figura, el número de eventos
al que debe responder el personal de TI se ve ampliamente reducido por el filtro de dos etapas precedentes, con un filtro de evento
normal/anormal de alto nivel. Las ventajas del filtrado normal/anormal son significativas. Por ejemplo, una importante compañía
aseguradora redujo las alarmas de incidentes en un 90% y las alarmas de las que se informó eran muy importantes.
3NCNR©KNR©DUDMSNR
3NCNR©KNR©DUDMSNR
Filtro de eventos
anormales
$UDMSNR© $UDMSNR©@MNQL@KDR
BNQQDK@BHNM@CNR BNQQDK@BHNM@CNR
"NQQDK@BHģM©CD© ġ@CHQ©ȯKSQ@CN©CD©
DUDMSNR©SQ@CHBHNM@K DUDMSNR©@MNQL@KDR
El problema es que la banda operativa normal puede variar con el tiempo. Por ejemplo, la carga de trabajo normal en un servidor
en particular puede aumentar con el tiempo debido a la introducción de un nuevo producto de la compañía. No obstante, este
aumento no supone ninguna amenaza a la calidad del servicio y se puede considerar que está dentro de una nueva banda
operativa más alta y nueva. Estas variaciones en el comportamiento normal necesitan un reajuste continuo del punto de inicio.
Algunos filtros de eventos anormales requieren un reajuste manual, un proceso propenso a los errores y con mucho trabajo.
Lo que se necesita es un filtro de eventos anormal que analice automáticamente las tendencias de carga de trabajo por encima
del tiempo y reajuste el punto de inicio de acuerdo a ésto.
Análisis y guía
Con la creciente complejidad y dinamismo de las infraestructuras de TI de hoy en día, el diagnóstico del problema se ha convertido
en algo extremadamente difícil. Por consiguiente, además de reducir el número de eventos al que debe responder la TI, la solución
debe facilitar un análisis de causa-raíz. Esto crea tres requisitos importantes:
1. Aumento de los eventos anormales con datos complejos, retóricos y relevantes al problema de que se trate. Esto debe incluir la
captura de datos inteligentes en el momento en que ocurra el problema. La captura de datos en el momento de producirse es
especialmente útil a la hora de diagnosticar problemas de rendimiento intermitentes en el altamente dinámico entorno de TI.
2. Empleo de técnicas sofisticadas para analizar eventos anormales y datos retóricos para determinar las causas probables.
Idealmente, la solución crearía una lista reducida de causas probables de un evento anormal clasificadas por probabilidad.
3. Dibujo en la información de topología de servicio que se mantiene en la CMDB para dar prioridad a eventos anormales en
función del impacto que tengan en el negocio. Esto centra al personal de TI en los problemas que tengan más importancia
para el negocio.
5
Este planteamiento avanzado a un análisis causa-raíz reduce enormemente el MTTR, acelerando la solución de problemas que
tienen un impacto negativo en la calidad del servicio. Éste requiere de un personal menos experto y aumenta su eficiencia. Con
este planteamiento, un grupo hospitalario importante redujo el tiempo de resolución de incidentes críticos en un 68% y ahorró
en un año 1,2 millones de dólares por gastos de manos de obra de TI.
La CMDB debe incluir una capacidad de descubrimiento automática que explore periódicamente la infraestructura de TI buscando
activos y cambios en los activos como traslados, adiciones, supresiones y cambios en la configuración. La detección automática
puebla inicialmente la CMDB para acelerar la implementación. También actualiza continuamente la información adaptándola
automáticamente a los cambios de la infraestructura.
La solución de gestión de eventos de BSM debe ser capaz de aprender y adaptarse automáticamente al entorno de TI en el que
reside. Tras la instalación, la solución debe iniciar un proceso de aprendizaje automático que analiza los perfiles de carga de
trabajo y determina el comportamiento de funcionamiento normal del entorno. Debe usar esta información para establecer las
bases automáticamente para el filtrado de evento normal/anormal. Además, la solución debe reajustar automática y continuamente
estos puntos de inicio para acomodar las variaciones de carga de trabajo normal a lo largo del tiempo.
Aprovechamiento e integración
Es importante, hoy en día, tratar la heterogeneidad de las infraestructuras de TI, muchas de las cuales incluyen mainframes así
como componentes de sistema distribuidos. La solución debe proporcionar una recopilación de datos independientemente del
proveedor a través de entornos virtuales y físicos e integrarlos con las herramientas y soluciones que ya tenga. Por ejemplo,
se debe integrar con sus herramientas de recopilación de datos existentes y aprovechar los datos proporcionados por ellas para
extraer más valores, como por ejemplo conectar los datos con la experiencia del usuario final. La solución también se debe
integrar con las consolas de gestión empresarial existentes.
Busque una solución que esté creada en una arquitectura unificada que acomode las soluciones BSM y que soporten otras
disciplinas de TI, como la gestión de problemas e incidentes o la gestión de cambios. Con una arquitectura unificada, podrá añadir
fácilmente otras soluciones BSM y extender los procesos por todos los grupos funcionales. De esta manera, podrá añadir valor
agrupando los grupos que antes estaban organizados en silos, creando así una mayor eficiencia y eficacia. Aquí tiene dos ejemplos:
Integrando la solución que soporta service assurance con la que soporta la gestión de problemas e incidentes, podrá eliminar
la barrera entre operaciones de TI y el servicio de atención al cliente. Esto permite al service desk participar lo antes posible y
moverse de forma proactiva por los problemas antes de que creen una degradación en la calidad del servicio. Por ejemplo, la
solución que soporta service assurance puede crear automáticamente incidentes cuando detecte eventos anormales y añadir
información al respecto así como indicaciones de las causas más probables.
Al integrar la solución BSM que soporta service assurance con la que soporta la gestión de cambios, se asegurará de que los
cambios hechos para aliviar los problemas de servicio no creen otros problemas que podrían impactar de forma negativa en
la calidad del servicio. La solución de gestión de cambios refuerza el uso de los procesos de mejores prácticas a la hora de
implementar cambios para solucionar problemas. Se asegura que todas las aprobaciones requeridas están en marcha antes
de realizar un cambio, que sólo el personal autorizado puede hacer el cambio y que el cambio está documentado según los
requisitos regulatorios.
Cosecha de beneficios
Muchas organizaciones ya disfrutan de los beneficios de la modernización de TI en el área de service assurance. Una organización
importante de servicios financieros recortó el tiempo de inactividad de los servicios de negocio en un 50 por ciento y alcanzó
un retorno de su inversión del 268% en un conjunto de soluciones BSM. CARFAX recuperó su inversión en sólo dos meses. Una
gran compañía de seguros redujo el tiempo de inactividad de su aplicación de negocio en un 66%, disminuyó los problemas con
impacto directo en clientes en un 70% y ahorró 4 millones de dólares a través de ganancias de productividad. Una línea aérea de
ámbito mundial mejoró la disponibilidad de sus sistemas críticos, mejoró el rendimiento de las operaciones y redujo el número
de equivalentes de tiempo completos (FTEs) dedicados a las actividades operacionales reactivas.
6
Menos interrupciones de negocio
Su negocio se ejecutará con más precisión ya que reducirá la frecuencia, gravedad y duración de las interrupciones de TI. Los
problemas se gestionarán proactivamente y se resolverán antes de que puedan impactar en el servicio y antes de que los
usuarios sean conscientes de ello. Además, podrá reducir MTTR y restablecer el servicio rápidamente cuando se produzcan
las interrupciones.
Conclusión
Al modernizar su acercamiento a service assurance, a través de la implementación de la solución BSM más adecuada, podrá
hacer más con menos. Podrá hacer mucho más al reducir las interrupciones de servicio, mejorar la entrega de servicio, aumentar
la agilidad de TI y mejorar su capacidad de mantener el cumplimiento de normas y la seguridad. Lo hará por menos al reducir
la carga de trabajo del personal de TI, aumentando la eficiencia del personal y reduciendo los niveles de conocimiento necesa
rios. Como resultado, cumplirá con las demandas del negocio para mejorar la calidad del servicio, tener más servicios y reducir
costes de TI.
Para obtener más información acerca de las soluciones BMC de garantía del servicio (service assurance), visite www.bmc.com.
NOTAS FINALES
1. IT Modernization: The Changing of the Guard, (Modernización de TI: cambio de guardia) Dale Vecchio, Gartner Research ID
Number: G00158431, Mayo 2008.
2. Ibid.
7
Información sobre el autor
Ajay Singh, Vicepresidente y Director general de Service Assurance, BMC Software
Ajay Singh es responsable de los productos de garantía de servicio de BMC. Se incorporó a BMC con la adquisición de ProactiveNet,
de la que fue fundador, presidente y CEO. Singh cuenta con más de 25 años de experiencia en aplicación y administración de
sistemas, servicios profesionales y marketing. Antes de ser el cofundador de ProactiveNet, ya ocupaba cargos clave de gestión
de nivel superior en Sun Microsystems. Antes de Sun, trabajó en la práctica de estrategia tecnológica en Booz-Allen y Hamilton,
una empresa de consultoría y gestión donde asesoró a clientes como IBM, GE, GM y Boeing. Singh cuenta con un MBA de la
escuela de negocios Stanford Graduate School of Business, con un MS en ingeniería computacional de la universidad de Carnegie
Mellon y un B-Tech del Instituto Indio de Tecnología en Kanpur, India.
BMC, BMC Software y el logotipo de BMC Software son propiedad exclusiva de BMC Software, Inc., son marcas registradas en la oficina de registros y patentes de EE.UU. y pueden estar también
registradas o pendientes de registro en otros países. El resto de marcas, marcas de servicios y logotipos de BMC pueden estar registrados o pendientes de registro en EE.UU. u otros países. ITIL®
es una marca registrada y una marca registrada de la comunidad de la oficina gubernamental de comercio y está registrada en la oficina de registros y patentes de EE.UU.; BMC Software, Inc.
la utiliza aquí bajo licencia y con el permiso de la OGC. IT Infrastructure Library® es una marca registrada de la oficina gubernamental de comercio y BMC Software Inc. la utiliza aquí bajo la licencia
y con el permiso de la OGC. El resto de marcas comerciales o marcas registradas pertenecen a sus respectivos propietarios. ©2009 BMC Software, Inc. Reservados todos los derechos.
*103381*