Está en la página 1de 43

Machine Translated by Google

Los 12 elementos esenciales de las operaciones

de las instalaciones del centro de datos

por David Gentry y Patrick Donovan

schneider-electric.com
Machine Translated by Google

La vida está encendida | Schneider Electric

Tabla de contenido
Transformación de las operaciones de las
Resumen ejecutivo
instalaciones del centro de datos

Introducción Errores comunes

Principios de la
Servicios de operaciones de instalaciones
“Mentalidad de misión crítica”

12 elementos esenciales Conclusión y recursos


Machine Translated by Google

La vida está encendida | Schneider Electric

Resumen ejecutivo
El 70 % de las interrupciones del centro de datos
se pueden atribuir directamente a errores
humanos, según el análisis del Uptime Institute
de su base de datos de informes de "incidentes
anormales" (AIR).1 Esta cifra destaca la
importancia fundamental de contar con un
programa eficaz de operaciones y mantenimiento
70% de error humano
(O&M). Este libro electrónico describe principios
30% otros factores
de gestión únicos y proporciona una descripción
general completa y de alto nivel de los elementos
necesarios del programa para operar una
instalación de misión crítica de manera eficiente y
confiable a lo largo de su ciclo de vida.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Introducción
Un programa de operaciones y mantenimiento (O&M) correctamente
diseñado, implementado y respaldado minimizará el riesgo, reducirá los
costos e incluso brindará una ventaja competitiva para el negocio general
al que sirve el centro de datos.

Un programa mal organizado, por otro lado, puede socavar


rápidamente la intención del diseño de la instalación poniendo a su gente,
Los sistemas de TI y el propio negocio en riesgo de daño o interrupción.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

La importancia de un programa de operación y mantenimiento del

centro de datos eficaz y eficiente se ilustra aún más al considerar los

siguientes puntos:

• La mayoría de las interrupciones de las instalaciones son atribuibles a Este libro electrónico describe un programa y una mentalidad equilibrados

errores humanos (es decir, del operador),1 muchos de los cuales ocurren de gestión de instalaciones críticas con 12 elementos esenciales del programa, a la

como resultado de malas prácticas de operación y mantenimiento . vez que proporciona consejos y sugerencias prácticas en todo momento. Los

administradores y operadores de las instalaciones de los centros de datos pueden

usar esta información para el desarrollo de programas de operación y mantenimiento,


• La mayoría del TCO de las instalaciones del centro de datos está en OPEX,
o como una herramienta para realizar un análisis de deficiencias en un programa
no CAPEX, que es también donde la mayoría de los
existente.
los ahorros de costos potenciales residen

• Los costos de energía representan la porción más grande de OPEX, Tenga en cuenta que los temas tratados en este libro electrónico de ninguna

y el costo de la energía está aumentando manera representan una lista completa de todos los procesos, tareas,

procedimientos o sistemas relacionados con las operaciones y el mantenimiento


• Impulso a la eficiencia energética está reduciendo la capacidad
de instalaciones críticas. Más bien, se ofrece una perspectiva sobre los
márgenes de seguridad y redundancia del sistema, aumentando la importancia
elementos más críticos a considerar al desarrollar o evaluar programas de O&M
del mantenimiento proactivo y la gestión de la infraestructura del centro de datos
en centros de datos nuevos o existentes.
(DCIM)

• Altos niveles de automatización y equipamiento de las instalaciones


1http://www.ponemon.org/blog/2016-
los datos de rendimiento han creado nuevas oportunidades
costo de las interrupciones del centro de datos
para mejorar la confiabilidad mientras se reducen los costos,

cuando se gestiona adecuadamente

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Principios de la
“mentalidad de misión crítica”

Administrar y operar una instalación de misión crítica es muy diferente


a administrar un edificio de oficinas comerciales o una fábrica. Para
la mayoría de los centros de datos, fallar no es una opción.
Algunos lo comparan con “mantener un avión mientras lo vuela”.
Hoy en día, las empresas suelen depender totalmente de su
centro de datos o el centro de datos ES la empresa.
La complejidad es mucho mayor y el ritmo de cambio dentro del
centro de datos es mucho mayor que en la mayoría de los otros
tipos de instalaciones. Los centros de datos cada vez más
definidos por software (es decir, máquinas virtuales, almacenamiento
virtual y redes virtuales) y el movimiento de la carga de trabajo
combinado con ciclos cortos de actualización de TI crean un entorno
de administración desafiante. Estos desafíos requieren una
cuidadosa coordinación y planificación con el equipo de las
instalaciones. El impacto potencial en la disponibilidad del sistema puede

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

ser tan severa que cada tarea operativa La gestión y el funcionamiento eficaces en implementar y administrar un
debe evaluarse cuidadosamente en este tipo de entorno exigen que la gestión programa efectivo de O&M basado
términos de su efecto neto sobre de las instalaciones y su personal adopten en los 12 elementos esenciales.
disponibilidad. También hay presiones una "mentalidad de misión crítica" que se Los 12 son: ambientales
externas únicas. Las regulaciones centre en la mitigación de riesgos y salud y seguridad, gestión de
gubernamentales y las auditorías de los comprenda la interconexión de las personal, preparación y respuesta
clientes requieren procesos y instalaciones y los sistemas de TI. Esta ante emergencias, gestión de
procedimientos detallados que estén filosofía operativa forma la base de un mantenimiento, gestión de cambios,
debidamente documentados y observados programa efectivo de O&M. gestión de documentación, formación,
concienzudamente. La alta criticidad y el gestión de infraestructura, gestión de
costo de las operaciones del centro de La Tabla 1 describe su núcleo calidad, gestión de energía, gestión
datos a menudo invocan un enfoque intenso de principales y resultados. financiera y supervisión y revisión del
el nivel CxO de la organización. El equipo de instalaciones que encarna rendimiento.

esta mentalidad estará en mucho


mejor posición para tener éxito

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

tabla 1

El código de conducta de misión crítica y su impacto en las operaciones del centro de datos

Principios de “mentalidad de misión crítica” Impacto

Enfocado en la mitigación de riesgos en todas las actividades, Aborda proactivamente todas las amenazas potenciales a la
procesos de trabajo y procedimientos operativos y de mantenimiento disponibilidad del sistema y la seguridad de los trabajadores/ocupantes

Actuar con confianza y paciencia que es el resultado de una Evita que los riesgos se conviertan en problemas; permite tiempos de
cuidadosa planificación y preparación. respuesta más rápidos y menos errores si surgen problemas

Enfoque del riesgo analítico y basado en procesos Ayuda a identificar y mitigar el riesgo en entornos
evitación y resolución de problemas complejos; garantiza un funcionamiento predecible y seguro

Comprensión integral de la función y la interconexión de los Identifique y resuelva rápidamente amenazas potenciales o
sistemas y componentes de las instalaciones problemas reales; evitar o reducir el tiempo de inactividad del sistema

Compromiso con el aprendizaje continuo y Aumenta las habilidades y la eficiencia operativa para mantener una
la mejora de procesos ventaja en un entorno en constante cambio

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

12 elementos esenciales
Emergencia
Gestión de personal 02 preparacióny 03
respuesta

Gestión del cambio 05 Documentación 06 gestión 07 Formación Infraestructura 08 gestión

Gestión de la calidad 09 Gestión de energía 10 Gestión financiera 11 Monitoreo y revisión del desempeño 12

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Medio ambiente 01 salud y seguridad

Cada instalación del centro de datos contiene riesgos de


seguridad eléctricos, químicos y mecánicos que pueden
causar lesiones, enfermedades o incluso la muerte si no
se identifican y mitigan adecuadamente.
Por lo tanto, un programa integral de seguridad en el lugar
de trabajo es un componente esencial de cualquier
programa de operación y mantenimiento de un centro de
datos. Las tareas clave de un programa de seguridad
incluyen la prevención de lesiones y enfermedades, la
seguridad eléctrica, el análisis de peligros y la comunicación
de peligros. Un programa efectivo no solo protege a la fuerza
laboral de daños y pérdida de tiempo, sino que también ayuda
a evitar posibles multas y citaciones por parte de las autoridades
gubernamentales, así como a reducir los daños al equipo y las
interrupciones del sistema que a menudo resultan cuando
ocurren accidentes. La Tabla 2 enumera y describe los
atributos críticos de un programa de seguridad eficaz.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Tabla 2
Los atributos críticos de un programa de salud y seguridad ambiental

Atributos clave del programa Descripción

Planes de seguridad y formación. Se deben establecer planes de seguridad por escrito que describan las prácticas y

procedimientos de trabajo seguros que deben observar todos los trabajadores.

También se debe realizar capacitación regular sobre los elementos del programa.

Análisis de riesgo Todos los procedimientos operativos deben comenzar con un análisis de los posibles peligros involucrados. Los

riesgos deben ser identificados y las medidas de seguridad asignadas.

Procedimientos de bloqueo/etiquetado Se deben utilizar los procedimientos adecuados para evitar la activación o el arranque inesperados de máquinas o

equipos (o que provoque una liberación de energía almacenada) al reparar o mantener el equipo.

Equipo de Protección Personal (EPP) Se debe proporcionar el equipo de protección adecuado, del tamaño adecuado, almacenado, mantenido y

utilizado según sea necesario para mitigar los riesgos de seguridad identificados.

Manejo de materiales peligrosos Los materiales peligrosos deben estar debidamente identificados, etiquetados, almacenados, mantenidos y utilizados
de conformidad con los requisitos del fabricante, las leyes locales y las ordenanzas.

Programa de comunicación de peligros Incluye una lista de productos químicos peligrosos, el uso de hojas de datos de seguridad de materiales

(MSDS), el etiquetado adecuado de todos los contenedores de materiales peligrosos y la capacitación de

los empleados sobre el uso y la protección de materiales peligrosos.

Cumplimiento de todas las leyes y reglamentos de Es probable que los requisitos varíen según la región y el nivel de gobierno (por ejemplo, local,

salud y seguridad aplicables estatal, federal).

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

02 Gestión de personal
Todavía se requiere que los humanos instalen, mantengan y operen los sistemas de las Los factores importantes para determinar los niveles de personal

instalaciones del centro de datos. Eliminar el error humano como la causa número uno de son los requisitos de cobertura (p. ej., solo los días de semana, 24 horas

las interrupciones del sistema requiere la contratación y el desarrollo de personas al día, 7 días a la semana), los requisitos de respuesta ante emergencias,

competentes y orientadas al equipo que incorporen la "mentalidad de misión crítica" la carga de trabajo de las actividades de mantenimiento, las necesidades de

descrita anteriormente. Un equipo completo incluye expertos en la materia en las supervisión del proyecto y el presupuesto de operaciones.

siguientes disciplinas: electricidad, mecánica, controles, detección/extinción de incendios,


Se debe realizar un análisis del alcance del mantenimiento de las instalaciones, que
gestión de calidad, capacitación, así como sistemas de gestión de mantenimiento
determina cuántas horas-hombre de mantenimiento se requieren, teniendo en cuenta el
computarizados (CMMS) y otros sistemas de soporte operativo, como centros de datos.
tiempo administrativo para la gestión del cambio y las tareas de capacitación.
gestión de infraestructuras (DCIM) y sistemas de gestión de edificios (BMS). Los equipos de

las instalaciones requieren una amplia capacitación inicial y continua, que se analiza aquí.
El objetivo debe ser dimensionar correctamente el personal para las operaciones

normales y aumentarlo con personal subcontratado para el mantenimiento máximo

y el trabajo del proyecto.

El requisito de cobertura está impulsado fundamentalmente por la criticidad de la

misión y el costo percibido del tiempo de inactividad.


Además de la contratación y la capacitación, otra tarea clave de la
Tener al menos dos técnicos por turno con experiencia en electricidad y
administración de personal es desarrollar un modelo de dotación de personal que sea
mecánica las 24 horas del día, los 7 días de la semana garantizará el más alto
específico para los sistemas de las instalaciones, las funciones comerciales y los mandatos
nivel de capacidad de respuesta ante emergencias. Algunos perfiles de riesgo y/o
operativos de la organización.
presupuestos permiten

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

un modelo más relajado que solo requiere un mínimo de un técnico


en turnos de noche y fines de semana.

Otros pueden estar dispuestos a asumir el mayor riesgo de una cobertura de

menos de 24 horas al día, 7 días a la semana, con una opción de guardia fuera

del horario de atención. Todos son modelos válidos para perfiles de riesgo específicos.

Lo importante es emparejarlos correctamente.

Por último, es crucial tener roles y responsabilidades claramente


definidos para cada puesto individual, así como una declaración
de misión organizacional y de equipo claramente definida. Las
descripciones de puestos bien definidas proporcionan un punto de
referencia para evaluar las habilidades y establecer metas para el
crecimiento y las necesidades de capacitación. Como consecuencia,
se mejorará la satisfacción laboral y la retención de los empleados.

Un personal bien ajustado y capacitado que se centre en una misión


común proporcionará la base sobre la que se debe construir un
programa exitoso de operación y mantenimiento de misión crítica.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google
La vida está encendida | Schneider Electric

03 y respuesta Preparación para emergencias

Para obtener
Independientemente de cuán bueno sea el diseño También es necesario desarrollar y ensayar
una
de la infraestructura y las capacidades del personal, procedimientos de escalamiento para garantizar que la
descripción más
es imposible eliminar todo riesgo de interrupción cadena de mando esté informada y que se utilicen los
detallada del elemento
inesperada del sistema. Una buena preparación es la recursos apropiados a medida que se desarrolla la
de preparación y
mejor defensa y ayudará a garantizar que las situación. Se deben realizar simulacros de escenarios
respuesta ante
respuestas sean oportunas, efectivas y sin errores. La con regularidad para ensayar y evaluar la eficacia de la
emergencias, incluido un ejemplo
preparación para emergencias comienza con el respuesta de emergencia individual y del equipo. Una
EOP y procedimientos de
desarrollo de procedimientos operativos de emergencia vez que se ha tratado un incidente y se han mitigado
simulacro de emergencia,
(EOP) para todos los escenarios de fallas de alto riesgo, sus efectos, se debe realizar un análisis para comprender ver Blanco Papel
como la pérdida de una planta enfriadora, falla en el cuáles fueron las causas fundamentales y qué tan
217, Cómo preparar y
arranque del generador, etc. Los EOP establecen un efectiva fue la respuesta de emergencia para abordar el Responder a datos
plan de acción detallado para aislar fallas de manera problema. Centro Emergencias
segura y restaurar el servicio o la redundancia cuando
El análisis formal de fallas para eventos significativos
sea posible. Estos procedimientos deben publicarse en
de la instalación es una parte fundamental del
áreas donde es probable que se lleve a cabo la
proceso general de mejora continua que se necesita
respuesta.
para reducir las fallas y mejorar la efectividad de la
respuesta en eventos futuros.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Mantenimiento 04
administración

El programa de mantenimiento de las instalaciones


ayuda a garantizar que los sistemas de energía y
enfriamiento funcionen continuamente como se
espera durante todo el ciclo de vida del centro de datos.
Una buena inteligencia de activos combinada con un
Manejo de mantenimiento
plan de mantenimiento preventivo y predictivo
proactivo aumenta la confiabilidad del equipo y la
disponibilidad del sistema. Como resultado, las previsiones
del presupuesto de mantenimiento se vuelven más precisas,
mientras que el costo total de propiedad y el tiempo de Gestión Gestión de Gestión de
inactividad se minimizan. de activos órdenes de trabajo repuestos

Un programa mal administrado, por otro lado, aumenta los


costos operativos debido a tasas de falla más altas que
pueden resultar en reparaciones costosas y períodos
prolongados de inactividad. La gestión de mantenimiento
abarca tres tareas clave: gestión de activos, gestión de Más información sobre cómo Schneider
órdenes de trabajo y gestión de repuestos. Electric puede ayudarlo a enfrentar los desafíos
del mantenimiento del centro de datos

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Gestión de mantenimiento: 04 Gestión de activos

El seguimiento preciso y consistente de todos los activos críticos de las Información recomendada de la base de datos de activos

instalaciones es la base de un buen programa de mantenimiento. Si bien Como mínimo, cada registro de activos debe contener la

una base de datos de activos bien mantenida proporciona los componentes siguiente información:

básicos para un mantenimiento efectivo, una inexacta dará como resultado


• Tipo: clasificación de nivel superior
ineficiencia o incluso fallas en el equipo. Para abordar esto, un (p. ej., sistema eléctrico, mecánico, contra incendios)
sistema de gestión de mantenimiento computarizado (CMMS)
• Subtipo (por ejemplo, PDU, UPS, CRAH)
debe usarse para registrar, rastrear y administrar datos de activos e
• Descripción de texto del activo
historial de mantenimiento. Consulte la barra lateral a la derecha para
• Marca: nombre del fabricante del activo
obtener una lista de atributos de activos recomendados para registrar.
• Modelo: número de modelo del fabricante
Además, cada marca y modelo único de activo debe tener un
• Tamaño o calificación
alcance de servicio (SOS) documentado.
• ID de ubicación (sala/área)
Este documento define el alcance del mantenimiento en términos de
• Responsable comercial del mantenimiento
frecuencia y las actividades específicas requeridas en cada evento de
• Número de serie del fabricante
mantenimiento, junto con la cantidad de horas-hombre necesarias
• Fecha de instalación
para realizar cada servicio. Su función es establecer un estándar que
se utilice en la contratación de acuerdos de servicio, programación de • Fecha de expiración de la garantía

mantenimiento, desarrollo de procedimientos y mejora continua de • Fecha de reemplazo del activo

programas.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Manejo de mantenimiento:

orden de trabajo 04
administración
Las órdenes de trabajo proporcionan una herramienta para la
gestión de procesos de servicio desde el inicio del trabajo hasta
la planificación, programación, ejecución y finalización.
Esto permite que el trabajo se priorice correctamente, se
asignen los recursos correctos y se complete a tiempo. Si se
administra de manera deficiente, es posible que se pierda el
mantenimiento, quede sin terminar o que se desperdicie el esfuerzo
del personal. Se puede utilizar un sistema de emisión de boletos
independiente o un módulo de órdenes de trabajo integrado en un
sistema CMMS o DCIM para la gestión de órdenes de trabajo. Estas
herramientas permiten que el personal de las instalaciones detecte
tendencias, identifique equipos problemáticos, realice un seguimiento
de la utilización de mano de obra, administre de manera eficiente los
recursos y pronostique con mayor precisión los presupuestos de
mantenimiento y las necesidades de reemplazo del equipo al final de su vida útil.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Gestión de mantenimiento: 04 Gestión de repuestos

Por lo general, las mismas herramientas enumeradas anteriormente también se utilizan para el propósito.

de gestión de repuestos. Mantener un inventario bien documentado de repuestos


críticos hará que el tiempo medio de recuperación (MTTR) sea mucho más corto. El
inventario de piezas de repuesto debe incluir componentes seleccionados cuyos
plazos de entrega excedan el período de inactividad máximo aceptable para el
sistema asociado.
Previo al inicio de operaciones, se debe realizar una evaluación
para crear una lista de repuestos recomendados que se derive de las recomendaciones del
fabricante y del proveedor, los objetivos específicos de la misión, el diseño de la planta, la
disponibilidad de piezas y la experiencia anterior. Los artículos de uso frecuente también se
pueden almacenar para aprovechar los descuentos por volumen.
La reevaluación del inventario de repuestos para la selección de artículos y
los niveles de existencias debe realizarse anualmente.

A medida que el equipo envejece, aumenta la probabilidad de falla de los


componentes, mientras que la disponibilidad de piezas puede disminuir, lo que,
junto con el historial de mantenimiento, puede afectar la decisión sobre qué
artículos almacenar y en qué cantidades. Estos artículos deben almacenarse en
un entorno seguro, limpio y estable con inspecciones, auditorías e incluso
pruebas periódicas para garantizar que estén listos.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

05 Gestión del cambio


Cualquier trabajo en o alrededor de equipos de misión crítica y sus El MOP en sí mismo es una herramienta importante para
sistemas de soporte requiere precauciones especiales y controlar la actividad laboral, pero es solo una parte de un proceso
coordinación con las partes interesadas afectadas (clientes/grupos de gestión de cambios más amplio que incluye elementos clave
de TI) para garantizar que se logren los resultados previstos sin como el desarrollo y revisión de procedimientos operativos,
consecuencias no deseadas o inesperadas. análisis y comunicación de riesgos, prácticas de trabajo
La gestión deficiente de este proceso puede provocar fallas, como estructuradas y supervisión de proveedores/contratistas. .
girar una válvula equivocada, cortar la energía a la alimentación
La gestión del cambio comienza con el desarrollo y la
incorrecta o la exposición accidental a un conductor eléctrico vivo.
realización de revisiones por pares de los procedimientos de trabajo.
El mecanismo principal para gestionar el cambio en el ámbito Estos deben basarse en parte en las recomendaciones
de las instalaciones de misión crítica es el proceso del Método del proveedor para los dispositivos específicos que se están
de procedimiento (MOP). Un MOP es esencialmente una lista reparando, pero también deben tener en cuenta las dependencias
de verificación detallada de cada paso en una tarea específica, generales del sistema junto con las características únicas del
como una actividad de mantenimiento preventivo o correctivo. sitio o la configuración del equipo. Los riesgos para la seguridad
y la disponibilidad del sistema deben identificarse, documentarse
y comunicarse en el MOP.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Las actividades de cambio planeadas necesitan ser Lista de verificación de MOP

comunicadas claramente a las personas apropiadas en un Se crea un MOP para cada


manera oportuna para que nadie sea tomado por sorpresa por actividad de mantenimiento y se
el cambio o por cualquier problema que pueda ocurrir cuando se basa en el alcance de servicio
realice el cambio. Finalmente, dado que los proveedores de OEM y (SOS) del equipo.
los proveedores de servicios de terceros a menudo están Un MOP debe contener:
involucrados en estos procedimientos, es importante que se
• Fecha y hora de la actividad
administren y supervisen cuidadosamente.
• Sitio e información de contacto
Con este fin, se debe llevar a cabo una orientación de • Descripción general del procedimiento
proveedores para presentar a los técnicos de proveedores
• Efectos previstos en la instalación
individuales la instalación y sus reglas de trabajo, los
• Documentación de respaldo •
procedimientos de trabajo y seguridad requeridos, así como
Requisitos de seguridad • Riesgos
el MOP y el proceso de supervisión de proveedores.
y suposiciones • Detalles de trabajo
Un programa de gestión de cambios que incluya todos estos
paso a paso • Procedimientos de
elementos minimizará los errores que generan tiempo de
restitución • Aprobaciones • Firmas
inactividad, reelaboración y los costos asociados.
de terminación • Retroalimentación
Se reducirá la cantidad de ventanas de cambio y disminuirán
los costos de reenvío de proveedores.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Documentación 06
administración

Debe existir un sistema para mantener los registros de infraestructura Además de los procedimientos operativos y los registros
crítica bien organizados y actualizados. de mantenimiento que ya se han discutido, hay otros documentos
La información precisa que está fácilmente disponible para cualquier importantes que administrar, como las reglas de trabajo de las instalaciones
persona en la organización que necesite acceso es un objetivo operativo críticas, los planos de las instalaciones, los estudios de ingeniería, los
fundamental. Idealmente, esto se logra a través de una aplicación de cambios de turno y los registros de rondas. Las reglas de trabajo de las
software de administración de documentos que puede automatizar instalaciones son las reglas establecidas que rigen la seguridad, las
procesos y facilitar el procesamiento, almacenamiento, recuperación y operaciones, la limpieza y la documentación adecuada.
archivo de documentos.
Todo el personal que ingrese al centro de datos para realizar
Sin embargo, no todos los presupuestos pueden acomodar un trabajos debe firmar que los comprende y los observa. Los planos
sistema de este tipo. Un proceso más manual puede ser menos de la instalación son diagramas unifilares eléctricos y mecánicos
conveniente y rico en funciones, pero aún puede funcionar si incluye actuales e históricos, diagramas de tuberías y distribución del espacio
los elementos enumerados en la barra lateral de la página siguiente. de piso de la instalación.
Ya sea automatizado o manual, un buen programa de administración Los estudios de ingeniería incluyen elementos tales como estudios
de documentos facilitará el desarrollo de procedimientos precisos, de arco eléctrico, estudios de coordinación de interruptores, etc.
capacitación adecuada, seguridad en el lugar de trabajo y mejora de
procesos, todo lo cual contribuye al tiempo de actividad y la eficiencia
de las instalaciones.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Proceso de gestión de documentos


Debería incluir:

• Un catálogo que enumera cada pieza de


Los registros de cambios de turno y rondas de inspección documentación por categoría y enumera
describen todas las actividades y eventos que ocurrieron su ubicación

durante un turno en particular, incluido el mantenimiento, • Un sistema de control de versiones que muestra...
capacitación, proyectos especiales, fallas y cualquier otra – Autor del documento
observaciones notables. Esto ayuda a proporcionar - Versión actual
conocimiento en tiempo real del estado de la - Dueño
instalación y debe mantenerse continuamente y estar
– Fechas de revisión
disponible para todas las partes interesadas.
- Cambia la historia
El uso consciente de esta documentación garantizará la
– Próxima fecha de revisión
continuidad de la misión a medida que cambien los turnos.
• Un procedimiento de aseguramiento de la calidad
para la revisión por pares y/o la gerencia de los
cambios, adiciones y eliminaciones de documentos

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

07 Entrenamiento

Maximizar la disponibilidad y minimizar el error humano en el Al completar el material del curso para cada nivel de capacitación,
entorno de sistemas críticos depende, en gran medida, de un los alumnos deben ser evaluados mediante una combinación de
personal bien capacitado. Se debe establecer un programa exámenes orales y escritos que incluyan demostraciones prácticas
de capacitación adecuado que organice todas las tareas de conocimientos. Los materiales de examen deben asegurarse y
operativas y de mantenimiento en categorías que correspondan distribuirse aleatoriamente para garantizar la integridad del proceso.
a niveles específicos de capacidad (p. ej., Básico, Intermedio y Se debe revisar cualquier pregunta perdida y se debe realizar una
Avanzado). Todas las operaciones y actividades de evaluación complementaria para garantizar que se hayan adquirido
mantenimiento deben asignarse a uno de estos niveles. Esto todos los conocimientos requeridos, incluso cuando se obtenga una
proporciona la capacidad de controlar las asignaciones de calificación de aprobación. Al completar con éxito la evaluación, el
trabajo y garantizar que todas las actividades sean realizadas personal está certificado para realizar o supervisar cualquier
por personal debidamente calificado. actividad asociada con ese nivel de capacitación. Se debe exigir a
todo el personal que mantenga su certificación mostrando una
La capacitación debe administrarse de manera que permita
competencia sostenida al aprobar los exámenes anuales de
que los nuevos técnicos alcancen rápidamente un nivel mínimo
recertificación.
de competencia y logren un progreso constante hasta que
estén completamente calificados en todas las facetas de la
operación del sitio.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Se debe exigir a todo el personal que se mantenga al día con los


conocimientos, las licencias y las certificaciones necesarias para operar y mantener
los equipos y sistemas de la instalación al estado actual de la técnica. Además, los
gerentes de equipo y el personal líder deben mantenerse al tanto de las tendencias
y soluciones de la industria. Para ello, la educación permanente necesita

llevarse a cabo para mantener las capacidades de los miembros del equipo.
Un programa de capacitación realizado de esta manera ayuda a prevenir
errores, aumenta la confianza y la satisfacción de los trabajadores, así como
también aumenta la cantidad de mantenimiento que se puede realizar

internamente, lo que reduce los costos de mantenimiento.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Infraestructura 08
administración

El propósito fundamental de las instalaciones del centro de datos es el aprovisionamiento de capacidad de seguridad en exceso y donde
proporcionar energía, enfriamiento, red y recursos de espacio no hay un alto grado de redundancia, un sistema de gestión de
ininterrumpidos en las cantidades correctas, en el nivel de redundancia infraestructura puede evitar el tiempo de inactividad, mejorar la
correcto y en el momento correcto para los servidores de TI, el resiliencia y la respuesta, reducir los gastos operativos y proporcionar una
almacenamiento y el equipo de red. Sin embargo, este propósito se base sólida para las decisiones de planificación de capacidad.
complica por el hecho de que el equipo de TI y sus cargas de trabajo
En el contexto de un programa de O&M, hay tres tareas clave en
pueden sufrir cambios y variaciones frecuentes tanto en el tiempo como
las que concentrarse dentro de un programa de administración de
en la ubicación. Y, con demasiada frecuencia, esto se complica aún más
infraestructura: monitoreo de instalaciones, administración de
por una "mentalidad de silo" en la que las instalaciones y TI (y, a veces,
capacidad e integración de TI/instalaciones. La plataforma ideal para
la alta dirección) actúan de forma aislada entre sí.
abordar estos requisitos es un paquete de software de administración
Esto puede dificultar enormemente la gestión eficaz de la capacidad, la
de infraestructura de centro de datos (DCIM). Proporcionar monitoreo
planificación y otras funciones importantes que requieren una
centralizado en tiempo real de todos los activos de las instalaciones,
comunicación continua. Es necesario un sistema de administración de
mapear visualmente las dependencias de las cargas de trabajo de TI a la
infraestructura para hacer coincidir de manera eficiente los recursos de la
infraestructura física, así como mostrar las tendencias de consumo de
instalación con los cambiantes requisitos de TI. Y, particularmente en un
energía actuales, históricas y futuras son todas funciones típicas de las
ambiente donde no hay asqueroso sobre
suites DCIM modernas.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Para obtener más información sobre las funciones de las herramientas


DCIM actuales, consulte el White Paper 104, Clasificación de herramientas
de software de administración de infraestructura de centros de datos (DCIM).

Para comprender los beneficios potenciales de estas funciones, consulte


el Informe técnico n.º 107, Cómo el software de gestión de la infraestructura
del centro de datos mejora la planificación y reduce los costos operativos.
Informe técnico n.º 170, Cómo evitar los errores comunes de la evaluación
e implementación del software DCIM, asesora sobre qué buscar en una
solución efectiva y cómo garantizar que la implementación sea exitosa a

largo plazo.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

09 Gestión de la calidad

Un enfoque en la calidad y la mejora continua. acciones y respuestas. El control de calidad se ocupa de detectar errores
conducirá a una instalación de centro de datos más eficiente, confiable que se han introducido en un sistema, preferiblemente en una etapa
y productiva que es menos costosa de operar. temprana. Los controles, las inspecciones y las auditorías periódicas y
Un buen programa de gestión de instalaciones debe tener continuas se utilizan para "inspeccionar lo que esperamos".
un sistema de calidad integrado y generalizado que incluya los Esto se refiere tanto al personal de la instalación como a la infraestructura.
siguientes componentes clave: El conocimiento debe evaluarse continuamente para identificar las
lagunas en la formación. La mejora de la calidad se produce cuando
• Garantía de Calidad (QA): Tipificado por la estandarización de
el resultado de una actividad de control de calidad se utiliza para
procesos y procedimientos
modificar y mejorar un proceso de control de calidad. Cuando ocurren
• Control de calidad (QC): controles de calidad, incidentes significativos o se detectan errores, se deben realizar
inspecciones y auditorías esfuerzos formales para comprender la causa raíz. Las lecciones
aprendidas resultantes se utilizan para adaptar las reglas, políticas o
• Mejora continua de la calidad
procedimientos existentes para evitar que ocurran en el futuro. Un

Los métodos de control de calidad ayudan a evitar que se introduzcan programa de calidad que se centre en estas tareas clave elimina la

errores en un sistema. Los procesos, procedimientos, documentación y repetición de errores costosos, aumenta la productividad y crea un camino

capacitación de las instalaciones se incluyen en esta categoría. hacia las mejores prácticas estandarizadas y las mejores operaciones de su clase.

ayudar a garantizar la precisión y la consistencia en la información del personal

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

10 Gestión de la energía

Dado que la energía suele ser el mayor gasto operativo individual de un centro de El proceso de evaluación comparativa depende de datos precisos y oportunos.
datos, la gestión de la energía merece figurar como un elemento esencial de cualquier El sistema de energía debe estar adecuadamente instrumentado para
programa de operación y mantenimiento. proporcionar las entradas necesarias, y los sensores deben calibrarse
Los costos de energía se pueden reducir significativamente en muchos casos con correctamente cuando se instalan y recalibrarse regularmente para lograr el
esfuerzos que producen un ROI muy favorable. Según dónde se ubique la instalación, máximo beneficio.
también se pueden reducir las cargas reglamentarias y mejorar la imagen de la
empresa.
Hay tres tareas principales involucradas en un programa

eficaz de gestión de la energía:

• Evaluación comparativa de rendimiento

• Análisis de eficiencia

• Abastecimiento estratégico de energía

Un programa completo de benchmarking debe ser


implementado para documentar el uso de energía de la instalación,
que se utilizará para formular la eficiencia energética y
planes de reducción de costes.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Una vez que los datos se recopilan con precisión, el análisis debe El mercado de adquisición de energía desregulado de hoy también
llevarse a cabo para descubrir oportunidades de ahorro de energía ofrece oportunidades para reducir las facturas de energía.
y planificar su realización. El conjunto de herramientas preferido para El abastecimiento de energía optimizado puede reducir la exposición a la
administrar y automatizar un programa de administración de energía es el volatilidad de los precios y puede garantizar precios que se ajusten al
software DCIM. Las herramientas modernas de DCIM recopilarán proactivamente presupuesto y los objetivos comerciales. Lograr esto requiere actividades
datos de potencia y energía y los presentarán de una manera clara y fácil de en una variedad de frentes que incluyen: negociación de contratos/créditos,
entender. El consumo de energía y el costo por kWh se pueden determinar participación en programas de respuesta a la demanda, gestión de
hasta el nivel del rack proveedores, análisis de oportunidades de mercado y más. Para aquellos que
en muchos casos. Si los datos medidos no están disponibles, los datos de carecen del conocimiento o ancho de banda para buscar este tipo de ahorro
consumo de energía se pueden estimar en función del equipo de energía, tenga en cuenta que estas actividades de subcontratación de
clasificaciones de la placa de identificación. energía están disponibles en el mercado hoy en día a través de proveedores
de servicios externos.
Un programa moderno de gestión de la energía debe ir más allá de
buscar oportunidades internas para aumentar
eficiencia energética mediante la optimización de los componentes de la
infraestructura de energía y refrigeración.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

11 Gestión financiera
La gestión financiera es un elemento esencial debido al gran tamaño de
los gastos operativos del centro de datos y también porque los problemas
relacionados con las finanzas pueden tener un impacto directo en la
disponibilidad y la capacidad de recuperación diarias de la instalación.
Los retrasos en las adquisiciones, los errores en los pedidos, los envíos
parciales no planificados y una multitud de otros posibles percances
pueden retrasar los proyectos críticos de mantenimiento e instalaciones
que podrían poner en peligro la disponibilidad y el cumplimiento de los
acuerdos de nivel de servicio (SLA). Por lo tanto, deben implementarse
procesos de gestión financiera que se centren en las compras, el cotejo
de facturas y los informes/análisis financieros.

Tenga en cuenta que este elemento requiere una estrecha


cooperación con el departamento de Compras, con quien los
Gerentes de Instalaciones deben mantener una relación de
trabajo estrecha y abierta. Una buena comunicación y planificación
ayudarán a garantizar que los pedidos se realicen de manera
correcta y oportuna, y cuando surjan problemas (p. ej., pedido
pendiente, envío parcial, etc.) se comunicarán rápidamente para
brindar tiempo para acciones alternativas.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

La conciliación de facturas es un elemento importante,


donde las facturas de los proveedores se cotejan con las órdenes
de compra y la prueba de entrega. Este proceso también debe
aplicarse a los informes de servicio, para garantizar que la
prestación del servicio se realice de acuerdo con las obligaciones contractuales.
Las técnicas de compra efectivas, como el uso de cálculos de
ROI para las actualizaciones del sistema y las RFP
estandarizadas para la comparación "manzanas con manzanas"
de los servicios que se adquirirán, ayudan a garantizar que se
pueda obtener el valor máximo y minimizar el desperdicio.

Finalmente, los informes y análisis financieros son muy


útiles para comprender el desempeño del programa y
descubrir potencialmente tendencias poco saludables que
conducirían a retrasos repetitivos, tiempos de entrega
menos predecibles y pedidos ineficientes.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Rendimiento 12 y revisión
seguimiento

Supervisar y revisar periódicamente el rendimiento de las instalaciones tales como software DCIM, herramientas CMMS, registros de
determinará cuál es la salud y la eficacia del programa general de seguridad y otros sistemas de soporte operativo. Cada métrica
O&M y cuál es su tendencia. Es una parte integral del proceso de debe tener objetivos de éxito y niveles de falla definidos,
calidad, que debe abarcar todos los elementos descritos en este incluidos los niveles que se consideran "aceptables".
documento.
Un error común es hacer que los umbrales de "éxito" y "fracaso" sean
Esto se hace de manera más efectiva mediante el uso de
casi idénticos entre sí (lo cual es una característica de los sistemas
indicadores clave de rendimiento (KPI) que se utilizan para
centrados en SLA). El resultado es que todos asumen que la situación
proporcionar enfoque e impulsar mejoras en el programa. Esto
está bien hasta que, de repente e inesperadamente, la instalación entra
produce varios beneficios, incluida la alineación de las actividades
en modo de "falla", aunque desde la perspectiva de las métricas, poco ha
operativas con los objetivos comerciales y proporciona un refuerzo
cambiado. Los buenos KPI proporcionan indicadores principales de falla
positivo para la innovación y la mejora de procesos.
que los hacen más predecibles y prevenibles. Estas métricas deben
La estructuración y medición de KPIs y sus SLAs asociados es recopilarse continuamente y tabularse mensualmente,
la clave para un buen programa de monitoreo y revisión del
desempeño. Cada métrica debe definirse claramente en términos con una revisión trimestral formal recomendada. Las desviaciones de
discretos que sean cuantificables, en lugar de basarse en criterios los niveles de rendimiento "aceptables" deben anotarse y abordarse de
subjetivos. inmediato. Finalmente, el programa debe administrarse de manera que
Las métricas deben derivarse de los datos medidos que fomente una atmósfera de trabajo en equipo y cooperación en lugar de
provienen de los sistemas de monitoreo y control de las instalaciones. una de temor.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Se debe centrar la atención en proporcionar incentivos KPI de instalación recomendados • Desarrollo, gestión y uso de

monetarios positivos para cumplir o superar los objetivos y • Tiempo de actividad de carga crítica procedimientos

metas en lugar de castigar a las personas, departamentos • Redundancia de carga mantenida • Control/mejora de la calidad
o proveedores que no alcancen estos objetivos. • Tiempo de actividad del sistema de soporte • Cumplimiento de la formación

• Finalización del mantenimiento • La mejora de procesos

• Cobertura de personal • Informes operativos

• Conformidad con la política de seguridad • Notificación y escalamiento de


eventos adecuados
• Simulacros de preparación para emergencias

• Cumplimiento del procedimiento • Informes de costos oportunos

de respuesta a emergencias y precisos

• Cumplimiento de la política

y los procedimientos de seguridad

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Transformación de las operaciones de las

instalaciones del centro de datos

La importancia crítica de contar con un programa eficaz de operaciones y Sin embargo, la reciente introducción de software y análisis basados en la nube o
mantenimiento (O&M) se intensifica a medida que las instalaciones se vuelven la gestión del centro de datos como servicio (DMaaS) está demostrando ser una
más complejas. Al mismo tiempo, la necesidad de cumplir con los plazos de innovación revolucionaria para la gestión de la infraestructura física. Inicialmente
implementación para movimientos, adiciones y cambios de equipos está como respuesta a la proliferación de centros de datos perimetrales y el requisito de
impulsando el requisito de una dinámica y conectividad a pedido para una nueva generación de usuarios de servicios de Internet,
comprensión en tiempo real de los recursos del centro de datos. Todo se suma a DMaaS está creciendo en estatura como un enfoque de vía rápida para la capacidad de
una mayor dependencia de las herramientas de gestión de infraestructura. monitoreo similar a DCIM.

Dentro del contexto de un programa de O&M, hay tres tareas clave de Hay tres razones principales detrás del creciente atractivo de
administración de infraestructura: monitoreo de instalaciones, administración DMaaS para el monitoreo del centro de datos:
de capacidad e integración de TI/instalaciones.
1. DMaaS satisface las necesidades de una amplia gama de
En los últimos años, las suites de software de gestión de la infraestructura
aplicaciones, incluidos los centros de datos perimetrales
del centro de datos (DCIM) se han desarrollado como una plataforma ideal
para abordar estos y otros requisitos. A medida que se subcontratan más aplicaciones, un enfoque híbrido
a los entornos de centros de datos ha surgido en los que los centros de
Las suites de software DCIM de hoy brindan
datos de borde y los recursos que alojan se han vuelto más críticos para el
monitoreo en tiempo real de los activos del centro de datos,
negocio. Por lo general, los centros de datos perimetrales comparten
asignando visualmente las dependencias de la carga de trabajo de TI a la
ubicación con sus clientes principales y tienden a tener una inversión insuficiente
infraestructura física subyacente y brindando información sobre el consumo
desde el punto de vista del diseño y la redundancia. Esto está impulsando el
de energía histórico, actual y futuro.
cambio: consulte el documento técnico 256, Por qué la computación en la nube
requiere que reconsideremos la resiliencia en el perímetro.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Transformación de las operaciones de las

instalaciones del centro de datos

DMaaS entra en esta historia porque es rápido de implementar, de bajo costo A medida que el software basado en la nube escucha y aprende de

(a partir de gratis) y no requiere más que una descarga de software más una dispositivos conectados a la nube, el sistema puede proporcionar una mejor
aplicación de teléfono inteligente para que los usuarios comiencen a obtener información de gestión al administrador del centro de datos.
monitoreo remoto e información en tiempo real sobre el centro de datos o Esto permite maximizar la protección de los equipos críticos a través de
entorno distribuido. En el pasado, el costo y la complejidad de instrumentar un alarmas inteligentes y resolución de problemas remota.
centro de datos era un bache en el camino hacia las implementaciones de DCIM, Al mismo tiempo, los conocimientos inteligentes ayudarán a
DMaaS puede utilizar datos de sensores de temperatura ubicuos para obtener mejorar la disponibilidad y la eficiencia, además de brindar recomendaciones
valor rápidamente. para la optimización del rendimiento y la reducción de costos.

2. Big data y análisis son clave tanto para comprender la capa física 3. El análisis de datos nos llevará hacia el mantenimiento
como para tomar mejores decisiones predictivo a través de servicios basados en condiciones

A medida que más y más centros de datos están conectados a DMaaS, más Tradicionalmente, el mantenimiento de los equipos de infraestructura
y más datos de fabricantes más diversos física se ha llevado a cabo utilizando un cronograma de calendario arbitrario
el equipo, en una mayor variedad de condiciones, se acumula en un lago de basado en la tradición, guiado por "condiciones promedio" de acuerdo con las
datos. Si bien los datos se etiquetan y anonimizan por motivos de privacidad, instrucciones de los fabricantes, o sobre una base de reparación. Ninguno de
se pueden aplicar análisis que se pueden convertir en recomendaciones estos enfoques puede describirse realmente como un enfoque óptimo para
personalizadas para respaldar los servicios comerciales críticos.
mejorar el rendimiento del centro de datos. Desde el punto de vista de los
grandes datos, el monitoreo basado en la nube brinda ventajas que las
soluciones de monitoreo de puntos no pueden igualar.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Transformación de las operaciones de las

instalaciones del centro de datos

En innumerables investigaciones de centros de datos, la causa principal del ¿Dónde sigue?

tiempo de inactividad es el error humano. Gran parte de esto ocurre durante los
Se establecieron centros de datos para cumplir con el procesamiento de datos,
procedimientos de mantenimiento de rutina, a menudo por el reemplazo de
necesidades de almacenamiento, redes y comunicaciones de la era digital. Al
piezas que no necesitaban reemplazo. El problema es que las garantías de los
desafiar el statu quo, DMaaS utiliza datos (en lo que se basa la industria) para
equipos a menudo se basan en que el propietario lleve a cabo el mantenimiento
mejorar las operaciones y cumplir una variedad de objetivos. DMaaS comienza con
de acuerdo con un cronograma que usa condiciones promedio y uso como base.
el monitoreo, que produce información y recomendaciones prácticas para optimizar
cualquier centro de datos y reducir costos. También comienza a abordar los
A medida que servicios como DMaaS acumulan datos sobre el equipo en una requisitos de las instalaciones existentes que se han desarrollado en importancia y
variedad de condiciones operativas, se vuelve más inteligente acerca de los complejidad, sin necesidad de construir reemplazos nuevos y totalmente autónomos.
requisitos de mantenimiento según el uso y el entorno, además de recopilar
información sobre la firma de una falla del equipo. En cualquier caso, el enfoque
basado en la nube para el mantenimiento y la reparación del centro de datos le La promesa del rendimiento predictivo atrae.
brinda al administrador de la instalación opciones. Además, aprovechar los datos de
un grupo más amplio también ofrece orientación sobre la tenencia de repuestos, etc.
Obtenga más información sobre EcoStruxure IT, la oferta DMaaS
basada en la nube de Schneider Electric que simplifica la forma en que
los operadores de centros de datos optimizan el rendimiento de la infraestructura
y mitigan el riesgo.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Errores comunes

La investigación y la experiencia han demostrado que


existen varios errores relacionados con el programa
de O&M que pueden socavar la eficacia de un
programa, lo que podría provocar interrupciones del
sistema, gastos evitables o lesiones del personal. La
Tabla 3 en la página siguiente resume estos escollos...

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Tabla 3
Una descripción de los errores comunes que se cometen en la gestión de un programa de O&M

Errores comunes Descripción


El programa de mantenimiento • A menudo, el resultado de una mala gestión de activos

no está impulsado por métricas • No se establece ningún vínculo entre las actividades de mantenimiento de reparación/romper y el mantenimiento preventivo

entrenamiento deficiente • La formación no se formaliza y/o no se toma en serio

• Exceso de confianza en la "observación" del técnico

• Sin vinculación entre el nivel de certificación y las tareas

Gestión del cambio ineficaz • Análisis de riesgo inadecuado


• Procedimientos deficientes o inexistentes

• No hay un proceso definido para realizar tareas de trabajo críticas

No probar y evaluar constantemente • Habilidades existentes/nivel de capacitación no evaluado formalmente


las habilidades. • No se emplean simulacros de escenarios
• Los resultados de incidentes y simulacros no se evalúan

Mala documentación • Sin secuencia coherente de operaciones

• Los dibujos y horarios están desactualizados

• Falta de control de revisión y/o falta de digitalización

Falta de desarrollo e implementación de un • Falta de gobernanza o recursos para medir, monitorear y revisar el desempeño

sistema de control de calidad.

Atascado en modo manual • Falta de implementación de CMMS, EDMS, DCIM, etc.

Exceso de seguridad • Suposición de que el rendimiento futuro se puede predecir a partir de la experiencia pasada

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Servicios de operaciones de
instalaciones

A medida que se considera y desarrolla el programa de Operaciones y


Mantenimiento, la organización puede llegar a
al darse cuenta de que se requiere ayuda profesional.
Los objetivos del proyecto podrían determinar que no hay suficiente
tiempo para desarrollar e implementar el programa internamente.
Puede que no haya suficiente experiencia interna o el tiempo para
desarrollarla. También puede haber un deseo de
minimizar los errores que probablemente ocurrirían cuando el equipo
experiencia acumulada operando la nueva instalación. Hay proveedores que
ofrecen servicios para asesorar, desarrollar, implementar y operar programas
de operación y mantenimiento para centros de datos nuevos y existentes.

Obtenga más información sobre cómo Schneider Electric

puede ayudarlo a enfrentar los desafíos de las operaciones


de las instalaciones del centro de datos .

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Conclusión y recursos

El error humano y la falta de atención Sin embargo, la base misma de ese


pueden comprometer el rendimiento de programa se basa en tener un equipo de
cualquier diseño de centro de datos. Mitigar operaciones de instalaciones que administre y
estas amenazas y sus efectos actúe con una "mentalidad de misión crítica".
requiere un programa de operaciones y Esta filosofía operativa se centra en la
mantenimiento eficaz y eficiente que se mitigación de riesgos, la preparación, los
centre y atienda a los 12 elementos procesos estandarizados y la mejora continua.

descrito en este libro electrónico.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Recursos
Facilidad Operaciones Madurez Evitar las trampas comunes de la evaluación e
Modelo para Centros de Datos implementación de soluciones DCIM
Libro blanco 197 Libro Blanco 170

Explorar todos los libros blancos


Cómo prepararse y responder a
Emergencias del centro de datos whitepapers.apc.com

Libro Blanco 217

Ciclo de vida del centro de datos:


Clasificación del Centro de Datos Servicios de Operación
Gestión de Infraestructura Video

(DCIM) Herramientas

Libro Blanco 104 Explore todas las herramientas TradeOff™

herramientas.apc.com
Cómo la infraestructura del centro de datos

Mejoras en el software de gestión (DCIM)


Planificación y reducción de costos operativos
Libro Blanco 107

Contáctenos
Para opiniones y comentarios sobre el contenido Si es cliente y tiene preguntas específicas sobre su
de este documento técnico: proyecto de centro de datos:
Centro de ciencia del centro de datos Póngase en contacto con su Schneider Electric
dcsc@schneider-electric.com representante en www.schneider-electric.com

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

La vida está encendida | Schneider Electric

Sobre los autores

David Gentry ha estado involucrado en la industria de Patrick Donovan es analista de investigación sénior en
operaciones e infraestructura crítica de centros de datos el Data Center Science Center de Schneider Electric.
durante más de tres décadas. Comenzando con Emerson Tiene más de 18 años de experiencia en el desarrollo y
Industrial Controls, David luego amplió su participación en la soporte de sistemas críticos de energía y enfriamiento
industria de centros de datos como fundador de su propia para la unidad de negocios de TI de Schneider Electric,
empresa, configurando y suministrando sistemas UPS, incluidas varias soluciones galardonadas de protección,
refrigeración de precisión, TVSS, generadores de motores y eficiencia y disponibilidad de energía.
equipos de monitoreo. Después de la adquisición por parte de
Lee Technologies, David se convirtió en vicepresidente
ejecutivo de diseño de centros de datos/
Construcción, Puesta en Marcha, Monitoreo, Mantenimiento
y Operaciones. Posteriormente, Lee Technologies fue
adquirida por Schneider Electric en 2011 para completar su
oferta de ciclo de vida del centro de datos. Desde la
adquisición, David ha dirigido el equipo responsable de la
expansión global de Operation Services.

Ejecutivo Introducción Principios 12 elementos Transformación de las Errores Servicios Conclusión


resumen esenciales operaciones de las comunes de operaciones & recursos
instalaciones del centro de instalaciones

de datos
Machine Translated by Google

schneider-electric.com

Schneider Electric
35 rue Joseph Monier
92500 Rueil-Malmaison, Francia
Teléfono: +33 (0)1 41 29 70 00

©2017 Schneider Electric. Reservados todos los derechos. Schneider eléctrico | Life Is On es una marca comercial y propiedad de Schneider Electric SE, sus subsidiarias y empresas afiliadas.

También podría gustarte