Documentos de Académico
Documentos de Profesional
Documentos de Cultura
schneider-electric.com
Machine Translated by Google
Tabla de contenido
Transformación de las operaciones de las
Resumen ejecutivo
instalaciones del centro de datos
Principios de la
Servicios de operaciones de instalaciones
“Mentalidad de misión crítica”
Resumen ejecutivo
El 70 % de las interrupciones del centro de datos
se pueden atribuir directamente a errores
humanos, según el análisis del Uptime Institute
de su base de datos de informes de "incidentes
anormales" (AIR).1 Esta cifra destaca la
importancia fundamental de contar con un
programa eficaz de operaciones y mantenimiento
70% de error humano
(O&M). Este libro electrónico describe principios
30% otros factores
de gestión únicos y proporciona una descripción
general completa y de alto nivel de los elementos
necesarios del programa para operar una
instalación de misión crítica de manera eficiente y
confiable a lo largo de su ciclo de vida.
de datos
Machine Translated by Google
Introducción
Un programa de operaciones y mantenimiento (O&M) correctamente
diseñado, implementado y respaldado minimizará el riesgo, reducirá los
costos e incluso brindará una ventaja competitiva para el negocio general
al que sirve el centro de datos.
de datos
Machine Translated by Google
siguientes puntos:
• La mayoría de las interrupciones de las instalaciones son atribuibles a Este libro electrónico describe un programa y una mentalidad equilibrados
errores humanos (es decir, del operador),1 muchos de los cuales ocurren de gestión de instalaciones críticas con 12 elementos esenciales del programa, a la
como resultado de malas prácticas de operación y mantenimiento . vez que proporciona consejos y sugerencias prácticas en todo momento. Los
• Los costos de energía representan la porción más grande de OPEX, Tenga en cuenta que los temas tratados en este libro electrónico de ninguna
y el costo de la energía está aumentando manera representan una lista completa de todos los procesos, tareas,
de datos
Machine Translated by Google
Principios de la
“mentalidad de misión crítica”
de datos
Machine Translated by Google
ser tan severa que cada tarea operativa La gestión y el funcionamiento eficaces en implementar y administrar un
debe evaluarse cuidadosamente en este tipo de entorno exigen que la gestión programa efectivo de O&M basado
términos de su efecto neto sobre de las instalaciones y su personal adopten en los 12 elementos esenciales.
disponibilidad. También hay presiones una "mentalidad de misión crítica" que se Los 12 son: ambientales
externas únicas. Las regulaciones centre en la mitigación de riesgos y salud y seguridad, gestión de
gubernamentales y las auditorías de los comprenda la interconexión de las personal, preparación y respuesta
clientes requieren procesos y instalaciones y los sistemas de TI. Esta ante emergencias, gestión de
procedimientos detallados que estén filosofía operativa forma la base de un mantenimiento, gestión de cambios,
debidamente documentados y observados programa efectivo de O&M. gestión de documentación, formación,
concienzudamente. La alta criticidad y el gestión de infraestructura, gestión de
costo de las operaciones del centro de La Tabla 1 describe su núcleo calidad, gestión de energía, gestión
datos a menudo invocan un enfoque intenso de principales y resultados. financiera y supervisión y revisión del
el nivel CxO de la organización. El equipo de instalaciones que encarna rendimiento.
de datos
Machine Translated by Google
tabla 1
El código de conducta de misión crítica y su impacto en las operaciones del centro de datos
Enfocado en la mitigación de riesgos en todas las actividades, Aborda proactivamente todas las amenazas potenciales a la
procesos de trabajo y procedimientos operativos y de mantenimiento disponibilidad del sistema y la seguridad de los trabajadores/ocupantes
Actuar con confianza y paciencia que es el resultado de una Evita que los riesgos se conviertan en problemas; permite tiempos de
cuidadosa planificación y preparación. respuesta más rápidos y menos errores si surgen problemas
Enfoque del riesgo analítico y basado en procesos Ayuda a identificar y mitigar el riesgo en entornos
evitación y resolución de problemas complejos; garantiza un funcionamiento predecible y seguro
Comprensión integral de la función y la interconexión de los Identifique y resuelva rápidamente amenazas potenciales o
sistemas y componentes de las instalaciones problemas reales; evitar o reducir el tiempo de inactividad del sistema
Compromiso con el aprendizaje continuo y Aumenta las habilidades y la eficiencia operativa para mantener una
la mejora de procesos ventaja en un entorno en constante cambio
de datos
Machine Translated by Google
12 elementos esenciales
Emergencia
Gestión de personal 02 preparacióny 03
respuesta
Gestión de la calidad 09 Gestión de energía 10 Gestión financiera 11 Monitoreo y revisión del desempeño 12
de datos
Machine Translated by Google
de datos
Machine Translated by Google
Tabla 2
Los atributos críticos de un programa de salud y seguridad ambiental
Planes de seguridad y formación. Se deben establecer planes de seguridad por escrito que describan las prácticas y
También se debe realizar capacitación regular sobre los elementos del programa.
Análisis de riesgo Todos los procedimientos operativos deben comenzar con un análisis de los posibles peligros involucrados. Los
Procedimientos de bloqueo/etiquetado Se deben utilizar los procedimientos adecuados para evitar la activación o el arranque inesperados de máquinas o
equipos (o que provoque una liberación de energía almacenada) al reparar o mantener el equipo.
Equipo de Protección Personal (EPP) Se debe proporcionar el equipo de protección adecuado, del tamaño adecuado, almacenado, mantenido y
utilizado según sea necesario para mitigar los riesgos de seguridad identificados.
Manejo de materiales peligrosos Los materiales peligrosos deben estar debidamente identificados, etiquetados, almacenados, mantenidos y utilizados
de conformidad con los requisitos del fabricante, las leyes locales y las ordenanzas.
Programa de comunicación de peligros Incluye una lista de productos químicos peligrosos, el uso de hojas de datos de seguridad de materiales
Cumplimiento de todas las leyes y reglamentos de Es probable que los requisitos varíen según la región y el nivel de gobierno (por ejemplo, local,
de datos
Machine Translated by Google
02 Gestión de personal
Todavía se requiere que los humanos instalen, mantengan y operen los sistemas de las Los factores importantes para determinar los niveles de personal
instalaciones del centro de datos. Eliminar el error humano como la causa número uno de son los requisitos de cobertura (p. ej., solo los días de semana, 24 horas
las interrupciones del sistema requiere la contratación y el desarrollo de personas al día, 7 días a la semana), los requisitos de respuesta ante emergencias,
competentes y orientadas al equipo que incorporen la "mentalidad de misión crítica" la carga de trabajo de las actividades de mantenimiento, las necesidades de
descrita anteriormente. Un equipo completo incluye expertos en la materia en las supervisión del proyecto y el presupuesto de operaciones.
las instalaciones requieren una amplia capacitación inicial y continua, que se analiza aquí.
El objetivo debe ser dimensionar correctamente el personal para las operaciones
de datos
Machine Translated by Google
menos de 24 horas al día, 7 días a la semana, con una opción de guardia fuera
del horario de atención. Todos son modelos válidos para perfiles de riesgo específicos.
de datos
Machine Translated by Google
La vida está encendida | Schneider Electric
Para obtener
Independientemente de cuán bueno sea el diseño También es necesario desarrollar y ensayar
una
de la infraestructura y las capacidades del personal, procedimientos de escalamiento para garantizar que la
descripción más
es imposible eliminar todo riesgo de interrupción cadena de mando esté informada y que se utilicen los
detallada del elemento
inesperada del sistema. Una buena preparación es la recursos apropiados a medida que se desarrolla la
de preparación y
mejor defensa y ayudará a garantizar que las situación. Se deben realizar simulacros de escenarios
respuesta ante
respuestas sean oportunas, efectivas y sin errores. La con regularidad para ensayar y evaluar la eficacia de la
emergencias, incluido un ejemplo
preparación para emergencias comienza con el respuesta de emergencia individual y del equipo. Una
EOP y procedimientos de
desarrollo de procedimientos operativos de emergencia vez que se ha tratado un incidente y se han mitigado
simulacro de emergencia,
(EOP) para todos los escenarios de fallas de alto riesgo, sus efectos, se debe realizar un análisis para comprender ver Blanco Papel
como la pérdida de una planta enfriadora, falla en el cuáles fueron las causas fundamentales y qué tan
217, Cómo preparar y
arranque del generador, etc. Los EOP establecen un efectiva fue la respuesta de emergencia para abordar el Responder a datos
plan de acción detallado para aislar fallas de manera problema. Centro Emergencias
segura y restaurar el servicio o la redundancia cuando
El análisis formal de fallas para eventos significativos
sea posible. Estos procedimientos deben publicarse en
de la instalación es una parte fundamental del
áreas donde es probable que se lleve a cabo la
proceso general de mejora continua que se necesita
respuesta.
para reducir las fallas y mejorar la efectividad de la
respuesta en eventos futuros.
de datos
Machine Translated by Google
Mantenimiento 04
administración
de datos
Machine Translated by Google
El seguimiento preciso y consistente de todos los activos críticos de las Información recomendada de la base de datos de activos
instalaciones es la base de un buen programa de mantenimiento. Si bien Como mínimo, cada registro de activos debe contener la
una base de datos de activos bien mantenida proporciona los componentes siguiente información:
programas.
de datos
Machine Translated by Google
Manejo de mantenimiento:
orden de trabajo 04
administración
Las órdenes de trabajo proporcionan una herramienta para la
gestión de procesos de servicio desde el inicio del trabajo hasta
la planificación, programación, ejecución y finalización.
Esto permite que el trabajo se priorice correctamente, se
asignen los recursos correctos y se complete a tiempo. Si se
administra de manera deficiente, es posible que se pierda el
mantenimiento, quede sin terminar o que se desperdicie el esfuerzo
del personal. Se puede utilizar un sistema de emisión de boletos
independiente o un módulo de órdenes de trabajo integrado en un
sistema CMMS o DCIM para la gestión de órdenes de trabajo. Estas
herramientas permiten que el personal de las instalaciones detecte
tendencias, identifique equipos problemáticos, realice un seguimiento
de la utilización de mano de obra, administre de manera eficiente los
recursos y pronostique con mayor precisión los presupuestos de
mantenimiento y las necesidades de reemplazo del equipo al final de su vida útil.
de datos
Machine Translated by Google
Por lo general, las mismas herramientas enumeradas anteriormente también se utilizan para el propósito.
de datos
Machine Translated by Google
de datos
Machine Translated by Google
de datos
Machine Translated by Google
Documentación 06
administración
Debe existir un sistema para mantener los registros de infraestructura Además de los procedimientos operativos y los registros
crítica bien organizados y actualizados. de mantenimiento que ya se han discutido, hay otros documentos
La información precisa que está fácilmente disponible para cualquier importantes que administrar, como las reglas de trabajo de las instalaciones
persona en la organización que necesite acceso es un objetivo operativo críticas, los planos de las instalaciones, los estudios de ingeniería, los
fundamental. Idealmente, esto se logra a través de una aplicación de cambios de turno y los registros de rondas. Las reglas de trabajo de las
software de administración de documentos que puede automatizar instalaciones son las reglas establecidas que rigen la seguridad, las
procesos y facilitar el procesamiento, almacenamiento, recuperación y operaciones, la limpieza y la documentación adecuada.
archivo de documentos.
Todo el personal que ingrese al centro de datos para realizar
Sin embargo, no todos los presupuestos pueden acomodar un trabajos debe firmar que los comprende y los observa. Los planos
sistema de este tipo. Un proceso más manual puede ser menos de la instalación son diagramas unifilares eléctricos y mecánicos
conveniente y rico en funciones, pero aún puede funcionar si incluye actuales e históricos, diagramas de tuberías y distribución del espacio
los elementos enumerados en la barra lateral de la página siguiente. de piso de la instalación.
Ya sea automatizado o manual, un buen programa de administración Los estudios de ingeniería incluyen elementos tales como estudios
de documentos facilitará el desarrollo de procedimientos precisos, de arco eléctrico, estudios de coordinación de interruptores, etc.
capacitación adecuada, seguridad en el lugar de trabajo y mejora de
procesos, todo lo cual contribuye al tiempo de actividad y la eficiencia
de las instalaciones.
de datos
Machine Translated by Google
durante un turno en particular, incluido el mantenimiento, • Un sistema de control de versiones que muestra...
capacitación, proyectos especiales, fallas y cualquier otra – Autor del documento
observaciones notables. Esto ayuda a proporcionar - Versión actual
conocimiento en tiempo real del estado de la - Dueño
instalación y debe mantenerse continuamente y estar
– Fechas de revisión
disponible para todas las partes interesadas.
- Cambia la historia
El uso consciente de esta documentación garantizará la
– Próxima fecha de revisión
continuidad de la misión a medida que cambien los turnos.
• Un procedimiento de aseguramiento de la calidad
para la revisión por pares y/o la gerencia de los
cambios, adiciones y eliminaciones de documentos
de datos
Machine Translated by Google
07 Entrenamiento
Maximizar la disponibilidad y minimizar el error humano en el Al completar el material del curso para cada nivel de capacitación,
entorno de sistemas críticos depende, en gran medida, de un los alumnos deben ser evaluados mediante una combinación de
personal bien capacitado. Se debe establecer un programa exámenes orales y escritos que incluyan demostraciones prácticas
de capacitación adecuado que organice todas las tareas de conocimientos. Los materiales de examen deben asegurarse y
operativas y de mantenimiento en categorías que correspondan distribuirse aleatoriamente para garantizar la integridad del proceso.
a niveles específicos de capacidad (p. ej., Básico, Intermedio y Se debe revisar cualquier pregunta perdida y se debe realizar una
Avanzado). Todas las operaciones y actividades de evaluación complementaria para garantizar que se hayan adquirido
mantenimiento deben asignarse a uno de estos niveles. Esto todos los conocimientos requeridos, incluso cuando se obtenga una
proporciona la capacidad de controlar las asignaciones de calificación de aprobación. Al completar con éxito la evaluación, el
trabajo y garantizar que todas las actividades sean realizadas personal está certificado para realizar o supervisar cualquier
por personal debidamente calificado. actividad asociada con ese nivel de capacitación. Se debe exigir a
todo el personal que mantenga su certificación mostrando una
La capacitación debe administrarse de manera que permita
competencia sostenida al aprobar los exámenes anuales de
que los nuevos técnicos alcancen rápidamente un nivel mínimo
recertificación.
de competencia y logren un progreso constante hasta que
estén completamente calificados en todas las facetas de la
operación del sitio.
de datos
Machine Translated by Google
llevarse a cabo para mantener las capacidades de los miembros del equipo.
Un programa de capacitación realizado de esta manera ayuda a prevenir
errores, aumenta la confianza y la satisfacción de los trabajadores, así como
también aumenta la cantidad de mantenimiento que se puede realizar
de datos
Machine Translated by Google
Infraestructura 08
administración
El propósito fundamental de las instalaciones del centro de datos es el aprovisionamiento de capacidad de seguridad en exceso y donde
proporcionar energía, enfriamiento, red y recursos de espacio no hay un alto grado de redundancia, un sistema de gestión de
ininterrumpidos en las cantidades correctas, en el nivel de redundancia infraestructura puede evitar el tiempo de inactividad, mejorar la
correcto y en el momento correcto para los servidores de TI, el resiliencia y la respuesta, reducir los gastos operativos y proporcionar una
almacenamiento y el equipo de red. Sin embargo, este propósito se base sólida para las decisiones de planificación de capacidad.
complica por el hecho de que el equipo de TI y sus cargas de trabajo
En el contexto de un programa de O&M, hay tres tareas clave en
pueden sufrir cambios y variaciones frecuentes tanto en el tiempo como
las que concentrarse dentro de un programa de administración de
en la ubicación. Y, con demasiada frecuencia, esto se complica aún más
infraestructura: monitoreo de instalaciones, administración de
por una "mentalidad de silo" en la que las instalaciones y TI (y, a veces,
capacidad e integración de TI/instalaciones. La plataforma ideal para
la alta dirección) actúan de forma aislada entre sí.
abordar estos requisitos es un paquete de software de administración
Esto puede dificultar enormemente la gestión eficaz de la capacidad, la
de infraestructura de centro de datos (DCIM). Proporcionar monitoreo
planificación y otras funciones importantes que requieren una
centralizado en tiempo real de todos los activos de las instalaciones,
comunicación continua. Es necesario un sistema de administración de
mapear visualmente las dependencias de las cargas de trabajo de TI a la
infraestructura para hacer coincidir de manera eficiente los recursos de la
infraestructura física, así como mostrar las tendencias de consumo de
instalación con los cambiantes requisitos de TI. Y, particularmente en un
energía actuales, históricas y futuras son todas funciones típicas de las
ambiente donde no hay asqueroso sobre
suites DCIM modernas.
de datos
Machine Translated by Google
largo plazo.
de datos
Machine Translated by Google
09 Gestión de la calidad
Un enfoque en la calidad y la mejora continua. acciones y respuestas. El control de calidad se ocupa de detectar errores
conducirá a una instalación de centro de datos más eficiente, confiable que se han introducido en un sistema, preferiblemente en una etapa
y productiva que es menos costosa de operar. temprana. Los controles, las inspecciones y las auditorías periódicas y
Un buen programa de gestión de instalaciones debe tener continuas se utilizan para "inspeccionar lo que esperamos".
un sistema de calidad integrado y generalizado que incluya los Esto se refiere tanto al personal de la instalación como a la infraestructura.
siguientes componentes clave: El conocimiento debe evaluarse continuamente para identificar las
lagunas en la formación. La mejora de la calidad se produce cuando
• Garantía de Calidad (QA): Tipificado por la estandarización de
el resultado de una actividad de control de calidad se utiliza para
procesos y procedimientos
modificar y mejorar un proceso de control de calidad. Cuando ocurren
• Control de calidad (QC): controles de calidad, incidentes significativos o se detectan errores, se deben realizar
inspecciones y auditorías esfuerzos formales para comprender la causa raíz. Las lecciones
aprendidas resultantes se utilizan para adaptar las reglas, políticas o
• Mejora continua de la calidad
procedimientos existentes para evitar que ocurran en el futuro. Un
Los métodos de control de calidad ayudan a evitar que se introduzcan programa de calidad que se centre en estas tareas clave elimina la
errores en un sistema. Los procesos, procedimientos, documentación y repetición de errores costosos, aumenta la productividad y crea un camino
capacitación de las instalaciones se incluyen en esta categoría. hacia las mejores prácticas estandarizadas y las mejores operaciones de su clase.
de datos
Machine Translated by Google
10 Gestión de la energía
Dado que la energía suele ser el mayor gasto operativo individual de un centro de El proceso de evaluación comparativa depende de datos precisos y oportunos.
datos, la gestión de la energía merece figurar como un elemento esencial de cualquier El sistema de energía debe estar adecuadamente instrumentado para
programa de operación y mantenimiento. proporcionar las entradas necesarias, y los sensores deben calibrarse
Los costos de energía se pueden reducir significativamente en muchos casos con correctamente cuando se instalan y recalibrarse regularmente para lograr el
esfuerzos que producen un ROI muy favorable. Según dónde se ubique la instalación, máximo beneficio.
también se pueden reducir las cargas reglamentarias y mejorar la imagen de la
empresa.
Hay tres tareas principales involucradas en un programa
• Análisis de eficiencia
de datos
Machine Translated by Google
Una vez que los datos se recopilan con precisión, el análisis debe El mercado de adquisición de energía desregulado de hoy también
llevarse a cabo para descubrir oportunidades de ahorro de energía ofrece oportunidades para reducir las facturas de energía.
y planificar su realización. El conjunto de herramientas preferido para El abastecimiento de energía optimizado puede reducir la exposición a la
administrar y automatizar un programa de administración de energía es el volatilidad de los precios y puede garantizar precios que se ajusten al
software DCIM. Las herramientas modernas de DCIM recopilarán proactivamente presupuesto y los objetivos comerciales. Lograr esto requiere actividades
datos de potencia y energía y los presentarán de una manera clara y fácil de en una variedad de frentes que incluyen: negociación de contratos/créditos,
entender. El consumo de energía y el costo por kWh se pueden determinar participación en programas de respuesta a la demanda, gestión de
hasta el nivel del rack proveedores, análisis de oportunidades de mercado y más. Para aquellos que
en muchos casos. Si los datos medidos no están disponibles, los datos de carecen del conocimiento o ancho de banda para buscar este tipo de ahorro
consumo de energía se pueden estimar en función del equipo de energía, tenga en cuenta que estas actividades de subcontratación de
clasificaciones de la placa de identificación. energía están disponibles en el mercado hoy en día a través de proveedores
de servicios externos.
Un programa moderno de gestión de la energía debe ir más allá de
buscar oportunidades internas para aumentar
eficiencia energética mediante la optimización de los componentes de la
infraestructura de energía y refrigeración.
de datos
Machine Translated by Google
11 Gestión financiera
La gestión financiera es un elemento esencial debido al gran tamaño de
los gastos operativos del centro de datos y también porque los problemas
relacionados con las finanzas pueden tener un impacto directo en la
disponibilidad y la capacidad de recuperación diarias de la instalación.
Los retrasos en las adquisiciones, los errores en los pedidos, los envíos
parciales no planificados y una multitud de otros posibles percances
pueden retrasar los proyectos críticos de mantenimiento e instalaciones
que podrían poner en peligro la disponibilidad y el cumplimiento de los
acuerdos de nivel de servicio (SLA). Por lo tanto, deben implementarse
procesos de gestión financiera que se centren en las compras, el cotejo
de facturas y los informes/análisis financieros.
de datos
Machine Translated by Google
de datos
Machine Translated by Google
Rendimiento 12 y revisión
seguimiento
Supervisar y revisar periódicamente el rendimiento de las instalaciones tales como software DCIM, herramientas CMMS, registros de
determinará cuál es la salud y la eficacia del programa general de seguridad y otros sistemas de soporte operativo. Cada métrica
O&M y cuál es su tendencia. Es una parte integral del proceso de debe tener objetivos de éxito y niveles de falla definidos,
calidad, que debe abarcar todos los elementos descritos en este incluidos los niveles que se consideran "aceptables".
documento.
Un error común es hacer que los umbrales de "éxito" y "fracaso" sean
Esto se hace de manera más efectiva mediante el uso de
casi idénticos entre sí (lo cual es una característica de los sistemas
indicadores clave de rendimiento (KPI) que se utilizan para
centrados en SLA). El resultado es que todos asumen que la situación
proporcionar enfoque e impulsar mejoras en el programa. Esto
está bien hasta que, de repente e inesperadamente, la instalación entra
produce varios beneficios, incluida la alineación de las actividades
en modo de "falla", aunque desde la perspectiva de las métricas, poco ha
operativas con los objetivos comerciales y proporciona un refuerzo
cambiado. Los buenos KPI proporcionan indicadores principales de falla
positivo para la innovación y la mejora de procesos.
que los hacen más predecibles y prevenibles. Estas métricas deben
La estructuración y medición de KPIs y sus SLAs asociados es recopilarse continuamente y tabularse mensualmente,
la clave para un buen programa de monitoreo y revisión del
desempeño. Cada métrica debe definirse claramente en términos con una revisión trimestral formal recomendada. Las desviaciones de
discretos que sean cuantificables, en lugar de basarse en criterios los niveles de rendimiento "aceptables" deben anotarse y abordarse de
subjetivos. inmediato. Finalmente, el programa debe administrarse de manera que
Las métricas deben derivarse de los datos medidos que fomente una atmósfera de trabajo en equipo y cooperación en lugar de
provienen de los sistemas de monitoreo y control de las instalaciones. una de temor.
de datos
Machine Translated by Google
Se debe centrar la atención en proporcionar incentivos KPI de instalación recomendados • Desarrollo, gestión y uso de
monetarios positivos para cumplir o superar los objetivos y • Tiempo de actividad de carga crítica procedimientos
metas en lugar de castigar a las personas, departamentos • Redundancia de carga mantenida • Control/mejora de la calidad
o proveedores que no alcancen estos objetivos. • Tiempo de actividad del sistema de soporte • Cumplimiento de la formación
• Cumplimiento de la política
de datos
Machine Translated by Google
La importancia crítica de contar con un programa eficaz de operaciones y Sin embargo, la reciente introducción de software y análisis basados en la nube o
mantenimiento (O&M) se intensifica a medida que las instalaciones se vuelven la gestión del centro de datos como servicio (DMaaS) está demostrando ser una
más complejas. Al mismo tiempo, la necesidad de cumplir con los plazos de innovación revolucionaria para la gestión de la infraestructura física. Inicialmente
implementación para movimientos, adiciones y cambios de equipos está como respuesta a la proliferación de centros de datos perimetrales y el requisito de
impulsando el requisito de una dinámica y conectividad a pedido para una nueva generación de usuarios de servicios de Internet,
comprensión en tiempo real de los recursos del centro de datos. Todo se suma a DMaaS está creciendo en estatura como un enfoque de vía rápida para la capacidad de
una mayor dependencia de las herramientas de gestión de infraestructura. monitoreo similar a DCIM.
Dentro del contexto de un programa de O&M, hay tres tareas clave de Hay tres razones principales detrás del creciente atractivo de
administración de infraestructura: monitoreo de instalaciones, administración DMaaS para el monitoreo del centro de datos:
de capacidad e integración de TI/instalaciones.
1. DMaaS satisface las necesidades de una amplia gama de
En los últimos años, las suites de software de gestión de la infraestructura
aplicaciones, incluidos los centros de datos perimetrales
del centro de datos (DCIM) se han desarrollado como una plataforma ideal
para abordar estos y otros requisitos. A medida que se subcontratan más aplicaciones, un enfoque híbrido
a los entornos de centros de datos ha surgido en los que los centros de
Las suites de software DCIM de hoy brindan
datos de borde y los recursos que alojan se han vuelto más críticos para el
monitoreo en tiempo real de los activos del centro de datos,
negocio. Por lo general, los centros de datos perimetrales comparten
asignando visualmente las dependencias de la carga de trabajo de TI a la
ubicación con sus clientes principales y tienden a tener una inversión insuficiente
infraestructura física subyacente y brindando información sobre el consumo
desde el punto de vista del diseño y la redundancia. Esto está impulsando el
de energía histórico, actual y futuro.
cambio: consulte el documento técnico 256, Por qué la computación en la nube
requiere que reconsideremos la resiliencia en el perímetro.
de datos
Machine Translated by Google
DMaaS entra en esta historia porque es rápido de implementar, de bajo costo A medida que el software basado en la nube escucha y aprende de
(a partir de gratis) y no requiere más que una descarga de software más una dispositivos conectados a la nube, el sistema puede proporcionar una mejor
aplicación de teléfono inteligente para que los usuarios comiencen a obtener información de gestión al administrador del centro de datos.
monitoreo remoto e información en tiempo real sobre el centro de datos o Esto permite maximizar la protección de los equipos críticos a través de
entorno distribuido. En el pasado, el costo y la complejidad de instrumentar un alarmas inteligentes y resolución de problemas remota.
centro de datos era un bache en el camino hacia las implementaciones de DCIM, Al mismo tiempo, los conocimientos inteligentes ayudarán a
DMaaS puede utilizar datos de sensores de temperatura ubicuos para obtener mejorar la disponibilidad y la eficiencia, además de brindar recomendaciones
valor rápidamente. para la optimización del rendimiento y la reducción de costos.
2. Big data y análisis son clave tanto para comprender la capa física 3. El análisis de datos nos llevará hacia el mantenimiento
como para tomar mejores decisiones predictivo a través de servicios basados en condiciones
A medida que más y más centros de datos están conectados a DMaaS, más Tradicionalmente, el mantenimiento de los equipos de infraestructura
y más datos de fabricantes más diversos física se ha llevado a cabo utilizando un cronograma de calendario arbitrario
el equipo, en una mayor variedad de condiciones, se acumula en un lago de basado en la tradición, guiado por "condiciones promedio" de acuerdo con las
datos. Si bien los datos se etiquetan y anonimizan por motivos de privacidad, instrucciones de los fabricantes, o sobre una base de reparación. Ninguno de
se pueden aplicar análisis que se pueden convertir en recomendaciones estos enfoques puede describirse realmente como un enfoque óptimo para
personalizadas para respaldar los servicios comerciales críticos.
mejorar el rendimiento del centro de datos. Desde el punto de vista de los
grandes datos, el monitoreo basado en la nube brinda ventajas que las
soluciones de monitoreo de puntos no pueden igualar.
de datos
Machine Translated by Google
tiempo de inactividad es el error humano. Gran parte de esto ocurre durante los
Se establecieron centros de datos para cumplir con el procesamiento de datos,
procedimientos de mantenimiento de rutina, a menudo por el reemplazo de
necesidades de almacenamiento, redes y comunicaciones de la era digital. Al
piezas que no necesitaban reemplazo. El problema es que las garantías de los
desafiar el statu quo, DMaaS utiliza datos (en lo que se basa la industria) para
equipos a menudo se basan en que el propietario lleve a cabo el mantenimiento
mejorar las operaciones y cumplir una variedad de objetivos. DMaaS comienza con
de acuerdo con un cronograma que usa condiciones promedio y uso como base.
el monitoreo, que produce información y recomendaciones prácticas para optimizar
cualquier centro de datos y reducir costos. También comienza a abordar los
A medida que servicios como DMaaS acumulan datos sobre el equipo en una requisitos de las instalaciones existentes que se han desarrollado en importancia y
variedad de condiciones operativas, se vuelve más inteligente acerca de los complejidad, sin necesidad de construir reemplazos nuevos y totalmente autónomos.
requisitos de mantenimiento según el uso y el entorno, además de recopilar
información sobre la firma de una falla del equipo. En cualquier caso, el enfoque
basado en la nube para el mantenimiento y la reparación del centro de datos le La promesa del rendimiento predictivo atrae.
brinda al administrador de la instalación opciones. Además, aprovechar los datos de
un grupo más amplio también ofrece orientación sobre la tenencia de repuestos, etc.
Obtenga más información sobre EcoStruxure IT, la oferta DMaaS
basada en la nube de Schneider Electric que simplifica la forma en que
los operadores de centros de datos optimizan el rendimiento de la infraestructura
y mitigan el riesgo.
de datos
Machine Translated by Google
Errores comunes
de datos
Machine Translated by Google
Tabla 3
Una descripción de los errores comunes que se cometen en la gestión de un programa de O&M
no está impulsado por métricas • No se establece ningún vínculo entre las actividades de mantenimiento de reparación/romper y el mantenimiento preventivo
Falta de desarrollo e implementación de un • Falta de gobernanza o recursos para medir, monitorear y revisar el desempeño
Exceso de seguridad • Suposición de que el rendimiento futuro se puede predecir a partir de la experiencia pasada
de datos
Machine Translated by Google
Servicios de operaciones de
instalaciones
de datos
Machine Translated by Google
Conclusión y recursos
de datos
Machine Translated by Google
Recursos
Facilidad Operaciones Madurez Evitar las trampas comunes de la evaluación e
Modelo para Centros de Datos implementación de soluciones DCIM
Libro blanco 197 Libro Blanco 170
(DCIM) Herramientas
herramientas.apc.com
Cómo la infraestructura del centro de datos
Contáctenos
Para opiniones y comentarios sobre el contenido Si es cliente y tiene preguntas específicas sobre su
de este documento técnico: proyecto de centro de datos:
Centro de ciencia del centro de datos Póngase en contacto con su Schneider Electric
dcsc@schneider-electric.com representante en www.schneider-electric.com
de datos
Machine Translated by Google
David Gentry ha estado involucrado en la industria de Patrick Donovan es analista de investigación sénior en
operaciones e infraestructura crítica de centros de datos el Data Center Science Center de Schneider Electric.
durante más de tres décadas. Comenzando con Emerson Tiene más de 18 años de experiencia en el desarrollo y
Industrial Controls, David luego amplió su participación en la soporte de sistemas críticos de energía y enfriamiento
industria de centros de datos como fundador de su propia para la unidad de negocios de TI de Schneider Electric,
empresa, configurando y suministrando sistemas UPS, incluidas varias soluciones galardonadas de protección,
refrigeración de precisión, TVSS, generadores de motores y eficiencia y disponibilidad de energía.
equipos de monitoreo. Después de la adquisición por parte de
Lee Technologies, David se convirtió en vicepresidente
ejecutivo de diseño de centros de datos/
Construcción, Puesta en Marcha, Monitoreo, Mantenimiento
y Operaciones. Posteriormente, Lee Technologies fue
adquirida por Schneider Electric en 2011 para completar su
oferta de ciclo de vida del centro de datos. Desde la
adquisición, David ha dirigido el equipo responsable de la
expansión global de Operation Services.
de datos
Machine Translated by Google
schneider-electric.com
Schneider Electric
35 rue Joseph Monier
92500 Rueil-Malmaison, Francia
Teléfono: +33 (0)1 41 29 70 00
©2017 Schneider Electric. Reservados todos los derechos. Schneider eléctrico | Life Is On es una marca comercial y propiedad de Schneider Electric SE, sus subsidiarias y empresas afiliadas.