Está en la página 1de 10

Centro de Operaciones de Red

(NOC)

Redes de Telecomunicaciones

Operación, Administración y Mantenimiento

REV 1.1

Noviembre 2016

por: Francisco Altamirano


ing. en Electrónica y
Especialista SGC
Prólogo:
Algunas de las experiencias más significativas que he vivido a través de mi
vida profesional ha sido operar Redes de Telecomunicaciones desempeñandome
en OAyM (Operación Administración y Mantenimiento). Una empresa de la cual
rescato la enorme distinción que tiene para con sus empleados es Motorola de
Argentina S.A., el trato para con ellos y la enseñanza de quienes la formaban en
dicho momento. La experiencia continuó en Movicom BellSouth en el mismo
departamento, ellos me signaron la mentalidad del “Mantenimiento del Servicio” y
de estar disponible para subsanar diferentes circunstancias, el aprendizaje
continuo y la búsqueda de soluciones permanente.

Los recaudos aquí mensionados generalmente NO están escritos como


procedimientos en las salas de Operaciones de Red y dificilmente estén
documentados como Procedimientos o Manuales de Buenas Prácticas pero a la
hora de hacer Calidad de Servicio en Telecomunicaciones sin duda serán un
requerimiento para quienes quieren planificar la operación.

Una de las principales desvenatajas de la mayoría de los sistemas que


Ingeniería de Red Implementa y luego Operaciones de Red sostiene, es que poco
hay de capacitación interdisciplinaria, entre otras cosas.

Si el manual es visto desde Ingeniería de Red, de común acuerdo deberían


implementarse las herramientas para que Operaciones pueda cumplir con su
cometido, e Ingeniería de Red debería exigir a Operaciones que se administren los
recursos necesarios para sostenar la red con el debido registro de su
comportamiento. Operaciones antes de comenzar a sostener la red, debería
exigirle a Ingeniería de Red que la entregue con las implementaciones necesarias
para sostenerla y la capacitación acorde.

Parece obvio y en la práctica se “hace”, el problema reside en que


generalmente no se planifican los traspasos con la debida documentación y
capacitación al respecto.

El siguiente documento está destinado a sentar las bases de la organización


del NOC y asociar algunas de las herramientas de los Sistemas de Gestión de
Calidad (SGC) a su Gestión y Operatoria. Pretende ser visto como una aplicación
de los SGC a la Calidad de las Telecomunicaciones en un sector llamado NOC y
una herramienta guía para la organización del mismo.
Gestión de RED

Le llamamos “Gestión de Red” a las funciones que nos permiten asignar los
recursos necesarios para que una red se pueda:
• Controlar
• Planificar
• Coordinar
• Asignar
• Visualizar o Monitorear

Observe que los recursos incluyen, personal, capacitación, equipamiento,


movilidad, sistemas de contabilidad para administrar los mismos y de alguna forma
habrá que llevar un registro de las asignaciones.

Diagramación de Tareas

En principio, utilizando un Ciclo Deming, como primera herramienta para


organizarnos deberíamos:

1. Definir una política de la Gestión de Red


2. Trazar Objetivos alineados con la Política
3. Determinar Metas a alcanzar
4. Consensuar un Plan de Acción al respecto
5. Ejecutar el Plan de Acción
6. Verificar los Resultados y las Observaciones al mismo
7. Estandarizar y Registrar las buenas Prácticas e
8. Ingresar las Observaciones al Plan de Mejora Continua.

Este modelo básico de trabajo lo utilizaremos en forma recurrente para cada


una de las tareas, podrá observar que luego de un cierto tiempo de uso, será una
modalidad muy práctica para mantener una línea de trabajo aplicable en
cualesquier ámbitos de trabajos.

A manera de ejemplo vamos a suponer que “La Política de la Gestión de


Red” ha sido definida, los Objetivos y Metas también, nuestro Plan de Acción
debería al menos contener:

• Fecha acordada de la necesidad de realizar la acción.


• Descripción de la Tarea.
• Responsable en ejecutarla.
• Autoridad competente para validar la misma.
• Fecha de inicio de la misma.
• Fecha de finalización de la misma.
• Observaciones.
Si el trabajo se realiza en etapas, habrá que utilizar una descripción en árbol
de las mismas indicando las necesidades y relaciones mutuas para el
encadenamiento de las tareas. El plan es en sí un registro, que luego de ser
utilizado debería ser tomado como base por ejemplo: la redacción del Manual de
Procedimientos. Las observaciones negativas serán el alimento de los Planes de
Mejora Continua.

Network Operations Center – NOC -


(Centro de Operaciones de Red)

Para mantener un orden de las principales funciones de nuestro Centro de


Operaciones detallemos algunas de las principales funciones del mismo, ellas
serán:

• Visualizar o Monitorear y Gestionar la Red


• Brindar información sobre la disponibilidad actual, histórica y planeada de los
sistemas o recursos.
• Controlar el Estado de la Red y estadísticas de operación
• Monitorear y Gestionar Fallas

Nuevamente, tendremos que instruir al personal en la forma en que se llevan


a cabo cada unas de estas “Tareas del NOC”. A continuación veremos lo que
vamos a Gestionar en la Red.

Partes de la Gestión de Red

Las siguientes gestiones se deberán sincronizar en las tareas del NOC:


• Gestión de configuraciones y cambios
• Gestión de control, desempeño y contabilidad
• Gestión de fallas
• Gestión de seguridad

◦ Gestión de Configuraciones

Obviamente que a este nivel le tendremos que sumar una “Bitácora de


Gestión”, volvemos a necesitar un registro de cada una se las gestiones de red. A
nuestras gestiones le sumaremos los siguientes detalles:

Mantener información relativa al diseño de la red y su configuración


actual

• Estado actual de la red


• Registro de la topología
• Estático
◦ Qué está instalado?
◦ Dónde está instalado?
◦ Cómo está conectado?
◦ Quién responde por cada cosa?
◦ Cómo comunicarse con los responsables?
• Dinámico
◦ Estado operacional de los elementos de la red
• Gestión de configuraciones
• Gestión de inventario
• Base de datos de elementos de la red
• Historia de cambios y problemas
• Mantenimiento de Directorios
• Todos los nodos y sus aplicaciones
• Base de datos de nombres de dominio
• Coordinación del esquema de nombres para nodos y aplicaciones

Uno de los faltantes en el historial de la mayoría de las Operaciones es:


¿qué se hizo? ¿cuándo? ¿quién lo hizo? y ¿quién validó la acción?. A continuación
cuatro registros “carpetas” para seleccionar los registros:

Gestión de Control Operacional de la Red


Determinar y mediar lo necesario para registrar y hacer accesible la
información a todos los interesados para las tareas de:
• Iniciar/Detener componentes individuales
• Alterar la configuración de los dispositivos
• Cargar y configurar versiones de configuraciones
• Actualizaciones de Hardware/Software

Si poseemos los registros para cubrir nuestra operatoria, digamos que al menos
podemos rastrear dónde nos equivocamos, lo cual no es poco.

Hasta aquí una tarea en principio Administrativa de la Gerencia, sería mediar


los recursos necesarios para crear el registro de cada una de las tareas
involucradas en OAyM de la red.

Gestión de Rendimiento
Para garantizar niveles consistentes mediante la Gestión de Rendimiento
habrá que planificar cómo se realizarán, cómo se pondrán a consideración y
quiénes estarán a cargo de:

• La colección de datos
• Las estadísticas de interfaces
• El Tráfico
• Las Tasas de error
• La Utilización
• La Disponibilidad porcentual

El nivel Gerencial de las Operaciones deberá mediar los recursos necesarios


para establecer el formato y herramientas a utilizar para lograr el “Análisis de
datos para mediciones y pronósticos” y el “Establecimiento de niveles límite
de rendimiento” de manera que se implementen, sean alcanzables y estén
debidamente capacitados para su análisis, todo el personal a cargo.

Planificación de la capacidad e instalaciones e Importancia de las


estadísticas de red
Uno de los principios fundamentales de los SGC es el Enfoque basado en
hechos para la toma de decisiones, esto nos obliga a Registrar lo acontecido y
mantener un orden al respecto.

Las decisiones eficaces se basan en el análisis de los datos y de la información.


Beneficios clave: siempre habrá que contar con información acerca de cómo
estamos trabajando, así, llevaremos un registro de los valores de producción, de
forma tal que podamos comprobar si la decisión cumple con el objetivo, es mejor
que la anterior o no. Esto aumenta nuestra capacidad de realizar, cuestionar,
intercambiar opiniones y decisiones tomadas anteriormente.
Aplicación práctica: asegúrese que los datos y la información son precisos y
fiables, haga accesibles los datos a quienes los necesiten. tome decisiones y
emprenda acciones en base el análisis objetivo, la experiencia y la intuición.
(reemplace intuición por experiencia)

Deberíamos aplicar el criterio para tener un registro de los eventos y saber


de éstos:
• Contabilidad
• Resolución de problemas
• Pronósticos a largo plazo
• Planificación de Capacidad

Las mediciones puede ser:


◦ Mediciones activas
◦ Mediciones pasivas

Las herramientas de gestión suelen tener funcionalidades estadísticas a estos


fines.

Gestión de fallas
Otra de las tareas cotidianas del NOC es sobrellevar las situaciones de
Emergencia, para ello hay que planificar la capacitación de quienes están a cargo
del NOC, el éxito depende exclusivamente de la capacidad de mantener la calma y
la repetición de procedimiento adquirido (mecánica) a éste procedimiento le
pondremos algunos detalles importantes más adelante.

“Estamos acostumbrados a utilizar el matafuegos en OAyM, pero además de


aprender a usarlo, debemos planificar la carga regular, la vigilancia de que estén
operativos, la comunicación a los involucrados y la adecuada planificación de
quién está apto para su uso y la ubicación estratégica de los mismos”
Identificación de la falla:
Sigamos el siguiente flujo del formato de trabajo para una eventualidad,
separemos las tareas en tres grandes aspectos para identificar nuestro accionar

(Inicio A)
• Sondeo regular de los elementos de la red
• Aislar la falla
• Diagnosis de los componentes de la red

(Acción B)
• Reaccionar ante la falla
• Asignación de recursos para resolver fallas
• Determinación de prioridades

(Registro C)
• Escalada técnica y de gestión
• Resolver la falla
• Registro y Notificación

Podríamos recomendar los siguientes tiempos involucrados en la


IDENTIFICACIÓN de la FALLA

Inicio A: calma, tómese su tiempo, observe detenidamente, agudice su vista y


capacidad de rastreo, deberá poder responder, que falla?, dónde falla?, cuánto
falla?. En otras palabra también saber si la falla “Afecta el Servicio”? O deja Fuera
de Servicio? (SA: service afecting y/o OOS: out of service). NO nos preguntamos
por qué falla?, de hecho no nos interesa la causa sino el hecho que está
sucediendo. No pierda su tiempo aquí tratando de determinar la causa. Debería
insumir un minuto, ideal para un operador con experiencia en la red y dos a tres
minutos máximo sino la posee.

Acción B: si ha hecho una lectura correcta en el punto anterior, las acciones ante
la falla podrían ser:
- si es posible y/o necesario contactar a un operador remoto para certificar la
falla es momento de contactarlo.
- las prioridades serán preestablecidas desde la Gerencia de Operaciones,
atendiendo que las OOS anteceden en prioridad a las SA, y cada una de ellas se
enumeran y escalonan según dependencias en la red.

Tampoco buscamos aquí la causa sino la forma de establecer su importancia,


atendiendo que la misma será de acuerdo a la afectación al servicio que produce.
Seguramente los tiempos para un operador con experiencia, tratar de establecer la
importancia en el servicio estaría en el orden de un minuto, será tiempo entonces
de pasar a C.

Registro C: el operador deberá notificar fehacientemente a quienes deben estar al


tanto de las operaciones de red, la Gerencia de Red deberá instruir las jerarquías
correspondientes y la manera en que se hará el aviso con anterioridad sobre algún
procedimiento. Si el operador esta facultado para tomar acciones, deberá intentar
restablecer el servicio. Quedarán registradas las acciones tomadas, las reacciones
del sistema a las actuaciones y los avisos dados a los superiores y encargados de
las acciones. El registro tendrá la posibilidad de “agregar” ahora sí, de ser posible,
la “causa” de la falla. No incluya una causa si no se puede verificar
fehacientemente que ella genera la misma. Aquí los tiempos de urgencia pasan por
los avisos a quienes corresponda y en segundo plano por el debido registro de lo
acontecido.

Atendiendo que los tiempos son estimativos pero significantes para el


personal que trabaja y “siente” el OA&M como una filosofía en las
Telecomunicaciones, recomiendo que de alguna manera sea público el
conocimiento del “Valor del Minuto”, no necesariamente debe estar publicado su
precio, pero por ejemplo si sabemos el total del tráfico diario, llamadas diarias
gestionadas por la red, etc. llegar al valor del minuto y tenerlo a la vista de los
operadores de red, sería una forma de recordar lo importante de su trabajo, por
ejemplo:

“Gracias a la operatividad de nuestra red es posible que XXX llamadas/Mbps


transiten en este minuto”

También podría ser un punto de comparación mensual/semanal, publicarlo


como “meta de mejora”. Tener una relación de minutos con cantidad de clientes en
la red y que incluya los OOS para que podamos visualizar, cuantificar y calificar
nuestra operación a modo general, como un hecho que ayude a la autoestima de
quienes lo hacen posible.

No subestimar la capacidad del operador que convive a diario con las


plataformas y sus estadísticas, por lo tanto conoce el comportamiento, muchas
veces OA&M genera las estadísticas pero no las analiza, no estaría muy de
acuerdo con esa postura.

Sistemas de gestión de fallas


Asegúrese que la Gerencia de Operaciones ha instruido los procedimientos
necesarios para que queden perfectamente establecidas las formas de:
• Mecanismos de reporte
• Enlace al NOC
• Notificación del personal de guardia
• Instalación y control de procedimientos de alarmas

Procedimientos de reparación/recuperación
Sistema de manejo de incidencias (ticketing system)

Detección y Gestión de Fallas


Quién se debe dar por enterado de que existe una incidencia en primera
instancia es el NOC, quien debe contar con personal 24x7, las 24 hs del día, los
siete días de la semana. Habrá que instruir y capacitar a todo el personal
involucrado, si incorpora un nuevo personal a la planta de monitoreo NO de por
hecho que los demás integrantes lo “capacitarán”, pues no es su función, aunque
tengan la mejor de las predisposiciones.

-Abrir una incidencia para dar seguimiento al problema.


-Soluciones básicas preliminares.
-Asignar un ingeniero al caso o escalar la incidencia.
-Llamada de Cliente, si corresponde.
-Contactarse con otros operadores de red, si corresponde.

El NOC debe tomar conocimiento de la incidencia mediante el uso de:

• Herramientas de monitoreo
• Utilidades Comunes
◦ ping
◦ Traceroute
◦ Ethereal
◦ SNMP
◦ Sistemas de Monitorización
◦ HP Openview
◦ Nagios
◦ Big Brother
◦ WiresHark
◦ Reportes de estado
◦ otros
• Separar lo que son:
◦ Nodos inoperativos (down)
◦ Nodos no alcanzables (unreachable)

Gestión de Fallas: Sistema de Incidencias


Se necesita un mecanismo para dar seguimiento a:
• Estado actual de la falla
• Personal asignado
• Tiempo estimado de solución
• Tiempo trabajado (si se va a facturar con más razón)
• Historia de las acciones

Gestión de Fallas: Sistema de Incidencias


El sistema debería proveer:
• Programación y asignación de tareas
• Registro de las comunicaciones
• Remisiones y despachos
• Supervisión
• Análisis estadístico
• Responsabilidades (¿quién hizo qué?)
• Gestión de fallas: utilización de una incidencia
• Crear una incidencia para todas las llamadas
• Crear una incidencia para todos los problemas
• Crear una incidencia para todos los eventos programados
(mantenimiento)
• Enviar una copia de la incidencia al que reporta y a una lista de
correo.
• Todas las acciones en la vida de una incidencia mantienen el
mismo número.
• La incidencia está abierta hasta que se resuelve.
• El que reporta el problema determina cuándo debe ser cerrada
la incidencia

Gestión de Seguridad
Si no debe ser accesible para todo el mundo, entonces quítelo del alcanse de todo
el mundo, utilice políticas de seguridad para que acedan a los recursos aquellos
que realmente lo necesitan, no permita almacenar en el mismo lugar las cuestiones
de seguridad con las cuestiones de acceso libre. Asegúrese de saber quién ingresó
y en qué momento lo hizo a los lugares en que se almacena la información
declarada como confidencial. Si tuvo un ingreso indebido, asegúrese que el mismo
queda registrado. Instrumente un procedimiento de revisión de la negación de
ingresos y sus detalles. Si tiene las herramientas, ellas deben ser usadas, de nada
sirve registrar si nadie se ocupa de revisar los ataques. Si no es idóneo en
seguridad, pida la ayuda necesaria, es más la Gerencia debería mediar para que
se asignen los recursos necesarios para que “el experto en seguridad informática”
de la Empresa pueda asistirlos.

Si este pequeño documento es de utilidad, puede comunicarse para mayores


detalles a franciscoaltamirano@ingenieria-aplicada.com.ar, en la práctica, hay una
serie de documentos disponibles para implementar, pero finalmente con un
programa y una base de datos asociada se remplazan planillas y se agiliza la
operatoria.

Atentamente.

Francisco Altamirano

También podría gustarte