Está en la página 1de 35

Gestin de Redes

Introduccin a la Gestin de
Redes
These materials are licensed under the Creative Commons Attribution-Noncommercial 3.0 Unported license
(http://creativecommons.org/licenses/by-nc/3.0/) as part of the ICANN, ISOC and NSRC Registry Operations Curriculum.

Seccin I: Panorama
Conceptos claves:
Qu es la monitorizacin de redes
Qu es la gestin de redes
Lo bsico
Por qu gestin de redes
Los tres grandes elementos
Deteccin de ataques
Documentacin
Consolidacin de la informacin
La visin completa

Detalles de la Gestin de Redes


Monitorizamos
Sistemas y servicios

Disponible, alcanzable

Recursos

Planificacin de expansin, mantener disponibilidad

Rendimiento

Tiempo de ida y vuelta, tasa mxima de transmisin

Cambios y configuraciones
Documentacin, control de versiones, logs

Detalles de la Gestin de Redes


Seguimos la pista de
Estadsticas
Para fines de contabilidad

Fallos

Deteccin,

Historial de fallos y sus soluciones

Los sistemas de gestin de incidencias son buenos para


esto

Expectativas
Una red en operacin debe ser monitorizada para:
-

Asegurar los SLA proyectados (Acuerdos de Nivel de


Servicio

Los SLAs dependen de polticas

Qu espera la direccin?

Qu esperan los usuarios?

Qu esperan los clientes?

Qu espera el resto de la Internet?

Qu se considera bueno? 99.999% de disponibilidad?

No hay tal cosa como disponibilidad 100%

Expectativas de Disponibilidad
Qu hace falta para 99.9 %?
30.5 das x 24 horas = 732 horas por mes
(732 (732 x .999)) x 60 = 44 minutos
Slo 44 minutos de baja por mes!

Tiene que apagar 1 hora por semana?


(732 4) / 732x 100 = 99.4 %
Recuerde tomar en cuenta el tiempo de baja planeado, e informe a
sus usuarios si est o no includo en el SLA

Cmo se mide la disponibilidad?


En el ncleo (core) ? Extremo a extremo? Desde la
Internet?

Puntos de Referencia
Qu se considera normal en su red?
Si nunca ha monitorizado su red, tendr que
saber cosas como:
Carga tpica de los enlaces ( Cacti)
Nivel de variabilidad (jitter) entre dos puntos (
Smokeping)
Utilizacin tpica de recursos
Niveles de ruido tpicos:
Escaneos de red
Datos descartados
Errores reportados y fallos

Por qu hacer todo esto?


Saber cundo se necesita una mejora
-

Su ancho de banda est saturado?

A dnde v su trfico?

Necesita un enlace de ms capacidad, u otro proveedor?

Es demasiado viejo el equipo?

Mantener una auditora de cambios


-

Anotar todos los cambios

Facilita conocer el origen de los problemas despus de cambios y


actualizaciones

Mantenga un histrico de las operaciones

Use un sistema de gestin de incidencias

Le permite protegerse y saber lo que ha ocurrido

Por qu la gestin de redes?


Contabilidad

Medir el uso de los recursos

Cobrar a clientes basado en utilizacin

Saber cundo hay problemas


-

Entrese antes que los usuarios, sino quedar mal!

El sistema de gestin puede crear incidencias y


notificar al equipo tcnico

Tendencias

Toda esta informacin sirve para ver las tendencias en


la red
Esto es parte del establecimiento de un punto de
referencia, planificacin de la capacidad, etc.

Los tres grandes elementos


Disponibilidad
Nagios
etc.

Servicios, servidores, enrutadores,

Fiabilidad
Smokeping Retardo, prdidas, variabilidad

Rendimiento
Cacti
Utilizacin de enlaces, CPU,
memoria, disco, etc.
Existe cierta coincidencia de funcionalidades entre los tres

Deteccin de ataques
La utilizacin de las tendencias y la
automatizacin, permiten determinar
cundo es victima de un ataque
Las herramientas le pueden ayudar a
mitigar estos ataques:

Flujos (netflow) a travs de interfaces


Saturacin de servicios o servidores
especficos
Fallos en mltiples servicios

Consolidacin de Datos
El Centro de Operaciones de la Red (COR, o
NOC) es Donde ocurre todo
-
-
-
-
-

Coordinacin de tareas
Estado de la red y los servicios
Atencin de incidencias y quejas
Donde residen las herramientas (servidor NOC)
Documentacin que incluye:

Diagramas de red

Asignacin de puertos en conmutadores y enrutadores

Descripcin de la red

Y como veremos mas adelante, mucho ms

Visin General
Notificaciones

- Monitorizacin
- Recopilacin de datos
- Contabilidad

Ticket

-Gestin de cambios
-Herramientas
-Gestin de
Incidencias

Ticket

Ticket

- Mejoras
- Actualizaciones

Ticket
Ticket

- Quejas
- Solicitudes

- Resolucin de
problemas

- Planificacin de capacidad
- Disponibilidad (SLAs)
- Tendencias
- Detectar problemas

Unas pocas soluciones Open Source


Rendimiento

Cricket
IFPFM
flowc
mrtg*
NetFlow*
NfSen*
ntop
perfSONAR
pmacct
RRDtool*
SmokePing*

Manejo de
Incidencias

RT*

Trac*

Redmine

Gestin de Cambios

Mercurial

Rancid* (routers)

CVS*

Subversion*

git*
Seguridad/(SDI)

Nessus
OSSEC
Prelude
Samhain
SNORT
Untangle

Registro de Eventos
swatch*
syslog-ng/rsyslog*
tenshi*

Gestin de Redes

Big Brother
Cacti*
Hyperic
Munin
Nagios*
OpenNMS*
Observium*
Sysmon
Zabbix

Documentacin

IPplan
Netdisco
Netdot*
Rack Table

Protocolos/Utilidades
SNMP*, Perl, ping

Preguntas hasta ahora?

Seccin II: Detalles


Algunos detalles sobre los conceptos :

Continuacin de la Documentacin de Redes


Herramientas de Diagnstico
Herramientas de Monitorizado
Herramientas de Rendimiento
Herramientas Activas y Pasivas
SNMP
Sistemas de Gestin de Incidentes
Gestin de configuracin y cambios

Seccin III: Detalles


Algunos detalles acerca de los conceptos
claves:

Herramientas de Diagnstico
Herramientas de Monitorizado
Herramientas de Rendimiento
Herramientas Activas y Pasivas
SNMP
Sistemas de Gestin de Incidentes
Gestin de configuracin y cambios

Sistemas de monitorizacin
Tres tipos de herramientas
1.

Diagnstico probar conectividad, comprobar que una


ubicacin es alcanzable, o que un dispositivo est disponible.
Generalmente herramientas activas.

2.

Monitorizacin ejecucin en segundo plano (demonios o


servicios, que recopilan eventos, pero que tambin pueden
iniciar sus propias verificaciones de estado (usando
herramientas de diagnstico), y anotan el resultado, de manera
programada.

3.

Rendimiento Nos dicen cmo la red est manejando los flujos


de datos

Sistemas y herramientas de monitorizacin


3. Herramientas de rendimiento
Mirar cada interfaz del enrutador y conmutadores

Dos herramientas populares:


-Netflow/NfSen: http://nfsen.sourceforge.net/
-MRTG:
http://oss.oetiker.ch/mrtg/
MRTG = Multi
Router Traffic
Grapher

Sistemas y herramientas de monitorizacin


Herramientas activas
-

Ping Probar conectividad hacia un nodo

Traceroute Mostrar la ruta de los paquetes

MTR Combinacin de ping + traceroute

Colectores de SNMP (polling)

Herramientas Pasivas
-

Monitorizacin de eventos, SNMP traps, NetFlow

Herramientas Automticas
-

SmokePing Recopilar y graficar el retardo en alcanzar nodos y servicios,


usando ICMP (Ping) y otros mtodos

MRTG/RRD Recopilar y graficar la utilizacin del canal en cada interfaz


de un dispositivo

Sistemas y herramientas de monitorizacin


Monitorizado de la red y servicios
-

Nagios Monitor de servidores y servicios

Puede monitorizar prcticamente de todo

HTTP, SMTP, DNS, Disco, CPU, ...

Fcil de escribir nuevas extensiones (plug-ins)

Solo requiere conocimiento bsico de programacin para


desarrollar nuevas pruebas Perl, Shell scripts, php, etc...

Muchas buenas opciones de Fuente Abierta

Zabbix, ZenOSS, Hyperic, OpenNMS

Los mecanismos de dependencias son muy tiles

Sistemas y herramientas de monitorizacin


Monitorice sus servicios crticos
-
-
-

DNS/Web/Email
Radius/LDAP/SQL
SSH

Cmo va a recibir alarmas?


No olvide la gestin de eventos!
-

Cada dispositivo de red (as como servidores Linux y


Windows) pueden reportar eventos usando Syslog
Debe recopilar y monitorizar sus archivos de eventos!
-

No hacerlo es uno de los principales errores en la gestin de


red

Protocolos de Gestin de Red


SNMP Simple Network Management
Protocol
Estndar de la industria, cientos de herramientas
- Presente en cualquier elemento de red decente
Utilizacin de canal, errores, CPU, temperatura, ...
-

-
-

Disco, procesos,
UNIX y Windows tambin lo implementan

SSH y telnet
-

Tambin es posible usar scripts (programas sencillos)


para monitorizar remotamente

Herramientas SNMP
Conjunto de herramientas Net SNMP
- http://net-snmp.sourceforge.net/

Muy sencillo desarrollar herramientas basadas


en estas utilidades
-

Recopilar las tablas ARP de enrutadores


Recopilar las tablas de conmutacin de los switches

Solicitar el estado de un arreglo de discos en RAID.

Solicitar las temperaturas de servidores, enrutadores,


etc.

Herramientas de estadsticas
Contabilidad y Anlisis de Trfico
-

Cmo est siendo utilizada la red, y qu tanto

Util para calidad de servicio (QoS), detectar abusos,


y facturacin

Protocolo dedicado: NetFlow

Identificar flujos de trfico: protocolo, fuente,


destino, bytes

Diferentes herramientas

Flowtools, flowc

NFSen

Muchas ms: http://www.networkuptime.com/tools/netflow/

Gestin de Fallos
Es transitorio el problema?
-

Sobrecarga, falta temporal de recursos

Es permanente el problema?
-

Fallo del equipo, lnea cada

Cmo detectar un problema?


-

Monitorizacin!

Quejas

Un sistema de incidencias es esencial


-

Abrir ticket para seguir un evento (ya sea planificado o por fallo)

Definir reglas de escalado

Quin es responsable de resolver el problema?

A quin se le asigna si ste no est disponible?

Sistemas de Incidencias
Por qu son importantes?
-

Seguir todos los eventos, fallos y problemas

Punto central de comunicacin del Help Desk


Utilcelo para registrar toda comunicacin
-

Tanto interna como externa

Eventos originados desde fuera:


-

Quejas de clientes

Eventos originados desde dentro:


-

Salidas de servicio de sistemas

Actualizaciones o mantenimiento planificados Recuerde notificar


a los clientes!

Sistemas de Incidencias

A cada caso se le asigna un nmero


Cada caso atraviesa un ciclo similar:
- Nuevo
- Abierto
- ...
- Resuelto
- Cerrado

Sistemas de Incidencias
Flujo de tareas:
Sistema de
Helpdesk
Tcnico
Eqpt
Incidencias
---------------------------------------------------------------T
T
T
T
pregunta
|
|
|
|
del ----> |
|
|
|
cliente
|-- solicitud -->|
|
|
<- ack. -- |
|
|
|
|
|<-comunicacin->|
|
|
|
| -solucionar->eqpt
|
|<-solucionado-- |
|
cliente <-|<-- respuesta --|
|
|
|
|
|
|

Sistemas de incidencias: Ejemplos


RT (Request Tracker)
-

Muy usado mundialmente.

Un sistema clsico de incidencias que se puede ajustar a cada entidad.

Un poco difcil de instalar y configurar.

Puede manejar grandes volmenes de transacciones

Trac
-

Sistema hbrido que incluye wiki y manejo de proyectos

Sistema de incidencias inferior a RT, pero funciona bien

Usado para seguir proyectos de grupo

Redmine
-

Como trac, pero ms robusto. Mucho ms difcil de instalar.

Sistemas de Deteccin de
Intrusiones de Red (SDI)
Programas que observan los flujos de trfico y
envan alarmas cuando detectan cosas como:
-

Nodos infectados o que actan como fuentes de Spam.

Algunas herramientas:
-

SNORT Un sistema IDS muy popular:


http://www.snort.org/

Prelude Sistema de Gestin de Informacin de Seguridad


https://dev.prelude-technologies.com/

Samhain SDI Centralizado


http://la-samhna.de/samhain/

Nessus Escner de vulnerabilidades:


http://www.nessus.org/download/

Gestin y monitorizacin de
configuraciones

Registrar cambios en configuraciones de equipos de red


usando control de versiones
Gestin de Inventario (Equipos, IPs, interfaces)
Usar control de versiones
-

Tan simple como:


cp named.conf named.conf.20070827-01

Para archivos de configuracin:


-

CVS, Subversion (SVN)

Mercurial

Para enrutadores:
- RANCID

Gestin y monitorizacin de
configuraciones

Se sola usar para cdigo fuente (programas)


Funciona bien para cualquier configuracin en formato
texto
-

Para equipos de red:


-

Tambin para archivos binarios, pero no es posible ver diferencias


RANCID (Recopilacin y registro automtico de configuraciones
para Cisco y otros fabricantes)

Includo en software de gestin de proyectos como:


-
-
-

Trac
Redmine
Y muchos otros productos de Wikis. Excelente para documentar la
red.

Revisin de la visin general


Notificaciones

- Monitorizacin
- Recopilacin de datos
- Contabilidad

Ticket

-Gestin de cambios
-Herramientas
-Gestin de
Incidencias

Ticket

Ticket

- Mejoras
- Actualizaciones

Ticket
Ticket

- Quejas
- Solicitudes

- Resolucin de
problemas

- Planificacin de capacidad
- Disponibilidad (SLAs)
- Tendencias
- Detectar problemas

Preguntas

También podría gustarte