Está en la página 1de 3

Backup de Servers y Redundancias

Objetivo
Por el presente documento se definirán soluciones de backup para lograr un sistema con
redundancias que garantice un servicio ininterrumpido. En cada una de las alternativas se detallarán
extensivamente ventajas y vulnerabilidades para contar con una visión completa de la solución más acorde a la
necesidad del proyecto.

Alcance
Aplica a todos los servers sin sistemas de redundancia para sistemas críticos de servicios de
streaming 24/7, garantizando la continuidad y seguridad de la plataforma.

Entorno actual
Los servers instalados cuentan con un entorno de virtualización altamente escalable basado en la
herramienta open source Ovirt. Se optó por esta vía por las características de seguridad y facilidad de uso a la
hora de ejecutar rutinas de backup y características “future ready” de redundancia entre otras. El
almacenamiento compatible es de red GlusterFS, pero a fines de mantener la solución competitiva se encuentra
hospedado en el mismo server en un setup definido como “hyper converged”. Consecuentemente uno de los
pasos consiste en la migración del storage local principal a un storage pool de red fuera del server como se
muestra en la siguiente figura:

Nota: Minima configuración 2 Storage Servers, recomendado 3.


Definiciones

Alta disponibilidad (high availavility):


Las maquinas virtuales de alta disponibilidad (HA VMs), son reiniciadas automáticamente por Ovirt cuando
desaparecen accidentalmente a fruto de fallas del hardware del server donde están hospedadas, problemas
de storage o errores QEMU (virtualizador)
Storage pool:
Es un array de servidores de almacenamiento de red seguros para almacenamiento de servicios críticos

Dimensionamiento de Storage:
A tener en cuenta a la hora del cálculo de capacidad del Storage Pool se deben sumar los discos a la
máxima capacidad esperada por server.
Origin
Capacidad máxima esperada: 1.5 TB
Nota: este server ya cuenta con un NFS server dedicado para catch-up de aproximadamente 5TB de uso en pico
para 24hs, con 20TB de capacidad actual., no está incluido en el storage pool definido previamente.
Cableview
Capacidad máxima esperada 2TB
Capacidad mínima recomendada para el storage pool:
(server 1 + server 2 + ... + server n) * 1.5 ( 50% sobredimensionado por redundancia )
(1.5TB + 2TB ) * 1.5 = 5.25 TB

Backup 1+1
En un entorno de alta disponibilidad, de forma automática en un cluster con un server por
redundancia se pueden definir N máquinas virtuales para correr automáticamente cuando se caiga una activa.
Como requisito el server backup debe tener como mínimo el hardware de la máquina a respaldar de mayor
capacidad, en el presente entorno deberían ser las siguientes specs o mejores:

CPU 40 cores (Intel Xeon Gold 6138)


RAM “32GB DDR4-2666” x4 = 128GB

Alternativa
Se puede optar por un tercer server del tipo Hyperconverged sin capacidades de high availability
pero reduciendo la cantidad de servers del storage pool antes propuestos.
Anexo, Transcoder de respaldo.
En el caso de los transcoders se sugiere disponer de un server de características similares a los 5
transcoders instalados con un menú de boot selectivo de 5 opciones para definir el transcoder que ha de
reemplazarse. Las características del mismo serían las siguientes o superiores:

Categoría Detalles
CPU “Xeon E5-2620V4” x 2
RAM “16 GB” x 4 = 64GB
HDD “SSD 960GB” X2 = 960GB raid 1
GPU “PNY Quadro P5000 16GB” X 2
Eno1 1gb
Eno2 1gb

Dicho transcoder se encontraría en el mismo rack donde están los activos, debidamente identificado.

Procedimiento en falla de transcoder


Ante la eventualidad de ser necesaria la reposición inmediata de un transcoder se procederá de la
siguiente forma:
*Inicio del transcoder de respaldo
*Selección en el menú de boot del transcoder a reemplazar
*Conexión de los cables de red del transcoder remplazado para respetar los ruteos de vlan’s de los puertos
preconfigurados en el switch y os del transcoder.
Este procedimiento disminuye radicalmente el tiempo de respuesta y baja el nivel de complejidad de
la reposición, pero no es en este caso automatizado.

Reglas de Firewall
Todos los servers cuentan con Firewall incluido a nivel OS en el tráfico por puertos, sin embargo se
detallará una revisión y reglas de tráfico/seguridad a crear de forma externa a incrementar via NGFW:

Reglas y características comunes:


Port 80 (http diagnose port, enabled) ICMP (dissabled for ddos attacks)
Port 443 (https secure port, enabled) WAF (web application firewall, layer7)
Port 22 (ssh config port, enabled) R.U.D.Y (timings shortened for responce)
DPI (deep packet inspection) IPS (intrusion prevention system)
AI (AI real time analisys)

También podría gustarte