Está en la página 1de 50

Webinar zabbix latam:

Escalando a más de 10.000 host

IMAGINE. DESIGN. TRANSFORM


A new way of doing business
Carlos Ortega
12+ años Sistemas de monitoreo
8+ años Sistemas Zabbix

carlos.ortega@imagunet.com
www.linkedin.com/in/carlos-ortega-guerrero
Agenda
¿Quiénes SOMOS?

Iniciando de 0 a 500 host

Escalando de 501 a 1.000 host

Rumbo a los 10.000 host

Recta final

referencias
Iniciando de 0 a 500 host
PREPARACIÓN DE
INFRAESTRUCTURA Y
PARÁMETROS DE
ZABBIX
• Iniciamos con un monitoreo de 0 a 500 host en una
infraestructura monolítica. Se monitorean equipos,
servidores, servicios entre otros.
• Las configuraciones de Zabbix se encuentran por
defecto

Al llegar a los 500 host, se empieza a detectar problemas


de funcionamiento

• Uso de templates por defecto


• Tiempos de recolección por defecto
• Triggers no inteligentes
• Descubrimientos frecuentes
Tipo Lento Rápido
Low-level detection 1h 1d, 7d Tips para optimizar el
Trigger expressions min(), max(), avg() last(), nodata() rendimiento del zabbix
Data collection Polling Trapping server

Data types Text, string, Numeric


¿chequeos activos vs pasivos?
• Para chequeos pasivos, siempre se generan
conexiones con el agente y el servido
• Para chequeos activos, el agente es quien envía la
información y alivia la carga de Zabbix server o Zabbix
proxy

¡Tener ambos chequeos permite un monitoreo integral!

Alternativas de
agente Zabbix

• HTTP
• SNMP
• ODBC
• SSH
Escalando de 501 a 1.000 host
AJUSTAR LA
INFRAESTRUCTURA Y
OPTIMIZACIÓN DE
ZABBIX
Configuraciones de chequeos
pasivos

OK:
/usr/sbin/zabbix_server: poller #1 [got 0 values in 0.000020 sec, idle 1 sec]
/usr/sbin/zabbix_server: poller #2 [got 0 values in 0.000021 sec, idle 1 sec]
Tipo Configuración
/usr/sbin/zabbix_server: poller #3 [got 6 values in 0.008376 sec, getting values]
/usr/sbin/zabbix_server: poller #4 [got 2 values in 0.050582 sec, idle 1 sec]
/usr/sbin/zabbix_server: poller #5 [got 3 values in 0.000688 sec, idle 1 sec] SNMP/Agente pasivo StartPollers = 25

NOT OK:
ICMP Ping StartPingers = 15
/usr/sbin/zabbix_server: poller #1 [got 20 values in 3.040020 sec, getting values]
/usr/sbin/zabbix_server: poller #2 [got 45 values in 2.013021 sec, getting values]
HTTP Checks StartHTTPPollers = 10
/usr/sbin/zabbix_server: poller #3 [got 63 values in 1.008376 sec, getting values]
/usr/sbin/zabbix_server: poller #4 [got 21 values in 7.050582 sec, getting values]
/usr/sbin/zabbix_server: poller #5 [got 43 values in 4.130688 sec, getting values]
Configuraciones de chequeos
activos

OK:
/usr/sbin/zabbix_server: trapper #1 [got 0 values in 0.000020 sec, idle 1 sec]
/usr/sbin/zabbix_server: trapper #2 [got 0 values in 0.000021 sec, idle 1 sec]
/usr/sbin/zabbix_server: trapper #3 [got 6 values in 0.008376 sec, getting values]
/usr/sbin/zabbix_server: trapper #4 [got 2 values in 0.050582 sec, idle 1 sec] Tipo Configuración
/usr/sbin/zabbix_server: trapper #5 [got 3 values in 0.000688 sec, idle 1 sec]
Agente activo StartTrappers = 25
NOT OK:
/usr/sbin/zabbix_server: trapper #1 [got 20 values in 3.040020 sec, getting values]
SNMP Trap StartSNMPTrapper = 15
/usr/sbin/zabbix_server: trapper #2 [got 45 values in 2.013021 sec, getting values]
/usr/sbin/zabbix_server: trapper #3 [got 63 values in 1.008376 sec, getting values]
/usr/sbin/zabbix_server: trapper #4 [got 21 values in 7.050582 sec, getting values]
/usr/sbin/zabbix_server: trapper #5 [got 43 values in 4.130688 sec, getting values]
Front-end
No olvides
realizar un
tuning del
servicio
NGINX VS Apache2
¡Usa el que mejor conozcas!
Base de datos
No olvides
realizar un
tuning del
PostgreSQL VS MySQL
servicio
¡Usa el que mejor conozcas!

• Utiliza la versión estable más reciente


• MySQL, use la estructura de tabla InnoDB
Configuraciones de mysql
innodb

innodb_file_per_table = 1
innodb_buffer_pool_size=3GB (~75% del total de la RAM)
innodb_buffer_pool_instances = 4 (1 p/GB)
innodb_flush_log_at_trx_commit = 2
innodb_flush_method = O_DIRECT
innodb_log_file_size= 512MB (1/8 de innodb_buffer_pool_size)
Configuraciones de Postgre

vacuum_cost_page_miss= 10
vacuum_cost_page_dirty= 20
autovacuum_vacuum_threshold= 50
autovacuum_vacuum_scale_factor= 0.01
autovacuum_vacuum_cost_delay= 20ms
autovacuum_vacuum_cost_limit= 3000
autovacuum_max_workers= 6
Más Host… Más registros

• Crecimiento de tablas
• Mayores consultas para gráficas
• Mayor uso de procesos de Housekeeping
Monitoreo de
housekeeper
Zabbix proxy
• Infraestructura sin distribución de carga
• Toda la información llega al Zabbix Server

Pequeños cambios generan grandes efectos


Añadir un item con intervalo de actualización de 1 minuto
provoca:

• Aumento de 17 VPS
• 61.000 nuevos registros por hora en la base de datos
• Infraestructura con distribución de carga
• Un grupo de servidores y equipos de red reportan a un
proxy respectivo

¡Divide y vencerás!
Al utilizar la opción de Zabbix proxy, transformamos las N
conexiones que realizaba el Zabbix server y los objetos
de monitoreo en solo 1 canal de comunicación y permite
optimizar los recursos de infraestructura.
¿Por qué usar zabbix
proxy?

• Zabbix Proxy "convierte" chequeos pasivos en activos.


• La carga se distribuye entre los Proxies.
• Si un proxy está sobrecargado, los nodos monitoreados se pueden mover a
otro Proxy fácilmente.
• Fácil mantenimiento y bajo consumo de CPU y Memoria.
• Datos almacenados temporalmente cuando el servidor Zabbix no este
disponible.
• Solo una permisología de firewall entre sedes remotas.
Rumbo a los 10.000 host
LLEGANDO A LA META
DE LOS 10.000 HOST

Optimizaciones a gran
escala
Más Host… Más registros

• Crecimiento de tablas
• Mayores consultas para gráficas
• Mayor uso de procesos de Housekeeping
• Base de datos sin
History particionamiento
• Dificultad para eliminar data
histórica
• En grandes tamaños, afecta
Trends el performance del servicio
• Base de datos con
History 2021-01-01
particionamiento
History 2021-01-02 • Facilidad para eliminar data
History 2021-01-03 histórica
• Mejora el performance del
Trends 2021 01 servicio
Trends 2021 02 • Recomendable solo para
Trends 2021 03 tablas históricas: history_* y
trends*
• Configuración en el Zabbix
frontend
• Hasta 90% en ahorro de
disco
• Postgre 12 o mayor
• Compresion de data (inserts,
deletes, updates) no son
permitidos
Recursos dedicados
Ventajas de arquitectura
distribuida
• Separación de recursos
• Optimización de infraestructura (Los recursos de la
base de datos no son los mismos que el FrontEnd
• Mejor manejo de Backup y Restore
• En caso de falla de algún servidor, esto no afectará
la totalidad del servicio
Ventajas de arquitectura
distribuida
• Separación de recursos
• Optimización de infraestructura (Los recursos de la
base de datos no son los mismos que el FrontEnd
• Mejor manejo de Backup y Restore
• En caso de falla de algún servidor, esto no afectará
la totalidad del servicio
Recomendaciones

Siempre mantener el SoftWare Actualizado

• Acceso a correcciones de BUG


• Aprovechar nuevas funcionalidades de performance
• Nuevos tipos de ítems
Recomendaciones

Nuevas funcionalidades e items

• Uso de ítems Master y dependientes


• Uso de throttling en preprocesamiento
• Replace para pasar texto a numerico
• Filtros en reglas de descubrimiento
• Override en reglas de descubrimiento
• Mucho mas…..
Recta final
Zabbix Server Redundante
• Configuración Activo-StandBy
• Mínimo Downtime en Upgrade
• Se pueden generar múltiples replicas con imágenes
DB en Cluster
• Configuración Activo-Activo con N Replicas
• Apoyo especializado de grupo de DBA de la
compañía
Funcionalidades en zabbix 5.2 (ha proxy
para front-end)
NUEVOS RETOS

Rumbo a los 50.000 host


referencias
La aplicación mejor
valorada del mercado en
comparación con sus
competidores.
Best IT Infrastructure Monitoring
Tools & Solutions in 2020

Best Cloud Monitoring Software


Tools & Services in 2020

Best Cloud Infrastructure Monitoring


Software
https://www.gartner.com/reviews/market/it-infrastructure-monitoring-tools/compare/microsoft-vs-solarwinds-vs-nagios-vs-paessler-vs-zabbix
servicios
Síguenos

Visite nuestro blog para encontrar más detalle http://www.imagunet.com/blog


sobre nuestra experiencia. sales@Imagunet.com

Conozca más la aplicación de nuestra https://www.zabbix.com/solutions


herramienta en tu industria. https://www.zabbix.com/manuals

Siga los eventos para conocer las fechas de https://www.meetup.com/Zabbix-Meetup-Colombia


nuestras sesiones Zabbix Meetup Colombia. https://www.zabbix.com/webinars?language=spanish
www.imagunet.com
sales@imagunet.com

https://www.linkedin.com/company/imagunet/

También podría gustarte