centreon监控系统分布式搭建

公司监控系统后端使用nagios,前端使用cenreon,使用版本为社区集成版。单套监控1000机器后延迟就较大。网上找到centreon有集成nagios的免费版,测试了分布式部署性能还可以,就决定将独立式变更为分布式。

部署环境

操作系统安装采用centreon官方提供的安装光盘安装,1台服务器安装过程中选择安装center节点,另一台选择poller节点。
center center不自己监控,连接poller,初始配置4C8G100G,分区 /boot 200M,lvm 其余空间,lv swap 4G,var 50G,其余root。安装选择center+databas。
poller 每个poller1000个主机,每个主机10个服务,规划4C2G100G配置,分区 /boot 200M,其余为lvm,lvm创建3个lv,swap 2g,var 80G,其余为root

center节点添加poller

主要步骤可在官方文档中查看,关键点为要修改poller engine configuration中data标签下的broker module,新增加一个入口,填写内容”/usr/lib64/nagios/cbmod.so /etc/centreon-broker/poller-module.xml”。这个步骤在官方文档中描述不突出,如果配置不对,会导致center节点下发给poller的命令无法生效,比如确认故障无效。可通过查看poller的engine日志和center的centcore.log排查。

center节点基础信息配置

基础信息配置包括检测命令、通知命令、服务模板、主机模板、联系人信息。

检测命令配置

1 拷贝命令到center节点指定目录并修改为用户和组为nagios。
2 在web前端添加命令配置合适的参数
check_centreon_ping

1
2
3
4
5
6
7
8
content
$USER1$/check_icmp -H $HOSTADDRESS$ -n $ARG1$ -w $ARG2$ -c $ARG3$
参数
!3!200,20%!400,50%
参数描述
ARG1 : count
ARG2 : warning
ARG3 : critical