学习目标:
- 能够实现一个web页面的监测
- 能够实现自动发现远程linux主机
- 能够通过动作在发现主机后自动添加主机并链接模板
- 能够创建一个模版并添加相应的元素(监控项,图形,触发器等)
- 能够将主机或模板的配置实现导出和导入
- 能够实现至少一种报警方式(邮件,微信等)
- 能够通过zabbix_proxy来实现监控
web监测
web监测:类似一个监控项,可以对一个url页面进行监测(监测它的状态码,页面匹配的字符串,响应时间,下载速度等)
web监测可以创建一个场景,并包含几个步骤
下面来做个例子(监测agent1的httpd的主页)
1, web管理界面--》配置--》主机--》web监测(选agent1的web监测)--》右上角点创建web场景
2,再点步骤,填上名称与监测的URL(你可以添加多个步骤,我这里只加这一个)
3,继续在步骤界面的最下面填上200状态码,然后点添加,出来后再点添加
4,创建完后,去下图中查看验证
-
如果看到是连接失败,则表示agent1的httpd没有启动
-
如果是404错误,则表示服务启动了,但找不到主页
5, 去agent1上安装httpd,并做一个主页,再重启服务
[root@agent1 ~]# yum install httpd httpd-devel [root@agent1 ~]# echo "agent1 主页" > /var/www/html/index.html [root@agent1 ~]# systemctl restart httpd [root@agent1 ~]# systemctl enable httpd
6,再去查看验证
练习:
-
为上面的web监测创建一个图形
-
为上面的web监测创建一个触发器,状态码不为200就触发(选监控项的时候要注意看清楚,一个web监测会产生好几个小的监控项,选状态码的那一个)
自动发现与动作
发现:假设我现在需要添加监控100台主机,这个工作量有点大。所以我可以把这100台连好网络,配置并启动好zabbix-agent服务。然后在zabbix server上配置一个自动发现规则,自动发现这100台主机。
自动发现是由服务端主动发起,Zabbix Server开启发现进程,定时扫描网络中符合条件的主机。
动作:自动发现了这100台主机,但是还要添加监控主机和链接模板啊。这时可以通过动作来达到此目的。
咱们前面早就准备了一台agent2,一直还没使用,这里就尝试自动发现这台agent2。
1,在agent2上安装zabbix-agent包
[root@agent2 ~]# yum install zabbix-agent
2,配置zabbix-agent端的配置文件,启动服务并做成开机自动启动
[root@agent2 ~]# vim /etc/zabbix/zabbix_agentd.conf 97 Server=10.1.1.11 修改成zabbix监控服务器的IP [root@agent2 ~]# systemctl restart zabbix-agent [root@agent2 ~]# systemctl enable zabbix-agent [root@agent2 ~]# lsof -i:10050
思考: 如果100台服务器都要装系统,然后再做上面两步,也挺累的。用什么方法来做更高效?
答: 安装系统可以使用pxe(kickstart)或cobbler.安装软件,修改配置可以使用cobbler的postscript,再或者使用ansible,saltstack这种软件。
3, web管理界面--》配置--》自动发现
4, 自动发现规则启用后,按下图显示的去验证
5,发现了agent2,但有一个问题,并没有把agent添加到监控的主机列表中,如下图所示
6,通过动作,将发现的主机添加到监控主机列表,并加上监控模板。
web管理界面--》配置--》动作--》右上角事件源选自动发现--》有一个叫Auto discovery. Linux servers的动作,直接启用就好
7, 再次验证就OK了(这里等待比较久,你也可以尝试把自动发现规则关闭一下,再次打开)
课外拓展: 自动注册
自动注册: 与自动发现实现的功能相同,区别在于自动发现是由zabbixserver去发现被监控机器。而自动注册是由被监控机器去找zabbixserver注册。
请问: 如果有大量的被监控机器,哪一种方式性能更好?
小结: 生产环境的自动化思路
-
cobbler自动安装系统和系统初始化
-
ansible实现配置自动化
-
自动发现加动作实现自动监控与模板链接
模板
模板(template): 就是包括监控项,应用集,触发器,图形,聚合图形,自动发现规则,web监测等的一组实体。
使用模板可以方便链接到主机,更改模板也会将更改应用到所有链接的主机。
参考: 7 模板
web管理界面--》配置--》模板--》创建模板
导入导出
辛辛苦苦配置了一个模板或一个主机,我想给另一台zabbix服务器使用或者我想保存下来,如何实现?
导入导出可以帮你轻松实现,导出的是xml格式文件.
目的:
-
备份防止误删除
-
将一台zabbix的模板配置迁移到另一台zabbix服务器
配置--》主机--》选取要导出的主机(前面打勾)--》下面选择导出
配置--》模版--》选取要导出的模版(前面打勾)--》下面选择导出
配置--》主机--》右上角导入
配置--》模板--》右上角导入
练习: 导入导出练习
-
把本机的一个模版删除
-
然后从同桌的zabbix服务器那导出成xml文件,并拷贝过来导入(里面有IP参数的要记得修改相应的IP)
报警
zabbix的报警媒介支持email,jabber,sms(短信),微信,电话语音等。
告警平台申请
自己配置报警比较复杂,而且邮件容易被拒或当做垃圾邮件。有些专业的报警平台就可以帮你简单实现。
如:onealeart 参考:睿象云-智能运维管理平台-智能运维系统-自动化运维性能监控平台
请先申请一个账号,绑定邮箱,手机,微信等。
登录进去后,按如下图示操作
告警平台增加zabbix应用
在zabbixserver安装告警平台agent
按照它的提示,进行安装 [root@zabbixserver ~]# cd /usr/lib/zabbix/alertscripts [root@zabbixserver alertscripts]# wget https://download.aiops.com/ca_agent/zabbix/ca_zabbix_relea se-2.1.0.tar.gz [root@zabbixserver alertscripts]# tar xf ca_zabbix_release-2.1.0.tar.gz [root@zabbixserver alertscripts]# cd cloudalert/bin/ [root@zabbixserver bin]# bash install.sh 2842d6d7-f7a1-fb97-254d-9be972403dd0 start to create config file... Zabbix管理地址: http://10.1.1.11/zabbix Zabbix管理员账号: admin Zabbix管理员密码: ......
验证安装
配置完onealert后,我们可以验证下它安装后到底对zabbix做了啥。简单来说,它做了三件事:
-
增加了一个报警媒介类型
-
增加了一个用户和一个用户组用于报警
-
增加了一个报警动作
配置通知策略
触发器触发告警
我们这里以前面都定义过的"agent1远程登录用户数"来测试报警,当agent1远程登录用户数大于20个就会触发器,然后报警。(==注意==:请在测试前先把agent1的登录用户数调整到20个以下)
验证: 将agent1远程登录用户数调整成大于20个,让触发器触发,也会触发报警。
zabbix proxy
参考网址: 1 代理
zabbix proxy的应用场景
应用场景1: 跨内外网监控
当zabbix server与被监控机器不在同一个机房时,跨公网监控会很麻烦, 也会带来安全隐患(比如有防火墙的情况,需要防火墙开放的端口增多。而且像mysql数据库这类应用是不适合直接被公网连接的)
应用场景2: 分布式监控
当监控机主机特别多,甚至分散在不同的地域机房。这个时候zabbix server压力很大,所以可以通过增加zabbix proxy来代理收集每个机房里的主机信息,再统一给zabbix server.
zabbix proxy的两个主要应用场景总结:
-
分布式监控,为zabbix server分担压力
-
zabbix server监控有防火墙的内网各服务器时,需要防火墙开放各个端口。使用zabbix proxy在内网统一监控,然后与zabbix server通过公网连接,此时防火墙只需要开放zabbix server与zabbix proxy的连接就可以了。
案例环境准备
我这里把原来的agent2用来模拟zabbixproxy
-
先在zabbix的web管理界面把agent2的配置删除(并把先前做的自动发现规则禁用,报警也禁用)
-
把agent2主机名改成zabbixproxy.cluster.com并且三台重新绑定/etc/hosts
# hostnamectl set-hostname --static zabbixproxy.cluster.com # vim /etc/hosts 10.1.1.11 zabbixserver.cluster.com 10.1.1.12 agent1.cluster.com 10.1.1.13 zabbixproxy.cluster.com
-
把zabbixproxy上的zabbix-agent服务先停一下
[root@zabbixproxy ~]# systemctl stop zabbix-agent
案例实现过程
-
在zabbixproxy上安装相关软件包
[root@zabbixproxy ~]# yum install mariadb-server zabbix-proxy-mysql zabbix-agent
2,启动数据库,授权并导入数据
[root@zabbixproxy ~]# systemctl restart mariadb [root@zabbixproxy ~]# systemctl enable mariadb [root@zabbixproxy ~]# mysql MariaDB [(none)]> create database zabbix_proxy default charset utf8; MariaDB [(none)]> grant all privileges on zabbix_proxy.* to 'zabbix'@'localhost' identified by '123'; MariaDB [(none)]> flush privileges; [root@zabbixproxy ~]# zcat /usr/share/doc/zabbix-proxy-mysql-3.4.15/schema.sql.gz |mysql zabbix_proxy -u zabbix -p123
3, 修改zabbix_proxy上的配置文件,并重启服务
[root@zabbixproxy ~]# vim /etc/zabbix/zabbix_proxy.conf 13 ProxyMode=0 主动模式 24 Server=10.1.1.11 zabbix_server的ip 43 Hostname=zabbixproxy.cluster.com 这个名字和你的主机名还有后面在web界面配置代理的名字保持一致 156 DBHost=localhost 167 DBName=zabbix_proxy 182 DBUser=zabbix 190 DBPassword=123 打开注释,并写上密码(与前面授权一致) 244 ConfigFrequency=60 主动模式下zabbix_proxy多久从zabbix_server接收一次配置数据 253 DataSenderFrequency=5 主动模式下zabbix_proxy多久发送一次收集的数据给zabbixserver [root@zabbixproxy ~]# systemctl restart zabbix-proxy [root@zabbixproxy ~]# systemctl enable zabbix-proxy
4, 如果zabbix_server也要监控zabbix_proxy的话,那么可以使用zabbix_proxy来代理自己(==可选步骤==)
[root@zabbixproxy ~]# vim /etc/zabbix/zabbix_agentd.conf 97 Server=10.1.1.13 138 ServerActive=10.1.1.13 自己代理自己,所以IP为zabbix_proxy的ip 149 Hostname=zabbixproxy.cluster.com [root@zabbixproxy ~]# systemctl restart zabbix-agent [root@zabbixproxy ~]# systemctl enable zabbix-agent
5, 修改agent1上的服务并重启服务
把服务器的ip改成zabbix_proxy的ip,而不是zabbix_server的ip [root@agent1 ~]# vim /etc/zabbix/zabbix_agentd.conf 97 Server=10.1.1.13 agent的被动模式 138 ServerActive=10.1.1.13 agent的主动模式 149 Hostname=agent1.cluster.com agent的主动模式必须要加主机名 [root@agent1 ~]# systemctl restart zabbix-agent
6, 回到zabbix server的web管理界面创建主机,添加代理服务器为一台主机
7, 增加代理, 代理自己和agent1
8, 验证测试
在agent1上找一个监控项做改变(比如登录用户数),然后在zabbix_server的图形界面能看到这个改变,说明proxy成功.
主动监控和被动监控(拓展)
agent被动模式
相对于agent的被动,也就是表示是server或proxy去找agent拿数据(这也是zabbix server的默认模式)
配置方法如下:
agent端配置被动模式的参数如下 [root@agent1 ~]# vim /etc/zabbix/zabbix_agentd.conf Server=10.1.1.13 IP为zabbix_proxy的ip(如果没有proxy,则直接为zabbix_server的ip) [root@agent1 ~]# systemctl restart zabbix-agent
agent主动模式
相对于agent的主动,也就是表示是agent主动把数据传给server或proxy
agent主动模式的优点是: 当agent太多的情况下,server或proxy去找这么多agent搜集数据,压力负载过大。用主动模式就可以缓解server或proxy的压力。
但用主动模式的问题是: 监控项也要转为主动式才行,而且很多zabbix自带模板里的监控项不支持转为主动式.
agent端配置主动模式的参数如下 [root@agent1 ~]# vim /etc/zabbix/zabbix_agentd.conf Serveractive=10.1.1.13 IP为zabbix_proxy的ip(如果没有proxy,则直接为zabbix_server的ip) [root@agent1 ~]# systemctl restart zabbix-agent
验证测试:
在agent1上把登录用户数再次调整,然后在zabbix_server的图形界面能看到这个改变,说明主动监控成功.
proxy主动模式
zabbix_proxy主动发数据给zabbix_server(proxy的默认模式)
# vim /etc/zabbix/zabbix_proxy.conf ProxyMode=0 --此参数为0表示proxy主动模式
proxy被动模式
zabbix_server找zabbix_proxy为收集数据
# vim /etc/zabbix/zabbix_proxy.conf ProxyMode=1 --此参数为1表示proxy主动模式
场景
场景: 公司大概十几台服务器(主要是lnmp环境),现在需要你来设计并使用zabbix监控它们,并且要考虑以后的扩展,尽量使用自动的方式实现.
传智要做一个宣传网站--》1台--> 架构(高可用,负载均衡)--》监控(安装监控软件并连接) --》按需求设置监控模板--》 因公司发展,业务增长,服务器增加,我们得基础扩展监控模板 -----》公司再发展,有多个机房,我们要实现分布式监控+自动注册+主动被动模式的优化
操作的大概步骤:
-
创建管理用户并配置报警策略
-
创建模版
-
在模版里加应用集与监控项
-
自定义配置每一个监控项(如要监测cpu,mem,io,disk use等等)
-
为相应的监控项创建图形,有些监控项可以多个合成一个图形,也有些监控项(如返回的字符串这种)无法创建图形
-
为相应的监控项设置触发器
-
完成基本模版的创建(可考虑创建更多模版,也可考虑将模版导出备份)
-
配置自动发现或自动注册规则
-
配置动作(指定监控符合哪些条件的主机,并为他们加入哪个组和链接哪些模版)
-
使用ansible这种配置自动化工具,把所有需要被监控的机器从zabbix-agent安装,配置,启动服务一体化完成
-
实现自动发现或自动注册,让所有被监控的机器自动被监控
-
增加分布式监控或调整主动被动模式进行优化