问题一
Q:麻烦请教一下zabbix服务器总是上报这几个告警,需要处理嘛?怎么处理?
A:同步历史数据进程负载过高的话会影响到server的性能,建议增加服务器硬件配置。
Q:是需要增加哪方面的配置,内存嘛还是CPU也要增加,还有以我现在的监控量大概需要什么配置?
A:这个得结合监控项的采集间隔、历史数据保留时间等因素。
问题二
Q:怎么改这个实现触发告警无延迟?
A:采集间隔越低告警触发延迟越低,更改如下。
Q:目前更新间隔是30S不长啊。
A:那监控项达到触发器阈值最快会在30秒触发
Q:不是啊,测试是3分钟啊,是要测试的主机 IP 地址,5 是 ping 测试的超时时间,2000 是 ping 测试的间隔时间,68 是 ping 测试的数据包大小,1000 是 ping 测试的重试次数。另外,好像达到告警阈值就是3分钟,而且不能手功改,一改就报错。
A:触发器表达式吗?
Q:是的。
A:跳转到模板那边能改。
Q:这模板没有啊。
A:找到icmp对应的触发器。
Q:触发器就是我发的,找不到啊。
A:那这个触发器引用的哪个监控项?
Q:没有引用啊,貌似是监控项里边自己手工加的。
A:那这个触发器哪来的。
Q:我也不知道。
A:先看看有没有icmp的监控项,再创建触发器引用这个监控项。
问题三
Q:各位大佬,这个里面的叫【最后一个】的这一项是啥意思呀?不同版本的zabbix的触发器表达式是不是不一样呀?我网上查到的格式和这不一样。
A:需求是啥?在多长时间内cpu空闲时就告警?
Q:需求是cpu使用率超过85%告警
A:min(/Linux by Zabbix agent/system.cpu.util,5m)>85,获取过去5分钟内 Linux 主机的 CPU 利用率的最小值,如果这个最小值大于85%,则触发告警。
Q:好的,我试试。
问题四
Q:alert->media type 配置了一个webhook类型的媒体,媒体中的java script脚本实现向企业微信推送消息,推送的内容是item采集到的值,如何将Item的值在media type中引用?也就是如何把item的值通过script推送出去?
A:webhook用于推送告警信息,获取监控项的值的话建议用api。
Q:不是,我的Item值不是告警信息,是文本;还有一个情况,我配置的Hosts下午还在看,怎么突然数据都丢失了?能恢复吗?
A:webhook就是用来推送告警的,最新数据那里应该有历史数据。
Q:然后呢,怎么恢复?
A:是主机丢失了还是监控项的值丢失了
Q:hosts都没了
A:那恢复不了。
问题五
Q:大神们,这个alert message命令行参数数据格式是啥啊?可以在哪里查到这个参数具体数据?
A:如下:
更多zabbix技术资料,请持续关注乐维社区