问题一
Q:乐维MCM免费版还需要再单独安装一个Zabbix连接么?
A:估计是perseusZ_server服务进程因为重复安装导致服务挂了。试下能不能启动起来?service perseusZ_server status
Q:正常启动的,页面刷新了还是显示连接不上server
A:没启动成功。看下日志。tail /itops/perseusZ/logs/perseusZ_server.log
Q:
A:sudo -uitops psql -d lwops -c 'DROP INDEX hosts_7。然后再重启一次。service perseusZ_server restart。因为重新执行LWweb安装的时候,会重新导入数据库,一些表字段会重复导入。所以一般不建议反复执行 LWweb 的LW_web_install.sh
Q:可以了,但是好像跳过了CMDB的步骤,直接初始化安装了,页面和原来的监控页面也一样
A:是用的MCM的包么,MCM的部署包和ITIM的部署包是分开两个的
Q:是用的MCM的,应该和重复安装有关系吧
A:要勾选这个
题二
Q:乐维的平台连接dell iDRACS9,用iDRAC8的snmp通用模板,snmpv2连接不上,是什么原因?
A:手动命令测试能否获取数据呢?snmpwalk -v 2c -c 团体字 dell服务IP system
Q:端口号不是默认的161,提示没有响应
A:snmpwalk -v 2c -c 团体字 dell服务IP:非默认端口 system
Q:加了端口的,连其它服务器是正常的,idrac这里打开就可以了吧,还有其它地方要设置吗?
A:一般配置snmp团体字后snmp请求数据超时会是这两种问题导致:
1.网络策略限制,但是这里说的其他服务器能正常,那就基本排除,除非端口不一致
2.可能是高版本idrac只支持snmpv3,可以配置snmpv3测试
3.有可能配置保存需要重启BMC管理口(如果电源选项没有单独重启BMC,那就是不支持这种操作),设备在维保的话咨询下厂商看下
问题三
Q:zabbix 的mysql 备份的时候,为什么server 就中断停止了呢,网页界面一直转圈圈?
A:如果用的mysqldump 等命令执行导出操作,是会导致库锁定的,页面读库查询的时候就无法读取。
问题四
Q:想问下这个问题的数据记录在哪个表啊?zabbix的问题数据记录在哪个表啊?5.0版本
A:trigger表。直接删problem记录的操作不提倡呀,有可能触发些奇奇怪怪的BUG
问题五
Q:我已经在web页面禁用不需要的主机了,为什么在zabbix server还能收到大量的
9853:20240703:151834.073 cannot send list of active checks to “192.168.72.5”: host [h23-12-47] not monitored的日志,如何解决。
A:正常提示消息来的,因为agent会像server发主机数据的报文,然后server检测到发数据的主机已经被禁用就会提示这个。如果不希望收到这种消息,只能是登录agent端停用agent服务进程
Q:意思要登录到agent端 手动gent服务是么
A:嗯,如果想要server停止产生这种日志的办法只能是关停对应主机的agent。其实可以忽视这种日志的,因为它也不是error或者warn级别的问题。
问题六
Q:zabbix server会话有大量的状态是TIME_WAT,有11952个,如何解决。
A:time_wait状态的连接都是用哪些端口呢
Q:10050 和10051
A:如果监控对象多的情况下,一个对象会保持或者建立关闭有1~3的网络连接,这种情况下有大量time-wait的网络连接的属于正常现象,可以针对time-wait的连接统计做一下指标监控,看下是持平的还是持续增加的,如果是只增不消的则需要额外排查
问题七
Q:最近一小时cpu使用率的区间在80-90%之间,突然降到了50%,这算不算异常?要不要告警?
A:min(10m)>80肯定要告警啊。一般CPU达到70%以上就要告警了。不是很重要的业务设备CPU达到80%-85%就要告警了。
问题八
Q:内存使用率和cpu使用率超过80% 并且持续时间超过5分钟或着10分钟 触发表达式怎么写?
A:min(10m)>80。类似这样:
更多zabbix技术问题,可以持续关注乐维社区