我们常常会感到这样的困惑,为什么这么多的无效主机记录,为什么这些主机很多信息空白,当许多人一起维护主机信息时,常常会出现信息错漏的情况。主机是运维最重要最基本的CMDB信息,而「合规性检查」为我们提供了更高效便捷的管理主机实例信息的方式。
本期EasyOps产品使用最佳实践,我们将为您揭晓:
-
如何对主机设置规格配置条件
-
优化通知格式的方式
「主 机 治 理 目 标」
「主 机 违 规 配 置」
以实际配置为例。由于数据违规规则是”且“条件,需同时满足才会触发违规,因此一般一条违规规则只配置一个违规条件。
1.运营信息
同一类对象的同一类信息的检查可以放一起。例如下面几个都是运营信息,作为识别主机的使用情况,不用再查找主机时发现很多信息空白,对于统计团队的主机使用情况、运营统计分析,监控告警、主机回收通知运维负责人,到期及时主机回收等都非常方便。
2.宿主机信息
这里只针对宿主机,因此和运营信息共用同一条规则,而是需要单独创建规则。
配置主机和机柜的关联关系,维护机房的拓扑架构。
3.虚拟机信息
虽然执行实例都一样,但是这3种违规都是针对不同情况下可能出现的违规,因此需要分开配置。
虚拟机我们需要维护和宿主机的关系,之前在HOST记录了虚拟机的信息,但是由于没有维护关联的宿主机,导致需要重启虚拟机时,无法立刻找到是在哪台宿主机上,因此该关系的检查也是必不可少。
注意:这里命名规则由于我们通常使用dev-host-0-2-test、ops-host-100-3-training作为主机名,因此可以如上图配置违规条件。
4.逾期检查
例如当某条主机的有效日期是昨天,那么今日大于昨天1,符合在9999天内的条件,则触发违规。通知管理员及时回收主机,避免主机的浪费,提高资源的回收率和可用性。
5.临期检查
例如当某条主机的有效日期是明天,那么今日小于明天1天,符合在7天内的条件,则触发违规。
6.主机Agent状态
对于主机Agent状态异常的主机,及时提醒通知。避免Agent状态异常导致工具、监控数据等异常。
违 规 通 知
执行周期在同一时间,将会把多条违规的规则合并成一条信息通知。
-
钉钉机器人通知效果
-
邮件通知效果
点击蓝色超链接即可打开规则详情页面,点击最新执行详情,可以查看具体的违规实例。
钉钉通知配置文件:/usr/local/easyops/resource_manage/static/template/datafilter/default/dingding_robot.content.template
邮件通知配置文件:/usr/local/easyops/resource_manage/static/template/datafilter/default/email.content.template
修改后重启resource_manage即可生效。