grafana alert告警面板配置说明
- 前提:只有graph panel 也就是图表面板(一般都是折线图和柱状图或者点状图)可以添加Alert ,其他面板不支持。
-
Rule Name :Alert规则 的名称
-
每多少时间评估一次
-
如果配置了这个参数,那么当查询结果超过阀值的时候,首先会从ok状态转到pending状态,此时是不会发邮件的,而当 超过阀值的状态的持续时间 过了配置的持续时间时,才会从pending 状态 转成 Alerting状态,并发送通知邮件。
在上图中我设置的是Evaluate every 1m for 5m, 也就是说每分钟计算一次是否超过阀值,如果超过阀值的时间持续了5分钟,就发送邮件通知,如果没有的话,只是从ok 状态转为 pedding状态.
发送了通知之后还是会每分钟检查一次,状态恢复正常之前是不会再发邮件的。
而且我们配置的prometheus还有个拿数据的时间间隔,这个也会影响数据的计算。 -
是查询的类型,可选项有很多,最大值、最小值、平均值等等
-
这里有三个参数 , 第一个是查询的编号,这个是在Queries里面设置的,稍后再讲,每个查询在每个时间点的结果值就构成了我们看到的图。 第二个是多少时间内, 第三个是开始时间
-
阀值
-
OR 或的意思,其他条件满足也会触发,也有AND条件,为且,需要多条件满足
上图的配置简单来说就是 :
A查询从当前时间开始的1分钟内的结果值的平均值如果高于阀值3,将会从ok状态 转变为 pending状态,但不会发邮件,然后每分钟查询一次,如果高于阀值的持续时间超过五分钟,就会发邮件通知。
或者B查询从当前时间开始的1分钟内的结果值的平均值如果高于阀值2,将会从ok状态 转变为 pending状态,但不会发邮件,然后每分钟查询一次,如果高于阀值的持续时间超过五分钟,就会发邮件通知。