产品新说 | 指标的异常检测怎么做,能更好配合业务变化(二)

news2024/9/24 5:31:04

前言:

上期分享我们提到了指标异常检测实践要素中的三个方面:

以面对业务变动为前提,确定业务波动是周期性还是非周期性,进而选对算法;

通过确认业务的常规指标,确定异常方向进行监测(上基带 / 下基带 / both);

考虑不同时段的检测差异从而设定合理的运维日历并做出相应的算法模型匹配。

戳→擎创夏洛克AIOps:产品新说 | 指标异常?怎么做能更好配合业务变化(一)一键回看上期精彩

本期分享将继续通过一些场景小故事进行实践要素的后续分享

使用角色:张三( 企业应用运维人员 / 平台(云)运维人员 / 基础设施运维人员 )

实践重点:考虑不同时段的检测差异、优化模型参数、优化告警阈值、长期关注数据质量

产品:擎创夏洛克指标解析中心

一、考虑不同时段的检测差异 (工作日/非工作日的不同阈值需求)

依旧选择超级网银这一业务,该业务中有三大类型:跨行实时转账、跨行账户查询、跨行资金归集,这三类业务在对公和对私的交易时间安排上大有不同。

把跨行实时转账单拎出来,以交易量(对公)指标为监测目标,在工作日和非工作日的不同时段条件下,对于告警阈值规则的选择应该如何呢?张三通过指标解析中心以将其分为以下三类。

▲Part.1:敏感度高

正常工作日上班期间,对交易量(对公)指标检测设定的告警策略是在2个检测窗口内满足以下规则,则触发告警:

异常度大于90,则触发告警级别为严重;

异常度大于60,则触发告警级别为一般;

▲Part.2:敏感度低

周末双休及工作日下班时段,对交易量(对公)指标检测设定的告警策略是在3个检测窗口内满足以下规则,则触发告警:

异常度大于80,则触发告警级别为一般;

指标值小于100,则不监测;

▲Part.3:静默处理

在节假日期间,超级网银业务通常是停滞的,这期间设定告警监测为关闭状态。

根据业务类型在时间上的特点,设定不同的阈值及告警规则,能够节省算力的同时,更精确的监测指标是否存在异常。

二、优化告警阈值 (固定阈值 / 动态阈值 / 不监测)

指标在不同的阈值区间需要有不同的检测策略,通过算法检测智能设定阈值,应用不同规则模式,保障检测结果的准确性。

●以CPU的使用率为例

1.固定阈值

某一时段,CPU的使用率会随着业务的体量增长而水涨船高,由于负载过高会触碰警戒红线而引起告警,这个负载的极限值根据监控需求设置固定阈值即可。

2.动态阈值

这一天张三在白班值班,在不同时段业务交易的数量不同,因此CPU使用率的指标数值在中位区间来回波动,指标解析中心采用动态阈值的监测规则,在监测过程中发现有2次数值突破黄线大概率要触碰警戒红线的趋势,及时进行了告警,张三迅速查看并及时找到故障根源进行解决,使得业务运营没有出现损失。

3.不监测

与固定阈值相似的是,很多常规时段里(如工作日休息)业务是处于低交易状态的,因此指标数值一直在低位区间波动,这并不会造成任何负面影响,因此指标解析中心会对低区间的规则设定为不监测。

三、 长期关注数据质量 :(配置规则 / 查看告警)

指标异常检测需要由高质量的指标数据供给,来保证结果的高可用性,而保证数据供给质量的前提是对指标数据质量的监测能力。

张三为长期保证数据质量的可用性,通过指标解析中心配置了两条规则:

1.监控连续数据缺失:在检查周期内,连续x分钟/小时内无指标示例的数据则记录告警;

2.监控随机数据缺失:在检查周期内,按照比例检查各指标实例的确实情况,并记录。

做好规则配置以后,可以定期在告警中心里查看低质量的数据源及缺失数据的时长和比例,有据可循的进行针对性优化及改善。

四、优化算法模型 (简化算法调参)

算法的调优调参一直是令张三头疼的一件事儿,系统在使用动态阈值检测的时候,需要有一种自动优化模型的能力。指标解析中心在学习历史数据(建议训练学习周期为14-30天)的基础上,只要附加一些符合该类业务异常敏感度的设定,即能够自动简单的生成相对最优的算法模型,避免无效告警的出现。

本期关于指标解析中心的一些能力介绍到此告一段落,虽然是在说产品的一些功能,但其实这也是擎创在指标方向探索出来的一些能力建设思路,希望能为大家带来或多或少的帮助。未来,擎创将继续从业务视角出发,打造更具实战性、自动化的指标产品,助力业务运营更加平稳高效。


擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司致力于协助企业客户提升对运维数据的洞见能力,优化运维效率,充分体现科技运维对业务运营的影响力。

行业龙头客户的共同选择

更多运维思路与案例持续更新中,敬请期待

随手点关注,更新不迷路

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/376902.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【夏虫语冰】Win10局域网下两台电脑无法ping通: 无法访问目标主机

文章目录1、简介2、修改高级共享设置3、启用防火墙规则4、局域网内的其他主机访问NAT模式下的虚拟机4.1 虚拟机网络设置4.2 访问测试4.2.1 http测试4.2.2 curl测试4.2.3 telnet测试4.2.4 端口占用测试5、其他结语1、简介 ping 192.168.31.134ping主机ip时,访问无法…

华为OD机试模拟题 用 C++ 实现 - 学校运动会(2023.Q1)

最近更新的博客 【华为OD机试模拟题】用 C++ 实现 - 最多获得的短信条数(2023.Q1)) 文章目录 最近更新的博客使用说明学校运动会题目输入输出示例一输入输出示例一输入输出Code使用说明 参加华为od机试,一定要注意不要完全背诵代码,需要理解之后模仿写出,通过率才会高…

Python--深入浅出的装饰器--2

前言如果上一章没怎么看懂,那么本章就放弃吧。好了,本章一起看看装饰器的另一种用法,带参数的装饰器。废话总结一下,经过前一章的学习,其实不难看出,装饰器的模板其实就是在此基础上,我们可以肆…

推荐几个实用的在线教程(建议收藏)

hello,大家好,我是木荣君。作为一名技术人员,工作中熟练使用各种管理及设计工具是一项必备的技能。今天给大家分享一下我工作中经常查看和学习的几个在线教程地址。供大家参考学习,建议收藏,真的很实用! Gi…

IEEE Fellow李海洲:远渡重洋,万里求索,“机器智能对话”是毕生所求

一直来到实叻坡,乜事无。上山来做工,伯公“多隆”保平安。——潮州过番歌 所谓“过番”,指早期潮州人外出务工,乘坐小船历经七天七夜到达东南亚谋生,“实叻坡”是马来语“Selat”的音译词,便是指“新加坡”…

djvu批量转换为pdf的工具和djvu阅读器(附下载链接)

简介 DjVuToy是一款美观易用、功能强大的DjVu处理工具,DjVuToy官方版功能包括图像文件转DjVu,支持PDG、BMP、GIF等格式。转换的同时可以进行OCR,生成双层DjVu。可以插入、删除、移动、旋转多页DjVu中的页面。还可以将多个DjVu文件合并成一个&…

《数据库系统概论》学习笔记——第一章:绪论

教材为数据库系统概论第五版(王珊) 第一章基本就纯概念了,考试基本就考简答题啥的。概念还是比较多,平时没事就看看记一下,重点看一些有比较的部分,比如文件管理和数据库的区别,各种数据模型之间…

阶段十:总结专题(第七章:分布式篇)

阶段十&#xff1a;总结专题&#xff08;第七章&#xff1a;分布式篇&#xff09;Day-第七章&#xff1a;分布式篇1. CAP 定理**CAP 定理****不一致的产生**<font color #FF0000>**保证一致性**<font>**保 CP 失 A****保 AP 失 C****一致性级别**2. Paxos 算法**Pa…

c++之引用

目录 引用的概念 引用做函数参数 引用的本质 常引用 引用的概念 在c中新增加了引用的概念&#xff0c;引用可以看作一个已定义变量的别名。 引用的语法&#xff1a;Type &name var; int main() {int a 10;int &b a;printf("b%d\n", b);printf(&quo…

three.js学习:给obj模型设置发光并解决渲染变暗问题

需求描述&#xff1a; 使用obj模型和mtl材质绘制地图&#xff0c;为地图边界添加发光边界线。 实现思路&#xff1a; 借助three.js的OutlinePass管道和Raycaster光线投射实现发光线条 实现步骤&#xff1a; 1、引入相关js文件 EffectComposer&#xff1a;用于实现three.js…

单片机电路设计中的10个难点

单片机是嵌入式系统的核心元件&#xff0c;使用单片机的电路要复杂得多&#xff0c;但在更改和添加新功能时&#xff0c;带有单片机的电路更加容易实现&#xff0c;这也正是电器设备使用单片机的原因。那么在单片机电路的设计中需要注意的难点有哪些&#xff1f;一、单片机上拉…

【高性能计算】TVM使用TE手动优化矩阵乘法算法解析与代码解读

引言 注&#xff1a;本文主要介绍、解释TVM的矩阵优化思想、代码&#xff0c;需要配合代码注释一起阅读。 矩阵乘法是计算密集型运算。为了获得良好的 CPU 性能&#xff0c;有两个重要的优化措施&#xff1a; 提高内存访问的高速缓存命中率。复杂的数值计算和热点内存&#x…

「TCG 规范解读」TCG 主规范-设计原则

可信计算组织(Ttrusted Computing Group,TCG)是一个非盈利的工业标准组织,它的宗旨是加强在相异计算机平台上的计算环境的安全性。TCG于2003年春成立,并采纳了由可信计算平台联盟(the Trusted Computing Platform Alliance,TCPA)所开发的规范。现在的规范都不是最终稿,都…

【Python】元组如何创建?

嗨害大家好鸭&#xff01;我是小熊猫~ Python 元组 Python 的元组与列表类似&#xff0c; 不同之处在于元组的元素不能修改。 元组使用小括号&#xff0c;列表使用方括号。 元组创建很简单&#xff0c;只需要在括号中添加元素&#xff0c; 并使用逗号隔开即可。 如下实例…

【线性筛】ccpc黑龙江省赛 F

第一次vp省赛&#xff0c;只出了三题&#xff0c;很寄啊Problem - F - Codeforces题意&#xff1a;思路&#xff1a;题目一直在强调最小质因子&#xff0c;我们考虑边跑线性筛边求贡献一、对于第一种情况&#xff0c;即遇到的数是质数&#xff0c;贡献直接1就好了二、对于第二种…

mac在命令行里获取root权限

1、为什么要获取root权限&#xff1f; 答&#xff1a;一些命令在正常状态下没有权限会报错&#xff0c;只有获取了root权限才能正常操作。 比如我们想修改一些系统的文件&#xff1a; vim /etc/shells 1 修改后保存&#xff0c;发现没权限&#xff0c;报错了。如下图&#xf…

MaxWell原理概述

文章目录1.MaxWell概述2.Maxwell输出数据格式3.Maxwell原理3.1 MySQL二进制日志3.2 MySQL主从复制1.MaxWell概述 Maxwell 是由美国Zendesk公司开源&#xff0c;用Java编写的MySQL变更数据抓取软件。它会实时监控Mysql数据库的数据变更操作&#xff08;包括insert、update、dele…

传输层重点协议

1.TCP协议 TCP&#xff0c;即Transmission Control Protocol&#xff0c;传输控制协议。人如其名&#xff0c;要对数据的传输进行一个详细的控制。 TCP协议段格式 源/目的端口号&#xff1a;表示数据是从哪个进程来&#xff0c;到哪个进程去&#xff1b;32位序号/32位确认号…

第三章-OpenCV基础-6-滤波处理

前置内容 在尽量保留图片原有信息的情况下,过滤掉图像内部的噪声的过程成为对图像的平滑处理(又称滤波处理),所得到的图像成为平滑图像(把图像中的噪点过滤掉,生成一个相对平滑的图像)。 举个栗子: 一个图像有个噪点,加载发现有个点的像素值和周边像素值差异太大格格不入,使用…

[C++]多态

&#x1f941;作者&#xff1a; 华丞臧 &#x1f4d5;​​​​专栏&#xff1a;【C】 各位读者老爷如果觉得博主写的不错&#xff0c;请诸位多多支持(点赞收藏关注)。如果有错误的地方&#xff0c;欢迎在评论区指出。 推荐一款刷题网站 &#x1f449;LeetCode 文章目录一、多态…