AIOps在线评测基准首阶段建设完成,面向社区发布真实运维数据!

news2024/11/13 15:21:49

本文根据必示科技算法研究员、产品总监聂晓辉博士在2024 CCF国际AIOps挑战赛线下宣讲会上的演讲整理成文。


2024年1月份OpenAIOps社区成立,随着越来越多的社区成员加入,各项工作在有条不紊的推进中。在线评测基准系统(AIOps Live Benchmark)是今年社区工作中的重点之一。

历届AIOps挑战赛都是一次评测。比如2018年的赛题是指标异常检测、 2022年的赛题是微服务架构下电商系统的故障识别与分类。大赛组委会根据赛题搭建真实的运维评测系统去产生真实的数据,然后把真实的故障注入到该系统中,最后由参赛选手提供各种思路的解决方案参赛评选。

但是,赛事结束之后评测系统也会随之关闭,如果选手们后续有了更好的改进方案也无法继续评测。OpenAIOps社区着手推进在线评测基准工作,目标之一也是希望把每届挑战赛的成果都沉淀下来。

在线评测基准简介

在这里插入图片描述

在线评测基准系统包含了几个重要模块。首先是运维的IT系统,这部分系统是可以扩展的;还部署了混沌工程相关的工具,模拟出真实的运维场景;同时部署了一些可观测性的工具来获取运维数据,像开源的Promethues、Jeager等。数据收集好后通过具体的AIOps应用或者评测方法,提供一个实时在线评审榜单。在线评测基准系统的最终目标是提供真实系统、真实数据、真实评测,让大家共同探讨研究AIOps技术。

在线评测基准系统(AIOps Live Benchmark)建设架构

在这里插入图片描述

上图是在线评测基准系统的整体架构,分为基础设施、 IT系统、平台工具和AIOps应用。整个架构相当于一个小型企业的 IT运维平台,麻雀虽小五脏俱全。图片中绿色部分是邀请社区专家和企业界的同仁一起已完成系统模块。目前实现了注入故障模拟、采集各种各样的运维数据功能,并且部署了业界开源和专业可观测性工具,最后把数据统一汇总,对上提供服务,也成功部署了像异常检测、告警分析等应用工具。

1、微服务系统——Online Boutique

在这里插入图片描述

Online Boutique是谷歌的一个开源的电商系统,能够模拟一些常见的IT系统使用环境。它还是微服务的架构,支持多种语言的开发,对于可观测性工具,包括运维场景,具备一些典型的代表性。

同时系统是开源的,可以根据不同的运维场景对系统进行改造升级,目前实现了支持信创数据库TiDB、支持OpenTelemetry数据采集、模拟变更场景等功能。欢迎大家把自己的开源服务部署到社区中来,构建典型的运维场景。

2、混沌工程工具

在这里插入图片描述

架构中部署了混沌工程的开源工具并做了集成,其中典型的是ChaosMesh。图片中右边部分是一个具体的例子,在容器中注入一个CPU使用率负载高的故障,然后观察在上面部署的这些应用能否检测到对应异常。

3、可观测性工具

在这里插入图片描述

目前已经部署Jaeger、Promethues等开源的工具。Jeager是开源的分布式跟踪系统,用于采集电商系统的trace数据;Promethues是开源的监控数据采集和告警工具,用于采集电商系统的指标数据。

在这里插入图片描述

同时我们也邀请了云杉网络、乐维、基调听云、蓝鲸等企业,针对上文提到的微服务系统Online Boutique做了全面的数据采集。

4、开源数据集

在这里插入图片描述

完成数据采集后,平台构建了一个数据的指标体系,按照规则把数据清洗分类,并定时在系统上发布。大家可以在OpenAIOps社区网站(https://www.aiops.cn)上获取这些数据,希望提供的这些真实数据可以推动AIOps的技术研究和工业落地。

5、AIOps应用

在这里插入图片描述

系统上也部署了AIOps的应用,图片中展示的是必示科技提供的两款标准化的产品。

(1) 智能业务指标异常检测。通过具体指标数据,不需要人工设置就能够识别出阈值,图中展示的是真实的效果。这款应用好处是无需人工配置阈值,同时自动学习哪些指标能够做监控,扩大监控范围,减少人工运维成本。

(2) 智能告警管理,提供基础的告警管理功能,在告警智能化分析上,主要解决告警风暴检测和分析问题,当告警量突增,系统自动检测并生成分析报告,辅助运维人员快速处置异常。

网站正式发布对外开放,欢迎大家学习交流。

网址:https://www.aiops.cn/aiops-live-benchmark/

在线评测基准系统(AIOps Live Benchmark)建设情况

在这里插入图片描述

在线评测基准系统(AIOps Live Benchmark)工作自3月份开始推进,我们快速搭建了整套的系统和具体的可观测性工具。5月份,第一批数据清洗出来并成功发布,同时开始准备指标异常检测的评测基准工作。

来自社区的专家成员积极参与,贡献力量。目前基准专家组已经有59个成员,来自高校研究所、科技公司、银行、证券等各行各业。工程师团队超过40+,来自中科院、南开大学、必示科技、云杉网络、乐维、听云、蓝鲸等单位。

未来展望

在这里插入图片描述

目前在线评测系统可以提供真实的IT应用场景,可以学习前沿的AIOps技术,发布对应的权威数据集,推动行业发展。

在线评测系统搭建完之后,我们未来重点工作为应用评测,例如业务指标的异常检测、机器指标的异常检测、调研链的异常检测和定位等。在做评测应用的同时,进一步的完善系统的可观测性和混沌工程能力。


关于CCF 国际AIOps挑战赛

CCF国际AIOps挑战赛(China Computer Federation International AIOps Challenge)由清华大学联合中国计算机学会(CCF)自2018年共同发起。旨在借助社区力量,运用人工智能算法解决各类运维难题。迄今为止已经成功举办六届,吸引了大量AIOps从业者和关注者,随着赛事规模和影响力的不断扩大,形成了运维行业著名的专业赛事品牌,并逐渐发展为智能运维领域最具影响力的专业赛事。

2024 (第七届)CCF国际AIOps挑战赛由中国计算机学会(CCF)主办,中国计算机学会互联网专委会、清华大学、中国科学院计算机网络信息中心承办,中兴通讯、北京智谱华章科技有限公司、中南大学计算机学院、清华大学计算机科学与技术系、北京必示科技有限公司协办。同时,本届AIOps挑战赛也是OpenAIOps社区成立之后第一届重要年度赛事。

更多赛事相关信息将在社区“智能运维前沿”公众号发布,同时OpenAIOps社区群将提供赛事通知、技术答疑,有意者可扫码添加官方微信号(OpenAIOps社区小助手)入群。

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1715114.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【刷题(13)】二分查找

一、二分查找基础 &#xff08;1&#xff09;int mid ((right - left) >> 1) left; &#xff08;2&#xff09;lower_bound的底层实现 int lower_bound(vector<int>& nums, int x) {int left 0;int right nums.size() - 1;// 区间为 左闭右闭while (lef…

JAVA 17

文章目录 概述一 语法层面变化1_JEP 409&#xff1a;密封类2_JEP 406&#xff1a;switch模式匹配&#xff08;预览&#xff09; 二 API层面变化1_JEP 414&#xff1a;Vector API&#xff08;第二个孵化器&#xff09;2_JEP 415&#xff1a;特定于上下文的反序列化过滤器 三 其他…

【Linux进程篇】Linux进程管理——进程创建与终止

W...Y的主页 &#x1f60a; 代码仓库分享&#x1f495; 目录 进程创建 fork函数初识 写时拷贝 fork常规用法 fork调用失败的原因 进程终止 进程退出场景 _exit函数 exit函数 return退出 进程创建 fork函数初识 在linux中fork函数时非常重要的函数&#xff0c;它从已…

Javascript 基础知识 —— 重写数组方法

1、写一个函数&#xff0c;实现深度克隆对象 const obj {name: "LIYUFAN",age: 25,career: "初级前端工程师",info: {field: ["JS", "CSS", "HTML"],framework: ["React", "Vue", "Angular"…

jmeter多用户并发登录教程

有时候为了模拟更真实的场景&#xff0c;在项目中需要多用户登录操作&#xff0c;大致参考如下 jmx脚本&#xff1a;百度网盘链接 提取码&#xff1a;0000 一&#xff1a; 单用户登录 先使用1个用户登录&#xff08;先把1个请求调试通过&#xff09; 发送一个登录请求&…

DSM驾驶行为分析系统在渣土车管理中的应用

随着科技的不断进步&#xff0c;智能交通系统正逐渐成为现代交通管理的重要工具。其中&#xff0c;DSM驾驶行为分析系统以其独特的功能和优势&#xff0c;在提升驾驶安全性、优化驾驶员管理等方面发挥着重要作用。索迪迈科技将DSM驾驶行为分析系统成功应用于渣土车管理中&#…

深兰科技获评2024年度人工智能出海先锋奖

5月25日&#xff0c;以“亚洲新势力&#xff1a;创新、融合与可持续发展”为主题的亚洲品牌经济峰会2024深圳会议在深圳益田威斯汀酒店举办。本次活动由中国亚洲经济发展协会指导&#xff0c;亚洲国际品牌研究院主办&#xff0c;旨在搭建品牌创新与经济发展交流平台&#xff0c…

服务器感染了. rmallox勒索病毒,如何确保数据文件完整恢复?

导言&#xff1a; 近年来&#xff0c;随着信息技术的飞速发展&#xff0c;网络安全问题日益凸显。其中&#xff0c;勒索病毒作为一种严重的网络威胁&#xff0c;对个人和企业数据造成了巨大的威胁。本文将重点介绍.rmallox勒索病毒的特点、传播途径以及应对策略&#xff0c;旨…

基于 FastAI 文本迁移学习的情感分类(93%+Accuracy)

前言 系列专栏:【深度学习&#xff1a;算法项目实战】✨︎ 涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域&#xff0c;讨论了各种复杂的深度神经网络思想&#xff0c;如卷积神经网络、循环神经网络、生成对…

J.搬砖【蓝桥杯】/01背包+贪心

搬砖 01背包贪心 思路&#xff1a;要让重量更小的在更前面&#xff0c;价值更大的在更后面&#xff0c;vi−wj>vj−wi viwi>vjwj 第 i 个箱子放在第 j 个箱子下面就显然更优。所以进行排序再用01背包即可。 #include<iostream> #include<algorithm> #defi…

vs工程添加自定义宏

一、简介 用户可以添加自定义宏变量方便工程路径名称的修改和配置 例&#xff1a;$(SolutionDir) 为解决方案路径&#xff0c;$(PojectDir) 为工程所在路径 测试环境&#xff1a;vs2017&#xff0c;qt5.14.0 二、配置 1、打开属性窗口&#xff1a;视图-》其他窗口-》属性管…

Android笔记--应用安装

这一节了解一下普通应用安装app的方式&#xff0c;主要是唤起系统来安装&#xff0c;直接上代码: 申请权限 <uses-permission android:name"android.permission.READ_EXTERNAL_STORAGE"/><uses-permission android:name"android.permission.WRITE_EXT…

HaloDB 的 Oracle 兼容模式

↑ 关注“少安事务所”公众号&#xff0c;欢迎⭐收藏&#xff0c;不错过精彩内容~ 前倾回顾 前面介绍了“光环”数据库的基本情况和安装办法。 哈喽&#xff0c;国产数据库&#xff01;Halo DB! 三步走&#xff0c;Halo DB 安装指引 ★ HaloDB是基于原生PG打造的新一代高性能安…

Python Selenium 详解:实现高效的UI自动化测试

落日余辉&#xff0c;深情不及久伴。大家好&#xff0c;在当今软件开发的世界中&#xff0c;自动化测试已经成为保障软件质量和快速迭代的重要环节。而在自动化测试的领域中&#xff0c;UI自动化测试是不可或缺的一部分&#xff0c;它可以帮助测试团队快速验证用户界面的正确性…

爬虫案例(读书网)

一.我们还是使用简单的bs4库和lxml&#xff0c;使用xpath&#xff1a; 导入下面的库&#xff1a; import requests from bs4 import BeautifulSoup from lxml import etree 我们可以看见它的div和每个书的div框架&#xff0c;这样会观察会快速提高我们的简单爬取能力。 二.实…

Nginx网页服务

nginx的配置: 1、全局块&#xff1a;全局配置&#xff0c;对全局生效&#xff1b; 2、events块&#xff1a;配置影响 Nginx 服务器与用户的网络连接&#xff1b; 3、http块&#xff1a;配置代理&#xff0c;缓存&#xff0c;日志定义等绝大多数功能和第三方模块的配置&#xf…

C语言---文件操作

【C语言详解】——文件操作&#xff08;建议收藏&#xff09;_c语言 写文件原理-CSDN博客 一、文件的读取 # define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<errno.h> #include<string.h>int main() {FILE * pffopen("C:\\Users\\zhw\\De…

Java中的ORM框架——myBatis

一、什么是ORM ORM 的全称是 Object Relational Mapping。Object代表应用程序中的对象&#xff0c;Relational表示的是关系型数据库&#xff0c;Mapping即是映射。结合起来就是在程序中的对象和关系型数据库之间建立映射关系&#xff0c;这样就可以用面向对象的方式&#xff0c…

Vue3使用Composition API实现响应式

title: Vue3使用Composition API实现响应式 date: 2024/5/29 下午8:10:24 updated: 2024/5/29 下午8:10:24 categories: 前端开发 tags: Vue3CompositionRefsReactiveWatchLifecycleDebugging 1. 介绍 Composition API是Vue.js 3中新增的一组API&#xff0c;用于在组件中组…

服装服饰商城小程序的作用是什么

要说服装商家&#xff0c;那数量是非常多&#xff0c;厂家/经销门店/小摊/无货源等&#xff0c;线上线下同行竞争激烈&#xff0c;虽然用户群体广涵盖每个人&#xff0c;但每个商家肯定都希望更多客户被自己转化&#xff0c;渠道运营方案营销环境等不可少。 以年轻人为主的消费…