线上观看 3 万+!「智能运维MeetUp」精彩回顾,探讨智能体构建新方向

news2024/12/25 10:09:37

龙蜥社区“走进系列”第 11 期走进中兴通讯-智能可观测运维技术 MeetUp 于成都圆满结束,由中兴通讯联合龙蜥社区系统运维联盟(SOMA)(以下简称“联盟”)共同举办。本次活动现场汇聚了阿里云、谐云科技、乘云数字、中兴通讯、云杉网络、浪潮信息等企业和社区资深技术专家们,围绕大模型、可观测性、智能机器人、SysOM 等热门话题,和我们分享系统运维硬核技术、优化实践等干货,本次活动线上观看人次 3 万+。

图片

(图/活动现场合照)

会议伊始,龙蜥社区系统运维联盟主席冯富秋介绍了本次 MeetUp 的全程安排。他表示龙蜥社区系统运维联盟作为运维技术创新的前沿阵地,承载着双重使命:第一通过强化联盟与各成员单位间的协同合作,打造出运维能力跃升新引擎;第二,致力于制定并推广运维产业标准,为用户提供一盏明灯,让他们清晰洞悉市场运维水准的现状与未来趋势。同时,他也详细介绍了联盟当前的工作进展,强调通过联盟,牵引国内系统运维健康、有序、领先的发展。

图片

(图/冯富秋)

接着,龙蜥社区系统运维联盟副主席、中兴通讯操作系统产品部副部长蒋学鑫表示,作为本次大会的承办单位,中兴通讯持续为联盟的运作提供了资金、服务和技术的支持,在操作系统运维领域积极参与共建,为联盟成员做好服务,助力联盟健康发展。同时,中兴通讯也是龙蜥社区副理事长单位,秉承开发合作,共创共赢的理念积极参与社区建设,力争打造国内社区生态底座,促进社区繁荣发展。

图片

(图/蒋学鑫)

致辞结束后,进入技术分享阶段,9 位技术大咖分享了大模型、智能机器人、可观测性等运维领域的前沿技术。

谐云科技技术总监蒋玉芳就谐云科技在容器化架构下,如何利用可观测技术实现应用性能和资源优化的一些探索进行了分享。她详细阐述了容器环境下应用性能影响的第一性原理,并分析了 CPU、IO、内存在容器环境中对应用性能的影响。蒋玉芳分享了相关的性能优化具体案例和常用的应用性能优化手段,并提到通过 eBPF 技术实现共享指标采集,为应用性能优化以及资源优化提供基础支持。资源优化方面,她介绍了谐云在应用混部方面的实践,讲述了如何利用算法构建应用性能画像,并通过自定义扩展调度、智能 HPA 以及 VPA 等资源优化方案,提升资源利用效率。

图片

(图/蒋玉芳)

企业面对多样化的监控需求,往往采用购买不同专业产品的“数码时代”模式,但这种模式在云原生、微服务、容器化等新技术环境下显得力不从心。杭州乘云数字技术有限公司运营副总裁张怀鹏会上分享了《如何打造开放领先的可观测性数据底座》演讲。乘云数字提出了构建可观测性数据底座的理念,以实现数据融合和自由开发应用。通过统一数据模型和统一组织构建的思路进行设计指导,全面拥抱 OpenTelemetry,确保了与业界生态的紧密接轨。通过 OneGate 高度自动化治理引擎实现多源异构的数据治理。基于自主研发的 MoreDB 和 TracingX ,在时序数据和链路数据的存储处理上降本增效。基于这套开放领先的可观测底座,提升监控数据质量,不断的开拓应用场景,包括但不限于 NGAIOps、IoT、故障预警、云网空间地图等等高级分析能力。可观测底座是打破传统监控孤岛,实现由 IT 进阶到 DT 数据驱动场景分析的必备基建。

图片

(图/张怀鹏)

中兴通讯系统工程师黄军华分享了《组装式 OS 可靠性增强组件实践》。他表示,越来越多的场景对可靠性有更高的要求,如基站、卫星、工业网关、智能汽车等,而当前 Linux 聚焦资源管理机制的实现,不重点关注资源使用策略导致的异常,其主要提供了硬件的可靠性处理,整体上没有体系化的管理手段。同时对于操作系统而言,可组装的定制功能将能在不同的场景下最大化功能价值。面对可靠性增强的需求和挑战,中兴通讯进行了组装式 OS 可靠性增强组件实践,充分覆盖系统各类亚健康事件,并进行对应策略处理,尽可能保障系统的可靠运行,同时提供必要的维测信息,方便后续故障定位。设计上采用可组装思路,利用 ftrace、kprobes 及 eBPF 技术进行功能解耦,可以很好地满足多场景下 OS 可靠性增强需求。

图片

(图/黄军华)

用 AI 实现 Ops 解决运维困境,一直是 IT 界的梦想。DeepFlow 解决方案负责人李飞分享了《零侵扰数据能力,构建可观测性智能体的基石》。他表示,自从以 GPT 为代表的大模型出现之后,用 AI 实现 Ops 解决运维困境的梦想看起来实现近在咫尺,但 AIOps 发展的核心瓶颈是数据。现阶段的运维体系存在大量的数据盲区、数据孤岛、数据关联等问题,运维诊断更多的是依靠经验、猜测、直觉和灵感,而不是依靠数据。数据的问题导致运维诊断工作难以模型化,AIOps 技术发展缓慢。云杉网络开发的 DeepFlow 可观测性平台,聚焦于解决运维数据中的盲区、孤岛等核心问题,通过 eBPF 技术带来的零侵扰、全栈采集能力消除数据盲区,通过 AutoTagging 技术带来的高性能数据统一标注能力消除数据孤岛,以高质量的可观测性数据体系构建基于数据的运维能力,消灭运维中的猜测、直觉和灵感,打造 AIOps 落地应用的稳定基石。DeepFlow 可观测性数据结合大模型 AI 能力,在广泛拓扑分析、海量指标分析、复杂函数性能剖析等运维诊断中已经取得令人惊艳的效果表现。当前, DeepFlow 可观测性平台正在探索全生命周期的 AI 运维技术,探索通过  eBPF 技术将“可观测性+ AI”延伸到包括智能驾驶、智能工厂等更广泛的领域。

图片

(图/李飞)

SysOM 作为社区与阿里云联合推出的开源运维平台产品,针对传统监控场景中用户的痛点以及运维的“碎片化”带来的问题,发布系统健康分和 Livetrace 热点进程分析功能。阿里云产品专家周絮、阿里云高级技术专家毛文安共同分享了《SysOM 健康度和 Livetrace 的评测方法探索》。周絮表示,相比于传统监控指标,健康分旨在分别通过饱和度、延迟、负载和错误形成统一的评分标准来指导用户分层来展示系统健康程度并定位系统健康问题。Livetrace 作为一种先进的操作系统级性能分析方法,能够通过不断地监测操作系统、容器运行环境以及应用程序等多个层次的性能指标,深入揭示整体性能瓶颈。借助 Livetrace,软件的性能管理更加稳健,性能表现的可预测性得到显著提升。毛文安介绍了系统运维联盟的主要工作为建立运维相关的标准以及对业务和运维平台的评测系统。如系统健康度评分标准、网络观测标准、持续剖析 Continues Profiling 标准、北极星指标定界标准;并通过详细分析健康度涉及的资源、性能、错误等聚合指标的四类评测方法。

图片

(图/从左至右:周絮、毛文安)

浪潮电子信息产业股份有限公司产品架构师张鑫分享了《某国有银行大规模带外监控管理技术实践分享》张鑫指出,随着数据中心设备量的不断增大,传统基于带外通道的监控方式面临诸多挑战。为此,他介绍了一种创新的系统架构,即多采集器、多分析器及微服务分布式架构。该架构以资源为作业单位,根据不同类型的作业实施差异化的数据采集与监控周期,从而显著提升了采集效率,降低了系统负载,并有效减少了数据延时。这一创新方案为数据中心的运维管理提供了更加全面、细致的数据支持,充分展现了浪潮电子信息产业股份有限公司在大规模带外监控技术领域的创新实力与丰富经验,也为行业提供了新的发展思路和实践路径。

图片

(图/张鑫)

中兴通讯系统工程师况明富分享了《调测容器实践》。在生产环境中的同一节点上, 通常都承载运行着大量的业务容器,但由于业务镜像大小以及资源限制,业务容器内通常不会预先部署调测工具及环境。这导致一旦容器内部出现问题时,业务容器就缺乏有效的调试工具。另一方面,生产节点的宿主机系统上也往往欠缺必要的调试工具及环境,调试工具的部署和使用受到限制。 为保障问题出现后,快速的部署所需的调试工具及环境,提高调试工具的部署效率,况明富提出了将调测工具打包到一个容器内,以容器的方式完成调试环境的"一键式"部署。 调试容器部署后,即可在调测容器内对业务容器或主机系统上的目标的调测,所有的调测活动都可以在此调测容器中进行,使用完后清理此调测容器即可,这样也可避免对主机环境产生污染。这种基于容器的调试方式和策略不仅提高了问题诊断的速度和效率,同时也减少了对生产环境的影响,体现了中兴通讯在容器技术和运维实践方面的先进理念和技术实力。

图片

(图/况明富)

阿里云技术专家陈诗雁分享了《基于 LLM Agent 的智能诊断机器人》。智能运维是运维技术发展的必然趋势,智能运维机器人可以把问题、告警处理流程、知识库、诊断工具等融合在一起,给运维人员更好的运维体验,高效协助运维人员诊断和解决问题。陈诗雁介绍了系统运维的现状和难点、智能对话机器人的发展、大模型在系统运维的应用、基于大模型智能体的诊断机器人设计,并演示了 SysOM 智能诊断机器人。智能机器人和运维平台是相辅相成的关系,运维平台的诊断能力成就了智能机器人解决实际问题的能力,智能机器人帮助运维平台更好地发挥和展示运维能力。

图片

(图/陈诗雁)

除了硬核技术和实践案例分享外,现场还准备了精美茶歇和伴手礼:

图片

最后,感谢本次活动各位嘉宾的精彩演讲,也感谢中兴通讯及龙蜥社区伙伴成员:徐立锋、杨光、胡捷、李康雅、毛文安、金美琴、蔡佳丽、刘寅、孙林林、林莉、池福睿、陈昊楠、陈晓源、冯艳、刘洪村、李鹏、李兴、刘家瑜、宋梦芝、解潞丹、周峻苇、王天助、袁艳桃(以上排名不分先后)等人的组织与配合,也特别感谢 DeepFlow 社区、乘云数字、51CTO、阅码场等媒体/企业对本次活动直播的支持,有各位的辛苦付出,使得 MeetUp 活动圆满结束。

课件、视频获取

本次活动技术 PPT 已上传,关注龙蜥公众号【OpenAnolis 龙蜥】,回复“龙蜥课件”获取。视频回放将会尽快上传至龙蜥官网(动态-视频-龙蜥MeetUp)。

—— 完 ——

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1929380.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue快速上手——创建vue项目,vue基本使用方式,路由vue-Router,转态管理vuex

文章目录 1.创建vue项目使用Vue CLI创建前端工程:1.方式一:vue create 项目名称2.方式二:vue ui 运行vue项目什么是node.jsnode.js和vue项目的关系 2.vue基本使用方式1.vue组件组成部分:脚本部分的组件选项:示例&#…

普通人还有必要学习 Python 之类的编程语言吗?

在开始前分享一些编程的资料需要的同学评论888即可拿走 是我根据网友给的问题精心整理的对于编程的重要性,这里就不详谈了。 未来,我们和机器的交流会越来越多,编程可以简单看作是和机器对话并分发给机器任务。机器不仅越来越强大&#xff0…

windows实现自动化按键

1.选择目标窗口 获取窗口句柄 void KeyPresser::selectWindow() {SetWinEventHook(EVENT_SYSTEM_FOREGROUND, EVENT_SYSTEM_FOREGROUND, NULL, WinEventProc, 0, 0, WINEVENT_OUTOFCONTEXT);selectedWindowLabel->setText("请点击目标窗口..."); }void CALLBACK …

直接卖断货了!百元价位现象级蓝牙耳机西圣AVA2究竟有什么亮点

今年五月,目前国内知名耳机品牌xisem西圣全新推出了——西圣AVA2真无线蓝牙耳机,产品一经上市就凭借其奢华的配置性能和超高的性价比迅速获得了消费者的追捧,甚至已出现一机难求的情况,目前西圣品牌称,西圣AVA2现阶段已…

Python机器学习、深度学习技术提升气象、海洋、水文领域实践技术

Python是功能强大、免费、开源,实现面向对象的编程语言,能够在不同操作系统和平台使用,简洁的语法和解释性语言使其成为理想的脚本语言。除了标准库,还有丰富的第三方库,Python在数据处理、科学计算、数学建模、数据挖…

2024黑马AI+若依框架项目开发 个人心得、踩坑和bug记录 全网最快最全 基础功能认识篇

2024黑马AI若依框架项目开发 个人心得、踩坑和bug记录 全网最快最全 基础功能认识篇 你好,我是Qiuner. 为帮助别人少走弯路和记录自己编程学习过程而写博客 这是我的 github https://github.com/Qiuner ⭐️ ​ gitee https://gitee.com/Qiuner 🌹 如果本篇文章帮到…

【中项第三版】系统集成项目管理工程师 | 第 5 章 软件工程① | 5.1 - 5.3

前言 第5章对应的内容选择题和案例分析都会进行考查,这一章节属于技术的内容,学习要以教材为准。 目录 5.1 软件工程定义 5.2 软件需求 5.2.1 需求的层次 5.2.2 质量功能部署 5.2.3 需求获取 5.2.4 需求分析 5.2.5 需求规格说明书 5.2.6 需求变…

Java简易图书管理系统

实体类beans book package com.hwq.beans;//实体类 public class Book {private int id;private String name;private String author;private int number;private boolean isBorrowed;//是否被借出public Book() {}public Book(int id, String name, String author, int numb…

MySQL-事务、日志

事务 特性 原子性 是指事务开始后,必须成功执行完所有的操作才会结束,否则会回滚到事务刚开始前。 拿转账来说,一个成功的 A向B转账100元的过程 会涉及如下过程: A:从数据库读取A的余额;A的余额-100&am…

速度与质量的碰撞——对抗扩散蒸馏 (ADD) 如何彻底改变图像生成

引言 DigiOps 与人工智能是最新和最令人兴奋的进步之一,它是一种将速度和质量融为一体的图像生成技术。 ADD 的发展经历了几个关键阶段。最初,图像生成方法非常基础,而且经常产生不令人满意的结果。生成对抗网络(GAN&#xff09…

[A-04] ARMv8/ARMv9-Cache的相关策略

ver0.3 前言 前面我们已经通过三篇文章反反复复的讲Cache的概念、结构、架构,相信大家对Cache已经大概有了初步的了解。这里简单归纳一下: (1) Cache从硬件视角看,是连接PE-Core和主存的一种存储介质,存储的数据是主存中数据的副本&#xf…

17098 广告牌最佳安放问题

这个问题可以通过动态规划来解决。我们可以定义一个数组d&#xff0c;其中d[i]表示到第i个广告牌地点时可以选择放置广告牌的最大效益值。然后我们可以通过遍历所有可能的j&#xff08;1 < j < i && x[i] - x[j] > 5&#xff09;&#xff0c;然后更新d[i]为ma…

Ubuntu22 Qt6.6 ROS 环境搭建

Ubuntu22.04; Qt6.6; Qt Creator 13.01; ROS2 1. 安装 Qt ROS 插件 1.下载地址&#xff1a; https://github.com/ros-industrial/ros_qtc_plugin/releases 选择对应 Qt Creator 版本的安装包。 2. Qt Creator中&#xff0c;“Help - 关于插件”–>“install Plugin…

十五、C++11常用新特性—Lambda表达式

1.基本 这个好像是很好用的&#xff0c;其有以下有点&#xff1a; 声明式的编程风格&#xff1a;直接匿名定义目标函数或函数对象&#xff0c;不需要额外写一个命名函数或函数对象。简洁&#xff1a;避免了代码膨胀和功能分散&#xff0c;让开发更加高效。在需要的时间和地点…

AI算法17-贝叶斯岭回归算法Bayesian Ridge Regression | BRR

贝叶斯岭回归算法简介 贝叶斯岭回归&#xff08;Bayesian Ridge Regression&#xff09;是一种回归分析方法&#xff0c;它结合了岭回归&#xff08;Ridge Regression&#xff09;的正则化特性和贝叶斯统计的推断能力。这种方法在处理具有大量特征的数据集时特别有用&#xff…

SIP消息结构详解

SIP协议的消息由三部分构成&#xff0c;分别是起始行&#xff08;请求行状态行)、消息头和消息体&#xff08;正文&#xff09; 一&#xff0e;起始行 1. 请求消息起始行 起始行&#xff1a;由方法名、请求URI和协议版本组成&#xff0c;自身内部用逗号分割&#xff0c;三者之…

​小语种AI翻译技术新成果,传音荣获WMT 2024国际机器翻译大赛三项冠军

近日,由国际计算语言学协会(The Association for Computational Linguistics,ACL)举办的WMT 2024国际机器翻译比赛结果揭晓。传音TEX AI中心翻译团队在小语种领域再获佳绩,斩获三项翻译赛道的机器自动评测冠军,一项亚军。 WMT(Conference on Machine Translation)大赛是机器翻译…

每日一练 - IEEE 802.1Q中STP协议

01 真题题目 关于设备 SWC 的上述配置说法正确的是 (多选) A.SWC 为根交换机 B.stp instance 1 priority 4096 是配置交换机在实例 1 中的优先级为 4096&#xff0c; 该优先级默认为0 C.gtp edged-port enable 该命令是启用交换机 5WC 的 Ethernet 1/0/2 为边缘端口 D.sto …

手把手教你,如何利用积木易搭3D扫描仪完成文物三维建模?

当前&#xff0c;文物三维建模主要技术手段主要有摄影测量技术、三维激光扫描技术、结构光扫描技术。其中&#xff0c;积木易搭的MagicScan作为一款先进的3D扫描仪&#xff0c;是正是运用了结构光扫描技术的精髓&#xff0c;它巧妙地融合了点云相机的高精度空间数据采集能力、纹…

解析DDD开发框架Axon

在微服务架构盛行的当下&#xff0c;领域驱动设计&#xff08;DDD&#xff09;也得到了崭新的发展。在DDD中包含了聚合、领域事件等核心概念&#xff0c;也需要引入CQRS、事件溯源等架构模式。对于开发人员而言&#xff0c;如何简单而高效的实现这些核心概念和架构模式是一大痛…