云栖实录 | 智能运维年度重磅发布及大模型实践解读

news2024/10/17 6:59:50

本文根据2024云栖大会实录整理而成,演讲信息如下:

演讲人:

钟炯恩 | 阿里云智能集团运维专家

张颖莹 | 阿里云智能集团算法专家

活动:

2024 云栖大会 AI+ 可观测专场 -智能运维:云原生大规模集群GitOps实践

2024 云栖大会 AI 运维专场 -大模型在大数据智能运维的应用实践

近年来,AIOps已成为IT运维市场的重要发展方向之一,各种技术层出不穷,但在应对大规模运维场景时仍显力不从心。面对越来越大的运维规模,大家都在关注是否有同时兼顾稳定性、成本和效率的运维方案来应对集群管理的复杂性。

云原生大规模集群场景的GitOps方案重磅发布

阿里云大数据运维团队运维专家钟炯恩在分享中提出:基于OAM云原生模型,可以实现研发与运维人员的关注点分离,使得不同角色的人员能在同一个工程中进行代码以及交付的协作,进而完成完整的云原生开发与部署。基于快捷且清晰的云原生运维管理方案,该研发及运维团队支撑了每天500+次的云原生部署。

在完整的云原生方案之上,阿里云大数据运维团队在调研业界的常见GitOps方案之后,落地了一套适合大规模集群场景的GitOps方案。该方案同时兼顾了变更的过程管理和终态管理,实现了变更的自动化、代码化、透明化。GitOps实现中关键细节在于基于自研的IaC语法,将git diff自动转换成变更计划.

GitOps在智能运维领域的关键作用:收敛运维的操作入口,提供大模型优化的操作平面。同时钟炯恩强调,智能运维是在已有的运维方案支持了稳定性、成本、效率需求之后的锦上添花之举,如果基础运维能力构筑不扎实就引入智能运维,很容易引发更大稳定性风险。

大模型在大数据智能运维的应用实践

随着大模型技术的演进,大模型技术智能运维领域带来了前所未有的推动力。经过八年的深耕,阿里云大数据团队在智能运维领域积累了丰富应用场景。

图片

阿里云计算平台算法专家张颖莹分享了大模型在大数据智能运维的应用实践,从大数据运维的业务背景出发,主要聚焦于两大核心议题:智能问答和智能诊断。

在智能问答场景中,引入了检索增强生成(RAG)方法,有效解决了大模型应用中的幻觉问题和知识更新缓慢问题。同时在知识构建和检索阶段实施了多项优化,包括多粒度知识抽取框架和RAG On Graph算法,极大提高了知识关联性和检索精度。

智能诊断方面,张颖莹介绍基于多智能体框架的平台诊断系统。为了模拟现实中故障应急团队的协作模式,引入了智能体Agent的概念,使大模型具备更高的主观能动性和灵活性,并根据系统模块完成了Agent的角色设定。而Agent的工具箱中则整合了指标异常检测、日志异常检测和历史故障学习等核心工具,实现了高效的数据分析和决策支持。此外,通过设计模拟神经网络反馈机制的工作流,可以确保各模块智能体有效协同,减少信息不对称和误差累积,最终由系统Agent综合分析并给出诊断结论。

在工程架构层面,如何构建合理框架以保障大模型应用的时效性和稳定性,涵盖数据层、算法服务层及大模型服务层的高效组织和管理是重中之重。团队通过解耦工具开发与Agent开发,实现算法复用和本地到云端的无缝部署,增强了可观测性和开发效率,为大模型的持续优化和规模化应用奠定了坚实基础。

总结而言,阿里云大数据运维团队通过智能问答和智能诊断的实践,展示了大模型在智能运维领域的巨大潜力,不仅提升了运维效率和问题解决能力,也为行业提供了宝贵的实践经验和技术启示。未来,团队将继续在模型能力强化、人机交互优化、工作流编排灵活性及大模型运维流程自动化等方面进行探索,推动智能运维技术的边界拓展,促进更多创新成果的诞生与分享。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2216878.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【c++】c++11多线程开发

2 C多线程 本文是参考爱编程的大丙c多线程部分内容,按照自己的理解对其进行整理的一篇学习笔记,具体一些APi的详细说明请参考大丙老师教程。 代码性能的问题主要包括两部分的内容,一个是前面提到资源的获取和释放,另外一个就是多…

使用rabbitmq-operator在k8s集群上部署rabbitmq实例

文章目录 前言一、rabbitmq-operator二、进行部署1.部署cluster-operator2.创建自己需要的特定命名空间3.创建rabbitmq的instance4.创建nodeport访问 结果验证 前言 使用rabbitmq-operator在k8s集群上部署rabbitmq实例。时区设置为上海 一、rabbitmq-operator 官网地址&#…

数学建模算法与应用 第16章 优化与模拟方法

目录 16.1 线性规划 Matlab代码示例:线性规划求解 16.2 整数规划 Matlab代码示例:整数规划求解 16.3 非线性规划 Matlab代码示例:非线性规划求解 16.4 蒙特卡洛模拟 Matlab代码示例:蒙特卡洛模拟计算圆周率 习题 16 总结…

java代码生成器集成dubbo,springcloud详解以及微服务遐想

摘要 今天终于有了点空闲时间,所以更新了一下代码生成器,修复了用户反馈的bug,本次更新主要增加了dubbo和springcloud脚手架的下载功能,架子是本人亲自搭建,方便自由扩展或者小白学习使用,你也许会问为什么…

红日安全vulnstack (二)

目录 环境搭建 网卡设置 修改Kali网段 IP 分布 WEB渗透 Weblogin服务开启 漏洞扫描 CVE工具利用 MSF上线 内网渗透 域内信息收集 凭证横向移动 权限维持 黄金票据 参考文章 https://www.cnblogs.com/bktown/p/16904232.htmlhttps://blog.csdn.net/m0_75178803/ar…

leetcode54:螺旋矩阵

给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。 示例 1: 输入:matrix [[1,2,3],[4,5,6],[7,8,9]] 输出:[1,2,3,6,9,8,7,4,5]示例 2: 输入:matrix [[1,2,3,…

hackmyvm-Hundred靶机

主机发现 sudo arp-scan -l 以sudo权限执行arp-scan -l 扫描并列出本地存在的机器,发现靶机ip为192.168.91.153 nmap扫描 端口发现 21/tcp open ftp 22/tcp open ssh 80/tcp open http web信息收集 我们先尝试一下ftp端口的匿名登录 FTP:是文件传输协议的端…

个人博客系统_测试报告

1.项目背景 基于SSM框架实现的个人博客系统,由五个页面构成:用户登录页、博客发表页、博客编辑页、博客列表页以及博客详情页。登录即可查看自己与其他用户已发布的博客,也可以使用自己的账号发布博客,通过使用Selenium定位web元…

《人工智能:CSDN 平台上的璀璨之星》

一、CSDN 上的 AI 热门话题 GPT-3 作为 CSDN 上的热门话题,其应用极为广泛。GPT-3 是 OpenAI 开发的一种基于 Transformer 架构的大规模预训练语言模型,拥有惊人的 1750 亿个参数。它具有多任务处理能力,能够执行多种自然语言处理任务&#x…

保护企业终端安全,天锐DLP帮助企业智能管控终端资产

为有效预防员工非法调包公司的软硬件终端资产,企业管理员必须建立高效的企业终端安全管控机制,确保能够即时洞察并确认公司所有软硬件资产的状态变化。这要求企业要有一套能够全面管理终端资产的管理系统,确保任何未经授权的资产变动都能被迅…

Ajax处理错误信息(处理响应报文)

<!DOCTYPE html> <html><head><meta charset"utf-8" /><title></title></head><body><form action""><div>用户名<input type"text" class"username"></div>…

【2024-10-16】某小破站w_rid参数分析

声明:该专栏涉及的所有案例均为学习使用,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!如有侵权,请私信联系本人删帖! 文章目录 一、前言二、参数分析三、代码一、前言 看一下小破站的参数加密 网址: aHR0cHM6Ly9zcGFjZS5iaWxpYmlsaS5jb20vNDA1Nz…

c++就业1.1.3海量数据去重的Hash与BloomFilter

找到具体的位置 通过映射 当前需要插入的指向 上一层最后一个 方便头插 布隆过滤器 - 查找是否有这个值 但是不能够返回value 服务器和过滤器进行网络交互 我们要知道这个key在不在mysql中 去查询并且在mysql中进行查询 所以在服务器部署布隆过滤器 为了节约内存 用位图 对str…

Linux权限理解及环境基础开发工具使用

前言 Linux中有两种用户&#xff0c;一种是root用户&#xff0c;另一种是普通用户&#xff0c;二者的权限不一样&#xff0c;即能做的事情不一样。下面我们来细讲一下这些不同。 root用户能在Linux系统下做任何事情&#xff0c;而普通用户只能做有限的事情。 root用户的命令…

FPGA采集adc,IP核用法,AD驱动(上半部分)

未完结&#xff0c;明天补全 IP核&#xff1a;集成的一个现有的模块 串口写好后基本不会再修改串口模块内部的一些逻辑&#xff0c;将串口.v文件添加进来&#xff0c;之后通过他的上层的接口去对他进行使用&#xff0c;所以我们打包IP&#xff0c;之后就不用去添加源文件了&a…

Pollard‘s p-1算法

概述 光滑数 (Smooth number)&#xff1a;指可以分解为多个小素数乘积的正整数 当p是N 的因数&#xff0c;并且p−1是光滑数&#xff0c;可以考虑使用Pollards p-1算法来分解N 当p是N的因数&#xff0c;并且p1是光滑数&#xff0c;可以考虑使用Williamss p1算法来分解N 这里…

Java 快速排序算法详解及通用实现模板案例示范

1. 引言 在众多排序算法中&#xff0c;快速排序&#xff08;QuickSort&#xff09; 是一种非常经典且高效的算法。它采用“分治法”的策略&#xff0c;通过递归地将数组分割成更小的部分&#xff0c;从而快速完成排序操作。快速排序的平均时间复杂度为 O(n log n)&#xff0c;…

webpack 学习入门

webpack 1. 简介1.1 webpack 是什么1.2 webpack 五个核心概念1.2.1 入口 - Entry1.2.2 出口 - Output1.2.3 Loader1.2.4 插件 - Plugins1.2.6 模式 - Mode 2. webpack 初体验2.1 初始化配置2.1.1. 准备2.1.2. 写代码2.1.3 编译打包应用 3. webpack 开发环境的基本配置3.1 打包样…

《深度学习》OpenCV EigenFaces算法 人脸识别

目录 一、EigenFaces算法 1、什么是EigenFaces算法 2、原理 3、实现步骤 1&#xff09;数据预处理 2&#xff09;特征提取 3&#xff09;构建模型 4&#xff09;识别 4、优缺点 1&#xff09;优点 2&#xff09;缺点 二、案例实现 1、完整代码 运行结果&#xff…

大学新生编程入门指南:如何选择编程语言与制定学习计划

大学新生编程入门指南&#xff1a;如何选择编程语言与制定学习计划 编程已成为当代大学生的必备技能&#xff0c;尤其是在信息技术高速发展的今天&#xff0c;编程能力不仅能帮助你在课堂学习中脱颖而出&#xff0c;更能为未来职业生涯打下坚实的基础。然而&#xff0c;面对如…