2023双态IT北京用户大会回顾(二) | 云内外一体化智能监控构建之路

news2024/9/22 5:39:15

文末附有本场专题演讲视频

2023第五届双态IT北京用户大会擎创科技专场演讲回顾(二):《云内外一体化智能监控构建之路》演讲嘉宾:擎创科技产品线总监 殷传旺

一、前言:企业运维自然推进or独立发展?

我们从很多客户处看到,在云原生发展的过程中,每有一个业务上云就可能会启用一套Prometheus(或CK、Sky walking)工具去进行监控,久而久之就出现了很多监控工具,它们的数据游离在传统监控之外,使得监管变得十分困难。那么云原生领域下,企业运维监控的构建会是基于传统监控框架继续发展、自然演进,还是应该重新搭建独立造轮子?

分布式、云原生的快速发展,带来了很多技术上的革新,如更优雅的弹性结构、更灵活敏捷的调度方式、更完善的治理流程等,但凡事皆有利弊,它们同样也带来了更多新的复杂性和挑战:

  • 从广度上看,微服务单元数呈现指数级增长,单元间关联关系庞杂,系统内部变更趋向动态化,架构日益复杂。

  • 从深度上看,技术栈不断加深,故障点可能出现在任何地方,生产事件造成的影响越来越大,系统复杂性急剧提升。

​因此,企业对云原生运维监控的要求也水涨船高↓↓↓

  • 在数据层面

对监控数据的质量要求能够支撑复杂问题排障,能够跨域关联支撑运维分析并保证从开发到存储分析都能保证性能与稳定;

  • 在体系层面

对运维监控体系要求能够明确边界和颗粒度,能够在容器环境下保证监控策略的稳快,能够确保多样化的开源工具既能在各自领域蓬勃发展,又能成为一体化统一监控体系内的能力拼图。

  • 如何破局

擎创认为,以近年常被提到的“可观测性”来应对云原生监控难题,或许是一种不错的解法。用在这里的可观测是需要通过一种高度统筹的方式,将所有可观测的特征数据进行整合,创造出决策闭环,来提升组织决策的有效性。(主要包含的数据无外乎还是指标、调用链(Trace)、日志三大重要特征数据)

二、企业如何应对云原生带来的挑战

企业运维监控面对云原生带来的挑战,迫切的需要能够将数据关联打通壁垒,我们认为想要使监控走向数据驱动的模式,需要六大数据能力使之实现↓↓↓

01数据模型

按照不同数据域进行数据建模,支撑快速构建上层运维场景

02数据采控

统一且开放地采集跨越云内外的指标、日志、链路等数据

03数据服务

针对贴源数据,提供高效、稳定的端到端数据开发服务;针对核心层数据提供统一的数据访问服务

04数据质量

符合时效性、完整性、正确性、合规性等数据标准以及管理规范

05数据存储

湖仓一体架构,满足时序、关系、结构化等不同类型数据的存储需求,按需进行分类、分级存储

06算法服务

以高质量数据为基础,提供指标、日志、拓扑等不同效用算法,洞见数据价值

三、数据能力举例—数据模型

从数据模型中的指标域来展开讲讲:一些企业因为监控工具的分散,比如云外使用的是Zabbix,云内使用的是Prometheus,导致描述同样一个主机的CPU指标完全不一样,消费方就很难进行判断和使用,这就严重影响了运维的效率。

其实某些技术类指标可以先根据对象属性进行分层和分级,然后再根据管理属性去进行拓展分类。这样处理过的指标数据在使用时,不需要去确认来源和采集方式,它们的标签一致、含义一致,可以完全满足消费方的需求,提供应有的数据价值,确保运维效率的快、准、稳。

关于运维监控的分享先到这里了,更多现场细节,戳下方视频,可一键直达了解~

云内外一体化智能监控构建之路

关注微信视频号-擎创夏洛克AIOps,更多专场视频尽在其中


​擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司致力于协助企业客户提升对运维数据的洞见能力,优化运维效率,充分体现科技运维对业务运营的影响力。

行业龙头客户的共同选择

​了解更多运维干货与技术分享

可以右上角一键关注

我们是深耕智能运维领域近十年的

连续多年获Gartner推荐的AIOps标杆供应商

下期我们不见不散

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/690527.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

WebAssembly能否取代Docker?

“如果WebAssembly(Wasm)在几年前出现,Docker可能就不会出现了。因为它是一项非常强大的跨平台技术,可以让我们使用不同的编程语言来编写跨平台应用程序。Docker的原始动力之一就是提供一个跨平台部署和应用的方法。” -- Solomon…

lesson6 ZIgbee网络特性抓包分析

目录 ZIgbee网络特性抓包分析 理论部分: 实验部分: 入网前相关数据帧(仅单个设备供电): 首先以路由器和协调器为例:(帧的类别从头部的Type可以看到,在四大帧类别中根据不同作用也…

Vue 项目build打包发布到github pages ,刷新页面首页正常打开,子路由报错404的解决方法

一、问题效果如下: 二、解决方法 1、切换到gh-pages分支 2、在index.html同级新增404.html文件,其内容与index.html一样 三、解决后的效果如下: 相关文章 Vue3 Vite Ts开源后台管理系统模板 基于ElementUi或AntdUI再次封装基础组件文档 基…

Java版本spring cloud 电子招标采购系统源码:营造全面规范安全的电子招投标环境,促进招投标市场健康可持续发展

营造全面规范安全的电子招投标环境,促进招投标市场健康可持续发展 传统采购模式面临的挑战 一、立项管理 1、招标立项申请 功能点:招标类项目立项申请入口,用户可以保存为草稿,提交。 2、非招标立项申请 功能点:非招标…

VueX用法快速回顾(简洁纯干货)

vuex基础结构 代码结构 vuex的完整结构长这样,其包含了state、mutations、actions、modules及getters5个部分。 import Vue from vue import Vuex from vuexVue.use(Vuex)const store new Vuex.Store({state: {},mutations: {},actions:{},modules:{},getters:{…

mysql数据库 查询出的字段值是 科学计数法数字,数字转换为易于理解的形式

目录 1 问题2 实现 1 问题 数据库查询出来的可能是这种,如何将数字转换为易于理解的形式; 2 实现

ppt文件全部删除怎么恢复?别急,这些方法能挽救

PPT文件全部删除怎么恢复?如果您不小心将PPT文件删除,不要担心,您可能还有机会将其恢复。在下面的文章中,我们将介绍一些技巧来恢复已删除的PPT文件。 第一部分:关于PPT文件 PPT文件是指Microsoft PowerPoint软件创建…

互联网医院开发|互联网医院系统源码技术实现

健康医疗这几年一直成为人们比较关注的问题,互联网医院系统通过信息化技术精简了预约挂号,优化了医生的诊断流程,通过互联网医疗,患者复诊或医疗咨询需求都可以在线上进行,这种快捷的线上问诊方式缓解一线医务人员的压…

【成都】EFDC建模方法及在地表水环境评价、水源地划分、排污口论证中实践技术应用

为了定量地描述地表水环境质量与污染排放之间的动态关系,EFDC、MIKE、Delft3D、Qual2K等数值模型被广泛应用在环境、水务、海洋等多个领域。Environmental Fluid Dynamics Code(EFDC)是一款用于模拟江河,湖泊,河口&…

Linux 中利用设备树点灯

系列文章目录 第一章 Linux 中内核与驱动程序 第二章 Linux 设备驱动编写 (misc) 第三章 Linux 设备驱动编写及设备节点自动生成 (cdev) 第四章 Linux 平台总线platform与设备树 第五章 Linux 设备树中pinctrl与gpio(…

通过一道题再了解一点Array原型上的every方法

一、例题 首先我们先来看这么一系列关于every使用的题: console.log(1, [].every(() > false)) console.log(2, [,,].every(() > false)) console.log(3, [undefined].every(() > false)) console.log(4, [false].every(() > false)) console.log(5, […

【深度学习】最全的十九种损失函数汇总

tensorflow和pytorch很多都是相似的,这里以pytorch为例。 文章目录 一、L1范数损失 L1Loss二、均方误差损失 MSELoss三、交叉熵损失 CrossEntropyLoss四、KL 散度损失 KLDivLoss五、二进制交叉熵损失 BCELoss六、BCEWithLogitsLoss七、MarginRankingLoss八、HingeEm…

git rebase和git merge在团队协作开发中的用法

git rebase和git merge是在日常开发中常用的用于分支合并的命令,也是非常容易误用的两个命令。本文将通过图文的方式去详解二者之间的区别。 git merge git merge会为本次的合并过程生成一条新的commit,并将该commit添加到目的分支上。通常用于将featu…

【Tensorflow object detection API + 微软NNI】图像分类问题完成自动调参,进一步提升模型准确率!

1. 背景&目标 利用Tensorflow object detection API开发并训练图像分类模型(例如,Mobilenetv2等),自己直接手动调参,对于模型的准确率提不到极致,利用微软NNI自动调参工具进行调参,进一步提…

Keep通过IPO聆讯,3年烧掉16亿

“运动科技第一股”来了! 6月21日,线上健身平台的运营方、北京卡路里科技有限公司(下称“Keep”)已正式通过聆讯,股票代码为810342.HK。 Keep是一家在线健身平台,主要产品包括在线健身内容、智能健身设备…

【python百炼成魔】python之内置函数range

前言 文章目录 前言内置函数 range()三种创建方式1. 只有一个参数的情况2. 给定两个参数的情况3. 三个参数都给定的时候 使用in和not in 来判断指定的整数是否存在1. 判断range生成的序列中是否存在指定的值2. in 和not in 不与range结合的情况 总结 内置函数 range() range()函…

第六章、Linux文件与目录管理

6.1 目录与路径 6.1.1 相对路径与绝对路径 绝对路径:路径的写法“一定由根目录 / 写起”,例如: /usr/share/doc 这个目录。 相对路径:路径的写法“不是由 / 写起”,例如由 /usr/share/doc 要到 /usr/share/man 下面…

chatgpt赋能python:使用Python获取句柄和发送消息

使用Python获取句柄和发送消息 什么是句柄? 在计算机中,句柄是指一个唯一的标识符,用于引用正在执行的进程或程序。在Python中,我们可以使用win32api模块获取Windows操作系统中的句柄。使用句柄,我们可以与Windows中…

Qt/C++编写跨平台的推流工具(支持win/linux/mac/嵌入式linux/安卓等)

一、前言 跨平台的推流工具当属OBS最牛逼,功能也是最强大的,唯一的遗憾就是多路推流需要用到插件,而且CPU占用比较高,默认OBS的规则是将对应画布中的视频画面和设定的音频一起重新编码再推流,意味着肯定占用不少CPU资…

DragGAN开源:生成图像流形上的基于点的交互式操作

文旨在解决生成对抗网络(GAN)中控制生成图像的问题。通过“拖动”图像中的任意点,实现用户交互式精确控制生成图像的姿态、形状、表情和布局。 这个名叫DragGAN的模型,本质上是为各种GAN开发的一种交互式图像操作方法。论文以Sty…