智能监控:业务监控新选择,效率提升新动力

news2024/9/16 19:40:55

前言

随着科技的飞速发展,企业对于业务的稳定性和连续性要求越来越高。传统的监控方式虽然在一定程度上能够保证业务的正常运行,但在面对复杂多变的业务场景和日益增长的数据量时,往往显得力不从心。为了解决这一问题,观测云在提供全面的可配置的监控器同时,结合最新的智能算法和技术,推出了智能监控功能,帮助企业轻松应对更多业务挑战, 也使观测云可观测性系统更加完善。

强大的智能监控

智能监控综合使用 ADTK (Anomaly Detection Toolkit)中异常检测算法(Detector)以及一些常用算法和处理函数,智能化检测时间序列数据中的异常值,对于业务分析、用户行为的分析、以及出现故障的根因分析能力,提供了一套快速定位异常节点的机制;高效地帮助用户主动地发现问题并生成事件报告。在对原本的智能巡检功能优化和升级后,全新的智能监控的优势也十分明显,具体有以下几项:

  • 更加快速定位异常节点:通过分析场景构建对多维指标做关键维度的定位;在定位到业务的维度范围后,围绕着微服务中服务的调用,服务的资源依赖,快速定位分析异常,大大提高了故障排查的效率。
  • 完美掌控波动性强的指标:为用户预制检测规则,适用于波动性较强的业务类及其他数据指标,能够更好地应对数据的快速变化和异常波动,提供实时事件分析报告并及时告警,帮助运维人员及时关注并解决问题。
  • 精准识别与预测异常数据:基于强大的智能检测算法,智能监控能够自动识别异常数据并预测未来走势,为企业提供更加及时、准确的故障预警和排查支持。
  • 灵活简捷的监控配置:与传统监控方式相比,智能监控无需复杂的阈值和触发规则配置,只需设定检测范围及通知人即可一键开启监控,这种简化的设置方式使得更多企业能够减少大量的时间成本和使用门槛。

丰富的检测类型

观测云智能监控目前支持 4 种智能检测规则,不同的规则覆盖不同数据范围以及多种指标,如下列表:

规则名称数据范围检测频率基本描述
主机智能检测指标(M)30 分钟通过智能算法自动检测主机,发现主机 CPU、内存异常情况。
日志智能检测日志(L)60 分钟通过智能算法自动检测日志中的异常,检测指标包含日志数量,错误日志数。
应用智能检测链路(T)30 分钟通过智能算法自动检测应用中的异常,检测指标包含应用请求数量,错误请求数,以及请求延迟。
用户访问智能检测用户访问数据(R)60 分钟通过智能算法自动检测网站/APP 中的异常,包含页面性能分析,错误分析,相关检测指标有 LCP、FID、CLS、Loading Time等。

主机智能检测

主机智能检测基于智能检测算法,定期对主机的 CPU、内存进行智能检测。通过对出现 CPU、内存异常的主机进行根因分析,确定该主机是否存在突增/突降/区间性上升的异常情况,从而监控主机的运行状态及稳定性。适用于对稳定性和可靠性要求较高的业务主机的监控,支持对产生的异常事件提供分析报告,不仅可以看到主机的相关详情,还能对异常情况做较为全面的分析。

日志智能检测

日志智能检测基于智能检测算法,监控工作空间内采集器产生的日志数据。智能识别日志数量的突增 / 突降、错误日志突增的异常数据,及时发现不符合预期的异常状态。多适用于在 IT 监控场景下,通过事件异常总结和错误分析,对代码异常或任务调度检测等数据进行更深层次的下钻分析。

应用智能检测

应用智能检测基于智能检测算法,智能识别应用请求数量的突增 / 突降、错误请求数量的突增、请求延迟的突增 / 突降 / 区间上升等异常情况。通过应用程序服务异常指标来自动进行异常分析,您可以根据异常总结以及资源分析,快速定位故障点并恢复,有效确保服务平稳运行状态。

用户访问智能检测

用户访问智能检测基于智能检测算法,智能检测用户访问 Web / APP 的性能异常和错误突增情况。基于检测指标进行性能和错误两个方面的异常分析,并触发告警,高效地帮助您监测网站或应用程序的运行情况以及用户使用情况。相关的指标及预设阈值如下:

  • 性能分析指标预设阈值: LCP(>= 2.5 s)、INP (>= 200 ms)、FID (>= 100 ms)、CLS (> 0.01);

基于性能分析指标,统计检测区间受影响用户占比,设置告警级别阈值:Critical > 76.2% 、 Warning > 47.4% 、 error > 59.8% ;

  • 错误检测指标:会话错误数、页面错误数、动作错误数。

其事件分析报告的异常总结会显示查看用户访问服务标签、分析报告详情、异常分布情况统计;同时您还能够根据具体情况进行页面性能或错误分析,即关联用户访问页面仪表板,分析页面 LCP、FCP、页面错误率等指标趋势。

简单的配置过程

  • 不同于传统形式的监控器需要配置复杂的阈值和触发规则,您只需要简单设置筛选数据的检测范围或自定义添加所需的属性字段作为筛选项,即可锁定更加精准的智能监控数据检测范围。

  • 智能监控会在发现异常后由算法自动生成事件报告并通知相关人员,帮助您及时发现异常情况并快速定位分析。您还可以自定义配置事件通知使接受人更清楚的了解事件内容;或将同步创建 Issue 异常追踪进行高效地统一管理。

  • 好用的告警配置能够根据所设置的不同事件等级、通知对象、以及告警聚合规则在该智能监控满足触发条件后,立即发送告警消息给指定的通知对象。值得注意的是,智能监控触发的事件等级为重要,您可以重点关注重要等级中的通知对象,以便高效管理告警通知。

配置告警策略,详情参见:机智的告警策略,完善监控系统的重要一环

完成创建智能监控后,监控器会获取所筛选后的各类数据,识别出现异常情况时,会生成相应的事件,您可以事件>智能监控列表中查看对应异常事件详情和分析报告,从而进一步分析并快速解决故障。

值得关注的是,分析报告是采用了仪表板模式做绑定的,如下图(以主机检测事件报告为例);在异常总结中,您可以查看异常点的具体分析数据以及相应主机的情况。同时,您可以直接跳转至该仪表板视图模版进行下钻分析,更加快速找到问题原因并解决。若您需要更加个性化的分析报告仪表板,观测云还支持您创建同名视图,更新分析看板则将覆盖现有事件分析报告,帮助您大大提升分析效率。

最后

通过本文的介绍,相信您已经了解如何快速使用智能监控,并体会到了观测云智能监控的强大优势和魅力。丰富的检测类型能够帮助各行各业的企业进行数字化改革,搭配常规的监控器使用,不仅能够全面覆盖企业的数据监控场景,还能够有效地降低各类成本。

观测云智能监控功能的上线,无疑是一次可观测系统智能化一次质的飞跃。它不仅提升了监控的智能化水平,更在业务稳定性、连续性和安全性等方面为企业提供了强有力的保障。通过运用这一功能,企业将能够更好地洞察业务运行的全貌,及时发现并解决潜在问题,从而确保业务的持续、稳定运行。我们相信,观测云智能监控功能将成为企业数字化转型道路上的得力助手;未来智能监控的持续升级也值得我们共同期待!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1367850.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

NUXT3学习笔记

1.邂逅SPA、SSR 1.1 单页面应用程序 单页应用程序 (SPA) 全称是:Single-page application,SPA应用是在客户端呈现的(术语称:CSR(Client Side Render)) SPA的优点 只需加载一次 SPA应用程序只需…

迎接人工智能的下一个时代:ChatGPT的技术实现原理、行业实践以及商业变现途径

课程背景 2023年,以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局…

Linux-添加虚拟内存,不添加硬盘方式操作

在linux中,当物理内存mem不足时,就会使用虚拟内存(swap分区) 例如增加2G虚拟内存,操作如下: 1.查看内存大小 [rootlocalhost ~]# free -m 2.创建要作为swap分区的文件:增加1GB大小的交换分区,则命令写法如下,其中的cou…

探索区块链的未来:Ignis的母子架构进展与模块化区块链趋势

随着区块链技术的不断演进,模块化区块链成为热点,而其高拓展性的优点早在Ignis公链的母子架构上就已经实现。本文将探讨这两个方面,揭示它们如何推动区块链技术向前发展。 模块化区块链的兴起与Celestia 模块化区块链通过将不同的功能分解为…

开源C语言库Melon:Cron格式解析

本文介绍开源C语言库Melon的cron格式解析。 关于 Melon 库,这是一个开源的 C 语言库,它具有:开箱即用、无第三方依赖、安装部署简单、中英文文档齐全等优势。 Github repo 简介 cron也就是我们常说的Crontab中的时间格式,格式如…

一起来了解综合能源服务认证

首先,综合能源服务认证是有国家政策支持的, 《能源生产和消费革命战略(2016-2030)》中指出:1、能源生产端要以绿色低碳为方向,推动能源集中式和分布式开发并举,大幅提高新能源和可再生能源比重&#xff1b…

Async In C#5.0(async/await)学习笔记

此文为Async in C#5.0学习笔记 1、在async/await之前的异步 方式一:基于事件的异步Event-based Asynchronous Pattern (EAP). private void DumpWebPage(Uri uri) {WebClient webClient new WebClient();webClient.DownloadStringCompleted OnDownloadStringCo…

【大数据进阶第三阶段之ClickHouse学习笔记】ClickHouse的简介和使用

1、ClickHouse简介 ClickHouse是一种列式数据库管理系统(DBMS),专门用于高性能数据分析和数据仓库应用。它是一个开源的数据库系统,最初由俄罗斯搜索引擎公司Yandex开发,用于满足大规模数据分析和报告的需求。 开源地址…

01-shell

shell 1. shell概述 1.1 引入 完成以下任务: 判断用户家目录下(~)下面有没有一个叫 test 的文件夹如果没有,提示按 y 创建并进入此文件夹,按 n 退出如果有,直接进入,提示请输入一个字符串,并…

Qt/C++音视频开发63-设置视频旋转角度/支持0-90-180-270度旋转/自定义旋转角度

一、前言 设置旋转角度,相对来说是一个比较小众的需求,如果视频本身带了旋转角度,则解码播放的时候本身就会旋转到对应的角度显示,比如手机上拍摄的视频一般是旋转了90度的,如果该视频文件放到电脑上打开,…

探索PyTorch优化和剪枝技术相关的api函数

torch.nn子模块Utilities解析 clip_grad_norm_ torch.nn.utils.clip_grad_norm_ 是 PyTorch 深度学习框架中的一个函数,它主要用于控制神经网络训练过程中的梯度爆炸问题。这个函数通过裁剪梯度的范数来防止梯度过大,有助于稳定训练过程。 用途 防止…

数据权限-模型简要分析

权限管控可以通俗的理解为权力限制,即不同的人由于拥有不同权力,他所看到的、能使用的可能不一样。对应到一个应用系统,其实就是一个用户可能拥有不同的数据权限(看到的)和操作权限(使用的)。 …

基于ssm的双减后初小教育课外学习生活活动平台的设计与实现论文

双减后初小教育课外学习生活活动平台的设计与实现 摘 要 当下,正处于信息化的时代,许多行业顺应时代的变化,结合使用计算机技术向数字化、信息化建设迈进。以前学校对于课外学习活动信息的管理和控制,采用人工登记的方式保存相关…

RocketMQ5-02快速部署RocketMQ5.x(手动和容器部署)

RocketMQ5快速入门指南(含部署实践) 部署环境本机单机可执行包部署、Docker部署 Mac部署:下载源文件可执行包部署 NameServer 问题1:资源不足补充: 关于日志的输出 可执行包部署 Broker 对于Local模式对于Cluster模式 对于 ProxyDocker部署 NameServerD…

AcrelEMS-BP生物制药能效管理系统——安科瑞 顾烊宇

​01 行业方案 02 项目案例 安科瑞 顾烊宇

Koodo Reader : 一个开源免费的电子书阅读器

今天在浏览 GitHub 的时候,偶然发现了一个非常有趣的开源项目——Koodo Reader。这个项目是一款开源免费的电子书阅读器,支持多种格式。它具有一些非常独特的功能,深深地吸引了我的注意。在接下来的内容中,我将为大家详细介绍一下…

oracle 12c pdb expdp/impdp 数据导入导出

环境 (源)rac 环境 byoradbrac 系统版本:Red Hat Enterprise Linux Server release 6.5 软件版本:Oracle Database 12c Enterprise Edition Release 12.1.0.2.0 - 64bit byoradb1:172.17.38.44 byoradb2:172.17.38.45 (目的&am…

升级 Vite 5 出现警告 The CJS build of Vite‘s Node API is deprecated.

🚀 作者主页: 有来技术 🔥 开源项目: youlai-mall 🍃 vue3-element-admin 🍃 youlai-boot 🌺 仓库主页: Gitee 💫 Github 💫 GitCode 💖 欢迎点赞…

一、二进制方式 安装部署K8S

目录 一、操作系统初始化 1、关闭防火墙 2、关闭 SELinu 3、 关闭 swap 4、添加hosts 5、同步系统时间 二、集群搭建 —— 使用外部Etcd集群 1、自签证书 2、自签 Etcd SSL 证书 ① 创建 CA 配置文件:ca-config.json ② 创建 CA 证书签名请求文件&#xff…

how2heap-2.23-12-house_of_spirit

house_of_spirit 注意事项 house_of_spirit:将一个地址伪造成符合fast bin大小的chunk,将其释放进fastbin中,同时伪造其中的fd指针,达到任意地址分配 伪造的chunk的大小,为什么是fast bin大小范围内的chunk&#xff…