优维EasyOps产品使用最佳实践:Agent存活性监控

news2024/11/26 16:28:11

 优维EasyOps平台内置Agent存活性监控啦!

Agent作为自动化/监控底层核心组件,它的可用性直接影响了上层功能的使用,故我们会非常关注它的状态。但如果有网络波动、Agent升级或机器故障等都可能导致Agent异常,这时用户希望这种异常能够及时通知到平台运维负责人,以便于他能够及时感知并处理。过去我们平台一直没内置Agent状态存活的监控,现场人员为此使用了各种旁路的方式去做监控,而旁路的方式并不能实时可靠的感知到Agent状态的变化,现在平台内置了此功能将彻底解决这个问题!

负责管理Agent状态的组件(gateway)直接将内存状态数据暴露出来当做指标进入告警处理链路流,从而上层可利用此配置告警。另外,Agent状态是触发沿上报,所以会非常的灵敏。

适配发行版:6.19.0!

1.说明

Agent是Easyops平台上负责客户端代理的组件,它能够实现监控采集、资源发现和工具执行等功能。由于Agent的存活性对系统运行非常关键,Easyops平台内置了对Agent的监控功能,包括以下指标:

 这些指标在Easyops平台中默认进行采集,无需额外配置策略,只需要简单配置相应的告警规则即可。

2.告警规则配置

⑴ 新建告警规则:首先,需要创建一个告警规则来定义监控的目标范围,即您希望监控的主机范围。

 ⑵ 设定告警指标:在告警规则中,选择"主机Agent状态"作为告警指标,并将阈值设定为"不等于正常"。这样一来,当Agent状态异常时将会触发告警。

 ● 请注意:Agent状态的指标每小时上报一次,并且可以基于触发条件(状态变化)进行即时触发。换句话说,当Agent状态从"正常"变为"异常"时,将立即触发指标值的变化。为了确保准确性,触发判断填写一个数据点来进行触发。(如果填写两个数据点,那么异常状态至少维持1小时才会触发,这样告警延迟过大。)
这意味着即使指标每小时上报一次,一旦状态发生变化,系统会立即捕捉到这个变化并触发相应的动作。这样设计的目的是确保对Agent状态的监控是及时且敏感的。因此,您可以依靠这个特性来快速发现并处理Agent状态异常的情况。

 ⑶ 添加告警丰富信息:您可以为告警添加更多的信息,以便更清楚地描述告警的内容和上下文。

 ⑷ 设定告警模板:为告警消息设定模板,使其包含关键信息并具有易读性。

【SLO事件告警】{{time|ts2str:'%Y-%m-%d %H:%M'}} 产生「{{levelName}}」级别告警

告警资源:{{target}}

告警等级:{{levelName}}

告警信息:『 {{originContent}} 』

运营负责人:{{instance|jsonpath:'$.owner[*].name'|unique|join:','}}

告警首次发生时间:{{startTime|ts2str:'%Y-%m-%d %H:%M'}}

距离首次告警的持续时长:{{duration|duration_format:'zh'}}

事件详情:http://修改为您的平台地址/next/events/{{eventId}}/detail

策略详情:http://修改为您的平台地址
/next/events/alert-rule/alert-rule/{{ruleId}}/edit

保存配置后,当agent状态异常时,您将收到如下告警(以钉钉告警为例)

告警

 恢复

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/753561.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

初级 - 如何搭建一个Java Web项目 - 记录

目录 序言一、使用 Spring Initializr 创建创建一个Java 项目基本框架的方法1. 新建项目时,安装依赖理解Developer Tools 选项 !Web 选项 ! 其他选项具体详情请最下面的参考链接,这里就不一一列举了,只筛选出笔者当前需…

科技政策 | 国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》

文 | BFT机器人 近日,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》(以下称《办法》),自2023年8月15日起施行。国家互联网信息办公室有关负责人表示&a…

零代码编程:用ChatGPT自动登陆微信公众号后台

要实现微信公众号后台自动登陆&#xff0c;可以使用ChatGPT来编写Python代码实现。 微信公众平台账号密码登陆&#xff0c;要先点击“使用账号登录”&#xff0c;源代码是&#xff1a;<a href"javascript:;" class"login__type__container__select-type"…

Python自动化之pytest常用插件

目录 1、失败重跑 pytest-rerunfailures 2、多重校验 pytest-assume 3、设定执行顺序 pytest-ordering 4、用例依赖&#xff08;pytest-dependency&#xff09; 5.分布式测试(pytest-xdist) 6.生成报告&#xff08;pytest-html&#xff09; 1、失败重跑 pytest-rerunfailu…

web 前端 Day 4

盒子模型 <style>div {width: 300px;height: 300px;background-color: pink;padding-left: 4px; 左侧内边距border: 3px solid red;margin: 50px;}</style> padding 内边距 </head> ​ <body> ​<div>cfdaffshydghjgdjdnjjjjjjjjjjjjjjj&l…

springboot网吧管理系统

着科学技术发展&#xff0c;电脑已成为人们生活中必不可少的生活办公工具&#xff0c;在这样的背景下&#xff0c;网络技术被应用到各个方面&#xff0c;为了提高办公生活效率&#xff0c;网络信息技术飞速发展。在这样的背景下人类社会进入了全新的信息化的时代。网吧管理一直…

Jenkins持续集成项目实践 —— 基于Python Selenium自动化测试(二)

上一篇讲了如何搭建jenkins&#xff0c;这篇主要讲&#xff0c;怎么将自动化代码与jenkins衔接起来 jenkins上运行的两种方式&#xff1a; 第一种&#xff0c;在jenkins上面运行本地代码&#xff0c;操作如下: 新建项目&#xff1a;项目名称根据自己项目情况填写并选择自由模…

【C语言初阶(16)】操作符2

文章目录 Ⅰ关系操作符Ⅱ 逻辑操作符⒈操作符介绍⒉短路求值 Ⅲ 条件操作符Ⅳ 逗号表达式Ⅴ 下标引用、函数调用和结构成员⒈[ ] 下标引用操作符⒉( ) 函数调用操作符⒊结构体成员访问操作符 Ⅵ 表达式求值⒈隐式类型转换&#xff08;整型提升&#xff09;⒉算术转换⒊操作符的…

精品项目源码第52期运动会管理系统(代号V052)

精品项目源码第52期运动会管理系统(代号V052) 大家好&#xff0c;小辰今天给大家介绍一个运动会管理系统&#xff0c;演示视频公众号&#xff08;小辰哥的Java&#xff09;对号查询观看即可 文章目录 精品项目源码第52期运动会管理系统(代号V052)难度指数&#xff08;中高等&…

uboot、kernel启动过程分析

00、uboot的宏观启动 第1种&#xff1a;bootROM读取SPL到片内RAM&#xff0c;SPL初始化DDR&#xff0c;SPL把uboot程序copy到DDR&#xff0c;uboot启动进行必要外设初始化、自我拷贝、重定位等。 第2种&#xff1a;bootROM直接读取uboot的头部信息&#xff08;IVT、DCD&#xf…

python详解(8)——进阶(2):初步算法

目录 &#x1f3c6;一、前言 &#x1f3c6;二、时间复杂度 &#x1f3c6;三、递推 &#x1f6a9;1.简介 &#x1f6a9;2.爬楼梯 &#x1f6a9;3、猴子吃桃 &#x1f3c6;四、递归 &#x1f6a9;1、简介 &#x1f6a9;2、递归求斐波那契数列 &#x1f6a9;3、递归求阶乘 &#x…

【Git】Git 拉取的快速方法(含项目示例)

文章目录 一、问题的提出二、问题的尝试解决 一、问题的提出 在我们之前的拉取中&#xff0c;速度可能比较慢&#xff0c;例如&#xff0c;我们要拉取CLIP的项目。 (ldm) rootI1385efcc2300601b29:/hy-tmp/latent-diffusion# pip install githttps://github.com/openai/CLIP.…

Redis 从入门到精通【进阶篇】之高可用集群(Redis Cluster)详解

文章目录 0. 前言设计目标核心概念 1. 架构设计和原理1.1. 数据分片2. 节点间通信6. 扩容和缩容 2. 总结3. Redis从入门到精通系列文章4. Redis Cluster面试题4.1. Redis Cluster如何进行扩容和缩容&#xff1f;4.2. Redis Cluster如何进行故障转移&#xff1f;4.3. Redis Clus…

【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递(7 月 14 日论文合集)

文章目录 一、分类|识别相关(10篇)1.1 Video-FocalNets: Spatio-Temporal Focal Modulation for Video Action Recognition1.2 Watch Your Pose: Unsupervised Domain Adaption with Pose based Triplet Selection for Gait Recognition1.3 YOLIC: An Efficient Method for Obj…

【JavaEE】HTTP请求的构造

目录 1、通过form表单构造HTTP请求 2、通过JS的ajax构造HTTP请求 3、Postman的安装和简单使用 常见的构造HTTP请求的方式有一下几种&#xff1a; 直接通过浏览器的地址栏&#xff0c;输入一个URL&#xff0c;就可以构造一个GET请求HTML中的一些特殊标签&#xff0c;也会触发…

【Linux】1、装机、装操作系统、部署

文章目录 一、装系统1.0 格式化 U 盘1.1 做启动盘1.1.2 rufus1.1.2 poweriso 1.2 安装步骤 二、恢复系统2.1 BootManager2.2 recovery mode 一、装系统 下载地址&#xff1a; http://old-releases.ubuntu.com/releases/16.04.5/ubuntu-16.04.5-server-amd64.isohttps://mirro…

基于STM32 ARM+FPGA伺服控制系统(二)软件及FPGA设计

完整的伺服系统所包含的模块比较多&#xff0c;因此无法逐一详细介绍&#xff0c;所以本章着重介绍 设计难度较高的 FPGA 部分并简单介绍 ARM 端的工作流程。 FPGA 部分主要有 FOC 算法、电流采样算法及编码器采样算法&#xff0c;是整个控制系统的基础&#xff0c;直接…

本地appserv外挂网址如何让外网访问?快解析端口映射

一、appserv是什么&#xff1f; AppServ 是 PHP 网页架站工具组合包&#xff0c;作者将一些网络上免费的架站资源重新包装成单一的安装程序&#xff0c;以方便初学者快速完成架站&#xff0c;AppServ 所包含的软件有&#xff1a;Apache[、Apache Monitor、PHP、MySQL、phpMyAdm…

好物推荐文案怎么写吸引人?纯干货

互联网上充斥着各种各样好物种草文&#xff0c;一不小心就跌入了软文的圈套中&#xff0c;好物推荐文案写得好&#xff0c;流量绝对少不了。 好物推荐文案怎么写吸引人&#xff1f;通过整理总结上百篇爆款种草文案&#xff0c;总结出一套超实用的文案写作妙招&#xff01;纯干…

活动页服务端渲染探索

目标 通过采用在服务端渲染激励页的方式&#xff0c;降低页面加载白屏时间&#xff0c;从而提升激励 H5 渲染体验。 架构设计 前端服务框架调研选型 只对比分析以下两种方案&#xff1a; Vue3 Nuxt3 WebpackNext.js React Node.js ’Nuxt3Next.js介绍Nuxt是一个基于Vu…