业务流程监控:让多维度监控有了灵魂

news2024/11/15 13:46:56

需求

《可视化业务流程监控,是解决方案更是运维之道!》一文让我们知道可以借助Grafana 两个插件:Diagram、FlowCharting,满足我们对于图形+数据+业务流程的可视化监控,但是在使用前需要我们做好以下两点工作:

  • 源数据的完整性 这意味着我们仍要持续的进行多维度的监控指标的收集,不断丰富业务流程对关键指标的依赖。
  • 多数据源无法集中合并展示 受限于Grafana的Dashboard的数据源单一性,即无法在一个Dashboard中关联多个数据源进行集中展示。

以上第一点是一个长期性的工作,也是一个非常重要的基础性工作;而第二点我们可通过使用mix数据源,实现数据源合并展示。

图形化展示

相对于Diagram,FlowCharting通过draw.io进行图形化编排,结合各个数据源提供实时数据,并在流程图中定义数据与图表进行多样性交互:

  • 监视状态和性能
  • 与图表交互
  • 根据数据或状态改变显示的对象
  • 向对象添加链接
  • 充分利用变量来修改形状,颜色,链接,下载路径等。
  • 支持用于匹配和替换的正则表达式

以下是通过FlowCharting编排的几个DEMO:

1.网络拓扑图

在这里插入图片描述

2.扩展和伸缩图

在这里插入图片描述

3.架构图

在这里插入图片描述

4.告警事件和动画

在这里插入图片描述

通过以上几个DEMO的展示,可以看出FlowCharting丰富的图形化和数据展示功能。
当然运维还是要落地的,因此我们通过一个自定义流程来进行具体展示。

业务审批流程

现在我们有一个业务审批流程需要进行监控,之前总是出现卡审批的现象,需要业务运维拉开发人员来进一步定位,这无疑大大延长了故障修复时间。后来经过复盘,原因主要集中在以下几方面:

  1. Rabbitmq 队列生产速度>消费速度,导致消息积压;
  2. Kafka topic 生产速度>消费速度,导致消息积压;
  3. 业务应用发生异常导致无法消费;
  4. 等等

1.业务审批流程图

在这里插入图片描述

业务审批流程大致为:
收单–>Rabbitmq 相关队列 --> 信贷系统 --> 全面风险管理系统 --> Kafka 相关topic --> 其他业务自子系统
整个业务流程,我们通过监控Rabbitmq、Kafka相关队列的消费情况,来比运营人员更早的发现问题,甚至是提前将问题解决。

2.数据源设置metric

图中绿色部分是我们通过以下数据源与其关联的:

  • Zabbix数据源
  • ELK数据源

由于粒度比较粗,我们还可以添加prometheus、mysql等数据源来进行更好的补充。
在这里插入图片描述

3.数据关联

在这里插入图片描述

以上是我们对Rabbitmq其中的一个队列“cmis_rule_loan”进行数据关联,根据配置我们可以得到:

  • 绿色:正常,即队列积压低于50;
  • 橙色:队列积压超50;
  • 红色:队列积压超80;

比较有趣的是,当告警时可以在图中设置动画,如:反转、倾斜、闪动等,以便我们更好的发现问题。

总结

图形化的业务流程监控给我们运维打开了另一个维度的监控思路,之前我们的监控维度主要为:

  • 硬件监控
  • 服务器基础状态监控
  • 应用状态监控
  • 流量监控

这些监控可以帮助我们解决80%的问题,但总感觉缺少一点灵魂。通过业务流程监控正好可以补齐这个短板,以上各个维度的数据都可为业务流程监控提供数据支撑,这让我们的思维更进一个台阶。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/79825.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

修复自定义标题word题注错误:错误,文档中没有指定样式的文字以及编号无法随章节变化问题

一、单个修复指定章节号 假设采用自定义样式“毕业”,如果出现类似提示,可以具体操作如下: 光标定位与错误题注的位置,按shift F9 {STYLEREF 1 \s} - 2 将内容修改为 图 {STYLEREF "毕业" \s} - 2 右击,更…

被人叫做砖家模拟器的ChatGPT,它真的靠谱吗?

大家好啊,我是测评君,欢迎来到web测评。 前言 最近很热门的聊天机器人ChatGPT,据说五天时间用户就破了百万,这几天在体验过程中发现了一些问题,今天我就以下列几个方面来跟大家简单的交流下ChatGPT。 ChatGPT怎么注册国…

【博客555】prometheus的step,durations,rate interval,scrape interval对数据查询结果的影响

prometheus的step,durations,rate interval,scrape interval对数据查询结果的影响 1、场景:在查询prometheus数据时出现很多诡异的现象 1、为什么同样的查询语句在不同的时间点查询,对过去某一时刻的数据展示却不一样…

网络拓扑配置案例练习(VRRP,浮动路由,DCHP,三层交换机配置)

网络拓扑配置案例网络拓扑配置案例练习网络拓扑需求描述具体操作命令交换机创建vlan,配置access、trunk口,划分vlanvrrp配置路由配置验证vrrp和浮动路由DHCP配置总结网络拓扑配置案例练习 在这篇文章中将记录网络的常见配置:VRRP&#xff0c…

vue-cli和vue有什么区别

目录 1、什么是 Vue? 2、什么是vue-cli? 3、区别和关联 👉 区别 👉 关联 🍀 扩展知识 “vue-cli”和vue的区别:vue是“vue.js”的简称,是一个成熟的用于构建用户界面的JavaScript渐进式框…

「Docker学习系列教程」9-Docker容器数据卷介绍

通过前面8篇文章的学习,我们已经学会了docker的安装、docker常用的命令已经docker镜像修改后提交的远程镜像仓库及提交到公司的私服仓库中。接下来,我们再来学学Docker另外一个重要的东西-容器数据卷。 我们先来看看一个场景:我们有多个dock…

18. 权重衰退的代码的从零实现和简洁实现

通过一个简单的例子来演示权重衰减。 %matplotlib inline import torch from torch import nn from d2l import torch as d2l0.01就是权重,xi是随机的输入,噪音是均值为0,方差为0.01的一个正态分布 n_train,n_test,num_inputs,batch_size 2…

Alibaba 官方微服务扛把子「SpringCloudAlibaba 全彩学习手册.PDF」,开源学习ing,

最近我在知乎上看过的一个热门回答: 初级 Java 开发面临的最大瓶颈在于,脱离不出自身业务带来的局限。日常工作中大部分时间在增删改查、写写接口、改改 bug,久而久之就会发现,自己的技术水平跟刚工作时相比没什么进步。 所以我们…

Spring Batch 批处理入门案例

引言 书接上篇 何为Spring Batch?怎么玩? ,前面普及了一下Spring Batch 相关介绍,本篇来一个helloword,简单试一下Spring Batch 怎么玩 批量处理流程 开始前,先了解一下Spring Batch程序运行大纲&#x…

[附源码]计算机毕业设计惠农微信小程序论文Springboot程序

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

这些不知道,别说你熟悉 Spring

写在前面 我们大多数 Java 程序员的日常工作基本都是在做业务开发,俗称 crudboy。 作为 crudboy 的你有没有这些烦恼呢? 随着业务的迭代,新功能的加入,代码变得越来越臃肿,可维护性越来越低,慢慢变成了屎…

【亲测有用】ERR_PROXY_CONNECTION_FAILED的解决方案(电脑明明有网络,但就是无法访问浏览器的网页!)

一、问题描述 就我而言,每次遇到这种问题,都是因为电脑意外关机导致的。昨天,我忘记给电脑充电,结果一觉醒来,发现电脑明明有网络,因为微信、QQ甚至向日葵远程连接别的电脑都没有问题,但就是所…

基于java+springboot+mybatis+vue+mysql的漫画动漫管理网站

项目介绍 本系统主要包括管理员和用户两个角色组成,主要包括以下功能: (1)前台:首页、漫画资源、排行榜、交流论坛、公告信息、个人中心、后台管理 。 (2)管理员:首页、个人中心、…

算法基础篇-06-排序-NB三人组(快速/堆/归并排序)

1. NB 三人组介绍 1.1 快速排序(Quick Sort) 时间复杂度:O(nlogn) 归位: 让元素去它该去的位置,保证左边的元素都比他小,右边都比他大; 1.1.1 原理图示: 假设初始列表: 我们从左边第一个…

三秒钟,我要拿到世界杯所有队伍阵容信息

文章目录🕐Im coming~🕑我写了个啥?🕔咋写的?🕘代码供上🕛 See you next time专栏Python零基础入门篇🔥Python网络蜘蛛🔥Python数据分析Django基础入门宝典🔥…

硬核,阿里自爆虐心万字面试手册,Github上获赞89.7K

开篇小叙 现在Java面试可以说是老生常谈的一个问题了,确实也是这么回事。面试题、面试宝典、面试手册......各种Java面试题一搜一大把,根本看不完,也看不过来,而且每份面试资料也都觉得Nice,然后就开启了收藏之路。 …

CSS - 02. CSS进阶

文章目录CSS进阶1 Emmet语法1.1 快速生成HTML结构语法1.2 快速生成CSS样式语法1.3 快速格式化代码2 CSS的复合选择器2.1 什么是复合选择器2.2 后代选择器2.3 子选择器2.4 并集选择器2.5 伪类选择器2.6 链接伪类选择器2.7 :focus 伪类选择器2.8 复合选择器总结3 CSS 的元素显示模…

Pr:导出设置之多路复用器与常规

多路复用器 MULTIPLEXERH.264、HEVC(H.265)和 MPEG 等格式中包含多路复用器 MULTIPLEXER模块,可用于控制如何将视频和音频数据合并到单个流中(又称“混合”)。基本设置Basic Settings多路复用器Multiplexer视频和音频流…

SolidWorks综合教程

SolidWorks综合教程 SolidWorks 认证工程师 (CSWA​​) 考试的完美指南,包含实例、测验和实践培训 课程英文名:SOLIDWORKS Academy A Comprehensive Course on SolidWorks 此视频教程共11.0小时,中英双语字幕,画质清晰无水印&a…

Android编译优化~Gradle构建基准测试

背景 之前对安卓打包编译优化有所实践,但当时对优化提升结果采取了手动测试的办法才拿到结果,而且遇到大型工程更是痛不欲生。不过当时采取的策略是将增量测试代码提到了Git,编译一次抄一次代码,样本数据只重复了10次&#xff0c…