优维全面可观测产品能力分解⑥:运维状态可观测

news2024/9/28 5:56:46

本文是《优维全面可观测产品能力分解》系列文章的第六篇:『运维状态可观测』。基于可观测的数据体系,「运维状态可观测」是实现于运维状态的一次深入可观测。

在日常运维场景中,系统/应用运维人员重点关注的是系统/应用是否可用,使用是否流畅及是否够用。基于此,「运维状态可观测」提供三大观测能力,包含可用性管理、性能管理、容量管理。其中,【可用性管理】则是结合SRE的SLO&SLI体系,呈现所有系统的可用性目标和可用性指标情况;【性能管理】是从性能的角度全面查看系统、服务和接口的性能情况,并快速识别出系统瓶颈;【容量管理】是从容量规划、容量呈现、容量运营等角度,实现对系统、应用的动静态容量管理。

1

可用性管理

可用性管理是确保任何IT服务一致且成本高效地提供客户所需的一致可靠服务级别的过程。可用性管理涉及最大程度地减少服务损失,并确保在服务丢失时采取适当措施。优维提供的【可用性管理】综合了服务的拨测成功率和SLO进行对比分析,通过可视化的形式,呈现所有系统的可用性目标与可用性指标,帮助企业有效衡量服务的可用性。

在可用性管理能力开发之前,基于实践观察,优维技术团队从三个方面梳理了当前企业在可用性管理上的痛点所在:

  • 系统及应用服务缺少可用性标准。
  • 无法实时掌握系统及应用服务的稳定性,也无法知道可用性是下降还是上升。
  • 无法横向对比系统的可用性,哪个系统做的好,哪个系统做的差。

基于对企业在可用性管理上的痛点洞察,优维研发的【可用性管理】在统一的标准规范指引下,设定系统及应用服务的可用性目标及计算工时,以目标倒推系统的可用性维护。其次,可查看年、月、周、天为单位的系统/应用服务的可用性,并支持周对比、月对比,从而查看可用性是在提升还是下降,以便进一步制定可用性治理手段。并提供系统间可用性排行榜,明确红榜黑榜。

在场景应用上,满足不同IT人员对可用性管理的需求。

  • 产品负责人:可制定某个时间周期内系统的服务等级目标SLO,以便其能够定义用户在使用业务系统时所期望的服务质量水平,并提供一个标准作为开发和运维团队的参考与评估。
  • 业务运维负责人:可根据不同系统特征(A类、B类、C类),围绕SLO制定可衡量服务质量/服务可用性水平的SLI,通过SLI具体指标去描述SLO,进而衡量SLO的达成情况。
  • 应用系统运维负责人:能够和运维团队一起制定应用系统内容要统计应用服务权重与接口服务黑/白名单,以便其根据企业管理要求或业务特征,通过权重/黑白名单的配置,排除干扰数据,提升可用性计算的合理性与准确性。同时,还可查看某个时间周期内,各个应用系统的可用性分析视图,以便其制定应用系统运维后续的可用性改进措施。

2

性能管理

目前对很多行业来说,IT技术正在支撑着关键的业务应用,为此关键业务应对性能有较高要求,性能下降往往对业务造成巨大损失。面对这些问题,需要一系列工具和方法,能够对IT系统的性能进行监控与管理,并对可能出现的性能问题进行及时、准确的分析和处理。从而改善服务品质,减少操作失败和灾难发生的风险,减少维护运营的整体成本,提高系统的可用性、缩短响应时间,提高用户的满意度。

因此,性能管理的重要性不言而喻,而在实际的系统运维维护的过程中,企业在性能管理上依然面临着以下问题:

  • 缺乏统一的系统性能评估手段,导致性能认知及系统建设方法不统一。
  • 性能问题解决效率慢,无法准确定位到木桶短板。

为此,优维在系统性能的观测与管理上,通过提供系统/应用的性能管理视图,以CMDB系统/应用树来呈现性能状态。同时,构建面向系统/应用服务的应用性能评估体系(Apdex),便于IT运维人员快速识别系统性能瓶颈。从业务到技术,从全局到局部,层层分析定位,帮助运维人员有效定位性能木桶短板。

在核心能力上,优维【性能管理】提供的「性能看板」功能模块,可进行系统/多服务横向对比,查看全量系统/应用服务概览,也可拆分多个生产环境,查看单系统/单应用服务的详情看板;同时,提供系统间性能排行榜,明确红黑榜Top5。另外,【性能管理」支持基于Apdex通用标准,自定义配置阈值。

3

容量管理

容量管理的核心职责是提供一个符合企业成本与利益的、及时的策略来保证IT服务与基础设施,始终达到或者超过当前业务的需求,促使业务的健康发展与IT服务的降本增效。优维研发的【容量管理】是从容量规划、容量呈现、容量运营等角度,实现对系统、应用的动静态容量管理。


通过对企业客户的深入调研,优维从四个方面有针对性的为企业提供容量管理服务。

  1. 由于企业业务不断变化,关联系统的容量支撑不得而知。为此,优维的【容量管理】可基于业务容量的变化情况,全面预估服务及容量是否能支撑业务需要。
  2. 企业缺乏系统及应用服务容量水平的实时监控。针对这一痛点,优维【容量管理】可实时掌握系统及应用服务的性能容量和资源容量状况,并定时提醒运维负责人做出改进。
  3. 企业在面临重大活动及节假日(禁止变更),系统/资源容量难以提前评估支撑。企业可利用优维【容量管理】查看活动及节假日的业务变化情况,全面评估及预测系统/资源容量水平,制定容量应对手段,从而很好的支撑业务。
  4. 缺乏主动容量管理,不足以预留足够的时间应对周期性业务变化。对此,优维【容量管理】通过建立周期性容量规划和预测机制,全面评估容量情况,制定改进计划,并落实解决。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1541364.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

谧林涓露门禁

原神武器升级材料谧林涓露和门禁好像聂。 difference(){union(){cylinder(2, 10,10, $fn365);hull(){translate([15,0,0])cylinder(1,2,2,$fn365);cylinder(1,10,10,$fn365);}}translate([15,0,-1])cylinder(4,1,1,$fn365); }

透视未来工厂:山海鲸可视化打造数字孪生新篇章

在信息化浪潮的推动下,数字孪生工厂项目正成为工业制造领域的新宠。作为一名山海鲸可视化的资深用户,我深感其强大的数据可视化能力和数字孪生技术在工厂管理中的应用价值,同时我们公司之前也和山海鲸可视化合作制作了一个智慧工厂项目&#…

读算法的陷阱:超级平台、算法垄断与场景欺骗笔记19_前方的路

1. 技术与财富分配不均 1.1. 当前的财富分配不均早已成为世界难题 1.1.1. 世界上有一半的人口——相当于35亿人——拥有的财富却不敌在一辆双层巴士上的商业精英的个人财富总和 1.2. 部分线上市场仍受到竞争机制支配的事实并不能为其他市场的反竞争策略开脱 1.3. 企业的市场…

计算机组成原理-5-输入输出系统

5. 输入输出系统 文章目录 5. 输入输出系统5.1 概述5.1.1 I/O系统的发展概况5.1.2 I/O系统的组成5.1.3 I/O设备与主机的连接5.1.4 I/O设备与主机传送信息的控制方式 5.2 I/O设备5.3 I/O接口5.4 控制方式5.4.1 程序查询方式5.4.2 程序中断方式5.4.3 DMA方式5.4.4 程序中断方式与…

数字乡村发展策略:科技引领农村实现跨越式发展

随着信息技术的迅猛发展和数字经济的崛起,数字乡村发展策略已经成为引领农村实现跨越式发展的重要手段。科技的力量正在深刻改变着传统农业的生产方式、农村的社会结构以及农民的生活方式,为农村经济发展注入了新的活力和动力。本文将从数字乡村的内涵、…

MySQL数据库 - 事务

1. 事务的概念 事务主要用于处理操作量大,复杂度高的数据。比如说,在人员管理系统中, 要删除一个人员,即需要删除人员的基本资料,又需要删除和该人员相关的信息,如信箱, 文章等等。这样&#x…

Docker 之 数据卷

目录 1. 数据卷是什么 1.1 运行一个带有容器卷存储功能的容器实例 2.能干什么 3. 容器卷案例 3.1 宿主机vs容器之间映射添加容器卷 3.1.1 命令添加: 3.1.2 查看数据卷是否挂载成功 3.1.3 容器和宿主机之间数据共享 3.2 读写规则映射添加说明 3.2.1 读写&…

chatgpt和 github copilot chat哪个更强

chatgpt大家应该都不陌生 ChatGPT 是由 OpenAI 开发的一种基于 GPT(生成式预训练模型)的聊天机器人。它可以生成语言上下文相关的响应,从而进行自然语言对话。ChatGPT 利用大规模的语言数据进行预训练,并通过微调或在线学习来适应…

10基于访问权限控制和细粒度控制的方式访问资源

访问权限控制 RBAC 基于角色的访问控制(Role-Based Access Control)是按角色进行授权,如主体的角色为总经理时才可以查询企业运营报表和员工工资信息等 缺点:查询工资所需要的角色变化为总经理和部门经理,此时就需要修改判断逻辑为判断用户角色是否为…

02课程发布模块之部署Nginx

部署Nginx 部署网关 通过Nginx访问后台网关,然后由网关再将请求转发到具体的微服务,网关会把请求转发到具体的服务 upstream gatewayserver{server 127.0.0.1:63010 weight10; } # 网站首页对应的虚拟机 server {listen 80;server_name www.51xuecheng.cn…

AtCoder ABC346 A-E题解

比赛链接:ABC346 Problem A: 签到题。 #include <bits/stdc.h> using namespace std; const int maxn105; int A[105],B[105]; int main(){int N;cin>>N;for(int i1;i<N;i)cin>>A[i];for(int i1;i<N;i){B[i]A[i1]*A[i];cout<<B[i]<<end…

【Godot4.2】像素直线画法及点求取函数

概述 基于CanvasItem提供的绘图函数进行线段绘制只需要直接调用draw_line函数就可以了。 但是对于可以保存和赋值节点直接使用的纹理图片&#xff0c;却需要依靠Image类。而Image类没有直接提供基于像素的绘图函数。只能依靠set_pixel或set_pixelv进行逐个像素的填色。 所以…

Linux 的 app :一般到哪里下载 ?(**)

利用 appimagetool 工具对开发好的项目进行打包 &#xff08;***带笔记*&#xff09; https://blog.csdn.net/ken2232/article/details/131313613 1. 首选&#xff0c;直接通过 OS发行版的官网仓库&#xff1a;简单、方便&#xff1b;可能相对最可靠。 如&#xff1a; sudo a…

matlab基于Simulink的模糊逻辑控制应用

一、原理 模糊逻辑指模仿人脑的不确定性概念判断、推理思维方式&#xff0c;对于模型未知或不能确定的描述系统&#xff0c;以及强非线性、大滞后的控制对象&#xff0c;应用模糊集合和模糊规则进行推理&#xff0c;表达过渡性界限或定性知识经验&#xff0c;模拟人脑方式&…

基于YOLOv8深度学习的橙子病害智能诊断与防治系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分类

《博主简介》 小伙伴们好&#xff0c;我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源&#xff0c;可关注公-仲-hao:【阿旭算法与机器学习】&#xff0c;共同学习交流~ &#x1f44d;感谢小伙伴们点赞、关注&#xff01; 《------往期经典推…

算法:bfs(深度优先搜索)

// dfs习题&#xff1a; // 输入9行&#xff0c;0代表未知 // 输出9行即最终结果 #include <stdio.h> #include <stdlib.h> int main() {int table[9][9];//输入数据for (int i 0; i < 9; i) {for (int j 0; j < 9; j) {scanf("%d", &table[…

js工具方法记录

校验数字是否有效的11位手机号 function isValidPhoneNum(value: string) {return /^[1][3,4,5,6,7,8,9][0-9]{9}$/.test(value) }手机号中间4位掩码 function maskPhoneNum(phone: string, space false) {if (!phone) {return }const reg /(\d{3})\d{4}(\d{4})/return pho…

【测试开发学习历程】MySQL分组查询与子查询 + MySQL表的联结操作

目录 1 MySQL分组查询与子查询 1.1 数据分组查询 1.2 过滤分组 1.3 分组结果排序 1.4 select语句中子句的执行顺序 1.5 子查询 2 MySQL表的联结操作 2.1 关系表 2.2 表联结 2.3 笛卡尔积 2.4 内部联结 2.5 外联结 2.6 自联结 2.7 组合查询 1 MySQL分组查询与子查询…

LangChain-Chatchat知识库对话

前言 上次我们完成了Chatchat的本地部署&#xff0c;使用了LLM对话的功能。这次我们尝试一下其他的功能&#xff0c;之前总是有报错没有跑通&#xff0c;这次处理了几个问题之后才跑通了知识库对话和文件对话。 知识库对话 原理: 首先我们看这个图可以明白&#xff0c;知识库…

Redis学习二--常见问题及处理

基本概念 Redis基本概念数据结构 机制 持久化机制&#xff1a; RDB(内存快照)&#xff1a;某一时刻的内存快照以二进制的方式写入磁盘&#xff0c;可以手动触发和自动触发。 优点&#xff1a;生成文件小&#xff0c;恢复速度快&#xff0c;适用于灾难恢复。 缺点&#xff1a…