详解ZabbixBSM是啥?业务服务监控达到全新高度

news2024/12/27 1:03:51

感谢本文译者赵广生 ! 欢迎更多资深用户,结合自己使用经验翻译原厂博文!

赵广生

· 毕业于北京外国语大学(信息管理与信息技术);

· 毕业后先后在多个公司从事信息化运维管理工作;

· 主要涉及虚拟化领域vmware以及超融合平台(Nutanix),拥有多年经验。

►详细了解 Zabbix 业务服务监控功能并查看我们的真实用例。这篇文章基于Aleksandrs Petrovs-Gavrilovs 的 Zabbix Summit 2022 演讲。

目录
1.使用 Zabbix 进行业务服务监控
2.业务服务层次结构示例
3.金融机构的业务服务树
4.MSP 的业务服务树

使用 Zabbix 进行业务服务监控

本文是关于高级业务服务和 SLA 监控以及相关用例的文章。你们中的一些人可能已经熟悉业务服务及其背后的核心思想。在绝大多数组织中,我们都有提供给客户或/和供内部使用的服务。这些服务的可用性通常基于硬件、软件或人员的存在和可用性。

但无论我们的监控配置得多么好,有时我们都会错过每个特定设备如何影响我们的业务,而这正是业务服务监控可以帮助我们的地方。

借助业务服务监控,可以根据基础架构每个部分的状态查看您的业务到底发生了什么。这让我们、管理员和服务所有者能够理解当硬件损坏或设备无法访问时的真正含义。通过业务服务监控,我们可以了解究竟是什么影响了我们的业务以及情况有多严重,包括计算 SLA(服务水平协议)并根据定义的 SLO(服务水平目标)对其进行评估。

业务服务层次结构示例

因此,让我们查看一些示例,了解现实生活中的业务服务可能是什么样子。

在这里插入图片描述

在此示例中,我们有一个基于支持服务的服务树。它有电话,电话插入 PBX,而 PBX 插入交换机。这只是一个例子,在现实中,我们可以有一个更复杂的基础设施,包括容器、CRM 服务等。我们当然会监控所有这些,但如果我们也对业务角度感兴趣怎么办?

要查看业务透视图,我们需要转到主菜单中的新服务部分,我们可以在其中创建和查看服务树本身。此外,在同一部分中,我们可以配置操作,这使我们能够在其中一项服务发生问题时做出反应。我们还可以指定我们努力实现的 SLO,并查看有关当前情况的 SLA 报告。

在这里插入图片描述

服务视图还可以让我们查看是否存在影响我们服务的问题并跟踪其根本原因。

在这里插入图片描述

定义哪个服务受到哪个问题的影响是通过使用问题标签来完成的,问题标签本质上将它们链接在一起。服务也可以有自己的标签,我们用它来对服务进行分组并了解一项服务与另一项服务的关系。我们还可以使用服务标签来构建 SLA 报告或在服务受到问题影响时执行操作。权限也基于服务标签,允许为不同的用户创建不同的视图。

但这些只是基础知识——更有趣的是实际用例。让我们看看 Zabbix 用户如何根据真实的业务示例实际使用业务服务监控来发挥自己的优势。

金融机构的业务服务树

真实的业务服务用例可能是有用的示例,可以帮助您设计自己的 Zabbix 业务服务树。也许您已经拥有自己的类似业务,并且您需要一切都可以“点击”的起点——该起点可以是现实生活中的例子。

在这里插入图片描述

第一个例子看起来有点复杂,但实际上非常简单。这里我们可以看到一个真实的金融机构业务服务树。你可以看到他们有很多不同的互连服务。首先查看服务树原始模式可能有点混乱,但在 Zabbix 中它非常简单。

内部服务连接到电子邮件,电子邮件同时与客户服务相关,因为我们确实需要与客户沟通,而不仅仅是内部!此外,我们还必须定义代表支持我们电子邮件服务的底层系统和应用程序的服务。使用 Zabbix 服务很容易做到这一点。

在这里插入图片描述

现在想象一下,如果您根本没有服务功能,当您只有多个设备的问题列表时,您能多快检查电子邮件服务的状态?如何查看全年的服务统计数据?这是服务所有者和管理员在此用例中遇到的问题,他们通过定义 Zabbix 业务服务树解决了这个问题。

在这里插入图片描述

我们首先定义根业务服务——金融机构。它与 15 项主要服务相关联。这 15 项服务分为内部服务和外部服务。较低级别的服务还包含主要服务所基于的子服务。即,我们有一个基于特定 VM 可用性的会计服务,会计软件驻留在其中。

在这里插入图片描述

服务分为特定类别,因此服务所有者可以更轻松地了解情况,而无需花费大量时间来弄清楚哪个问题导致了哪种情况。只需单击一下,服务所有者就可以立即看到每个服务基于哪些组件或子服务以及实际的服务 SLA。这还有利于显示根本原因问题,并能够快速识别哪些子服务导致特定业务服务出现问题。

在这里插入图片描述

不要忘记,业务服务树可以是多级的——子服务可以有自己的子服务,服务也可以相互连接。例如——在父子服务关系截图中,我们可以看到我们有一个会计服务。会计使用Microsoft服务。Microsoft服务也在内部使用。那么当Microsoft服务停止工作时会发生什么?我们将知道会计将受到影响,内部服务将受到影响,我们将看到确切的事件链——组织中到底出了什么问题以及如何出错,以及哪些组件需要修复。

在这里插入图片描述

服务会对您的业务产生不同的影响。有些服务比其他服务更重要。附加规则使 Zabbix 能够考虑潜在的服务影响。前两个附加规则分析受影响的子服务的百分比,并相应地设置服务问题的严重性。

但如果这两个最关键的服务受到影响,那将立即成为一场灾难。例如网上银行——你可以想象现在任何一家银行都有网上银行服务,如果它出现故障——所有的客户都会受到影响;它甚至可以登上新闻,而不仅仅是监控。因此,他们当然想立即了解那种灾难,而使用 Zabbix 服务——他们会的。通过定义额外的规则和服务权重,您可以先发制人地对问题做出反应并在问题导致最终用户停机之前解决问题。

在这里插入图片描述

在Zabbix中,我们可以选择计算SLA的时间段——每天、每周、每月、每年,或者这些的混合选择。根据我们的选择,我们可以看到服务的实时报告,例如,到年底或一天,了解最需要关注的内容并审查服务绩效。或者举一个更接近现实的例子——通过会计报告找出许可证是否及时更新,以便会计使用的软件始终可用。我们还可以构建一个包含报告的仪表板,显示服务的当前摘要是什么,以便他们可以计划、购买新软件、购买新许可证和获得新硬件,并始终领先于可能发生的任何事情。

在这里插入图片描述

用户角色中的服务权限可用于创建不同的服务视图。这可用于隐藏敏感的服务信息或仅以所需的详细程度显示服务。例如,可以为内部支持用户提供更详细的视图,因为他们需要尽可能多的信息来解决任何与服务相关的问题。可以为会计和管理团队提供单独的视图,仅显示相关数据以确保快速可靠的决策过程。

如果我们想让会计和管理团队的工作变得更加简单怎么办?我们可以使用操作和计划报告功能将所需信息传递到用户邮箱,而无需他们定期登录 Zabbix。

在这里插入图片描述

MSP 的业务服务树

另一个例子是 MSP(托管服务提供商)服务树。这个用例经常遇到,即使在原始模式视图中,树也总是很容易阅读,如下所示:

在这里插入图片描述

我们以托管公司为例。该公司为其用户提供一组特定的服务。还有一些内部服务也可以被客户使用——例如,Zabbix 本身。

Zabbix 可以成为 MSP 场景中的一个很好的工具,因为它可以直接为客户提供对 Zabbix 的访问权限,并使用与特定用户相关的最新统计信息构建仪表板视图。在这个例子中,我们可以看到托管的主要服务,划分给客户,其中每个客户都是该树的一个分支,使用公司提供的托管服务。我们还看到监控本身就是一项服务,因为在这种情况下,客户还可以利用 Zabbix 获取有关他们使用的服务及其当前状态的详细信息。查看他们使用的服务器的当前 SLA 级别,是否符合预期。

在这里插入图片描述

当然,MSP 保留了客户的完整视图,所有客户都同等重要,都应该得到适当的服务质量,因此当然每个客户都会被分配到相同的权重。一旦任何客户出现问题,相关服务将在服务树上标记为高级别严重性。这样,MSP 将立即看到受影响的客户,从而可以尽快为他们提供帮助。

如果你有一个更大的环境——也许你有数百个客户,你可能会选择不在你的配置中定义服务权重,因为服务的数量变化非常快。那么我们如何应对全球性问题呢?我们可以使用百分比规则,而不是仅对静态重量数字做出反应。通过这种方式,我们可以检查问题是与单个客户有关,还是全球性的,现在每个人都受到影响。

服务中的根本原因视图将使您能够立即开始修复所有问题。同时,可以使用服务动作和条件单独通知每个客户。如果我们正确命名或标记了服务,这应该很容易做到。

在这里插入图片描述

不要忘记定义权限,这样任何客户,就像这里的 Mooyani,都可以在登录后立即访问他们的服务,确保信息不仅保持私密性,而且与当前用户相关。

在这里插入图片描述

客户的所有信息都可以放在他们的个人仪表板上,他们可以在需要时随时查看所有详细信息。监控通过其 VM 的流量、资源使用情况、应用程序状态和任何其他受监控的实体。不要忘记服务 SLA 报告也可以放在 Zabbix 仪表板上。通过这种方式,您的客户可以看到 MSP 符合协议中定义的条款,并且一切都按预期执行。

总而言之——从任何角度监控您的基础设施都很棒,包括业务监控。将此视图作为 MSP 提供给您的客户始终是一个好主意,这样他们就可以看到我们满足了我们为自己定义的标准以及对用户的课程承诺。

往期推荐

薅羊毛|3折!怎样1天就拿下Zabbix6.0认证专家证书?

周四在线课|如何实现Prometheus对K8S的监控?

密码重置、API调用、远程命令,Zabbix用户必知的几个技巧

PPT免费放送|Zabbix峰会结束了?还有件儿事!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/350569.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pytorch离线安装

windows下离线安装pytorch,很多内网机,无法连接外网,只能下载whl文件进行离线安装下载pytorch,地址https://download.pytorch.org/whl/torch_stable.html我是windows,Python37,没有gpu,所以选择…

如何利用知识库加强内部管理?

许多公司都知道需要有一个面向客户的知识库,以加强客户服务,提供更好的客户体验。 但是很多企业没有意识到的是,拥有一个内部知识库软件对于员工改善沟通和促进知识共享的重要性。 协作是组织成功的关键部分,通过明确的远景和使…

怎么看电脑显卡?3个步骤,1分钟学会

显卡作为电脑重要的组成部件,具有重要的作用。很多小伙伴买回来电脑后,想要查看电脑显卡,却不知道怎么看电脑显卡?别着急,今天小编就应各位小伙伴的要求,以图文的方式,3个步骤教你如何看电脑显卡…

C++设计模式(15)——代理模式

亦称: Proxy 意图 代理模式是一种结构型设计模式, 让你能够提供对象的替代品或其占位符。 代理控制着对于原对象的访问, 并允许在将请求提交给对象前后进行一些处理。 问题 为什么要控制对于某个对象的访问呢? 举个例子&…

分享117个HTML婚纱模板,总有一款适合您

分享117个HTML婚纱模板,总有一款适合您 117个HTML婚纱模板下载链接:https://pan.baidu.com/s/1cC3I5cfh91-KmQj4nfSoPA?pwd9hod 提取码:9hod Python采集代码下载链接:采集代码.zip - 蓝奏云 import os import shutil import …

懂九转大肠的微软New Bing 内测申请教程

最近微软的New Bing开放内测了,网上已经有拿到内测资格的大佬们对比了ChatGPT和New Bing。对比结果是New Bing比ChatGPT更强大。来看看具体对比例子吧 1.时效性更强 ChatGPT的库比较老,跟不上时事,比如你问它九转大肠的梗,ChatG…

初级调色转档CameraRaw

一级调色 还原-曝光-色彩-细节-质感 修图的范围 整体(掌握基本面板)——局部(曲线)——具象(混色器) 修片最开始的准备工作 看直方图:明暗跟色彩的数据表 分析图片是否存在以下问题: 1.曝光…

Linux权限概念

目录 Linux权限的概念 什么是权限 如何去操作权限 设置文件所属角色 设置文件属性 umask 粘滞位 Linux权限的概念 首先我们要了解到,在linux下有两种用户:超级用户(root)和普通用户。超级用户的命令提示符是“#”,普通用户的命令提示…

亚马逊测评自养号需要注意的五点

一.有自己的一套环境系统市场上有很多系统,但很多都是现成的或软件包,没有解决风控的能力,这个还需要大家自己甄别的哈,如果有需要建议大家自己学习一套,把技术掌握在自己手里,这样不会有依赖性&#xff0c…

零基础、学历无优势、逻辑能力一般”,能转行做程序员吗?

此前,拉勾数据研究院对程序员群体做了一次深入调查,并发布了《2022程序员群体职场洞察报告》,报告显示,“高薪”依然是程序员的职业标签之一。 在调查的程序员群体中,年薪在10-30万元之间的人数占比为66.7%&#xff0…

V4l2框架基础知识(三)

V4L2框架概述 V4L2框架主要部分组成: V4L2_device:管理所有设备; media_device:media_device框架管理运行时的pipeline; V4L2_device 这个是整个输入设备的总结构体,可以认为他是整个V4L2框架的入口,由该…

分享53戏源代码总有一个是你想要的(亲测每一个均可用)

收集整理不容易老铁支持我动力! 53戏源代码下载链接:https://pan.baidu.com/s/1MI_EvHNFKoUu-l8LR6MAmg?pwdass5 提取码:ass5 下面是项目的名字,我放了一些图片,大家下载后可以看到。 c#版植物大战僵尸 H5纸牌接龙…

猿人学 第十六题

使用XHR断点找到XHR发送位置向上跟栈,会发现在ajax中发现m已经生成,向上追踪代码继续向上追,发现m在i中出现,并在r.m中生成进入n[e(528)]方法,发现作用只是返回e(t)p_s为获取当时时间的方法 btoa为方法点击进入btoa方法…

玩机搞机------高级改良型高通工程线制作方法。

很多普通玩家对工程线的定义还停留在早期短接红绿端的操作认知上。例如这个 常规制作工程线 或者短接主板触点方式 今天给大家描述的是更高级改良型的工程线。因为前期的这种工程线对于米6或者其他同时期机型已经不起任何作用。后期机型进入高通edl模式就需要拆机手动短接主板触…

pytorch各种版本最简单安装,不用自己安装cuda cudnn

pytorch各种版本 pip 安装命令 查看官网 https://pytorch.org/get-started/previous-versions/ conda pytorch 安装 1、安装conda, 2、创建并并激活虚拟环境 - conda create -n pytorch_1.7 python3.7 - conda activate pytorch_1.7 3、虚拟环境中 pip 安装想要的…

升级Room引发的惨案!!

kotlin升级 在升级kotlin的时候,直接升级到大版本的kotlin(比如1.7以上),直接报错,只是报错不知道原因。 koltin Release details 后来把koltin版本改成1.6.0,报如下的错,我们才知道gradle是需…

积水内涝监测——埋入式积水终端设备介绍

一、设备概述 埋入式积水终端是针对城市内涝推出的积水信息监测采集设备,采用超声波传感技术,对积水的深度进行精确的测量。产品能够在低温、腐蚀环境下可靠运行本产品特别适用于智慧城市中,对城市道路、社区低洼处的积水进行实时监测上报到…

(十)、通过云对象修改阅读量+点赞功能的实现【uniapp+uinicloud多用户社区博客实战项目(完整开发文档-从零到完整项目)】

1,通过云对象importObj修改阅读量 1.1 新建云对象 1.2 云对象中写自增自减方法 封装云对象utilsObj中的自增自减方法,方法名取为operation,传递4个参数。 // 云对象教程: https://uniapp.dcloud.net.cn/uniCloud/cloud-obj // jsdoc语法提…

火山引擎数智平台的这款产品,正在帮助 APP 提升用户活跃度

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 你有没有关注过 APP 给你推送的消息? 出于提升用户活跃度的考虑,APP 会定期在应用内面向用户进行内通推送,推送形式既包括 APP …

查看jdk安装路径,在windows上实现多个java jdk的共存解决办法,安装java19后终端乱码的解决

查看jdk安装路径, 在windows上实现多个java jdk的共存解决办法, 安装java19后终端乱码的解决 目录 一、查看jdk(java开发工具包)安装路径的方法 二、在windows上实现多个java jdk的共存 (1)、安装好多…