服务台需要跟踪的3个重要指标MTBF+MTTF+MTTR

news2024/11/15 21:55:47

衡量标准是IT服务管理的核心,可提供有关运营的见解,并帮助确定需要持续改进的领域。通常的服务台指标有助于展示内部运营效率。例如,衡量在规定时间内解决问题的工单数量的 SLA 是展示服务台效率的关键因素。另一方面,故障指标可帮助团队找出 IT 基础设施中的薄弱环节,并帮助评估对故障事件的响应。这有助于 IT 团队最大限度地减少故障可能对关键系统造成的连带影响。

IT服务管理

需要跟踪的关键失败指标是什么?在本文中,我们将看到探讨以下三个关键绩效指标:

1、平均无故障工作时间(MTBF)

当 IT 基础设施资产(无论是网络、服务器还是工作站等)频繁发生故障时,会对 IT 和业务服务的可用性产生连带影响。这些中断会导致收入和声誉的损失。如果某项 IT 资产经常出现故障,通常需要进行维修或更换。在此之前,调查并了解资产经常宕机的原因,以及是在什么情况下宕机,有助于制定资产维护计划,提高系统可用性。

平均无故障工作时间(MTBF)是帮助确定宕机原因的指标,有助于减少宕机时间或制定快速恢复计划,提高 IT 系统的可用性。如果某项 IT 资产的 MTBF 很低,就意味着该资产会经常停机,导致 IT 和业务中断。

MTBF 示例

在一家企业中,每当应用新的 Windows 固件更新时,存储驱动器的新更新总是失败。这种情况发生了几次,平均无故障工作时间变得越来越短。在对问题进行分析后,团队确定是第三方驱动程序导致执行更新所需的 API 无法实施或存在故障。当计划进行新的更新时,如果第三方驱动程序没有实施必要的 API,有两种可能的解决方案可供探索。比如将 API 与 SATA 和 NVMe 存储协议的 Windows 替代方案进行交换,或从原始设备制造商处获取新的、更好支持的驱动程序版本,都有助于实施更新、修复漏洞并堵塞安全漏洞。监控和跟踪驱动程序升级以及停机时间都有助于提高存储驱动器的可用性。

如何提高 MTBF

实施观察资产健康状况的流程,以跟踪和监控故障,有助于找出故障原因。

分析问题的根本原因,以提高认识、解决长期原因并提高资产性能。

制定快速反应战略,有效解决并减少影响运营的停机时间。目标是减少停机次数,延长停机时间。

2、平均失效前时间(MTTF)

资产经常出现故障会中断企业的 IT 运营,导致 IT 基础设施性能下降。MTTF 指标有助于确定资产、设备或组件的使用寿命。对于 MTTF 较低的 IT 资产和组件,通常更换 IT 组件比修复组件更省时,并能最大限度地降低运营影响和成本。

这尤其适用于与基础设施关键运行元素(如大型机服务器堆栈或网络接入点)相关联的 IT 组件。如果资产的 MTTF 不理想且经常出现故障,则表明 IT 资产不可靠,需要频繁更换,以免影响 IT 运营。

MTTF 示例

在一家 IT 软件开发公司,当数据和网络服务器堆栈中的交换机连接或断开电缆时,网络电缆就会松动、断开或损坏。由于数据传输中断,导致文件损坏。网络团队的进一步分析表明,CAT6 RJ45 跳线上的无卡塑料盖不断断裂。这是因为电缆是从使用廉价材料的制造商那里采购的。随后,IT 团队用质量更好的电缆替换了旧电缆,以确保今后移动电缆时不会出现数据丢失或损坏等问题。这是一个典型的例子,但定期跟踪电缆的 MTTF 有助于 IT 团队了解关键资产(如组件)的影响,从而就维修和更换做出明智的决策。

如何提高 MTTF

通过采购高质量的资产和停用低质量、低成本的资产来延长资产的使用寿命。

通过定期检查与关键资产相关的组件,防止大规模中断业务运营。

实施及时库存流程,估算资产的运行时间,从而降低资产存储的间接成本。

3、平均修复时间 (MTTR)

当关键 IT 系统发生故障时,IT 团队必须尽快恢复系统运行。延迟恢复 IT 系统会导致收入损失并影响关键业务运营。一个组织良好的恢复和响应系统可以帮助 IT 团队应对计划外停机,并有效地恢复运行。MTTR 衡量的是修复资产或排除故障并使其恢复运行能力所需的平均时间。

停机成本随着 MTTR 的增加而增加。MTTR 高说明恢复和响应操作不够迅速有效。系统故障是不可避免的,但 MTTR 能让团队对资产故障做出及时和战略性的反应。

MTTR 示例

一家软件公司正在开发的一款视频游戏因代码漏洞而遭到零时差攻击。这次攻击破坏了 Wi-Fi 和监控系统等操作。这导致攻击者访问了组织的网络域和机密业务文件。网络安全团队告知员工有关零日攻击的信息,以及他们可以在哪里报告这些攻击。该组织的所有 IT 资产都配备了下一代杀毒软件 (NGAV)。这次攻击导致局域网和员工自助服务门户瘫痪,使组织的运营陷入瘫痪。在攻击发生后一小时内,网络安全团队得到了 NGAV 的通知和帮助,NGAV 利用威胁分析和用户行为模式,识别出了可疑活动。网络安全团队立即运行补丁管理脚本,修正了代码中的漏洞,并锁定了内部网络,以避免进一步影响运营和数据窃取。

如何降低 MTTR

通过识别瓶颈、指定资产维修或更换,实行高效的资产管理战略,有助于推动更好的决策,还能够可以节省资金和存储空间。

明确技术人员的责任和角色,简化事故检测和解决流程。

为技术人员提供详细的标准操作程序,以减少停机期间的误传和混乱。

使用集中管理资产维护和监控信息的企业资产管理解决方案来衡量 MTTR。这还有助于优化资产利用率、收集资产数据和预测可能的停机时间。

结语

这些指标可帮助团队识别运营中的瓶颈及其对事件的响应能力,它们通过准确定位持续性事件的根本原因,帮助 IT 团队实现更高的运营效率。IT 团队可以清楚地了解 IT 运营受到影响的领域,从而改进其事件响应策略。企业可以将这些指标作为关键绩效指标而不仅仅是绩效目标来实施。这些指标指出了流程简化和运营改进的领域,而不仅仅是要达到的目标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1247010.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

那些被玩烂了的设计模式

单例模式 单例模式是指一个类在一个进程中只有一个实例对象(但也不一定,比如Spring中的Bean的单例是指在一个容器中是单例的) 单例模式创建分为饿汉式和懒汉式,总共大概有8种写法。但是在开源项目中使用最多的主要有两种写法&am…

SPSS信度分析

前言: 本专栏参考教材为《SPSS22.0从入门到精通》,由于软件版本原因,部分内容有所改变,为适应软件版本的变化,特此创作此专栏便于大家学习。本专栏使用软件为:SPSS25.0 本专栏所有的数据文件请点击此链接下…

HBase之Region Splitting

目录 Region Splitting步骤 Region状态过程 Region Splitting 步骤 RegionServer开始split region,SPLIT事务开启。RegionServer在表上获取共享读锁防止split过程中数据被修改。接着在zk中创建一个znode,标记为SPLITTING。Master 将会观察到该znode的创…

linux如何查看文件的hash数值

在Linux系统中,你可以使用各种工具来查看文件的哈希值。下面是一些常见的方法: md5sum命令: md5sum 文件名例如: md5sum example.txtsha1sum命令: sha1sum 文件名例如: sha1sum example.txtsha256sum命令&a…

Android 打包aar包含第三方aar 解决方案

Android 打包aar包含第三方aar 因项目需要,打包aar包含第三方aar,如果直接对module进行打包会产生一些问题。 * What went wrong: Direct local .aar file dependencies are not supported when building an AAR. The resulting AAR would be broken be…

加速你的自动化测试:3种等待方式!

在自动化测试中,等待是一个重要的技术,用于处理页面加载、元素定位、元素状态改变等延迟问题。 等待能够确保在条件满足后再进行后续操作,提高自动化测试的稳定性以及可靠性。 等待方式:显示等待、隐式等待、线程睡眠 1. 显式等…

Python丨让简历脱颖而出的关键,居然是“它”!

进入疫情后时代,各行各业都在力争新的发展!财会行业亦是如此,浏览各大招聘网站,不难发现财会相关岗位的招聘要求越来越“卷”,那求职者如何才能让自己获得面试邀请呢? 答案就是:一份亮眼且具有…

设计模式—开闭原则

1.背景 伯特兰迈耶一般被认为是最早提出开闭原则这一术语的人,在他1988年发行的《面向对象软件构造》中给出。这一想法认为一旦完成,一个类的实现只应该因错误而修改,新的或者改变的特性应该通过新建不同的类实现。新建的类可以通过继承的方…

Duplicate 模型中的 ROLLUP(十六)

因为 Duplicate 模型没有聚合的语意。所以该模型中的 ROLLUP,已经失去了“上卷”这一层含义。而仅仅是作为调整列顺序,以命中前缀索引的作用。下面详细介绍前缀索引,以及如何使用 ROLLUP 改变前缀索引,以获得更好的查询效率。 前…

【开源】基于Vue.js的城市桥梁道路管理系统的设计和实现

项目编号: S 025 ,文末获取源码。 \color{red}{项目编号:S025,文末获取源码。} 项目编号:S025,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块三、系统展示四、核心代码4.1 查询城市桥…

选择TikTok直播网络方案前的必读指南

真实、稳定、可靠的TikTok直播网络方案挑选需要考虑这三大要素: 原生IP、独享带宽、线路 之前小编也分享了不少关于TikTok直播网络搭建方法和注意事项的文章及用户案例,但还是不少TikTok直播卖家不知道各个方法有何区别,毕竟市面上说可以解决…

Centos 7、Debian、Ubuntu中tree指令的检查与下载

目录 前言 Centos 7中检查tree指令是否安装的两种办法 which指令检查 查看当前版本指令 不同版本下安装tree指令 Centos 7的发行版本 重点 Debian的发行版本 重点 Ubuntu的发行版本 重点 前言 在大多数Linux发行版中,tree命令通常不是默认安装的指令。…

动物病理学3d虚拟仿真场景还原系统提高学员的判断准确性

动物疾病检查培训存在着标本难找、操作复杂及费用高等难点,将VR虚拟现实技术应用到动物疾病检查培训中,突破了诸多传统限制,为学生提供更为真实、直观的学习体验,通过实践操作,提高培训效果和质量。 每种动物的系统模块…

2024第十二届成都国际智能驾驶技术展览会

2024第十二届成都国际智能驾驶技术展览会 2024 Chengdu International Autonomous driving Expo 时间:2024年7月17-19日 地点:成都世纪城新国际会展中心 指导单位: 成都市人民政府 四川省经济和信息化厅 重庆市经济和信息化委员会 推动…

跨境电商贸易多币种处理:策略、方法与解决方案

在跨境电商中,企业需要与不同的跨境客户打交道,用客户喜欢的货币进行收款是一项很有挑战性的任务。现在,使用Zoho Books的高级多币种处理功能,这将变得毫不费力。 注:此功能在Zoho Books的精英版和旗舰版下可用。 商业全球化为商…

牛客 算法题 记负均正II golang实现

题目 HJ105 记负均正II golang 实现 package mainimport ("bufio""fmt""io""os""strconv""strings" )func main() {scanner : bufio.NewScanner(os.Stdin)nums:make([]int,0)sum:0minus:0for scanner.Scan() {l…

虚幻学习笔记—给UI添加动画

一、前言 本文所使用的虚幻版本为5.3.2,之前工作都是用unity,做这类效果用的最多的是一个DoTween的插件,在虚幻中都内置集成了这这种效果制作。 图1.1 UI动画 二、过程 1、首先,在诸如按钮、图像等可交互控件中选中,如…

JoySSL OV证书

JoySSL OV证书全称为Organization Validation SSL证书,属于组织验证型SSL证书。它是一种增强型的SSL证书,不仅能够提供基本的数据加密功能,还能提供更高级别的安全保障。通过验证申请者身份的方式,确保了用户访问的网站是由合法的…

2023年微软开源八个人工智能项目

自2001年软件巨头微软前首席执行官史蒂夫鲍尔默对开源(尤其是Linux)发表尖刻言论以来,微软正在开源方面取得了长足的进步。继ChatGPT于去年年底发布了后,微软的整个2023年,大多数技术都是面向开发人员和研究人员公开发…

快速入门Postman接口测试,让你轻松掌握接口测试技能!

1.postman界面 下载安装postman工具,以下是postman的界面 快捷区:提供常用的操作入口,新建请求,执行器,导入别人共享的收藏夹测试数据,包括运行收藏夹的一组测试数据; 侧边栏:搜索栏…