操作系统基础知识介绍之可靠性与可用性(包含MTTF、MRBF、MTTR等)

news2025/1/10 21:01:37

计算机是在不同的抽象层上设计和构建的。 我们可以通过计算机递归地下降,看到组件将自身放大为完整的子系统,直到我们遇到单个晶体管。 尽管有些故障很普遍,例如断电,但许多故障仅限于模块中的单个组件。 因此,一个模块在一个级别上的完全故障可以被认为仅仅是更高级别模块中的组件错误。

一个困难的问题是确定系统何时正常运行。 随着互联网服务的普及,这一理论观点变得更加具体。 基础设施提供商开始提供服务水平协议 (SLA) 或服务水平目标 (SLO),以保证他们的网络或电力服务可靠。 例如,如果他们没有遵守每月几个小时的协议,他们将向客户支付罚款。 

系统在关于 SLA 的两种服务状态之间交替:

1. 服务完成,其中服务按规定交付。

2. 服务中断,交付的服务与 SLA 不同。

这两个状态之间的转换是由故障(从状态 1 到状态 2)或恢复(从 2 到 1)引起的。 量化这些转变可以得出两个主要的可靠性衡量标准:

■ 模块可靠性是衡量从参考初始时刻开始的连续服务成就(或等效的故障时间)的衡量标准。 因此,平均无故障时间 (MTTF) 是一种可靠性衡量标准。 MTTF 的倒数是故障率,通常报告为每十亿小时运行故障数,或 FIT(及时故障)。
■ 服务中断以平均修复时间 (MTTR) 衡量。 平均无故障时间 (MTBF) 就是 MTTF + MTTR 的总和。 

■ 模块可用性是关于完成和中断两种状态之间的交替的服务完成的量度。 对于有维修的非冗余系统,模块可用性是

模块可用性 = MTTF / (MTTF + MTTR) 

可靠性和可用性现在是可量化的指标,而不是可靠性的同义词。 根据这些定义,如果我们注意到可靠性和可用性现在是可量化的指标,而不是可靠性的同义词,我们就可以定量地估计系统的可靠性。 根据这些定义,如果我们对组件的可靠性做出一些假设并且故障是独立的,我们可以定量地估计系统的可靠性

MTTF(平均故障时间)是指不可修复的模块或元件的平均寿命。它是通过收集大量的模块或元件的寿命然后取平均值来计算的。
MRBF(平均故障间隔时间)是指可修复的模块两次故障之间的平均时间。它是通过将总运行时间除以故障次数来计算的。它反映了模块的可靠性,即正常运行的时长。
MTTR(平均修复时间)是指从模块发生故障到恢复正常运行所需的平均时间。它包括发现、定位、修复和测试的时间。它反映了模块的维修效率,即恢复速度。
模块可用性是指模块正常运行的时间占比。它是通过将MRBF除以MRBF加上MTTR来计算的。它反映了模块对用户或系统提供服务的能力。

假设我们有一个模块,它在一年内发生了四次故障,每次故障的间隔和修复时间如下:

那么,我们可以计算出:

  • MTTF(平均故障时间)= N/A,因为这是一个可修复的模块,不适用MTTF指标。
  • MRBF(平均故障间隔时间)= (1000 + 800 + 900 + 700) / 4 = 850 小时
  • MTTR(平均修复时间)= (2 + 3 + 4 + 5) / 4 = 3.5 小时
  • 模块可用性 = 850 / (850 + 3.5) = 0.996

另一个例子:

假设一个磁盘子系统具有以下组件和 MTTF:
■ 10 个磁盘,每个磁盘的额定 MTTF 为 1,000,000 小时
■ 1 个 ATA 控制器,500,000 小时 MTTF
■ 1 个电源,200,000 小时 MTTF
■ 1 个风扇,200,000 小时 MTTF
■ 1 ATA 电缆,1,000,000 小时 MTTF
使用寿命呈指数分布且故障独立的简化假设,计算整个系统的 MTTF。

故障率的总和是:

 系统的 MTTF 只是故障率的倒数:

 最后一个例子:

磁盘子系统通常具有冗余电源以提高可靠性。 使用前面的组件和 MTTF,计算冗余电源的可靠性。 假设一个电源足以运行磁盘子系统,并且我们要添加一个冗余电源。

我们需要一个公式来显示当我们可以容忍故障并仍然提供服务时会发生什么。 为了简化计算,我们假设组件的寿命呈指数分布,并且组件故障之间没有依赖关系。 我们的冗余电源的 MTTF 是一个电源发生故障之前的平均时间除以另一个电源在更换第一个电源之前发生故障的可能性。 因此,如果在维修前发生第二次故障的可能性很小,则该对的 MTTF 就很大。

由于我们有两个电源和独立的故障,一个电源出现故障的平均时间是 MTTFpower supply/2。 二次故障概率的一个很好的近似值是 MTTR 在另一个电源出现故障之前的平均时间。 因此,一对冗余电源的合理近似是

使用前面的 MTTF 数字,如果我们假设操作员平均需要 24 小时才能注意到电源出现故障并更换它,则容错电源对的可靠性为 

 

使这对电源的可靠性比单个电源高 4150 倍。 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/502547.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python每日一练:小艺的口红(暴力、二分、图论三种方法)代写匿名信

文章目录 前言0、题目一、暴力查找二、二分查找三、有序二叉树总结(代写匿名信) 前言 很明显小艺的口红问题是考的是查找算法,对于这种一次性查找,直接暴力就行了,当然咱是为了学习,所以用来练练各种查找&…

【Linux】基础IO_文件系统

环境:centos7.6,腾讯云服务器Linux文章都放在了专栏:【Linux】欢迎支持订阅 相关文章推荐: 【Linux】冯.诺依曼体系结构与操作系统 【C/进阶】如何对文件进行读写(含二进制)操作? 【Linux】基础…

【9种】ElasticSearch分词器详解,一文get!!!| 博学谷狂野架构师

ElasticSearch 分词器 作者: 博学谷狂野架构师GitHub:GitHub地址 (有我精心准备的130本电子书PDF) 只分享干货、不吹水,让我们一起加油!😄 概述 分词器的主要作用将用户输入的一段文本,按照一定…

二十一、线索转换1:点击转换按钮加载信息、搜索市场活动

功能需求 *在线索转换页面,展示:fullName,appellation,company,owner 流程图 代码实现 1.ClueMapper /*** 通过id查询线索详情* param id 线索id* return 对应id的线索*/Clue selectClueForDetailById(String id); ClueMapper.xml <select id"selectClueForDetailByI…

考研数学武忠祥 高等数学0基础课笔记

函数和映射 常见的函数 取整函数的基本性质 函数的有界性 例题 sinx 是从-1到1的&#xff0c;但是x是无界的 遇到这种带sin的&#xff0c;就要试着取特殊值&#xff0c;让它为1或者为0 函数的单调性 函数的奇偶性 函数的周期性 举例 数学中Q表示有理数集&#xff0c;下面…

Docker服务编排(Docker Compose) :部署上线nginx+springboot项目

Docker服务编排(Docker Compose) 微服务应用一般包含若干个微服务每个微服务一般会部署多个实例&#xff0c;如果每个微服务需要手动启停 维护工作量大 从Dockerfile build image 或者去dockerhub拉去image 创建多个容器 管理容器 Docker Compose 一个编排多容器分布式…

设计原则之【接口隔离原则】

文章目录 一、什么是接口隔离原则二、实例三、总结接口隔离原则与单一职责原则的区别 一、什么是接口隔离原则 接口隔离原则&#xff08;Interface Segregation Principle, ISP&#xff09;是指用多个专门的接口&#xff0c;而不使用单一的总接口&#xff0c;客户端不应该依赖…

自学Java多久可以就业?Java这样自学实习都能过万!

昨天有00后学妹私信小源&#xff0c;她在学校已经学过java、C等相关课程&#xff0c;未来想走计算机的方向&#xff0c;问我建议还要学习什么语言&#xff0c;是否需要继续学Java?今天好程序员简单介绍下Java必学的技术&#xff01;想自学Java的真的可以试一试&#xff01; 一…

哈希数据结构的概念、实现和应用

一、认识哈希表 1.unordered_set和unordered_map STL实现了两个数据结构unordered_map和unordered_set顾名思义&#xff0c;因为底层的实现方式不同&#xff0c;它们成为了无序的map和set&#xff0c;但是它们的使用与普通的map和set是一样的。 我们可以通过代码测试两种数据…

【力扣--622】设计循环队列

&#x1f58a;作者 : D. Star. &#x1f4d8;专栏 : 数据结构 &#x1f606;今日分享 : 丢脸其实并没有那么可怕&#xff0c;我们可以从另一个角度来想&#xff1a;别人能够记住我了&#xff0c;而且过了还有多少人能记得我呢&#xff1f;虽然这种出场不太优雅&#x1f606; 设…

python制作散点动图

目录 示例1&#xff1a;简单的散点图示例2&#xff1a;添加颜色和大小示例3&#xff1a;实时更新动图完整代码 本教程将介绍如何使用Python制作散点动图。我们将通过三个示例代码&#xff0c;从易到难&#xff0c;逐步说明如何使用Python绘制出散点动图。 示例1&#xff1a;简单…

图书馆客流人数统计分析系统方案

智慧客流人数统计分析系统可以帮助图书馆管理者更好地管理人群流量。系统能够自动统计区域内的人流量高峰期&#xff0c;并通过数据分析提供更加合理的管控&#xff0c;从而提区域内人群流动性&#xff0c;避免拥堵的情况。 AI客流视觉监控 客流量管控分析系统意义 讯鹏客流量管…

雪花算法生成ID

1.简介 SnowFlake 中文意思为雪花&#xff0c;故称为雪花算法。最早是 Twitter 公司在其内部用于分布式环境下生成唯一 ID。在2014年开源 scala 语言版本。 雪花算法的原理就是生成一个的 64 位比特位的 long 类型的唯一 id。 最高 1 位固定值 0&#xff0c;因为生成的 id 是…

Python的HTTP库及示例

13.3 HTTP库 HTTP&#xff08;Hyper Text Transfer Protocol&#xff09;是一个客户端和服务器端请求和应答的标准。客户端是终端用户&#xff0c;服务器端是网站。客户端发起一个到服务器上指定端口的HTTP请求&#xff0c;服务器向客户端发回一个状态行和响应的消息。 可以…

ICV: 2025年全球QKD产业规模有望达到25亿美元

近日&#xff0c;专注于量子、智能驾驶等前沿科技领域的国际咨询机构ICV发布了《全球量子安全通信产业研究报告》&#xff0c;报告主要内容包括量子安全通信的概念、量子密钥分发 (QKD)发展历程、QKD的优势、产业链、应用领域、QKD产业规模及预测、全球主要参与者。 量子安全通…

ubuntu18.04中PCL点云库依赖的安装以及PCL点云库和Eigen的卸载与安装

一、PCL点云库依赖的安装、遇到问题的解决方法 sudo add-apt-repository ppa:v-launchpad-jochen-sprickerhof-de/pcl sudo apt-get update sudo apt-get install libpcl-all 以上是官方给出的&#xff0c;但是会出很多报错&#xff0c;这里建议自己配置。 配置步骤&#xff…

【Android学习专题】安卓样式学习(学习内容记录)

学习记录内容来自《Android编程权威指南&#xff08;第三版&#xff09;》 样式调整和添加 调整颜色资源&#xff08;res/values/colors.xml&#xff09; 格式&#xff1a; 添加样式&#xff08;res/values/styles.xml&#xff09;&#xff0c;&#xff08;创建BeatBox项目时…

开源狂潮让巨头惨败!谷歌内部文件曝光:我们和OpenAI都没有护城河

因为开源&#xff0c;AI军备竞赛&#xff0c;谷歌和OpenAI全是输家&#xff1f; 来源丨新智元 重磅&#xff01; 谷歌的一份名为《我们没有护城河&#xff0c;OpenAI也没有》的内部文件疑似被泄露&#xff0c; 今天早上&#xff0c;外媒SemiAnalysis公布了这份重磅炸弹泄露…

日撸 Java 三百行day45

文章目录 说明day45 冒泡排序1. 基本思路2.代码 说明 闵老师的文章链接&#xff1a; 日撸 Java 三百行&#xff08;总述&#xff09;_minfanphd的博客-CSDN博客 自己也把手敲的代码放在了github上维护&#xff1a;https://github.com/fulisha-ok/sampledata day45 冒泡排序 …

IP地址技术原理

IP地址用于唯一地标识一个网络设备&#xff08;如计算机、路由器等&#xff09;在互联网或局域网中的位置。IP地址由32位二进制数表示&#xff0c;通常分为4个8位二进制数&#xff0c;每个数用点号隔开&#xff0c;如106.110.92.215。IP地址可用于数据传输、网络管理和安全控制…