冗余-安全设计的基石

news2025/1/9 2:21:33

冗余构成原理就是在系统中采用2套中央处理器(CPU)单元,其中1套为工作主机,1套为热备,一旦工作主机发生故障,热备的CPU将自动投入工作,此时热备的CPU变为工作主机,原工作主机故障处理完成后就变为热备CPU。除主机冗余外,输入输出模板也可以采用冗余构成或非冗余构成。按照主机冗余方式和输入输出冗余方式,系统可以有各种不同类型。

1.单一故障准则

在一个系统的运行过程中,单一子系统出现故障或失效的几率是最大的,而两个或两个以上子系统同时出现故障或失效的几率则很小。因此在实际工程中,只要保证当单个子系统出现故障或失效时,不会引起整个系统的故障或失效,就可以满足绝大部分控制系统对可靠性的要求。

单一故障准则的定义是,系统中任何一个子系统的故障或失效均不会导致整个系统的故障或失效。当然,如果系统中同时出现了两个或两个以上子系统故障或失效,则系统将不能保证不出现故障或失效,尽管在此情况下,系统有可能还可以正常运行。

根据单一故障准则的要求,采用冗余技术是最有效的手段之一。

2.冗余(Redundancy)

通过前面的讲述可以知道,子系统的并联连接可以较大地提高整个系统的可用率,因此,在需要高可靠性的系统中,采用冗余技术是提高系统可靠性的有效方法。

冗余的含义,是使用两个甚至多个功能完全相同的子系统,使其并联,这样的并联完全不影响或改变系统的功能,但只要这些并联子系统中的任何一个子系统处在正常运行状态,整个系统就能够保证正常运行。形成并联系统的子系统数量被称为冗余的重数,如由两个子系统并联构成的冗余系统被称为双重冗余(DMR,Dual Module Redundancy),由三个子系统并联构成的冗余系统被称为三重冗余(TMR,Triple Module Redundancy),等等。

对于冗余,IEEE可靠性协会的定义是:在需要时运行并完成指定功能的备用措施(Thatredundancy where in the alternative means for performing a given function are in operative untilneeded.IEEE Reliabilitv Society).这个定义的隐含意思是,这个备用措施在不需要时是不运行的,也就是说,在正常时,处于冗余状态的子系统中只有一个是运行的。

采用冗余技术可以明显地提高系统的可用率,其可用率的上升呈指数趋势。例如,我们使用两个可用率为80%的子系统并联成一个完整系统,则系统可用率将上升至96%。如果采用四个同样的子系统并联,系统可用率将高达99.84%。

在一般情况下,一个系统从无冗余到两重冗余,系统可用率会有很大的提升;从两重冗余提高到三重或四重冗余,系统的可用率也有较大的提升,但效果已没有那么明显;到四重以上的冗余,虽然可用率有所提升,但越来越不明显,而系统的复杂性和成本将会成倍上升。因此,在高可靠性系统中,两重冗余使用得最为普遍,对于更高的可靠性要求,可采用三重或四重冗余,而高于四重的冗余则很少采用。

3.冗余系统(Redundant System)

IEEE核电站安全系统标准委员会对冗余系统的定义为:一设备或系统与一设备或系统的基本功能完全相同,它们不管其中一个运行还是故障,另一个都可以执行要求的功能(Apiece of equipment or a system that duplicates the essential function of an other piece of equipment or system to the extent that either may perform the required function regardless of the state of operation or failure of the other, IEEE STD603-1991 IEEE Std Criteria for Safety Systems for Nuclear Power Generaing Stations).

显然这个定义并未涉及冗余系统中各个并联子系统间的切换及切换时间(或切换过程)问题,但在实际工程中,冗余系统的这个问题却是不得不认真考虑的,因为,它会影响整个系统功能的执行,甚至使冗余系统达不到预期的目的。

在上节已经谈到,在任何时刻,冗余系统中各个并联的子系统间只能有一个在运行,否则系统将出现混乱。那么,当正在运行的子系统出现故障时,就必须将出现故障的故障的子系统从系统中切除,并尽快地将备用的子系统投入运行,以接替故障子系统正在进行的处理,这种处理被称为冗余系统的故障切换。虽然在冗余系统中,系统的可靠性或可用率比单一系统有大幅度的提高,但这里没有考虑并联子系统的故障切换对它的影响。故障切换过程主要有两个方面的动作,一是故障的确定,即系统要有一个故障诊断功能,该功能要不断对系统的完好性做出判断,一旦发现故障,就应立即开始从当前处于运行状态的子系统向处于备用状态子系统的转移过程。这个过程一般来说是相当复杂的,其中,包括当前正在进行的处理过程的转移、子系统与其他各个子系统(如输入输出)的连接切换等。

对于故障诊断和切换来说,这项功能也需要由一个子系统来完成,它虽然是被监视和切换的冗余系统中的一个组成部分,但功能却与之不同,因此,冗余系统与故障诊断和切换子系统间必须是串联的连接方式。这样,在考虑系统可用率时就不能不考虑故障诊断和切换子系统对整个系统的影响,也就是说,故障诊断和切换子系统本身也是有失效率的,在这个子系统串入系统后,必须会使总的系统可用率下降。我们可以用下面的例子来说明。

假设一个冗余系统是由两个可用率为90%的子系统组成,这两个子系统组成的冗余系统可有99%的可用率。而要实现这种冗余的系统结构,还必须增加一个诊断和切换子系统。假设这个子系统可用率99%,则整个系统的可用率将是98%。

由此我们可以看到,为实现冗余,必须有故障诊断和切换子系统,而这个子系统的可用率对整个系统的可用率影响极大,如果它的可用率不高,那么前面用再多重的冗余所提高的系统可用率都将被拉下来。因此,对故障诊断和切换子系统的要求是,构成尽可能简单,可用率尽可能高,至少比形成冗余结构的子系统高一个数量级,最好高两个数量级。

4. 备用式冗余

根据冗余系统的定义,我们了解到在一个冗余系统中,形成冗余结构的各个子系统在运行时,只有一个是在线的,而其他的子系统都处于被用(即Backup)状态。根据系统设计,备用方式可分为以下几种。

1)冷备用方式(Cold Backup)

冷备用方式中备用子系统完全不运行,甚至不加电,以手动方式完成切换。切换时系统需停电。或不需停电。冷备用方式的切换速度最慢,但没有切换设备,不存在切换设备可用率对系统可用率的影响,成本也最低。在线的故障诊断和报警技术、不停电切换(Hot Swap或俗称热插拔)技术现在已比较成熟,这较大地加快了故障切换的过程。目前在允许局部有短暂停用状态(几分钟到几十分钟)的系统中多采用这种备用方式,优点是成本低而且实用。

  1. 温备用方式(Warm Backup)

温备用方式中备用子系统处于运行状态,但运行的不是在线程序,而是一个跟踪程序。该程序跟踪在线子系统的所有运行状态,将在线子系统的所有数据改变均记录在备用子系统的内存中。一旦在线子系统出现故障,备用子系统立即启动,并根据跟踪的状态继续运行。温备用方式的切换无需人工干预,切换过程可自动完成。但由于备用子系统对在线子系统的跟踪总是有差距或滞后的,而且在切换发生时备用子系统才启动在线程序,因此温备用方式的切换时间虽快于冷备用方式,但还是比较慢,大约在几秒到几十秒之间。其优点是故障诊断和切换子系统构造简单,容易做成高可靠的设备,其成本也比较低。

3) 热备用方式(Hot Backup)

在热备用方式中,备用子系统和在线子系统运行完全同样的程序,形成完全并列的运行模式,所不同的,是备用子系统不对现场输出控制信号,处于一种“哑”状态。当在线子系统出现故障时,切换子系统将在线子系统的输出通路切断,同时接通备用子系统输出通路,这样就完成了切换过程。由于构成冗余结构的各个子系统处于完全同样的运行状态,因此切换过程可以缩短到毫秒级。但热备用方式的故障诊断和切换设备是相当复杂的,而且还要进行各个冗余的子系统间严格的运行同步,因此,其可靠性很难做得非常高,在很多时候,由冗余结构带来的可靠性提高又被切换设备拉下来了,反而得不偿失,而且其成本也相当高。因此,除非系统对故障切换时间有极其严格的要求,或在切换过程中不需要处理输出通路的切换,一般不采用热备用方式。

5.备用式冗余的无扰切换

所有备用式冗余结构,都存在切换的瞬间系统输出扰动(Disturbance)的可能,也就是双机的输出运算结果在切换前是不一致的,如果是开关量输出不一致,将导致阀门从开状态跳动到关状态,或从关状态跳动到开状态。如果是模拟量输出不一致的程度较大,现场阀门的开关会发生明显的波动。如何解决切换瞬间的扰动,是备用式冗余结构的关键问题。通常方法有以下两种:

1)数据周期拷贝法

由于主备模块都会几乎同时(最多相差一个控制周期)采集到所有输入类信息,所以切换扰动的原因不在于实时采集值的差异,而是与时间有关的变量在主备机上不同所致。所谓时间相关的变量,一类是事件型开关量输入,该类时间相当于电信号的上升沿事件或下降沿事件,比如人手指按了一下键盘,是“一去不复还”的信息,该类信息,有可能主机采集到了,而备机并没有采集到。相反,与事件型开关量对应的是状态型开关量,比如电源开关的状态,相当于电信号中的电平信号,状态的存活周期足以让主备机都采集到。另一类是变量累积值,比如PID的积分初值,还有定时器的计数值,这些值可能在主备机上存在不一致(比如说时钟差异或上电时间不一样导致)。总之,这两类与时间相关的变量在主备机上的不一致,直接导致了主备机切换的扰动。

数据周期复制法就是基于上述的分析提出的,其基本思路就是,将主机的时间相关变量,周期性的复制到备份机,并刷新备份机的对应变量的当前值。当然,如果控制器的能力足够强大,我们也可以不加区分地将主机的所有变量都复制到备份机,也是可行的,但往往数据量的增加是惊人的,一般来说99%的数据都对扰动没有影响。

理论上,数据周期复制法并不能保证绝对意义上的无扰,原因是在数据复制完成之前,如果现场状态刚好发生变化,并且此刻切换到备份机,是可能有扰动的。扰动的可能性受到数据复制周期的影响,复制周期越短,扰动的可能性越小。如果每个控制周期都复制一次数据,扰动的可能性就小到可以忽略不计。

2)主备运算同步法

主备运算同步法的切换无扰性能要优于数据周期复制法,其解决切换扰动的思路是:主备机的控制运算节拍保持同步,则双机的事件型变量和累计运算值都是相等的,其输出结果必然是相同的,切换时当然就可以无扰。

当然,即使采用同步法的系统,在备机上电或复位初始化时,也还是要复制一次主机的数据,然后才能进入同步运算,该过程称为重构。

6.表决冗余

备用式冗余主要解决的问题是系统的可用性,但是在许多安全性为首要要求的场合,是不能采用备用式冗余的,只能采用表决式冗余。

表决式冗余的基本思路是,所有冗余模块都同时运行,但多个模块的输出必须经过表决器比较后才能输出,一旦表决结果异常,将禁止输出或系统干脆导向安全态,甚至停止运行。所以表决式冗余要解决的是安全性而不是可用性。

常用的表决系统有双模表决冗余系统和三模表决冗余系统,或称为2取2表决系统和3取2表决系统。双模表决冗余的机理是:当两个模块输出相同并且正确的指令时,输出该控制信号,其他情况下禁止输出,并导向安全态。三模表决冗余的机理是:当三个模块中有两个或三个模块的输出相同并且正确的指令时,输出该相同的控制信号,其他情况下则禁止输出。其中当仅有两个模块输出相同时,第三个模块可以进行维修或自动进行重构后加入系统运行。三模表决冗余安全性与双模表决冗余系统相同,但可用性和可维护性却大大提高了。

在某些特殊应用中,为了进一步提高系统的可维护性,引入了两套双模表决系统主备切换的体系结构。该结构的特点是将备用式冗余和表决式冗余两种机制有机结合起来,如图7所示,也有人将这种方式称为Pair&Spare模式,当然这种结构的成本是最高的。在这种结构中,只要A机和B机中不同时各出现一个模块故障,系统就是可以继续安全运行的。

7.同构冗余和异构冗余

上节所说的冗余系统是由两个或两个以上具有相同功能的子系统进行并联以保证在出现单点失效时不丧失系统功能。在这里强调的是形成并联关系的子系统间功能的相同,而不关注其结构是否相同。在多数冗余系统中,都是采用相同功能且相同结构的子系统形成冗余,称为同构冗余,这样的系统比较简单,容易实现。但同构冗余的问题是,如果由于某种原因造成一个子系统的故障,那么同样的原因也有可能造成另外的子系统故障,这种情况称为“共因故障”。例如,无线通信子系统,如果因太阳黑子的活动造成电波传播受到干扰,那么同样的无线通信子系统也会受到干扰,在这种情况下,即使采取了冗余配置也无法保证系统正常运行。

图片

图 主备双模表决冗余系统

为避免共因故障,可采用功能相同,但实现功能所用的设备甚至设备的工作原理均不相同的子系统组成冗余配置,这样的冗余系统被称为异构冗余。如采用无线通信设备和有线通信设备组成冗余配置,无线通信设备可有效防止电波传播干扰造成的故障,而无线通信设备则可有效防止机械破坏造成的故障。因此异构冗余要比同构冗余具有更高的可靠性。但异构冗余的实现难度比较大,技术上比较复杂,而且成本较高。在冗余系统的设计中应该根据实际情况、可靠性需求和成本的约束进行适当的选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/517774.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

五月份了,让我看看有多少金三银四没找到工作的.....

前两天跟朋友感慨,去年的铜九铁十、裁员、疫情导致好多人都没拿到offer!现在都已经5月了,金三银四都结束一段时间了。 金三银四都已经结束,大部分企业也招到了自己需要的人,但是我看我的读者们还是有很大一部分人在抱…

GEE:设置下载数据的Nodata值,并在ArcGIS中将空值设置为空

作者:CSDN @ _养乐多_ Google Earth Engine(GEE)是一个功能强大的云平台,用于进行地理空间数据处理和分析。它提供了丰富的数据集和工具,使得在研究和应用中使用遥感数据变得更加便捷。本文将介绍如何使用GEE设置下载的数据的Nodata值,并在ArcGIS软件中将空值设置为空,…

Golang笔记:使用标准库中os.Args和flag包编写命令行界面(CLIs)

文章目录 目的os.ArgsflagFlagSet总结 目的 命令行界面(Command-line Interfaces)是比较常用的一种软件形式。对于大部分开发运维人员来说很多时候CLIs可能比图形界面更加方便。软件开发时也经常会有需要开发命令行界面形式软件的情况,使用G…

栈和队列:理解与使用

目录 栈 顺序栈结构 链式栈结构 中缀表达式和后缀表达式 顺序栈四则运算 链式栈四则运算 队列 顺序队列结构 链式队列结构 总结 栈和队列是计算机科学中常见的数据结构,它们都是一种线性数据结构,可以对元素进行快速的插入、删除和查找操作。栈…

00后工资太低,现在转行数据分析还能就业吗?,求大佬指点!

当然可以就业,只要专业技能过关。IT是靠技术吃饭的行业,没有复杂的人际关系和面子工程,相对其他行业要纯粹一些。当然,如果你技术不过关,或者跟不上技术更新发展速度,淘汰也是必然的,IT行业不能…

听我一句劝,千万别去外包,两年外包生涯做完,感觉自己废了一半....

先说一下自己的情况。大专生,18年通过校招进入湖南某软件公司,干了接近5年的点点点,今年年上旬,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了五年的功能测试…

前端开发和测试的新伙伴:Requestly,让你事半功倍!

目录 引言 痛点 前端测试 后端测试 曾使用的应对措施 Charles Chrome 插件 实现mock工具 Requestly Requestly的功能 流量捕捉方式 请求的修改 响应的修改 请求响应录制 我对Requestly的应用 总结 引言 想必每个前端开发和测试的小伙伴都曾经历过不断地切换页…

CV界的chatgpt出现——Segment Anything能分割万物

目录 一、前言(1)弱人工智能(Weak AI)(2)强人工智能(General AI)(3)超人工智能(Super AI) 二、SAM的一些介绍2.1 模型的结构是什么&am…

React动态路由配置

目录 项目初始化 模块创建 统一导出 全局模块配置选项 核心代码 使用及效果展示 博文适用于react-router v6及以上,其中还有很多值得改进的地方 最近学习react的过程中,思考怎样实现动态路由的配置(最终实现从页面配置最终动态从数据库加载上线模…

C++解析JSON JSONCPP库的使用

首先去GitHub下载JSONCPP的源码: JSonCpp的源码 解压后得到:jsoncpp-master 文件夹 需要的是:jsoncpp-master\src\lib_json 目录下的所有文件和 jsoncpp-master\include\json 目录下的所有文件,在MFC工程目录下新建两个文件夹或…

承诺协议:定义 构造

文章目录 安全性定义方案构造基于 OWP 存在性基于 DL 假设基于 OWF 存在性基于 DDH 假设 总结 安全性定义 承诺协议(Commitment Scheme)是一个两阶段的两方协议。一方是承诺者(Committer) C C C,另一方是接收者&#…

网络安全怎么学?

一、怎么入门? 这个 Web 安全学习路线,整体大概半年左右,具体视每个人的情况而定。 (上传一直很模糊,所以就没有展开了,需要高清版的可以在下面领取) 👉 【一学习路线高清版一】&a…

WiFi(Wireless Fidelity)基础(八)

目录 一、基本介绍(Introduction) 二、进化发展(Evolution) 三、PHY帧((PHY Frame ) 四、MAC帧(MAC Frame ) 五、协议(Protocol) 六、安全&#x…

AndroidStudio-学习笔记之多级目录功能的设计与开发

多级目录功能的设计与开发 演示效果需求描述开发预计前端后端 前端开发多级目录的UI小框架前端xml前端代码---本地demo版前端代码---服务器版逻辑说明 后端开发表设计书写接口 演示效果 需求描述 根据需求,为用户展示多级目录(目前设计的为4级目录),并在…

Win10笔记本无法正常启动代码0xc0000001解决方法

Win10笔记本无法正常启动代码0xc0000001解决方法。最近不少的用户在笔记本电脑安装Win10系统使用时,出现了蓝屏的情况,电脑显示错误代码0xc0000001无法启动到桌面使用。那么这个情况怎么去进行问题的解决呢?来看看以下的解决方法吧。 准备工作…

OpenCL编程指南-4.1OpenCL C编程

使用OpenCL C编写数据并行内核 OpenCL中的数据并行性表述为一个N维计算域,其中N1、2或3。N-D域定义了可以并行执行的工作项的总数。下面通过一个简单的例子来了解如何用OpenCL C编写一个数据并行内核,将两个浮点数数组相加。这个代码的串行版本求和时需…

在windows上通过QEMU快速上手RT-thread smart

参考链接 官方文档 资料下载 env-windows-v1.3.5.7z userapps 注意事项 通过QEMU仿真不同的平台,使用到的交叉编译工具也不一样,需要将相应工具的路径添加到系统PATH里;或者通过CMD定位到userapps,运行smart-env.bat xxx&…

【jvm系列-11】jvm性能调优篇---命令行工具的基本使用

JVM系列整体栏目 内容链接地址【一】初识虚拟机与java虚拟机https://blog.csdn.net/zhenghuishengq/article/details/129544460【二】jvm的类加载子系统以及jclasslib的基本使用https://blog.csdn.net/zhenghuishengq/article/details/129610963【三】运行时私有区域之虚拟机栈…

智能优化算法——下山单纯型算法

作者:非妃是公主 专栏:《智能优化算法》 博客地址:https://blog.csdn.net/myf_666 个性签:顺境不惰,逆境不馁,以心制境,万事可成。——曾国藩 文章目录 专栏推荐序一、算法流程1. 反射2. 膨胀…

马哈鱼SQLFLow数据流生成介绍

马哈鱼数据血缘分析器是当前最流行的数据血缘关系(data lineage)管理工具之一,它是一种通过分析SQL脚本来自动发现数据流向的工具。它通过生成一个简洁的图表来显示数据仓库中表/视图和列之间的数据流。支持超过20种流行的数据库,包括 bigquery, couchba…