01.引言
城市轨道交通系统作为大容量公共交通工具,其安全性直接关系到广大乘客的生命安全,所以要求城市轨道交通系统在如此高的运行密度下,还要保证安全和高效率的运行。而信号系统作为保证列车安全、正点、便捷、舒适、高密度不间断运行的重要技术装备,在城市轨道交通系统中有着举足轻重的地位。因此,如何保证和实现信号系统的安全性、可靠性就显得尤其关键和重要。
02.什么是可靠性和安全性
虽然“可靠”“安全”两个词在语义上看起来十分的相似,但是在轨道交通系统中,这两个术语却是有着不同的深层含义的。
所谓“可靠”是作为“主体”的“我”对环境中“客体”他人和他物的一种认识,对可靠与否作为属性的系统性评价就是可靠性。用可靠性这个标尺就能衡量各种为提高可靠性而采取的技术措施的有效性。可靠性的概括性定义是:对象在规定的条件下、规定的时间内完成规定任务的能力或可能性。在轨道交通系统中,有以下几种指标来衡量可靠性:可靠度、平均工作时间(MTTF)或平均失效间隔时间(MTBF)、失效率、可用度、可维修度、平均修复时间(MTTR)等。
“安全(safe)”是在人类生产过程中,将系统的运行状态对人类的生命、财产、环境可能产生的损害控制在人类不感觉难受的水平以下的状态。反映某一个考察对象没有造成也不会造成危害的属性就是安全性(safety)。轨道交通信号系统中的安全性,广义地说是指轨交信号设备(或系统)维护行车、调车安全运行的能力。狭义的安全性则是指设备(或系统)“满足‘故障——安全( fail-safe)’设计原则的要求,出现故障(或误操作)时,导向远离危及行车、调车安全的事故或减少事故损失的能力”。
“安全性”和“可靠性”是两个既相关又不同的概念,它们最为本质的区别在于“可靠性”是主体对所依赖客体的感受程度,而“安全性”是主体自身对处境的感受程度。以城交公司旗下产品车载ATP子系统为例,其作为2乘2取2设备,其可靠性指标要求平均故障间隔时间(MTBF)应大于等于图片h。车载ATP子系统采用安全完整性等级为SIL4的安全平台,其可容忍危害率(THR)指标为图片。车载ATP应用软件的安全完整性等级为SIL4,根据《CBTC_系统THR分配》,单套车载ATP设备的可容忍危害率(THR)为图片。
03.可靠性技术
总体介绍安全性与可靠性之后,我们来展开讨论可靠性有哪些相关技术,又是怎样应用到实际的科研与工程项目当中去的。
可靠性技术包括:可靠性设计、可靠性增长、避错排错和防错、容错设计等技术。其中,可靠性设计与容错设计是实现可靠性目标的两个重要技术手段。
01 可靠性设计( reliability design)指通过设计达到产品可靠性目标的方法。产品的可靠性是通过设计、生产和管理实现的,而首先是产品的设计。它决定着产品的固有可靠性。电子产品或嵌入有电子部件(包括计算机系统)的产品的可靠性设计技术包括许多内容,主要有:可靠性分配、可靠性预测、冗余技术、防漂移设计、抗热设计、设计分析、元件器件的优选和筛选及设计评审等。下面以可靠性分配来举例说明可靠性设计的基本思想。
常用的可靠性分配(reliability allocation)方法是“加权分配法”。可靠性分配的本质是“不可靠性”的分配,实际分配的是系统为实现可靠性目标各组成成分允许的“不可靠性”。
对于有n个组成成分的系统,最简单的情况是假定这些组成成分的可靠性是相互独立的,而且每一个成分对系统来说,都是不可缺少的。因此各组成成分构成可靠性串联系统。第i个组成成分的可靠性为图片,不可靠性为图片,则产品的可靠性q为
产品的不可靠性
设产品的每个组成部分的寿命都为指数分布,第i个组成成分的故障率为图片,则产品的寿命亦为指数分布,原本各成分可靠性中故障概率相乘的关系变成故障率相加的关系,故障率图片为
此时,可靠性分配变为了故障率的分配,实际使用上还会采用加权分配的方法,考虑故障重要性因素、复杂性因素、维修性因素以及元器件可靠性因素等。本质上讲可靠性分配是人力、物力的统一调度和运用的工程管理问题。因为在一个产品中不同元、器件能达到的可靠性水平差别很大,而把它们的可靠性提高到一定水平所需要的人力、财力和时间的差别也很大,因而不能采取均匀提高的办法。在实际工作中,需进行多个方案的协调、比较后才能决定。
02 容错技术是保证系统在某些组成部分出现故障、差错或存在内在缺陷时仍能正常工作或能继续实现关键功能的技术。从容错技术就可以引申出一个在设计系统时十分重要的思想:冗余。冗余也叫备份,按备份的物质属性有:硬件冗余、软件冗余、时间冗余、信息冗余等。我们常说的二乘二取二系统,就是从冗余思想发展而成的一种安全计算机系统架构。
04.安全性技术
上节介绍了可靠性技术,本节我们来讨论安全性技术。安全性技术归纳起来可分为以下类别:防误(fool-proof)技术、“故障—安全”技术、危险侧故障率最小化技术、故障影响弱化(fault-soft)技术、冗余和重构(redundancy and reconfiguration)技术、故障检测和诊断(testing and diagnosing)技术、降额(derating)使用技术、应急顶替(back up)技术等。
“故障—安全”技术是目前应用较为广泛的安全技术。一个系统从故障的发生到失效有一个过程,因此“故障—安全”是有步骤地对这个过程的发展加以引导和控制的技术。“故障—安全”技术分为:结构式“故障—安全”、重叠式“故障—安全”和反应式“故障—安全”。铁路信号是最早从技术上确立“故障—安全”原则的领域。它的代表成果是19世纪中叶发明的,在操纵导线断离时能利用重力自动复位发出“停止信号”的臂板信号机,在电气信号中广泛使用的重力型继电器,引入电子器件以后的光电、高频或脉冲耦合的逻辑电路、接口电路都是“故障—安全”器件。
可以用来实现“故障—安全”技术的结构分为物理结构、逻辑结构。物理结构中常用的有能量结构、机械结构、电路结构和半导体结构等。逻辑结构又分硬件逻辑结构和软件逻辑结构。利用逻辑结构实现“故障—安全”是在继电器电路、数字逻辑电路和软件程序中对(实施安全相关控制的)条件进行互锁、互禁、多方位等的反复校验,以逻辑模块层面上流程结构上的不对称谋求故障概率的不对称。