1.网络高可用性概述
随着网络快速发展及应用日益深入,各种核心和增值业务在网络上广泛部署,网络的作用愈来愈凸显出来。即使网络出现短时间中断,都可能对业务带来比较大的影响,甚至给企业造成一定程度的经济损失。因此,网络可用性在网络设计时需高度重视。
网络可用性度量可从两个方面考虑。首先是网络不能频繁出现故障。网络出现故障势必影响业务的运营,特别是实时性强和对丢包时延敏感的业务,如语言、视频以及在线游戏等。退一步讲,网络即使出现故障,应能迅速恢复。如一个网络不常出现故障,但出现一次故障,需要比较常时间才能恢复,如几个小时、几天或甚至更长时间,这样的网络也不能算是高可用性网络。因此,故障次数少和故障恢复时间短是衡量网络高可用性的主要指标。
可用性(Availability)可以下式表示:
A = MTBF/(MTBF+MTTR)
MTBF:平均无故障时间(Mean Time Between Failures)
MTTR:平均故障修复时间(Mean Time To Repair)
可见,提高网络可用性,提高MTBF,降低MTTR都是行之有效的方法。MTBF取决于网络设备的硬件和软件本身的质量,而极力提升它们的质量总是有限的,因此无法一味地提高MTBF数值来获得网络高可用性。设法减少MTTR数值,也是提高网络可用性的有效途径。就MTTR的影响因素来说,一是以最快的速度发现网络故障,二是迅速将网络从故障状态恢复出来。
实际上,上述理论公式难以精确计算网络的可用性。通常也会采用某些更具实际意义的工程经验公式变通衡量网络的可用性。
2.网络高可用架构
网络的高可用性是一个系统级的概念。对于一个网络来说,它由网络元素(或网络部件),按照一定的连接模型连接在一起而构成。因此,构成网络的部件的可用性,以及连接模型的可用性就决定了网络的可用性程度。
1)网络部件
网络部件是组成网络的基本要素,典型代表有各种交换机、路由器等网络设备。网络部件的高可用性是网络高可用性的关键。在网络设计时,它们的高可用设计或选用是需要重点、优先考虑的。
通常,网络部件包括硬件结构和软件系统。因此硬件高可用性和软件系统高可用性,就直接影响着网络部件的高可用性。硬件高可用性包括主控结点冗余设计,如采用1+1主备;业务结点热插拔设计;电源风扇冗余设计等。软件系统高可用性包括软件热补丁设计,软件异常保护,数据冗余备份等。
2)网络连接模型
除了网络部件本身的高可用性外,网络物理拓扑连接形式也影响网络的可用性程度。如图1(a)、 (b)、 (c)、 (d)、 (e)分别是网络设备NE1和网络设备NE2两类设备互连的五种拓扑形式。假设网络设备NE1的在线率(可用性)为R1,网络设备NE2的在线率(可用性)为R2。它们的高可用性指标分别是A1、A2、A3、A4、A5。由NE1和NE2两类设备组成的这五种形式网络的可用性计算如下。
图1 两类设备五种拓扑互连图
(a)是一对一(单点单归)连接方式,其可用性A1为:A1=R1XR2;
(b)是一对二(单点双归)连接方式,其可用性A2为:A2=R2X(1-(1-R1)X(1-R1));
(c)是二对一(双点单归)连接方式,其可用性A3为:A3=R1X(1-(1-R2)X(1-R2));
(d)是双一对一(双点双归)连接方式,其可用性A4为:A4=1-(1-R1XR2)X(1-R1XR2);
(e)是双一对二(双归属)连接方式,其可用性A5为:A5=(1-(1-R1)X(1-R1))X(1-(1-R2)X(1-R2));