在数据存储备份领域,说起“3-2-1”备份策略真是无人不知、如雷贯耳!笔者也经常把“3-2-1”备份策略挂在嘴边,那简直就是确保数据安全的圭臬!但是,最近有一位读者问我:“3-2-1”备份策略的出处在哪里?有没有被纳入重量级参考标准或文件?“3-2-1”都还没搞清楚,怎么又出来“4-3-2-1”?还真把我给问住了,咱们今天就来聊聊这个话题。
“3-2-1”备份策略概念
“3-2-1”备份策略的准确出处已经无法考证,比较正规的出处是美国摄影家 Peter Krogh在2005年出版的《The DAM Book: Digital Asset Management for Photographers》一书中关于“3-2-1 Strategy”的描述。
另外,Gartner Group的存储资深副总裁Carolyn DiCenzo也在同期提出过相似的观点,他将“3-2-1”备份策略简单归纳为:“对于要长期存储的数据,至少要有3份拷贝,它们被存在两种不同的物理载体上,其中一份必须是可移动的,离线的永久拷贝”
事实上,“3-2-1”备份策略在数据保护的早期就已经存在,可能是数据存储厂商在产品或解决方案的介绍资料中提出来的,因此没有被写入到ISO标准文件中。但不管怎么说,“3-2-1”备份策略在业界的认知度和认可度是不言而喻的,被公认为是数据存储备份和数据安全保护领域的最佳实践。虽然它不能保证所有数据都不会受到损害,但这种策略消除了单点故障的最大风险。不仅在一个副本损坏或技术失败的情况下为组织提供保障,而且在发生自然灾害或盗窃导致物理存储类型消失的情况下也受到保障。因此,2012年,美国计算机应急响应组(US-CERT)推荐“3-2-1”备份策略,里面特别提到了异地备份对于从自然灾害或者严重故障恢复的重要性。实际上,同城多活、异地多活、冷热结合等备份策略,都是“3-2-1”备份策略的实现或者变体。
“3-2-1”备份策略原理
我们举一个实际的例子来描述“3-2-1”备份策略的实现原理。在下面这台光磁库设备中,融合了固态硬盘、磁盘阵列和蓝光光盘三种存储载体,并且内置管理软件,用于执行“3-2-1”备份策略以及数据、载体的智能巡检和数据损坏时的自动恢复。
固态硬盘
固态硬盘实际上是数据缓存区,用于数据的高速预处理,处理完成之后的数据入库存储,但数据缓存区本身不存储数据。
磁盘阵列
磁盘阵列是在线存储区,存储一套完整数据,便于随时访问,同时刻录两套数据到蓝光光盘中;其中一套蓝光光盘属于近线备份区,可用于磁盘数据损坏时的快速恢复;另一套蓝光光盘则可以离线,拿到异地妥善保管(比如存放在离线光盘柜中),用于意外情况发生时的容灾恢复。如下图所示:
由此可见,对于普通数据或者数字资源的安全存储和备份而言,“3-2-1”备份策略已经完全能够满足要求,但是对于档案数字资源这样的重要数据而言,“3-2-1”备份策略还不够,因此,笔者提出了更加完善、安全的“4-3-2-1”备份策略。
“4-3-2-1”备份策略
由于“3-2-1”备份策略缺少了对于重要和珍贵档案数字资源而言非常关键的“异质”备份(注意档案领域中的“异质”指的是“形态差异”而不是“不同的存储介质”,详见本公众号文章《档案异质备份的“异质”指的是“介质”吗?》),所以还不足以达到档案数字资源备份体系建设的要求。
中办国办2021年6月印发的《“十四五”全国档案事业发展规划》第15条中指出:“扎实做好档案数字资源备份工作,完善备份机制,实现馆(室)藏全部档案数字资源完整备份,重要电子档案异地异质备份,积极探索备份新途径,加强备份工作全过程安全监控,切实保障档案数字资源安全。”这是继中办发[2014]15号《关于加强和改进新形势下档案工作的意见》、档发〔2016〕6 号《关于进一步加强档案安全工作的意见》等重要文件之后再次提到重要电子档案“异质备份”。
为了满足重要电子档案“异质备份”的要求,我们可以在“3-2-1”备份策略的基础上增加数字胶片(有关数字胶片的详细介绍参见本公众号文章《构建数字时代的诺亚方舟》)这种“异质备份”载体,形成磁光胶融合备份策略,如下图所示:
当然,目前的技术还无法将磁、光、胶这三种数据存储载体集成在一台设备中实现磁光胶融合存储,为此,我们提出了电子档案库房解决方案。
电子档案库房
所谓电子档案库房(Electronic Archives Repository,EAR)就是保存电子档案的库房,为了确保电子档案的安全,电子档案库房一般采用离线的方式保存电子档案。由于电子文件易修改、环境依赖、存储载体可分离等特性,单一的备份载体显然无法满足档案数字资源长期安全保存的需要,比较切实可行的措施是采用不同介质多套备份组合的方式来确保档案数据安全。可以预计,将来各级各类档案部门都会形成磁、光、电、胶等多种档案数字资源备份载体。因此,电子档案库房实际保存的是存储电子档案的物理载体,比如磁盘、光盘、磁带、胶片等。
另外,由于载体本身的不可直读特性,还需要配置各种载体的读取设备;由于各种载体的保管条件要求不同,还需要配置各种存放不同特性载体的保管设备,这些载体读取和保管设备统称电子档案库房装具。电子档案库房示意如下图所示:
显而易见,在电子档案库房中采用了“4-3-2-1”数据长期保存(备份)策略,基于不同的备份载体,实现档案数字资源的多套备份,满足档案管理规定的异质、异地、离线备份要求。
4套数据
1套在线、1套近线、1套异质、1套异地
3种载体
磁盘、光盘、胶片
2套离线
1套光盘、1套胶片(异质)
1套异地
光盘
由此可见,对于普通数据而言,“3-2-1”备份策略已经能够满足数据安全存储备份的要求,但是对于档案数字资源这样的重要数据而言,还需要更加完善、安全的“4-3-2-1”备份策略。需要说明的是,增加的一套胶片异质备份,由于备份制作成本较高,基于性价比的综合考虑没有必要针对全部数据,也就是说“4-3-2-1”备份策略很多情况下并不是严格意义上的4套完整数据,因此,“4-3-2-1”备份策略也可以认为是“3-2-1”备份策略的变体。