持续数据保护(CDP)适合档案数据备份吗?

news2025/1/22 17:49:44

几个月前笔者写过两篇针对档案长期保存库备份(或者说是档案数字资源长期保存策略)的文章,《电子档案备份相对于数据备份的特别之处》、《备份策略从“3-2-1”到“4-3-2-1”》,但是很多读者依然觉得不解渴,因为目前绝大部分档案部门正在建设和使用的是管理库,而不是长期保存库。很多单位对于长期保存库的建设尚处于规划设计阶段,现阶段首先应该考虑的是档案管理库数据的备份问题,我们今天就来聊聊这个话题。

档案管理库数据的备份问题 

按照常规的档案“四库架构”,详细参见本公众号文章《档案信息化建设到底需不需要“四库分离”?》,上图红圈所示的管理库处于核心和中枢的位置,数字档案馆(室)应用系统主要也都是和管理库进行数据交互。管理库中存储的数据主体是档案目录数据和电子全文数据,前者一般存储在关系型数据库中,后者一般存储在文件系统中,两者之间通过一定的逻辑关系映射。当然管理库中的数据比较复杂,除了档案目录数据和电子全文数据之外,可能还会有各种管理类数据、日志文件、程序处理需要的临时或者冗余数据,当然还包括操作系统、数据库、中间件等系统软件本身的数据文件以及应用程序文件。

档案管理库的物理架构也比较复杂,很多立档单位为了管理方便,都会把管理库放在本单位信息部门统一构建的私有云上,这种情况下就采用信息部门统一管理的存储备份策略即可,本文不对这种情况进行讨论。而档案馆则一般会建设独立的计算机机房,对档案数据进行单独管理,而不是将管理库构建在统一的政务云平台上。档办函[2020]55号《关于档案部门使用政务云平台过程中加强档案信息安全管理的意见》中也明确指出:“涉及国家秘密、工作秘密的档案数据及业务,不得使用政务云平台”。

为了实现管理库的长期稳定运行并确保数据安全,需要对管理库采取切实可行的备份措施。那么,对于物理独立的管理库中的数据应该如何进行备份呢?现阶段,管理库主流的存储备份架构如下图所示:

即主要用磁盘阵列存储数据,用磁带库进行数据备份,用备份软件管理整个备份过程并执行备份策略。典型的备份策略示例如下(各单位由于数据量、数据类型、备份要求的不同会有差异,仅供参考):

常见的备份方式包括以下三种:

※ 全备份(Full Backup,F):对要备份的内容做无条件的全部备份;

※ 差分备份(Differential Backup,D):从前一个全备份以后,对变更过或新增的数据进行备份;

※ 增量备份(Incremental Backup,I):对从上次任意形式的备份以后变更过或新增的所有数据进行备份。


 

常规的数据备份可以采用以上三种备份方式相结合的策略,如下所示:

 

即以一个月(或者四周)为周期,每个月做一次全备份(F),每周做一次差分备份(D),每天做一次增量备份(I),约定每天晚上12点钟开始执行备份策略,以此往复循环。

以上备份策略充分运用了全备份、增量备份、差分备份各自的特点,尽可能减少每次备份的数据量以提高备份效率,并且尽可能降低数据恢复时所需的备份文件,同时保证了最大数据损失就是一天的变化数据。

持续数据保护

但不管怎么说,以上备份策略毕竟还是会造成一天的变化数据损失,这在很多实时性要求很高的应用系统中是不被允许的,于是,持续数据保护(Continuous Data Protection,CDP)应运而生。

 

持续数据保护(CDP)也被称作持续备份(Continuous Backup),是一种在不影响主要数据运行的前提下,可以实现持续捕捉或跟踪目标数据所发生的任何改变,并且能够恢复到此前任意时间点的方法。CDP系统能够提供块级、文件级和应用级的备份,以及恢复目标至任意可变的恢复点。

应该说CDP技术是对传统数据备份技术的一次革命性的重大突破。传统的数据备份解决方案专注在对数据的周期性备份上,因此一直伴随有备份窗口、数据一致性以及对生产系统的影响等问题。而CDP系统为用户提供了新的数据保护手段,系统管理者无须关注数据的备份过程(因为CDP系统会不断监测关键数据的变化,从而不断地自动实现数据的保护),而且当灾难发生后,简单地选择需要恢复到的时间点即可实现数据的快速恢复。

从原理上来看,CDP技术通过在操作系统核心层中植入文件过滤驱动程序,来实时捕获所有文件访问操作。对于需要CDP连续备份保护的文件,当CDP管理模块经由文件过滤驱动拦截到其改写(新增、删除、修改)操作时,则预先将文件数据变化部分连同当前的系统时间戳(System Time Stamp)一起自动备份到存储设备。从理论上说,任何一次的文件数据变化都会被自动记录,因而称之为持续数据保护。有一个形象的比喻:传统备份软件就像是照相机,只在按快门的时候产生照片;CDP软件则是摄像机,打开就不停工作,任何时间点的图像都不会错过。

全球网络存储工业协会(Storage Networking Industry Association,SNIA)关于CDP的描述如下图所示:

 

CDP技术用于档案管理库的备份

如果将CDP技术用于档案管理库的备份,存储备份架构如下图所示:

 

在需要监控的服务器上安装CDP客户端(如果服务器进行了虚拟化处理,也可以在云平台中嵌入CDP引擎插件),采用CDP备份一体机进行持续备份,为了提升备份和恢复的速度,备份数据的存储载体以磁盘为主。

SNIA关于CDP的优势已经说的很明白:

1)零数据丢失、零备份窗口;

2)任意时间点的数据恢复;

3)数据恢复操作便捷;

4)全天候的数据保护。

这样看来,CDP似乎可以完全取代传统的数据备份方式了,但事实并非如此,CDP技术也存在一些劣势:

1)真正的CDP技术需要解决数据持续不间断监控和记录的技术难题,目前还存在资源消耗大、计算效率低、重复数据多的问题;

2)真正的CDP技术持续备份时产生的大量数据,远大于其他备份方式产生的数据量,对存储系统形成较大压力;

3)真正的CDP解决方案实施费用相对较高,是传统备份方式的几倍,但大部分客户的数据保护需求并没有这么高。

因此,从性价比上来评判数据备份解决方案的优劣,是否采用CDP技术就不一定了。一般而言,CDP技术方案更加适合于系统实时性要求非常高、对数据变化高度敏感的应用,比如银行交易系统、订票网站、生产管理系统等,相对而言档案管理系统的数据实时性要求并没有这么高,采用传统的备份方案,一天的变化数据丢失也不是说完全不能接受,毕竟档案数据还有多套备份,还有长期保存库托底。大不了在灾难发生时,数据恢复到前一天之后再人工录入当天的数据,也不会产生多少工作量。在这种情况下,笔者认为,对于档案管理库中的数据,传统的备份方案实际上也已经够用了。当然在经费允许的情况下,CDP解决方案也可以尝试,毕竟这代表了备份技术的发展方向。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/151613.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Activity和Fragment的生命周期总结以及保存实例状态机制

读完将收获以下内容 一. Activity的生命周期详解 Activity配置和状态改变时生命周期 Activity状态和配置改变时的解决方案 二.Fragment的生命周期详解 Fragment配置和状态改变时生命周期 Fragmen状态和配置改变时的解决方案 三.Activity和Fragment的生命周期调用顺序 一. Acti…

笔记--Qt Pro语法总结

QT pro文件: 任何一个 Qt 项目都至少包含一个 pro 文件,此文件负责存储与当前项目有关的配置信息,比如: 项目中用到了哪些模块? 项目中包含哪些源文件,哪些头文件,它们的存储路径是什么&…

德育知识元素挖掘系统设计 软件工程 spring boot + Vue.js + python机器学习

第一章 绪论 摘要 当今社会发展迅速,机器学习相关技术快速在各行各业普及,制作数据挖掘系统的需求日益增长。同时,随着社会发展不断推进,对学生进行德育教育的规模越做越大,成为了教育行业发展的一大趋势。对于较大规模…

glibc 2.31 pwn——house of pig原题分析与示例程序

house of pig这种利用方式来源于XCTF 2021 final中的同名题,其原题使用的是libc 2.31版本,本文就根据这道题学习一下这种漏洞利用方式。 参考资料 这是一道C pwn,但漏洞本身与C不同于C的特性关系不大。 一共提供了5个选项: 增&…

idea无法安装插件

不能安装插件,首先需要确定是问题,最常见的是无法下载和安装不上, 1.无法下载解决版本 无法下载很多时候就是延迟太高导致的,我们先打开插件官网看一下 Python - IntelliJ IDEs Plugin | Marketplace 如果网站无法打开&#xf…

【测试】用例篇

努力经营当下,直至未来明朗! 文章目录一、设计测试用例的万能公式二、设计测试用例的具体方法1. 等价类2. 边界值3. 因果图(判定表)4. 场景设计法5. 正交法6. 错误猜测法:sparkles: 小结普通小孩也要热爱生活! 一、设…

JS数据类型判断的九种方式

JS 的数据类型检测是一道经典的八股文面试题。相信大家都能条件反射的回答出 4 种方法:typeof、constructor、instanceof 和 Object.prototype.toString,并且对它们各自的优缺点也是张口就来。 本文对这些方法做了简单归纳,同时又补充了其他…

Leetcode:112. 路径总和、113. 路径总和 II(C++)

目录 112. 路径总和: 问题描述: 实现代码与解析: 递归: 原理思路: 迭代: 原理思路: 113. 路径总和 II: 问题描述: 实现代码与解析: 迭代&#xff…

分享66个NET源码,总有一款适合您

NET源码 分享66个NET源码,总有一款适合您 NET源码下载链接:https://pan.baidu.com/s/1-H0UV3yly3p1PXbeLAvMtA?pwdk06f 提取码:k06f page_count 1 # 每个栏目开始业务content"text/html; charsetgb2312"base_url "http…

go defer return panic 执行顺序

根据代码实例运行结果来总结说明:定义一个函数,有多个defer (用于判断多个defer执行顺序),有panic和 return (判断与defer对比执行顺序)一、函数中有panicpackage mainimport "fmt"fu…

【矩阵论】8. 常用矩阵总结——秩1矩阵,优阵(单位正交阵),Hermite阵

矩阵论 1. 准备知识——复数域上矩阵,Hermite变换) 1.准备知识——复数域上的内积域正交阵 1.准备知识——Hermite阵,二次型,矩阵合同,正定阵,幂0阵,幂等阵,矩阵的秩 2. 矩阵分解——SVD准备知识——奇异值…

【性能调优】【离线任务】flink处理离线任务(8000个小文件?200多亿数据量?)稳定性与性能调优探索

文章目录一、场景描述1. 任务类型描述2. 问题任务二、相关理论1.Task Slots and Resources1.1. slots与资源的隔离和共享1.2 建议cpu和slot数关系2. tm的资源配置是否合适2.1. flink load problems2.2. 阿里 flink资源配置建议三、问题分析与解决1. 测试结果比对1.1. 任务11.2.…

小程序学习(2)-----常用的各类组件

新建项目 项目->新建项目-小程序,如下图所示 新建小程序页面 只需要在 app.json->pages 中新增页面的存放路径,小程序开发者工具可帮我们自动创建对应的页面文件,如图所示: 2.常用的视图容器类组件 ① view 普通视图区域类…

Java基础算法每日5道详解(3)

136. Single Number 单号 Given a non-empty array of integers nums, every element appears twice except for one. Find that single one. You must implement a solution with a linear runtime complexity and use only constant extra space. 给定一个非空整数数组 nu…

在Multisim导入TI提供的SPICE模型

对在multisim中导入TI模型的一个记录。 multisim中只有常规的元器件,对于很多元器件multisim都没有相应的模型,这就需要手动导入了。 Multisim导入模型1、从官网下载相应的模型文件2、在Multisim中导入模型3、写在后面1、从官网下载相应的模型文件 &…

c/c++ 函数(一) setw()、isdigit()、isalpha()、atoi()、itoa()

目录 1、setw(int n) <iomanip> 2、int isdigit(char ch) <ctype.h> 3、int isalpha(int c) <ctype.h> 4、int atoi(const char* str) <stdlib.h> 5、char* itoa(int num) <stdlib.h> 1、se…

Linux 基本权限

目录 1 shell命令以及运行原理 1.1 理解 1.2 意义 2 Linux权限的概念 2.1 概念 2.2 用户分类 2.3 Linux文件属性 2.4 Linux文件权限 2.4.1 文件访问者的分类&#xff08;人&#xff09; 2.4.2 root&&普通用户 vs 拥有者&&所属组&&other 2.4…

异步架构,避免相互依赖的系统耦合

前言&#xff1a; 使用缓存架构可以减少不必要的计算&#xff0c;快速响应用户请求&#xff0c;但是缓存只能改善系统的读操作性能&#xff0c;也就是在读取数据的时候&#xff0c;可以不从数据源中读取&#xff0c;而是通过缓存读取&#xff0c;以加速数据的读取速度。 但是…

vulnhub DC系列 DC-6

总结:wpscan爆破&#xff0c;nmap提权 下载地址 DC-6.zip (Size: 619 MB)Download: http://www.five86.com/downloads/DC-6.zipDownload (Mirror): https://download.vulnhub.com/dc/DC-6.zip使用方法:解压后&#xff0c;使用vm直接打开ova文件。 漏洞分析 信息收集 这里还是使…

4. 数据处理:用R语言实现【多路替换】真高效!!

b站课程视频链接&#xff1a; https://www.bilibili.com/video/BV19x411X7C6?p1 腾讯课堂(最新&#xff0c;但是要花钱&#xff0c;我花99&#x1f622;&#x1f622;元买了&#xff0c;感觉讲的没问题&#xff0c;就是知识点结构有点乱&#xff09;&#xff1a;https://ke.qq…