当前针对虚拟机的磁盘映像备份的通用技术,主要通过识别虚拟机磁盘文件的元数据,或是借助虚拟化API(如CBT接口)或分区结构提取位图来进行。然而,由于虚拟化环境底层的限制,无法洞悉文件系统的内部运作,因此在执行文件删除操作时,这可能会导致随着时间的推移,完全备份的有效数据不断累积,最终趋近于整个磁盘的大小。
深度有效数据提取技术的出现,正是为了克服上述备份方案的不足,精确识别并提取磁盘中的实际使用数据。整体来看,这项技术能够显著减少备份的传输需求以及存储空间,不仅能有效节省存储空间,更可以提高整体备份效率。
举例:在A虚拟机的磁盘上,存放着一份大小为10Kb的文件。当我们删除这份文件时,A虚拟机的文件系统只是在元数据中将其标记为已删除,但实际上它并未从磁盘上移除(注:此点不等于可以将丢失的数据找回,这里的描述旨在为读者更通透的理解深度有效数据提取的技术背景)。由于虚拟化平台无法感知到A虚拟机的文件系统已将这份10Kb的文件标记为删除,因此,在进行完全备份时,通用备份技术也会将该文件备份下来。随着时间的推移,当A虚拟机上的删除操作越来越多时,被文件系统标记为已删除的磁盘空间就越多,完全备份一次磁盘映像,备份数据量将逐渐增大并趋近于整个磁盘的大小,这将极大地浪费备份存储空间。因此,深度有效数据提取技术应运而生,以解决这个问题。该技术能够精确识别并提取磁盘中的实际使用数据,从而显著减少备份的传输和存储需求,节省空间并提高整体备份效率。
云祺的深度有效数据提取技术的核心原理在于穿透块设备层,直接识别磁盘内的分区信息和文件系统信息,从而解析出文件系统层的有效数据位图。通过将传统备份方式的有效数据位图与新的备份数据位图进行结合,可以生成新的备份数据,从而实现减少备份数据大小的目的。目前,深度有效数据提取功能支持排除已在文件系统中删除的数据块、交换文件块以及分区间隙块等无需进行备份的数据块。
目前该技术应用于虚拟机保护模块、操作系统保护模块。其中,虚拟机保护模块中深度有效数据技术的应用逻辑如下:
- 在备份任务阶段完成基本信息获取及快照创建之后;
- 虚拟机保护模块按照目标虚拟化对应的方法获取磁盘的有效数据位图(如VMware的CBT接口返回的位图信息);
- 通过深度有效数据提取引擎获取对应虚拟磁盘的磁盘位图;
- 备份系统通过将步骤2和3得到的两个位图进行处理,生成新的位图;
- 虚拟机保护模块会使用新的位图信息进行对应数据的备份传输;
从技术原理图中也可以看出,操作系统保护模块通过引擎获取之后,直接使用该位图文件进行识别和数据传输。
深度有效数据提取技术能够深入解析磁盘结构,显著提高备份效率。同时,它提供了灵活的配置选项。当您使用灾备系统并启用深度有效数据提取功能时,系统将自动排除被文件系统标记为已回收的块。此外,还支持设置两个高级选项:“排除分区间隙”和“排除交换文件块”。用户可以根据自身需求选择开启或关闭这些选项,以更好地满足备份需求。总之,云祺深度有效数据提取技术能够大幅减少备份数据量,提高备份效率,并为用户提供灵活的配置选项。
深度有效数据提取技术原理图: