服务器存储数据恢复环境:
北京某企业一台EMC FCAX-4存储上搭建一组由12块成员盘的raid5磁盘阵列,其中包括2块热备盘。
服务器存储故障:
raid5阵列中两块硬盘离线,热备盘只有一块成功激活,raid瘫痪,上层LUN无法使用,存储崩溃。
服务器存储数据恢复过程:
1、将故障存储中所有磁盘编号后取出。硬件工程师对所有硬盘进行物理故障检测后发现所有磁盘均无物理故障,包括掉线盘也不存在物理故障。检测所有磁盘的坏道也没有发现有硬盘存在问题。
2、以只读方式将所有磁盘做扇区级全盘镜像,镜像完成后将所有磁盘按照编号还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。由于本案例中磁盘扇区大小为520字节,镜像完成后将所有镜像数据做520字节 to 512字节的转换。
3、基于镜像文件分析所有磁盘底层数据,获取raid结构相关信息,利用获取到的raid相关信息重组原raid。
4、分析LUN在RAID中的分配信息,以及LUN分配的数据块MAP。解释LUN的数据MAP并导出LUN的所有数据。
5、使用北亚企安自主开发的软件对LUN做文件系统解释,但是在对部分文件系统元文件做解释时却出现报错。经过分析发现报错原因是元文件损坏。北亚企安数据恢复工程师手动修复损坏的元文件,直到zfs文件系统就可以正常解析,解析完成后导出所有数据。
6、用户方对恢复出来的数据进行认真检测后,确认恢复出来的数据完整有效。本次数据恢复工作完成。