【服务器数据恢复】Raid磁盘阵列常见故障类型原因分析

news2024/9/22 15:30:02

由于raid的特点和优势,磁盘阵列技术被广泛应用于服务器和存储等商用领域。由于用户基数大,出现故障的情况也不少。通过这篇文章介绍一下常见的raid磁盘阵列数故障类型和原因。

 

故障类型一、磁盘阵列处于降级状态时未及时rebuild。
RAID磁盘阵列的数据安全冗余是利用部分空余空间实现的,阵列中有成员盘下线便无法继续提供冗余空间。如果此时未能及时更换新磁盘并rebuild整个卷,一旦raid中有其他成员盘离线将会导致整个raid卷无法工作。这类故障是北亚企安数据恢复工作中会经常遇到case。

故障类型二、raid控制器故障。
磁盘阵列控制器在充当着操作系统与物理硬盘之间的连接纽带。磁盘阵列中的硬盘数量、容量大小、raid级别、校验方式等raid信息有的存储于硬盘,有的存储于阵列卡或者在二者中都有存储。如果控制器出现故障,raid信息就无法还原,如果出现这种故障,即使能够还原raid结构并再次重建raid阵列也无法恢复数据。

故障类型三、固件算法缺陷。
RAID的创建、重建、降级、保护等功能的实现依靠的raid固件上的一套非常复杂的算法,任何复杂的算法都会有BUG,尽管厂商不会轻易承认自家产品固件算法的BUG(有可能自己也不知道)。因为固件算法BUG,发生无法解释的故障可能性肯定是有的。比如在北亚企安接到的数据恢复case中就遇到过早期生产的某品牌服务器RAID中一块盘OFFLINE后,故障盘与报警灯不一致的情况。用户在更换故障盘进行REBUILD时被误导拔错盘,导致整个RAID崩溃。

 

故障类型四、IO通道受阻导致RAID掉盘。
RAID控制器在设计时候优先考虑的是数据的安全性,RAID会尽可能避免将数据写到不稳定的存储介质上。当控制器与物理盘进行IO时,如果时间超过某个阈值或校验关系不满足,RAID控制器便会认为对应的存储介质已不具备持续稳定工作的能力并让其强制下线,然后通知管理员尽快解决问题。这种设计的初衷从技术上和逻辑上来看没有问题,但对于如物理连接线路松动,硬盘工作反应超时(硬盘还是完好的)等场景来说,控制器无法分辨存储介质是否真的出现物理故障,这种情况下会大概率强制磁盘下线。这类故障发生概率比较高且无法避免,很多用户因此类故障质疑服务器厂商。实际上。越是设计安全的RAID控制器,越容易发生此类故障。

故障类型五、控制器的稳定性。
RAID的控制器在ONLINE状态下(无离线盘)工作是最稳定的。当部分硬盘(物理故障或者逻辑故障)离线后控制器便会工作在一个相对不稳定的状态,这也是好多中低端的RAID控制器在有磁盘离线后就表现出读写性能下降的原因。控制器的不稳定会增加数据吞吐时IO滞留的可能性,从而导致上述第四个类型的故障的发生。中低端的控制器(无高性能处理芯片或者大容量高速缓存)发生这类故障的概率要高得多。

故障类型六、阵列中硬盘故障。
很多人认为磁盘阵列只要在正常工作,阵列中就不会存在有物理故障的硬盘。这个观点的判断依据是一旦raid中有硬盘出现物理故障,阵列控制器就会将故障硬盘踢下线。然而实际上并非如此。
RAID很少会读取到物理硬盘的所有磁盘空间,同一时间更是不可能。部分情况下,硬盘会在RAID没有读取到的区域或者RAID以前读取过的区域出现坏道,这类坏道因为没有被RAID读过,所以在控制器来看还是好的。
出现这种情况后可能会产生的直接后果就是在REBUILD过程中,当一块物理硬盘离线后,在进行REBUILD过程中,如果其他硬盘存在这类没有被RAID读取到的坏道,由于REBUILD是对全盘做全面同步,在REBUILD过程中就一定会读写到这类之前没有被RAID读取到的坏道。这时REBUILD还没完成,新盘无法上线,又在旧盘发现了坏道,RAID极有可能将发现坏道的旧盘踢出,这样就会导致RAID故障。

故障类型七、人为误操作。
人为误操作导致的RAID故障,例如:误拔了RAID里的硬盘、更换坏盘不及时、拔出硬盘更换或者进行其他操作后忘记硬盘在RAID中的顺序、不小心删除了原RAID配置等。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/456386.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux+云服务器

目录 前言 一、Linux介绍 二、Linux 环境搭建 2.1 云服务器 2.2 XShell 终端 三、Linux 常用命令 3.1操作目录的命令 3.1.1 ls 【list的缩写】 双击某个目录 3.1.2 pwd 【print working directory的缩写】打印当前所处地址 3.1.3 cd 【change directory的缩写】切…

DAY02_运算符和选择语句

1:运算符 对数据进行运算。而对数据运算就要用到运算符。 和表达式做一个简单的描述: 运算符:对字面量或者变量进行操作的符号 表达式:用运算符把字面量或者变量连接起来符合java语法的式子就可以称为表达式。不同运算符连接的…

JUC多并发编程 volatile

特点: 可见性有序性(有时需要禁用重排) 内存语义: 当写一个 volatile 变量时, JMM 会把该线程对应的本地内存中的共享变量值立即刷新回主存中当读一个 volatile 变量时, JMM 会把该线程对应的本地内存设置无效,重新…

m4a怎么转换成mp3,4招搞定

m4a怎么转换成mp3?相信很多朋友都知道,无论是音频、视频、图片等很多电子文件,都会有多种格式。由于格式不统一,很容易导致文件和软件之间出现不兼容的情况,最直接的结果就是在播放器中无法打开,或者使用的…

一篇文章带你了解Spring/SpringBoot常用注解(建议收藏!!! )

这篇文章介绍的 Spring/SpringBoot 常用注解基本已经涵盖你工作中遇到的大部分常用的场景。对于每一个注解我都说了具体用法,掌握搞懂,使用 SpringBoot 来开发项目基本没啥大问题了! 1. SpringBootApplication 这里先单独拎出SpringBootAppl…

NUXT规范及常见问题

props中不要使用Web环境才有的对象&#xff0c;服务端渲染的时候会失败 使用<Nuxt/>组件代替<router-view/>&#xff0c;使用<NuxtLink/>代替<router-link/>static目录下的资源是静态资源&#xff0c;不应该通过import或../static/img/logo.png等方式…

【AI绘画】我以Midjourney为主学习AI绘画效果咋样?

上一篇博客链接&#xff1a;【ChatGPT】ChatGPT掀起AIGC与AI浪潮_山楂山楂丸的博客-CSDN博客 这周&#xff0c;我加入了新星计划&#xff0c; 涉及的领域是我感兴趣以及对未来规划有帮助的——AI绘画&#xff01;​​​​​​​ 文章目录 前言 一、AI绘画是什么 二、AI绘画进…

MYSQL命令小总结

一、创建查看 1.输入cmd&#xff0c;打开控制器&#xff0c;输入如下&#xff0c;打开MYSQL C:\Users\ASUS> mysql -u root -p 2.查看已有数据库 mysql> show databases; 3.建立数据库 4.使用数据库 use englishword;5.建立表单 CREATE TABLE user ( id INT primar…

AI Stable Diffusion Prompt参数【一】

AI Stable Diffusion Prompt参数【一】 配置场景1:草丛里的女性promptNegative Prompt结果 场景2: 雨中披头散发的女孩promptNegative Prompt结果 场景3: 一个女孩和她的朋友在逛街promptNegative Prompt结果 场景4: 学生在教室promptNegative Prompt结果 场景5: 穿着白色丝袜和…

自动化工具 基于 Antd+DRF 开发了一款适配 JMeter 的接口自动化测试报告

JMeter Report 基于 AntdDRF 开发的一款 JMeter 测试报告服务&#xff0c;用于在 JMeter 接口测试中使用。 &#x1f334; 背景 JMeter 是测试工作中常用的一款工具&#xff0c;除了压测还可以用来做接口自动化的测试。 从事测试多年&#xff0c;接口自动化也做过很多的尝试…

从零搭建开发脚手架 自定义打包构建研发输出产物

文章目录 背景目录源码目录结果目录 实现项目打包方式一 使用IDEA工具打包,选择对应的profiles,然后clean package方式二 使用maven命令打包 部署 背景 在打包项目时&#xff0c;通常只需要生成一个可执行的jar文件。然而&#xff0c;有时候需要将启动脚本或外部配置文件附加到…

Java版电子招投标系统源码之了解电子招标投标全流程

随着各级政府部门的大力推进&#xff0c;以及国内互联网的建设&#xff0c;电子招投标已经逐渐成为国内主流的招标投标方式&#xff0c;但是依然有很多人对电子招投标的流程不够了解&#xff0c;在具体操作上存在困难。虽然各个交易平台的招标投标在线操作会略有不同&#xff0…

感应开关盖垃圾桶项目实现.md

1.项目接线 接线示意图和实物图 示意图和接线说明&#xff1a; 舵机控制口P1.1&#xff08;定时器0中断&#xff09;&#xff1b;超声波Trig接P1.5 ,Echo接P1.4 &#xff1b;蜂鸣器接P2.0 口;震动传感器接P3.2 口&#xff08;外部中断0&#xff09;。 实物图&#xff08;未封装…

室内人员定位,硬件部署方案多场景技术分析

室内外定位技术在工业、矿业、医疗养老、能源电力、展览展会、公检法司、工地等众多领域具有丰富的应用场景。定位能力作为“物联网”的核心能力之一&#xff0c;其定位精度和稳定性不仅需要强大的算法支撑&#xff0c;也有赖于好的室内定位设备的落地部署。 基于蓝牙LoRa定位…

MySQL按照,库的操作,表的约束 --- MySQL总结(一)

MySQL 文章目录 MySQLMySQL的安装MySQL组成架构连接池软件层引擎层储存层 库的操作创建库修改数据库删除数据库备份数据库还原数据库查看链接情况 表操作创建表查看表结构修改表结构添加字段修改字段类型长度更改表名修改属性删除表 数据类型表的约束空属性&#xff08;not nul…

typescript全局安装卸载以及npm相关问题

全局安装 npm install -g typescript 全局安装之后&#xff0c;如果想要卸载要使用 npm uninstall -g typescript 全局安装之后可以在终端使用 tsc xxx 编译ts文件 本地安装&#xff0c;也就是在项目目录下安装 npm install typescript 本地卸载 npm uninstall type…

【LeetCode】刷题数据结构(1)[反转链表]

【LeetCode】刷题数据结构&#xff08;1&#xff09; 1.题目来源2.题目描述3.解题思路4.代码展示 所属专栏&#xff1a;玩转数据结构题型 博主首页&#xff1a;初阳785 代码托管&#xff1a;chuyang785 感谢大家的支持&#xff0c;您的点赞和关注是对我最大的支持&#xff01;&…

Elasticsearch ILM DSL 索引生命周期管理

1、冷热集群架构 冷热架构也叫冷暖架构&#xff0c;是“Hot-Warm” Architecture的中文翻译。 冷热架构本质是给节点设置不同的属性&#xff0c;让每个节点具备了不同的属性。为演示 ILM&#xff0c;需要首先配置冷热架构&#xff0c;三个节点在 elasticsearch.yml 分别设置的…

4月21号软件更新资讯合集.....

PlayEdu v1.0-beta.3 发布&#xff0c;视频培训解决方案 PlayEdu 是基于 SpringBoot3 Java17 React18 开发的企业内部培训系统。它专注于提供私有化部署方案&#xff0c;包括视频&#xff0c;图片等资源的内网部署。目前主要支持有本地视频上传播放、学员邮箱登录、无限级部门…

如何使用JMeter和Ant生成高效测试报告?

Jmeter接口自动化测试项目实战视频教程地址&#xff1a;https://www.bilibili.com/video/BV1e44y1X78S/? 目录&#xff1a;导读 引言 一、安装ant 二、ant关联jmeter工具 三、执行 结语 引言 你曾经在进行软件测试时遇到过测试结果难以分析&#xff0c;甚至花费大量时间…