EMC Unfied的VNX存储系统要比单纯的Block系统复杂很多,相当于是两套存储系统,不管在物理硬件上还是逻辑的软件OS上,都复杂很多很多。
客户经常遇到由于机房停电或者机房搬迁等情况,需要对存储系统做关机下电甚至物理搬迁的动作,但由于很多工程师对Unified存储系统不了解,采取了野蛮关机的方式,导致很多时候出现了data mover不能正常启动,cache dirty的情况发生,严重的影响到客户的业务不能继续提供,甚至造成客户数据丢失。
本文对EMC VNX Unifed存储系统的关机顺序给出了详细的描述,希望对朋友们有所帮助。如果还有其他问题,可以add wechat at StorageExpert继续讨论。
下面的方法适用于VNX1代和2代产品,在客户现场由于OE版本的不同,可能看到的和本文描述的会有所不同,这里不能一一列出差异所在,但大体方向是一样的。
-
通知用户要进行关机
-
登陆控制台CS0的unisphere检查系统状况,这个是图形界面
-
也可以通过串口登录控制台,使用nasadmin用户登录,登录以后,su到root权限
检查系统健康状态
# /nas/bin/nas_checkup
这个命令会检查控制台control station,data mover和存储系统,要确保没有major errors。如果有major error,一定要解决了再关机。
4. 从filer OE 7.1.74.5版本以后,就有了单一命令行(single CLI command)下电的功能。
# /nas/sbin/nas_halt -sp now //这个就是一个命令把所有的都下电,包含控制台,data mover和Array存储
如果仅仅要把filer部分下电,使用下面的命令,下面的命令不shutdown存储的
# /nasmcd/sbin/nas_halt now (To shutdown Control Stations and Data Movers only)
******************************** WARNING! *****************************
You are about to HALT this VNX including all of its Control Stations and Data Movers. DATA will be UNAVAILABLE when the system is halted.
Note that this command does *not* halt the storage array.
ARE YOU SURE YOU WANT TO CONTINUE? [yes or no] :
这个下电过程需要20分钟左右的时间来下电。
5. 如果仅仅是对file部分下电的话, # /nas/sbin/nas_halt now
必须是root权限来执行
6. 确认DME是否已经下电,拔掉电源线。
从外观来观察是否可以拔掉电源线了。上图是data mover的LED指示灯(有两种LED,一种是故障fault指示灯,一种是电源指示灯)。另外,从Data mover的后面看,management module这个IO module的故障LED也是点亮的。
成功的data mover关机后,enclosure的故障LED灯是点亮的,Power电源的LED灯是关闭的。
7. 确定控制台control station是否成功关机?拔掉电源线。
下面图是VNX1代的控制台LED指示灯情况
控制台成功关机的LED指示灯是只有6号灯,就是网络的灯是点亮的,其他都是熄灭的状态。
下图是VNX2代控制台LED指示灯的情况,供参考。
8. 如果仅仅对filer部分关机,到此为止就可以了。如果还要继续对array存储block部分关机。还需要继续下面的操作
停止所有的IO,就是把主机都停了,这样就没有IO了,这时候存储会把内存中的数据刷到磁盘上,建议停止IO以后,再等5分钟继续后面的操作。
9. 对SP的关机,不是直接拔掉SP上的电源线,对于VNX1代设备,有两个单独的SPS电池,关闭SPS上的电源开关。
要等SPS的LED灯熄灭以后再做拔掉电源线等动作。
对于VNX2代设备,由于没有了专门的SPS电池,变成了BBU电池,所有可以直接拔掉电源线,但也要等LED灯都熄灭了再做其他动作。
10. 最后如果有扩展柜的话,可以把扩展柜的电源线都拔掉了。