目录
- vSAN故障处理
- 单节点维护
- 从vSAN集群中永久删除节点
- 关闭vSAN集群
- 重启vSAN集群
- 删除vSAN集群
vSAN故障处理
级别 | 状态 | 处理 | 可能原因 |
---|---|---|---|
活动 | 正常 | 无 | 无 |
缺失 | vSAN 检测到临时组件故障,且其中的组件可以恢复并还原其工作状态,则该组件将处于“缺失”状态。(检测到故障,但不确定是否能恢复) | 默认情况下,在60分钟后还无法访问或影响组件,开始重构组件。 | 网络故障、ESXi主机故障、磁盘热拔拔出 |
已降级 | 如果 vSAN 检测到永久组件故障并假定该组件不会恢复到工作状态,该组件将处于“已降级”状态。(无法恢复的故障) | 立即开始重构组件。 | 磁盘故障、磁盘控制器故障 |
同步中 | 数据同步或重组 | 无 | 重新应用存储策略 |
vSAN7U1中,组件确实,会在另一台主机上创建raid-d组件,用于记录新产生的数据。当原组件恢复后,raid-d数据与原数据合并,再删除。
单节点维护
- 将所有正在运行的虚拟机从该节点上迁移走(vCLS和File Service Node除外)
- VCLS:创建集群后自动创建的辅助虚拟机
- 选择数据迁移形式
确保可访问性:迁移部分数据,保证用户能正常访问
迁移全部数据:将vSAN集群在该主机上的数据全部迁移走
- 主机进入维护模式
- 处理主机维护工作,并退出维护模式
从vSAN集群中永久删除节点
磁盘出现问题时,也会进行这个操作
-
确保 VSAN 磁盘组中有
足够的容量
来容纳
取消配置节点的数据。 -
将主机置于
维护模式
并选择 ful data migration(完全数据迁移
)。这会撤出所有磁盘组
-
等待重新同步完成,主机进入维护模式。
-
删除要取消配置的主机上的磁盘组。
选择 vSAN 集群>配置>磁盘管理>选择磁盘组>移除磁盘组
OSA架构下,如果是缓存层出问题,由于缓存层磁盘没有
移除磁盘
选项,就必须删除掉整个磁盘组
OSA架构下,如果是容量盘出问题,可以
单独删除
该容量盘,再添加即可。但要注意:磁盘种类相同,磁盘大小大于或等于
原故障磁盘。
- 将 ESXi 主机移出群集,以便与 VSAN 解除关联
手动将该ESXi主机
拉出
集群文件夹即可。
注意:也可以从命令行运行 esxcli vsan clusterleave 命令来退出集群
- 关闭 ESXi 主机。
关闭vSAN集群
一般是因为vSAN中ESXi主机的升级;更新驱动等
-
准备要关闭的 vSAN 集群。
- 检查 vSAN 运行状况服务以确认集群处于正常运行状态。
- 关闭存储在 VSAN 集群中的所有虚拟机的电源,vCenter Server 虚拟机、vCLS 虚拟机和文件服务虚拟机
除外
。如果 VSAN 集群中托管 vCenter Server,请勿关闭 vCenter Server 虚拟机的电源。
-
右键单击 vSphere client 中的 vSAN 集群,然后选择菜单
关闭集群
。
-
“关闭集群”向导中,确认“关闭”预检查具有
绿色的复选标记
。解决任何带有红色感叹号在的问题。单击下一步。如果在 VSAN 集群上部署 vCenter Server Appliance,“关闭”向导会显示 vCenter Server 通知。记下编排主机的IP地址
,以备在集群重新启动期间使用。单击 下一步。
-
输入执行关机的原因,然后单击关机。“VSAN 服务”页面改为显示关于关机过程的信息。
-
监控关机过程。VSAN 将执行关闭集群、关闭系统虚拟机电源和关闭主机电源的步骤。
假如VCSA主机在vSAN上,VCSA会在所有vSAN上主机启动后自动启动(VMWare内置脚本)
当然生产环境vCenter不要放在vSAN上。
注意:不要在整个关机操作完成前,手动把主机上电启动。
重启vSAN集群
- 打开集群所有主机的电源。
如果在 VSAN 集群上托管 vCenter Server,请等待 vCenter Server 重新启动。
-
右键单击 vSphere client 中的 vSAN 集群,然后选择菜单
重新启动集群
。
-
在“重新启动集群”对话框中,单击
重新启动
。
-
集群重新启动后,检查 VSAN 运行状况服务并解决任何未解决的问题
删除vSAN集群
-
关闭所有服务
-
关闭vSAN
-
删除集群再添加主机(或手动移出集群即可)