Oracle-ASM磁盘组HIGH模式丢盘问题处理

news2024/11/17 12:35:57

背景:

        用户一套Oracle19c的RAC集群ASM磁盘组使用了3个存储作为HIGH以及NORMAL冗余模式,每个存储分别对应一个failgroup,其中2个存储出现了故障导致ASM磁盘组对应的failgroup磁盘全部offline,在存储恢复正常之后,需要将offline的磁盘加回ASM磁盘组

问题:

        一套Oracle19c的RAC集群ASM磁盘组ARCHDG,DATADG使用了3个存储作为HIGH冗余模式,OCRDG使用了3个存储作为normal模式,每个存储分别对应一个failgroup,其中2个存储出现了故障导致ARCHDG,DATADG磁盘组对应的两个failgroup磁盘全部offline,OCR磁盘组有一个failgroup offline

问题处理:

      OCRDG盘处理

        OCRDG心跳盘磁盘只有FAILGROUP FG3的OCRDG_0002被force drop,因为集群至少需要2个心跳盘否则集群会直接crash,所以只能force drop一个FAILGROUP

        在Oracle11.2之后,对于被force drop的OCR心跳盘,加回磁盘的操作跟普通的ASM磁盘组一样,直接通过add diskgroup加回即可

        将force drop的磁盘加回OCRDG,由于是被强制drop offline,现有的磁盘组成员的PST(partnership and status table)已经清理了该磁盘的信息,但被offline的磁盘里面还保存原有的磁盘信息,需要通过force add disk的方式或者先dd磁盘头信息再加进去

alter diskgroup OCRDG add disk '</path/name>' force;

        重新加会OCRDG磁盘组之后,集群的ocr配置也会同步更新,将state状态offline的磁盘重新加回

crsctl query css votedisk
##  STATE    File Universal Id                File Name Disk group
--  -----    -----------------                --------- ---------
 1. ONLINE   a6219f6847fb4f3abfc1c9e4618566e6 (/dev/xxxxx/ocrdg1) [OCRDG]
 2. ONLINE   ad3cf7c7e1b94fdfbff9dd920e7cb573 (/dev/xxxxx/ocrdg2) [OCRDG]
 3. ONLINE   5defc32620594f34bfed90517e9225e2 (/dev/xxxxx/ocrdg3) [OCRDG]

        ARCHDG盘处理

        ARCHDG归档日志盘failgroup FG2, FG3都被force drop,只剩failgroup FG1正常

ARCHDG盘由于进行drop磁盘操作,触发了数据的rebalance,但由于现在只要一个failgroup FG1,冗余不满足无法正常的rebalance下去报错ORA-59048,需要将被force drop的磁盘加回去,才能恢复rebalance

        因为磁盘已经被force drop,FG1的PST里面已经没有保留FG2,FG3的信息,尝试使用force add的方式将force drop的两个failgroup FG2,FG3磁盘加回去,但报错ORA-15107:missing or invalid ASM disk name,没办法将两个failgroup同时一起强制加回去

        采用另一种方法,先将force drop的磁盘头信息dd,再采用正常加入add disk的方式

        先使用dd命令清理force drop磁盘的头信息

        再将两个failgroup FG2,FG3重新加回磁盘组,force drop的磁盘全部成功加回去ARCHDG磁盘组

        rebalance恢复正常,报错ORA-59048消失

        注意要同时将两个failgroup一起加回,不能只加一个,否则会遇到以下ORA-15291报错,因为当前的磁盘组为HIGH模式,加磁盘时至少需要两个failgroup才能进行配对

        DATADG盘处理

        DATADG归档日志盘failgroup FG2, FG3的磁盘虽然没有被force drop,但由于IO错误,FG2,FG3的磁盘都被offline了,状态变成unknown,但FG1的PST还保留着FG2,FG3的信息

        尝试直接online disk或者整个failgroup,但由于磁盘组的属性配置compatible.rdbms为10.1.0.0小于11.1.0.0.0,无法使用该功能,并且当前由于磁盘组部分磁盘offline,无法更改磁盘组的属性compatible.rdbms

        由于FG2,FG3的磁盘只是被offline,无法像恢复ARCHDG的方式通过dd磁盘+add disk的进行恢复,因为FG1还保留着FG2,FG3的信息,加进去会出现冲突failgroup磁盘数量不一致,还好当前集群为Oracle 19c版本,可以使用12c之后的新特性replace disk指定加入的磁盘替换已有的磁盘

        先通过kred采集FG2,FG3磁盘头里面原有的dskname信息

      再使用dd命令清理FG2,FG3的磁盘的头信息

        最后使用REPLACE DISK的方式将FG2,FG3加回磁盘组,完成DATADG磁盘的恢复操作

后续处理:

        在修复完磁盘组之后,将磁盘的compatible.rdbms属性设置为11.2.0.0.0,以确保磁盘由于IO报错或者disk repair time时间内offline的磁盘,可以使用Oracle ASM 11G的特性 ASM Fast Disk Resync 通过online disk或者failgroup进行快速的恢复,使用normal或者high模式的磁盘组compatible.rdbms建议都要设置为11.1.0.0.0及以上

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/661379.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2020年全国硕士研究生入学统一考试管理类专业学位联考英语(二)试题

2020年英语二联考真题 一、完形填空 Directions: Read the following text. Choose the best word for each numbered blank and mark A, B, C or D on the ANSWER SHEET (10 points) Being a good parent is what every parent would like to be. But defining what it mea…

《Java黑皮书基础篇第10版》 第17章【习题】

Java语言程序设计 习题第十七章 17.2章节习题 17.1什么是文本文件&#xff0c;什么是二进制文件&#xff1f;可以使用文本编辑器来查看文本文件或者二进制文件吗&#xff1f; 文本文件是字符组成的文件&#xff0c;二进制文件是0和1组成的文件 文本编辑器只能访问文本文件 17…

一文教你彻底学会SPI协议

一文教你彻底学会IIC协议 一.概况SPI二.SPI连接2.1 一主一从2.2 一主多从 三.SPI通信过程3.1 CPOL&#xff08;极性&#xff09;和CPHA&#xff08;相位&#xff09;3.2 SPI时序图3.1 SPI起始信号3.2 SPI停止信号3.3 数据的有效性 四.代码实例 一.概况SPI SPI 协议是由摩托罗拉…

腾讯云服务器开Minecraft配置怎么选择?

腾讯云服务器Minecraft我的世界服务器配置怎么选择&#xff1f;10人以内玩2核4G就够用了&#xff0c;腾讯云开我的世界服务器选择轻量应用服务器就够了&#xff0c;轻量CPU采用至强白金处理器&#xff0c;大型整合包一般1.12版本的&#xff0c;轻量2核4G配置都差不多的&#xf…

智慧加油站卸油作业行为分析算法 opencv

智慧加油站卸油作业行为分析系统通过opencvpython网络模型技术&#xff0c;智慧加油站卸油作业行为分析算法实现对卸油作业过程的实时监测。当现场出现卸油作业时人员离岗&#xff0c;打电话人员抽烟等违规行为&#xff0c;灭火器未正确摆放&#xff0c;明火和烟雾等异常状态&a…

VMware 逃逸基础知识

虚拟化相关概念 VMM&#xff1a;即 VM Monitor &#xff0c;也被称为 Hypervisor&#xff08;虚拟机监控程序&#xff09;。VMM 是 guest os 的管理器&#xff0c;管理虚拟机运行。例如 Windows 的 Hyper-V &#xff0c;linux 的 KVM 以及裸机上安装的 Xen 和 VMware ESXi 都属…

《MySQL是怎么运行的》阅读笔记

mysql运行的整体架构简介 Mysql是由两部分构成&#xff0c;一部分是服务器程序&#xff0c;一部分是客户端程序。 服务器程序又包括两部分&#xff1a; 第一部分server层包括连接器、查询缓存、分析器、优化器、执行器等。涵盖 MySQL 的大多数核心服务功能&#xff0c;以及所有…

【Android复习笔记】Glide核心原理

Glide 核心流程 Glide中RequestManager会管理两个队列,一个请求队列,一个等待队列,当生命周期onStop停止时,把运行队列中的任务添加到等待队列中,当生命周期onResume恢复时,又从等待队列中添加到运行队列执行。 关于 Glide.with(this).load(url).into(iv); 主要搞清楚三…

Doris初认识

Doris初认识 文章目录 Doris初认识1. Doris 概述2. 核心特性3. 使用场景4. 架构 1. Doris 概述 Apache Doris 是由百度大数据部研发&#xff08;之前叫百度 Palo&#xff0c;2018 年贡献到 Apache 社区后&#xff0c;更名为 Doris &#xff09;&#xff0c;在百度内部&#xff…

Schneider Electric EcoStruxure Control Expert 15.3 Crack

Schneider Electric EcoStruxure Control Expert 15.3专为使用施耐德电气的Modicon PLC&#xff08;可编程逻辑控制器&#xff09;的控制和自动化工程师量身定制。它提供了一系列功能和工具&#xff0c;以方便自动化应用程序的开发、部署和维护。 施耐德电气EcoStruxure控制专家…

优化命令测试

命令内容&#xff1a; nload、free 目录 一、nload 1.删除yum仓库本地源 local.repo 2.nload命令的环境依赖文件只有在epel商城才有 所以需要安装epel 3.压力测试 二、free 1.free功能 2.free参数​编辑 4.实验&#xff1a;使用压力测试工具dd 查看内存使用的变化 总…

KUKA机器人出现“如果文件以写入方式打开,则不允许选择或执行程序”的解决办法

KUKA机器人出现“如果文件以写入方式打开,则不允许选择或执行程序”的解决办法 情景再现: 在操作KUKA机器人时可能会遇到这样的情况:如下图所示,即操作人员登录了管理员权限后,打开了config配置文件, 正常情况下,应该像下图所示点击左侧的来关闭config配置文件,但是…

Java012——引用数据类型String的简单学习

回顾Java数据类型 本次要学习的是Java引用数据类型String 一、对String类简单说明 说明&#xff1a;String是Java中的一个类 二、String类的作用 作用&#xff1a;主要用来创建和操作字符串。 三、使用String类 3.1、创建字符串 注意&#xff1a; 1、字符串使用双引号&qu…

【SQL应知应会】分析函数的点点滴滴(二)

欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享&#xff0c;与更多的人进行学习交流 本文收录于SQL应知应会专栏,本专栏主要用于记录对于数据库的一些学习&#xff0c;有基础也有进阶&#xff0c;有MySQL也有Oracle 分析函数的点点滴滴 1.什么是分析函数&#xff1a;…

Linux中新建用户使用sudo问题

文章目录 sudo问题 sudo问题 sudo&#xff1a;权限提示指令&#xff0c;当使用sudo这条指令时&#xff0c;会将普通用户的权限提升为root权限 但是在命令行新建用户&#xff0c;这个用户使用sudo指令对一条指令提权是用不了的 这个用户没有在sudoers file这个文件中&#xff…

读发布!设计与部署稳定的分布式系统(第2版)笔记05_层叠

1. 水平扩展 1.1. 增加服务器来增加容量 1.1.1. 这些服务器集群被称为“农场” 1.2. 负载均衡的服务器集群 1.2.1. 不易遭遇单点系统失效 1.2.2. 高负载比低负载更易导致竞态条件的并发缺陷 1.3. 如果双节点集群出现失效&#xff0c;那么幸存服务器的工作负载将增加一倍 …

SpringBoot集成企业微信自建应用消息

目录 参考文档概述发送限制成员收不到应用推送消息的原因创建应用五、发送消息1、文本 text2、卡片文本3、图文news4、markdown 参考文档 官方文档 企业微信群机器人应用 概述 消息群发&#xff0c;是企业微信提供的用于企业向成员推送企业通知的工具&#xff0c;支持管理端…

AN13743-移植-无eSE

PN553/PN557 to PN7160 migration guidelines 1目的 本文件提供了从PN553/PN557 NFC控制器迁移到PN7160 NFC控制器的指南。它旨在从硬件和软件的角度描述PN7160 NFC控制器与PN553/PN557 NFC控制器的主要区别和新功能。软件部分逐步介绍如何适应Android开源项目 为PN553/PN55…

React学习笔记(二)组件详解

一、组件的概念&#xff1a; 当你开始学习 React 的时候&#xff0c;你会了解到 React 组件是 React 应用程序的基本构建块。组件是一个隔离的、可重复使用的代码块&#xff0c;由 HTML 元素、其他组件或自定义的 UI 元素组成&#xff0c;组件也就是react的核心思想&#xff0c…

Visual Studio Code 插件安装

目录 1、在线安装 1.1 单个插件的安装 1.2 根据配置文件一次性安装多个插件 1.3 同步配置的方式 1.3.1 第一种方式使用VSCode自带的同步功能。 1.3.2 第二种方式&#xff0c;首先需要先安装插件 Settings Sync 2、离线安装 2.1 去官方下载离线安装包进行安装 2.2 直接…