asm disk被加入到另外一个磁盘组故障恢复---惜分飞

news2024/11/27 11:09:49

有朋友在aix环境对其中一个rac的asm磁盘组进行扩容
 

add_disk


之后另外一套rac的磁盘组直接dismount

Wed Aug 23 12:44:02 2023

NOTE: SMON starting instance recovery for group DATA domain 2 (mounted)

NOTE: F1X0 found on disk 0 au 2 fcn 0.128808679

NOTE: SMON skipping disk 7 - no header

NOTE: cache initiating offline of disk 7 group DATA

NOTE: process _smon_+asm1 (1770932) initiating offline of disk 7.3422955792 (DATA_0007) with mask 0x7e in group 2

NOTE: initiating PST update: grp = 2, dsk = 7/0xcc062910, mask = 0x6a, op = clear

Wed Aug 23 12:44:02 2023

GMON updating disk modes for group 2 at 7 for pid 17, osid 1770932

ERROR: Disk 7 cannot be offlined, since diskgroup has external redundancy.

ERROR: too many offline disks in PST (grp 2)

Wed Aug 23 12:44:02 2023

NOTE: cache dismounting (not clean) group 2/0x7FE6D808 (DATA)

WARNING: Offline for disk DATA_0007 in mode 0x7f failed.

Wed Aug 23 12:44:02 2023

NOTE: halting all I/Os to diskgroup 2 (DATA)

ERROR: No disks with F1X0 found on disk group DATA

NOTE: aborting instance recovery of domain 2 due to diskgroup dismount

NOTE: SMON skipping lock domain (2) validation because diskgroup being dismounted

Abort recovery for domain 2

Wed Aug 23 12:44:02 2023

ERROR: ORA-15130 in COD recovery for diskgroup 2/0x7fe6d808 (DATA)

ERROR: ORA-15130 thrown in RBAL for group number 2

Errors in file /u01/app/grid/diag/asm/+asm/+ASM1/trace/+ASM1_rbal_2360526.trc:

ORA-15130: diskgroup "DATA" is being dismounted

[

再次尝试mount该磁盘组,报ORA-15042和ORA-15038错误

SQL> alter diskgroup data mount

NOTE: cache registered group DATA number=2 incarn=0x79e6d861

NOTE: cache began mount (first) of group DATA number=2 incarn=0x79e6d861

NOTE: Assigning number (2,0) to disk (/dev/rhdisk31)

NOTE: Assigning number (2,3) to disk (/dev/rhdisk33)

NOTE: Assigning number (2,4) to disk (/dev/rhdisk34)

NOTE: Assigning number (2,5) to disk (/dev/rhdisk35)

NOTE: Assigning number (2,6) to disk (/dev/rhdisk36)

NOTE: Assigning number (2,9) to disk (/dev/rhdisk39)

NOTE: Assigning number (2,1) to disk (/dev/rhdisk8)

NOTE: Assigning number (2,2) to disk (/dev/rhdisk9)

Wed Aug 23 12:58:46 2023

NOTE: GMON heartbeating for grp 2

GMON querying group 2 at 11 for pid 27, osid 3736034

NOTE: Assigning number (2,7) to disk ()

NOTE: Assigning number (2,8) to disk ()

GMON querying group 2 at 12 for pid 27, osid 3736034

NOTE: cache dismounting (clean) group 2/0x79E6D861 (DATA)

NOTE: messaging CKPT to quiesce pins Unix process pid: 3736034, image: oracle@hbbz01 (TNS V1-V3)

NOTE: dbwr not being msg'd to dismount

NOTE: lgwr not being msg'd to dismount

NOTE: cache dismounted group 2/0x79E6D861 (DATA)

NOTE: cache ending mount (fail) of group DATA number=2 incarn=0x79e6d861

NOTE: cache deleting context for group DATA 2/0x79e6d861

GMON dismounting group 2 at 13 for pid 27, osid 3736034

NOTE: Disk DATA_0000 in mode 0x7f marked for de-assignment

NOTE: Disk DATA_0001 in mode 0x7f marked for de-assignment

NOTE: Disk DATA_0002 in mode 0x7f marked for de-assignment

NOTE: Disk DATA_0003 in mode 0x7f marked for de-assignment

NOTE: Disk DATA_0004 in mode 0x7f marked for de-assignment

NOTE: Disk DATA_0005 in mode 0x7f marked for de-assignment

NOTE: Disk DATA_0006 in mode 0x7f marked for de-assignment

NOTE: Disk  in mode 0x7f marked for de-assignment

NOTE: Disk  in mode 0x7f marked for de-assignment

NOTE: Disk DATA_0009 in mode 0x7f marked for de-assignment

ERROR: diskgroup DATA was not mounted

ORA-15032: not all alterations performed

ORA-15040: diskgroup is incomplete

ORA-15042: ASM disk "8" is missing from group number "2"

ORA-15042: ASM disk "7" is missing from group number "2"

ORA-15038: disk '/dev/rhdisk37' mismatch on 'Time Stamp' with target disk group [2129689239] [2062898314]

ERROR: alter diskgroup data mount

怀疑把报错这个磁盘组的rhdisk37加入到另外一套rac的asm中了(也就是说两套asm使用了同一块磁盘),aix操作系统层面分析确认

---对asm扩容的机器上

# lscfg -vpl hdisk15

  hdisk15          U78C5.001.DQD076A-P2-C4-T1-W200C00A098BC9A83-L0  MPIO NetApp FCP Default PCM Disk

        Manufacturer................NETAPP 

        Machine Type and Model......LUN C-Mode     

        ROS Level and ID............9000

        Serial Number...............80DYz]L/OpCA

        Device Specific.(Z0)........FAS8020        

  PLATFORM SPECIFIC

  Name:  disk

    Node:  disk

    Device Type:  block

---磁盘组dismount的机器上

# lscfg -vpl hdisk37     

  hdisk37          U5802.001.9K87776-P1-C1-T1-W200500A098BC9A83-L0  MPIO NetApp FCP Default PCM Disk

        Manufacturer................NETAPP 

        Machine Type and Model......LUN C-Mode     

        ROS Level and ID............9000

        Serial Number...............80DYz]L/OpCA

        Device Specific.(Z0)........FAS8020        

  PLATFORM SPECIFIC

  Name:  disk

    Node:  disk

    Device Type:  block

通过lscfg 命令确认两套rac使用了同一块盘导致一个磁盘组异常,在新加的机器上查询确认新盘被破坏情况(新加入的磁盘由于reblance操作,已经被写入了380G左右数据[也就意味着这个磁盘在老磁盘组中最少会丢失380G数据]
 

20230905140603


对于这种情况,dismount磁盘组是外部冗余不可能直接mount起来,只能通过以前处理的类似方法:
asm disk header 彻底损坏恢复
asm磁盘加入vg恢复
asm磁盘dd破坏恢复
asm disk 磁盘部分被清空恢复
再一例asm disk被误加入vg并且扩容lv恢复
fdisk分区导致asm disk破坏数据库恢复
再一起asm disk被格式化成ext3文件系统故障恢复
oracle asm disk格式化恢复—格式化为ext4文件系统
oracle asm disk格式化恢复—格式化为ntfs文件系统
ORA-15063: ASM discovered an insufficient number of disks for diskgroup 恢复
通过底层处理恢复出来没有覆盖的数据块中数据
 

20230827200941


再使用dul恢复出来其中数据,完成这次故障的核心数据恢复

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/976343.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RocketMQ 快速搭建与控制台搭建

一、下载资料及环境准备 这里 下载路径 可以下载对应的版本,本文以 4.9.5 为例:下载这里的Binary 为Linux 安装文件,Source 也下载,方便后续使用。 将下载后的包进行解压: 由于RockerMQ 的建议运行环境较大&#xff…

解决pyside6-uic生成py代码中文为unicode(乱码)的问题

前言 本来想用Java做客户端,后来发现很多算法还是Python有现成的比较方便。 所以最终选择了pyside6。但是用Designer(QT设计师)设计完后,生成的代码中文部分显示为unicode,也可以理解为乱码。 就像这样:…

MybatisPlus 扩展功能 代码生成 逻辑删除 通用枚举 字段类型处理器 配置加密

MybatisPlus 核心功能 条件构造器 自定义SQL Service接口 静态工具_软工菜鸡的博客-CSDN博客 3.扩展功能 3.1.代码生成 在使用MybatisPlus以后,基础的Mapper、Service、PO代码相对固定,重复编写也比较麻烦。因此MybatisPlus官方提供了代码生成器根据数据…

pytorch-v2.0.1 cuda arm64 aarch64 torch 2.0.1+cu118 源码编译笔记【2】验证cuda安装 成功

接上篇 pytorch-v2.0.1 cuda arm64 aarch64 torch 2.0.1cu118 源码编译笔记_hkNaruto的博客-CSDN博客 由于采用/usr/local/bin/gcc编译,先设置LD_LIBRARY_PATH,再启动python3 export LD_LIBRARY_PATH/usr/local/lib64:/usr/local/lib:/usr/lib64:/usr/…

高德Android高性能高稳定性代码覆盖率技术实践

前言 代码覆盖率(Code coverage)是软件测试中的一种度量方式,用于反映代码被测试的比例和程度。 在软件迭代过程中,除了应该关注测试过程中的代码覆盖率,用户使用过程中的代码覆盖率也是一个非常有价值的指标,同样不可忽视。因为…

Spring 6.0和SpringBoot 3.0新特性

目录 主要更新内容是以下几个: AOT编译 Spring Native GraalVM SpringBoot3生成二进制可执行文件底层流程 主要更新内容是以下几个: A Java 17 baselineSupport for Jakarta EE 10 with an EE 9 baselineSupport for generating native images with…

录音转写和AI质检的区别和使用场景

区别: 录音转写是将语音或录音转化为文本形式的过程。它通常涉及使用自然语言处理技术和语音识别算法来将音频文件中的语音转换为可读的文本格式。 AI质检是一种利用人工智能技术对客户服务、销售和其他电话中心交互进行自动化评估的过程。通过分析和评估客户和代…

【C++】STL案例2-员工分组

#include <iostream> using namespace std;#include<vector> #include<map>#define CHEHUA 0 //策划部门 #define MEISHU 1 //美术部门 #define YANFA 2 //研发部门class Worker { public:string m_Name;int m_Salary; };void createWorker(vector<…

flask使用Flask-Mail实现邮件发送

Flask-Mail可以实现邮件的发送&#xff0c;并且可以和 Flask 集成&#xff0c;让我们更方便地实现此功能。 1、安装 使用pip安装&#xff1a; $ pip install Flask-Mail或下载源码安装&#xff1a; $ git clone https://github.com/mattupstate/flask-mail.git $ cd flask-…

Java线程与锁常考知识点

Java线程与锁常考知识点 基础篇1. 创建线程的几种方式2. 线程池创建的方式3. 线程池提交任务的流程4. 线程池有哪些状态 进阶篇1. 说说对线程安全的理解2. 对守护线程的理解3. ThreadLocal的底层原理4. 并发、并⾏、串⾏之间的区别5. Java死锁如何避免&#xff1f;6. 线程池的底…

滑动窗口实例8(最小覆盖子串)

题目&#xff1a; 给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串&#xff0c;则返回空字符串 "" 。 注意&#xff1a; 对于 t 中重复字符&#xff0c;我们寻找的子字符串中该字符数量必须不少于 t…

C/C++中FILE指针的使用总结

在C中&#xff0c;FILE指针是一个用于文件操作的指针类型。它是C语言标准库中的一部分&#xff0c;也被C所继承。通过使用FILE指针&#xff0c;我们可以打开、读取、写入和关闭文件。 在C中&#xff0c;FILE指针通常与标准库中的文件操作函数一起使用&#xff0c;例如fopen(),…

通俗易懂玩QT:QStackedWidget 学习

QStackedWidget 学习 一、介绍 业务需求&#xff0c;用到了 QStackWidget 这个类&#xff0c;然后程序存在很严重的内存泄露问题&#xff0c;所以特意研究了一下 QStackWidget 类&#xff0c;QStackWidget 类的功能是窗体切换&#xff0c;它比 QTabWidget 使用起来更为灵活&a…

【高等数学基础知识篇】——不定积分

文章目录 一、不定积分的概念与基本性质1.1 原函数与不定积分的基本概念1.2 不定积分的基本性质 二、不定积分基本公式与积分法2.1 不定积分基本公式2.2 不定积分的积分法2.2.1 换元积分法2.2.2 分部积分法 三、两类重要函数的不定积分——有理函数与三角有理函数3.1 有理函数的…

架构设计基础设施保障IaaS计算

目录 1 IaaS概述2 服务部署演进历程3 云虚拟机4 云虚拟机如何选型5 云虚拟机的创建操作6 服务部署访问 1 IaaS概述 云计算并不是一种单一类型的产品&#xff0c;而是为满足企业各种IT需求而提供的多种服务。 通过云计算提供的一类这样的服务是基础设施即服务&#xff08;IaaS&a…

蓝桥杯备赛(Day5)——二叉树

二叉树存储 普通做法&#xff0c;二叉树一个节点包括结点的数值以及指向左右子节点的指针 在class Node中 def __init__(self,s,lNone,rNone):self.valNoneself.llself.rr 在竞赛中&#xff0c;我们往往使用静态数组实现二叉树&#xff0c;定义一个大小为N的静态结构体数组…

使用iCloud和Shortcuts实现跨设备同步与自动化数据采集

在如今的数字时代&#xff0c;跨设备同步和自动化数据采集对于提高工作效率和便利性至关重要。苹果的iCloud和Shortcuts App为我们提供了强大的工具&#xff0c;可以实现跨设备同步和自动化数据采集的功能。本文将详细介绍如何利用iCloud和Shortcuts App实现这些功能&#xff0…

英诺森供应链一体化平台解析

近日&#xff0c;2023年中国物流与采购联合会科学技术奖正式公布&#xff0c;该奖项经国家科技部批准&#xff0c;在国家科学技术奖励工作办公室登记备案&#xff0c;是我国物流行业最具影响力的奖项之一。 英诺森联合客户申报的科技项目“英诺森供应链智能数据平台”&#xf…

Golang编写客户端SDK,并开源发布包到GitHub,供其他项目import使用

目录 编写客户端SDK&#xff0c;并开源发布包到GitHub1. 创建 GitHub 仓库2. 构建项目&#xff0c;编写代码Go 代码示例&#xff1a;项目目录结构展示&#xff1a; 3. 提交代码到 GitHub仓库4. 发布版本5. 现在其他人可以引用使用你的模块包了 编写客户端SDK&#xff0c;并开源…

记一次以太网连接失败修复

症状: 很久没用这个电脑了&#xff0c;开机以后&#xff0c;发现连不上校园网。 遂检查网线&#xff0c;发现网线连在自己笔记本是可以用的&#xff0c;说明网线没问题。 但是网线连在主机是红灯常亮黄灯闪烁&#xff0c;怀疑是网卡有问题&#xff08;后证明不是&#xff0c…