一、报错信息
今天在进行数据库巡检时,在集群节点1发现了IPC相关报错信息:
2024-10-10T10:22:06.846317+08:00
IPC Receiver dump detected. Sender instance 2 Receiver pnum 277 ospid 377527 [oracle@zxsszpt-sjkfwq1 (PPA6)], pser 124403
2024-10-10T10:22:06.846665+08:00
GYSTDJY(7):Errors in file /u01/app/oracle/diag/rdbms/utcdb/utcdb1/trace/utcdb1_ppa6_377527.trc:
同时,在节点2有如下信息:
2024-10-10T10:22:50.859603+08:00
GYSTDJY(7):IPC Send timeout detected. Sender: ospid 298373 [oracle@zxsszpt-sjkfwq2]
GYSTDJY(7):Receiver: inst 1 binc 20 ospid 377527
2024-10-10T10:39:59.130691+08:00
Thread 2 advanced to log sequence 85810 (LGWR switch)
Current log# 9 seq# 85810 mem# 0: +DATA/UTCDB/ONLINELOG/group_9.411.1066216577
2024-10-10T10:39:59.929239+08:00
ARC2 (PID:207489): Archived Log entry 171218 added for T-2.S-85809 ID 0x8d8b532a LAD:1
2024-10-10T10:45:18.843834+08:00
GYSTDJY(7):IPC Send timeout detected. Sender: ospid 314725 [oracle@zxsszpt-sjkfwq2]
GYSTDJY(7):Receiver: inst 1 binc 20 ospid 377527
二、问题分析
根据报错信息,首先进行集群心跳检查,经过检查集群心跳正常,心跳网络未出现丢包。
同时查看集群日志以及cssd日志等信息,未发现问题的情况下,在MOS上进行查询,根据报错信息,查到该报错为当前版本bug。
查询信息如下:
报错匹配到的bug为Bug 25174777,并且在Bug 27223075副本中关闭。
三、解决方案
根据MOS查询结果,Bug 27223075在19.1中修复,但当前数据库版本为19.3.0,次bug依旧存在。
查询Bug 27223075的修复补丁,发现只有11.2.0.4、12.1.0.2、12.2.0.1版本相关的补丁:
暂时没有19.X相关补丁提供。
为了避免IPC相关报错导致集群故障,建议对当前环境更新最近补丁。