问题背景:
应用执行存储过程报错ORA-00600: 内部错误代码, 参数: [ktspffbmb:objdchk_kcbnew_3], [0], [3303775], [4], [], [], [], [], [], [], [], [],导致过程无法正常执行
ORA-00600: 内部错误代码, 参数: [ktspffbmb:objdchk_kcbnew_3], [0], [3303775], [4], [], [], [], [], [], [], [], []
Tue Aug 01 09:35:33 2023
Errors in file /u01/app/oracle/diag/rdbms/test/test/trace/test_ora_190479.trc (incident=1346011):
ORA-00600: , : [ktspfmdb:objdchk_kcbnew_3], [1], [3303763], [4], [], [], [], [], [], [], [], []
Incident details in: /u01/app/oracle/diag/rdbms/test/test/incident/incdir_1346011/test_ora_190479_i1346011.trc
Use ADRCI or Support Workbench to package the incident.
See Note 411.1 at My Oracle Support for error and packaging details.
问题分析:
通过600的错误函数代码ktspffbmb:objdchk_kcbnew_3以及当前数据库的版本11.2.0.4以及补丁版本,在Oracle的mos官网查到了疑似Bug 16862882
Bug的触发场景以及原因如下
1 对象被drop删除操作进入到回收站,这时对象块会从缓冲区被刷出
2 同时被删除的对象发生了事务恢复,恢复操作会将L1 BMB(ASSM自动段存储空间管理的L1位图块)带入缓冲区并进行修改
3 回收站的对象被清理(人为清理或者由于表空间不够导致回收站对象被清空复用),该操作不会刷新相关对象的块
4 清理的块被重新分配给新的会话对象使用,此时可能会发生该报错ORA-600 [ktspffbmb:objdchk_kcbnew_3],由于缓存区的块检验失败
简单来说就是该bug会导致回收站被清空的对象,在复用时出现缓存区的块出现校验失败的问题并抛出ORA-00600的报错
接下来查看报错的trc文件以及alert日志,确认是否匹配该bug
查看trc里面的call stack函数堆栈信息,可以看到当前的会话在执行dml操作,报错的位置在函数kcbnew[CACHE_RCV],cache_rcv为cache recovery,推测是在对缓存的块进行检查校验时发生问题
查看报错的块里面对象为data_object_id:3303616,object_id:92000,flags为block_written_once
块里面的对象已经被删除无法查询到
trc里面的redo dump,可以看到对象复用的操作Object reuse: tsn=10 objd=3303616,可以que'd当前的块应该为复用的块,被分配给新会话使用
查看块里面的事务信息,存在未处理完的事务XID:0x0019.01b.0067e081分别对应25号回滚段,27号slot以及6807681序列
-
---- = transaction is active, or committed pending cleanout
-
C--- = transaction has been committed and locks cleaned out
-
-B-- = this undo record contains the undo for this ITL entry
-
--U- = transaction committed (maybe long ago); SCN is an upper bound
-
---T = transaction was still active at block cleanout SCN
从事务表x$ktuxe以及smon的trc日志,我们可以确认块里面的XID:0x0019.01b.0067e081为回滚的死事务
查看alert日志,可以看到记录到了事务回滚之前有一个drop table的操作,没有加purge所以这个操作会进入到回收站
分析到这里,我们可以基本确认当前问题场景问题匹配Bug 16862882
1 会话执行了drop table test_B07,操作没有加purge对象进入到回收站,此时对象块会从缓冲区被刷出
2 删除之后,该对象的块发生了事务回滚操作XID:0x0019.01b.0067e081,恢复操作会将L1块带入缓冲区并进行修改
3 回收站的对象由于表空间不够导致对象被从回收站清空复用,该操作不会刷新相关对象的块
4 清理的块被重新分配给新的会话对象使用,在对缓存的块进行检查校验时发生报错ORA-600 [ktspffbmb:objdchk_kcbnew_3]
问题修复:
1 通过安装小补丁16862882进行修复,但目前在官网查看的只有基于11.2.0.4以及11.2.0.4.19 exadata database版本的补丁,所以通过安装补丁方式修复,存在补丁资源获取问题
2 这是一个缓存块的校验问题,可以通过刷新数据库实例的块缓存buffer cache规避该问题
alter system flush buffer_cache
3 Bug触发机制还与回收站的对象使用有关,可以尝试在drop table时通过加purge,不让对象进入回收站规避该问题的发生