Oracle-AWR快照无法自动生成问题分析

news2025/1/11 15:07:51

前言:

近期处理了一起数据库AWR快照无法自动生成的问题,用户发现数据库在近期出现了AWR快照无法自动生成的问题,数据库整体负载正常,后面分析发现原因是由于AWR快照在生成过程中,执行的SQL语句出现超时导致。

问题:

Oracle11.2.0.4版本AWR快照无法自动生成,27-30号之间出现AWR快照无法自动生成问题

问题原因:

1 awr快照生成任务进程m00x发起wrh$_sql_bind_metadata表的插入语句执行超时,导致AWR快照生成失败

2 wrh$_sql_bind_metadata表的插入语句超时是由于插入语句需要访问内存基表x$kqlfbc(x$kqlfbc基表是绑定变量的内存缓存表),而当前数据库里面语句使用了大量的绑定变量,导致在访问该X$基表时需要检索内存里面大量的绑定变量信息,执行效率非常缓慢。

问题分析:

查看数据库后台日志,可以发现有MMON进程挂起suspend 82800 seconds的告警

mmon进程的trc文件,可以发现类似的slave进程挂起操作挂起Unable to schedule a MMON slave at: Auto Flush Main 1,Slave action has been temporarily suspended,- Slave action had prior policy violations.

查看AWR快照子进程m000进程trc文件,出现关于wrh$_sql_bind_metadata表的插入语句执行超时的情况,报ORA-12751: cpu time or run time policy violation 

到这里,我们可以确认 awr快照生成任务进程m00x发起wrh$_sql_bind_metadata表的插入语句执行超时,导致AWR快照生成失败

语句主要通过关联查询基表x$kewrattrnew,x$kewrsqlidtab以及v$sql_bind_capture,将结果插入到wrh$_sql_bind_metadata表

insert into wrh$_sql_bind_metadata   
(snap_id, dbid,    sql_id, name, position, dup_position,    datatype, datatype_string,    character_sid, precision, scale, max_length)  
SELECT /*+ ordered use_nl(bnd) index(bnd sql_id) */      :lah_snap_id, :dbid,      bnd.sql_id, name, position, dup_position,      datatype, datatype_string,      character_sid, precision, scale, max_length    
FROM      x$kewrattrnew      new,      
x$kewrsqlidtab     tab,      
v$sql_bind_capture bnd     
WHERE new.str1_kewrattr     = tab.sqlid_kewrsie      AND tab.sqlid_kewrsie     = bnd.sql_id      AND tab.childaddr_kewrsie = bnd.child_address

从表的命名来看x$kewrattrnew是存放属性配置的表,x$kewrsqlidtab是存放sqlid信息的表,v$sql_bind_capture是访问v_$sql_bind_capture视图的同义词

查看v$sql_bind_capture的底层访问基表,通过查询视图的定义语句,我们可以确认底层的基表为x$kqlfbc

SQL> select VIEW_DEFINITION
from V$FIXED_VIEW_DEFINITION
where view_name ='GO$SQL_BIND_CAPTURE';  2    3  
​
VIEW_DEFINITION
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
select INST_ID,     KQLFBC_PADD,         KQLFBC_HASH,      KQLFBC_SQLID,     KQLFBC_CADD,         KQLFBC_CHNO,      substr(KQLFBC_NAME, 1, 128),           KQLFBC_POS,       to_number(decode(KQLFBC_DUPPOS, 65535, NULL, KQLFBC_DUPPOS)),     KQLFBC_OACDTY,   substr(KQLFBC_DTYSTR, 1, 15),
      decode(KQLFBC_OACCSI, 0, to_number(null), KQLFBC_OACCSI),     decode(KQLFBC_OACPRE, 0, to_number(null), KQLFBC_OACPRE),       decode(KQLFBC_OACSCL, 0, to_number(null), KQLFBC_OACSCL),          KQLFBC_OACMXL,         decode(KQLFBC_WCAP, 0, 'NO', 'YES'),      decode(KQLFBC_WCAP, 0, to_date(NULL),        decode(KQLFBC_WCAP, 2, to
_date(NULL), KQLFBC_LCAP)),        KQLFBC_STRVAL,        decode(KQLFBC_WCAP, 0, NULL,              sys.sys$rawtoany(KQLFBC_BINVAL, KQLFBC_OACDTY,              KQLFBC_OACCSF, KQLFBC_OACCSI)),        CON_ID      
from x$kqlfbc

查询三个基表x$kewrattrnew,x$kewrsqlidtab,x$kqlfbc的数据,x$kewrattrnew、x$kewrsqlidtab基表的数据不多结果很快返回,而x$kqlfbc查询几分钟都没有返回结果,可见数据量很大

所以,到这里我们基本可以确认wrh$_sql_bind_metadata表的插入语句超时是由于插入语句需要访问内存基表x$kqlfbc(x$kqlfbc基表是绑定变量的内存缓存表),而当前数据库里面语句使用了大量的绑定变量,导致在访问该X$基表时需要检索内存里面大量的绑定变量信息,执行效率非常缓慢。

---x$kewrattrnew,x$kewrsqlidtab基表的数据不多,很快返回
select count(*) from  X$KEWRATTRNEW;
select count(*) from X$KEWRSQLIDTAB;
---x$kqlfbc查询几分钟都没有返回结果,数据量很大
select count(*) from x$kqlfbc;

问题解决:

由于涉及到x$数据库内核基表,我们首先通过Oracle的官方mos查看是否有相关案例的处理办法

在文档Error ORA-32701 'On Current SQL: insert into wrh$_sql_bind_metadata' (Doc ID 2226216.1)里面找到了类似相关问题的处理办法

原因跟我们之前分析的基本一致,x$kqlfbc基表是绑定变量的内存缓存表,而当数据库里面语句使用了大量的绑定变量,会导致在访问该X$基表时需要检索内存里面大量的绑定变量信息,使执行效率非常缓慢

而提供的解决方法为

1 收集基表x$kewrattrnew,x$kewrsqlidtab,确保语句的执行计划生成正确,避免由于执行计划的错误,导致语句执行缓慢

2 重启数据库释放内存基表的数据

3 刷新shared_pool释放内存基表的数据

随后,我们采纳了方法1,对基表x$kewrattrnew,x$kewrsqlidtab进行统计信息收集,但问题没有得到解决,方法1不适合本场景问题

而对于方法2,3,我们并没有采纳实施,因为两个方法对在线的业务都会造成影响,并且都是通过释放内存临时规避内存里面绑定变量过多的问题,随着数据库的运行,内存里面的绑定变量依然会继续堆积起来,无法解决根本的问题

接下来,我们继续寻求其他的解决方法,由于是内存里面的绑定变量过多导致了这个问题的发生,而绑定变量绝大部分都是应用的SQL所带来的,所以,我们可以通过优化减少应用的绑定变量使用,来解决这个问题

查询使用绑定变量语句过多的SQL,可以发现多个语句使用了大量的绑定变量

---查询绑定变量过多的sql_id
select a.sql_id,count(POSITION)
from (select sql_id,POSITION
from v$sql_bind_capture
where rownum<100000) a
group by a.sql_id
order by 2;
---通过sql_id去确认sql语句
set linesize 400
set long 99999
set longc 99999
select sql_fulltext
from v$sql
where sql_id='';

而SQL语句使用这么多的绑定变量,使为了将数据通过union+dual的方式去构造表进行匹配比对

 

MERGE INTO xxxxx s
        USING (
  select :1  AS XXX, :3
            AS XXX,
            :6  AS XXX,
            :9  AS XXX,
            :10  AS XXX, :11  AS
            xxx,
            :12  AS XXX,
            :13  AS XXX,
            :16  AS XXX,
            :17  AS XXX,
            :19  AS XXX,:20  AS
           xxxxXXX,
            :21  AS XXX, :22  AS
            xxxx,
            :23  AS XXX,
            :24  AS XXX,
            :25  AS XXX,
            :26  AS XXX,
            :27  AS XXX,
            :29  AS XXX, :30
            AS XXX,
            :31  AS XXX,
            :32  AS XXX,
            :33  AS XXX, :34  AS xxxx
            from dual
 
            .......
            union
            select :5407  AS XXX, :5409
            AS XXX,
            :5412  AS XXX,
            :5415  AS XXX,
            :5416  AS XXX, :5417  AS
            xxxx,
            :5418  AS XXX,
            :5419  AS XXX,
            :5422  AS XXX,
            :5423  AS XXX,
            :5425  AS XXX,:5426  AS
            xxxx,
            :5427  AS XXX, :5428  AS
            xxxx,
            :5429  AS XXX,
            :5430  AS XXX,
            :5431  AS XXX,
            :5432  AS XXX,
            :5433  AS XXX,
            :5435  AS XXX, :5436
            AS XXX,
            :5437  AS XXX,
            :5438  AS XXX,
            :5439  AS XXX, :5440  AS xxx
            from dual

找到使用绑定变量过多的SQL之后,我们将语句提供给了应用进行优化整改,并建议不要使用union+dual这种大量绑定变量的方式构造表,而是从应用端先将数据分批写入表,在与关联表进行匹配比对

后续,应用也采纳了我们的建议,进行优化整改,数据库内存的绑定变量数量也慢慢得到释放,awr快照自动生成也恢复了正常。

其他问题:

1 由于应用的语句改造需要时间,在此期间有没有其他办法,确保awr快照自动生成

除了可以通过重启数据库,刷新shared_pool释放内存临时规避,还可以通过禁用awr刷新表wrh$_sql_bind_metadata进行规避,但这会导致awr缺少关于此表的数据

alter system set  "_AWR_DISABLED_FLUSH_TABLES"='wrh$_sql_bind_metadata';

2 手动kill了MMON进程,但MMON进程没有重新启动,怎么解决

  • 重启数据库实例,恢复MMON进程,对应用有影响,需要停机窗口操作

  • 设置实例为restricted session,然后在设置回正常模式,注意这种设置也会造成数据库不可用,对应用有影响,需要停机窗口操作

alter system enable restricted session;
alter system disable restricted session;
  • 在11.2.0.4版本,存在Bug 19565533,导致MMON进程被KILLED之后无法自动启动的情况,需要应用one-off补丁Patch 19565533解决

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/21394.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【课上笔记】第八章 图

图 8.1图的基本概念 8.1.1图的定义和术语 1&#xff0e;图的定义 ​ 图(Graph)由一个顶点集合Vn和一个边&#xff08;或者弧&#xff09;集合En组成&#xff0c;通常记为&#xff1a; G&#xff1d;(Vn,En)其中&#xff0c;Vn中有n(n>0)个顶点&#xff0c;En中有e&#…

stm32cubemx hal学习记录:FreeRTOS任务管理

一、基本配置 1、配置RCC、USART1、时钟84MHz 2、配置SYS&#xff0c;将Timebase Source修改为除滴答定时器外的其他定时器&#xff0c;因为滴答定时器被用于时钟基准&#xff0c;可以实现任务切换。Timebase Source是实现HAL_Delay等延时函数的 3、初始化LED的两个引脚 4、开…

HTTP VS HTTPS

一、网络协议 网络协议是计算机之间为了实现网络通信而达成的一种“约定”或者”规则“&#xff0c;有了这种”约定“&#xff0c;不同厂商的生产设备&#xff0c;以及不同操作系统组成的计算机之间&#xff0c;就可以实现通信。 二、HTTP与HTTPS 1、HTTP &#xff08;1&am…

Autoware中的点云3D聚类算法,保姆级算法阅读注释,一看就懂,非常详细!

综述 五大模块&#xff0c;看完等于点云入门~&#xff08;dog&#xff09; 实际步骤 输入激光雷达获得的点云 pcl::PointCloud<pcl::PointXYZ>::Ptr header:seq:序列长度stamp:获取点云的时刻frame_id:坐标系名称 points:保存点云的容器,类型为std::vector width:类型…

大小端的判断

1.关于进制 1.1 进制数与位数 n进制数中&#xff0c;一位最多表示到数字n-1 十进制中1位最多能表示9个数字 满则溢&#xff0c;溢则进位。 拿我们最常用的是10 进制来举例说明&#xff0c; 构成十进制的最小单位数: 1 2 3 4 5 6 7 8 9 0 十进制(其实只有从9到0这几个数字,1…

OSPF笔记(四):OSPF五种报文和五种常见LSA

一、OSPF五种报文 (使用IP承载&#xff0c;可靠&#xff09; 1.1 hello&#xff1a; 发现和维护邻居关系 &#xff0c;以太网10s一次 1.2 DBD&#xff1a; 发送链路状态数据库摘要 1.3 LSR&#xff1a; 请求发送特定的链路状态信息&#xff08;请求包&#xff09; 1.4 LSU&…

Pr2023(Premiere Pro)中文版软件下载「附带安装教程」

Premiere Pro 23.0 版专为帮助编辑人员制作创意内容而设计&#xff0c;提供了出色的字幕工具组合。借助改进功能&#xff08;如批量编辑时间轴中的标题剪辑、灵活的对齐控件等&#xff09;简化您的标题和图形工作流程。此版本包含稳定性和性能方面的基础改进&#xff0c;包括更…

用 Flutter 轻松做个红包封面

前言 在 Flutter 的开发中&#xff0c;最常见的就是层层的组件嵌套&#xff0c;因此不可避免会遇到子组件如何适配父组件的问题。比如&#xff0c;按钮的可点击区域是否要占满整个父组件&#xff1f;图片是居中还是居左&#xff1f;这些问题可以通过 Flutter 提供的FittedBox …

Rancher - 更换Linux发行版

Rancher - 更换Linux发行版 时间&#xff1a;2022年11月20日21:24:29 推荐&#xff1a;Linux CentOS7.9 一、为什么要更换/升级&#xff1f; CentOS7.9 停止维护时间 2024年06月30日 AnolisOS8 阿里云推出的Linux发行版&#xff0c;支持多计算架构&#xff0c;也面向云端场景…

公众号免费搜题系统搭建

公众号免费搜题系统搭建 本平台优点&#xff1a; 多题库查题、独立后台、响应速度快、全网平台可查、功能最全&#xff01; 1.想要给自己的公众号获得查题接口&#xff0c;只需要两步&#xff01; 2.题库&#xff1a; 查题校园题库&#xff1a;查题校园题库后台&#xff08;…

算法篇-------贪心2

文章目录题目1-------活动选择题目2-----无重叠区间题目3------最多可以参加的会议数目题目4-------去除重复字母题目5------移掉K位数字题目6-----拼接最大数题目1-------活动选择 有n个需要在同一天使用同一个教室的活动a1, a2, …, an&#xff0c;教室同一时刻只能由一个活…

MapReduce基础

MapReduce入门 理解MapReduce的思想 MapReduce的思想核心是先分再合&#xff0c;分而治之所谓的分而治之&#xff0c;就是把一个复杂的问题&#xff0c;按照一定的分解方法分为等价的规模的若干部分&#xff0c;然后捉个解决&#xff0c;分别找出各个部分的结果没然后将各个部…

【学习笔记】mac安装maven与idea自带maven

一、安装Maven 1.1 场景一&#xff1a;mac安装Maven step1: 下载maven 到 maven官网下载压缩包&#xff0c;这里下载 apache-maven-3.8.6-bin.zip 压缩包&#xff1a; step2: 解压安装 解压maven压缩包&#xff0c;将解压得到的maven文件夹 “apache-maven-3.8.6” 放到合适…

Ubuntu22.04系统安装Unreal Engine 5.1.0

1.实现目标 在Ubuntu22.04系统上从源码构建安装Unreal Engine 5.1.0。 2.实现过程 2.1 正常流程 (1)从github上下载最新的release版本的源代码:5.1.0 release。 (2)解压缩代码,并打开终端,执行 ./Setup.sh,下载所需的各项依赖,文件大小约20GB,需下载2-3小时。 (…

【每日一题Day33】LC799香槟塔 | 动态规划

香槟塔【LC799】 我们把玻璃杯摆成金字塔的形状&#xff0c;其中 第一层 有 1 个玻璃杯&#xff0c; 第二层 有 2 个&#xff0c;依次类推到第 100 层&#xff0c;每个玻璃杯 (250ml) 将盛有香槟。 从顶层的第一个玻璃杯开始倾倒一些香槟&#xff0c;当顶层的杯子满了&#xff…

springmvc-day01

springmvc-day01 第一节 SpringMVC概述 1. SpringMVC 优势 SpringMVC 是 Spring 为表述层开发提供的一整套完备的解决方案。在表述层框架历经 Strust、WebWork、Strust2 等诸多产品的历代更迭之后&#xff0c;目前业界普遍选择了 SpringMVC 作为 Java EE 项目表述层开发的首…

pytest集成allure报告(allure安装及配置以及如何实现集成)

一、allure安装及环境变量配置 1、先保证本地已装jdk1.8 首先安装JDK1.8&#xff0c;添加到环境变量path。 具体可以查看文章&#xff1a;https://blog.csdn.net/weixin_40608713/article/details/116103153?ops_request_misc%257B%2522request%255Fid%2522%253A%2522166892…

07_通信过程

知识点1【给路由器添加一块网卡】 知识点2【演示浏览器访问web服务器】 知识点2【局域网的划分】&#xff08;补充&#xff09; 知识点3【跨外网的不同局域网通信过程】&#xff08;补充&#xff09; 知识点4【LInux下的防火墙】&#xff08;了解&#xff09; 防火墙的分类…

【虚幻引擎UE】UE4/UE5 GIS相关插件推荐及使用介绍

一、Cesium for Unreal&#xff08;Cesium插件&#xff09; 二、SuperMap Scene SDKs_Unreal Engine&#xff08;超图地图插件&#xff09; 提供了从SuperMap平台或其他开放在线地图访问真实世界地理空间3D数据的功能。 三、Vitruvio CityEngine Plugin&#xff08;CityEngine…

Python图像处理笔记

文章目录一. Pillow处理图片1.1 Pillow安装1.2 Pillow基本使用二. Matplotlib包中的图像模块2.1 简介2.2 API简介三. ndarray图像操作练习3.1 旋转图片3.2 图片打码3.3 图片拼接3.4 图片切割四. 图像灰度化4.1 简介4.2 灰度化方法五. OpenCV使用入门5.1 简介5.2 OpenCV基本使用…