Oracle-探究统计信息收集自动采样AUTO_SAMPLE_SIZE

news2025/1/11 10:04:50

前言:

        Oracle数据库进行统计信息收集时,可以通过ESTIMATE_PERCENT参数指定采样方式或者比例,有以下4种指定的方式

1 统计信息收集时不指定值,这时候ESTIMATE_PERCENT值为默认值DBMS_STATS.AUTO_SAMPLE_SIZE,自动采样

2 指定采样比例,范围可以为0.000001到100

3 指定采样方式为自动采样DBMS_STATS.AUTO_SAMPLE_SIZE

4 指定为null,这时候采样比例为100

 

统计收集测试:

        对一张1000W行的1.2G的表TEST进行统计信息收集测试,分别使用指定采样比例方式以及自动采样方式进行收集测试

        使用estimate_percent =>DBMS_STATS.AUTO_SAMPLE_SIZE自动采样方式,花费时间9.04秒

SQL> exec  DBMS_STATS.GATHER_TABLE_STATS(ownname=>'TEST', tabname=>'TEST',estimate_percent => DBMS_STATS.AUTO_SAMPLE_SIZE, method_opt       =>'for all columns size auto',no_invalidate    => FALSE,degree=> 8,  cascade=> TRUE);
​
PL/SQL procedure successfully completed.
​
Elapsed: 00:00:09.04

        查看表统计信息收集的采样比例,这里自动采样使用的比例为100

4f1060997b95972ddab2764962759159.png

        查看表列统计信息的采样比例为,可以看到对于收集直方图信息的owner,created列,采样比例发生了改变,这里使用了一个很低的采样比例大小

 

ab16851fb6a4fab735a885b2db41c244.png

        查看索引统计信息的采样比例,这里同样也是使用了一个很低的采样比例

edbf56a93d4a1a26428a0776001f52f7.png

        使用estimate_percent =>30指定30%比例采样,花费时间28秒,慢了2倍左右

SQL> exec  DBMS_STATS.GATHER_TABLE_STATS(ownname=>'TEST', tabname=>'TEST',estimate_percent => 30, method_opt       =>'for all columns size auto',no_invalidate    => FALSE,degree=> 8,  cascade=> TRUE);
​
PL/SQL procedure successfully completed.
​
Elapsed: 00:00:28.27
SQL> 

查看表统计信息收集的采样比例,跟指定的比例一样为30%

6d880a285831f70b557a538686c7e63a.png

查看列统计信息收集的采样比例,跟指定的比例一样为30%

6f5120306b1d0f6d3162248319a5cbe3.png

查看索引统计信息收集的采样比例,跟指定的比例一样为30%

f55877ce3b7d466f3c9b8bfa2b79786c.png

分析DBMS_STATS.AUTO_SAMPLE_SIZE自动采样的执行过程:

        通过10046j进行跟踪,分析DBMS_STATS.AUTO_SAMPLE_SIZE自动采集的过程

主要执行的语句步骤如下

        1 获取表的统计信以及列的统计信息,这里采用的是100比例的采样,也是主要的耗时操作

bed8e54ec4f524e1182b83f7c54763d6.png

        2 对于要收集直方图信息的列,按0.0495277038比例的采样数据插入临时表ora_temp_1_ds_110008

f3195753cc7df433707d1cc5610e5121.png

        3 从临时表ora_temp_1_ds_110008分组统计owner列频率直方图列的信息

813519a1081e51f5098a6f952a59d488.png

        4 从临时表ora_temp_1_ds_110008分组统计created列的高度均衡直方图的信息

cf07ca7da01218a55cecdaa76036a3e9.png

        5 清空临时表数据

        truncate table sys.ora_temp_1_ds_110008

        6 按4.3728587743的采样比例收集索引IND_TEST_OWNER的统计信息

8d50774daa472a49d85101e3323c5ea0.png

        7 按3.8608254352的采样比例收集索引IND_TEST_CREATED的统计信息

57e0673a82a071f5e981f3c727938b62.png

        可以看到DBMS_STATS.AUTO_SAMPLE_SIZE默认对于全表的采用的是100%的采样比例收集,但对于索引,需要收集直方图信息的列单独采集的比例很低,所以整体的速度提升很多

        从Oracle mos的文档How to Gather Optimizer Statistics on 11g (Doc ID 749227.1)我们也可以看到在Oracle11g版本,为了对表本身收集尽可能的准确以及11g版本后使用了新的更快的hash算法去计算统计信息,所以默认对于表自身的统计信息收集采用的比例是100%,而对于列级别的统计信息采集比例则采用内部自动计算的方式

82b06eaba634eac97d8f8bffe6a1ef56.png

分析指定采样比例的执行过程:

        继续通过10046跟踪分析指定采样比例30%的收集过程

        主要执行的语句步骤如下

        1 按30%采样全表扫描,获取表的统计信以及列的统计信息

841ff3d0b779db01eebd94c5567b80e3.png

        2 按30%采样分组统计owner列频率直方图列的信息

 

f8fcd6969c4cf3e542c6509211d4cb1b.png

 

dbdbf8518365fe8e3c6d31c30e05ea61.png

        3 按30%采样分组统计created列高频直方图列的信息

 

6d131d0564db906f220ceb8af4c6faa6.png

        4 按采样30%的比例收集索引IND_TEST_OWNER的统计信息

a62324d2feefd627d4033ae3414c13db.png

        5 按采样30的比例收集索引IND_TEST_CREATED的统计信息

b2b703ea301f96f438d2ec7d586a59bb.png

        可以看到指定采样比例的方式,全程不管是对于表,列的直方图以及索引都采集30%表数据的方式进行采样,所以在列的直方图以及索引这一块的消耗时间要比DBMS_STATS.AUTO_SAMPLE_SIZE高,整个过程下来收集的时间相对较长,要多次执行对表统计信息收集表TEST的全表扫描

 

总结:

        测试下来,在Oracle11g 版本使用DBMS_STATS.AUTO_SAMPLE_SIZE的方式进行统计信息收集还是比较不错的方式,在确保表自身统计信息准确的情况下,对于一些额外的统计信息列直方图,索引,则采取使用内部自动计算采样比例进行收集,兼具了采集的准确度高以及较高的执行效率

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1373471.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ApolloCarla联合仿真基本操作

Apollo 系统架构 CANBus:对接车辆的底盘,做一些数据的收发,如油门,方向盘转角 HDMap: 给localization提供定位图层的信息给perception一些车道线、道路拓扑、红绿灯的信息(超时空感知)&#x…

一台Linux服务jdk1.6 与 jdk1.8 并存,tomcat6+tomcat8 并存

Linux jdk1.6,1.8 tomcat6 tomcat8 并存 需求场景: 有一个项目 原来是 jdk1.6tomcat6 部署的,现在需要进行项目架构升级 项目需要适配jdk1.8 然后用 jdk.8 tomcat 8进行部署,然后下架 jdk1.6 的linux服务 现在有一台 jdk.8 tomcat 8的linu…

【办公软件】手机当电脑摄像头Iriun Webcam软件安装与试用

家里电脑是台式的没有摄像头,但老安卓手机有一台。本来想用小爱摄像头做电脑摄像头,但是发现像素有点差,捣鼓了半天没成功。看网上别人都用旧手机来当电脑摄像头,并且也能使用音频,所以还是用旧手机做摄像头比较香。 …

Java 常见缓存详解以及解决方案

一. 演示Mybatis 一级缓存 首先我们准备一个接口 两个实现的方法, 当我们调用这个queryAll()方法时我们需要调用selectAll()方法来查询数据 调用此接口实现效果 这个时候我们就可以发现了问题,我们调用方法…

车速预测 | Matlab基于RBF径向基神经网络的车速预测模型(多步预测,尾巴图)

目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 车速预测 | Matlab基于RBF径向基神经网络的车速预测模型(多步预测,尾巴图) 程序设计 完整程序和数据获取方式:私信博主回复Matlab基于RBF径向基神经网络的车速预测模型…

电脑重装系统有什么好处和坏处?利弊分析

在数字时代,电脑已成为我们日常生活和工作中不可或缺的工具。随着时间的推移,电脑可能会出现各种问题,如运行缓慢、软件冲突、病毒侵入等。此时,许多人会选择重装系统作为解决问题的方法。重装系统既有好处也有坏处。本文将深入探…

GC6109——双通道5V低电压步进电机驱动芯片,低噪声、低振动,应用摄像机,机器人等产品中

GC6109是双通道5V低电压步进电机驱动器,具有低噪声、低振动的特点,特别适用于相机的变焦和对焦系统,万向节和其他精密、低噪声的STM控制系统。该芯片为每个通道集成了256微步驱动器。带SPl接口,用户可以方便地调整驱动器的参数。内…

Java版直播商城:电商源码、小程序、三级分销及 免 费 搭 建 方案

一、技术选型 java开发语言:java是一种跨平台的编程语言,适用于大型企业级应用开发。使用java开发直播商城可以保证系统的稳定性和可扩展性。 spring boot框架:spring boot是一个快速构建spring应用的框架,简化了开发过程&#xf…

Elasticsearch windows开箱即用【记录】

一、准备工作 安装ES之前要在本机安装好JDK,对应的兼容性见官网链接:https://www.elastic.co/cn/support/matrix ES官网链接:https://www.elastic.co/cn/, 我本机安装的是JDK8,测试使用的是7.3.0版本的ES和Kibana。 1、首先去…

【2024最新-python3小白零基础入门】No3.python六大数据类型学习

文章目录 前言一、 Number(数字)1.1 数字类型分类1.2 数字类型转换1.3 数字运算 二、 String(字符串)2.1 字符串的创建: 2.2 字符串的基本操作:2.3 字符串常用方法: 三、 List(列表&…

Vulnhub靶机:Corrosion 2

一、介绍 运行环境:Virtualbox 攻击机:kali(10.0.2.15) 靶机:corrosion:2(10.0.2.13) 目标:获取靶机root权限和flag 靶机下载地址:https://www.vulnhub.com/entry/c…

Python教程39:使用turtle画美国队长盾牌

---------------turtle源码集合--------------- Python教程36:海龟画图turtle写春联 Python源码35:海龟画图turtle画中国结 Python源码31:海龟画图turtle画七道彩虹 Python源码30:海龟画图turtle画紫色的小熊 Python源码29&a…

大创项目推荐 深度学习手势检测与识别算法 - opencv python

文章目录 0 前言1 实现效果2 技术原理2.1 手部检测2.1.1 基于肤色空间的手势检测方法2.1.2 基于运动的手势检测方法2.1.3 基于边缘的手势检测方法2.1.4 基于模板的手势检测方法2.1.5 基于机器学习的手势检测方法 3 手部识别3.1 SSD网络3.2 数据集3.3 最终改进的网络结构 4 最后…

iOS14 Widget 小组件调研

桌面小组件是iOS14推出的一种新的桌面内容展现形式。 根据苹果的统计数据,“一般用户每天进入主屏幕的次数超过90次”,如果有一个我们应用的小组件在桌面,每天都有超过90次曝光在用户眼前的机会,这绝对是一个顶级的流量入口。 “…

LCD—液晶显示中英文

本节主要介绍以下内容: 字符编码 字模 各种模式的液晶显示字符实验 本节字符编码说明参考网站 字符编码及转换测试:导航菜单 - 千千秀字 Unicode官网:http://www.unicode.org。 一、字符编码 由于计算机只能识别0和1,文字…

TensorFlow相关组件的安装

安装Anaconda3 安装Anaconda3的时候可以安装在任意磁盘中,在勾选path的时候全部勾选即可。更换Anaconda3的下载源为清华大学源,在此期间不要打开Anaconda3,在cmd中依次输入以下即可: conda config --add channels https://mirro…

基于TI TPSXX系列 Buck电路应用计算-外围器件详细计算过程

TPS54202 Buck电路应用计算 1、电气特性2、内部框图3、典型应用电路4、设计需求5、计算EN引脚电阻6、FB引脚电阻估算7、查看反馈电压电压基准8、输入电容计算10、FB引脚反馈电阻计算11、功率电感计算12、输出电容计算13、前馈电容计算15、Layout布局 TPS54202-中文版 1、电气特…

软件测试|详解 Pytest 参数化:简化测试用例的编写

简介 Pytest 是一个广泛使用的 Python 测试框架,它提供了丰富的功能来编写和执行测试用例。其中一个强大的特性是参数化,它允许我们通过一种简洁的方式运行多个输入参数的相似测试用例,从而减少冗余的代码。本文将详细介绍 Pytest 的参数化功…

招投标系统是Electron的纯内网编辑Office Word,可以设置部分区域可编辑,其他的地方不能编辑吗?

问题: 我们是招投标系统的开发公司,框架是用的Electron,需要在纯内网的环境下编辑Office Word,可以设置部分区域可编辑,其他的地方不能编辑吗(如下红框位置)并且在用户忘记填写一些区域的时候做…

linux kernel:devres模块架构分析

参考文档: https://www.kernel.org/doc/html/latest/driver-api/driver-model/devres.html https://www.cnblogs.com/sammei/p/3498052.html devres in linux driver devres: Managed Device Resource device resource managementdevres_alloc()动态申请内存分配…