【数据库】第九章 关系查询处理与优化

news2025/1/1 9:09:55

第九章 关系查询处理与优化

索引

在这里插入图片描述

索引文件是一种辅助存储结构,其存在与否不改变存储表的物理存储结 构;然而其存在,可以明显提高存储表的访问速度。

索引文件组织方式有两种:(相对照的,主文件组织有堆文件、排序文件、散列文件、 聚簇文件等多种方式)

  • 排序索引文件(Orderedindices):按索引字段值的某一种顺序组织存储

  • 散列索引文件(Hash  indices):依据索引字段值使用散列函数分配散列桶的 方式存储

特点

  • 在一个表上可以针对不同的属性或属性组合建立不同的索引文件,可建立 多个索引文件。索引字段的值可以是Table中的任何一个属性的值或任何多个 属性值的组合值

  • 索引文件比主文件小很多。通过检索一个小的索引文件(可全部装载进内 存),快速定位后,再有针对性的读取非常大的主文件中的有关记录

  • 有索引时,更新操作必须同步更新索引文件和主文件。

    • DBMS可以自动维护,table改变,索引也会有相应的改变

  • 索引技术应用使检索效率大幅度提高,但同时其也增加了存储空间、使维 护负担加重(不仅要维护主文件,而且要维护索引文件)

    衡量索引性能好坏

  • 访问时间

  • 插入时间

  • 删除时间

  • 空间负载

  • 支持存取的有效性

    • 比如:支持的是属性的限定值(是否符合单一值), 还是支持属性的限定范围的值(是否符合一定范围)

相关概念

在这里插入图片描述

创建索引

在这里插入图片描述

在这里插入图片描述

  • 对于主文件中每一个记录(形成的每一个索引字段值),都有一个索引项和它 对应,指明该记录所在位置。这样的索引称稠密索引(denseindex)
    • 候选键属性的稠密索引
      • 先查索引,然后再依据索引读主文件
    • 候选键属性的稠密索引(三种情况)
      在这里插入图片描述
      在这里插入图片描述

在这里插入图片描述

  • 对于主文件中部分记录(形成的索引字段值),有索引项和它对应,这样的索 引称非稠密索引(undense index)或稀疏索引(sparseindex)
    • 稀疏索引如何定位记录
      • 定位索引字段值为 K的记录,需要
        • 首先找相邻的小于K的最大索引字段值所对应的索引项
        • 从该索引项所对应的记录开始顺序进行Table的检索
      • 稀疏索引的使用要求—主文件必须是按对应索引字段属性排序存储
      • 相比稠密索引:空间占用更少,维护任务更轻,但速度更慢
      • 平衡:索引项不指向记录指针,而是指向记录所在存储块的指针,即每一 存储块有一个索引项,而不是每条记录有一索引项----主索引
        在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述

比较

  • 一个主文件仅可以有一个主索引,但可以有多个辅助索引
  • 主索引通常建立于主码/排序码上面;辅助索引建立于其他属性上面
  • 可以利用主索引重新组织主文件数据,但辅助索引不能改变主文件数据
  • 主索引是稀疏索引,辅助索引是稠密索引

聚簇索引与非聚簇索引

  • 聚簇索引—是指索引中邻近的记录在主文件中也是临近存储的;

  • 非聚簇索引—是指索引中邻近的记录在主文件中不一定是邻近存储的

特点

  • 如果主文件的某一排序字段不是主码,则该字段上每个记录取值便不唯 一,此时该字段被称为聚簇字段;聚簇索引通常是定义在聚簇字段上。
  • 聚簇索引通常是对聚簇字段上的每一个不同值有一个索引项(索引项的总数和 主文件中聚簇字段上不同值的数目相同),索引字段即是聚簇字段的不同值,由于有相同聚簇字 段值的记录可能存储于若干块中,则索引项的指针指向其中的第一个块。
  • 一个主文件只能有一个聚簇索引文件,但可以有多个非聚簇索引文件 主索引通常是聚簇索引(但其索引项总数不一定和主文件中聚簇字段上不同值的数目相 同,其和主文件存储块数目相同);辅助索引通常是非聚簇索引。
  • 主索引/聚簇索引是能够决定记录存储位置的索引;而非聚簇索引则只能用 于查询,指出已存储记录的位置

其他索引类型

  • 倒排索引

在这里插入图片描述
在这里插入图片描述

数据库查询实现算法

一趟扫描算法

数据库查询优化技术

思路

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

  • (1)尽可能地早做选择和投影:可使中间 结果变小,节省几个数量级的执行时间。
  • (2)把选择与投影串接起来:一元运算序 列可一起执行,只需对整个关系扫描一遍。
  • (3)把投影与其前或后的二元运算结合 起来:在第一次用关系时去掉一些无关属性, 可以避免多次扫描整个关系。
  • (4)把某些选择与其前的笛卡尔积合并 成一个连接:当R×S前有选择运算且其中有 条件是R、S属性间比较的运算时,可将其转化 为连接运算可节省时间。
  • (5)执行连接运算前对关系做适当预处 理:文件排序、建立临时索引等,可使两关系 公共值高效联接。
  • (6)找出表达式里的公共子表达式:若 公共子表达式结果不大,则预先计算,以后可读 入此结果,节时多,尤当视图情况下有用。

关系代数操作交换的等价性

关系代数: 并,差,积,选择,投影

等价

在这里插入图片描述

关系交换定理

  1. 连接与连接,积与积的交换律
    在这里插入图片描述

通常,我们选择结果集合小的表达式,先装入内存

  1. 连接与连接、积和积的结合律

在这里插入图片描述

通常,我们选择结果集合小的表达式,先装入内存

  1. 投影串接律

在这里插入图片描述

  1. 选择串接律

在这里插入图片描述

  1. 选择和投影交换律

在这里插入图片描述

  1. 选择和积的交换律
    在这里插入图片描述

  2. 投影和积的交换律

在这里插入图片描述

  1. 选择和并的交换律

在这里插入图片描述

  1. 选择和差的交换律

在这里插入图片描述

  1. 投影和并的交换律

在这里插入图片描述

查询优化算法及示例

在这里插入图片描述

物理层优化

代价估算

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/373495.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python3-字符串

Python3 字符串 字符串是 Python 中最常用的数据类型。我们可以使用引号( ’ 或 " )来创建字符串。 创建字符串很简单,只要为变量分配一个值即可。 Python 访问字符串中的值 Python 不支持单字符类型,单字符在 Python 中也是作为一个字符串使用…

行测-判断推理-图形推理-位置规律-旋转、翻转

短指针每次逆时针旋转60(排除法选C走人)长指针每次顺时针旋转120选C左上菱形每次顺时针旋转90(排除C D)右上每次旋转180(选B走人)左下每次保持不变右下每次逆时针旋转90选B左上和右上为左右翻转&#xff0c…

结合JasperReports输出报表

结合JasperReports输出报表 前面我们已经使用Jaspersoft Studio设计了两个模板文件:demo1.jrxml和demo2.jrxml。其中demo1.jrxml的动态列表数据是基于JDBC数据源方式进行数据填充,demo2.jrxml的动态列表数据是基于JavaBean数据源方式进行数据填充。本小节…

ATTCK实战系列-红队评估(一)

from ATT&CK实战系列-红队评估(一) 环境搭建 下载地址:http://vulnstack.qiyuanxuetang.net/vuln/detail/2/ 将三个虚拟机启动起来 除了windows 7那个主机,其他都只设置成仅主机模式 windows 7添加两个网卡,一个是仅主机,一个是NAT …

解决SpringBoot中@RequestBody不能和Multipart同时传递的问题

问题描述 今天在做文件上传的时候,遇到了这么一个错误日志: Resolved[org.springframework.web.HttpMediaTypeNotSupportedException: Content type ‘multipart/form-data;boundary--------------------------771899451541318130280588;charsetUTF-8’…

[牛客Hot101]链表篇

文章目录1.翻转链表2.链表内指定区间翻转3. 链表中的节点每k个一组翻转4. 合并两个排序的链表5. 合并k个排序的链表6. 判断链表是否有环7. 链表中倒数第k个节点8. 删除链表中的倒数第k和节点9. 两个链表的第一个公共节点10.链表的入环节点11. 链表相加(二&#xff0…

mac 如何设置 oh my zsh 终端terminal 和添加主题powerlevel10k

Oh My Zsh 是什么 Oh My Zsh 是一款社区驱动的命令行工具,正如它的主页上说的,Oh My Zsh 是一种生活方式。它基于 zsh 命令行,提供了主题配置,插件机制,已经内置的便捷操作。给我们一种全新的方式使用命令行。 **Oh …

Buuctf reverse [FlareOn4]IgniteMe 题解

一. 查壳 无壳32位程序 二. ida打开 GetStdHandle函数根据微软官方文档可以得知是获取标准输入/输出/错误的句柄 参数里的 0xFFFFFFF6转换一下是4294967286, 对应(DWORD) -10 所以这里的WriteFile函数实际上是实现了printf的功能 sub_4010F0()函数 其功能是通过ReadFile函数读取…

Java EE|TCP/IP协议栈之数据链路层协议详解

文章目录一、数据链路层协议感性认识数据链路层简介以太网简介特点二、以太网数据帧格式详解帧头不同类型对应的载荷三、关于MTU什么是MTUMTU有什么作用ip分片(了解)参考一、数据链路层协议感性认识 数据链路层简介 从上图可以看出 , 在TCP/…

「JVM 高效并发」Java 线程

进程是资源分配(内存地址、文件 I/O 等)的基本单位,线程是执行调度(处理器资源调度)的基本单位; Loom 项目若成功为 Java 引入纤程(Fiber),则线程的执行调度单位可能变为…

搭建Vue工程

搭建Vue工程 localhost 127.0.0.1 域名 IP 192.168.0.28 联网IP 最后都会渲染到一个页面里面,有多少个页面就有多少个页面模板。 vue里面改webpack配置 vue.config.js 配置参考 | Vue CLI /assets /api* 开发的时候用到的请求后台地址 和 项目真实部署上线的时候 请…

Linux 练习二 (VIM编辑器 + GCC编译器 + GDB调试)

文章目录VIM命令思维导图GCC编译器1、GCC编译文件练习2、静态库动态库制作练习将此函数编译成动态库将此函数编译成静态库GCC优化选项 -OnGDB调试命令练习练习一:编写一个程序,通过gdb调试,使用到gdb的b,n,s&#xff0…

ccc-台大林轩田机器学习基石-hw1

文章目录Question1-14Question15-PLAQuestion16-PLA平均迭代次数Question17-不同迭代系数的PLAQuestion18-Pocket_PLAQuestion19-PLA的错误率Question20-修改Pocket_PLA迭代次数Question1-14 对于有明确公式和定义的不需要使用到ml 智能系统在与环境的连续互动中学习最优行为策…

Android OTA 相关工具(四) 查看 payload 文件信息

文章目录1. payload_info.py 的使用1. 环境2. 帮助信息2. 查看 payload 文件信息1. 不带选项查看2. 使用 stats 选项查看3. 使用 signagures 选项4. 使用 list_ops 选项查看3. 其它一直以来,很多人都表达过很想去研究一下 Android OTA 的 payload 文件,看…

CSDN原力增长规则解读 实测一个月

CSDN原力越来越难了,当然,这对生态发展来说也是好事。介绍下原力增长有哪些渠道吧。发布原创文章:10分/次,每日上限为15分、2篇回答问题:1分/次,每日上限2分,2回答发动态:1分/次&…

MyBatis 的工作原理解析

文章目录前言一、mybatis工作原理1.1 流程图1.2 步骤解析1.3 代码实现前言 本文记录 Mybatis 的工作原理,做到知识梳理总结的作用。 一、mybatis工作原理 Mybatis 的总体工作原理流程图如下图所示 1.1 流程图 1.2 步骤解析 Mybatis 框架在工作时大致经过8个步骤…

【ArcGIS Pro二次开发】(9):GeoProcessing工具和自定义工具的调用

ArcGIS Pro自带了1000种以上的GeoProcessing工具,几乎可以实现所有你想要做的事。 ArcGIS Pro的二次开发并不需要我们从底层做起,很多功能只要学会调用工具并组合使用,就完全可以实现。 下面介绍如何调用系统自带的GeoProcessing工具&#x…

pmp考试费用要多少?

PMP所带来的费用分为三种:PMP考试费用,PMP培训费用,以及PMP续证费用一、PMP 费用⭕PMP考试费用这个属于PMP本身的考试费用,由PMI机构收取,然后是交给人才管理中心的,费用是3900元人民币,补考的话…

蓝桥杯 考勤打卡

问题描述 小蓝负责一个公司的考勤系统, 他每天都需要根据员工刷卡的情况来确定 每个员工是否到岗。 当员工刷卡时, 会在后台留下一条记录, 包括刷卡的时间和员工编号, 只 要在一天中员工刷过一次卡, 就认为他到岗了。 现在小蓝导出了一天中所有员工的刷卡记录, 请将所有到岗…

机器学习可解释性一(LIME)

随着深度学习的发展,越来越多的模型诞生,并且在训练集和测试集上的表现甚至于高于人类,但是深度学习一直被认为是一个黑盒模型,我们通俗的认为,经过训练后,机器学习到了数据中的特征,进而可以正…