PostgreSQL技术内幕8:PostgreSQL查询执行器

news2024/12/27 13:52:01

0.简介

执行器是查询编译和存储引擎之间的连接模块,其负责将优化器输出的执行计划,进行初始化、执行,访问存储引擎并获得最终结果返回,本章主要介绍PG的执行器模型和其执行流程。

执行器的处理模型

常见的执行器的处理模型包含基于拉操作的Pull模型和基于推操作的Push模型。

1.1 火山模型(Pull模型)

火山模型也叫迭代器模型,最早是《Volcano, an Extensible and Parallel Query Evaluation System》中提出,其产生的背景是当时的 IO 速度是远远小于 CPU 的计算速度的,所以降低虚函数开销带来的优化微乎其微,且内存空间有限,单个处理更附和当时的场景。火山模型是由上游节点主动pull来驱动下层节点,逐层调用来实现数据的处理。其优缺点也比较明确:
优点:
1)实现简单,通用性好:每个Operator都可以独立实现,不受其他Operator的影响,且不受数据规模限制,可以处理任意规模的数据集。
2)灵活性高:可以灵活控制输出的数量,比如Limit算子及时短路。
缺点:
1)虚函数开销:每次调用GetNext获取一个tuple,会产生大量虚函数调用开销。
2)对应Cache不友好:过多的控制语句和函数调用容易导致缓存失效。

在这里插入图片描述

1.2 Push模型

可以看到,Push模型和Pull模型刚好相反,是从底层元组主动向上传递从而驱动整个流程。Push模型在计划的叶子节点开始执行,每层执行完成后物化然后传递给上一层节点。

在这里插入图片描述

优点:
1)减少函数调用:与Pull模型相比,Push模型显著减少了函数调用次数。
2)Cache命中率高:由于内部处理逻辑一致,Cache命中率得到显著提升。
缺点:
1)内存占用较大:由于每个节点都需要物化处理后的数据,可能导致内存占用升高。

1.3 向量化执行引擎

可以看到,把pull模型一次获取一条改为一个循环,处理完再向上驱动即为Push模型。向量化是对其另一种优化,一次处理一批数据,减少函数调用次数和缓存切换频率,提高执行效率。同时,结合了列式存储和SIMD指令,提高执行器性能。

2. PG执行器

执行器是执行计划和存储引擎之间的关联模块,那么接下来就分别从执行器流程、与执行计划的关联、与存储引擎的关联来进行执行器的分析。

2.1 执行器本身流程

在PG中有四个个用于调用执行器的接口,他们是ExecutorStart、ExecutorRun、ExecutorFinish和ExecutorEnd。其职责如下:

1)ExecutorStart:主要负责初始化各个算子的状态,通过调用standard_ExecutorStart对执行器进行必要的初始化

2)ExecutorRun:执行器运行阶段,通过ExecutorRun来执行算子。

3)ExecutorFinish:统计信息收集和清理。

4)ExecutorEnd:逐层结束下游节点的执行,释放资源。

顺序关系即为:ExecutorStart --> ExecutorRun --> ExecutorFinish -->ExecutorEnd

2.2 执行器与执行计划的关联

与传统执行器直接关联执行计划不同,PG引入了Portal层,负责将查询计划转发,同时根据策略生成路径,其结构如下:

typedef struct PortalData
{
  /* Bookkeeping data */
  const char *name;      /* portal's name */
  const char *prepStmtName;  /* source prepared statement (NULL if none) */
  MemoryContext portalContext;  /* subsidiary memory for portal */
  ResourceOwner resowner;    /* resources owned by portal */
  void    (*cleanup) (Portal portal); /* cleanup hook */

  ....    /* other */
}      PortalData;

Portal提供了三个方法:PortalStart、PortalRun和PortalDrop。
1)PortalStart:初始化Portal参数和策略。
2)PortalRun:根据语句类型选择执行器路径,返回结果。
3)PortalDrop:结束执行器,释放资源。

2.3 执行器和存储引擎的关联

以一个简单的Scan为例,顺序扫描的入口函数为SeqNext,其会调用heap_getnext,heap_getnext内部调用heapgettup,其内部使用就是共享内存和页面对应的部分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2103201.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

海南云亿商务咨询有限公司抖音电商服务的可靠之选

在这个短视频与直播电商风起云涌的时代,抖音作为其中的佼佼者,正引领着新一轮的消费潮流。而在这片充满机遇与挑战的电商蓝海中,海南云亿商务咨询有限公司犹如一颗璀璨新星,凭借其专业的服务与独到的策略,在抖音电商领…

缺失值插补解释:六种插补方法?

目录 一、说明 二、什么是缺失值,为什么会出现缺失值? 2.1 什么是缺失值? 2.2 为什么会出现缺失值? 2.3 缺失数据类型 2.4 为什么要关注缺失值? 三、数据集 四、缺失数据的插值方式 4.1 方法 1:List-wise D…

通过Python库ydata-profiling生成数据分析报告

一:ydata-profiling库的介绍 ydata-profiling是一个强大的 Python 库,它为 Pandas DataFrame 提供了快速的探索性数据分析(EDA)。它能够自动生成包含详细统计信息的交互式 HTML 报告,使得数据分析变得更加直观和便捷。…

设计模式 -- 中介者模式(Mediator Pattern)

1 问题引出 1.1 智能家庭项 智能家庭包括各种设备,闹钟、咖啡机、电视机、窗帘 等主人要看电视时,各个设备可以协同工作,自动完成看电视的准备工作,比如流程为:闹铃响起->咖啡机开始做咖啡->窗帘自动落下->电…

idea插件【1】Smart Tomcat

一、简介 在开发过程中除了springboot项目支持jar运行,很多场景下需要使用到tomcat外置服务部署,此时我们可以使用idea插件Smart Tomcat (Smart Tomcat 插件是一个用于简化与 Tomcat 服务器交互的工具,它提供了一些额外的功能来增…

TCP协议相关特性

TCP(Transmission Control Protocol,传输控制协议)是互联网传输层协议之一,也是 TCP/IP 协议簇的核心协议。它的作用是在 IP 网络上提供可靠的、面向连接的通信。 TCP基本特点: 有链接,可靠传输, 面向字节流 ,全双工 TCP协议段格…

掌握盈利新技能:网格交易法分享

交易策略对于交易成功至关重要。一个有效的策略可以帮助你在市场中轻松获得盈利,而一个不恰当的策略就可能导致不少损失。今天,我们将来探讨网格交易法,这是一种特别适合震荡市场的交易策略。 什么是网格交易法? 网格交易法&#…

linux下oracle启动及关于pfile和spfile启动参数文件的配置

在现代企业环境中,Oracle数据库作为关键的业务支撑平台,承载着大量的数据处理和事务管理任务。 无论是对于DBA(数据库管理员)还是开发人员来说,掌握Oracle数据库的基本操作和配置技巧都是至关重要的。本文提供了一份全…

图形语言传输格式glTF和三维瓦片数据3Dtiles(b3dm、pnts)学习

文章目录 3DTilesb3dm一、glTF1.glTF 3D模型格式有两种2.glTF 场景描述结构3.glTF的JSON结构 二、 3DTiles 原文 工具资料 格式详解 格式详解! 3D Tiles 是一种开源的、优化的文件格式,支持逐级细节(LOD)和空间索引,使…

生成模型之训练

如图1所示。生成器和判 别器是两个网络,在训练前我们要先分别进行参数初始化。训练的第一步是固定生成器,只训 练判别器。因为生成器的初始参数是随机初始化的,所以它什么都没有学习到,输入一系列采 样得到的向量给它,…

Qt第三课 ----------widget的控件属性及stylesheet样式(css样式)的简单介绍

作者前言 🎂 ✨✨✨✨✨✨🍧🍧🍧🍧🍧🍧🍧🎂 ​🎂 作者介绍: 🎂🎂 🎂 🎉🎉&#x1f389…

“论面向服务架构设计及其应用”写作框架,软考高级论文写作,系统架构设计师

第一章 项目摘要 2023年,我参与了某公司汽车物流系统的研发项目,担任系统架构设计师的角色。该项目旨在构建一个高效、灵活且可扩展的汽车物流管理系统,以优化物流流程,提升业务响应速度,并降低运营成本。系统涵盖了订…

RISC-V (八)定时器中断

​​​​​​​riscv中断的分类 Core local INTerrupt: CLINT CLINT编程接口-寄存器 mtime寄存器,由中断触发的时钟,按照固定频率计数。

中国化学工程第七建设校招|EAS测评题库智联招聘攻略考什么

中国化学工程第七建设有限公司(简称“七化建”)是一家隶属于中国化学工程集团有限公司的全资子公司,属于央企。公司业务领域广泛,包括石油化工、房屋建筑、水利水电、市政公用、道路桥梁等EPC总承包、技术开发、实业投资、贸易等。…

【Python 千题 —— 算法篇】回文字符串

Python 千题持续更新中 …… 脑图地址 👉:⭐https://twilight-fanyi.gitee.io/mind-map/Python千题.html⭐ 题目背景 在计算机科学中,字符串操作是基础且广泛应用的内容之一。回文字符串是一个非常经典的问题,回文是一种对称的结构,这种结构在数学、文学和计算机科学中都…

css三点闪烁(可用于加载样式、标题等)

代码案例 HTML <div class"flexAlign loading"><div class"loading_item"></div><div class"loading_item"></div><div class"loading_item"></div> </div> <div class"ot…

山东省行政执法证照片要求及图像处理方法

在山东省&#xff0c;行政执法证是执法人员身份的重要标识&#xff0c;其照片的规范性对于证件的有效性至关重要。本文将详细介绍山东省行政执法证照片的要求&#xff0c;并提供使用手机相机拍照的实用方法&#xff0c;以确保照片符合标准。 一、山东省行政人员执法证照片拍摄要…

论文解读 | ACL2024 Outstanding Paper:因果指导的主动学习方法:助力大语言模型自动识别并去除偏见...

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入&#xff01; 点击阅读原文观看作者直播讲解回放&#xff01; 作者简介 孙洲浩&#xff0c;哈尔滨工业大学SCIR实验室博士生 概述 尽管大语言模型&#xff08;LLMs&#xff09;展现出了非常强大的能力&#xff0c;但它们仍然…

常见概念 -- DCM色散补偿

色散的概念 光是一种电磁波&#xff0c;在特定介质中&#xff0c;光的相速度随频率&#xff08;波长&#xff09;或传输模式有差异&#xff0c;造成光波在通过介质后&#xff0c;不同频率成分光波的相位形成分散或分离的效果&#xff0c;称为色散。 日常生活中&#xff0c;最…

时间与白酒风味:陈酿的奥秘与魅力

在漫长的历史长河中&#xff0c;白酒不仅是中华文化的瑰宝&#xff0c;更是时间的艺术品。每一滴白酒都承载着时间的沉淀&#xff0c;经过岁月的洗礼&#xff0c;散发出不同的韵味。今天&#xff0c;我们就来一同探寻陈酿的奥秘与魅力&#xff0c;感受豪迈白酒&#xff08;HOMA…