CMU 15-445 -- Parallel Execution - 11

news2025/1/11 7:47:26

CMU 15-445 -- Join Algorithms - 11

  • 引言
  • Parallel & Distributed
    • Inter-query vs. Intra-query Parallelism
  • Process Model
    • Approach #1: Process per DBMS Worker
    • Approach #2: Process Pool
    • Approach #3: Thread per DBMS Worker
  • Execution Parallelism
    • Inter-query Parallelism
    • Intra-query Parallelism
      • Intra-operator Parallelism (Horizontal)
      • Inter-operator Parallelism (Vertical)
      • 观察
  • I/O Parallelism
    • Multi-disk Parallelism
    • Partitioning
      • Vertical Partitioning
      • Horizontal Partitioning
  • 小结


引言

本系列为 CMU 15-445 Fall 2022 Database Systems 数据库系统 [卡内基梅隆] 课程重点知识点摘录,附加个人拙见,同样借助CMU 15-445课程内容来完成MIT 6.830 lab内容。


Parallel & Distributed

随着摩尔定律逐渐失效,处理器走向多核,系统可以通过并行执行增加吞吐量,减少延迟,使得系统响应更快。

Parallel:如运行在多核 CPU 上

  • 每个 DB 节点物理上非常接近,通过高速 LAN 相连接
  • 通信成本极小

Distributed:如分布式数据库

  • 节点之间距离可能很远,通过公网相连接
  • 通信成本和通信可能出现的问题不可忽略

Inter-query vs. Intra-query Parallelism

  • Inter-Query:不同的查询并行执行
    • 增加吞吐量,减少延迟
  • Intra-Query:同样的查询的不同 operators 并行执行
    • 减少长时查询的延迟,主要用于 Streaming

Process Model

DBMS 的 process model 定义了多用户数据库系统处理并发请求的架构。在下文中,用 worker 指代执行查询任务的单位,它可能是 Process(es),也可能是 Thread(s)。

Approach #1: Process per DBMS Worker

在这里插入图片描述

用户请求经过 Dispatcher 后,由 Dispatcher 分配相应的 Worker 完成查询并返回结果,每个 worker 都是单独的 OS Process

  • 依赖 OS scheduler 来调度
  • 使用 shared-memory 来存储全局数据结构
  • 单个 worker 崩溃不会引起整个系统崩溃

这种 Process Model 出现在 threads 跨平台支持很不稳定的时代,主要是为了解决系统的可移植性问题。使用这种 Process Model 的数据库有历史版本的 DB2、ORACLE 和 PostgreSQL 等。


Approach #2: Process Pool

在这里插入图片描述
用户请求经过 Dispatcher 后,由 Dispatcher 分配相应的 Worker 完成查询,将结果返回 Dispatcher,后者再返回给用户。每个 Worker 可以使用 Worker Pool 中任意空闲的 Process(es):

  • 依赖 OS scheduler 来调度
  • 使用 shared-memory 来存储全局数据结构
  • 不利于 CPU cache

使用这种 Process Model 的数据库有 DB2、PostgreSQL(2015)。


Approach #3: Thread per DBMS Worker

在这里插入图片描述
整个 DBMS 由一个 Process 和多个 Worker Threads 构成:

  • DBMS 自己控制调度策略:每个查询拆成多少个任务、使用多少个 CPU cores、将任务分配到哪个 core 上,每个 task 的输出存储在哪里。自己控制调度策略的理由与自己构建 Buffer Pools 的理由是一样的:DBMS 比 OS 有更多的领域知识。
  • dispatcher 不一定存在
  • thread 崩溃可能导致整个系统崩溃
  • 使用多线程架构的优势
    • context switch 成本更低
    • 天然地可以在 threads 之间共享全局信息,无需使用 shared memory

使用这种 Process Model 的数据库有 DB2、MSSQL、MySQL、Oracle (2014) 及其它近 10 年出现的 DBMS 等。


Execution Parallelism

Inter-query Parallelism

通过并行执行多个查询来提高 DBMS 性能。如果这些查询都是只读查询,那么处理不同查询之间的关系无需额外的工作;如果查询存在更新操作,那么处理好不同之间查询的关系将变得很难。相关内容将在后续章节中介绍。


Intra-query Parallelism

通过并行执行单个查询的单个或多个 operators 来提高 DBMS 性能:

  • Approach #1:Intra-Operator
  • Approach #2:Inter-Operator

这两个方法可以被同时使用,每个 relational operator 都有并行的算法实现。


Intra-operator Parallelism (Horizontal)

将 data 拆解成多个子集,然后对这些子集并行地执行相应的 operator,DBMS 通过将 exchange operator 引入查询计划,来合并子集处理的结果,过程类似 MapReduce,举例如下图所示:

在这里插入图片描述


Inter-operator Parallelism (Vertical)

将 operators 串成 pipeline,数据从上游流向下游,一般无需等待前一步操作执行完毕,也称为 pipelined parallelism,举例如下:

在这里插入图片描述
这种方式在传统 DBMSs 中并不常用,因为许多 operators,如 join, 必须扫描所有 tuples 之后才能得到结果。它更多地被用在流处理系统,如 Spark、Nifi、Kafka,、Storm、Flink、Heron。


观察

值得注意的是,使用额外的 processes/threads 来并行地执行查询可以通过提高 CPU 利用率来提高 DBMS 效率;但如果 DBMS 效率瓶颈出现在 disk 数据存取上,这种优化带来的效果就非常有限,甚至有可能因为 disk I/O 的提高导致整体性能下降,如 cache miss rate 提高等等。


I/O Parallelism

I/O Parallelism 通过将 DBMS 安装在多个存储设备上来实现:

  • Multiple Disks per Database
  • One Database per Disk
  • One Relation per Disk
  • Split Relation across Multiple Disks

Multi-disk Parallelism

通过 OS 或硬件配置将 DBMS 的数据文件存储到多个存储设备上,整个过程对 DBMS 透明,如使用 RAID:
在这里插入图片描述

在这里插入图片描述
一些 DBMS 甚至允许用户为单个 database 指定 disk location。


Partitioning

将一个 logical table 拆分成多个 physical segments 分开存储。理想情况下,partitioning 应该对应用透明,但这并不一定能实现。

Vertical Partitioning

原理上类似列存储数据库,将 table 中的部分 attributes 存储到不同的地方,如:

CREATE TABLE foo (
  attr1 INT,
  attr2 INT,
  attr3 INT,
  attr4 TEXT
);

在这里插入图片描述

Horizontal Partitioning

基于某个可定制的 partitioning key 将 table 的不同 segments 分开存储,包括:

  • Hash Partitioning
  • Range Partitioning
  • Predicate Partitioning

在这里插入图片描述


小结

并发执行很重要,几乎所有 DBMS 都需要它,但要将这件事做对很难,体现在

  • Coordination Overhead
  • Scheduling
  • Concurrency Issues
  • Resource Contention

本节对应教材PDF

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/781392.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于SpringBoot+vue的滴答拍摄影项目设计与实现

博主介绍: 大家好,我是一名在Java圈混迹十余年的程序员,精通Java编程语言,同时也熟练掌握微信小程序、Python和Android等技术,能够为大家提供全方位的技术支持和交流。 我擅长在JavaWeb、SSH、SSM、SpringBoot等框架…

JAVA设计模式——23种设计模式详解

一、什么是设计模式🍉 设计模式(Design pattern) 是解决软件开发某些特定问题而提出的一些解决方案也可以理解成解决问题的一些思路。通过设计模式可以帮助我们增强代码的可重用性、可扩充性、 可维护性、灵活性好。我们使用设计模式最终的目…

基于物联网网关的工业数据可视化平台有什么功能?

随着数字化浪潮的不断发展,工业数据的价值越来越重要。在企业利用数据的过程中,数据可视化是数字化系统中十分重要的一部分。然而,工厂多种设备、多种协议影响到系统的搭建使得企业无法获得全面的数据视图,也无法对整个生产流程进…

Ubuntu22.04 安装深度学习服务器全纪录

文章目录 Ubuntu 22.04 安装深度学习服务器全纪录1. 制作启动盘2. 安装 Ubuntu 22.043.配置国内镜像软件源4. Python 相关设置5. 配置 SSH6. 配置远程桌面6. 安装 CUDA7. 安装 docker8. 安装 Anaconda9. 安装 ChatGLM210. 使用 fastllm 推理加速 Ubuntu 22.04 安装深度学习服务…

【100天精通python】Day8:数据结构_元组Tuple的创建、删除、访问、修改、推导系列操作

目录 1 创建元组 2 删除元组 3 访问元组元素 4 多个值的同时赋值和交换 5 修改元组元素 6 元组推导式 7 元组运算符 8 元组常用场景 9 元组(Tuple)和列表(List)的区别 元组(tuple)是 Python 中的…

Codeforces Round 886 (Div. 4)

目录 A. To My Critics B. Ten Words of Wisdom C. Word on the Paper D. Balanced Round E. Cardboard for Pictures F. We Were Both Children G. The Morning Star A. To My Critics time limit per test1 second m…

《qt quick核心编程》笔记一

1.基础HelloWorld代码 import QtQuick 2.15 import QtQuick.Window 2.15 import QtQuick.Controls 2.15Window {width: 400height: 300visible: truetitle: qsTr("Hello 1World")Rectangle {width: parent.widthheight: parent.heightcolor: "gray"Text {…

RabbitMQ惰性队列使用

说明:惰性队列是为了解决消息堆积问题,当生产者生产消息的速度远高于消费者消费消息的速度时,消息会大量的堆积在队列中,而队列中存放的消息数量是有限的,当超出数量时,会造成消息的丢失。而扩容队列&#…

Homography单应性矩阵

1. Homography 单应性概念 考虑 同一个平面(比如书皮)的两张图片,红点表示同一个物理坐标点在两张图片上的各自位置。在 CV 术语中,我们称之为对应点。 Homography 就是将一张图像上的点映射到另一张图像上对应点的3x3变换矩阵. 因为 Homography 是一个 …

AtcoderABC237场

A - Not OverflowA - Not Overflow 题目大意 题目要求判断给定的整数N是否在范围[-231, 231-1]内,如果是则输出"Yes",否则输出"No"。 思路分析 位运算:由于题目中的范围是2的幂次方,可以使用位运算来进行快…

Elasticsearch/Enterprise Search/Kibana安装记录

目录 Elasticsearch的安装导入 elasticsearch PGP密钥 安装使用APT安装手动下载安装 启动elasticsearch安全功能重新配置节点以加入现有集群启用系统索引的自动创建功能运行Elasticsearch(在systemd下)检查Elasticsearch是否正在运行Elasticsearch配置外网访问 第三方包安装ela…

flex局部的知识总结

一、Flex布局的基本概念。 (1)Flex布局: 任何一个容器都可以指定为Flex布局。 注意:设为Flex布局以后,子元素的float、clear和vertical-align属性将失效。 (2)Flex容器:采用Flex布局…

Linux环境下Elasticsearch相关软件安装

Linux环境下Elasticsearch相关软件安装 本文将介绍在linux(Centos7)环境下安装Elasticsearch相关的软件。 1、安装Elasticsearch 1.1 Elasticsearch下载 首先去Elasticsearch官网下载相应版本的安装包,下载之后传输到linux服务器上。 官网地址:http…

Sony索尼CMOS图像传感器SubLVDS与SLVS-EC接口FPGA开发方案

索尼Sony公司的工业CMOS图像传感器主要有3种接口:Sub-LVDS、SLVS、SLVS-EC。 Sub-LVDS接口的CMOS主要是IMX2XX系列和IMX3XX系列的一部分型号,例如IMX250,IMX252、IMX255、IMX392、IMX304等。 SLVS与SLVS-EC接口的CMOS主要是IMX3XX系列的一部分…

ReviewTools-iOS混淆工具

ReviewTools-iOS混淆工具 下载 一键混淆 拖拽或点击上传项目,然后选择一个代码库即可开始对项目混淆。 一键混淆默认开启了所有的混淆选项,开启字符串加密功能需要手动选择一种加密方式。混淆单词以及垃圾代码均来自于大量Github项目,完美解决…

使用css给图片添加酷炫标题的几种方式

使用css给图片添加酷炫标题的几种方式 在本文章中,将会向大家展示如何使用 CSS3 创建具有各种过渡动画的图像标题。 浏览器支持情况 这些方式将在很大程度上依赖于css3的transform和transition属性,这些属性是相对较新的功能,因此&#xf…

设计模式原则

1、设计模式七大原则 1.1 设计模式的目的 编写软件过程中,程序员面临着来自 耦合性,内聚性以及可维护性,可扩展性,重用性,灵活性 等多方面的挑战,设计模式是为了让程序(软件),具有更好 代码重…

抖音短视频seo矩阵系统源码解析与技术实现

抖音短视频SEO矩阵系统源码解析与技术实现涉及到多个方面的技术,包括算法、网络爬虫、数据挖掘、自然语言处理、数据库设计等。 一、 以下是一些实现此系统的技术要点和步骤: 数据采集和处理 首先,需要对抖音短视频进行数据采集。这可以通过编…

【Linux进程】进程控制(上) {进程创建:fork的用法,fork的工作流程,写时拷贝;进程终止:3种退出情况,退出码,常见的退出方法}

一、进程创建 1.1 fork的初步认识和基本使用 在linux中fork函数是非常重要的函数&#xff0c;它从已存在进程中创建一个新进程。新进程为子进程&#xff0c;而原进程为父进程。 #include <unistd.h> pid_t fork(void);返回值&#xff1a;子进程中返回0&#xff0c;父进…

批量AI智剪:让您的短视频制作更加轻松有趣!

在如今的社交媒体时代&#xff0c;短视频已经成为了人们表达创意和分享生活的重要方式。然而&#xff0c;对于许多人来说&#xff0c;短视频制作却是一项繁琐且技术要求较高的任务。幸运的是&#xff0c;现在有了AI智剪&#xff0c;让您的短视频制作变得更加轻松有趣&#xff0…