【大数据】Flink 中的 Slot、Task、Subtask、并行度

news2025/1/13 8:09:43

Flink 中的 Slot、Task、Subtask、并行度

  • 1.并行度
  • 2.Task 与线程
  • 3.算子链与 slot 共享资源组
  • 4.Task slots 与系统资源
  • 5.总结

我们在使用 Flink 时,经常会听到 taskslot线程 以及 并行度 这几个概念,对于初学者来说,这几个概念以及它们与内存,CPU 之间的关系经常搞不清楚,下面我们就通过这篇文章来弄清楚这些概念。

1.并行度

特定算子的子任务(subtask)的 个数 称之为 并行度parallel)。一般情况下,一个 数据流的并行度 可以认为是其 所有算子中最大的并行度。Flink 中每个算子都可以在代码中通过 .setParallelism(n) 来重新设置并行度,而并行执行的 subtask 要发布到不同的 slot 中去执行。

2.Task 与线程

对于分布式执行的任务,Flink 将算子的 subtasks 链接成 tasks。每个 subtask 由一个线程执行。如下图中样例数据流用 5 个 subtask 执行,因此就有 5 个并行线程。

在这里插入图片描述
上图中,source + map 算子组成一个 subtask,并行度为 2,keyby + window + apply 算子组成一个 subtask,并行度为 2,sink 算子组成一个 subtask,并行度为 1。

3.算子链与 slot 共享资源组

前面提到 Flink 会将算子的 subtask 链接成 task,实际上就是通过算子链操作来实现的。将算子链接成 task 的好处:

  • ✅ 它减少线程间切换、缓冲的开销,并且减少延迟的同时增加整体吞吐量。
  • ✅ 链行为是可以配置的;将两个算子链接在一起能使得它们在同一个线程中执行,从而提升性能。

Flink 默认会将能链接的算子尽可能地进行链接(例如两个 map 转换操作)。 此外, Flink 还提供了对链接更细粒度控制的 API 以满足更多需求。

如果想对整个作业禁用算子链,可以调用 StreamExecutionEnvironment.disableOperatorChaining()。下列方法还提供了更细粒度的控制。需要注意的是, 这些方法只能在 DataStream 转换操作后才能被调用,因为它们只对前一次数据转换生效。例如,可以 someStream.map(...).startNewChain() 这样调用,而不能 someStream.startNewChain() 这样。

另外,一个 slot 共享资源组对应着 Flink 中的一个 slot 槽, 可以根据需要手动地将各个算子隔离到不同的 slot 中。

Transformation
Description
Start new chain以当前 operator 为起点开始新的连接。如下的两个 mapper 算子会链接在一起而 filter 算子则不会和第一个 mapper 算子进行链接。someStream.filter(...).map(...).startNewChain().map(...)
Disable chaining任何算子不能和当前算子进行链接。someStream.map(...).disableChaining()
Set slot sharing group配置算子的资源组。Flink 会将相同资源组的算子放置到同一个 slot 槽中执行,并将不同资源组的算子分配到不同的 slot 槽中,从而实现 slot 槽隔离。如果所有输入操作都在同一个资源组,资源组将从输入算子开始继承。Flink 默认的资源组名称为 default,算子可以显式调用 slotSharingGroup("default") 加入到这个资源组中 .someStream.filter(...).slotSharingGroup("name")

4.Task slots 与系统资源

每个 worker(TaskManager)都是一个 JVM 进程,可以在单独的线程中执行一个或多个 subtask。为了控制一个 TaskManager 中接受多少个 task,就有了所谓的 task slot(至少一个)。

每个 task slot 代表 TaskManager 中 资源的固定子集。例如,具有 3 个 slot 的 TaskManager,会将其托管内存 1 / 3 1/3 1/3 用于每个 slot。分配资源意味着 subtask 不会与其他作业的 subtask 竞争托管内存,而是具有一定数量的保留托管内存。注意此处没有 CPU 隔离;当前 slot 仅分离 task 的托管内存。

通过调整 task slot 的数量,用户可以定义 subtask 如何互相隔离。每个 TaskManager 有一个 slot,这意味着每个 task 组都在单独的 JVM 中运行(例如,可以在单独的容器中启动)。具有多个 slot 意味着更多 subtask 共享同一 JVM。同一 JVM 中的 task 共享 TCP 连接(通过多路复用)和心跳信息。它们还可以共享数据集和数据结构,从而减少了每个 task 的开销。

在这里插入图片描述
上边例子,从图所示 5 个 subtask 用 5 个 task slot 来执行,一定是这样分配的吗?

这个还真不一定,默认情况下,上边例子只需要 2 个 slot 就可以了。

在这里插入图片描述
我们再看另外一个例子,当我们把并行度调大为 6。

在这里插入图片描述
按照并行度拆开这个任务(task),我们发现会有 13 个 subtask,那么是不是就意味着需要 13 个 slot 才能执行该任务呢?

答案是否定的,实际是只需要 6 个 slot 就够了。

为什么会这样呢?我们来看两条规则:

  • 1️⃣ 默认情况下,Flink 允许子任务共享 slot,即使他们是不同任务的子任务。这样的结果就是一个 slot 可以保存作业的整个 pipeline
  • 2️⃣ Task Slot 是静态的概念,指的是 TaskManager 具有的并发执行能力。

在这里插入图片描述
实际上,第一个 slot 会运行 3 个 subtask,也就是执行 3 个线程。

前面也提到了 slot 只是做了内存隔离,并没有做 CPU 隔离,但是 CPU 资源是有限的,所以我们在设置资源参数时,需要考虑一下集群可提供的资源。

在这里插入图片描述
那么问题又来了,上面这个图中所示需要 5 个 task slot,但是默认情况下 Flink 会自动优化成为需要 2 个 slot,如果我们不想使用默认的 slot 个数来执行呢,那就要通过 slot 共享组来实现了。

DataStream<String> inputDataStream = env.socketTextStream(host, port);
DataStream<Tuple2<String, Integer>> resultStream = inputDataStream.flatMap(new WordCount.MyFlatMapper()).slotSharingGroup("green")
        .keyBy(0)
        .sum(1).setParallelism(2).slotSharingGroup("red");

resultStream.print().setParallelism(1);

这几行代码几个 subtask?并行度是多少?用几个 task slot

看一下以上代码运行时 Flink Web UI:

在这里插入图片描述
从 Web UI 界面可以看出,该任务被切分成了 5 个子 task,按照最大并行度算子来算,这个任务的并行度应该为 2,那么这 5 个 subtask 占用了几个 slot 呢?

通过设置 slotSharingGroup,是手动干预 slot 分配的手段之一,默认情况下,整个 StreamGraph 都会用一个默认的 default SlotSharingGroup,即所有的 task 都可以共用一个 slot

上面代码里,source 算子并没有显式分配 slot 共享组,所以它将被分在默认的 default 共享组里,而 flatMap 算子被显式指定到了 green 共享组里,聚合算子同样被显式指定到了 red 共享组里,那么最后的 sink 算子呢?注意,默认情况下,每一个算子会与其前一个算子保持在同一个共享组内,所以 sink 算子(也就是上边的打印算子)也会被分配在 red 共享组里,按照 slot 共享组进行分组,每个分组最大的并行度相加,就是这个任务所占用的总共 slot,所以应该是 4 个。

在这里插入图片描述

5.总结

通过上面几个例子,我们已经很清楚的理解这些概念了,总结以下几点:

  • 1️⃣ Flink 中 slot 是任务执行所申请资源的最小单元,同一个 TaskManager 上的所有 slot 都只是做了内存分离,并没有做 CPU 隔离。
  • 2️⃣ 每一个 TaskManager 都是一个 JVM 进程,如果某个 TaskManager 上只有一个 slot,这意味着每个 task 组都在单独的 JVM 中运行,如果有多个 slot 就意味着更多 subtask 共享同一 JVM。
  • 3️⃣ 一般情况下有多少个 subtask,就是有多少个并行线程,而并行执行的 subtask 要发布到不同的 slot 中去执行。
  • 4️⃣ Flink 默认会将能链接的算子尽可能地进行链接,也就是算子链,Flink 会将同一个算子链分组内的 subtask 都发到同一个 slot 去执行,也就是说一个 slot 可能要执行多个 subtask,即多个线程。
  • 5️⃣ Flink 可以根据需要手动地将各个算子隔离到不同的 slot 中。
  • 6️⃣ 一个任务所用的总共 slot 为所有资源隔离组所占用的 slot 之和,同一个资源隔离组内,按照算子的最大并行度来分配 slot

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1435501.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

爬虫工作量由小到大的思维转变---<第四十四章 Scrapyd 用gerapy管理多台机器爬虫>

前言: 之前讲过关于如何在gerapy中部署本地爬虫, 爬虫工作量由小到大的思维转变---&#xff1c;第三十四章 Scrapy 的部署scrapydGerapy&#xff1e;_gerapy如何登录-CSDN博客 爬虫工作量由小到大的思维转变---&#xff1c;第三十五章 Scrapy 的scrapydGerapy 部署爬虫项目&…

锦上添花!特征选择+深度学习:mRMR-CNN-BiGRU-Attention故障识别模型!特征按重要性排序!最大相关最小冗余!

适用平台&#xff1a;Matlab2023版及以上 特征选择方法&#xff1a;"最大相关最小冗余"&#xff08;Maximal Relevance and Minimal Redundancy&#xff0c;简称MRMR&#xff09;是一种用于特征选择的方法。该方法旨在找到最相关的特征集&#xff0c;同时最小化特征…

[UI5 常用控件] 06.Splitter,ResponsiveSplitter

文章目录 前言1. Splitter1.1 属性 2. ResponsiveSplitter 前言 本章节记录常用控件Splitter,ResponsiveSplitter。主要功能是分割画面布局。 其路径分别是&#xff1a; sap.ui.layout.Splittersap.ui.layout.ResponsiveSplitter 1. Splitter 1.1 属性 orientation &#x…

Meta开源大模型LLaMA2的部署使用

LLaMA2的部署使用 LLaMA2申请下载下载模型启动运行Llama2模型文本补全任务实现聊天任务LLaMA2编程Web UI操作 LLaMA2 申请下载 访问meta ai申请模型下载&#xff0c;注意有地区限制&#xff0c;建议选其他国家 申请后会收到邮件&#xff0c;内含一个下载URL地址&#xff0c;…

【python】绘制爱心图案

以下是一个简单的Python代码示例&#xff0c;它使用turtle模块绘制一个代表爱和情人节的心形图案。 首先&#xff0c;请确保计算机上安装了Python和turtle模块。然后&#xff0c;将以下代码保存到一个.py文件中&#xff0c;运行它就可以看到爱心图案的绘制过程。 import turt…

【ArcGIS微课1000例】0101:删除冗余节点或折点

文章目录 一、实验描述二、实验数据三、实验过程1. 手动删除2. 简化线工具四、注意事项一、实验描述 矢量数据获取通常来源于手动或者ArcScan自动采集,其基本存储方式就是记录每个要素的点坐标,如点要素就是一个坐标、线要素由多个点要素连接形成。当某段线要素被过多的节点…

【webpack】优化提升

webpack优化提升 安装webpack相关内容向下兼容游览器-babel/polyfill进一步优化babel/polyfill模块联邦-共享模块如何提升构建性能通用环境下1&#xff0c;webpack更新到最新版本2&#xff0c;将loader应用于最少数量的必要模块3&#xff0c;引导&#xff08;每个额外的loader/…

pr如何导出mp4格式视频?手把手教你

PR是一款强大的视频编辑软件&#xff0c;广泛应用于电影、电视制作以及各类创意视频项目。在完成编辑后&#xff0c;将项目导出为MP4格式视频是常见的需求&#xff0c;因为MP4是一种通用且高度兼容的视频格式&#xff0c;适用于多个平台和设备。pr如何导出mp4格式视频&#xff…

分享69个节日PPT,总有一款适合您

分享69个节日PPT&#xff0c;总有一款适合您 69个节日PPT下载链接&#xff1a;https://pan.baidu.com/s/1Y3tf2bStj595B2GD3v0dBQ?pwd8888 提取码&#xff1a;8888 Python采集代码下载链接&#xff1a;采集代码.zip - 蓝奏云 学习知识费力气&#xff0c;收集整理更不易。…

记录一下esp32模组固件开发流程

现在的esp32开发环境非常简单&#xff0c;参考如下&#xff1a; dl.espressif.cn/dl/esp-idf/ 在上面的链接中选择合适的版本进行安装&#xff0c;安装后环境自带源文件、编译连接工程脚本、图形化配置脚本、编译器、烧录调试工具。 这里我选择安装在C盘&#xff0c;C:\Espr…

Redis核心技术与实战【学习笔记】 - 17.Redis 缓存异常:缓存雪崩、击穿、穿透

概述 Redis 的缓存异常问题&#xff0c;除了数据不一致问题外&#xff0c;还会面临其他三个问题&#xff0c;分别是缓存雪崩、缓存击穿、缓存穿透。这三个问题&#xff0c;一旦发生&#xff0c;会导致大量的请求积压到数据库。若并发量很大&#xff0c;就会导致数据库宕机或故…

网络安全大赛

网络安全大赛 网络安全大赛的类型有很多&#xff0c;比赛类型也参差不齐&#xff0c;这里以国内的CTF网络安全大赛里面著名的的XCTF和强国杯来介绍&#xff0c;国外的话用DenCon CTF和Pwn2Own来举例 CTF CTF起源于1996年DEFCON全球黑客大会&#xff0c;以代替之前黑客们通过互相…

GUI编程..

1.GUI(Graphical User Interface 图形用户界面) 所谓GUI 指的是在计算机中采用图形方式展示用户的界面 在GUI之前采用的是字符界面 有了GUI之后 采用的则是图形界面 2.Java的GUI编程方案 常见的有四种 3.Swing 1.实现一个窗口 public class Main{public static void ma…

第二证券:北向资金连续第五日净流入,茅台、工行、五粮液等获加仓

沪指低收险守2700点关口&#xff0c;北向资金接连5日净流入。 2月5日&#xff0c;A股三大股指团体低开&#xff0c;三大股指均创阶段性新低后反弹&#xff0c;创业板指午后首先翻红且一度涨超3%&#xff0c;深成指和沪指也相继转涨。但商场做多情绪欠安&#xff0c;沪深股指重…

K8S之Namespace的介绍和使用

Namespace的理论和实操 Namespace理论说明Namespace实操创建、查看命名空间使用ResouceQuota 对Namespace做资源限额更多ResouceQuota 的使用 Namespace理论说明 命名空间定义 K8s支持多个虚拟集群&#xff0c;它们底层依赖于同一个物理集群。 这些虚拟集群被称为命名空间&…

深入理解Netty及核心组件使用—下

目录 ChannelHandler ChannelHandler 接口 ChannelInboundHandler 接口 ChannelHandler 的适配器 Handler 的共享和并发安全性 资源管理和 SimpleChannelInboundHandler Bootstrap ChannelInitializer ChannelOption ChannelHandler ChannelHandler 接口 从开发人员的…

国产工业三防平板丨加固手持平板丨国产化加固平板有何优势?

随着科技的不断发展&#xff0c;三防产品已经逐渐成为人们生活、工作和娱乐中必不可少的一部分。而国产三防平板产品也在不断崛起&#xff0c;逐渐获得了消费者的认可和喜爱。相较于国外的三防平板产品&#xff0c;国产三防平板产品在技术和价格等方面具有一定的优势&#xff0…

游戏服务器租赁多少钱1个月?一年费用

2024年更新腾讯云游戏联机服务器配置价格表&#xff0c;可用于搭建幻兽帕鲁、雾锁王国等游戏服务器&#xff0c;游戏服务器配置可选4核16G12M、8核32G22M、4核32G10M、16核64G35M、4核16G14M等配置&#xff0c;可以选择轻量应用服务器和云服务器CVM内存型MA3或标准型SA2实例&am…

转融通业务是什么?好处和弊端是什么?

转融通业务是指证券金融公司借入证券、筹得资金后&#xff0c;再转借给证券公司&#xff0c;为证券公司开展融资融券业务提供资金和证券来源&#xff0c;包括转融券业务和转融资业务两部分。从证券金融公司角度看&#xff0c;向证券公司提供资金和证券供其开展融资融券业务&…

*s是什么意思

&s是地址&#xff0c;*是指针&#xff0c;*&s是指指向&s地址的指针&#xff1b; j *&s 就是 j s的意思。 例如&#xff1a;readRawData( (char *)& rowCount, sizeof(qint16)); //读取文本流中的行数到rowCount、列数到colCount qint16 rowCount, col…