深入理解ForkJoin

news2024/9/22 5:43:29

任务类型

线程池执行的任务可以分为两种:CPU密集型任务和IO密集型任务。在实际的业务场景中,我们需要根据任务的类型来选择对应的策略,最终达到充分并合理地使用CPU和内存等资源,最大限度地提高程序性能的目的。

CPU密集型任务

CPU密集型任务也称为计算密集型任务,包括加密、解密、压缩和计算等一系列需要大量耗费CPU资源的任务。对于CPU密集型的任务,并不是设置越多的线程性能越高,其最佳核心数是逻辑CPU核心数的1~2倍。因为对于计算任务较重的任务,CPU的每个核心基本都是满负荷的,设置更多的线程不仅不会提升性能,反而由于线程之间对CPU资源的争抢造成不必要的上下文切换导致性能下降。

IO密集型任务

IO密集型任务的特点是不会特别消耗CPU资源,但IO操作比较耗时,导致总体占用较多时间,数据库读写、文件读写、网络通信等任务都属于IO密集型任务。对于IO密集型任务,一般会将最大线程数设置为CPU核心数很多倍。IO读写速度相比于CPU计算的速度要慢很多,如果设置的线程数较少,线程可能都在处理IO操作,导致CPU资源的浪费。如果设置较多的线程数,当一部分线程在等待IO的时候,这部分线程不需要CPU资源,其他的线程就可以利用CPU资源去执行其他任务。

线程数计算方法

可以通过下面的公式计算出一个合理的线程数量。

线程数 = CPU核心数 × (1 + 任务平均等待时间/CPU平均工作时间)

可以看出线程数与任务平均等待时间成正比,任务的平均等待时间越长,线程数就越多;与CPU平均工作时间成反比,CPU平均工作时间越长,线程数就越少。例如CPU密集型任务的特点是CPU平均工作时间较长,而任务的平均等待时间较短,因此此类型所需的线程数较少;IO密集型任务的特点是任务平均等待时间较长,CPU平均工作时间较短,因此此类型所需的线程数较多。

分治算法

分治算法的基本思想是将一个规模较大的问题分解为多个规模较小的子问题,这些子问题之间相互独立且与原问题的性质相同。将所有子问题的解求出来,原问题的解也就求出来了。

分治算法的步骤如下:

  1. 分解:将要解决的问题划分成若干规模较小的同类子问题;
  2. 求解:当子问题划分得足够小时,可以用很简单的方式计算出子问题的解;
  3. 合并:将子问题的解逐层合并,最终得到原问题的解。

以上过程可以表示如下图:

ForkJoin框架

传统的线程池ThreadPoolExecutor有以下两个缺点:

  • 无法对大任务进行拆分,即只能由单个线程去完成某项任务;
  • 工作线程从队列中获取任务时存在竞争。

为了解决以上问题,JDK1.7引入了ForkJoin框架。ForkJoin框架允许其他线程向其提交任务,并将任务拆分成粒度更细的子任务,这些子任务由ForkJoin框架内部的工作线程来并行执行,并且这些工作线程之间可以互相窃取任务执行。

主要API

ForkJoin框架主要包含两部分:

  1. 分治任务的线程池ForkJoinPool类;
  2. 分治任务ForkJoinTask类。

ForkJoinPool

ForkJoinPool是用于执行ForkJoinTask任务的执行池,继承了AbstractExecutorService类。ForkJoinPool的构造函数有多个,此处我们介绍其中参数最全的一个,其实现如下:

public ForkJoinPool(int parallelism,
                    ForkJoinWorkerThreadFactory factory,
                    UncaughtExceptionHandler handler,
                    boolean asyncMode) {
    this(checkParallelism(parallelism),
         checkFactory(factory),
         handler,
         asyncMode ? FIFO_QUEUE : LIFO_QUEUE,
         "ForkJoinPool-" + nextPoolId() + "-worker-");
    checkPermission();
}
  • parallelism:表示指令的并行级别,ForkJoinPool将根据这个值来决定工作线程的数量,默认使用Runtime.getRuntime().availableProcessors()来设置;
  • factory:ForkJoinPool内部创建线程使用的线程工厂,需要注意的是,此处的线程工厂的类型是ForkJoinWorkerThreadFactory而不是ThreadFactory,默认使用DefaultForkJoinWorkerThreadFactory;
  • handler:异常处理器,主要用于处理任务运行中出现的异常;
  • asyncMode:队列的工作模式,为true时使用先进先出模式,为false时使用先进后出模式。

ForkJoinPool提交任务的方法主要有以下几种:

  • execute():在提交任务后不会返回结果,支持ForkJoinTask类型和Runnable两种类型的任务;
public void execute(ForkJoinTask<?> task);
public void execute(Runnable task);
  • invoke():在任务执行结束后返回泛型执行结果,支持ForkJoinTask类型的任务;
public <T> T invoke(ForkJoinTask<T> task);
  • submit():在提交任务后返回ForkJoinTask类型的结果,如果任务不能按计划执行则抛出任务拒绝异常,支持ForkJoinTask类型、Callable类型和Runnable类型的任务。
public <T> ForkJoinTask<T> submit(Callable<T> task);
public <T> ForkJoinTask<T> submit(Runnable task, T result);
public ForkJoinTask<?> submit(Runnable task);

ForkJoinTask

ForkJoinTask是ForkJoinPoll的核心之一,是任务的实际载体,定义了任务执行时的具体逻辑和任务拆分逻辑。ForkJoinTask是一个抽象类,实现了Future接口,因此也可以将其看成轻量级的Future。

ForkJoinTask的核心方法主要有以下两个:

  • fork():用于向当前任务所运行的线程池中提交任务,如果当前线程是ForkJoinWorkThread类型(即ForkJoinPool内部工作线程),则将任务放入该线程的工作队列,否则放入common线程池的工作队列;
  • join():用于获取任务的执行结果,调用此方法时将阻塞当前线程直到对应的子任务完成运行并返回结果。

ForkJoinTask提供了以下三个子类,在实际使用时可以根据需要继承这三个子类即可。

  • RecursiveAction:用于递归执行但不需要返回结果的任务;
  • RecursiveTask:用于递归执行且需要返回结果的任务;
  • CountedCompleter<T>:在任务完成后会触发执行一个自定义的钩子方法。

WorkQueue

WorkQueue是ForkJoinPool的静态内部类,主要用来表示一个工作队列,是基于一个ForkJoinTask类型的数组实现的双端队列。WorkQueue的几个较重要的成员变量如下:

//在对该WorkQueue操作时搭配CAS加锁
volatile int qlock;
//数组的底端,工作窃取时从此处取出任务执行
volatile int base;
//任务数组,用于保存当前工作队列的所有任务
ForkJoinTask<?>[] array;
//当前工作队列的ForkJoinWorkerThread类型的工作线程,如果是外部提交生成的工作队列这个属性为null
final ForkJoinWorkerThread owner;

ForkJoinPool内部维护了一个WorkQueue工作队列数组,当我们调用invoke()或submit()方法提交一个任务时,ForkJoinPool根据某个路由规则将该任务放到一个工作队列中,如果任务在执行过程中会创建出子任务,则子任务会提交到工作线程对应的工作队列中。

工作队列WorkQueue是ForkJoinPool类的一个内部类,是一个双端队列。如果是ForkJoinPool内部划分的任务,在WorkQueue数组中的下标是奇数位;如果是外部提交的任务,在WorkQueue数组中的下标是偶数位。

每个工作线程在处理自己的工作队列时采用的是FILO先进后出的方式,即在运行中产生新的任务时,会将其放到工作队列的尾端;在需要执行新的任务时,同样在工作队列的尾端取任务。工作线程处理自己的工作队列的同时,还可以窃取其他工作线程的任务,为了降低冲突的发生,窃取的位置在工作队列的首端。

ForkJoinWorkerThread

ForkJoinWorkerThread是ForkJoinPool中用于执行任务的线程,并且是ForkJoinPool内部专门为执行划分的子任务创建的工作线程。每个ForkJoinWorkerThread都有其对应的一个WorkQueue,这个关系由WorkQueue的一个owner属性来维护,并且这种WorkQueue在ForkJoinPool的WorkQueue数组中的下标一定是奇数位。

工作窃取

工作窃取指的是允许空闲线程从繁忙线程的工作队列中窃取任务。一般情况下,工作线程是从它自己对应的工作队列(WorkQueue数组)的头部获取任务执行,但当它的工作队列为空时会从其他繁忙的工作线程的工作队列的尾部窃取任务来执行。工作窃取是ForkJoinPool的性能保证的关键之一。

工作窃取算法的优点是充分利用线程资源来执行任务,但在某些情况下工作窃取的设计会发生线程竞争问题,例如当双端队列只有一个任务。

工作窃取时会从其他工作线程的尾部窃取任务,主要有以下原因:

  • 尽量降低线程竞争的可能,因为工作线程从自己的工作队列获取任务是在头部,工作窃取在尾部;
  • 由于任务是可分割的,队列中较旧的任务的粒度可能相对较大,空闲的工作线程更适合处理这些任务。

ForkJoinPool使用

ForkJoin框架是基于分治算法实现的,并且其主要特点是可以实现任务切分,因此它的使用也与其他基于分治算法的实现类似。

ForkJoinPool执行流程

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/909162.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【快速解决方案】浏览器的安全策略不允许通过 file:// 协议直接加载外部文件(最省事的方法)

目录 问题摘要 解决办法 检验结果 问题摘要 Failed to load resource: net::ERR_FILE_NOT_FOUND&#x1f308; Cute Code Editor &#x1f308;.html:162 Fetch API cannot load file:///D:/%E6%A1%8C%E9%9D%A2/%E4%B8%83%E5%A4%95%E5%BF%AB%E4%B9%90/index.txt. URL scheme …

RK3399平台开发系列讲解(内核调试篇)内核中内存泄漏的调试

🚀返回专栏总目录 文章目录 一、Linux 内核内存泄漏二、如何观测内核内存泄漏?三、kmemleak 工具沉淀、分享、成长,让自己和他人都能有所收获!😄 📢 内核内存泄漏往往都会是很严重的问题,那么,我们该如何判断内存泄漏是否是内核导致的呢? 一、Linux 内核内存泄漏 …

003-Nacos 2.1.x 注册实例源码分析

目录 Nacos 2.1.X注册实例入口接口流程Client 注册 事件处理 服务订阅入口 Nacos 2.1.X 注册实例 入口 com.alibaba.nacos.naming.remote.rpc.handler.InstanceRequestHandler#handleService service Service.newService(request.getNamespace(), request.getGroupName(), r…

计算机网络————IP数据报的首部各字段详解(很重要)

目录 1. IP数据报的介绍2. 首部的固定部分的各字段说明2.1 Version&#xff08;版本&#xff09;2.2 IHL&#xff08;首部长度&#xff09;2.3 Type of service&#xff08;区分服务&#xff09;2.4 Total Length&#xff08;总长度&#xff09;2.5 Identification&#xff08;…

企业级即时通讯协作和移动应用管理平台哪个品牌好?

在竞争激烈的商业环境下&#xff0c;高效的企业通讯和协作变得至关重要。WorkPlus作为领先的品牌&#xff0c;专注于提供企业级即时通讯协作和移动应用管理平台。本文将介绍WorkPlus如何成为企业实现协同工作、高效沟通和流程管理的理想解决方案。 一、全面协作加速工作流程&am…

二、1.保护模式

访问外部硬件有两个方式&#xff1a; 将某个外设的内存映射到一定范围的地址空间中&#xff0c; CPU 通过地址总线访问该内存区域时会落到外设 的内存中&#xff0c;这种映射让 CPU 访问外设的内存就如同访问主板上的物理内存一样外设是通过 IO 接口与 CPU 通信的&#xff0c;…

BDA初级分析——民宿投资决策影响因素分析

实战作业: 民宿投资决策影响因素分析如今&#xff0c;出门旅行住民宿已经不是一个新鲜话题&#xff0c;而且民宿品牌也是层出不穷.作为一名旅行服务业的数据分析师&#xff0c;我们以Airbnb北京的民宿为例&#xff0c;对其进行数据分析&#xff0c;探索什么类型的民宿价格更高?…

Eltima USB Network Gate 10.0 Crack

USB Network Gate -通过网络共享USB 设备 USB Network Gate (前身为以太网USB控制器USB) 轻松的通过网络(Internet/LAN/WAN)分享您的一个或者多个连接到您计算机的USB设备。 无论您身处异国还是近在隔壁办公室&#xff0c;您都可以轻松使用远程扫描仪、打印机、摄像头、调制解…

从零构建深度学习推理框架-9 再探Tensor类,算子输入输出的分配

再探Tensor类&#xff1a; 第二节中我们编写的Tensor类其实并不能满足我们的使用需要&#xff0c;我们将在这一节以代码阅读的方式来看看一个完全版本的Tensor应该具备怎样的要素&#xff0c;同时我们对Tensor类的分析来看看在C中一个设计好的类应该是怎么样的。 Tensor<fl…

K8s学习笔记3

Kubernetes功能&#xff1a; Kubernetes是一个轻便的可扩展的开源平台&#xff0c;用于管理容器化应用和服务。通过Kubernetes能够进行应用的自动化部署和扩缩容。在Kubernetes中&#xff0c;会将组成应用的容器组合成一个逻辑单元以更易管理和发现。Kubernetes积累了作为Goog…

打怪升级之从零开始的网络协议

序言 三个多月过去了&#xff0c;我又来写博客了&#xff0c;这一次从零开始学习网络协议。 总的来说&#xff0c;计算机网络很像现实生活中的快递网络&#xff0c;其最核心的目标&#xff0c;就是把一个包裹&#xff08;信息&#xff09;从A点发送到B点去。下面是一些共同的…

面试-快速学习计算机网络-UDP/TCP

1. OSI四层和七层映射 区别&#xff1a; 应用层&#xff0c;表示层&#xff0c;会话层合并为了应用层数据链路层和物理层合并为了网络接口层 2. TCP和UDP的区别&#xff1f; 总结&#xff1a; 1 . TCP 向上层提供面向连接的可靠服务 &#xff0c;UDP 向上层提供无连接不可靠服…

验证二叉搜索树

给你一个二叉树的根节点 root &#xff0c;判断其是否是一个有效的二叉搜索树。 有效 二叉搜索树定义如下&#xff1a; 节点的左子树只包含 小于 当前节点的数。节点的右子树只包含 大于 当前节点的数。 所有左子树和右子树自身必须也是二叉搜索树。 示例 1&#xff1a; 输…

8.21summary

计划部分完成&#xff0c;复习暂未完成

Linux环境下交叉编译环境安装、编译和运行

Win11主机上安装虚拟机&#xff0c;虚拟机内运行Ubuntu20.04&#xff0c;为了能够在本地电脑&#xff08;Win11&#xff09;上开发测试软件和算法&#xff0c;最终将编译好的可执行文件拷贝到Linux板上&#xff08;Rk3288上运行linux系统&#xff09;运行&#xff0c;因此需要安…

【QML】鼠标放在控件上颜色改变的效果实现

最近刚好要用到一个功能&#xff0c;在qml上实现鼠标放上去&#xff0c;控件的颜色改变&#xff0c;鼠标移走&#xff0c;控件颜色恢复。第一反应是这个功能非常简单&#xff0c;但是搞了一会儿都没实现&#xff0c;最后发现MouseArea其实提供了一个很简便的方法来提供使用&…

马蹄集 第九次oj赛

目录 MT2188单条件和 8421码 余3码 永恒之2 新十六进制 人脑计算机 二进制&#xff1f;不同&#xff01; 三进制计算机1 三进制计算机2 excel的烦恼 MT2188单条件和 号难度&#xff1a;黄金© 时间限制&#xff1a;1秒 巴占用内存&#xff1a;128M ★收藏△报错 “单…

MemSeg:一种差异和共性来检测图像表面缺陷的半监督方法

目录 1、摘要 2、Method 2.1 模拟异常样本 2.2 Memory Module 2.3 空间注意模块 2.4 多尺度特征融合模块 2.5 损失函数设置 2.6 Decoder模块 1、摘要 本文认为人为创建类内差异和保持类内共性可以帮助模型实现更好的缺陷检测能力&#xff0c;从而更好地区分非正常图像。如…

蓝蓝设计UI设计公司-界面设计与开发案例

天津航天中为项目 中国南方电网十二个软件交互优化和界面设计 图标设计 | 交互设计 | 界面设计 天津航天中为数据系统科技有限公司是航天503所控股的专业化公司&#xff0c;坐落于天津滨海新区航天技术产业园&#xff0c;是航天五院家入住天津未来科技城的军民融合型企业&…

el-tree组件图标的自定义

饿了么树形组件的图标自定义 默认样式: 可以看到el-tree组件左侧自带展开与收起图标,咱们可以把它隐藏:: .groupList {::v-deep .el-tree-node { .el-icon-caret-right {display: none;} } } 我的全部代码 <div class"groupList"><el…