Spark3每个job之间任务间隔过长

news2026/2/12 4:36:45

公司的跑批引擎从impala改成Spark3已经有一个多月了。
不得不说，跑批稳定了好多。资源控制有相对稳定了很多。Spark3比CDH的hive on spark2.4.0要快不少。AQE和CBO真的挺强的。但是使用中发现了一个很奇怪的事情。这个问题在网上搜过，并没有实际解决。

当然我的这个帖子只是记录问题以及解决问题，具体原理没有深挖(太忙了没时间深挖)。

我这边有个很简单的SQL。

我有7个表 A,B,C,D,E,F,G

每个表的分区是省会，比如河南、吉林、北京...等等

select * from 
A LEFT JOIN B
ON A.id=B.id and A.region=B.region
LEFT JOIN C
ON B.id=C.id and B.region=C.region
........

很简单的SQL，正常来(忽略数据量)说应该很快执行完。但是执行的时候却发现

每个job执行都很快，但是每个job执行完，会间隔好几分钟。再执行下一个。

因为网络原因，没办法看到详细 stage的log日志。这可难为坏我了。

查看执行计划太长了。实在是看不下去。

全部任务执行下来跑了俩多小时。

实在无奈，先看看如何优化吧。调整参数AQE啊啥的。没效果。

那么只能从SQL上进行优化了。这时候又犯了难了。这丫的也不算数据倾斜啊。

然后按照正常的思路进行异常排查。发现了问题

我有15个省会大区。

当我执行

select * from A where region in('henan','beijing'....各大区)
left join B
.....

他就不会出现每个job之间的间隔。

因为可能未来涉及到增加省会大区。我直接改成

select * from A where region <> 1
left join B
.....

逻辑上执行效果和指定省会大区一样的。

最终优化后的SQL，从执行两个半小时，变成了5分钟跑完。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/358716.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Spark3每个job之间任务间隔过长

相关文章

【机器学习】决策树-ID3算法

CANopen概念总结、心得体会

拳打DALL-E 2脚踢Imagen，谷歌最新Muse模型刷新文本图像合成排行榜

网络计划--时间参数的计算和优化

基于Hive的河北新冠确诊人数分析系统的设计与实现

通过官网怎么查找联盟申请链接

第三届无线通信AI大赛分享交流会暨颁奖典礼顺利举办，大赛圆满收官

将二进制文件作为目标文件中的一个段

Vue3搭建记录

【C#】async关键字修饰后有无await的影响

RK3568工业开发板工控板说明

记录使用ROS驱动USB相机

OpenGL学习日记之光照计算

27 pandas 数据透视

【1】linux命令每日分享——mkdir

【Spring】难理解的Aop编程 | 入门？

XXL-JOB分布式任务调度框架(三)-集群部署

wav2vec 2.0：一种自监督的语音识别方法

踔厉奋发·勇毅前行 | 2023广和通中国区代理商大会成功召开

云原生周刊 | 2023 年热门：云 IDE、Web Assembly 和 SBOM | 2023-02-20