Spark 平衡 CPU

news2026/3/25 10:17:48

Spark 平衡 CPU

CPU/内存平衡
CPU 低效
- 线程挂起
- 调度开销
优化 CPU

CPU/内存平衡

Spark 将内存分 :

Execution Memory : 用于分布式任务执行
Storage Memory : 用于 RDD 缓存
RDD 缓存展开前消耗 Execution Memory , 最后占用 Storage Memory

线程/执行内存关系：
执行内存抢占规则 : 在同个 Executor 有 N 个线程尝试抢占执行内存
抢占原则：

执行内存总大小 (M) = Execution Memory 初始大小 + Storage Memory 剩余空间
每个线程的可用内存的上下限，下限 : M/N/2，上限 : M/N

平衡 CPU/内存的 3 类配置参数 : 并行度、集群的并行计算能力、执行内存大小

并行度：分布式数据集的划分数

并行度越高，数据的粒度越细，数据分片越多，数据越分散

并行度的配置项 :

spark.default.parallelism : 设置 RDD 的默认并行度
spark.sql.shuffle.partitions : Spark SQL 指定 Shuffle Reduce 默认的并行度

并发度 : 同一时间内，一个 Executor 能同时运行的最大任务数量

spark.executor.cores ：Executor 的线程池大小
spark.task.cpus ：每个任务在运行时要消耗的线程数
并发度 = Executor 的线程池大小/ 每个任务运行时的线程数
spark.task.cpus 默认为 1，并发度默认为 spark.executor.cores

Executor 线程池：线程可以复用，但同一时间中，每个线程只能计算一个任务

每个任务负责处理一个数据分片
在运行时，线程、任务、分区是一一对应的关系

执行内存大小：

堆内执行内存的初始值：spark.executor.memory * spark.memory.fraction * (1 - spark.memory.storageFraction)
堆外执行内存：spark.memory.offHeap.size * (1 - spark.memory.storageFraction)

CPU 低效

线程挂起

线程挂起的原因 :

动态变化的执行内存总量 M
动态变化的并发度 N~
分布式数据集的数据分布

动态变化的执行内存总量 M :

下限： Execution Memory 初始值
上限： spark.executor.memory * spark.memory.fraction
上限会随着 Storage Memory 增加，而减少

线程总数 (N) 是固定 :

Executor 最大并发度 (N) : spark.executor.cores/spark.task.cpus
Executor 当前并发度 (N~) : Executor 中当前并行执行的任务数 ( N~ <= N )

数据分片的数据量决定了任务要申请多少内存

当分布式数据集的并行度设置好，线程挂起也就解决

调度开销

并行度设到最大，每个数据分片足够小，小到每个 CPU 线程都能申请到内存

数据分散的副作用：调度开销骤增

优化 CPU

定 Executor 线程池和执行内存大小的算法：

一个数据分片大小在（M/N/2, M/N）之间的并行度

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/393214.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Spark 平衡 CPU

Spark 平衡 CPU

CPU/内存平衡

CPU 低效

线程挂起

调度开销

优化 CPU

相关文章

Eclipse快捷键，IDEA中使用Eclipse快捷键

《数据解构》HashMap源码解读

C语言——文件操作

拼多多的赶超让京东感受到压力，如今才发起百亿补贴可能晚了

GitLab创建仓库分配权限

ASEMI高压MOS管7N60参数，7N60封装，7N60规格

如何规避近年频发的数据安全事故？浅谈 SaaS 数据安全之路

零基础如何学习Web 安全，如何让普通人快速入门网络安全？

代码随想录-50-222. 完全二叉树的节点个数

基础复习第二十四天网络编程

基于React Hooks的简单全局状态共享实现方案

containerd启动过程

throw语句以及throw “error“ 和 throw new Error(“error“)的区别

AOP的另类用法 (权限校验自定义注解)

磁盘存储和文件系统管理

maven的安装配置

XGboost部分细节补充

模式识别 —— 第二章参数估计

【Git】P1 Git 基础

华为OD机试题，用 Java 解【数据分类】问题