spark01-内存数据分区数量个数原理

spark01-内存数据分区数量个数原理

news2026/2/16 8:19:20

原始代码如下：

  val conf: SparkConf = new SparkConf().setMaster("local[*]").setAppName("wordcount")
    val sc=new SparkContext(conf)
    val rdd: RDD[Int] = sc.makeRDD(List(1,2,3,4)
    //将处理的数据保存分区文件
    rdd.saveAsTextFile("output2")
    sc.stop()

makeRDD方法可以传第二个参数，这个参数表是分区的数量

第二个参数可以不传递有默认值：defaultParallelism（默认的并行度）

默认的并行度调用的是backend.defaultParallelis()方法

TaskSchedulerImpl.scala

SchedulerBackend.scala

spark在默认情况下，从配置对象中获取配置参数 spark.default.parallelism

// 如果获取不到，那么使用totalCores属性，这个属性是当前运行环境的最大可用核数

按照代码举例，当没有设置parallelism参数时最后执行的结果如图

本人处理器

有个问题需要注意一下：

setMaster("local[*]") 使用的是所有的核数

setMaster("local")使用的是单核

总结：

//makeRDD方法可以传第二个参数，这个参数表是分区的数量

//第二个参数可以不传递有默认值：defaultParallelism（默认的并行度）

//默认的并行度调用的是backend.defaultParallelis()方法

// 最后调用scheduler.conf.getInt("spark.default.parallelism", totalCores)

// spark在默认情况下，从配置对象中获取配置参数 spark.default.parallelism

// 如果获取不到，那么使用totalCores属性，这个属性是当前运行环境的最大可用核数

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/341738.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

分布式数据库（ShardingSphere）

分布式数据库（ShardingSphere）

单库单表数据量过大导致的问题与应对传统的将数据集中存储至单一数据节点的解决方案，在容量、性能、可用性和运维成本这三方面已经难于满足互联网的海量数据场景。我们在单库单表数据量超过一定容量水位的情况下，索引树层级增加，磁盘 IO 也很…

阅读更多...

数据库(六): MySQL的主从复制和读写分离

数据库(六): MySQL的主从复制和读写分离

文章目录一、为什么要使用主从复制和读写分离二、主从复制的原理三、如何实现主从复制3.1 master配置3.2 slave配置3.3 测试主从复制四、读写分离五、缺点一、为什么要使用主从复制和读写分离注意到主从复制和读写分离一般是一起使用的。目的很简单，就是提高数据库…

阅读更多...

Python:路径之谜（DFS剪枝)

Python:路径之谜（DFS剪枝)

题目描述小张冒充 X 星球的骑士，进入了一个奇怪的城堡。城堡里边什么都没有，只有方形石头铺成的地面。假设城堡地面是 nn 个方格。如下图所示。按习俗，骑士要从西北角走到东南角。可以横向或纵向移动，但不能斜着走&#xf…

阅读更多...

Java类和对象超详细整理，适合新手入门

Java类和对象超详细整理，适合新手入门

目录一、驼峰命名法二、Java注释三、转义符四、Java程序它的基本结构是什么？ 五、Java中的类六、创建类七、定义main方法八、执行代码输出语句九、Java中的对象十、创建对象十一、类与对象的关系一、驼峰命名法包名：多单词组成所…

阅读更多...

常用类详解（二）StringBuffer

常用类详解（二）StringBuffer

StringBuffer类： 基本介绍： java.lang.StringBuffer代表可变的字符序列，可以对字符串内容进行增删很多方法与String相同，但StringBuffer是可变长度的。 StringBuffer是一个容器。我们进行查看StringBuffer，如下…

阅读更多...

fpga设计中如何防止信号被优化

fpga设计中如何防止信号被优化

本文分别对quartus和vivado防止信号被优化的方法进行介绍。为什么要防止信号被优化在FPGA开发调试阶段，经常遇到这样的情况，需要临时添加信号，观察信号变化，用来定位代码中存在的问题，很多时候这些临时添加的信…

阅读更多...

sg3_utils arm64 静态编译

sg3_utils arm64 静态编译

需求背景在进行ufs等scsi device测试时，需要进行power mode切换等测试，因此需要有一个简单地工具集来向scsi device（ufs接口）发送scsi命令，比如 scsi reset命令等。在网上调研后发现sg3_utils是一个比较全面的工具。…

阅读更多...

本地代码提交至gitee仓库

本地代码提交至gitee仓库

1、新建仓库新建一个私人访问的仓库 2、创建公钥点开cmd 输入ssh-keygen -t rsa -C "xxxxxxxxxx.com" 邮箱填入自己使用的即可。输入完毕后，连按三次enter。命令就会执行完毕，会出现这个界面此时已经代表ssh公钥已经创建完毕。公…

阅读更多...

自动驾驶TPM技术杂谈 ———— 摄像头标定

自动驾驶TPM技术杂谈 ———— 摄像头标定

文章目录介绍摄像头内参标定摄像头模型的建立摄像头坐标系与环境坐标系的转换图像坐标系与图像像素坐标系小孔成像与图像物理坐标系环境坐标系与图像像素坐标系的转换摄像头畸变矫正常见内参标定方法平面标定自标定摄像头间外参标定介绍标定传感器是自动驾驶感知系统中不可缺少…

阅读更多...

Springboot集成工作流Activity

Springboot集成工作流Activity

介绍官网：https://www.activiti.org/ 一、工作流介绍 1.工作流（workflow） 就是通过计算机对业务流程自动化执行管理，它主要解决的是“使在多个参与这之间按照某种预定义规则自动化进行传递文档、信息或任务的过程&#xff0c…

阅读更多...

儿童绘本馆图书借阅租赁知识付费小程序源码交流

儿童绘本馆图书借阅租赁知识付费小程序源码交流

1.分类图书 2.书单推荐 4.会员卡次、期限购买 5.借阅时间选择 6.积分签到 7.优惠Q领取前端uniapp开发后端thinkphp开发完全开源 <template> <view class"sp-section sp-index">  <view class&qu…

阅读更多...

【第30天】SQL进阶-查询优化- performance_schema系列实战五：查看最近的事务执行信息（SQL 小虚竹)

【第30天】SQL进阶-查询优化- performance_schema系列实战五：查看最近的事务执行信息（SQL 小虚竹)

回城传送–》《32天SQL筑基》文章目录零、前言一、查看最近的事务执行信息数据准备（如果已有数据可跳过此操作）开启第一个会话，配置启用事务事件开启第二个会话，用于执行事务，并模拟事务回滚第一个会话查询活跃事件第…

阅读更多...

详解无线技术标准都使用哪些频段？中国物联网市场又适用哪些频段

详解无线技术标准都使用哪些频段？中国物联网市场又适用哪些频段

由于各行各业都有各自的频段只应用需求，所以一般频段都是由国家来进行分配的。国家设立无线电管理机构，通过拍卖、定价的方法向企业、机构发放频段使用许可。获得许可的机构将会获得拍照。这也就是5G，4G时各运营商获得国家颁发牌照的由来。只…

阅读更多...

【QT】TCP通信（QTcpServer 和 QTcpSocket）

【QT】TCP通信（QTcpServer 和 QTcpSocket）

目录1. TCP通信概述2. QTcpServer2.1 公共函数2.2 信号2.3 保护函数3. QTcpSocket3.1 公共函数3.2 信号4. 代码示例4.1 服务器端MainWindow.hMainWindow.cpp4.2 客户端MainWindow.hMainWindow.cpp4.3 界面显示1. TCP通信概述 TCP是一种被大多数Internet网络协议（如…

阅读更多...

【设计模式】我终于读懂了代理模式。。。

【设计模式】我终于读懂了代理模式。。。

👦代理模式的基本介绍 1)代理模式：为一个对象提供一个替身，以控制对这个对象的访问。即通过代理对象访问目标对象,这样做的好处是:可以在目标对象实现的基础上,增强额外的功能操作,即扩展目标对象的功能。 2)被代理的对象可以是远程对象、创建…

阅读更多...

SharpImpersonation：一款基于令牌和Shellcode注入的用户模拟工具

SharpImpersonation：一款基于令牌和Shellcode注入的用户模拟工具

关于SharpImpersonation SharpImpersonation是一款功能强大的用户模拟工具，该工具基于令牌机制和Shellcode注入技术实现其功能，可以帮助广大研究人员更好地对组织内部的网络环境和系统安全进行分析和测试。该工具基于 Tokenvator的代码库实现其功能&a…

阅读更多...

webpack、vite、vue-cli、create-vue 的区别

webpack、vite、vue-cli、create-vue 的区别

webpack、vite、vue-cli、create-vue 的区别首先说结论 Rollup更适合打包库，webpack更适合打包项目应用，vite基于rollup实现了热更新也适合打包项目。功能工具工具脚手架vue-clicreate-vue构建项目vite打包代码webpackrollup 脚手架:用于初始化&#…

阅读更多...

icon-font的使用

先登录阿里巴巴图标矢量库官网iconfont-阿里巴巴矢量图标库在官网挑选需要的图标点击图标购物车并且点击下载代码下载好之后将文件夹里面的css，ttf文件放置到你的项目当中并且点击里面的html文件这里面有详细的用法，这里我是用的时font class方法‘方法二…

阅读更多...

【macOS】mac电脑M2芯片安装Homebrew 最简单的方法

【macOS】mac电脑M2芯片安装Homebrew 最简单的方法

一 Homebrew的安装打开终端，复制如下命令，按回车执行 M芯片和Intel芯片均可中途可能需要你手动输入密码，输入完成回车即可（密码不可见选择中科大或者清华镜像源 /bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/Hom…

阅读更多...

MyBatis案例 | 使用映射配置文件实现CRUD操作——修改数据

MyBatis案例 | 使用映射配置文件实现CRUD操作——修改数据

本专栏主要是记录学习完JavaSE后学习JavaWeb部分的一些知识点总结以及遇到的一些问题等，如果刚开始学习Java的小伙伴可以点击下方连接查看专栏本专栏地址：🔥JavaWeb Java入门篇： 🔥Java基础学习篇 Java进阶学习篇&…

阅读更多...

推荐文章

最新文章