PySpark--spark local 的环境部署

news2026/2/12 14:53:04

Spark环境搭建-Local

环境搭建

在这里插入图片描述

基本原理

本质：启动一个JVM Process进程(一个进程里面有多个线程)，执行任务Task

Local模式可以限制模拟Spark集群环境的线程数量, 即Local[N] 或 Local[*]
其中N代表可以使用N个线程，每个线程拥有一个cpu core。如果不指定N，则默认是1个线程（该线程有1个core）。通常Cpu有几个Core，就指定几个线程，最大化利用计算能力.
如果是local[*]，则代表 Run Spark locally with as many worker threads as
logical cores on your machine.按照Cpu最多的Cores设置线程数

在这里插入图片描述

Local 下的角色分布：

资源管理：

Master：Local进程本身
Worker：Local进程本身

任务执行：

Driver：Local进程本身
Executor：不存在，没有独立的Executor角色, 由Local进程(也就是Driver)内的线程提供计算能力

PS: Driver也算一种特殊的Executor, 只不过多数时候, 我们将Executor当做纯Worker对待, 这样和Driver好区分(一类是管理一类是工人)

注意: Local模式只能运行一个Spark程序, 如果执行多个Spark程序, 那就是由多个相互独立的Local进程在执行

spark-3.2.0-bin-hadoop3.2.tgz下载地址
https://dlcdn.apache.org/spark/spark-3.2.0/spark-3.2.0-bin-hadoop3.2.tgz

配置环境：

搭建操作, 可参考资料提供的部署文档:
https://gitee.com/tianyi6_6/PySpark/blob/master/Spark%E9%83%A8%E7%BD%B2%E6%96%87%E6%A1%A3.md#binspark-submit-pi

在这里插入图片描述

pyspark/spark-shell/spark-submit 对比

总结：

Local模式的运行原理?

Local模式就是以一个独立进程配合其内部线程来提供完成Spark运行时环境. Local模式可以通过spark-shell/pyspark/spark-submit等来开启

bin/pyspark是什么程序?

是一个交互式的解释器执行环境,环境启动后就得到了一个Local Spark环境,可以运行Python代码去进行Spark计算,类似Python自带解释器

Spark的4040端口是什么?

Spark的任务在运行后,会在Driver所在机器绑定到4040端口,提供当前任务的监控页面供查看

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/96796.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【使用Netty实现群发消息】

【使用Netty实现群发消息】

使用Netty实现群发消息netty简单介绍实现群发流程图代码实现NettyServer 类MyChannelInitializer 类MyServerHandler 类ChannelHandler 类Netty 依赖效果展示netAssist 工具启动Netty server打开netAssist 工具netty简单介绍 Netty是由JBOSS提供的一个java开源框架&#xff0c…

阅读更多...

第三十一章 linux-模块的加载过程

第三十一章 linux-模块的加载过程

第三十一章 linux-模块的加载过程文章目录第三十一章 linux-模块的加载过程sys_init_modulestruct moduleload_module在用户空间，用insmod这样的命令来向内核空间安装一个内核模块，本节将详细讨论模块加载时的内核行为。当调用“insmod demodev.ko”来安…

阅读更多...

通讯录的思路与实现（C语言)

通讯录的思路与实现（C语言)

目录前言程序的分装程序的结构函数实现通讯录的初始化通讯录的扩容将数据保存到本地增加联系人显示通讯录所有联系人目标联系人的检索(根据名称) 目标联系人的检索(根据号码) 检索发展来的函数删除联系人查询目标联系人联系人信息的更改按名称对通…

阅读更多...

Python写个“点球大战”小游戏

Python写个“点球大战”小游戏

大家好，欢迎来到 Crossin的编程教室 ！ 看过我Python入门教程的朋友应该会看到其中有提到一个点球小游戏的作业。在世界杯决赛即将到来之际，我们再来回顾一下这个小游戏。对于刚刚学习编程不久的同学，这是个不错的练手习题&…

阅读更多...

（二）RT-Thread入门——线程管理

（二）RT-Thread入门——线程管理

目录线程管理线程管理特点线程工作机制线程控制块线程属性线程栈线程状态线程优先级时间片线程入口函数无限循环模式顺序执行或有限次循环模式线程错误码线程状态切换线程操作创建动态线程删除初始化静态线程脱离获得当前线程让出…

阅读更多...

数据结构基础篇》》用c语言实现复数的八个基本运算

数据结构基础篇》》用c语言实现复数的八个基本运算

数据结构开讲啦！！！🎈🎈🎈 本专栏包括： 抽象数据类型线性表及其应用栈和队列及其应用串及其应用数组和广义表树、图及其应用存储管理、查找和排序将从简单的抽象数据类型出发，深入浅出…

阅读更多...

B-013 缓启动电路设计

B-013 缓启动电路设计

缓启动电路设计1 简介2 案例分析2.1 电路说明2.2 原理分析3 电路参数设定说明1 简介缓启电路的供电是由一个PMOS控制通断的，软启动的设计是让PMOS的导通时间变缓，电路上的做法是在PMOS的栅极和源极之间接一个合适的电容，PMOS的导通时间就会…

阅读更多...

Arcgis中创建Python脚本工具

Arcgis中创建Python脚本工具

文章目录创建工具步骤第一步：第二步：第三步：定义工具工具箱Toolbox工具类1、__init__2、getParameterInfo3、isLicensed4、updateParameters5、updateMessage6、execute进度条的使用代码相比于自定义工具箱的源脚本和参数定义难以集中管理的缺…

阅读更多...

你好，法语A1法语动词变位

你好，法语A1法语动词变位

动词变位表

阅读更多...

中国专利电子申请网站系统环境配置方法

中国专利电子申请网站系统环境配置方法

一、在线平台使用环境要求支持的操作系统、浏览器、office的版本如下，必须匹配对应的版本： 操作系统：WINDOWS XP、WINDOWS 7、WINDOWS 8 浏览器：IE8、IE9、IE10 文档编辑软件：OFFICE2003、OFFICE2007 强烈推荐使用中…

阅读更多...

1. Maven基础

1. Maven基础

1. Maven简介 Maven是专门用于管理和构建Java项目的工具，它的主要功能有： 提供了一套标准化的项目结构提供了一套标准化的构建流程（编译，测试，打包，发布……） 提供了一套依赖管理机制 1.1…

阅读更多...

Allegro快速编辑丝印文字操作指导

Allegro快速编辑丝印文字操作指导

Allegro快速编辑丝印文字操作指导 Allegro支持丝印文字的编辑，下面介绍快速编辑丝印文字的两种方法如下以编辑下方丝印文字为例方法一：选择Text edit 命令点击丝印文字，丝印会被高亮起来输入需要更改后的文字，如下右击选择done 文字被更改好了方法二选择se…

阅读更多...

Function composition

Function composition

In mathematics, function composition is an operation ∘ that takes two functions f and g, and produces a function h g ∘ f such that h(x) g(f(x)). In this operation, the function g is applied to the result of applying the function f to x. That is…

阅读更多...

van-uplaoder保存文件到后端，回显后端接口返回的数据

van-uplaoder保存文件到后端，回显后端接口返回的数据

实现功能：在移动端使用van-uploader组件上传图片，然后调用接口保存到后端数据库，提交保存信息成功后，调用另外的接口返回数据用来回显uploaded的文件，（一般正常的返回数据的接口是个图片地址，可…

阅读更多...

15 CPP函数重载

15 CPP函数重载

函数重载的细节： 1 使用重载函数时，如果数据类型不匹配，C尝试使用类型转换与形参进行匹配，如果转换后有多个函数能匹配上，编译将报错。 2 引用可以作为函数重载的条件，但是调用重载函数的时候&#xff0…

阅读更多...

javaSE - 认识字符串（String class），String类里面方法的使用，下半部分

javaSE - 认识字符串（String class），String类里面方法的使用，下半部分

一、字符, 字节与字符串 1.1、字符与字符串之间进行转换字符串内部包含一个字符数组，String 可以和 char[] 相互转换将整个字符数组转换成字符串 public static void main(String[] args) {char[] chars {a,b,c,d,e,f,g};String str new String(chars);Sys…

阅读更多...

Sulfo-NHS-SS-biotin，CAS：325143-98-4介绍，生物素双硫键琥珀酰亚胺

Sulfo-NHS-SS-biotin，CAS：325143-98-4介绍，生物素双硫键琥珀酰亚胺

英文名称：Sulfo-NHS-SS-biotin 化学式：C19H27N4NaO9S4 分子量：606.7 CAS：325143-98-4 纯度：95% 储存条件：-20C 结构式： 简介：磺基NHS SS生物素是一种可切割试剂，用…

阅读更多...

【剧前爆米花--爪哇岛寻宝】抽象类和接口（上）——理论及逻辑理解

【剧前爆米花--爪哇岛寻宝】抽象类和接口（上）——理论及逻辑理解

作者：困了电视剧专栏：《JavaSE语法与底层详解》文章分布：这是一篇关于抽象类和接口的文章，在本篇文章中我会介绍其相关的定义和语法，并且揭示接口和抽象类的运行逻辑，提高对面对象编程的理解。目录抽象…

阅读更多...

吴恩达week6 ~批量梯度下降指数加权平均动量梯度下降学习率衰减 Adam

吴恩达week6 ~批量梯度下降指数加权平均动量梯度下降学习率衰减 Adam

文章目录前言一、小批量梯度下降 mini-batch1、batch gradient descent2、stochastic gradient descent3、mini-batch gradient descent二、指数加权平均1.什么是指数加权平均2、理解指数加权平均3、与普通求平均值的区别4、指数加权平均的偏差修正三、gradient descent with m…

阅读更多...

Allegro批量替换过孔类型操作指导

Allegro批量替换过孔类型操作指导

Allegro批量替换过孔类型操作指导 Allegro支持批量替换过孔类型，具体操作如下例如需要把这些VIA10的过孔全部替换成VIA8的过孔选择菜单上面的Tool-padstack-Group edit 右击选择temp Group 选中需要替换的过孔选完之后右击选择complete 弹出Padstack Map窗口，modify…

阅读更多...

推荐文章

最新文章