大数据之Spark部署模式

news2026/2/13 21:37:24

文章目录

前言
一、Spark的部署模式
- （一）Client模式
- - 1. Standalone集群下的Client模式
  - 2. Spark On Yarn集群下的Client模式
- （二）Cluster模式
- - 1. Standalone集群下的Cluster模式
  - 2. Spark On Yarn集群下的Cluster模式
总结

前言

#博学谷IT学习技术支持#
上篇文章介绍了PySpark的入门案例，大致了解了Spark的开发流程，本次继续探讨Spark的两种部署模式，Client模式和Cluster模式，让我们继续往下看。

一、Spark的部署模式

在Spark中，我们编写的代码成为Driver程序，Client模式和Cluster模式的区别在于Driver程序在哪里运行，Client模式时，Driver程序在提交任务的机器上运行，而Cluster模式则是将Driver提交到集群中运行。
Client和Cluster两种模式又分别存在于Standalone集群和Spark On Yarn集群，详情如下：

（一）Client模式

1. Standalone集群下的Client模式

Driver Program是一个JVM Process进程，该模式下，Driver程序运行在提交任务的主机上

在这里插入图片描述

2. Spark On Yarn集群下的Client模式

Spark On Yarn集群的Client模式与Standalone集群的Client模式相同，该模式下，Driver程序也是运行在提交任务的主机上
在这里插入图片描述

（二）Cluster模式

1. Standalone集群下的Cluster模式

Cluster模式时，Driver程序运行在集群从节点的任意一台Worker机器上
在这里插入图片描述

2. Spark On Yarn集群下的Cluster模式

该模式下，Driver程序运行在Yarn集群从节点的某一台机器上
在这里插入图片描述
开发环境下，部署模式一般设定为Client模式，而生产模式大多数都是设置为Cluster模式。

总结

Client模式与Cluster模式最主要的区别在于Driver程序运行在哪里，两种模式各有优缺点：
（1）Client模式下与集群的通信费用较高，但是执行结果可以显示在客户端，
（2）Cluster模式Driver运行在集群中，与集群的通信费用较低，但是执行结果不能显示在客户端，只能通过日志获取，由于该模式下，Driver程序由Yarn集群管理，如果运行过程中出现问题，Yarn集群会重启Driver程序。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/421658.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

c++头文件、namespace 的理解、#include、编译模式

c++头文件、namespace 的理解、#include、编译模式

namespace C 命名空间 | 菜鸟教程 C命名空间（名字空间）详解作用：多写在头文件中，用于多个头文件的变量函数出现重命名。 namespace中可以定义变量，函数，类等等，也可以写声明，来…

阅读更多...

牛客网 HJ28 素数伴侣【二分图匹配,匈牙利算法】困难

牛客网 HJ28 素数伴侣【二分图匹配,匈牙利算法】困难

描述若两个正整数的和为素数，则这两个正整数称之为“素数伴侣”，如2和5、6和13，它们能应用于通信加密。现在密码学会请你设计一个程序，从已有的 N （ N 为偶数）个正整数中挑选出若干对组成“素数伴侣”&am…

阅读更多...

一种用于水位量测的浮子水位计

一种用于水位量测的浮子水位计

简介浮子式水位传感器（带水位显示）是集机、电技术于一体的数字化传感器。通过输出轴的角度位移量转换成相应的数字量，可以高精度测量被测液位高度，能确认准确位置。具有断电记忆功能。其工作原理就是：水位传感器测轮…

阅读更多...

二叉搜索树(BSTree)

二叉搜索树(BSTree)

目录一、二叉搜索树二、二叉搜索树的接口及实现 1、二叉搜索树的查找 2、二叉搜索树的插入 3、二叉搜索树的删除三、二叉搜索树的递归版本本期博客主要分享二叉搜索树的底层实现。(主要是笔记，供自己复习使用😂) 一、二叉搜索树二叉搜索树(B…

阅读更多...

Github创建组织(organization)

Github创建组织(organization)

目录前言 Github上创建组织的详细步骤前言创建 Github 组织（Organization）可以让你和你的团队共享代码，更好地管理和协作开发项目。Github 组织（Organization）是一个非常有用的工具，可以让开发者协同…

阅读更多...

stm32cubemx IAP升级（一）

stm32cubemx IAP升级（一）

stm32cubemx IAP升级- Bootloader的制作板卡：Nucleo-L412 平台：macbook pro 工具：vscode stm32cubemx stm32cubeProgramer cmake toolchain 分区 L412 自带128K的flash，所以我们可以这样分区， printf(“| flash pr…

阅读更多...

crypto-js AES-CTR 实现密文前缀式局部解密细节踩坑点

crypto-js AES-CTR 实现密文前缀式局部解密细节踩坑点

项目有需求，长明文经过AES-CTR模式加密后，在解密的时候，密文不能直接得到，每次通过某些方法尝试后，只能得到一块密文（按顺序），所以只能一块一块的拼接解密。在使用crypto-js这个库的…

阅读更多...

WooCommerce可扩展性：如何扩大您的WooCommerce商店

WooCommerce可扩展性：如何扩大您的WooCommerce商店

有了合适的人和技术，WooCommerce可扩展性绝对是很大的！ 事实上，使用WooCommerce作为您的电子商务平台，您的在线商店的规模可以与您的目标和愿望一样大！ 根据自定义模板开发高性能品牌电子商务网站全球超500万个电商…

阅读更多...

高效办公——Excel表格-02篇（if函数常见用法 + 条件格式的使用）

高效办公——Excel表格-02篇（if函数常见用法 + 条件格式的使用）

高效办公——Excel表格-02篇（if函数常见用法条件格式的使用）1. if单条件简单用法1.1 简单需求1.2 实现方法2. if多条件使用(if-else的情况)3. if多条件使用(if(A && B)的情况)3.1 简单需求3.2 实现需求4. if多条件使用(if(A || B)的情况)5. 条…

阅读更多...

亚马逊云科技“三步走”，实现区块链应用的快速开发

亚马逊云科技“三步走”，实现区块链应用的快速开发

作为数字技术的代表之一，区块链技术正在被越来越多的企业所重视，并被引入到各行业的数字化转型中。根据中国通信院数据显示，目前中国区块链应用场景主要以金融和互联网为主，但应用范围呈现不断拓展的态势，政务数据共享…

阅读更多...

day10_oop

day10_oop

今日内容零、复习昨日一、面向对象的概念二、面向对象编程三、内存图零、复习昨日晨考复习… 一、作业 package com.qf.homework;import java.util.Arrays;/*** --- 天道酬勤 ---** author QiuShiju* desc* ----------------* 引用数据类型的默认初始值null*/ public …

阅读更多...

Nginx 正向代理、方向代理、端口转发

Nginx 正向代理、方向代理、端口转发

正向代理就是客户端代理，代理客户端，服务端不知道实际发起请求的客户端正向代理中，proxy和client一般同一个lan或者网络可达，server与client一般不可达（缓存场景除外） 正向代理类似一个跳板机&#xff0c…

阅读更多...

下一个“AI王炸”，别只盯着OpenAI，DeepMind也在憋大招

下一个“AI王炸”，别只盯着OpenAI，DeepMind也在憋大招

过去几个月，OpenAI风头无两，各大科技公司争先恐后地跟进大语言模型（LLM）这一技术路线。对比之下，OpenAI的老对手DeepMind，显得有些低调和沉默。微软靠OpenAI打了一场胜仗，而谷歌推出的Bard翻了…

阅读更多...

【c++初阶】命名空间的定义

【c++初阶】命名空间的定义

命名空间的定义一.缺陷二.namespace和::三.访问namespace四.一些注意1.工程里标准库的展开2.命名域的小技巧一.缺陷在c语言中，如果我们同时定义一个全局变量和一个局部变量并且使用同一个名称的话，是可以编过的（因为全局和局部是属于两个不同…

阅读更多...

云原生_kubernetes(k8s)_pod介绍以及配置信息说明

云原生_kubernetes(k8s)_pod介绍以及配置信息说明

目录一、Pod介绍 1、Pod结构 2、Pod定义二、Pod配置 1、基本配置 2、镜像拉取 3、启动命令 4、环境变量 5、端口设置 6、资源配额一、Pod介绍 1、Pod结构每个Pod中都可以包含一个或者多个容器，这些容器可以分为两类： 用户程序所在的容器&…

阅读更多...

网络编程(第二章: TCPUDP基础模型)

网络编程(第二章: TCPUDP基础模型)

TCP/UDP（服务器、客户端源码） [(12条消息) 网络编程(4.7作业)(TCP/UDP源代码)_m0_37565374的博客-CSDN博客]: 一. 套接字 socket 1.概念最早的socket和消息队列、共享内存，管道一致只能实现一台主机中的多个进程间通信。后期加入了TCP/I…

阅读更多...

云日记个人中心项目思路

云日记个人中心项目思路

验证昵称的唯一性前台： 昵称文本框的失焦事件 blur 1. 获取昵称文本框的值 2. 判断值是否为空如果为空，提示用户，禁用按钮，并return 3. 判断昵称是否做了修改…

阅读更多...

一文详解：linux部署jenkins，一键构建并部署springboot至第三方服务器

一文详解：linux部署jenkins，一键构建并部署springboot至第三方服务器

目录 1、下载jenkins 2、启动jenkins 3、访问jenkins 4、在当前Linux上安装maven 4.1、更新wget命令，支持https请求 4.2、下载maven 4.3、解压安装maven 4.4、配置maven环境变量 4.5、maven配置阿里云镜像 4.6、配置maven依赖下载的位置 5、Linux安装Gi…

阅读更多...

Redis的使用【Redis】

Redis的使用【Redis】

一、缓存简介缓存简介二、缓存分类缓存分类三、常见缓存常见缓存四、Redis使用 Redis 有 5 ⼤基础数据类型： String——字符串类型Hash——字典类型List——列表类型Set——集合类型ZSet——有序集合类型其中最常⽤的是字符串和字典类型。 1.字符…

阅读更多...

Vulnhub靶场DC-1练习

Vulnhub靶场DC-1练习

目录0x00 准备0x01 主机信息收集0x02 站点信息收集0x03 漏洞查找与利用0x00 准备下载链接：https://download.vulnhub.com/dc/DC-1.zip 介绍：There are five flags in total, but the ultimate goal is to find and read the flag in root’s home dir…

阅读更多...

推荐文章

最新文章