spark08-spark任务启动环境准备

news2026/3/27 18:56:55

内容来自尚硅谷

1.submitApplication

当spark执行任务时会启动java虚拟机，启动一个进程，该进程的名称为SparkSubmit，会执行SparkSubmit中的main方法，该方法中调用了super.doSubmit方法。

org.apache.spark.deploy.SparkSubmit

doSubmit方法中首先会解析参数调用parseArguments(args)方法，创建参数构建对象new SparkSubmitArguments(args)，根据参数中action类型进行执行，如果是submit就是提交任务

2.启动ApplicationMaster

submit方法底层会执行runMain(args, uninitLog)，该方法中会调用prepareSubmitEnvironment(args)方法(准备任务提交的环境)

如果是yarn模型，childMainClass=org.apache.spark.deploy.yarn.YarnClusterApplication

YarnClusterApplication执行start方法会new一个client对象

client对象中包含yarnClient对象，底层会生成resouceManager对象

client.run 会调用submitApplication方法,该方法会封装一些执行的指令

该方法中会创建application对象，指定container

当是集群模式是会创建master对象(进程)，随后执行run方法，启动Driver

3.启动Driver ，初始化sparkContext

runDriver中会启动一个线程名字为Driver,并执行提交代码的main方法，执行代码中的new sparkContext（conf）代码

4.注册AM,与resouceManage连接申请资源

5.注册AM时会获取资源可用服务器链表

处理可使用的服务器

运行已分配服务器

6.启动exceutor通信进程

启动executor线程

执行启动container方法

startContainer首先会封装命令，该命令会启动一个进程（org.apache.spark.executor.YarnCoarseGrainedExecutorBackend executor的通信进程）

向指定的服务器启动container

创建executorBackend会执行其中的run方法

创建SparkEnv环境

7.executor向driver进行注册

onStart方法执行的是CoarseGrainedExecutorBackend中的onStart方法

当向driver进行注册时，其实是向SparkContext环境进行注册，SparkContext中会有一个对象

服务器端进行接收和回复

8.executor注册成功

当服务器接收并回复之后，executor会给自己发送消息注册成功

CoarseGrainedExecutorBackend中的onStart方法

9.创建executor计算对象

executor当接收到消息后创建executor

10.执行代码

总体

1)执行脚本提交任务，实际是启动一个 SparkSubmit 的 JVM 进程；

2) SparkSubmit 类中的 main 方法反射调用 YarnClusterApplication 的 main 方法 YarnClusterApplication 创建 Yarn 客户端，然后向 Yarn 服务器发送执行指令： bin/java

ApplicationMaster； Yarn 框架收到指令后会在指定的 NM 中启动 ApplicationMaster；

3) ApplicationMaster 启动 Driver 线程，执行用户的作业；

4) AM 向 RM 注册，申请资源；

5)获取服务器可用列表

6) 获取资源后 AM 向 NM 发送指令： bin/java YarnCoarseGrainedExecutorBackend；

7) CoarseGrainedExecutorBackend 进程会接收消息，跟 Driver 通信

8)注册已经启动的Executor；

8) 然后启动计算对象 Executor 等待接收任务

10) Driver 线程继续执行完成作业的调度和任务的执行。

11) Driver 分配任务并监控任务的执行。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/365880.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Python abs() 函数

Python abs() 函数

Python abs() 函数Python 数字描述abs() 函数返回数字的绝对值。语法以下是 abs() 方法的语法:abs( x )参数x -- 数值表达式。返回值函数返回x（数字）的绝对值。实例以下展示了使用 abs() 方法的实例：#!/usr/bin/python print "abs(-45) …

阅读更多...

百度西交大大数据菁英班目标检测竞赛

百度西交大大数据菁英班目标检测竞赛

来源：投稿作者：LSC 编辑：学姐数据介绍数据集共包括40000张训练图像和1000张测试图像，每张训练图像对应xml标注文件： 共包含3类：0:head, 1:helmet, 2:person。提交格式要求，提交名为pred_r…

阅读更多...

如何为Java文件代码签名及添加时间戳？

如何为Java文件代码签名及添加时间戳？

Java是一种流行的编程语言，大多数组织都使用它来开发业务应用程序。由于其高使用率，攻击者总是试图找到其中的漏洞并基于它利用软件。为了防止此类攻击， 为 Java 文件（.jar）进行代码签名并添加时间戳，可以防…

阅读更多...

Netty网络编程实战：基于Netty的Http服务器开发

Netty网络编程实战：基于Netty的Http服务器开发

Netty网络编程实战：基于Netty的Http服务器开发文章目录Netty网络编程实战：基于Netty的Http服务器开发介绍功能需求服务端代码实现基于Netty的WebSocket开发网页版聊天室WebSocket简介WebSocket和HTTP的区别基础环境准备服务端开发Netty中粘包和拆包的解…

阅读更多...

关于PHP的webshell免杀小结

关于PHP的webshell免杀小结

0X00普通的一句话木马（适用于CTF和小站） <?php eval($_POST[a]); ?> //函数的相似替换 <?php assert($_POST[a]); ?><?php eval($_POST[110]);?>与第一个一句话木马相比多了一个"“字符，我们发现这个字符的含义…

阅读更多...

【科研】测试速通：python不同文件夹下同名图像拼接

【科研】测试速通：python不同文件夹下同名图像拼接

论文必备图像拼接笔记速通结果： 现有：测试样本相同（名命相同），测试模型不同，测试结果分别保存至不同文件夹目标：结果显示在同一张图像上目录论文必备图像拼接笔记 1.如果图像格式不一致…

阅读更多...

怎么维护Linux VPS 服务器？简单7个步骤

怎么维护Linux VPS 服务器？简单7个步骤

维护VPS的目的是为了确保服务器网络始终畅通无阻。请注意，此列表中的任务并不是服务器维护所需完成的唯一任务。以下是 Linux VPS 服务器所有者可以做些什么来维护他们的服务器。 1.监控磁盘空间服务器是个人服务器还是具有多个用户帐户的服务器并不重要&#xff0…

阅读更多...

精简版SDL落地实践

精简版SDL落地实践

一、前言一般安全都属于运维部下面，和上家公司的运维总监聊过几次一些日常安全工作能不能融入到DevOps中，没多久因为各种原因离职。18年入职5月一家第三方支付公司，前半年在各种检查中度过，监管形势严峻加上大领导对安全的重视(主…

阅读更多...

【数据结构】二叉树(C语言实现)

【数据结构】二叉树(C语言实现)

文章目录一、树的概念及结构1.树的概念2.树的相关概念名词3.树的表示4.树在实际中的运用二、二叉树概念及结构1.二叉树的概念2.特殊的二叉树3.二叉树的性质4.二叉树的存储结构三、二叉树链式结构的实现1.结构的定义2.构建二叉树3.二叉树前序遍历4.二叉树中序遍历5.二叉树后序遍…

阅读更多...

QWebEngineView 类详细使用说明

QWebEngineView 类详细使用说明

文章目录一、前言二、详述三、属性四、公共函数五、重新实现的公共函数六、公共槽函数七、信号八、保护函数九、重新实现的受保护函数 10、总结一、前言原文链接 QWebEngineView类提供了一个小部件，用于查看和编辑Web文档。 Header: #include < …

阅读更多...

【Web安全-MSF记录篇章一】

【Web安全-MSF记录篇章一】

文章目录前言msfvenom生成远控木马基本系统命令webcam 摄像头命令常用的信息收集脚本注册表设置nc后门开启 rdp&添加用户获取哈希mimikatz抓取密码前言最近打站，可以感觉到之前的学的渗透知识忘记很多。。。。。多用多看多练，简单回顾一下 msfven…

阅读更多...

2023年了，零基础小白转行IT学习Java还有前途吗？

2023年了，零基础小白转行IT学习Java还有前途吗？

“2023年了，转行IT学习Java是不是已经听过看过很多次了，Java从出现到现在有多少年了呢？掐指一算，Java是1995年由Sun公司推出的一款高级编程语言……距今已有28年了！ Sun公司都被收购了，莫不是Java也要垮台了…

阅读更多...

Android实现Dribbble上动感的Gallery App Icon

Android实现Dribbble上动感的Gallery App Icon

先来看看原Dribbble上动感的Gallery App Icon效果图思路拆解一下，还是比较简单，需要绘制的有：圆形背景太阳(圆形)山(三角形)云朵(圆角矩形三个圆)需要进行的动画：太阳 - 旋转动画山 - 上下平移动画云朵 - 左右平移动画不必绘制圆…

阅读更多...

随想录二刷 (双指针法) leetcode 27 26 283 844

随想录二刷 (双指针法) leetcode 27 26 283 844

双指针法的原理双指针法相对于暴力解法的优点有以下几点暴力遍历的时间复杂度会比较高双指针法利用两个指针进行遍历完成双层循环所做的事情双指针一般有两种方法同向指针，双向指针第一题 leetcode 27 移除元素题目描述题目分析采用暴力遍历可以得出结…

阅读更多...

vector的基本使用

vector的基本使用

目录介绍： vector iterator 的使用增删查改增（push_back insert）： 删(pop_back erase)： swap： vector的容量和扩容： 排序（sort）： 介绍&#xff…

阅读更多...

SpringBoot入门（二）

SpringBoot入门（二）

这里写目录标题一、SpringBoot整合Junit1.1 搭建SpringBoot工程1.2 引入starter-test起步依赖1.3 编写类1.4 测试二、SpringBoot整合mybatis2.1 搭建SpringBoot工程2.2 引入mybatis起步依赖，添加驱动2.3 编写DataSource和MyBatis相关配置2.4 定义表和实体类2.5 编写…

阅读更多...

100%BIM学员的疑惑：不会CAD可以学Revit吗？

100%BIM学员的疑惑：不会CAD可以学Revit吗？

在新一轮科技创新和产业变革中，信息化与建筑业的融合发展已成为建筑业发展的方向，将对建筑业发展带来战略性和全局性的影响。建筑业是传统产业，推动建筑业科技创新，加快推进信息化发展，激发创新活力，培育…

阅读更多...

apk中代码执行adb指令实现

apk中代码执行adb指令实现

背景：想要在android apk中直接使用adb指令，从而不需要把手机通过数据线方式连接到电脑，在电脑端执行adb指令。一、权限相关想要在apk代码中执行adb命令，涉及到执行权限。首先手机需要有root权限。其次就算手机已经root了&…

阅读更多...

yolov5/6/7系列模型训练日志结果数据对比分析可视化

yolov5/6/7系列模型训练日志结果数据对比分析可视化

早在之前使用yolov3和yolov4这类项目的时候可视化分析大都是自己去做的，到了yolov5的时候，变成了一个工具包了，作者全部集成进去了，这里我们以一个具体的结果为例，如下：整个训练过程产生的指标等数据都会自…

阅读更多...

11.3 基于Django4的可重用、用户注册和登录系统搭建(优化)

11.3 基于Django4的可重用、用户注册和登录系统搭建(优化)

文章目录邮件注册发送邮件功能测试基本的邮件注册功能实现完成注册表单完成注册的业务逻辑密码加密功能实现邮件注册确认创建模型修改视图测试处理邮件确认请求修改登录规则测试邮件注册根据官方文档进行：https://docs.djangoproject.com/zh-hans/4.1/topics/emai…

阅读更多...

推荐文章

最新文章