spark3.0源码分析-driver-executor心跳机制

spark3.0源码分析-driver-executor心跳机制

news2026/3/27 18:57:06

前言

driver和executor心跳机制分为两种机制：
1、executor发送心跳机制
2、driver接受心跳机制

至于为何要分为两种，原因是在分布式场景中，服务的稳定性是无法保障的，例如executor宕机后无法发送心跳，故driver端需要有executor心跳超时机制，同样如果是driver端宕机或者GC导致executor无法成功发送心跳，那么executor也有自己的超时结束进程的机制

1、executor心跳机制

executor向driver发送心跳的间隔默认[spark.executor.heartbeatInterval]：10s
心跳异常次数超过默认阈值[spark.executor.heartbeat.maxFailures]：60次
当超过阈值后executor会自杀，意味着executor会重试发送大约10分钟的心跳，但大部分不会发送到10分钟
因为driver在120s内没有接收到executor的请求后就会主动杀死executor进程[dirver心跳机制]，所以10分钟的场景适用于driver端挂掉的情况下executor自杀，退出错误码为56。
在这里插入图片描述

executor自动退出码：56

例如下图：生产中executor连接超时日志

2、driver心跳机制

driver对executor心跳的检测机制：当driver端检测到executor最后一次心跳时间距今超过了[spark.network.timeout]120s，则启动一个线程杀死executor进程[杀死的过程是请求集群管理器进行处理]
在这里插入图片描述

在这里插入图片描述

此时executor被杀死后的退出码应该是：143
生产中driver日志：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/349162.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

3、按键扫描检测处理

3、按键扫描检测处理

说明：本文处理按键的短按、长按检测执行，非矩阵按键硬件可以类似如下连接即可，无需放置上下拉电阻； 按键动作分长按、短按(弹起时执行)两种按下不放执行长按，但松开按键时不予执行短按函数多个按键可以同时操作按…

阅读更多...

内网渗透(三十四)之横向移动篇-IPC配合计划任务横向移动

内网渗透(三十四)之横向移动篇-IPC配合计划任务横向移动

系列文章第一章节之基础知识篇内网渗透(一)之基础知识-内网渗透介绍和概述内网渗透(二)之基础知识-工作组介绍内网渗透(三)之基础知识-域环境的介绍和优点内网渗透(四)之基础知识-搭建域环境内网渗透(五)之基础知识-Active Directory活动目录介绍和使用内网渗透(六)之基…

阅读更多...

Altium Designer输出生产文件Gerber、IPC、NC Drill、坐标文件--AD

Altium Designer输出生产文件Gerber、IPC、NC Drill、坐标文件--AD

AD软件版本：22.2.1 gerber文件输出共有两部分： 1、Gerber Files:铜皮和外形分别导出 2、Nc Drill Files 分3次导出一、Gerber Files 导出2次设定原点 ** Edit->Origin->Set** 一般板边左下角为原点，可以根据自己板子形状确定导…

阅读更多...

使用MAT工具分析OOM问题

使用MAT工具分析OOM问题

1、添加jvm参数保存堆内存快照 -XX:HeapDumpOnOutOfMemoryError -XX:HeapDumpPath存放路径 2、下载MAT工具下载地址： https://www.eclipse.org/mat/downloads.php 3、启动如果遇到 Version 1.8.0 102 of the JVM is not suitable for this product, Version: 11…

阅读更多...

2023LaCTFWriteup

2023LaCTFWriteup

文章目录2023LaCTFEBEa hackers notes2023LaCTF 前言： 累了，没有话，下次一定 EBE I was trying to send a flag to my friend over UDP, one character at a time, but it got corrupted! I think someone else was messing around with me…

阅读更多...

【C++】类与对象（三）

【C++】类与对象（三）

前言本章我们接替前一章继续深入理解类的默认成员函数，赋值重载，取地址重载，及const取地址操作符重载但是在讲剩下的三个默认成员函数之前，我们要先来了解运算符重载，因为赋值重载，取地址重载&#xff0c…

阅读更多...

Compose-Navigation简单案例上手

Compose-Navigation简单案例上手

Navigation 快速上手下面案例简要展示使用 Compose 版本的 Navigation 库来实现两个页面之间的跳转这是完整的结构（忽略掉红线划过的那个包） 安装适用于 kotlin 的 navigation 依赖 dependencies {implementation("androidx.navigation:navigati…

阅读更多...

兼职任务平台收集（一）分享给有需要的朋友们

兼职任务平台收集（一）分享给有需要的朋友们

互联网时代，给人们带来了很大的便利。信息交流、生活缴费、足不出户购物、便捷出行、线上医疗、线上教育等等很多。可以说，网络的时代会一直存在着。很多人也在互联网上赚到了第一桶金，这跟他们的努力和付出是息息相关的。所谓一份耕耘&#…

阅读更多...

使用kubeadm部署k8s1.24.0版本，遇到的坑总结

使用kubeadm部署k8s1.24.0版本，遇到的坑总结

使用kubeadm部署k8s1.24.0版本，遇到的坑总结环境安装遇到的问题环境操作系统：centos7 内核：5.4.231-1.el7.elrepo.x86_64 kubeadm：1.24.0 kubelet：1.24.0 kubectl：1.24.0 cri：docker cni&…

阅读更多...

nginx rewrite 规则

nginx rewrite 规则

生效位置 rewrite 可以写在 server 、 location、 if 配置段内格式 rewrite regex replacement [flag] regex是匹配的正则表达式。只会处理$request_uri部分，不会匹配$host replacement 是跳转的URI。可以以http:// 或者https:// 开头， 也…

阅读更多...

自适应多因素认证：构建不可破解的企业安全防线｜身份云研究院

自适应多因素认证：构建不可破解的企业安全防线｜身份云研究院

打开本文意味着你理解信息安全的重要性，并且希望获取行业最佳实践来保护你所在组织的信息安全。本文将带你了解多因素认证（MFA：Multi-Factor-Authentication）对于企业信息安全的重要性以及实施方法。多因素认证（MFA&…

阅读更多...

尚医通（十五）医院排班管理

尚医通（十五）医院排班管理

目录一、医院排班管理需求1、页面效果2、接口分析二、科室列表（接口）1、添加service接口和实现2、添加DepartmentController方法三、科室列表（前端）1、添加隐藏路由2、封装api方法3、添加/views/hosp/schedule.vue组件四、排班日期…

阅读更多...

$torch相比于numpy都干了什么——torch入门$

torch相比于numpy都干了什么——torch入门

Torch已深度学习框架被熟知，但它首先是作为Numpy的存在。我们首先比较一下Torch和Numpy有什么不同，为什么可以实现深度学习。从数据结构看起。Numpy的强大之处就在于array的数据结构，它是多维数组，要求所有元素是相同类型的&…

阅读更多...

人与人之间赚钱的差距在哪里呢？体现在这几个因素中

人与人之间赚钱的差距在哪里呢？体现在这几个因素中

同样生而为人，同样接受九年制义务教育的熏陶，但最终赚钱能力却千差万别，因此也就形成了我们所谓的圈层，阶层，穷人和富人。一个人的赚钱能力跟什么有关？资源技能、学历、认知，这些都会决定一个人…

阅读更多...

搞清楚动态库和静态库的区别

搞清楚动态库和静态库的区别

什么是库文件一般来说，一个程序，通常都会包含目标文件和若干个库文件。经过汇编得到的目标文件再经过和库文件的链接，就能构成可执行文件。库文件像是一个代码仓库或代码组件的集合，为目标文件提供可直接使用的变量、函数、类等…

阅读更多...

visual studio 改变界面语言

visual studio 改变界面语言

在使用visual studio 2019 时，开始是英文界面，后面变成了中文界面。但是看视频教学时有的是英文界面，我就想回到英文界面，所以有切换界面语言的需要。其实操作很简单：工具-> 选项打开界面在界面里选择环境&#xf…

阅读更多...

axios中的resolvePromise为什么影响promise状态

axios中的resolvePromise为什么影响promise状态

axios的取消请求意思很简单，就是在发送请求后不久停止发送请求本文探讨的是v0.22.0之前的CancelToken API，因为在阅读源码交流的时候发现很多朋友不理解为什么CancelToken中的resolvePromise会影响到实例对象身上的promise状态即下图所示代码&#xf…

阅读更多...

为乡村振兴塑形铸魂，VR全景助力美丽乡村建设

为乡村振兴塑形铸魂，VR全景助力美丽乡村建设

民族要复兴，乡村必振兴，文旅部一直推动乡村文化产业和乡村旅游融合发展，大力推进乡村文化数字化，为乡村文化振兴注入新动能。为了更好的给乡村振兴塑形铸魂，VR智慧乡村助力数字化乡村建设发展，利用VR全景展…

阅读更多...

CMD SET % 字符串截取

CMD SET % 字符串截取

:: 使用 CSDN Cobol 格式化风格。:: *. 百分号 (%) :: (1) % 作为变量引导符，有几种用途：在命令行窗口中，用 1 个 % 引号变量; 在批处理文件中，用 2 个 % 引号变量。[1] 两个 % 夹着一个变量名称，表示取（扩…

阅读更多...

HashMap如何避免内存泄露问题

HashMap如何避免内存泄露问题

HashMap对于Java开发人员来说，应该是一种非常非常熟悉的数据结构了，应用场景相当广泛。本文重点不在于介绍如何使用HashMap，而是关注在使用HashMap过程中，可能会导致内存泄露的情况，下面将以示例的形式展开具体介绍。…

阅读更多...

推荐文章

最新文章