【yarn】任务日志丢失问题分析

news2024/12/23 16:18:34

【yarn】任务日志丢失问题分析

故事背景

今天中午收到了一个报警邮件通知。内容大致为:有一个正在 yarn上运行的flink的实时任务挂掉了。
针对上述的现象,我们的开发工程师先打开yarnweb ui找到对应的job的任务页面。查询任务日志。
在这里插入图片描述
点击这个log,找不到任何日志。那么很显然,这个任务的container已经没了,日志已经找不到了。
引出问题:日志怎么会消失?

探究过程

  1. 通过上图的Finished这一栏可以看到,这个任务在什么时候结束运行的,从上图得知,这个任务是在Wed Nov 16 12:58:09 +0800 2022挂掉的。
  2. 记录最下面Node栏对应的机器ip(在上面的图片中我打码了,这个机器是yarn的一个node节点,请根据自己的环境来分析)
  3. 在做好上述两点的基础上,先找到这台Node节点,然后检查该节点的NodeManager的日志,目前我用的环境是cdh,所以我可以在cloudera manager管理界面上查看到对应的NodeManager的角色日志,找到Finshed时间对应的日志,日志如下:在这里插入图片描述
    如上所示:
    在这里插入图片描述
    针对标号1的这块儿内容,进入cdh的给出来的官方文档检查了一下:
    在这里插入图片描述
    这个exitCode=255 似乎看不出来什么原因。
    但是通过标志2的那段内容可以看到这个container找不到用户scb。带着这段信息去搜索了一下,得到如下链接:https://community.cloudera.com/t5/Support-Questions/Getting-user-not-found-issue-when-starting-spark-job/td-p/278090
    在这个链接中:
    明确的提到了同类的问题,并且给出了问题发生的可能性。
    针对找不到用户的问题的校验方法,验证该用户是否有效:
    1. 登录对应的机器上
    2. 使用命令id 用户名来查询用户名是否ok
      针对问题的可能发生的原因:可能是有运维人员操作了sssd工具,导致当时运行程序的container容器的那台机器的用户名受到了影响。导致程序运行失败,container容器启动失败被清理掉了。
      后续我们问了一下相关的负责人,得到的反馈是在那个时间点操作了一下sssd导致了container找不到用户名

总结

其实诊断信息就写在这里
在这里插入图片描述
最后,通过该问题的探究经历,经验+1。如果各位大佬有什么更好的建议,请在评论区里留言。谢谢~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/12068.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

java计算机毕业设计springboot+vue宠物服务管理系统

项目介绍 计算机网络的发展,促进了社会各行业的进步,带来了经济快速增长。用户通过本平台发布宠物趣事,进行展示,在平台上和用户进行实时的交流沟通,达成交易。用户登录后,把想要交易的宠物周边商品发布到平台上,进行交易,提高了效率,减少了时间成本,并且在交易过程中,宠物服务…

c语言(看一遍就会操作,小马教一步步教你如何文件操作)

前言: ^ _ ^文件操作想必大家掌握的并不熟练,确实因为我们用的并不多,而本节内容能够让大家初步认识文件操作,从文件认识到文件使用,让我们对c语言文件操作有个初步的了解,在应用中可以看我用文件的形式完…

java爬虫破解滑块验证码

使用技术:javaSelenium 废话: 有爬虫,自然就有反爬虫,就像病毒和杀毒软件一样,有攻就有防,两者彼此推进发展。而目前最流行的反爬技术验证码,为了防止爬虫自动注册,批量生成垃圾账号…

三菱FX系列控制脉冲伺服--DDRVA、DZRN、 ALTP、D8340、DPLSY指令的使用

一:文章主题 FX系列控制轴最常用的是脉冲控制的方式。本文基于实际开发案例,讲解三菱FX系列的运动控制指令,基于该文章能清楚指导通过脉冲控制伺服的基本原理和程序思路。 二:运动控制指令 2.1、DDRVA指令使用 1、DDRVA定义&#…

zabbix 自动发现与自动注册(接上章补充)

一、zabbix 自动发现 server CentOS7.6 192.168.130.70 / client CentOS7.6 192.168.130.10 / proxy CentOS7.6 192.168.130.60 / 1.zabbix server 主动的去发现所有的客户端,然后将客户端的信息登记在服务端上。 缺点是如果定义的网段中的主机数量多,…

MQTT X 1.9.0 发布:开箱即用的 bench 命令,MQTT 性能测试更便捷

近日,MQTT 5.0 客户端工具 MQTT X 1.9.0 正式发布。 新版本针对桌面客户端优化了一些细节上的 UI 样式与交互方式,新增了一个可以帮助用户更加快速和系统学习 MQTT 协议相关知识的页面,同时也修复了一些已知问题;针对命令行客户端…

c++基础(十七)——职工管理系统实现

一、项目的创建 打开visual studio之后,选择文件—新建—项目。出现弹窗后选择Visual C,填好名称即可。 接下来分别在对应的位置创建头文件以及源文件以及一个主函数文件"职工管理系统.cpp": 二、系统界面的基本实现: 在头文件…

Qt音视频开发03-ffmpeg倍速播放(半倍速/2倍速/4倍速/8倍速)

一、前言 用ffmpeg做倍速播放,是好多年都一直没有实现的功能,有个做法是根据倍速参数,不断切换播放位置,实现效果不是很好,ffplay中的倍速就做得很好,而且声音无论倍速多少还非常柔和,有特别的…

Vue实现网页首屏加载动画、页面内请求数据加载loading

博主介绍 📢点击下列内容可跳转对应的界面,查看更多精彩内容! 🍎主页:水香木鱼 🍍专栏:后台管理系统 文章目录 简介:这是一篇有关【Vue实现网页首屏加载动画、页面内请求数据加载lo…

如何使用html、css制作一个期末作业网站【羽毛球体育运动主题html网页设计】

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

sulfo-CY3(Cyanine3) DBCO,磺酸基-花青素CY5二苯并环辛炔,1782950-79-1

中文名:磺酸基-花青素CY3二苯并环辛炔 英文名:Sulfo-Cyanine3 DBCO,Sulfo-Cy3 DBCO CAS:1782950-79-1 分子式:C50H54N4O11S3 性 状:红色粉末 分子量:983.18 Abs/Em Maxima:548/…

Hadoop单个节点的磁盘均衡

hadoop如果一个节点内有新增磁盘或者数据出现在磁盘上不均衡时,需要做磁盘均衡,就是将其他已经写入数据的磁盘均衡到新增加的磁盘上去,大概分为以下三个步骤,计划,执行,查询: 一般默认都开启了磁…

基于NodeJs+Express+Mysql学生社团活动管理系统

开发技术:nodejs express ElementUI layui 开发工具环境:Vscode Mysql 后台登录地址:http://localhost:8080/nodejsr08n1/admin/dist/index.html#/login 管理员账号密码:abo/abo 社团账号密码:账号1/123456 前台地…

JVM内存区域划分

哈喽,又是好久不见呀,今天主要要给大家分享的是JVM的内存区域划分,这个就是纯纯的八股文了呦,但是我依旧还是会尽我最大的努力给友友讲清楚的,快来看看吧. 目录 1.JVM快速扫盲 2.JDK、JRE、JVM的关系 3.JVM内存区域划分 3.1 堆 3.2 java虚拟机栈 3.3 本地方法栈 3.4 程序…

OpenCV学习-P44 角点检测

OpenCV学习-P44 角点检测角点特征Harris和Shi-Tomas算法Harris角点检测Shi-tomas角点检测角点特征 角点是图像很重要的特征,对图像图形的理解和分析有很重要的作用 Harris和Shi-Tomas算法 Harris角点检测 E最大的点即角点,矩阵M决定了E的取值 im…

信息系统项目管理师高级论文如何准备?

如果有项目经验,可以选一个,整理一下项目背景,内容等,使它符合考试的要求。 没有项目经验,就只能多看范文,总结框架,然后再动手写了。 所以,论文一定要提前准备。 2小时内要完成三…

HTML简单的网页制作期末作业【NBA勒布朗詹姆斯篮球明星】HTML+CSS+JavaScript

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

大一学生作品《前端框架开发技术》 期末网页制作 HTML+CSS+JavaScript 个人主页网页设计实例

🎉精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

UML类图

统一建模语言(Unified Modeling Language,UML)是用来设计软件的可视化建模语言。它的特点是简单、统一、图形化、能表达软件设计中的动态与静态信息。 UML从目标系统的不同角度出发,可分为用例图、类图、对象图、状态图、活动图、…

实现一个全局事件总线并发布到NPM

前言 Vue2开发过程中,会碰到非父子组件情况,我们大多数会使用Vue提供的自定义实例来解决这个问题,但在Vue3之后就移除了$on/$off/$once/emit 相关API,不再提供自定义实例,而是推荐使用一些第三方库如mitt、tiny-emitt…