Yarn(Yet Another Reource Negotiator)另一个资源协调者

Yarn(Yet Another Reource Negotiator)另一个资源协调者

news2026/1/19 16:44:52

官网引用

在这里插入图片描述

在这里插入图片描述

总结性

产生的需求

在这里插入图片描述

YARN工作逻辑

通用的资源管理系统，为上一层应用提供统一的资源管理和调度。解决集群资源利用率，数据共享，资源管理统一问题，yarn取代Job Tracker角色
在这里插入图片描述

组件说明

Client

向RM提交任务，终止任务。

Resource Manager(RM)

一个集群中只有一个RM,一个RM对应多个NM
处理客户端的请求（启动/终止应用程序）
启动/监控AM,若AM挂掉，RM会在另一个NM节点启动AM
监控NM,接收NM汇报的心跳信息并分配任务给NM执行；一旦某个NM故障，标记下该NM上的任务，通知对应的AM如何处理。

Node Manager(NM)

集群中有多个NM,负责单个节点资源管理和使用
周期性地通过心跳信息向RM汇报本节点上的资源使用情况和各个Container的运行状态
接收并处理来自RM的Container启动和停止的各种命令

Application Master(AM)

对应每一个应用程序，负责应用程序的管理
AM向RM申请资源用在NM上启动相应的任务
为应用程序/作业向RM申请资源（Container）,并分配给内部任务
与NM通信，已启动/停止任务
任务监控和容错，在任务执行失败时重新为该任务申请资源以重启任务
处理RM发过来的命令（终止Container，让NM重启）

Container （任务运行环境的抽象）

任务是在Container中运行的，一个Container既可以运行AM，也可以运行具体的Map,Reduce,MPI,SparkTask
MapReduce作业启动时产生Map任务——Map Task
MPI框架对应执行任务——MPI Task

YARN架构设计

在这里插入图片描述

用户向YARN提交应用程序作业，包括AM程序，启动AM程序的命令和用户程序
RM为作业分配第一个Container，并与对应的NM通信，要求它运行这个Container中启动该作业的AM
AM首先向RM注册，这样用户就可以直接通过RM查询作业的运行状态；然后再为各个任务申请资源并监控任务的运行状态，直到运行结束（AM采取轮询的方式通过RPC请求向RM申请资源）
AM一旦申请到资源，便与对应的NM通信，要求它启动任务
NM启动任务
各个任务通过RPC协议向AM汇报自己的状态和进度，以便AM随时掌握各个任务的运行状态，从而在任务失败时重新启动任务
作业在运行过程中，用户可以随便通过RPC向AM查询作业的当前运行状态
作业完成后，AM向RM注销并关闭自己

yarn容错性

RM可基于ZK实现HA,避免单点
NM执行失败后，RM将失败任务高速对应的AM,由AM决定如何处理失败任务
AM执行失败后，有RM负责重启（AM需要处理内部任务的容错问题，保存已经运行完成的Task，重启后不再运行）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/467083.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

1、软件测试概述

1、软件测试概述

1、软件测试概述一、软件生命周期二、软件开发模型1、瀑布模型2、增量模型3、原型模型4、敏捷开发三、软件质量1、软件质量概念2、影响软件质量的因素一、软件生命周期软件生命周期分为多个阶段，每个阶段有明确的任务，通常，可将软件生命…

阅读更多...

ARM寄存器组织

ARM寄存器组织

ARM有37个32位长的寄存器： 1个用做PC（Program Counter）； 1个用做CPSR(Current Program Status Register)； 5个用做SPSR（Saved Program Status Registers）； 30个通用寄存器。 AR…

阅读更多...

Unity之OpenXR+XR Interaction Toolkit实现射线和物体交互事件回调

Unity之OpenXR+XR Interaction Toolkit实现射线和物体交互事件回调

前言前面我们介绍了如何抓取物体，今天我们来说一下如何和3D的物体进行交互，得到接触的事件回调。交互的两种方式： 1.直接抓取或者射线抓取物体，得到接触回调 2.射线或者手部触摸物体后，得到接触回调准备工作有了…

阅读更多...

Android 10.0 设置默认launcher后安装另外launcher后默认Launcher失效的功能修复

Android 10.0 设置默认launcher后安装另外launcher后默认Launcher失效的功能修复

1.前言在10.0的系统rom定制化开发中，在系统中有多个launcher的时候，会在开机进入launcher的时候弹窗launcher列表，让用户选择进入哪个launcher，这样显得特别的不方便所以产品开发中，要求用RoleManager的相关api来设置默认Launcher，但是在设置完默认Launcher以后，在安…

阅读更多...

嵌入式软考备考_3 嵌入式操作系统概述

嵌入式软考备考_3 嵌入式操作系统概述

嵌入式操作系统概述工作在嵌入式环境中的操作系统 Embedded Operating System。嵌入式和一般操作系统区别： 非通用操作系统，用于完成特定功能；性能实时性能源可靠性要求高；占用资源少；可剪裁，可配置。…

阅读更多...

渗透测试 | Web信息收集

渗透测试 | Web信息收集

0x00 免责声明本文仅限于学习讨论与技术知识的分享，不得违反当地国家的法律法规。对于传播、利用文章中提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，本文作者不为此承担任何责任，一旦造成后果请自行承担…

阅读更多...

《程序员面试金典（第6版）》面试题 16.04. 井字游戏（棋盘类问题，C++）

《程序员面试金典（第6版）》面试题 16.04. 井字游戏（棋盘类问题，C++）

题目描述设计一个算法，判断玩家是否赢了井字游戏。输入是一个 N x N 的数组棋盘，由字符" "，“X"和"O"组成，其中字符” "代表一个空位。以下是井字游戏的规则： 玩家轮流将字符放入空位…

阅读更多...

专门为麻醉科和手术室开发的：手术麻醉系统源码，系统稳定，功能完整，支持二次开发

专门为麻醉科和手术室开发的：手术麻醉系统源码，系统稳定，功能完整，支持二次开发

手术麻醉系统源码：C# .net 桌面软件 C/S版系统极其稳定，扩展性强，已在多家医院运营。文末获取联系手术麻醉信息管理系统是专门为麻醉科和手术室开发的围手术期临床信息管理系统，具备以下功能: 1.手术程管理系统整合了手术室、…

阅读更多...

人工智能实践: 基于T-S 模型的模糊推理

人工智能实践: 基于T-S 模型的模糊推理

模糊推理是一种基于行为的仿生推理方法, 主要用来解决带有模糊现象的复杂推理问题。由于模糊现象的普遍存在, 模糊推理系统被广泛的应用。模糊推理系统主要由模糊化、模糊规则库、模糊推理方法以及去模糊化组成, 其基本流程如图1所示。

阅读更多...

C++（继承下）

C++（继承下）

目录： 1.继承与有元 2.继承与静态成员 3.单继承、多继承 4.如何定义一个不能被继承的类？？ 5.分享有意思的一道题 6.菱形继承及菱形虚拟继承 --------------------------------------------------------------------------------------------…

阅读更多...

【c语言】全局变量 | 局部变量的生命周期与作用域

【c语言】全局变量 | 局部变量的生命周期与作用域

创作不易，本篇文章如果帮助到了你，还请点赞支持一下♡>𖥦<)!! 主页专栏有更多知识，如有疑问欢迎大家指正讨论，共同进步！ 给大家跳段街舞感谢支持！ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ…

阅读更多...

亚马逊云科技赋能客户，为海思科打造安全高效的营销业务中台系统

亚马逊云科技赋能客户，为海思科打造安全高效的营销业务中台系统

羽翼渐丰，翱翔云端携手亚马逊云科技，打造互联网级企业解决方案秉承“为客户创造价值”的理念，在公司发展过程中，博智信息先后服务了众多知名企业，客户行业覆盖制造、零售、餐饮、科技、电子等。经过近20年的发展&a…

阅读更多...

AutoGPT 是 prompt 工程的下一个前沿

AutoGPT 是 prompt 工程的下一个前沿

前言最近了解到Auto GPT的上线，下面我来整理一下整个体验过程，希望对大家有所帮助和启发。首先Auto GPT是 OpenAI 的 Andrej Karpathy 都在大力宣传的一个开源项目，他认为 AutoGPT 是 prompt 工程的下一个前沿。近日，AI 界貌…

阅读更多...

自助式数据分析平台：jvs数据智仓-统计报表的使用条件及界面介绍

自助式数据分析平台：jvs数据智仓-统计报表的使用条件及界面介绍

统计报表界面介绍统计报表是指利用表格和报表等形式，将数据以清晰的结构和布局的方式呈现出来，以便用户进行数据分析和决策制定的一种BI统计方法。表格式的BI统计通常采用交叉表格、分组表、报表等形式，对数据进行整合、分析和展示&#xff…

阅读更多...

【数据库数据恢复】ndf文件损坏的SQL SERVER数据库数据恢复案例

【数据库数据恢复】ndf文件损坏的SQL SERVER数据库数据恢复案例

数据库数据恢复环境： 某公司存储上部署SQL SERVER数据库，数据库中有1000多个文件，该SQL SERVER数据库每10天生成一个NDF文件，数据库包含两个LDF文件。数据库故障&分析： 存储设备出现故障导致SQL SERVER数据库异常…

阅读更多...

IDEA实用设置

IDEA实用设置

1、设置全局编码统一为UTF-8 file>setting中搜索框输入file encoding修改格式为UTF-8 2、设置文字大小 file>setting中搜索框输入font修改字体大小 3、配置maven file>setting中搜索框输入maven修改maven的路径、conf文件、文件仓库 4、idea中实现Serializable提示…

阅读更多...

RabbitMQ通讯方式

RabbitMQ通讯方式

RabbitMQ通讯方式 RabbitMQ提供了很多中通讯方式，依然可以去官方查看：https://rabbitmq.com/getstarted.html 七种通讯方式 1 RabbitMQ提供的通讯方式 Hello World!：为了入门操作！Work queues：一个队列被多个消费者…

阅读更多...

三十五、垃圾回收器

三十五、垃圾回收器

一、GC分类于性能指标垃圾回收器的分类 1.串行回收指的是在同一时间段内只允许有一个CPU用于执行垃圾回收操作，此时工作线程被暂停，直至垃圾收集工作结束。 1)在诸如单CPU处理器或者较小的应用内存等硬件平台不是特别优越的场合，串行回收器…

阅读更多...

WRF模式应用：天气预报、模拟分析观测气温、降水、风场、水汽和湿度、土地利用变化、土壤及近地层能量水分通量、土壤、水体、植被等相关气象变量

WRF模式应用：天气预报、模拟分析观测气温、降水、风场、水汽和湿度、土地利用变化、土壤及近地层能量水分通量、土壤、水体、植被等相关气象变量

查看原文>>>高精度气象模拟软件WRF(Weather Research Forecasting)技术及案例应用目录区域气候模式理论知识梳理 Linux操作系统WRF模式系统实际操作模式调试及运行模式操作及案例实践实际应用及案例分析 Python在WRF模型自动化运行及前后处理中的实践技术…

阅读更多...

为什么在马云成功前就有那么多影像留下来？

为什么在马云成功前就有那么多影像留下来？

马云创业的各个阶段，都有意无意得到媒体的推波助澜，不光是影像，还留下了很多相关的文字报道。站在当时的角度，马云或许并不总是以一种成功人士的身份出现，但即便如此，他做事情也足够新潮、足够前卫、或者足…

阅读更多...

推荐文章

最新文章