YARN详解

news2025/1/14 0:43:42

YARN 简介

YARN 是Yet Another Resource Negotiator的缩写。
YARN是第二代MapReduce,即MRv2,是在第一代MapReduce基础上演变而来的,主要是为了解决原始Hadoop扩展性较差,不支持多计算框架而提出的;通俗讲就是资源管理器.

  • YARN核心思想:

将 MR1 中资源管理和作业调度两个功能分开,分别由 ResourceManager 和 ApplicationMaster 进程来实现。
ResourceManager : 负责整个集群的资源管理和调度。
ApplicationMaster : 负责应用程序相关事务,比如任务调度、任务监控和容错等。

YARN 作用

YARN 采用了一种分层的集群框架,它解决了 MR1.0 一系列的缺陷,具有以下优势:

  1. 具有向后兼容性,用户在 MR1.0 上运行的作业,无需任何修改即可运行在 YARN 之上.
  2. 将JobTracker功能分解,分别由ResouceManager(资源管理)和ApplicationMaster(应用程序管理)负责,每个应用程序(节点进程)对应一个ApplicationMaster.
  3. 支持多个框架,不再是一个单纯的计算框架,而是一个框架管理器(更加抽象所以拓展性强),用户可以将各种各样的计算框架移植到YARN之上,由YARN进行统一管理和资源分配,提高集群资源的利用率.
  4. 框架升级更容易,在YARN中,各种计算框架(MR,Spark)不再是作为一个服务部署到集群的各个节点上,而是被封装成一个用户程序库(lib)存放在客户端,当需要对计算框架进行升级时,只需升级用户程序库即可.

YARN 组成

YARN 主要由
ResourceManagerNodeManagerApplicationMasterContainerScheduler
等几个组件构成。
在这里插入图片描述

ApplicationsManager

应用程序管理器
负责管理整个系统中所有应用程序,包括应用程序提交、与调度器协商资源以启动ApplicationMaster、监控ApplicationMaster运行状态并在失败时重新启动它等。

Scheduler

调度器
根据容量、队列等限制条件(如每个队列分配一定的资源,最多执行一定数量的作业等),将系统中的资源分配给各个正在运行的应用程序;
在资源紧张的情况下,可以kill掉优先级低的,来运行优先级高的任务.

ResourceManager

全局资源管理器;
由调度器(Scheduler)和应用程序管理器(ApplicationsManager)组成,
RM是一个全局的资源管理器,负责整个系统的资源管理和分配;
通俗讲就是用于管理NodeManager 节点的资源,包括cpu、内存等.

ApplicationMaster

应用程序实例管理器
管理在 YARN 内运行的每个应用程序实例.
每个应用程序对应一个 AM.
AM 负责协调来自 RM 的资源,并通过 NM监视容器的执行和资源使用(CPU、内存等的资源分配),通俗讲是管理发起的任务,随着任务创建而创建,任务的完成而结束.

NodeManager

节点管理器 是每个节点上的资源和任务管理器. 一方面,它会定时地向 RM 汇报本节点上的资源使用情况和各个Container的运行状态;
另一方面,它接收并处理来自 AM 的Container启动/停止等各种请求.

Container

容器,是 YARN 中的资源抽象 它封装了 NM 节点上的多维度资源,如内存、CPU、磁盘、网络等;
当 AM 向 RM申请资源时,RM为AM返回的资源便是用Container表示的.
YARN 会为每个任务分配一个Container,且该任务只能使用该Container 中描述的资源.

YARN 提交任务的过程

在这里插入图片描述

  1. 用户向 YARN 中提交应用程序.
  2. ResourceManager为该应用程序分配第一个Container,要求它在这个Container中启动应用程序的ApplicationMaster.
  3. ApplicationMaster首先向ResourceManager注册,目的是让用户可以直接通过ResourceManager查看应用程序的运行状态,然后它将为各个任务申请资源,并监控它的运行状态,直到运行结束.
  4. ApplicationMaster向ResourceManager 的 scheduler申请和领取资源(通过RPC协议).
  5. ApplicationMaster申请到资源后,便与对应的NodeManager通信,要求它启动任务.
  6. NodeManager启动任务。
  7. 各个任务向ApplicationMaster汇报自己的状态和进度(通过RPC协议),以便让ApplicationMaster随时掌握各个任务的运行状态,从而可以在任务失败时重新启动任务.
  8. 应用程序运行完成后,ApplicationMaster向ResourceManager注销并关闭自己.

YARN的三种调度策略

FIFO 策略

在这里插入图片描述

First In First Out,先进先出.
弊端:
没有做到资源共享;由于顺序执行任务,如果第一个是大量资源,后续任务需要等待.

举例:
有两个任务,第一个是任务需要大量资源;第二个需要少量资源,但是紧急重要任务;
此时第二个需要等待第一个执行完,才能执行.

容量调度策略

在这里插入图片描述

属于共享调度策略;将集群资源,给队列分配部分资源,每个队列互不干涉.
弊端:
某个队列突然来个大的任务,那这个大的任务不会占用其他队列资源,执行时间长,效率低.
解决:
配置弹性队列;允许队列超过自己配置的容量,但仅在其他队列没有占用资源的情况下.
容量调度 + 弹性队列 = 实现资源共享

公平调度策略

在这里插入图片描述

队列间可以互相共享资源,如果权重高的任务来了,权重低的任务会分给权重高的任务部分资源,必要时,可kill掉权重低的任务.

1.Steady Fair Share
稳定的公平份额,指Yarn根据每个队列的权重weight、最大可运行资源maxShare、最小可运行资源minShare的配置计算得到的理论上应该分配给这个队列的最大资源;
它与这个队列当前是否有app正在运行无关,只和我们在fair-scheduler.xml中的配置有关.

2.Instantaneous Fair Share
瞬时的公平份额,指的是实时动态分配的资源,它的值是随着集群资源的变动而实时变动的;
如果集群中有队列从active变为inactive(不活动的),那么剩余的队列分到的instaneous fair share都会随之变大;反之,如果有一个队列从inactive变为active,则其他队列的instaneous fair share会随之变小,即instaneous fair share会变小.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1637373.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Javascript:Web APIs(一)

Javascript基础(一) Javascript基础(二) Javascript基础(三) Javascript基础已经结束,接下来我们将进入到整个Web API学习中,在此,我们将学习DOM操作,基本的…

Linux内核之页面映射到虚拟地址:insert_page用法实例(六十五)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒…

卫星通信现状与展望三 -- 6G

作者:私语茶馆 6G星地一体远景规划 中国信通院《6G总体远景与潜在关键技术白皮书》指出6G将实现地面网络、不同轨道高度上 的卫星(高中低轨卫星)以及不同空域飞行器等融合而成全新的移动信息网络,通过地面网络实现城市热点常态化覆盖,利用天基、空基网络实现偏远地…

Flink学习(九)-jar 包提交给 flink 集群执行

一、界面执行 1,点击左侧的 submit new job,然后点击add New 2,粘贴程序入口,设置并行度 3,执行后,就可以在 taskManager 中找到相关任务了 二、控制台执行 在命令行中,在flink 的安装目录下&…

C++ 矩阵

目录 了解矩阵的数学原理(大学线性代数) 矩阵及转置矩阵 矩阵乘法 矩阵快速幂 相伴矩阵模板 [相伴矩阵,快速矩阵幂]CSES1722 Fibonacci Numbers 了解矩阵的数学原理(大学线性代数) 矩阵及转置矩阵 这里A就是一个矩阵&…

pyqt 按钮常用格式Qss设置

pyqt 按钮常用格式Qss设置 QSS介绍按钮常用的QSS设置效果代码 QSS介绍 Qt Style Sheets (QSS) 是 Qt 框架中用于定制应用程序界面样式的一种语言。它类似于网页开发中的 CSS(Cascading Style Sheets),但专门为 Qt 应用程序设计。使用 QSS&am…

2024 五一杯高校数学建模邀请赛(C题)| 煤矿深部开采冲击地压危险预测 |建模秘籍文章代码思路大全

铛铛!小秘籍来咯! 小秘籍团队独辟蹊径,构建了这一题的详细解答哦! 为大家量身打造创新解决方案。小秘籍团队,始终引领着建模问题求解的风潮。 抓紧小秘籍,我们出发吧~ 让我们看看五一杯的C题! 完…

【展会邀请】百华鞋业邀您参加2024山东省休闲旅游产业展!

2024山东省休闲旅游产业展将于4月25日—27日在临沂国际博览中心精彩亮相。本届展会由山东省旅游行业协会、山东省文化产业发展协会主办,山东新琅琊投资发展集团有限公司承办的2024休闲旅游产业展,将在临沂国际博览中心精彩亮相。山东百华鞋业将作为临沂户…

MySQL中索引的数据结构

2.3.1. 索引数据结构 索引就是能够提高查询速度的一种数据结构,在数据插入时就进行了排序(会影响插入和更新的性能),索引广泛使用的是B树索引。 B树索引结构: 目前是基于磁盘排序效率最高的数据结构,树非…

Leetcode—657. 机器人能否返回原点【简单】

2024每日刷题&#xff08;121&#xff09; Leetcode—657. 机器人能否返回原点 实现代码 class Solution { public:bool judgeCircle(string moves) {int rnum 0, lnum 0, unum 0, dnum 0;for(int i 0; i < moves.size(); i) {switch(moves[i]) {case R:rnum;break;c…

Electron+Vue3+Vite+ElectronForge整合-全部ts开发 - 一键启动两个服务 一键打包两个服务

说明 本文介绍一下 Electron Vue3 Vite Electron Forge 的高级整合操作。vue3 : 使用 TS 的语法开发&#xff1b; Electron : 使用 TS 的语法开发。 补充 &#xff1a; 目前Electron的开发还是以JS为主&#xff0c;不过我们可以直接使用TS开发&#xff0c;在执行和打包时&a…

MaskFormer

This repository has been archived by the owner on Aug 30, 2023. It is now read-only.不建议复现

linux系统的rsync命令实现本机到远程主机之间目录的复制和同步

一、rsync命令介绍 在Linux中&#xff0c;rsync 是一个强大的命令行工具&#xff0c;用于同步文件和目录。它可以在本地或通过网络在远程系统之间复制文件。 二、远程目录复制的条件 1、系统要已经安装rsync工具 要使用 rsync 复制远程目录&#xff0c;需要确保系统上安装了 …

高效率的做事方法?

高效率的做事方法可以帮助我们更好地管理时间和资源&#xff0c;以下是一些建议&#xff1a; 1.明确目标和计划&#xff1a; 在开始任何任务之前&#xff0c;先明确你的目标是什么。 制定一个详细的计划&#xff0c;包括步骤、时间表和预期结果。 将任务分解成小块&#xff0…

浅谈Agent AI智能体的未来

Agent AI智能体的未来非常广阔和潜力巨大。随着技术的发展和应用场景的不断拓展&#xff0c;我们可以期待以下几个方面的发展&#xff1a; 更加智能化&#xff1a;Agent AI智能体将会变得越来越智能&#xff0c;具备更强大的学习、推理和决策能力。它们可以通过大数据和机器学习…

修改word文件的创作者方法有哪些?如何修改文档的作者 这两个方法你一定要知道

在数字化时代&#xff0c;文件创作者的信息往往嵌入在文件的元数据中&#xff0c;这些元数据包括创作者的姓名、创建日期以及其他相关信息。然而&#xff0c;有时候我们可能需要修改这些创作者信息&#xff0c;出于隐私保护、版权调整或者其他实际需求。那么&#xff0c;有没有…

Linux系统启动Canal错误

说明&#xff1a;记录在Linux系统&#xff08;Cent OS 7&#xff09;中使用Canal的错误&#xff1b; 场景 将下载的Canal包解压&#xff0c;启动Canal时&#xff0c;Canal没有启动&#xff0c;如下&#xff1a; 分析&#xff1a;hs_err_pid13418.log是JVM运行异常生成的日志文…

SDKMAN!

概述 官网&#xff0c;SDKMAN是一款管理多版本SDK的工具&#xff0c;可以实现在多个版本间的快速切换。 其他特性&#xff1a; 易用&#xff1a;安装SDK不再需要去Google想安装的某个软件的官网的下载页&#xff0c;或找其他下载页面&#xff0c;然后下载安装包、解压、设置…

Apollo Dreamview+之播放离线数据包

前提条件 完成 Dreamview 插件安装&#xff0c;参见 Studio 插件安装 。 操作步骤 您可以通过包管理和源码两种方式快速体验离线数据包播放操作。其中进入 docker 环境和启动 dreamview 的命令有所区别&#xff0c;请您按照命令进行操作。 步骤一&#xff1a;启动并打开 Dr…

踏上R语言之旅:解锁数据世界的神秘密码(三)

多元相关与回归分析及R使用 文章目录 多元相关与回归分析及R使用一.变量间的关系分析1.两变量线性相关系数的计算2.相关系数的假设检验 二.一元线性回归分析的R计算三、回归系数的假设检验总结 一.变量间的关系分析 变量间的关系及分析方法如下&#xff1a; 1.两变量线性相关…