10.Yarn概述

news2025/1/24 2:26:01

如果说HDFS是存储,则Yarn就是cpu和内存,mapreduce就是程序。

1.基础架构 

复习:

1.Container就是一个容器,其中封装了需要使用的内存与cpu

2.每当提交一个job,就会产生一个appMaster(总指挥),app Master负责其他container里面的MapTask和ReduceTask.

3.NodeManager是一个开关,真正跑任务的是appMaster.

2.Yarn工作机制

步骤解读:

- (0)MR程序提交到客户端所在的节点。

- (1)YarnRunner向ResourceManager申请一个Application。

- (2)RM将该应用程序的资源路径返回给YarnRunner。

- (3)该程序将运行所需资源提交到HDFS上。

- (4)程序资源提交完毕后,申请运行mrAppMaster。

- (5)RM将用户的请求初始化成一个Task。

- (6)其中一个NodeManager领取到Task任务。

- (7)该NodeManager创建容器Container,并产生MRAppmaster。

- (8)Container从HDFS上拷贝资源到本地。

- (9)MRAppmaster向RM 申请运行MapTask资源。

- (10)RM将运行MapTask任务分配给另外两个NodeManager,另两个NodeManager分别领取任务并创建容器。

- (11)MR向两个接收到任务的NodeManager发送程序启动脚本,这两个NodeManager分别启动MapTask,MapTask对数据分区排序。

- (12)MrAppMaster等待所有MapTask运行完毕后,向RM申请容器,运行ReduceTask。

- (13)ReduceTask向MapTask获取相应分区的数据。

- (14)程序运行完毕后,MR会向RM申请注销自己。

3.Hadoop三驾马车的关系

4.Yarn调度器

 hadoop默认调度器有三种:先进先出调度器,容量调度器,公平调度器

1.FIFO

先进先出调度器

   

缺点:任务先到先执行,没有任务优先级一说

2.Capacity Scheduler

容量调度器

3.Fair Scheduler

公平调度器

 关于缺额的解释:

       如上图,一个队列有20%的资源,跑四个任务,每个任务占比5%;这时候新加入一个任务,

理论上是五个人评价分配资源,但是实际上,当job5想要加入的时候,前面4个已经开始跑了,job5并不会里面得到资源。所以

某一时刻上,一个job应该获得的资源和实际获得资源的差据叫缺额

调度器会优先为缺额大的job分配资源:也就是说前面job释放的资源会优先提供给job5.但是每一个job都会有最小资源的保证

只要一直向缺额大的job分配资源,最终整个资源会达到动态平衡的状态

 ps.理论上的资源也不是平均分的,而是根据job的需求和优先级(权重)确定

 5.Yarn常见配置

在yarn-site.xml里面配置,套用以下格式去改

<property>
    <name>   需要添加的名称    </name>
    <value>  需要添加的值      </value>
</property>

1.ResourceManager性能相关

2.Yarn集群资源配置(NodeManager)

2.1 自动配置(用的少)

ps.虚拟核数就是骗yarn,让他以为job有更多资源 

2.2 手动配置

3.Yarn容器资源配置 

4.Yarn容器内存限制

ps.2.1的意思就是我允许你申请1G内存,但是你最大可以申请到2.1G的虚拟内存

 5.容量调度器相关配置

ps.为什么默认值是0.1而不是1:如果appMaster占用的资源太多,那么mapTask和reduceTask的运行就会有问题 

6. 多队列配置  

多对列的使用案例:

ps.容量调度器只有一条Default队列,是一条单队列的调度器,在实际使用中会出现单个任务阻塞整个队列的情况。因此就需要我们按照业务种类配置多条任务队列。

  在capacity-scheduler.xml进行如下配置:

ps.就是把defualt的内容复制一下,改成hive,然后修改value即可

1.指定多队列,增加hive队列

<property>
    <name>yarn.scheduler.capacity.root.queues</name>
    <value>default,hive</value>
    <description>
      The queues at the this level (root is the root queue).
    </description>
</property>

  2.降低default队列资源额定容量为40%,提升hive队列资源额定容量为60%

<property>
    <name>yarn.scheduler.capacity.root.default.capacity</name>
    <value>40</value>
</property>

<property>
    <name>yarn.scheduler.capacity.root.hive.capacity</name>
    <value>60</value>
</property>

3.配置hive队列的其他属性

<property>
    <name>yarn.scheduler.capacity.root.hive.user-limit-factor</name>
    <value>1</value>
</property>
<!-- 指定hive队列的资源最大容量 -->
<property>
    <name>yarn.scheduler.capacity.root.hive.maximum-capacity</name>
    <value></value>
</property>

<property>
    <name>yarn.scheduler.capacity.root.hive.state</name>
    <value>RUNNING</value>
</property>

<property>
    <name>yarn.scheduler.capacity.root.hive.acl_submit_applications</name>
    <value>*</value>
</property>

<property>
    <name>yarn.scheduler.capacity.root.hive.acl_administer_queue</name>
    <value>*</value>
</property>

<property>
    <name>yarn.scheduler.capacity.root.hive.acl_application_max_priority</name>
    <value>*</value>
</property>

<property>
    <name>yarn.scheduler.capacity.root.hive.maximum-application-lifetime</name>
    <value>-1</value>
</property>

<property>
    <name>yarn.scheduler.capacity.root.hive.default-application-lifetime</name>
    <value>-1</value>
</property>

 配置完成后,重启yarn即可

结果如下:

4. 最后在driver中声明

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/468408.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【分布式技术专题】「分布式技术架构」手把手教你如何开发一个属于自己的Redis延时队列的功能组件

手把手教你如何开发一个属于自己的延时队列的功能组件 前提介绍解决痛点延时队列组件的架构延时队列组件的初始化流程延时队列组件的整体核心类架构延时队列组件的整体核心类功能 延时队列的开发组件延迟队列的机制配置初始化类源码 - DelayedQueueConfigurationRedission客户端…

排序算法 - 冒泡排序

文章目录 冒泡排序介绍冒泡排序实现复杂度和稳定性冒泡排序时间复杂度冒泡排序稳定性 代码实现核心&注意结尾 每日一道算法提高脑力&#xff0c;今天是第一天&#xff0c;来个最简单的算法–冒泡排序。 冒泡排序介绍 它是一种较简单的排序算法。它会遍历若干次要排序的数列…

jQuery知识点一

一、 jQuery 介绍 1.jQuery的概念&#xff1a; jQuery 是一个快速、简洁的 JavaScript 库&#xff0c;其设计的宗旨是“write Less&#xff0c;Do More”&#xff0c;即倡导写更少的代码&#xff0c;做更多的事情。 j 就是 JavaScript&#xff1b; Query 查询&#xff1b; 意思…

学习 Python 之 Pygame 开发魂斗罗(十五)

学习 Python 之 Pygame 开发魂斗罗&#xff08;十五&#xff09; 给魂斗罗游戏加入Boss1. 分析boss2. 创建boss类3. 在主类中加载Boss4. 修改子弹类逻辑&#xff0c;让boss可以开火5. 修改主类逻辑&#xff0c;让boss正常开火 给魂斗罗游戏加入Boss 在上次的博客学习 Python 之…

如何在不重装系统的情况下换固态硬盘?

随着固态硬盘的价格不断下降&#xff0c;越来越多的计算机用户希望用固态硬盘替换老旧的机械硬盘以获得更好的性能。 但是常规方法就避免不了重装系统&#xff0c;用户配置文件、系统设置、个人文件和已安装的程序又需要重新配置一遍。此外&#xff0c;还可能重新遇到很多问题…

城市“一网统管”平台—智慧平安小区的场景应用

随着城市建设进程的不断加快&#xff0c;关于城市的智能化治理需求也随之增多。在国家发布的“十四五”规划中&#xff0c;已经明确指出&#xff0c;推进新型城市建设&#xff0c;推行城市运行一网统管。作为推动城市治理体系和治理能力现代化的重要探索&#xff0c;“一网统管…

Linux/Unix常见IO模型

阻塞&#xff08;Blocking I/O&#xff09;、非阻塞&#xff08;Non-Blocking I/O&#xff09;、IO多路复用&#xff08;I/O Multiplexing&#xff09;、 信号驱动 I/O&#xff08;Signal Driven I/O&#xff09;&#xff08;不常用&#xff09;和异步&#xff08;Asynchronous…

智能家居“落地者”:三翼鸟用场景方案持续链接大众消费

互联网分析沙龙(techxue)原创 作者 &#xff5c; 锡海 编辑 &#xff5c; 七喜 从上海车展再到AWE2023展会&#xff0c;只要有大型活动的地方&#xff0c;都能看到人潮汹涌的景象&#xff0c;久违的烟火气又回来了。数据显示&#xff0c;社会消费已出现较为强劲反弹&#xff0…

长知识了,mongo的时间居然这个样子

1、前言 最近一直在使用mongo数据库&#xff0c;前面文章也介绍了一直在做数据过期的事情&#xff0c; mongo中的数据过期时间之前在程序中增加了一个字段 【Springboot系列】项目启动时怎么给mongo表加自动过期索引 之前看到时间字段没有时区的信息&#xff0c;没有关注&a…

微服务注册中心选型:Zookeeper、Eureka、Nacos、Consul和Etcd

注册中心基本概念 什么是注册中心&#xff1f; 注册中心主要有三种角色&#xff1a; 服务提供者&#xff08;RPC Server&#xff09;&#xff1a;在启动时&#xff0c;向 Registry 注册自身服务&#xff0c;并向 Registry 定期发送心跳汇报存活状态。 服务消费者&#xff08…

怎么知道网站服务器有没有被攻击?

​  一个网站服务器遭到攻击可能会给企业带来巨大的金融损失&#xff0c;因此&#xff0c;企业需要及时发现服务器是否被攻击。但是&#xff0c;企业如何知道自己的服务器是否被攻击呢?下面&#xff0c;我们来看一些服务器被攻击的警告信号。 1.网络延迟增加 在网络攻击中&a…

记一次运气非常好的渗透到服务器的经历

平平无奇的客服平台 这个客服平台是有RCE的&#xff0c;如果上传到的不是oss服务器&#xff0c;存储在本地服务器的话 在返回端口的url是存在st2 root权限&#xff0c;由于是客服后台服务器&#xff0c;没有啥有用价值的信息 直接替换私钥连服务器 继续翻找有用的信息 配置文件…

Django性能监视工具django-silk的使用

django-silk 是一个轻量级的 Django 应用性能监视工具&#xff0c;可帮助您了解 Django 应用的性能瓶颈、数据库查询等问题。它可以使用在django前后端分离的项目中&#xff0c;直接通过请求后台API接口即可对性能进行监视。以下是 django-silk 的使用步骤&#xff1a; 1.安装…

资本认可 | 开源网安成为中国未来独角兽企业,引领软件安全不断发展

4月11日&#xff0c;第七届万物生长大会中国未来独角兽大会盛大召开&#xff0c;本次大会中国投资发展促进会创投专委会联合微链共同发布了《2023中国未来独角兽TOP100榜单》&#xff0c;开源网安成功入选榜单。 《2023中国未来独角兽TOP100榜单》瞄准近两年融资较为活跃或融资…

快速简单制作macOS Ventura系统ISO格式镜像

ISO格式的镜像其实没有什么制作难度&#xff0c;下面苹果系统之家教大家怎么快速简单制作ISO格式的镜像&#xff0c;教程使用到的都是Mac官方的命令。制作好的ISO格式镜像可以用于虚拟机安装或者制作到U盘或者直接在Mac里面打开安装升级。 准备系统镜像 首先下载好macOS 镜像…

上海亚商投顾:沪指延续反弹涨0.67% AI概念股掀跌停潮

指数今日低开高走&#xff0c;沪指午后一度涨超1%&#xff0c;以保险为首的大金融板块拉升&#xff0c;中国平安在一季报驱动下&#xff0c;迎来久违涨停&#xff0c;成交超120亿元。医药股全天强势&#xff0c;何氏眼科、金石亚药、普蕊斯、天宇股份20CM涨停&#xff0c;第一医…

约翰霍普金斯大学诺奖得主涉嫌造假,撤回5篇PNAS论文

2019年&#xff0c;约翰霍普金斯大学的著名基因医学科学家Gregg L. Semenza博士因为“发现细胞如何感知和适应氧气供应”&#xff0c;和另外两名科学家&#xff08; William Kaelin Jr. and Peter J. Ratcliffe&#xff09;分享当年的生理医学诺贝尔奖。 近期&#xff0c;Gregg…

SpringBoot整合WebSocket详细教程

预期效果 共开启两个页面&#xff0c;实现一对一聊天。 服务端代码&#xff1a;https://gitee.com/lianaozhe/springboot-websocket.git 代码实现逻辑 服务端 导入相关依赖&#xff1a; <dependency><groupId>org.springframework.boot</groupId><art…

Silane-PEG-FITC 硅烷聚乙二醇荧光素FITC-PEG-Silane在医疗设备领域有广泛应用,具有很好的生物相容性。

FITC-PEG-Silane&#xff0c;荧光素-聚乙二醇-硅烷 中文名称&#xff1a;荧光素-聚乙二醇-硅烷 英文名称&#xff1a;FITC-PEG-Silane 存储条件&#xff1a;-20C&#xff0c;避光&#xff0c;避湿 性状 :白色、微黄色粉末或固体&#xff0c;取决于分子量 溶剂&#xff1a;…

新版android studio gradle插件7.4.2.pom一直无法下载问题

android studio同步时候出现org.gradle.api.plugins.UnknownPluginException&#xff0c;Plugin [id: com.android.application, version: 7.4.2] was not found in any of the following sources: pom插件一直无法下载&#xff0c;搞了好几天&#xff0c;简直想砸电脑&#x…