十六、YARN和MapReduce配置

news2026/2/18 10:03:51

1、部署前提

（1）配置前提

已经配置好Hadoop集群。

配置内容：

（2）部署说明

（3）集群规划

2、修改配置文件

MapReduce

（1）修改mapred-env.sh配置文件

export JAVA_HOME=/export/server/jdk
export HADOOP_JOB_HISTORYSERVER_HEAPSIZE=1000
export HADOOP_MAPRED_ROOT_LOGGER=INFO,RFA

（2）修改mapred-site.xml配置文件

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    <description></description>
  </property>
  <property>
    <name>mapreduce.jobhistory.address</name>
    <value>node1:10020</value>
    <description></description>
  </property>
  <property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>node1:19888</value>
    <description></description>
  </property>
  <property>
    <name>mapreduce.jobhistory.intermediate-done-dir</name>
    <value>/data/mr-history/tmp</value>
    <description></description>
  </property>
  <property>
    <name>mapreduce.jobhistory.done-dir</name>
    <value>/data/mr-history/done</value>
    <description></description>
  </property>
  <property>
    <name>yarn.app.mapreduce.am.env</name>
    <value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
  </property>
  <property>
    <name>mapreduce.map.env</name>
    <value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
  </property>
  <property>
    <name>mapreduce.reduce.env</name>
    <value>HADOOP_MAPRED_HOME=$HADOOP_HOME</value>
  </property>
</configuration>

yarn

（1）修改yarn-env.sh文件

export JAVA_HOME=/export/server/jdk
export HADOOP_HOME=/export/server/hadoop
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
# export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop
# export YARN_LOG_DIR=$HADOOP_HOME/logs/yarn
export HADOOP_LOG_DIR=$HADOOP_HOME/logs

（2）修改yarn-site.xml文件

<configuration>

<!-- Site specific YARN configuration properties -->
<property>
    <name>yarn.log.server.url</name>
    <value>http://node1:19888/jobhistory/logs</value>
    <description></description>
</property>

  <property>
    <name>yarn.web-proxy.address</name>
    <value>node1:8089</value>
    <description>proxy server hostname and port</description>
  </property>


  <property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
    <description>Configuration to enable or disable log aggregation</description>
  </property>

  <property>
    <name>yarn.nodemanager.remote-app-log-dir</name>
    <value>/tmp/logs</value>
    <description>Configuration to enable or disable log aggregation</description>
  </property>


<!-- Site specific YARN configuration properties -->
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>node1</value>
    <description></description>
  </property>

  <property>
    <name>yarn.resourcemanager.scheduler.class</name>
    <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>
    <description></description>
  </property>

  <property>
    <name>yarn.nodemanager.local-dirs</name>
    <value>/data/nm-local</value>
    <description>Comma-separated list of paths on the local filesystem where intermediate data is written.</description>
  </property>


  <property>
    <name>yarn.nodemanager.log-dirs</name>
    <value>/data/nm-log</value>
    <description>Comma-separated list of paths on the local filesystem where logs are written.</description>
  </property>


  <property>
    <name>yarn.nodemanager.log.retain-seconds</name>
    <value>10800</value>
    <description>Default time (in seconds) to retain log files on the NodeManager Only applicable if log-aggregation is disabled.</description>
  </property>



  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
    <description>Shuffle service that needs to be set for Map Reduce applications.</description>
  </property>
</configuration>

分发配置文件

3、开启YARN服务器集群

（1）node1节点，以Hadoop用户，执行如下语句：

//开启Hadoop集群
start-dfs.sh
//开启yarn集群
start-yarn.sh
//因为代理服务器已经在配置文件中配置完毕，但历史服务器需要手动开启
//开启历史服务器
mapred --daemon start historyserver

（2）执行结果展示、

（3）查看YARN的Web-UI页面

打开本地浏览器，输入node1:8088，即可打开本地YARN的Web-UI页面。

4、总结

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1314415.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

十六、YARN和MapReduce配置

1、部署前提

（1）配置前提

（2）部署说明

（3）集群规划

2、修改配置文件

MapReduce

（1）修改mapred-env.sh配置文件

（2）修改mapred-site.xml配置文件

yarn

（1）修改yarn-env.sh文件

（2）修改yarn-site.xml文件

分发配置文件

3、开启YARN服务器集群

（1）node1节点，以Hadoop用户，执行如下语句：

（2）执行结果展示、

（3）查看YARN的Web-UI页面

4、总结

相关文章

基于BWA，Bowtie2，samtools、checkm等工具计算宏基因组学序列分析中Contigs与Genes在样品中的丰度，多种计算方式和脚本对比

2023.12.14每日一题

GPT-4V被超越？SEED-Bench多模态大模型测评基准更新

Tomcat-安装部署（源码包安装）

【期末复习向】长江后浪推前浪之ChatGPT概述

jenkins-Generic Webhook Trigger指定分支构建

Redis设计与实现之跳跃表

使用React实现随机颜色选择器，JS如何生成随机颜色

智能插座是什么

Python：如何将MCD12Q1\MOD11A2\MOD13A2原始数据集批量输出为TIFF文件(镶嵌/重投影/)？

【STM32独立看门狗(IWDG) 】

Knife4j 接口文档如何设置 Authorization 鉴权参数?

用23种设计模式打造一个cocos creator的游戏框架----(十一)桥接模式

高并发如何实现单用户信息查询接口

Nessus漏洞扫描报错：42873 - SSL Medium Strength Cipher Suites Supported (SWEET32)

网络互通--三层交换机配置

自然语言处理阅读第一弹

用23种设计模式打造一个cocos creator的游戏框架----(十七)命令模式

2024年20多个最有创意的AI人工智能点子

基于C/C++的libcurl多协议文件传输库dll二次封装开发使用