【hadoop】部署hadoop全分布模式

news2026/2/12 6:32:33

hadoop全分布模式

全分布模式特点
部署全分布模式
- 准备工作
- 正式配置
- hadoop-env.sh
- hdfs-site.xml
- core-site.xml
- mapred-site.xml
- yarn-site.xml
- slaves
- 对NameNode进行格式化
- 复制到另外两台虚拟机
- 启动
对部署是否成功进行测试

全分布模式特点

真正的分布式环境，用于生产
具备Hadoop的所有功能：HDFS、Yarn

部署全分布模式

在三台虚拟机上面进行部署

准备工作

1、关闭防火墙（略）

systemctl stop firewalld.service
systemctl disable firewalld.service

2、设置主机名

使用xshell工具，对三台虚拟机同时进行操作
在这里插入图片描述

vi /etc/hosts

在这里插入图片描述

3、免密码登录
ssh-keygen -t rsa 产生自己的公钥和私钥
在这里插入图片描述
将自己的公钥都拷贝给对方

ssh-copy-id -i .ssh/id_rsa.pub root@bigdata112
ssh-copy-id -i .ssh/id_rsa.pub root@bigdata113
ssh-copy-id -i .ssh/id_rsa.pub root@bigdata114

验证一下，都不需要密码

在这里插入图片描述

4、jdk安装（略）

5、同步时间

在这里插入图片描述

6、解压和设置环境变量

每台都需要配置环境变量，另外两台虚拟机bigdata113和bigdata114则不需要解压。

操作详细见在linux上设置Hadoop的环境变量

准备工作已经完成！下面进入正式的部署。

正式配置

在这里插入图片描述

hadoop-env.sh

路径：/root/training/hadoop-2.7.3/etc/hadoop（$HADOOP_HOME/etc/hadoop）

更改第25行 export JAVA_HOME=/root/training/jdk1.8.0_181

hdfs-site.xml

进入 /root/training/hadoop-2.7.3/etc/hadoop/ 路径找到 hdfs-site.xml 文件进行编辑。
在这里插入图片描述

vi hdfs-site.xml

将下面xml代码添加该文件

<!--数据块的冗余度，默认是3-->
<!--一般来说，数据块冗余度跟数据节点的个数一致，最大不超过3-->
<property>
	<name>dfs.replication</name>
	<value>2</value>
</property>

<!--禁用了HDFS的权限检查-->
<property>
	<name>dfs.permissions</name>
	<value>false</value>
</property>

在这里插入图片描述

core-site.xml

需要在hadoop目录下，先创建出tmp文件，作为HDFS对应的操作系统目录。

mkdir /root/training/hadoop-2.7.3/tmp

编辑操作与上面文件相同，则不演示。

<!--配置NameNode的地址-->
<!--9000是RPC通信的端口-->
<property>
	<name>fs.defaultFS</name>
	<value>hdfs://bigdata112:9000</value>
</property>

<!--HDFS对应的操作系统目录-->
<!--默认值是Linux的tmp目录-->
<property>
	<name>hadoop.tmp.dir</name>
	<value>/root/training/hadoop-2.7.3/tmp</value>
</property>

mapred-site.xml

这个文件默认没有，需要我们先复制

cp mapred-site.xml.template mapred-site.xml

在这里插入图片描述

<!--配置MapReduce运行的框架是Yarn-->
<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
</property>

yarn-site.xml

<!--配置ResourceManager的地址-->
<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>bigdata112</value>
</property>

<!--MapReduce运行的方式是洗牌-->
<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
</property>

slaves

slaves中指定从节点的地址，将localhost改成bigdata113 bigdata114

对NameNode进行格式化

执行下面这条命名

hdfs namenode -format

成功则出现下面这句话。
在这里插入图片描述

复制到另外两台虚拟机

把bigdata112上的整个hadoop目录复制到bigdata113和bigdata114上面
先进入/root/training目录，执行下面两句完成复制。

scp -r hadoop-2.7.3/ root@bigdata113:/root/training
scp -r hadoop-2.7.3/ root@bigdata114:/root/training

启动

在bigdata112上面启动集群

start-all.sh

在这里插入图片描述

对部署是否成功进行测试

1、准备数据
在这里插入图片描述

2、将本地文件上传到hdfs

在这里插入图片描述

3、执行wordcount程序

进入/root/training/hadoop-2.7.3/share/hadoop/mapreduce/

hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /input /output/wc

4、查看结果

hdfs dfs -ls /output/wc
hdfs dfs -cat /output/wc/part-r-00000

在这里插入图片描述
5、停止集群

 stop-all.sh

在这里插入图片描述
测试完成！部署成功！！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/755754.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【hadoop】部署hadoop全分布模式

hadoop全分布模式

全分布模式特点

部署全分布模式

准备工作

正式配置

hadoop-env.sh

hdfs-site.xml

core-site.xml

mapred-site.xml

yarn-site.xml

slaves

对NameNode进行格式化

复制到另外两台虚拟机

启动

对部署是否成功进行测试

相关文章

【动手学习深度学习--逐行代码解析合集】19含并行连结的网络（GoogleNet）

H3C-Cloud Lab实验-三层交换机实验

WAIC2023| AIGC究竟在向善还是向恶而行？

Flink是什么

css之混合模式、文字智能适配背景、文字镂空效果、差值模式、滤色模式、difference、screen、overlay、mix、blend、mode

【python】python手机评论抓取+情感分析（python代码+报告）

1.8 运用C编写ShellCode代码

Linux —— 进程介绍

RNA病毒基因组的重头组装-内含tophat2报错的快速解决办法-CPIV3数据分析-2023-07-13

Java 核心技术卷I 第4章对象与类

云计算相关概念

驱动程序——字符设备驱动框架

学习使用FAsyncTask执行异步任务

SPEC CPU 2006 在 CentOS 5.0 x86_64 古老系统测试【4】-O3 不支持编译失败

谈 Delphi 中 JSON 的简便操作（非常简单）

51. N 皇后（递归+回溯）

计算机毕设大数据电商用户行为分析及可视化

大数据分析平台能为企业带来哪些好处_光点科技

【ArcGIS微课1000例】0070：制作宾馆酒店分布热度热力图

[QT编程系列-11]：C++图形用户界面编程，QT框架快速入门培训 - 5- QT主要控件与自定义控件