Hadoop 之分布式集群配置与使用（三）

news2025/4/18 2:50:52

Hadoop 之分布式集群

一.集群实例创建
二.配置
- 1.创建三个虚拟机（Anolis）
- - 1.修改 HostName
  - 2.配置免密登录，配置前
- 2.配置命名节点
- - 1.在 nd1 / nd2 部署 hadoop
  - 2.配置
- 3.查看集群信息
三.测试

一.集群实例创建

以三个 Hadoop 实例创建集群，可以用虚拟机，或者Docker容器来实现。本教程直接使用虚拟机演示
集群架构可参考下图：客户端、命名节点和数据节点

在这里插入图片描述

查看 Hadoop 配置文件目录：ll $HADOOP_HOME/etc/hadoop

在这里插入图片描述

Hadoop 基本概念与含义

名称	含义
HDFS	Hadoop Distributed File System，Hadoop 分布式文件系统的简称
NameNode	指挥其它节点存储的节点，用于映射文件在集群存储的位置
Secondary NameNode	副命名节点，用于备份命名节点数据，并协助命名节点进行管理工作；命名节点崩溃后可以用来恢复其数据，可以有多个
DataNode	用来储存数据块的节点，HDFS基础存储单位，受命名节点协调管理
core-site.xml	Hadoop 核心配置
hdfs-site.xml	HDFS 配置项
mapred-site.xml	MapReduce 配置项，映射和规约，对大型任务分治处理
yarn-site.xml	YARN 配置项
workers	记录所有的数据节点的主机名或 IP 地址

二.配置

1.创建三个虚拟机（Anolis）

虚拟机名称	地址	Host Name
hadoop_1	192.168.1.6	nn
hadoop_2	192.168.1.7	nd1
hadoop_3	192.168.1.8	nd2

在这里插入图片描述

1.修改 HostName

## 修改 192.168.1.6 服务器
hostnamectl set-hostname nn
echo "192.168.1.7 nd1" >> /etc/hosts
echo "192.168.1.8 nd2" >> /etc/hosts
## 修改 192.168.1.7 服务器
hostnamectl set-hostname nd1
echo "192.168.1.6 nn" >> /etc/hosts
echo "192.168.1.8 nd2" >> /etc/hosts
## 修改 192.168.1.8 服务器
hostnamectl set-hostname nd2
echo "192.168.1.6 nn" >> /etc/hosts
echo "192.168.1.7 nd1" >> /etc/hosts

以 192.168.1.6 为例

在这里插入图片描述

2.配置免密登录，配置前

ssh root@nd1

在这里插入图片描述

## 修改 192.168.1.6 服务器
ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa
ssh-copy-id -i ~/.ssh/id_rsa root@nd1
ssh-copy-id -i ~/.ssh/id_rsa root@nd2
## 修改 192.168.1.7 服务器
ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa
ssh-copy-id -i ~/.ssh/id_rsa root@nn
ssh-copy-id -i ~/.ssh/id_rsa root@nd2
## 修改 192.168.1.8 服务器
ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa
ssh-copy-id -i ~/.ssh/id_rsa root@nn
ssh-copy-id -i ~/.ssh/id_rsa root@nd1
## 分别配置本地登录
ssh-copy-id -i ~/.ssh/id_rsa root@localhost

以 192.168.1.6为例，免密访问 nd1

在这里插入图片描述

2.配置命名节点

1.在 nd1 / nd2 部署 hadoop

## 解压文件
mkdir -p /usr/local/java
mkdir -p /usr/local/hadoop
tar zxvf jdk-11.0.19_linux-x64_bin.tar.gz -C /usr/local/java/
tar zxvf hadoop-3.3.6.tar.gz -C /usr/local/hadoop/
## 设置环境变量
echo 'export JAVA_HOME=/usr/local/java/jdk-11.0.19' >> /etc/profile
echo 'export CLASSPATH=$JAVA_HOME/lib:$CLASSPATH' >> /etc/profile
echo 'export PATH=$JAVA_HOME/bin:$PATH' >> /etc/profile
echo 'export HADOOP_HOME=/usr/local/hadoop/hadoop-3.3.6' >> /etc/profile
echo 'export PATH=${PATH}:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin' >> /etc/profile
source /etc/profile

2.配置

## 1.进入
cd $HADOOP_HOME/etc/hadoop
## 2.修改配置 core-site.xml
vim core-site.xml
## 增加如下信息
   <property>
       <name>hadoop.http.staticuser.user</name>
       <value>root</value>
   </property>
   <property>
        <name>fs.defaultFS</name>
        <value>hdfs://nn:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:///home/hadoop/tmp</value>
    </property>
## 3.修改配置 hdfs-site.xml
vim hdfs-site.xml
## 增加如下信息
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:///home/hadoop/hdfs/name</value>
    </property>
    <property>
        <name>dfs.namenode.data.dir</name>
        <value>file:///home/hadoop/hdfs/data</value>
    </property>
## 4.修改配置 yarn-site.xml
vim yarn-site.xml
## 增加如下信息
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>nn</value>
    </property>
## 5.修改配置 mapred-site.xml
vim mapred-site.xml
## 增加如下信息
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
## 6.修改配置 workers
vim workers
## 增加如下信息
nn
nd1
nd2
## 7.将以上两个文件从 nn 复制到 nd1/nd2
scp core-site.xml hdfs-site.xml yarn-site.xml mapred-site.xml hadoop-env.sh workers root@nd1:$HADOOP_HOME/etc/hadoop
scp core-site.xml hdfs-site.xml yarn-site.xml mapred-site.xml hadoop-env.sh workers root@nd2:$HADOOP_HOME/etc/hadoop

core-site.xml

在这里插入图片描述

hdfs-site.xml

在这里插入图片描述

yarn-site.xml

在这里插入图片描述

mapred-site.xml

在这里插入图片描述

workers

在这里插入图片描述

## 格式化命名节点：$HADOOP_HOME/etc/hadoop
hdfs namenode -format
## 启动服务
start-dfs.sh

格式化结果

在这里插入图片描述

启动结果

在这里插入图片描述

## 启动 Yarn
start-yarn.sh

在这里插入图片描述

3.查看集群信息

集群信息：http://192.168.1.6:9870/dfshealth.html#tab-datanode

在这里插入图片描述

在 Windows 访问 http://nd1:9864 要关虚拟机防火墙，并添加 Host 解析，此处直接通过 IP 地址打开

在这里插入图片描述

Yarn 信息：http://192.168.1.6:8088/cluster

在这里插入图片描述

三.测试

## 上传文件
hadoop fs -put /home/test.txt /log/
## 查看文件
hadoop fs -cat /log/test.txt

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/761384.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Hadoop 之分布式集群配置与使用（三）

Hadoop 之分布式集群

一.集群实例创建

二.配置

1.创建三个虚拟机（Anolis）

1.修改 HostName

2.配置免密登录，配置前

2.配置命名节点

1.在 nd1 / nd2 部署 hadoop

2.配置

3.查看集群信息

三.测试

相关文章

对战五子棋——网页版

郭东白的架构课学习笔笔记（1）

【网络安全带你练爬虫-100练】第14练：文件内容的读取、取出

【Gradle】Gradle之JVM进程详解

【机密计算组织】机密计算联盟

SpringBoot中注入ServletFilterListener

关于初识MySQL数据库以及MySQL的基本使用

vue-cesium的基本使用【一】

Git原理与基本操作（含安装教程）

聊一下2023前端状况

【从零开始学习Linux】背景知识与获取环境

谷粒商城第二篇服务功能-商品服务-三级分类

前端Vue自定义可自由滚动新闻栏tabs选项卡标签栏标题栏组件

vue3.0之组合API有哪些(详解)

【档案专题】三、电子档案管理系统

el-cascader级联选择器那些事

cocosCreator笔记之Spine了解

北京银行发放门头沟区首笔知识产权质押贷款

java习题3

Slf4j日志集成

Hadoop 之 分布式集群配置与使用（三）

Hadoop 之 分布式集群

一.集群实例创建

二.配置

1.创建三个虚拟机（Anolis）

1.修改 HostName

2.配置免密登录，配置前

2.配置命名节点

1.在 nd1 / nd2 部署 hadoop

2.配置

3.查看集群信息

三.测试

相关文章

Hadoop 之分布式集群配置与使用（三）

Hadoop 之分布式集群