本地部署HDFS集群

news2025/4/20 21:52:29

首先完成本地部署大数据集群前置准备，可参考：

本地部署大数据集群前置准备https://blog.csdn.net/m0_73641796/article/details/145994787?spm=1001.2014.3001.5501

1.下载hadoop

下载Hadoop安装包，本文用的是hadoop-3.3.4.tar.gz

2. 集群规划

节点	服务
Node1	NameNode、DataNode、SecondaryNameNode
Node2	DataNode
Node3	DataNode

3. 上传解压

以下操作在Node1节点执行，以root身份登录

上传hadoop安装包到node1节点

tar -zxf hadoop-3.3.4.tar.gz -C /export/server/

cd /export/server/
ln -s /export/server/hadoop-3.3.4 hadoop

4. 修改配置文件

1) 配置works

cd hadoop/etc/hadoop

vim workers
--把localhost换为
node1
node2
node3

2) 配置hadoop-env.sh

vim hadoop-env.sh
--填入以下内容
export JAVA_HOME=/export/server/jdk
export HADOOP_HOME=/export/server/hadoop
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export HADOOP_LOG_DIR=$HADOOP_HOME/logs

3) 配置core-site.xml

vim core-site.xml
--填入以下内容
<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://node1:8020</value>
  </property>
  <property>
    <name>io.file.buffer.size</name>
    <value>131072</value>
  </property>
</configuration>

4) 配置hdfs-site.xml

vim hdfs-site.xml
--添加以下内容
<configuration>
  <property>
    <name>dfs.datanode.data.dir.perm</name>
    <value>700</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/data/nn</value>
  </property>
  <property>
    <name>dfs.namenode.hosts</name>
    <value>node1,node2,node3</value>
  </property>
  <property>
    <name>dfs.blocksize</name>
    <value>268435456</value>
  </property>
  <property>
    <name>dfs.namenode.handler.count</name>
    <value>100</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/data/dn</value>
  </property>
</configuration>

5. 准备数据目录

--在node1节点:
mkdir -p /data/nn
mkdir -p /data/dn

--在node2和node3节点:
mkdir -p /data/dn

6. 分发Hadoop文件夹

--在node1执行如下命令:
cd /export/server

scp -r hadoop-3.3.4 node2:`pwd`/
scp -r hadoop-3.3.4 node3:`pwd`/

--在node2执行:
ln -s /export/server/hadoop-3.3.4/ hadoop

--在node3执行:
ln -s /export/server/hadoop-3.3.4/ hadoop

7. 配置环境变量

--在node1,node2,node3均执行以下操作:

vim /etc/profile

export HADOOP_HOME=/export/server/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile

8. 授权hadoop用户

chown -R hadoop:hadoop /data
chown -R hadoop:hadoop /export

9. 格式化HDFS文件系统

su - hadoop
hadoop namenode -format

10. 启动集群

--启动hdfs集群
start-dfs.sh

--关闭hdfs集群
stop-dfs.sh

通过jps可查看正在运行的java进程

11. 查看HDFS WEBUI

在浏览器输入 node1:9870，即可查看

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2309724.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

本地部署HDFS集群

1.下载hadoop

2. 集群规划

3. 上传解压

4. 修改配置文件

1) 配置works

2) 配置hadoop-env.sh

3) 配置core-site.xml

4) 配置hdfs-site.xml

5. 准备数据目录

6. 分发Hadoop文件夹

7. 配置环境变量

8. 授权hadoop用户

9. 格式化HDFS文件系统

10. 启动集群

11. 查看HDFS WEBUI

相关文章

10.【线性代数】—— 四个基本子空间

基于vue框架的游戏商城系统cq070（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。

我代表中国受邀在亚马逊云科技全球云计算大会re:Invent中技术演讲

css3d放置的面板方向不对问题排查

网络安全法与等级保护 PPT 精华汇总

探秘基带算法：从原理到5G时代的通信变革【十】基带算法应用与对比

io学习-----＞标准io

LeetCode 面试题 17.19. 消失的两个数字

KaiwuDB| Google Spanner 经典架构回顾

拼电商客户管理系统

项目准备（flask+pyhon+MachineLearning）- 1

1.2.2 使用Maven方式构建Spring Boot项目

C++中函数的调用

【Linux】之【Bug】VMware 虚拟机开机一直卡在黑屏左上角下划线闪烁界面

RT-DETR融合YOLOv12中的R-ELAN结构

【前端基础】Day 8 H5C3提高

NL2SQL-基于Dify+阿里通义千问大模型，实现自然语音自动生产SQL语句

Java 9 到 Java 21 新特性全解析：从语法简化到API增强

skia的学习与研究

网络编程 day01