（二）hadoop搭建

（二）hadoop搭建

news2025/2/22 9:06:42

1. 下载

访问https://hadoop.apache.org/releases.html查看hadoop最新下载地址

wget https://dlcdn.apache.org/hadoop/common/hadoop-3.3.4/hadoop-3.3.4.tar.gz

2.解压

tar zxvf hadoop-3.3.4.tar.gz

mv hadoop-3.3.4 /usr/local

3.配置环境变量（新建.sh文件，\etc\profile会遍历\etc\profile.d文件夹下的所有.sh文件）

查看jdk安装路径

依次查看link连接命令，

执行

which java

ls -l /usr/bin/java

ls -l /etc/alternatives/java

sudo vim /etc/profile.d/hadoop_profile.sh

内容如下：

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

export PATH=$PATH:$JAVA_HOME/bin

export HADOOP_HOME=/usr/local/hadoop-3.3.4

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADOOP_HOME/sbin

刷新使配置生效

source /etc/profile

4.查看验证

hadoop version

5.配置集群

集群规划

cd /usr/local/hadoop-3.3.4/etc/hadoop

5.1配置hdfs

vi hdfs-site.xml

在<configuration></configuration>标签中新增如下内容

<property>

<name>dfs.namenode.http-address</name>

<value>hadoop-master:9870</value>

</property>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>hadoop-slave1:9868</value>

</property>

5.2 配置core-site

vi core-site.xml

在<configuration></configuration>标签中新增如下内容

<property>

<name>fs.defaultFS</name>

<value>hdfs://hadoop-master:8020</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop-3.3.4/data</value>

</property>

<property>

<name>hadoop.http.staticuser.user</name>

<value>hadoop</value>

</property>

5.3 配置yarn

vi yarn-site.xml

在<configuration></configuration>标签中新增如下内容

<property>

<name>yarn.nodemanager.env-whitelist</name>

<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>

</property>

<property>

<name>yarn.resourcemanager.hostname</name>

<value>hadoop-slave2</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>

<property>

<name>yarn.log.server.url</name>

<value>http://hadoop-master:19888/jobhistory/logs</value>

</property>

<property>

<name>yarn.log-aggregation.retain-seconds</name>

<value>604800</value>

</property>

5.4配置mapred-site

vi mapred-site.xml

在<configuration></configuration>标签中新增如下内容

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>hadoop-master:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>hadoop-master:19888</value>

</property>

6.把上述配置复制到hadoop-slave1、hadoop-slave2

sudo scp -r /usr/local/hadoop-3.3.4 hadoop@hadoop-slave1:/home/hadoop/

sudo scp -r /usr/local/hadoop-3.3.4 hadoop@hadoop-slave2:/home/hadoop/

分别在hadoop-slave1和hadoop-slave2的/home/hadoop下执行

sudo mv hadoop-3.3.4/ /usr/local/

7.把配置文件hadoop_profile.sh复制到hadoop-slave1和hadoop-slave2

scp /etc/profile.d/hadoop_profile.sh hadoop@hadoop-slave1:/home/hadoop

scp /etc/profile.d/hadoop_profile.sh hadoop@hadoop-slave2:/home/hadoop

分别在slave1和slave2的/home/hadoop下执行

sudo mv hadoop_profile.sh /etc/profile.d/

source /etc/profile

8.配置worker

vi /usr/local/hadoop-3.3.4/etc/hadoop/workers

添加如下内容

hadoop-master

hadoop-slave1

hadoop-slave2

把配置文件workers复制到hadoop-slave1和hadoop-slave2

scp /usr/local/hadoop-3.3.4/etc/hadoop/workers hadoop@hadoop-slave1:/home/hadoop

scp /usr/local/hadoop-3.3.4/etc/hadoop/workers hadoop@hadoop-slave2:/home/hadoop

分别在slave1和slave2执行

sudo mv /home/hadoop/workers /usr/local/hadoop-3.3.4/etc/hadoop/

9.格式化NameNode

集群第一次启动需要先在master节点格式化NameNode

hdfs namenode -format

注意：

格式化NameNode后，集群会产生新的id，导致NameNode和原来DataNode对应的集群id不一致，这样集群就找不到原来的数据。如集群在运行过程中遇到问题，需要重新格式化NameNode的时，需要先停止namenode和datanode进程，并删除所有机器的data和logs目录，然后再格式化。

10. 启动HDFS （在hadoop-master节点执行）

start-dfs.sh

注意：

如果报错ERROR: JAVA_HOME is not set and could not be found.

解决办法：

vi /usr/local/hadoop-3.3.4/etc/hadoop/hadoop-env.sh

修改 JAVA_HOME为实际的jdk的JAVA_HOME路径

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

11. 启动该YARN（在hadoop-slave2节点执行)

start-yarn.sh

12. 启动历史服务器(在hadoop-master节点执行)

mapred --daemon start historyserver

13验证

13.1在hadoop-master节点执行jps

13.2在hadoop-slave1节点执行jps

13.3在hadoop-slave2节点执行jps

13.4访问HDFS 、YARN 、HistoryJob的web端

HDFS

访问：http://hadoop-master:9870

YARN

访问 http://hadoop-slave2:8088

HistoryJob

访问：http://hadoop-master:19888/jobhistory

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1434615.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

IDEA创建SpringBoot+Mybatis-Plus项目

IDEA创建SpringBoot+Mybatis-Plus项目

IDEA创建SpringBootMybatis-Plus项目一、配置Maven apache-maven-3.6.3的下载与安装（详细教程） 二、创建SpringBoot项目在菜单栏选择File->new->project->Spring Initializr，然后修改Server URL为start.aliyun.com&#xff0c…

阅读更多...

TOP100-二叉数

TOP100-二叉数

1.94. 二叉树的中序遍历给定一个二叉树的根节点 root ，返回它的中序遍历。示例 1： 输入：root [1,null,2,3] 输出：[1,3,2]示例 2： 输入：root [] 输出：[]示例 3： 输入&#xf…

阅读更多...

提升你的PHP开发效率：探索JetBrains PhpStorm 2022的全新特性

提升你的PHP开发效率：探索JetBrains PhpStorm 2022的全新特性

在当今快速发展的软件开发领域，选择一个强大且高效的开发工具对于提升开发效率、保证代码质量至关重要。对于PHP开发者来说，JetBrains PhpStorm一直是市场上最受欢迎的IDE之一。随着JetBrains PhpStorm 2022的发布，这款工具带来了一系列创新功…

阅读更多...

springboot 集成 nacos (demo 版)

springboot 集成 nacos (demo 版)

环境要求：本地安装 nacos（windows版本），jdk 是 8，安装完还得在 nacos 上面配置一个 yaml 类型的配置文件，方便项目演示读取。提示：如标题所示，本文只介绍如何从零到一的去集成 naco…

阅读更多...

进程状态、排队

进程状态、排队

进程状态 1. 进程排队2. 进程各个状态3. 查看一个进程的状态4. linux内核描述进程状态5. 孤儿进程 1. 进程排队进程为什么要排队呢？答案就是资源不够。需要等待某个软硬件资源，就像我们常用的scanf函数就是等待键盘资源。之前的文章我们有个结论&#…

阅读更多...

【SpringBoot】策略和模板模式的思考与实践

【SpringBoot】策略和模板模式的思考与实践

一、应用场景之所以会将策略和模板模式放在一起，是因为这两种模式用的最多最广泛，而且基本都是联合使用的。在开始之前，先复习一下模式的定义： 模板模式（Template Pattern） 模板模式是在一个抽象类中定…

阅读更多...

OpenGL 入门（八）— 标准光照模型

OpenGL 入门（八）— 标准光照模型

标准光照模型前言颜色创建一个光照场景标准光照模型环境光照漫反射光照法向量计算漫反射光照完整源码高光反射完整源码 Gouraud着色前言冯氏光照模型(Phong Lighting Model)： 一个通过计算环境光，漫反射，和镜面光分量的值来估计真实光照…

阅读更多...

大模型运行成本对比：GPT-3.5/4 vs. 开源托管

大模型运行成本对比：GPT-3.5/4 vs. 开源托管

在过去的几个月里，生成式人工智能领域出现了许多令人兴奋的新进展。 ChatGPT 于 2022 年底发布，席卷了人工智能世界。作为回应，各行业开始研究大型语言模型以及如何将其纳入其业务中。然而，在医疗保健、金融和法律行业等敏感应用…

阅读更多...

MATLAB实现高通滤波(附完整代码)

MATLAB实现高通滤波(附完整代码)

1.MATLAB实现高通滤波器以下是一个使用MATLAB实现高通滤波器的例子。在这个例子中，我们将设计一个简单的数字高通滤波器，然后将其应用到一个包含低频和高频成分的信号上。 clc;close all;clear all;warning off;%清除变量 rand(seed, 500); randn(s…

阅读更多...

算法学习——LeetCode力扣哈希表篇2

算法学习——LeetCode力扣哈希表篇2

算法学习——LeetCode力扣哈希表篇2 454. 四数相加 II 454. 四数相加 II - 力扣（LeetCode） 描述给你四个整数数组 nums1、nums2、nums3 和 nums4 ，数组长度都是 n ，请你计算有多少个元组 (i, j, k, l) 能满足： 0 …

阅读更多...

PiflowX新增Apache Beam引擎支持

PiflowX新增Apache Beam引擎支持

参考资料： Apache Beam 架构原理及应用实践-腾讯云开发者社区-腾讯云 (tencent.com) 在之前的文章中有介绍过，PiflowX是支持spark和flink计算引擎，其架构图如下所示： 在piflow高度抽象的流水线组件的支持下，我们可以…

阅读更多...

kubesphere部署k8s-v1.23.10

kubesphere部署k8s-v1.23.10

功能： 🕸 部署 Kubernetes 集群 🔗 Kubernetes 多集群管理 🤖 Kubernetes DevOps 🔎 云原生可观测性 🧩 基于 Istio 的微服务治理 💻 应用商店 💡 Kubernetes 边缘节点管理 &#x1…

阅读更多...

SD-WAN：企业网络转型的不可逆趋势

SD-WAN：企业网络转型的不可逆趋势

随着SD-WAN的逐渐发展和完善，越来越多的企业开始选择SD-WAN进行网络转型。IDC研究显示，已有47%的企业成功迁移到SD-WAN，另有48%的公司表示，未来两个月内将纷纷投入这一技术的部署。据Channel Futures报道，一位合作伙伴…

阅读更多...

网络请求库axios

网络请求库axios

一、认识Axios库为什么选择axios? 功能特点: 在浏览器中发送 XMLHttpRequests 请求在 node.js 中发送 http请求支持 Promise API拦截请求和响应转换请求和响应数据补充: axios名称的由来? 个人理解没有具体的翻译. axios: ajax i/o system 二、axios发送请求 1.axios请求…

阅读更多...

sql求解连续两个以上的空座位

sql求解连续两个以上的空座位

Q：查找电影院所有连续可用的座位。返回按 seat_id 升序排序的结果表。测试用例的生成使得两个以上的座位连续可用。结果表格式如下所示。 A:我们首先找出所有的空座位：1，3，4，5 按照seat_id排序（上面已…

阅读更多...

滑动小短剧影视微信小程序源码/带支付收益等模式

滑动小短剧影视微信小程序源码/带支付收益等模式

仿抖音滑动小短剧影视微信小程序源码，带支付收益等模式、支持无限滑动；高性能滑动、预加载、视频预览，支持剧情介绍，集合壁纸另外仿抖音滑动效果；支持会员模式，支持用户单独购买等等多功能。丰富的后台设…

阅读更多...

Deepin系统安装x11vnc远程桌面工具实现无公网ip访问本地桌面

Deepin系统安装x11vnc远程桌面工具实现无公网ip访问本地桌面

文章目录 1. 安装x11vnc2. 本地远程连接测试3. Deepin安装Cpolar4. 配置公网远程地址5. 公网远程连接Deepin桌面6. 固定连接公网地址7. 固定公网地址连接测试 x11vnc是一种在Linux系统中实现远程桌面控制的工具，它的原理是通过X Window系统的协议来实现远程桌面的展…

阅读更多...

2024年2月CCF-全国精英算法大赛题目

2024年2月CCF-全国精英算法大赛题目

第一次参加这种比赛，虽然是c类赛事，但是是ccf主办的，难度还是有点的，主要是前面签到题主要是思想，后面的题目难度太高，身为力扣只刷了一百多道题目的我解决不了，这几道我只做了B,C题,E题超时了&…

阅读更多...

html5 audio video

html5 audio video

DOMException: play() failed because the user didn‘t interact with the document first.-CSDN博客不可用： 可用： Google Chrome Close AutoUpdate-CSDN博客

阅读更多...

rclone基础命令解析及实战

rclone基础命令解析及实战

rclone命令解析及实战 1 rclone介绍：远程同步工具 rclone是一个开源的远程数据同步工具，由Golang编写，旨在在不同平台的文件系统和多种类型的对象存储产品之间提供数据同步功能。它支持超过 40 种不同的云存储服务，包括 Amazon S…

阅读更多...

推荐文章

最新文章