Hadoop运行搭建——系统配置和Hadoop的安装

news2025/1/24 2:17:40

Hadoop运行搭建

前言:
本文原文发在我自己的博客小站,直接复制文本过来,所以图片不显示(我还是太懒啦!)想看带图版的请移步我的博客小站~

Linux镜像:CentOS7

系统安装:CentOS安装参考教程

系统网卡设置:

  • 参考教程:CentOS配置静态IP

  • NAT参数:虚拟机NAT设置参数

系统配置信息:

  • hadoop100:

    • 用户名:user

    • 密码:***

    • 内网IP:192.168.62.140

本博客参考(转载)教程:Hadoop入门

声明:本博客仅作为笔者小白自己学习,作为流程记录方便自己理解

一、虚拟机环境准备

1.检查虚拟机网络

先检查虚拟机是否可以与外网连接,ping一下百度瞅瞅(如果提示没有ping命令,先下载一下网络工具包yum install net-tool)。

ping baidu.com

2.添加软件源

yum update	#养成先更新一下的好习惯
yum install -y epel-release

3.关闭防火墙

方便之后的操作,防止出现由于防火墙安全策略而产生的错误。

systemctl stop firewalld	#关闭防火墙
systemctl disable firewalld.service #关闭防火墙开机自启

4.设置用户账号(按需设置)

useradd Tom	#添加用户
passwd Tom	#修改用户密码

5.给用户添加管理员权限(按需设置)

vim /etc/sudoers	#先切换到root用户,才能执行此命令

找到%wheel(大概在99行,vim设置显示行号命令为“:set nu"),在该项下面添加刚才创建的用户的配置。

为用户添加sudo权限

在网上教程看到的注意事项:”添加user这一行不要直接放到 root行下面,因为所有用户都属于 wheel组,你先配置了user具有免密功能,但是程序执行到 %wheel行时, 该功能又被覆盖回需要密码 。所以user要放到 %wheel这行下面。“

6.创建工作文件夹

在/opt目录下创建文件夹方便一会进行文件传输,并修改所属用户和所属组。

mkdir /opt/module
mkdir /opt/software
chown user:user /opt/module
chown user:user /opt/software

7.卸载虚拟机自带JDK

虚拟机自带的JDK版本可能与Hadoop所需的JDK版本不同。如果两者版本不兼容,可能导致Hadoop无法正常运行。卸载自带JDK可以避免版本冲突、减少资源占用、降低管理复杂性,并提升Hadoop的性能。

rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps

命令解释:

rpm -qa:查询所安装的所有rpm软件包
grep -i:忽略大小写
xargs -n1:表示每次只传递一个参数
rpm -e --nodeps:强制卸载软件

8.重启虚拟机

reboot

二、克隆虚拟机

1.克隆创建虚拟机

我们需要构建好几台类似配置的虚拟机,直接克隆已配置好的hadoop100模板节省时间。

怎么克隆???直接复制虚拟机的所在文件夹,拷贝几份就可以了~

克隆虚拟机

在VM中打开刚才复制下来的虚拟机,修改一下虚拟机名称方便区分。

更改虚拟机名称

2.修改克隆虚拟机IP

不同的虚拟机设置独立IP,设置连续的IP方便处理,设置hadoop102为例,仅修改IP地址,其余不要动,103、104同理。(如果hadoop100静态IP没有就没有设置好,请参考这篇CentOS配置静态IP)

vim /etc/sysconfig/network-scripts/ifcfg-ens32 
修改虚拟机IP

3.配置克隆机主机名映射

以Hadoop102为例,其余虚拟机同样操作。

  • 修改主机名称(这步没搞清楚要干啥,先空着)
vim /etc/hostname 
  • 配置Linux克隆机主机名称映射hosts文件 打开/etc/hosts
vim /etc/hosts

添加以下映射配置(IP地址按实际修改):

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

192.168.62.140 hadoop100	#写出一条样例,方便复制粘贴
  • 重启克隆机
reboot

剩余的虚拟机重复以上操作即可(ps:记得从第2步修改克隆虚拟机IP开始~)。

  • 配置主机映射文件

以上映射文件配置完成后,修改Windows的主机映射文件。进入C:\Windows\System32\drivers\etc路径,打开 hosts文件(用记事本打开,可以看到里边空空如也),添加并保存以下内容 (和刚才在虚拟机配置的一样)。

配置Windows主机映射文件

三、安装JDK

仍然先以Hadoop103为例。

1.检查JDK

确保已卸载虚拟机自带JDK。

java -version	#先查看,如果返回版本信息则说明没有卸载
rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps	#卸载JDK命令,1.7已解释

2.安装JDK

  • 下载JDK

JDK可以在主机下载好之后再通过FTP传给虚拟机(虚拟机搭建FTP服务器的方法有很多,这里不再赘述,小白可移步Linux搭建FTP服务器参考文章),由于我们使用VMware,可以直接从Windows复制粘贴到虚拟机(偷懒,想要掌握技术不建议)。

官网下载有一捏捏麻烦,下载速度也些许感人,我们直接在清华大学镜像下载openJDK8清华源JDK8下载链接

https://mirrors.tuna.tsinghua.edu.cn/Adoptium/8/jdk/x64/linux/

单击它开始下载下载JDK

下载完成之后用FTP工具传给虚拟机,传输过程省略。

这里我直接从Windows主机粘贴到虚拟机目录,一步到位hhh~

将JDK传给虚拟机
  • 将JDK导入软件工作目录

将刚才的JDK存放到/opt/software/路径下。(注意,虚拟机没有经过配置的话无法输入中文,如果懒得去配置可以鼠标选中中文部分右键复制,再在你的命令行右键粘贴。)

(小tip:在输入文件名字时过长不用一个个准确输入,只需输入文件前缀,然后按Tab键自动补全即可)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • 将JDK解压到/opt/module
tar -zxvf /opt/software/OpenJDK8U-jdk_x64_linux_hotspot_8u402b06.tar.gz -C /opt/module/

3.配置JDK环境变量

  • 配置环境变量
ls /opt/module/		#先查看当前jdk包
sudo nano /etc/profile.d/my_env.sh 
配置JDK环境变量
#JAVA_HOME
export JAVA_HOME=/opt/module/jdk8u402-b06	#这里要与刚才看到的JDK包一致
export PATH=$PATH:$JAVA_HOME/bin

引入刚配置的环境变量文件

source /etc/profile
  • 测试JDK是否可用
java -version
查看JDK版本

返回JDK版本信息,说明安装JDK成功~

四、安装Hadoop

1.安装Hadoop

  • 下载Hadoop

hadoop下载链接(有点慢,可能需要一些魔法)

  • 导入Hadoop软件包

通过FTP或者其他方式将刚下载的包导入/opt/software/目录

cp /home/user/下载/hadoop-3.3.6-aarch64.tar.gz /opt/software/
ls /opt/software/	#查看是否已复制

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • 解压Hadoop
tar -zxvf /opt/software/hadoop-3.3.6-aarch64.tar.gz -C /opt/module/
ls /opt/module/		#查看是否解压成功
Hadoop解压成功

2.配置Hadoop环境变量

  • 添加Hadoop环境变量
sudo vim /etc/profile.d/hadoop_env.sh

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.3.6	#与刚才解压的Hadoop包保持一致
export PATH=$PATH:$HADOOP_HOME/bin
  • 加入新配置的环境变量
source /etc/profile
  • 检查Hadoop可用性
hadoop version
验证Hadoop可用性

返回版本信息,Hadoop安装成功并添加进环境变量~

  • 重启虚拟机

刚配置完环境变量,重启电脑检查配置是不是临时性的,避免等到用时因配置恢复而造成不知名错误.

reboot

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1495298.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

在win10中下载桌面版的docker并在docker中搭建运行基于linux的容器

在win10中下载桌面版的docker 1.背景 在很多时候需要linux系统部署项目,在win10中安装虚拟机并在虚拟机中安装linux系统比较繁琐,可以利用win10自带的hyper-v的虚拟机管理工具,打开该虚拟机管理工具,安装docker,并在…

【排序】希尔排序

一、思想 希尔排序,由D.L. Shell于1959年提出,是基于插入排序的一种改进算法。它的主要思想是将待排序的序列分割成若干个子序列,这些子序列的元素是相隔一定“增量”的。然后对每个子序列进行直接插入排序。随着增量的逐步减小,…

数学建模【整数规划】

一、整数规划简介 整数规划其实是线性规划和非线性规划的一个特殊情况,即有的变量取值只能是整数,不能是小数。这时候就需要一个新的函数来解决问题。 对于整数规划,分为线性整数规划和非线性整数规划 线性整数规划:MATLAB可进…

gitlab仓库迁移至bitbucket

0. 场景描述 假设已有一个gitlab仓库:ssh://xxx_origin.git,想要把这个仓库迁移至bitbucket上。 默认gitlab和bitbucket的SSH key都已添加。 1. 新建bitbucket仓库 在bitbucket上创建新的仓库,并复制url地址。假设为: https:/…

Leetcode 26. 删除有序数组中的重复项 java版。 java解决删除重复数组元素并输出长度

1. 官网链接: . - 力扣(LeetCode) 2. 题目描述: 给你一个 非严格递增排列 的数组 nums ,请你 原地 删除重复出现的元素,使每个元素 只出现一次 ,返回删除后数组的新长度。元素的 相对顺序 应该…

一个数据库表格缺少自动增加的字段导致添加一条数据失败

一个数据库表格缺少自动增加的字段导致添加一条数据失败。最近要整理出一个cms网站源程序,因此新建了一个目录,将需要的文件复制到该目录。复制好以后,试用的时候发现添加留言失败。经过数小时的查找原因,最后找到原因&#xff0c…

修复通达OA 百度ueditor 文件上传漏动

前些日子,服务器阿里云监控报警,有文件木马文件,因为非常忙,就没及时处理,直接删除了木马文件了事。 谁知,这几天对方又上传了木马文件。好家伙,今天不花点时间修复下,你都传上瘾了…

苍穹外卖学习-----2024/03/04

1.公共字段填充 代码在这里

【python--读取csv文件统计店铺有关信息】

🚀 作者 :“码上有前” 🚀 文章简介 :Python 🚀 欢迎小伙伴们 点赞👍、收藏⭐、留言💬 python练习题 读取csv文件统计店铺有关信息 读取csv文件统计店铺有关信息 import csv import osdef get_…

L1-096 谁管谁叫爹分数

L1-096 谁管谁叫爹 分数 20 全屏浏览 切换布局 作者 陈越 单位 浙江大学 《咱俩谁管谁叫爹》是网上一首搞笑饶舌歌曲,来源于东北酒桌上的助兴游戏。现在我们把这个游戏的难度拔高一点,多耗一些智商。 不妨设游戏中的两个人为 A 和 B。游戏开始后&…

Android开发者值得深入思考的几个问题,腾讯T3大佬亲自教你

前言 众所周知,移动开发已经来到了后半场,为了能够在众多开发者中脱颖而出,我们需要对某一个领域有深入地研究与心得,对于Android开发者来说,目前,有几个好的细分领域值得我们去建立自己的技术壁垒&#x…

LLM 大模型框架 LangChain 可观测性最佳实践

LLM(Large Language Model)大模型的可观测性是指对模型内部运行过程的理解和监控能力。由于LLM大模型通常具有庞大的参数量和复杂的网络结构,因此对其内部状态和运行过程的理解和监控是一个重要的问题。 什么是 LangChain? Lang…

回溯算法02-组合总合III(Java)

2.组合总合III 题目描述 找出所有相加之和为 n 的 k 个数的组合,且满足下列条件: 只使用数字1到9每个数字 最多使用一次 返回 所有可能的有效组合的列表 。该列表不能包含相同的组合两次,组合可以以任何顺序返回。 示例 1: 输入: k 3,…

simplex算法的代码实现

def pivot(N, B, A, b, c, v, l, e):N对应非基本元变量下标,B对应基本元变量下标,A对应非基本元在约束方程组中的系数相反数形成的矩阵,b对应约束条件中小于等于号右边的数值集合,c对应目标函数中变量系数形成的集合,v对应当前目标函数的取值,l对应转出变量下标在B中的位置&am…

nodejs版本管理工具nvm安装和环境变量配置

1、下载nvm.exe https://github.com/coreybutler/nvm-windows/releases2、安装 1.在D盘根目录新建一个dev文件夹,在dev里面再新建一个nodejs。 2.双击下载好的nvm.exe 修改文件路径,且路径中不能有中文 3.安装完成后在D:\dev\nvm打开settings.txt&…

C++写食堂菜品管理系统

说明:本博文来自CSDN-问答板块,题主提问。 需要:学校拟开发一套食堂菜品管理系统,以便对菜品和同学们的评价进行管理,其中包含如下信息: 商户:商户名称、柜面位置、电话…… 菜品:菜品编号、菜品名称、价格、所属商户…… 学生:注册账号、昵称、电话…… 食堂里的商户…

因果学习篇(2)-Causal Attention for Vision-Language Tasks(文献阅读)

Causal Attention for Vision-Language Tasks 引言 这篇论文是南洋理工大学和澳大利亚莫纳什大学联合发表自2021年的CVPR顶会上的一篇文献,在当前流行的注意力机制中增加了因果推理算法,提出了一种新的注意力机制:因果注意力(CATT)&#xff…

【四】【SQL Server】如何运用SQL Server中查询设计器通关数据库期末查询大题

数据库学生选择1122 数据库展示 course表展示 SC表展示 student表展示 数据库学生选课1122_3 第十一题 第十二题 第十三题 第十四题 第十五题 数据库学生选课1122_4 第十六题 第十七题 第十八题 第十九题 第二十题 数据库学生选课1122_5 第二十一题 第二十二题 结尾 最后&…

Snap7 PLC使用

文章目录 前言一、Snap7是什么?1. 官网下载2.下载后找到关键lib和.h文件 二、使用步骤1.新建一个Qt的工程2.读入数据 总结 前言 提示:这里可以添加本文要记录的大概内容: 项目需要: 提示:以下是本篇文章正文内容&…

JavaSE(上)-Day1

JavaSE(上)-Day1 CMD终端的常见命令配置环境变量的作用?高级记事本安装(略,正版收费)各个语言的运行方式区别为什么Java可以实现跨平台?JDK和JRE的认识JDK是什么?由什么组成JRE是什么?由什么组…