Hadoop的安装和使用-2024年08月01日

news2025/2/23 3:52:15

Hadoop的安装和使用-2024年08月01日

1.创建Hadoop用户
2.SSH登陆权限设置
3.java的安装
4.Hadoop单机安装配置
5.Hadoop伪分布式安装配置

1.创建Hadoop用户

如果安装Ubuntu的时候不是用的“hadoop”用户，那么需要增加一个名为 hadoop的用户首先按ctrl+alt+t打开终端窗口，输入如下命令创建新用户

$ sudo useradd -m hadoop -s /bin/bash

上面这条命令创建了可以登陆的hadoop 用户，并使用/bin/bash 作为shell接着使用如下命令设置密码，可简单设置为hadoop，按提示输入两次密码，密码不能够包括用户名，不能太简单，不能少于8位，不能使用password作为密码。

$ sudo passwd hadoop

可为hadoop用户增加管理员权限，方便部署，避免一些对新手来说比较棘手的权限问题，这一步执行完一定他要显示正在将hadoop加入。。。即为成功

$ sudo adduser hadoop sudo

在这里插入图片描述

hadoop账户创建成功后，切换当前用户至hadoop，再继续往下操作注意注意

2.SSH登陆权限设置

SSH为Secure Shell的缩写，是建立在应用层和传输层基础上的安全协议。SSH是目前较可靠、专为远程登录会话和其他网络服务提供安全性的协议。
SSH是由客户端和服务端的软件组成，服务端是一个守护进程(daemon)，它在后台运行并响应来自客户端的连接请求，客户端包含ssh程序以及像scp（远程拷贝）、slogin（远程登陆）、sftp（安全文件传输)等其他的应用程序

1.安装vim

$sudo apt-get install vim

在这里插入图片描述

2.下载SSH服务端和客户端

$sudo apt-get install openssh-server

在这里插入图片描述

3.登录本机

$ssh localhost   //输入 'yes'，登录本机，每次登录都需密码

在这里插入图片描述

4.配置无密码登录

$exit      //退出登录
$cd  ~/.ssh/ //切换到ssh目录
$ssh-keygen -t rsa //生成密钥，之后在这会按几次回车，看下图
$cat ./id_rsa.pub >> ./authorized_keys //将密钥添加到公钥中

在这里插入图片描述

5.无密码登录

$ssh localhost  //本次登录无需输入密码

3.java的安装

Java环境可选择Oracle的JDK，或是OpenJDK可以在Ubuntu中直接通过命令安装OpenJDK8
1.首先更新下包

sudo apt update

2.安装jdk1.8

sudo apt install openjdk-8-jdk

3.验证安装

java -version

在这里插入图片描述
4.查看你安装目录

update-alternatives --list java

在这里插入图片描述
5.将 Java 可执行文件的路径添加到 PATH 环境变量中：

echo 'export PATH="$PATH:/usr/lib/jvm/java-8-openjdk-amd64/bin"' >> ~/.bashrc
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/jre

6.重新加载环境变量

source ~/.bashrc

7.pwd查看自己当前路径
在这里插入图片描述
8.在此目录下新建一个文本，写个简单的java代码，做测试

public class test {
	public static void main(String[] args) {
		for(int i = 0; i < 10; i++) {
			System.out.print(i);
		}
	}
}

9.修改格式为java文件
在这里插入图片描述

10.打开命令终端 ctrl+alt+t，执行编译命令，代码没错的情况下，会在同目录下多一个文件叫test.class

javac test.java

在这里插入图片描述
11.执行编译文件

java test

在这里插入图片描述
12.至此安装及检测完成

4.Hadoop单机安装配置

1.用linux自带的firefox浏览器访问Hadoop官网，从Apach官网上下载Hadoop 2.10.2版本
https://downloads.apache.org/hadoop/common/hadoop-2.10.2/hadoop-2.10.2.tar.gz
在这里插入图片描述
这里可以看到下载的非常慢，可以使用国内镜像下载
https://downloads.apache.org/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz

2.解压安装Hadoop2.10.2

$cd ~/下载  //切换到Hadoop安装包的位置
$sudo tar -zxf  hadoop-2.10.2.tar.gz -C /usr/local   //将Hadoop解压到/usr/local目录下
$cd /usr/local
$sudo mv ./hadoop-2.10.1/ ./hadoop     //将目录名改为hadoop
$sudo chown -R hadoop ./hadoop         //修改目录权限

在这里插入图片描述
3.检查是否可用

$ cd /usr/local/hadoop
$ ./bin/hadoop version

显示下图即为成功，如果显示JAVA_HOME找不到，自己回到上面重新配置java的path
在这里插入图片描述
4.将hadoop配置环境变量

$sudo vim ~/.bashrc  //打开环境变量目录写入

export HADOOP_HOME=/usr/local/hadoop
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"
export PATH=${JAVA_HOME}/bin:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:$PATH

在这里插入图片描述
5.查看Hadoop版本信息

$hadoop version   //查看版本信息

在这里插入图片描述

5.Hadoop伪分布式安装配置

1.跳转目录

cd /usr/local/hadoop/etc/hadoop

2.修改 core-site.xml

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

3.修改 hdfs-site.xml

<configuration>
        <property>
                <name>dfs.replication</name>
                <value>1</value>
        </property>
        <property>
                <name>dfs.namenode.name.dir</name>
                <value>file:/usr/local/hadoop/tmp/dfs/name</value>
        </property>
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>file:/usr/local/hadoop/tmp/dfs/data</value>
        </property>
</configuration>

4.关闭搜友命令窗口，重新打开命令窗，做格式化并启动

/usr/local/hadoop/bin/hdfs namenode -format

执行后会又一大堆字符，看到has been successfully …,即为成功

5.然后启动全部进程：
start-all.sh

这里可能出现找不到java_home报错，但是执行java -version又可以显示
在这里插入图片描述
此时方法为：修改hadoop-env.sh 文本路径为：

/usr/local/hadoop/etc/hadoop/hadoop-env.sh

里面有个

export JAVA_HOME=${JAVA_HOME}
把这一行改为：
export JAVA_HOME=你javahome的绝对路径即可

6.启动成功图
在这里插入图片描述
7.浏览器打开http://localhost:50070可以看到

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1981460.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！