大数据框架之Hadoop:入门(三)Hadoop运行环境搭建(开发重点)

news2024/9/29 20:12:00

3.1虚拟机环境准备

详见:yiluohan1234/vagrant_bigdata_cluster: 利用virtualbox快速搭建大数据测试环境 (github.com)

单纯只是安装虚拟机的话,注释掉40到115行。按照教程安装即可。

image-20230113221807403

/opt 目录下创建 modulesoftware 文件夹

[root@hdp101 ~]# mkdir -p /opt/module
[root@hdp101 ~]# mkdir -p /opt/software

3.2安装JDK

1.卸载现有 JDK

(1)查询是否安装 Java 软件:

[root@hdp101 ~]# rpm -qa | grep java

(2)如果安装的版本低于1.7,卸载该 JDK

[root@hdp101 ~]# rpm -e 软件包

(3)查看 JDK 安装路径:

[root@hdp101 ~]# which java

2.用 Tabby 工具在 /opt/software 下载 JDK

wget https://repo.huaweicloud.com/java/jdk/8u201-b09/jdk-8u201-linux-x64.tar.gz

3.在Linux系统下的 /opt/software 目录中查看软件包是否下载成功

[root@hdp101 ~]# cd /opt/software
[root@hdp101 software]# ls
jdk-8u201-linux-x64.tar.gz

4.解压 JDK/opt/module 目录下并重命名文件夹为java

[root@hdp101 software]# tar -zxvf jdk-8u201-linux-x64.tar.gz -C /opt/module/
[root@hdp101 software]# mv /opt/module/jdk1.8.0_201 /opt/module/java

5.配置 JDK 环境变量

(1)先获取 JDK 路径

[root@hdp101 java]# pwd
/opt/module/java

(2)打开 /etc/profile 文件

[root@hdp101 java]# vi /etc/profile

在profile文件末尾添加 JDK 路径

# jdk environment
export JAVA_HOME=/opt/module/java
export PATH=${JAVA_HOME}/bin:$PATH

(3)保存后退出

:wq

(4)让修改后的文件生效

[root@hdp101 java]# source /etc/profile

6.测试 JDK 是否安装成功

[root@hdp101 java]# java -version
java version "1.8.0_201"
Java(TM) SE Runtime Environment (build 1.8.0_201-b09)
Java HotSpot(TM) 64-Bit Server VM (build 25.201-b09, mixed mode)

3.3安装Hadoop

  1. Hadoop官网下载地址:https://archive.apache.org/dist/hadoop/core/hadoop-2.7.7/hadoop-2.7.7.tar.gz

推荐使用:https://mirrors.huaweicloud.com/apache/hadoop/core/hadoop-2.7.7/hadoop-2.7.7.tar.gz下载速度快

1.用 Tabby 工具将 hadoop-2.7.2.tar.gz 下载到opt目录下面的software文件夹下面

切换到 sftp 连接页面,选择 Linux 下编译的 hadoop tar 包拖入,如下图所示

[root@hdp101 software]# wget https://mirrors.huaweicloud.com/apache/hadoop/core/hadoop-2.7.7/hadoop-2.7.7.tar.gz

2.进入到 Hadoop 安装包路径下

[root@hdp101 ~]$ cd /opt/software/

3.解压安装文件到 /opt/module 下面,并重命名为hadoop

[root@hdp101 software]# tar -zxvf hadoop-2.7.7.tar.gz -C /opt/module/
[root@hdp101 software]# mv /opt/module/hadoop-2.7.7 /opt/module/hadoop

4.查看是否解压成功

[root@hdp101 software]# ls /opt/module/
java  hadoop

5.将 Hadoop 添加到环境变量

(1)获取 Hadoop 安装路径

[root@hdp101 hadoop]# pwd
/opt/module/hadoop

(2)打开 /etc/profile 文件

[root@hdp101 hadoop]# vi /etc/profile

profile 文件末尾添加 JDK 路径:(shift+g

# hadoop environment
export HADOOP_HOME=/opt/module/hadoop
export PATH=${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:$PATH

(3)保存后退出

:wq

(4)让修改后的文件生效

[root@hdp101 hadoop]# source /etc/profile

6.测试是否安装成功

[root@hdp101 hadoop]# hadoop version
Hadoop 2.7.7
Subversion Unknown -r c1aad84bd27cd79c3d1a7dd58202a8c3ee1ed3ac
Compiled by stevel on 2018-07-18T22:47Z
Compiled with protoc 2.5.0
From source with checksum 792e15d20b12c74bd6f19a1fb886490
This command was run using /opt/module/hadoop/share/hadoop/common/hadoop-common-2.7.7.jar

3.4Hadoop目录结构

1、查看 Hadoop 目录结构

[root@hdp101 hadoop]# ll
total 112
drwxr-xr-x 2 vagrant ftp   194 Jul 19  2018 bin
drwxr-xr-x 3 vagrant ftp    20 Jul 19  2018 etc
drwxr-xr-x 2 vagrant ftp   106 Jul 19  2018 include
drwxr-xr-x 3 vagrant ftp    20 Jul 19  2018 lib
drwxr-xr-x 2 vagrant ftp   239 Jul 19  2018 libexec
-rw-r--r-- 1 vagrant ftp 86424 Jul 19  2018 LICENSE.txt
-rw-r--r-- 1 vagrant ftp 14978 Jul 19  2018 NOTICE.txt
-rw-r--r-- 1 vagrant ftp  1366 Jul 19  2018 README.txt
drwxr-xr-x 2 vagrant ftp  4096 Jul 19  2018 sbin
drwxr-xr-x 4 vagrant ftp    31 Jul 19  2018 share

2、重要目录

(1)bin目录:存放对 Hadoop 相关服务(HDFS, YARN )进行操作的脚本

(2)etc目录:Hadoop 的配置文件目录,存放 Hadoop 的配置文件

(3)lib目录:存放 Hadoop 的本地库(对数据进行压缩解压缩功能)

(4)sbin目录:存放启动或停止 Hadoop 相关服务的脚本

(5)share目录:存放 Hadoop 的依赖jar包、文档、和官方案例

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/338841.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一、Java并发编程之线程、synchronized

黑马课程 文章目录1. Java线程1.1 创建和运行线程方法一:Thread方法二:Runnable(推荐)lambda精简Thread和runnable原理方法三:FutureTask配合Thread1.2 查看进程和线程的方法1.3 线程运行原理栈与栈帧线程上下文切换1.…

1. SpringMVC 简介

文章目录1. SpringMVC 概述2. SpringMVC 入门案例2.1 入门案例2.2 入门案例工作流程3. bean 加载控制4. PostMan 工具1. SpringMVC 概述 SpringMVC 与 Servlet 功能等同,均属于 Web 层开发技术。SpringMVC 是 Spring 框架的一部分。 对于 SpringMVC,主…

Python导入模块的3种方式

很多初学者经常遇到这样的问题,即自定义 Python 模板后,在其它文件中用 import(或 from...import) 语句引入该文件时,Python 解释器同时如下错误:ModuleNotFoundError: No module named 模块名意思是 Pytho…

45.在ROS中实现global planner(1)

前文move_base介绍(4)简单介绍move_base的全局路径规划配置,接下来我们自己实现一个全局的路径规划 1. move_base规划配置 ROS1的move_base可以配置选取不同的global planner和local planner, 默认move_base.cpp#L70中可以看到是…

Vue3电商项目实战-分类模块1【01-顶级类目-面包屑组件-初级、02-顶级类目-面包屑组件-高级】

文章目录01-顶级类目-面包屑组件-初级02-顶级类目-面包屑组件-高级01-顶级类目-面包屑组件-初级 目的: 封装一个简易的面包屑组件,适用于两级场景。 大致步骤: 准备静态的 xtx-bread.vue 组件定义 props 暴露 parentPath parentName 属性&am…

[oeasy]python0081_ANSI序列由来_终端机_VT100_DEC_VT选项_终端控制序列

更多颜色 回忆上次内容 上次 首先了解了RGB颜色设置可以把一些抽象的色彩名字 落实到具体的 RGB颜色 计算机所做的一切 其实就是量化、编码把生活的一切都进行数字化 标准 是ANSI制定的 这个ANSI 又是 怎么来的 呢??🤔 由来 ANSI 听起…

【c++设计模式】——模板方法模式

模板方法模式的定义 定义一个操作中的算法对象的骨架(稳定),而将一些步骤延迟到子类(定义一个虚函数,让子类去实现),template method使得子类可以不改变(复用)一个算法结…

can协议介绍

目录 1 can协议介绍 1.1can协议 1.2 CAN协议特点 2.CAN FD 2.1 CAN FD协议简介 2.2 CAN FD协议特点 3.LIN 3.1 LIN总线简介 3.2 LIN总线特点 4. FlexRay 4.1 FlexRay简介 4.2 FlexRay特点 5. MOST 6.Ethernet 7 总结: 1 can协议介绍 1.1can协议 CAN…

Linux---Linux是什么

Linux 便成立的核心网站: http://www.kernel.org Linux是什么 Linux 就是一套操作系统 Linux 就是核心与系统呼叫接口那两层 软件移植:如果能够参考硬件的功能函数并据以修改你的操作系统程序代码, 那经过改版后的操作系统就能够在另一个硬…

Spring Boot 整合定时任务完成 从0 到1

Java 定时任务学习 定时任务概述 > 定时任务的应用场景非常广泛, 如果说 我们想要在某时某地去尝试的做某件事 就需要用到定时任务来通知我们 ,大家可以看下面例子 如果需要明天 早起,哪我们一般会去定一个闹钟去通知我们, 而在编程中 有许许多多的…

ssm高校功能教室预约系统java idea maven

本网站所实现的是一个高校功能教室预约系统,该系统严格按照需求分析制作相关模块,并利用所学知识尽力完成,但是本人由于学识浅薄,无法真正做到让该程序可以投入市场使用,仅仅简单实现部分功能,希望日后还能…

springboot集成Redis

springboot集成Redis1 windows平台安装Redis2 引入依赖3 修改配置文件4 启动类添加注解5 指定缓存哪个方法6 配置Redis的超时时间小BUG测试对于项目中一些访问量较大的接口,配置上Redis缓存,提升系统运行速度。1 windows平台安装Redis github.com/Micro…

谈一谈API接口开发

做过开发的程序猿,基本都写过接口,写接口不算难事,与接口交互的对象核对好接口的地址、请求参数和响应参数即可,我在作为面试官去面试开发人员的时候,有时候会问这个问题,但相当多的一部分人并没有深入的考…

BERT(NAACL 2019)-NLP预训练大模型论文解读

文章目录摘要算法BERT预训练Masked LMNSPFine-tune BERT实验GLUESQuAD v1.1SQuAD v2.0SWAG消融实验预训练任务影响模型大小影响BERT基于特征的方法结论论文: 《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》github&#xff…

QT+OpenGL 摄像机

QTOpenGL 摄像机 本篇完整工程见gitee:QtOpenGL 对应点的tag,由turbolove提供技术支持,您可以关注博主或者私信博主 OpenGL本身没有摄像机的定义,但是我们可以通过把场景中的所有物体往相反方向移动的方式来模拟出摄像机,产生一…

Linux内核启动(2,0.11版本)内核启动前的苦力活与内核启动

内核启动前的工作 在上一章的内容中,我们跳转到了setup.s的代码部分,这章我们先讲一讲setup做了什么吧 entry start start:! ok, the read went well so we get current cursor position and save it for ! posterity.mov ax,#INITSEG ! this is done …

Flowable进阶学习(十)定时器、ServiceTask服务任务、ScriptTask脚本任务

文章目录一、定时器1. 流程定义定时激活2. 流程实例定时挂起3. 定时任务执行过程ServiceTask 服务任务委托表达式表达式类中字段ScriptTask 脚本任务JS TASK一、定时器 相关知识链接阅读:事件网关——定时器启动事件 1. 流程定义定时激活 可以通过activateProces…

材质笔记 - Simluate Solid Surface

光的行为 当光和物体相遇时,光会有三种行为:被物体反射、穿过物体(物体是透明或半透明的)或者被吸收。 高光反射和漫反射 高光反射(Specular Reflection)会在表面光滑且反光的物体上看到,比如镜…

SMART PLC时间间隔定时器应用(高速脉冲测频/测速)

高速脉冲计数测量频率,专栏有系列文章分析讲解,这里不再赘述(原理都是利用差分代替微分)。具体链接如下: 西门子SMART PLC高速脉冲计数采集编码器速度(RC滤波)_RXXW_Dor的博客-CSDN博客这篇文章主要讲解西门子 SMART PLC高速计数采集编码器脉冲信号计算速度,根据编码器脉…

鸢尾花数据集分类(PyTorch实现)

一、数据集介绍 Data Set Information: This is perhaps the best known database to be found in the pattern recognition literature. Fisher’s paper is a classic in the field and is referenced frequently to this day. (See Duda & Hart, for example.) The data…