Hadoop安装和测试

Hadoop安装和测试

news2026/2/14 2:37:18

一，下载

地址：Index of /dist/hadoop/common

选择3.3.6版本（最新版本之前的一个版本，一般比较稳定）

二，解压

解压到/data/module目录，这里随便自定义就好。

tar -zxvf hadoop-3.3.6.tar.gz -C /data/module/

- bin 目录：存放对 Hadoop 相关服务（hdfs，yarn，mapred）进行操作的脚本
- etc 目录：Hadoop 的配置文件目录，存放 Hadoop 的配置文件
- lib 目录：存放 Hadoop 的本地库（对数据进行压缩解压缩功能）
- sbin 目录：存放启动或停止 Hadoop 相关服务的脚本
- share 目录：存放 Hadoop 的依赖 jar 包、文档、和官方案例

三，配置环境变量

vim /etc/profile.d/hadoop_env.sh

在hadoop_env.sh文件末尾添加如下内容：

#HADOOP_HOME
export HADOOP_HOME=/data/module/hadoop-3.3.6
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

保存退出，然后source一下，重新加载一下系统环境变量配置

source /etc/profile

注意：如果没有配置JAVA_HOME的话，也需要配置一下

下面是找到系统jdk安装的步骤

whereis java找系统已经安装的java

进到/usr/bin 使用ll命令，找到java命令真实的引用

进到/etc/alternatives目录，再次ll找到真实引用

找到java真实安装路径后，配置到系统环境变量文件中

vi /etc/profile

保存退出，记得也需要source一下/etc/profile,使系统重新加载一下配置文件

source /etc/profile

测试一下hadoop是否安装成功

hadoop version

有如下图的输出，就是安装成功了

四，测试官方文档案例

WordCount是一个统计文件内单词数量的程序。可以理解为MapReduce的helloword。

1，在/data目录创建test目录放测试文件和输出文件

2，进到test目录，vi word.txt, 输入

hello word
peace
love
hello shenzhen
world peace
love shenzhen
love china

3，执行测试程序

hadoop命令结构：

hadoop jar Jar包的路径 Jar包的主类传递给主类的参数地址由主类执行后输出的结果地址

hadoop jar /data/module/hadoop-3.3.6/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /data/test/word.txt wcoutput

有如下图的输出，表示运行成功了

4，查看运行结果

记得点赞关注哟！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1844220.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

超级好用的JSON格式化可视化在线工具

超级好用的JSON格式化可视化在线工具

JSON是开发非常常用的一种报文格式，最常见的需求就是将JSON进行格式化，最好是有图形化界面显示结构关系，以便进行数据分析。理想的在线JSON工具，应该支持快速格式化、可压缩、快捷复制、可下载导出，对存在语法错误的地方能明确显示。提供搜索定位功能，可视区足够大，最好…

阅读更多...

CPU核心是如何影响VPS性能的？

CPU核心是如何影响VPS性能的？

为什么VPS对于各种类型和规模的网站和应用程序来说都是非常出色的解决方案？ 首先，它比其他类型的托管具有许多优势，但也许它最大的优势是它可以以合适的价格为您提供合适的性能。然而，只有当您满足所需的规格时它才会这样做。 …

阅读更多...

Linux环境编程基础学习2

Linux环境编程基础学习2

For循环累加求和，两种方式，c方式的运算更快打开文件操作 cat操作的实现 EOF: 1.diff A B比较两个文件是否一样，一样则什么结果都没有 Od -c 文件名可以显示出文件中的不可见字符

阅读更多...

贴图法美化Button按钮

贴图法美化Button按钮项目是在下面这篇文章里的基础上进行美化的：MFC实现INI配置文件的读取 1. 初始效果 2.最终效果 3. 增加 CImgButton 类 1.1 ImgButton.h 头文件 #pragma once // CImgButtonclass CImgButton : public CBitmapButton {DECLARE_DYNAMIC(CImgBu…

阅读更多...

IT人周末兼职跑外面三个月心得分享

IT人周末兼职跑外面三个月心得分享

IT人周末兼职跑外面三个月心得分享这四个月来，利用周末的时间兼职跑外面，总共完成了564单，跑了1252公里，等级也到了荣耀1，周末不跑就会减分。虽然收入只有3507.4元。 - 每一次的接单，每一段路程&#xff…

阅读更多...

定时器-前端使用定时器3s轮询状态接口，2min为接口超时

定时器-前端使用定时器3s轮询状态接口，2min为接口超时

背景众所周知，后端是处理不了复杂的任务的，所以经过人家的技术讨论之后，把业务放在前端来实现。记录一下这次的离大谱需求吧。如图所示，这个页面有5个列表，默认加载计划列表。但是由于后端的种种原因，这…

阅读更多...

Vue3 + Element-plus + TS —— 动态表格自由编辑

Vue3 + Element-plus + TS —— 动态表格自由编辑

前期回顾《穿越时空的代码、在回首：Evil.js两年后的全新解读》-CSDN博客 Vue3 TS Element-Plus 封装Tree组件《亲测可用》_ https://blog.csdn.net/m0_57904695/article/details/131664157?spm1001.2014.3001.5501 态表格自由编辑目录 ♻️ 效果图…

阅读更多...

【物联网】物联网操作系统简介

【物联网】物联网操作系统简介

目录一、物联网操作系统概述 1.1内存占用 1.2 内存管理二、物联网操作系统构成三、物联网操作系统关键特性 3.1 调度方式 3.2 I/O操作方式 3.3 网络服务 3.3.1 TinyOS网络协议栈 3.3.2 LiteOS网络协议栈一、物联网操作系统概述物联网操作系统是支撑物联网大规模…

阅读更多...

极限编程里最容易被忽略的实践

极限编程里最容易被忽略的实践

在前面的一篇文章里面我和大家聊过了极限编程的重要性，今天想和大家聊聊极限编程里面最简单但也往往最容易被忽略的实践——编码规范。说到编码规范，每一个开发人员都非常熟悉，每一个团队也都有自己的编码规范。但实际的执行情况如何呢&…

阅读更多...

MySQL 8版本的新功能和改进有哪些？(MySQL收藏版）

MySQL 8版本的新功能和改进有哪些？(MySQL收藏版）

目录 1. 简单介绍 2. 发展历史 3. MySQL 8产品特性 4. 数据库性能重点分析 1. 原生 JSON 支持改进 2. 隐式列优化 3. 改进的查询优化器 4. 并行查询 5. 分区表改进 MySQL 是一个流行的开源关系型数据库管理系统（RDBMS），由瑞典公司 M…

阅读更多...

变长的时间戳设计

变长的时间戳设计

以前的时间戳有32位，以秒为单位，231秒≈68年，从1970年开始，到2038年会出问题。后来出现的时间戳有64位，以纳秒为单位，263纳秒≈292年。本次设计的变长时间戳，以32比特为单位，总共…

阅读更多...

“尚泉杯”2024 演讲朗诵公益展演展播在京启动

“尚泉杯”2024 演讲朗诵公益展演展播在京启动

2024 年 6 月 15 日“尚泉杯”2024 演讲朗诵公益展演展播启动仪式在北京隆重举行。本次活动宗旨是响应领导讲话精神，通过演讲朗诵等形式弘扬中国文化，展现中国魅力，促进文化交流。活动以“爱我中华”为主体线索，鼓励参与者采用不…

阅读更多...

显卡nvidia的CUDA和cuDNN的安装

显卡nvidia的CUDA和cuDNN的安装

显卡版本，和nvidia下载的 CUDA版本和CUDNN的关系 1. 显卡版本 nvidia-smi 硬件环境：显卡版本 4090 NVIDIA-SMI-555.85 我的驱动是510.85.02，驱动附带cuda12.5 2. nvidia下载的cuda版本 nvcc -V 我下载的是cuda12.5 cuda在安装版本过程…

阅读更多...

新手下白对Latex下手啦！

新手下白对Latex下手啦！

第一次使用latex，浅浅地记录一下子吧。首先我们一般会下载一个latex模板，如果想知道咋下载，评论去告诉俺哟！ 新手小白首先要看懂结构，不然完全下不了手，本文就以IEEE的模板，从头往下讲咯~ 第…

阅读更多...

【全网最全最详细】RabbitMQ面试题

【全网最全最详细】RabbitMQ面试题

一、说下RabbitMQ的架构大致是什么样的？ RabbitMQ是一个开源的消息中间件，用于在应用程序之间传递消息。它实现了AMQP（高级消息队列协议）并支持其它消息传递协议，例如STOMP（简单文本定向消息协议&#xff…

阅读更多...

动态轮换代理IP是什么？有什么用？

动态轮换代理IP是什么？有什么用？

如果您要处理多个在线帐户，选择正确的代理类型对于实现流畅的性能至关重要。但最适合这项工作的代理类型是什么？ 为了更好地管理不同平台上的多个账户并优化成本，动态住宅代理IP通常作用在此。一、什么是轮换代理？ 轮换代理充当…

阅读更多...

AWR1843BOOST上的TM4C1294NCPDT是干啥用的？

AWR1843BOOST上的TM4C1294NCPDT是干啥用的？

摘要：AWR1843BOOST上面有2个体积较大的芯片，一片是雷达，另一片是什么呢？ 答案：它就是XDS110仿真器。有了它，就不用再买一个仿真器了。从AWR1843BOOST的原理图中可以看到整个 BOOST板子上只有2个比较大的…

阅读更多...

Java实现俄罗斯方块——文本域组件

Java实现俄罗斯方块——文本域组件

技术实现： 1.初始化游戏窗口； 2.初始化游戏界面； 3.初始化游戏的说明面板； 4.随机生成下落方块； 5.绘制方块； 6.清除方块； 7.清楚某一行方块，上方方块掉落； 8.刷新…

阅读更多...

elementUI的el-table自定义表头

elementUI的el-table自定义表头

<el-table-column label"昨日仪表里程(KM)" align"left" min-width"190" :render-header"(h, obj) > renderHeader(h, obj, 参数)" > <template slot-scope"scope"> <span>{{ scope.row.firstStartMil…

阅读更多...

深度解析响应式异步编程模型

深度解析响应式异步编程模型

上一篇文章中我们聊了一下线程池，基于线程池的多线程编程是我们在高并发场景下提升系统处理效率的有效手段，但却不是唯一的。今天我们来看一下另一种异步开发的常用手段-响应式编程模型传统多线程模型的缺陷多线程模型是目前应用最为广泛的并发编程手段，但凡遇到什么性能…

阅读更多...

推荐文章

最新文章