（大数据开发随笔6）Hadoop 3.3.x分布式环境部署—

（大数据开发随笔6）Hadoop 3.3.x分布式环境部署——本地模式

news2025/3/9 10:16:58

本地模式

材料准备

Linux虚拟机-CentOS7
hadoop-3.3.1.tar.gz Index of /hadoop/common (apache.org)
jdk-8u321-linux-x64.tar.gz Java Archive | Oracle

Centos7虚拟机部署

准备材料：
- VMware17
- CentOS-7-x86_64-Minimal-2009.iso centos-7-isos-x86_64安装包下载_开源镜像站-阿里云 (aliyun.com)
网络配置
- 参考：VMware Workstation17下载安装、环境搭建、网络配置最小化安装操作步骤_哩欤的博客-CSDN博客
Centos安装配置

安装JDK

软件包上传路径：/root/softwares
软件包安装路径：/usr/local

卸载原有的JDK

rpm -qa | grep jdk  # 查询已有的
rpm -e xxxx --nodeps  # 将查询到的jdk强制卸载

解压安装：tar -zxvf jdk-8u321-linux-x64.tar.gz -C /usr/local/
可能需要：yum -y install vim*
环境变量：vim /etc/profile
- 在末尾添加如下：
- export JAVA_HOME=/usr/local/jdk1.8.0_321 export PATH=$PATH:$JAVA_HOME/bin
- :wq保存
- 生效：source /etc/profile
- 验证：javac 或 java -version

安装Hadoop

解压安装：tar -zxvf hadoop-3.3.1.tar.gz -C /usr/local/
环境变量：vim /etc/profile
- 在末尾添加：export HADOOP_HOME=/usr/local/hadoop-3.3.1
- 在PATH后添加:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
- 最终样式：
- 生效：source /etc/profile
- 验证： hadoop version
cd $HADOOP_HOME/ ——> ll

案例演示

WordCount

## 模拟数据
mkdir ~/input
cd input
vim file1  # 在file1中随意地写入一些单词，以空格分隔
for i in {1..1000}; do cat file1 >> file2; done  # 循环1000次，每次都将file1里的内容追加到file2中
for i in {1..1000}; do cat file1 >> file2; done  # 循环1000次，每次都将file2里的内容追加到file3中
for i in {1..10}; do cat file1 >> file2; done  # 循环1000次，每次都将file3里的内容追加到file4中

## 执行运算
cd $HADOOP_HOME/share/hadoop/mapreduce/
hadoop jar hadoop-mapreduce-examples-3.3.1.jar wordcount ~/input/ ~/output  # 注意：output文件夹不能已经存在

## 查看结果
cd ~/output/
cat part-r-00000

Π（pi）

cd $HADOOP_HOME/share/hadoop/mapreduce/
hadoop jar hadoop-mapreduce-examples-3.3.1.jar pi 10 10

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/445308.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

（大数据开发随笔6）Hadoop 3.3.x分布式环境部署——本地模式

本地模式

材料准备

Centos7虚拟机部署

安装JDK

安装Hadoop

案例演示

相关文章

2022国赛34：路由器之间ISIS协议配置

企业如何从0到1落地BI项目

[Python基础] 序列（列表/元组）和字典的操作详解

APIs -- DOM节点操作

React语法(N)

CTF之命令执行常见绕过

增长黑武器|LTD荣获“2023中国工业数字化赋能奖先锋”

力扣sql中等篇练习(十)

STM32常用的开发工具有哪些

springboot_模拟01

李沐读论文笔记--大模型时代下做科研的四个思路

《程序员面试金典（第6版）》面试题 16.01. 交换数字（位运算符，异或性质）

spring getway的配置

【安全防御】IPsec VPN

用Keras单层网络预测银行客户流失率

基于vue+laravel技术框架开发的：PHP不良事件上报系统源码

成都建博会：家居行业数字营销金点子句句戳心坎，先收藏

美国主机常见的安全漏洞与防范方法详解

HTML5 语义元素

Git Commit message 编写规范