hadoop伪分布式搭建教程

news2025/9/19 2:56:11

官方参数文档

Apache Hadoop 3.3.5 – HDFS Users Guide

Hadoop是一个分布式存储和计算框架，由以下几个组件组成：

1. Hadoop Distributed File System (HDFS)：Hadoop分布式文件系统，用于存储大量数据，并提供高可靠性和高可用性。

2. MapReduce：一种编程模型，用于处理大规模数据集。它将数据分成小块，并在分布式计算集群上并行处理。

3. YARN (Yet Another Resource Negotiator)：Hadoop的资源管理器，用于管理集群中的计算资源，并分配任务给不同的节点。

4. Hadoop Common：包含Hadoop所需的共享库和工具。

5. Hadoop Ozone：Hadoop的对象存储层，用于存储和管理大规模的非结构化数据。

6. Hadoop Archives：Hadoop的存档工具，用于将文件和目录压缩成一个单独的归档文件。

7. Hadoop KMS (Key Management Server)：Hadoop的密钥管理器，用于管理和保护数据加密密钥。

8. Hadoop HttpFS：Hadoop的HTTP文件系统，提供了一个REST接口，可以通过HTTP访问Hadoop文件系统。

以下是一些关于Hadoop组件的链接：

1. HDFS：Apache Hadoop 3.3.5 – HDFS Users Guide

2. MapReduce：Apache Hadoop 3.3.5 – MapReduce Tutorial

3. YARN：Apache Hadoop 3.3.5 – Apache Hadoop YARN

4. Hadoop Common：https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/CommonJars.html

5. Hadoop Ozone：https://hadoop.apache.org/docs/stable/hadoop-ozone/index.html

6. Hadoop Archives：https://hadoop.apache.org/docs/stable/hadoop-archive-logs/HadoopArchives.html

7. Hadoop KMS：Hadoop KMS – Hadoop Key Management Server (KMS) - Documentation Sets

8. Hadoop HttpFS：HttpFS – Hadoop HDFS over HTTP - Documentation Sets

代码相关的问题，请提供具体问题和代码。

基础环境准备

jdk包上传并且解压

添加jdk环境变量

配置免密登录

ssh-keygen -t加密算法 -b密钥长度（用于生成ssh密钥），将公钥分发到远程主机上

Hadoop伪分布式集群搭建

hadoop的搭建(压缩包的解压)

添加环境变量

sudo vim /etc/profile.d/hadoop.sh

export HADOOP HOME=/opt/module/hadoop-2.7.7

export PATH=$PATH:$HADOOP HOME/bin:$HADOOP HOME/sbin

source /etc/prorifle #配置生效

hadoop version

bin目录

sbin目录（管理hadoop的脚本）

配置hdfs

1、官方网址查询

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/core-default.xml
http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml
http://hadoop.apache.org/docs/current/hadoop-mapreduce-client/hadoop-mapreduce-client-core/mapred-default.xml
http://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-common/yarn-default.xml

通过这些网址，可以了解最新的全部的hadoop 配置信息，而且包括一些过时的定义标识，从而更好地维护您的集群。

(2条消息) hadoop搭建四个配置文件(core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml )的简单介绍_蜗牛!Destiny的博客-CSDN博客

(都是在解药的hadoop文件里编辑)

1、配置core-site.xml

2、配置hdfs-site.xml

3、配置mapred-site.xml

4、配置yarn-site.xml

<configuration>

<property>

<name>yarn.resourcemanager.hostname</nam

<value>hadoop</value> #主机名字

</property>

<property>

<name>yarn.nodemanager.aux-services</nam

<value>mapreduce_shuffle</value>

伪分布式配置slaves（简单版本）

伪分布式配置slaves是一种在单台计算机上模拟分布式计算的方法。在这种配置中，我们将单台计算机视为一个集群，然后在该计算机上启动多个slave节点来模拟多台计算机的情况。

为了配置伪分布式，我们需要安装和配置Hadoop和其他必要的软件。然后，我们需要在单台计算机上启动多个slave节点。这可以通过在不同的端口上启动多个Hadoop进程来实现。

在伪分布式配置中，所有的slave节点都运行在同一台计算机上，因此它们共享相同的资源，如内存和硬盘空间。这种配置适合于开发和测试Hadoop应用程序，但不适合生产环境。

需要注意的是，伪分布式配置不同于真正的分布式配置，因为它只是在单台计算机上模拟了分布式环境。在真正的分布式环境中，我们需要多台计算机来构建一个集群，并且每台计算机都运行着一个或多个slave节点。

直接在hadoop文件目录下配置

cd hadoop

vim slaves

添加主机的名字

格式化NameNode

格式化NameNode是指将Hadoop分布式文件系统（HDFS）上的NameNode节点的元数据清空，以便重新开始使用。这通常是在重新启动集群之前执行的操作。

hdfs namenode -format

启动hadoop

jps查看进程、

jps是Java Virtual Machine Process Status Tool的缩写，它是用于查看Java进程的命令行工具。jps命令可以显示当前系统中所有正在运行的Java进程的进程ID和进程名。

$ jps

12345 Jps

67890 MyJavaApp

ui界面

hdfs上传文件

hadoop fs -put /path/to/local/file /path/in/hdfs

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/478260.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Spring源码：动态代理的增强顺序（AOP与事务的先后）

Spring源码：动态代理的增强顺序（AOP与事务的先后）

前文： 《Spring AOP源码：开启注解读取》《Spring AOP源码2：查找增强器》《Spring AOP源码3：实现代理》《Spring事务源码：创建代理类》《Spring事务源码：事务创建》《Spring事务源码：…

阅读更多...

(05)基础强化:字符串拘留池,格式化,StringBuilder,垃圾回收,弱引用

(05)基础强化:字符串拘留池,格式化,StringBuilder,垃圾回收,弱引用

一、复习 1.什么是接口？说说你对接口的理解。 （提示：概念、语法、应用场景，与抽象类的区别。说出最特别的） 接口是一种规范、标准，一种抽象的概念，所以本身无法实现&#…

阅读更多...

Redis基础——Java客户端Jedis

Redis基础——Java客户端Jedis

2.1.Jedis客户端 Jedis的官网地址： https://github.com/redis/jedis 2.1.1.快速入门我们先来个快速入门： 1）引入依赖：  <dependency><groupId>redis.clients</groupId><artifactId&…

阅读更多...

山东专升本计算机第九章-信息安全

山东专升本计算机第九章-信息安全

信息安全计算机病毒考点 4病毒的定义与特点定义 • 一组人为设计的程序满足一定条件即被激活特点 • 可执行性 • 破坏性 • 占用系统资源 • 破坏或删除程序或数据文件 • 传染性 • 潜伏性 • 隐蔽性 • 针对性 • 宏病毒只感染docx • 衍生性 • 抗反病毒软…

阅读更多...

102-Linux_I/O复用方法之poll

102-Linux_I/O复用方法之poll

文章目录 1.poll系统调用的作用2.poll的原型3.poll支持的事件类型4.poll实现TCP服务器(1)服务器端代码:(2)客户端代码:(3)运行结果截图: 1.poll系统调用的作用 poll 系统调用和 select 类似，也是在指定时间内轮询一定数量的文件描述符，以测试其中是否有…

阅读更多...

docker容器原理及简单且详细的使用

docker容器原理及简单且详细的使用

docker原理简单介绍 docker是一种虚拟化容器技术。虚拟化：早期为了节约成本和学习只有在宿主机中基于 kvm（基于内核的虚拟机）等技术虚拟出来完整的操作系统，而这个完整的操作系统会大量的占用宿主机的硬件资源，当创建…

阅读更多...

spring的安装 -- IEDA-创建 Java 工程的jar包教程--以及spring5的核心组件

spring的安装 -- IEDA-创建 Java 工程的jar包教程--以及spring5的核心组件

目录 Spring Spring 基本介绍 Spring5 下载进入 Spring5 进入 Spring5 的 github 进入 Spring5 的 github下拉 Access to Binaries, 进入 Spring -----拷贝下载地址，打开--- -----选择 5.3.8, 点击进入, 即可下载- 在线文档: 离线文档 : 离线 API: …

阅读更多...

【刷题之路Ⅱ】LeetCode 92. 反转链表 II

【刷题之路Ⅱ】LeetCode 92. 反转链表 II

【刷题之路Ⅱ】LeetCode 92. 反转链表 II 一、题目描述二、解题1、方法1——穿针引线法1.1、思路分析1.2、代码实现 2、方法2——针对进阶的头插法2.1、思路分析2.2、代码实现一、题目描述原题连接： 92. 反转链表 II 题目描述： 给你单链表的头指针 he…

阅读更多...

基于全过程通道相关像素值顺序的彩色图像可逆数据隐藏

基于全过程通道相关像素值顺序的彩色图像可逆数据隐藏

文献学习： 基于全过程通道相关像素值顺序的彩色图像可逆数据隐藏原文题目： Reversible data hiding for color images based on pixel value order of overall process channel. 发表期刊： Signal Processing（中科院二区&#xf…

阅读更多...

AOP（面向切面编程）

AOP（面向切面编程）

3、AOP 3.1、场景模拟 3.1.1、声明接口声明计算器接口Calculator，包含加减乘除的抽象方法 public interface Calculator {int add(int i, int j);int sub(int i, int j);int mul(int i, int j);int div(int i, int j); }3.1.2、创建实现类 public class Calcul…

阅读更多...

osgGA::CameraManipulator类computeHomePosition函数分析

osgGA::CameraManipulator类computeHomePosition函数分析

osgGA::CameraManipulator类computeHomePosition函数代码如下： void CameraManipulator::computeHomePosition(const osg::Camera *camera, bool useBoundingBox) {if (getNode()){osg::BoundingSphere boundingSphere;OSG_INFO<<" CameraManipulator::…

阅读更多...

继续细说文件

继续细说文件

先来了解几个函数： fopen，这个函数有2个参数分别为（字符串也就是要记得打引号）路径，和（字符串）操作模式，返回值为FILE类型的指针，也就是一个指向文件信息的结构的指针&a…

阅读更多...

Java 基础入门篇（五）——— 面向对象编程

Java 基础入门篇（五）——— 面向对象编程

文章目录一、面向对象的思想二、类的定义与对象的创建三、对象内存分配情况 ★ 3.1 两个对象的内存图3.2 两个变量指向同一个对象内存图四、构造器4.1 构造器的格式与分类4.2 构造器的调用五、 this 关键字六、封装七、标准JavaBean补充：局部变量和成员变量的区别…

阅读更多...

【计算机网络详解】——物理层（学习笔记）

【计算机网络详解】——物理层（学习笔记）

📖 前言：今天我们将一起探索电脑网络中最基础的一层，物理层。从摩斯电码到光纤传输的高速互联网时代，物理层在不断发展和创新。让我们一起深入到网络通讯的本质，探究物理层与我们的日常联系密不可分的原因。目录 &…

阅读更多...

面试篇：Spring

面试篇：Spring

一、Spring框架的单例bean是线程安全的吗？ 1、Spring框架中的bean是单例的吗？ spring框架中的bean是单例的，在默认情况下是singleton模式，即单例模式。如果需要更改则可以在Scope注解设置为prototype为多例模式。 singleton:bea…

阅读更多...

ECharts---X轴文字显示不全

ECharts---X轴文字显示不全

原因： X轴标签文字过多导致显示不全解决方法：(一)xAxis 中添加 xAxis.axisLabel 属性 axisLabel是用来设置x轴的刻度以及一些参数的设置： (1)interval设置的是间隔数，把x轴分成10个间隔，根据x轴的数据自动划分份数值…

阅读更多...

【计算机专业漫谈】【计算机系统基础学习笔记】W1-计算机系统概述

【计算机专业漫谈】【计算机系统基础学习笔记】W1-计算机系统概述

利用空档期时间学习一下计算机系统基础，以前对这些知识只停留在应试层面，今天终于能详细理解一下了。参考课程为南京大学袁春风老师的计算机系统基础MOOC，参考书籍也是袁老师的教材，这是我的听课自查资料整理后的笔记，…

阅读更多...

【Java笔试强训 14】

【Java笔试强训 14】

🎉🎉🎉点进来你就是我的人了博主主页：🙈🙈🙈戳一戳,欢迎大佬指点! 欢迎志同道合的朋友一起加油喔🤺🤺🤺 目录一、选择题二、编程题 🔥计算日期…

阅读更多...

web小游戏开发：华容道（一）

web小游戏开发：华容道（一）

web小游戏开发：华容道（一）华容道htmlcss素材原图素材验证游戏关卡华容道老顾儿时的记忆啊，也是一个经典的益智游戏。游戏规则就不用再介绍了吧，就是让曹操移动到曹营就算胜利。 CSDN 文盲老顾的博客，https://blog.csdn.net/superrwfei html 经过上次的扫雷，大家应…

阅读更多...

Prometheus 监控初体验

Prometheus 监控初体验

最近由于要对Splunk 实现Prometheus 监控，下面先实践一下： 0: 先看架构图： 1: 安装： docker run -d -p 9090:9090 -v ~/docker/prometheus/:/etc/prometheus/ prom/prometheus 执行上面的命令，发现prometheus docker 启动不起来，(原因是Mac 里的文件权限，或者是path

阅读更多...

推荐文章

最新文章