一文搞懂什么是Hadoop

一文搞懂什么是Hadoop

news2026/2/14 16:45:57

Hadoop概念

什么是Hadoop

Hadoop是一个由Apache基金会所开发的用于解决海量数据的存储及分析计算问题的分布式系统基础架构。

广义上来说，Hadoop通常指一个跟广泛的概念——Hadoop生态圈。

以下是hadoop生态圈中的技术：

Hadoop优势

hadoop组成

HDFS架构概述

HDFS（Hadoop Distributed File System）是一个分布式文件系统，用于存储文件，通过目录树来定位文件。

NameNode（nn）：存储文件元数据，比如文件名、目录结构、文件属性（生成时间、副本数、文件权限），以及每个文件的数据块（Block）列表和数据库映射信息（比如块所在哪几个DataNote）等。
DataNode（dn）：在本地文件系统存储文件块数据，以及块数据的校验和；执行数据块的读写操作。
Secondary NameNode（2nn）：定期备份NameNode元数据；在紧急情况下，可辅助恢复NameNode。

HDFS 优缺点

HDFS 的使用场景：适合一次写入，多次读出的场景。一个文件经过创建、写入和关闭之后就不需要改变

YARN架构概述

YARN（Yet Another Resource Negotiator）是一个资源调度平台，负责为运算程序提供服务器运算资源。

ResourceManager（RM）：核心管理服务，负责资源的管理和分配。
NodeManager（NM）：管理单个节点上的资源。
ApplicationMaster（AM）：负责内部任务的资源申请和分配；任务的监控和容错。
Container：容器，里面封装了任务运行所需要的资源。

MapReduce架构概述

MapReduce 是一个分布式运算程序的编程框架，是用户开发“基于 Hadoop 的数据分析应用”的核心框架。
MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并发运行在一个 Hadoop 集群上。

MapReduce将计算过程分为两个阶段：Map和Reduce。

Map 阶段并行处理输入数据；
Reduce 阶段对 Map 结果进行汇总。

HDFS、YARN、MapReduce三者关系

Hadoop运行环境集群部署采用了三台服务器，以下是集群部署规划：

注意:

NameNode 和 SecondaryNameNode 不要安装在同一台服务器
ResourceManager 也很消耗内存，不要和 NameNode、SecondaryNameNode 配置在同一台机器上。

本文由mdnice多平台发布

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1295408.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

单例模式---饿汉式、懒汉式

单例模式---饿汉式、懒汉式

一、什么是单例模式单例模式，指的是一个类中的对象只能有一个，它在内存中只会创建一次对象的设计模式。二、饿汉式 public class SingleTon {// 私有的构造方法private SingleTon() {};// 1. 饿汉式private static SingleTon instance new SingleTon…

阅读更多...

【Java 基础】26 枚举

【Java 基础】26 枚举

文章目录 1. 什么是枚举2. 定义3. 使用1）常量2）遍历3）switch 4. 属性和方法1）属性2）方法 5. 实现原理6. 使用场景总结 1. 什么是枚举枚举是列出某些有穷序列集的所有成员的程序，或者是一种特定类型对象的计…

阅读更多...

第17章：随堂复习与企业真题（反射机制）

第17章：随堂复习与企业真题（反射机制）

第17章：随堂复习与企业真题（反射机制） 一、随堂复习 1. 反射的概述（熟悉） Java给我们提供了一套API，使用这套API我们可以在运行时动态的获取指定对象所属的类，创建运行时类的对象，…

阅读更多...

12.08

12.08

1.头文件 #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QDebug>QT_BEGIN_NAMESPACE namespace Ui { class Widget; } QT_END_NAMESPACEclass Widget : public QWidget {Q_OBJECTpublic:Widget(QWidget *parent nullptr);~Widget(); signals:v…

阅读更多...

One-to-Few Label Assignment for End-to-End Dense Detection阅读笔记

One-to-Few Label Assignment for End-to-End Dense Detection阅读笔记

One-to-Few Label Assignment for End-to-End Dense Detection阅读笔记 Abstract 一对一（o2o）标签分配对基于变换器的端到端检测起着关键作用，最近已经被引入到全卷积检测器中，用于端到端密集检测。然而，o2o可能因为…

阅读更多...

Aligning Large Multi-Modal Model with Robust Instruction Tuning

Aligning Large Multi-Modal Model with Robust Instruction Tuning

Abstract 尽管多模态任务取得了有希望的进展，但当前的大型多模态模型（LMM）很容易产生与相关图像和人类指令不一致的描述的幻觉。 LRV-指令。我们通过引入第一个大型且多样化的视觉指令调整数据集来解决这个问题，该数据集名为大…

阅读更多...

DOS 批处理（一）

DOS 批处理（一）

DOS 批处理 1. 批处理是什么？2. DOS和MS-DOS3. 各种操作系统shell的区别Shell 介绍图形用户界面（GUI）shell命令行界面（CLI）的 shell命令区别 1. 批处理是什么？ 批处理(Batch)，也称为批处理脚本…

阅读更多...

el-tree数据量过大，造成浏览器卡死、崩溃

el-tree数据量过大，造成浏览器卡死、崩溃

el-tree数据量过大，造成浏览器卡死、崩溃场景：树形结构展示，数据超级多，超过万条，每次打开都会崩溃我这里采用的是引入新的插件虚拟树，它是参照element-plus 中TreeV2改造vue2.x版本虚拟化树形控件&…

阅读更多...

基于微服务架构的外卖系统源码开发

基于微服务架构的外卖系统源码开发

在当前互联网时代，外卖行业蓬勃发展，用户对于高效、智能的外卖服务需求不断增加。为了满足这一需求，采用微服务架构的外卖系统成为了开发的主流方向。本文将探讨基于微服务的外卖系统源码开发，涉及到关键技术和示例代码。 1. 微…

阅读更多...

远程控制如何赋能智能制造？贝锐向日葵制造业场景案例解析

远程控制如何赋能智能制造？贝锐向日葵制造业场景案例解析

随着数字化转型在制造业的不断深入，企业在产线端也逐渐投入更多智能化设备，数字化、智能化设备其中一个比较显著的优势就是可以依托互联网实现远程运维和调试，大大提升产线设备的稳定性和工作效率；而远程调试运维一个重要的实现方…

阅读更多...

ALTERNET STUDIO 9.1 Crack

ALTERNET STUDIO 9.1 Crack

ALTERNET STUDIO 9.1 发布宣布 AlterNET Studio 9.1 版本今天上线。AlterNET Studio 9.0 是一个中期更新，重点是改进我们所有的组件库。以下是 AlterNET Studio 9.1 的发布亮点： Roslyn C# 和 Visual Basic 解析器现在支持代码修复/代码重构。代码修复…

阅读更多...

el-date-picker时间控制范围为过去时间不可选

el-date-picker时间控制范围为过去时间不可选

<el-date-picker :picker-options"startPickerOptions()" value-format"yyyy-MM-dd HH:mm:ss" v-model"form.applyFixPlan" type"datetime" placeholder"选择日期时间"> </el-date-picker> 在method中定义star…

阅读更多...

【ESP32 IDF】ESP32移植u8g2库，实现oled界面显示

【ESP32 IDF】ESP32移植u8g2库，实现oled界面显示

ESP32移植u8g2库，实现oled界面显示 1. 简单描述2. 环境准备1. 硬件准备2. 软件准备 3. IIC屏幕【基于 ssd1362 256*64 】4. SPI屏幕【基于 ssd1306 128*32】 1. 简单描述开发方式为 IDF5.0参考连接为 iic基于esp-idf移植使用u8g2 spi基于esp-idf移植使用u8g2 …

阅读更多...

插入排序——直接插入排序和希尔排序(C语言实现）

插入排序——直接插入排序和希尔排序(C语言实现）

文章目录前言直接插入排序基本思想特性总结代码实现希尔排序算法思想特性总结代码实现前言本博客插入排序动图和希尔排序视频参考大佬java技术爱好者，如有侵权，请联系删除。直接插入排序基本思想直接插入排序是一种简单的插入排序法&#xff…

阅读更多...

广播和组播

广播和组播

1. 广播 1.1 知识点 INADDR_ANY代表本机所有地址常用方法当你将套接字绑定到INADDR_ANY，它会监听所有可用的网络接口，这意味着它将接受来自所有本地IP地址的传入连接或数据包 1.1.1 广播的流程广播发送端： ----> 添加广播属性 1、建立套…

阅读更多...

JAVA后端自学技能实操合集

JAVA后端自学技能实操合集

JAVA后端自学技能实操内容将会持续更新中,有需要添加什么内容可以再评论区留言,大家一起学习FastDFS使用docker安装FastDFS(linux)集成到springboot项目中内容将会持续更新中,有需要添加什么内容可以再评论区留言,大家一起学习 FastDFS 组名：文件上传后所在的 st…

阅读更多...

MySQL中是如何insert数据的

MySQL中是如何insert数据的

正常insert数据，MySQL并不会显式加锁，而是通过聚簇索引的trx_id索引作为隐式锁来保护记录的。比如两个事务对一个非唯一的索引情况添加，会造成幻读但在某些特殊情况下，隐式锁会转变为显式锁： 记录之间有间隙锁inser…

阅读更多...

Qt使用Cryptopp生成HMAC-MD5

Qt使用Cryptopp生成HMAC-MD5

近期项目中HTTPS通讯中，token需要使用HMAC-MD5算法生成，往上找了一些资料后，仍不能满足自身需求，故次一记。前期准备： ①下载Cryptopp库（我下载的是8.8.0 Release版本）：Crypto Li…

阅读更多...

基础课19——知识图谱问答引擎

1.概念知识图谱是一种结构化的知识表示方式，将实体、属性和关系以图形的形式进行表达和组织。它通过对知识进行结构化建模，将不同实体之间的关系进行编码，形成一个图结构的知识网络。知识图谱的目标是将人类的知识整合到一个统一的框架中&a…

阅读更多...

Segment Anything--SAM框架（二）

Segment Anything--SAM框架（二）

文章目录 prologuepaper && codeImage encoderPrompt encoderLightweight mask decoderMaking the model ambiguity-aware prologue 没什么事，写一写SAM的paper中关于模型框架的部分和实际代码部分。 paper && code SAM有三个组件，如图…

阅读更多...

推荐文章

最新文章