Hadoop --- HDFS介绍

Hadoop --- HDFS介绍

news2026/2/11 5:59:03

HDFS 全称是Hadoop Distributed File System hadoop分布式（cluser）文件存储系统。适合一次写入，多次读出的场景。

HDFS不需要单独安装，安装Hadoop的时候带了HDFS系统。

Hadoop安装可以参考：

有基础的，已经安装了虚拟机的： Hadoop安装
没有基础，也没有安装虚拟机的： Hadoop集群安装

HDFS的优缺点：

优点：高容错性，适合处理大数据，可构建在廉价机器上
缺点：不适合低延时数据访问；无法高效对大量小文件进行存储，不支持并发写入、数据修改。

HDFS文件块大小：

HDFS中的文件再物理上是分块存储，块的大小可以通过配置参数（dfs.blocksize）来规定，默认大小在Hadoop2.x/3.x版本中是128M，1.x版本中是64M

注：寻址时间为传输时间的1%时，为最佳状态

思考：为什么块的大小不能设置太小，也不能设置太大？
（1）HDFS的块设置太小，会增加寻址时间
（2）块太大，从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间。导致程序处理块数据时，会非常慢。
总结：HDFS块的大小设置主要取决于磁盘的传输速率。

HDFS结构：

HDFS是一个主/从体系结构(经典的Master和Slave架构)。

HDFS由四部分组成，HDFS Client，NameNode，DataNode和Secondary NameNode。

每一个HDFS集群包括一个NameNode和多个DataNode

1、Client客户端

通过Client来访问文件系统，然后由Client与NameNode和DataNode进行通信。Client对外作为文件系统的接口

文件切分，文件上传HDFS的时候，将文件切分成一个一个的数据块(Block)进行存储
与NameNode交互，获取文件位置
与DataNode交互，读取或写入数据。存储实际的数据块，执行数据库的读写操作
Client提供一些命令来管理HDFS，比如NameNode格式化
Client可以通过一些命令来访问HDFS，比如对HDFS增删改查操作

2、NameNode ( nn )

相当于一个Master，管理者。用于存储和管理文件元数据、维护文件系统的目录结构树，记录写入的每个数据块（Block）与其归属文件的对应关系。

管理HDFS的名称空间
配置副本策略
管理数据块的映射信息
处理客户端的读写请求

3.dataNode

DataNode会通过心跳和NameNode保持通信。DataNode负责存储文件的数据（block块），并提供block的读写，并且定期的向NameNode汇报该DataNode存储的数据块信息

4、Secondary NameNode

Secondary NameNode的作用是消费EditsLog，定期地合并FsImage和EditsLog，生成新的FsImage文件，并推送给NameNode，降低了NameNode的压力。在紧急情况下，可辅助恢复NameNode

注：

1、FsImage（文件系统镜像二进制）
存储某一个时间点（checkPoint）的NameNode镜像数据
默认存储位置： /opt/install/hadoop-2.5.2/data/tmp/dfs/name
dfs.namenode.name.dir

2、EditsLog
可编辑日志二进制记录（检查点以后的所有写操作）
默认存储位置：dfs.namenode.edits.dir

HDFS高可用设计：

数据存储故障容错：

磁盘在存储数据可能会出现错乱。HDFS对于存储在DataNode上的数据块，计算并存储校验和（CkeckSum）。在读取数据的时候，重新计算读取出来的数据的校验和，如果校验不正确就抛出异常，应用程序捕获异常后就到其他DataNode上读取备份数据。

磁盘故障容错：

如果DataNode检测到本机的磁盘损坏，就将磁盘上存储的BlockID报告给NameNode, NameNode检查这些数据块的备份，通知相应的DataNode服务，将对应的数据恢复到其他服务器上，以保证数据块备份数满足要求。

DataNode故障容错：

DataNode会通过心跳和NameNode保持通信，偌DataNode超时未发送心跳，NameNode就认为该DataNode已经宕机，并立即查找DataNode上的数据块，以及这些数据块所在的服务器，随后通知这些服务器再复制一份数据到其他服务器上，以保证HDFS存储的数据块备份数符合要求。

NameNode故障容错：

NameNode是整个HDFS的核心，记录这所有文件的分配信息，以及所有文件路径和数据块存储信息。如果NameNode故障，整个HDFS系统集群都无法使用，如果NameNode的数据丢失，整个集群的所有DataNode数据也就无用了。所以NameNode采用主从热备的方式提供高可用服务。如下图：

HDFS读写过程：

写流程：

请求上传：client向namenode通信，请求上传文件
namenode判断是否可上传： namenode检查用户是否有上传的权限、目标文件是否已存在、父目录是否存在
文件切分：client将文件切分成0~128M大小的block块（逻辑切分）
client请求block块的存储位置
namenode返回datanode地址dn1、dn2、dn3
client通过FSDataOutputStream模块请求dn1上传数据，建立连接管道（本质上是一个 RPC 调用，建立 pipeline）
当dn1收到请求后会继续调用dn2， dn2调用dn3，将整个通信管道建立完成，然后逐级返回client，即图中的ack校验
client开始往dn1上传第一个Block（先从磁盘读取数据放到一个本地内存缓存），以Packet为单位(默认64k)，dn1收到一个Packet就会传给dn2，dn2传给dn3；dn1每传一个packet会放入一个应答队列等待应答
当一个Block传输完成之后，client再次请求NameNode上传第二个Block的服务器（重复执行4-8步）
传输完毕之后，客户端关闭流资源，并且会告诉hdfs数据传输完毕，然后hdfs收到传输完毕就恢复元数据

读流程：

Client 向 NameNode 发起 RPC 请求，来确定请求文件 block 所在的位置；
NameNode 会视情况返回文件的部分或者全部 block 列表，对于每个 block，NameNode 都会返回含有该 block 副本的 DataNode 地址；
这些返回的 DataNode 地址，会按照集群拓扑结构得出 DataNode 与客户端的距离，然后进行排序，排序两个规则：网络拓扑结构中距离Client近的排靠前；心跳机制中超时汇报的 DataNode 状态为 STALE，这样的排靠后；
Client 选取排序靠前的 DataNode 来读取 block，如果客户端本身就是 DataNode，那么将从本地直接获取数据；底层上本质是建立 Socket Stream（FSDataInputStream），重复的调用父类 DataInputStream 的 read 方法，直到这个块上的数据读取完毕；
当读完列表的 block 后，若文件读取还没有结束，客户端会继续向 NameNode 获取下一批的 block 列表；
读取完一个 block 都会进行 checksum 验证，如果读取 DataNode 时出现错误，客户端会通知 NameNode，然后再从下一个拥有该 block 副本的 DataNode 继续读。
read 方法是并行的读取 block 信息，不是一块一块的读取；NameNode 只是返回 Client 请求包含块的 DataNode 地址，并不是返回请求块的数据；
最终读取来所有的 block 会合并成一个完整的最终文件。

HDFS存储模型：

文件按字节线性切割成block块，具有offset、id
一个文件除了最后一个block，其它block大小一致
block大小依据硬件的I/O 特性调整
block被分散在集群的节点中，具有location
block具有副本（replication），没有主从概念，副本不能出现在同一个节点
副本是满足可靠性和性能的关键
文件上传可以指定block大小和副本数，上传后只能修改副本数
一次写入多次读取，不支持修改，只支持追加数据

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/671208.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

轻松了解OPC：实时数据通信领域的必备神器！

轻松了解OPC：实时数据通信领域的必备神器！

OPC简介 OPC（OLE for Process Control，进程控制对象连接）是一种在工业自动化领域中被广泛使用的技术，它允许不同厂商的自动化设备之间进行通信和数据交换。 OPC技术最早是由美国的软件公司OPC Foundation推出的，它通…

阅读更多...

【jsDelivr】jsDelivr - 一个免费、快速、可靠的为JS和开源项目服务的CDN

【jsDelivr】jsDelivr - 一个免费、快速、可靠的为JS和开源项目服务的CDN

文章目录 jsDelivr 简介jsDelivr 工作原理 jsDelivr加速域名如下cdn.jsdelivr.net 2023/06/21 域名解析结果fastly.jsdelivr.net 2023/06/21 域名解析结果gcore.jsdelivr.net 2023/06/21 域名解析结果test1.jsdelivr.net 2023/06/21 域名解析结果仓库拓展 - 其他CDNnpmESMGitH…

阅读更多...

nginx nginx-module-vts 监控模块

nginx nginx-module-vts 监控模块

nginx nginx-module-vts 监控模块大纲 nginx-module-vts 安装nginx-module-vts 配置监控字段总结配置参数总结vhost_traffic_status_filter_by_host 使用vhost_traffic_status_filter_by_set_key 使用 nginx-module-vts 安装 nginx-module-vts 可以实现对nginx 各个虚拟主…

阅读更多...

接口测试是什么？如何测试？

接口测试是什么？如何测试？

扫盲内容： 1.什么是接口？ 2.接口都有哪些类型？ 3.接口的本质是什么？ 4.什么是接口测试？ 5.问什么要做接口测试？ 6.怎样做接口测试？ 7.接口测测试点是什么？ 8.接口测试都要掌…

阅读更多...

在Linux系统实现服务器端和客户端的多线程并发通信

在Linux系统实现服务器端和客户端的多线程并发通信

先导知识： 在Linux系统实现服务器端和客户端的套接字通信_小梁今天敲代码了吗的博客-CSDN博客线程同步（一）_小梁今天敲代码了吗的博客-CSDN博客线程同步（二）_小梁今天敲代码了吗的博客-CSDN博客线程同步&#x…

阅读更多...

通付盾入围《2023年度中国数字安全能力图谱（行业版）》

通付盾入围《2023年度中国数字安全能力图谱（行业版）》

近日，数世咨询发布《2023年度中国数字安全能力图谱（行业版）》。通付盾作为以分布式数字身份和大数据决策智能技术为核心的数字化高端软件与服务提供商，凭借在数字安全领域的实力和影响力，入选政府、互联网两大行业细分…

阅读更多...

实战react+ts+antd遇见的问题之自定义树形结构

实战react+ts+antd遇见的问题之自定义树形结构

目录自定义编辑树搜索树形结构搜索算法原理实时更改数据界面不随之发生变化自定义编辑树需求要求在每个节点的后面加上新增，编辑，删除按钮，并且能够点击编辑title的显示变成input输入框，antd的案例中没有这种情况&#xff0c…

阅读更多...

逍遥自在学C语言 | 指针函数与函数指针

逍遥自在学C语言 | 指针函数与函数指针

前言在C语言中，指针函数和函数指针是强大且常用的工具。它们允许我们以更灵活的方式处理函数和数据，进而扩展程序的功能。本文将介绍指针函数和函数指针的概念，并讲解一些常见的应用示例。一、人物简介第一位闪亮登场，有请…

阅读更多...

金士顿U盘无法识别的修复软件，方便好用

金士顿U盘无法识别的修复软件，方便好用

一、PD V1.16 先打开“PDx16.exe”这个软件，插入U盘。就会在“DEVICE 1”那里检测到U盘（如果没有，就用另外的软件）。然后按“全部开始”。当完成好，再重新插入U盘。二、2090&2090E_V1.6.9_普通版070628 1、插入…

阅读更多...

工业机器人运动学与Matlab正逆解算法学习笔记（用心总结一文全会）（二）

工业机器人运动学与Matlab正逆解算法学习笔记（用心总结一文全会）（二）

文章目录机器人逆运动学※ 代数解、几何解，解析解（封闭解）、数值解的含义与联系○ 代数解求 θ 1 \theta_1 θ1、 θ 2 \theta_2 θ2、 θ 3 \theta_3 θ3※参考资料求解 θ 1 \theta_1 θ1 求解 θ 3 \theta_3 θ3 求解 θ 2 \t…

阅读更多...

JUC高级-0620

JUC高级-0620

8. CAS 原子类：Atomic没有CAS之前：多线程环境不使用原子类保证线程安全i（基本数据类型），可以使用synchronized，但是很重有CAS之后： 使用AtomicInteger.getAndIncrement这样的API，保…

阅读更多...

ARM的半主机模式(Semihosting)

ARM的半主机模式(Semihosting)

本文介绍ARM的半主机模式，并介绍在MCU进行调试时其他的调试方法和手段。 1.ARM半主机模式(Semihosting) ARM Semihosting是ARM平台的一个独特功能，它允许使用主机上的输入和输出函数，通过硬件调试器转发到微控制器，通过挂接到I/…

阅读更多...

网络解析----faster rcnn

网络解析----faster rcnn

Faster R-CNN（Region-based Convolutional Neural Network）是一种基于区域的卷积神经网络用于目标检测任务的模型。它是一种两阶段的目标检测方法，主要包含以下几个步骤： Region Proposal Network（RPN）: F…

阅读更多...

c++ vector的扩容机制

c++ vector的扩容机制

1、当向vector push_back一个元素时，如果此时元素个数超过了vector的容量，会触发扩容 2、扩容的过程是：开辟新空间->拷贝旧空间的元素->释放旧空间 3、扩容过程中开辟新空间的大小影响着往vector插入元素的效率： 如果新空…

阅读更多...

软件系统三基座之三：用户管理

软件系统三基座之三：用户管理

软件系统三基座包含：权限管理、组织架构、用户管理。基于权限控制、组织搭建，用户可以批量入场。一、用户管理在系统构建中，权限控制、组织搭建，对于普通用户都是不可见的。权限控制，在系统搭建时，就会…

阅读更多...

电商网站Web自动化测试实战（编写京东搜索脚本python+selenium框架）

电商网站Web自动化测试实战（编写京东搜索脚本python+selenium框架）

电商网站Web自动化测试实战（ 编写京东搜索脚本） 1，打开京东页京东首页地址：京东(JD.COM)-正品低价、品质保障、配送及时、轻松购物！，故进入京东首页如下： 2，打开浏览器开发者模式…

阅读更多...

Doris-简介、架构、编译、安装和数据表的基本使用

Doris-简介、架构、编译、安装和数据表的基本使用

目录 1、Doris简介2、Doris网址3、Doris架构3、编译和安装 3.1、软硬件需求3.2、编译 3.2.1、安装Docker环境3.2.2、使用Docker 开发镜像编译3.3、集群部署 3.3.1、创建目录并拷贝编译后的文件3.3.2、部署 FE 节点3.3.3、配置 BE 节点3.3.4、在 FE 中添加所有 BE 节点3.3.5、启…

阅读更多...

最小生成树的拓展应用

最小生成树的拓展应用

1.新的开始信息学奥赛一本通（C版）在线评测系统 (ssoier.cn)http://ybt.ssoier.cn:8088/problem_show.php?pid1488 假如自己建个发电站相当于从一个虚拟原点向他有条边，然后做跑一遍最小生成树即可 #include<bits/stdc.h> using nam…

阅读更多...

【云原生】Docker部署/容器加速器（最新版）

【云原生】Docker部署/容器加速器（最新版）

目录初时Docker和部署 1.什么是Docker 2.容器和虚拟化的区别 3.部署Docker 1.卸载历史版本 2.设置存储库 3.安装Docker最新引擎 4.安装Docker特定安装引擎 1.先查看当前docker-ce都有那些版本 2.替换为所需版本，然后运行以下命令要安装的命令： 5.启动D…

阅读更多...

Python入门教程：掌握for循环、while循环、字符串操作、文件读写与异常处理等基础知识

Python入门教程：掌握for循环、while循环、字符串操作、文件读写与异常处理等基础知识

文章目录 for循环while循环字符串操作访问字符串中的字符切片总结字符串拼接文件读写try...except 异常处理函数模块和包类和面向对象编程完结 for循环在 Python 中，for 循环用于遍历序列（list、tuple、range 对象等）或其他可迭代对象。for…

阅读更多...

推荐文章

最新文章