【Hadoop|HDFS篇】NameNode和SecondaryNameNode

news2024/11/15 10:24:35

1. NN和2NN的工作机制

思考:NameNode中的元数据是存储在哪里的?

首先,我们做个假设,如果存储在NameNode节点的磁盘中,因为经常需要进行随机访
问,还有响应客户请求,必然是效率过低。因此,元数据需要存放在内存中。但如果只存在
内存中,一旦断电,元数据丢失,整个集群就无法工作了。因此产生在磁盘中备份元数据的
Fslmage

这样又会带来新的问题,当在内存中的元数据更新时,如果同时更新FsImage,就会导
致效率过低,但如果不更新,就会发生一致性问题,一旦NameNode节点断电,就会产生数
据丢失。因此,引入 Edits文件(只进行追加操作,效率很高)。每当元数据有更新或者添
加元数据时,修改内存中的元数据并追加到Edits 中。这样,一旦NameNode 节点断电,可
以通过 FsImage 和 Edits 的合并,合成元数据。

工作机制图解:

2. Fsimage文件解析

NameNode被格式化以后,将在如下目录产生一些文件。

[hexuan@hadoop102 current]$ ll
总用量 4128
-rw-rw-r--. 1 hexuan hexuan      42 9月   2 17:12 edits_0000000000000000001-0000000000000000002
-rw-rw-r--. 1 hexuan hexuan 1048576 9月   2 17:22 edits_0000000000000000003-0000000000000000010
-rw-rw-r--. 1 hexuan hexuan 1048576 9月   2 22:52 edits_0000000000000000011-0000000000000000138
-rw-rw-r--. 1 hexuan hexuan      42 9月   2 23:29 edits_0000000000000000139-0000000000000000140
-rw-rw-r--. 1 hexuan hexuan 1048576 9月   2 23:29 edits_0000000000000000141-0000000000000000141
-rw-rw-r--. 1 hexuan hexuan 1048576 9月   6 16:22 edits_inprogress_0000000000000000142
-rw-rw-r--. 1 hexuan hexuan    1737 9月   2 23:29 fsimage_0000000000000000140
-rw-rw-r--. 1 hexuan hexuan      62 9月   2 23:29 fsimage_0000000000000000140.md5
-rw-rw-r--. 1 hexuan hexuan    1707 9月   3 17:22 fsimage_0000000000000000141
-rw-rw-r--. 1 hexuan hexuan      62 9月   3 17:22 fsimage_0000000000000000141.md5
-rw-rw-r--. 1 hexuan hexuan       4 9月   3 17:22 seen_txid
-rw-rw-r--. 1 hexuan hexuan     219 9月   3 17:22 VERSION
[hexuan@hadoop102 current]$ pwd
/opt/module/hadoop-3.1.3/data/dfs/name/current
  • Fsimage文件:HDFS文件系统元数据的永久性的检查点,其中包含了HDFS文件系统的所有目录和文件inode的序列化信息。
  • Edits文件:存放HDFS文件系统的所有更新操作的路径,文件系统客户端执行的所有写操作首先被记录到Edits文件中。
  • seen_txid文件保存的是一个数字,就是最后一个edits_的数字。
  • 每次NameNode启动的时候都会将Fsimage文件读入内存,加载Edits里面的更新操作,保证内存中的元数据信息是最新的,同步的,可以看成NameNode启动的时候将Fsimage和Edits文件进行了合并。

3. oiv和oev命令

1)查看oiv命令

语法:hdfs oiv -p 文件类型 -i 镜像文件 -o 转换后文件的输出路径

[hexuan@hadoop102 current]$ hdfs oiv -p XML -i fsimage_0000000000000000140 -o /opt/module/hadoop-3.1.3/fsimage.xml
2024-09-06 20:13:28,002 INFO offlineImageViewer.FSImageHandler: Loading 4 strings

2)查看oev命令

语法:hdfs oev -p 文件类型 -i 编辑日志 -o 转化后文件的输出路径

4. CheckPoint时间设置

1)通常情况下,SecondaryNameNode每隔一小时执行一次。

2)一分钟检查一次操作次数,当操作次数达到一百万时,SecondaryNameNode执行一次。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2111358.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java面试题——第五篇(Java基础)

1. main方法为什么是静态的,能不能改为非静态的 由于JVM在运行Java应用程序的时候,首先会调用main方法,调用时不实例化这个类的对象,而是通过类名直接调用因此需要限制为public static。 不能改为非静态,main方法必须声…

JavaWeb - Mybatis - 基础操作

删除Delete 接口方法: Mapper public interface EmpMapper { //Delete("delete from emp where id 17") //public void delete(); //以上delete操作的SQL语句中的id值写成固定的17,就表示只能删除id17的用户数据 //SQL语句中的id值不能写成…

美妆行业的画册电子版如何制作?

美妆行业的画册电子版制作,首先要确立画册的主题和内容。针对美妆行业特点,可以展示产品系列、护肤理念、品牌故事、用户评价等内容。同时,为了吸引目标受众,需要注重画面美观和时尚感,突出产品特点和品牌形象。 在选择…

如何快速理解网络编程

目录 前言 一、网络编程的概念 二、TCP/IP架构体系的各层作用 三、网络通信中常用的专业术语 四、IP地址的分类和划分 前言 在一个主机中,我们能进行进程间通信,但是随这时代发展,我们不可能只是在单独的一个主机中传输数据,&…

H3C SR-MPLS通过OSPF通告SID配置

首先在配置前理解几个基本概念 Prefix SID配置 统一分配和配置(全局规划)loopback和prefix sidPrefix SIDSRGB Base(16000)index Adj SID自动生成 对应SR节点间的互联链路SR节点本地标识,从设备本地Segment池中动态…

观趋势 谋发展 2024 SSHT上海智能家居展有哪些创新呈现?

引言:大数跨境发布的《2024全球智能家居市场洞察报告》显示,智能家居市场正迎来快速增长,预计从2024年的1215.9亿美元增长至2032年的6332.0亿美元,复合年增长率为22.9%。 近年来,随着物联网、AI等底层技术的飞速进步&…

I/O管理【上】

目录 一. I/O设备的概念与分类二. I/O控制器(考的频率不高,但还是要有印象)三. I/O控制方式(重要考点)3.1 程序直接控制方式3.2 中断驱动方式3.3 DMA方式3.4 通道控制方式 四. I/O软件层次结构4.1用户层软件4.2 设备独立性软件4.3 设备驱动程…

摩博会前瞻:OneOS智能超高安全性彩屏,百元级价格,高性能骑行新选择!

引言 中国国际摩托车博览会即将启动!倒计时7天,OneOS与恒石智能联合打造的十几款智能彩屏仪表首次展出!十几款彩屏仪表由国产HMI芯片Model系列驱动,OneOS实时操作系统,100%国产自主设计,实现百元级超高安全…

DP(Display Port)

DP(Display Port) 一、DP简介 DisplayPort是由美国视频电子协会(VESA:Video Electronics Standards Association)在2006年5月提出的一种新型数字显示接口规范,主要用于源端和设备端(如电脑显示…

虚拟机中使用gparted扩展硬盘容量

步骤1:安装gparted apt-get install gparted 步骤2:关闭虚拟机,扩展硬盘容量 步骤3:开启虚拟机,找到gparted软件,双击 步骤4:扩展,点击原磁盘,点击扩展,点击保…

深度学习(十一)-PaddlePaddle

PaddlePaddle PaddlePaddle(Parallel Distributed Deep Learning,中文名飞桨) 是百度公司推出的开源、易学习、易使用的分布式深度学习平台 源于产业实践,在实际中有着优异表现 支持多种机器学习经典模型 优点 易用性。语法简…

网页时装购物系统:Spring Boot框架的创新设计

第1章 绪论 1.1背景及意义 随着社会的快速发展,计算机的影响是全面且深入的。人们生活水平的不断提高,日常生活中人们对时装购物系统方面的要求也在不断提高,喜欢购物的人数更是不断增加,使得时装购物系统的开发成为必需而且紧迫的…

搭建线上虚拟展厅,需要哪些技术?

搭建虚拟展厅需要一系列先进的技术支持,以确保能够为用户提供逼真、生动、互动的参观体验。以下是搭建虚拟展厅所需的主要技术: 1. 三维建模与渲染技术 三维建模:利用三维建模软件(如Maya、3D MAX、Blender等)建造三维…

Python | Leetcode Python题解之第389题找不同

题目: 题解: class Solution:def findTheDifference(self, s: str, t: str) -> str:return chr(sum(map(ord, t)) - sum(map(ord, s)))

基于free5gc模拟5G核心网和UERANSIM模拟5G用户设备的模拟5G网络环境的部署搭建方法总结和解析。

简介:下文介绍了基于free5gc模拟5G核心网和UERANSIM模拟5G用户设备的模拟5G网络环境的部署搭建方法,并且通过完成相关配置, 简单实现测试5G用户设备接入核心网的注册流程、去注册流程,模拟了一个用户设备通过模拟核心网进行实际的…

2024年上海松江启动建筑绿色低碳发展专项检查,共绘城市节能新篇章

2024年9月4日,2024年度松江区建筑工程绿色低碳发展工作专项检查会议正式开展,会议内容主要围绕以下三点, 1、《关于开展 2024年度本市建筑领域绿色低碳发展工作监督检查的通知》宣贯。 2、分项计量、能效测评工作验收要求介绍。 3、专项检…

怎么使用matplotlib绘制一个从-2π到2π的sin(x)的折线图-学习篇

首先:如果你的环境中没有安装matplotlib,使用以下命令可以直接安装 pip install matplotlib如何画一个这样的折线图呢?往下看 想要画一个简单的sin(x)在-2π到2π的折线图,我们要拆分成以下步骤: 先导入相关的库文…

用ChatGPT撰写论文被判抄袭?8个技巧让你轻松写出原创优质论文

在学术写作中,原创性和诚信是评价论文质量的关键因素。ChatGPT作为一种先进的AI写作助手,可以帮助您快速生成内容,但同时也带来了抄袭的风险。本文将探讨如何在使用ChatGPT时确保您的论文内容独特且原创。 以下是每个步骤的详细使用说明和操作案例: 一、具体提问与个性化…

VBA进行excel坐标转换

在Excel里利用坐标绘图时,可以比较容易想到采用数据透视表,但是数据透视表生成的图不可更改,因此本案例采用VBA进行坐标变换而不改变原始值来转换图像,即实现图像的左右翻转和上下翻转,如下图所示,选择map的…

万字长文,只为给小白说明白搭建一个单节点多工作节点k8s如何操作!!!

这里写目录标题 1. Kubernetes 基础概念1.1 什么是 Kubernetes?1.2 核心组件 本次搭建的机器演示具体的安装部署步骤修改主机的机器名称依次修改主机的host文件配置免密登录当前用户的 SSH 公钥复制到远程主机关闭交换区分区加载 br_netfilter 内核模块为什么安装 K…