HDFS回收站-删除策略详解

news2024/12/23 17:55:22

HDFS拥有回收站的功能,将某一段时间的删除的数据,放到指定路径(/user/{username}/.Trash),至少保留指定的时间,然后一起删除。

现实中发现回收站里有该删除的却没有删除,和回收站原理逻辑对不上。
以下从源码上看看到底是什么原因导致的。

背景

某HDFS集群指定数据保留时间为360分钟,理论是删除的数据至少保留6小时,才会被真正的删除。当前时间删除的数据放入(/user/{username}/.Trash/Current/)目录,以6小时为周期,每个周期的起点时间,将.Trash/Current/目录(也就是上个周期的被删除的数据)重命名为当前时间格式为yyMMddHHmmss 的名字的目录,例如 /user/hive/.Trash/240819080022。

正常的具体流程是:

        1. 08点 将目录名为: XXXXXX020000 的彻底删除(也就是目录名为凌晨02点)
        2. 将.Trash/Current/目录 重命名为:XXXXXX080000
        3. 14点 将目录名为: XXXXXX080000 的彻底删除(也就是目录名为凌晨08点)
        4. 将.Trash/Current/目录 重命名为:XXXXXX140000
        5. 20点 将目录名为: XXXXXX140000 的彻底删除(也就是目录名为凌晨14点)
        6. 将.Trash/Current/目录 重命名为:XXXXXX200000
        7. 02点 将目录名为: XXXXXX200000 的彻底删除(也就是目录名为凌晨20点)
        8. 将.Trash/Current/目录 重命名为:XXXXXX020000
        9. 重复执行到第1步,继续循序

发现的问题

从hdfs的容量监控中可以看到,每天的 2点8点14点20点 都会出现容量降下去。但是现实中发现,唯独每天14点却没有明显的容量下降?这个不是个别现象,每天如此。

这种原因究竟是什么导致的?

根据以上流程14点应该删除的是目录名为 XXXXXX080000 。可以到命令行中查看.Trash/目录的情况,发现 XXXXXX080000 仍在,没有被删除。

$ hadoop fs -ls /user/XXXXXX/.Trash
Found 3 items
drwx------   - XXXXXX XXXXXX          0 2024-08-19 02:00 /user/XXXXXX/.Trash/240819080022
drwx------   - XXXXXX XXXXXX          0 2024-08-19 08:00 /user/XXXXXX/.Trash/240819140013
drwx------   - XXXXXX XXXXXX          0 2024-08-19 14:00 /user/XXXXXX/.Trash/Current

这里问题进一步锁定是14点要删除的没删,所以导致容量没有下降。

问题探索

1.查看源码

namenode调用

namenode 启动一个新的守护

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2056145.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docusign Maestro:智能自动化,实现无缝协作,让签约更简单!

作为 Docusign IAM 引擎的核心部分,Maestro 能够帮助你自动化、定制并连接你的协议工作流程。你可以完全按照自己的需求,定制每一个流程细节。无论是什么类型的协议,Maestro 都能减少繁琐的手动操作,让最终用户更快、更轻松地完成…

springboot网上商品订单转手系统论文源码调试讲解

第2章 开发环境与技术 开发网上商品订单转手系统需要搭建编程的环境,也需要通过调查,对各个相关技术进行分析,选取适合本系统开发的技术与工具。 2.1 MYSQL数据库 题目确定了是一个应用程序之后,就开始按部就班的进行设计与分析…

7个超有意思的网站,值得收藏起来慢慢用

分享7个超有意思的网站,绝对让你意想不到! 1、动漫捏脸 Picrew|つくってあそべる画像メーカー 一个超有趣的二次元动漫捏脸网站,你可以随意制作自己喜欢的各种动漫形象、头像等画作,搭配B站教程食用更佳哦~ 搭配教…

全场景 真利旧 强运维!麒麟信安打造县域自主创新云办公解决方案

近年来,国家正大力推进信息技术自主创新,减少对外依赖,并在关键行业加速推广和应用自研技术产品。现全国乡镇以上各级党政机关积极响应国家战略指引,全面实施自主创新办公系统建设升级。但在升级过程中,却因设备架构和…

4款AI 生成 PPT的工具,帮你赶上演示文稿的新趋势!

AI 生成 PPT 最大的优势就在于它能够帮助我们提高效率。如果我们自己制作的话就需要花费大量的时间去收集资料、构思布局、设计排版。而现在,有了AI工具,一切就迎刃而解,如果大家需要这样的工具,可以看看这4款。 1、笔灵办公 直通…

网络硬盘录像机NVR程序源码海思3520D NVR 安防监控智能升级运用方案

随着安防技术的不断发展,传统的监控系统正逐步向智能化方向转变。海思Hi3520D作为一款高性能的网络视频处理芯片,在NVR(网络视频录像机)领域有着广泛的应用。本方案旨在探讨如何利用海思Hi3520D芯片的强大功能对现有的NVR系统进行…

软件测试需求分析有多重要?软件测评公司如何进行测试需求分析?

软件测试需求分析是指在软件测试过程中,对用户需求和功能需求进行深入理解和评估的过程。它主要帮助测试团队明确测试目标、制定测试策略,并根据需求制定测试用例。这一过程不仅提高了测试的效率,也降低了后续开发与测试中可能出现的问题。 …

Qt 0819作业

一、思维导图 二、字体对话框的实现 #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this); }Widget::~Widget() {delete ui; }void Widget::on_pushButton_clicked(…

ant design pro 技巧之自制复制到剪贴板组件

ant design pro 如何去保存颜色ant design pro v6 如何做好角色管理ant design 的 tree 如何作为角色中的权限选择之一ant design 的 tree 如何作为角色中的权限选择之二ant design pro access.ts 是如何控制多角色的权限的ant design pro 中用户的表单如何控制多个角色ant des…

【PyCharm安装】安装Python和PyCharm的注意事项!!!PyCharm常用的插件介绍。

安装Python的注意事项 确定所需版本:根据您的项目和库的要求,选择合适的Python版本进行安装。不同版本的Python可能支持不同的库和特性。确保网络连接:如果您使用的是在线安装方式,确保您的计算机有可靠的网络连接,以…

《Techporters架构搭建》-Day07 集成API文档工具

API文档化 前言API文档化历史集成Knife4j常用注解基本信息注解分组注解请求方法注解路径注解 使用示例 源码地址:请看day07 前言 在现代软件开发中,良好的API文档是团队协作和项目管理中不可或缺的一部分。OpenAPI规范(前身为Swagger&#x…

AI绘画Stable Diffusion插件—LayerDiffusion 分层控图新突破!生成透明图片前后景图片融合,毫无违和感!

大家好,我是画画的小强 用AI绘画Stable Diffusion 生成透明图片怎么搞? 这要搁之前,我们需要生成完图片,然后放到去背景插件中调整参数去除背景!效果一般般 如果想要在一张图片上添加主体,该怎么搞&#…

使用gpreftools测试性能

参考文献: C 性能分析工具调研_性能分析工具 gperf perf vergi 比较-CSDN博客性能测试工具CPU profiler(gperftools)的使用心得-CSDN博客gperftools使用方法和常见问题_pprof no nodes to print-CSDN博客c 分析 gperftools 总结 | Weakyon Blog 文章目录 安装使用 …

如何搭建知识库?2024年6款工具优质推荐

一、引言 在当今信息化时代,知识管理已成为企业提升竞争力和实现持续发展的关键。搭建一个高效、易用的知识库,不仅能帮助企业更好地整合和分享内部资源,还能提升员工的工作效率和创新能力。本文将详细介绍如何搭建知识库,并推荐…

制作语音数据集: 爬取B站音视频+基于whisper语音识别标注

本文以制作小学课堂音频数据集为例子 1. 搜索关键字获取音视频链接 if __name__ "__main__":with sync_playwright() as playwright:searcher BLVideoSearch(playwright, headlessTrue)url searcher.make_url(keyword["小学公开课"])searcher.run(url, …

英文科目一外国人要考中国驾照理论考试题目是什么样的

随着中国的国际化发展,越来越多的外国朋友选择在中国生活和工作,其中一些人可能会考虑在这里考取驾驶执照。然而,语言障碍成为了他们面临的一大挑战。一个常见的问题是科目一考试是否提供英文版本或者是否有翻译服务。本文将介绍中国车管所提…

什么是IP?

目录 简介 IP IP协议 IP地址 发展历程 IP地址类型 公有地址 私有地址 IP地址编址方式 A类IP地址 B类IP地址 C类IP地址 D类IP地址 特殊的网址 子网 超网 无类间路由 IP地址的分配 IP地址管理 手工管理模式 DHCP分配IP地址的管理模式 通过交换机管理IP 地址…

分布式ID-一窥雪花算法的原生实现问题与解决方案(CosId)

分布式ID-雪花算法的问题与方案(CosId) 基本原理 外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url%E5%88%86%E5%B8%83%E5%BC%8FID-%E9%9B%AA%E8%8A%B1%E7%AE%9…

微分方程(Blanchard Differential Equations 4th)中文版Section1.6

平衡点与相直线 给定一个微分方程 d y d t = f ( t , y ) , \frac{dy}{dt} = f(t, y), dtdy​=f(t,y), 我们可以通过绘制斜率场和勾勒图形来大致了解解的行为,或者使用欧拉法计算近似解。有时我们甚至可以推导出解的显式公式并绘制结果。所有这些技术都需要相当多的工作,无…

武汉流星汇聚:西班牙时尚消费高涨,中国商家借亚马逊平台拓商机

在2024年第二季度的亚马逊西班牙站,一场前所未有的时尚盛宴正悄然上演。销售额同比高增长TOP10品类榜单的揭晓,不仅揭示了西班牙消费者对于时尚品类的狂热追求,更为亚马逊平台上的中国商家开启了一扇通往新蓝海的大门。其中,男士拳…