Lunule: An Agile and Judicious Metadata Load Balancer for CephFS——论文泛读

news2024/11/17 19:38:09

SC 2021 Paper 元数据论文阅读汇总

问题

CephFS采用动态子树分区方法,将分层命名空间划分并将子树分布到多个元数据服务器上。然而,这种方法存在严重的不平衡问题,由于其不准确的不平衡预测、对工作负载特性的忽视以及不必要/无效的迁移活动而导致性能不佳。

挑战

性能问题主要是由以下两个原因造成的:1)不准确的负载模型与忽视良性不平衡:负载监控模块未能准确模拟每个MDS的负载和集群负载,同时也不能容忍良性不平衡,其中负载不平衡水平保持在安全区间;2)无效的子树迁移候选选择:迁移决策模块不适当地选择了子树迁移候选项,没有考虑这些子树的访问模式和未来的负载变化。

现有方法局限性

Mantle [35]将负载统计收集和迁移决策步骤与CephFS的其他元数据管理分离,并提供可编程的API,允许用户指定确定何时以及迁移多少的函数。然而,这些API有限,不涵盖重要的子树选择功能。而且,得出准确的负载模型和合理的元数据迁移和负载平衡启发式仍然是一个挑战。

本文方法

我们提出了Lunule,基于CephFS动态子树分区的新型元数据负载平衡器。

  • 为了在需要时进行重新平衡,Lunule由一个分析模型驱动,该模型准确捕捉整个MDS集群的工作负荷强度水平。与使用平均负载统计不同,该模型使用变异系数来计算MDS集群的实时不平衡因子,以最小化噪声对迁移决策的负面影响。我们引入了一个紧急参数,用于量化不平衡情况是否对未来减少不必要的迁移安全或有害。基于该模型,Lunule确定了出口MDS和进口MDS。出口MDS的需要将一些负载迁移到其他对等节点。进口MDS具有多余的容量来容纳负载,并根据MDS未来的负载变化,计算应该在两个MDS之间迁移多少数据。

  • Lunule选择在每个出口MDS上要移动的子树集,准确预测不同子树的未来访问频率(分配为它们的迁移索引),并选择具有较高值的迁移子树候选是至关重要的。我们提出了一个统一的公式来估计子树过去访问活动的时间和空间局部性对其未来负载的影响。对于时间局部性,我们考虑最近的时间间隔内元数据访问的重复性,而不是依赖于当前CephFS中使用的简单累积的流行度计数器。对于空间局部性,我们考虑目标子树的元数据访问的均匀分布,并考虑兄弟子树之间的访问相关性。

与基准相比,Lunule实现了更好的负载均衡,在五种真实工作负载及其混合情况下,分别将元数据吞吐量提高了高达315.8%,并将尾部作业完成时间缩短了高达64.6%。此外,Lunule能够处理元数据集群的扩展和客户端工作负载的增长,并在16个MDS的集群上呈线性扩展。

实验环境

测试平台:实验在一个本地集群上运行,该集群有16个裸金属服务器,通过56Gb/s IPoIB网络连接。每台服务器有2个Intel(R)Xeon(R)E5-2650 V4 CPU、64 GB内存和1.6TB NVMe SSD(Intel P4610),运行的是CentOS版本7.3.10.0862.14.4.el7.x86_64。

数据集:

实验对比:负载不平衡情况、元数据吞吐量、作业完成时间、如何适应工作负载和集群扩展的变 化

总结

对Ceph的元数据负载均衡机制进行优化,原始方法由于对未来负载预测的不准确和无效迁移导致性能低。作者通过变异系数计算不平衡因子模型,减小噪声影响,准确确定何时触发重新平衡;通过紧急参数,容忍良性的不平衡情况;感知工作负载时间局部性(最近时间间隔内元数据访问的重复性)和空间局部性(目标子树元数据访问的均匀分布,并考虑兄弟子树间的访问相关性),以选择子树迁移候选项。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1386426.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024年,文旅行业如何抓住流量密码

去年的“进淄赶烤”,今年哈尔滨的“讨好型市格”,回顾2023,大家都去了哪里玩呢?随着人们生活水平的提高,文旅消费需求也发生了升级,人们更加注重文化体验、参与感和个性化服务。那么在2024年,文…

冯诺依曼体系结构和操作系统

文章目录 冯诺依曼体系结构对冯诺依曼体系结构的理解——用QQ和朋友聊天时数据的流动过程操作系统是什么操作系统的作用操作系统 冯诺依曼体系结构 冯诺依曼结构也称普林斯顿结构,是一种将程序指令存储器和数据存储器合并在一起的存储器结构。程序指令存储地址和数据…

数据资产入表背后:中国To B数字化驶入“数据时代”

数据资产“入表”,更像是一剂通过颠覆旧的生产关系,从根上医治数字化转型的“良方”。 那么,数据资产到底是什么?以及在愈发被规范的数据市场大背景下,对中国的To B企业和To B服务商而言,正在或者即将发生…

WaitForSingleObject 函数的诸多用途与使用场景总结

目录 1、WaitForSingleObject函数详细说明 2、在线程函数中调用WaitForSingleObject实现Sleep,可立即退出Sleep状态 3、调用WaitForSingleObject函数监测线程或进程是否已经退出 3.1、子进程实时监测主进程是否已经退出,主进程退出了,则子…

高级分布式系统-第15讲 分布式机器学习--神经网络理论

神经网络理论 模糊控制在处理数值数据、自学习能力等方面还远没有达到人脑的境界。人工神经网络从另一个角度出发,即从人脑的生理学和心理学着手,通过人工模拟人脑的工作机理来实现机器的部分智能行为。 人工神经网络(简称神经网络&#xf…

【嘉立创EDA】原理图显示/隐藏引脚标识

文章路标👉 文章解决问题主题内容be end..文章解决问题 1️⃣ 嘉立创EDA专业版,操作版本是V2.1.17客户端半离线版本。 本文基于嘉立创EDA专业版讲述如何将原理图中已建立的器件的引脚标识进行显示或隐藏。本文将此过程记录,以供有需要的读者参考。 主题内容 2️⃣ 对目…

html5+css3+bootstrap+js 新闻网页

新闻网页练习打卡! 一、首页 二、社会 三、财经 四、视频展示 简易新闻网站(期末作业)

无纸化革新:纸质文件转在线存储和检索 | 开源日报 No.141

paperless-ngx/paperless-ngx Stars: 13.9k License: GPL-3.0 Paperless-ngx 是一个文档管理系统,将您的纸质文件转换为可搜索的在线存档,以便您可以保留更少的纸张。 完整功能列表和截图可在文档中找到通过 docker compose 最简单地部署 paperless可以…

Linux驱动学习—IIC总线之FT5X06触摸驱动实验

1、实现触摸坐标值上报 流程图&#xff1a; 设备树如下&#xff1a; 触摸设备对应的设备树节点是&#xff1a; 读取坐标的寄存器&#xff1a; #include <linux/init.h> #include <linux/module.h> #include <linux/i2c.h> #include <linux/gpio.h> #i…

HTML---JAVAscript对向和原型链

文章目录 前言一、pandas是什么&#xff1f;二、使用步骤 1.引入库2.读入数据总结 前言 一.JavaSceipt对象概述 JavaScript是一种基于对象的编程语言&#xff0c;每个值都是一个对象。JavaScript中的对象是一种无序的键值对集合&#xff0c;其中每个键都是唯一的。 JavaScript的…

@Controller层自定义注解拦截request请求校验

一、背景 笔者工作中遇到一个需求&#xff0c;需要开发一个注解&#xff0c;放在controller层的类或者方法上&#xff0c;用以校验请求参数中(不管是url还是body体内&#xff0c;都要检查&#xff0c;有token参数&#xff0c;且符合校验规则就放行)是否传了一个token的参数&am…

D4140 交流插座电器漏电断路器的低功耗控制芯片,内置桥式整流器漏电灵敏度可调,采用SOP8和DIP8 的封装形式

D4140 是一种用于交流插座电器漏电断路器的低功耗控制器。这些设备可以检测到接地的危险电流路径&#xff0c;例如设备掉进水中。在发生有害或致命的电击之前&#xff0c;断路器会断开线路。内置有整流桥&#xff0c;齐纳管稳压器&#xff0c;运算放大器&#xff0c;电流基准&a…

C++(11)——string

前面通过前面篇文章介绍了中的各项基本知识。从本篇文章开始&#xff0c;将对中的中的各项内容进行介绍&#xff1a; 目录 1.string类对象的常见构造&#xff1a; 2. string类对象的赋值操作&#xff1a; 3. string类对象的访问与遍历&#xff1a; 3.1 string类对象的访问…

大数据Doris(五十六):SQL函数之地理位置函数

文章目录 SQL函数之地理位置函数 一、​​​​​​​ST_AsText(GEOMETRY geo)

An efficient path-based approach for influence maximization in social networks

ABSTRACT 口碑对社会联系的影响非常强大&#xff0c;这已不是什么秘密&#xff0c;但问题是“哪些因素影响口碑的有效性&#xff1f;”答案取决于一小组节点如果被激活&#xff0c;就会将信息传播到整个网络。这是社交网络分析中的一个主要问题&#xff0c;称为影响力最大化&am…

优雅处理并发:Java CompletableFuture最佳实践

第1章&#xff1a;引言 大家好&#xff0c;我是小黑&#xff0c;今天&#xff0c;小黑要和大家聊聊CompletableFuture&#xff0c;这个Java 8引入的强大工具。 在Java传统的Future模式里&#xff0c;咱们都知道&#xff0c;一旦开始了一个异步操作&#xff0c;就只能等它结束…

Xcode 15 for Mac:超越开发的全新起点

作为一名开发人员&#xff0c;你是否正在寻找一款强大而高效的开发工具&#xff0c;来帮助你在Mac上构建出卓越的应用程序&#xff1f;那么&#xff0c;Xcode 15就是你一直在寻找的答案。 Xcode 15是苹果公司最新推出的一款集成开发环境&#xff08;IDE&#xff09;&#xff0…

介绍C++的关键字(保留字)

介绍C的关键字&#xff08;保留字&#xff09; 1. asm asm (指令字符串)&#xff1a;允许在 C 程序中嵌入汇编代码。 2. auto auto&#xff08;自动&#xff0c;automatic&#xff09;是存储类型标识符&#xff0c;表明变量"自动"具有本地范围&#xff0c;块范围的…

2024PMP考试新考纲-【过程领域】近期典型真题和很详细解析(6)

距离2024年3月10日的PMP考试还有不到两个月了&#xff0c;加油&#xff01; 华研荟继续为您分享【过程Process领域】的新考纲下的真题&#xff0c;进一步帮助大家体会和理解新考纲下PMP的考试特点和如何应用知识来解题&#xff0c;并且举一反三&#xff0c;一次性、高等级通过…

【excel密码】Excel中如何使部分单元格区域实现加密

Excel文件可以设置保护工作表&#xff0c;那么可以只保护工作表中的部分单元格&#xff0c;其他地方可以正常编辑吗&#xff1f;当然是可以的&#xff0c;今天我们学习&#xff0c;如何设置保护部分单元格。 首先&#xff0c;我们先将整张工作表选中&#xff08;Ctrl A&#…