p2Cache: Exploring Tiered Memory for In-Kernel File Systems Caching——论文泛读

news2024/11/26 22:17:25

ATC 2023 Paper 分布式元数据论文汇总

问题

快速、字节寻址的持久性内存(PM)正在产品中变得越来越现实。然而,使传统的内核文件系统完全支持PM需要大量的工作,面临着在块级访问粒度和字节寻址之间转换的挑战。此外,新的针对PM的文件系统仍然远未达到生产的水平,难以广泛使用。

挑战

随着存储设备变得更快,分层存储堆栈的开销变得更加显著。例如,软件开销在低延迟(3us)NVMe SSD上贡献了50%的读取延迟[45]。随着存储设备变得更快、更接近CPU,软件开销变得更加占主导地位。英特尔的Optane持久内存[10]位于内存总线上,读取延迟低至~170 ns[44]。

本文方法

我们提出了P2CACHE,一种新颖的内核缓存机制,探讨了在快速、字节寻址的PM面前,传统的内核文件系统如何有效演变。

  • 在PM和DRAM的分层内存系统上利用读/写可区分的内存层次结构。利用PM为所有写请求提供即时的数据耐久性和强大的崩溃一致性,使用DRAM为大多数读I/O提供高I/O性能。

  • 引入了一个位于VFS层下方的持久缓存。使用PM来快速同步地持久化/缓冲文件系统的元数据/数据更新,确保即时的数据耐久性和强大的崩溃一致性。然后,缓冲的操作通过现有的I/O接口异步应用于底层的内核文件系统,确保与内核文件系统的兼容性。持久缓存建立在一个轻量级的操作日志之上,该日志捕获来自VFS的文件系统更新,并将它们记录在一个预写式日志中。利用PM的字节寻址能力,将复制操作与写操作解耦来高效地持久化元数据/数据更新,在写操作被同步记录的同时异步执行数据复制。

  • 进一步优化了页面缓存,通过更快但易失性的DRAM为大多数读操作提供服务。利用了设备级并行性让两个缓存协同高效地工作,即持久缓存和页面缓存。我们观察到将数据同时写入PM和DRAM的I/O延迟几乎与仅将数据写入PM的延迟相同,因为对DRAM的(额外)复制的延迟被并行但较慢的PM写隐藏起来。因此我们采用了一个简单而有效的包容式缓存模型,相同数据的多个副本存储在分层内存中,而最顶层(即DRAM)始终包含最新版本。包容式缓存模型简化了两个缓存之间的同步:对于写操作,更新两个缓存;对于读操作,从页面缓存、持久缓存和底层文件系统中顺序搜索,直到首次找到数据。

开源代码:GitHub - YesZhen/P2CACHE

我们的评估表明,P2CACHE可以显著提高传统内核文件系统的性能,例如,在Ext4上对RocksDB的提高达到了200倍,同时为它们提供即时的数据耐久性和强大的崩溃一致性,类似于专为PM设计的文件系统。

实验

实验环境:两个12核Intel Xeon Gold 5317处理器(3.0 GHz,18M Cache)的ASUS RS700-E10-RS12U服务器,每个处理器具有2个NUMA节点,每个节点具有256 GB DRAM。启用turbo boost时禁用了超线程。为每个NUMA节点安装了四个128 GB(总计512 GB)的Intel Optane 200系列持久内存和一个2 TB的Samsung PM883 SSD。

数据集:microbenchmark,Filebench[6],db_bench[1],MinIO[14]

实验对比:每秒操作数(Mops),IOPS

总结

优化利用PM的文件系统,传统方法需要对原始文件系统进行大量修改以支持PM使用,作者提出利用PM和DRAM构建缓存机制,不修改现有文件系统的同时利用PM的优势:高I/O性能、高I/O并发性、即时数据持久性和强一致性。提出在VFS下引入持久缓存,使用PM快速同步持久/缓充文件系统元数据/数据更新,随后异步应用于底层文件系统;利用DRAM和PM构建页面缓存,将数据写入PM的同时更新DRAM,读操作时利用DRAM缓存加速查找。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1426047.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

react 之 react.memo

React.memo 作用:允许组件在props没有改变的情况下跳过重新渲染 组件默认的渲染机制 默认机制:顶层组件发生重新渲染,这个组件树的子级组件都会被重新渲染 // memo // 作用:允许组件在props没有改变的情况下跳过重新渲染import…

UGUI中Text和TextMeshPro实现图文混排方式

一些项目中实现图文混排是自定义一个脚本去继承Text类,然后文本中用富文本的方式进行图片和超链接的定义,在代码中用正则表达式匹配的方式把文本中图片和超链接给替换,如下: TextMeshPro实现是生成SpriteAsset进行图文混排的&…

SpringCloud + Nacos配置文件加载顺序和优先级详解

文章目录 一、加载顺序与优先级1. 示例配置2. 配置文件分类3. 加载顺序4. 优先级 二、本地配置优先的设置结论 在微服务架构中,合理地管理和理解配置文件的加载顺序与优先级对于确保应用的稳定性和灵活性至关重要。特别是在使用 Spring Cloud Alibaba Nacos 作为配置…

数组与字符串深度巩固

经过再三思考觉得今天就写一篇关于数组与字符串相关的文章吧!其中字符串主要通过练习来巩固知识亦或是获得新知识。好接下来将进行我们的学习时刻了。 首先我们来思考一个问题,你真的了解数组的数组名吗?数组名真的就单单一个名字而已吗&…

nodejs+vue+mysql校园失物招领网站38tp1

本高校失物招领平台是为了提高用户查阅信息的效率和管理人员管理信息的工作效率,可以快速存储大量数据,还有信息检索功能,这大大的满足了用户和管理员这两者的需求。操作简单易懂,合理分析各个模块的功能,尽可能优化界…

【unity小技巧】unity3d创建和实现破碎打破物品,万物可破碎

文章目录 破碎插件可破碎的物品代码控制加入破坏力完结 破碎插件 关于物品破碎,其实之前已经分享过一个免费插件,如果没有碎片化的模型,可以选择使用这个插件: OpenFracture插件实现unity3d物体破裂和切割 可破碎的物品 代码控制…

zsh: command not found: mysql (mac通过安装MySQL后终端cmd找不到mysql命令)

考虑是mysql环境变量没有配置的问题 1.查找mysql安装路径 ps -ef|grep mysql 2.先启动上安装的mysql 3. 查看 .bash_profile 文件 ls -al 查看是否有(.bash_profile)文件 如果没有就输入以下命令创建一个,再查看 touch .bash_profile 4.打开 .bash_profile 文件 …

Spring的事件监听机制

这里写自定义目录标题 1. 概述(重点)2. ApplicationEventMulticaster2.1 SimpleApplicationEventMulticaster2.2 AbstractApplicationEventMulticaster 3. ApplicationListener3.1 注册监听器3.2 自定义 4. SpringApplicationRunListeners 1. 概述&#…

气膜厂家产品种类繁多,哪种适合您?

气膜是一种以薄膜为材料、通过气体充气而形成的充气结构。由于其轻便、灵活、耐用等优点,在各个领域都有广泛应用。气膜厂家生产的产品种类繁多,下面将介绍几种常见的气膜产品,并分析哪种适合您。 气膜建筑是气膜厂家的特色产品之一。气膜建…

探析零知识证明高能发展路径:走向更安全、私密且可扩展的 Web3 新时代

原文:https://www.coinbase.com/blog/understanding-the-zero-knowledge-landscape 作者:Jonathan King|Coinbase Ventures 编译:TinTinLand 本文核心观点 2023 年,零知识技术吸引了逾 4 亿美元的投资,主…

凝聚共识开新篇:产业“围炉谈”共促5G-A加速

由北京通信学会主办的“新阶段、新体验、新价值”产业围炉谈活动在北京时间1月25日已成功举办。 来自社会各界的专家代表齐聚一堂,围炉畅谈5G-A产业发展,共同呼吁5G-A产业加速,擘画数字发展新画卷。 承前启后,5G-A开启5G新阶段 …

MySQL索引的原理和SQL优化策略

1. 索引 在InnoDB存储引擎中,索引分为聚簇索引和辅助索引两种类型。 聚簇索引是指基于表的主键构建的索引,它决定了表中数据的物理存储顺序。也就是说,聚簇索引中的键值按照主键的顺序来排序,并且每个叶子节点存储的是整个表行的…

VBA技术资料MF113:将文件夹图像添加到PowerPoint

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。我的教程一共九套,分为初级、中级、高级三大部分。是对VBA的系统讲解,从简单的入门,到…

小程序跳转:云开发之h5跳小程序

背景: 抖音通过链接跳转微信小程序。考虑使用h5页面中转实现,下面是实现步骤。 官方的文档上面写的还是比较详细的,可以仔细阅读,按照步骤去操作。 实践总结: 测试必须使用真机测试,模拟器之类的全部不…

Spring实现事务(一)

Spring事务 .什么是事务事务的操作Spring中事务的实现准备工作创建表创建项目,引入Spring Web, Mybatis, mysql等依赖配置文件实体类 编程式事务(手动写代码操作事务)声明式事务(利用注解自动开启和提交事务) . 什么是事务 事务是⼀组操作的集合, 是⼀个不可分割的操作 在我们…

P9809 [SHOI2006] 作业 Homework 浅显易懂讲解这道题为什么根号分治

题目: 我们有一堆数,找出模Y的最小值。 思路: 我们初步思考,会发现每个Y是一段,比如 1~Y , Y~2Y , 2Y~3Y ... 每个区间都可能有最小的答案。 这里对Y可以使用根号分治,因为: 当Y足够大时&a…

MySQL原理(一)架构组成之物理文件组成

目录 一、日志文件 1、错误日志 Error Log 1.1、作用: 1.2、开启关闭: 1.3、使用 2、二进制日志 Binary Log & Binary Log Index 2.1、作用: 2.2、开启关闭: 2.3、Binlog还有一些附加选项参数 (1&#x…

8.4 Springboot整合Redis 之RedisTemplate方式

文章目录 前言一、Maven依赖二、配置文件application.properties2.1 连接池核心配置说明三、RedisTemplate配置类四、RedisTemplate工具类五、测试前言 上文我们讲解了官方推荐的Jedis方式,本文讲解Springboot通过Spring Data Redis 集成 Redis,主要使用RedisTemplate方式,…

LeetCode 使循环数组所有元素相等的最少秒数

地址:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 难度:中等 题目描述:给你一个下标从 0 开始长度为 n 的数组 nums 。 每一秒,你可以对数组执行以下操作: 对于范围在 [0, n - 1] 内的每…

Java 类的加载流程

一、类的加载 指的是将类的.class 文件中的二进制 数据读入到内存中,将其放在运行时数据区的方法区内,然后在堆区创 建一个 java.lang.Class 对象,用来封装类在方法区内的数据结构。 类从被加载到虚拟机内存中开始,到卸载出内…