Salus: Efficient Security Support for CXL-Expanded GPU Memory——论文泛读

news2024/12/23 4:16:58

HPCA 2024 Paper CXL论文阅读笔记整理

问题

GPU已成为许多数据密集型应用程序不可或缺的加速器,如科学工作负载、深度学习模型和图分析,这些应用程序对越来越大的内存有着共同的需求。通常,采用统一存储器[12]、[18]、[34]、[67]和多GPU[7]、[48]、[50]来克服GPU的容量墙。

  • 统一存储器:主机存储器与GPU设备存储器结合使用。但除了频繁的主机交互以协调内存管理外,从外部内存传输数据是不可避免的,从而导致显著的性能开销[34]。

  • 多GPU:将工作集分布在不同的GPU设备存储器上,GPU之间的通信成为瓶颈[48]。

随着传统内存接口连接的内存容量达到极限,异构内存系统在扩展内存池方面获得了吸引力。一些工作[19]、[27]、[28]、[40]、[43]探索了使用计算快速链路(CXL)[1]进行系统内存扩展,还研究了高效使用扩展内存系统的页面放置和分页策略。CXL扩展内存允许使用抽象和通用的加载/存储语法访问不同的内存(例如,DDR或NAND[29]),通过将数据存储在CXL扩展内存中,GPU可以管理无法容纳在其本地GDDR/HBM内存中的数据,同时避免中断或长链接远程访问。

但将关键应用程序卸载到异构内存系统会面临更高的安全漏洞,即针对其数据或计算的攻击。在这样的环境中提供机密计算是必不可少的,机密计算通过引入可信执行环境(TEE)来提供安全保障。TEE将应用程序数据和计算与其他共享应用程序或外部实体隔离,在物理世界中,TEE定义了一个表示信任区域的可信计算库(TCB),通常是GPU芯片。TCB之外的任何组件,包括片外存储器,都被认为是不可信的,使用这些组件需要安全保证。

CXL扩展内存和GPU设备内存之间的不对称带宽对性能和安全提出了新的挑战。传统异构存储器系统需要缓存或页面迁移方案,将频繁访问/待访问的数据移动到更高带宽的存储器来确保高性能。但现有安全方案会带来显著的性能开销,因为从慢速存储器(即CXL扩展存储器)到快速存储器(即GDDR/HBM)的每一次数据移动都会触发与安全相关的操作(例如,加密和身份验证)。例如,在慢速存储器(即CXL扩展存储器)和快速存储器(即GDDR/HBM)之间交换数据需要两个存储器在每个存储器发送/接收数据时执行安全操作;此外,这两个存储器不仅被请求用于数据,而且还被请求用于安全元数据。因此,在异构适应CXL内存扩展的安全GPU中实现高性能的主要挑战是设计高效的安全元数据管理,通过考虑安全需求和动态数据移动来减少与安全相关的流量。而且现有的安全实施的元数据与数据的物理位置有关。

本文方法

本文提出了一种新的安全模型,适用于具有异构存储器的GPU。

  • 统一存储器的安全元数据,将安全元数据与数据的物理位置解耦,从而消除了在数据重新定位过程中的重新加密。

  • 重组加密计数器块,在具有相同交织粒度的次要计数器之间有效地共享主要计数器,从而在数据重新定位时进一步减少流量。同时压缩了内存中访问频率较低的的计数器块,确保了高效的存储和流量。

  • 在CXL到GPU映射中以位掩码格式跟踪脏信息,显著减少元数据访问和写回相关的流量。

根据实验评估,与传统安全模型相比,本文提出的安全模型将GPU吞吐量的几何平均值提高了29.94%(高达190.43%),并将内存子系统中的安全流量平均降低到47.79%(低至17.71%的开销)。

实验

实验环境:GPGPU-sim

总结

针对使用CXL内存扩展GPU内存时,为了实现安全产生的相关流量。本文提出了一种新的安全模型,包括三个技术:(1)统一存储器的安全元数据,将安全元数据与数据的物理位置解耦,消除了在数据重新定位过程中的重新加密。(2)重组加密计数器块,在次要计数器之间共享主要计数器,从而减少流量,同时压缩访问频率较低的的计数器块。(3)在CXL到GPU映射中以位掩码格式跟踪脏信息,显著减少元数据访问和写回相关的流量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1885202.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024阿里云大模型自定义插件(如何调用自定义接口)

1,自定义插件入口 2,插件定义:描述插件的参数 2.1,注意事项: 2.1.1,只支持json格式的参数;只支持application/JSON;如下图: 2.1.2,需要把接口描述进行修改&a…

计算机网络 —— 路由协议:RIP、OSPF、BGP、MPLS

路由协议 1. 定义2. IGP2.1 RIP2.2 OSPF 3. BGP4. MPLS 1. 定义 互联网中需要通过路由将数据发送至目标主机。 路由器根据路由控制表(RoutingTable)转发数据包,它根据所收到的数据包中目标主机的IP地址与路由控制表的比较得出下一个应该接收的路由器。 &#xff…

NARF(法线对齐的径向特征)

NARF 全称 normal aligned radial feature(法线对齐的径向特征) ,是一种为从深度图像中识别物体而提出的3D关键点检测和描述的算法,该算法由Bastian Steder和 Radu Bogdan Rusu等人于2010年在他们的文章《Point Feature Extraction on 3D Range Scans Ta…

Transformers 介绍和详细说明

Transformers 介绍和详细说明 一、引言 Transformers是一种基于注意力机制的深度学习模型架构,由谷歌团队在2017年的论文《Attention is All You Need》中首次提出。这一模型架构在自然语言处理(NLP)领域取得了显著成就,并迅速扩…

【高性能服务器】多进程并发模型

🔥博客主页: 我要成为C领域大神🎥系列专栏:【C核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞👍收藏⭐评论✍️ 本博客致力于知识分享,与更多的人进行学习交流 对于常见的C/S模型…

恶意域名检测研究与应用综述

域名攻击发展 使用 DGA 的优势在于模糊了控制服务器的节点位置,该方法的灵活性还让网络安全管理员无法阻止所有可能的域名,并且注册一些域名对攻击者来说成本很低。利用 DGA 域名实施的攻击是网络安全中重要的攻击形式。因此,捕获由恶意软件生…

【CentOS7.6】yum 报错:Could not retrieve mirrorlist http://mirrorlist.centos.org

一、报错 1.报错内容如下 在使用 yum makecache 命令时报错,在 yum install -y xxx 的时候报错等等 [roothcss-ecs-a901 yum.repos.d]# yum makecache Loaded plugins: fastestmirror Determining fastest mirrors Could not retrieve mirrorlist http://mirrorl…

第十一章 Nest 创建动态模块

在 NestJS 中,动态模块允许在运行时动态添加和删除模块。这对于创建可扩展的和灵活的应用程序非常有用。 新建一个项目: nest new dynamic-module -p npm创建一个crud的模块: nest g resource test启动项目 浏览器访问 可以发现模块生效了 …

哪些品牌的充电宝牌子比较好用?性价比无线磁吸充电宝推荐

经常外出的朋友,不管是旅行聚会,或是商务出差,一旦手机电量告急,总会令人心生焦虑。共享充电宝不仅充电速度迟缓,而且价格高昂,有线充电宝又显得沉重,线缆还杂乱无章。现在随着科技的发展&#…

将exe文件添加到注册表中,实现开机时自动运行

目录 一、前言 二、代码 三、使用步骤 1.编译生成exe文件、 2.以管理员身份运行代码 3.打开注册表,验证结果 一、前言 在Windows操作系统中,将exe文件的路径添加到注册表下,主要用于实现程序的开机自动运行功能。 注册表路径为&#xf…

6.The hardest part about learing hard things(学一件难的事,难在哪里)

I’ve been recording a lot of podcast interviews for my upcoming book, Ultralearning.One of the reurring themes I’ve noticed in our conversations is that how people feel about learning is the overwhelming cause of the results they experience. 我为我的新书…

2024年6月总结及随笔之打卡网红点

1. 回头看 日更坚持了547天。 读《人工智能时代与人类未来》更新完成读《AI未来进行式》开更并更新完成读《AI新生:破解人机共存密码》开更并持续更新 2023年至2024年6月底累计码字1267912字,累计日均码字2317字。 2024年6月码字90659字,…

Git学习(常用的一些命令)

🍎个人博客:个人主页 🏆个人专栏:日常聊聊 ⛳️ 功不唐捐,玉汝于成 目录 前言 正文 配置相关: 创建与克隆仓库: 基本操作: 分支操作: 远程仓库操作&#xff1a…

mac 安装nvm的教程

在macOS上切换Node.js版本,可以使用nvm(Node Version Manager)。以下是安装nvm和切换Node.js版本的步骤: 安装nvm 下载方式 终端复制输入: curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.1/install.…

第一后裔掉宝奖励有什么 怎么领取第一后裔掉宝奖励

第一后裔在今天就要正式上线了,虽然是一款刚刚上线的新游戏,但是其实很早就测试过了,而且测试过很多次,所以有很多已经体验过的小伙伴,这款游戏的玩法还是比较有意思的,第三人称刷宝射击加上MMORPG的玩法&a…

深入分析差分驱动器,4种情形帮您看透~

差分驱动器可以由单端或差分信号驱动,今天我们就利用无端接或端接信号源来分析这两种情况。 01 差分输入、无端接信号源 图1显示一个差分驱动器由一个平衡的无端接信号源驱动。这种情况通常是针对低阻抗信号源,信号源与驱动器之间的连接距离非常短。 图…

充电宝买哪个牌子好?2024年十大口碑最好充电宝推荐

在如今快节奏的生活中,充电宝已然成为我们出行必备的物品之一。然而,面对市场上琳琅满目的充电宝品牌和型号,我们常常陷入选择的困境:充电宝买哪个牌子好?2024 年,充电宝技术不断革新,新品牌层出…

重生之算法刷题之路之链表初探(三)

算法刷题之路之链表初探(三) 今天来学习的算法题是leecode2链表相加,是一道简单的入门题,但是原子在做的时候其实是有些抓耳挠腮,看了官解之后才恍然大悟! 条件 项目解释 有题目可以知道,我们需…

论文题目:SpringBoot种草好物app13151

摘要 随着电子商务的快速发展和智能手机的普及,越来越多的用户选择通过移动应用程序进行商品浏览、购买和分享体验。种草好物App作为一个专注于商品推荐和购物体验的平台,具有广泛的应用前景和商业价值。本研究旨在构建一个功能丰富、性能稳定的种草好物…

第一后裔快速领取掉宝奖励礼包教程

7月2日第一后裔在steam正式上线,全新刷宝射击mmo玩法,角色的招式非常新颖 ,画面冲击感十足,而且游戏人物的自定义功能非常丰富,超级细节真实的人物建模,加上超带感的服装自定义系统,让你能玩一整…