文献阅读(207)FPGA HBM

news2024/11/15 17:21:34
  • 题目:HBM Connect: High-Performance HLS Interconnect for FPGA HBM
  • 时间:2021
  • 会议:FPGA
  • 研究机构:UCLA Jason Cong

  • 题目:Demystifying the Memory System of Modern Datacenter FPGAs for Software Programmers through Microbenchmarking
  • 时间:2021
  • 会议:FPGA
  • 研究机构:加拿大西蒙菲莎大学

FPGA中的HBM主要是为了解决带宽受限的问题,这里的两篇论文都是针对存储和互连的优化,希望能最大化HBM的带宽。需要解决两个事情:

  • memory port的数量、位宽、burst_len等一些列参数的确定,避免小马拉大车
  • 如何充分的利用多个独立的HBM通道,需要互连的优化

所以第一篇论文的主要贡献点在于:

  • 通过设计的switching和crossbar结构提高throughput
  • A BRAM-efficient HLS buffering scheme that increases the AXI burst length and the effective bandwidth when PEs access several HBM pseudo channel

在这里插入图片描述

相比于第一篇论文,第二篇论文更简单些,主要是针对不同参数进行一系列对比实验,一些有意义的结论包括:

  • 总有效片外存储器带宽几乎与所有并发存储器访问端口的合计端口宽度成线性比例关系。对于理论峰值带宽为19.2GB/s的单个DDR4存储体,其在512位变得平坦:有效峰值读写带宽约为18.01GB/s和16.56GB/s。对于理论峰值带宽为14.4GB/s的单个HBM2存储体,其在512位也变得平坦:多个存储器端口访问单个DRAM存储体的有效峰值读写带宽约为13.18GB/s和13.17 GB/s。
  • 每个端口的最大突发访问大小(即每个端口的数据宽度和最大突发访问长度的乘积)应设置为16Kb(即2KB)。 然而,单端口接入没有这个要求。对于HBM,通常每个存储器访问端口连接到一个单独的HBM bank
  • 有效片外存储器带宽随着连续数据访问大小的增加而增加,当该大小在128KB左右时变得平坦。
  • 对于加速器到加速器的流端口,总(片内)通信带宽与每个端口的数据宽度(每个端口最高1024位)和端口数量(16个端口时持平)成线性比例关系。
  • 在设计中,应通过联合考虑计算-内存平衡和资源利用来选择最佳配置,而不是综合选择峰值带宽配置。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1125951.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

五金经营小程序商城的作用体现在哪

对消费者而言,如今线上购买五金是很多人的选择,传统线下购买,不仅需要跑路,而且店内未必有所需品,但线上平台则一目了然购买所需品,本地/外地均可以触达到,同时还可对用户/会员进行高效管理&…

vscode代码快捷输入

Vscode代码片段快捷输入 常用的代码片段为了避免重复输入,可以使用Vsco的中用户代码片段进行设置,这样就可以实现快捷输入. 操作流程 如下 打开vscode的设置 2. 找到用户代码片段 3. 选择模板 4. 然后写入代码片段即可 上面的代码片段可以设置多个,看自己 重点关注的是 prefi…

GoLong的学习之路(四)语法之循环语句

书接上回,上回说到运算符,这次我们说一个编程语言中最重要的一点:流程控制,及循环语句 文章目录 循环语句if else(分支结构)if条件判断特殊写法 for(循环结构)for range(键值循环) switch casegoto(跳转到指定标签)break(跳出循环…

2022年京东双11母婴品类数据回顾

母婴产品作为部分家庭的刚需,双11期间的行业热度也节节攀升,2022年双11期间,行业中不少品类赛道势头猛进。下面,鲸参谋带大家一起来回顾2022年双11期间母婴行业大盘及母婴重点细分赛道的销售表现。 母婴行业大盘 2022年双11期间&a…

基于鲸鱼算法的无人机航迹规划-附代码

基于鲸鱼算法的无人机航迹规划 文章目录 基于鲸鱼算法的无人机航迹规划1.鲸鱼搜索算法2.无人机飞行环境建模3.无人机航迹规划建模4.实验结果4.1地图创建4.2 航迹规划 5.参考文献6.Matlab代码 摘要:本文主要介绍利用鲸鱼算法来优化无人机航迹规划。 1.鲸鱼搜索算法 …

微积分(二) 导数与微分

前言 导数反映了函数值相对于自变量的变化快慢程度,而微分则表明当自变量有微小变化时,函数值大体上变化多少 瞬时速度的解决——极限 牛顿采用了一种无限逼近的方法。 平均速度的定义:如果一个物体在一段时间△t内位移了s,它在这段时间内的平均速度…

二进制明文字符串加密:还原与反还原

背景 上一篇文章中介绍了xorstr的原理和最小化验证概念的代码,这篇文章来看下这种已经被广泛应用于各恶意样本以及安全组件中的技术如何还原,如果还没看上篇建议先看下了解其实现后再看本篇文章 xorstr的现状 随着相关技术的应用越来越广,…

最新咸鱼签名JS逆向分析教程

本章教程,主要分享一下咸鱼H5网页端sign签名算法。 案例地址:https://h5.m.goofish.com/item?id=744640763988 程仅供参考,请勿滥用,由此带来的法律责任,需由自己承担。 目录 一、参数分析 二、逆向过程

TCmalloc (google开源项目核心部分模拟实现)

1什么是内存池 1.1池化技术 所谓“池化技术”,就是程序先向系统申请过量的资源,然后自己管理,以备不时之需。之所以要申请过 量的资源,是因为每次申请该资源都有较大的开销,不如提前申请好了,这样使用时就…

橙河网络:国外问卷调查赚钱的项目可靠吗?

国外问卷调查项目是可靠的,是一个长期稳定的互联网项目。 大家好,我是橙河网络,今天聊一聊国外问卷调查赚钱的项目可靠吗? 在海外地区,很多公司和机构,它们为了收集一些关于产品和服务的消费者意见&#…

读懂Json文件[妈妈再也不用担心我不读懂了]

第一次见到它,我特别害怕, 很大一个文件,还是二进制的,是什么意思呢?该文件是深度学习模型训练完成之后由模型的输出数据保存的结果数据; 在线JSON编译器 JSON Editor Online 把文件传上去! …

React-native-camera 在小米手机上拍照查看闪退

场景:为实现可拍照和录像的相机用react-native-camera这个库手写一个相机,发现了拍出来的图片在小米10上查看闪退 根据手机后台捕获的错误信息是什么玩意太大了(之前还以为是图片显示组件的问题) 改进:相机吊起的时候…

unity中使用protobuf工具将proto文件转为C#实体脚本

unity中使用protobuf工具将proto文件转为C#实体脚本 介绍优点缺点Protobuf 为什么比 XML 快得多?Protobuf的EncodingProtobuf封解包的过程通常编写一个Google Protocol Buffer应用需要以下几步: Protostuff是什么Protobuf工具总结 介绍 protobuf也就是G…

第三章Maven依赖的特性-基础篇

文章目录 Maven依赖核心配置文件pom.xml依赖的范围概念compile 和 test 对比compile 和 provided 对比结论 测试验证 compile 范围对 main 目录有效验证test范围对main目录无效验证test和provided范围不参与服务器部署验证provided范围对测试程序有效 依赖的传递概念传递的原则…

计算机体系结构实验三-缓存一致性

最近在看CMU15-418,LECTURE10-11就是讲两个缓存一致性协议,刚好这部分内容在实验中学习过,在实验中监听式协议提到的是MSI协议(modified,shared,invalid),lecture中还讲了优化的版本MESI(应该是实际使用的协…

pytorch 入门 (四)案例二:人脸表情识别-VGG16实现

实战教案二:人脸表情识别-VGG16实现 本文为🔗小白入门Pytorch内部限免文章 参考本文所写记录性文章,请在文章开头注明以下内容,复制粘贴即可 🍨 本文为🔗小白入门Pytorch中的学习记录博客🍦 参…

CSMM软件能力成熟度评估

CSMM认证,又称为“软件能力成熟度评估”,也有地方称为“CSMM软件能力成熟度模型评估国家标准认证”,也被民间喊作“中国版CMMI认证”。该标准于2021年6月8日发布,是我国自主标准,适合中国国情以及中国软件企业的特点。…

2023腾讯云服务器价格表(轻量/CVM/免费/GPU)

腾讯云服务器租用价格表,轻量应用服务器、云服务器CVM、免费云服务器申请和GPU云服务器配置报价,轻量2核2G4M价格108元一年、2核4G6M带宽159元一年、4核8G10M优惠价425元一年、8核16G14M优惠价1396元一年、16核32G20M价格2775.99元一年,云服务…

Cesium冷知识:API中显示私有方法

在Cesium.js源码中, 某些类或方法的注释中含有private这个“私有”标识 会导致不会在API文档中显示 (这是jsdoc的规范) 解决方法: Ceisum.js 1.110.0版本的解决方案: 在gulpfile.js中的buildDocs方法中&#xff0…

vscode Coder Runner 运行C++

1. 设置Code Runner 2. 防止输入读不到,把在终端运行勾上。 3. 设置minw/bin的环境变量 安装mingw教程:https://blog.csdn.net/fancy_male/article/details/133992000 4. 见图