内存原生CRAM技术将会颠覆计算存储的未来?

news2024/9/20 1:11:43

近期,一项刚刚发布的最新研究表明,一种名为计算随机存取存储器(Computational Random-Access Memory, CRAM)的新技术能够极大地减少人工智能(AI)处理所需的能量消耗。这项技术由明尼苏达大学双城分校的一组工程研究人员开发,并已发表在《npj非传统计算》期刊上,该期刊是由Nature出版的同行评审期刊。

图片

随着人工智能(AI)和大数据时代的到来,传统的计算范式正面临着前所未有的挑战。特别是在数据密集型应用中,数据在内存和处理器之间频繁传输所消耗的能量和时间成为瓶颈。为了解决这个问题,一种新的计算模式——计算随机存取存储器(Computational Random-Access Memory, CRAM)应运而生

图片

为了应对这一挑战,研究人员转向了CRAM技术。CRAM是一种将计算能力直接嵌入到内存单元中的技术,与现有的内存内处理(Processing-In-Memory, PIM)解决方案不同,后者仅是在内存核心内部放置一个处理计算单元(PCU),而数据仍然需要在内存单元和PCU之间移动,只是距离较短。在CRAM中,数据无需离开内存,而是在内存阵列内部进行处理。这使得运行AI计算应用的系统能够实现高达1000倍的能效提升。

图片

扩展阅读:万物皆可计算|下一个风口:近内存计算

CRAM技术采用了高密度、可重构的自旋电子(spintronic)计算基底,直接嵌入到内存单元中。与三星的PIM技术相比,CRAM技术使数据无需离开内存即可进行处理,消除了数据在内存单元与处理单元之间的长距离传输。CRAM通过消除数据在内存和处理单元之间的移动,显著降低了能耗。此外,由于CRAM的计算直接发生在内存中,它还提供了更好的随机访问能力、可重构性以及大规模并行处理能力。

图片

CRAM的工作原理主要基于磁隧道结(Magnetic Tunnel Junction, MTJ)技术,这是一种利用磁性材料实现存储的新兴技术。MTJ是一种利用磁性层之间的量子隧穿效应来实现存储的器件。在CRAM中,MTJ不仅仅用于存储数据,还被用来执行计算任务。通过精确控制MTJ的状态,可以实现诸如AND、OR、NAND、NOR和多数逻辑运算等基本逻辑操作。这些操作可以在内存单元内部直接完成,而不需要数据离开内存。

图片

这项工作首次在实验中证明了CRAM的可行性,并为评估其计算准确性提供了实证依据。

  • 基本操作验证:研究人员首先验证了基本的内存操作,随后展示了2输入、3输入和5输入逻辑门的操作。这些实验结果显示CRAM能够准确执行简单的逻辑运算。

  • 1位全加器的设计与演示:接着,研究人员展示了两种不同的1位全加器设计,并进行了实验验证。这些全加器的设计对于构建更复杂的算术逻辑单元至关重要。

  • 误差率分析:基于实验结果,研究团队开发了一系列模型来表征CRAM计算的准确性。这些模型考虑了MTJ的隧穿磁阻比(TMR)、逻辑操作脉冲宽度等因素对误差率的影响。

  • 功能电路模拟与分析:最后,研究人员基于实验验证的结果,对更大规模的功能电路进行了模拟和分析,包括标量加法、乘法以及矩阵乘法,这些是许多传统和机器智能应用中的核心构建块。

图片

CRAM技术展现了巨大的潜力,尤其是在机器学习、生物信息学、图像处理、信号处理、神经网络和边缘计算等领域。例如,一项基于CRAM的机器学习推理加速器的研究表明,它在能量延迟乘积方面的性能比现有技术提高了大约1000倍。此外,CRAM在执行MNIST手写数字分类任务时,能耗和时间分别降低了2500倍和1700倍。

CRAM技术展现出巨大的潜力,但其真实计算能力的局限在于连续CRAM数组内部。任何需要跨越不同CRAM数组的数据访问和计算都会增加额外的数据移动开销

尽管CRAM技术目前仍处于早期阶段,但其实验验证和模拟结果显示出良好的准确性和性能。随着MTJ技术的进步和新切换机制的发展,CRAM的门级错误率有望进一步降低。此外,错误校正技术的应用也将有助于抑制CRAM中的误差。这些进展将使得CRAM成为下一代计算技术的重要组成部分,为未来的高性能计算和人工智能应用提供强大的支持。

综上所述,CRAM技术不仅在理论上提供了新的计算方式,而且在实验中也证明了其可行性和实用性。随着技术的不断成熟和完善,CRAM有望在未来成为计算领域的一项关键技术。CRAM技术为AI计算带来了一种全新的方法,有望通过减少数据传输所需的能量消耗来极大提升AI系统的能效。

如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!

精彩推荐:

  • DRAM组件级故障预测模型,如何提升系统可靠性?

  • 当CXL遇到NVMe,计算存储会发生什么?

  • 浅析SSD性能与NAND速率的关联

  • 浅析MPS对PCIe系统稳定性的影响

  • DPU:值不值得托付下一代存储加速架构?

  • 论文解读|数据中心内存RAS技术全景剖析

  • 硬盘HDD:AI时代的战略金矿?

  • 断电的固态硬盘数据能放多久?

  • CXL-GPU: 全球首款实现百ns以内的低延迟CXL解决方案

  • 万字长文|下一代系统内存数据加速接口SDXI解读

  • 数据中心:AI范式下的内存挑战与机遇

  • WDC西部数据闪存业务救赎之路,会成功吗?

  • 属于PCIe 7.0的那道光来了~

  • 深度剖析:AI存储架构的挑战与解决方案

  • 浅析英伟达GPU NCCL P2P与共享内存

  • 3D NAND原厂:哪家芯片存储效率更高?

  • 大厂阿里、字节、腾讯都在关注这个事情!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1961507.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SmartInitializingSingleton和InitializingBean的区别

SmartInitializingSingleton:接口里面就一个方法afterSingletonsInstantiated,它是spring容器将所有bean都初始化完成之后,才会去调用,要求实现它接口的bean必须是单例的。 应用场景:可以在服务启动之后去处理一些逻辑…

红酒与电影:银幕上的醉人瞬间

在光影交织的银幕世界里,红酒不仅是品味生活的象征,更是情感交流的媒介。当定制红酒与电影相遇,它们共同编织出一个个醉人的瞬间,让观众在品味红酒的同时,也沉醉于电影的魅力之中。今天,就让我们一起走进红…

JS小应用:从图床获取的html代码中提取IMG标签并提取图片复制到剪贴板

JS小应用:从图床获取的html代码中提取IMG标签并提取图片复制到剪贴板 问题产生 自己做站长,为了节省银子,难免要用到图床。有的图床可以直接给你URL,这当然是最好的情况: 而有的图床,却禁用了鼠标右键&am…

“论数据分片技术及其应用”写作框架软考高级论文系统架构设计师论文

论文真题 数据分片就是按照一定的规则,将数据集划分成相互独立、正交的数据子集,然后将数据子集分布到不同的节点上。通过设计合理的数据分片规则,可将系统中的数据分布在不同的物理数据库中,达到提升应用系统数据处理速度的目的…

FP分数规划在无线通信中的应用(II)

3. 具体例子 3.1-3.3都只需要用第一章concave-convex方法求解,3.4-3.6需要用到第二章的拉格朗日对偶变换,而且具体解 x \mathbf{x} x时需要对离散变量单独开发算法。 3.1 多小区SISO能量分配 第一个例子是具有一组单天线基站(BSs&#xff…

Python面向对象浅析

目录 面向对象基本概念 一、类和对象 类和对象是面向对象骗程的两个核心概念。 在程序开发中,要设计一个类,通常需要满足一下三个要素: self详解: 对象(Object) 魔法方法: 类里的一些特殊方法 __in…

RK3568笔记四十八:ADC驱动开发测试

若该文为原创文章,转载请注明原文出处。 一、ADC介绍 RK3568集成了一个逐次逼近模数转换器(Successive Approximation ADC),通常简称为SAR ADC。 这种转换器能够将连续的模拟信号转换为离散的数字信号,其特点在于具有…

nginx转发netty长链接(nginx负载tcp长链接配置)

首先要清楚一点,netty是长链接是tcp连接不同于http中负载在http中配置server监听。长连接需要开启nginx的stream模块(和http是并列关系) 安装nginx时注意开启stream,编译时加上参数 --with-stream (其他参数根据自己所需来加) …

rem实现屏幕适配(jQuery)

一、rem换算 1.根据视口宽度动态计算字体大小,如果宽度大于750px,则将字体大小设置为100px,否则按比例缩小。 tips:使用时记得引入jQuery.js // 在文档加载完成后执行函数,确保DOM已经准备就绪$(function () {// 定义一个自执行…

增量学习中Task incremental、Domain incremental、Class incremental 三种学习模式的概念及代表性数据集?

1 概念 在持续学习领域,Task incremental、Domain incremental、Class incremental 是三种主要的学习模式,它们分别关注不同类型的任务序列和数据分布变化。 1.1 Task Incremental Learning (Task-incremental) 任务增量学习,也称为任务增…

盐分反演关键:批量计算常用的盐分指数反演变量

盐分反演关键:批量计算常用的盐分指数反演变量 一、引言 盐分指数反演是遥感应用中的一个重要方面,尤其在农业和环境监测中有着广泛的应用。通过遥感影像,研究人员可以高效地获取和分析地表盐分信息,为土地管理和作物生产提供重…

YOLOX+PyQt5交通路口智能监测平台设计与实现

1.概述 交通要道的路口上人车穿行,特别是上下班早高峰,且时常发生交通事故。因此对交通路口的车流量和人流量的监测必不可少。 2.检测模型 使用的检测模型为YOLOX模型,模型权重为训练VOC数据集得来,其中包括了二十个类别&#…

ONLYOFFICE 协作空间 2.6 已发布:表单填写房间、LDAP、优化房间和文件管理等

更新后的 ONLYOFFICE 协作空间带来了超过 20 项新功能和优化,让工作更加高效和舒适。阅读本文了解详情。 表单填写房间 这次更新增加了一种新的房间类型,可在 ONLYOFFICE 协作空间中组织简单的表单填写流程。 通过表单填写房间,目前可以完成…

仓库物品与装备物品位置更换

一、装备物品与选中的仓库物品位置交换 1、准备工作 2、Inventory Items 3、给Warehouse添加Grid Layout Group组件 4、复制Inventory Items,设置Grid Layout Group组件 5、创建文本ItemName和ItemDescription 6、设置物品数据 (1) 创建 ItemData.cs using Syst…

Spring boot tomcat 读写超时时间设置

yaml配置 connection-timeout: 20000 server:port: 9898servlet:context-path: /testtomcat:connection-timeout: 20000max-connections: 250accept-count: 300 spring源码设置自定义tomcat参数 customizeConnector(connector); Overridepublic WebServer getWebServer(Serv…

【MySQL】表的约束{ 常见约束 空属性 默认值 列描述comment zerofill 主键 复合主键 自增长 唯一键 外键 }

文章目录 常见约束空属性默认值列描述commentzerofill主键复合主键自增长唯一键外键 2.总结 真正约束字段的是数据类型,但是数据类型约束很单一,需要有一些额外的约束,更好的保证数据的合法性,从业务逻辑角度保证数据的正确性。比…

MySQL基础练习题12-使用唯一标识码替换员工ID

题目:展示每位用户的 唯一标识码(unique ID );如果某位员工没有唯一标识码,使用 null 填充即可。 准备数据 分析数据 题目:展示每位用户的 唯一标识码(unique ID );如果…

一, 创建工程,引入依赖

一, 创建工程,引入依赖 文章目录 一, 创建工程,引入依赖创建工程工程间的关系的建立配置各个工程当中的 pow 配置信息,相关的依赖父工程(也就是总项目工程)的 pow 配置demo-module06-generate 模块中pow 配置&#xff…

基于IEC61499标准的在线工业编程平台open61499

基于IEC61499标准的在线工业编程平台open61499是一个专为工业自动化领域设计的编程环境,它遵循IEC 61499标准,为开发者提供了一种高效、灵活的方式来创建、配置和管理分布式控制系统(DCS)的应用程序。以下是对open61499的详细解析…

LeetCode热题 翻转二叉树、二叉树最大深度、二叉树中序遍历

目录 一、翻转二叉树 1.1 题目链接 1.2 题目描述 1.3 解题思路 二、二叉树最大深度 2.1 题目链接 2.2 题目描述 2.3 解题思路 三、二叉树中序遍历 3.1 题目链接 3.2 题目描述 3.3 解题思路 一、翻转二叉树 1.1 题目链接 翻转二叉树 1.2 题目描述 1.3 解题思路 根…