HBM是什么?因AI而崛起,它有哪些优势?

news2024/12/23 5:01:39

南韩存储大厂SK海力士宣布,将与台积电公司密切合作,联手生产下一代HBM——即预计在2026年投产的第六代HBM产品HBM4,双方并于近期签署合作备忘录(MOU)。

SK海力士以往的HBM产品,包括HBM3E(第五代HBM产品)都是基于公司自身制程制造的基础裸片,但从HBM4产品开始,将采用台积电的先进逻辑制程,这将使得HBM4的性能与功效更好,有助于海力士生产满足客户需求的客制化HBM产品。

与此同时,双方将协力优化SK海力士的HBM产品和台积电的CoWoS技术的整合,共同应对HBM相关客户的要求。

在AI浪潮下,HBM(高带宽存储器)成为当红炸子鸡,究竟什么是HBM?相较传统DRAM(动态随机存取存储器),又有什么不同?

HBM是什么?跟传统DRAM有什么不同?

简单来说,越强的AI处理器,需要越强的存储。

美光副总裁暨运算与网络事业部运算产品事业群总经瓦伊迪亚纳坦(Praveen Vaidyanathan)指出,芯片性能表现与存储的频宽和容量成正相关,随着大规模语言模型(LLM)参数量增加,也需要更高频宽内存,AI处理器才能顺利运行。

HBM相较传统DRAM为高频宽内存。高频宽就好比是高速公路,道路越宽可承受的车流量就越大,换句话说频宽越高,内存能运送的资料量就越大。《SemiAnalysis》指出,光GPT-4就含1.8兆个参数,像应用AI,就必须搭配像HBM这样容量更大、存取更快速的存储器,让参数可以轻易被传输与储存。

HBM是由大众所熟知的DRAM(动态随机存取存储器)堆迭,再透过3D IC先进封装而成。如同盖积木般,透过先进封装将DRAM做3D立体堆迭,加大频宽与储存空间,与一般DRAM之间并不存在取代关系,而是因为应用需求的不同,衍生出的技术。

HBM技术难在哪里?

技术听起来简单,然而却有不少须突破的技术障碍。瓦伊迪亚纳坦指出3项技术难点:

首先,是厚度。HBM厚度仅能为人类头发的一半,意味着每一层DRAM的厚度都必须控制,研磨必须相当精细。瓦伊迪亚纳坦指出:“一旦堆迭层数越多,DRAM就必须做的更薄。”在这样的状况下,企业必须拥有更先进的DRAM制程才可能达成。

其次,是晶圆堆迭的精准度。HBM的封装是将每一片DRAM晶圆迭齐后再做切割,切割下来的晶粒就是HBM。不过,制造商为让堆迭更薄,会在硅晶圆上穿孔并以金属物质填满,用以通电,藉此取代传统封装的导线架。这样的打洞技术则称为“硅穿孔(TSV, Through Silicon Via)。”

倘若是堆迭4层的HBM,从晶圆堆迭切割前开始,就必须精准对齐硅穿孔(TSV),“切的时候也不能移位,否则不能导电。”瓦伊迪亚纳坦说。由于硅穿孔仅略大于细菌尺寸,需要非常精细的工艺才能做到。

第三,就是堆迭后的散热问题。HBM之所以被发明,来自于芯片商希望能将存储器和处理器,包含CPU和GPU,全都包在一颗IC中。如此一来,存储器与处理器的距离变得比之前近很多,散热问题更需要被解决。综合三点来看,封装技术的重要性更甚以往。

HBM的应用有哪些?

由于技术难度高,成本也相对高昂。早在2013年HBM就已经诞生,当时超微(AMD)找SK海力士共同研发第一代HBM,却因价格太贵而鲜少被芯片业者采用,直至今日才因为AI应用而崛起。

芯片业者分析,虽然越先进的HBM价格越高,但只要效能够好、够省电,厂商当然愿重本采用,“不然黄仁勳(英伟达执行长)要怎么喊出‘买越多、省越多’的口号。”

那么,HBM市场在哪呢?目前来看,AI服务器会是HBM最重要的市场,美光以及海力士的HBM3e已通过英伟达的验证,市场更盛传英伟达已支付数亿美元的预付款以确保供应。瓦伊迪亚纳坦指出:“AI服务器所需要的存储体量,是传统服务器的5~6倍。”

除此之外,未来自驾车市场也是HBM重要的应用场景。Mordor Intelligence在10月出版的一份报告中表示,自驾车与ADAS(自动驾驶辅助系统)正在推升HBM的需求。从这个情况看来,AI服务器+车用的HBM市场需求,可能将长达10年。

HBM背后的厮杀战!

在这样的情况下,HBM也成为存储巨头的最新战场。集邦科技指出,作为先进者的海力士,在2022年拿下近全球近5成HBM市占夺冠,居次的三星占4成、美光占1成。

《BusinessKorea》报导,三星将在2024年积极扩产HBM以追上海力士脚步。而看似落后的美光,希望在HBM战局中,用技术吹响反攻号角。

如同台积电的3、5纳米制程,DRAM也有制程迭代,排序为1y、1z、1α、1β和1γ,其中1β是当前已量产的最先进DRAM,1γ则还未量产。若进一步比较,最新一代的HBM3e,三星采用的是1α制程,海力士与美光皆用1β制作,于技术上领先三星。投资银行分析师指出,美光是希望藉着HBM技术领先,抢攻市场龙头。

不过,HBM目前最大的挑战是“良率”。

日本微细加工研究所所长汤之上隆于1月的专栏指出,虽然HBM技术门槛较高,但其售价比DRAM高出10倍以上,商业诱因充足。因此,即便HBM的良率低于50%,仍是存储制造商无法轻易放弃的市场。

集邦科技则进一步指出,下一代的HBM预计将于2026年推出,堆迭层数也会自现有的12层增加至16层,2027年有机会问世,届时先进封装技术和良率角色将更为吃重。

全球存储市场长久以来三分天下,HBM受到重视后则开启全新战局,甚至可能扭转局势。在先进技术优先、成本其次考量的AI时代,存储器比起以往将扮演更重要的角色。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1885701.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

感动的短视频:成都柏煜文化传媒有限公司

感动的短视频:瞬间触动心灵的温暖力量 在这个快节奏、高压力的时代,我们常常在忙碌与喧嚣中穿梭,心灵深处那份最纯粹的感动似乎变得愈发珍贵而难得。然而,就在这样一个数字化盛行的今天,短视频以其独特的魅力&#xf…

LLM学习记录

概述 语言模型的发展 语言模型经历过四个阶段的发展,依次从统计语言模型到神经网络语言模型(NLM),到出现以 BERT 和 Transformer 架构为代表的预训练语言模型(PLM),最终到大型语言模型阶段&am…

第一后裔怎么绑定NEXON账号 NEXON账号绑定Steam第一后裔教程

刚上线就特别好评的多人刷榜刚上线就特别好评的多人刷宝射击爽游《第一后裔》免费上线了,快和小伙伴们一起来闯荡这个神秘的世界吧,整体还是mmo的玩法,开放世界任意探索,全新虚幻五引擎带来的不俗的画面表现,在游戏中扮…

Sharding-JDBC分库分表的基本使用

前言 传统的小型应用通常一个项目一个数据库,单表的数据量在百万以内,对于数据库的操作不会成为系统性能的瓶颈。但是对于互联网应用,单表的数据量动辄上千万、上亿,此时通过数据库优化、索引优化等手段,对数据库操作…

昇思25天学习打卡营第04天 | 数据集 Dataset

昇思25天学习打卡营第04天 | 数据集 Dataset 文章目录 昇思25天学习打卡营第04天 | 数据集 Dataset数据集加载数据集迭代数据集的变换shufflemapbatch 自定义数据集可随机访问数据集对象可迭代数据集生成器 总结打卡 数据集Dataset对原始数据进行封装、变换,为神经网…

OpenSSH漏洞扫描(CVE-2024-6387、CVE-2006-5051、CVE-2008-4109)

目录 POC:ssh_poc.py 使用方法 github CVE-2024-6387 漏洞信息 补丁 POC:ssh_poc.py import sys import socket import argparse import threading import queue import os from datetime import datetime from urllib.parse import urlparse from…

全年免费!环信发布出海创新版,助力泛娱乐创业者扬帆起航

目前,以陌生人社交、直播、语聊、电商等热门场景为代表的社交泛娱乐出海正发展得如火如荼,成为企业新的增长曲线。但随着出海企业增多,海外市场争夺、资源竞争与技术博弈也愈加激烈。 为了让更多创业者与创新者获得支持,快速高效…

宠物博主亲测养宠好物安利,口碑好的狗毛空气净化器推荐

作为一名6年资深铲屎官,一到春季换季就开始各种疯狂打喷嚏、全身过敏红肿,这是因为宠物在换季的时候就疯狂掉毛,家里就想下雪一样,空气中都是宠物浮毛。而宠物毛上附带的细菌会跟随浮毛被人吸入人体,从而产生打喷嚏、过…

VBA字典与数组第十六讲:行、列数不相同的数组间运算规律

《VBA数组与字典方案》教程(10144533)是我推出的第三套教程,目前已经是第二版修订了。这套教程定位于中级,字典是VBA的精华,我要求学员必学。7.1.3.9教程和手册掌握后,可以解决大多数工作中遇到的实际问题。…

云服务器中的地域和可用区是什么意思?

一、地域介绍 1、概念 地域(Region):从地理位置和网络时延维度划分,同一个地域内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。不同地域之间完全隔离,保证不同地域间最大程度的稳定性和容…

0628_ARM4

练习&#xff1a; stm32流水灯 .text .global _start _start: 使能GPIOE外设时钟 0X50000A28 RCC_MP_AHB4ENSETR[4]->1 LDR R0,0x50000a28 指定操作的内存地址 LDR R1,[R0] 将R0对应的地址空间中的值读取出来 ORR R1,R1,#(0x3<<4) 将第4,5位设置为1 STR…

ForkJoinPool与ThreadPoolExecutor

ThreadPoolExecutor不多介绍&#xff0c;重点介绍ForkJoinPool&#xff0c;以及二者的区别 ForkJoinPool ForkJoinPool 是 Java 7 引入的一种用于并行计算的框架&#xff0c;特别适合处理递归任务。它是 java.util.concurrent 包的一部分&#xff0c;基于工作窃取算法&#x…

【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人

系列篇章&#x1f4a5; No.文章1【Qwen部署实战】探索Qwen-7B-Chat&#xff1a;阿里云大型语言模型的对话实践2【Qwen2部署实战】Qwen2初体验&#xff1a;用Transformers打造智能聊天机器人3【Qwen2部署实战】探索Qwen2-7B&#xff1a;通过FastApi框架实现API的部署与调用4【Q…

java 程序、进程 、线程,cpu,并行、并发、启动线程两种方式

1、重写 Thread 父类方法 后创建实例调用 start 方法 2、将创建自实现 Runable 接口后的实例 作为参数传递给 Thread 的构造方法 两个条件同时存在&#xff0c;那个生效&#xff1f; new Thread(/* condition 1 */threadTest2) {Override/* condition 2 */public void run() {T…

如何查看xpf文件

xpf文件是什么 XPF文件是“XML Paper Specification File”的缩写&#xff0c;它是一种文件保存格式&#xff0c;具有以下特点和相关信息&#xff1a; 一、定义与用途 定义&#xff1a;XPF文件用于保留文档的固定布局&#xff0c;包括文本、图片以及其他文档元素的确切位置。…

【HarmonyOS NEXT】鸿蒙如何动态添加组件(NodeController)

NodeController用于实现自定义节点的创建、显示、更新等操作的管理&#xff0c;并负责将自定义节点挂载到NodeContainer上。 说明 本模块首批接口从API version 11开始支持 当前不支持在预览器中使用NodeController。 导入模块 import { NodeController } from "ohos…

23种设计模式之装饰者模式

深入理解装饰者模式 一、装饰者模式简介1.1 定义1.2 模式类型1.3 主要作用1.4 优点1.5 缺点 二、模式动机三、模式结构四、 装饰者模式的实现4.1 组件接口4.2 具体组件4.3 装饰者抽象类4.4 具体装饰者4.5 使用装饰者模式4.6 输出结果&#xff1a; 五、 应用场景5.1 图形用户界面…

嵌入式Linux系统编程 — 6.2 signal和 sigaction信号处理函数

目录 1 信号如何处理 2 signal()函数 2.1 signal()函数介绍 2.2 示例程序 3 sigaction()函数 3.1 sigaction()函数介绍 3.2 示例程序 1 信号如何处理 信号通常是发送给对应的进程&#xff0c;当信号到达后&#xff0c; 该进程需要做出相应的处理措施&#xff0c;可以通…

ROS——Server、Client的编程实现,服务数据的定义与使用,参数的使用和编程方法

客户端 创建功能包 创建客户端、创建服务、配置请求数据、请求调用、等待应答 设置编译规则 编译运行客户端 服务端 创建服务器 编译成目标执行文件、相关库的连接 add_executable(turtle_command_server src/turtle_command_server.cpp) target_link_libraries(turtle_comman…

第2章 寄存器

第2章 寄存器 一个 CPU 由运算器&#xff0c;控制器&#xff0c;寄存器等器件构成&#xff0c;这些器件靠内部总线进行相连。简单的说 CPU 中&#xff1a; 运算器进行信息处理寄存器进行信息存储控制器控制各种器件进行工作内部总线连接各个器件&#xff0c;在他们之间进行各种…