前言
2022年8月9日,壁仞科技在上海发布首款通用GPU芯片BR100,标志着中国企业第一次打破了此前一直由国际巨头保持的通用GPU全球算力纪录;
8月31日,美国政府命令芯片厂商英伟达(NVIDIA)以及超威半导体(AMD)停止向中国销售部分高性能GPU;
10月,AMD RDNA3的发布,由于单片设计中的现代高端图形处理器一代又一代地变得越来越复杂和昂贵,它决定通过Navi 31图形芯片为其图形处理器采用全新的革命性小芯片GPU设计,从而实现我们在图形处理器中看到的所有功能。
目前GPU赛道风潮正劲。在上一波AI芯片总融资金额超过200亿的热潮后,整个芯片行业经历了一轮大洗牌。如今GPU成为芯片界又一火热的赛道,同时加上国产替代紧迫的“引力”,国产GPU企业蓄势待发。
在本文中,我们主要从GPU概况、GPU的国内外市场情况、国产化布局、GPU挑战及机遇等几个方面,了解GPU的现状与趋势。
01 .什么是GPU?
GPU(Graphics Processing Unit,图形处理器)又被称作显示核心、视觉处理器、显示芯片,是一种专为并行处理而设计的微型处理器,非常擅长处理大量简单任务,包括图形和视频渲染。
在计算能力方面,相较于CPU“拉垮”的计算能力,GPU站在了浪潮之巅。正如其全称“图形计算单元“,GPU的初衷主要是为了接替CPU进行图形渲染的工作。
GPU之所以擅长并行计算,从其架构里就决定了。它主要由计算单元ALU组成,仅有少量的控制单元和存储单元。这也就意味着,GPU可以拥有数百、数千甚至上万核心来同时处理计算任务,使计算的并行度得到成千上万倍的提升—相比现在普通电脑最多8核CPU同时工作,这是一个及其恐怖的数字。
GPU根据接入系统的方式分为集成型GPU(Integrated GPU,iGPU)和离散型GPU(Discrete GPU ,dGPU)两种,前者就是我们日常所说的集成显卡/核芯显卡,后者就是我们日常所说的独立显卡。
发展至今,GPU不仅为个人电脑、服务器和移动设备进行图形处理工作,还主要应用在工作站、游戏机、嵌入式设备、数据中心等各种需要渲染图形或高性能计算的场景。
02 .全球GPU市场格局
1.GPU市场规模
根据Verified Market Research数据统计,2020年全球GPU市场价值为254.1亿美元,2027年有望达到1853.1亿美元,年平均增速高达32.82%。
据 IDC 数据显示,2018 年全年中国GPU市场规模约为13.05 亿美金(约合人民币90.05亿元),据预测到2023 年中国GPU市场规模将达到43.2亿美金(约合人民币 298 亿元),未来5年整体市场年复合增长率(CAGR)27.1%。
2.GPU“最吸金”的赛道之一
早期GPU多用于2D和3D图形的计算和处理。传统上来说,之前GPU最关键的市场在游戏领域。但长期来看,这部分市场增速趋缓,甚至隐隐有下降势头。
而在眼下的算力时代,取而代之的是与数字化转型相关的用例已成为GPU应用的主要阵地,如今的GPU通用计算技术发展在浮点运算、并行计算等部分计算方面,GPU 可以提供数十倍乃至于上百倍于CPU 的性能。
目前随着云计算、人工智能等高性能异构计算的发展,GPU并行计算的优势被进一步发掘,成为高性能计算领域的“宠儿”。从2020年开始,GPU便成为国内芯片领域“最吸金”赛道之一,融资总额已超过200亿元。
03 .巨头垄断,壁垒横行
放眼全球,GPU呈现寡头高度垄断的格局。在GPU市场,排名前三的英伟达、AMD、英特尔的营收几乎垄断整个GPU行业,占据市场份额高达63%。在中国市场中,三大巨头也是分走了大部分“蛋糕”。
英伟达是全球GPU领域的绝对龙头,A100是其2020年推出的数据中心级云端加速芯片,采用台积电7nm工艺制程,支持FP16、FP32和FP64浮点运算,为人工智能、数据分析和HPC数据中心等提供算力;
AMD公司可同时提供独立GPU和集成GPU,其集成GPU主要运用在Ryzen APU、嵌入式、半定制平台中,独立GPU分为Radeon和Instinct系列,主要用于游戏、专业视觉、服务器等应用;
Intel公司能够帮助公司在集成GPU领域实现寡头垄断,在2022年8月24日正式发布了全新数据中心GPUFlex系列。
相比之下,国产GPU还处于起步阶段。受限于工艺制程、EDA等技术封锁,国内厂商目前在自主研发领域的成果与国际一流水平还有着很大的差距。但随着国内自研GPU的领军企业景嘉微、壁仞科技、芯动科技等逐渐崭露头角,各厂家已发展出了一系列的产品线,并且均采用国内成熟制程工艺及自主架构,国产替代浪潮来临,国内独立GPU厂商的广阔市场空间已被打开。
04. 融资持续火热的GPU赛道,GPU创企陆续交出产品
近年来,国产GPU频频传出好消息。在市场和政策的推动下,曾经蒙尘的国产GPU开始闪烁自己的光芒。
睿兽分析显示,自2019年9月成立以来,曾创造A轮融资纪录的壁仞科技,至今已完成四轮融资,融资总额超50亿元人民币;
2021年2月22日,摩尔线程完成数十亿元人民币的pre-A轮融资;
2022年7月5日,沐曦完成10亿元人民币pre-B轮融资;
2022年7月13日,天数智芯宣布完成超10亿元人民币的C+轮及C++轮融资.
近段时间来,国产GPU厂商除了陆续获得大笔超百亿融资以外,也在相继发布产品进展,切实在产品上取得了一定的突破。
目前已经聚集了约20家GPU领域的厂商,其中许多已经将其GPU 芯片投入量产。伴随着国内GPU赛道上一个又一个交出新产品,国产GPU正迅速走过“从无到有”,进入下一个“迭代时刻”。
芯动科技
2021年11月正式发布了其用于服务器和桌面应用的风华一号GPU。它率先实现5-10TFLOPS的渲染能力,率先实现图形API支持超过OpenGL 4.0等;
2022年8月,芯动科技又推出了针对于桌面市场的“风华2号”GPU,“风华2号”渲染能力突出,GPU像素填充率48GPixel/s,FP32单精度浮点性能1.5TFLOPS,AI运算(INT8)性能12.5TOPS,实测功耗4至15W,支持OpenGL4.3、DX11、Vulkan等API;
目前“风华3号”已基本完成研发,将为国内用户提供超大算力光追等酷炫性能。
天数智芯
2021年3月31日,上海天数智芯对外正式发布了7nm的天垓100芯片及天垓100加速卡,实现了国内通用GPU从0到1的突破。天数智芯其首款7nm制程的云端推理通用GPU产品“智铠100”,该芯片已于今年5月点亮,将于2022年第四季度正式发布,年底量产。
2022年5月8日,天数智芯第二款产品7nm云边推理芯片“智铠100”成功点亮,产品迭代开发和商业应用领先国内同行。
摩尔线程
在短短18个月内,就发布了全新统一系统架构MUSA和全能GPU产品“苏堤”等系列新品。
基于MUSA统一系统架构GPU苏堤,摩尔线程推出了第一代桌面级显卡MTT S60,它采用12nm制程,包含2048个MUSA核心,单精度算力最高可达6TFlops;以及面向数据中心级多功能GPU产品MTT S2000,MTT S2000采用12nm制程,使用4096个MUSA核心。
登临科技
2020年6月,登临科技Goldwasser系列产品在台积电12nm工艺上Full Mask 量产成功。包括边缘计算产品 Goldwasser UL,功率25-35W,INT8 算力 32-64TOPS;半高半长的服务器计算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一种全高全长的 Goldwasser XL,输出 512TOPS 算力。
沐曦
2022年1月,沐曦首款7nm工艺的异构GPU产品启动流片,预计将于2023年初实现规模量产。
沐曦致力于为异构计算提供安全可靠的通用GPU芯片及解决方案,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI训练,以及MXG系列GPU(曦彩)用于图形渲染,满足数据中心对“高能效”和“高通用性”的算力需求。
壁仞科技
2022年8月10日,壁仞科技就推出了首款通用GPU产品BR100系列,采用7nm制程,并创新性应用Chiplet与2.5D CoWoS封装技术,创出全球算力纪录。据透露,其16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别,以“每秒1千万亿次的计算”算力纪录,超过了英伟达目前在售的旗舰计算产品A100 GPU的3倍,强势对标英伟达H100。
景嘉微
中国第一家GPU制造商,景嘉微2015年该公司推出了第一代GPU,称为JM5400,采用65nm CMOS工艺制造;
2018年8月,景嘉微推出第二代产品JM7200,主要应用于商务台式机;
2021年12月,公司推出第三代14nm高性能GPU—JH920,该芯片采用14nm工艺,支持OpenGL4.0、OpenCL 3.0、Vulkan 1.1等,但不支持DX。关键指标上,JH920像素填充率为32G Pixels/s,FP32浮点性能为1.5Tflops,功耗为30W。
兆芯
在核显级GPU领域,兆芯2019年发布了兆芯KX-6000,其核显与S3的C645规格和性能类似,甚至连驱动都能共用,3Dmark成绩为250分左右,当时集成的是C-960 GPU。
瀚博半导体
去年,瀚博半导体发布了面向云端的通用AI推理芯片SV102芯片,其特点是推理性能高(单芯片INT8峰值计算能力200TOPS,还支持FP16/BF16数据类型),延迟低,视频解码性能。支持64路1080p(解码格式支持H.264、H.265、AVS2)。
芯瞳半导体
2020年8月,芯瞳半导体第一代GPU芯片GenBu01问世。enBu01显卡平均功耗3W,为应用提供超长续航能力,满足对功耗有特殊需求的场景;满足国产操作系统2D显示、3D渲染需求,支持OpenGL 4.3图形标准、1080P高清显示、多窗口显示、具有VGA和HDMI双路显示输出接口等,集成1GB DDR3存储等。
据悉,芯瞳半导体的第二代芯片正在研发阶段,预期2023年完成市场化应用。
智绘微
2020年10月,智绘微电子成功推出第一款GPU芯片IDM919。采用高性能SIMT指令实现架构和可编程统一着色器架构,不仅可用于2D和3D图像渲染,也可以用于高性能计算等。
经过最新一轮的融资后,智绘微电子将提升旗下第二代GPU芯片IDM929流片进度和第三代GPU芯片IDM939的研发进度。
龙芯
2022年7月19日,新一代龙芯3号系列处理器配套桥片7A2000正式发布。GPU核心频率达到400-500Mhz,基于OpenGL 2.1和OpenGL ES 2.0规范实现,集成DDR4显存控制器,显存频率达到2000Mhz-2400Mhz,最大支持16GB,典型分辨率1920X1080@60Hz 最高支持2560x1440@30Hz,glmark2性能超过300 fps,glxgears 性能超过1800 fps。
凌久微
已成功研制出凌久PCI图形控制器GC101、图形加速芯片GC69030、通用图形处理器凌久GP100等多个系列GPU产品。2022年7月发布的GP200系列GPU,实现亿门级超大规模集成电路设计,具备多屏4K高清显示及万亿次计算能力。
总 结
总的来说,芯片不断的算力提升,还是依赖于整个摩尔定律的提高。因为每代芯片都会更换台积电最新一代的工艺,那么越到后面就应考虑是否会有一些更先进的封装,比如像Chiplet,或者像异质集成,或者像光电一体的计算,或者再往后更加远的一些新的计算。
目前,相比于前些年火热的AI芯片,GPU无疑在技术上有更高的门槛,虽然获得了庞大的资金涌入,但跟英伟达等国际芯片巨头还有一些差距。
另外,GPU芯片从最初设计到制造、流片、量产,周期通常不会低于18-24个月,需要经年累月的迭代和优化。同时还需要看下游的应用,来判断是不是一个很大的国产替代的机会,包括是不是一个很大的增量空间。GPU毫无疑问属于这样一个范畴,整个市场空间非常大,可能是个千亿人民币以上的市场。国产替代空间值得期待。