国产高端GPU,国产替代加速(附国产厂家汇总)

news2024/11/22 15:21:00

2022年8月9日,壁仞科技在上海发布首款通用GPU芯片BR100,标志着中国企业第一次打破了此前一直由国际巨头保持的通用GPU全球算力纪录;

8月31日,美国政府命令芯片厂商英伟达(NVIDIA)以及超威半导体(AMD)停止向中国销售部分高性能GPU;

10月,AMD RDNA3的发布,由于单片设计中的现代高端图形处理器一代又一代地变得越来越复杂和昂贵,它决定通过Navi 31图形芯片为其图形处理器采用全新的革命性小芯片GPU设计,从而实现我们在图形处理器中看到的所有功能。

目前GPU赛道风潮正劲。在上一波AI芯片总融资金额超过200亿的热潮后,整个芯片行业经历了一轮大洗牌。如今GPU成为芯片界又一火热的赛道,同时加上国产替代紧迫的“引力”,国产GPU企业蓄势待发。

在本文中,我们主要从GPU概况、GPU的国内外市场情况、国产化布局、GPU挑战及机遇等几个方面,了解GPU的现状与趋势。

01 .什么是GPU?

GPU(Graphics Processing Unit,图形处理器)又被称作显示核心、视觉处理器、显示芯片,是一种专为并行处理而设计的微型处理器,非常擅长处理大量简单任务,包括图形和视频渲染。

在计算能力方面,相较于CPU“拉垮”的计算能力,GPU站在了浪潮之巅。正如其全称“图形计算单元“,GPU的初衷主要是为了接替CPU进行图形渲染的工作。

GPU之所以擅长并行计算,从其架构里就决定了。它主要由计算单元ALU组成,仅有少量的控制单元和存储单元。这也就意味着,GPU可以拥有数百、数千甚至上万核心来同时处理计算任务,使计算的并行度得到成千上万倍的提升—相比现在普通电脑最多8核CPU同时工作,这是一个及其恐怖的数字。

GPU根据接入系统的方式分为集成型GPU(Integrated GPU,iGPU)和离散型GPU(Discrete GPU ,dGPU)两种,前者就是我们日常所说的集成显卡/核芯显卡,后者就是我们日常所说的独立显卡。

发展至今,GPU不仅为个人电脑、服务器和移动设备进行图形处理工作,还主要应用在工作站、游戏机、嵌入式设备、数据中心等各种需要渲染图形或高性能计算的场景。

02 .全球GPU市场格局

1.GPU市场规模

根据Verified Market Research数据统计,2020年全球GPU市场价值为254.1亿美元,2027年有望达到1853.1亿美元,年平均增速高达32.82%。

据 IDC 数据显示,2018 年全年中国GPU市场规模约为13.05 亿美金(约合人民币90.05亿元),据预测到2023 年中国GPU市场规模将达到43.2亿美金(约合人民币 298 亿元),未来5年整体市场年复合增长率(CAGR)27.1%。

2.GPU“最吸金”的赛道之一

早期GPU多用于2D和3D图形的计算和处理。传统上来说,之前GPU最关键的市场在游戏领域。但长期来看,这部分市场增速趋缓,甚至隐隐有下降势头。

而在眼下的算力时代,取而代之的是与数字化转型相关的用例已成为GPU应用的主要阵地,如今的GPU通用计算技术发展在浮点运算、并行计算等部分计算方面,GPU 可以提供数十倍乃至于上百倍于CPU 的性能。

目前随着云计算、人工智能等高性能异构计算的发展,GPU并行计算的优势被进一步发掘,成为高性能计算领域的“宠儿”。从2020年开始,GPU便成为国内芯片领域“最吸金”赛道之一,融资总额已超过200亿元。

03 .巨头垄断,壁垒横行

放眼全球,GPU呈现寡头高度垄断的格局。在GPU市场,排名前三的英伟达、AMD、英特尔的营收几乎垄断整个GPU行业,占据市场份额高达63%。在中国市场中,三大巨头也是分走了大部分“蛋糕”。

英伟达是全球GPU领域的绝对龙头,A100是其2020年推出的数据中心级云端加速芯片,采用台积电7nm工艺制程,支持FP16、FP32和FP64浮点运算,为人工智能、数据分析和HPC数据中心等提供算力;

AMD公司可同时提供独立GPU和集成GPU,其集成GPU主要运用在Ryzen APU、嵌入式、半定制平台中,独立GPU分为Radeon和Instinct系列,主要用于游戏、专业视觉、服务器等应用;

Intel公司能够帮助公司在集成GPU领域实现寡头垄断,在2022年8月24日正式发布了全新数据中心GPUFlex系列。

相比之下,国产GPU还处于起步阶段。受限于工艺制程、EDA等技术封锁,国内厂商目前在自主研发领域的成果与国际一流水平还有着很大的差距。但随着国内自研GPU的领军企业景嘉微、壁仞科技、芯动科技等逐渐崭露头角,各厂家已发展出了一系列的产品线,并且均采用国内成熟制程工艺及自主架构,国产替代浪潮来临,国内独立GPU厂商的广阔市场空间已被打开。

04. 融资持续火热的GPU赛道,GPU创企陆续交出产品

近年来,国产GPU频频传出好消息。在市场和政策的推动下,曾经蒙尘的国产GPU开始闪烁自己的光芒。

睿兽分析显示,自2019年9月成立以来,曾创造A轮融资纪录的壁仞科技,至今已完成四轮融资,融资总额超50亿元人民币;

2021年2月22日,摩尔线程完成数十亿元人民币的pre-A轮融资;

2022年7月5日,沐曦完成10亿元人民币pre-B轮融资;

2022年7月13日,天数智芯宣布完成超10亿元人民币的C+轮及C++轮融资.

近段时间来,国产GPU厂商除了陆续获得大笔超百亿融资以外,也在相继发布产品进展,切实在产品上取得了一定的突破。

目前已经聚集了约20家GPU领域的厂商,其中许多已经将其GPU 芯片投入量产。伴随着国内GPU赛道上一个又一个交出新产品,国产GPU正迅速走过“从无到有”,进入下一个“迭代时刻”。

芯动科技

2021年11月正式发布了其用于服务器和桌面应用的风华一号GPU。它率先实现5-10TFLOPS的渲染能力,率先实现图形API支持超过OpenGL 4.0等;

2022年8月,芯动科技又推出了针对于桌面市场的“风华2号”GPU,“风华2号”渲染能力突出,GPU像素填充率48GPixel/s,FP32单精度浮点性能1.5TFLOPS,AI运算(INT8)性能12.5TOPS,实测功耗4至15W,支持OpenGL4.3、DX11、Vulkan等API;
目前“风华3号”已基本完成研发,将为国内用户提供超大算力光追等酷炫性能。

天数智芯

2021年3月31日,上海天数智芯对外正式发布了7nm的天垓100芯片及天垓100加速卡,实现了国内通用GPU从0到1的突破。天数智芯其首款7nm制程的云端推理通用GPU产品“智铠100”,该芯片已于今年5月点亮,将于2022年第四季度正式发布,年底量产。

2022年5月8日,天数智芯第二款产品7nm云边推理芯片“智铠100”成功点亮,产品迭代开发和商业应用领先国内同行。

摩尔线程

在短短18个月内,就发布了全新统一系统架构MUSA和全能GPU产品“苏堤”等系列新品。

基于MUSA统一系统架构GPU苏堤,摩尔线程推出了第一代桌面级显卡MTT S60,它采用12nm制程,包含2048个MUSA核心,单精度算力最高可达6TFlops;以及面向数据中心级多功能GPU产品MTT S2000,MTT S2000采用12nm制程,使用4096个MUSA核心。

登临科技

2020年6月,登临科技Goldwasser系列产品在台积电12nm工艺上Full Mask 量产成功。包括边缘计算产品 Goldwasser UL,功率25-35W,INT8 算力 32-64TOPS;半高半长的服务器计算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一种全高全长的 Goldwasser XL,输出 512TOPS 算力。

沐曦

2022年1月,沐曦首款7nm工艺的异构GPU产品启动流片,预计将于2023年初实现规模量产。

沐曦致力于为异构计算提供安全可靠的通用GPU芯片及解决方案,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI训练,以及MXG系列GPU(曦彩)用于图形渲染,满足数据中心对“高能效”和“高通用性”的算力需求。

壁仞科技

2022年8月10日,壁仞科技就推出了首款通用GPU产品BR100系列,采用7nm制程,并创新性应用Chiplet与2.5D CoWoS封装技术,创出全球算力纪录。据透露,其16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别,以“每秒1千万亿次的计算”算力纪录,超过了英伟达目前在售的旗舰计算产品A100 GPU的3倍,强势对标英伟达H100。

景嘉微

中国第一家GPU制造商,景嘉微2015年该公司推出了第一代GPU,称为JM5400,采用65nm CMOS工艺制造;

2018年8月,景嘉微推出第二代产品JM7200,主要应用于商务台式机;

2021年12月,公司推出第三代14nm高性能GPU—JH920,该芯片采用14nm工艺,支持OpenGL4.0、OpenCL 3.0、Vulkan 1.1等,但不支持DX。关键指标上,JH920像素填充率为32G Pixels/s,FP32浮点性能为1.5Tflops,功耗为30W。

兆芯

在核显级GPU领域,兆芯2019年发布了兆芯KX-6000,其核显与S3的C645规格和性能类似,甚至连驱动都能共用,3Dmark成绩为250分左右,当时集成的是C-960 GPU。

瀚博半导体

去年,瀚博半导体发布了面向云端的通用AI推理芯片SV102芯片,其特点是推理性能高(单芯片INT8峰值计算能力200TOPS,还支持FP16/BF16数据类型),延迟低,视频解码性能。支持64路1080p(解码格式支持H.264、H.265、AVS2)。

芯瞳半导体

2020年8月,芯瞳半导体第一代GPU芯片GenBu01问世。enBu01显卡平均功耗3W,为应用提供超长续航能力,满足对功耗有特殊需求的场景;满足国产操作系统2D显示、3D渲染需求,支持OpenGL 4.3图形标准、1080P高清显示、多窗口显示、具有VGA和HDMI双路显示输出接口等,集成1GB DDR3存储等。

据悉,芯瞳半导体的第二代芯片正在研发阶段,预期2023年完成市场化应用。

智绘微

2020年10月,智绘微电子成功推出第一款GPU芯片IDM919。采用高性能SIMT指令实现架构和可编程统一着色器架构,不仅可用于2D和3D图像渲染,也可以用于高性能计算等。

经过最新一轮的融资后,智绘微电子将提升旗下第二代GPU芯片IDM929流片进度和第三代GPU芯片IDM939的研发进度。

龙芯

2022年7月19日,新一代龙芯3号系列处理器配套桥片7A2000正式发布。GPU核心频率达到400-500Mhz,基于OpenGL 2.1和OpenGL ES 2.0规范实现,集成DDR4显存控制器,显存频率达到2000Mhz-2400Mhz,最大支持16GB,典型分辨率1920X1080@60Hz 最高支持2560x1440@30Hz,glmark2性能超过300 fps,glxgears 性能超过1800 fps。

凌久微

已成功研制出凌久PCI图形控制器GC101、图形加速芯片GC69030、通用图形处理器凌久GP100等多个系列GPU产品。2022年7月发布的GP200系列GPU,实现亿门级超大规模集成电路设计,具备多屏4K高清显示及万亿次计算能力。

总 结

总的来说,芯片不断的算力提升,还是依赖于整个摩尔定律的提高。因为每代芯片都会更换台积电最新一代的工艺,那么越到后面就应考虑是否会有一些更先进的封装,比如像Chiplet,或者像异质集成,或者像光电一体的计算,或者再往后更加远的一些新的计算。

目前,相比于前些年火热的AI芯片,GPU无疑在技术上有更高的门槛,虽然获得了庞大的资金涌入,但跟英伟达等国际芯片巨头还有一些差距。

另外,GPU芯片从最初设计到制造、流片、量产,周期通常不会低于18-24个月,需要经年累月的迭代和优化。同时还需要看下游的应用,来判断是不是一个很大的国产替代的机会,包括是不是一个很大的增量空间。GPU毫无疑问属于这样一个范畴,整个市场空间非常大,可能是个千亿人民币以上的市场。国产替代空间值得期待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/490596.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

借助 Google Play 游戏电脑版 Com2uS 为用户打造多平台无缝体验

作者 / Google Play 游戏总监 Arjun Dayal 吸引潜在用户在 PC 端畅享游戏 《魔灵召唤:克罗尼柯战记》是韩国游戏开发商 Com2uS 于 2023 年 3 月面向全球发布的一款移动端大型多人在线角色扮演游戏。迄今为止,《魔灵召唤》在全球的下载量超过 1.8 亿&…

Aztec:混合zkRollup,而非zkEVM

1. 引言 Aztec zkRollup为混合zkRollup: 支持通用私有计算的加密zkRollup(命名为Aztec):构建trustless、可扩展的、去中心化的Layer2 zkRollup,同时支持private smart contract execution。同时支持public state和pr…

C++ Primer阅读笔记--参数传递

目录 1--三种基本传递方式 2--数组形参 3--main函数传递参数 4--传递可变形参 1--三种基本传递方式 ① 值传递: 使用值传递时,初始值会拷贝给变量,对变量的改动不会改变初始值的值; ② 指针传递: 使用指针传递时&…

Mysql 查询性能优化

查看数据库用户连接数量 show processlist;分析表结构 索引 show index from conference;查询锁状态 show status like %lock%;是否开启慢查询 show variables like %slow_query_log%;日志查询默认情况下:slow_query_log的Value为OFF 如要开启慢查询日志&#…

2023最新软件测试面试题汇总

常见的面试题汇总 1、你做了几年的测试、自动化测试,说一下 selenium 的原理是什么? 我做了五年的测试,1年的自动化测试; selenium 它是用 http 协议来连接 webdriver ,客户端可以使用 Java 或者 Python 各种编程语言…

AI奇点将至 如何成为人工智能驱动型公司

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 2023年4月16日,中泰证券首席经济学家李迅雷先生发表了《奇点将至:AI或开启新一轮科技革命》的文章。李迅雷先生认为,以智能化为特征的第四次工业革命轮廓日渐清晰,在世界百年未…

Linux网络编程:socket、客户端服务器端使用socket通信

socket socket(套接字),用于网络中不同主机间进程的通信。 socket是一个伪文件,包含读缓冲区、写缓冲区。 socket必须成对出现。 socket可以建立主机进程间的通信,但需要协议(IPV4、IPV6等)…

[230507]托福听力真题TPO66词汇 |无重复|20:50~21:55 + 8:00~8:30

目录 conversation 1 conversation 2 ​ TPO66 Lecture ppt词汇 TPO66 Lecture 笔记词汇 conversation 1 conference / ˈkɑːnfərəns /n 会议terrific / təˈrɪfɪk /adj 极好的presentation / ˌpriːz(ə)nˈteɪʃ…

发送Ajax get请求详解

发送AJAX get请求&#xff0c;前端代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head> <meta charset"UTF-8"> <title>ajax get请求</title> </head> <body> <script type"text/java…

第三十一章 Unity骨骼动画

关于骨骼动画的原理&#xff0c;我们这里不再详细介绍&#xff0c;有不清楚的可以回去看DirectX课程和3dsMAX课程。接下来&#xff0c;我们来讲解一下Unity的骨骼动画系统。Unity 的动画系统基于动画剪辑&#xff08;Animation Clip&#xff09;的概念&#xff0c;它的本质就是…

Linux 安装时,各个分区的作用是什么?

在这里&#xff0c;我说说一开始Linux为什么需要分区。 因为 Linux 是一个多用户操作系统。 多用户意味着一个问题&#xff1a;并非所有用户的操作都是可控的。 而系统正常运行的话&#xff0c;必须要一定的剩余空间。 这也就意味着&#xff1a;如果一个用户自己把空间占满…

MySQL数据库之用户管理

一、数据库用户管理 1.1 新建用户 CREATE USER 用户名来源地址 [IDENTIFIED BY [PASSWORD] 密码]; 即&#xff1a;create user 用户名源地址 identified by 密码; 用户名&#xff1a; 指定将创建的用户名 来源地址&#xff1a; 指定新创建的用户可在哪些主机上登录&…

线段树练习题(日程安排表、LC-307、LC-2407、LC-699)

线段树详解&#xff1a;https://leetcode.cn/problems/range-module/solution/by-lfool-eo50/ 文章目录 线段树线段树模板[729. 我的日程安排表 I](https://leetcode.cn/problems/my-calendar-i/)[731. 我的日程安排表 II](https://leetcode.cn/problems/my-calendar-ii/)[732.…

数据库基础及用户管理授权

数据库概念 关系型数据库 数据结构二维表格 库 -> 表 -> 列&#xff08;字段&#xff09;&#xff1a;用来描述对象的的一个属性&#xff1b;行&#xff1a;用来描述一个对象的信息 mysql&#xff08;5.7/8.0&#xff09; maridb ocracle postgresql sqlserver(windows…

2D火焰特效

Unity面片实现火焰效果 一、效果说明 大家好&#xff0c;我是阿赵。这是一个火焰的效&#xff0c;不过它不是粒子做的&#xff0c;是用一个面片做的&#xff0c;可以理解成是2D的特效。这个例子很简单&#xff0c;但可以拓展一下思路&#xff0c;原来除了用序列帧和粒子做动画…

将页面元素隐藏的10种方法

在Web开发中&#xff0c;隐藏页面元素使其视觉不可见是一个非常常见的需求。为了实现这一目标&#xff0c;我们通常会采用多种方法&#xff0c;最常用的例如CSS的display属性&#xff0c;只要设置为node即可隐藏元素。 本文将通过对当前所有可用的隐藏元素的方法做一个总结&…

Flink系列-11、Flink DataStream的Sink

版权声明&#xff1a;本文为博主原创文章&#xff0c;遵循 CC 4.0 BY-SA 版权协议&#xff0c;转载请附上原文出处链接和本声明。 大数据系列文章目录 官方网址&#xff1a;https://flink.apache.org/ 学习资料&#xff1a;https://flink-learning.org.cn/ 目录 Flink在批处…

云效/git 删除特殊字符远程分支

云效/git 删除特殊字符远程分支 一、查看所有分支二、删除分支三、验证 在使用云效时&#xff0c;不小心添加了一个错误分支 de’vdev &#xff0c;在云效手动删除时&#xff0c;报错“找不到分支”&#xff0c;无法删除。只能启动git命令进行查看&#xff0c;将步骤总结如下&a…

【JAVA】#详细介绍!!! 文件操作之文件内容操作(2)!

本文主要是针对文件内容的操作进行展开&#xff0c;文件内容操作无非就两种 1.针对文件进行“读” 2.针对文件进行“写” 目录 文件内容读写的形式 字符流 字节流 文件内容操作 InputStream&#xff1a;以字节流的形式进行读操作 创建方式&#xff1a; FileInputStream的…

2023年深圳CPDA数据分析师认证到这里就对了哦

CPDA数据分析师认证是大数据方面的认证&#xff0c;助力数据分析人员打下扎实的数据分析基础知识功底&#xff0c;为入门数据分析保驾护航。 帮助数据分析人员掌握系统化的数据分析思维和方法论&#xff0c;提升工作效率和决策能力&#xff0c;遇到问题能够举一反三&#xff0c…