国产自主GPU架构“天狼星”在北京亮相

news2024/12/23 19:57:37

  GPU(Graphic Processing Unit)即图形处理器,是数字世界图形内容生成的基石,不管是桌面应用、游戏、电影、数字孪生还是元宇宙;与此同时,强大的并行计算能力业已成为各种应用加速的主流手段,正广泛应用于科学计算和人工智能。然而,我国GPU芯片基本全部依赖进口。随着美国不断加码限制英伟达、AMD向我国供应高端GPU芯片,我国进口GPU也受到极大的限制。这些多重因素,更加促使国产GPU企业奋起直追。

  6月15日,国产自主GPU架构“天狼星”鉴定及发布会在北京举办。

  出席本次活动的行业领导有:国际信息显示学会中国总裁、fellow、俄罗斯工程院外籍院士、国际信息显示学会北京分会理事长严群博士;上海市集成电路行业协会秘书长郭奕武;原国家能源局电力可靠性和质监中心副主任胡红升;国家开发投资集团国投委执行总监梁敬东;杭州市上城区国有资本运营集团有限公司总经理陈轰;湖州市南太湖新区招商服务中心章佳辉;OPPO投资部陆宇仟珊;量子创新(北京)信息技术有限公司创始人程全富,副总裁郭松;北京锐马视讯科技有限公司副总裁徐言茂,副总裁肖志刚;北京德风新征程科技股份有限公司副总裁王妙维。

  •GPU架构“天狼星”出世

  GPU架构“天狼星”由国内企业中天恒星科技有限公司(Advanced Technology Stellar,简称中天恒星/ATS)自主研发。

  中天恒星研发团队由卡内基梅隆大学电子与计算机工程博士、清华大学软件学院、微电子学研究所副教授、NVIDIA合作教授邓仰东博士率领。邓博士是GPU通用计算最早研究人员之一,被誉为“GPU通用计算先行者”。邓博士长期从事图形处理器体系结构、并行计算研究和芯片产品开发工作;曾设计出全球第一个基于FPGA的GPU仿真平台;研究成果在ISCA、MICRO、等顶级会议和期刊发表。邓博士撰写多部教材和专著,其中《数字集成系统的结构化设计与高层次综合》入选清华大学及多所大学研究生教材,《异构处理器OpenCL编程导论》是国内GPU异构计算第一部教材,《3-Dimensional VLSI》是三维集成电路的第一部专著。

  “天狼星”GPU架构有几大亮点:一是具有3D图形引擎+2D图形加速+视频引擎。二是自主可控/灵活优化的指令集和VLIW/SIMD机器指令集(ICCD’13);其中,自主可控/灵活优化的指令集,保证GPU芯片迭代的软件兼容。三是SIMT计算框架,充分利用图形应用的数据并行性( DATE’12.ICCD'13,TVLSI15)。四是支持物理真实渲染(ACMComputingSurvey’14,SIGGRAPHASIA'14.15)。五是Shader Core(Graphics ProcessingCluster),包括SIMT独立指令执行单元、以32位浮点ALU为基础的统一图形架构(ICCD13)以及集成寄存器堆、纹理/数据缓存。六是延迟聚集式全局线程调度技术(ISCA20、TPDS21、TCAD'21)。七是具有良好性能伸缩性的片上互联架构(MICRO'20、TPDS’21)。

  此次发布的天狼星的主要有三个技术优势:第一、面向亿级订单市场,以独立显卡GPU芯片主流产品为突破口,瞄准需求广阔、增长强劲的亿级刚需市场,突出性价比优势;第二、拥有完全自主知识产权,以清华大学超过10年研究基础为依托的自研核心架构,确保产品迭代自主可控。以基础理论研究为基础,从数学公式推导开始,从架构设计、算法模型、原理验证、硬件实现、驱动开发等环节全部正向设计。核心架构完整知识产权,已申请专利和著作权数百项,数十项已获授权;相关研究成果发表于ISCA、Micro、IEEE TPDS、IEEE TCAD等顶级会议和期刊;第三、完备的交付能力,上下游产业链准备充分,确保产品量产自主可控;芯片设计完成全面验证,确保流片成功;软硬件接口符合国际标准,确保芯片装机即可使用,包括操作系统认证:Windows WHQL;API认证:Open GL Conformance Test;外围接口认证:HDMI DP CTS;专业测试认证:PHY layer和LIINK layer;质量体系认证:显卡3C认证(中国)、 日本VCCI 、欧盟CE、 美国FCC。

  •得到业界专家高度认可

  当前,Imagination和Vivante两家公司是主要IP来源,这些IP主要是针对移动应用的GPU内核,不适合桌面应用。此外,购买第三方的IP,难以形成成熟的图形显卡级GPU,核心电路专利无法自控和自主迭代。

  中天恒星联合创始人、总架构师邓仰东博士表示:“很多国产的GPU的IP授权主要购买的第三方。中天恒星的路线有所不同,核心的图形引擎完全自主设计的,所以3D图形引擎这块不涉及到别人的知识产权,也没有IP的问题,全部是我们自己拥有,从0到完整架构的实现,都是我们自主的技术。”

  自研GPU架构存在极高的技术挑战。邓仰东分析指出:“GPU设计有几个地方非常复杂:一个是架构级的设计,这其实是个统筹的艺术。GPU本身的资源,在所谓的uni版的shader,所有的计算资源是一样的,大家都用32比特或者64比特的浮点运算单元,这是一个配合的问题。有很多个核共享L2的cash,然后每个核内有自身的计算单元,还有通往片外的各种通道,实际上片上还有一些针对图形的,比如像纹理的缓存;这些虽然很容易知道是什么样的模块,难的是如何配合起来实现整体性能最优。换言之,如何通过统筹协调,能够适应绝大多数图形应用。在大多数情况下,均衡的设计保持性能每秒至少30帧,这是一个极具挑战的地方。二是,架构仿真的时间非常长,需要经验也需要直觉,去找出架构问题到底出在哪里。这方面也是一个很大的挑战,需要有多年的积累才能去做这件事。”

  GPU架构“天狼星”得到行业专家的高度认可和好评。

  对于天狼星架构,国际信息显示学会中国总裁、fellow、俄罗斯工程院外籍院士、国际信息显示学会北京分会理事长严群博士指出:“现在所有显示器都可以称为被动式显示技术,观看的人对它的信息传输只有接收,没有互动,一旦显示屏加上很多GPU功能,有了沉浸式三维影像呈现、交互体验,那就不是传统的电视了,现在没有人看电视了,特别是年轻人很少有人看电视,这个体验已经被手机端、PAD端等便携设备全部替代了,没有必要看那么大的电视。但是一旦需要有交互体验的时候,我们就会重新回到大屏,重新回到这些有渲染的、真实的、你可以融入其中的体验,这种体验非常不得了。”

  严群博士表示,现在ChatGPT很火,这个人工智能我们认为还是处于幼儿园、小学阶段,但这已经很可怕了,如果有了交互,以后灵魂是在数据里了,这个时候抓取的大数据,不是Chat生成式了,而是交互式GPT,这个时候大数据经过人工智能的学习以后,会远远超过人类的智力和能力,这是真正元宇宙的目标。“

  “我觉得现在真是一个很好的时机,要抓住它,潮流也在往这个方向走,机会非常多。我们如果能够逐步上去的话,我们不见得会比现在西方的有些国家的东西落后,因为你抓的点是更高层级的点。”严群分享道。

  上海市集成电路行业协会秘书长郭奕武认为:“现在正好是非常好的关口,即产业革命和新技术革命的兴起,大家也看到包括云计算、数字化、智能汽车、云端到边缘等等,这些产业化以后,都需要大算力,也就是我们所说的GPU。所以我们赶上的时机非常好,未来随着新的技术产业革命的发展,这个方面的空间是非常大的。”

  “中天恒星自研架构,有这几个特点:一是3D图形渲染。二是指令集的自主可控,这是非常不容易的。三是它的框架结构,包括在整个储存器当中的DDR4实现高速存储,这个设计也是比较领先的架构,中天恒星都用上了,这决定了未来的产品用途非常广泛。中天恒星的切入点在显示领域,我觉得显示领域非常广阔,我相信在黄总的带领下,中天恒星一定会从架构到产品,最后能够使我们的产品在全球落地。”郭奕武指出。

  •克服重重考验 终将“亮剑”

  依托研发团队多年研究成果,中天恒星从数学公式推导开始,架构设计、算法模型、原理验证、硬件实现和驱动开发等环节全部正向设计,核心IP完全自主可控,拥有图形GPU完整知识产权,并已申请专利和著作权数百项,其中25项已获授权,相关研究成果发表在ISCA、Micro、IEEE TPDS、IEEE TCAD等顶级会议和期刊。

  2019年,第一代“天狼星”架构芯片设计验证完成。2021年,第一代“天狼星”架构GPU诞生;2022年,定义第二代GPU架构“大角星”;2023年,第一代“天狼星”架构GPU实现量产。

  GPU架构取名为“天狼星”有着独特的寓意,中天恒星创始人黄永博士指出:“我们的架构全部是以恒星来命名的。Stellar是恒星、星宿、星座的意思,引申出来有超一流、卓越的含义。第二代架构命名为大角星;大角星是第二亮的恒星。只是因为距离地球更远,所以看起来没有天狼星亮;实际上,大角星比天狼星更亮,其亮度是太阳的110倍。”

  据悉,2024年,中天恒星会继续优化基于“天狼星”架构的GPU。2025年,将量产第二代GPU架构“大角星”。

  国产自研“天狼星”GPU架构的推出,无疑推动国产GPU芯片朝前迈出一个新的高度。

  当前,美国对中国的科技打压仍在继续,对中国限制供应高端GPU芯片的打压不会减弱。国内的国产替代处在深入推进期,国内下游应用市场采购国内自主可控的芯片的自主性和迫切性更强,这进一步激发中国企业自研GPU芯片的热情,为国产GPU的发展提供了巨大的助力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/652686.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

混淆矩阵和语义分割评价指标

语义分割评价指标 混淆矩阵和评价指标 https://cocodataset.org/#stuff-eval 混淆矩阵(Confusion Matrix) 指标公式准确率、正确率 T P T N ТР T N F P F N \frac{TP TN}{ ТР TNFPFN} ТРTNFPFNTPTN​精确率、精度 P T P ТР F P P \frac{TP }{ ТР F…

VLAN基础知识1_整体介绍

目录 1.VLAN概述 2.VLAN帧格式 3.VLAN端口类型 4.缺省VLAN 5.VLAN打标签和去标签 6.VLAN划分的方法 1.VLAN概述 VLAN(虚拟局域网)是一种逻辑上划分网络设备的技术,用于将单个物理网络划分成多个虚拟网络。VLAN可以将网络中的设备分组&…

uni-app开发壁纸图像小程序 瀑布流、懒加载展示

标题:使用uni-app开发壁纸图像小程序:瀑布流与懒加载展示 引言: 在今天的移动应用市场中,壁纸图像小程序备受欢迎。为了提高用户体验,我们可以使用uni-app框架来开发这样的小程序,并实现瀑布流和懒加载展示…

Mybatis常见问题

Mybatis执行流程 理解各组件的联系Sql的执行过程(参数映射,sql解析,执行和处理结果)首先通过mybatis-config.xml文件去加载连接数据库的相关配置,加载sql的映射文件 通过mybatis的配置文件然后去构建会话工厂SqlSess…

chatgpt赋能python:Python整数筛选方法

Python整数筛选方法 Python是一种极其强大的编程语言,特别适合用于数据科学和数字计算。在数字计算中,经常需要筛选出指定范围内的整数。下面将介绍几种Python中筛选整数的方法。 1. 利用循环筛选 最简单的方法是使用循环,逐个检查每个数字…

关于Sui x KuCoin Labs夏季黑客松的七个关键信息

为促进Sui生态发展更进一步,Sui与KuCoin Labs联合举办夏季黑客松,希望能聚集全球加密英才,利用Sui产业领先的技术堆栈激荡出新的火花,为加密产业和Sui生态引入新的力量。本次黑客松总奖金达28.5万美元,分为多个赛道&am…

【React】React中编写CSS,Redux

❤️ Author: 老九 ☕️ 个人博客:老九的CSDN博客 🙏 个人名言:不可控之事 乐观面对 😍 系列专栏: 文章目录 React中编写CSS内联样式普通csscss modulescss in js动态添加class ReduxJS纯函数如何创建redux…

MVC 模式及对象持久化

MVC 模式及对象持久化 开发框架简介对象关系映射ORM 技术 Struts2 框架的使用Struts2 框架的下载及部署Struts2 配置 开发框架简介 在了解MVC 之前,首先来了解框架的概念。要理解框架的含义得从开发的实际需求说起。在软件开发过程中总有很多基础的功能是相同或者相…

荣耀MagicBook如何重装系统?荣耀MagicBook重装Win10系统教程

荣耀MagicBook如何重装系统?荣耀MagicBook是一款12小时长续航独显轻薄本,深受用户的喜欢,有些用户想知道如何给荣耀MagicBook重装Win10系统,操作难度不会很大,用户们可以根据小编给大家分享的荣耀MagicBook重装Win10系…

【FPGA零基础学习之旅#8】阻塞赋值与非阻塞赋值讲解

🎉欢迎来到FPGA专栏~阻塞赋值与非阻塞赋值 ☆* o(≧▽≦)o *☆嗨~我是小夏与酒🍹 ✨博客主页:小夏与酒的博客 🎈该系列文章专栏:FPGA学习之旅 文章作者技术和水平有限,如果文中出现错误,希望大家…

Redis从入门到精通【高阶篇】之底层数据结构跳表(SkipList)

文章目录 0.前言1.跳表(SkipList)基本详解2. 源码解析3.总结4.思考题5. Redis从入门到精通系列文章 0.前言 上个篇章回顾,我们上个章节我们学习了《Redis从入门到精通【高阶篇】之底层数据结构整数集(IntSet)详解》,我们从源码层了解整数集由一个头部和…

Day08 Python数据结构(数据容器)详解

文章目录 第五章 Python数据容器5.1. 容器类型介绍5.2. 数据容器运算符5.2.1. 成员运算符5.2.2. 身份运算符 5.3. 字符串str5.3.1. 字符串的定义5.3.2. 运算符的相关操作5.3.3. 索引和切片5.3.3.1. 索引5.3.3.2. 切片 5.3.4. 字符串遍历5.3.5. 字符串的相关操作5.3.5.1. 获取的…

git安装以及git小乌龟使用

一、下载git 打开git官网地址:https://git-scm.com/进行下载 下载完安装,一直next就好,如果愿意就可以改下安装路径,改在d盘。 具体可以参考:git安装教程 二、安装完下载小乌龟以及语言包 下载地址:小乌龟…

【OpenMMLab AI实战营二期笔记】第六天 目标检测和MMDetection

1.什么是目标检测? 目标检测 vs 图像分类 目标检测的应用 (1)人脸识别 (2)智慧城市 (3)自动驾驶 (4)下游视觉任务:场景文字识别、人体姿态估计 目标检测技术…

微服务 springcloud 08.zuul框架,API网关,整合ribbon和hystrix框架

01.zuul是作为springcloud中的一个网关框架来使用的。 zuul API 网关,为微服务应用提供统一的对外访问接口。 zuul 还提供过滤器,对所有微服务提供统一的请求校验。 在项目中的位置: 02.新建 sp11-zuul 项目 03.pom.xml 需要添加 sp01-com…

【雕爷学编程】Arduino动手做(111)---震动提醒模块

37款传感器与执行器的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止这37种的。鉴于本人手头积累了一些传感器和执行器模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的&am…

纺织工厂运营神技,不会你就OUT了!

在纺织工业中,保持适宜的生产环境是至关重要的。温湿度、能耗、设备运行状态以及空气质量等因素对纺织品的质量和生产效率都有着重要影响。 为了实现对生产环境的全面监控和管理,纺织企业越来越多地采用动环监控系统。 客户案例 湖州市某纺织工厂监控项目…

USART2实现Motbus485通信

本文用的单片机是原子的战舰V4 1. 先来驱动一下usart2 USART驱动配置一般步骤: STEP1:使能相关时钟,这块板子usart2用到了A2、A3分别为TX脚、RX脚,D7的作用是发送接收模式控制。下面开启GPIO与USART2时钟: RCC_APB1PeriphClockCm…

SpringBoot中打印 sql 语句

系列文章目录 文章目录 系列文章目录前言一、在配置文件中 application.yml 配置即可二、#Log4g打印SqL语句三、配置Logback总结 前言 在SpringBoot中,我们可以使用日志框架来打印SQL语句,常用的日志框架有Logback和Log4j2。下面以Logback为例&#xff…

35:考虑virtual函数以外的其他选择

假设你正在写一个视频游戏软件,你打算为游戏内的人物设计一个继承体系,剧中人物被伤害或因其他因素而降低健康状态的情况并不罕见。你因此决定提供一个成员函数healthValue,它会返回一个整数,表示人物的健康程度。 由于不同的人物…