对话芯动科技 | 助力云游戏 4K级服务器显卡的探索与创新

news2024/10/6 2:22:29

2021年芯动科技推出了基于IMG BXT GPU IP的风华1号显卡。单块风华1号显卡可在台式机和云游戏中实现4K级别的性能,渲染能力达到5 TFLOPS,如果在服务器中同时运行两块显卡,性能还可翻倍。该显卡是为不断扩大的安卓云游戏市场量身定制的,通过云端提供卓越的成本优势与杰出的能效比,以获得完美的移动娱乐体验。

现在,芯动科技团队分享了他们在风华1号显卡上取得的最新成就:在一块显卡上同时支持44个实例,每款游戏的运行速度约为30帧/秒。

这是他们发展历程中的一个重要里程碑,彰显了他们产品的能力,以及数据中心企业探索更新的显卡解决方案对其服务的益处。在下面的访谈中,与芯动科技的SoC首席架构师何颖探讨了他们的愿景、如何取得这些成果以及下一步的发展方向。

1、芯动科技认为云游戏的最新趋势是什么?

游戏内容的多样化和质量的提高。游戏画面、交互方式、声音体验、延迟改进等等,都在不断升级,以满足用户对游戏体验越来越高的要求。

第二个趋势是多终端协同,即无论使用什么设备,都能实现无处不在的游戏体验:智能电视、平板电脑、个人电脑和智能手机都是云游戏的有效选择。

云游戏正在逐步融合其他技术领域,推动技术创新。目前,许多城市已经实现了 5G 覆盖,使游戏玩家能够以更快的速度、更低的延迟串流畅玩更多更精细的内容。令人信服的人工智能生成内容的出现,为游戏开发商提供了差异化游戏的新方法。新推出的元宇宙应用要求同类型的处理与交互基础设施,而这些需求在云端业已得到或者得到证明。

游戏开发商正在探索创建云原生内容的方法,而不仅仅只是向用户从云端提供传统游戏的服务能力,以提高每用户平均营收。这些内容可以利用云计算更强的处理能力,为高分辨率显示器提供更复杂、帧率更高的大型游戏渲染,或在游戏中渗透人工智能生成内容等高级功能,以改变游戏玩法。

 2、数据中心企业在为其服务选择合适的显卡时需要考虑哪些因素?

在挑选显卡时,数据中心运营商会考虑显卡供应商的生态系统及其在特定领域(如云游戏)的接受程度。他们会关注显卡的渲染运算、可实现的准确性、人工智能的训练和推断运算,以及显卡的目标应用和云基础功能。此外,绿色数据中心的趋势也在不断发展,它鼓励以安全、低能耗、环保的方式来满足企业的需求--从而反向通过降低功耗成本以获取更好的成本优势。

3、使用 IP 解决方案是如何帮助你们为客户打造最佳显卡的?

我们决定基于 Imagination 的 GPU IP开发我们的图形卡,以加快产品上市时间,并确保我们采用的基本图形架构是经过验证的领先技术。这一决定使我们的工程团队有时间专注为显卡添加新功能,帮助我们的产品在云游戏市场脱颖而出。

在我们的 GPU 研发过程中,GPU 设计部门和 IP 设计部门紧密合作,为 GPU 产品打造了一套高性能、高可靠性、低功耗和兼容性强的 IP 解决方案。

例如,风华二号采用的 LPDDR IP 不仅兼容 LPDDR4/4x/5/5x,我们还针对 GPU 的数据访问特性,设计并优化了 DDR 的内部请求调度机制。这为 GPU 核提供了更大的内存访问带宽,并降低了处理关键任务的时延。DDR 控制器的内部请求调度机制同样为 GPU  Core更大的内存访问带宽和更低的关键任务时延而提供了专用设计。

由于 CoreActive 拥有适用于不同代工厂不同工艺节点的成熟强鲁棒性的 IP 库,因此我们在设计 GPU 芯片时可以更灵活地选择工艺节点,而不受 IP 选型的限制。

4、您选择在哪些方面集中工程力量来创建适用于安卓云游戏的芯片?

为安卓云游戏调整芯片的重点包括支持虚拟化、支持新版本的 OpenGL® ES 或 Vulkan® API、优化多客户端场景的线性度和可靠性。

在硬件开发方面,我们集中了更多的架构、算法和设计资源,用于研究和实施虚拟化和 API 升级所需的硬件修改。其次,我们加大了对软件驱动程序开发部门的资源投入,为更高版本的安卓系统创建驱动程序,并优化其稳定性和性能。最后,我们将部分测试工作集中在新功能上,以确保在主流游戏场景中的可靠性和性能,从而保证硬件能够与安卓设备进行良好的通信和运行。

5、在扩大风华1号可容纳的游戏玩家数量方面有哪些挑战?你们是如何克服的?

对于我们的商业客户来说,扩大显卡可容纳的游戏玩家数量是一个重要目标,但也存在一些困难。主要挑战之一是软件调度的线性。随着客户数量的增加,发送到 GPU 的请求数量以及随之而来的数据也会呈指数级增长。我们的驱动程序工程师在优化数据处理调度方面投入了大量精力:最大限度地利用片上数据处理引擎,同时优化图形控制器的数据吞吐效量,缩小任务调度中的间隙和浪费,这也减少了系统 CPU 负载和等待时间。

客户端数据的隔离和保护是另一个需要解决的问题。为了保证多个客户端的数据互不干扰,我们设计了一种高效/灵活配置的内存映射机制来管理不同客户端的内存空间,从而在不降低访问效率的前提下实现客户端数据的物理隔离。我们的解决方案是 Imagination HyperLane 虚拟化技术的演进,它为每个核创建了多达八个独立的控制通道,每个通道都在内存中安全隔离,并采用灵活的性能管理技术。

6、IMG BXT 的哪些功能为风华1号带来了最大价值?

Imagination基于分块的延迟渲染架构以及硬件虚拟化技术为风华系列GPU带来了显著的能效优势,使我们能够在相同功耗水平下比竞争对手拥有更多方式支持云游戏。

风华1号和风华2号只是开端,产品推出后效果非常好。我们下一步将继续开发两条产品线:一条面向低功耗市场,一条面向服务器市场。

在低功耗市场,除了继续提升性能外,我们还将积极探索不同行业的应用场景,推出更加注重节能、低成本、高性价比的产品。

在服务器市场,我们将继续推出技术更先进、性能更强大的产品。例如,我们将采用Chiplet (芯粒)技术,突破工艺瓶颈的限制,更好地提高性能。

 7、客户和市场对 "风华 1号 "的反响如何?

风华1号一经推出,就迅速获得了市场的好评。经过测试和评估,我们的客户发现,在典型的云游戏场景中,与竞争对手的解决方案相比,"风华1号 "在能效比、单卡支持客户数量和性价比方面都具有突出优势。

8、芯动创新的下一步计划是什么?

风华1号和风华2号只是开端,产品推出后效果非常好。我们下一步将继续开发两条产品线:一条面向低功耗市场,一条面向服务器市场。

在低功耗市场,除了继续提升性能外,我们还将积极探索不同行业的应用场景,推出更加注重节能、低成本、高性价比的产品。

在服务器市场,我们将继续推出技术更先进、性能更强大的产品。例如,我们将采用Chiplet (芯粒)技术,突破工艺瓶颈的限制,更好地提高性能。

END

欢迎加入Imagination GPU与人工智能交流2群

f7b990cd5e985aa164493c5b4c6edd48.jpeg

入群请加小编微信:eetrend89

(添加请备注公司名和职称)

推荐阅读

对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数

在线课程 | Imagination中国区技术总监全面解读IMG DXD GPU

e5411286793f911aa78e866c38a20912.png


Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1221821.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

时序预测 | Python实现ConvLSTM卷积长短期记忆神经网络股票价格预测(Conv1D-LSTM)

时序预测 | Python实现ConvLSTM卷积长短期记忆神经网络股票价格预测(Conv1D-LSTM) 目录 时序预测 | Python实现ConvLSTM卷积长短期记忆神经网络股票价格预测(Conv1D-LSTM)预测效果基本介绍程序设计参考资料预测效果 基本介绍 时序预测 | Python实现ConvLSTM卷积长短期记忆神…

智能指针面试题

智能指针被问到的概率还是很大的,特别是Shared_ptr,最好会手撕,亲身经历! 基本概念 1. RAll RAII(Resource Acquisition Is Initialization)是一种利用对象生命周期来控制程序资源(如内存、文…

解决Requests中使用httpbin服务器问题:自定义URL的实现与验证

问题背景 在使用Python的Requests模块进行单元测试时,可能会遇到无法使用本地运行的httpbin服务器进行测试的问题。这是因为测试脚本允许通过环境变量HTTPBIN_URL指定用于测试的本地httpbin实例,但在某些测试用例中,URL是硬编码为httpbin.or…

100套Axure RP大数据可视化大屏模板及通用组件库

106套Axure RP大数据可视化大屏模板包括了多种实用美观的可视化组件库及行业模板库,行业模板涵盖:金融、教育、医疗、政府、交通、制造等多个行业提供设计参考。 随着大数据的发展,可视化大屏在各行各业得到越来越广泛的应用。可视化大屏不再…

基于共生生物算法优化概率神经网络PNN的分类预测 - 附代码

基于共生生物算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于共生生物算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于共生生物优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神…

02-1解析xpath

我是在edge浏览器中安装的xpath,需要安装的朋友可以参考下面这篇博客最新版edge浏览器中安装xpath插件 一、xpathd的使用 安装lxml pip install lxml ‐i https://pypi.douban.com/simple导入lxml.etree from lxml import etreeetree.parse() 解析本地文件 htm…

11月最新版付费进群源码自动定位+开源

感觉这个和前几天发布的付费进群差不多。 但有部分地方不一样,也是有什么分销分站后台,看见就头大。 没测试具体功能,可以搭建出来,D盾也未检测到加密文件 更多源码请到www.baicxx.com

OpenCV技术应用(4)— 如何改变图像的透明度

前言:Hello大家好,我是小哥谈。本节课就手把手教你如何改变图像的透明度,希望大家学习之后能够有所收获~!🌈 目录 🚀1.技术介绍 🚀2.实现代码 🚀1.技术介绍 改变图像透明度的实…

(论文阅读40-45)图像描述1

40.文献阅读笔记(m-RNN) 简介 题目 Explain Images with Multimodal Recurrent Neural Networks 作者 Junhua Mao, Wei Xu, Yi Yang, Jiang Wang, Alan L. Yuille, arXiv:1410.1090 原文链接 http://arxiv.org/pdf/1410.1090.pdf 关键词 m-RNN、…

金融业务系统: Service Mesh用于安全微服务集成

随着云计算的不断演进,微服务架构变得日益复杂。为了有效地管理这种复杂性,人们开始采用服务网格。在本文中,我们将解释什么是Service Mesh,为什么它对现代云架构至关重要,以及它是如何解决开发人员今天面临的一些最紧…

PCL_点云分割_基于法线微分分割

一、概述 PCL_点云分割_基于法线微分分割_点云法向量微分-CSDN博客 利用不同的半径(大的半径、小半径)来计算同一个点的法向量差值P。判断P的范围,从而进行分割。 看图理解: 二、计算流程 1、计算P点小半径的法向量Ns 2、计…

Python3语法总结-基本数据类型①

Python3语法总结-基本数据类型① Python3语法总结一.注释和基本数据类型标识符与关键字注释变量标准数据类型数字(Number)布尔类型(bool) 未完待续... Python3语法总结 一.注释和基本数据类型 标识符与关键字 标识符是指程序中定义的一个名字,如变量名&#xff0…

NewStarCTF2023 Reverse Week3---Let‘s Go Wp

分析 程序打开后结合题目可以发现是 GO语言。 在GO语言中,main_init 要先于 main 函数运行。 在这里对一个iv做了处理。 用插件Signsrch发现AES加密 知道是AES后,就需要找密文,key和iv了。 密文应该就是前面的十六进制字符串。 key和i…

python趣味编程-5分钟实现一个F1 赛车公路游戏(含源码、步骤讲解)

Python 中的 F1 赛车公路游戏及其源代码 F1 Race Road Game是用Python编程语言开发的,它是一个桌面应用程序。 这款 Python 语言的 F1 赛道游戏可以免费下载开源代码,它是为想要学习 Python 的初学者创建的。 该项目系统使用了 Pygame 和 Random 函数。 Pygame 是一组跨平…

Oracle 存储过程数据插入临时表慢以及SQL语句查询慢

/*parallel*/ 解释: 一般表数据量比较大(超过100万)时,可以使用parallel强制启动并行度来提升查询速度 用法:/*parallel(table_short_name,cash_number)*/ 可以加到insert、delete、update、select的后面来使用 比如&#xff…

获取用户详细信息

pojo.user:JsonIgnore注解作用忽略密码属性,返回给用户的信息不能有敏感属性密码 package com.lin.springboot01.pojo;import com.fasterxml.jackson.annotation.JsonIgnore; import lombok.Data;import java.time.LocalDateTime;Data public class Use…

多维时序 | MATLAB实现PSO-BiGRU-Attention粒子群优化双向门控循环单元融合注意力机制的多变量时间序列预测

多维时序 | MATLAB实现PSO-BiGRU-Attention粒子群优化双向门控循环单元融合注意力机制的多变量时间序列预测 目录 多维时序 | MATLAB实现PSO-BiGRU-Attention粒子群优化双向门控循环单元融合注意力机制的多变量时间序列预测预测效果基本介绍模型描述程序设计参考资料 预测效果 …

Jenkins代码检测和本地静态检查

1:Jenkins简介 Jenkins是一个用Java编写的开源的持续集成工具;Jenkins自动化部署可以解决集成、测试、部署等重复性的工作,工具集成的效率明显高于人工操作;并且持续集成可以更早的获取代码变更的信息,从而更早的进入测…

vue3+vite+ts 发布自定义组件到npm

vue3vite 发布自定义组件到npm 初始化项目编写组件配置打包组件上传到npm测试组件库 初始化项目 // 创建项目 pnpm create vite vue-test-app --template vue-ts// 运行项目 cd vite vue-test-app pnpm install pnpm run dev编写组件 1、根目录下创建packages目录作为组件的开…

C++--STL总结

参考教程:黑马程序员匠心之作|C教程从0到1入门编程,学习编程不再难_哔哩哔哩_bilibili 软件界一直希望建立一种可重复利用的东西,C的面向对象和泛型编程思想,目的就是复用性的提升。 大多情况下,数据结构和算法都未能有一套标准,…