黄仁勋预言步入现实 谷歌展示实时游戏生成AI模型GameNGen

news2024/11/15 6:52:25

由AI模型实时生成游戏的时代,已经悄然来到了我们身边。本周来自谷歌公司和特拉维夫大学的研究人员发表了一篇名为《Diffusion模型是实时游戏引擎》的论文,介绍了计算机历史上第一个完全由神经网络模型支持的游戏引擎GameNGen。

在这里插入图片描述
研究人员在论文中写道:“今天,电子游戏是由人类编程的,GameNGen是游戏引擎新范式的部分概念验证——游戏将会变成神经模型的权重,而不是代码行。

换一种更容易理解的说法,目前所有的电子游戏都是预先设计好的,开发者需要编写代码、准备游戏文本和贴图模型,然后放置在游戏地图上——游戏画面的渲染和状态更新取决于手动编辑的规则。但GameNGen模型打开了一个完全不同的思路:使用AI生成模型,根据玩家的动作和反应,实时演算和生成游戏画面

在演示中,研究人员通过机器学习,让GameNGen模型成功实时生成90时代的第一人称射击游戏《毁灭战士》。视频显示,在AI生成的游戏中,玩家可以在场景中转弯、发射武器,同时能够准确反映剩余的子弹数量、遭到攻击后的剩余血量,以及是否满足打开下一个关卡所需的条件。

在这里插入图片描述
需要注意的是,上面看到的一系列画面,完全是AI实时生成的图像。最新的进展也显示,AI模型继成功生成文字、图像、音频和短视频后,可能存在生成游戏场景的能力,这对逻辑性、连贯性和实时交互的要求明显高出一大截。
他们是怎么做到的?

研究团队介绍称,为了训练这个能实时生成游戏的AI,首先需要训练一个强化学习(RL)代理来玩游戏,然后使用录制下来的片段来训练生成扩散模型,根据过去的画面和玩家动作来预测接下来的画面,这也是为什么AI生成的游戏能够展现生命值和弹药的变化,以及敌人受到攻击的动画。

更大的挑战在于让AI生成的图像保持时间和逻辑上的连贯性。为了减轻推理过程中的自回归漂移,研究人员在训练期间通过向编码帧添加高斯噪声破坏上下文帧,允许AI更正前几帧中采样的信息,从而长时间保持图像生成的稳定性。

在这里插入图片描述
研究人员披露,跑这个模型只需要单个TPU(谷歌自研AI处理器),就能实现每秒20帧的生成速度。
当然,上面这几段话也展现出GameNGen的局限性:这个AI必须依靠输入已有的游戏(或文字、图片等材料)来生成游戏。
英伟达高级研究经理&具身智能集团主管Jim Fan博士在社交媒体上评论称,GameNGen更像是一个神经辐射场(NeRF),而不是一个视频生成模型。神经辐射场通过从不同角度拍摄场景的图像,从而生成场景的3D展示。但这也意味着模型不具备泛化能力,无法“想象”新的场景。这也是GameNGen与Sora的不同点:它无法生成新的场景或交互机制。

在这里插入图片描述
研究人员也在论文中提到这一点,解释称借助该技术,未来的游戏开发者将能通过“文本描述和示例图像”来创建新游戏,人们将有可能仅根据示例而不是编程技能,将一组精致的图像转化为现有游戏的新可玩关卡或角色。

黄仁勋:5-10年内出现完全由AI生成的游戏

由AI渲染来进行实时游戏并不是一个全新的想法。在今年3月发布最新一代Blackwell架构芯片时,英伟达CEO黄仁勋就曾预言,大概在5-10年内就能看到完全由AI生成的游戏。

事实上,朝着这个方向前进的不只是谷歌团队,OpenAI在今年首次发布Sora演示时,也曾展现过模拟像素游戏《我的世界》的能力。

在这里插入图片描述
最新的进展,也恰好迎合了米哈游前董事长蔡浩宇近期引发热议的“劝退”言论。

蔡浩宇本周公开发声称,AIGC已经彻底改变了游戏开发,现在只需要时间让这种现象完全展开。他认为,未来只有两种游戏开发者具有继续从业的意义——前0.0001%的天才,以及99%的业务爱好者创作满足自己需求的游戏。至于剩下的“从普通到专业”的游戏开发者,大家还是趁早转行吧。

在这里插入图片描述

追评

反正,就我看来,技术创新已经成为了企业如何削减成本的常规手段。但是AIGC是否真的能代替人类,相信只有专业的你自己心知肚明。人类要始终保持学习,始终对事物产生思考,成长不断地成长,才会找到属于自己人生的价值和意义。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2092606.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

51单片机.之蜂鸣器振动播放歌曲

蜂鸣器发声是通过喇叭振动发声的&#xff0c;通电产生磁场&#xff0c;磁铁吸收&#xff0c;而振动。不断释放&#xff0c;吸收。 1、蜂鸣器发声&#xff0c;播放不同频率的声音逐渐变尖 #include<reg52.h>sbit BUZZ P1^6;unsigned char T0RH0; unsigned char T0RL0; v…

七、性能测试

文章目录 一、常见的性能测试二、为什么要进行性能测试三、性能测试实施的流程&#xff08;一&#xff09;如何确定性能测试的需求1.关键性能指标分析2.关键业务分析 &#xff08;二&#xff09;常见的性能指标 三、性能测试定义四、性能测试关键指标&#xff08;一&#xff09…

论文笔记:Estimating future human trajectories from sparse time series data

sigspatial 2023 humob竞赛paper hiimryo816/humob2023-MOBB (github.com) 1 数据集分析 这里只分享了HuMob数据集1的内容 1.1 假日分析 对HuMob数据集#1地理数据的方差分析显示了非工作日的模式 在某些天的y坐标方差中有显著的峰值&#xff0c;这是非工作日的象征【x坐标…

写给LLM新手的建议,让你少走2年弯路!

大模型的爆火&#xff0c;在全球范围内引发了一场A1“狂也在业界点燃了一场百模大战。结合蕞近飙”&#xff0c;两年我在大模型领域的一些经验&#xff0c;分享一下在校学生/新人如何转到大模型阵营。 1、大模型有哪些从业方向? 首先你可以在求职网站搜索一下“大模型关键词&…

重卡智能充电机器人

产品介绍 随着新能源电池行业的发展&#xff0c;越来越多码头、矿山等场景的重型卡车都改为新能源供电形式&#xff0c;由于新能源重卡充电电压为1.2MW&#xff0c;充电口离地1.8m&#xff0c;充电枪充电线缆重量为50kg&#xff0c;人工操作难度大、危险性大&#xff0c;所以我…

arcpy将数据库要素类添加到图层组以及创建要素收藏夹如何创建文件夹并将模板中的符号添加到文件夹中

&#x1f3c6;本文收录于《CSDN问答解惑-专业版》专栏&#xff0c;主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案&#xff0c;希望能够助你一臂之力&#xff0c;帮你早日登顶实现财富自由&#x1f680;&#xff1b;同时&#xff0c;欢迎大家关注&&收…

算法基础-位运算

>> &#xff08;右移运算&#xff09; x >> y&#xff1a;表示将x的二进制值右移y位。 正数是直接右移y位&#xff0c;则高位&#xff08;最左边&#xff09;补y个0。 负数是求补码&#xff0c;然后右移y位&#xff0c;最高位补y个1&#xff0c;再求反码&#xff…

react|useState的异步渲染

useState 组件里面的变量可以用state来表示&#xff0c;setState函数是用来更新state的值的用法 let [age,setAge]useState(0); // 0是变量age的初始值异步渲染 setState是异步指定的。也就是setAge是异步执行的。执行但不是立刻渲染&#xff0c;而是进入到微任务队列。注意…

数值分析笔记(六)非线性方程求根

非线性方程求根 二分法 二分法是线性收敛的。 不动点 对于非线性方程 f ( x ) 0 f(x)0 f(x)0&#xff0c;将其转化为 x φ ( x ) x\varphi(x) xφ(x)&#xff0c;若 x ∗ x^* x∗满足 f ( x ∗ ) 0 f(x^*)0 f(x∗)0&#xff0c;称 x ∗ x^* x∗为 φ ( x ) \varphi(x) φ…

基于ASO-BP原子探索优化BP神经网络实现数据预测Python实现

本文提出了一种基于ASO算法优化BP神经网络的数据预测方法。通过ASO算法对BP神经网络的权值和阈值进行优化&#xff0c;克服了BP神经网络易陷入局部最优解和对初始权值敏感的缺点。实验结果表明&#xff0c;优化后的BP神经网络在预测精度上得到了显著提升&#xff0c;为数据预测…

【数学建模学习手册】python基本入门使用

本专栏内容为&#xff1a;数学建模原理 记录学习数学建模 &#x1f493;博主csdn个人主页&#xff1a;小小unicorn ⏩专栏分类&#xff1a;数学建模 &#x1f69a;代码仓库&#xff1a;小小unicorn的代码仓库&#x1f69a; &#x1f339;&#x1f339;&#x1f339;关注我带你学…

【三维重建】三角网格中轴骨架线提取

三维网格中轴线提取 方法介绍实现提取 三维网格中轴线提取是计算机图形学和三维建模领域中的一个重要技术&#xff0c;它对于理解三维形状的拓扑结构和几何特性具有重要意义。 方法介绍 以下是几种常见的三维网格中轴线提取方法&#xff1a; 基于距离变换的方法 基本原理&…

海康二次开发笔记10-独立Group导入、导出及执行

独立Group导入、导出及执行 1. 界面设计 2. 添加引用 Group相当于VM中的模块,因此在调用相关接口函数前,需要引用对应的动态库IMVSGroupCs,同时将复制本地的属性改为False using IMVSGroupCs;3. 添加VmSingleModuleSetConfigControl控件 拖入控件后,设置Dock为Fill 4. 选择G…

算法的学习笔记—把数字翻译成字符串

&#x1f600;前言 在日常生活中&#xff0c;我们经常会遇到各种编码和解码的问题。今天&#xff0c;我们将讨论一个有趣的问题&#xff1a;如何将一串数字翻译成字母&#xff0c;并计算出有多少种不同的翻译方法。 &#x1f3e0;个人主页&#xff1a;尘觉主页 文章目录 &#…

虚拟化设置和虚拟机相关的环境搭建

目录 0.首先声明 1.背景知识 ​编辑 2.虚拟化设置 3.安装vm15.5过程 4.安装虚拟系统 4.1下载centos7.6 4.2安装centos7.6 5.我的总结 6.我的体会 0.首先声明 我的这个教程参考的就是韩顺平老师的这个linux学习教程&#xff0c;但是这个韩老师的这个教程就是2020年的教…

算法如何应用,思路都在这

目录 01 问题定义 02 问题建模 03 特征工程 04 模型选择 05 模型融合 本文深入探讨了算法在不同领域的应用方法和背后的思考逻辑。作者夏师傅通过丰富的案例分析&#xff0c;揭示了算法如何助力产品决策、优化业务流程&#xff0c;并提供了实用的策略和技巧。无论您是技术专家还…

2024 年 Web 开发者必备的 30 款 CSS 工具

2024 年 Web 开发者必备的 30 款 CSS 工具 | 瑆箫博客 找到合适的 CSS 工具可能需要花费不少时间&#xff0c;但是这份 2024 年最棒的 30 款 CSS 工具清单&#xff0c;可以让你的选择变得轻松许多。无论你的 CSS 技能水平如何&#xff0c;这份清单都能提供调试、优化代码和提升…

Bazel 快速入门与核心知识

Bazel 快速入门与核心知识 Bazel 简介 Bazel 是一款与 Make、Maven 和 Gradle 类似的开源构建和测试工具。 它使用人类可读的高级构建语言。Bazel 支持多种语言的项目 (C/C, Java, Python, …)&#xff0c;可为多个平台构建输出。Bazel 支持跨多个代码库和大量用户的大型代码…

2024怎么选蓝牙耳机性价比品牌?四款小白必看优选王炸机型推荐!

如今国人对蓝牙耳机的选择日益重视&#xff0c;蓝牙耳机作为智能的手机备件&#xff0c;普及率也是一升再升&#xff0c;但市面上很多品牌虽然宣传自己音质好和佩戴感舒适&#xff0c;其实性能不佳&#xff0c;那么2024怎么选蓝牙耳机性价比品牌&#xff1f;身为资深的蓝牙耳机…

复变函数在大模型中的应用

1. 导入 说来惭愧&#xff0c;我研究生时的研究方向是复分析&#xff0c;但毕业近十年来几乎没用到它。 我还记得实习时做自我介绍时&#xff0c;我说我的研究方向是复分析。面试官不太了解&#xff0c;我便解释说&#xff0c;这是关于对 -1 开平方得到的虚数 i 的研究。 在…