AI游戏革命！谷歌推出GameNGen，实时生成游戏画面，每秒20帧实时模拟

AI游戏革命！谷歌推出GameNGen，实时生成游戏画面，每秒20帧实时模拟

news2026/2/13 4:36:39

未来， AI会取代传统游戏引擎吗？

谷歌的研究人员发表论文称，他们创建了一个名为GameNGen的AI神经网络，直接用AI生成了整个《Doom》游戏！

最令人惊讶的是，他们并没有使用传统的游戏引擎，而是在单张张量处理单元Google Cloud TPU（谷歌定制的AI加速器芯片）上，运行GameNGen。

由扩散模型预测生成所有游戏帧，以超高效率处理3D环境和动作模拟，成功以每秒20帧的速度创造出《Doom》的游戏内容。

这是人工智能领域的一项重要的里程碑，标志着人工智能首次完全模拟出一款复杂的互动式游戏。

研究人员在论文中表示：“这是第一个完全由神经模型驱动的游戏引擎，能够在长轨迹上，以高质量与复杂环境进行实时交互。”

论文地址：https://arxiv.org/abs/2408.14837

自1993年发布以来，很多玩家把《Doom》玩出了花，尝试在各种设备上游玩《Doom》：如电视、摄像机，甚至还有人在微波炉上运行。

这次，GameNGen直接带来了突破式的进展。

不依赖编码软件来管理游戏状态，不需要传统游戏引擎来渲染视觉效果，GameNGen使用AI生成扩散模型，成功自动模拟《Doom》整个游戏内容。

要知道，计算机上的游戏，是需要围绕以下循环，手动制作的软件系统：

（1）识别玩家操作的内容；
（2）更新游戏状态；
（3）将其渲染到屏幕上。

游戏需要高帧率运行上述的循环，以创造互动式的虚拟世界的效果。

研究人员的灵感，来源于最近一年多模态AI的盛行，如Stable Diffusion、Dall-E、Runway等AI生成模型，在多模态图像和视频方面取得了重大进展。谷歌的研究人员设想，或许可以利用视频生成模型，直接完成互动式游戏的制作。

然而，互动式游戏不仅仅需要非常快速的视频生成。在游戏的复杂性、模拟速度、长时间稳定性，以及视觉质量方面都有极高的要求。

所以，实时运行的神经模型能否高质量地生成复杂的游戏？

谷歌的研究人员给出了肯定的答案，他们在研究中，成功在神经网络GameNGen上，自动生成游戏内容，实时运行《Doom》，并达到了与原本游戏内容相同的视觉质量。

与2018年World Models生成的画面相比，这六年间的进步可以说是日新月异：

为了实现这种效果，研究人员针对GameNGen进行了两个阶段训练：

利用代理模型“玩游戏”，观测游戏操作并记录学习；
训练扩散模型预测下一帧，实现稳定的自回归生成帧。

研究人员首先采用了Stable Diffusion v1.4模型，训练了一个生成式代理智能体，对游戏内容进行记录，并生成训练数据集。

第二阶段，研究人员重新利用了Stable Diffusion v1.4，使用教师强制与自回归采样两种方法，对模型进行训练。 同时，为了避免误差，研究人员还加入了高斯噪声来优化输出质量，以达到训练效果。

经训练，图像质量方面，GameNGen长线的模拟质量，能与原始游戏质量相当。

在视频质量上，通过自回归评估，预测帧的轨迹在内容和图像质量上也能与实际游戏相仿：

而在人类评价方面，研究人员准备了130个1.6秒和3.2秒的模拟短片，提供给10名评估人员。研究人员将模拟内容和原游戏内容一并播放，请评估员判断，哪个才是原游戏内容。

1.6秒项目中，正确率为58%；3.2秒项目中，正确率为60%。

根本分不清，到底哪个才是AI制作的啊！

此外，如何有效的训练神经游戏引擎；以及如何进行微调优化，这些是研究潜在的问题。但无论如何，这种新的范式已经足以令人兴奋了。

从传统游戏引擎到GameNGen，人工智能可能会导致游戏产业大换血。消除手动编程游戏逻辑的需要，AI可能会成为减少开发时间和成本的代名词。

但《Doom》的游戏质量已经不能代表21世纪大型游戏的质量了。对于图形密集程度、精细度更高的现代游戏，想实现AI模拟，可能需要更大的计算能力支持。但在小型游戏方面，这种技术转变可以降低游戏创作的门槛，使更多小作坊能够创造出以前难以想象的复杂游戏内容。

除了节省成本和时间之外，AI游戏引擎还可以为各种其他领域打开新的大门，这项创新可能会重塑虚拟世界格局，为我们提供对未来世界的一瞥：更加多样化的虚拟生态系统。

参考资料

[1]https://venturebeat.com/ai/googles-gamengen-ai-breaks-new-ground-by-simulating-doom-without-a-game-engine/

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2090411.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

基于单片机的浴室防雾镜系统设计

基于单片机的浴室防雾镜系统设计

1系统方案设计浴室防雾镜是一种特殊的镜子，在浴室中使用时不会起雾，通过对其需要展开分析，本设计基于51单片机设计的浴室防雾镜的系统架构如图2.1所示，采用了DS18B20温度传感器和人体红外感应红外传感器进行智能控制&#xff0c…

阅读更多...

通过住宅代理捕获网站快照：技术解析与未来展望

通过住宅代理捕获网站快照：技术解析与未来展望

引言什么是网站快照？为什么需要网站快照？ 网站快照的工作原理是什么？ 如何捕获网站快照？ 网站快照未来的发展趋势总结引言在当今快速发展的数字时代，网站快照作为一种关键的网页记录技术，扮演着越…

阅读更多...

Springboot3整合ELK实现日志可视化

Springboot3整合ELK实现日志可视化

一、环境准备 Elasticsearch、Logstash、Kibana,组合起来可以搭建线上日志系统 ELK中各个服务的作用 Elasticsearch:用于存储收集到的日志信息； Logstash:用于收集日志，SpringBoot应用整合了Logstash以后会把日志发送给Logstash,Logstash再把日志转发…

阅读更多...

【Android】UI拓展之滑动菜单、悬浮按钮、CoordinatorLayout布局等

【Android】UI拓展之滑动菜单、悬浮按钮、CoordinatorLayout布局等

文章目录一、滑动菜单1. 添加依赖2. 侧滑菜单内容2.1 headerLayout样式2.2 menu样式 3. 主界面添加4. 关联actionbar与滑动菜单二、悬浮按钮FloatingActionButton 三、可交互提示Snackbar 四、能协调子视图的布局CoordinatorLayout 五、卡片式布局CardView 一、滑动菜单 Draw…

阅读更多...

微信小程序服务器费用一年多少？微信小程序开发

微信小程序服务器费用一年多少？微信小程序开发

在互联网时代，微信小程序已成为众多企业和个人拓展业务、提升服务品质的有力工具。然而对于许多准备涉足小程序领域的朋友来说【开发一个小程序大概需要多少钱】以及【微信小程序服务器费用一年需要多少】是首要关注的问题，今天飞飞将和你们分享小程序服…

阅读更多...

【LoRa】SetLoRaSymbNumTimeout寄存器

【LoRa】SetLoRaSymbNumTimeout寄存器

目录 1 前言2 实验验证疑问2.1 SetRx的timeout模式和SetLoRaSymbNumTimeout2.1.1 实验12.1.2 实验22.1.3 结论 2.2 SetRx的single与continuous模式和SetLoRaSymbNumTimeout2.2.1 实验12.2.2 实验22.2.3 实验3 3 小结 1 前言本章节介绍LoRa芯片的寄存器SetLoRaSymbNumTimeout&…

阅读更多...

服务器部署前后端分离项目vue+springboot

服务器部署前后端分离项目vue+springboot

步骤 1-安装java，mysql，nginx环境服务器先安装宝塔 yum install -y wget && wget -O install.sh https://download.bt.cn/install/install_lts.sh && bash install.sh ed8484bec安装后输入bt 14查看内网链接打开宝塔页面 java&…

阅读更多...

uniapp icons图标不显示的问题解决

uniapp icons图标不显示的问题解决

如图所示在uniapp开发中突然发现icons组件不显示图标了 ，而且没什么报错这是为什么其实这最大的原因就是你上面的代码在取值上没有做好null的判断导致参数取值报错因此影响了页面正常的渲染导致下面的图标都不显示

阅读更多...

vsCode多文件标签栏换行显示

vsCode多文件标签栏换行显示

1.文件——首选项——点‘设置’ 2.输入 wrap tabs 并勾选Workbench › Editor: Wrap Tabs

阅读更多...

安装MySQL，navicat以及Django配置遇到的一些问题

MySQL安装问题安装MySQL按照了此文章： MySQL数据库下载及安装教程（最最新版）_mysql下载安装-CSDN博客https://blog.csdn.net/weixin_39289696/article/details/128850498首先是遇到了starting the server红色叉号显示按照上面文章的介绍…

阅读更多...

《机器学习》【项目】爬虫爬取数据、数据分词、贝叶斯算法、判断分类＜完整实战详解＞（全篇完结）

《机器学习》【项目】爬虫爬取数据、数据分词、贝叶斯算法、判断分类＜完整实战详解＞（全篇完结）

目录一、回顾爬虫 1、什么是爬虫 2、实操爬虫 1）寻找标签位置 2）爬取苏某某购产品好评数据运行代码： 3）爬取差评内容二、数据分词 1、将获取到的好评和差评数据进行初步分词 1）初步分词 2）内…

阅读更多...

华为云征文｜1分钟熟悉Flexus X实例基础操作

华为云征文｜1分钟熟悉Flexus X实例基础操作

前言随着云计算技术的普及，越来越多的企业和个人开始将业务迁移到云端。华为云作为国内领先的云服务提供商，推出了高性能、高可用性的Flexus云服务器X，以满足不同用户的需求。本文将详细介绍如何购买Flexus云服务器X以及初次使用时的基本操…

阅读更多...

物联网平台组件2：平台校验规则

物联网平台组件2：平台校验规则

加载不通的规则引擎配置文件，使用DynamicExpresso校验采集数据，得出是否告警 rules.json {"Rules": [{"Description": "温度超过阈值警报","Condition": "temperature > 30","Action":…

阅读更多...

2024 Xiangtan University Summer Camp-Div.2 个人题解（待补完）

2024 Xiangtan University Summer Camp-Div.2 个人题解（待补完）

前言： 教练突然发在群里的一个比赛，想到自己好像也没什么事干，就参加了个div2（太菜了），我看着好像没啥人发这玩意的题解，cf上比赛结束了也看不了别人代码，就将自己的写出题的代码分享…

阅读更多...

鸿蒙Next 单元测试框架——hypium

鸿蒙Next 单元测试框架——hypium

一框架概述单元测试框架(hypium)是HarmonyOS上的测试框架，提供测试用例编写、执行、结果显示能力，用于测试系统或应用接口。表1 单元测试框架功能特性二安装使用目前hypium以npm包的形式发布, 因此需要在Deveco Studio 工程级package.json内配…

阅读更多...

Javascript集合引用类型（一）

Javascript集合引用类型（一）

思维导图 Javascript集合引用类型(一)思维导图对象数组与定型数组 Map、WeakMap、Set以及WeakSet类型 1. Object 创建的对象的两种方式：new 操作符和对象字面量使用对象字面量的更多，因为代码量少； 2. Array Array构造函数,es6新增…

阅读更多...

android studio avd设置中文输入法和时间

android studio avd设置中文输入法和时间

设置语言打开avd 找到设置找到语言找到系统语言把中文移动到第一个就是默认语言了如果想删除英文可以点击三个点有个移除随便找个输入框，默认就是中文了设置时间点击设置->系统->日期和时间关掉自动设置选择一下时区为上海即可

阅读更多...

【Datawhale X 李宏毅苹果书 AI夏令营】深度学习自适应学习率(AdaGrad/RMSProp/Adam)及其调度

【Datawhale X 李宏毅苹果书 AI夏令营】深度学习自适应学习率(AdaGrad/RMSProp/Adam)及其调度

1、自适应学习率理论上：在训练一个网络，训练到现在参数在临界点附近，再根据特征值的正负号判断该临界点是鞍点还是局部最小值实际上：①在训练的时候，要走到鞍点或局部最小值非常困难；②多数还未走到临界…

阅读更多...

第十周：机器学习笔记

第十周：机器学习笔记

第十周机器学习周报摘要Abstract机器学习——self-attention（注意力机制）1. 为什么要用self-attention2. self-attention 工作原理2.1 求α的两种方式2.2 attention-score（关联程度） Pytorch学习1. 损失函数代码实战1.1 L1loss&a…

阅读更多...

EmguCV学习笔记 VB.Net 8.4 pyrMeanShiftFiltering

EmguCV学习笔记 VB.Net 8.4 pyrMeanShiftFiltering

版权声明：本文为博主原创文章，转载请在显著位置标明本文出处以及作者网名，未经作者允许不得用于商业目的。 EmguCV是一个基于OpenCV的开源免费的跨平台计算机视觉库,它向C#和VB.NET开发者提供了OpenCV库的大部分功能。教程VB.net版本请访问…

阅读更多...

推荐文章

最新文章