AI游戏革命!谷歌推出GameNGen,实时生成游戏画面,每秒20帧实时模拟

news2024/11/14 4:11:24

未来, AI会取代传统游戏引擎吗?

谷歌的研究人员发表论文称,他们创建了一个名为GameNGen的AI神经网络,直接用AI生成了整个《Doom》游戏!

最令人惊讶的是,他们并没有使用传统的游戏引擎,而是在单张张量处理单元Google Cloud TPU(谷歌定制的AI加速器芯片)上,运行GameNGen。

由扩散模型预测生成所有游戏帧,以超高效率处理3D环境和动作模拟,成功以每秒20帧的速度创造出《Doom》的游戏内容。

这是人工智能领域的一项重要的里程碑,标志着人工智能首次完全模拟出一款复杂的互动式游戏。

研究人员在论文中表示:“这是第一个完全由神经模型驱动的游戏引擎,能够在长轨迹上,以高质量与复杂环境进行实时交互。”

论文地址:https://arxiv.org/abs/2408.14837

自1993年发布以来,很多玩家把《Doom》玩出了花,尝试在各种设备上游玩《Doom》:如电视、摄像机,甚至还有人在微波炉上运行。

这次,GameNGen直接带来了突破式的进展。

不依赖编码软件来管理游戏状态,不需要传统游戏引擎来渲染视觉效果,GameNGen使用AI生成扩散模型,成功自动模拟《Doom》整个游戏内容。

要知道,计算机上的游戏,是需要围绕以下循环,手动制作的软件系统:

  • (1)识别玩家操作的内容;

  • (2)更新游戏状态;

  • (3)将其渲染到屏幕上。

游戏需要高帧率运行上述的循环,以创造互动式的虚拟世界的效果。

研究人员的灵感,来源于最近一年多模态AI的盛行,如Stable Diffusion、Dall-E、Runway等AI生成模型,在多模态图像和视频方面取得了重大进展。谷歌的研究人员设想,或许可以利用视频生成模型,直接完成互动式游戏的制作。

然而,互动式游戏不仅仅需要非常快速的视频生成。在游戏的复杂性、模拟速度、长时间稳定性,以及视觉质量方面都有极高的要求。

所以,实时运行的神经模型能否高质量地生成复杂的游戏?

谷歌的研究人员给出了肯定的答案,他们在研究中,成功在神经网络GameNGen上,自动生成游戏内容,实时运行《Doom》,并达到了与原本游戏内容相同的视觉质量。

与2018年World Models生成的画面相比,这六年间的进步可以说是日新月异:

为了实现这种效果,研究人员针对GameNGen进行了两个阶段训练:

  • 利用代理模型“玩游戏”,观测游戏操作并记录学习;

  • 训练扩散模型预测下一帧,实现稳定的自回归生成帧。

研究人员首先采用了Stable Diffusion v1.4模型,训练了一个生成式代理智能体,对游戏内容进行记录,并生成训练数据集。

第二阶段,研究人员重新利用了Stable Diffusion v1.4,使用教师强制与自回归采样两种方法,对模型进行训练。 同时,为了避免误差,研究人员还加入了高斯噪声来优化输出质量,以达到训练效果。

经训练,图像质量方面,GameNGen长线的模拟质量,能与原始游戏质量相当。

在视频质量上,通过自回归评估,预测帧的轨迹在内容和图像质量上也能与实际游戏相仿:

而在人类评价方面,研究人员准备了130个1.6秒和3.2秒的模拟短片,提供给10名评估人员。研究人员将模拟内容和原游戏内容一并播放,请评估员判断,哪个才是原游戏内容。

1.6秒项目中,正确率为58%;3.2秒项目中,正确率为60%。

根本分不清,到底哪个才是AI制作的啊!

此外,如何有效的训练神经游戏引擎;以及如何进行微调优化,这些是研究潜在的问题。但无论如何,这种新的范式已经足以令人兴奋了。

从传统游戏引擎到GameNGen,人工智能可能会导致游戏产业大换血。消除手动编程游戏逻辑的需要,AI可能会成为减少开发时间和成本的代名词。

但《Doom》的游戏质量已经不能代表21世纪大型游戏的质量了。对于图形密集程度、精细度更高的现代游戏,想实现AI模拟,可能需要更大的计算能力支持。但在小型游戏方面,这种技术转变可以降低游戏创作的门槛,使更多小作坊能够创造出以前难以想象的复杂游戏内容。

除了节省成本和时间之外,AI游戏引擎还可以为各种其他领域打开新的大门,这项创新可能会重塑虚拟世界格局,为我们提供对未来世界的一瞥:更加多样化的虚拟生态系统。

参考资料

 [1]https://venturebeat.com/ai/googles-gamengen-ai-breaks-new-ground-by-simulating-doom-without-a-game-engine/ 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2090411.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于单片机的浴室防雾镜系统设计

1系统方案设计 浴室防雾镜是一种特殊的镜子,在浴室中使用时不会起雾,通过对其需要展开分析,本设计基于51单片机设计的浴室防雾镜的系统架构如图2.1所示,采用了DS18B20温度传感器和人体红外感应红外传感器进行智能控制&#xff0c…

通过住宅代理捕获网站快照:技术解析与未来展望

引言 什么是网站快照?为什么需要网站快照? 网站快照的工作原理是什么? 如何捕获网站快照? 网站快照未来的发展趋势 总结 引言 在当今快速发展的数字时代,网站快照作为一种关键的网页记录技术,扮演着越…

Springboot3整合ELK实现日志可视化

一、环境准备 Elasticsearch、Logstash、Kibana,组合起来可以搭建线上日志系统 ELK中各个服务的作用 Elasticsearch:用于存储收集到的日志信息; Logstash:用于收集日志,SpringBoot应用整合了Logstash以后会把日志发送给Logstash,Logstash再把日志转发…

【Android】UI拓展之滑动菜单、悬浮按钮、CoordinatorLayout布局等

文章目录 一、滑动菜单1. 添加依赖2. 侧滑菜单内容2.1 headerLayout样式2.2 menu样式 3. 主界面添加4. 关联actionbar与滑动菜单 二、悬浮按钮FloatingActionButton 三、可交互提示Snackbar 四、能协调子视图的布局CoordinatorLayout 五、卡片式布局CardView 一、滑动菜单 Draw…

微信小程序服务器费用一年多少?微信小程序开发

在互联网时代,微信小程序已成为众多企业和个人拓展业务、提升服务品质的有力工具。然而对于许多准备涉足小程序领域的朋友来说【开发一个小程序大概需要多少钱】以及【微信小程序服务器费用一年需要多少】是首要关注的问题,今天飞飞将和你们分享小程序服…

【LoRa】SetLoRaSymbNumTimeout寄存器

目录 1 前言2 实验验证疑问2.1 SetRx的timeout模式和SetLoRaSymbNumTimeout2.1.1 实验12.1.2 实验22.1.3 结论 2.2 SetRx的single与continuous模式和SetLoRaSymbNumTimeout2.2.1 实验12.2.2 实验22.2.3 实验3 3 小结 1 前言 本章节介绍LoRa芯片的寄存器SetLoRaSymbNumTimeout&…

服务器部署前后端分离项目vue+springboot

步骤 1-安装java,mysql,nginx环境 服务器先安装宝塔 yum install -y wget && wget -O install.sh https://download.bt.cn/install/install_lts.sh && bash install.sh ed8484bec安装后输入bt 14查看内网链接打开宝塔页面 java&…

uniapp icons图标不显示的问题解决

如图所示 在uniapp开发中 突然发现icons组件不显示图标了 ,而且没什么报错 这是为什么 其实这最大的原因就是你上面的代码在取值上没有做好null的判断 导致参数取值报错 因此影响了页面正常的渲染 导致下面的图标都不显示

vsCode多文件标签栏换行显示

1.文件——首选项——点‘设置’ 2.输入 wrap tabs 并勾选Workbench › Editor: Wrap Tabs

安装MySQL,navicat以及Django配置遇到的一些问题

MySQL安装问题 安装MySQL按照了此文章: MySQL数据库下载及安装教程(最最新版)_mysql下载安装-CSDN博客https://blog.csdn.net/weixin_39289696/article/details/128850498首先是遇到了starting the server红色叉号显示 按照上面文章的介绍…

《机器学习》【项目】 爬虫爬取数据、数据分词、贝叶斯算法、判断分类 <完整实战详解> (全篇完结)

目录 一、回顾爬虫 1、什么是爬虫 2、实操爬虫 1)寻找标签位置 2)爬取苏某某购产品好评数据 运行代码: 3)爬取差评内容 二、数据分词 1、将获取到的好评和差评数据进行初步分词 1)初步分词 2)内…

华为云征文|1分钟熟悉Flexus X实例基础操作

前言 随着云计算技术的普及,越来越多的企业和个人开始将业务迁移到云端。华为云作为国内领先的云服务提供商,推出了高性能、高可用性的Flexus云服务器X,以满足不同用户的需求。本文将详细介绍如何购买Flexus云服务器X以及初次使用时的基本操…

物联网平台组件2: 平台校验规则

加载不通的规则引擎配置文件,使用DynamicExpresso校验采集数据,得出是否告警 rules.json {"Rules": [{"Description": "温度超过阈值警报","Condition": "temperature > 30","Action":…

2024 Xiangtan University Summer Camp-Div.2 个人题解 (待补完)

前言: 教练突然发在群里的一个比赛,想到自己好像也没什么事干,就参加了个div2(太菜了),我看着好像没啥人发这玩意的题解,cf上比赛结束了也看不了别人代码,就将自己的写出题的代码分享…

鸿蒙Next 单元测试框架——hypium

一 框架概述 单元测试框架(hypium)是HarmonyOS上的测试框架,提供测试用例编写、执行、结果显示能力,用于测试系统或应用接口。 表1 单元测试框架功能特性 二 安装使用 目前hypium以npm包的形式发布, 因此需要在Deveco Studio 工程级package.json内配…

Javascript集合引用类型(一)

思维导图 Javascript集合引用类型(一)思维导图 对象 数组与定型数组 Map、WeakMap、Set以及WeakSet类型 1. Object 创建的对象的两种方式:new 操作符和对象字面量 使用对象字面量的更多,因为代码量少; 2. Array Array构造函数,es6新增…

android studio avd设置中文输入法和时间

设置语言 打开avd 找到设置 找到语言 找到系统语言 把中文移动到第一个就是默认语言了 如果想删除英文可以点击三个点有个移除 随便找个输入框,默认就是中文了 设置时间 点击设置->系统->日期和时间 关掉自动设置 选择一下时区为上海即可

【Datawhale X 李宏毅苹果书 AI夏令营】深度学习自适应学习率(AdaGrad/RMSProp/Adam)及其调度

1、自适应学习率 理论上:在训练一个网络,训练到现在参数在临界点附近,再根据特征值的正负号判断该 临界点是鞍点还是局部最小值实际上:①在训练的时候,要走到鞍点或局部最小值非常困难;②多数还未走到临界…

第十周:机器学习笔记

第十周机器学习周报 摘要Abstract机器学习——self-attention(注意力机制)1. 为什么要用self-attention2. self-attention 工作原理2.1 求α的两种方式2.2 attention-score(关联程度) Pytorch学习1. 损失函数代码实战1.1 L1loss&a…

EmguCV学习笔记 VB.Net 8.4 pyrMeanShiftFiltering

版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。 EmguCV是一个基于OpenCV的开源免费的跨平台计算机视觉库,它向C#和VB.NET开发者提供了OpenCV库的大部分功能。 教程VB.net版本请访问…