AI技术颠覆游戏开发:谷歌DeepMind GameNGen实时生成《DOOM》探秘

news2025/1/17 14:05:31

引言

近年来,生成式人工智能(AIGC)在图像和视频生成领域取得了巨大突破。然而,谁能想到,这项技术正逐渐渗透进游戏开发领域,且潜力巨大。2023年8月29日,谷歌DeepMind发布了名为《扩散模型是实时游戏引擎》(Diffusion Models Are Real-Time Game Engines)的论文,提出了全新的AI游戏生成引擎GameNGen。令人惊讶的是,GameNGen无需传统的游戏引擎与预设代码逻辑,仅依赖神经网络和提示词,即可实时生成复杂的游戏内容。在此研究中,GameNGen成功复现了经典游戏《DOOM》,并在单个TPU上实现了每秒20帧的实时渲染。此举有望彻底颠覆传统游戏开发流程。

本文将详细剖析GameNGen的技术原理、创新点及其对游戏行业的潜在影响。

GameNGen的工作原理

游戏开发的传统逻辑

传统的电子游戏开发流程,通常涉及复杂的预设逻辑,遵循用户输入、更新游戏状态、渲染画面的固定循环。无论是经典的贪吃蛇还是复杂的3D游戏,都依赖开发者预设的代码逻辑来控制游戏的运行。因此,游戏引擎通常通过固定的编程规则来响应用户输入并更新游戏画面。

然而,DeepMind提出了一种革命性的想法——通过生成式AI模型完全抛弃这些预设逻辑,依赖AI实时生成游戏的内容与状态更新。这种创新不仅有望降低游戏开发的技术门槛,还可以大幅减少开发成本和时间。

扩散模型与GameNGen架构

GameNGen的核心技术基于扩散模型(Diffusion Models),这是一种生成式模型,最早被应用于图像和视频生成任务,如Stable Diffusion和DALL-E等。GameNGen则对这一技术进行了改进,使其可以高效生成游戏场景和逻辑。

数据集与训练

为了训练一个能够高效玩游戏的AI,研究人员首先构建了一个900M帧的数据集。这些数据包括游戏角色的动作、玩家视角等关键信息。通过深度强化学习方法(如PPO训练),并结合卷积神经网络(CNN)提取特征,研究团队成功地训练了一个可以理解游戏逻辑的AI agent。

模型架构改进

GameNGen的模型基础是Stable Diffusion 1.4,原本是一个生成文本到图像的扩散模型。在此基础上,研究团队做了几项关键的改动:

  1. 动作数据嵌入:将游戏中的动作序列作为token嵌入到模型中,使得模型能够理解游戏角色的动作。
  2. 交叉注意力机制改进:通过将编码后的动作序列替换原有的文本输入,模型得以从玩家的输入和先前的帧信息中生成下一帧画面。
  3. 去噪采样优化:GameNGen使用了名为“速度参数化”的新技术来最小化扩散损失,并通过在上下文帧中添加高斯噪声,优化了模型的帧生成质量。

高效实时渲染

与传统生成模型不同的是,GameNGen仅需要4次DDIM去噪步骤即可生成高质量的游戏帧,而非通常需要的20次采样。这极大提升了游戏的生成效率,使其能够稳定在每秒20帧的速度下运行。

实际效果与局限性

复现《DOOM》:AI与人类难辨的游戏体验

GameNGen首次被应用于复现经典射击游戏《DOOM》,该游戏以其复杂的3D场景和快节奏的战斗著称。实验表明,GameNGen在生成《DOOM》游戏画面的质量上几乎与原版游戏无异。研究人员甚至组织了多名评估者进行盲测,让他们判断哪一个画面来自真实游戏,哪一个来自AI生成的GameNGen。结果显示,约60%的情况下,评估者无法分辨AI生成的游戏与真实游戏之间的差异。这种几乎以假乱真的效果,证明了GameNGen在生成游戏画面和模拟复杂游戏逻辑上的能力。

当前存在的挑战

尽管GameNGen展示了极大的潜力,但其仍存在明显的局限性:

  1. 通用性不足:目前,GameNGen仅在《DOOM》这款特定游戏上表现出色。模型需要针对特定游戏进行大量训练,尚未实现对多种游戏的普适性支持。
  2. 帧率限制:虽然GameNGen已经实现了每秒20帧的速度,但这远未达到现代游戏普遍要求的60帧甚至更高帧率。这意味着当前的技术水平尚不足以支持实时生成复杂的现代游戏。
  3. 无法创造新内容:虽然GameNGen能够高效生成现有场景,但其并不能创造新的场景或游戏机制,限制了其在创新型游戏开发中的应用。

GameNGen对游戏开发的影响

开发成本与时间大幅降低

通过AI生成游戏内容,开发者可以节省大量编写逻辑和设计关卡的时间。未来的游戏开发可能只需要给出一个提示词,AI就能够生成完整的游戏场景和交互逻辑。这不仅简化了开发流程,也大大降低了开发成本。

游戏行业的颠覆与机遇

AI生成游戏的出现,预示着未来游戏行业的潜在变革。正如米哈游前董事长蔡浩宇所言,未来的游戏开发者可能只有两类:极少数顶尖天才和大量纯粹的爱好者。通过AI,人人都可能成为游戏开发者,甚至无需任何编程知识。这对传统的游戏开发公司和开发者将带来巨大冲击。

未来展望

虽然GameNGen目前仍处于早期阶段,面临诸多挑战,但其展示出的颠覆性潜力不容忽视。随着AI技术的不断进步,游戏开发的门槛将继续降低,开发者可以将更多精力放在游戏创意与创新上,而不再局限于技术实现。

正如英伟达CEO黄仁勋所预言的那样,未来5至8年内,AI生成的每个像素都可能达到实时渲染水平。届时,游戏开发将进入全新时代,每个人都有可能通过AI工具创造属于自己的虚拟世界。

结论

GameNGen作为世界上首个由神经网络驱动的实时游戏引擎,展示了AI技术在游戏开发中的巨大潜力。虽然它目前仍面临通用性和性能上的挑战,但这一技术有望在未来几年内彻底改变游戏开发流程,为游戏行业带来全新的可能性。

随着AI技术的快速发展,游戏开发者将不再局限于编写复杂的逻辑与代码,而是可以通过简单的提示词让AI生成出完整的游戏世界。GameNGen

的出现,预示着我们正在逐步走向一个完全由人工智能主导的游戏开发时代。这不仅为开发者提供了强大的工具,也为玩家们带来了更多创意和定制化的游戏体验。今后的游戏开发将会越来越智能化,游戏行业也将面临更多的创新机遇与挑战。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2110178.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【舍入,取整,取小数,取余数丨Excel 函数】

数学函数 1、Round函数 Roundup函数 Rounddown函数 取整:(Int /Trunc)其他舍入函数: 2、Mod函数用Mod函数提取小数用Mod函数 分奇偶通过身份证号码判断性别 1、Round函数 Roundup函数 Rounddown函数 Round(数字,保留几位小数)(四…

解除网站禁用右键 解除禁用选择方法 并允许复制

限制我复制&#xff0c;太恶心了&#xff0c;别用技术作恶&#xff01;&#xff01;&#xff01; 一般HTML网站禁止右键选择的方法 <body ondragstart"return false" oncontextmenu"return false" onselectstart"return false">解除网站…

遇到“msvcp120.dll丢失”的错误提示?来看看msvcp120.dll丢失的解决方法都有哪些?

遇到“msvcp120.dll丢失”的错误提示可能会让人感到焦虑&#xff0c;尤其是当你尝试运行某个应用程序或游戏时突然接收到这样的消息。​msvcp120.dll​是Microsoft Visual C 2013 Redistributable Package 中的一个文件&#xff0c;主要负责C标准库中的功能&#xff0c;比如输入…

C++第四十六弹---解锁多线程编程的奥秘:<thread>库深入探索

✨个人主页&#xff1a; 熬夜学编程的小林 &#x1f497;系列专栏&#xff1a; 【C语言详解】 【数据结构详解】【C详解】 目录 1 线程库 1.1 thread类的简单介绍 1.2 线程函数参数 1.3 原子性操作库(atomic) 1.4 lock_guard与unique_lock 1.4.1 mutex的种类 1.4.2 loc…

python-小理的三角形

题目描述 小理有一个数组长度大小为 n &#xff0c;数组中有 n 个正整数。 现在小理请你从其中选出三个元素&#xff08;注意选择元素的下标不能相同&#xff0c;但是其值可以相同&#xff09;组成一个三角形。 无法做到&#xff0c;请输出一行一个字符串"No solution&quo…

SQL进阶技巧:每年在校人数统计 | 区间重叠问题

目录 0 问题分析 1 数据准备 2 问题分析 3 小结 区间重叠问题 0 问题分析 有一个录取学生人数表 in_school_stu&#xff0c;记录的是每年录取学生的人数及录取学生的学制&#xff0c;计算每年在校学生人数。 1 数据准备 create table in_school_stu as ( select stack(5,…

【平渊网络】副业项目拆解:视频借鉴式搬运项目 | 搞笑视频跨平台 “借鉴式” 搬运项目思路 | 抖音防查重机制基础

目录 项目介绍 实操&#xff1a;账号准备 素材制作教学 防查重机制基础 项目介绍 只分享实操干货&#xff0c;不浪费时间。如果你没有2台手机&#xff0c;或者手机不支持分身就不用往下读了&#xff0c;这个项目大概率是做不出流量的。 项目是情感聊天对话的变种&#xff…

C++ DLL DEMO

头文件dlltest.h #pragma once #include "pch.h" #include <iostream> #include <fstream> #include <iomanip> #include <string> #include <bitset>extern "C" __declspec(dllexport) void debugService(uint32_t debugF…

【全网最全】2024年数学建模国赛B题31页完整建模过程+成品论文+matlab/python代码等(后续会更新

您的点赞收藏是我继续更新的最大动力&#xff01; 一定要点击如下的卡片&#xff0c;那是获取资料的入口&#xff01; 2024数学建模国赛B题 【全网最全】2024年数学建模国赛B题31页完整建模过程成品论文matlab/python代码等&#xff08;后续会更新「首先来看看目前已有的资料…

【计算机图形学】《五讲速通CG重点》第三讲-Rendering

如果这篇文章对你有帮助&#xff0c;欢迎点赞与收藏~ 目录 Rasterization 1 Points 2 Line 2.1 DDA&#xff08;差分&#xff09; 2.2 Bresenham’s algorithm: 2.3 Mid-point algorithm (0-45) 3 Triangles 4 Polygon 5 Triangulation 6 Interpolation 7 Anti-alia…

运动耳机哪个牌子的好?五大选购技巧助你轻松购买

作为一名专注运动装备的测评专家&#xff0c;我曾深入体验了多款骨传导耳机&#xff0c;发现市场上不少品牌并未如广告所宣称的那般出色&#xff0c;部分低质或不专业的骨传导耳机在使用时不仅舒适度欠佳&#xff0c;还可能因设计缺陷导致声音泄露严重&#xff0c;非常影响使用…

共赢算力未来,华宇TAS应用中间件获“鲲鹏原生开发认证”

9月2日&#xff0c;华为在北京中关村国家自主创新示范区会议中心举办了以“鲲鹏原生&#xff0c;力算未来”为主题的鲲鹏原生开发伙伴圈层活动&#xff0c;旨在聚集鲲鹏生态合作伙伴&#xff0c;搭建交流平台&#xff0c;加强产业圈各方紧密合作&#xff0c;抓住产业机遇&#…

Canvas艺术之旅:了解几个绘制基本图形的 API

了解几个绘制基本图形的 API Canvas 是 HTML5 提供的绘画 API&#xff0c;可以用于在 Web 页面上绘制各种基本图形。本文介绍一些 Canvas 绘制基本图形的 API&#xff1a; 前置条件 注意&#xff1a;本文章所提供的代码示例默认已经进行了 canvas 元素定义&#xff0c;DOM 获…

Java项目: 基于SpringBoot+mybatis+maven+mysql教师工作量管理系统(含源码+数据库+毕业论文)

一、项目简介 本项目是一套基于SpringBootmybatismavenmysql教师工作量管理系统 包含&#xff1a;项目源码、数据库脚本等&#xff0c;该项目附带全部源码可作为毕设使用。 项目都经过严格调试&#xff0c;eclipse或者idea 确保可以运行&#xff01; 该系统功能完善、界面美观…

日志框架log4j打印异常堆栈信息携带traceId,方便接口异常排查

一、异常堆栈无traceId 排查定位问题异常痛苦 在日常项目开发中&#xff0c;我们会自定义一个traceId方便&#xff0c;链路追踪。在log4j2.xml 我们可能是这样去配置日志打印格式。 <Console name"CONSOLE" target"SYSTEM_OUT"><PatternLayoutpa…

python学习第六节:使用python制作九九乘法表和学生管理系统

python学习第六节&#xff1a;使用python制作九九乘法表和学生管理系统 通过前面五节的了解&#xff0c;已经大概知道python的语法以及基础函数&#xff0c;下面是简单的两个小程序。不会做没关系&#xff0c;看得懂就可以了&#xff0c;如果能够自己加工举一反三那就更好了。 …

计算机网络 TCP/IP协议篇

今天学习了TCP/IP协议的相关知识&#xff0c;学习笔记如下&#xff1a; 在学习之前&#xff0c;我们先抛出几个问题&#xff0c;什么是TCP/IP协议簇&#xff1f;TCP/IP协议簇是怎么工作的&#xff1f; TCP/IP模型 协议分层 每层通过协议完成各自特定的功能上层依赖下层提供…

智能对决:提示词攻防中的AI安全博弈

智能对决&#xff1a;提示词攻防中的AI安全博弈 在2024年上海AIGC开发者大会上&#xff0c;知名提示词爱好者工程师云中嘉树发表了关于AI提示词攻防与安全博弈的精彩演讲。他深入探讨了当前AI产品的安全现状&#xff0c;提示词攻击的常见手段及其应对策略。本文将对他的演讲进…

【每日一题】LeetCode 84.柱状图中最大的矩形(栈、数组、单调栈)

【每日一题】LeetCode 84.柱状图中最大的矩形&#xff08;栈、数组、单调栈&#xff09; 题目描述 给定 n 个非负整数&#xff0c;用来表示柱状图中各个柱子的高度。每个柱子彼此相邻&#xff0c;且宽度为 1 。求在该柱状图中&#xff0c;能够勾勒出来的矩形的最大面积。 这…

Linux小程序:进度条

目录 一、换行与回车 二、缓冲区 三、倒计时代码 四、进度条实现 实现进度条程序&#xff0c;首先需要两个预备知识&#xff1a; 1.换行与回车 2.缓存区 一、换行与回车 我们通常使用\n作为换行符&#xff0c;但实际上\n是换行回车两种效果的结合&#xff0c;因此我们需…