最近,香港和中国的几所大学与腾讯联合研发了一个名为 GameGen-O 的 AI 模型,专门用于创建开放世界视频游戏的模拟。
GameGen-O 的功能不仅仅限于生成高质量的游戏内容,它还模拟了多种游戏引擎的特性,能够创造出丰富多样的游戏元素,比如角色动态环境、复杂的动作以及各种事件。
项目入口:https://gamegen-o.github.io/
这款模型还提供了多模态互动控制的能力,让玩家在游戏过程中能够自由地进行操控,带来前所未有的游戏体验。
研究团队表示,虽然 GameGen-O 并不是一个完全可玩游戏,但它为开发者提供了一个极好的工具,让他们可以快速制作原型,并测试不同的游戏元素,省去了从零开始构建的麻烦。
在展示的演示视频中,模型生成的场景中出现了许多著名游戏的画面,这可能会引发关于版权的进一步讨论。
GameGen-O 的开发是一个从零开始的庞大工程。团队通过建立一个名为 OGameData 的开放世界视频游戏数据集,这个数据集包含了超过100款现代开放世界游戏的处理数据。
为了这一目标,他们从网络上收集了32000个原始视频,经过专业人士的筛选和处理,最终形成了15000个可用视频。视频经过场景检测后被切分成片段,随后又经过严格的筛选和排序,确保它们在美学、光流和语义内容等方面的高质量。这些片段经过结构化的注释处理,形成了更为精细且适合训练的数据集。
接下来,他们通过两个阶段来训练这个模型。第一阶段,模型学习根据 OGameData 生成各种游戏内容;第二阶段,他们增加了一个名为 “InstructNet” 的组件,使得用户可以对生成的内容进行互动控制。
在实际的游戏生成过程中,GameGen-O 不仅支持角色和环境的生成,还能设计各种动作和事件,让玩家体验到生动的游戏场景。此外,这个模型还能够根据玩家的输入和指令灵活调整生成的内容,带来更个性化的游戏体验。
研究人员认为,GameGen-O 在使用 AI 生成开放世界视频游戏方面迈出了重要的一步,它结合了创意生成和互动能力,有望成为传统渲染技术的替代方案。
他们表示,这个模型对于研究者和开发者而言将是一个宝贵的资源,可以探索诸如视频游戏 AI 开发、互动控制和沉浸式虚拟环境等多种应用。
此外,最近也有其他研究团队展示了类似的 AI 系统,例如谷歌研究、谷歌 DeepMind 和特拉维夫大学共同开发的 GameNGen,这个系统能够实时模拟并播放经典游戏《DOOM》,并且帧率超过20帧每秒。
感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!