谷歌DeepMind推出SIMA智能体,可以跟人一起玩游戏

news2024/9/22 23:21:09

谷歌 DeepMind 推出了 SIMA,这是一种通过训练学习游戏技能的人工智能代理,因此它玩起来更像人类,而不是一个只做自己事情的强大人工智能。

从早期与 Atari 游戏合作,到以人类大师级别玩《星际争霸 II》的 AlphaStar 系统,谷歌 DeepMind 在人工智能和游戏领域拥有悠久的历史。

01 游戏是人工智能的重要试验场

视频游戏是人工智能 (AI) 系统的重要试验场。与现实世界一样,游戏是丰富的学习环境,具有响应灵敏、实时的设置和不断变化的目标。

在一份新技术报告中,谷歌 DeepMind 介绍了 SIMA(Scalable Instructable Multiworld Agent),它是一种用于 3D 虚拟设置的通用 AI Agent。这项研究标志着智能体首次证明它可以理解广泛的游戏世界,并像人类一样遵循自然语言指令执行其中的任务。 

SIMA 的存在并不是为了获得游戏高分,对于人工智能系统来说,学会玩一款视频游戏本身就是一项技术壮举。SIMA 的研究向人们展示了如何通过语言界面将高级人工智能模型的功能转化为有用的、现实世界的动作。

谷歌 DeepMind 希望 SIMA 和其他智能体研究能够使用视频游戏作为沙箱,以更好地了解人工智能系统如何变得更有帮助。

02 SIMA 经过九种不同游戏测试

谷歌 DeepMind 与八家游戏工作室合作,在九种不同的视频游戏上训练和测试 SIMA,例如Hello Games 的《No Man's Sky》和 Tuxedo Labs 的《Teardown》。

SIMA 产品组合中的每款游戏都开辟了一个新的互动世界,包括一系列可供学习的技能,从简单的导航和菜单使用,到采矿资源、驾驶宇宙飞船或制作头盔。

此外,谷歌 DeepMind 还使用了四个研究环境 - 包括 Unity 构建的“构建实验室”等,智能体需要用积木构建雕塑,以测试他们的对象操作和对物理世界的直观理解。

通过学习不同的游戏世界,SIMA 可以捕捉到界面语言并与游戏行为联系起来。例如,在游戏中,SIMA 会观察玩家所做的事情并记录导致他们进行游戏操作的指令。 

03 SIMA 可在十秒内完成简单任务

SIMA 是一种人工智能代理,可以感知和理解各种环境,然后采取行动来实现指示的目标。它包括一个专为精确图像语言映射而设计的模型和一个预测屏幕上接下来会发生什么的视频模型。

同时,谷歌 DeepMind 还会根据 SIMA 产品组合中特定于 3D 设置的训练数据对这些模型进行微调。

SIMA 不需要访问游戏的源代码,也不需要定制的 API。它只需要两个输入:屏幕上的图像以及用户提供的简单的自然语言指令,SIMA 使用键盘和鼠标输出来控制游戏的中心角色来执行这些指令。

这意味着 SIMA 可以与任何虚拟环境进行交互。

SIMA 的当前版本通过 600 项基本技能评估测试,涵盖导航(例如“左转”)、对象交互(“爬梯子”)和菜单使用(“打开地图”)等简单任务,SIMA 均可在大约 10 秒内完成。

谷歌 DeepMind 希望未来的 SIMA 能够处理需要高层战略规划和多个子任务才能完成的任务,例如“寻找资源和建立营地”。

04 SIMA 表现优于单游戏训练智能体

SIMA 的成功应用证明受过多种游戏训练的智能体比仅学习如何玩一种游戏的智能体更好。

在谷歌 DeepMind 的测试中,SIMA 智能体在九个 3D 游戏上进行了训练,其表现明显优于仅在每个单独的游戏上进行训练的所有专业智能体。而且,多款游戏训练过的 SIMA 在新游戏中的表现几乎与专门针对该游戏进行过训练的智能体一样好。

这种在全新环境中运行的能力凸显了 SIMA 超越其训练的泛化能力,但是 SIMA 需要进行更多的研究才能在已知和未知的游戏中达到人类的水平。

此外,谷歌 DeepMind 的测试结果还表明 SIMA 的性能依赖于语言。在控制测试中,若智能体没有接受任何语言训练或指令,它的行为是漫无目的的。例如,智能体可能会收集资源(这是一种常见行为),但不是按照指示去收集。

SIMA 的测试结果显示了开发新一代通用语言驱动的智能体的潜力。谷歌 DeepMind 也表示,SIMA 代表可扩展、可指导、多世界的智能体,目前还处于内测阶段,期待在更多训练环境中进一步构建 SIMA,并纳入更强大的模型。

最终,SIMA 可以理解并安全地执行各种任务,从而对网上和现实世界中的人们有所帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1534832.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

算法设计与分析-动态规划算法的应用——沐雨先生

一、实验目的 1. 掌握动态规划算法的基本思想,包括最优子结构性质和基于表格的最优值计算方法。 2.熟练掌握分阶段的和递推的最优子结构分析方法。 3. 学会利用动态规划算法解决实际问题 。 二、实验内容 1. 问题描述 &#…

Open-Sora揭秘:这款开源视频生成神器能否超越OpenAI的Sora?

近日,我开始研究开源视频生成项目Open-Sora。 Open-Sora的核心思想,其实就是通过开源的方式,让先进的视频生成技术能够普及到大众手中。 而且,它还提供了精简又用户友好的工具和内容。 这样一来,视频制作的复杂性就…

Postman接口做关联测试的方法步骤

应用场景 假设下一个接口登录需要上一个接口的返回值,例如请求需要先登录获取到token,下一个请求要携带对应的token才能进行请求 方法:通过设置全局变量/环境变量 方法一:设置全局变量 1.先请求登录接口,请求成功之后…

解决微信小程序代码包大小限制方法

1 为什么微信小程序单个包的大小限制为 2MB 微信小程序单个包的大小限制为 2MB 是出于以下几个考虑: 保证小程序的启动速度:小程序的启动速度是影响用户体验的关键因素之一。如果包太大,会导致小程序启动时间过长,从而影响用户体…

2024年【熔化焊接与热切割】报名考试及熔化焊接与热切割复审考试

题库来源:安全生产模拟考试一点通公众号小程序 熔化焊接与热切割报名考试考前必练!安全生产模拟考试一点通每个月更新熔化焊接与热切割复审考试题目及答案!多做几遍,其实通过熔化焊接与热切割模拟考试题库很简单。 1、【单选题】…

Java反射机制的讲解及其示例说明

Java 反射机制是指在运行时动态地获取类的信息以及操作对象的方式。它允许程序在运行时检查和操作类、方法、属性等,而不需要在编译时就确定这些属性。通过反射机制,我们可以在运行时动态地创建对象、调用方法、获取属性等。 Java 反射机制提供了以下主…

LeetCode每日一题【24. 两两交换链表中的节点】

思路:先创建虚拟头结点,再用双指针,两两交换 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNode(int x) : val(x), next(nullptr…

2024.3.21 QT

思维导图 自由发挥登录窗口的应用场景,实现一个登录窗口界面。(不要使用课堂上的图片和代码,自己发挥,有利于后面项目的完成) 要求: 1. 需要使用Ui界面文件进行界面设计 2. ui界面上的组件相关设置&…

C++的vector类(一):vector类的常见操作

目录 前言 Vector类 遍历与初始化vector ​vector的扩容机制 vector的对象操作 find与insert 对象数组 前言 string类中还有一些内容需要注意: STL 的string类怎么啦? C面试中string类的一种正确写法 C STL string的Copy-On-Write技术 C的st…

java 继承(上)

在说继承之前,先看Student、Teacher这两个类,通过下面的代码可以看出什么? 细心的你可能已经有所发现了,那就是它们都含有相同的属性和方法。 如果把相同特征提取出来,放到一个类中,暂时先把这个类叫做 Tan…

【Linux】多线程概念 | POSIX线程库

文章目录 一、线程的概念1. 什么是线程Linux下并不存在真正的多线程,而是用进程模拟的!Linux没有真正意义上的线程相关的系统调用!原生线程库pthread 2. 线程和进程的联系和区别3. 线程的优点4. 线程的缺点5. 线程异常6. 线程用途 二、二级页…

25.删除链表中倒数第N个结点

题意:给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 class Solution { public:ListNode* removeNthFromEnd(ListNode* head, int n) {ListNode* dummyHeadnew ListNode(0); //定义虚拟头结点ListNode* fastdummyHead; //定…

32.网络游戏逆向分析与漏洞攻防-游戏网络通信数据解析-网络数据分析原理与依据

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 如果看不懂、不知道现在做的什么,那就跟着做完看效果 内容参考于:易道云信息技术研究院VIP课 上一个内容:31.其它消息的实…

浅谈游戏地图中位置实时更新的技术方案

地图如今在游戏中发挥的作用越来越重要,随着电子竞技的兴起,地图逐渐成为了为玩家创造体验的直接舞台。希望本文能对有兴趣了解游戏地图背后实现原理的同学一些帮助。 什么是游戏地图 在游戏中可以通过3D场景虚拟一个完整的世界,当3D场景较为…

基于springboot的大学生租房平台系统

技术:springbootmysqlvue 一、系统背景 互联网发展至今,无论是其理论还是技术都已经成熟,而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播,搭配信息管理工具可以很好地为人们提供服务。针对大学生租房信息管理混乱…

C语言每日一题07

一、题目 二、解析 逻辑与 &&、逻辑或 || 均有“短路”特性: 逻辑与&&“短路”:当逻辑与&&的左操作数为逻辑 “假“ 时,就足以判断该逻辑运算的结果为假了,故右操作数就不再被执行。 逻辑或||“短路”&#xff1a…

使用PLCSIM Advanced仿真博途运动控制

作者顾工首先,添加一个CPU,直接添加一个1518T,反正仿真,不用最好的干嘛呢。是吧。当然,你也可以添加一个你喜欢的PLC,这里不强求。 然后添加工艺对象,我们简单添加一个定位轴。 在工艺对象&am…

GPT-5揭秘:Lex Fridman与Sam Altman播客热议,AGI时代的新变革即将来临!

嘿,朋友们,你们知道吗?Lex Fridman和Sam Altman又聚在一起了,这次是在播客上。 在播客中,他们聊了很多,包括董事会的幕后故事、Elon Musk的诉讼案,甚至还提到了Ilya、Sora这些名字。 但真正让…

跟着官方文档一步一步搭建Elastic Stack(3节点ES集群+Kibana+Filebeat+Metricbeat)

文章目录 源码仓库硬件要求配置文件docker-compose.ymlfilebeat.ymlmetricbeat.yml 配置项解读以及注意事项docker-compose.yml解读filebeat配置解读metricbeat配置解读SSL配置ILM配置 运行运行截图 写在最后 本篇文章是使用Filbeat将产品环境的access_lo同步至Elastic Stack中…

SSTI漏洞详解

目录 前备知识 模块引擎: 模块渲染函数: 继承关系: SSTI漏洞简介 SSTI漏洞成因 SSTI漏洞原理 一些常见模块介绍 php Twig模块引擎 代码演示1 Twig模块引擎代码演示2 python flask模块 代码演示1: python jinja模块 代…