谷歌提出AGI的6大原则,和5大能力等级

news2024/11/27 16:44:35

随着ChatGPT等大模型的出现,AGI概念正在从哲学层面快速转向实际应用落地,并且ChatGPT已经展示出了初级AGI的功能(如AutoGPT),有不少专家认为,AGI时代可能在10年内到来。

因此,需要一个明确的技术框架来讨论和衡量不同系统的AGI能力。谷歌的DeepMind研究人员提出了6项关于“AGI框架”的定义原则。

基于这些原则,又提出了表现力和通用性两个维度的AGI技术框架,包含5个表现力等级(初级、熟练、专家、大师和超人)和通用详细等级划分。

论文地址:https://arxiv.org/abs/2311.02462

图片

谷歌研究人员表示,这一框架有助于指导AGI定义和风险评估,为技术研究指明了发展方向。期待学术界可以在此基础上开展后续研究,逐步完善AGI的量化框架和基准测试,以更准确地衡量AI的进步,并谨慎应对风险。

AGI简单介绍

AGI英文全称是Artificial General Intelligence,中文译为通用人工智能。AGI是指在任何任务上,AI都可以像人类一样表现出高度适应性和灵活性,高效率地完成指定任务。

当前的AI通常被设计为在特定的任务或问题范围内表现出色,而AGI能够跨领域学习、理解、推理并应用所学知识。

ChatGPT已经具备初级AGI功能,例如,它既能当情感伴侣与你聊天,也能查看邮件、生成创意文本/图片等,帮你处理日常工作。

图片

AGI的主要技术特征包括学习、推理、理解、感知、创造、通用学习、自我意识等重要能力。

学习能力:AGI应能够自主学习新任务,而无需针对每项任务的特殊编程。

推理能力:能够用拟人化的逻辑推理来解决复杂问题。

理解力:可以理解语言、概念、情感等,以及如何处理它们之间的关系。

感知能力:能够通过感官(例如,计算机视觉、语音识别)来感知这个世界。

创造力:能够创造性地解决问题,例如,生成图片、语音、视频等。

通用学习:能够将在一领域学到的知识,迁移到其他领域。

自我意识:理论上,AGI需具备记忆存储、历史查询的能力,让其拥有自我意识以提升工作效率。

图片

谷歌对于AGI则提出了6项更具体,有指导意义的原则,这有助于该技术以健康、安全的方式发展。

通用性和表现力

衡量一个AGI需要同时考量其通用性和表现力两个维度。通用性指能够处理任务的广度和多样性,表现力指在这些任务上达到的水平。

高通用性和表现力都对AGI意义重大且不可或缺。一个系统即使在很多任务上有出色表现,如果这些任务过于相似或局限,也难称为AGI。

反过来,一个极为通用的系统,如果所有任务的完成质量都很差,也与人类智能难以媲美。通用性和表现力必须同时达标,才可能成为AGI。谷歌对于这两个维度给出了详细的定义框架。

1)表现力

初级(Emerging)

要求与不熟练的人类差不多或略胜。对应狭窄AI中的早期专家系统,通用AI中的大型语言模型。

熟练(Competent)

要求超过50%熟练成人的表现。对应狭窄AI中的语音助手、VQA系统等。尚无通用AI达到。

专家(Expert)

要求超过90%熟练成人的表现。对应狭窄AI中的语法检查、图像生成模型等。尚无通用AI达到。

大师(Virtuoso)

要求超过99%熟练成人的表现。对应狭窄AI中的围棋软件AlphaGo等。尚无通用AI达到。

超人(Superhuman)

要求超过100%人类的表现,做到人类根本无法企及的任务。对应狭窄AI中的AlphaFold蛋白结构预测等。

图片

2)通用性

狭窄AI(Narrow AI)

只能处理一小类特定的任务。不同表现力层次要求同上。

通用AI(General AI)

需要能处理广泛的认知任务,包括语言、逻辑、创造等大部分人类有能力的任务。

不同表现力层次对应的最低要求如下:

初级:各任务表现尚可,但大多数任务不佳。

熟练:大多数任务达到一般人中等水平。

专家:大多数任务超过90%人类表现。

大师:所有任务超过99%人类表现。

超人:所有任务超出人类极限。

关注能力而非机制

AGI的定义应该关注AI系统的能力,而不是实现这些能力的具体机制。例如,我们不应该要求AGI必须通过类似人脑的学习机制来实现其能力,也不应将AGI的定义建立在“强AI”这样主观意识方面的假设上。AGI的重点应是评估其可以完成的任务类型和效果。

这条原则的合理性在于,神经网络等当前主流技术的成功正是建立在不完全拟人的基础上。与人脑相比,它们有着完全不同的计算机构成和信息处理方式。

面向能力而非特定机制,既可以避免因为假设了不必要的实现条件而过早地限制AGI的定义,也可以忽略那些目前难以科学检验的主观意识属性,把讨论集中在较为客观和可操作的能力层面。

元认知能力

AGI的定义应该关注处理非物理世界的认知任务,而不是要求必须具备机器人那样的物理能力。元认知能力,如学习新技能的能力,也被认为是AGI达到高通用性的关键。

之所以这样,是因为目前在非物理领域如语言、视觉、推理等方面,AI系统取得的进展明显领先于具备实际移动操作能力的机器人。

将物理能力作为AGI的先决条件,显然过于苛刻。当然,长远来看,在物理世界获得经验可能会提升一些认知能力,但短期内应该关注AI已比较拔尖的认知能力。

关注潜力而非部署

谷歌认为,我们不应该要求一个系统必须被实际大规模部署,才能被认定为AGI。只要一个系统能够在受控环境下,通过标准测试展示完成某类别任务的能力,就可以认定它具备对应的AGI水平。

因为实际部署会带来很多技术之外的障碍,如法律监管、社会接受度等。把部署作为AGI的必要条件,让AGI的判定标准包含了太多非技术因素。我们应该关注AI系统的本质能力,而不是它的实际应用程度。

关于生态

用于衡量AGI的任务应具有生态效度,即与人类在现实生活中重视的任务尽可能接近。不应只关注那些易于量化但是与实际生活脱节的任务。

现有的许多AI基准测试过于简化,脱离实际场景,很难真正评估一个系统在复杂环境下协助人类的能力。

相反,我们需要设计更贴近真实世界,模拟人类活动的测试,以得到对AGI实际能力的准确评估。这需要我们跳出传统的思维定势,不仅追求易测量,也要追求对用户有意义。

关注通往AGI的路径,而非单一目标

谷歌认为,我们应该将AGI视为一个连续发展的过程,而不是一个固定的目标。需要设定AGI发展路径上的多个进展阶段,而不是只关注最终的AGI概念。

这种层次化和渐进的方法有助于我们理解和把控AGI的进展轨迹。不同层次也对应着不同的风险和对策。

如果只一味追求最终的AGI,很容易忽视进展过程中的重要问题。而一个循序渐进的多阶段框架,则支持我们在每一步都审慎地评估机遇和风险,以确保AI的健康发展。

本文素材来源谷歌论文,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1207641.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

图片转excel的三种方案(电脑、手机)

图片怎么转换成excel文件呢?用金鸣表格文字识别是最便捷、最佳的解决方案。也许有些同学会问,那我用手工也可以解决呀,干吗要用软件?这么想就不对了,手工做不但要做表格线,还要手工打字,非常麻烦,而且容易出错,特别是对于数字多的图片,更是要命,现在有金鸣识别就不用那么麻烦…

python读取excel,进行数据处理

一、准备python编译器 二、下载 pyexcel 库 pip install pyexcel-xls三、进行编码读取数据 import pyexcel# 读取Excel文件 成本中心字典 data pyexcel.get_array(file_name成本中心.xls)def hand():#打印数据#print(data)url f"INSERT INTO dst_base.sys_dict(p_…

efcore反向共工程,单元测试

1.安装efcore需要的nuget <PackageReference Include"Microsoft.EntityFrameworkCore" Version"6.0.24" /> <PackageReference Include"Microsoft.EntityFrameworkCore.SqlServer" Version"6.0.24" /> <PackageRefere…

评论:AlexNet和CaffeNet有何区别?

一、说明 在这个故事中&#xff0c;我们回顾了AlexNet和CaffeNet。AlexNet 是2012 年ILSVRC&#xff08;ImageNet 大规模视觉识别竞赛&#xff09;的获胜者&#xff0c;这是一项图像分类竞赛。而CaffeNet是AlexNet的单GPU版&#xff0c;因此&#xff0c;我们平时在普通电脑的Al…

Fortinet 聚焦核心业务增长领域,巩固网安市场领导地位,持续推动行业创新

近日&#xff0c;专注于推动网络与安全融合的全球网络安全领导者 Fortinet&#xff08;NASDAQ&#xff1a;FTNT&#xff09;发布第三季度财报。同期&#xff0c;Fortinet做出重大战略宣布&#xff0c;未来将重点聚焦高速增长的差异化市场。Fortinet 将紧紧围绕安全组网、Univer…

中馥集团双11当日发货销售额突破1000万!

昨日&#xff0c;中馥集团双十一当日发货销售额突破1000万&#xff0c;再创新高&#xff01;双十一大促期间&#xff0c;中馥集团全体上下通力合作&#xff0c;每场直播商品经层层筛选、严格评选的“名品”&#xff0c;既有优质精品文化酒&#xff0c;也有市场火爆的高端酱酒&a…

【java学习—十四】Class类(2)

文章目录 1. Class类2. Class类的常用方法3. 实例化Class类对象&#xff08;四种方法&#xff09; 1. Class类 在 Object 类中定义了以下的方法&#xff0c;此方法将被所有子类继承&#xff1a; public final Class getClass() 以上的方法返回值的类型是一个 Class 类&#xf…

vue2中使用Markdown编辑器

这里写自定义目录标题 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题&#xff0c;有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…

Linux必备基础命令,JAVA程序员必备

目录 一、了解基本的左侧栏什么意思​编辑 二、ls&#xff0c;ll&#xff08;list&#xff0c;查找目录内容) 三、cd(change directory&#xff0c;切换目录) 小技巧&#xff0c;我们在查找东西的时候&#xff0c;可以使用tab进行智能补全。 四、touch&#xff08;建立文件…

【运维】-- 在线网络工具

1、https://ping.pe/ 一个免费的在线网络工具&#xff0c;可以帮助您检测和分析IP地址的连接情况。 这是搬瓦工官方做的一个 ping 在线测试网站工具。比较适合测试短时间的 ping 统计&#xff0c;并且在网页上以图表形式统计显示出来。 PS&#xff1a; a、丢包会以红色显示出…

安卓:打包apk时出现Execution failed for task ‘:app:lintVitalRelease

Execution failed for task :lintVitalRelease 程序可以正常运行&#xff0c;但是打包apk的时候报Execution failed for task ‘:app:lintVitalRelease导致打包失败&#xff0c;原因是执行lintVitalRelease失败了&#xff0c;存在错误。解决办法&#xff1a;在app模块的build.…

R程序 示例4.3.2版本包 在centos进行编译部署

为了在CentOS上下载和编译R语言4.3.2包&#xff0c;可以按照以下步骤进行操作&#xff1a; 1.首先&#xff0c;需要安装一些必要的依赖项。可以使用以下命令安装它们&#xff1a; sudo yum install -y epel-release sudo yum install -y gcc gcc-c gcc-gfortran readline-dev…

任意注册漏洞

目录 一漏洞介绍 二实战演示 三漏洞修复 本文由掌控安全学院 - 小博 投稿 一漏洞介绍 1.未验证邮箱/手机号 情景&#xff1a;应用为了方便用户记录用户名&#xff0c;使用邮箱和手机号作为用户名&#xff08;因此很多应用在注册的时候就要求用户填写&#xff0c;多数时候…

gpt-4-vision-preview 识图

这些图片都是流行动画角色的插图。 第一张图片中的角色是一块穿着棕色方形裤子、红领带和白色衬衫的海绵&#xff0c;它站立着并露出开心的笑容。该角色在一个蓝色的背景前&#xff0c;显得非常兴奋和活泼。 第二张图片展示的是一只灰色的小老鼠&#xff0c;表情开心&#xf…

Android Studio的代码笔记--JSON解析学习2

JSON学习2 生成JSON解析JSON java解析json字符串和合成json字符串 json字符串 {"type":"getConfig","ip":"192.168.1.100"}使用 String ss groupJS("Config","192.168.1.100"); splitJS(ss);回显 I/lxh: group…

个人类型小程序已支持申请微信认证

小程序申请微信认证 政府、媒体、其他组织类型账号&#xff0c;必须通过微信认证验证主体身份。企业类型账号&#xff0c;可以根据需要确定是否申请微信认证。已认证账号可使用微信支付权限。 个人类型小程序已支持微信认证&#xff08;审核大约需要1-3个工作日&#xff09; …

黑客技术应该这么学!30天入门黑客

前言 前几天发布了一篇 网络安全&#xff08;黑客&#xff09;自学 没想到收到了许多人的私信想要学习网安黑客技术&#xff01;却不知道从哪里开始学起&#xff01;怎么学 今天给大家分享一下&#xff0c;很多人上来就说想学习黑客&#xff0c;但是连方向都没搞清楚就开始学习…

神通MPP数据库的跨库查询

神通MPP数据库的跨库查询 一. 简介二. 系统表三. 跨库查询语法1. 创建外部数据存储服务器2. 删除外部数据存储服务器3. 授予普通用户访问外部数据存储服务器权限4. 回收普通用户访问外部数据存储服务器权限5. 加密函数6. 访问外部数据存储服务器 ★ 四. 跨库查询&#xff1a;统…

MySQL中修改注释+报错1067错误时的解决方法

修改某字段的注释内容的mysql语句 ALTER TABLE consumption_table MODIFY COLUMN risk_level tinyint(1) NOT NULL DEFAULT 0 COMMENT 0-低 1-中 2-高;修改某字段的注释内容的mysql语句时报错1067的解决方法 首先执行MySQL语句&#xff1a;SET sql_mode ‘ALLOW_INVALID_DAT…