AI智能体的分级

news2024/11/15 13:51:36

技术的分级

人们往往通过对一个复杂的技术进行分级,明确性能、适用范围和价值,方便比较、选择和管理,提高使用效率,促进资源合理分配和技术改进和标准化。

比如,国际汽车工程师学会(SAE)定义了自动驾驶技术的六个等级(0到5级),描述了车辆自动化程度的不同阶段。这些等级详细规定了从完全人工驾驶,经过不同程度的人工辅助驾驶,到完全自动驾驶的过渡过程。

71f6910230f16fb11275afe61fd54359.png

图:国际汽车工程师学会的驾驶自动化分级

象自动驾驶技术这样的分级还使得制造商、监管机构和消费者可以更清晰地理解和衡量技术的能力和限制,更有助于技术普及和市场推广。

29e6f25120f927ee96059de3135fbaab.png

图:通过与驾驶自动化分级对应的驾驶场景,大众能够很好地理解技术和技术对世界和生活带来的影响


智能体的分类

AI的应用飞速发展。那么AI,特别是智能体(AI Agent)技术,是不是也可以分级?Dr. Yu Huang的《Levels of AI Agents: from Rules to Large Language Models》(https://arxiv.org/pdf/2405.06643)一文研讨了这个问题,列举了几种相关的分类方式:

1. 基于AI角色的分级 (Morris分级法)

在《Levels of AGI: Operationalizing Progress on the Path to AGI》 一文中,M R Morris, et. al. 从AI产品设计的视角,以AI类比人类现实生活中的角色,从毫无自主性的“工具(Tool)”角色,到“顾问(Consultant)”、 “合作者(Collaborator)”、“专家(Expert)”, 直至完全自主的"智能体(Agent)",将AI的自主性进行分级。

8bd20bd0659e121268a41522c6a63674.png

图:翻译自论文原文,并有编辑和删减

2. 基于AI承担职责的分级 (Li分级法)

Yuanchun Li, et.al. 则从智能体所承担的职责出发,对智能体进行了分析,发表在《Personal LLM Agents: Insights and Survey about the Capability, Efficiency and Security》一文。

在各级系统中,人类和AI分担不同的职责。级别越高,AI承担更多的职责。

480526817acfca88a1d1cc292237a8ea.png

398c8f6d3f97e53851b9818ecf0747d1.png

图:翻译自论文原文,并有编辑和删减

3. 基于AI功能的分级(Huang分级法)

在他的文章中,Yu Huang也提出了基于AI的功能的分级方法。

1f67419aac8ecf11a0739595844b1e42.png图:翻译自论文原文,并有编辑和删减

可以看到,随着级别的提升,AI具有越来越多的功能。

思考和总结

采用以上对智能体的分级,有助于我们在对特定AI应用进行分析的过程中,为我们解构和剖析提供了一定的方法论。

应用Morris方法论,当前智能体技术应该是在L3的早期,AI主要是人类的copilot,人类和AI的互动有趋向于平等的趋势,但人类仍然在主导几乎所有活动,智能体的自主性还非常有限。

现在的智能体技术(比如MemGPT等工具)已经具备了对情景的感知和记忆的能力,而在Li分类法里,这被认为是非常高阶的能力(L4)。现在的智能体框架软件如AutoGen和CrewAI等已经支持了多智能体之间的协作,这在Huang分类法里是被认为是最高级(L5)智能体才具备的能力。

因此,应用Li分级法和Huang方法,则Agent已经部分到达L4和L5了。

相对于自动驾驶的分级体系,当前的智能体分级方法似乎难以量化回答“当前智能体技术处在哪一级”的问题,标准相对模糊。这是因为“自动驾驶”是一个相对明确的场景,而智能体的应用场景并没有给定的原因。

总体来看,Morris分级法的实用性似乎更强一些。我们期待有更好的分级方法出现。

部分参考资料

  • M R Morris, J Sohl-dickstein, N Fiedel, et al., Levels of AGI: Operationalizing Progress on the Path to AGI, arXiv 2311.02462, 2023

  • Yuanchun Li, et.al. Personal LLM Ai的gents: Insights and Survey about the Capability, Efficiency and Security,05.08.2024

  • Yu Huang, Levels of AI Agents: from Rules to Large Language Models, https://arxiv.org/pdf/2405.06643

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1813077.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CANOpen转PROFINET网关连接低压伺服系统

在现代工业自动化领域,随着技术的不断进步,各种总线通讯协议之间的转换和互操作性变得越来越重要。CANOpen和PROFINET作为两种广泛应用的通讯协议,各自具有独特的优势和应用场景。然而,在实际应用中,往往需要将CANOpen…

python使用wkhtmltopdf将html字符串保存pdf,解决出现方框的问题

出现的问题: 解决办法: <html> <head><meta charset="UTF-8"/> </head> <style> * {font-family: Arial,SimSun !important; } </style> </html>在html字符串前面加上上面代码,意思是设置字体编码和样式 html示例:…

vue2前置路由守卫中使用this.$store.state报错解决

1、问题描述&#xff1a;在前置路由守卫逻辑中&#xff0c;要更改vuex中的store的state状态&#xff0c;使用常规的this.$store.state报错 2、问题原因&#xff1a; 在vue2是vueRouter前置路由守卫中&#xff0c;this关键字并不会指向vue实例&#xff0c;因此不能使用this.$st…

如何优雅的实现Excel导入通用处理流程

目录 1.业务背景2.业务导入流程3.流程优化3.1 模板模式3.1.1 导入处理器接口ImportProcessor3.1.2 抽象父类 AbstractImportProcessor3.1.3 子类实现 ImportDemoProcessor 3.2 工厂模式3.2.1 标识子类的枚举ImportTypeEnum3.2.2 工厂类ProcessorHolder3.2.3 工厂类的调用 4. 特…

纹理贴图必须要输入顶点坐标或纹理坐标吗

最近知识星球的一位同学,面试时被问到:纹理贴图必须要输入顶点坐标或纹理坐标吗? 他一下子被这个问题问蒙了,虽然他知道正确答案是否定的,但是说不上来理由。 这个就引出了文本提到的全屏三角形,它不需要顶点缓冲区,而是利用顶点着色器直接生成所需的顶点坐标和纹理坐标…

【CTS】android CTS测试

android CTS测试 1.硬件准备2. 软件准备3. 下载 CTS3.1 cts3.2 解压 CTS 包&#xff1a; 4 配置adb fastboot5 检查 Java 版本6 安装aapt26.1 下载并安装 Android SDK6.2 找到 aapt2 工具6.3 配置环境变量 7. 准备测试设备8. 运行 CTS 测试8.1 启动 CTS&#xff1a; 9. 查看测试…

DDD架构和微服务初步实现

本次记录的是微服务的初步认识和DDD架构的初步实现和思路&#xff0c;在之前的发布里&#xff0c;对Javaweb进行了一次小总结&#xff0c;还有一些东西&#xff0c;不去详细理解说明了&#xff0c;下面开始我对微服务的理解。 什么是微服务&#xff1f; 在刚刚开始学习的时候…

【让AI写高考AI话题作文】看各大模型的回答

文章目录 命题chatGPT问题的消失&#xff0c;思考的萎缩 通义千问标题&#xff1a;在信息洪流中寻找智慧之光 文心一言探寻未知&#xff0c;拥抱无限的问题 命题 阅读下面的材料&#xff0c;根据要求写作。&#xff08;60分&#xff09; 随着互联网的普及、人工智能的应用&am…

快速锁定Bug!掌握Wireshark等抓包技术,提升测试效率

前言 相信做了测试一段时间的小伙伴都会开始意识到抓包对于测试的重要性&#xff0c;它涉及到功能测试、性能测试、自动化测试、安全测试和数据库测试等等。可以说我们要想做好测试就必须和抓包打交道&#xff0c;脱离抓包的测试是不合格的。人们都说黑客利用Wireshark等抓包工…

未来校园的新质生产力:南京江北新区浦口外国语学校校园网升级改造的启示

作者:南京江北新区浦口外国语学校 校长助理 杨美玲 导语:在南京江北新区(第十三个国家级新区),浦口外国语学校,这所拥有77605平方米宽阔校园、169个班级、7335名学生和511位专任教师的九年一贯制公办外语特色学校,正以前所未有的活力和智慧,迎接信息化时代的挑战。作为学校信息…

【JMeter接口测试工具】第二节.JMeter基本功能介绍(下)【进阶篇】

文章目录 前言八、Jmeter常用逻辑控制器 8.1 如果&#xff08;if&#xff09;控制器 8.2 循环控制器 8.3 ForEach控制器九、Jmeter关联 9.1 正则表达式提取器 9.2 xpath提取器 9.3 JSON提取器十、跨越线程组传值 10.1 高并发 10.2 高频…

1996-2023年各省农林牧渔总产值数据(无缺失)

1996-2023年各省农林牧渔总产值数据&#xff08;无缺失&#xff09; 1、 时间&#xff1a;1996-2023年 2、 来源&#xff1a;国家统计局、统计年鉴 3、 指标&#xff1a;农林牧渔总产值 4、 范围&#xff1a;31省 5、 缺失情况&#xff1a;无缺失 6、 指标解释&…

韩顺平0基础学java——第20天

p407-429 接口 一个类可以实现多个接口&#xff08;电脑上可以有很多插口&#xff09; class computer IB&#xff0c;IC{} 接口中的属性只能是final&#xff0c;并且是public static final 接口不能继承其他类&#xff0c;但是可以继承多个别的接口 interface ID extends I…

【PX4-AutoPilot教程-TIPS】离线安装Flight Review PX4日志分析工具

离线安装Flight Review PX4日志分析工具 安装方法 安装方法 使用Flight Review在线分析日志&#xff0c;有时会因为网络原因无法使用。 使用离线安装的方式使用Flight Review&#xff0c;可以在无需网络的情况下使用Flight Review网页。 安装环境依赖。 sudo apt-get insta…

Rust基础学习-标准库

栈和堆是我们Rust代码在运行时可以使用的内存部分。Rust是一种内存安全的编程语言。为了确保Rust是内存安全的&#xff0c;它引入了所有权、引用和借用等概念。要理解这些概念&#xff0c;我们必须首先了解如何在栈和堆中分配和释放内存。 栈 栈可以被看作一堆书。当我们添加更…

数据库错误[ERR] 1071 - Specified key was too long; max key length is 1000 bytes

环境&#xff1a;phpstudy的mysql8 索引长度问题&#xff1a; 试了很多解决办法&#xff0c;例如需改配置&#xff1a; set global innodb_large_prefixON; set global innodb_file_formatBARRACUDA; 试了还是有问题&#xff0c;直接启动不了了。因为mysql8取消了这个配置。…

Linux操作系统学习:day02

内容来自&#xff1a;Linux介绍 视频推荐&#xff1a;[Linux基础入门教程-linux命令-vim-gcc/g -动态库/静态库 -makefile-gdb调试]( day02 5、Linux目录结构 操作系统文件结构的开始&#xff0c;只有一个单独的顶级目录结构&#xff0c;叫做根目录。所有一切都从“根”开始…

DHCP原理与配置(Linux)

目录 DHCP概念 使用DHCP的好处 DHCP的分配方式 DHCP租约过程 租约过程分4个步骤&#xff08;全过程广播&#xff09; 1. 客户机请求IP&#xff08;Discover&#xff1a;发现&#xff1b;客户端广播 发送一个数据包&#xff0c;其他主机也能接收到&#xff0c;如果是没有安…

34.打印K型

上海市计算机学会竞赛平台 | YACSYACS 是由上海市计算机学会于2019年发起的活动,旨在激发青少年对学习人工智能与算法设计的热情与兴趣,提升青少年科学素养,引导青少年投身创新发现和科研实践活动。https://www.iai.sh.cn/problem/76 题目描述 小爱想用 * 打出一个大写的 K。…

边缘计算采集网关解决方案:为企业提供高效、灵活的数据处理方案-天拓四方

一、企业背景 某大型制造企业&#xff0c;位于国内某经济发达的工业园区内&#xff0c;拥有多个生产线和智能化设备&#xff0c;致力于提高生产效率、降低运营成本。随着企业规模的扩大和生产自动化的推进&#xff0c;该企业面临着海量数据处理、实时响应和网络安全等多重挑战…