代理型人工智能系统 萨曼莎 贾维斯的定义,谁开发 谁部署 谁用 出了问题谁负责 是怎样炼成的?

news2025/3/2 13:50:16

定义:Agenticness, Agentic AI Systems, and “Agents”

agnet(名词) n.代理人
agentic(形容词) adj.代理的
agenticness(+ness变名词) n.代理

  1. 代理型人工智能系统的特点是能够在没有事先指定行为的情况下,在很长一段时间内持续采取有助于实现目标的行动。
  2. 在文化想象中,人工智能代理是为用户完成任意任务的助手,就像《她》中的萨曼莎或《2001太空漫游》中的HAL 9000。它与GPT4没有明确的界线,只是GPT4目前只能完成有限的现实任务(在某些方面出奇的博学和聪明)。
  3. 人工智能系统的代理性最好理解为涉及多个维度,我们预计该领域将沿着每个维度继续发展
  4. 在有限的直接监督下,系统在复杂环境中实现复杂目标的适应性程度。
  5. 带我追上太阳,给我摘下月亮,给AI的目标到底能有多复杂?可以直接回答我做不到,我只给开车送你去发射台,告诉你方法。
    在这里插入图片描述
    我们通常将agentic AI系统概念化为在追求人类定义的目标并在人类确定的环境中运作(并且通常与人类“队友”合作),而不是完全自主设定目标的系统。我们所定义的主动性也并不与物理性质挂钩(即许多数字系统在上述意义上比大多数机器人更具主动性),但某些具有物理后果的“独立执行”(例如在无人驾驶汽车中)可能会在特定应用中增加主动性的风险和机遇。最后,主动性在概念上与AI系统在给定任务上的表现水平或其能力的通用性不同,尽管在表现和通用性上的提升可能会“解锁”系统在某些情境中作为代理人的能力。

人类参与者在AI代理生命周期中的角色

  1. 模型开发者(Model Developer):负责开发AI模型,这个模型是整个代理系统的核心。模型开发者决定了系统的基本能力和行为方式。

  2. 系统部署者(System Deployer):在模型的基础上构建并运行更大的系统。系统部署者负责实现模型的应用,如提供用户界面,连接到其他工具,或者为特定用途定制AI系统。

  3. 用户(User):是使用特定AI代理系统的个体或组织。用户启动系统,并提供AI代理应该追求的具体目标。

在AI代理的生命周期中,这些角色可能会有所重叠。例如,同一公司可能既是模型的开发者,也是通过API部署该模型的系统部署者。此外,有时多个实体可能共同承担某个角色,如一个公司训练了一个模型,另一个公司对其进行了针对特定应用的微调。

这些角色在AI代理系统的设计、开发、部署和使用过程中起着至关重要的作用,它们的互动和协作对于确保系统的有效性和安全性至关重要。

Agentic AI Systems的潜在益处

  1. 代理功能越越好
  2. 影响力倍增器:在社会中促进AI的更广泛和有益的应用

代理作为一种有用的属性

  1. AI系统变得更有益的程度与它们的主动性的程度成正比。
  2. AI系统变得更有益的条件是它们被安全地设计,且适当的安全和责任最佳实践被应用。
  3. 高质量和更可靠的输出
  4. 更高效的节省用户的时间
  5. 改进用户交互体验:用自然语言交互比在设置中找相应的选项更容易。
  6. 可扩展性

代理作为影响力倍增器

核心是讨论AI系统中"主体性"(agenticness)的重要性。"主体性"在这里指的是AI的能力和自主性。文章指出,除了分析特定AI系统中的"主体性"对社会影响的意义外,我们还可以将"主体性"视为AI普及带来的更广泛系统性影响的前提条件。这些影响中有很多都有可能对社会产生重大益处。简而言之,作者强调了理解和评估AI的"主体性"在评估其广泛的社会影响时的重要性。

就代理性作为这种扩散的定义上或实际上的前提而言,代理性的影响可能与人工智能的影响密切相关。从这个意义上说,一般来讲,随着代理性的增加,人工智能的影响可能会更加频繁、更加明显,并且发生得更早,这使得代理性成为整个人工智能领域的‘影响倍增器’。

代理性越强,影响力越大。

有时候,在讨论当前或未来的人工智能能力时,人们会隐含地假设有代理性。OpenAI的宪章将人工通用智能(AGI)定义为‘在大多数经济价值工作中胜过人类的高度自主系统’,而像Russell和Norvig的《人工智能:一种现代方法》这样的经典教科书在其对人工智能的构想中强调了代理性。鉴于这些考虑,我们简要回顾了作为一个整体技术领域,人工智能普遍预期的几个影响。

即使没有在代理性方面的显著进步,人工智能很可能已经构成了一种通用技术。从历史上看,像蒸汽机和电力这样的通用技术的广泛应用随时间显著提高了全球的生活标准(尽管也给许多人带来了重大的伤害,特别是对那些在这些时期生活的较不强大或不太有特权的群体)。广泛部署的高能力和具有代理性的人工智能系统甚至可能极大地提高经济生产力,从根本上改变工作的性质,可能并且更加投机地促使一个“休闲社会”或“后工作”世界的出现,尽管这并不是必然的,并且会带来风险[16]。此外,人工智能可能加速推动各种非经济指标的社会福祉进展,如那些被囊括在可持续发展目标中的指标,并通过加速科学进步和理解。某些人期望从人工智能中获得的经济和其他生产力增长可能会更大,这在一定程度上取决于具有代理性的人工智能系统能够自主采取行动。

保持自主人工智能系统安全和可问责的实践方法

在下文中,我们建议不同方采取一系列实践,以确保自主AI系统的安全运作,并符合用户的意图,在发生伤害时创建问责制。当这些实践一起实施时,本节概述的实践旨在提供一种“深度防御”方法来减轻来自自主AI系统的风险。尽管今天许多这些实践以某种形式被采用,我们强调了围绕它们应如何操作化的许多未决问题。我们还讨论了随着AI系统变得更加自主,可能需要采取额外的预防措施。我们强调,仅这些实践本身不足以完全减轻当今AI系统的风险,更不用说减轻先进AI带来的灾难性风险。例如,下面的原则中没有一个涵盖了确保代理的网络安全性的方法,以防止它们被攻击者劫持,尽管我们预计这将是一个需要新实践的重大挑战。这里讨论的实践旨在作为方法和相关考虑的初步概述。

(AI系统自身如何防止补攻击或利用?)

我们避免讨论在构建能力强大且符合用户需求的主动式人工智能系统方面应使用的技术最佳实践。这些都是快速发展的领域,实践也在迅速变化,因此我们不期望这些领域能在短期内就如何保证特定人工智能能力或用户一致性方面达成“最佳实践”。此外,预测人工智能模型在给定训练选择下的能力/用户一致性所需的科学基础还处于初级阶段[18]。这意味着目前模型开发者无法确定性地保证模型对下游系统部署者和用户的预期行为。有一些例外,例如完全排除训练样本数据将意味着模型无法重复它。尽管如此,鉴于模型行为可以预先限定的程度有限,我们将专注于设计一套与特定模型的训练方法无关的最佳实践集。

评估适合任务的能力

限制行动空间并要求批准

设置代理的默认行为

代理行为的清晰可辨性

代理行为的可读性

自动监视

归因

如果在用户或系统部署人员的层面上防止有意或无意的伤害是不可行的(例如,犯罪分子操作AI代理来欺骗第三方),那么仍然有可能通过让用户追踪到他们身上来阻止伤害。

中断和维护控制

间接影响

除了单个人工智能系统的直接影响外,许多不同人工智能系统的使用以及社会对其使用的反应也会产生间接影响。正如我们很难预料到以前的通用技术(如电力和计算机)所带来的全面的社会调整一样,我们应该“预料到意想不到的事情”。尽管如此,我们确实认为,人工智能系统有几类间接影响可能需要社会积极缓解,我们在下面列出了这些影响。

采用竞赛

考虑到代理在竞争环境中可能赋予的优势,例如私营公司或政府之间的竞争,竞争对手可能会面临巨大的压力,在没有适当审查这些系统的可靠性和可信度的情况下采用代理AI系统。
推动这种过早依赖的一个关键观察是,人工智能系统平均而言可能会在一项任务上取得成功,而在罕见但重要的情况下却不可靠,这些情况可能会被竞争对手在压力下错过或忽视

劳动力置换和差异化采用率

与静态人工智能系统相比,动态人工智能系统似乎可能对工人、工作和生产力产生更实质性的影响。传统的人工智能系统在一些常规工作上表现出色,但增加代理可以扩展人工智能辅助或自动化的“常规”任务(例如适应意外情况、收集相关背景和根据用户偏好进行校准)。

改变攻防平衡

有些任务可能比其他任务更容易被人工智能系统自动化。这种不对称可能会破坏当前许多隐含的假设,这些假设是我们社会中减轻伤害平衡的基础(称为“进攻-防御平衡”),后果不明确。

相关的错误

人工智能系统可能会带来意想不到的故障模式,当大量人工智能系统同时故障或以相同的方式故障时,会产生特殊的风险。这些相关的错误可能是由于“算法单一文化”造成的:使用相同或类似算法和数据训练的人工智能系统可能会以类似的方式出现故障。

结论 Conclusion

采取措施确保它们安全可靠地工作,并减轻与代理采用相关的更大间接风险。我们希望学者和从业者共同努力,确定谁应该负责使用哪些实践,以及如何使这些实践对广泛的行动者可靠且负担得起。对这些最佳实践达成一致意见也不太可能是一次性努力。如果人工智能能力持续快速进步,社会可能需要反复就每一个更有能力的人工智能系统类别达成新的最佳实践协议,以便激励快速采用解决这些系统更大风险的新实践。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1329442.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

选择移动订货系统源码的四大原因

移动订货系统需要选择源码支持的厂家,有以下四个原因,其中第四个是比较重要的,大家点个关注点个赞,我们接着往下看。 1.可自行定制:支持源码的移动订货系统可以根据企业的具体需求进行定制开发,满足企业特定…

【Midjourney】Midjourney根据prompt提示词生成人物图片

目录 🍇🍇Midjourney是什么? 🍉🍉Midjourney怎么用? 🔔🔔Midjourney提示词格式 Midjourney生成任务示例 例1——航空客舱与乘客 prompt prompt翻译 生成效果 大图展示 细节大…

Java整合APNS推送消息-IOS-APP(基于.p12推送证书)

推送整体流程 1.在开发者中心申请对应的证书(我用的是.p12文件) 2.苹果手机用户注册到APNS,APNS将注册的token返回给APP(服务端接收使用)。 3.后台服务连接APNS,获取连接对象 4.后台服务构建消息载体 5.后台…

FreeRTOS之队列集操作(实践)

多个任务在在同一队列中传递的同一种数据类型,而队列集能够在任务之间传递不同的数据类型。 配置流程:(更详细流程参考正点原子的教程) 1、启用队列集将configUSE_QUEUE_SETA置1) 2、创建队列集 3、创建队列或信号…

openGauss学习笔记-169 openGauss 数据库运维-备份与恢复-导入数据-更新表中数据-使用DML命令更新表

文章目录 openGauss学习笔记-169 openGauss 数据库运维-备份与恢复-导入数据-更新表中数据-使用DML命令更新表169.1 操作步骤 openGauss学习笔记-169 openGauss 数据库运维-备份与恢复-导入数据-更新表中数据-使用DML命令更新表 openGauss支持标准的数据库操作语言&#xff08…

【Java JMM】编译和优化

1 前端编译 在 Java 技术下, “编译期” 是一个比较含糊的表述, 因为它可能指的是 前端编译器 (“编译器的前端” 更准确一些) 把 *.java 文件转变成 *.class 文件的过程Java 虚拟机的即时编译器 (常称 JIT 编译器, Just In Time Compiler) 运行期把字节码转变成本地机器码的过…

基于Java+Swing大鱼吃小鱼(期末95分以上)

基于JavaSwing大鱼吃小鱼 一、系统介绍二、效果展示1.视频演示2.运行效果 三、其他系统实现四、获取源码 一、系统介绍 1.GWindow类:窗口的绘制,继承JFrame类,其主要设置的内容有: 窗口的相关信息:宽度、…

React学习计划-React16--React基础(二)组件与组件的3大核心属性state、props、ref和事件处理

1. 组件 函数式组件&#xff08;适用于【简单组件】的定义&#xff09; 示例&#xff1a; 执行了ReactDOM.render(<MyComponent/>, ...)之后执行了什么&#xff1f; React解析组件标签&#xff0c;找到了MyComponent组件发现组件是使用函数定义的&#xff0c;随后调用该…

嘉康利新品VIVIX软糖面世中国

中国区总经理登台演绎劲舞“科目三”&#xff0c;你敢想&#xff1f;嘉康利中国总经理冉永夫再一次用惊艳众人的创意打破了你的认知。 这一幕发生在12月10日在苏州国际博览中心举办的嘉康利新产品发布盛典上。盛典开场&#xff0c;冉永夫便领衔经销商和专业舞者&#xff0c;用一…

EfficientDet:Scalable and Efficient Object Detection中文版 (BiFPN)

EfficientDet: Scalable and Efficient Object Detection EfficientDet&#xff1a;可扩展和高效的目标检测 摘要 模型效率在计算机视觉中变得越来越重要。本文系统地研究了用于目标检测的神经网络架构设计选择&#xff0c;并提出了几个关键的优化方法来提高效率。首先&…

教你在Linux上安装Node并用Electron打包deb和rpm包

Windows下无法打linux版本的包&#xff0c;如果你要打linux系统的amd64架构需要找一台linux amd64的系统打包&#xff0c;也可以在amd64下打arm架构的包&#xff0c;但是不能运行&#xff0c;需要放到arm架构的系统里才能运行。 下载linux的node环境 Index of /nodejs-releas…

Leetcode 134 加油站

题意理解&#xff1a; 给定n个站点&#xff0c;两个数组gas表达每个站点可加的油量&#xff0c;cost表达到下一站点所需耗费的油量。 gas [1,2,3,4,5], cost [3,4,5,1,2] 要求从下表为i的站点开始&#xff0c;刚好能支撑汽车在每个站点转一圈后回到出发位置。 解题思路&#…

Deployment Controller详解(上)

上一篇在《Kubectl 部署无状态应用》中介绍了如何使用 Deployment 部署五个 hello world 实例时&#xff0c;我们并没有详细探讨 Deployment Controller 的各项功能。因此&#xff0c;本文将深入介绍 Deployment Controller 的作用以及它能够完成的任务。 本文来自官方文档梳理…

CAS机制

Java中提供了很多原子操作类来保证共享变量操作的原子性。这些原子操作的底层原理都是使用了CAS机制。在使用一门技术之前&#xff0c;了解这个技术的底层原理是非常重要的&#xff0c;所以本篇文章就先来讲讲什么是CAS机制&#xff0c;CAS机制存在的一些问题以及在Java中怎么使…

浅谈测试自动化selenium之POM模式

基于本人也是一个初学者&#xff0c;在运用POM模式的时候记录一下自己的学习笔记。 如果你是大神&#xff0c;那么可以略过&#xff0c;如果你是初学者&#xff0c;希望对你有帮助。 本文阐述了以下几个问题&#xff1a; 什么叫POM模式 为什么要用POM模式 POM模式的思想 POM模…

前端案例—antdDesign的Select多选框组件加上全选功能

前端案例—antdDesign的Select多选框组件加上全选功能。 实现效果如下&#xff1a; Select 组件里有这个属性&#xff0c;可以利用这个对下拉菜单进行自定义。 const handleChange (e, value) > {setSelectState(e.target.checked)let arr productOptions?productOption…

AI绘画中CLIP文本-图像预训练模型

介绍 OpenAI 在 2021 年提出了 CLIP&#xff08;Contrastive Language–Image Pretraining&#xff09;算法&#xff0c;这是一个先进的机器学习模型&#xff0c;旨在理解和解释图像和文本之间的关系。CLIP 的核心思想是通过大规模的图像和文本对进行训练&#xff0c;学习图像…

口碑好的国产主食冻干猫粮品牌有哪些?盘点十大放心猫粮国产名单

冻干猫粮可以帮助猫咪摄入更多的水分&#xff0c;因为冻干是高蛋白质的食物&#xff0c;当猫咪吃了冻干猫粮后&#xff0c;会感到口渴&#xff0c;从而更主动地去喝水。对于那些不喜欢喝水的猫咪&#xff0c;可以将冻干复水后再喂给它们&#xff0c;这样也可以增加猫咪的水分摄…

Keil5软件仿真 定时器互补通道 波形输出(Logic Analyzer)

步骤一&#xff1a;管脚配置确认。 ①配置定时器的管脚模式为复用推挽输出模式&#xff08;GPIO_MODE_AF_PP&#xff09;&#xff01;&#xff01;&#xff01;&#xff0c;注意&#xff1a;复用开漏模式软件仿真时无波形。 步骤二&#xff1a;编译程序。 ①点击编译按钮。 …

【泛型中K T V E? Object等分别代表什么含 义】

✅ 泛型中K T V E? Object等分别代表什么含义 ✅ 典型解析✅代码示例 ✅ 典型解析 E - Element (在集合中使用&#xff0c;因为集合中存放的是元素) T-Type (Java 类) K- Key (键) V - Value (值) N - Number (数值类型) ? - 表示不确定的iava类型 (无限制通配符类型) …