科技云报到:AI Agent打了个响指,商业齿轮加速转动

news2025/3/27 10:05:15

科技云报到原创。


3月16日,百度旗下文心大模型4.5和文心大模型X1正式发布。目前,两款模型已在文心一言官网上线,免费向用户开放。

同时,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API;文心大模型X1也即将在千帆上线。

无独有偶,OpenAI宣布GPT-4.5/5将很快陆续发布,且免费版ChatGPT将在标准智能设置下无限制使用GPT-5进行对话。不仅如此,字节跳动、阿里云等企业也纷纷下调旗下大模型产品价格。

降价和免费时代的来临无疑将加速AI技术的普及和应用落地,越来越多的企业和开发者开始尝试将AI技术应用到各个领域,从而催生出大量创新应用和商业模式,AI Agent(智能体)就是其中之一。

近日,AI智能体企业Manus AI表示,7天来,Manus使用申请等候名单增加到两百万人。3月12日,OpenAI正式发布了一系列全新的Agent(智能体)开发组件,旨在通过自动化工具和标准化接口降低开发门槛,显著缩短智能体应用的开发周期。

这一系列围绕智能体的技术发布,从侧面说明AI智能体目前已经达到了爆发的临界点。伴随各大科技公司在智能体领域不断加码,2025年有望成为真正的AI智能体商业爆发元年。

想象一下,未来只需简单一个指令,智能体便能领悟并执行复杂的任务;它们还能通过视觉捕捉用户的表情和动作,判断其情绪状态。这不再是好莱坞科幻电影中的场景,而是正逐步走进现实的AI智能体时代。

早在2023年11月,微软创始人比尔·盖茨就发文表示,智能体不仅会改变每个人与计算机交互的方式,还将颠覆软件行业,带来自我们从键入命令到点击图标以来最大的计算革命。OpenAI首席执行官山姆·奥特曼也曾在多个场合表示:构建庞大AI模型的时代已经结束,AI智能体才是未来的真正挑战。

类比智能电动汽车,犹如其在新能源技术应用和里程焦虑之间寻找到某种平衡的增程路线一样,AI智能体让人工智能进入了“增程模式”,在AI技术和行业应用之间尽可能达成新的平衡。


被看好的AI智能体

作为人工智能领域的一个重要概念,学术界和产业界对AI智能体提出了各种定义。大致来说,一个AI智能体应具备类似人类的思考和规划能力,并具备一定的技能以便与环境和人类进行交互,完成特定的任务。

或许把AI智能体类比成计算机环境中的数字人,我们会更好理解——数字人的大脑就是大语言模型或是人工智能算法,能够处理信息、在实时交互中做出决策;感知模块就相当于眼睛、耳朵等感官,用来获得文本、声音、图像等不同环境状态的信息;记忆和检索模块则像神经元,用来存储经验、辅助决策;行动执行模块则是四肢,用来执行大脑做出的决策。

长久以来,人类一直在追求更加“类人”甚至“超人”的人工智能,而智能体被认为是实现这一追求的有效手段。近些年,随着大数据和计算能力的提升,各种深度学习大模型得到了迅猛发展。这为开发新一代AI智能体提供了巨大支撑,并在实践中取得了较为显著的进展。

比如,谷歌DeepMind人工智能系统展示了用于机器人的AI智能体“RoboCat”;亚马逊云科技推出了Amazon Bedrock智能体,可以自动分解企业AI应用开发任务等等。Bedrock中的智能体能够理解目标、制定计划并采取行动。新的记忆保留功能允许智能体随时间记住并从互动中学习,实现更复杂、更长期运行和更具适应性的任务。

这些AI智能体的核心是人工智能算法,包括机器学习、深度学习、强化学习、人工神经网络等技术。通过这些算法,AI智能体可以从大量数据中学习并改进自身的性能,不断优化自己的决策和行为,还可以根据环境变化做出灵活地调整,适应不同场景和任务。

目前,AI智能体已在不少场景中得到应用,如客服、编程、内容创作、知识获取、财务、手机助手、工业制造等。AI智能体的出现,标志着人工智能从简单的规则匹配和计算模拟向更高级别的自主智能迈进,促进了生产效率的提升和生产方式的变革,开辟了人们认识和改造世界的新境界。

随着以通信、感知、计算为一体的“通感算”网络的构建,未来包括智能汽车、机器人、无人机、低空飞行器等在内的更广泛AI智能体将以前所未有的规模实现接入,通过将各类智能体互联互通,不断扩张单一智能体的能力边界,并借助多智能体的智慧涌现,实现智能体的大规模、高效协作与交互,从而完成从单体智能向群体智能的跃迁。


AI应用技术趋势的底层逻辑

随着大模型技术的落地带来的成本降低,使得自动化的智能技术正在成为核心方向,大模型的产品形态形成了从Chatbot到Copilot再到智能体的趋势和方向。

在此背景下,AI应用技术的三大底层逻辑正在浮现。

第一重底层逻辑是从智能体到AGI。对比在移动互联网时代奠定的App生态,当前需要在AI时代奠定一个AGI应用生态。从智能体发展看,人类在逐步强化程序的自动化、智能化程度,在智能体的尝试中,应用厂商结合深度学习等算法、知识图谱、RPA等技术实现了部分的自动化,其核心是在存量知识的基础上,实现由程序自主解决部分问题。

随着基础模型能力的进一步提升,智能体在任务规划中的灵活性,在知识吸收运用的效率方面的上限或将进一步提升。在当前的基础模型能力下,若将智能体与工作流进一步结合,在工作流程中嵌入AI实现部分问题的智能+自动化解决,智能体实用性或将进一步改善,商业化或将进一步加速。

第二重底层逻辑是大语言模型推动智能体进入新阶段。AI智能体经历了从符号智能体、反应智能体,到基于强化学习的智能体、具有迁移学习和元学习的智能体,到基于大语言模型的智能体的阶段,智能体通过与外部环境之间的互动来提升自己的智能。

第三重底层逻辑是多路径共同提升智能体整体智能化水平。“大模型+智能体”是通向AGI的路径之一。智能体用来描述表现出智能行为并具有自主性、反应性、主动性和社交能力的人工实体,能够使用传感器感知周围环境、做出决策,然后使用执行器采取行动,具备以上特征的智能体是实现AGI的关键一步。


AI智能体爆发元年已至?

2025年是否真的会如业界预测的那样成为“AI智能体爆发元年”?

业内专家将人工智能发展类比自动驾驶技术的分级,划分为L1-L5五个阶段:聊天机器人、推理、智能体、创新者、组织者。

第一阶段聊天机器人已经实现了。第二个阶段就是现在的大模型推理能力,第三就是智能体。可以把智能体分成两大类,一类是生成内容的智能体。一类是进行操作的智能体。操作智能体,又可以分为在数字世界进行操作的智能体和在物理世界进行操作的智能体。第四是随着智能体不断发展,需要更多的创新。第五组织者主要是指大模型、智能体、创新者多了之后,需要用AI对社会的管理模式进行重新设计与协调。

按照上述5个阶段划分,目前基本上处于智能体与创新者这两个阶段的转换过程中。未来每个人可能在生活和工作中有多个智能体。比如随时监测个人健康的智能体,会定期将健康数据汇总并给出健康建议。点餐智能体不需要你向它发出点餐指令,就可以根据你的饮食规律以及分享健康监测智能体中的数据,自行安排何时需要点餐,当你想要吃饭时外卖已经在门口了。每个人还可以有多个数字人智能体,比如帮你处理日常事务的数字人。

2025年,AI最重要的几个发展方向现在已经比较清晰。一是继续推进通用人工智能(AGI),在预训练受限之后,后训练的潜力逐渐体现出来。二是智能体大发展,行业智能体将会风起云涌。三是VLA大模型和具身智能将会有大发展。四是多模态融合趋势将会更加明显。


潜在风险不容忽视

AI智能体通过模拟和扩展人类的认知能力,有望广泛应用于医疗、交通、金融及国防等多个领域。有学者推测,到2030年,人工智能将助推全球生产总值增长12%左右。

不过,在看到AI智能体飞速发展的同时,也要看到其面临的技术风险、伦理和隐私等问题。一群证券交易机器人通过高频买卖合约便在纳斯达克等证券交易所短暂地抹去了1万亿美元的价值,世界卫生组织使用的聊天机器人提供了过时的药品审核信息,美国一位资深律师没能判断出自己向法庭提供的历史案例文书竟然均由ChatGPT凭空捏造……这些真实发生的案例表明,AI智能体带来的隐患不容小觑。

因为AI智能体可以自主决策,又能通过与环境交互施加对物理世界的影响,其一旦失控将给人类社会带来极大威胁。哈佛大学教授齐特雷恩认为,这种不仅能与人交谈,还能在现实世界中行动的AI智能体,是“数字与模拟、比特与原子之间跨越血脑屏障的一步”,应当引起警觉。

首先,AI智能体在提供服务的过程中会收集大量数据,用户需要确保数据安全,防止隐私泄露。

其次,AI智能体的自主性越强,越有可能在复杂或未预见的情境中做出不可预测或不当的决策。AI智能体的运行逻辑可能使其在实现特定目标过程中出现有害偏差,其带来的安全隐患不容忽视。用更加通俗的话来说,就是在一些情况下,AI智能体可能只捕捉到目标的字面意思,没有理解目标的实质意思,从而做出了一些错误的行为。

再次,AI大语言模型本身具备的“黑箱”和“幻觉”问题也会增加出现操作异常的频率。还有一些“狡猾”的AI智能体能够成功规避现有的安全措施,相关专家指出,如果一个AI智能体足够先进,它就能够识别出自己正在接受测试。目前已经发现一些AI智能体能够识别安全测试并暂停不当行为,这将导致识别对人类危险算法的测试系统失效。

此外,由于目前并无有效的AI智能体退出机制,一些AI智能体被创造后可能无法被关闭。这些无法被停用的AI智能体,最终可能会在一个与最初启动它们时完全不同的环境中运行,彻底背离其最初用途。AI智能体也可能会以不可预见的方式相互作用,造成意外事故。

为此,人类目前需尽快从AI智能体开发生产、应用部署后的持续监管等方面全链条着手,及时制定相关法律法规,规范AI智能体行为,从而更好地预防AI智能体带来的风险、防止失控现象的发生。

展望未来,AI智能体有望成为下一代人工智能的关键载体,它将不仅改变我们与机器交互的方式,更有可能重塑整个社会的运作模式,正成为推动人工智能转化过程中的一道新齿轮。


【关于科技云报到】

企业级IT领域Top10新媒体。聚焦云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。原创文章和视频获工信部权威认可,是世界人工智能大会、数博会、国家网安周、可信云大会与全球云计算等大型活动的官方指定传播媒体之一。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2318885.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【蓝桥杯python研究生组备赛】005 数学与简单DP

题目1 01背包 有 N 件物品和一个容量是 V 的背包。每件物品只能使用一次。 第 i 件物品的体积是 vi,价值是 wi。 求解将哪些物品装入背包,可使这些物品的总体积不超过背包容量,且总价值最大。 输出最大价值。 输入格式 第一行两个整数&a…

大白话读懂java对象创建的过程

1. java对象创建流程(大白话版) 咱们java对象被创建的过程大致如下,即: 在 JVM 中对象的创建,从⼀个 new 指令开始: 首先检查这个指令的参数是否能在常量池中定位到⼀个类的符号引用检查这个符号引用代表…

AI图像理解技术的演进

在CLIP等现代多模态模型出现之前,早期的图生文技术主要依赖人工标注的ImageNet等数据集,但其技术路线与当前方法存在本质差异。 一、传统图生文技术的标注依赖 ImageNet的核心地位 在2012-2020年间,ImageNet的1,400万张人工标注图像&#xff…

电脑节电模式怎么退出 分享5种解决方法

在使用电脑的过程中,许多用户为了节省电力,通常会选择开启电脑的节能模式。然而,在需要更高性能或进行图形密集型任务时,节能模式可能会限制系统的性能表现。这时,了解如何正确地关闭或调整节能设置就显得尤为重要了。…

【Java】——程序逻辑控制(构建稳健代码的基石)

🎁个人主页:User_芊芊君子 🎉欢迎大家点赞👍评论📝收藏⭐文章 🔍系列专栏:【Java】内容概括 文章目录: 一.顺序结构二.分支结构1.if 语句1.1 语法格式11.2 语法格式21.3 语法格式3 …

卫星互联网智慧杆:开启智能城市新时代​

哇哦!在当下这个数字化浪潮正以雷霆万钧之势席卷全球的超酷时代,智慧城市建设已然成为世界各国你追我赶、竞相发力的核心重点领域啦!而咱们的卫星互联网智慧杆,作为一项完美融合了卫星通信与物联网顶尖技术的创新结晶,…

Qt-QChart实现折线图

一、介绍场景 动态查看数据变化,或者了解数据发展趋势,让数据可以形象直观展现出来,这里推荐使用折线图的方式展现,本文抛砖引玉,简单实现一个实例,效果图如下: 二、实现步骤 1、charts组件 …

取消Win10锁屏界面上显示的天气、市场和广告的操作

要取消Win10锁屏界面上显示的天气、市场和广告,您可以按照以下步骤操作: 方法一:更改锁屏界面设置 打开“设置”: 点击“开始”菜单,然后点击齿轮状的“设置”图标。 进入“个性化”: 在“设置”窗口中&a…

从TouchDriver Pro到Touchdriver G1,Weart触觉手套全系解析:XR交互的“真实触感”如何实现?

Weart旗下的Touchdriver Pro触觉手套和Touchdriver G1触觉手套,凭借其技术创新,为用户带来了全新的触觉体验。Touchdriver Pro触觉手套通过多模态触觉反馈技术,提供力反馈、纹理渲染和温度提示,让用户在虚拟环境中感受到真实的触觉…

排序算法实现:插入排序与希尔排序

目录 一、引言 二、代码整体结构 三、宏定义与头文件 四、插入排序函数(Insertsort) 函数作用 代码要点分析 五、希尔排序函数(ShellSort) 函数作用 代码要点分析 六、打印数组函数(PrintSort&#x…

UDP协议原理

UDP协议原理 本篇介绍 在前面使用UDP编程时已经基本了解了UDP的工作模式,也知道了UDP有三个特点: 无连接不可靠面向数据报 但是当时并没有具体谈论为什么UDP有以上三个特点,基于这个原因,本篇就会针对这三个原因进行介绍 UDP…

EtherCAT转Modbus网关如何在倍福plc组态快速配置

EtherCAT转Modbus网关如何在倍福plc组态快速配置 在工业控制领域,EtherCAT和Modbus是两种常见的总线通信协议。EtherCAT以其高速的数据传输和灵活的网络配置被广泛应用于高性能自动化控制系统中,而Modbus则因其简单、稳定且兼容性强而被许多设备所支持。…

DooTask在Linux的离线部署教程

DooTask在Linux的离线部署教程 下载安装包 从网盘中将安装包下载到本地,下载地址 通过网盘分享的文件:DooTask项目管理工具 链接: https://pan.baidu.com/s/1hGmLXonT4c8hLiDP1QBr8w?pwdgdp6 提取码: gdp6 通过网盘分享的文件:DooTask项目…

Python实现WYY音乐下载

一、需求背景 WYY音乐作为国内主流音乐平台,其歌曲资源丰富但下载接口存在多重加密保护。本文将通过Python结合JS逆向技术,解析其核心加密逻辑,实现免费歌曲的下载功能。 二、技术难点分析 1. 接口加密机制 通过抓包分析可知,网易云核心接口使用两次加密: 第一次:获取…

Java基础面试题学习

转换成自已的语言来回答,来源小林coding、沉默王二以及其它资源和自已改编。 1、概念 1、说一下Java的特点 我认为Java有很多特点 首先是平台无关性:Java可以实现一次编译到处运行,因为Java的编译器将源代码编译成字节码,使得该…

【笔记】深度学习模型训练的 GPU 内存优化之旅:重计算篇

开设此专题,目的一是梳理文献,目的二是分享知识。因为笔者读研期间的研究方向是单卡上的显存优化,所以最初思考的专题名称是“显存突围:深度学习模型训练的 GPU 内存优化之旅”,英文缩写是 “MLSys_GPU_Memory_Opt”。…

AI革命!蓝耘携手海螺AI视频,打造智能化视频新纪元

AI革命!蓝耘携手海螺AI视频,打造智能化视频新纪元 前言 在这个信息爆炸的时代,视频已经成为我们获取信息、学习新知识的重要方式。而随着人工智能(AI)技术的快速发展,AI与视频内容的结合为我们带来了全新的…

Django+celery+flower

Djangoceleryflower Django的定时任务及可视化监控Django Django的定时任务及可视化监控 Django的定时任务,以及可视化监控。 Django Django; 首先在python中新建虚拟环境并激活 pip install virtualenv python -m venv venv source venv/bin/activa…

MapReduce处理数据流程

(一)Shuffle MapReduce中的Shuffle过程指的是在Map方法执行后、Reduce方法执行前对数据进行分区排序的阶段 (二)处理流程 1. 首先MapReduce会将处理的数据集划分成多个split,split划分是逻辑上进行划分,…

基于springboot的教务系统(源码+lw+部署文档+讲解),源码可白嫖!

摘要 这些年随着Internet的迅速发展,我们国家和世界都已经进入了互联网大数据时代,计算机网络已经成为了整个社会以及经济发展的巨大动能,各个高校的教务工作成为了学校管理事务的重要目标和任务,因此运用互联网技术来提高教务的…