爆肝整理AI Agent:在企业应用中的6种基础类型

news2025/1/15 1:35:34

AI Agent智能体在企业应用中落地的价值、场景、成熟度做了分析,并且探讨了未来企业IT基础设施与架构如何为未来Gen AI(生成式AI)做好准备。在这样的架构中,我们把最终体现上层应用能力的AI Agent从不同的技术要求与原理上分成了几类:

  • 创作与生成类助手

  • 企业知识助手

  • 数据分析助手

  • 应用/工具助手

  • Web操作助手

  • 自定义流程助手

本篇将对这几类AI助手分别做进一步探讨。

01

创作与生成类助手

大模型是生成式AI的基础,因此,理解、创作与生成内容是其强项也是最基本的能力。在C端市场,大量的生成类AI工具已经遍地开花(包括图片、视频、音乐),也是目前最成熟的一种应用形式。需要注意的是,在C端工具中,我们也经常看到各种形式的简单“助手”:

这里的助手与我们这里探讨的企业应用中的AI Agent有一定的区别:

AI Agent是一个以任务驱动的具备自主能力的智能体,不仅需要大模型这个核心“大脑”,也需要任务规划、记忆与外部工具使用等能力。而我们常看到的个人AI助手大部分是基于预设提示词的大模型问答Bot,在不借助其他插件时,通常不具备工具使用能力。

当前在企业应用中以内容创作生成为主要能力的AI Agent从技术上至少有两种:

1、单Agent的内容生成。简单地将大模型的生成能力通过API集成到其他应用与业务流程中,替代或简化原来由人工完成的部分工作。比如:

  • 在线培训管理系统中,利用AI自动根据课件创建考题/考卷

  • 在数字营销流程中,利用AI生成精确营销话术甚至撰写营销方案

  • 市场分析的AI Agent基于互联网搜索或开放数据生成市场分析报告

  • 电子商务企业借助AI自动批量生成商品摘要

  • 媒体行业通过AI生成新闻摘要;学术平台借助AI生成论文摘要

这种类型的AI助手简单的借助Prompt工程即可实现(与C端个人助手并无本质区别):

2、基于多Agent协作(可能还有人类)的内容生成。典型的为虚拟机器人软件公司,由AI Agent担任多个软件开发岗位,通过相互协作完成某个软件开发任务。

**这种多Agent协作型的助手可以借助Multi-Agents框架来简化开发与实现。**比如MetaGPT,可以根据自然语言描述的开发任务,组建Agent团队(PM、架构师、程序员、QA等),遵循SOP并最终输出完整软件开发的成果(文档、代码、API说明等)。

其他支持多Agent的开源框架包括微软的AutoGen,xAgents等。

02

企业知识助手

当前较为成熟的一种Agent类型。通俗地说,就是在企业应用中,通过“外挂”私有知识库来扩充大模型的知识储备,以提供基于自然语言的、对话式的企业私有知识访问(对应到AI Agent的基本能力之一:持久化记忆),以解决通用大模型在面向企业应用时领域知识不足导致的幻觉问题。

知识助手通常借助于大模型的**RAG(检索增强生成)**方案来实现,其本质上也是一种提示工程:**借助于在大模型输入时携带相关的私有知识上下文,让大模型理解、总结、整理并回答用户问题。**只是这里的私有知识上下文需要借助嵌入模型(Embedding Model)、向量数据库(Vector Store)、文档加载分割(Document Loader&Splitter)等相关技术来获得。

知识助手的技术实现基础架构如下:

基于RAG方案的AI助手实现可以自行通过代码直接实现,当然,为了简化开发与管理过程,推荐使用的工具包括:

  • LangChain或者LlamaIndex大模型主流应用开发基础框架。这两个基础框架对大量的模型、文档加载器、向量数据库、嵌入模型等做了抽象封装,并对RAG应用过程中的知识检索、Prompt组装等过程做了简化,可以大大简化开发过程。

  • 另一类是具备一定开箱即用能力的RAG应用构建平台。相对基础开发框架来说,提供了更完善的RAG应用构建工具,比如私有知识库的管理维护、测试、对话流程编排、提示词自定义等能力。这里推荐两个项目,一个是基于Langchain构建的Langcahin-Chatchat;另一个是FastGPT,后者有用于商业运营的SaaS应用,可以自行体验。

03

数据分析助手

数据分析与商业智能(BI)在中大型企业的日常运营中的重要性毋庸置疑,无论是简单的财务数据分析,还是复杂的客户与运营数据洞察,都需要借助专业的工具。传统BI工具使用门槛高、过度依赖技术部门、结果产出周期长的问题在AI时代可以借助大模型的能力得以缓解。

基于大模型的数据分析助手(Data Agent)是在企业应用中通过将自然语言转换成数据分析的语言或代码,比如对API的调用、对数据库的访问、甚至编写数据分析代码,来达到获取数据、分析数据与可视化结果的目的。其实现基础架构与原理如下:

无论是对本地的Excel数据文件分析,或者对数据库中的关系型数据分析,又或者对互联网的非结构化数据分析,当前大模型实现数据分析的技术途径基本以这三种方式为主,自然语言转API、转SQL、以及代码解释器(转代码)

这里推荐几个除Langchain之外构建数据分析助手的工具与项目:

  • **DB-GPT:**一个国内团队的以重新定义数据交互为使命的强大开源项目,包含完整的前后台项目实现,实现了多场景下的交互数据分析。包括数据库分析、Excel分析、仪表盘分析等,该项目的另一个特点是后端大模型的可伸缩管理架构。另外还有一个专注于微调Text2SQL模型与评估的开源项目。

  • **OpenAgents:**一个来自香港团队的开源项目,Data Agent是其中一个重要的Agent实现。当前主要实现了对本地结构化数据文档的数据分析,其特点是提供了两种数据分析方法供选择,一种是基于SQL,一种是基于代码解释器。

  • **OpenInterpreter:**当前最强大的开源代码解释器,完美地复刻了OpenAI的代码解释器实现,但是可以完全在本地部署与使用,利用它来实现本地的数据分析与可视化是一个不错的选择。

需要注意的是:数据分析助手严重依赖大模型对自然语言转数据操作的能力(SQL或Python代码等)。当然条件下,即使是针对这种场景专门优化的模型与提示工程,其失败概率也很高(比如Text2SQL目前最高成功率在80%左右)。因此,在实际实施中需要根据场景、复杂性、可靠性要求做综合评估。

04

应用/工具助手

企业应用中的AI助手很多时候需要与现有应用(CRM、OA系统)做集成与交互,以完成某个用户任务或者驱动业务流程。比如:如果你需要AI帮你在协同办公系统中提交一个付款申请,那么你需要调用办公系统的接口;或者你需要借助互联网获得最新某上市公司的财务报告,你需要调用第三方平台的公开接口。这就是AI Agent另一项重要能力:工具使用。

**AI应用/工具助手就是能够把自然语言转换成对企业应用或者互联网开放API调用的一种基础Agent形式。**当然,在复杂任务场景下的这种调用往往不是单一的。其基础架构与原理:

应用助手的基本原理是比较简单的,其复杂性主要体现在大模型对自然语言转API的能力,在实际使用中,其主要体现以下两个方面:

  • 能否根据上下文理解,精确匹配到需要使用的API(一个或者多个)

  • 能否准确地提取或生成每个API的调用参数

在实际测试中我们发现不同的大模型在这方面的能力是有较大的差异的,而且即使是最优秀的模型,也存在一定的不确定性,比如有时候无法判断出正确的工具。

在构建企业基于大模型的应用助手时,有一些工程问题是需要考虑的,这些问题在做原型或者测试时容易被忽视:

  • 企业中API过多的优化方案。由于需要通过Prompt提示LLM这些API信息,过多的API描述可能会导致上下文溢出;而且大量的API相互干扰,会提高大模型推理时的错误率。之前我们介绍过一种优化方案:借助向量库语义搜索,每次只检索出本次任务相关的API描述,再交给LLM处理。

  • **需要设计一个标准化的、容易扩展、易于插拔的工具/插件架构。**即能够灵活快速地扩展Agent的“工具包”,在增加新的工具时,通过简单的配置甚至自动化生成,即可给Agent动态赋予新的工具能力。

构建应用助手的一些工具和项目推荐:

  • LangChain:LangChain中的Agent组件,通过组装多个Tools,封装与简化了大模型使用工具的过程,可以让你专注于Tools的创建即可。

  • Assistants API:这是OpenAI官方最新放出构建AI助手的API,如果你条件具备,也可以基于此构建企业AI助手,充分利用其强大的gpt4模型。其中对工具的使用主要体现在其对Function Calling功能的支持。

  • OpenAgents:该项目中的Plugins Agent实现了对大量开放API的智能使用,并且可以灵活配置增加新的Plugin,可以参考其实现。

  • **集简云:**类似海外Zapier的平台。该平台对接了国内大量的SaaS应用与互联网平台作为“工具”。因此,你可以通过简单的配置后,在你的AI助手中通过API来对接这些工具,可以大大拓展你的AI助手的“工具库”。

05

Web助手

一种类似RPA(机器人流程自动化)的AI智能体。其主要能力是**自动化Web网络浏览、操作与探索的动作与过程,以简化web浏览访问与操作。对于个人来说,可以作为个人数字助理,简单对话即可让AI帮你完成Web浏览与操作,比如在线订票。而对于企业来说,则可以作为企业的数字员工,来简化企业日常工作中重复性较高、流程与规则固定、大批量的前端操作性事务。**比如批量订单处理、批量客户联络、批量网站抓取等,提高效率,降低错误率。

传统的RPA机器人也是用来完成此类工作的AI形式,由于这种AI机器人工作在软件的最上层即操作层面,好处是流程直观、简单、也可以配置化,且对应用无侵入性;但其缺点是与前端应用耦合性大,每个任务需要根据前端应用界面做精心配置与调试,自适应能力较差。

在大模型出现以后,给这一类RPA智能也带来了新的优化空间。利用大模型的理解与分析推理能力,可以让AI更加智能的规划与分解任务过程,然后借助浏览器完成执行;且在未来可以利用像GPT-4V这样的视觉模型,更智能的理解界面元素与功能,实现完全自主的智能操作,具备更强的自适应能力。

实现一个自主Web操作的Agent的基础原理与架构:

构建一个真实应用的Web Agent需要借助浏览器自身能力。由于外部应用无法直接接管浏览器实现操作,一般需要借助浏览器插件,比如Chrom扩展,借助浏览器API完成网站导航与自动化网页操作,比如点击界面元素,或者输入表单。

我们前面介绍到的OpenAgents项目中的Web Agent是一个基于Chrom浏览器与扩展而实现的一个LLM Agent,可以参考用作参考。

当然由于大模型的输出不确定性,当前的Web Agent仍然处于探索实验阶段,具有较大的失败或误操作可能,实际应用中需要根据情况反复测试与评估。

06

自定义流程助手

最后一种AI Agent严格来说是上面的几种基础Agent能力的组合。

理想中的AI Agent是在丢给他一个工具包与一些知识以后,借助于大模型的理解、推理能力,完全自主的规划与分解任务,设计任务步骤,并智能的使用各种工具,检索知识,输出内容,完成任务。但是在企业应用中,由于企业知识、应用、业务需求的千差万别,以及大模型自身的不确定性,如果这么做,那么结果很可能是“开盲盒”一样的不可控。所以这也是越来越多的Agents项目要强调可控性的原因,即能够对AI智能体的执行过程与细节进行更多的控制,来让AI按照人类确认过的工作流程来完成任务。

比如之前我们介绍的HR简历自动化筛选的场景中,你可能需要更加细致的去定义整个自动化工作流程,包括:

  • 主要的工作步骤与目标设定

  • **每个步骤使用的大模型
    **

  • 每个步骤可以使用的工具

  • 可以输入与携带的知识与文档

  • 其他必要的限定与指令

在实际应用中,这样基于LLM的工作流既可以是直接面向使用者的对话机器人来触发;也可以是完全后台触发。

实现这样的自动化工作流程AI智能体,除了借助Langchain/LlamaIndex这样的LLM开发框架直接定制外,还可以参考或利用一些开源项目:

  • 借助类似Flowise或者FastGPT这样的具有LLM流程可视化编排能力的框架或平台,可以更加直观简单地定制任务流程

  • 借助类似SuperAGI这样可快速简单化定制LLM流程的Agent框架来实现

07

结束语

以上,我们对企业应用中的大模型AI Agent从技术原理层面区分的几种类型做了简单探讨。实际上这里的每一种类型也都是一个可以深入的复杂话题,其中部分类型在之前的文章中也展开深入过,后续我们也会关注AI Agent技术趋势与发展,并在未来做持续分享。

可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好,希望能够真正帮助到大家。

👉AI大模型学习路线汇总👈
大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)
在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉大模型视频和PDF合集👈
观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1833175.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

考试系统Spring Security的配置

设置Spring Security配置类 1、设置包括认证、授权方法 protected void configure(HttpSecurity http) throws Exception {http.headers().frameOptions().disable();List<String> securityIgnoreUrls systemConfig.getSecurityIgnoreUrls();String[] ignores new Str…

重生奇迹mu圣导师介绍

出生地&#xff1a;勇者大陆 性 别&#xff1a;男 擅 长&#xff1a;统率&宠物使用 转 职&#xff1a;祭师&#xff08;3转&#xff09; 介 绍&#xff1a;当玩家账号中有一个Lv250以上角色时&#xff0c;便可以创建职业为圣导师的新角色&#xff0c;圣导师每升一级获得…

Trying to access array offset on value of type null

主要原因是版本7.4以后PHP解析器会对null类型的下标访问直接报错 背景&#xff1a; laravel框架 同时使用了扩展A和扩展B 扩展A要求 php>7.4,同时扩展B的对null类型的下标访问不兼容php7.4 修改扩展B不太现实&#xff0c;毕竟扩展B中有太多的对null类型的下标访问。 解决…

6月17日(周一),AH 股行情总结

AI手机及苹果概念股全日走强&#xff0c;领益智造、山东精密等多股涨停&#xff0c;立讯精、歌尔股份涨逾6% 。新车型秦L销售预期提振股价&#xff0c;比亚迪涨超1% &#xff1b;航运、煤炭、地产板块下跌。 文章正文 周一&#xff0c;A股低开高走&#xff0c;上证指数收跌0.…

代码随想录算法训练营第二十六天|39. 组合总和、 40.组合总和II、 131.分割回文串

39. 组合总和 题目链接&#xff1a;39. 组合总和 文档讲解&#xff1a;代码随想录 状态&#xff1a;卡了一会儿 思路&#xff1a;先排序&#xff0c;方便剪枝。允许数字重复使用&#xff0c;因此递归调用时传入当前索引i。 题解&#xff1a; public class Solution {// 用于存…

ETAS AUTOSAR工具链的作用

一、AUTOSAR是什么&#xff1f; AUTOSAR&#xff08;Automotive Open System Architecture&#xff09;是一个全球性的联盟&#xff0c;致力于制定和推广汽车电子系统的标准化解决方案。它是由汽车制造商、供应商和工程公司组成的合作伙伴网络&#xff0c;旨在解决汽车电子系统…

如何理解 Java 类加载器的工作原理及其使用场景

1. 简介 Java类加载器&#xff08;ClassLoader&#xff09;是Java运行时环境的一部分&#xff0c;负责动态加载Java类文件到Java虚拟机&#xff08;JVM&#xff09;中。类加载器是Java反射机制和动态特性的重要基础&#xff0c;为Java的跨平台和动态加载提供了支持。理解类加载…

ANSYS EMC解决方案与经典案例

EMC问题非常复杂&#xff0c;各行各业都会涉及&#xff0c;例如航空、航天、船舶、汽车、火车、高科技、物联网、消费电子。要考虑EMC的对象很多&#xff0c;包含整个系统、设备、PCB、线缆、电源、芯片封装。而且技术领域覆盖广&#xff0c;涉及高频问题、低频问题&#xff1b…

《山西教育》教学版是什么级别的刊物?

《山西教育》教学版是什么级别的刊物&#xff1f; 《山西教育(教学版)》创刊于1956年&#xff0c;是由山西教育报刊社主办的教学刊物。山西省一级期刊&#xff0c;是“宣传教育政策&#xff0c;关注教育热点&#xff0c;传播先进经验&#xff0c;提供教改资讯”的权威性期刊&a…

Http协议JSON格式

1. 计算机网络 计算机网络是指将地理位置不同的具有独立功能的多台计算机及其外部设备&#xff0c;通过通信线路连接起来&#xff0c;在网络操作系统&#xff0c;网络管理软件及网络通信协议的管理和协调下&#xff0c;实现资源共享和信息传递的计算机系统。 思考:计算机网络…

UniVue更新日志:使用Carousel组件实现轮播图效果

github仓库 稳定版本仓库&#xff1a;https://github.com/Avalon712/UniVue 开发版本仓库&#xff1a;https://github.com/Avalon712/UniVue-Develop UniVue扩展框架-UniVue源生成器仓库&#xff1a;https://github.com/Avalon712/UniVue-SourceGenerator 更新说明 今天的更…

数字人源码部署怎么做?如何高效搭建好用的数字人系统?

作为人工智能时代的风口项目&#xff0c;AI数字人自出现之日起便引发了大量的关注。不少创业者都有了搭建数字人系统的想法&#xff0c;但却苦于没有强大的专业背景和雄厚资金支撑&#xff0c;只能在局外徘徊&#xff0c;而这恰恰为数字人源码公司推出的数字人源码部署服务的火…

自然语言处理学习路线(1)——NLP的基本流程

NLP基本流程 【NLP基本流程】 0. 获取语料 1. 语料预处理 2. 特征工程&选择 3. 模型训练 4. 模型输出&上线 【NLP基本流程图】 Reference 1. 自然语言处理(NLP)的一般处理流程&#xff01;-腾讯云开发者社区-腾讯云 2. https://zhuanlan.zhihu.com/p/55…

FreeBSD通过CBSD管理低资源容器jail来安装Ubuntu子系统实践

简介 FreeBSD、CBSD、Jail和Ubuntu&#xff0c;四者的组合方案可以说是强强联合&#xff0c;极具性价比和竞争力&#xff01;同时安装简单方便&#xff0c;整体方案非常先进。 CBSD是为FreeBSD jail子系统、bhyve、QEMU/NVMM和Xen编写的管理层。该项目定位为一个综合解决方案…

YOLOv5目标检测——基于YOLOv5的吊车安全监测

移动式起重机是建筑施工中使用的重要设备。 遵守正确的操作程序对于防止事故很重要。 然而&#xff0c;其中存在人为错误的因素。 这里我将举一个例子来说明计算机视觉&#xff08;CV&#xff09;如何帮助解决这个问题。 1、移动式起重机操作的安全问题 为简单起见&#xff0…

室内外一体化定位系统的创新与应用

随着科技的飞速发展&#xff0c;人们对定位技术的需求日益增强。传统的定位技术主要依赖于室外环境&#xff0c;如GPS等卫星定位技术。然而&#xff0c;在室内环境下&#xff0c;由于信号遮挡和多径效应等问题&#xff0c;这些技术往往难以发挥有效作用。因此&#xff0c;室内外…

记录一次基于Vite搭建Vue3项目的过程

Vue2已经于2023年12月31日停止维护了&#xff0c;2024年算是vue3的崭新的一年&#xff0c;我们的项目也基本从vue2逐渐向着Vue3过渡&#xff0c;Vue3相较于vue2有更好的开发体验&#xff0c;和ts的自然融合使得项目的结构、功能拆分变得更加的清晰&#xff1b;组合式声明有种MV…

【吉林大学Java程序设计】第7章:对象的容纳

第7章&#xff1a;对象的容纳 1.数组 Arrays1.1 数组的创建、初始化和使用&#xff08;1&#xff09;数组的声明&#xff08;2&#xff09;数组初始化静态初始化动态初始化对象数组的初始化 &#xff08;3&#xff09;数组的使用 1.2 多维数组1.3 数组与数组的引用1.4 数组工具…

Python学习从0开始——Kaggle深度学习002

Python学习从0开始——Kaggle深度学习002 一、单个神经元1.深度学习2.线性单元示例 - 线性单元作为模型多个输入 3.Keras中的线性单元 二、深度神经网络1.层多种类型的层 2.激活函数3.堆叠密集层4.构建Sequential模型 三、随机梯度下降1.介绍2.损失函数3.梯度下降法1.梯度下降法…

Spring Boot 优雅关机时异步线程安全优化

个人名片 &#x1f393;作者简介&#xff1a;java领域优质创作者 &#x1f310;个人主页&#xff1a;码农阿豪 &#x1f4de;工作室&#xff1a;新空间代码工作室&#xff08;提供各种软件服务&#xff09; &#x1f48c;个人邮箱&#xff1a;[2435024119qq.com] &#x1f4f1…