AI Agent产品经理血泪史:一年来我摸过的那些石头【Tools篇】

news2025/1/20 3:43:40

前几天刚好看到一篇关于GPT-6的报道,才想起来还有这麽回事情,于是赶紧把草稿捞出来改改交个任务。

至于为什麽贴这张图,以及为什麽血泪史从Tools开篇。

那是因为你看,即使到了GPT-6的时代,Tools仍然是AI Agent落地的基石。正如图中所示,即使AI模型不断进化,物理攻击还是物理攻击,Tools还是Tools,没有变成魔法攻击。

图片

01 - 前言:从接口请求说起

如果从技术层面来看这个世界,其实并没有那麽科幻。大模型也是如此,GPT-5, GPT-6同样如此。

在传统互联网时代,所有功能背后都是一个个接口。

入参 → 请求 → 返回结果

然后再通过UI和前端,把这些零散的接口包装成一个功能呈现在用户面前。

例如登录页面:

  • 用户输入:用户名、密码
  • 后台请求:验证接口
  • 返回结果:成功/失败

正确就返回Yes,登录成功;不正确就返回No,告诉你账号或密码不正确

大模型的出现,让这套交互发生了些许的变化

Agent 可以直接拿着你的数据去请求登录(例子就不考虑数据安全问题了)

但背后的那个登录接口还是登录接口

AI Agent的出现并没有改变这个本质,它只是将人工编写的规则替换为了AI的决策。

Tools就是在这个过程中,帮助AI Agent生成正确API请求参数的关键。

02 - 起源:大模型的魅力,其实并不是因为它是个吐字机。

而是可以通过它,把这个世界连接到一起。

当我第一次知道 ChatGPT 的时候,我刚好在解一个难题:

如何快速地从一堆非结构化数据中,抽取出结构化的候选人信息,然后提交到系统里。

用户输入的数据其实是千奇百怪的,没有什麽固定规则,可能这样:

“白苏,男,才华横溢,电话18856888898,家住XXXXXXXXX”

也可能直接就是一坨文本,我曾尝试了很多种解法,都挺难。

最后写了一大段正则。

后来我知道了GPT,再然后,我的道心就崩了。

毕竟一个prompt就抹掉了我个把月的努力。

图片

更让我崩溃的是,我发现,这个输出,直接可以作为我系统中上传候选人的入参,这不就,自动化了么???

上传候选人接口(API)如下:

图片

这个事情我可以描述地再具体一点:

很多人应该都用过寄快递的软件,输入地址的时候,复制一坨文本进去,它能自动帮你填好。如果识别不出来,你就得一个一个空地去填写。

通过大模型自动化之后,我只需要给一个文本框,你输入一坨文本进来,我自动给你提交。

那个时候还是22年底,没有Function Calling 更没有Tools,Sam也还没有给大家演示ChatGPT帮你点外卖。

03 - 探索:JSON Output 让大模型窥见真实的世界

去年同期有个段子,说GPT-4能自己越狱。

这事情当时被那些自媒体们越传越邪乎,但事实上,这事光靠大模型自己,是不现实的。

因为它,真的没有办法直接触碰到真实世界,毕竟大模型连现在是何年何月何日都不知道。

接着上面的例子讲

其实只要能够让大模型按照我们想要的定义输出结构化的信息,我们就可以去做很多有趣的事情。

JSON就是一个非常不错的选择

我们基于这个思路也做了很多的探索,比如:

1、无模板的Excel导入

改变传统的数据导入方式,再也不用写复杂的业务逻辑了。只需要一个Prompt去读取想要的数据列就可以

2、AI审核员

在原先人审的环节前加一个AI审,给一些knowhow和fewshot,输出yes和no还是很简单的。

3、分类器

分类器的场景很多。以前搞个分类,大小得训练个模型吧,那个年代可真是算法的黄金年代啊。

嗯,现在一个prompt就搞定了。

4、其它一些业务场景落地

好用,真的太好用了!

但那个时候的大模型,还太不成熟了,上面的路子能通,但走起来磕磕碰碰。

04 - 救星:Function Calling 以及 Tools 的到来

为何抛弃 Json Output?

在 OpenAI 的 Function Calling 到来之前,其实很多人都意识到了需要这样一个东西,因为Action是Agent 不可或缺的一环。

但那会 OpenAI 还在很努力地做自己的Plugin商店(后来死了),国内模型厂家还在起名字。

有些大神也通过这种方式在做一些牛逼的实现

Langchain 早期Agent的实现,以及它的Output parse;

AutoGPT 的爆火,Planning & Execute 的实现以及后面的Baby AGI;

….还有很多

但是Json Output天然存在很多缺陷:

1、JSON的格式其实是非常标准的,但凡输出一个错的token,就异常了;

2、那会模型的上下文还很短,整个窗口才4096,GPT-4是8K和32K,但是太贵啊;

3、模型其实是很难在单个请求里去完成多个复杂任务的,即使到今天也很难;

4、大模型真的废话很多,你必须不断强调:“不要讲废话”;

5、工程化复杂,维护成本高

……还有一箩筐理由

下面这个图是AutoGPT当时的Prompt,这句话必不可少

图片

在OpenAI的0613版本中,更新了Function Calling的功能。

那天晚上,我激动地一晚上没睡,连夜改需求,优雅,实在是太优雅了。

Function Calling实现的方式,让所有LLMs应用开发的难度大大降低:

1、Prompt维护成本降低,System Prompt 和 Function 解耦;

2、热插拔,你可以通过JSON Scheme的方式快速创建一个工具,比如Search,谁都能用,插上就行;

3、工程和业务解耦,以前通过Json Output来实现,还得针对不同的业务流程来设计流程图,工程得判断哪个节点用哪个prompt模板,然后下一个节点是啥;

现在,只要一个循环!

只要Function Calling存在,继续

否则结束

大模型真正改变应用开发的范式,是从0613这里开始的。

后面 OpenAI 又把 Function Calling 升级成了 Tools,也就是1106版本,原因不详。

Tools 和 Function Calling 只是写法上有所差异,Tools 更高一级,Function Calling 同级的还有OpenAI 自己封装的工具 Code - Interpreter 和 File - Search (RAG)。

个人猜测是为了推它自己的GPTs,毕竟没有场景的话,很难留住用户。这部分可以看我以前的文章。

1106版本的升级,也带来新的功能,Tools可以并行调用。

但是1106版本估计也是为了配合DevDay的仓促之作,不管是3.5还是4,在Tools上都有很多异常的问题,直到后面的0125版本里面才得到改善。

05 - 提升:从Tools上让你的 Agent 更可控

上面讲到了4种实现Function Calling的方式:

**Json Output:**通过Prompt的方式让模型输出JSON格式内容

优劣势:Prompt 麻烦,输出不稳定,串业务成本高

Json Mode: 官方Josn Output,1106与Tools同期推出

优劣势:JSON格式稳定,但实际上它与Tools的适用场景是不同的,JSON mode是为了输出JSON 存在的,而Tools 是为了 Call API存在的

Function Calling 和 Tools 就不再赘述

但是从可控的角度来说,还是会推荐Function Calling 和 Tools来实现。

1、 放弃 JSON mode:

随着模型能力提升,模型能够准确地输出JSON,但是它还是会出错,不能保证100%正确;

模型厂家对Function Calling是有微调优化的,也有说法是专门的MOE专家,但是无从验证;

2、降低 System prompt 依赖,化繁为简

System prompt里面写的东西太多了,你不能保证模型能很好地遵循它;

能在Tools里面去写的东西,尽量写在Tools里面

3、API Response 增强 Prompt:

其实所有输入给模型的内容,都可以算作是Pormpt。同理,Tools 调用的结果也就是API Response 也会被返回给到模型。

可以在这一步增加一些给大模型的约束和提示,这里的准确率非常高,毛估估95%以上。

4、尽量让模型做选择,而不是填空

把确定的答案做成选项给到模型,比如用Enum的方式。

一方面减少token的输出,提高速度;

另一方面,准确率高

5、利用Tools来做Route,构建Multi Agent

一个不行就上两,两个不行就上四。

术业有专攻,Agent的世界也一样。

06 - 未来:Tools 如何推动 Agent 走向智能

我跟小伙伴们一路关注着OpenAI各个版本模型能力的迭代,把模型能力摸的一清二楚。虽然官方没有任何明确的说明,但是从各版本模型迭代的路线来推断,Tools大概率是 OpenAI 押注AGI的方式。

开头的报道截图其实也能够证明这点。

可能有很多人对 AI Agent 的认知是从 Plan-and-Execute 开始的,比较有名的可能就是当时的AutoGPT,BabyAGI,以及国内一个项目Xagent。

我不否认Plan Agent是一种解决问题的方式,但它绝对不是AI Agent该有的智能。

这里就不展开去聊Plan Agent了,毕竟去年那些Plan Agent项目至今都很难有落地的。

而 Tools 则是给了一种全新的解题思路。而开发者也只需要关注两个事情:

1、选到合适的工具;

2、填写准确(优秀)的参数;

所有事情的优化,都可以从这两个方面下手。

把业务上的 knowhow ,快速地转化为 Agent 的知识,提升它在上面两个事情的准确率,把精力放在这个事情上,而不是在工程化上。

图片

Sam 虽然是个忽悠大王,但是有些话缺不无道理。

有些模型迭代能去解决的问题,不要花太多精力去做,也许你哼哧哼哧搞几个月,还没上线下个版本模型就解决了。

如何转行/入门AI产品经理?

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,转行/入门AI产品经理,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI产品经理入门手册、AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI产品经理入门手册

在这里插入图片描述

三、AI大模型视频教程

在这里插入图片描述

四、AI大模型各大学习书籍

在这里插入图片描述

五、AI大模型各大场景实战案例

在这里插入图片描述

六、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2069877.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ElementPlus下拉框输入框对齐问题

1.问题 2.解决方法 2.1label-width 说明:el-form中label-width设置为auto 2.2 label-wdith固定值 说明:如果在el-form-item里面设置了label-width"100px";采用宫格布局。 .demo-one{display: grid;grid-template-columns: repe…

C++:vector篇

前言: 本篇仅介绍vector中常用的函数接口,如果需要详细的请到官网查看。 vector是一种动态数组,能够自动调整大小。与数组类似,vector使用连续内存来存储元素,允许高效访问,但可以动态增加容量。为了应对容…

买了服务器后如何正确挂载数据盘|什么是系统盘,什么是数据盘

一、前言 我们买了服务器后,一般会再买一个数据盘,如果没有数据盘,万一服务器系统出现问题后数据丢失就完了,什么数据都没了,所以为了避免意外的发生,我们通常会再买一个数据盘 如上图,我就在…

差一点通关某公司面试靶场

没有web4和web8,web2的4没做出来。 web1 国光ssrf改版靶场 1 直接读取flag 3 使用file协议读取hosts IP为172.18.240.5 dict探针内网主机开启常见端口 172.18.240.1:80 172.18.240.5:3306 172.18.240.1:3306 172.18.240.5:80 172.18.240.5:8080 172.18.240.1:…

RocketMQ Dashboard

rocketmq-dashboard是一个可视化查看和管理RocketMQ消息队列的工具 官方地址:RocketMQ Dashboard | RocketMQ 1、点击下载源码 2、下载并解压,切换至源码目录rocketmq-dashboard-1.0.0 3、修改配置文件 4、编译 rocketmq-dashboard打成jar包 &#xf…

【2024最新】注册Github账号图文教程

GitHub 是一个全球最大的开源代码托管平台,它提供了基于 Git 的版本控制和协作功能,使开发者能够共享、管理和协作开发项目。用户可以创建、克隆、编辑代码,并通过分支、合并请求等工具进行协同工作。GitHub 还提供社区交流、项目管理和代码审…

qt圆环饼状图,非常小的窗口都能显示

非常小的窗口都能显示 QT core gui charts#include <QtCharts> using namespace QtCharts;//创建饼状图 void MainWindow::createpieSewies() {//饼状图QPieSeries * my_pieSeries new QPieSeries();//中间圆与大圆的比例my_pieSeries->setHoleSize(0.35);//…

Spring MVC、Spring Boot和Spring Cloud

一、Spring MVC 主要特点 传统的基于Servlet的Web框架: 需要手动配置Servlet、Filter等。 配置灵活: 可以使用XML或Java类来定义Bean和依赖关系。 依赖于Web容器: 需要部署到外部Web容器&#xff08;如Tomcat、Jetty&#xff09;中运行。 视图技术支持: 支持JSP、Thymelea…

DALI-2 NFC调光解码方案,电源模块,解码板

DALI-2 DT6 NFC 调光模块 一、产品概述 深圳锐科光电科技有限公司的DALI2 DT6&D4i&#xff0c;NFC调光模块&#xff0c;符合IEC62386-101 Ed2.0、IEC62386-102 Ed2.0和 IEC62386-207 Ed1 adapted to Ed2&#xff08;DT6&#xff09;标准协议。采用国外进口单片机芯片&#…

阮一峰《TypeScript 教程》学习笔记一类型系统、数组、元祖

阮一峰《TypeScript 教程》 本篇文章主要记录浏览阮一峰《TypeScript 教程》书籍的过程中本人不会的一些TypeScript的用法。当然&#xff0c;可以说&#xff0c;我都不会哈哈哈&#xff0c;不过有的用法比较奇葩的我就不记录了&#xff0c;只记录我觉得项目中会用到&#xff0c…

Python类型检查器库之typeshed使用详解

概要 在 Python 开发中,类型检查器(如 mypy)和 IDE(如 PyCharm)能够显著提高代码的可读性和可维护性。然而,Python 本身是一种动态类型语言,标准库和第三方库通常没有类型注解。这就需要一个包含这些库类型信息的资源库,以便类型检查器能够正常工作。Typeshed 正是这样…

【Python】学习Python的流程,有这一篇资料就够了,带你深入了解Python!!!

点击免费领取《CSDN大礼包》&#xff1a;Python入门到进阶资料 & 实战源码 & 兼职接单方法 安全链接免费领取 书籍推荐 《Python编程:从入门到实践》 作者&#xff1a;埃里克马瑟斯&#xff08;Eric Matthes&#xff09;特点&#xff1a;通过实际项目引导读者学习Pyt…

前端生成验证码

一.效果图 二、实现 2.1html <template><div class"outer-box"><div class"code-box"><div class"inout-code"><label class"label" for"inputCode">验证码&#xff1a;</label><…

内存管理篇-05物理页面的迁移类型migratetype

本节内容依旧是对上节课伙伴系统的补充&#xff0c;主要介绍了新版伙伴系统的页面迁移相关的内容 为什么要引入页面迁移类型&#xff1f;新版本伙伴系统针对老版本的伙伴系统的升级改进。主要优化memory compaction内存碎片整理的过程。 页面迁移实际上就是伙伴系统中free_area…

第一次get到学习大模型的沉浸感和成就感 ,大模型入门必看!!<大模型应用开发极简入门>(PDF分享)

人工智能大潮已来&#xff0c;不加入就可能被淘汰。就好像现在职场里谁不会用PPT和excel一样&#xff0c;基本上你见不到。 而大模型是人工智能代表&#xff0c;潜力与使用方式有关。使用好大模型可提高效率&#xff0c;让人获得更好的待遇和更多机会。所以今天给大家推荐一本…

【STM32】中断

中断与GPIO一样是STM32中非常常用的东西&#xff0c;以我一个写上位机的人的理解&#xff0c;它相当于上位机程序中多线程的地位&#xff0c;因为多线程和中断都是为了提高某些响应的实时性。悄悄说一句&#xff0c;我觉得中断在一定程度上比多线程还好用。哈哈哈哈哈哈哈~ 大部…

竖图秒变横屏壁纸!AI绘画SD最强控制插件ControlNet教程,一键实现图片的扩展式填充真的太强了!

大家好&#xff0c;我是画画的小强 经常用PhotoShop作图的人都知道&#xff0c;自从去年PS2023beta版的发布&#xff0c;引入了AI绘画给广大创作者带来了不小的惊喜&#xff0c;最主要的就是它的“创成式填充”&#xff0c;通过现有图片可以进行扩展和延展&#xff0c;其强大的…

Vue2 中 $set 用法详细讲解

给变量重复赋值&#xff0c;Vue 监测不到数据变化。这个时候&#xff0c;双向绑定就失效了。 1、为什么要用set&#xff1f; 在vue中&#xff0c;并不是任何时候数据都是双向绑定的。 在官方文档中&#xff0c;有这样一段话&#xff0c;如下&#xff1a; 从文档得知&#xff…

wpf 定制 个性圆角信息面板

先上图&#xff1a; 代码实现&#xff1a; <Canvas Grid.Column"1"><Border Background"#5665F4" BorderBrush"#5665F4" BorderThickness"0.5" CornerRadius"10,10,10,30"Width"180" Height"165&qu…

CSS背景与边框——WEB开发系列18

网页设计中&#xff0c;背景和边框是用于提升视觉效果的关键元素。CSS&#xff08;层叠样式表&#xff09;提供了丰富的功能来定制这些视觉效果&#xff0c;确保网页看起来既美观又符合设计需求。 一、背景样式 背景样式在网页设计中起着至关重要的作用。它们可以用来增加页面…