后智能体时代的LLM和Agent

文章目录

- 1. 关于AI重塑的哲学体系
- 2. 关于AI大模型体系的认知
- 3. 关于AI大模型体系的畅想
- 4. 关于人和AI大模型体系的共处
- 5. 写在最后

随着OpenAI、Deepseek、Manus等等智能体的爆火，人们茶前饭后、插科打诨的话题都离不开这些智能体，现状也正如《人民日报》认为那样，DeepSeek实现了历史突破，但利益错综复杂，市场并不冷静，爆火的背后，也由此衍生出了炒作夸大、诱使客户花钱买单、贩卖焦虑等种种乱象；为此作者想了很久，还是决定写一篇通俗易懂的文章，与大家一起浅聊一下目前AI大模型的面纱下究竟藏着什么？

1. 关于AI重塑的哲学体系

18世纪的世界体系中，大家熟悉的被苹果砸中的牛顿提出了两个主题，一个是他的微积分和物理学，力求物理世界的可预测性和可测量，牛顿本人也把他的《自然哲学的数学原理》叫作“论宇宙的系统”；另一个则是建立一套坚是可靠的货币体系，这一体系也标志着世界的生产力和劳动力开始挂钩货币，使得世界人们的劳动协助有了所谓的市场调节；
在这里插入图片描述

图1.1 艺术家笔下的牛顿像神一样规划着宇宙

接下来我们重点再继续讲一讲牛顿自然科学数学的这一支发展，物理学和金融货币这一支的在此文中就不展开了，1900年伟大的数学家希尔伯特给出这样的一个颇具挑战的定义：基于确定性力学原理，可以把所有的科学都归结为数学逻辑。正如他向社会解释的那样：“在理论和实践之间，在思想和观察之间进行协调的工具是数学；它建造连接的桥梁，使它变得愈加强大。因此，当下的整个文化，都是基于对自然的理性认识和驾驭之上，都建立在数学的基础上。”针对这个学派的理解，我们姑且就叫他“数学化”吧，也可以理解为“数字化”的前身。

希尔伯特“数学化”学派追随着里面不乏许多成名的数学家，比如每位IT同学都了解的冯诺依曼，早期也是这个学派的忠实信徒，然后，20世纪哥德尔以必胜的心态体现出了冷酷的死神形象。他证明了希尔伯特、卡尔纳普和冯·诺依曼最珍视的数学目标根本无法实现，然后除了冯·诺依曼之外，听众中没有任何其他人为哥德尔的证明所具备的重大意义所打动。大家还以为冯·诺依曼听到有人对他所热爱的数学进行如此尖锐的抨击定会感到愤怒，但他的反应符合世界顶尖数学家的风范，他鼓励哥德尔继续发言，并随后进行了跟进，才有了后续的冯诺依曼计算机的壮举。

哥德尔的观点将偶像们打落在地，他的证明方法犹如天外惊鸿。他设计了一套算法，其中所有的符号和指令都是数字。在驳斥牛顿数学背后的宿命论哲学和希尔伯特的帝国逻辑的同时，他也为一种新的数学——信息数学——开辟了道路。这次会议中诞生了颇具创造力并带来连连惊喜的数学模式，由此萌发了一个现在由谷歌领导的计算机和通信新产业。

谷歌在信息化或者说数字化的时代，确实居功甚伟，随着岁月的流逝，谷歌几乎数字化了世界上所有可以获取的图书（2005），数字化了世界语言这个大织锦挂毯上的所有语言及其翻译（2010），数字化了这个星球的地形（谷歌地图和谷歌地球，2007）等等，也标志着万物数字化，打造万物的数字孪生才是信息数学的基石和真正答案，此刻再看希尔伯特的"数学化"理论，是否觉得如此熟悉，但是创奇就是拿来被超越的，不是吗？

信息数学的脚步并没有因为数字化而停止，直至今天，随着OpenAI、Deepseek、Manus等等智能体的落地，所有人心中对信息数学又有了更多的期待和畅想，随着而来必然是新的信仰和哲学体系，至于他的下一站在哪里？也只能是且看今日之域中，竟是谁家之天下……

2. 关于AI大模型体系的认知

随着LLM（Large Language Model，也就是大语言模型，简称大模型）的爆火，大家普遍接触到的更多的是以Chat(聊天)为交互模式的诸如ChatGPT、通义、豆包、智普、Kimi、deepseek、元宝等等的产品，关与这个交互的架构可以理解为图2.1。
在这里插入图片描述

图2.1 Chat模式的LLM产品架构

大模型本身而言是个类似概率计算的问题，带来大概率准确答案的同时，也难免会带来用户不想要的错误答案，关于错误答案产生的原因，总体而言可以收敛为3类：

没有问清楚,于是有了针对提示词优化的Prompt，其设计核心的原则就是问题清晰化，结构化，问题场景上线文管理，问题内容的合规与合法检测等；
缺乏相关的知识；每个企业和个人都有自己的隐私数据，这些数据都不可能开放到互联网，自然就使得LLM对这些隐私数据毫无所知，于是就有了RAG（检索（Retrieval） + 增强（Augmentation） + 生成（Generation）,通俗而言就是通过外接知识库的方式，把隐私的数据在相对安全的情况下结合LLM的能力输出给到请求的用户，于是该模式的产品架构就变成了图2.2的模式。

图2.2 LLM的RAG架构

大模型自身参数能力有欠缺，大厂生产的这些LLM本身是解决通用问题的智能体，更像是一个什么都懂的本科生，但不同的企业本身服务的商业就不同，毕竟在专业的领域专业的研究生和博士生往往样样精通的比万花筒显得更加得心应手一些，如基于医药的LLM，基于法律的LLM，基于汽车的LLM……于是就有了所谓的LoRA模型微调。

以上当然不是大模型的体系的全部，就拿一开始的交互模式为例，目前给到C端用户体验的模式，更多的是以Chat模式为代表的聊天机器人，但平时我们自己去做一件事情本身并不是这样的一个模式，更多的是先有一个需求，然后设计针对整个需求的解决方案制定Workflow，也就是拆解成开始，处理步骤1,2,3……，结束的一个一个的flow，一个flow的完成去触发下一个flow的执行；本质上AI的做法，也是同样的思路，不过AI给他起了一个更高端的名字叫Agent，Agent早期能更多是靠人工自己去配置一个个的flow，以此为代表的工具有LangChian、Dify等等；当然LLM只是实现某一个Workflow中很重要的一环，更多的模型可以访问AI之家里面的AI大模型学习，如图2.3。
在这里插入图片描述

图2.3 通用LLM的代表

既然LLM可以有通用的智能体Deepseek、ChatGPT、Qwen等等，随之而来的问题自然是Agent有没有通用的Agent智能体呢？答案是有的，那就是国内爆火的Manus和国外OpenAI的Deep Research，通用Agent的本质，就是你只要给Agent输入你的需求，则Agent会帮你实现基于互联网和物联网世界的所有功能交付，当然要实现这个目标还有很长的路；现状是通过拿到Manus内测码的程序员和Deep Research的10项任务的对比，发现两者能力上是各有千秋的，其中大家熟悉的Manus在基于用户提供的一个要求完成编程代码，如完成一个贪吃蛇、俄罗斯方块等游戏，Manus可以完全实现可用的产品交付，但是在其他方面也有稍逊的表现。总之而言，通用Agent的出现，给普罗大众带来了无限的遐想，感觉上AGI（Artificial General Intelligence 通用人工智能）真的要来了，但是其实未来的路真的还很长，和通用LLM一样，通用Agent也只是个万花筒，基于医药的Agent，基于法律的Agent，基于汽车的Agent等等，也是Agent发展的必然；随着通用Agent的发展，因此如图2.4基于互联网和物联网的人机协同交互模式，也必然随之发生变更；
在这里插入图片描述

图2.4 通用Agent出现后的人机交互的模式

整个AI大模型和Agent等智能体的生态非常庞大，基于篇幅的关系作者就不在此一一列举了，在此放一张学习路线图，当然此学习图并非是说让我们去学习如何从0到1构建一个LLM或者Agent，而是站在通用大模型的肩膀上开发更有意义的商用产品，换个其他的举例来说截止今日也很少人能从0到1写出操作系统、JDK等等的基座，但是并不妨碍普罗大众基于这类基座上的二次创新和百花齐放；有缘人可自行拿去闭环修炼，如图2.5。
在这里插入图片描述

图2.5 通用LLM和Agent的学习路线

3. 关于AI大模型体系的畅想

个人感觉未来的LLM和Agent等智能体在大方向上会呈现出2个大方向的发展，一个是通用型智能体，就是所谓的万花筒智能体，Deepseek、Qwen、智普、Manus等此类万花筒智能体应该原则上还是聚焦在一线的科技公司大厂，可持续的成为该公司在智能体上的护城河；但是对于传统行业而言，也必将迎来新的转型和契机，当然前提还是基于数字世界的互联网和物联网的前提下，比如用户能在互联网上做的所有事情，智能体都能实现，网上不能做的呢，也许通过物联网可以实现，比如你想做一个蛋糕，智能体是做不了的，但是它可以帮你在网上外卖点一个蛋糕，当然类似Elon Musk和宇树科技的机器人也许可以实现，但这属于另一人工智能的派系，此处不做展开讨论，以下是一些作者觉得不错的畅想，也欢迎大家一起学习交流

【科技】通用万花筒智能体的继续百花齐放；
【电商】智能体给用户在最省时的前提下找到最适合（性价比、高端定制……）的商品；
【新闻咨询】智能体先读完后将主人需要的新闻咨询总结归纳给到主人；
【广告】智能体的出现原则上对广告是不利的，毕竟有的选择，谁会愿意看广告呢？但是基于搜索引擎广告竞价的Rank模式，如果一旦有人掌握了智能体LLM和Agent的Rank模式，则广告必然成为这个Rank模式竞价的新载体；
【教育】以前的授课都是为人授课，授课的讲师和备授课的人是否会出现基于智能体呢？
【企业员工】数字CEO，数字PM，数字架构师……
……

4. 关于人和AI大模型体系的共处

基于以上AI大模型的畅想，其实已经给出了人和AI大模型智能体的一个最佳的共处模式，在没有LLM和Agent出现的互联网时代，其实用户也一直在被各类数字化产品服务着，只是正如作者在公司天天被各个资深的产品经理教育的一样“从用户的角度出发，这个产品应该是……”
个人感觉，万花筒LLM和Agent的出现，也许变成了“从用户和智能体的角度出发，这个产品应该是……”此处也许就会有人问道，那身为非产品经理的架构师和程序员的我呢？其实原则意义上讲，个人还是比较推崇那句“产品技术不分家”的说法的，架构师也好，程序员也罢，本就是产品中的一员，人人都需要一些产品思维，不论是产品本身还是人自己，自然路就走的更高更远了。