后智能体时代的LLM和Agent

news2025/3/9 20:07:09

文章目录

    • 1. 关于AI重塑的哲学体系
    • 2. 关于AI大模型体系的认知
    • 3. 关于AI大模型体系的畅想
    • 4. 关于人和AI大模型体系的共处
    • 5. 写在最后

  随着OpenAIDeepseekManus等等智能体的爆火,人们茶前饭后、插科打诨的话题都离不开这些智能体,现状也正如《人民日报》认为那样,DeepSeek实现了历史突破,但利益错综复杂,市场并不冷静,爆火的背后,也由此衍生出了炒作夸大、诱使客户花钱买单、贩卖焦虑等种种乱象;为此作者想了很久,还是决定写一篇通俗易懂的文章,与大家一起浅聊一下目前AI大模型的面纱下究竟藏着什么?

1. 关于AI重塑的哲学体系

  18世纪的世界体系中,大家熟悉的被苹果砸中的牛顿提出了两个主题,一个是他的微积分和物理学,力求物理世界的可预测性和可测量,牛顿本人也把他的《自然哲学的数学原理》叫作“论宇宙的系统”;另一个则是建立一套坚是可靠的货币体系,这一体系也标志着世界的生产力和劳动力开始挂钩货币,使得世界人们的劳动协助有了所谓的市场调节;
在这里插入图片描述

图1.1 艺术家笔下的牛顿像神一样规划着宇宙

  接下来我们重点再继续讲一讲牛顿自然科学数学的这一支发展,物理学和金融货币这一支的在此文中就不展开了,1900年伟大的数学家希尔伯特给出这样的一个颇具挑战的定义:基于确定性力学原理,可以把所有的科学都归结为数学逻辑。正如他向社会解释的那样:“在理论和实践之间,在思想和观察之间进行协调的工具是数学;它建造连接的桥梁,使它变得愈加强大。因此,当下的整个文化,都是基于对自然的理性认识和驾驭之上,都建立在数学的基础上。”针对这个学派的理解,我们姑且就叫他“数学化”吧,也可以理解为“数字化”的前身。

  希尔伯特“数学化”学派追随着里面不乏许多成名的数学家,比如每位IT同学都了解的冯诺依曼,早期也是这个学派的忠实信徒,然后,20世纪哥德尔以必胜的心态体现出了冷酷的死神形象。他证明了希尔伯特、卡尔纳普和冯·诺依曼最珍视的数学目标根本无法实现,然后除了冯·诺依曼之外,听众中没有任何其他人为哥德尔的证明所具备的重大意义所打动。大家还以为冯·诺依曼听到有人对他所热爱的数学进行如此尖锐的抨击定会感到愤怒,但他的反应符合世界顶尖数学家的风范,他鼓励哥德尔继续发言,并随后进行了跟进,才有了后续的冯诺依曼计算机的壮举。

  哥德尔的观点将偶像们打落在地,他的证明方法犹如天外惊鸿。他设计了一套算法,其中所有的符号和指令都是数字。在驳斥牛顿数学背后的宿命论哲学和希尔伯特的帝国逻辑的同时,他也为一种新的数学——信息数学——开辟了道路。这次会议中诞生了颇具创造力并带来连连惊喜的数学模式,由此萌发了一个现在由谷歌领导的计算机和通信新产业。

   谷歌在信息化或者说数字化的时代,确实居功甚伟,随着岁月的流逝,谷歌几乎数字化了世界上所有可以获取的图书(2005),数字化了世界语言这个大织锦挂毯上的所有语言及其翻译(2010),数字化了这个星球的地形(谷歌地图和谷歌地球,2007)等等,也标志着万物数字化,打造万物的数字孪生才是信息数学的基石和真正答案,此刻再看希尔伯特的"数学化"理论,是否觉得如此熟悉,但是创奇就是拿来被超越的,不是吗?

  信息数学的脚步并没有因为数字化而停止,直至今天, 随着OpenAIDeepseekManus等等智能体的落地,所有人心中对信息数学又有了更多的期待和畅想,随着而来必然是新的信仰和哲学体系,至于他的下一站在哪里?也只能是且看今日之域中,竟是谁家之天下……

2. 关于AI大模型体系的认知

   随着LLM(Large Language Model,也就是大语言模型,简称大模型)的爆火,大家普遍接触到的更多的是以Chat(聊天)交互模式的诸如ChatGPT、通义、豆包、智普、Kimi、deepseek、元宝等等的产品,关与这个交互的架构可以理解为图2.1。
在这里插入图片描述

图2.1 Chat模式的LLM产品架构

   大模型本身而言是个类似概率计算的问题,带来大概率准确答案的同时,也难免会带来用户不想要的错误答案,关于错误答案产生的原因,总体而言可以收敛为3类:

  1. 没有问清楚,于是有了针对提示词优化的Prompt,其设计核心的原则就是问题清晰化,结构化,问题场景上线文管理,问题内容的合规与合法检测等;
  2. 缺乏相关的知识;每个企业和个人都有自己的隐私数据,这些数据都不可能开放到互联网,自然就使得LLM对这些隐私数据毫无所知,于是就有了RAG( 检索(Retrieval) + 增强(Augmentation) + 生成(Generation),通俗而言就是通过外接知识库的方式,把隐私的数据在相对安全的情况下结合LLM的能力输出给到请求的用户,于是该模式的产品架构就变成了图2.2的模式。
    在这里插入图片描述
图2.2 LLM的RAG架构
  1. 大模型自身参数能力有欠缺,大厂生产的这些LLM本身是解决通用问题的智能体,更像是一个什么都懂的本科生,但不同的企业本身服务的商业就不同,毕竟在专业的领域专业的研究生和博士生往往样样精通的比万花筒显得更加得心应手一些,如基于医药的LLM,基于法律的LLM,基于汽车的LLM……于是就有了所谓的LoRA模型微调。

   以上当然不是大模型的体系的全部,就拿一开始的交互模式为例,目前给到C端用户体验的模式,更多的是以Chat模式为代表的聊天机器人,但平时我们自己去做一件事情本身并不是这样的一个模式,更多的是先有一个需求,然后设计针对整个需求的解决方案制定Workflow,也就是拆解成开始,处理步骤1,2,3……,结束的一个一个的flow,一个flow的完成去触发下一个flow的执行;本质上AI的做法,也是同样的思路,不过AI给他起了一个更高端的名字叫AgentAgent早期能更多是靠人工自己去配置一个个的flow,以此为代表的工具有LangChian、Dify等等;当然LLM只是实现某一个Workflow中很重要的一环,更多的模型可以访问AI之家里面的AI大模型学习,如图2.3。
在这里插入图片描述

图2.3 通用LLM的代表

   既然LLM可以有通用的智能体Deepseek、ChatGPT、Qwen等等,随之而来的问题自然是Agent有没有通用的Agent智能体呢?答案是有的,那就是国内爆火的Manus和国外OpenAI的Deep Research,通用Agent的本质,就是你只要给Agent输入你的需求,则Agent会帮你实现基于互联网和物联网世界的所有功能交付,当然要实现这个目标还有很长的路;现状是通过拿到Manus内测码的程序员和Deep Research的10项任务的对比,发现两者能力上是各有千秋的,其中大家熟悉的Manus在基于用户提供的一个要求完成编程代码,如完成一个贪吃蛇、俄罗斯方块等游戏,Manus可以完全实现可用的产品交付,但是在其他方面也有稍逊的表现。总之而言,通用Agent的出现,给普罗大众带来了无限的遐想,感觉上AGI(Artificial General Intelligence 通用人工智能)真的要来了,但是其实未来的路真的还很长,和通用LLM一样,通用Agent也只是个万花筒,基于医药的Agent,基于法律的Agent,基于汽车的Agent等等,也是Agent发展的必然;随着通用Agent的发展,因此如图2.4基于互联网和物联网的人机协同交互模式,也必然随之发生变更;
在这里插入图片描述

图2.4 通用Agent出现后的人机交互的模式

   整个AI大模型和Agent等智能体的生态非常庞大,基于篇幅的关系作者就不在此一一列举了,在此放一张学习路线图,当然此学习图并非是说让我们去学习如何从0到1构建一个LLM或者Agent,而是站在通用大模型的肩膀上开发更有意义的商用产品,换个其他的举例来说截止今日也很少人能从0到1写出操作系统、JDK等等的基座,但是并不妨碍普罗大众基于这类基座上的二次创新和百花齐放;有缘人可自行拿去闭环修炼,如图2.5。
在这里插入图片描述

图2.5 通用LLM和Agent的学习路线

3. 关于AI大模型体系的畅想

   个人感觉未来的LLM和Agent等智能体在大方向上会呈现出2个大方向的发展,一个是通用型智能体,就是所谓的万花筒智能体,Deepseek、Qwen、智普、Manus等此类万花筒智能体应该原则上还是聚焦在一线的科技公司大厂,可持续的成为该公司在智能体上的护城河;但是对于传统行业而言,也必将迎来新的转型和契机,当然前提还是基于数字世界的互联网和物联网的前提下,比如用户能在互联网上做的所有事情,智能体都能实现,网上不能做的呢,也许通过物联网可以实现,比如你想做一个蛋糕,智能体是做不了的,但是它可以帮你在网上外卖点一个蛋糕,当然类似Elon Musk宇树科技的机器人也许可以实现,但这属于另一人工智能的派系,此处不做展开讨论,以下是一些作者觉得不错的畅想,也欢迎大家一起学习交流

  1. 【科技】通用万花筒智能体的继续百花齐放;
  2. 【电商】智能体给用户在最省时的前提下找到最适合(性价比、高端定制……)的商品;
  3. 【新闻咨询】智能体先读完后将主人需要的新闻咨询总结归纳给到主人;
  4. 【广告】智能体的出现原则上对广告是不利的,毕竟有的选择,谁会愿意看广告呢?但是基于搜索引擎广告竞价的Rank模式,如果一旦有人掌握了智能体LLM和Agent的Rank模式,则广告必然成为这个Rank模式竞价的新载体;
  5. 【教育】以前的授课都是为人授课,授课的讲师和备授课的人是否会出现基于智能体呢?
  6. 【企业员工】数字CEO,数字PM,数字架构师……
  7. ……

4. 关于人和AI大模型体系的共处

   基于以上AI大模型的畅想,其实已经给出了人和AI大模型智能体的一个最佳的共处模式,在没有LLM和Agent出现的互联网时代,其实用户也一直在被各类数字化产品服务着,只是正如作者在公司天天被各个资深的产品经理教育的一样“从用户的角度出发,这个产品应该是……”
  个人感觉,万花筒LLM和Agent的出现,也许变成了“从用户和智能体的角度出发,这个产品应该是……”此处也许就会有人问道,那身为非产品经理的架构师和程序员的我呢?其实原则意义上讲,个人还是比较推崇那句“产品技术不分家”的说法的,架构师也好,程序员也罢,本就是产品中的一员,人人都需要一些产品思维,不论是产品本身还是人自己,自然路就走的更高更远了。

5. 写在最后

   文末,还是套用下《人民日报》的观点:通用万花筒LLM(DeepSeek等)和Agent(Manus等)最大的价值不是被膜拜,而是被超越!包括自己超越自己。唯此,才是对通用万花筒LLM(DeepSeek等)和Agent(Manus等)最真诚的爱护、最本质的尊重!也愿以人为本的AI时代更加五彩缤纷。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2312310.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

景联文科技:以精准数据标注赋能AI进化,构筑智能时代数据基石

在人工智能技术席卷全球的浪潮中,高质量数据已成为驱动AI模型进化的核心燃料。作为全球领先的AI数据服务解决方案提供商,景联文科技深耕数据标注领域多年,以技术为基、以专业为本,致力于为全球客户提供全场景、高精度、多模态的数…

嵌入式L6计算机网络

Telnet不加密 socket是应用层和下面的内核

华为鸿蒙系统全景解读:从内核设计到生态落地的技术革命

华为鸿蒙系统全景解读:从内核设计到生态落地的技术革命 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,可以分享一下给大家。点击跳转到网站。 https://www.captainbed.cn/ccc 文章目录 华为鸿蒙系统全景解读&#x…

八卡5090服务器首发亮相!

AI 人工智能领域热度居高不下。OpenAI 的 GPT - 4 凭强悍语言处理能力,在内容创作、智能客服等领域广泛应用。清华大学团队的 DeepSeek 大模型在深度学习训练优势突出,正促使各行业应用端算力需求向推理主导转变,呈爆发式增长 。 随着 DeepS…

基于SSM+Vue+uniapp的驾校预约管理小程序+LW示例

系列文章目录 1.基于SSM的洗衣房管理系统原生微信小程序LW参考示例 2.基于SpringBoot的宠物摄影网站管理系统LW参考示例 3.基于SpringBootVue的企业人事管理系统LW参考示例 4.基于SSM的高校实验室管理系统LW参考示例 5.基于SpringBoot的二手数码回收系统原生微信小程序LW参考示…

《用Python+PyGame开发双人生存游戏!源码解析+完整开发思路分享》

导语​ "你是否想过用Python开发一款可玩性高的双人合作游戏?本文将分享如何从零开始实现一款类《吸血鬼幸存者》的生存射击游戏!包含完整源码解析、角色系统设计、敌人AI逻辑等核心技术点,文末提供完整代码包下载!" 哈…

ArcGIS操作:13 生成最小外接矩阵

应用情景:筛选出屋面是否能放下12*60m的长方形,作为起降场候选点(一个不规则的形状内,判断是否能放下指定长宽的长方形) 1、面积初步筛选 Area ≥ 720 ㎡ 面积计算见 2、打开 ArcToolbox → Data Management Tools …

manus对比ChatGPT-Deep reaserch进行研究类学术相关数据分析!谁更胜一筹?

没有账号,只能挑选一个案例 一夜之间被这个用全英文介绍全华班出品的新爆款国产AI产品的小胖刷频。白天还没有切换语言的选项,晚上就加上了。简单看了看团队够成,使用很长实践的Monica创始人也在其中。逐渐可以理解,重心放在海外产…

Python —— pow()函数

一、示例1 # 计算 2 的 3 次幂 result1 pow(2, 3) print(result1) # 输出: 8# 计算 2.5 的 2 次幂 result2 pow(2.5, 2) print(result2) # 输出: 6.25 二、示例2 # 计算 (2 ** 3) % 5 result3 pow(2, 3, 5) print(result3) # 输出: 3 三、示例3 ntxt input("请输…

开发环境搭建-完善登录功能

一.完善登录功能 我们修改密码为md5中的格式,那么就需要修改数据库中的密码和将从前端获取到的密码转化成md5格式,然后进行比对。比对成功则登录成功,失败则禁止登录。 二.md5格式 使用DigestUtils工具类进行md5加密,调用md4Dig…

STM32G431RBT6--(3)片上外设及其关系

前边我们已经了解了STM32的内核,下面我们来介绍片上外设,对于这些外设,如果我们弄清楚一个单片机都有什么外设,弄清他们之间的关系,对于应用单片机有很大的帮助,我们以G431为例: 这个表格描述了…

docker 安装达梦数据库(离线)

docker安装达梦数据库,官网上已经下载不了docker版本的了,下面可通过百度网盘下载 通过网盘分享的文件:dm8_20240715_x86_rh6_rq_single.tar.zip 链接: https://pan.baidu.com/s/1_ejcs_bRLZpICf69mPdK2w?pwdszj9 提取码: szj9 上传到服务…

AI 驱动的软件测试革命:从自动化到智能化的进阶之路

🚀引言:软件测试的智能化转型浪潮 在数字化转型加速的今天,软件产品的迭代速度与复杂度呈指数级增长。传统软件测试依赖人工编写用例、执行测试的模式,已难以应对快速交付与高质量要求的双重挑战。人工智能技术的突破为测试领域注…

六轴传感器ICM-20608

ICM-20608-G是一个6轴传感器芯片,由3轴陀螺仪和3轴加速度计组成。陀螺仪可编程的满量程有:250,500,1000和2000度/秒。加速度计可编程的满量程有:2g,4g,8g和16g。学习Linux之SPI之前,…

TikTok Shop欧洲市场爆发,欧洲TikTok 运营网络专线成运营关键

TikTok在欧洲的影响力还在持续攀升,日前,TikTok发布了最新的欧盟执行和使用数据报告,报告中提到: 2024年7~12月期间,TikTok在欧盟地区的月活用户达1.591亿,较上一报告期(2024年10月发布&#xf…

专业工具,提供多种磁盘分区方案

随着时间的推移,电脑的磁盘空间往往会越来越紧张,许多人都经历过磁盘空间不足的困扰。虽然通过清理垃圾文件可以获得一定的改善,但随着文件和软件的增多,磁盘空间仍然可能显得捉襟见肘。在这种情况下,将其他磁盘的闲置…

你会测量管道液体流阻吗?西-魏斯巴赫方程(Darcy-Weisbach Equation)、Colebrook-White 方程帮你

测量管道液体流阻需要测量以下关键量: 需要测量的量 压力差(ΔP):管道入口和出口之间的压力差,通常通过压力传感器或差压计测量。流量(Q):流经管道的液体体积流量,可通…

SQL命令详解之多表查询(连接查询)

目录 1 简介 2 内连接查询 2.1 内连接语法 2.2 内连接练习 3 外连接查询 3.1 外连接语法 3.2 外连接练习 4 总结 1 简介 连接的本质就是把各个表中的记录都取出来依次匹配的组合加入结果集并返回给用户。我们把 t1 和 t2 两个表连接起来的过程如下图所示: …

导入 Excel 规则批量修改或删除 Excel 表格内容

我们前面介绍过按照规则批量修改 Excel 文档内容的操作,可以对大量的 Excel 文档按照一定的规则进行统一的修改,可以很好的解决我们批量修改 Excel 文档内容的需求。但是某些场景下,我们批量修改 Excel 文档内容的场景比较复杂,比…

字节码是由什么组成的?

Java字节码是Java程序编译后的中间产物,它是一种二进制格式的代码,可以在Java虚拟机(JVM)上运行。理解字节码的组成有助于我们更好地理解Java程序的运行机制。 1. Java字节码是什么? 定义 Java字节码是Java源代码经过…