▼最近直播超级多,预约保你有收获
近期直播:《基于 LLM 大模型的微调构建AI Agents 案例实践》
—1—
LLM 大模型有哪些局限性?
给定一些字或者词(称为 token),预测下一个字或者词模型,就是语言模型。
大语言模型(Large Language Model, LLM)是一类基于深度学习的语言模型,它们在大量的文本数据上进行训练,可以完成各种任务,包括代码编写、总结、翻译等。LLM 的特点是规模庞大,包含数十亿的参数,学习语言数据中的复杂模式。
大语言模型发展日新月异,基于 Transformer 预训练架构演变成各种各样的大模型。
目前 LLM 大模型也会存在3点局限性:
第一、简单的推理也会犯错。
第二、多聊几句就会忘记历史信息。
第三、写了代码不能运行验证。
— 2 —
使用 AI Agents进一步增强 LLM 大模型的能力
第一、什么是 Agent?
实际上,人类是这个星球上最强大的 Agent。Agent 是一个能感知并自主地采取行动的实体,这里的自主性极其关键,Agent 要能够实现设定的目标,其中包括具备学习和获取知识的能力以提高自身性能。
Agent 的 复杂程度各不相同,一个简单的恒温器可以是一个 Agent,一个大型的国家或者一个生物群体也可能是个 Agent。感知环境、自主决策、具备行动能力,设定明确的目标和任务,适应环境及学习能力,都是 Agent 的关键特点。
Agent 由三个部分组成:控制端(Brain)、感知端(Perception)和行动端(Action)。
我们来看下 Agent 的工作流程:当人类询问是否会下雨时,感知端(Perception)将指令转换为 LLMs 可以理解的表示。然后控制端(Brain)开始根据当前天气和互联网上的天气预报进行推理和行动规划。最后,行动端(Action)做出响应并将雨伞递给人类。
第二、什么是 AI Agent?
AI Agent 被设计为具有独立思考和行动能力的 AI 程序。你只需要提供一个目标,比如写一个游戏、开发一个网页,它就会根据环境的反应和独白的形式生成一个任务序列开始工作。就好像是人工智能可以自我提示反馈,不断发展和适应,以尽可能最好的方式来实现你给出的目标。
可以使用以下的公式来描述 AI Agent。
AI Agent = LLM(大语言模型推理能力) + Planning(规划能力) + Memory(记忆能力) + Tools(使用工具能力) + Action(行动能力)。
第三、AI Agent 如何进一步增强 LLM 大模型的能力?
LLM 与 LangChain 等工具相结合,释放了内容生成、编码和分析方面的多种可能性,目前在 ChatGPT-4 插件中比较有代表性的插件就是 Code Interpreter。
我们看一个“简单的难题”:尽管 ChatGPT-4 等模型非常强大、Agent 的发展似乎牛气冲天,它们仍然无法满足很多任务的需要,甚至一些在我们看来很简单的任务都完成不了,比如我们构造的这个任务:
我们必须明白,尽管 AI 在一定程度上模仿了人脑的工作方式,但实际上,机器人和人脑在处理信息时采用的策略有很大的不同。因此,即使在未来,我们也需要继续改进 AI 框架,以解决这种差距。比如一个百万位数的加法任务,ChatGPT-4 囿于 token 数的限制是不可能完成这个任务的,但人类却可以,这恰是人类和 AI 需要弥补的 Gap。我们进行了一些简单的试验,还没有发现大模型和 AI Agent 能搞定这个任务。其中,ChatGPT-4的 Code Interpreter 是表现最好的,因为它调用了外部计算器,但中间的过程描述还是发生了错误。
—3—
免费超干货大模型 AI Agents 直播
为了帮助同学们掌握好 AI Agents 的技术架构和应用案例实战,本周五晚上8点,我和陈东老师会开一场直播和同学们深度聊聊 AI Agents 技术架构剖析、AI Agents 的应用案例实战、LLM 大模型的微调案例实战,请同学点击下方按钮预约直播,咱们本周五晚8点不见不散哦~~
近期直播:《基于 LLM 大模型的微调构建AI Agents 案例实践》
END