大模型时代,开发者怎么办

news2024/11/27 1:38:38

随着ChatGPT的出圈,基于大模型开发的应用也不断涌现,不管是不是相关方向的从业人员,在这一年多总能听到很多新名词,从LLMPromptRAGFine-tuningAgent,各个大企业都在讲All in AI,一些技术会议也明显感觉到AI占用的篇幅越来越多。

无论企业还是个人,好像不使用大模型就落伍了,更甚者我们会不会被AI取代,最近听到一种说法挺认同的:

AI不会取代人类,只是会用AI的人会取代不会用的

AI或者说大模型是不是正在掀起一场新的工业革命,我不好说,但大模型的影响力比以往近10年产生的新技术都大,譬如区块链、Web3、云原生,所有行业都值得用大模型重新做一遍,上一次有这个待遇的还是互联网,之前常说互联网+,那么现在是不是到了AI+的时代。

人生又能遇到几次这样的浪潮,在大模型时代,我们要怎么做呢?

我的大模型之路

22年12月,ChatGPT横空出世,当时注册卡的很严,借了个账号体验体验,感觉回答的很像真人,比以往所谓的语音助手要好很多,但仅此而已,还没有很深刻的体会。

23年开始尝试用New Bing来解决工作中遇到的问题,确实比搜索引擎体验好很多。后来趁着出国度假申请了ChatGPT的账号,工作基本是离不开它了,让它来写代码、替代搜索引擎、文章润色。也尝试过其他Github CopilotLLama3、千问等等,各种LLM发布时号称怎么怎么打败OpenAI,到头来发现还是ChatGPT最好用。

23年底,公司组织了AI相关的竞赛,借机开始研究怎么基于大模型(LLM)做开发,当时基于llama-index开发了一个RAG+自动执行的小应用。后来也开始不断地了解相关知识,LangChainAgent等。

接触的越多越发觉得大模型太厉害了,能解决以往不敢想象的事情,虽然还有很多局限性。那么作为开发者,怎么样才能更好地利用大模型呢?

大模型的能力

如果我们要使用一种技术,必须能清晰地了解这种技术的边界。那么大模型能做什么,不能做什么?

「LLM能做的事」

  • 「自然语言的理解和生成」,可以理解并生成文本、代码生成、摘要等

  • 「多语言支持」,在多种语言间进行转换,翻译、代码转换等

  • 「简单的推理」,能够进行一定程度的逻辑推理,如情感识别、问答、修复Bug

  • 「多模态的能力」,识别图像、语言等

「LLM的局限」

  • 「幻觉」,倒不如说是大模型的特性,大模型给出的答案可能不准确也不可靠,不能使用的在医疗等准确度要求较高的场景

  • 「推理能力有限」,对于复杂任务效果不好

  • 「深层次的上下文理解」,大模型在需要深层次上下文理解或常识推理的任务中仍会遇到困难

  • 「数据的准确性与时效性」,大模型本身的训练数据可能会含有一些脏数据、政治倾向等,也不包含最新的实时数据

  • 「物理世界的操作」,无法执行外部动作,比如帮你取快递、感知环境

  • 「创造性思维」,虽然大模型能够生成新颖的内容,但内容都是基于训练数据的,并不是真的创新思考

尽管当前大模型有一些局限,但是随着技术的发展,大模型本身的能力也在不断发展。

大模型开发

我不是专业的LLM开发者,抛开底层的技术和优化(Pre-Training, Fine-Tuning等),基于大模型的应用开发可分为以下几个级别:

级别技术解释应用
L0:无AICode根据经验形成代码计算器软件,报表系统
L1:PromptLLM + Prompt通过合适提示词得到想要的结果,如Few-Shot、COT对话机器人,日报生成,小红书模板
L2:RAGLLM + Prompt + VectorDB通过嵌入外部相关数据发送给LLM,得到更准确的回答企业问答系统,智能客服
L3:Workflow(LLM + Prompt) * Workflow组织多个LLM链实现更复杂的应用,如LangChain Chain报表分析、意图识别
L4:AgentLLM + Reflection + Tools + Memory智能体可以借助外部工具自动地执行人类布置的多步骤复杂任务,如MetaGPT自动故障处理、私人助理
L5:Autonomous AgentsAgents + Awareness + Collaboration超级智能体可以感知环境,自动做出决策,并可以与其他智能体协作斯坦福小镇

类似自动驾驶的分类级别,根据用户参考程度不同,从L0用户全程参与到L5完全不需要用户参与,中间包含有提示词工程Prompt、RAG应用、基于工作流的LLM应用、AI智能体。

往靠近底层,实现的功能简单,越往上层自动化程度更高,实现的应用越复杂,上层应用可以使用下层的技术,比如Agent一般都会结合RAG、Prompt等,可以根据自己的需求使用场景,选择合适的应用。

Prompt

Prompt即提示词工程,是指大模型提供的输入提示,用来引导LLM生成特定的输出。通过设计不同的提示词,可以控制模型生成的内容和行为。

通常我们使用大模型的路径如下:

INPUT -> LLM -> OUTPUT + %

提供一个输入,大模型会给出一个带有随机性的输出,怎么样使得这个输出更符合我们的要求呢,那就需要一定技巧的提示词。

不是所有输入都是Prompt,只有携带系统指令的问题才是。比如hi, how are you这不是提示词,而answer my question use chinese, question: 'how are you'包含了指令和问题,其中的前面的指令才算作Prompt。

通过Prompt可以让大模型输出特定的内容,比如生成小红书的爆款文案、返回JSON格式、生成工作日报等等。

「技术」

Prompt有很多类型,比如Zero-Shot(无样本提示词)、Few-Shot(少样本提示词)、COT(思维链,可以实现一些较复杂的推理,数学计算等),更多的可以参考Prompt Engineering。

「示例」

下面是一个简单Few-Shot例子:

---
Prompt: 你是一个情感识别专家,根据用户的输入,判断句子是"消极"还是"积极",下面是一些例子:
这场比赛好极了! // 积极
今天天气热死了 // 消极
这个电影真难看 // 消极
樊振东好样的 //
---
LLM: 积极
---

「局限」

  • 依赖大模型本身的功能,只能实现相对简单的应用

  • 基于提示词的应用很难形成壁垒,通过特定手段可以获取到应用的提示词

RAG

RAG(Retrieval-Augmented Generation, 检索增强生成)是一种将信息检索与生成模型结合的方法。首先根据用户输入从一个大型文档集合中检索相关信息,然后将用户问题与检索信息发送到大模型,大模型生成对应答案。

RAG可以借助外部知识源,从而提升回答的准确性和信息丰富度,相当于为LLM配置了一个书架,虽然有些知识不知道,但可以参考相关书籍从而获取不错的答案。可以用来做文档问答系统、客服系统、企业内私有数据的问答系统。

「技术」

实现一个基础的RAG应用,如上图所示,一般包含如下步骤:

  1. 将知识库拆分成固定大小的块

  2. 选择合适的Embedding模型将数据块向量化,存放在VectorDB(向量数据库)中

  3. 用户查询时,在VectorDB中匹配相关内容

  4. 将用户输入与检索信息发送给大模型

  5. 大模型整理后返回结果

图中也展示一些知识来提升RAG的效果,比如:

  • 混合搜索,通过多路召回,综合VectorDB、DB与其他数据源中的数据以提升回答的准确性

  • 数据清洗,RAG应用的效果依赖于高质量的数据

  • 效果评估,引入评估系统

借助llama-indexLangChain等工具,可以方便地实现RAG应用。

「与Fine-tuning的区别」

在使用中,RAG经常会与Fine-tuning(微调)做比较。

  • RAG可以借助外部数据集,通过检索数据发送给大模型以提升回答效果,大模型本身不知道这些外部知识。RAG成本更低,适合频繁更新的场景,新闻摘要、实时回答等。

  • Fine-tuning是在较小的数据集上继续训练大模型,使其参数更好地适应任务需求。有助于模型理解任务的细微差别,通常用于情感分析、法律文档分析和医学报告生成等需要特定领域术语和风格的任务。微调的上限更高,成本也更高,但不适合频繁更新数据的场景。

两者并不互斥,可以结合一起以实现更好的效果。

「局限」

  • 检索相关性,检索的相关性直接影响最终的效果,通过向量检索来匹配TopK内容,比如问你吃了吗,正确的应该是去搜索我吃了...而不是直接搜索问题

  • 汇总信息,无法进行对比和汇总,比如分析近10天关于AI的新闻

  • Token限制,每个LLM都有Token数限制,一些长上下文可能无法全量发送给LLM

Workflow

对于一些复杂任务,LLM并不能很好处理,可以将这些任务拆分成多个步骤,每个步骤使用LLM实现一个简单的任务,将这些任务串起来便是Workflow

比如可以实现一个歌词应用,拆分为作词与评论,作词链只负责作词,根据用户输入输出对应的歌词;评论链负责给出歌词的修改建议。

INPUT -> [LYRICIST CHAIN(LLM) ] -> LYRIC -> [REVIEWER CHAIN(LLM)] -> OUTPUT

「技术」

Workflow是将复杂任务分解为更小的、可管理的单元,结合LLM实现一个多步骤的复杂任务。可以是链式的、或者更复杂的有向无环图。比如LangChain的名字本身就指的是大模型链,其中的SimpleSequentialChain就是顺序调用链、RouterChain路由链,可以动态选择下一个路径形成更复杂的工作流。

「局限」

  • 工作流的调用关系在代码中是写死的,无法灵活处理,只适合特定任务

  • 误差累积,初期步骤的错误可能导致执行失败

  • 上下文丢失,链条过长造成上下文模糊甚至丢失

Agent

Agent本意是代理人,比如房屋中介,能代替人做部分事情。具体到LLM Agent目前没有一个统一的定义,常翻译为智能体,通常指能够能够感知环境、进行决策并执行动作的智能实体。

「技术」

![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传](https://img-

Agent可以用公式定义为:

Agent = LLM + Planning + Action + Tools + Memory

智能体能够实现复杂任务的规划,可以借助外部工具执行每一个步骤,根据执行结果不断调整,并将结果记录存储起来,最终完成任务。拆开来看:

  • LLM:LLM作为智能体的**「大脑」**,可以实现任务的规划、根据执行结果进行反思。

  • Tools:由于LLM本身的局限,借助外部工具赋予智能体**「双手」**,可以根据任务步骤做出行动,如查询天气、执行代码、搜索内容。

  • Memory:智能体可以**「记忆」**过去的经验,这对学习至关重要,可以根据这些先前的经验调整未来的行动。

借助智能体我们可以实现更加智能化、多步骤的任务,相比Workflow具体的执行流是由LLM制定的,并不是人类经验的硬编码。使用Agent可以实现数据分析、智能个人助手、自动运维工具等。

更进一步多智能体(Multi-Agent)可以视为一个智能社会,不同Agent分工协作实现更加复杂的场景,例如一个软件公司包括**「产品经理 / 架构师 / 项目经理 / 工程师」**多个智能体,一起协作来实现复杂的软件。当前也有一些多智能体的框架,如MetaGPTLangGraph等。

「局限」

  • 依赖LLM,Agent的推理、反思、规划能力都依赖大模型,不同模型效果有差异

  • 很难脱离人类单独运行,一些危险操作(修改数据),无法保证Agent的精确性,需要人类参与

  • 复杂性,实现更复杂,尤其是多智能体,很难测试验证

总结

大模型时代,作为开发者我们可以借助大模型的能力实现更加智能的应用,本文介绍了多个大模型的开发级别,从简单的提示词到智能体,每一个级别都有其特点和局限,选择合适的技术来适配不同场景,你也可以转化为一个AI加持的开发者。

展望一下未来,随着AI技术的发展,真正的智能有没有可能实现呢?各种智能体可以替代我们做事,甚至做一些人类做不到的事情。

在这里插入图片描述

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2100236.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Massive Exploration of Neural Machine Translation Architectures论文解读

基本信息 作者D Britzdoi发表时间2017期刊EMNLP网址https://arxiv.org/abs/1703.03906v1 研究背景 1. What’s known 既往研究已证实 神经机器翻译NMT是一种自动翻译的端到端方法(Neural Machine Translation by Jointly Learning to Align and Translate论文里的…

Gartner《2024中国安全技术成熟度曲线》AI安全助手代表性产品:开发者安全助手D10

海云安关注到,近日,国际权威研究机构Gartner发布了《2024中国安全技术成熟度曲线》(Hype Cycle for Security in China,2024)报告。 在此次报告中,安全技术成熟度曲线将安全周期划分为技术萌芽期(Innovation Trigger)…

快捷开发技巧-idea如何提取代码成方法

1.首选选中要抽取的代码段 2.右键选择Refactor->Extract Method 3.调整方法名称 4.回车保存

Find My资讯|腾势联名九号推出F2 升级版电动滑板车,支持苹果Find My功能

比亚迪腾势与九号电动推出的联名电动滑板车 F2 升级版已在腾势商城上架,该车支持苹果“Find My”查找功能,续航里程 40 公里,售价为 2999 元。 该车配备 30 毫米双筒减振,采用 10 英寸自修复果冻胎,拥有前碟刹 后 E…

改变地址栏的网址链接路径或传参,不刷新当前网页页面

window.history.replaceState(null, null, "/网址后面的路径?参数参数值1");window.history.replaceState(null, null, "./当前路径保留?参数参数值1");

linux 系统中关于文件压缩效率/压缩比的说明

前言 tar.gz(或tgz)格式是Linux中常用的压缩格式,它结合了tar的打包功能和gzip的压缩功能。根据搜索结果,tar.gz格式在压缩比率、压缩和解压速度上取得了较好的平衡。 在一项测试中,一个大约23GB的目录使用tar.gz格式…

win7一键修复所有dll缺失!全面介绍电脑DLL文件丢失修复过程!

在Windows 7操作系统中,DLL(动态链接库)文件扮演着至关重要的角色。它们是Windows系统和其他应用程序正常运行所必需的组件。然而,由于各种原因,如系统更新不当、软件卸载不完全或恶意软件攻击,DLL文件可能…

线性结构队列栈知识点(软件设计师)

线性结构 1.线性表2.线性表存储结构顺序存储链式存储 3.栈4.队列5.串 1.线性表 线性表是最简单、最基本的数据结构。线性表常采用顺序存储和链式存储,主要的基本操作是插入、删除和查找等 2.线性表存储结构 顺序存储 插入、删除 移动元素查找时间复杂度O(1) 可以随…

极简的go语言channel入门

写在文章开头 很久没写go语言相关的文章了,近期准备整理整理go语言channel相关的知识点,而本文将通过几个示例快速带读者了解channel的基本概念,希望对你有帮助。 Hi,我是 sharkChili ,是个不断在硬核技术上作死的 ja…

Vue笔记总结(Xmind格式):第六天

Xmind鸟瞰图: 简单文字总结: 动态组件 1.组件中name属性的作用 递归组件:一个组件要用自己的时候,可以通过自己的名字来使用自己。 2.组件缓存 组件切换会导致组件被频繁销毁和重新创建, 所以性能不高,Vue内置的keep-alive组件包起来要频繁切…

2024年(第7届)“泰迪杯”数据分析技能赛通知

由泰迪杯数据分析技能赛组织委员会、广东泰迪智能科技股份有限公司主办,广东省工业与应用数学学会、人民邮电出版社和北京泰迪云智信息技术研究院协办的“泰迪杯”数据分析技能赛(以下简称竞赛)即将开展。 竞赛目的在于以赛促学、以赛促教、…

企业架构的概念及发展历程简述(附TOGAF架构理论学习资料下载链接)

企业架构在数字化转型中发挥着至关重要的作用。它不仅确保了战略一致性、提高了运营效率、强化了信息安全,还指导了数字化转型路径、推动了技术与业务的深度融合以及促进了生态系统的连接。因此,在数字化转型过程中,企业应高度重视企业架构的…

2023年中国90后十大影响力人物

“2023年中国90后十大影响力人物” 2024年1月23日,揭晓了由网友投票评选的中国2023年90后十大影响力人物。

一文读懂蒙特卡洛算法:从概率模拟到机器学习模型优化的全方位解析

爱德华蒙克(Edvard Munch)的"蒙特卡洛赌场的轮盘桌"(1892) 蒙特卡洛方法的起源与发展 1945年,在第二次世界大战即将结束之际,一场看似简单的纸牌游戏引发了计算领域的重大突破。这项突破最终导致了蒙特卡洛方法的诞生。参与曼哈顿计划的科学…

day05 1.运算符重载

#include <iostream> #include <cstring> using namespace std;class myString {private:char *str; //记录c风格的字符串int size; //记录字符串的实际长度public://无参构造myString():size(10){str new char[size]; //构造出一个长度为10的…

解除禁售!Ozon重新开放电子产品等品类销售,Ozon出单了怎么发货?

今年6月份&#xff0c;俄罗斯电商平台Ozon暂时关闭了电子产品、汽车配件和DIY工具三大品类&#xff0c;相关数据显示&#xff0c;有69%的电子产品是中国制造的&#xff0c;如耳机耳麦、充电器、智能手机、平板电脑、电子元器件等。这项禁售政策影响了众多卖家的销售业务&#x…

电赛2024年H题智能小车基于MSPM0G3507主控MCU(利用8路灰度加上MPU6050的解决方式)具体项目报告

题目&#xff1a;自动行驶小车&#xff08;H题&#xff09; 摘要 本项目由微处理器MSPM0G3507&#xff0c;编码器电机驱动&#xff0c;8路灰度传感器指示线巡线单元&#xff0c;MPU6050六轴传感器无线直行单元&#xff0c;OLED显示人机互动单元&#xff0c;红色LED及蜂鸣器声光…

Windows Server 2019 中文版、英文版下载 (updated Aug 2024)

Windows Server 2019 中文版、英文版下载 (updated Aug 2024) Windows Server 2019 Version 1809 请访问原文链接&#xff1a;https://sysin.org/blog/windows-server-2019/&#xff0c;查看最新版。原创作品&#xff0c;转载请保留出处。 本站将不定期发布官方原版风格月度更…

springboot驾校预约管理系统—计算机毕业设计源码25540

摘 要 随着科学技术的飞速发展&#xff0c;各行各业都在努力与现代先进技术接轨&#xff0c;通过科技手段提高自身的优势&#xff1b;对于驾校预约管理系统 当然也不能排除在外&#xff0c;随着网络技术的不断成熟&#xff0c;带动了驾校预约管理系统 &#xff0c;它彻底改变了…

【C语言从不挂科到高绩点】08-作业练习-循环结构01

Hello!彦祖们,俺又回来了!!!,继续给大家分享 《C语言从不挂科到高绩点》课程,前面课程中给大家讲解了一些常规的知识点,那么本次课,我们一起来练习挑战一下!! 本套课程将会从0基础讲解C语言核心技术,适合人群: 大学中开设了C语言课程的同学想要专升本或者考研的同…