我日常是如何使用LLM工具的:你的LLM工具没用起来,可能是因为方法不对。

news2024/11/15 2:10:56

引言

我对 Prompt 认知经历了 2 个阶段:

第一阶段:去年 3 月-11 月,我认为 Prompt 最终会灭亡。

第二阶段:去年 12 月至今,我有两个理解:

  • 在主流 LLM 工具(比如 ChatGPT,文心一言等大模型厂商的对话产品,以下统称 LLM 工具)中,Prompt 能力未来会像我们现在使用 word,ppt,excel 的能力一样,人人必备。
  • 在垂直领域的 AI 应用中,prompt 对用户会消亡,因为好的 AI 应用会把 Prompt 完美地嵌入到 AI 应用中。也正因如此,Prompt 工程是 AI 应用开发者一项必不可少的能力。在这种场景下,我把 prompt 定义为 AI 应用的最后一公里,是一项系统实验工程。

而公众的认知,基于我从 explodingtopics.com(基于爬虫技术帮助用户发现、预测爆点的网站)上的数据来看:

第一阶段:2022 年 12 月,ChatGPT 第一次发布后,Prompt engineering 一路飙升到今年 7 月到达最高峰。

第二阶段:2023 年 7 月至今,开始迅速回落。

我们套用被历史多次验证的 Gartner 技术曲线,Prompt engineering 的发展正趋于稳定,但无论如何不会超过 2023 年的最高峰(橙色部分为我认为的未来关注度,仅供参考)。

图片

所以不要过高估计 prompt engineering 的未来发展,也不建议大家把它作为职业生涯的长期规划。类比来说,20 年前有个工种叫办公自动化,主要就是操作 office 套件,现在人人都能用 office。

也正是这样一个趋于稳定的时间点,加上最近的一些实践,会让我自己更理性的看待 Prompt engineering,今天就和大家一起聊聊 prompt engineering 的话题,按照我目前的认知分为两个话题:

话题 1:日常工作中我是如何做好 prompt 来使用 LLM 工具的,目的主要是“教会大家如何使用 office”,也解答周围人经常问我的问题。这一部分会以原则和实例来说明,不会有特别专业的词汇(prompt 工程在传播过程中有点故弄玄虚了)。

话题 2:如何在构建产品时合理发挥 prompt 的作用,这一部分会单独在下一篇文章中聊一下(不然太长了)。目前讲这块的文章确实不多,甚至很多产品都把 prompt 是作为自己的核心的、不可泄露的内容,我就抛砖引玉。

2

日常工作中我是如何使用 prompt 的

直至今日,我身边的大多数人对 LLM 工具的使用是跟着舆论热点走的,比如最近 claude 3 出来了,大家可能就赶紧再去使用一下,过了几天就凉了。我自己的使用频率稍有不同,是“隔三差五”的频率。

在这里插入图片描述

这其中有两个原因:

  • 一是 LLM 工具最擅长的文字、coding 工作仅仅是工作的一部分,agent 应用有望能 cover 更多的工作,但 agent 应用目前还没有普及。
  • 二是大家对 LLM 的期待过高,从而导致使用方式的错误,进而容易放弃使用 LLM。我自己也是经历了一段时间后才摸索出来适合自己的方式,这也是本文的重点,希望对大家有借鉴意义。

接下来我会以写文章为例来说明我是如何使用 LLM 工具的,在这之前声明几个重要的原则。

2.1

LLM 工具使用原则

1.我会借助 LLM 工具来写文章,但往往最后会发现没有一段话是 LLM 直接给我的,所以放低你对LLM工具的期待,但它确实会成为你的助手。

2.长文的撰写中,LLM 的质量依然没有保障。其实这是好事,不然你的价值又在哪里?

3.在撰写任何一篇文章之前,我会做较多的调研和实践,以保证自己对 LLM 的回答有基本判别能力。在调研过程中,我不会使用大模型的总结能力,因为此时我并没有构建出基本的判别能力,总结是一种有损压缩,且损失特别大。除非你对某个话题特别了解,否则不要用总结功能。

4.我总是会给 LLM 工具很多我认可的参考文章,而不是纯粹依赖 LLM 的能力。

5.工作中需要敷衍的文章(我知道大家绝对有这个诉求) 确实可以很高效地用 LLM 工具完成。

接下来说说在使用 LLM 工具前要做的准备工作:拆解任务

2.2

准备工作:拆解你的任务

在写文章的例子中,我把这个任务拆成几个步骤: 选题→调研 →构思大纲 →把内容填充到大纲中 →配图 →排版。我把每一步 LLM 参与的比例、所花费时间用图表示出来。

图片

可以看出:

  • 最耗时选题和调研是 LLM 工具最难参与的,这一部分从理性角度来讲,我认为目前还是要以真人参与为主,我主张 LLM 在工作中是一个工具,当然可能有人和我持完全相反的态度。
  • 最不耗时的配图和排版 LLM 参与少是因为“打苍蝇用不着大炮”。如果使用 MJ 和 DALL 3 等工具精准控图,要说好多提示词,还不如传统工具来得快;另一个步骤排版,传统工具也已经做得很好了。
  • 目前看起来只有中间填充大纲内容部分LLM工具参与度比较高。

拆解步骤后,就是针对这些步骤写 prompt 模板了。我的每一步会有一个或几个 prompt 模板,我推荐每个人都慢慢积累一套自己的模板。

如何撰写 prompt 模板,我用一句话概括就是:

用招聘任务助理的方式来写 prompt。

想象你在招聘个人助理时,需要你撰写招聘文案,俗称 JD(Job descriptiong)。你的 JD 怎么写,prompt 就怎么写(这个比喻便于大家记忆,也是我根据网上的各种资源做的一个总结,通俗地覆盖了 80% 的 open AI prompt 策略)。

这是我随意从 BOSS 直聘上找到的 JD 和我日常使用的一个 prompt 模板的对照,你会发现他们的结构是一样的,但在具体内容上,Prompt 会执行更细,更具体的 task。

图片

接下来详细说明每一步。

2.3

手把手使用 LLM 工具示例

前几天我想写一篇关于 “苹果取消电动汽车项目”的文章,我按照上述的步骤一步步来看:

1.选题。在这个例子中选题不用我想了。如果你不确定选题,我也不太建议你寻求 LLM 的帮助(因为 LLM 的信息不是实时的),而是通过一些大数据平台,google trends ,expodingtopic 等寻找合适选题。

2.调研。在这之前,我对苹果电动汽车项目其实并不了解。我首先通过 google 搜索,perplexity.ai,知乎等地略读了大约 15-30 篇文章。

3.选用合适的思维框架并列出大纲。根据某种思维框架构思出文章思路,这些框架我已深深印刻在脑海中(比如 5W2H 框架,总分总框架,What+WHY + HOW 框架,MECE 框架,timeline 的框架,四象限框架等等),这些框架也会在一篇文章中混合、嵌套使用。一般在调研之后,我自己就能选出合适的框架来构思。如果不熟悉如何选择这些框架,你可以借助 LLM 来帮助你完成这一工作,在提示词中指定:

  • 角色为:科技博主
  • 技能为:熟悉各种思维框架;熟悉科技最新动态;拥有较强的构思能力。
  • 步骤为:我会给你一个主题和一个思维框架 → 请你按照这个思维框架,为这个主题列出构思大纲。
  • 初始化:我给你的主题是:<苹果取消电动汽车项目>,我给你的思维框架是:<5W2H>。

多试几个框架,选出你认为最合适的就好,下图是我用百川大模型的结果。

图片

4.填充大纲内容。大纲构建出来之后,再看你调研的内容是否足以填充到相应的内容中,如果没有相应的内容,则:寻找更多的资料或者调整大纲。然后将对应内容填入大纲。这一部分大模型的参与最多,牢记两点:

  • 要给定你认可的参考资料避免 LLM 胡说八道(参考 openAI prompt策略 Provide reference text: https://platform.openai.com/docs/guides/prompt-engineering/provide-reference-text )。
  • 小标题一个个完成,不要让大模型一次性完成多个小标题(参考 openAI prompt 策略 Split complex tasks into simpler subtasks: https://platform.openai.com/docs/guides/prompt-engineering/split-complex-tasks-into-simpler-subtasks )。

在这篇文章中我针对大纲的第二个标题 When 中有一项是“概述苹果电动汽车项目的时间线”,我就会去用我的模板:“给出参考文章和主题总结 timeline”,只需要把最后提到的参考文章链接和主题更改一下就可以,注意这些参考文章是根据之前的人工调研得到你认可的文章。

当然我还有其他模板,公众号回复“提示词”即可获得全部模板

  • 给出主题写思路
  • 给出思维框架和主题写大纲和段落概要
  • 给出主题、大纲、参考文章,写出新文章(用于写敷衍性的文章)
  • 给出参考文章和主题写段落
  • 给出参考文章和主题总结 timeline
  • 从某参考文章中快速找到确定性答案
  • 完整读某篇参考文章
  • 根据步骤画出 Mermaid 流程图

填充大纲内容后,接下来的两个工作就是:插图和排版。

5.插图。有些创意性的图片会在 midJourney 社区中寻找或直接生成,博客文章中的图要加上具体的标记还是推荐在传统做图软件中实现。

6.排版。我用 md 格式撰写,notion、飞书等工具已经做得很好了。在公众号文章中我用的是 knb 的模板,md 放进去基本不用修改。

这样,一篇文章基本就写完了。当然,LLM 工具还有很多其他使用场景,比如算数学题题,可能会使用完全不同的任务拆解方法和提示词结构,有的还会涉及到一些 prompt 的专业技巧名词,比如:

  • COT: Chain of thought, 其实就是提示词中添加具体操作步骤,越细越好。
  • zero shot/few shot: shot 的意思就是举例说明,在提示词中加上举例会让 LLM 工具更好地理解你
  • SBP:step backward prompt,就是把你的问题抽象一下再给大模型。比如一个物体从 100 米的高处落下到地上的速度是多少,SBP 就是在提示词里加上这样一句话“这个问题遵循什么物理规则”。

这些技巧就像 office 套件中的高级功能,大家可以了解一下,需要的时候搜索使用即可。

3

总结

今天和大家讲了一点朴素的提示词工程能力,供大家日常使用,不必焦虑天天要用,即使是今天这篇文章,LLM 的参与度也不算特别高,大概 30%左右。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1931226.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

dom4j 操作 xml 之按照顺序插入标签

最近学了一下 dom4j 操作 xml 文件&#xff0c;特此记录一下。 public class Dom4jNullTagFiller {public static void main(String[] args) throws DocumentException {SAXReader reader new SAXReader();//加载 xml 文件Document document reader.read("C:\\Users\\24…

leetcode刷题总结——字符串匹配

KMP&#xff08;字符串匹配算法&#xff09; 主串或目标串&#xff1a;比较长的&#xff0c;我们就是在它里面寻找子串是否存在&#xff1b; 子串或模式串&#xff1a;比较短的。 前缀&#xff1a;字符串A和B&#xff0c;A BS&#xff0c;S非空&#xff0c;则B为A的前缀。 …

C++从入门到精通(第2版) 中文电子版

前言 C&#xff08;c plus plus&#xff09;是一种计算机高级程序设计语言&#xff0c;由C语言扩展升级而产生&#xff0c;最早于1979年由本贾尼斯特劳斯特卢普在AT&T贝尔工作室研发。C既可以进行C语言的过程化程序设计&#xff0c;又可以进行以抽象数据类型为特点的基于对…

四、GD32 MCU 常见外设介绍

系统架构 1.RCU 时钟介绍 众所周知&#xff0c;时钟是MCU能正常运行的基本条件&#xff0c;就好比心跳或脉搏&#xff0c;为所有的工作单元提供时间 基数。时钟控制单元提供了一系列频率的时钟功能&#xff0c;包括多个内部RC振荡器时钟(IRC)、一个外部 高速晶体振荡器时钟(H…

Python os模块的强大功能与应用详解

概要 在Python中,os模块提供了与操作系统进行交互的功能,允许我们执行各种操作系统任务,如文件和目录操作、环境变量访问、进程管理等。os模块是标准库的一部分,无需额外安装。本文将详细介绍os模块的功能,并提供相应的示例代码,帮助全面掌握这一强大工具。 os 模块概述…

支付宝低代码搭建电商小程序,无需编程,可视化操作

大家好&#xff0c;我是小悟 在数字化浪潮的推动下&#xff0c;为了更快速、高效地搭建电商小程序&#xff0c;支付宝低代码平台凭借其独特优势&#xff0c;为商家提供了便捷的解决方案。 支付宝低代码平台犹如一座精心打造的智慧工坊&#xff0c;让电商小程序的搭建变得轻而易…

【 香橙派 AIpro评测】烧系统运行部署LLMS大模型跑开源yolov5物体检测并体验Jupyter Lab AI 应用样例(新手入门)

文章目录 一、引言⭐1.1下载镜像烧系统⭐1.2开发板初始化系统配置远程登陆&#x1f496; 远程ssh&#x1f496;查看ubuntu桌面&#x1f496; 远程向日葵 二、部署LLMS大模型&yolov5物体检测⭐2.1 快速启动LLMS大模型&#x1f496;拉取代码&#x1f496;下载mode数据&#x…

【Outlook】从Outlook新版回归经典版全攻略

引言 在微软宣布计划于2024年底淘汰邮件应用&#xff08;Mail app&#xff09;之后&#xff0c;许多用户发现新版Outlook应用&#xff08;Outlook (new)&#xff09;在他们的Windows 11/10系统上自动启动。如果您更倾向于使用经典版Outlook&#xff08;Outlook (classic)&…

大气热力学(11)——热力学图的应用之二(焚风)

本篇文章源自我在 2021 年暑假自学大气物理相关知识时手写的笔记&#xff0c;现转化为电子版本以作存档。相较于手写笔记&#xff0c;电子版的部分内容有补充和修改。笔记内容大部分为公式的推导过程。 文章目录 11.1 焚风的概念11.2 焚风形成的原理11.3 焚风的示意图 11.1 焚风…

Caido——Burpsuite强有力的竞品工具

0x00 最近发现一个burpsuite的竞品&#xff1a;Caido&#xff0c;尝试使用了一下&#xff0c;发现它的功能还是挺强大的&#xff0c;而且在用户体验上&#xff0c;比Burpsuite要好不少&#xff01;和大家分享一下。 Caido是一款用RUST语言编写的代理工具&#xff0c;目前处于…

nftables(7)集合(SETS)

简介 在nftables中&#xff0c;集合&#xff08;sets&#xff09;是一个非常有用的特性&#xff0c;它允许你以集合的形式管理IP地址、端口号等网络元素&#xff0c;从而简化规则的配置和管理。 nftables提供了两种类型的集合&#xff1a;匿名集合和命名集合。 匿名集合&…

捷配总结的SMT工厂安全防静电规则

SMT工厂须熟记的安全防静电规则&#xff01; 安全对于我们非常重要&#xff0c;特别是我们这种SMT加工厂&#xff0c;通常我们所讲的安全是指人身安全。 但这里我们须树立一个较为全面的安全常识就是在强调人身安全的同时亦必须注意设备、产品的安全。 电气&#xff1a; 怎样预…

【顺序表】算法题 --- 力扣

一、移除元素 移除元素 这个题让我们移除数组nums中值为val的元素&#xff0c;最后返回k&#xff08;不是val的元素个数&#xff09; 这样显然我们就不能再创建一个数组来解决这个问题了&#xff0c;只能另辟蹊径 思路&#xff1a;双指针 这里定义两个指针&#xff08;l1&…

【Python】连接MySQL数据库:详细教程与示例代码

文章目录 1. 安装必要的库2. 建立与MySQL的连接3. 执行SQL查询4. 插入数据5. 更新数据6. 删除数据7. 错误处理8. 小结 在数据驱动的开发中&#xff0c;连接数据库是一个至关重要的技能。Python作为一门强大的编程语言&#xff0c;提供了多种方式连接并操作MySQL数据库。本文将详…

nuitka 打包python程序成windows exe可执行文件

参考&#xff1a; https://www.zhihu.com/question/281858271/answer/2466245521 https://www.zhihu.com/question/281858271 https://zhuanlan.zhihu.com/p/689115995 https://blog.csdn.net/Pan_peter/article/details/136411229 下载&#xff1a; pydantic-2.6.1 pydantic-…

通讯的概念

通讯的概念 文章目录 通讯的概念1.通讯的基本概念2. 串行通讯与并行通讯2. 全双工、半双工及单工通讯3. 同步通讯与异步通讯4. 通讯速率 1.通讯的基本概念 通讯是指在嵌入式系统中实现数据交换的技术手段&#xff0c;它涉及到硬件与硬件、硬件与软件之间的信息传输。基本概念包…

OneForAll工具:安装指南、使用方法及常见问题解决(超全)

引言 在网络安全领域&#xff0c;子域名收集是信息收集过程中非常重要的一步。OneForAll 是一款功能强大的子域名收集工具&#xff0c;能够帮助我们高效地进行子域名收集。本文将详细介绍 OneForAll 的安装和使用方法&#xff0c;并解决在使用过程中可能遇到的问题。 1. OneFo…

手机找回删除的通讯录号码,2个方法,让你不再烦恼

在数字化的浪潮中&#xff0c;我们的手机通讯录如同一张张精心编织的社会网络图谱&#xff0c;每一串数字背后都蕴藏着一段故事或一个重要的联系。然而&#xff0c;生活总会面临小插曲&#xff0c;总有些时候会不慎将通讯录遗失。不用过多担心&#xff0c;本文将会提供一些方法…

Facebook:数字时代的社交瑰宝

在当今数字化飞速发展的时代&#xff0c;社交媒体已经成为人们日常生活中不可或缺的一部分&#xff0c;而Facebook作为其中的领军者&#xff0c;不仅连接了全球数十亿的用户&#xff0c;更深刻地改变了人们的社交方式和生活方式。本文将探讨Facebook如何成为数字时代的社交瑰宝…

Early Convolutions Help Transformers See Better(NeurIPS 2021, Meta)

paper&#xff1a;Early Convolutions Help Transformers See Better 出发点 本文的出发点是解决 ViT 模型在优化性方面的问题。作者假设问题主要出现在 ViT 的早期视觉处理部分&#xff0c;即 "patchify" 过程&#xff0c;这是通过一个大的步幅和大核卷积来实现的…