提示词工程学的前世今生:Generative Pre-trained Transformer 到AIGC,再到Prompt Engineering

news2024/9/28 7:20:35

人工智能(Artificial intelligence,AI)的演进已然变革了我们对于技术的理解以及应用方式。自最初的规则系统直至当下的深度学习,AI 在众多领域均彰显出了极为巨大的潜力。当中,生成式预训练模型(Generative Pre-trained Transformer,GPT)属于近些年来引发广泛瞩目的技术之一。并且基于这些技术,人工智能生成内容(AI-Generated Content, AIGC)获得了广泛的运用。而提词工程学(Prompt Engineering)作为与 AIGC 紧密相连的新兴范畴,也逐步吸引了人们的关注。

一、GPT的发展历程

GPT的核心是Transformer架构,它由Vaswani等人在2017年提出。Transformer通过自注意力机制(Self-Attention)来捕捉序列中各个位置之间的关系。相比传统的循环神经网络(RNN)和卷积神经网络(CNN),Transformer在处理长序列时效率更高,性能更好。GPT采用预训练-微调(Pre-training and Fine-tuning)的策略。在预训练阶段,模型在大规模未标注数据上进行训练,学习语言的基本结构和规律。微调阶段,模型在特定任务的数据集上进行调整,使其适应具体的应用场景。这个策略使得GPT能够在不同任务上表现出色。

2018年,OpenAI发布了GPT-1,这是第一个基于Transformer的生成预训练变换器模型。2019年,OpenAI推出了GPT-2,这一版本在参数量上有了显著的提升,从GPT-1的1.17亿参数增加到15亿参数。2020年,OpenAI发布了GPT-3,它的参数量达到了1750亿,是GPT-2的十倍多。

2023年,OpenAI发布了GPT-4,进一步提升了模型的能力和性能。GPT-4不仅在参数量上有所增加,还在处理复杂语言任务、理解上下文、生成连贯文本等方面表现出色。2024年,OpenAI推出的“GPT-4o mini”迷你AI模型和SearchGPT原型,都是其致力于在“多模态”领域保持领先地位的一部分。所谓“多模态”,即在一个工具内部,提供多种类型的AI生成媒体,包括文本、图像、音频、视频以及搜索功能。

二、GPT时代的AIGC

AIGC(AI-generated Content)即由人工智能所生成的内容,涵盖的范畴包括但不限于文本、图像、音频以及视频等等。AIGC 技术的关键核心在于生成模型,例如 GPT 之类,其凭借对大量数据的学习从而生成高品质的内容。AIGC 的问世,给内容创作带来了全新的可能性以及挑战。

我们应当了解,AIGC 的发展历程能够追溯至 20 世纪 60 年代,彼时约瑟夫·魏岑鲍姆(Joseph Weizenbaum)研发出了 ELIZA,这属于早期的自然语言处理程序,其旨在模拟人类之间的对话。ELIZA 能够借助简单的模式匹配技术和用户展开互动,尽管功能存在一定的局限性,然而它却彰显出计算机生成类人交互的潜力。不过,伴随 OpenAI 的 GPT 系列的推出,这意味着 AIGC 迈入了一个至关重要的里程碑阶段。由于 GPT 模型运用了 Transformer 架构,经过大量数据的预训练,能够生成连贯且与上下文紧密相关的文本,极为逼真地效仿人类的写作风格。不管是新闻报道、市场营销的相关内容,还是社交媒体的帖子,AI 均能够迅速生成高质量的文本内容。举例来说,GPT-3 被广泛运用于生成新闻文章、博客内容以及技术文档等等。这些成效都是以往的技术所无法达成的!

三、AIGC 的发展催生了提示词工程学

随着 ChatGPT 的问世和发展,一批以年轻人为主的群体开始热衷于探索大型语言模型和图像生成程序,尝试让它们执行其开发者未曾预料甚至未曾设想的任务。然而,在这个过程中,也面临着诸多技术难题和伦理争议。很多创新公司可以雇佣具有对人工智能模型命令设计和优化的人士,因为他们可以通过设计复杂的提示词来发现模型的特点来来完成工作任务。但是,要找到真正精通此道的人才并非易事,且相关成本也较高。

所以,一门这样的技术就出现了!提示词工程学(Prompt Engineering)是指通过设计和优化输入提示词,来引导人工智能模型生成期望的输出。这一过程涉及对模型行为的精细控制,以达到特定的目标或解决实际问题。提示词工程学不仅包括简单的文字输入,还可能涉及到复杂的语言结构和上下文设置。

提示词工程学的关键技术包括提示词设计、模型调整和自动化提示词生成。提示词设计是基础,常见策略有示例驱动、格式化提示和上下文设置,分别通过提供示例、特定格式和背景信息帮助模型理解任务。模型调整是提升性能的重要手段,包含模型微调以提高特定任务适应性、参数调整优化性能、多轮对话提升输出质量。随着发展,自动化生成提示词技术逐渐成熟,涵盖遗传算法、强化学习和自动化工具,分别能自动生成和优化提示词、依据反馈优化、简化设计优化流程。

伴随着各类 AIGC 模型不断增多,技术在多维度上的进步以及应用范围的拓展,提示词工程学必将发挥愈发关键的作用,为各行各业赋予崭新的机遇与挑战。期望本文能够为您带来关于提示词工程学的初步认知。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1992317.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

浮毛烦恼不复存在!不容错过的养宠好物——宠物空气净化器

猫咪一年有两次换毛季,多集中在春夏和秋冬,尤其是在春季,换毛时长可以达到一个月之久。在此期间。猫咪会疯狂掉毛,需要铲屎官们在此期间做好相关措施,让猫咪顺利度过换毛季。其中,最重要的就是猫毛清理&…

PLC远程控制网关再也不用劳累出差

在当今快速发展的工业4.0时代,随着智能制造与物联网技术的深度融合,工厂自动化系统的远程监控与管理已成为提高生产效率、优化资源配置的关键。其中,可编程逻辑控制器(PLC)作为工业控制的核心部件,其远程控…

Retrofit 自定义注解 实现可选择性的打印接口日志

序言 有时候我们需要打印okhttp的日志,但是现在的日志拦截器,不能做到接口级别的日志输出控制。要么就是全部打印。这样很影响调试效率。所以我在这块做了一些探索。 使用效果 普通输出 只需要在要打印日志的接口上添加 PrintLog 注解就可以打印&…

奥运足球背后的中国小公司

有一家中国的小公司叫做顶碁运动,居然打败了耐克和阿迪达斯这样的巨头,成功地成为了现在巴黎奥运会的足球供应商。 顶碁运动研发的足球,最大的优点就是能够在一秒钟之内精准地识别500次。因为他们在足球的内胆里面装置了芯片和传感器&#xf…

【Linux】:进程控制1(创建、终止、等待)

目录 1.进程创建 2.进程终止(退出) 2.1 什么是进程终止 2.2 进程退出的场景(原因) 2.3 进程退出码 2.4 错误码errno 2.5 进程常见的退出方法 正常终止 从main函数返回 调用库函数exit 系统接口_exit 3.进程等待 3.1 …

[qt] 多线程应用02

源码: 点击此处 一 UI 1.1 效果 1.2 代码 首先定义一系列的控件和按钮,用来显示Tcp连接数据信息。 QLabel *m_serverNameLabel;QLineEdit *m_serverLineEdit;QLabel *m_portLabel;QLineEdit *m_portLineEdit;QDateTimeEdit *m_d…

【书生大模型实战营第三期】基础岛 第3关 浦语提示词工程实践

欢迎大家参与第三期书生大模型实战营!!! 1. 基础任务 背景问题:近期相关研究发现,LLM 在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b(internlm2-chat-7b)也存在这…

数据结构——排序(2):选择排序+交换排序

目录 一、选择排序 (1)直接选择排序 ①思路 ②过程图示 ③代码实现 ④代码解释 ⑤优化 1.代码实现 2.过程图示 3.代码解释 4.注意 ⑥直接选择排序的复杂度 (2)堆排序 ①注意 ②代码实现 二、交换排序 &#xff08…

一键生成!AI绘画、视频制作与写作神助攻

市面上有各种各样的AI助手,它们覆盖了文字处理、图像编辑、视频制作到语音识别等众多领域。这些工具设计得既实用又友好,几乎每个人都能找到适合自己的那一款。 1. 文字处理助手 文本生成:帮你快速创作文章、博客等内容。 内容优化&#xff…

操作ArkTS页面跳转及路由相关心得

本文为JS老狗原创。 当前端不得不关注的点:路由,今天聊一聊鸿蒙相关的一点心得。 总体上套路不意外,基本就是(尤其是Web)前端那些事:维护路由表、跳转带参数、历史堆栈操作,等等。 历史原因&…

越秀·星汇城|大城好生活

建筑,是美好生活的载体。而户型则是住宅的灵魂,一处好的居所,承载理想生活盛放。 细腻的美好藏在生活各个角落,星汇城以24小时贯穿的细节享受,重新定义幸福该有的舒适。诉说生活的达观,臻藏岁月静好。 8:…

windows系统获取网卡信息

在抓包或者使用socket,或者监听端口时,如果使用的是pcap4j类库,就会用到网卡信息,那么怎么查看本机的网卡信息呢,Linux的比较方便,直接通过ifconfig命令就能看到, windows的比较麻烦一点&#x…

【名单】山东省2024年度第一批DCMM贯标试点企业名单

​各市工业和信息化局: 为深入贯彻全省工业经济头号工程推进会议有关部署,全面落实《关于加快数字经济高质量发展的意见》《2024年“促进经济巩固向好、加快绿色低碳高质量发展”政策清单(第一批)》等文件要求,充分发…

从根儿上学习spring 十 之run方法启动第四段(4)

我们接着上一节已经准备开始分析AbstractAutowireCapableBeanFactory#doCreateBean方法,该方法是spring真正开始创建bean实例并初始化bean的入口方法,属于核心逻辑,所以我们新开一节开始分析。 图12 图12-530到536行 这几行的主要就是创建b…

先天亏钱圣体!谢瑜、陈梦、全红婵夺冠后,我看到了最残酷的社交真相——早读(逆天打工人爬取热门微信文章解读)

我怎么寻思这是普通事故 引言Python 代码第一篇 洞见 谢瑜、陈梦、全红婵夺冠后,我看到了最残酷的社交真相第二篇 亏麻了结尾 没想到是辆切糕车 引言 昨天文章的数据不错呀 200 的阅读 20的收藏 10:1已经是很高的比例了 再来干货吧 以后大家要是做视频 心中看到这…

Spring Cloud微服务项目聚合Swagger文档

在微服务架构中,每个服务通常都有自己独立的 API 文档。为了方便管理和查看所有服务的接口文档,我们需要将这些文档进行聚合。Spring Cloud 与 Swagger 的结合可以帮助我们实现这一目标。本文将介绍如何在 Spring Cloud 微服务项目中聚合 Swagger 文档&a…

72 成员方法、类方法、静态方法、抽象方法

在面向对象程序设计中,函数和方法这两个概念是有本质区别的。方法一般指与特定实例绑定的函数,通过对象调用方法时,对象本身将被作为第一个参数自动传递过去,普通函数并不具备这个特点。 class Demo:passt Demo()def test(self,…

html+css网页设计公司网站模版3个页面 无js 静态页面

htmlcss网页设计公司网站模版3个页面 无js 静态页面 网页作品代码简单,可使用任意HTML编辑软件(如:Dreamweaver、HBuilder、Vscode 、Sublime 、Webstorm、Text 、Notepad 等任意html编辑软件进行运行及修改编辑等操作)。 获取源…

推送给女朋友让她自己学习打光去(Stable Diffusion进阶篇:Imposing Consistent Light)

大家好我是极客菌!!! 对于学过stable diffusion的小伙伴来说,forge UI和Comfy UI会更加熟悉一些。在IC-Light发布后,Openpose editor的开发者将其制作成了一个Forge UI上的插件。 **https://github.com/huchenlei/sd-…

国内有哪些可以交易上证50etf期权的平台?

随着期权交易的普及,越来越多的投资者开始关注期权交易app平台。期权开通方式有券商和期权分仓平台两种,目前期权交易费用是7元左右一张,期权佣金是可以根据券商的证券范围进行调整的,下文为大家科普国内有哪些可以交易上证50etf期…