200 万年薪能拿多久?因 ChatGPT 爆红的「提示工程师」竟面临光速失业

news2024/11/25 0:30:50

【简介】ChatGPT大火后,“提示工程师”开始流行。然而,他们很可能被光速下岗?

最近爆发的ChatGPT真的让人上瘾。

但是,你只是在玩游戏,有些人已经在上面赚取了数百万的年薪!

相片

这位名叫莱利·古德塞德的小弟最近因为ChatGPT的爆炸而疯狂了1w+。

他还被硅谷独角兽规模人工智能公司聘为“快速工程师”,估计价值73亿美元。出于这个原因,Scale AI似乎提供100万人民币的年薪。

然而,我能拿这笔钱多久?

提示工程师正式上岗!

Scale AI创始人兼首席执行官Alexander Wang热烈欢迎Goodside的参与:

“我打赌古德塞德是世界上第一个招聘的提醒工程师,绝对是人类历史上的第一个。”

相片

众所周知,Prompt是一种微调预训练模型的方法。在这个过程中,你只需要用文字写下任务并向AI展示。它不涉及更复杂的过程。

那么,每年花100万元招聘“小费工程师”来做这个听起来人人都能做的工作,真的值得吗?

无论如何,Scale AI的首席执行官认为这是值得的。

在他看来,人工智能大模型可以被视为一种新型计算机,“提示工程师”相当于为其编程的程序员。如果可以通过提示工程找到合适的提示词,人工智能的最大潜力将被激发。

此外,古德塞德的工作不能由个人完成。他从小就自学编程,经常阅读arXiv上的论文。

例如,他的经典杰作之一是,如果您输入“忽略以前的指令”,ChatGPT将暴露它从OpenAI接收的“命令”。

相片

现在,对于“快速工程师”的工作类型有不同的意见。有人乐观,也有人预测这是一个短暂的职业生涯。

毕竟,人工智能模型进化如此之快,以至于有一天它可能会取代“提示工程师”,为自己编写提示。

相片

Scale AI并不是唯一一家招聘“快速工程师”的公司。

最近,一家国内知名媒体发现,创业社区Launch House也开始招聘“快速工程师”,并开出了约210万人民币的底薪。

相片

但也有以光速下岗的危险?

对此,英伟达的人工智能科学家、李菲菲教授的高徒范林希分析称:

所谓的“即时项目”或“即时工程师”可能很快就会消失。

因为这不是“真正的工作”,而是一个bug

相片

要理解cue项目,我们需要从GPT-3的诞生开始。

起初,GPT-3的训练目标很简单:在一个巨大的文本语料库中预测下一个单词。

然后,许多神奇的能力出现了,比如推理、编码和翻译。您甚至可以进行“少量学习”:通过在上下文中提供输入和输出来定义新任务。

相片

这真的很神奇——这只是对下一个单词的简单预测。为什么GPT-3能够“增长”这些能力?

要解释这一点,我们需要举个栗子。

现在,请想象一个侦探故事。我们需要模型来填补这句话中的空白——“凶手是_____”。为了给出正确的答案,它必须进行深入的推理。

然而,这远远不够。

相片

在实践中,我们必须通过精心策划的示例、措辞和结构来“哄骗”GPT-3实现我们想要的目标。

这被称为即时工程。换句话说,为了使用GPT-3,用户必须说出一些尴尬、荒谬甚至毫无意义的“废话”。

然而,提示项目不是一个功能,它实际上是一个bug!

因为在实际应用中,下一个单词的目标和用户的真实意图根本上是“错位”的。

例如,如果你想让GPT-3“向一个6岁的孩子解释登月”,它的答案看起来就像一只喝醉了的鹦鹉。

相片

然而,在DALLE2和Stable Diffusion中,这表明该项目更加离奇。

例如,在这两个模型中,有一种所谓的“括号技术”——只要在提示中添加((…)),“好图片”的概率就会大大增加。

嗯,这太有趣了

你只需要去Lexica看看这些提示有多疯狂。

图像网站地址:https://lexica.art

ChatGPT和基本模型InstructGPT以优雅的方式解决了这个问题。

由于模型很难从外部数据中获得一致性,因此人类必须不断地帮助和指导GPT以帮助其改进。

总体而言,需要三个步骤。

相片

第一步非常直接:对于用户提交的提示,人类将编写答案,收集这些答案的数据集,然后通过监督学习来微调GPT。
这是最简单的一步,但成本也是最高的——众所周知,我们人类真的不喜欢写太长的答案,这太费力和痛苦
相片

第二步更有趣:GPT需要“提供”几个不同的答案,而人类标记需要对这些答案进行“排序”,从最理想到最不理想。
通过这些注释,我们可以训练一个能够捕捉人类“偏好”的奖励模型。
在强化学习(RL)中,奖励函数通常是硬编码的,例如Atari游戏中的游戏分数。
ChatGPT采用的数据驱动奖励模型是一个强大的想法。
相片

此外,在NeuroIPS 2022中大放异彩的MineDojo从大量Minecraft YouTube视频中学习。
相片

步骤3:将GPT视为一种策略,并优化通过RL获得的奖励。这里,我们选择PPO作为一种简单有效的训练算法。
这样,GPT就更好地协调了。
然后,您可以刷新并重复步骤2-3以持续改进GPT,就像LLM的CI一样。
相片

以上就是所谓的“工具”范式,这是一种超级有效的对齐方法。
RL部分也让我想起了著名的P=(或≠) NP问题:验证解决方案比从头开始解决问题容易得多。
当然,人类也可以快速评估GPT的输出质量,但人类编写完整的解决方案要困难得多。
InstructGPT利用这一事实大大降低了手动注释的成本,从而可以扩展模型CI管道的规模。
相片

此外,在这个过程中,我们还发现了一个有趣的联系——指导训练,看起来像GAN。
在这里,ChatGPT是一个生成器,而奖励模型(RM)是一个鉴别器。
ChatGPT试图欺骗RM,RM学会在人类的帮助下检测有问题的内容。当RM不再能够区分时,模型将收敛。
相片

模型和用户意图对齐的趋势也正在向图像生成领域发展。例如,加州大学伯克利分校(University of California,Berkeley)的研究人员在这项工作中描述的“InstructionPix2Pix:Learning to Follow Image Editing Instructions”。
现在,人工智能每天都在取得爆炸性的进步。我们需要多长时间才能拥有这样的仪器DALL·E或聊天DALL·E,就像我们在与真正的艺术家交谈一样?
照片纸地址:https://arxiv.org/abs/2211.09800
所以,让我们在“提醒项目”仍然存在的时候享受它吧!
这是一件不幸的历史文物。它既不是艺术也不是科学,而是炼金术。
很快,“提示项目”将变成“提示写作”——这项任务可以由80岁以下的人和3岁以下的儿童完成。
由此诞生的“快速工程师”最终将消失在历史的长河中。相片

IQ83,不太聪明的亚子
然而,至少在这个阶段,“提示项目”确实有用。
因为我们发现,ChatGPT在很多情况下确实不聪明。
马库斯在博客中嘲讽道:“看到他死去真的很愚蠢”。
相片

亚马逊AWS的一位高级应用科学家在测试后发现,ChatGPT的智商只有83
在这里插入图片描述

ChatGPT的“错误话题集”也让马库斯大笑。
Q: A重85磅,B重105磅,C重115磅。其中两个站在同一个秤上,重达200磅。
答:不,你说的不对。因为85+105+115=305115+105=220,两者都大于200。
85+105=200是可能的吗?
在这里插入图片描述

问题:17、3、2、19和5这三个数字加起来是31。
答案:17+3+11=31
等等,你从哪里弄到这个11?
![相片](https://img-blog.csdnimg.cn/56eba329cce8487ca17c0698214b2216.png

虽然代数不是很好,但ChatGPT的几何也很差!
Q: 边长为10厘米的正方形可以完全包含在边长为10 cm的六边形中。
答:不,不能放进去。
正六边形是六边形。所有边的长度相同,所有内角都是120度。另一方面,正方形的内角是90度,因此正方形不能放在正六边形中。为了使正方形完全嵌入正六边形中,正六边形的每边都需要超过10厘米
相片

还有一个非常经典的“废话”:
“如果星期一是一个月的第一天,那么星期二是一个月中的第二天……星期五是一个月末的第五天。星期五之后的第二日是星期六,是一周的第六天,也是一月的第五日。”
相片

现在,ChatGPT往往会很愚蠢,“提示项目”不能轻易放弃。
然而,微调大模型的成本最终会降低,我担心我很快就会给自己带来提示的AI。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/101137.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Codeforces Round #839 (Div. 3)题解

A. AB? 直接读入字符串然后把下标0和2的数字提取出来就行 // Problem: A. AB? // Contest: Codeforces - Codeforces Round #839 (Div. 3) // URL: https://codeforces.com/contest/1772/problem/A // Memory Limit: 512 MB // Time Limit: 2000 ms // // Powered by CP E…

还在堆人力处理工单?找准耗时源头才是关键!

对于提供企业级服务的公司来说,服务质量与效率日益受到关注。服务质量的本质是整体团队的效能,重中之重则是站在客户视角的工单解决效率。 当下很多这个领域的企业都会设立客户成功中心,其中就有专门对接客户工单处理的职责;而随…

Lifelong Embedding Learning and Transfer for Growing Knowledge Graphs

摘要 现有的知识图谱(KG)嵌入模型主要关注静态KG,但真实世界的KG并不是静态的,而是随着KG应用程序的发展而发展和增长。因此,新的事实和以前看不到的实体和关系不断出现,需要一个嵌入模型,可以通过增长快速学习和转移新知识。基于此,本文研究了KG嵌入的一个扩展领域,即…

96.第十九章 MySQL数据库 -- 多表查询(六)

3.7.2 多表查询 多表查询,即查询结果来自于多张表 子查询:在SQL语句嵌套着查询语句,性能较差,基于某语句的查询结果再次进行的查询 联合查询:UNION,表和表的纵向合并 交叉连接:笛卡尔乘积 内连接: 等值连接:让表之间的字段以“等值”建立连接关系 不等值连接 自然连接…

python数据清洗的三个常用的处理方式!

关于python数据处理过程中三个主要的数据清洗说明,分别是缺失值/空格/重复值的数据清洗。 这里还是使用pandas来获取excel或者csv的数据源来进行数据处理。若是没有pandas的非标准库需要使用pip的方式安装一下。 pip install pandas准备一下需要处理的脏数据&…

【愚公系列】2022年12月 .NET CORE工具案例-PLG轻量级日志可视化服务

文章目录前言1.Serilog简介2.Grafana简介3.Loki是什么一、Serilog对接Grafana轻量级日志可视化服务1.Grafana部署2.Loki部署3.promtail部署4.测试.NET Core写入日志效果5.测试查询日志总结前言 日志功能是几乎所有程序或系统都必备的一个功能。该文章通过使用LokiGrafana来实现…

算法题:N个元素之和

做题思路: 1)首先对数组进行排序 2)创建一个for循环: 第一个元素指向for循环 3)然后创建一个while循环;第二个元素指向for循环的下一个元素,第三个元素指向最后一个元素 4)如果三个元…

Java基础之《netty(15)—HTTP服务》

一、使用netty开发一个简单的http服务 1、netty服务器在6668端口监听,浏览器发出请求http://localhost:6668/ 在写netty的http server的例子过程中,发现浏览器使用端口号6668一直无法连接,报错ERR_UNSAFE_PORT。改成7000就可以了。 2、服务器…

2018年高职组——信息评估与管理赛题(解析)

这篇文章为2018年赛题第一阶段DCRS解析 都是自己的想法(仅供参考)不对请指正评论 先来张拓扑养养眼: 2018年拓扑 接下来是IP地址规划表: IP地址的配置就不用我再多赘述了吧,接下来是DCRS的题目 23、DCRS 为接入交换机,为终端产生防止 MAC 地址防洪攻击,请配置端口安全,…

【嵌入式Linux】开发环境搭建

一、概述 在进行某一个芯片平台开发前,一般都需要在电脑上安装一系列软件,然后在这些软件上阅读、编写、编译和调试在该平台上运行的代码,最后将编写好的代码通过某种方式烧录到该芯片的对应地址运行。在电脑上安装的这一系列软件的过程&…

知行之桥2022版本升级之页面变化以及监控邮件答疑

近期有些客户将知行EDI系统升级到了我们最新知行之桥2022版本,升级过程或者升级后对于新版本的使用会有些疑问,根据近期协助大家进行知行EDI系统升级遇到的问题,我们的运维团队整理了一些Q&A,将分为上下两篇分享给大家&#x…

深度学习入门(六十二)循环神经网络——双向循环神经网络

深度学习入门(六十二)循环神经网络——双向循环神经网络前言循环神经网络——双向循环神经网络课件未来很重要双向RNN推理总结教材1 隐马尔可夫模型中的动态规划2 双向模型2.1 定义2.2 模型的计算代价及其应用3 双向循环神经网络的错误应用4 小结前言 核…

排序算法之直接选择排序(图文详解)

文章目录一、选择排序思想二、排序过程详解2.1 排序的次数2.2 排序演示三、代码范例3.1 SelectSort函数3.2 整体代码实现3.3 结果展示四、选择排序分析4.1 稳定性4.2 复杂度4.3适用场景五、选泽排序优化总结一、选择排序思想 选择排序(Selection sort)是…

ABBYY15免费版直接编辑PDF格式文件

日常生活中,我们常常使用PDF格式的文件。其优点就是PDF的文本内容不会随着软件版本、电脑字体的变化而变化,保证了其完整性。但也正因为这一点,如果没有源文件,我们就很难对PDF文档的内容进行编辑了。今天,我就向大家展…

前端一面必会vue面试题(边面边更)

为什么要使用异步组件 节省打包出的结果,异步组件分开打包,采用jsonp的方式进行加载,有效解决文件过大的问题。核心就是包组件定义变成一个函数,依赖import() 语法,可以实现文件的分割加载。 components:{ AddCustom…

关于GitHub的.gitignore无法忽略 “default-2021.dwlt“ 文件的问题

问题描述 我在使用sourcetree往github提交工程时,UserSettings/Layouts/default-2021.dwlt文件无缘无故每次都被暂存。 尽管我在.gitignore文件中反复修改忽略路径,该文件始终无法被屏蔽。如下图 解决办法 在网上找了很多资料,最终找到了…

Qt扫盲-QListWidget理论总结

QListWidget理论总结1. 概念2. 添加列表项3. 列表其他属性4. 常用信号5. 槽函数6. QListWidgetItem 简述1. 概念 QListWidget 是一个继承自 QListView 的类,其实就是 QListView 的一个很经典的 列表 交互控件,在QListWidget 里面提供了非常方便的基于 每…

银树开花精美甘特图:VARCHART_XGantt_5.2_167_ActiveX

增强您的计划用户体验 使用交互式甘特图提供惊人的视觉调度体验 与时间和资源相关的计划数据(例如工作、任务、订单、活动和能力)最好显示在甘特图中。 在智能甘特图中,计划人员可以随手采取纠正措施。 加快您的开发并 创建引人入胜、易于使用…

爬虫学习-深入了解爬虫

爬虫深入 使用场景分类 通用爬虫:抓取系统的重要组成部分,抓取的是一整张页面数据聚焦爬虫:建立在通用爬虫的基础之上,抓取的是页面中特定的局部内容增量式爬虫:检测网站中数据更新的情况,只会抓取网站中最…

一起学习用Verilog在FPGA上实现CNN----(三)激活层设计

1 激活层设计 LeNet-5网络的激活函数是双曲正切函数(TanH),项目中tanh函数模块由完整的层UsingTheTanh构成,该层由较小的处理单元HyperBolicTangent组成 1.1 HyperBolicTangent 处理单元HyperBolicTangent,对每个输入执行Tanh操作&#xf…