OpenAI全球招外包大军,手把手训练ChatGPT取代码农 ; 码农:我自己「杀」自己

news2024/11/17 1:28:04

目录

前言

OpenAI招了一千多名外包人员,训练AI学会像人类一样一步步思考。如果ChatGPT「学成归来」,码农恐怕真的危了?

码农真的危了!

当时OpenAI也说,ChatGPT最合适的定位,应该是编码辅助工具。

用ChatGPT来debug,效果拔群

ChatGPT有一个强大的优势:我们可以在对话中与系统互动,更详细地对问题进行说明,从而获得正确的答案。

码农:我自己「杀」自己

咱们来排一排,那些会写代码的AI。

谷歌的Pitchfork

AlphaCode:吊打72%程序员

Copilot:代码补全神器


前言

OpenAI招了一千多名外包人员,训练AI学会像人类一样一步步思考。如果ChatGPT「学成归来」,码农恐怕真的危了?

福利文末有chat-gpt纯分享,无魔法,无限制

码农真的危了!

最近有消息称,OpenAI已经在悄悄地训练ChatGPT,让它学习人类的思考过程,从而真正掌握软件工程,彻底代替「初级码农」。

图片

OpenAI招外包大军,教AI学人类思考

会编程的AI,几家硅谷大厂都在做。

DeepMind的AlphaCode,据说「吊打72%人类程序员」,但尚未开放;传闻中谷歌的「神秘项目」Pitchfork,也还在酝酿中;而微软的GitHub Copilot主要是一个代码补全工具。

要说完全代替人类码农,它们还不够格。

但如果真的让ChatGPT学会了用人类思维去编程,这些友商/自家的产品恐怕要被吊打。

图片

而从种种迹象看来,OpenAI似乎正在下一盘大棋。

根据Semafor的报道,在过去的六个月里,OpenAI已经从拉美和东欧等地区招募了大约1000名外包人员,来训练他们的AI码代码。

图片

这个新闻中,有两个「华点」。

首先,为什么地点选在拉美和东欧?这个咱们都明白,现在硅谷的泡沫戳破了,各家互联网大厂都在绞尽脑汁「降本增效」,有的靠裁员,有的就去其他国家找廉价劳动力。

第二个「华点」是,这些外包人员中,很多人并不是计算机专业的毕业生,也不具备高级的编程技能。他们的作用是,编写OpenAI期待实现的「自动化」基本代码。

图片

具体来说,其中的60%从事「数据标注」工作——创建大量的图像、音频片段等信息,用来训练人工智能工具或自动驾驶汽车。

另外的40%则是实打实的程序员,他们正在为OpenAI的模型「手搓」数据,从而让AI学习软件工程任务。

此前,OpenAI一直是用从GitHub上抓取的代码训练其模型。

而这次,OpenAI想建立的数据集中,不仅有代码,还包括背后用自然语言编写的人类解释。

图片

论文地址:https://arxiv.org/abs/2107.03374

对此,Semafor特地采访了一位南美的开发者,而他曾无偿为OpenAI完成了5小时的编码测试。

在这个测试中,他被要求处理两个任务。

首先,他会得到一个编程问题,OpenAI要求他用书面的英语解释自己将如何处理这个问题。

然后,他需要提供一个解决方案。

如果他发现了一个bug,OpenAI就会要求他详细说明问题是什么,应该如何纠正,而不是简单地修复。

「他们很可能是想用一种非常特殊的训练数据来投喂这个模型,在这种情况下,就需要展示人类是如何一步步思考的。」这位开发者说。

图片

此前的ChatGPT,写的代码就被揪出过不少问题。

原因在于,ChatGPT没有任何标记了对错的内部记录,它其实是一个统计模型。ChatGPT的答案,本质上就是从构成GPT-3的互联网数据语料库中收集的概率结果。

当时OpenAI也说,ChatGPT最合适的定位,应该是编码辅助工具。

图片

但想象一下,如果OpenAI真的教会了ChatGPT「像人类一样一步一步思考」,那它完全可以代替一些需要死记硬背的写代码工作,后果就是,一些「初级」码农被彻底淘汰。

现在,硅谷的高管们正在设想这样的产品,让几乎没有编程经验的人士向AI描述自己的创意和愿景,然后就能构建出任何自己想要的东西,无论是一个网站,还是一个游戏。

几天前,特斯拉的前人工智能主管Andrej Karpathy刚刚在推特上说:「最热门的新编程语言是英语」。

图片

用ChatGPT来debug,效果拔群

这可能并不是一个玩笑,比如当红炸子鸡ChatGPT,就很有潜力。

最近,一项来自美因茨大学和伦敦大学学院的研究发现,ChatGPT不仅可以出色地修复bug,而且开发者还能通过对话来显著提高成功率。

图片

研究人员表示,ChatGPT的debug性能与常见的深度学习方法CoCoNut和Codex相差无几,并且明显优于标准的自动程序修复方法(APR)。

图片

论文地址:https://arxiv.org/abs/2301.08653

用ChatGPT来解决代码问题并不新鲜,但与人类对话的独特能力,使它比其他方法和模型更具优势。

为了评估ChatGPT的debug性能,研究人员使用QuixBugs基准的40个纯Python问题对其进行了测试,然后手动检查建议的解决方案是否正确。

由于ChatGPT给出的答案存在一定的随机性,因此研究人员针对每个问题都会单独测试4次。

与其他自动程序修复的基准不同,QuixBugs包含了相对较小的问题(代码行数少),而这非常适合在对话系统中使用。

图片

在测试过程中,研究人员删除了所有的注释,并询问ChatGPT这段代码是否有bug以及如何修复它。

比如,图1中就是一个关于BITCOUNT问题的例子。其中,第1-2行是向ChatGPT提出的需求;从第4行开始是错误的代码片段。

对于这个例子,我们希望ChatGPT的回答能解决第7行的错误,即nˆ= n - 1应该被替换为n &= n - 1。做为回应,ChatGPT要么给出一段修复完的代码,要么给出一个描述告诉我们应该如何修改。

图片

结果显示,ChatGPT解决了40个bug中的19个,与CoCoNut(19)和Codex(21)相当,但标准的APR方法只解决了其中的7个问题。

当然,因为ChatGPT和Codex都是来自于同一个语言模型系列,所以解决问题的数量差不多也就不足为奇了。

此外,如果我们仔细观察结果还可以发现,ChatGPT并不是每次都能解决基准测试中的bug。仅在BUCKETSORT和FLATTEN这两个问题上,四次都发现了bug,而其他的通常只能成功1-2次。

也就是说,用户在实际使用时,可能需要尝试数次才能获得正确的结果。

图片

ChatGPT有一个强大的优势:我们可以在对话中与系统互动,更详细地对问题进行说明,从而获得正确的答案。

实际测试结果,也确实如此。

经过与模型更进一步的对话,研究人员成功地将ChatGPT的正确率刷新到了77.5%,也就是修复了40个错误中的31个,远超SOTA。

图片

至少,目前看来,这件事是完全有可能的:开发人员将不再需要编写样板代码。

相反,他们可以专注于复杂的应用程序架构或网络安全等领域。

也就是说,虽然ChatGPT可能会完成某些编程工作,例如编写通用函数或样板代码,但它不会完全取代程序员。因为程序员的工作需要的不仅仅是写代码。

成为一名程序员需要技巧——能够构建程序、遵循逻辑并生成比各部分总和更宏大的东西。

码农:我自己「杀」自己

显然,ChatGPT不是码农们做出的第一个「自我迭代」的产品。

图片

咱们来排一排,那些会写代码的AI。

谷歌的Pitchfork

去年11月,坊间传闻,谷歌正在酝酿一个秘密项目,这个产品会通过机器学习训练代码,自己编自己,自己修复bug,还能自己更新。

图片

据知情人士透露,这个项目起初是由Alphabet的登月部门——X部门开发的,代号为Pitchfork,去年夏天被转移到了谷歌实验室。

根据内部资料,Pitchfork的作用是「教代码自行编写、自行重写」。

它能够学习不同的编程风格,并且根据这些风格写出代码。

一名谷歌员工表示,开发Pitchfork的初衷是希望建立一个工具,将谷歌的Python代码库更新到新版本。

AlphaCode:吊打72%程序员

2022年2月,DeepMind推出了「AlphaCode」系统,可以使用人工智能生成代码。

根据DeepMind的说法,AlphaCode可以与人类匹敌。

图片

DeepMind使用编程竞赛平台Codeforces上托管的10个现有竞赛来测试AlphaCode,它的总体排名位于前 54.3%,也就是说,它击败了46%的参赛者 。

DeepMind声称,在使用编程竞赛平台Codeforces进行检测时,AlphaCode解决了100万个样本中34.2%的问题。

图片

另外在过去6个月参加过比赛的用户中,AlphaCode的数据排到了前28%,可以说「吊打72%人类程序员」!

当时,DeepMind就指出,虽然AlphaCode目前只适用于具有竞争性编程领域,但显然,它未来的能力绝不会止步于此。

它为创造某些工具打开了大门,而这些工具将使编程变得更容易被人们接受,并且有朝一日可以完全实现自动化。

Copilot:代码补全神器

再往前,在2021年,GitHub与OpenAI共同推出了一款AI编程神器——GitHub Copilot。

图片

输入代码时,Copilot会自动提示程序中接下来可能出现的代码片段,就像一个经过训练用Python或JavaScript说话的自动补全机器人。

Copilot能够填充必要的代码块,只要它们不是特别复杂或者特别有创造性,这对于相当于手工劳动的编程,可太有用了。

2022年6月22日,Copilot正式面向C端上线,定价10美元/月或100美元/年,并向学生用户和流行开源项目的维护者免费提供。

现在,成千上万的开发者都在用Copilot。在十几种最流行的语言编写代码中——有高达40%是依靠它来生成的。

图片

GitHub预测,开发人员将在五年内使用Copilot编写多达80%的代码。

微软首席技术官Kevin Scott还表示:「我们确信:GitHub Copilot可以应用到数千种不同类型的工作中。」

不过,因为涉嫌侵权,在发布不到5个月后,Copilot已经被愤怒的程序员一举告上法庭,索赔90亿美元。

而学会「软件工程思维」的ChatGPT,能吊打它们吗?按OpenAI的速度,恐怕我们不用等太久。充电君会在第一时间给你带来最新、最全面的解读,别忘了三联一波哦

                                                           

 关注公众号:资源充电吧
回复:Chat GPT
充电君发你:免费畅享使用中文版哦
点击小卡片关注下,回复:IT

想要的资料全都有 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/889001.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

matlab使用教程(17)—多项式的定义和运算

1.创建并计算多项式 此示例说明如何在 MATLAB 中将多项式表示为向量以及根据相关点计算多项式。 1.1 表示多项式 MATLAB 将多项式表示为行向量,其中包含按降幂排序的系数。例如,三元素向量 p [p2 p1 p0]; 表示多项式 创建一个向量以表示二次多项式…

mysql 存储过大如何处理

文章目录 定位是否MySQL存储过大处理binlog大小查看目前存储策略设置binlog 保存时间 定位是否MySQL存储过大 查询当前文件夹大小 du -sh查询第一层文件夹大小 du -h -d 1处理binlog大小 查看目前存储策略 查询日志保存天数 show variables like expire_logs_days;0&…

大势智慧软硬件技术答疑第八期

1.DasViewer可以使用同一个账号登录多台电脑,然后同时进行格式转换操作吗? 答:可以的 2.在DasViewer里面添加了标注点,能手动修改标注点坐标、手动输入坐标值 吗? 答:目前DasViewer暂不支持手动输入坐标 …

Android12 偶现触摸失灵

生产线 在烧录固件时,会偶然出现稍完之后屏幕触摸用不了。前期以为是烧录没弄好,后面又发生,就怀疑与产品有关了。 首先进行抓日志分析:有问题的设备先确认下dmesg信息 adb连接设备进行日志抓取: logcat > /sdcard…

【Go】锁相关

mutex锁相关 mutex源码分析 Locker接口: type Locker interface {Lock()Unlock() }Mutex 就实现了这个接口,Lock请求锁,Unlock释放锁 type Mutex struct {state int32 //锁状态,保护四部分含义sema uint32 //信号量&#…

IDEA启动报错【java.sql.SQLSyntaxErrorException: ORA-00904: “P“.“PRJ_NO“: 标识符无效】

IDEA报错如下: 2023-08-17 11:26:15.535 ERROR [egrant-biz,b48324d82fe23753,b48324d82fe23753,true] 24108 --- [ XNIO-1 task-1] c.i.c.l.c.RestExceptionController : 服务器异常org.springframework.jdbc.BadSqlGrammarException: ### Error queryin…

看看安森美深力科NSI45090JDT4G 是如何点亮汽车内外照明系统解决方案

关于线性恒流调节器(CCR):是一种用于控制电流的稳定输出。它通常由一个功率晶体管和一个参考电流源组成。CCR的工作原理是通过不断调节功率晶体管的导通时间来维持输出电流的恒定。当输出电流超过设定值时,CCR会减少功率晶体管的导…

C# WPF ListBox 动态显示图片

前言 最近在和其他软件联合做一个本地图片选择传输功能,为此希望图片能够有序的呈现在客户端,简单的实现了一下功能,通过Mvvm模式进行呈现,过程简单通俗,话不多说直接上图。 处理过程 前台代码 你只需要粘贴到你的前台…

linux动态链接之.plt与.got.plt

1. 动态链接 一个 main.c 文件 #include <stdio.h> #include <stdlib.h>int main() {puts("123");puts("456");return 0; }此时我们编译它默认会使用动态链接默认生成a.out可执行文件 gcc main.c当第一次调用puts函数时&#xff0c;会去往.…

考公-判断推理-逻辑判断-真假推理

真假推理最多考一道 例题 找矛盾 例题 例题 四组 例题 例题 例题 例题 例题 例题 例题

Keburnetes 配置资源管理 Secret ConfigMap

Secret 资源 用于保存密码文件、tls证书/私钥文件、token令牌字符串、镜像私有仓库认证信息 等需要加密的敏感的信息 Secret资源的 4 种类型 Opaque&#xff1a;默认的Secret资源类型&#xff0c;可以通过选项引用文件、目录、键值对的方式创建Secret资源&#xff0c;并且资…

在APP中如何嵌入小游戏?

APP内嵌游戏之所以能火爆&#xff0c;主要是因为互联网对流量的追求是无止境的&#xff0c;之前高速增长的红利期后&#xff0c;获取新的流量成为各大厂商的挑战&#xff0c;小游戏的引入&#xff0c;就是这个目的&#xff0c;为已有的产品赋能&#xff0c;抢占用户注意力和使用…

文件夹数据加密怎么设置?文件夹数据加密软件哪个好?

文件夹是电脑存放重要数据的载体&#xff0c;我们需要保护其数据安全&#xff0c;那么文件夹数据加密该怎么设置呢&#xff1f;下面我们就来盘点一下文件夹数据加密软件。 EFS加密 提起文件夹加密&#xff0c;很多人想到的就是EFS加密&#xff0c;它可以加密NTFS卷的各种文件或…

【RP2040】香瓜树莓派RP2040之新建工程

本文最后修改时间&#xff1a;2022年09月05日 11:02 一、本节简介 本节介绍如何新建一个自己的工程。 二、实验平台 1、硬件平台 1&#xff09;树莓派pico开发板 ①树莓派pico开发板*2 ②micro usb数据线*2 2&#xff09;电脑 2、软件平台 1&#xff09;VS CODE 三、版…

ThreadLocal内存泄漏问题

引子&#xff1a; 内存泄漏&#xff1a;是指本应该被GC回收的无用对象没有被回收&#xff0c;导致内存空间的浪费&#xff0c;当内存泄露严重时会导致内存溢出。Java内存泄露的根本原因是&#xff1a;长生命周期的对象持有短生命周期对象的引用&#xff0c;尽管短生命周期对象已…

为什么 ThreadLocal 会导致内存泄漏 ?如何解决 ?

面试官问 &#xff1a;为什么 ThreadLocal 会导致内存泄漏 &#xff1f;&#xff1f; 在面试中被问到这个问题&#xff0c;如果记不清细节了&#xff0c;可以这样回答&#xff1a; ThreadLocal 里面存储的数据&#xff0c;它的生命周期是和线程或者线程池的生命周期保持一致的…

JavaWeb-DAO设计模式

目录 DAO设计模式 1.认识DAO 2.DAO各部分的详解 3.DAO设计模式流程 DAO设计模式 1.认识DAO DAO(Data Acess Object 数据库访问对象)的主要功能是操作数据库&#xff0c;所以DAO在标准开发架构中数据数据层&#xff0c;以下是标准开发的架构 客户层&#xff1a;目前使用B/…

ZKSV2-12-2NCP、ZKSV2-08-2NCSP-L、ZKSV2-08-2NOP插装式电磁换向阀

ZKSV-08-2NCP、ZKSV2-08-2NCP、ZKSV2-10-2NCP、ZKSV2-12-2NCP、ZKSV2-08-2NCSP-L、ZKSV2-08-2NOP、ZKSV2-10-2NOP、ZKSV2-12-2NOP、ZKSV2-08-3、ZKSV2-08-3A、ZKSV2-08-3C、ZKSV2-08-3B、ZKSV2-10-3、ZKSV2-10-3C、ZKSV2-10-3B、ZKSV2-08-4 CO、ZKSV2-08-4 NC、ZKSV2-08-4 TC、…

问道管理:机器人概念走势活跃,新时达涨停,拓斯达、丰立智能等大涨

机器人概念17日盘中走势活跃&#xff0c;到发稿&#xff0c;拓斯达大涨18%&#xff0c;昊志机电涨近16%&#xff0c;丰立智能涨超13%&#xff0c;步科股份、优德精细涨超10%&#xff0c;新时达涨停&#xff0c;天玑科技、兆龙互联、中大力德涨逾9%。 消息面上&#xff0c;8月16…

javaScript:一分钟看懂数组排序以及冒泡排序(重点)

目录 一.前言 二.数组排序 sort&#xff08;&#xff09; 字符串大小的比较原则 字符编码排序规则 如果使用sort从小到大排列 &#xff08;重点&#xff09; 函数的返回值 规则&#xff1a; 代码 案例 数组打乱 sort相关代码 三.冒泡排序&#xff08;重点&#xff…