全球首个 AI 超级工程师:拥有全栈技能,一个指令就能完成整个开发过程

news2024/11/21 0:13:00

全球首位AI软件工程师Devin是由初创公司Cognition推出的,它被认为是世界上第一个完全自主的AI软件工程师[2][15]。Devin具备强大的编程和软件开发能力,能够在多个方面协助或完全独立地完成软件开发任务[15]。它的核心能力包括自学新语言、开发迭代App、自动Debug等[8][10],并且在SWE-bench编码基准测试中取得了突破性的成功,展示了其执行复杂任务的能力,甚至超越了顶尖的人类工程师[2][13]。

Devin不仅能够提供编码建议并自动完成部分任务,还能独自承担并完成整个软件开发流程[17]。它掌握全栈技能,包括云端部署、底层代码编写、修复bug以及训练和微调AI模型等[5][14]。此外,Devin还能够学习如何使用不熟悉的技术、为成熟的生产仓库做出贡献,并且还能完成Upwork上的真实工作[9]。

image

Devin AI软件工程师的技术原理是什么?

Devin AI软件工程师的技术原理主要基于其能够自主规划和完成软件项目的能力,以及在这一过程中做出数以千计的准确决策的能力[18]。Devin能够快速掌握新技术,这表明其背后的技术可能涉及到机器学习和深度学习领域,使其能够从研究资料库中获取指令,建立并微调大型语言模型[20]。此外,Devin还展示了其执行复杂任务的能力,甚至超越了顶尖的人类工程师,在SWE-bench编码基准测试中取得了突破性的成功[20]。

Devin的技术还包括能够自学新语言、开发迭代App、自动Debug等能力[20],这些能力的实现依赖于其背后的高级算法和技术,如控制网络(ControlNet)的应用,通过生成带有隐藏文字的图像来展示其对不熟悉技术的理解和应用能力[21]。此外,Devin还能自己训练微调大模型,直接作为一个程序员来接受用户需求和反馈,独立完成编码和应用上线功能[22]。这表明Devin的技术原理不仅包括高级的机器学习和深度学习技术,还涉及到自然语言处理、图像处理等多个领域,使其能够在多个编程领域内独立工作并提供解决方案。

image

Devin在SWE-bench编码基准测试中是如何超越顶尖人类工程师的?

Devin在SWE-bench编码基准测试中超越顶尖人类工程师的方式主要体现在以下几个方面:

  1. 自动Debug能力:Devin能够自行设置代码环境、复制错误、自行编码、测试修复程序,这一系列操作展示了其强大的自动Debug能力,能够在遇到问题时迅速定位并解决问题[24]。
  2. 执行复杂任务的能力:Devin在SWE-bench编码基准测试中取得了突破性的成功,展示了其执行复杂任务的能力,这一点是其超越顶尖人类工程师的关键所在[23][26][28]。
  3. 无辅助的自主学习和操作:与其他模型相比,Devin是在数据集25%的随机子集上进行评估的,并且是无辅助的,而所有其他模型都是有辅助的(意味着模型被告知哪些文件需要编辑)。这种无辅助的自主学习和操作能力使得Devin在SWE-bench编码基准测试中更加突出[30]。

Devin之所以能在SWE-bench编码基准测试中超越顶尖人类工程师,是因为它具备了自学新语言、开发迭代App、自动Debug、执行复杂任务、长期推理以及无辅助的自主学习和操作等多方面的强大能力。

Devin如何自学新语言和开发迭代App?

Devin通过自学新语言和开发迭代App的能力,成功地在SWE-bench编码基准测试中取得了突破[37]。这表明Devin具备自我学习和适应新技术的能力,能够独立完成软件开发任务。此外,Devin被描述为一款人工智能助手,旨在协助软件工程团队完成编码和其他开发任务,包括部署应用、修复Bug、学习新技术等[33]。这进一步证实了Devin不仅能够自学新语言,还能够开发迭代App,并且在这一过程中扮演着监督和指导的角色。

Devin通过其内置的学习和开发能力,以及作为人工智能助手的角色定位,实现了自学新语言和开发迭代App的目标。

Devin在云端部署、底层代码编写和修复bug方面有哪些具体应用案例?

Devin在云端部署、底层代码编写和修复bug方面的具体应用案例包括:

  1. 云端部署:Devin能够自主学习不熟悉的技术,并端到端地构建和部署应用程序。这意味着它可以从零开始,或者对现有的项目进行扩展和升级,无需人工干预即可完成云端部署的任务[46]。
  2. 底层代码编写:Devin不仅能够编写底层代码,还能在运行期间列出它正在执行的所有任务,并在编写代码时持续测试,自行查找并修复bug。这表明Devin具有高度的自我学习和自我优化能力,能够在没有明确指导的情况下,独立完成复杂的编程任务[47]。
  3. 修复bug:Devin擅长识别、调试和修复代码问题。开发者只需提供一个GitHub链接让Devin熟悉项目情况,然后Devin会准备数据进行测试,接着按部就班地编写测试用的程序并准备好有关数据,最后运行这些程序以查找和修复bug。这一过程展示了Devin强大的debug能力,能够有效地解决代码中的问题[49][50]。

Devin在云端部署、底层代码编写和修复bug方面的应用案例体现了其作为全球首个AI软件工程师的能力,包括但不限于自主学习新技能、端到端的应用程序开发、以及高效的bug识别和修复能力。

Devin完成Upwork真实工作的能力是如何体现的?

Devin完成Upwork真实工作的能力主要体现在以下几个方面:

  1. 编程和调试代码:Devin能够编写并调试代码,以运行计算机视觉模型。这表明它具备处理复杂编程任务的能力,能够根据需求开发和优化软件[51]。
  2. 数据采样与报告编制:除了编程外,Devin还能对生成的数据进行采样,并在最后编制一份报告。这说明它不仅能够处理技术性的工作,还能进行数据分析和报告撰写,显示出其综合性的技能[51]。
  3. 执行多样化任务:Devin能够接受多种类型的指令,如创建展示特定信息的网站,包括搜索餐馆、获取地址和联系方式等步骤。这表明它具有高度的灵活性和适应性,能够根据不同的任务需求自主完成相关工作[53]。
  4. 解决整个工作流问题:Devin不仅能生成网页,还能直接完成服务端的开发。这意味着它能够从头到尾解决一个项目的需求,包括前端和后端的开发,展示了其全面的技术能力[54]。

Devin在Upwork上完成真实工作的能力体现在其强大的编程能力、数据分析与报告编制能力、以及能够执行多样化任务和解决整个工作流问题的能力上。这些能力共同证明了Devin作为一个AI软件工程师,在实际工作中能够胜任各种复杂任务的能力。

image

相关事件

事件名称事件时间事件概述类型
全球首个AI软件工程师Devin问世2024年03月13日Cognition公司宣布推出全球首个完全自主的AI软件工程师Devin,具备自学新语言、开发迭代App、自动Debug等能力。科技创新
Devin在SWE-bench编码基准测试中取得突破性成功2024年03月13日Devin在SWE-bench编码基准测试中展示了其执行复杂任务的能力,甚至超越了顶尖的人类工程师。技术成就
Devin通过公司面试并开始实际工作2024年03月13日Devin成功通过了领先人工智能公司的实际工程面试,并在Upwork上完成了实际工作。职业发展
Devin掌握全栈技能,包括云端部署、底层代码、改bug、训练和微调AI模型等2024年03月13日Devin不仅能够提供编码建议并自动完成部分任务,还能独自承担并完成整个软件开发流程。未知

相关组织

组织名称概述类型
Cognition初创公司,推出了全球首个AI软件工程师Devin。科技/人工智能

相关人物

人物名称概述类型
Devin被介绍为世界首个完全自主的AI软件工程师。人工智能软件工程师

参考资料

1. 首个AI软件工程师震撼硅谷!手握10块IOI金牌,他们铁了心砸掉程序 … [2024-03-13]

2. 全球首位 AI 软件工程师 Devin 问世:能自学新语言、开发迭代 App、自动 Debug - IT之家 [2024-03-13]

3. 时代变革:首位AI软件工程师Devin,面试成功入职且接过实际工作的单 [2024-03-13]

4. 第一位ai软件工程师诞生 - 知乎 - 知乎专栏

5. 全球首个AI程序员诞生,码农饭碗一夜被砸! - 凤凰科技 [2024-03-13]

6. 首个AI软件工程师上线,已通过公司面试抢程序员饭碗 - 36氪 [2024-03-13]

7. 全球首位AI软件工程师诞生,未来程序员会被取代吗? - 赵泠的回答 [2024-03-13]

8. 全球首位AI软件工程师Devin问世:能自学新语言、开发迭代App、自动Debug - 人工智能 — C114(通信网) [2024-03-13]

9. Devin:全球首位AI程序员 - 映技派 [2024-03-13]

10. 全球首位AI软件工程师Devin问世:能自学新语言、开发迭代App [2024-03-13]

11. 全球首位AI 软件工程师Devin 问世:配备自学、开发 - TechNave 中文版 [2024-03-13]

12. AI新工具(20240313) 世界上第一个完全自主的AI软件工程师Devin … [2024-03-13]

13. 全球首个AI软件工程师诞生多项能力直逼顶尖人类工程师-中关村在线 [2024-03-13]

14. 全球首个AI程序员诞生,码农饭碗一夜被砸! - 数码之家 [2024-03-13]

15. Devin - 首个全自主的AI软件工程师智能体 - AI工具集 [2024-03-13]

16. 首个AI软件工程师震撼硅谷!手握十块IOI金牌 - 51CTO [2024-03-13]

17. 90后华人团队真来砸程序员饭碗了?推出全球首个AI超级工程师 - InfoQ [2024-03-13]

18. 全球首位AI 软件工程师Devin 问世- 果核剥壳 [2024-03-13]

19. 全球首个AI程序员Devin问世,颠覆传统编程领域 - 知乎

20. 全球首位 AI 软件工程师 Devin:能自学新语言、开发迭代 App、自动 Debug - OSCHINA - 中文开源技术交流社区

21. 首个AI软件工程师震撼硅谷!10块IOI金牌团队铁了心砸程序员饭碗 [2024-03-13]

22. 全球首个AI软件工程师问世:可以自己训练微调大模型的AI软件工程师Devin简介 | 数据学习者官方网站(Datalearner) [2024-03-13]

23. 全球首位 AI 软件工程师 Devin 问世:配备自学、开发、自动 Debug 的多面能力 - 掘金咖 [2024-03-13]

24. 全球首个AI程序员诞生,码农饭碗一夜被砸,10块IOI金牌华人团队 … [2024-03-13]

25. Cognition 实验室发布全球首位AI软件工程师… 来自互联网的那点事 [2024-03-13]

26. 全球首个AI软件工程师Devin问世 AI+低代码平台望 … - 雪球

27. 全球首个AI程序员Devin问世,颠覆传统编程领域-CSDN博客 [2024-03-13]

28. 全球首位AI版软件工程师问世能自学新语言迭代并Debug - 搞趣网 [2024-03-13]

  1. [2024-03-13]

30. 全球首位AI版软件工程师问世 能自学新语言迭代并Debug [2024-03-13]

31. 全球首位AI软件工程师Devin问世:能自学新语言、开发迭代App - 虎嗅 [2024-03-13]

32. 全球首个ai程序员诞生,码农饭碗一夜被砸!10块ioi金牌华人团队震撼打造,996写代码训练模型 - 知乎

33. 首个AI软件工程师Devin问世 人工智能正式加入编程行列 [2024-03-13]

35. MATLAB App Designer教程全集_哔哩哔哩_bilibili

36. App Inventor第1课,跟何老师学做第一个手机应用_哔哩哔哩_bilibili

37. 互联网的那点事 - 微博

38. app迭代开发版本号的规则 - 一门APP

39. APP开发教程: 零编程教你快速制作iOS APP、Android APP - 知乎

40. 微软Copilot全面升级OpenAI GPT-4 Turb - 沸点 - 稀土掘金 [2024-03-13]

41. 管理迭代 - 什么是 DevOps? DevOps 介绍 | CODING DevOps

42. 学的很吃力,听说后面的更难,我应该怎么办? - Devin 的回答- 知乎 [2022-03-18]

43. 全球首个AI程序员诞生,码农饭碗一夜被砸,10块IOI金牌华人团队 … [2024-03-13]

44. 3种应用架构简单介绍 - CSDN博客 [2022-05-22]

45. Devin,程序员的末日即将来临 - 知乎 - 知乎专栏

46. 码农//全球首位AI软件工程师Devin诞生了,它掌握全栈技能,云端部署 [2024-03-13]

47. 90 后华人团队真来砸程序员饭碗了!推出全球首个 Ai 超级工程师:拥有全栈技能,一个指令就能完成整个开发过程_腾讯新闻

48. DevOps 实践体系和流程总结 - 知乎专栏 [2020-02-27]

49. 首个AI软件工程师震撼硅谷!10块IOI金牌团队铁了心砸程序员饭碗|ai|编程|计算机_网易订阅 [2024-03-13]

50. 首个AI软件工程师震撼硅谷!手握10块IOI金牌,他们铁了心砸掉程序员饭碗 编辑部 发自 凹非寺 量子位 | 公众号 QbitAI 一觉醒来 … [2024-03-13]

51. 第一位AI软件工程师诞生 - 汲道

52. 全球首位AI软件工程师诞生,未来程序员会被取代吗? - 知乎 [2024-03-13]

53. 转译:金牌程序员打造的AI:能够自行完成… 来自宝玉xp - 微博 [2024-03-13]

54. 首个AI软件工程师震撼硅谷!手握10块IOI金牌他们铁了心砸掉程序员 … [2024-03-13]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1513979.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

浅谈Redis 的 保护模式(protected-mode)

今天在一台服务器上面部署了redis,发现始终无法用工具远程连接,项目里面是正常的,就是工具不行,防火墙也关闭了.折腾了一会才突然想起来,是不是触发了保护模式. 什么时候触发保护模式protected-mode: 同时满足以下两个: 1.bind未指定ip 2.未配置密码 解决方案: 编辑redis…

UL1642标准_锂聚合物电池亚马逊测试报告

UL1642标准_锂聚合物电池亚马逊测试报告 什么是锂聚合物电池UL1642标准? UL1642 认证要求涵盖旨在用于技术人员可更换或用户可更换应用的锂离子电池。UL1642 认证要求是为了避免锂离子电池在产品中工作时发生火灾或爆炸的风险。 锂聚合物电池 UL是Underwriters L…

2014

1,写出计算Ack(m,n)的递归算法 #include<iostream> using namespace std; int A(int m,int n){if(m0){return n1;}else if(m>0&&n0){return A(m-1,1);}else{return A(m-1,A(m,n-1));} }int main(){int m,n;cout<<"please input two number"&l…

移动端App、小程序、公众号该怎么选择,你真得知道吗?

当下移动App,小程序泛滥&#xff0c;如何选择&#xff0c;你真的知道吗&#xff1f; 今天我们就聊聊App、小程序、公众号、微应用具体是什么&#xff1f;怎么样开发&#xff1f;适合在什么情况下使用&#xff1f; 1.App、小程序、公众号、微应用之初识 App App本质来说就是手…

docker私有仓库-harbor的搭建

docker 官方提供的私有仓库 registry&#xff0c;用起来虽然简单 &#xff0c;但在管理的功能上存在不足。 Harbor是一个用于存储和分发Docker镜像的企业级Registry服务器&#xff0c;harbor使用的是官方的docker registry(v2命名是distribution)服务去完成。harbor在docker di…

23、设计模式之访问者模式(Visitor)

一、什么是访问者模式 访问者模式是一种行为型设计模式&#xff0c;它可以用于在不修改已有对象结构的情况下&#xff0c;定义新的操作方式。简单地说就是在不改变数据结构的前提下&#xff0c;通过在数据结构中加入一个新的角色——访问者&#xff0c;来达到执行不同操作的目的…

GIS软件应用(二)

任务&#xff1a; 1. 正确划分渔网并裁剪出研究区域 2. 渔网与poi数据正确空间链接并统计网格内类别POI数量 步骤&#xff1a; 将南京市边界进行投影变换&#xff0c;具体看我的这篇文章&#xff1a;GIS软件应用&#xff08;一&#xff09;-CSDN博客 选择ArcToolbox中的 Cr…

开口式霍尔电流传感器助力直流配电改造

彭姝麟 Acrelpsl 1开口式霍尔电流传感器助力直流配电改造 1.1 改造要求 系统改造要求不停电进行直流系统切改&#xff0c;即在不失去直流电源的情况下进行负荷的倒出和倒入&#xff0c;改造工程难度大。针对此需求&#xff0c;可采用开口式霍尔电流传感器来解决改造项目中直流…

【PHP+代码审计】PHP基础——流程控制

&#x1f36c; 博主介绍&#x1f468;‍&#x1f393; 博主介绍&#xff1a;大家好&#xff0c;我是 hacker-routing &#xff0c;很高兴认识大家~ ✨主攻领域&#xff1a;【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 &#x1f389;点赞➕评论➕收…

Mock.js 基本语法与应用笔记

&#x1f31f; 前言 欢迎来到我的技术小宇宙&#xff01;&#x1f30c; 这里不仅是我记录技术点滴的后花园&#xff0c;也是我分享学习心得和项目经验的乐园。&#x1f4da; 无论你是技术小白还是资深大牛&#xff0c;这里总有一些内容能触动你的好奇心。&#x1f50d; &#x…

数据分析之一些Excel函数

数据分析之Excel的使用 SUM()求和SUMIF()单条件求和SUMIFS()多条件求和日期函数YEAR()提取年份MONTH()提取月份DAY()提取日DATE()函数 SUBTOTAL()求和IF()函数IF嵌套 VLOOKUP()搜索取值MATCH()返回行值或列值INDEX()定位取值 SUM()求和 SUM(number1,[number2],…) 对选中的区域…

CSS学习2

自己在工作中总是有一些自动化开发的需求&#xff0c;总是以为自己是有前端基础的&#xff0c;但是一写页面&#xff0c;布局都布不好&#xff0c;真是搞笑&#xff0c;说起来还是基本功不扎实啊&#xff0c;这里在重新复习一下&#xff0c;然后记录一下文档。后边在写两个综合…

Linux 配置ssh、scp、sftp免密登录

SSH&#xff08;Secure Shell&#xff09;是一种安全的远程登录协议&#xff0c;它使用客户端-服务器架构促进2个系统之间的安全通信&#xff0c;并允许用户远程登录服务器。在某些高可用环境下&#xff0c;服务器之间可能还需要配置免密互信&#xff0c;即基于密钥验证登录。 …

linux系统使用head和tail命令,快速切分json 格式的数据集

文章目录 介绍切分训练集切分测试集 介绍 json格式的数据集&#xff0c;每一行都是一个单独数据单元。 data.json的文件格式如下&#xff1a; {"text": "彭小军认为&#xff0c;国内银行现在走的是台湾的发卡模式&#xff0c;先通过跑马圈地再在圈的地里面选择…

产品实操——设计阶段

一、思维导图&#xff1a; 二、原型图&#xff1a; 1.墨刀&#xff1a;

【代码随想录 | 数组 05】螺旋矩阵 ||

文章目录 5.螺旋矩阵25.1题目5.2思路 5.螺旋矩阵2 5.1题目 59. 螺旋矩阵 II 给你一个正整数 n &#xff0c;生成一个包含 1 到 n2 所有元素&#xff0c;且元素按顺时针顺序螺旋排列的 n x n 正方形矩阵 matrix 。 示例一&#xff1a; 输入&#xff1a;n 3 输出&#xff…

OpenGL-贴纸方案

OpenGL-贴纸方案 普通贴纸&#xff08;缩放、Z轴旋转、平移&#xff09; OpenGL环境说明 OpenGL渲染区域使用正交投影换算,正常OpenGL坐标是vertexData,这样的 Matrix.orthoM 进行换算 //顶点坐标&#xff08;原点为显示区域中心店&#xff09;private final float[] vertex…

小米公司研发岗的年终奖。。

小米 好的公司有年终且在年前发放&#xff0c;一般的公司有&#xff08;可能打折的&#xff09;年终且年后分批发放&#xff0c;不好的公司各有操作。 3 月已来&#xff0c;小米的年终也开始热议起来。 最近&#xff0c;一则「传小米年终打折&#xff0c;14薪能保住吗」冲上热搜…

electron + vtkjs加载模型异常,界面显示类似于图片加载失败的图标

electron vtkjs加载模型显示异常&#xff0c;类似于图片加载失败的效果&#xff0c;如上图。 electron开发版本&#xff1a;13。 解决方法&#xff1a;升级electron版本号。 注意&#xff1a;win7最高兼容electron 22版本。

华为机考:HJ3 明明的随机数

华为机考&#xff1a;HJ3 明明的随机数 描述 代码 set&#xff0c;插入即排序&#xff0c;而且没有重复数字 #include<iostream> #include<vector> #include<algorithm> using namespace std;int main(){int n;while(cin >> n){ //首先输入每次调查…