全球首个AI程序员Devin诞生,真的不再需要程序员了吗?

news2025/1/12 3:47:02

前言

今年到底是怎么回事?前有Sora(首个文生视频大模型)独领风骚,后有Mistral(号称世界第二语言大模型)横刀立马,甚至Claude3的热度都还没有过,今天一则更炸裂的消息就爆出,世界上第一个AI程序员诞生了,他的名字叫做:Devin


Devin是什么? 

Devin并不是传统意义上代码编写的辅助工具,它所体现的是未来AI编程解决方案的新趋势。远超传统的编程助手如GitHub Copilot——该工具是GitHub、微软以及OpenAI的共同成果——Devin在软件开发过程中的能力几乎可以说是全方位的。

Devin能够独立地承担起从头到尾的软件开发任务,碾压了仅提供编码建议和自动完成代码片段的传统助手的功能。其操作流程也非常直观:用户只需向Devin提出一个需求,例如:

“设计一个呈现纽约市所有书店的互动地图的应用”,Devin就会立刻着手执行,自动化地搜寻必要信息,诸如书店的准确地理位置、街道地址及联络详情。Devin会开始创建一个展示这些详细信息的网站,并且负责将这个网站成功上线。在整个开发过程中,Devin不仅能够精确执行任务,还能实时更新其进展情况,并在代码编写阶段不断进行测试,以便主动识别并解决任何可能出现的错误。

Devin的独到之处在于它融合了最新的AI技术,具有SWE-Bench 编码基准的最新水平,已经成功通过了领先人工智能公司的实际工程面试,甚至还在 Upwork 上完成了实际工作。

Devin在独立解决问题方面达到了13.86%的成功率,这一成就远超以往最高水平的1.96%。即便是在提供了具体需要修改的文件情况下,先前的顶尖模型也仅能处理4.80%的问题。Devin或许已经真正意义上实现了智能。

光看数据可能并不能直观的感觉到Devin的强大,下面我们来看几个网友的辣评


Devin能够做什么?

Devin展现了其在处理复杂软件工程项目方面的非凡能力,能够进行数千次决策来规划和执行任务。

并且它具备回顾每个阶段必要背景信息的能力,能够逐渐学习并纠正过程中的错误。

此外,开发团队为Devin装备了一系列开发工具,能够在一个安全的沙盒环境中运行的shell、代码编辑器和网络浏览器,实际上是提供了开发人员进行编程工作所需的全部工具。

最重要的是,Devin被设计成能够与使用者紧密合作。它不仅能够即时分享工作进度,还能接收反馈,并在设计决策上与使用者共同作出选择。

在Cognition AI官网发布的几个用例视频中,具体介绍了Devin目前具备的七个功能:

大家可以前去观看视频:博客 (cognition-labs.com)

1.Devin 可以学习如何使用不熟悉的技术

提交一篇博文给Devin之后,它能够在短短几分钟内自学完成,包括阅读文章内容到执行代码。Devin能够在Modal平台上操控ControlNet,进行编程时还能自行进行调试。最终,当程序员Sara希望获得一张包含她名字的个性化桌面壁纸时,Devin迅速响应并生成了所需的壁纸。

2.Devin 可以端到端地构建和部署应用程序

如果你渴望体验「生命游戏」,只需将任务交由Devin即可。Devin会启用Shell工具来初始化一个React应用,接着利用代码编辑器着手编程。编码完毕,Devin不仅完成了代码编写,还会自动将该应用部署至Netlify,轻松开发一个基础版的「生命游戏」。

3.Devin 可以自主查找和修复代码库中的错误

在这个用例中,利用Devin解决了一个BUG,整个流程大概是给了Devin存储库,让它来检查和处理这个存储库,然后发现了其中的问题,并且成功的解决了,起到了维护和调试的作用。

4.Devin 可以训练和微调自己的 AI 模型

Devin 为大型语言模型设置了微调,给出了指向 GitHub 上研究存储库的链接。并且在1小时内,Devin顺利完成了几百步的训练。

5.Devin 可以解决开源存储库中的错误和功能请求

只要有一个指向 GitHub 问题的链接,Devin 就会完成所需的所有设置和上下文收集。

6.Devin 可以为成熟的生产存储库做出贡献,修复系统BUG

此示例是 SWE-bench 基准测试的一部分。Devin 解决了 sympy Python 代数系统中对数计算的错误。Devin 设置代码环境,重现错误,并自行编码和测试修复程序。

7.替代真人,在 Upwork 上给 Devin 提供真正的工作

在这里,Devin 编写和调试代码以运行计算机视觉模型。Devin 对生成的数据进行采样,并在最后编制一份报告。完全胜任了其承担的工作,真正做到了一个智能体的效果。


Devin的团队怎么样?

Cognition AI.是一家专注于推理的应用人工智能实验室。

根据他们自己的介绍:

“我们正在打造人工智能队友,其能力远远超出当今现有的人工智能工具。通过解决推理问题,我们可以在广泛的学科领域开启新的可能性--代码只是一个开始。我们希望帮助世界各地的人们将想法变为现实。

我们拥有充足的资金,包括由创始人基金(Founders Fund)主导的 2100 万美元 A 轮融资。我们非常感谢行业领导者的支持,包括 Patrick 和 John Collison、Elad Gil、Sarah Guo、Chris Re、Eric Glyman、Karim Atiyeh、Erik Bernhardsson、Tony Xu、Fred Ehrsam 和其他许多人。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1514379.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

代码贴--链表--数据机构

本博客将记录链表代码(单链表)&#xff0c;后续其他链表和其他数据结构内容请看我的其他博客 头文件(SList.h) #pragma once #include<iostream> #include<bits/stdc.h> using namespace std;typedef int SLTDataType;struct SListNode {int data;struct SListNo…

windows系统玩游戏找不到d3dx9_43.dll缺失,无法启动此程序的解决方法

今日&#xff0c;我们要深入讨论d3dx9_43.dll文件的重要性及其缺失问题。最近&#xff0c;我也遇到了这个文件丢失的困扰&#xff0c;因此想借此机会与大家分享如何解决d3dx9_43.dll缺失的问题。 一.电脑d3dx9_43.dll丢失会提示什么&#xff1f; 关于电脑提示d3dx9_43.dll丢失…

【人力资源开发】某主题公园人力资源开发管理咨询项目纪实

虽然很多企业将“人事部”改为“人力资源部”&#xff0c;但是企业的人力资源管理水平却仍停留在“人事管理”的阶段。该主题公园也是如此。随着公园的不断发展&#xff0c;其人力资源管理问题逐渐显露&#xff0c;而管理者也不清楚问题的根源在哪里&#xff0c;只能采取“头疼…

AWS入门实践-AWS CLI工具的使用介绍

AWS CLI&#xff08;Amazon Web Services Command Line Interface&#xff09;是一个强大的工具&#xff0c;它允许您直接从命令行与AWS服务进行交互。这不仅可以加快许多任务的处理速度&#xff0c;而且还可以通过脚本自动化。 一、AWS CLI工具的安装 1、Windows 安装下载…

java-双列集合

什么是双列集合&#xff1f; 集合中每次存的数据是成对存入的 以及它的特点是什么&#xff1f; 特别注意&#xff1a;键不可重复&#xff0c;值可以 Map是双列集合的顶层接口 Map 它有哪些方法呢&#xff1f; Map的常用API 添加 添加操作的代码如下 我们要明白一些细节&…

【项目笔记】java微服务:黑马头条(day02)

文章目录 app端文章查看&#xff0c;静态化freemarker,分布式文件系统minIO1)文章列表加载1.1)需求分析1.2)表结构分析1.3)导入文章数据库1.3.1)导入数据库1.3.2)导入对应的实体类 1.4)实现思路1.5)接口定义1.6)功能实现1.6.1)&#xff1a;导入heima-leadnews-article微服务&am…

C++初阶:内存管理

目录 1. C/C中各种资源的内存分布1.1 C/C程序内存区域划分1.2 各资源的内存分布情况&#xff08;练习&#xff09; 2. C中的动态内存管理方式2.1 new/delete开辟内置类型空间2.2 new/delete开辟销毁自定义类型空间 3. operator new 与 operator delete函数4. new与delete的实现…

逆变器功率软起斜率要求

安规说明 在NB32004中&#xff0c;有明确要求&#xff0c;有功功率调整速率不得超过正负10%Pn/min&#xff0c;包括起停机。 控制对象 控制功率最终是通过调整D轴电流给定来达到限制功率的目的&#xff0c;所以我们只要让D轴的电流给定限幅值按照10%/min增加就好了。 具体实…

openAI key 与ChatGPTPlus的关系,如何升级ChatGPTPLus

一、前言 先详细介绍一下Plus会员和Open API之间的区别&#xff1a; 实际上&#xff0c;这两者是相互独立的。举例来说&#xff0c;虽然您开通了Plus会员&#xff0c;并不意味着您就可以使用4.0版本的API。尽管这两个账户可以是同一个&#xff0c;但它们是完全独立的平台。 …

ChatGPT提问技巧:可解释的软提示

ChatGPT提问技巧&#xff1a;可解释的软提示 可解释的软提示是一种既能控制模型生成的文本&#xff0c;又能为模型提供一定灵活性的技术。 具体做法是为模型提供一组受控输入和一些有关所需输出的附加信息。这种技术可以使生成的文本更具可解释性和可控性。 提示示例及其公式…

DAY by DAY 史上最全的Linux常用命令汇总----man

man是按照手册的章节号的顺序进行搜索的。 man设置了如下的功能键&#xff1a; 功能键 功能 空格键 显示手册页的下一屏 Enter键 一次滚动手册页的一行 b 回滚一屏 f 前滚一屏 q 退出man命令 h 列出所有功能键 /word 搜索word字符串 注意&#xff1a…

每日一题——LeetCode1678.设计Goal解析器

方法一 splice 将字符串转为数组&#xff0c;对数组进行遍历&#xff0c;碰到G保持不变&#xff0c;继续循环&#xff0c;碰到 ( 看他后一位&#xff0c;是 ) 则删除两个元素&#xff0c;添加一个 o &#xff0c;不是则删除四个元素&#xff0c;添加元素 al &#xff0c;最后将…

JS ATM练习案例(复习循环知识)

需求&#xff1a;用户可以选择存钱、取钱、查看余额和退出功能。 分析&#xff1a;1循环时反复出现提示框&#xff0c;所以提示框写到循环里面。 2.退出的条件是4&#xff0c;所以是4就会结束循环 3.提前准备一个金额预存储 4取钱为减法操作&#xff0c;存钱为加法操作&#xf…

【论文阅读】Vision Mamba:双向状态空间模型的的高效视觉表示学习

文章目录 Vision Mamba:双向状态空间模型的的高效视觉表示学习摘要介绍相关工作用于视觉应用的状态空间模型 方法准备视觉MambaVim块结构细节高效分析计算效率 实验图片分类语义分割目标检测和实例分割消融实验双向SSM分类设计 总结和未来工作 论文地址&#xff1a; Vision Mam…

【C语言】qsort函数的使用

&#x1f451;个人主页&#xff1a;啊Q闻 &#x1f387;收录专栏&#xff1a;《C语言》 &#x1f389;道阻且长&#xff0c;行则将至 前言 这篇博客主要是介绍qsort函数的使用&#xff0c;以及利用冒泡排序的方式模拟实现qsort 一.初识qsort函数 我们可以在…

LJXpaper

表1-3引用出现较滞后 1.3文献[42]有问题 如图 如图 如图 如图 &#x1f447; &#x1f447; &#x1f447; &#x1f447; &#x1f447; &#x1f447; &#x1f447; 要不要加连接词&#xff1a;4-11 4-12之间 &#…

数码管的动态显示(二)

1.原理 这个十六进制是右边的dp为高位。 数码管的动态显示&#xff0c;在第一个计数周期显示个位&#xff0c;在第二个周期显示十位&#xff0c;在第三个周期显示百位由于人眼的视觉和数码管的特性&#xff0c;感觉就是显示了234&#xff0c;每个数码管的显示需要从输入的数据里…

AHU 数据库 实验五

【实验名称】 实验5 数据库的数据更新与视图管理 【实验目的】 1. 熟悉数据更新操作的概念与操作类型&#xff1b; 2. 熟练掌握INSERT、UPDATE、DELETE语句的基本语法&#xff1b; 3. 熟练运用INSERT、UPDATE、DELETE语句实现数据的插入、修改与删除…

应对恶意IP攻击的有效方法

在当今数字化时代&#xff0c;网络攻击已经成为了互联网安全的重大挑战之一。恶意IP攻击是网络安全领域中的一种常见威胁&#xff0c;它可能导致数据泄露、服务中断、系统瘫痪等严重后果。因此&#xff0c;有效地应对恶意IP攻击至关重要。IP数据云将深入探讨如何应对恶意IP攻击…

OpenHarmony开源项目—工程管理

DevEco Studio的基本使用&#xff0c;请参考DevEco Studio使用指南。本章主要介绍如何使用DevEco Studio进行多设备应用开发。 说明&#xff1a; 本章的内容基于DevEco Studio 3.1.1 Release版本进行介绍&#xff0c;如您使用DevEco Studio其它版本&#xff0c;可能存在文档与产…