Devin,第一位AI软件工程师

news2024/11/17 17:44:38

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

遇见Devin,全球首位全能自主AI软件工程师。

Devin是个不知疲倦的技术搭档,无论是并肩作战还是独立完成任务,它都能让你大开眼界。

有了Devin,工程师们可以将精力集中在更加有趣的问题上,工程团队也能追求更高的目标。

Devin的技能包括:

借助我们在长期推理和规划方面的进步,Devin能够规划并执行复杂的工程任务,这些任务需要成千上万的决策。Devin能够在每一步都回忆起相关上下文,随时间学习,并修正错误。

我们还为Devin装备了常见的开发工具,包括shell、代码编辑器和浏览器,这一切都在一个沙盒计算环境中——就像一个人类工程师需要的一样。

最后,我们让Devin能够与用户积极协作。Devin能够实时报告进度,接受反馈,并在设计选择上与你协同工作。

下面是Devin能做的一些示例:

  • Devin能学习如何使用不熟悉的技术。在阅读了一篇博客文章后,Devin运行ControlNet在Modal上产生含有隐藏信息的图片给Sara。
  • Devin能够端到端构建和部署应用程序。Devin创建了一个模拟生命游戏的互动网站!它逐步添加用户请求的功能,然后将应用部署到Netlify。
  • Devin能够自主地在代码库中找到并修复bug。Devin帮助Andrew维护和调试他的开源竞技编程书。
  • Devin能够训练和微调自己的AI模型。Devin仅凭一个指向GitHub研究仓库的链接就设置了大型语言模型的微调。
  • Devin能够处理开源仓库中的bug和功能请求。仅凭一个GitHub问题的链接,Devin就完成了所有的设置和上下文收集工作。
  • Devin甚至能够为成熟的生产仓库做出贡献。这个例子是SWE-bench基准测试的一部分。Devin在sympy Python代数系统中解决了一个对数计算的bug。Devin设置了代码环境,重现了bug,并独立完成了编码和测试。
  • 让Devin在Upwork上接真实的工作,它也能做到!在这里,Devin编写和调试代码来运行一个计算机视觉模型。Devin采样结果数据并在最后编制了一份报告。

Devin的表现

我们在SWE-bench上评估了Devin,这是一个挑战性的基准测试,要求代理解决在开源项目中找到的真实世界GitHub问题,如Django和scikit-learn。

Devin正确解决了13.86%*的问题,远远超过了之前的最好成绩1.96%。即使给定了确切的文件来编辑,以前的最好模型也只能解决4.80%的问题。

*Devin在数据集的随机25%子集上进行了评估。Devin是无人协助的,而所有其他模型都是有协助的(意味着模型被明确告知需要编辑哪些文件)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1515255.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode.2864. 最大二进制奇数

题目 2864. 最大二进制奇数 分析 这道题目其实我们只需要保证最后一位是1,其余的1都放在最前面,这样得到的就是最大二进制奇数。 所以,我们先统计给定的字符串有多少个 1,多少个 0,把其中一个 1 放在最后一位&…

【C#】【SAP2000】读取SAP2000中所有Frame对象的应力比到Grasshopper中

if (build true) {// 连接到正在运行的 SAP2000// 使用 System.Runtime.InteropServices.Marshal.GetActiveObject 方法获取正在运行的 SAP2000 实例cOAPI mySapObject (cOAPI)System.Runtime.InteropServices.Marshal.GetActiveObject("CSI.SAP2000.API.SapObject"…

趣学前端 | 平平无奇的JavaScript函数

背景 最近睡前习惯翻会书,重温了《JavaScript权威指南》。这本书,文字小,内容多。两年了,我才翻到第十章。因为书太厚,平时都充当电脑支架。 JavaScript函数 读这章之前,我感觉我三十年开发功力&#xf…

构建社区服务平台的智慧架构

社区服务平台作为连接社区居民与各类服务资源的桥梁,承载着提升居民生活品质、促进社区发展的重要使命。本文将深入探讨社区服务平台的架构设计理念、核心功能和发展前景,助力读者了解如何构建智慧化、便捷化的社区服务平台,为社区居民提供更…

SpringBoot+Vue项目报错(问题已解决)

1、错误日志 2、分析原因: JWT strings must contain exactly 2 period characters. Found: 0 JWT字符串必须包含2个句号字符。发现:0 分析:可以判断出大概可能是token格式出现了问题 3、参考 http://t.csdnimg.cn/hfEiY 4、检查后端代码是否出现问…

VR数字展厅在企业中应用的优势有哪些?

随着VR全景技术的成熟,VR数字展厅逐渐成为了企业展示形象和产品的重要手段之一。VR企业数字展厅是一种通过VR技术、3D建模技术展示企业形象和产品的创新方式,将企业线下的展厅搬到线上,为企业品牌形象带来了很多优势。 VR数字展厅在企业中应用…

数学实验_Matlab使用2_简单绘图

简单使用 x -pi * 2 : .1 : pi*2;y sin(x);plot(x, y); % 绘制普通图像plot(x, y, k-.*); % 绘制2维图像,线为实线,*为每个点(Matlab的画图比较原始,就是简单的秒点画图)grid on; % 打开网状格式% grid off; % 关闭…

php中 0 == ‘’(0等于任意字符串) 判断是否成立 返回true

php中不同类型变量之间比较大小 一、背景二、探究0是为什么?三、探究 0all是为什么?四、程序中如何判断0是否等于指定字符串 一、背景 最近在项目实际开发中,我需要判断前端传来的参数值是否等于一个字符串;然后发现当参数值是0时…

每天五分钟计算机视觉:如何构造分类定位任务的算法模型?

本文重点 本节课程我们将学习分类定位的问题,也就是说不仅要完成图片分类任务,然后还要完成定位任务。如下所示,我们不仅要用算法判断图片中是不是一辆车,还要在图片中标记出它的位置,用边框对象圈起来,这就是分类定位问题。 一般可能会有一张图片对应多个对象,本节课我…

你《时间贫困》么?

今天我要为大家分享的书叫《时间贫困》 这本书出版于2023年12月 “时间贫困”这个名字是什么意思呢? 它指的是一种没有自己的时间的感受 这种感受我相信大家都不陌生 现代人早晨被闹钟叫醒后就忙着洗漱、吃早饭、上班 下班后经过漫长的通勤回到家 可能还要处理各种琐…

Mysql 死锁案例4-delete 相邻记录导致死锁

死锁复现 CREATE TABLE t (id int(11) NOT NULL,c int(11) DEFAULT NULL,d int(11) DEFAULT NULL,PRIMARY KEY (id),KEY c (c) ) ENGINEInnoDB DEFAULT CHARSETutf8;/*Data for the table t */insert into t(id,c,d) values (0,0,0),(5,5,5),(10,10,10),(15,15,15) 事务1事…

数据结构入门篇 之 【双链表】的实现讲解(附完整实现代码及顺序表与线性表的优缺点对比)

一日读书一日功,一日不读十日空 书中自有颜如玉,书中自有黄金屋 一、双链表 1、双链表的结构 2、双链表的实现 1)、双向链表中节点的结构定义 2)、初始化函数 LTInit 3)、尾插函数 LTPushBack 4)、头…

04_拖动文件渲染在页面中

新建一个文件夹,跟之前一样,在 Vscode 终端里输入 yarn create electron-app Drag。 在 index.html 添加以下代码,JS 文件夹和 render.js 都是新创建的: 首先,css 文件一般和 html 结合使用,相当于 html 是…

SQL-Labs靶场“32-33”关通关教程

君衍. 一、32关 GET单引号闭合宽字节注入1、源码分析2、宽字节注入原理3、联合查询注入4、updatexml报错注入5、floor报错注入 二、33关 GET单引号addslashes逃逸注入1、源码分析2、联合查询注入3、updatexml报错注入4、floor报错注入 一、32关 GET单引号闭合宽字节注入 请求方…

yolov5-模型蒸馏算法

一般来说模型剪枝之后精度都会下降,微调之后会恢复一部分,但仍然达不到剪枝前的精度,因此蒸馏会在微调阶段配合使用 蒸馏是一种基于“教师-学生网络”的训练方法,教师模型参数量较大,效果更好,学生模型参数量较少,效果较差,蒸馏即让小模型学习大模型的知识,提升小模型…

ADO .Net操作SQL Server数据库

//ADO.NET是.NET Framework提供的数据访问服务的类库,应用程序可以使用ADO.NET连接到这些数据源,并检索、处理和更新数据 //常用的数据源包括四种:(1)Microsoft SQL Server数据源:使用System.Data.SqlClien…

力扣27. 移除元素

思路:数组的空间是连续的,没办法删除,所以只能是覆盖; 把有用的元素排上来之后,剩下的空间放什么元素可以直接忽视,然 后我们只需要返回新数组中长度即可; 快慢指针法:我们需要新建两…

数据仓库的基本概念、基本特征、体系结构

个人看书学习心得及日常复习思考记录,个人随笔。 数据仓库的基本概念、基本特征 数据仓库的定义:数据仓库是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,用以更好地支持企业或组织的决策分析处理。 数据仓库中数据的4个…

[LeetCode][LCR169]招式拆解 II——巧妙利用字母的固定顺序实现查找复杂度为O(1)的哈希表

题目 LCR 169. 招式拆解 II 某套连招动作记作仅由小写字母组成的序列 arr,其中 arr[i] 第 i 个招式的名字。请返回第一个只出现一次的招式名称,如不存在请返回空格。 示例 1: 输入:arr "abbccdeff" 输出:a…

基于SSM的协同过滤算法的电影推荐系统(有报告)。Javaee项目。ssm项目。

演示视频: 基于SSM的协同过滤算法的电影推荐系统(有报告)。Javaee项目。ssm项目。 项目介绍: 采用M(model)V(view)C(controller)三层体系结构,通…