RepoAgent:基于大型语言模型的开源框架,主动生成、维护和更新代码文档

news2024/12/28 21:04:14

人工智能咨询培训老师叶梓 转载标明出处

开发者通常花费约58%的时间在程序理解上,高质量的代码文档在减少这一时间上扮演着重要角色。然而,维护代码文档同样消耗大量的时间、金钱和人力。为了减轻维护代码文档的负担,早期尝试自动文档生成的方法旨在为源代码提供描述性摘要。但是,这些方法在总结化、指导不足和被动更新方面存在显著局限性。清华大学、中国人民大学和西门子公司的研究团队提出了RepoAgent,一个由大模型(LLM)驱动的开源框架,旨在主动生成、维护和更新代码文档。通过定性和定量评估,验证了本方法的有效性,表明RepoAgent在生成高质量的仓库级文档方面表现出色。代码和结果已在GitHub公开访问。

通过普通摘要方法和提出的RepoAgent生成的代码文档的比较

RepoAgent框架

RepoAgent方法的三个组成部分

如图2所示RepoAgent方法分三个组成部分:全局结构分析(Global Structure Analysis)、文档生成(Documentation Generation)和文档更新(Documentation Update)。这三个组件不仅可以独立执行,还可以打包成工具钩子(hook),用于各种工具集成目的。当这三个组件协同工作时,RepoAgent能够确保从头开始构建和维护代码仓库的文档,将文档的重要性提升到与代码同等的水平,从而促进团队之间的同步和协作。

全局结构分析

全局结构分析是构建高质量代码文档的基础。研究者们首先提出了项目树这一概念,它作为理解整个代码库结构的关键数据结构。项目树的构建过程从筛选出Python文件开始,排除了其他非目标语言的文件,以确保分析的准确性。随后,通过应用抽象语法树(AST)分析,研究者们能够递归地解析每个Python文件中的类和函数,详细提取它们的元信息,包括类型、名称和代码片段等。这些信息成为了后续文档生成过程中的基本构建块。

文档生成

文档生成阶段,研究者们设计了一套策略,使得后端的大型语言模型(LLM)能够利用项目树中的元信息和代码间的引用关系,生成结构化且具有实用指导性的文档。这一过程涉及到一个精心构建的提示模板,它能够引导LLM生成包含功能、参数、代码描述、注意事项和示例等部分的文档。

用于文档生成的提示模板,包括动态填充的变量和根据不同对象的元信息丰富文档内容的部分

图3提供了一个用于文档生成的提示模板示例,这个模板是与大模型(LLM)交互的接口,指导模型生成结构化且内容丰富的文档。

在文档生成阶段,RepoAgent首先利用项目树(Project Tree)来感知整个代码库的上下文。项目树中的每个节点,代表代码中的一个类或函数,都携带有其元信息,例如类型、名称和相对文件路径。这些元信息为LLM提供了生成文档所需的基本信息。

接着,RepoAgent使用精心设计的提示模板,将这些元信息以及代码片段作为输入传递给LLM。提示模板中包含了一些关键部分,例如:

功能描述(Functionality):使用清晰、简洁的句子描述代码对象的主要功能。

参数(Parameters):列举函数或类的参数,并提供每个参数的描述。

代码描述(Code Description):详细阐述代码的工作原理、逻辑流程以及它在整个项目中的作用。

注意事项(Notes):提供关于代码使用的额外信息,可能包括潜在的错误、优化建议或其他重要提示。

示例(Examples):如果代码对象有返回值或特定的使用场景,提供示例可以帮助开发者更好地理解如何使用这段代码。

最后,RepoAgent将LLM生成的文本编译成Markdown格式,这是一种轻量级的标记语言,可以轻松地转换成HTML,用于在Web上展示。Markdown格式的文档具有清晰的结构和易于阅读的样式,使得开发者可以快速浏览和查找所需信息。

文档更新

文档更新是RepoAgent自动化能力的另一重要体现。研究者们通过与Git的紧密集成,实现了文档的自动跟踪和更新。通过Git的预提交钩子,RepoAgent能够在代码提交前自动检测变更,并触发文档的更新流程,确保文档与代码的同步。这一自动化过程显著减少了人工干预的需求,并且由于代码的低耦合特性,RepoAgent能够智能地仅更新受影响部分的文档,而不是每次都重新生成整个文档。文档更新的触发条件包括源代码的修改、引用关系的变更等,这些都是确保文档准确性和时效性的关键因素。

通过这三个阶段的协同工作,RepoAgent不仅提升了文档的质量和可用性,还强化了团队协作的效率,使得每个团队成员都能够轻松访问最新、最准确的项目文档。这种自动化和智能化的文档管理方式,是现代软件开发实践中的一个重要进步,有助于提升开发速度和代码质量。

实验

研究者选择了9个不同规模的Python代码仓库作为实验对象,这些仓库在GitHub上因其经典性或高流行度而被选中,并且具有高代码质量和项目复杂性。研究者提供了这些仓库的详细统计数据,包括代码行数、类和函数的数量。他们还介绍了实验中使用的后端大型语言模型(LLMs),包括gpt-3.5-turbo、gpt-4-0125、Llama-2-7b和Llama-2-70b。

研究者以ChatDev仓库为例,展示了RepoAgent生成的文档。生成的文档结构清晰,首先用简洁的句子描述对象的功能,然后是参数部分,详细列举了所有相关参数及其描述。代码描述部分全面阐述了代码的各个方面,包括对象的角色和它与全局上下文中其他代码的关联。笔记部分进一步丰富了描述,突出了代码中的逻辑错误或潜在优化。如果对象有返回值,模型还会生成示例部分,展示预期输出。

RepoAgent为ChatDev代码库生成的代码文档示例
ChatDev功能文档的更新,包括原始代码、更新后的代码、原始文档和更新后的文档

研究者采用了人类评估员来评估RepoAgent生成的文档质量。由于缺乏有效的评估方法,他们进行了偏好测试,比较了人类编写的和模型生成的代码文档。评估员被要求根据一系列评估标准来选择每对文档中的较优者。评估结果显示,RepoAgent生成的文档在质量上超越了人类编写的内容。

人类偏好测试的结果,比较了人类编写和模型生成的代码文档的偏好率

“定量分析”部分包含了几个关键的定量测试,用以评估RepoAgent的性能:

参考召回(Reference Recall):研究者评估了模型识别代码对象全局上下文中的引用关系的能力。他们比较了几种不同的文档生成方法,包括基于机器学习的方法、长上下文连接方法和单对象生成方法。结果显示,RepoAgent使用Jedi工具和双向解析准确传递了全局引用关系,有效克服了其他方法在生成仓库级代码文档时遇到的范围限制。

不同文档生成方法在全局调用者和被调用者识别中的召回率

格式对齐(Format Alignment):研究者评估了LLMs生成的文档是否遵循了定义的格式。大型模型如GPT系列和Llama-2-70b在格式对齐方面表现良好,而小型模型Llama-2-7b在格式对齐上表现较差。

不同LLMs在格式对齐准确性方面的表现

参数识别(Parameter Identification):研究者进一步评估了模型在所有9个仓库中识别参数的能力。结果显示,GPT系列在参数识别方面显著优于LLaMA系列,其中gpt-4-0125表现最佳。

不同LLMs作为后端在识别函数参数准确性方面的表现

经过深入研究和实践,RepoAgent已被证明是一个强大的工具,它不仅提升了代码文档的生成质量,还显著增强了开发团队的协作效率。虽然存在一些限制,比如目前主要支持Python语言,并且可能需要人工监督来确保文档的准确性和完整性,随着技术的不断发展,RepoAgent将能够克服这些限制,服务于更广泛的编程语言和应用场景。

论文链接:https://arxiv.org/abs/2402.16667

项目链接:https://github.com/OpenBMB/RepoAgent

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1969676.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【学术会议征稿】2024年环境保护与污染控制国际学术会议 (EPPC 2024)

2024年环境保护与污染控制国际学术会议 (EPPC 2024) 2024 International Conference on Environmental Protection and Pollution Control (EPPC 2024) 2024年环境保护与污染控制国际学术会议将于2024年11月22-24日于中国西安举行。随着全球环境问题日…

【C语言】C语言期末突击/考研--数据的输入输出

目录 一、printf()输出函数介绍 二、scanf读取标准输入 (一)scanf函数的原理 (二)多种数据类型混合输入 三、练习题 今天我们学习printf和scanf读取标准输入。下面我们开始正式的学习吧。 C语言中有很多内置函数,今…

【项目管理进阶】如何制定进度计划

前言 项目管理进阶系列又又又又更新了… 作为Team leader或者Project Manager,你们最怕什么?(文末有投票,踊跃参加O)~ 甲说,我具备多年的项目管理经验,秉持“兵来将挡,水来土掩”的…

开机WiFi没了只能宽带,连声音都有问题,服务里系统还原等一堆错误无法调试!——DHCP服务器常见的故障影响这么大?

错误呈现: 因为问题解决了所以就剩最开始开机直观看到的问题截图: 最崩溃的网络出现问题: 针对网络问题解决结果失败: 问题描述 1,刚开始声音有问题自以为是驱动连接或者声卡硬件有错。 2,后面发现输入…

DB-GPT_0.5.10安装__部署Qwen2-72b模型(Ubuntu)——报错记录

官网地址在这里——源码部署 (yuque.com),英文地址——Source Code Deployment | DB-GPT (dbgpt.site) 官网给了三种部署方式:源码部署、Docker部署、Docker-Compose部署,这里我选择的部署方式是源码部署,Docker部署的教程我感觉…

18. Lammps命令学习-4之units

来源: “码农不会写诗”公众号 链接:Lammps命令学习-4之units units style 使用read data或create box命令定义模拟框之前设置用于模拟的单位类型   https://docs.lammps.org/units.html Syntax units styleDescription **设置用于模拟的单位类型&am…

MySQL数据库入门基础知识 【1】推荐

数据库就是储存和管理数据的仓库,对数据进行增删改查操作,其本质是一个软件。 首先数据有两种,一种是关系型数据库,另一种是非关系型数据库。 关系型数据库是以表的形式来存储数据,表和表之间可以有很多复杂的关系&a…

flink 1.17 测试

1、配置 2、测试: ./bin/flink run-application -t yarn-application -Dyarn.application.namewordcount -c org.apache.flink.streaming.examples.wordcount.WordCount ./examples/streaming/WordCount.jar --input hdfs://jy/tmp/input --output hdfs://jy/tmp/o…

linux安装人大金仓数据库

下载人大金仓数据库 人大金仓-成为世界卓越的数据库产品与服务提供商 (kingbase.com.cn) 下载授权文件 1创建用户 创建用户并设置密码为kingbase useradd kingbasepasswd kingbase 创建目录 sudo mkdir -p /opt/Kingbase/ES/V9 # 设置操作权限 sudo chmod orwx /opt/Kingba…

Spring@Autowired注解

Autowired顾名思义,就是自动装配,其作用是为了消除代码Java代码里面的getter/setter与bean属性中的property。当然,getter看个人需求,如果私有属性需要对外提供的话,应当予以保留。 因此,引入Autowired注解…

智慧水务项目(一)django(drf)+angular 18 通过pycharm建立项目

一、环境准备 windows 10 pycharm python3.11 二、pycharm 创建django项目 三、建立requirements.txt 在根目录创建requirements.txt,也就是与manage.py同一目录下,先放下面几个依赖 Django djangorestframeworkpip install -r .\requirements.txt 更新下pip python…

仓颉语言 -- 网络编程

使用新版本 (2024-07-19 16:10发布的) 1、网络编程概述 网络通信是两个设备通过计算机网络进行数据交换的过程。通过编写软件达成网络通信的行为即为网络编程。 仓颉为开发者提供了基础的网络编程功能,在仓颉标准库中,用户可使用…

python3GUI--new音乐播放器!By:PyQt5(附下载地址)

文章目录 一.前言二.展示1.启动2.MV推荐3.专辑详情页4.歌手详情页5.搜索结果页6.歌曲播放页7.我喜欢歌曲页8.我喜欢专辑页 三.思路&启发1.布局2.细节3.组件复用4.项目结构5.优化速度1.Nuitka1.显著提高性能:2.减小程序体积&am…

SPSSAU | 德尔菲专家法原理及案例实操分析

德尔菲专家法Delphi是一种结构化的预测和决策方法,主要用于收集和综合专家意见,进而做出相应决策的研究方法。比如在我们建立指标体系时,首先选择20个备选指标,然后寻找10位专家进行评价(评价该20个指标是否具有可行&a…

聊聊ChatGLM6B的微调脚本及与Huggingface的关联

前言 本文首先分析微调脚本trainer.sh的内容,再剖析ChatGLM是如何与Huggingface平台对接,实现transformers库的API直接调用ChatGLM模型,最后定位到了ChatGLM模型的源码文件。 脚本分析 微调脚本: PRE_SEQ_LEN128 LR2e-2CUDA_V…

GeneAvatar: 3D 数字人编辑方案

定位: GeneAvatar是一种通用方法,用于编辑不同体积表示(如NeRFBlendShape、INSTA、Next3D)中的3D数字人,仅需一张2D图像即可实现友好的编辑操作。 核心功能: 支持使用2D编辑方法(如拖拽式GAN、文本驱动编辑等&#x…

[Bugku] web-CTF-GET

GET 1.开启环境 2.根据内容得知在网址url后输入?whatflag

字符设备驱动基础—sys文件系统,udev介绍,驱动模块在内核空间注册设备

文章目录 sys文件系统介绍设计思想应用和功能 udev介绍主要功能工作原理使用 udevadm 工具 设备文件创建流程驱动程序的注册device_create函数详解示例代码效果图 sys文件系统介绍 sysfs 是 Linux 内核中的一种虚拟文件系统,它为用户空间和内核之间提供了一种统一的…

C语言小练习(贰)

上机 计算n以内所有正奇数的和 ? n值通过键盘输入 #include <stdio.h>int main() {int sum 0;int i 1;int n;printf("请输入一个范围\n");scanf("%d",&n);do{if(i % 2 ! 0)//判断奇数{sum i;}i;}while(i < n);//限定条件printf("范围…

Python连接数据库:JDBC不是唯一选择!

你是否曾困惑于如何在Python中连接数据库?也许你听说过JDBC,但不确定它是否适用于Python?别担心,本文将为你揭开Python数据库连接的神秘面纱! 目录 JDBC vs Python数据库连接Python连接数据库的正确姿势Python的数据库连接方案为什么Python不直接使用ODBC或JDBC&#xff1f;…