ArchGuard Co-mate:一次关于大语言模型与架构治理、架构设计的探索

news2024/11/29 18:24:14

在过去的几个月里,为了探索了 LLM 结合 SDLC、BizDevOps 的可能性,我们(Thoughtworks 开源社区)创建了 ClickPrompt、 AutoDev、DevTi 等一系列的开源项目。从个人的经验来看,未来越来越多的应用将围绕于 LLM@Core 设计,所以我们挖了一个新的坑、新的试验:ArchGuard Co-mate:https://github.com/archguard/comate,欢迎来入坑一起探索和研究。

Why is Co-mate ?

我们发起 Co-mate 项目的原因,可以归于:在 LLM 优先的应用开发时代,掌握相关的开发技能。这些相关的技能包含但是不限于:

  • 探索是否存在更好的交互模?如基于 Chat 的动态 UI(DSL)生成 等。

  • 适用于 JVM 体系下的 LLM 应用开发?如 JVM 版 LangChain、Embedding 等。

  • 如何辅助上下文理解、构建的本地小模型?即 Sentence Transformer + ONNX 的本地处理。

  • 如何设计新一代、适用于 LLM 的软件 API?即如何以确定性的方式与 ArchGuard API 交互。

  • 如何更好地构建上下文,以工程化的方式构建 AI 应用的上下文(即 prompt)?

而出于架构治理的场景,我们则是想探索:

  • 如何让 LLM 解释软件架构给人听?毕竟,让人理解构建都是一件费力的事情。

  • 如何让 LLM 基于代码、分层、依赖关系等,解释架构、业务?

  • 如何让 LLM 更好地理解规范,从文档出发,去设计软件架构?

每个问题都足够的有意思,并且具备一定的业务和技术复杂度,足以让我们掌握基于 LLM 的软件架构所需要考虑的因素。

What is Co-mate ?

作为一个探索性的项目,解释 Co-mate 的用途并不是一件容易的事情。一个架构师的助手能做到什么程度,我们还没有想得足够的清晰 —— 因为我们还没对架构的定义达到一致意见。

但是呢,先让我们看看 Co-mate 当前的处理流程:

3a4953e1d1b9223df4c2741df0335b66.png

从表面上看,基本上和主流的 AI 应用没有区别;从实际代码上来看,和主流的 AI 应用也看不出多大的区别。还是让我们看看两个典型的 Co-mate 场景。

示例 1:介绍一下这个系统

当用户在 Co-mate 中去分析 Co-mate 时,会返回类似于如下的结果:

Co-mate 项目是一个 AI 助手应用程序,使用了 Jetpack Compose、RxJava、DataStore 等一系列相关的库来构建设计和治理工具等功能。该应用还使用了一些第三方库来构建用户界面,如 Coil-Compose、Voyager Navigator 等,以及进行深度学习推理任务,如 Kotlin Deep Learning API、Inference API 等。该应用需要考虑高效的算法和模型推理能力等非功能需求。

对于这个场景下,其数据处理过程如下:

  1. 匹配本地相关的指令(如 “分析系统”)

    1. 如果匹配到,则直接调用 AG API 来构建上下文。

    2. 如果没有匹配到,则调用 LLM 进行选择命令,然后可以调用 AG 原有 API。

  2. 调用 AG API 构建上下文(项目信息、软件依赖信息等)。

  3. 调用 LLM 进行总结,并返回给用户。

所以,我们尝试构建两个新的 API:本地语义分析、(动态)上下文收集 API。

示例 2:API 规范性检查

基于 ArchGuard 的能力,我们挑选的第二个场景是检查 API 是否规范。当你有一个 Controller 里的 API 需要检查是否符合 API 规范时,就可以执行: 检查 API 规范 。

假设你的 API 是: /api/blog/get ,并且已经通过 spec-partitioner (还没有实现)转换了你的 API 规范。

最后,Co-mate 会返回:

API '/api/blog/get' 不符合 URI 构造规范,Rule: uri construction regex: \/api\/[a-zA-Z0-9]+\/v[0-9]+\/[a-zA-Z0-9\/-]+,建议 API 修改为 '/api/blog/v1/get'。

(PS:垃圾 GPT 3.5 Turbo,居然认可了 /get)

所以,当你有了完整的架构规范时,那么就可以进入下一代架构生成:

cf5646a2696b0eed3ca5d980936ba166.png

这也是我们想进一步探索的工作。

How Co-mate works ?

众所周知 GPT 充满了各种不确定性,人们对于 GPT 理解的能力也是不同的。因此,从架构设计的角度来说,我们需要分解 GPT 的原子能力,诸如于总结、分类、提取、翻译、逻辑推理,消除其中的不确定性因素,再由我们的软件封装 API 提供动态能力。

分层架构与 ArchGuard 能力映射

在示例 1 中,我们做的第一件是分解架构与数据按不同的架构元素分析。因为我们对于架构缺乏统一的定义,所以我从 Global 的 slides 找了一个适合于 LLM 理解的分层架构、并且也适用于 ArchGuard 表达。随后,构建了一个不太成功的分层与所需要的上下文数据映射:

342e71080cce6ad3e09a8d46cfd55816.png

于是在示例 1 里,我们给的 prompt 模板是:

{xxx} 项目是一个 {channel type} 应用程序,使用了 Jetpack Compose、{xxx} 和一系列相关的库来构建 {xxx} 等功能。该应用还使用了一些第三方库来构建用户界面 {xxx},以及进行 {xxx} 等任务。该应用需要考虑 {xxx} 等非功能需求。

在这个 prompt 里,它依赖于两个主要数据:项目介绍与项目的技术栈(依赖信息)。技术栈可以直接从 ArchGuard SCA 中获取,而项目介绍则是从 README.md 中解析得到的。

LLM 与 Co-mate API 的能力映射

在示例 2 中,我们做的第一件事是分解 API 文档, 按不同 LLM 的原子能力进行分解。构建出四种不同的原子能力:

  • 推理出适用于 URI 的正则表达式。

  • 推理出一个合理的 example。

  • 提取一些 checklist,诸如于状态码、HTTP Action 等。

  • 将剩下的不确定性内容,扔到一起。

如下图所示:

7407441447ee5417b31efbd78feb7f37.png

在右侧,我们则构建了一个 Kotlin Typesafe DSL,以动态的加载到系统中(未来),每一个函数对应到一个 Rule。

rest_api {
    uri_construction {
        rule("/api\\/[a-zA-Z0-9]+\\/v[0-9]+\\/[a-zA-Z0-9\\/\\-]+")
        example("/api/petstore/v1/pets/dogs")
    }
    http_action("GET", "POST", "PUT", "DELETE")
    status_code(200, 201, 202, 204, 400, 401, 403, 404, 500, 502, 503, 504)
    security("""Token Based Authentication (Recommended) Ideally, ...""")
    misc("""....""")
}

作为一个 demo,这个 DSL 依旧具备很大的完善空间。其中比较有意思的部分在于 security 和 misc 部分,这些不确定性正好适用于 LLM 进行推理。所以,在执行对应的 misc、security 规则检查时,会再调用 GPT 来检查:

eb52265e017128abb31fa3eb3acb2312.png

以将其中的确定性与不确定性更好的结合,进而充分地利用了 LLM 与 ArchGuard 的能力,并减少对 GPT 的消耗。

Welcome join us

下图是,当前 ArchGuard Co-mate 的所有模块:

25ca84be5943e0cdb54d237a17ff9956.png

简单介绍如下:

  • Comate-Core 提供了 CLI 和 GUI 所需要的基本能力,

  • Meta-Action 则是定义了基本的 Action

  • Architecture 定义了什么是 Co-mate 理解的架构

  • LLM-Core 则是对于 LLM 的调用 。

  • Spec Partitioner 则是计划对于规范的提取与自动生成(当前都是手动 prompt)

而我们在采用 JVM 技术栈的时候,遇到了几个坑 KotlinDL 和 Deep Java Library 都是通过 JNI/Rust 的方式调用了 HuggingFace Tokenizers、ONNX API,导致了应用在 macOS 下 crash。而一种理想的方式应该是通过 JSON RPC 的方式来调用,所以我们计划使用 Rust 构建一个新的模块:Comate Agent。

所以,如果你对使用 JVM 技术栈来开发 AI 应用,对 Rust 技术栈来开发 AI 应用,欢迎来加入我们。

总结

该文介绍了 Thoughtworks 开源社区创建的一系列开源项目,探索了大语言模型与架构治理、架构设计的可能性。其中,ArchGuard Co-mate 是一个探索性的项目,旨在探索架构师助手的能力,包括本地语义分析、动态上下文收集 API、架构规范检查等。文章还介绍了分层架构与 ArchGuard 能力映射、LLM 与 Co-mate API 的能力映射等内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/626180.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

400万总奖金!打一场大厂算法赛事

Datawhale赛事 主办:科大讯飞,伙伴:Datawhale 5月6日,伴随科大讯飞星火认知大模型的发布,2023年度 iFLYTEK A.I. 开发者大赛也正式开启。本届大赛的总奖金池超400万元,除此外还将进一步开放海量数据与核心…

如何使用ArcGIS制作三维地形图

ArcGIS作为专业的GIS软件,不仅可以制作二维地图,制作三维地图也是不在话下,通常我们使用ArcScene来制作三维地图,这里为大家介绍一下制作三维地图的方法,希望能对你有所帮助。 预处理数据 将准备好的矩形面、矩形线和…

Kibana:使用 Kibana 自带数据进行可视化(一)

在今天的练习中,我们将使用 Kibana 自带的数据来进行一些可视化的展示。希望对刚开始使用 Kibana 的用户有所帮助。 前提条件 如果你还没有安装好自己的 Elastic Stack,你可以参考如下的视频来开启 Elastic Stack 并进行下面的练习。你可以开通阿里云检…

接着首发!2023全国1卷数学压轴题解析

早点关注我,精彩不错过! 压轴题原题如下: 以下是压轴题速解,上次突出一个细,这次,自己挑战了一把快! 去年偶然得闲,在高考当天晚上陷入了少年的回忆,重做了一把高考数学压…

“站在后天看明天”:华为给金融广厦架起数字栋梁

在中国古建筑中,有个重要概念,叫做“栋梁”。其中“栋”是指房屋的东西向正梁,起到承担房屋荷载的作用;“梁”则是支撑楼板和其他承重结构的南北向竖梁,起到构筑受重面,支撑屋顶飞檐斗拱的作用。 精彩绝伦、…

如何安装和使用 Hugging Face Unity API

Hugging Face Unity API 提供了一个简单易用的接口,允许开发者在自己的 Unity 项目中方便地访问和使用 Hugging Face AI 模型,已集成到 Hugging Face Inference API 中。本文将详细介绍 API 的安装步骤和使用方法。 安装步骤 打开您的 Unity 项目导航至菜…

2核4G服务器阿里云和腾讯云性能测试对比

阿里云轻量应用服务器2核4G4M带宽优惠价297.98元12个月,腾讯云轻量2核4G5M服务器168元一年,628元3年,2核4G轻量应用服务器阿里云和腾讯云怎么选择?哪个性能比较好?阿腾云分享轻量应用服务器2核4G配置阿里云和腾讯云价格…

3A(3000mA)输出电流比例阀控制器

0.5A(500mA)、0.8A(800mA)、1A(1000mA)、1.5A(1500mA)、2A(2000mA)、2.5A(2500mA)、3A(3000mA)、3.2A(3200mA)等电流输出控制比例阀放大器是用于控制液压系统中的比例阀线圈驱动阀芯运动。它主要由阀体、驱动线圈和放大器。 比例阀是控制方向、流量或压力的元件,它的…

chatgpt赋能python:Python怎么1加1等于2

Python怎么1加1等于2 Python是一种高级编程语言,通常用于快速开发应用程序,处理数据和进行科学计算。Python是一门易于学习的语言,学习它的基础非常简单。 介绍 Python在计算机科学领域已经有超过20年的历史,它在很多领域都有广…

【新版】系统架构设计师 - 项目管理

个人总结,仅供参考,欢迎加好友一起讨论 文章目录 架构 - 项目管理考点摘要进度管理工作分解结构(WBS)关键路径法及几个概念箭线图法(双代号网络图,ADM)前导图法(单代号网络图&#x…

Java利用函数计算工资

1 问题 在平时里,我们经常用到计算问题,很多人只会在main函数里赋值计算,这样计算出的数据没有对象,很混乱。因此,用创建一个类,来进行批量计算,会给我们带来很大便利。 2 方法 (1) 先创建一个w…

CentOS 7 安装 Jenkins

一、准备工作 首选需要CentOS 7 安装 JAVA环境(JDK 1.8) 1.打开url选择jdk1.8下载 Java Downloads | Oracle 我选择linux x64版本: ​ 2.下载 wget http://download.oracle.com/otn-pub/java/jdk/8u171-b11/512cd62ec5174c3487ac17c61aaa…

代码随想录训练营Day52|300.最长递增子序列;674. 最长连续递增序列 ;718. 最长重复子数组

300.最长递增子序列 class Solution {public int lengthOfLIS(int[] nums) {int[] dp new int[nums.length];int res 0;Arrays.fill(dp, 1);for(int i0;i<nums.length; i){for(int j0; j<i; j){if(nums[j]<nums[i]){dp[i] Math.max(dp[i], dp[j]1);}}res Math.max…

天呐!Python秒出朋友圈秀图!

大家注意&#xff1a;因为微信最近又改了推送机制&#xff0c;经常有小伙伴说错过了之前被删的文章&#xff0c;比如前阵子冒着风险写的爬虫&#xff0c;再比如一些限时福利&#xff0c;错过了就是错过了。 所以建议大家加个星标&#xff0c;就能第一时间收到推送。&#x1f44…

Java开发中PO、VO、DAO、BO、DTO、POJO 含义

PO(persistant object) 持久对象 可以看成是与数据库中的表相映射的java对象。使用 Mybatis 来生成 PO 是不错的选择。 VO(value object) 值对象 通常用于业务层之间的数据传递&#xff0c;和 PO 一样也是仅仅包含数据而已。但应是抽象出的业务对象&#xff0c;可以和表对应&am…

最强提示词技巧,没有之一!(全网首发)

我们总是希望AI按照我们的要求来进行回复。 通常&#xff0c;当回复不符合预期的时候&#xff0c;我们需要通过不断优化提示词&#xff0c;让AI慢慢学习&#xff0c;慢慢领悟我们的意图&#xff0c;直到符合我们的预期。而这个过程&#xff0c;往往需要长时间多轮往复。 举个栗…

【网络原理】初学网络必备知识

&#x1f94a;作者&#xff1a;一只爱打拳的程序猿&#xff0c;Java领域新星创作者&#xff0c;CSDN、阿里云社区优质创作者。 &#x1f93c;专栏收录于&#xff1a;计算机网络原理 本期讲解什么是局域网与广域网&#xff0c;网络通信基础知识之IP地址、端口号、协议、五元组。…

springboot第25集:实体类定义规则

PO&#xff1a;持久化对象&#xff0c;一个PO对象对应一张表里面的一条记录。全部对应 VO&#xff1a;View视图对象&#xff0c;用来在页面中展示数据的&#xff0c;页面需要哪些字段属性就添加哪些&#xff0c;查询出来之后赋值操作比PO对象要简单。所以提高性能。 DTO&#x…

paddle 目标检测C++部署流程

1 源码下载以及依赖库 PaddleDetectionopencv3.4.6paddle_inference10.2 2 C 编译流程 手动配置cmake的依赖库路径 报错1 报错2 报错3 编译结果 3 测试 略

梵想 S690MQ 4TB固态尝鲜,我的磁盘空间又充裕了

先上一张我的工作电脑磁盘空间图&#xff0c;系统盘装了非常多的开发环境非常吃紧&#xff0c;数据盘D盘存着大部分虚拟机估计再过没多久也要告急了&#xff0c;之前磁盘已经红过一次&#xff0c;清理了下微信聊天记录感觉还能挺几个月。 对于爱折腾系统的我 1.5T 的磁盘空间已…