DB-GPT发布:用私有LLM技术彻底改革数据库互动

news2024/10/5 12:36:03

01

项目介绍

随着大模型的发布迭代,大模型变得越来越智能,在使用大模型的过程当中,遇到极大的数据安全与隐私挑战。在利用大模型能力的过程中我们的私密数据跟环境需要掌握自己的手里,完全可控,避免任何的数据隐私泄露以及安全风险。基于此,我们发起了DB-GPT项目,为所有以数据库为基础的场景,构建一套完整的私有大模型解决方案。此方案因为支持本地部署,所以不仅仅可以应用于独立私有环境,而且还可以根据业务模块独立部署隔离,让大模型的能力绝对私有、安全、可控。我们的愿景是让围绕数据库构建大模型应用更简单,更方便。

DB-GPT 是一个开源的以数据库为基础的GPT实验项目,使用本地化的GPT大模型与您的数据和环境进行交互,无数据泄露风险,100% 私密

02

特性一览

目前已经发布了多种关键的特性,这里一一列举展示一下当前发布的能力。

私域问答&数据处理

支持内置、多文件格式上传、插件自抓取等方式自定义构建知识库,对海量结构化,非结构化数据做统一向量存储与检索

多数据源&可视化

支持自然语言与Excel、数据库、数仓等多种数据源交互,并支持分析报告。

自动化微调

围绕大语言模型、Text2SQL数据集、LoRA/QLoRA/Pturning等微调方法构建的自动化微调轻量框架, 让TextSQL微调像流水线一样方便。

Multi-Agents&Plugins

支持自定义插件执行任务,原生支持Auto-GPT插件模型,Agents协议采用Agent Protocol标准

多模型支持与管理

海量模型支持,包括开源、API代理等几十种大语言模型。如LLaMA/LLaMA2、Baichuan、ChatGLM、文心、通义、智谱等。

隐私安全

通过私有化大模型、代理脱敏等多种技术保障数据的隐私安全。

支持数据源

DataSource、MySQL、PostgresSQL、Spark、DuckDB、Sqlite、MSSQL、ClickHouse。

03、

架构方案

DB-GPT基于FastChat 构建大模型运行环境。此外,我们通过LangChain提供私域知识库问答能力。同时我们支持插件模式, 在设计上原生支持Auto-GPT插件。我们的愿景是让围绕数据库和LLM构建应用程序更加简便和便捷。整个DB-GPT的架构,如下图所示baa1cd3dad2fef83a8da296895ad8bce.jpeg核心能力主要有以下几个部分。

1.多模型:支持多LLM,如LLaMA/LLaMA2、CodeLLaMA、ChatGLM、QWen、Vicuna以及代理模型ChatGPT、Baichuan、tongyi、wenxin等

2.私域知识库问答: 可以根据本地文档(如pdf、word、excel等数据)进行高质量的智能问答。

3.统一数据向量存储和索引: 将数据嵌入为向量并存储在向量数据库中,提供内容相似性搜索。

4.多数据源: 用于连接不同的模块和数据源,实现数据的流动和交互。

5.Agent与插件: 提供Agent和插件机制,使得用户可以自定义并增强系统的行为。

6.隐私和安全: 您可以放心,没有数据泄露的风险,您的数据100%私密和安全。

7.Text2SQL: 我们通过在大型语言模型监督微调(SFT)来增强文本到SQL的性能

RAG生产落地实践架构

6cbd5d8e48954ad8ff1ee3f8fad61e42.jpeg 

子模块

DB-GPT-Hub 通过微调来持续提升Text2SQL效果

https://github.com/eosphoros-ai/

DB-GPT-Hub·DB-GPT-Plugins DB-GPT 插件仓库, 兼容Auto-GP

Thttps://github.com/eosphoros-ai/

DB-GPT-Plugins·DB-GPT-Web 多端交互前端界面

https://github.com/eosphoros-ai/DB-GPT-Web

SFT模型准确率 截止20231010,利用本项目基于开源的13B大小的模型微调后,在Spider的评估集上的执行准确率,已经超越GPT-4! 2e06165a731a66ca2e30051f785a8081.jpeg


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1124571.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【问题思考总结】已知对角矩阵怎么求原矩阵?原矩阵唯一吗?【相似对角化】

问题 这个问题起源于2010年数一真题: 给定一个对角阵,说QTAQ对角阵,然后Q矩阵实际上是能求出来无穷个的,在这种情况下,A矩阵该怎么求?或者说,Q矩阵不同的时候,A矩阵唯一吗&#xf…

uniapp水果海鲜生鲜商城系统小程序H5源码APP 同城配送、自提、拼单、多门店商城

外卖多门店小程序开源版开发 能够更好的适用于瑜伽馆、健身房、美容美发店、鲜花店、水果店、宠物店、母婴店、教育培训机构,送奶站、送水站,足疗按摩店、儿童摄影馆、上门服务(如:家政、维修)、无人售货超市、新零售会…

分治法,动态规划法,贪心法,回溯法主要概括

目录 分治法,动态规划法,贪心法,回溯法主要概括 1.前言2.分治法2.1基本思想:2.2适用条件:2.3时间复杂度:2.4主要解决:2.5关键字:2.6其他: 3.动态规划法3.1基本思想&…

2023/10/23学习记录

1.VS2019中sln对应解决方案 修改sln的文件名,对应的解决方案名称也会变化。 2.如何修改生成的exe文件名呢? 属性--->杂项--->(名称) 3.这是任务管理器,这里红色部分显示的是“这是文件描述”。 当通过属性查看详细信息的时…

朋友圈推广如何做?

为什么在朋友圈做推广是如此重要,以及如何充分利用这个平台来推动你的业务增长。 不仅仅是分享生活点滴,朋友圈也可以成为你的事业起飞的跳板。快来了解一下吧! 为什么在朋友圈做推广? 1、人脉力量:朋友圈是一个连接…

生成式AI - 基于大模型的应用架构与方案

这篇文章探讨了使用文档加载器、嵌入、向量存储和提示模板构建基于语言模型(LLM)应用程序的过程。由于其生成连贯且上下文相关的文本的能力,LLM在自然语言处理任务中变得越来越受欢迎。本文讨论了LLM的重要性,比较了微调和上下文注入方法,介绍…

集团公司管控的三种模式:财务管控、运营管控、战略管

集团管控是集团公司通过对子公司采用层级的管理控制、资源的协调分配等策略和方式,使集团的组织架构和业务流程达到最佳运作效率的管理体系。 不同的集团管控模式决定了不同的财务管控方式。但不论采取何种管控模式,集团对财务的管理与控制都是其最为核心…

2023简单好用的信息化管理平台,赋能中小生产企业信息化转型升级-亿发

随着信息技术的快速进步和产业互联网的兴起,传统企业正面临着日益迫切的信息化转型升级需求。数字化转型是指企业利用信息技术和互联网思维,对其业务模式、组织结构和运营流程进行改造,以提高生产效率和加强市场竞争力。在本文中,…

自然语言处理---Transformer机制详解之Transformer结构

1 Encoder模块 1.1 Encoder模块的结构和作用 经典的Transformer结构中的Encoder模块包含6个Encoder Block.每个Encoder Block包含一个多头自注意力层,和一个前馈全连接层. 1.2 Encoder Block 在Transformer架构中,6个一模一样的Encoder …

AUTOSAR 包 MC-ISAR 安装指南

安装程序和Tresos配置概念适用于所有AURIX产品。 一、安装包命名规则 二、安装包定义 三、名词缩写 四、安装过程 以 BASE package 安装过程为例。 1、运行MC-ISAR_AS<xxx>_AURIX_TC<con>_<Step>_PB_BASE_V<nnn>.exe。 对于TC29x版本&#xff1a;运…

多维评测指标解读第17届MSU世界编码器大赛全高清10bit赛道结果

超高清视频纤毫毕现的关键一环。 01 主要指标多项第一&#xff0c;带宽节省48% 近日&#xff0c;第17届MSU世界编码器大赛全高清10bit赛道成绩揭晓&#xff0c;阿里自研的H.266/VVC编码器Ali266在该赛道最高效的1fps档次上获得两项冠军&#xff0c;相较大赛基准编码器x265可节…

VR全景平台应该具备哪些功能,怎样选择VR全景平台

引言&#xff1a; 虚拟现实&#xff08;VR&#xff09;技术在不断发展&#xff0c;为企业和消费者提供了全新的交互体验。VR全景平台是一个关键的组成部分&#xff0c;它必须具备一系列重要的功能来吸引用户、提供内容和实现商业成功。那么VR全景平台应该具备哪些功能&#xf…

Ubuntu22.04系统 Cgroup v2 切换成v1

使用v1导致docker容器启动失败 Failed to mount cgroup at /sys/fs/cgroup/systemd: Operation not permitted Issue #4072 lxc/lxc GitHub https://github.com/lxc/lxc/issues/4072 原因&#xff1a;ubuntu自21.04版本后的版本&#xff08;不包含21.04&#xff09;linux内…

DS200DCFBG1BLC IS220PAICH1A 构建人工智能能力背后的紧迫性

DS200DCFBG1BLC IS220PAICH1A 构建人工智能能力背后的紧迫性 2023年9月12日可安装文件系统全球云企业软件公司发布了第一批研究结果&#xff0c;研究技术在企业向服务化业务模式转变的过程中&#xff0c;在实现业务优势和推动价值方面所扮演的角色。该研究调查了美国、英国、…

【网络安全】网络安全基础必备技能

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化【获取源码商业合作】 &#x1f449;荣__誉&#x1f448;&#xff1a;阿里云博客专家博主、5…

Speech | 语音中的风格迁移论文及总结[20231023更新版]

2018_Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-to-End Speech Synthesis 1.样式标记&#xff1a;端到端语音合成中的无监督样式建模、控制和传输 paper&#xff1a;Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-t…

OSPF的网络类型

1.3配置OSPF的网络类型 1.3.1实验3&#xff1a;配置P2P网络类型 实验需求 实现单区域OSPF的配置实现通过display命令查看OSPF的网络类型 实验拓扑 实验拓扑如图1-11所示 图1-11 配置P2P网络类型 实验步骤 步骤1&#xff1a;[1] 配置IP地址 路由器R1[2] 的配置 <Huawe…

基于SpringBoot的学生班级考勤管理系统

基于SpringBootVue的学生班级考勤管理系统的设计与实现~ 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringBootMyBatisVue工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 管理员界面 课程管理 班级管理 学生管理 学生界面 考勤管理 摘要 学生…

Deployments

Deployments 一个 Deployment 为 Pod 和 ReplicaSet 提供声明式的更新能力。 你负责描述 Deployment 中的目标状态&#xff0c;而 Deployment 控制器&#xff08;Controller&#xff09; 以受控速率更改实际状态&#xff0c; 使其变为期望状态。你可以定义 Deployment 以创建新…