大模型工具_QUIVR

大模型工具_QUIVR

news2026/4/6 23:37:51

https://github.com/StanGirard/quivr/ 24.5K Star

1 功能

整体功能，想解决什么问题
- 实现了前后端结合的 RAG 方案。构建能直接使用的应用。
- 提出了“第二大脑”，具体实现也是RAG，但针对不同用户不同场景支持多个“大脑”并存，每个“大脑里”存储一个或多个文件，用户可使用指定的大脑提供搜索增强生成。
当前解决了什么问题，哪些问题解决不了
- QUIVR整体看是个很产品化的工具，但是过于复杂，在其中做修改和定制开发也很困难（运行时启动5个docker镜像）。
- 整体技术栈相对新，对于一般人有一定学习成本
- 一些细节略差，比如没有说明引用数据的具体内容，只有来自哪个文件（有时显示）。例如在一个大脑中上传多篇论文，问着问着内容就串了。
提供哪些功能点，其中哪些是刚需
- 核心是针对多组文档聊天的 RAG 功能
- 可爬取网站，构建知识库
- 提供一些 ollama 的本地部署方案
- 可连接 telegram 通讯工具使用
用户使用难度，操作逻辑是否过于复杂
- 我测试时的版本，没有针对 linux 系统的脚本，需要手动修改调整，但整体还比较易用。

2 技术栈

技术栈是什么
- 分成：前端 +CMS+ 后端 + 数据库，略有点重
- 前端：Next.js/React
- 后端：fastapi/SupaBase
- CMS：Strapi
- 数据库：PGSQL/SupaBase
现有底层工具消化了哪些常用功能
- Supabase 存储数据库，文件、向量
- 虽然使用了 langchain，但在代码中也自行实现了很多RAG加强功能
代码分析（使用cloc工具统计）
- TypeScript：17392 行实现前端和cms
- Python：6912 行实现后端

3 商业模式

QUIVR使用 Supabase 存储数据，Supabase 网站提供一定免费额度，用量大时，按规则收费；如果不想付费，也可以自己搭一下Supabase。（我理解是一种 Saas 方案）

4 使用

4.1 安装

见 README.md

docker-compose up --build

运行之后启动了四个后端服务，一个前端服务，一个redis，共5个docker 容器。
通过前端服务端口 3000 进行访问

4.2 注意事项

如果需要使用代理，请修改frontend/.env加入HTTP_PROXY, HTTPS_PROXY环境变量；在docker-compose.yml中也要在build args中加代理
配置文件中内容很多，至少要设置 OPEN API KEY，Supabase相关项，其它可以先不动。
在Supabase控制台的数据中的vectors中可以看到文档内容已经入库。

4.3 使用

打开 3000 端口：http://localhost:3000/
用邮箱注册了一个用户，注册后可以在 supabase 用户管理界面看到。
上传了一个论文 pdf 文件，约21页，20000单词，上传时间1分钟以内，大概是生成向量比聊天快很多。
上传文件时，还可以聊天。
在后台log可以看到其工作过程。

4.4 用后感

从用户注册，邮箱激活，服务部署到 supabase 访问 chatgpt。

5 参考

Quivr 基于Supabase构建本地知识库

如何用 ChatGPT 和你的卡片笔记对话？开源应用 Quivr 尝试

文档

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1332154.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

C语言用两个函数求最大公约数和最小公倍数

C语言用两个函数求最大公约数和最小公倍数

目录 1【c语言】(函数)写两个函数,分别求两个整数的最大公约数和最小公倍数。在主函数中输入两个数，分别调用这两个函数，并输出结果 2代码: 3运行代码: 4总结: 1【c语言】(函数)写两个函数,分别求两个整数的最大公约数和最小公倍数。在主函数中输入两…

阅读更多...

智能优化算法应用：基于金枪鱼群算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用：基于金枪鱼群算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用：基于金枪鱼群算法3D无线传感器网络(WSN)覆盖优化 - 附代码文章目录智能优化算法应用：基于金枪鱼群算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.金枪鱼群算法4.实验参数设定5.算法结果6.…

阅读更多...

十一.约束(二)

十一.约束(二)

约束 5.自增列:AUTO_INCREMENT5.1作用5.2关键字5.3特点和要求5.4如何指定自增约束5.5如何删除自增列5.6MySQL8.0新特性——自增变量的持久化 6.FOREIGN KEY 约束6.1作用6.2关键字6.3主表和从表/父表和子表6.4特点6.5添加外键约束6.6演示问题6.7约束等级6.8删除外键约束6.9开发场…

阅读更多...

5G边缘计算：解密边缘计算的魔力

5G边缘计算：解密边缘计算的魔力

引言你是否曾想过，网络可以更贴心、更智能地为我们提供服务？5G边缘计算就像是网络的小助手，时刻待命在你身边，让数字生活变得更加便捷。什么是5G边缘计算？ 想象一下，边缘计算就像是在离你最近的一层“云…

阅读更多...

树与图的深度优先遍历、宽度优先遍历算法总结

知识概览树是特殊的图，是无环连通图图分为有向图和无向图。因为无向图可以转化为有向图，树可以转化为图。因此本文讨论有向图。树和图的存储： 邻接矩阵：空间复杂度，适合存储稠密图。邻接表：存储每个点可以…

阅读更多...

SpringBoot3-核心原理

SpringBoot3-核心原理

生命周期监听场景：监听应用的生命周期 1. 监听器-SpringApplicationRunListener 自定义SpringApplicationRunListener来监听事件； 1.1. 编写SpringApplicationRunListener 实现类 1.2. 在 META-INF/spring.factories 中配置 org.springframework.boo…

阅读更多...

Featured Based知识蒸馏及代码(3): Focal and Global Knowledge (FGD)

Featured Based知识蒸馏及代码(3): Focal and Global Knowledge (FGD)

文章目录 1. 摘要2. Focal and Global 蒸馏的原理2.1 常规的feature based蒸馏算法2.2 Focal Distillation2.3 Global Distillation2.4 total loss3. 实验完整代码论文： htt

阅读更多...

【数据库系统概论】第3章-关系数据库标准语言SQL(1)

【数据库系统概论】第3章-关系数据库标准语言SQL(1)

文章目录 3.1 SQL概述3.2 学生-课程数据库3.3 数据定义3.3.1 数据库定义3.3.2 模式的定义3.3.3 基本表的定义3.3.4 索引的建立与删除3.3.5 数据字典 3.1 SQL概述动词分类三级模式 3.2 学生-课程数据库 3.3 数据定义 3.3.1 数据库定义创建数据库 tips：[ ]表…

阅读更多...

图解LRU缓存

图解LRU缓存

图解LRU缓存 OJ链接介绍 LRU 缓存机制可以通过哈希表辅以双向链表实现，我们用一个哈希表和一个双向链表维护所有在缓存中的键值对。双向链表按照被使用的顺序存储了这些键值对，靠近尾部的键值对是最近使用的，而靠近头部的键值对是最久未…

阅读更多...

论文笔记--Learning Political Polarization on Social Media Using Neural Networks

论文笔记--Learning Political Polarization on Social Media Using Neural Networks

论文笔记--Learning Political Polarization on Social Media Using Neural Networks 1. 文章简介2. 文章概括3. 相关工作4. 文章重点技术4.1 Collection of posts4.1.1 数据下载4.1.2 数据预处理4.1.3 统计显著性分析 4.2 Classification of Posts4.3 Polarization of users 5…

阅读更多...

碳排放预测 | 基于ARIMA和GM(1,1)的碳排放预测（Matlab）

碳排放预测 | 基于ARIMA和GM(1,1)的碳排放预测（Matlab）

目录预测效果基本介绍模型描述ARIMA模型GM(1,1)模型程序设计参考资料预测效果基本介绍基于ARIMA和GM(1,1)的碳排放预测（Matlab） 基于ARIMA（自回归移动平均模型）和GM(1,1)（灰色预测模型）的碳排放预测是…

阅读更多...

1-2B参数规模大模型使用心得及模型汇总

1-2B参数规模大模型使用心得及模型汇总

大模型时代，根据大模型缩放定律，大家通常都在追求模型的参数规模更大、训练的数据更多，从而使得大模型涌现出更多的智能。但是，模型参数越大部署压力就越大。即使有gptq、fastllm、vllm等推理加速方法，但如果GPU资源不…

阅读更多...

go语言初体验1--使用go install

go语言初体验1--使用go install

当安装后go语言后。尝试编写go程序。当使用 go install 命令，报错。 go: go install requires a version when current directory is not in a moduleTry go install jvmgo\ch01latest to install the latest version通过查找资料。用命令： go env …

阅读更多...

VS(Visual Studio)更改文件编码

VS(Visual Studio)更改文件编码

vs默认编码是GB2312,更改为UTF-8 工具->自定义

阅读更多...

039、转置卷积

039、转置卷积

之——增大高宽杂谈通常来说，卷积不会增大输入的高宽，通常要么不变，要么减半；如果想要直接padding来增加高宽，在不断的卷积过程中，padding的0越来越多，最后要做像素级的判断时候，由…

阅读更多...

【SpringCloud笔记】（8）服务网关之GateWay

【SpringCloud笔记】（8）服务网关之GateWay

GateWay 概述简介官网地址： 上一代网关Zuul 1.x：https://github.com/Netflix/zuul/wiki（有兴趣可以了解一下） gateway：https://cloud.spring.io/spring-cloud-static/spring-cloud-gateway/2.2.1.RELEASE/reference/…

阅读更多...

STM32F407-14.3.10-表73具有有断路功能的互补通道OCx和OCxN的输出控制位-1x011

STM32F407-14.3.10-表73具有有断路功能的互补通道OCx和OCxN的输出控制位-1x011

如上表所示，MOE1，OSSR0，CCxE1，CCxNE1时，OCx与OCxN对应端口的输出状态取决于OCx_REF与极性选择（CCxP，CCxNP） 死区。 ------------------------------------------------------------…

阅读更多...

浅析海博深造

浅析海博深造

文章目录深造作用留学种类选专业择校申请流程申请方式深造作用 1、个人能力提升（学术专业、语言、新文化或新生活方式） 2、更好的职业发展（起点更高、结交新朋友或扩大社交圈） 3、北京上海落户优惠 4、海外居留福…

阅读更多...

【VB测绘程序设计】案例4——简单的四则运算练习Select Case语句的使用（附源码）

【VB测绘程序设计】案例4——简单的四则运算练习Select Case语句的使用（附源码）

【VB测绘程序设计】案例4——简单的四则运算练习（附源码）文章目录前言一、界面预览二、程序介绍总结前言在新手学习VB程序设计中，四则运算是基础，通过设计的TexT、按钮、label等控件，定义变量，实现简单程序的编写，提高对VB程序的入门训练。一、界面预览二、程序介…

阅读更多...

openGauss学习笔记-171 openGauss 数据库运维-备份与恢复-导入数据-深层复制

openGauss学习笔记-171 openGauss 数据库运维-备份与恢复-导入数据-深层复制

文章目录 openGauss学习笔记-171 openGauss 数据库运维-备份与恢复-导入数据-深层复制171.1 使用CREATE TABLE执行深层复制171.1.1 操作步骤 171.2 使用CREATE TABLE LIKE执行深层复制171.2.1 操作步骤 171.3 通过创建临时表并截断原始表来执行深层复制171.3.1 操作步骤 openGa…

阅读更多...

推荐文章

最新文章