如何用 ChatGPT 和你的卡片笔记对话?开源应用 Quivr 尝试

news2024/9/22 19:22:13

ee5577ab44c7d935617ddfde1826a0cf.jpeg

卡片

我 非常喜欢使用卡片笔记。其优点明显,例如能显著减轻写作压力。在你面对空白屏幕时,写一篇文章的压力可能会很大,而随时三言两语记录卡片笔记则显得更为轻松。由于笔记以卡片形式存在,可以进行大量重组复用,对于 内容输出来说,非常友好。

然而,卡片笔记也会带来一些问题。信息分散在许多卡片中,在查找和使用时增加了困难。为了解决这个问题,现有的卡片笔记工具普遍采用了 双链方法。

fefc4eb5758e008f128836cbecbc38b2.jpeg

双链将笔记之间进行链接。当我们需要查找笔记时,不再仅仅按照关键词搜索,而是找到某一篇笔记作为种子,然后沿着链接指出的路径和聚簇关联,找到相关的卡片,并且进行整合输出。Obsidian,Roam Research 和 Logseq 等卡片笔记工具都提供了这样的双向链接功能。

疑问

近一段时间,我在知识星球和公众号后台时常收到读者的疑问:能否将 AI (例如 ChatGPT)与我们的本地卡片笔记库进行交互?这样就可以获取与特定主题紧密相关的诸多卡片内容,并将它们有机地整合。然后利用 ChatGPT 的自然语言问答交互能力,让 AI 以流畅、清晰、准确且综合的方式,回答我们的问题,形成独有的知识输出。

d181f63d87d0f15041c5074a9977ace6.jpeg

回答这个问题有些困难。单一文档的问答对话已经有很多解决方案,例如我之前推荐过的 ChatDoc 等。然而,要从多文档中综合提取信息,ChatDoc 搞不定。好用的多文档问答工具倒是现成的,例如 ChatBase 。

c2cf2de155f9f2e4c495122cc54b9d7d.jpeg

好用归好用,价格却不能忽略。ChatBase 最低月费是 19 美元。

e8dff59bd98afea66f84839ade1ba3c5.jpeg

一开始我觉得 19 美金 / 月这价格虽然不低,但如果能提高用户工作效率并带来竞争优势,或许值得。但是,我看到这篇作者的访谈后,就改变了想法。

fdf26d7f4878796b777c90db606b8df8.jpeg

作者观察到大部分用户一上来都选择了最低挡位的19美金,但是很快要么提高订阅等级(多交钱),要么干脆不续订了。这表明 19 美元的月订阅费对大部分人来说,根本不够用

d311f7e45658c050769aff0f91c478d1.jpeg

好在我最近发现了一个新的应用,能以经济实惠的方式为大部分用户提供多文档对话功能。

应用

这款工具叫做 Quivr ,网址在这里。

12794c80ea47c905f5cbe95637aa7ce8.jpeg

使用之前,你需要先设置你的 OpenAI API 密钥,然后选择相关的模型。我建议你选择 gpt-3.5-turbo-16k 模型,因为这个 6 月 13 日更新的模型 token 最大长度有显著提升,可以大概率避免答案中途无缘无故截断。

b34fde32ad0ae367bf6b8414f49b9927.jpeg

使用 Quivr 的过程里,你依然要为调用 OpenAI API 付费。但是比起 ChatBase 19 美元起的月费,这个成本就显得微不足道了。

上传

Quivr 的界面简洁易用,用户可以将一系列文档拖拽上传,或者直接指定某个网址,它自己帮你爬取网站信息。这样一来,你就可以轻松愉快和自己的卡片笔记对话了。

为了演示方便和保护隐私,我上传了之前发布在公众号和知识星球、小报童的一些文章。如果这款工具可以妥善处理文章这样的长篇材料,那么卡片笔记篇幅短小,更是不在话下。

ddaf75dbf941db2605325aba5389d2a8.jpeg

除了文本和 Markdown 文件,Quivr 还支持其他类型的文件,如 PDF、PowerPoint、Excel、Word,甚至音频和视频。这意味着用户可以上传各种不同的材料和类型,然后统一进行提问,我认为这个设计准确抓住了知识生产用户的痛点。

cdb4390ee6cc37bca484030724bc6ab0.jpeg

在上传过程中,工具会提示哪些文件已成功上传。我上传的都是 markdown 纯文本文件,体积不大,很快就完成了。

723e299af4709ecbb70a2371da5db056.jpeg

在 Explore 选项下,我们可以检查已经上传的文件,确认没有遗漏。

2bd4b4b1754d9decbf11a4974a67f5f2.jpeg

用户还可以通过图表查看当前存储空间的使用情况。如果你使用的资料都是 Markdown 文件,这 200 MB 的空间应该能用一段时间了。

dc92772082f261a564ddc118f1d23d79.jpeg

至此咱们的资料已经上传好了,下面可以开始提问了。

44c07ede004888a0b535b11ad376ac33.jpeg

提问

我首先询问我的知识库中包含哪些 GPT 的应用介绍。

7807fcedc2eda31c7c9672d3ea36bfa5.jpeg

Quivr 返回了四个结果,其中前三个还算准确,而且明显不是来自单一文件,而是综合了多个文件的信息。除了过于笼统的第四个答案,我整体比较满意。

c792c1065ba8b34bf34e6fabdf9f1dca.jpeg

我接着提问 GPT-4 在编程上能提供何种帮助。它根据我的资料列出了一些具体应用,如 代码解释器 和 Github Copilot Chat 等。

b2e0344bdb624846af4ceba9f0a5a6b3.jpeg

只是我不明白答案第二项这个自动化论文评分(AES)是啥,我没写过啊?结果在 Obsidian 里面一查询,发现是《AI 写文献回顾,好使吗?》一文中引用的 GPT-4 给出的答案。难怪,哈哈。

fedd09acd398e6f3e814cbf6dc1ba3e1.jpeg

我进一步提问,哪些 GPT 功能和 GPT 插件可以用于科研文献回顾,并要求它给出综合结果并列出原始信息。

f526557b1d50fa00a7d592f12b9415d0.jpeg

Quivr 将 GPT 功能 和 GPT 插件(分别来自两篇不同的文章)分开处理,分别提供了来源。然而,我发现 Quivr 并未列出具体的文档名,而且部分结果存在误导,如将 Wolfram 误为文献回顾的插件。

3804080cb40136ab530f20b1a9ddae2b.jpeg

我怀疑可能是我的提示词有误,于是我对提示词进行了修正,并提出新的问题。

e6535e929131dc61c398abfe1bb791f5.jpeg

这次我要求综合结果、具体细节,还要求了原始信息。

下面是 Quivr 的回答:

2181ef838f82ee2cbd9a7a34f9182d97.jpeg

这答案看完,我颇为振奋。首先 Quivr 确实综合了大概 4 篇文档的内容,而且都进行了梳理提炼,在答案中列出这些原始文件名称,使得我们验证答案变得更为容易,也为进一步的知识挖掘提供了基础。

特色

另外我发现 Quivr 还保存了历次对话,以便于用户随时回顾和分析历史信息。这个功能可以帮助你不断与自己的卡片笔记库深入对话,找到深层次的洞察,发现可能被忽略的问题。

00a82afd9bc5180f0cdbfaa7c1dfe31f.jpeg

Quivr 是完全开源的,你可以 在 GitHub 上找到其源代码仓库。

371b815ebd6358cf151b6d82d2cade44.jpeg

Quivr 为用户提供了在本机部署服务的方法,使用的是 Docker。如果你有需求,可以按照官方教程操作。

105f7b32fbc7ee9ffa0ddd1ae2b661a4.jpeg

LangChain

我们简要介绍一下 Quivr 所使用的技术。它的基础框架是 LangChain,这是一个在 GitHub 上特别受欢迎的库,评价超过 5 万颗星,月下载量过百万。

4cfd0b3280e60cf8efb4380b8793aacd.jpeg

LangChain 这个库的优势在于解决了人们使用大型语言模型时重复性操作问题。深度学习中求导、反向传播等重复性操作很恼人,于是催生了 TensorFlow 和 PyTorch 这样的深度学习框架。同样,LangChain 也在事实上成为 LLM 应用领域的通用框架,你在目前海量涌现的 LLM 应用中,大多都能看见它的影子。

如果你对 LangChain 感兴趣,我推荐 这门由 Deep Learning AI 和 LangChain 官方联合推出的免费课程。

46ac9eaa46225601ce5ed52a181b8bc1.jpeg

尽管这只是一门基础课程,但学过后你可以对一些已经存在的项目进行修改调整,满足你自己的应用需求。

安全

我知道读到这里,又有读者要跟我聊隐私数据泄漏问题了。有人坚持认为一调用 OpenAI API ,你的数据就会被科技巨头收割。在 ChatGPT 科研预览版阶段,这样的担心确实很有必要。我在去年 12 月第一次介绍 ChatGPT 的时候就专门提过。不过我们也要注意与时俱进。自 2023 年 3 月 1 日起,OpenAI 在数据政策上已经做出了重大的调整。

501692ba84d69f58804a63c0da84d70c.jpeg

通过 API 上传的数据并不会被 OpenAI 用于训练或改进模型,除非用户明确要求这样做。由于法规要求,OpenAI 会保留你通过 API 上传的数据 30 天,然后删除。

如果你就是对数据隐私高度敏感,无法使用 OpenAI ,Quivr 也能帮到你。最近它已经支持了开源模型 GPT4All 。这个模型我之前给你介绍过的,在笔记本上就能运行。虽然处理复杂认知问题,GPT4All 相较于 GPT-4 还有相当的差距,但是对若干份文档抽取重点做出解答,还足够胜任。

32e03a3c0765a61073551643970089f1.jpeg

随着更多的本地化模型和开源模型的加入,个人和机构的知识库也可以完全在本地利用 Quivr 进行知识检索和问答,而无需担心数据隐私泄露。

小结

今天我为你介绍了利用 ChatGPT 与你的卡片笔记库交互的免费开源软件 ——Quivr。从卡片中提取内容时减少手动查询操作,更减轻了你输入卡片时的整理压力。与 ChatBase 等应用相比,Quivr 免费开源。它支持多种文件格式,还可以使用本地开源大语言模型 GPT4All 等。希望它能对你的知识管理起到帮助。

信息

最近还有两次活动,期待你的参与。

首先是 6月29日(周四)晚,我将在「AI洞察力」专栏第6期课程中做《如何利用ChatGPT提升科研效率?》的主题演讲。

9d79fbbf2a7ca1944deb58e01b2da54b.jpeg

「AI洞察力」是一个专为职场人设计的AI专栏课,包括30+场高质量直播,60+位业界资深专家分享AIGC/LLM/ChatGPT前沿资讯, 4大维度讲透大模型时代的底层逻辑。无论你是AI初学者、专业从业者,还是科研人员、AIGC创业者,都能在「AI洞察力」专栏中有所收获。

我还专门争取了粉丝福利,原价698的专栏课,现价298,我的粉丝还可以额外再领取一张50元抵扣券,券后仅需248即可订阅专栏(单门课程低至9.9)。扫下方二维码获取粉丝福利:

a225cc8955763e232a7b4663568df735.jpeg

其次是 7 月 2 日(周日)下午 2 点,我会在北京阅动朝阳书店参加人民邮电出版社和少数派联合举办的新书发布会,并且做大约 30 分钟的主题演讲。

842d2ca8d5835313c63039294f941d70.jpeg

如果你有空,欢迎扫描上图中的二维码报名参加。

点赞 +「在看」,转发给你身边有需要的朋友。收不到推送?那是因为你只订阅,却没有加星标

欢迎订阅我的小报童付费专栏,每季度更新不少于10篇文章。订阅一整年价格优惠。

14f63cf67f484cba4b0d7ebbbf736baa.jpeg

如果有问题咨询,或者希望加入社群和热爱钻研的小伙伴们一起讨论,订阅知识星球吧。不仅包括小报童的推送内容,还可以自由发帖与提问。之前已经积累下的帖子和问答,就有数百篇。足够你好好翻一阵子。知识星球支持72小时内无条件退款,所以你可以放心尝试。

87c50f1fe01956277da7eef2491c9924.jpeg

若文中部分链接可能无法正常显示与跳转,可能是因为微信公众平台的外链限制。如需访问,请点击文末「阅读原文」链接,查看链接齐备的版本。 

延伸阅读

  • GPT-3 加持的语音输入文字新流程

  • 如何交互可视化你的卡片式笔记网络?

  • 如何用 ChatGPT 做数据进阶可视化?(三维交互图与动图视频)

  • 如何用 ChatGPT 一句话生成 Web 应用?

  • 卡片笔记写作法为什么管用?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/690266.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于SpringBoot+vue的音乐网站与分享平台设计与实现

博主介绍: 大家好,我是一名在Java圈混迹十余年的程序员,精通Java编程语言,同时也熟练掌握微信小程序、Python和Android等技术,能够为大家提供全方位的技术支持和交流。 我擅长在JavaWeb、SSH、SSM、SpringBoot等框架…

分布式理论和一致性算法详解

1、什么是分布式系统 分布式系统是一个硬件或软件组成分布在不同的网络计算机上,彼此之间仅仅通过消息传递进行通信和协调的系统 2、分布式系统的特征 分布性 分布式系统的多台计算机都会在空间上随意分布的,同时,机器的分布情况也会随时变动…

【详细分析】thinkphp反序列化漏洞

文章目录 配置xdebug反序列化漏洞利用链详细分析poc1(任意文件删除)测试pocpoc2(任意命令执行)poc3(任意命令执行) 补充代码基础函数trait关键字应用案例优先级多trait 配置xdebug php.ini [Xdebug] zend…

聊聊我在店铺开放域做性能优化的体会

我们新推出大淘宝技术年度特刊《长期主义,往往从一些小事开始——工程师成长总结专题》,专题收录多位工程师真诚的心路历程与经验思考,覆盖终端、服务端、数据算法、技术质量等7大技术领域,欢迎一起沟通交流。 本文为此系列第五篇…

nodejs+mysql+vue+elementUI 实现选择资源管理工具

我们在写后台管理系统时会遇到上传视频、音频等内容。如果上传资源地方多的话,每个地方都要加上传的代码,比较麻烦。而且遇到有些图片是已经上传过的,下次遇到了又要重复上传,浪费服务器或cos资源。 这时候可以实现一个资源管理工具,上传图片到资源管理工具里,然后再去选…

35年前,金山WPS上的当终于找补回来,没想到,钉钉也深度参与

我们当年上了微软的当! 近日,雷军在武汉科技大学毕业典礼致辞,登上了热搜。 关于“小米汽车”的话题再次被推上了舆论的风口。这是54岁雷军的最后一搏,距离2024年量产,时间也所剩不多了。 从软件到电商,到…

Flutter控件封装之视频进度条

视频控制器,三方所提供的样式,有时很难满足我们的需求,对于此情况,我们不得不在此基础上自行封装,今天所分享的文章就是一个很简单的控制器封装案例,包含了基本的播放暂停,全屏和退出全屏&#…

在ElementUI中如何通过按钮控制输入框的隐藏与显示

点击此按钮会出现两个输入框 当点击完新增后会出现两个输入框及一个按钮&#xff0c;解决此方案思路比较简单&#xff1a;就是设置一个属性值&#xff0c;用v-if进行绑定&#xff0c;在什么情况下需要显示就需要设置v-if绑定的值等于需要显示的值 <div style"height:7…

Istio 熔断 连接池 故障处理

istio熔断 熔断主要是无感的处理服务异常并保证不会发生级联甚至雪崩的服务异常。在微服务方面体现是对异常的服务情况进行快速失败&#xff0c;它对已经调用失败的服务不再会继续调用&#xff0c;如果仍需要调用此异常服务&#xff0c;它将立刻返回失败。 与此同时&#xff0…

c语言修炼第一章--初识c语言(1.3)

目录 前言&#xff1a; 1.关键字 1.1常见关键字: 1.1.1typedef类型重定义 1.2.static 1.2.1static修饰局部变量 1.2.2static修饰全局变量 1.2.3static修饰函数 …

待办事项工具用哪个?每天都在用的待办工具

随着职场“内卷”程度的加深&#xff0c;越来越多的上班族感到自己每天都会面临各种繁忙的日程安排、琐碎的待办事项&#xff0c;并且工作事项和家庭事项交织在一起&#xff0c;需要各方面都兼顾到&#xff0c;这简直让人恨不得长出三头六臂。在待办的事情比较多时&#xff0c;…

艺考之路,很艰难也很幸福

点击文末“阅读原文”即可参与节目互动 剪辑、音频 / 卷圈 运营 / SandLiu 卷圈 监制 / 姝琦 嘉宾 / 小川同学 产品统筹 / bobo 录音间 / 声湃轩北京站 本期节目是拼娃时代的第三十期&#xff0c;我们请来了拼娃时代的老朋友&#xff0c;小川同学。 拼娃时代的听友们肯定…

带有10位数码管显示的语音芯片ic,节省30%MCU硬件资源WTV890-B001

随着科技的不断发展&#xff0c;WTV890-B001多功能语音芯片的推出&#xff0c;为工程师带来了极大的便利和产品体验&#xff0c;这款多功能语音芯片具有许多优势&#xff0c;其中WTV890-B001版本中&#xff0c;最引人注目的特点是它带有10位的数码管显示功能&#xff0c;无需再…

nginx配置https证书(nginx-docker版本)

1、下载证书文件 以下两种多可配置 2、nginx server下加上配置 注意&#xff1a;ssl_certificate 参数可为crt文件、或者pem文件。需要将文件docker cp进容器中&#xff0c; ssl_certificate、ssl_certificate_key 为容器内的文件路径。 listen 443 ssl;server_name 域名地…

TMS FlexCel Studio for net 7.17 cRACK

TTMS FlexCel Studio for net 100% 托管代码 Excel 文件操作引擎以及 Excel 和 PDF 报告生成&#xff0c;适用于 .NET、Xamarin.iOS、Xamarin.Android、Xamarin.Mac​​ 功能概述 使用 FlexCel Studio for .NET 创建可动态快速读写 Excel 文件的应用程序、Web 服务和移动设备应…

深入理解浏览器的缓存机制之协商缓存与强缓存

目录 什么是浏览器缓存 浏览器缓存的分类 &#x1f397;️ 强缓存 &#x1f397;️ 协商缓存 &#x1f449;&#x1f3fb; 缓存请求流程 &#x1f449;&#x1f3fb; 为什么要有Etag &#x1f449;&#x1f3fb; 缓存优先级 &#x1f449;&#x1f3fb; 启发式缓存 &a…

Midjourney教程古风人像类

古风图像的特点&#xff1a; 人物发型多为飘逸的长发&#xff0c;或是精致的盘发&#xff1b; 人物服装多为飘逸的长袍、长裙&#xff1b; 整体画风以水墨、水彩、工笔为c主&#xff0c;线条写意&#xff0c;色彩清新淡雅&#xff1b; 背景中多用花鸟、亭台楼阁、桃林等构建氛…

抖音seo矩阵系统源码|需求文档编译说明(三)

文章目录 批量剪辑工具技术源码框架 短视频SEO矩阵系统源码技术开发&#xff0c;遵循步骤抖音矩阵系统源码搭建功能 开发语言及开发环境 抖音账号矩阵系统源码搭建包括以下步骤 概要 ​​抖音seo源码&#xff0c;抖音矩阵系统如何使用源码二次开发&#xff0c;开发的功能有那些…

RT-Thread内核介绍

目录 三、RT-Thread内核介绍 3.1、内核框架 3.1.1、线程调度 3.1.2、时钟管理 3.1.3、线程间同步 3.1.4、线程间通信 3.1.5、内存管理 3.1.6、I/O 设备管理 3.2、RTT内核启动流程 3.2.1、汇编阶段 3.2.2、C阶段 3.2.3、rtthread_startup函数 3.2.4、创建主线程 三、…

jupyter notebook内核挂掉的解决方案

今天在运行notebook时报错 “jupyter notebook内核挂掉了”查找发现是下面这一句出的错&#xff0c;这是pytorch深度学习实战中的一个例程&#xff0c;读取三维体素文件并把其中的一张当作图片显示出来 plt.imshow(vol_arr[50]) 完整代码如下 import torch torch.set_printo…