ChatGPT 可以落地的一个行业就是建立私有知识库,将ChatGPT落地TO B行业,可基于ChatGPT和私有数据构建智能知识库和个性化AI。
这个应该是ChatGPT 最热的一个创业方向。
可能出现的产品,有智能AI客服、企业内部/外部知识库、个人知识库,适用于医疗、法律、金融等行业。
在ChatGPT 下,建立私有知识库,只需上传文档、定义配置、Chat就可搭建AI客服/AI知识库。
下面介绍几个开源的,基于ChatGPT建立的私有知识库,也会不断的更新。
Quivr:让数据管理更智能更高效
摘要:Quivr是一个功能强大而高效的数据管理工具,可将本地文件向量化并存储到云端,随时可查询对话。它采用先进的人工智能技术,支持多种文件格式,如文本、Markdown、PDF、音频和视频等,并支持生成式人工智能。Quivr专为速度和效率而设计,保证数据安全可靠,另外还是开源且免费使用的。
项目地址:https://github.com/StanGirard/quivr
gpt4-pdf-chatbot-langchain-chroma
介绍如何使用GPT-4 api基于LangChain、Chroma、Typescript、Openai和Next.js等技术栈创建可处理多个大型PDF文件的ChatGPT聊天机器人。LangChain是一个构建可扩展AI/LLM应用和聊天机器人的框架,Chroma则用于存储嵌入向量和文本,以便以后检索类似PDF文档。包含操作指南、教程视频和错误排查部分。如果有疑问可加入Discord交流。
项目地址:https://github.com/mayooear/gpt4-pdf-chatbot-langchain
langchain-ChatGLM
一种基于 langchain 思想实现的本地知识库问答应用,旨在为中文场景与开源模型提供友好支持,可离线运行。该应用能够使用 ChatGLM-6B 等大语言模型直接接入,或通过 fastchat api 形式接入其他模型。本项目实现基于文件加载,文本分割,文本向量化,问题向量化,文本匹配,上下文添加等流程,可全部使用开源模型离线私有部署。
项目地址:https://github.com/imClumsyPanda/langchain-ChatGLM
PrivateGPT
通过利用本地LLMs的能力,在不依赖于互联网的情况下创建一个针对您的文档的问答聊天机器人。确保完全的隐私和安全性,因为您的数据永远不会离开您的本地执行环境。即使没有互联网连接,也可以无缝地处理和查询您的文档。受imartinez启发。
项目地址:https://github.com/imClumsyPanda/langchain-ChatGLM
ChatFiles
上传文件然后与之对话.
项目地址:https://github.com/guangzhengli/ChatFiles
pdfGPT
当你将大量的文本传递给Open AI时,它会受到4K令牌限制。它无法接受整个pdf文件作为输入。有时,Open AI变得过于啰嗦,并返回与您的查询无关的、不直接相关的回复。这是因为Open AI使用了低质量的嵌入。ChatGPT不能直接与外部数据交互。有一些解决方案使用Langchain,但如果实现不正确,它会“吃掉”大量令牌。
项目地址:https://github.com/bhaskatripathi/pdfGPT
ChatLongDoc
本项目打破了使用OpenAI Chat-LLMs(如ChatGPT)的长度限制,使您能够与任何长文档进行交流。它加快了对内容的理解,促进了有价值的见解的获取。与ChatPDF相比,它支持各种文件格式,包括PDF、doc、docx、txt和Web URL。此项目的实现易于跟随、扩展,并且对于集成到其他应用程序非常高效。
欢迎您查看我们的ChatGPT插件和Chrome扩展。
项目地址:https://github.com/webpilot-ai/ChatLongDoc