GPT-4(THUDM) + Langchain >> Personalized expert AI assistant.
Langchain.
GPT-4
LangChain简介 - 知乎 (zhihu.com)
利用LangChain和国产大模型ChatGLM-6B实现基于本地知识库的自动问答_哔哩哔哩_bilibili
Github地址:
https://github.com/thomas-yanxin/LangChain-ChatGLM-Webui
ModelScope在线体验:
https://modelscope.cn/studios/AI-ModelScope/LangChain-ChatLLM/summary
OpenI地址:
https://openi.pcl.ac.cn/Learning-Develop-Union/LangChain-ChatGLM-Webui
ModelScope阿里达摩院开源模型平台 - 知乎 (zhihu.com)
手把手带你实现:基于Langchain和chatglm-6b构建本地知识库的自动问答应用_哔哩哔哩_bilibili
稳定性:数据抖动,推理是否稳定
数据安全是因为在一个离线的部署环境当中。
缺点非常明显:
1.非常依赖知识库的建设,也就是你的知识库是否能够涵盖一定的question,如果没有相应的answer,可能会产生一些幻觉(hallucination)现象,也就是一本正经胡说八道。看起来合理,其实啥也不是。
2.非常依赖LLM的基础能力,知识库其实是把一个prompt输出给大语言模型了,那其实就跟LLM的能力强相关了。
3.强依赖于embedding model,你得到的向量Vector是否能够做好相应的搜索也非常关键。
方案2更想一个平民化的方案,不需要太多的专业知识和经验。就可以简单的搭建起来这一套系统
Faiss是由FacebookAI团队开发的向量检索库,提供了多种向量查询方案,可以实现在亿级别候选物料上的毫秒级查询,是目前最主流的向量检索库。
langchain里面是没有集成GLM的,所以需要我们自定义GLM。
改进空间
1. LLM
2. Embedding model
3. 长文本需要切分,未来怎么切分很重要