ChatGPT Plugins内幕、源码及案例实战(三)
ChatGPT Plugins内幕、源码及案例实战
6.4 ChatGPT Retrieval Plugin全流程内幕解析
以ChatGPT检索插件为例,我们讲解一下它整个的流程,让大家有一个比较明确、清晰的统一认知:
数据存储:设立的前提是你有文档,会有一些文档信息,我们第一步把这个信息放进插件中,这是基本的Python开发,通过Upsert方法插入数据到向量数据库。假设有一个LangChain的开发文档,你可以在客户端运行Python代码,将LangChain的本地文档通过调用服务器端点的upsert方法,上传到插件API服务器,然后通过OpenAI的嵌入式向量接口,将文档转换为向量,并存储到向量数据库中,如图6-5所示。
图6- 5 通过Upsert方法插入数据到向量数据库
6.5 ChatGPT Plugins案例开发实战
我们讲解了ChatGPT检索插件原理机制的部分,接下来看具体的代码,最经典的可以直接看ChatGPT检索插件的代码,它类似一个模板,本节会看一个比较小规模的案例代码,这是关于LangChain文档的插件,在这个例子中,我们执行以下脚本命令,从https://python.langchain.com下载LangChain文档,得到网站上所有的.html文件。
!wget -