最近,使用大型语言模型(LLMs)和知识图谱(KG)开发 RAG(Retrieval Augmented Generation)流程引起了很大的关注。在这篇文章中,我将使用 LlamaIndex 和 NebulaGraph 来构建一个关于费城费利斯队(Philadelphia Phillies)的 RAG 流程。
我们用的是开源的 NebulaGraph 来完成这次的知识图谱。用来查询费城费利斯队的信息。我们将使用费城费利斯队的维基百科页面作为我们的其中一个信息源数据源,另一个是 YouTube 下载的一段视频。
我们的高级架构图如下:
文章转载:https://www.zhihu.com/question/299907037/answer/3340394547
对于那些已经熟悉知识图和 NebulaGraph 的人,请跳到 “详细实现” 部分。对于 NebulaGraph 的新手,请继续阅读。
1.知识图谱(KG)
知识图谱是使用图结构的数据模型或拓扑来集成数据的知识库。它是一种表示有关现实世界实体及其相互关系的信息的方法。知识图谱通常用于驱动搜索引擎、推荐系统、社交网络等。
1.1主要组件
知识图谱通常由两个主要组件组成:
- 顶点 / 节点:表示知识