graphRAG原理解析——基于微软graphRAG+Neo4j llm-graph-builder

news2024/11/17 3:54:32

知识图谱生成

llm-graph-builder(以下简称 LGB)也使用了最新的 graph + RAG 的思路,使用知识图谱来加持RAG,提供更加准确和丰富的知识问答。知识图谱的生成上,利用大模型的泛化能力来自动生成和构建知识图谱,包括实体、关系和属性等。其相较于微软开源的 GraphRAG(以下简称 MS-GRAG)有很多相似和同源之处,但也有很多的不同。

模块能力llm-graph-builderGraphRAG
知识抽取使用大模型抽取支持支持
支持适配多种大模型支持支持
本体(schema)配置部分支持(可选系统已配好的schema)
有一套比较完整的配置策略
支持
相对简单,只有简单枚举
prompt调整不支持不支持
promt形式zero-shot(效果一般,实体质量不高)few-shot(效果更好)
知识分层有分层社区,并提供社区级别的摘要
知识存储图数据库neo4j(查询较快)文件存储(效率低)
知识召回召回模式vector, graph + vectorgraph + vector
问答素材基于召回的文本片段基于召回的实体,或社区摘要
问答效率
交互界面UI支持不支持(命令行操作生成和问答)
实体展示支持不支持
文档级操作支持文件级的生成、查看和召回
支持增量的生成
不支持
有文件更新时,需要重新构建知识图谱

知识抽取

  • LGB的prompt相较于微软 MS-GRAG来说,简单许多。

微软的prompt无论是在结构上,还是组织形式上,都更加完善。而最终体现的效果也是相差较多。

知识存储

LGB 依托于 Neo4j 图数据库,包括文档管理,实体、关系管理等,都是基于Neo4j图数据来做的。在召回性能上,相较于 MS-GRAG 要快。

知识召回

在召回策略上,两个产品使用了不同的方案。

  • LGB

利用图数据库提供的快速检索能力,支持了向量 + 图检索的召回模式,也支持单纯的向量召回(传统的RAG模式)。

无论是向量 + 图检索的模式,还是单纯向量模式,召回的内容都是文档片段(chunk);使用图模式时,会将关联的实体数量,作为rerank的依据。

最终将召回的内容,加上prompt,调用大模型来总结答案。

  • MS-GRAG

微软的做法是,将所有提取的实体,作为叶子节点,同时自动对这些实体进行聚类。相关的实体节点聚成一类,称之为社区(community)。而多个社区,还可以继续形成新的社区。每个社区都有自己的摘要和总结。

召回时,根据用户问题的embedding,在以下5个场景中检索素材,并最终将召回的素材和历史对话一起传给大模型,生成答案。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2076147.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

企事业单位数据资料防外泄如何实现?这5个小技巧等你来掌握!

企事业单位的数据资料防外泄是一项重要的任务,它关乎企业的核心竞争力和信息安全。 以下是五个实用的小技巧,可以帮助企事业单位有效地防止数据外泄: 1. 数据加密 技巧说明:通过对敏感数据进行加密处理,即使数据被非…

Python的10个构建桌面应用的技巧

Python以其简洁的语法和强大的库支持,成为开发桌面应用的热门选择。无论是创建简单的工具还是复杂的图形界面程序,Python都能大显身手。下面,我们将通过10个实用技巧,逐步引导你进入Python桌面应用开发的世界。 如果你对Python感兴…

服务器内存占用陡增,部分应用程序无故被停,docker-cache罪魁祸首

一、背景 告警提示:服务器内存占用陡增,部分应用程序无故被停。 查看内存占用,发现只剩下几百M了。 [rootnb003 ~]# free -htotal used free shared buff/cache available Mem: 30G 28G …

初识 Go 语言,环境配置有问题

你好,我是沐爸,欢迎点赞、收藏、评论和关注。个人知乎 Go 也称 Golang, 是由 Google 开发的一种开源的、静态类型、编译型、并发型,并具有垃圾回收功能的编程语言。它以其简洁的语法、强大的标准库和高效的并发模型而广受欢迎。今…

C++学习笔记——保留3位小数的浮点数

一、题目描述 二、代码 #include <iostream> #include <iomanip> using namespace std; int main() {double a;cin >> a;cout << fixed << setprecision(3)<<a<<endl;return 0; }

无人机遥控器显示屏的重要性!!!

无人机遥控器的显示屏在无人机操作中扮演着至关重要的角色&#xff0c;它提供了无人机状态、飞行参数、设置选项以及实时图像&#xff08;对于带屏遥控器&#xff09;等重要信息 显示飞行参数&#xff1a; 显示屏上可以实时显示无人机的高度、距离、坐标、速度、方向等关键飞行…

Buildroot构建Qt根文件系统-思维导图-学习笔记-基于正点原子阿尔法开发板

Buildroot构建Qt根文件系统 获取 Buildroot 源码 Buildroot 源码下载地址&#xff0c;https://buildroot.org/ 本次下载的是长期支持版本 移动至ubuntu后解压 tar xf buildroot-2022.02.3.tar.gz 解压后的 Buildroot 源码 配置 Buildroot 安装显示图形菜单需要的库 sudo…

Linux中库的概念,动态库,静态库

1.什么是库 库在Linux中是一个二进制文件&#xff0c;它是由.cpp文件&#xff08;不包含卖弄函数&#xff09;编译而来&#xff0c;其他程序如果想要使用该源文件中的函数时&#xff0c;只需在编译生成可执行程序时&#xff0c;链接上该源文件生成的库文件即可。库中存储的是二…

【香橙派系列教程】(十六) 语音模块与阿里云结合

【十六】语音模块与阿里云结合 本小节实现功能使用语音模块和摄像头在香橙派上做垃圾智能分类识别。 大致流程&#xff1a;说出“识别垃圾类型”口令&#xff0c;语音模块接收到之后通过串口发送字符串指令&#xff0c;随后进行拍照&#xff08;请确保香橙派已经驱动起来了摄…

2024/8/25 Nacos本机配置

目录 一、nacos下载 二、修改配置文件 2.1、配置数据库 2.2、配置鉴定密钥 2.3、配置启动脚本 三、nacos启动 3.1、启动运行脚本 3.2、新增配置 3.3、服务列表 记录一下本机nacos2.2.3配置全过程 一、nacos下载 下载地址&#xff1a;https://github.com/alibaba/nacos/r…

安灯系统赋能照明行业打造高效智能的生产管理体系

在当今竞争激烈的照明行业中&#xff0c;提高生产效率、确保产品质量以及实现智能化管理已成为企业生存和发展的关键。安灯系统作为一种先进的生产管理工具&#xff0c;正逐渐在照明行业中发挥着重要作用&#xff0c;为企业打造高效智能的生产管理体系提供有力支持。 一、照明行…

LeetCode31

206.反转链表 给你单链表的头节点 head &#xff0c;请你反转链表&#xff0c;并返回反转后的链表。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5] 输出&#xff1a;[5,4,3,2,1]示例 2&#xff1a; 输入&#xff1a;head [1,2] 输出&#xff1a;[2,1]示例 3&#…

秋招TCP篇(较全的TCP网络知识,通俗理解底层逻辑)

TCP详细知识 计算机网络八股-局域网和广域网详解八股-OSI七层模型和TCP/IP五层模型八股-数据在网络之间传递的过程八股-UDP详解根据协议格式详解TCPSocket详解八股-TCP可靠性机制确认应答超时重传超时重传等待时间数据去重 八股-三次握手和四次挥手三次握手四次挥手为什么要三次…

系统之家官网网址:一键直达,安全无忧!

有很多用户反映自己搜搜系统之家&#xff0c;会出现很多网址&#xff0c;不知道哪个才是真正的系统之家官网网址&#xff1f;对于想要访问真正的系统之家官网&#xff0c;获取更多优质系统资源及解决相关系统问题的用户而言&#xff0c;记住系统之家的官网网址是至关重要。以下…

4款文章生成器,自动写作优质文章

在当今信息爆炸的时代&#xff0c;内容创作已经成为网络世界中不可或缺的一部分。然而&#xff0c;随着人们对高质量内容的需求不断增加&#xff0c;传统的手动创作已经无法满足市场的需求。因此&#xff0c;文章生成器应运而生&#xff0c;成为许多从业者和企业的利器。在本文…

公司图纸文件加密超详细的三大步骤,图纸加密软件最新推荐

随着企业信息化建设的不断深入&#xff0c;图纸文件成为了企业核心数据的重要组成部分。特别是在制造、建筑、设计等行业&#xff0c;CAD图纸文件承载了大量的商业秘密和技术机密。一旦这些图纸被泄露或未经授权地访问&#xff0c;企业将面临巨大的经济损失和声誉损害。因此&am…

【已解决】JS Uncaught DOMException: Failed to construct ‘Worker’ 所有场景

【已解决】JS Uncaught DOMException: Failed to construct ‘Worker’ 所有场景 概述 在JavaScript中&#xff0c;Web Workers允许我们运行后台脚本&#xff0c;这些脚本不会影响到页面的性能。然而&#xff0c;当我们尝试创建一个新的Worker时&#xff0c;有时会遇到“Uncau…

时钟同步方案的参考方案

网络时间服务器是为网络设备提供精确、标准、安全、可靠和多功能的时间服务的最佳解决方案&#xff0c;能提供精确的同步时钟信号&#xff0c;支持标准的NTP和SNTP网络对时协议&#xff0c;提供高精度的网络同步时钟直接来自于GPS系统中各个卫星的原子钟。 那么时钟同步方案我…

idea发送请求提示 无法保留 Cookie,cookie storage file is included in ignored list:

你们好&#xff0c;我是金金金。 场景 IDEA插件httpclient发起请求&#xff0c;提示如下 翻译如下&#xff1a;cookie存储文件被列入忽略列表 解决 查看下是不是你把.idea文件忽略显示了&#xff0c;忽略后会不检索 索引不知道所在位置&#xff0c;所以需要把.idea从忽略列表…

【python】如何通过Python中的http.server搭建文件上传下载服务

✨✨ 欢迎大家来到景天科技苑✨✨ &#x1f388;&#x1f388; 养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; &#x1f3c6; 作者简介&#xff1a;景天科技苑 &#x1f3c6;《头衔》&#xff1a;大厂架构师&#xff0c;华为云开发者社区专家博主&#xff0c;…