聊一聊知识图谱结合RAG

聊一聊知识图谱结合RAG

news2026/3/10 1:22:01

因为最近在做一些关于提高公司内部使用的聊天机器人的回答准确率，并且最近微软官方也是开源了一下graphrag的源码，所以想聊一聊这个知识图谱结合rag。

rag在利用私有数据增强大模型回答的领域是一种比较典型的技术，也就是我们提出问题的时候，rag会根据我们的问题去知识库中检索一些比较相关的文档或者语句，将这些文档和我们的问题一起拼接到提示词模版中，得到一个完整的提问大模型的问题，这样大模型就可以根据我们提供的知识以及我们的问题来对特定领域的问题进行回答了。

首先，我们了解一下传统的rag技术，传统的rag技术就是通过匹配文档语句的相关性或者相似度来得到一些比较相关的文档。可以分为两个角色，分别是用户和文档管理者。大致流程：

文档管理者：

①上传导入文件，解析文件内容

②对文本内容进行切块，每一块可以成为一个chunk。

③得到每个chunk，利用嵌入式模型得到每个chunk的向量表示，并将这个向量存储到向量数据库中，常见的向量数据库，比如faiss数据库，将其作为一个本地知识库。

用户：

①提出问题

②对问题进行向量化

③利用得到的向量去知识库中匹配，得到相关性分数比较大的一些语句块，即chunk，这里就会涉及到一些检索技术了

④得到chunk，将其和问题拼接到提示词模版中，就可以得到一个完整的对大模型的问题。

⑤大模型回答问题，得到答案

由此，我们可以看的出来，传统的rag是一种局部检索的技术，也就是我们提问的问题会跟每个语句块进行匹配得到相关性分数，只能提问一些局部的问题，以及得到一种比较局部的答案，当我们要问某个文档的全局性的问题的时候，他就不会出现很好的效果。

这时候就需要知识图谱了，知识图谱是一种类似于图结构，其中有很多的实体，也就是结点，也有很多的关系，也就是边，一个文档可以理解为一个图结构，各个文档之间没有交集，也就是对应的图结构不会有关系。

这样，我们在上传文档的时候，切分为了很多的块，即chunk，我们会将每个块交给大模型，让其提取其中的实体和关系，然后存储起来，实体和关系分别存储到各自的集合中，最终所有的chunk提取完以后，一次性的将所有的结点和关系存储到一个图数据库中，然后我们就可以在数据库中得到这个文档的一个知识图谱。这样，当用户提问的时候，就可以提供更丰富的上下文或者关系，提供总结能力和回答的准确性。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1951076.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

MATLAB基础：数组及其数学运算

MATLAB基础：数组及其数学运算

今天我们继续学习MATLAB中的数组我们在学习MATLAB时了解到，MATLAB作者秉持着“万物皆可矩阵”的思想企图将数学甚至世间万物使用矩阵表示出来，而矩阵的处理，自然成了这门语言的重中之重。数组基础在MATLAB中，数组是一个基本…

阅读更多...

LCD 横屏切换为竖屏-I.MX6U嵌入式Linux C应用编程学习笔记基于正点原子阿尔法开发板

LCD 横屏切换为竖屏-I.MX6U嵌入式Linux C应用编程学习笔记基于正点原子阿尔法开发板

LCD 横屏切换为竖屏横屏显示如何切换为竖屏显示 LCD 屏默认横屏显示开发板配套的 LCD 屏默认都是横屏显示，如 4.3 寸、7 寸和 10.1 寸的不同分辨率的 RGB LCD 屏固定坐标体系 （以 800*480 分辨率为例）横屏模式下的固定坐标：…

阅读更多...

【JavaScript】深入理解 `let`、`var` 和 `const`

【JavaScript】深入理解 `let`、`var` 和 `const`

文章目录一、var 的声明与特点二、let 的声明与特点三、const 的声明与特点四、let、var 和 const 的对比五、实战示例六、最佳实践在 JavaScript 中，变量声明是编程的基础，而 let、var 和 const 是三种常用的变量声明方式。本文将详细介绍这三种变量声…

阅读更多...

Blackbox AI-跨时代AI产物，你的私人编程助手

Blackbox AI-跨时代AI产物，你的私人编程助手

1. 引言随着人工智能技术的飞速发展，我们的生活方式正在经历前所未有的变革。从智能家居到自动驾驶，AI已经渗透到我们生活的方方面面。而在这场科技革命中，Blackbox 网站凭借其先进的技术和全面的功能，成为了众多AI产品中的佼佼者…

阅读更多...

基于单片机控制的锂电池组电路的设计

基于单片机控制的锂电池组电路的设计

摘要: 提出一种基于单片机控制的锂电池组电路设计方案 . 采用 8 位 CMOS 闪存单片机 PIC16F886 作为主控芯片 , 电路设计中含有 S-8254 芯片的一次保护电路、 S-8244 芯片的二次保护电路和 MCU 的辅助保护功…

阅读更多...

photoshop学习笔记——选区3 快速选择工具

photoshop学习笔记——选区3 快速选择工具

快速选择工具 W shift W 在3种快速选择工具之间切换对象选择工具 photoshop CC中没有这个工具，利用AI，将款选中的对象快速的提取选区，测试了一下，选区制作的非常nice快速选择工具跟磁性套索类似，自动识别颜色相似…

阅读更多...

qt初入门9:qt记录日志的方式，日志库了解练习（qInstallMessageHandler,qslog, log4qt）

qt初入门9:qt记录日志的方式，日志库了解练习（qInstallMessageHandler,qslog, log4qt）

项目中用到qt，考虑有需要用到去记录日志，结合网络，整理一下，做记录。简单了解后，qt实现日志模块思考： 1：借助qt自带的qInstallMessageHandler重定向到需要的目的地。 2：自己封装一…

阅读更多...

JAVA SE 类和对象

JAVA SE 类和对象

类和对象类定义和使用类的定义格式类的实例化什么是实例化 this 引用this引用的特性对象的构造及初始化如何初始化对象构造方法概念特性在这里插入图片描述 **注意**： 封装封装的概念封装扩展之包导入包中的类自定义包包的访问权限控制举例 static成员static修饰…

阅读更多...

MOZHE SQL手工注入漏洞测试(MySQL数据库)

MOZHE SQL手工注入漏洞测试(MySQL数据库)

主界面URL没有参数，无法判断是否有注入点点击公告【浏览器不便于查看返回包可以用burp】测试URL 参数后加上单引号，报错，说明存在注入点 http://124.70.64.48:40021/new_list.php?id1 获取表列数 order by 4 返回200 order by 5 …

阅读更多...

鸿蒙应用框架开发【N-Body模拟程序】

鸿蒙应用框架开发【N-Body模拟程序】

N-Body模拟程序介绍在本示例中，使用ArkTS编程语言开发了业界编程语言基准测试项目[Benchmarks Game]中的[N体问题模拟程序]，实现类木星体轨道计算。本示例用到了ohos.taskpool和ohos.worker 接口。示例中的程序可以用于AOT(Ahead Of Time)等性能测…

阅读更多...

计科录取75人！常州大学计算机考研考情分析！

计科录取75人！常州大学计算机考研考情分析！

常州大学（Changzhou University），简称“常大”，位于江苏省常州市，是江苏省人民政府与中国石油天然气集团有限公司、中国石油化工集团有限公司及中国海洋石油集团有限公司共建的省属全日制本科院校，为全国深…

阅读更多...

⼤模型在⽹络安全⽅⾯的应⽤汇总

⼤模型在⽹络安全⽅⾯的应⽤汇总

引⾔⼤语⾔模型（Large Language Models, LLMs）的横空出世，为传统计算机科学的各个细分领域带来了颠覆性的变⾰。这种变⾰的浪潮同样席卷了⽹络安全领域，引发了⼀系列深刻的变化和影响。GPT-4、Gemini、Llama 2 等⼤模型以其卓越的…

阅读更多...

7月22日学习笔记文件共享服务nfs，SAMBA文件共享与DNS域名服务

7月22日学习笔记文件共享服务nfs，SAMBA文件共享与DNS域名服务

任务背景由于业务驱动，为了提⾼⽤户的访问效率，现需要将原有web服务器上的静态资源⽂件分离出来，单独保存到⼀台⽂件服务器上。任务要求 1. ⼀台应⽤服务器web-server部署apache，静态⽹⻚资源存放在另外⼀台NFS服务器上 …

阅读更多...

深入理解计算机系统 CSAPP 家庭作业11.7

深入理解计算机系统 CSAPP 家庭作业11.7

静态内容是指在不同请求中访问到的数据都相同的静态文件。例如：图片、视频、网站中的文件（html、css、js）、软件安装包、apk文件、压缩包文件等。 /** get_filetype - derive file type from file name*/ void get_filetype(char *filename,…

阅读更多...

12_TypeScript 模块以及模块化封装DB 库

12_TypeScript 模块以及模块化封装DB 库

TypeScript 模块 1、模块中暴露方法12、模块中暴露方法23、模块中暴露方法34、封装[上一节的db 库](https://blog.csdn.net/qq_46143850/article/details/140664100)5、TypeScript 命名空间模块的概念（官方）： 关于术语的一点说明&#xff1a…

阅读更多...

Linux网络-wget命令

Linux网络-wget命令

作者介绍：简历上没有一个精通的运维工程师。希望大家多多关注我，我尽量把自己会的都分享给大家，下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 Linux服务器作为一个常用的网络服务器，主要的作用就是向客户端提供网络…

阅读更多...

【工具推荐】强大的JS渗透测试工具：URLFinder

【工具推荐】强大的JS渗透测试工具：URLFinder

一、下载地址 https://github.com/pingc0y/URLFinder 二、工具原理从表现中JS中提取URL或者敏感数据，一款用于快速提取检测页面中JS与URL的工具。功能类似于JSFinder，但JSFinder好久没更新了。三、工具介绍 1、下载解压出来包含下面两个文件 2、直…

阅读更多...

内网渗透—内网穿透工具NgrokFRPNPSSPP

内网渗透—内网穿透工具NgrokFRPNPSSPP

前言主要介绍一下常见的隧道搭建工具，以此来达到一个内网穿透的目的。简单说一下实验滴环境吧，kali作为攻击机，winserver2016作为目标靶机。 kali 192.168.145.171 winserver2016 10.236.44.127 显然它们处于两个不同的局域网&#xff0c…

阅读更多...

SQLException：Operation not allowed after ResultSet closed

SQLException：Operation not allowed after ResultSet closed

运行代码时出现的错误： 这是在运行简单的JDBC访问数据库时出现的问题，原因是在ResultSet方法中添加了close()关闭方法,如图： ResultSet 是通过 query 方法获得的，并且在 try-catch 块中没有显式地关闭它。这实际上是一个常见的…

阅读更多...

ServletContainerInitializer接口详解

ServletContainerInitializer接口详解

版权声明本文原创作者：谷哥的小弟作者博客地址：http://blog.csdn.net/lfdfhlServletContainerInitializer概述 ServletContainerInitializer是Servlet 3.0规范中引入的一个接口，它的主要目的是允许开发者在Servlet容器（如Tomcat、Jetty等）启动时执行一些自定义的初始化代…

阅读更多...

推荐文章

最新文章