图观 | 嬴图GraphRAG在博物馆文物馆藏中的应用探讨

news2024/9/22 7:31:43

图数据库技术是AI走向强人工智能的必经之路和重器!因为图数据库(含知识图谱)最大限度还原(模拟)了人的思维和思考方式。

—— 摘自孙宇熙《图数据库原理、架构与应用》

前言:

博物馆文物馆藏管理和观众服务是文化遗产保护和传播的重要方面。嬴图GraphRAG(Graph Retrieval-Augmented Generation)将知识图谱、检索增强生成(RAG)和大型语言模型(LLM)结合起来,可显著提升博物馆文物信息管理和观众互动体验。本文探讨GraphRAG在博物馆文物馆藏中的具体应用及其优势。

大英博物馆正上新展国宝级珍品《女史箴图》。众所知,顾恺之作品大都已佚或无存,大英博物馆之馆藏也仅是唐代摹本。

图片

转登故宫博物院之官网一查“画祖”东晋顾恺之的藏品有几何呢?见下图:

图片

世人素有对书画的痴迷,无论是2015年故宫博物院(北京)展出《清明上河图》《五牛图》《伯远帖》时引起的“故宫跑”(见上图),还是台北博物院展出《富山春居图》时的观潮,又或日本曾展出颜真卿《祭侄文书》真迹时引发的争议…… 均可见人们对文化精神需求上的日益增长和展陈资源上的局限及供给不足……

图片

此次大英博物馆出于人流考量和文物保护,明文规定了展厅内不设讲解,游人需靠“智能音频进行导览”。

当然,如果是精心制作的音频,观展效果一样不会打折扣,但很多素喜逛博物馆的朋友大都有过糟糕的体验——太多博物馆的音频内容极差,观众扫码后,只是听到照本宣科的一小段内容,且晦涩干瘪,毫无任何增量知识的获取,这无疑是对观展研习的一次浪费(尤其是针对青少年来说)更别提能够启迪心智了……

图片

显然,这也是目前国内外博物馆普遍存在的一个现状与面临痛点:

· 数据的多样性和复杂性

文物数据包括文字说明、图片、音频、视频等多种形式,数据量大且复杂,管理和检索难度较高。

· 文物信息管理

博物馆拥有大量的文物,这些文物涉及丰富的历史、文化和艺术背景。如何有效管理和展示这些文物信息是一个重大挑战。

· 观众互动需求

观众在参观博物馆时,希望能够获取详细而准确的文物信息,并与展品进行互动。传统的展示和导览设备难以满足观众个性化的需求。

那么,如何用技术手段解决以上问题呢?不仅提升观众的观展体验,还能够满足个性化获取知识的需求?

嬴图的GraphRAG(Graph Retrieval-Augmented Generation),其将知识图谱、检索增强生成(RAG)和大型语言模型(LLM)结合起来,这一技术在处理复杂知识结构和生成自然语言回答方面表现出色,完全适用于博物馆文物馆藏管理和观众服务。

  • 个性化导览:根据观众的兴趣和查询历史,提供个性化的文物讲解内容。

  • 自然语言交互:观众可以通过语音或文字与导览系统互动,提出问题并获取即时回答。

图片

嬴图GraphRAG在博物馆文物馆藏中的应用

1、 构建文物知识图谱

知识图谱是GraphRAG的基础,通过图结构将文物、历史事件、文化背景等知识节点和关系组织起来。

图片

如上图所示,通过嬴图高可视化工具,我们可以直观地看到在故宫博物馆中,宋徽宗赵佶的传世之作一共有6件,且每一件的名称(如《芙蓉锦鸡图轴》)、尺寸(如纵81.5cm、横53.6cm)均有展示。【更多了解可阅读:走进嬴图Manager之高可视化】

图数据库是以节点(Node)和(Edge)的形式存储数据,非常适合表示复杂的关系网络建模非常灵活。如下图所示,图数据库以其强大的底层引擎能力,将复杂的、海量的文物之间的关联、历史事件的时间线或考古、人文等信息全部呈现出来,构成一张庞大的、无远弗届的知识图谱——这是图技术模拟人类大脑思维方式的一种高维展示。【更多了解可阅读:图数据库知识点系列之图思维方式】

图片

如:我们在上图中,不仅可以直观地看到以赵佶为节点所展开的所有书画作品,也可以看到故宫博物馆藏有朝的藏品共计45件,当然,我们还可以切换成2D形式(右下角)进行查询。(数据集采自故宫名画记:https://minghuaji.dpm.org.cn/paint/list))

图片

另,当以赵佶为节点展开后,还可以查询到有关其更多的知识,包括人物与人物、人物与事件、事件与事件之间庞大的关联网络。如下图,赵佶张艺谋之间有什么关系?简单组网即可查询出来:

宋徽宗赵佶(父)(君) —宋高宗赵构(子)(君) — 名将岳飞(臣) —《满江红》 电影 — 张艺谋导演

图片

图片

值得一提的是,构建高质量的文物知识图谱需要大量的数据处理和算法支持目前大家所看到的知识图谱构建,大部分只是徒有其表,仅仅是围绕NLP和可视化呈现这两部分,并没有底层算力的支撑,所以并不具备解决深度查询、计算时效性与结果可解释性等能力。因此,这也是很多问答系统(如大家熟知的聊天机器人)回答质量差、答非所问或根本无法回答的原因,更不用提可以个性化、针对性地为观众答疑解惑了。

2、文物信息检索与增强生成

智能回答生成是一种结合了图结构和检索增强生成(Graph-based Retrieval-Augmented Generation)技术,通过将知识图谱(Knowledge Graph)与生成模型相结合,快速定位并提供相关文物信息,提升生成文本的准确性和信息丰富度,博物馆可以实现准确的信息融合和答案生成,为观众提供自然、准确的文物知识,提升观众体验。

图片

此外,嬴图专门设计的ChatGraph插件能帮助用户以对话的方式与图数据进行互动。鉴于大模型能够很好地理解自然语言,嬴图利用它从自然语言问题中提取信息,并将问题转化为准确的嬴图GQL语句,然后通过结合大模型的文本理解能力和图的结构化推理能力,能够整体增强AI系统的功能性、智能性和可解释性。 

· 文物信息检索:根据观众的查询,从知识图谱中检索相关文物信息和背景资料。

· 信息融合:将检索到的信息输入到生成模型中,结合上下文生成准确的回答。

· 答案生成:通过LLM生成符合自然语言的回答,为观众提供详细而准确的文物信息。

此外,在图的建模中,嬴图专门设计了Graph Extractor,它可以使用LLM自然语言处理技术识别文物实体(如文物名称、作者、年代)和关系抽取(如所属朝代、出土地)等。

  • 将文档解析为节点

  • 使用 LLM 从文本中提取信息并可手动定义关系

  • 为每个节点生成嵌入

    如此自动化快速的图构建能力和算法优化,大大提升了图的质量和查询效率。【更多了解,可阅读:嬴图 | LLM+Graph:大语言模型与图数据库技术的协同】

图片

小结

GraphRAG通过结合知识图谱、检索增强生成和大型语言模型,为博物馆文物馆藏管理和观众服务提供了创新的解决方案。它不仅提升了文物信息管理的效率和准确性,实现全面而系统的知识管理,还为观众提供了个性化、智能化、自然准确的互动体验。

嬴图GraphRAG技术还可以应用于虚拟博物馆和在线展览。观众通过虚拟导览平台,可以远程参观博物馆,体验智能导览和互动服务,获取全面的文物信息。随着技术的不断发展,嬴图GraphRAG在博物馆领域的应用将继续拓展,为文化遗产保护和传播做出更大的贡献。(文/ Emma 、Jason)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1967099.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于内地城市生活垃圾收运场景的路线规划算法

基于混合遗传算法和模拟退火算法的优化垃圾收集路线规划 摘要 本论文提出了一种基于混合遗传算法(GA)和模拟退火算法(SA)的创新路线规划方法,旨在优化内地城市的生活垃圾收集效率。算法结合了遗传算法的全局搜索能力…

中证500etf期权合约一手多少钱?

中证500etf期权合约一手需要的资金取决于多个因素,比如做一手需要几十块钱到几百块钱不等,不过买卖中证500etf期权合约一手多少钱,也是包括期权的执行价格、权利金、保证金要求等。下文为大家介绍中证500etf期权合约一手多少钱?本…

.\venv\Scripts\activate : 无法加载文件 E:\,因为在此系统上禁止运行脚本。

问题描述: 问题原因: Windows PowerShell 的执行策略用于控制脚本的运行权限和安全性。 以下是几种常见的执行策略及其特点: AllSigned:只允许运行经过数字签名的脚本。这意味着无论是本地创建的还是从网络获取的脚本&#xff0…

如何设计一个高性能的分布式系统?

本文讨论的主题是高性能,主要思路是围绕快展开,这么设计为什么会快? 文章目录 架构设计:微服务架构负载均衡数据一致性方案选择容错处理:双机互备消息队列缓存总结 架构设计:微服务架构 第一个设计是应用…

“再来一单“业务功能开发

文章目录 概要整体架构流程技术细节小结 概要 再来一单”功能常见于餐饮、零售、外卖等行业,主要目的是为了简化用户的重复购买流程,提高用户体验和效率。 需求分析以及接口设计 再来一单就是将原订单中的商品重新加入到购物车中,所以本质上是"增…

人工智能助力芯片半导体发展,开拓芯片设计技术新趋势

微型硅片上可以容纳多少个晶体管?这些晶体管是构成世界各地技术的集成电路(IC)的基础。1971年,第一款微处理器集成有2,300个晶体管,而如今的硅片上却超过了1000亿个晶体管。在摩尔定律失效之前,每两年晶体管…

10、billu-b0x2

难度 中 目标 root权限 首先确定靶机ip地址 netdiscover -i eth0 -r 192.168.189.0/24 kali 192.168.189.58 靶机 192.168.189.184 信息收集端口扫描 看到一个80和8080,先重点摸一下网站的内容 然后看到信息里有个robots.txt 首先就去访问一下 看到有许多不允许…

高频JMeter软件测试面试题

近期,有很多粉丝在催更关于Jmeter的面试题,索性抽空整理了一波,以下是一些高频JMeter面试题,拿走不谢~ 一、JMeter的工作原理 JMeter就像一群将请求发送到目标服务器的用户一样,它收集来自目标服务器的响应以及其他统计…

传统产品经理VS现在AI产品经理,你要学习的太多了,超详细收藏我这一篇就够了

传统产品经理想要转行成为AI产品经理,需要经历一系列的学习和实践过程。下面是一份详细的学习路线图,旨在帮助你顺利转型。 学习路线图 了解AI基础知识 AI概览:阅读《人工智能:一种现代的方法》这样的书籍,以获得对AI…

初谈Linux多线程--线程控制

文章目录 线程的概述理解线程Linux中的线程重新理解的进程Windows的线程线程的优点线程的缺点理解线程调度成本低 进程VS线程 线程控制创建线程等待线程线程函数传参线程的返回值新线程的返回值新线程返回值错误返回值为类对象 创建多线程线程的终止线程的分离pthread_detach 线…

AIExpo2024奖项申报正式启动,三大奖项为你闪耀

由新一代人工智能产业技术创新战略联盟、苏州市人工智能协同创新中心联合主办,苏州启智创新科技有限公司、苏州工业园区科技发展有限公司共同承办的第六届全球人工智能产品应用博览会(以下简称“智博会”)将于2024年9月11-12日在苏州国际博览…

二叉搜索树,Map,Set,LeetCode刷题

二叉搜索树&#xff0c;Map&#xff0c;Set 1. 二叉搜索树2. 二叉搜索树的模拟实现1.1 插入操作1.2 查找操作1.3 删除操作 3. 二叉搜索树时间复杂度分析4. TreeMap和TreeSet5. Map5.1 Map的常用方法5.2 Map.Entry<K,V> 6. Set6.1 Set的常用方法 LeetCode刷题1. 二叉搜索树…

Total Eclipse 挑战赛:在以太坊首个 SVM L2 上开发应用

摘要&#xff1a;Eclipse 基金会宣布了其首届黑客马拉松计划&#xff0c;即"The Total Eclipse Challenge"&#xff0c;作为一场独一无二的黑客松活动 &#xff0c;邀请了优秀的开发者们在链上开发创新的应用。 "The Total Eclipse 挑战赛" 是一项为期两周…

如何更好地做出判断?

笛卡尔有句名言&#xff1a;无法下判断的人&#xff0c;不是欲望太奢侈&#xff0c;就是觉悟还不够。 这里说的判断&#xff0c;其实也就是选择。我们人生面临着各种维度的选择&#xff0c;大到人生方向&#xff0c;小到一顿饭吃什么&#xff0c;可以说&#xff0c;选择伴随着我…

全志T113i移植LAN8720指南

1、根据硬件修改设备树 gmac0_pins_a: gmac0 {allwinner,pins "PG0", "PG1", "PG2", "PG3", "PG4","PG5", "PG11", "PG12", "PG13", "PG14", "PG15";allwin…

vue3+TS+nest+mysql实现网站访问统计系统

网站采用了vue3tsnestmysql的技术选型&#xff0c;目前初步实现第一版开发 访问地址&#xff1a;点我进入网站 网站访问统计 主要通过插入script来调用上传接口来实现数据统计,目前仅存储了用户的ip和访问时间&#xff0c;后期也可根据ip来获取用户的城市信息 async pageUplo…

探索TinyDB的轻量级魅力:Python中的微型数据库

文章目录 探索TinyDB的轻量级魅力&#xff1a;Python中的微型数据库背景&#xff1a;为何选择TinyDB&#xff1f;什么是TinyDB&#xff1f;如何安装TinyDB&#xff1f;5个简单的库函数使用方法3个场景下的应用实例常见问题与解决方案总结 探索TinyDB的轻量级魅力&#xff1a;Py…

社区志愿服务管理平台小程序/社区志愿者管理系统

获取源码联系方式请查看文章结尾&#x1f345; 摘 要 随着当今网络的发展&#xff0c;时代的进步&#xff0c;各行各业也在发生着变化&#xff0c;于是小程序也逐步进入人们的生活&#xff0c;给我们生活或者工作提供了新的方向新的可能。 本毕业设计的内容是设计实现一个基…

芯片解密技术可以应用在哪些领域?

芯片解密技术可以在以下一些领域得到应用&#xff1a; 电子产品维修&#xff1a;对于一些老旧或难以获取原厂技术支持的设备&#xff0c;通过解密芯片获取程序代码可以更有效地进行故障诊断和维修。技术研究和学习&#xff1a;帮助科研机构和技术人员深入了解先进芯片的设计和工…

python绘图 | 横坐标是日期,纵坐标是数值

需求 profit_value [0.084, 0.225, 0.234, 0.264, 0.328] time_stamp [20221111, 20230511, 20230704, 20231212, 20240315] 横坐标是日期&#xff0c;纵坐标是数值&#xff0c;我想绘图的时候&#xff0c;横坐标是按日期格式来 代码 from matplotlib import pyplot as pl…