图形数据库的实战应用:如何在 Neo4j 中有效管理复杂关系

news2024/9/24 13:19:50

关系数据库管理系统( RDBMS ) 代表了最先进的技术,这在一定程度上要归功于其由周边技术、工具和广泛的专业技能组成的完善的生态系统。

在这个涵盖信息技术(IT) 和运营技术(OT) 的技术革命时代,人们普遍认识到性能方面出现了重大挑战,特别是在NoSQL 解决方案优于传统方法的特定用例中。事实上,市场提供了许多解释和利用各种不同数据模型的NoSQL DBMS解决方案:

  • 键值存储(例如,最简单的存储,其中对持久数据的访问必须是即时的,并且通过像哈希映射或字典这样的键进行检索);

  • 面向文档(例如,在无服务器解决方案和 lambda 函数架构中广泛采用,其中客户端需要直接从数据库获取结构良好的 DTO);

  • 面向图的(例如,对于知识管理、语义网或社交网络有用);

  • 面向列(例如,在查询驱动的建模方法中提供高度优化的“即用型”数据投影);

  • 时间序列(例如,用于处理物联网场景中的传感器和样本数据);

  • 多模型存储(例如,组合不同类型的数据模型以实现混合功能目的)。

“与那些完全不使用数据的人相比,使用不充分的数据时出现错误要少得多。” 

一个较少被研究的问题是依赖于关系解决方案的软件架构能够灵活地适应软件领域和功能需求快速而频繁的变化。类似敏捷的软件开发方法加剧了这一挑战,这些方法旨在满足客户处理由其业务市场主导的不断出现的需求。

特别是,RDBMS 就其本质而言,当软件需求随着时间的推移而变化时,可能会受到影响,通过引入新的关联表(也替换预先存在的外键)并在 SQL 查询中生成新的 JOIN 子句,对数据库表格模式产生快速影响,从而导致更复杂且更难维护的解决方案。

根据我们的企业经验,我们已经成功实施并试验了基于Neo4j 图形数据库的面向图形的 DBMS 解决方案,以便在具有不同用户和角色的数字社交社区的典型操作环境中减轻需求变更的架构后果。

在这篇文章中,我们:

  • 举例说明面向图形的 DBMS 如何更能满足功能需求;

  • 讨论在经典的N层(分层)架构中采用面向图的DBMS的可行性,提出一些克服主要困难的方法;

  • 强调在各种环境和用例中采用它们的优点和缺点以及威胁。

Neo4j 图形数据库

面向图的数据模型背后的思想是采用原生方法来处理实体(即节点)及其背后的关系(即边),以便通过导航实体之间的关系来查询知识库(即知识 图)。

Neo4j 图形数据库适用 于面向属性图,其中节点和边都拥有不同类型的属性属性。

我们选择它作为 DBMS,主要是为了:

  • 它的“本机”实现是通过数字图元模型具体建模的,其运行时实例由节点(包含具有域属性的实体)和边(表示互连概念之间的可导航关系)组成。这样,关系的遍历时间为O(1);

  • Cypher查询语言被采用为图形中持久知识的非常强大且直观的查询系统。

此外,Neo4j 图形数据库还提供用于对象图形映射(OGM) 的Java 库,可帮助开发人员实现映射、持久化和管理模型实体、节点和关系的自动化过程。实际上,OGM 对于面向图形的 DBMS 的解释与对象关系映射( ORM )模式对于关系持久层的作用相同。

与为 RDBMS 设计的 ORM 模式相比,OGM 模式用于简化数据访问对象( DAO )的实现。它的主要功能是在源代码中正确配置和注释的持久域模型实体中启用半自动细化。

相对于被广泛认为是领先的 ORM 技术的Java Persistence API ( JPA )/Hibernate,Neo4j的 OGM 库以独特的方式运行:

写操作

  • OGM 在托管实体的所有关系中传播持久性更改(从托管对象开始分析整个对象关系树);

  • JPA从托管实体开始逐表执行更新,并基于级联配置处理关系。

读操作

  • OGM通过查询检索一整棵具有固定深度的“关系树”,从指定节点开始,充当“树的根”;

  • JPA允许配置EAGER和LAZY加载方法之间的关系。

示例性案例研究的解决方案优势

为了举例说明我们分析的意义,我们引入一个简单的操作场景:图 1.1 中的 UML 类图描述了一个与实体 Auth(授权的缩写)具有 1 对 N 关系的 User 实体,该实体定义了应用程序内的权限和授权。这种领域模型可以通过类似于表 1.1 和表 1.2 的架构在关系型数据库管理系统(RDBMS)中支持,或者在面向图形的数据库管理系统中,如图 1.2 中的知识图所示。

图 1.1:领域模型的 UML 类图。

USERS TABLE
idfirstNamelastName
.........

表 1.1:在 RDBMS 架构中为 User 实体映射的表格。

AUTHS TABLE

idnameleveluser_fk
............

表 1.2:在 RDBMS 架构中为 Auth 实体映射的表格。

图1.2:与图1.1 的领域模型相关的知识图 。

现在,想象一下,在应用程序的生产生命周期期间出现了一个新的需求:出于管理原因,客户需要将授权限定在特定时间段内(即有效期的开始和结束日期),如图 2.1 所示,将 User 和 Auth 之间的关系转变为 N 对 N。这种领域模型可以通过类似于表 2.1 的架构在关系型数据库管理系统(RDBMS)中支持,或者在面向图形的数据库管理系统中,如图 2.2 中的知识图所示。

图 2.1:在定义新要求后的领域模型 UML 类图。

USERS TABLE

idfirstNamelastName
.........

表 2.1:在 RDBMS 架构中为 User 实体映射的表格。

USERS_AUTHS TABLE

user_fkauth_fkfromuntil
............

表 2.2:在 RDBMS 架构中用于存储 User 和 Auth 实体之间关联的表格。

AUTHS TABLE

idnamelevel
.........

表 2.3:在 RDBMS 架构中为 Auth 实体映射的表格。

图 2.2:与图 2.1 领域模型相关的知识图。

在架构层面上的优势已经很明显:实际上,面向图形的方法没有改变架构,只是在边缘(建模关系)上定义了两个新属性,而 RDBMS 方法则创建了新的关联表 users_auths,替代了 auths 表中引用用户表的外键。

进一步深入分析,我们可以尝试分析 SQL 查询和用 Cypher 查询语言语法编写的查询在这两种方法下的区别:我们想要识别名为“Paul”的用户,他们拥有名为“admin”的 Auth,并且级别大于或等于 3。

一方面,在 SQL 中,所需的查询(分别是第一个查询用于从表 1.1 和表 1.2 检索数据,第二个查询用于表 2.1、表 2.2 和表 2.3)是:

SELECT users.*FROM usersINNER JOIN auths ON users.id = auths.user_fkWHERE users.firstName = 'Paul' AND auths.name = 'admin' AND auths.level >= 3
SELECT users.*FROM usersINNER JOIN users_auths ON users.id = users_auths.user_fkINNER JOIN auths ON auths.id = users_auths.auth_fkWHERE users.firstName = 'Paul' AND auths.name = 'admin' AND auths.level >= 3

另一方面,在Cypher 查询语言中,所需的查询(对于这两种情况) 是:

MATCH (u:User)-[:HAS_AUTH]->(auth:Auth)WHERE u.firstName = 'Paul' AND auth.name = 'admin' AND auth.level >= 3RETURN u

虽然 SQL 查询需要多一个 JOIN 子句,但值得注意的是,在这种特定情况下,不仅用 Cypher 查询语言编写的查询没有额外的子句或 MATCH 路径的变化,而且它也保持不变。后端的“查询系统”上没有必要进行任何更改!

结论 

楔形工程作为国际项目中的技术合作伙伴,设计了一个协作社交平台,作为一个解耦的 Web 应用程序,在 3 层架构中由以下部分组成:

  1. 后端模块,一个分层的 RESTful 架构,利用 JakartaEE 框架; 

  2. 知识图,由 Neo4j 图形数据库提供的 NoSQL; 

  3. 前端模块,一个基于 HTML、CSS 和 JavaScript 的单页应用程序,利用 Angular 框架。 

我们面临的最具挑战性的设计选择是使用原生利用 Cypher 查询语言的驱动程序还是利用 OGM 库简化 DAO 实现:我们发现使用 Cypher 查询语言编写的自定义查询构建整个应用程序既不可行也不可扩展,而 OGM 在处理涉及大量涉及引用外部实体的关系的大型数据层次结构时可能不够高效。

我们最终选择了一种自定义方法,利用 OGM 作为映射节点和边缘的参考解决方案,以 ORM 类型的视角,并支持特定 DAO 的实现,因此通过无法表现良好的自定义查询方法优化了时间上的优化。

总之,我们可以说采用的软件架构很好地响应了知识图模式的变化,并完全满足了客户需求,同时减轻了楔形工程开发团队的努力。

然而,在采用这种架构之前,必须考虑一些威胁:

  • SQL 比 Cypher 查询语言更为常见 → 因此,更容易找到(并因此纳入开发团队)能够维护 RDBMS 而不是 Neo4j 图形数据库的代码的专家; 

  • ​Neo4j 的本地生产系统要求很高(即对于基于服务器的环境,至少推荐 8 GB)→ 这种解决方案可能不适合资源有限的场景和低成本实施; 

  • 在我们的最大努力下,我们没有找到任何“随时可以使用且易于使用”的开源编辑器来浏览 Neo4j 图形数据库的数据结构(Neo4j 的官方数据浏览器不允许通过 GUI 进行数据修改,除非自定义 MERGE/CREATE 查询),就像 RDBMS 有很多一样 → 这可能是由于特定的数据模型本身导致的,使得实现数据的表格视图变得困难。

作者:Cosimo Giani

更多技术干货请关注公号【云原生数据库

squids.cn,云数据库RDS,迁移工具DBMotion,云备份DBTwin等数据库生态工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1237007.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot+bootstrap+java农业电商服务商城系统_30249

本农业电商服务系统是为了提高用户查阅信息的效率和管理人员管理信息的工作效率,可以快速存储大量数据,还有信息检索功能,这大大的满足了管理员、会员和商家这三者的需求。操作简单易懂,合理分析各个模块的功能,尽可能…

鸿蒙原生应用/元服务开发-AGC分发如何编译打包应用

软件包规范 在正式打包应用前,请确保已了解HarmonyOS应用软件包规范。 操作步骤 1.打开DevEco Studio,菜单选择“Build > Build Hap(s)/APP(s) > Build APP(s)”。 2.等待编译构建。编译完成后,将在工程目录“build > outputs >…

企业再不做数字化就OUT了

做数字化是为了让企业活得更好,也是企业活下去的关键! 今年是十四五规划的第二年,科技创新与数字生态建设,俨然成为今年政府工作报告中重点强调的方向之一。 “加快数字化发展,打造数字经济新优势,协同推进…

喜报 | 热烈祝贺思腾合力成功挂牌天津OTC专精特新板

近日,天津区域性股权市场企业挂牌上市成果发布会于2023中国民营企业投融资洽谈会上成功举行。在会上公布,思腾合力成功挂牌天津OTC“专精特新”板。 本次活动由北交所(新三板)天津基地、天津证监局、市发改委,天津滨海…

Linux ps -ef|grep去除 grep --color=auto信息

linux 监控 进程判断是否启动可通过该指令实现 ps -ef|grep java指令结果为 # -v 参数有过滤作用 ps -ef|grep java |grep -v grep

Vue2 基本语法

Vue2 基本语法 前言Vue2 基本语法脚手架文件结构关于不同版本的Vuevue.config.js配置文件ref属性props配置项mixin(混入)插件scoped样式总结TodoList案例webStorage组件的自定义事件全局事件总线(GlobalEventBus)消息订阅与发布(pubsub&#…

Django 创建项目时找不到数据库sqlite3

原因:PyCharm创建Django项目,找不到数据库sqlite3 解决:如果没有默认的db文件,则应在PyCharm终端中执行以下命令: python manage.py makemigrations python manage.py migrate

C题目11:数组a[m]排序

每日小语 双手,且放下一切劳作,前额,也忘掉忧思,此时此刻我所有的感觉就想沉入安睡。 自己敲写 这个问题老师上课讲了一种方法,叫做冒泡排序。基本思想是 1.找最小值,放到a[0] 2.从a[1]~a[3]找最小值&a…

TVS瞬态抑制二极管的工作原理和特点?|深圳比创达电子EMC

TVS二极管一般是用来防止端口瞬间的电压冲击造成后级电路的损坏。防止端口瞬间的电压冲击造成后级电路的损坏。有单向与双向之分,单向TVS一般应用于直流供电电路,双向TVS应用于交流供电电路。 TVS产品的额定瞬态功率应大于电路中可能出现的最大瞬态浪涌…

分享一些简单的英语问候语

昨天和一个朋友聊天,他问我最近有没有某个国家的客户?我说只有一两个,都已经好久没有联系了,上一次问候还是在九月份。他说从十月底开始就收到很多来自当地的询盘,你不妨问下客户最近是否有新的需求? 于是…

如何看待Unity新收费模式?

Unity新收费模式的变化主要在于将收费重心从功能分级收费转变为资源使用量收费,这个改变已经引起了一定的争议和反响。以下是我个人的看法: 优点: 更公平的收费方式:新的收费模式将更加公平,用户只需按照实际使用的数…

【开源】基于Vue.js的婚恋交友网站

项目编号: S 057 ,文末获取源码。 \color{red}{项目编号:S057,文末获取源码。} 项目编号:S057,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 会员管理模块2.3 新…

SpringBoot : ch04 整合数据源

前言 Spring Boot 是当今最流行的 Java 开发框架之一,它以简洁、高效的特点帮助开发者快速构建稳健的应用程序。在实际项目中,涉及到数据库操作的需求时,我们需要对数据源进行整合。本文将重点介绍如何在 Spring Boot 中整合数据源&#xff…

实时云渲染 助力破解智慧园区痛点困局

智慧园区是运用先进的信息技术,如物联网(IoT)、大数据、云计算、人工智能、三维可视化等,对园区内的各类设施、资源以及管理进行智能化和数字化升级。其目标是通过科技手段提升园区的运营效率、资源利用率,提供更便捷、…

循环神经网络(RNN)实现股票预测

文章目录 一、前言二、前期工作1. 设置GPU(如果使用的是CPU可以忽略这步)2. 导入数据 四、数据预处理1.归一化2.设置测试集训练集 五、构建模型六、激活模型七、训练模型八、结果可视化1.绘制loss图2.预测3.评估 一、前言 我的环境: 语言环…

防雷接地+防雷工程施工综合方案

一、地凯科技防雷工程接地概述 防雷接地工程是指在建筑物或其他设施上安装防雷装置,以防止雷电对人员、设备和建筑物造成危害的工程。防雷装置主要包括避雷针(网)、引下线、接地体(网)等部分,其中接地体&a…

Zookeeper初识及安装配置

文章目录 写在前面一、Zookeeper概念二、下载安装2.1 环境准备2.2 下载上传2.3 解压 三、配置启动3.1 配置zoo.cfg3.2 启动Zookeeper 写在前面 最近接受了一个比较老的分布式项目,用的Zookeeper协调服务,所以虽然相关的服务注册等功能有很多可能更好的代…

技术分享|电商数据接口|淘宝天猫京东商品API接口之数据同步

常见的数据同步/集成场景多发生于不同的存储系统、不同的存储格式,如从 mysql 同步数据至数仓、excel 或 csv 导入数据库中,但是众多数据同步解决方案很少涉及从 http 接口同步数据。 如淘宝、拼多多等电商平台,平台内部不同团队之间的数据打…

4.3、Linux进程(2)

个人主页:Lei宝啊 愿所有美好如期而遇 通过系统调用创建进程--fork函数 结果是什么呢? 为什么会出来三个打印呢? 就是因为父进程调用了fork函数创建出了子进程的task_struct,但是一个进程不止task_struct,还有代码和数据,他们…

JVM基础- 垃圾回收器

基本介绍 Java虚拟机(JVM)中的垃圾回收器是用来自动管理内存的关键组件。它负责识别并回收不再使用的内存,从而防止内存泄漏。不同的JVM实现提供了多种垃圾回收器,每种回收器都有其特定的使用场景和性能特点。以下是一些常见的JV…