图数据库的力量：深入理解与应用 Neo4j

文章目录

- 图数据库的力量：深入理解与应用 Neo4j
- - 1、什么是 Neo4j？
  - - 版本说明
  - 2、Neo4j 的部署和安装
  - - Neo4j Web 工具介绍
  - 3、体验 Neo4j
  - - 加载数据
    - 查询数据
    - 数据结构
  - 4、Cypher 入门
  - - 创建数据
    - 查询数据
    - 关系深度查询
    - 分页查询
    - 更新数据
    - 删除数据
    - 索引

1、什么是 Neo4j？

Neo4j 是由 Java 实现的开源 NoSQL 图数据库。自 2003 年开始开发，2007 年正式发布第一版并将源码托管于 GitHub。作为图数据库的代表产品，Neo4j 已经在众多行业项目中广泛应用，如网络管理、软件分析、组织和项目管理及社交网络等。

Neo4j 官网: https://neo4j.com/

Neo4j 提供了专业数据库级别的图数据模型存储，具备完整的数据库特性，包括 ACID 事务支持、集群支持、备份和故障转移等功能。

它还支持声明式查询语言 Cypher，这种语言类似于关系型数据库中的 SQL，操作简单，表现力强，查询效率高，且具有良好的扩展性。

下图演示了 Neo4j 的典型数据存储方式：

图数据库例子

在上图中，紫色圆圈代表【人】数据，橙色圆圈代表【电影】数据，展示了人和电影之间参演或导演的关系。

版本说明

Neo4j 提供以下两个版本：

社区版（Community Edition）：具备了基本功能，适合开发环境使用。
企业版（Enterprise Edition）：相对于社区版增加了集群部署、高级监控、高级缓存、在线备份等功能，建议在生产环境中使用。

企业版从 3.2 版本开始支持集群，能够在不受地理位置限制的情况下实现事务 ACID 特性。更多信息请参考：Neo4j 企业版特性

2、Neo4j 的部署和安装

Neo4j 支持多个平台的部署和安装，包括 Windows、Mac 和 Linux 等系统。在安装 Neo4j 之前，请确保已安装 Java 虚拟机。

使用 Docker 进行安装的命令如下：

docker run \
-d \
--restart=always \
--name neo4j \
-p 7474:7474 \
-p 7687:7687 \
-v neo4j:/data \
neo4j:4.4.5

# 7474 是 web 管理工具的端口，7687 是 Neo4j 协议端口用于数据通信

Neo4j Web 工具介绍

Neo4j 提供了一个便捷的 Web 工具，可以进行数据库的 CRUD 操作。

Neo4j Web工具

3、体验 Neo4j

以下是通过官方提供的电影数据来实战体验 Neo4j 的步骤：

数据体验

加载数据

首先，选择并加载数据：

加载数据

系统会自动将创建数据的 Cypher 语句加载到输入框中，点击执行：

执行加载数据

执行成功后，可以看到数据已经成功导入：

数据导入成功

查询数据

例如，查询【Tom Hanks】参演了哪些电影的 Cypher 语句如下：

MATCH (tom:Person {name: "Tom Hanks"})-[:ACTED_IN]->(tomHanksMovies) RETURN tom, tomHanksMovies

查询结果如下图所示：

查询结果

数据结构

在 Neo4j 中，数据通过节点、属性、关系和标签来存储。以下是具体说明：

数据结构

节点：存储实体数据（如上图中的演员和电影），类似于关系型数据库中的表。
关系：存储节点之间的关系。每个关系只能有一个类型，必须有开始和结束节点，并且可以循环引用，但不能留空。
属性：节点和关系都可以有属性，由键值对组成。节点的属性类似于关系型数据库中的字段，而关系属性则进一步明确了关系属性。
标签：用于对节点进行分类，使 Neo4j 数据模型更易于构建。在上面的电影案例中，Movie 和 Person 即是标签。

4、Cypher 入门

Cypher 是 Neo4j 的查询语言，类似于关系型数据库中的 SQL，一些关键词来源于 SQL，比如：CREATE、WHERE、RETURN 等。下面我们一起学习 Cypher 的基本语句。

Cypher 语句的关键字对大小写不敏感。

创建数据

// 查询所有数据
MATCH (n) RETURN n

// 删除所有节点和关系，慎用！
MATCH (n) DETACH DELETE n

// 创建一个具有 name 属性的节点，变量 n 代表该节点，创建完成后返回该节点
CREATE (n {name: $value}) RETURN n

// 创建一个指定标签（$Tag）的节点
CREATE (n:$Tag {name: $value})

// 创建 n 指向 m 的关系，并且指定关系类型为 KNOWS
CREATE (n)-[r:KNOWS]->(m)

// 示例
// 创建节点，并赋予 name 属性
CREATE (n {name:'迪士尼营业部'})
CREATE (n:AGENCY {name:'航头营业部'})

// 创建浦东新区转运中心、上海转运中心节点，并且创建关系类型为 IN_LINE，创建完成后返回节点和关系
// TLT -> Two Level Transport（二级转运中心）
// OLT -> One Level Transport（一级转运中心）
CREATE (n:TLT {name:'浦东新区转运中心'}) -[r:IN_LINE]-> (m:OLT {name:'上海转运中心'}) RETURN n,r,m

// 关系可以是反向的，并且可以为关系指定属性
CREATE (n:TLT {name:'浦东新区转运中心'}) <-[r:OUT_LINE]- (m:OLT {name:'上海转运中心'}) RETURN n,r,m

在上面的示例中，我们先后创建了节点、指定标签的节点以及带有特定关系类型的节点。示例代码展示了如何创建双向关系，并且为关系指定属性。

查询数据

// 匹配某个条件的节点
MATCH (n:AGENCY {name: "航头营业部"}) RETURN n

// 查询具有一定条件的节点及其关系，并按照一定顺序返回数据
MATCH (n)-[:KNOWS]->(m) WHERE m.name = "Tom Hanks" RETURN n, m ORDER BY n.name ASC

关系深度查询

可以指定关系的深度进行查询，语法格式：-[:TYPE*minHops..maxHops]->

例如，六度分隔（Six Degrees of Separation）理论表明，你和任何一个陌生人之间所间隔的中间人不会超过六个，也就是说，最多通过六个人你就能认识任何一个陌生人。

// 查询【北京市转运中心】关系中深度为 1~2 层的节点
MATCH (n:OLT {name:"北京市转运中心"}) -[*1..2]->(m) RETURN *

// 可以简写为
MATCH (n:OLT {name:"北京市转运中心"}) -[*..2]->(m) RETURN *

// 通过变量查询
MATCH path = (n:OLT {name:"北京市转运中心"}) -[*..2]->(m) RETURN path

// 获取结果中的关系，WITH 语句将结果传递给下一个查询
MATCH path = (n:OLT {name:"北京市转运中心"}) -[*..2]->(m)
WITH n, m, relationships(path) AS r
RETURN r

// 查询两个网点之间所有的路径，最大深度为 6
MATCH path = (n:AGENCY) -[*..6]->(m:AGENCY)
WHERE n.name = "北京市昌平区定泗路" AND m.name = "上海市浦东新区南汇"
RETURN path

// 查询两个网点之间的最短路径，查询深度最大为 10
MATCH path = shortestPath((n:AGENCY) -[*..10]->(m:AGENCY))
WHERE n.name = "北京市昌平区定泗路" AND m.name = "上海市浦东新区南汇"
RETURN path

// 查询两个网点之间所有路径中成本最低的一条路径，最大深度为 10
MATCH path = (n:AGENCY) -[*..10]->(m:AGENCY)
WHERE n.name = "北京市昌平区定泗路" AND m.name = "上海市浦东新区南汇"
UNWIND relationships(path) AS r
WITH sum(r.cost) AS cost, path
RETURN path ORDER BY cost ASC, LENGTH(path) ASC LIMIT 1

// UNWIND 将列表数据展开
// sum() 是聚合函数，类似的还有 avg()、max()、min() 等

分页查询

// 分页查询网点，按照 bid 正序排序，每页查询 2 条数据

// 第一页
MATCH (n:AGENCY) 
RETURN n ORDER BY n.bid ASC SKIP 0 LIMIT 2

// 第二页
MATCH (n:AGENCY)
RETURN n ORDER BY n.bid ASC SKIP 2 LIMIT 2

更新数据

更新数据使用 SET 语句进行标签、属性的更新。SET 操作是幂等性的。

// 更新或设置属性
MATCH (n:AGENCY {name:"北京市昌平区新龙城"})
SET n.address = "龙跃苑四区3号楼底商101号"
RETURN n

// 移除属性
MATCH (n:AGENCY {name:"北京市昌平区新龙城"}) 
REMOVE n.address 
RETURN n

// 给没有 address 属性的节点增加 address 属性
MATCH (n:AGENCY) 
WHERE n.address IS NULL 
SET n.address = "暂无地址" 
RETURN n

删除数据

删除数据通过 DELETE 和 DETACH DELETE 完成。DELETE 不能删除有关系的节点，删除关系需要使用 DETACH DELETE。

// 删除节点
MATCH (n:AGENCY {name:"航头营业部"})
DELETE n

// 有关系的节点不能直接删除
MATCH (n:AGENCY {name:"北京市昌平区新龙城"})
DELETE n

// 删除节点及其所有关系
MATCH (n:AGENCY {name:"北京市昌平区新龙城"})
DETACH DELETE n

// 删除所有节点和关系，慎用！
MATCH (n)
DETACH DELETE n

索引

给节点添加索引以提高查询效率。

// 创建索引语法
CREATE [TEXT] INDEX [index_name] [IF NOT EXISTS]
FOR (n:LabelName)
ON (n.propertyName)
[OPTIONS "{" option: value[, ...] "}"]

// 示例
CREATE TEXT INDEX agency_index_bid IF NOT EXISTS FOR (n:AGENCY) ON (n.bid)

// 删除索引语法
DROP INDEX [index_name]

// 示例
DROP INDEX agency_index_bid

通过对 Neo4j 的深入理解与应用，图数据模型的强大优势得以展现。无论是复杂关系存储还是高效查询，Neo4j 都表现出色。希望这些详细的示例和说明能帮助你更好地掌握 Neo4j，为实际项目应用打下坚实基础。