【NebulaGraph】变化的多跳查询
- 1. 需求
- 2. 解决方案
- 2.1 确定查询结构
- 2.2 构建查询语句
- 3. 追加需求:如果增加每一跳都要指定查询某SPACE下的Tag,或者不查询某个Tag怎么办
1. 需求
存在多跳请求,其中每一跳是从上一跳查询结果为基础的。但是 最终查询的结果要包含到每一跳的查询结果。 请求参数比如,给了顶点id是324718然后指定查询某些边,然后这一跳是正向的,然后第二跳在一跳的基础上,再指定查询哪些边,什么方向。 以此类推,最终要获取所有顶点的id,顶点包含Tag的properties还有边的信息。
2. 解决方案
2.1 确定查询结构
假设我们需要进行两跳查询:
- 第一跳:从给定的顶点 ID 出发,沿着特定类型的边进行遍历。
- 第二跳:从第一跳的结果顶点出发,继续沿着另一类型的边进行遍历,可以是反向。
2.2 构建查询语句
下面是一个示例查询,它演示了如何执行两跳查询,每一跳可以指定不同的边类型和方向:
GO FROM "player100" OVER follow
YIELD src(edge) AS src, dst(edge) AS dst, edge AS e1
src(edge)
:起点id
dst(edge)
: 终点id
edge
:是边
# 使用第一跳的结果作为第二跳的输入
GO FROM "player100" OVER follow
YIELD src(edge) AS src, dst(edge) AS dst, edge AS e1 |
GO FROM $-.dst OVER serve REVERSELY
YIELD $-.src AS src1, $-.dst AS dst1, $-.e1 AS e1, src(edge) AS src2, dst(edge) AS dst2, edge AS e2
这里存在问题:在 Nebula Graph 的查询中,如果你使用了管道操作 | 来连接两次 GO 查询,那么整个查询的结果是依赖于所有步骤的。这意味着,如果第二跳没有结果,整个查询可能不会返回任何数据,即使第一跳实际上有结果。这是因为管道操作符 | 将第一跳的输出作为第二跳的输入,如果第二跳的查询基于这些输入没有找到符合条件的结果,则整个查询链被视为没有产生有效输出。
根据这个结论:需要我们每一跳都要收集数据,最后一期汇总,而不能通过一次复杂的nGQL语句查询出所有的结果
3. 追加需求:如果增加每一跳都要指定查询某SPACE下的Tag,或者不查询某个Tag怎么办
- 步骤一:每1跳的查询都要收集顶点的ID
- 步骤二:使用
FETCH PROP ON
获取特定标签的属性
1跳查询的时候:
GO FROM "player100" OVER follow
YIELD src(edge) AS src, dst(edge) AS dst, edge AS e1
这个结果可知:相关顶点的id为player101与player125
# 查询指定的Tag,但是查询到的结果是空的,说明这两个顶点如果指定查询tag:team,则返回为空,并且
# 与其相关的边也要删除掉
FETCH PROP ON team "player101","player125" YIELD properties(vertex),id(vertex);