Ultipa Manager是嬴图数据库管理系统基于网页端的应用。自2019年至今,已迭代最新至v4.2版本。本系列,笔者将分三篇文章,引导大家走进嬴图之Ultipa Manager,详细了解其高可视化、数据科学家工具箱、便捷的数据迁移3大亮点功能,本期具体围绕高可视化展开。
广义来说,高可视化就是在二维或三维空间中,给点和边安排一个空间布局。
高可视化是Ultipa Manager的核心任务之一。事实上,我们很难不以可视化的方式去思考图,我们的脑中总会不自觉地把“画”出来进行洞察和分析。
我们要么是想要一张包含所有数据的全图,要么是其中的一部分图(子图)。当然,现实场景中,数据集可能非常庞大,以至于都很难在有限的屏幕空间中,能将数据全部地展示出来,但我们仍然有很多方法表现其要旨。
另一方面,部分视图(子图)则可能有许多形式——查询结果可能包含节点、边 、路径、子图、表或它们的组合,Ultipa Manager旨在处理这种查询结果的复杂性。
01 | 图+表,两者兼有
当我们受够了传统关系型数据库在表达数据间的关联关系方面的无力,图数据库的横空出世填补了这一空白。
图数据库中的元数据一般分为两种:点和边,分别表达实体和关系。换句话说,关系是直接存储在图数据库中的,而非通过多表关联(Join)等操作计算出来的。
图与我们大脑的思维方式有很强的可比性,它很直观,因此通常不需要太多解释。即使是这样,表还是有其可取之处,我们喜欢它的井井有条、整齐不乱,易于人眼扫描。当然,Ultipa Manager亦提供这种展现方式,在展现离散的元数据详细信息等情况下十分有效。
你会喜欢Ultipa Manager的图/列表模式切换功能,甚至还可以对结果面板进行分屏,对比查看这两种展现方式。
在下面的案例中,我们在一个合著网络(Co-authorship Network)中查询了10个schema为author(作者)的节点。在左边的列表模式里,可以很清楚地看到这些作者的详细信息,包括他们的id、uuid、name和gender。在右边对应的图模式里,我们用一个指定的图标展示这些节点,每个节点均有一个文字标签,内容是我们指定的一个节点属性值(这里我们用的是name属性)。
值得一提的是,每个结果面板都是能独立使用的,不是非得来自同一个查询。另外,每个结果面板均能保留很多历史的查询结果。
在图模式中,Ultipa Manager能帮助你做更多的探索。
如图2所示,从一个节点(作者)进行展开,看看这个作者曾与谁合著过。展开的深度可进行自定义。制作下图时,设置深度是3,期待看到曾与目标作者直接、间接和更加间接合作过的人。
02 | 树形布局
在Ultipa Manager中,我们可以对图中的点、边重新进行布局,使得图进一步描述出它所包含的信息。
具体来说,可以进行树形布局和环形布局。在应用中,我们可以在这些布局之间进行切换,以求发现更多网络结构的特点。
众所周知,树形布局利于展示等级,即从上到下,从根节点到叶子节点,为可视化信息增加更清晰的脉络。
当渲染树形布局时,Ultipa Manager会先找到连通分量(连通图本身就是一个连通分量,非连通图中有多个连通分量)里的单向最长路径,将其端点放置在根节点位置,然后再将其他节点按边的相连关系在垂直方向进行排列。
准确来说,图的树状布局结果未必是一棵“树”,而是类似“树”的一个结构,因为图中可能含有环路,而严格定义下的树结构是不能包含环路的。但无论如何,这种树状结构能为我们提供一些关于图的广度和深度的信息。
在原始布局中,边是用曲线绘制的,当移动一个节点的位置时,会一并拖动与其相连的节点,节点前往位置周围的节点也会被“推开”,图的状态十分灵活。
而在树形布局中,边是用直线绘制的,移动一个节点时不会影响其他节点。树形布局带来的好处之一是能够快速厘清节点邻居距离节点的距离(即跳数,Hop)。例如,在上面的示例中,我们从Adar, E这个作者节点进行了展开,在树形布局中这个节点位于树的左下方。由于结构很整齐清晰,我们很快就能判断出与他有1度(蓝色区域)、2度(绿色区域)和3度(红色区域)关系的合著者。
在企业所有权图中调查一家公司的股权结构是一个典型的应用。
以图6为例,针对ID为23的公司(用红色建筑物图标表示)的查询结果,公司的股权持有者要么是公司(绿色建筑物图标),要么是个人(蓝色用户图标),股权持有关系以及持股比例都用有向边表示。用UQL(Ultipa Graph Query Language,Ultipa嬴图查询语言)书写的查询语句即
n(23).re({@holdShare})[:10].n() as paths return paths{*}
这是一个深度为10的单向穿透,因为在商业世界中,企业的持股人可能会选择隐藏他们的身份。说到这里,你可能有兴趣阅读Ultipa嬴图的最终受益人查找用例。
从这个查询结果的默认布局中,我们可以大概知晓这家ID为23的公司有着十分分散的股权结构,但一时间还是难以解释清楚。故,如图7所示,我们将其转换成树形布局。
该公司的持有人最多地隐藏在了3步开外的深度,其中最大的股东是ID为1的个人,他共计持股55.51%。在图8所示的树形布局中,我们进一步将其持股路径用红色粗边标注出来,并将局部放大呈现。
03 | 环形布局
环形布局则与树形布局迥然不同。它一视同仁地对待所有的节点,并表现在将所有节点均匀地放置在一个圆环上。边则被绘制为圆环中的弦,或是贴近圆周的直线。
以下图为例,图9是一个蛋白质互作网络的原始布局(左)和环形布局(右)。在原始的可视化局部中,我们能看到其中的一团团的簇(Cluster),而这些簇的中心节点在环形布局中就变得更加清晰了,因为这些中心节点附近的边更加密集。
04 | 小结
将图技术应用到各行各业并赋能其深度价值的发掘上,图可视化发挥着重要的作用。通过Ultipa Manager对图非常直观、可交互的呈现,能让我们对网络(点-线-面-体)的理解不仅可以更快,视野和角度还能被拓宽,旨在帮助业务人员、数据科学家、程序员等进行更快、更明智地洞察并采取行动。 下期我们将发布Ultipa Manager 之数据科学家的工具箱篇。【文/Pearl C · Ultipa文档工程师】
END
详细信息,可登陆