- CS224W1.1——图机器学习介绍
- CS224W1.2——图机器学习应用
- CS224W1.3——图表示的选择
前面几篇介绍了图机器学习的基础一些背景知识,我们知道图机器学习任务分为多个层级:
- 节点层级任务
- 边层级任务
- 子图层级任务
- 图层级任务
这篇主要讲传统的基于特征方法的节点层级任务。我们将讨论节点级特性及其应用。节点级特征关注图中节点的特征,可分为基于重要性和基于结构两种。
文章目录
- 1. 不同层级特征
- 2. 传统的机器学习流水线
- 3. 特征设计
- 4. 节点层级任务
- 4.1 节点特征——度
- 4.2 节点特征——中心信息(Centrality)
- 4.2.1 特征向量中心(Eigenvector centrality)
- 4.2.2 中间性中心(Betweenness centrality)
- 4.2.3 亲密关系中心(Closeness centrality)
- 4.3 节点特征——聚类系数(Clustering Coefficient)
- 4.4 节点特征——Graphlets
1. 不同层级特征
下图展示了不同层级的特征:
其中节点特征可以由下两部分组成:
- 节点附加信息,如节点特征。
- 节点结构信息,如节点在图中位置。
2. 传统的机器学习流水线
传统机器学习流水线有两个步骤:
- 第一步:我们取数据(数据点、节点、边、整图),将这些表示成特征向量。最重要的是,我们去训练典型机器学习任务(比如分类器)
- 第二步:我们获得训练好的特征,去做预测。
3. 特征设计
使用有效的特征是十分重要的,能很好的表示你想表示的东西,这是模型获得很好效果的关键。传统机器学习利用人工设计特征的方式,我们将从三个层级来学习传统特征设计方式。
我们的特征设计与目标任务紧密相关,整体任务可以看下图:
主要就是我们如何去学习这个映射函数 f f f
4. 节点层级任务
节点层级任务和特征集中描述个体节点,我们将这种任务称为半监督学习任务(semi-supervised task)。在这类任务中,会给出整图,并给出一些有标签的节点(绿色、红色),用这些有标签的节点去预测无标签的节点。
节点层级任务主要目标:
我们要很好的利用图结构信息(节点度、节点中心、聚类信息等)表述节点特征。
4.1 节点特征——度
4.2 节点特征——中心信息(Centrality)
节点的度信息十分重要,但也有一些问题:
首先是节点的度信息没有考虑周围节点的重要性,
4.2.1 特征向量中心(Eigenvector centrality)
4.2.2 中间性中心(Betweenness centrality)
4.2.3 亲密关系中心(Closeness centrality)
4.3 节点特征——聚类系数(Clustering Coefficient)
4.4 节点特征——Graphlets
“有根连通的非同构子图”
相关定义:
举例: