传统图机器学习(人工特征工程+机器学习)
结点,连接,子图都可以有特征
特征分类:
属性特征:本身存在的特征
连接特征:在图中和其他结点连接的特征
传统的机器学习模型:
特征工程:人工构造的特征
将特征抽象成为向量,使计算机能够看懂,输入到机器学习算法,进行训练
半监督问题
假设为银行欺诈问题:绿色未被欺诈,红色被欺诈,灰色未知
对灰色结点进行预测
结点特征
结点连接数(Node Degree)
结点重要度(Node Centrality)
Eigenvector centrality
Betweenness centrality
交通咽喉:计算即最短距离经过该节点的次数
Colseness centrality
不同的Node Centrality计算方法有:
Degree Centrality(度中心性):节点的度越高,其中心性越强。
Eigenvector Centrality(特征向量中心性):基于邻接矩阵的特征向量分析,具有较高的精确性和可解释性。
PageRank(PageRank):基于链接分析的算法,通过模拟网页浏览行为来计算节点的中心性。
Katz Centrality(Katz中心性):根据节点的邻居和朋友的数量以及他们之间的相互联系来评估节点的中心性。
Closeness Centrality(接近中心性):基于节点到其他所有节点的平均最短路径长度来计算节点的中心性。
Betweenness Centrality(介数中心性):通过测量所有最短路径中经过该节点的比例来计算节点的中心性
集群系数
子图模式
小结
连接数:一个节点周围的连接数
集群系数:一个节点周围的三角形系数
子图模式:一个节点周围的预先定义的子图模式