开源内容:https://github.com/TommyZihao/zihao_course/tree/main/CS224W
子豪兄B 站视频:https://space.bilibili.com/1900783/channel/collectiondetail?sid=915098
斯坦福官方课程主页:https://web.stanford.edu/class/cs224w
文章目录
- 半监督节点分类
- 半监督节点分类问题求解方法对比
- 标签传播和集体分类
- 大自然对图的基本假设
- Label Propagation (Relational Classification)
- 算法简介
- 算法举例
- 算法的不足
- lterative Classification
- 算法简介
- 算法举例
- Correct & Smooth
- 算法简介
- 算法举例
- Belief Propagation
- 算法简介
- 算法举例
- 消息传递举例
- 存在环
- 算法优缺点分析
- Masked Lable Prediction
- 算法简介
- 总结
半监督节点分类
标签传播算法常作为baseline和其它图神经网络模型进行对比
半监督节点分类:由已知标签的节点猜测未知节点
直推式学习和归纳式学习
- transductive直推式学习:训练模型的过程中用到了已知和未知的标签,没有新节点的加入
- inductive归纳式学习:对新节点进行预测
半监督节点分类问题的求解思路
- 特征工程
- 节点表示学习(图嵌入)
- 标签传播(消息传递)
- 图神经网络
任务:通过节点属性和网络信息预测新节点的标签
半监督节点分类问题求解方法对比
标签传播和集体分类
集体分类:Label Propagation ( Relational Classification)和lterative Classification
后处理:Correct & Smooth
消息传递:Belief Propagation
自监督:Masked Lable Prediction
大自然对图的基本假设
相邻的节点更可能相连且有相同的类别(物以类聚人以群分,近朱者赤近墨者黑)
- 同质性(Homophily):具有相似属性特征的节点更可能相连且具有相同类别
- 影响(influence):社交会影响节点类别
Label Propagation (Relational Classification)
算法简介
-
计算方式:对节点的邻居节点求加权平均
-
对已知节点初始化为0或者1,位置节点初始化为0.5
-
更新所有的节点直到收敛或者达到迭代次数上限
算法举例
算法的不足
- 不保证收敛
- 仅用到网络的连接信息,没有使用到节点属性特征
lterative Classification
算法简介
使用了网络信息、节点类别信息和节点属性特征信息
算法举例
Correct & Smooth
算法简介
利用了图的结构进行后处理,分为correct步骤和smooth步骤
correct步骤对训练误差(不确定性)进行扩散和分散
smooth步骤对最终的预测结果进行扩散和分散
可以和图神经网络进行结合
算法举例
Correct step
smooth step
Belief Propagation
算法简介
Belief Propagation是一种动态规划的方法,下一时刻的状态仅取决于上一时刻,当所有节点达到共识的时候,得到最终的预测结果
算法举例
消息传递举例
对于树状图,从叶子节点向根节点进行汇报
存在环
算法优缺点分析
Masked Lable Prediction
算法简介
总结
本篇文章介绍了半监督节点分类问题的常见概念和各种求解方法的对比,之后介绍了五种解决半监督节点分类问题的算法,分别是Label Propagation ( Relational Classification)、lterative Classification、Correct & Smooth、Belief Propagation、Masked Lable Prediction,其中前两种属于集体分类,第三种属于后处理,第四种属于消息传递,第五种属于自监督方法。