Abstract
Accou2vec。首先,为了切断人类账户和机器人账户之间的攻击边,利用类似深度自动编码器的非负矩阵分解社区检测算法将社交图划分为多个子图。然后设计了社区漫游规则,分别控制社区内部和社区间的漫游,同时考虑社区中的节点和边的数量。随后,使用图表示学习来学习每个账户的表示向量。
动机:
基于关系图的社交机器人检测方法根据未知账户的邻居标签预测其标签。如果未知账户是人类但与机器人账户有关系,它可能会被错误地分类为社交机器人。
机器人和人类账户之间建立的关系被称为攻击边,降低了社交网络的同质性,对社交机器人检测产生负面影响。
通过社区检测,社交图被划分为多个子图,并相应地切断了一些攻击边。用于社交机器人检测的高级社区检测算法有可能切断更多攻击边,提升社交机器人检测的性能。
通过分析社交机器人检测基准,Cresci-2015和Twitter数据集,可以发现机器人账户之间存在大量双向关注关系,而人类账户之间的关系更可能是单向关注。
Contribution:
- 提出的模型利用深度自动编码器样非负矩阵分解(DANMF)社区检测算法来增强社交网络子图的同质性。
- 设计了一种社区漫游规则,在生成漫游序列时考虑了社区中的节点和边数。该规则约束漫游序列主要在同一社区内,从而减少潜在攻击边对节点表示学习的干扰。
ACCOU2VEC
两个主要阶段:社区检测和图嵌入。
- 在第一个阶段,使用 DANMF从输入的社交图中提取一定数量的社区,换句话说,将一个大图分割成多个子图,可以增强社交网络子图的同质性。
- 在第二个阶段,使用提出的社区游走来表征一个社区内外节点对特定节点的影响。
根据社区游走规则生成的游走序列被输入到图嵌入模型中以学习节点的表示。
最后,使用传统的机器学习分类器预测节点的标签。
Community detection
机器人和人类账户之间建立的关系,即攻击边,会降低社交网络的同质性,并对社交机器人检测产生负面影响。然而,在社区检测阶段,当社交图被划分为多个子图时,一些攻击边会被切断。这将增强社交网络子图的同质性。
DANMF 继承了基于非负矩阵分解(NMF)的社区检测算法的优秀检测性能和良好的可解释性。此外,它可以检测社交网络中的重叠社区,同时在非重叠社区上优于 Louvain。DANMF 通过将编码器组件和解码器组件集成到统一的损失函数中,使这两个组件在学习过程中相互指导,从而获得理想的社区成员节点。
具体关于DANMF的介绍,之后将在DANMF的文献中详细阐述
Skip-gram
Algorithm 1