Abstract
真实用户与机器人数量之间的固有不平衡带来了巨大的挑战,常常导致分类器的偏差。本文引入了HyperSMOTE,这是一种利用超图丰富结构的不平衡节点分类的新方法。通过将X平台用户表示为节点,并将他们的互动表示为超边,构建了一个能够捕捉用户之间复杂关系和互动的超图。
这种基于超图的表示方式允许对用户行为和互动有更细致的理解,为机器人检测提供了坚实的基础。
HyperSMOTE通过在超图中生成合成的机器人账户,解决了类别不平衡问题,确保了训练数据集的平衡,同时保留了超图的语义。
Contribution:
1)X生态系统的超图表示:我们引入了一种新的X平台表示方法,将每个用户账户描述为一个节点,他们的互动(推文、转推、提及等)形成超边。这种表示捕捉了X账户之间复杂的关系和互动,为后续分析和机器人检测提供了丰富的结构。
2)使用HyperSMOTE解决类别不平衡:鉴于超图中真实用户账户数量远多于机器人账户,我们提出了HyperSMOTE技术。该方法在超图中生成合成的机器人账户,确保训练数据集的平衡,同时保留超图的结构和语义。
3)用于机器人检测的超图神经网络:我们设计了一种超图神经网络,通过聚合邻近节点和超边的信息,生成每个节点的稳健表示。
PROPOSED METHOD