挂到arxiv上的,多行为级联超图加对比学习,超图是针对单个行为的,而不是针对多个行为的。参考的类似工作是CRGCN加MBSSL。这两篇我都做了论文阅读,(CRGCN正在路上,MBSSL是我的第一篇论文阅读帖子)推荐系统论文阅读总结:SIGIR 2023 Multi-behavior Self-supervised Learning for Recommendation-CSDN博客
1 动机
编码多行为交互的方式之前写过一篇帖子了,分为并行和级联。这篇帖子是使用DAG以级联的方式进行编码的,使用了DAG的GCN以及注意力https://blog.csdn.net/cyzz523/article/details/143416527 那么现在这篇是超图加对比学习,并行和级联的方式再次总结一下:
1 并行:通常将多路交互数据转换为各种精心设计的异质图结构,然后并行地提取和聚合不同行为的语义和上下文信息,通过图神经网络,对比学习等机制来捕捉行为依赖。能够灵活地处理不同类型的行为,避免不同行为间的干扰。此外,一些论文中将用户的多行为分为了点击和点击后行为(包含用户的多行为类型交互)CSDN
2 级联:反映了实际场景中行为链的偏序关系,通过残差结构等模块串行连接各个行为。(假定低层次行为或者说早起辅助行为(如浏览、加购物车)对高层次行为最终目标行为(如购买)有直接影响。能够更有效地利用行为间的顺序和层级关系,提升推荐性能。
然而,级联方式编码的缺陷:
1:先前级联模型强调利用行为序列中的依赖关系进行嵌入学习,例如,从一个行为中学到的嵌入将被输入到下一个行为的嵌入学习过程中。 尽管它们可以有效地捕获两个连续行为之间的依赖性,但不同行为之间丰富的全局一致性以及行为内的依赖性信号在很大程度上被忽略。
2:在多行为推荐中,利用多层图消息传递机制建模用户与物品之间的高阶依赖关系可能导致过度平滑,从而削弱模型性能。
3:现有的研究工作主要依赖于对特定行为下用户与物品之间的细粒度交互进行建模,而忽略了探索交互图中存在的粗粒度信息,粗粒度信息可以有效补充细粒度交互信息。例如,某些用户可能具有相似的兴趣偏好,或者特定物品可能属于同一类别。
2 贡献
-
提出了一种用于多行为推荐的超图增强级联图卷积网络,通过构建用户-物品交互图和对应的超图,分别捕捉不同粒度的用户或物品之间的关联。捕捉具体的用户-物品多行为交互,还捕捉更高层次的关联(如用户兴趣相似性或物品类别,通过超图)。
-
提出了一种基于对比学习的行为一致性指导的对齐策略。包括:行为内一致性对齐:通过对比学习子模块,将来自交互图的用户和物品嵌入与对应超图学习到的嵌入进行对齐,确保同一行为下不同图结构的表示保持一致。行为间一致性对齐:通过跨行为对齐模块,将不同类型行为(如浏览、点击、购买)的用户和物品嵌入与一个全局图的嵌入对齐,确保不同行为之间的表示具有全局一致性。
3 HEC-GCN
由四个模块组成,(1)全局图学习模块,获取用户跨行为的一般偏好的洞察独特的行为。 (2)超图增强级联图卷积网络,遵循级联范式,并结合行为超图来增强特定行为下表示的学习。 (3)行为一致性引导的对比学习模块,涵盖行为内和行为间的内在一致性。 (4)Prediction,利用多任务学习进行联合优化。
3.1 全局图学习
全局图包含了用户 u与物品 i之间所有类型行为(如浏览、点击、购买等)的交互信息。通过全局图,模型能够识别出用户与物品之间是否存在至少一次交互。捕捉了用户与物品在所有行为类型下的整体交互信息,从而生成反映用户整体偏好和物品整体特性的全局嵌入表示:
lightgcn,没啥可说的
3.2 超图增强的级联图卷积网络(参考CRGCN)
通过级联方式同时利用用户-物品交互图和对应的超图,为每种行为学习用户和物品的表示。可以捕获用户和物品之间的高阶协作关系,从而增强模型学习更好的用户偏好的能力。
3.2.1 特定行为的交互图学习
使用LightGCN在其对应行为的用户-物品交互图上学习节点(用户和物品)的表示:
对于第 k种行为,嵌入的初始值来自于前一种行为学习到的嵌入:
通过 L 层图卷积后,聚合所有层的嵌入以获得最终的行为特定嵌入:
3.2.2 特定行为的超图学习
为了进一步捕捉用户和物品之间的高阶协同关系,使用行为特定的超图。超图允许一个超边连接多个节点,从而更全面地表示复杂的关系。
每种行为定义用户和物品的超边表示:M 是用户数量,N是物品数量,S是超边数量。使用可学习的参数化超边表示,以低秩方式优化超边参数,减少计算复杂度和过拟合风险。首先生成超图边的表示:
表示与第𝑘特定行为交互图对应的所有用户和项目的嵌入。对于第 𝑘 行为中的超图学习,对每个行为的用户侧和项目侧超图使用简化的超图卷积网络:
H是用户侧和物品侧的超图依赖矩阵,表示用户与用户之间以及物品与物品之间的高阶关联, E是通过超图卷积后得到的用户和物品的高阶嵌入表示。为了在超图卷积过程中融入更多的用户交互信息,将行为交互图中学习到的嵌入注入到超图学习过程中。 其次,为了保持行为交互图学习的独立性,采用停止梯度策略来确保从特定行为交互图学习到特定行为超图学习的单向信息传播。 第三,为了简化超图学习中的信息传播过程, 从超图卷积中删除了激活函数。
3.2.2 特定行为的嵌入聚合
通过从第𝑘行为特定交互图和行为特定超图学习到的用户和项目的嵌入,将它们集成以获得相应的行为特定嵌入:
3.3 行为一致性引导的对比学习(参考MBSSL)
3.3.1 行为间一致性对比学习
捕捉不同类型行为之间的共享信息,确保不同行为下的用户和物品嵌入与全局嵌入保持一致,从而更好地反映用户的综合兴趣。正样本对是相同用户或物品在全局图和某一行为图下的嵌入对。不同用户或物品在全局图和某一行为图下的嵌入对。InfoNCE 损失:
用户端的对比损失由多个行为累加,和MBSSL一样,正负样本对不一样。
3.3.2 行为内一致性对比学习
捕捉同一行为下交互图和超图之间的内在一致性,确保同一行为下不同图视图的嵌入保持一致,从而增强模型对该行为特定信息的理解。正样本对是同一用户或物品在交互图视图和超图视图下的嵌入,负样本对是不同用户或物品在交互图视图和超图视图下的嵌入对:
也是最终的行为内对比学习由用户和项目端累加,这是针对行为和超图的,还有行为和全局图的:
3.4 预测与优化
通过从其他行为中提取信息,增强当前行为的用户和物品表示,从而更准确地反映用户的兴趣偏好,注意力机制:
接着从全局和局部两个角度整合用户和物品的表示,以获得更全面的嵌入表示:
接着进行预测:
4 实验部分
5 总结
针对每个行为使用lightgcn,并生成超图,以级联的方式进行编码。在对比学习部分分为行为间和行为内,行为间有两个对比损失,分别是全局图和单个行为图,以及单个行为图和超图。行为内是超图和单个行为图,最后聚合的时候使用了注意力。