WWW23-多行为级联|级联图卷积网络的多行为推荐

news2024/12/25 3:24:06

 论文:https://arxiv.org/abs/2303.15720

 代码:https://github.com/SS-00-SS/MBCGCN

这篇论文MB-CGCN和上一篇CRGCN是同一个团队的,都是级联的方式。一个用了残差,一个用了特征转换,文章最后有discussion讨论了两者的不同,期刊到会议,改动了一部分。MB-CGCN是引用了CRGCN,CRGCN的帖子:TOIS23-多行为级联|用于多行为推荐的级联残差图卷积网-CSDN博客

1 动机

首先再次说一下CRGCN的动机:

1 挖掘行为之间的关联和顺序依赖:大多数现有方法主要是将不同类型的行为独立地建模,然后再将这些独立的表示进行融合,忽视了不同行为之间存在的内在关联和顺序依赖。例如,用户的“浏览”行为通常会引导到“点击”行为,而“点击”行为又可能进一步引导到“加入购物车”或“购买”行为。这种行为序列中的依赖关系和信息传递对于准确捕捉用户偏好具有重要意义。然而,现有方法未能在嵌入学习过程中充分利用这些行为间的关联信息,导致用户偏好建模不够全面。

2 模型复杂度较高:为了提高推荐准确性,现有的多行为推荐模型通常引入了复杂的模型结构和更多的参数。例如,使用多层神经网络、注意力机制等高级技术来分别处理不同类型的行为数据。不仅增加了模型的空间和时间复杂度,还导致训练过程更加耗时和资源密集。在实际应用中,推荐系统的效率同样至关重要,一个既能保持高推荐准确性又具备低复杂性和高效率的模型更具应用价值。

那么在此基础上,MB-CGCN:

1:考虑到直接使用输出嵌入作为下一个 GCN 的输入嵌入可能会注入噪声或误导性信息来误导学习过程。

2:考虑到在真实场景中,用户可能会直接跳转一两个行为到最终行为。 


2 贡献

  • 提出了具有级联图卷积网络的多行为推荐模型(MB-CGCN),由一系列 GCN 块组成,每个块对应于行为链中的一个行为( LightGCN)。

  • 不同的是:考虑到噪声问题,设计了特征转换来在传递之前处理嵌入,显式地利用链中的行为依赖关系来直接促进后续行为中的嵌入学习。 最后,从不同行为中学习到的嵌入被聚合以用于最终的行为预测。MB-CGCN 在优化时没有采用多任务学习。 它仅使用目标行为作为监督信号,专注于优化目标行为的预测性能,使得嵌入向量更有效地反映用户对物品的最终偏好。


3 MB-CGCN

模型上来看,还是相似的,去除了残差连接以及多任务。

3.1 嵌入初始化

将离散的用户和物品ID转换为连续的向量表示的过程。这些嵌入向量将作为后续模型学习的基础。

𝑷 ∈ R𝑀×𝑑 和 𝑸 ∈ R𝑁×𝑑 为用户和项目嵌入初始化的嵌入矩阵,其中 𝑀 和 𝑁 分别表示用户和项目的数量; 𝑑 表示嵌入大小,嵌入矩阵 𝑷 和 𝑸 是模型中唯一可学习的参数。

3.2 级联GCN

从各个单一行为中提取用户偏好,并捕捉不同行为之间的级联关系,以全面学习用户偏好。将初始化的用户和物品嵌入作为基本特征,通过利用每种行为学习到的行为特征,逐步细化和优化嵌入表示。

3.2.1 单行为建模

使用lightgcn进行迭代聚合,更新单行为下的用户和项目的嵌入:

​最终的嵌入聚合:

3.2.2 特征转换(不同的地方,没用残差)

交互中所有不同类型的行为都或多或少地揭示了用户的偏好。 在行为链中,后一个行为通常比前一个行为表现出更强的信号或更准确的用户偏好。 然而,直接使用前一个行为的特征作为初始化嵌入可以被视为使用后一个行为对嵌入的细化,这可能会丢失不同行为传达的多样化信息。 另一方面,前一个行为中的噪声信息可能会对后一个行为的学习过程产生严重的负面影响。因此使用特征转换以在下一个行为之前处理学习到的嵌入:

𝑾表示转换向量,特征转换可以有效地提取有用的特征,以促进下一个行为的嵌入学习。(实验分析有证明)

3.2 多行为聚合

将从所有行为中学习到的嵌入进行聚合以进行预测。 这项工作的主要重点是研究按一定顺序利用多种行为的依赖结构进行推荐的潜力:

 3.3 预测与训练:

采用成对学习策略进行模型优化:


 4 讨论

MB-CGCN 与 CRGCN 在如何将嵌入从一个行为传递到下一个行为上有根本的不同。 CRGCN 精心设计了一个残差连接,以保留先前的行为特征作为下一个行为网络的初始化嵌入。 通过这种方式,它通过链中的所有行为逐渐细化用户和项目嵌入来学习用户和项目嵌入。 从最后的行为中学到的嵌入直接用于预测。 因此,从早期行为(例如点击)中学习到的嵌入质量对最终性能有很大影响。 由于早期的行为不是确定性的并且通常是有噪声的,因此在此类行为中使用高阶传播进行嵌入学习不可避免地会给嵌入带来更多的噪声。 这也解释了为什么CRGCN在辅助行为中只使用一层传播(gcn层数为1)。 相反,MB-CGCN采用特征转换来提取有用信息,用于下一个行为的嵌入学习。

实验分析:为了评估特征聚合的实用性,将 CRGCN 与实验中的两个变体进行比较:

• w/o agg.:该变体删除了MB-CGCN中的特征聚合模块。 这意味着从最后一个 GCN 块学习到的嵌入直接用于目标预测。

• w/o  concat.:此变体用串联操作替换聚合。 具体来说,将从每个行为中学习到的用户和项目嵌入连接在一起以进行目标预测。

通过特征转换,当将从第一个行为学习到的嵌入传递到目标行为时,从辅助行为学习到的一些特征将被过滤。 它还将鼓励模型从每种行为中学习不同的特征。 因此,为了充分利用多种行为,CRGCN考虑所有行为特征非常重要。 为了简单起见,在实验中仅比较线性组合(w. agg)和嵌入串联(w. concat.)。 根据经验,W. agg 的性能比 w 好得多。 concat. 还可以应用更复杂的融合方法(例如注意力网络),这将在未来的研究中进行探索。​


5总结

也是级联的方法,期刊到会议,改了残差以及模型训练的部分。因为作者设计的模型是降低复杂度的,所以没用什么其他的方法,整个模型很简洁所以也改不了什么东西。我认为还是有很多地方值得去改进的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2265051.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【day16】Java开发常用API

模块15回顾 在深入探讨模块16之前,让我们回顾一下【day15】中的重点内容: String类: 构造方法:String(), String(String s), String(char[] chars), String(byte[] bytes), String(char[] chars, int offset, int count), String…

MLU运行Stable Diffusion WebUI Forge【flux】

文章目录 一、平台环境准备二、代码下载三、基础环境准备3.1 支援whl包 四、代码修改4.2 组件下载 六、运行效果 FLUX模型是由Black Forest Labs推出的一款文本生成图像的AI模型,具有120亿参数,显著提升了图像生成的质量和多样性‌。FLUX模型包含三个版本…

PPP - NCP协议

NCP协议是一个很多子协议构成的主要取决于网络层封装的什么协议比如 三层协议NCP协议ipIPCPIPv6IPv6CPMPLSMPLSCP NCP能够协商的内容包括: 1.网络层协议(ip?ipv6?MPLS?…)  2.协商地址 主要了解使用最多…

< Chrome Extension : TamperMonkey > 去禁用网页的鼠标的事件 (水文)

问题描述 在一个视频网站看视频,在播放视频时, 如果当鼠标移到视频外,只要有点击鼠标的动作,视频就会暂停播放(包括 Window 下的 其它 tab)。有种被打劫完财物,还被凌辱的感觉。 解决方案 使…

网络安全 | 常见的网络攻击类型及防范技巧全解析

网络安全 | 常见的网络攻击类型及防范技巧全解析 一、前言二、常见网络攻击类型2.1 网络扫描2.2 恶意软件攻击2.3 网络钓鱼2.4 拒绝服务攻击(DoS/DDoS)2.5 中间人攻击2.6 SQL 注入攻击2.7 跨站脚本攻击(XSS) 三、防范技巧3.1 网络…

CE第七次作业

1. for创建20用户 用户前缀由用户输入 用户初始密码由用户输入 例如:test01,test10 [rootServer ~]# vim add_user20.sh #!/bin/bash read -p "please input usernames prefix:" name_pre read -p "please input users passwd:" p…

了解反向传播算法

目录 一、说明 二、了解反向传播算法 三、定义神经网络模型 3.1 输入层 3.2 隐藏图层 3.3 输出层 四、前向传播和评估 五、反向传播和计算梯度 六、结束语 一、说明 梯度正向和反向传播,是神经网络的重要概念。其中包含的重要技巧是:1)复函数…

实力认可 | 通付盾入选《ISC.AI 2024创新能力全景图谱》五项领域

近日,ISC.AI 2024创新能力百强(以下简称“创新百强”)正式发布《ISC.AI 2024创新能力全景图谱》。该全景图谱是由政企、资本、高校、行业力量共同完成了领域划分、综合创新等标准的制定,整合梳理了参评的300余家数字安全厂商、120…

Web3.0安全开发实践:9个sCrypt智能合约开发的最佳实践

sCrypt是一种基于TypeScript的嵌入式领域特定语言(eDSL),专为在比特币链上编写智能合约而设计。sCrypt智能合约使用比特币支持的操作码,可以编译成Bitcoin Script。由此生成的类似汇编的脚本可用作交易中的锁定脚本。 本文将探讨…

新手SEO指南如何快速入门与提升网站排名

内容概要 搜索引擎优化(SEO)是提高网站可见度和排名的重要手段,尤其对新手来说,掌握其基本概念和实用技巧至关重要。本文将针对新手提供一系列的指导,帮助你快速入门并逐步提升网站排名。 首先,了解SEO的…

【EthIf-14】EthIfGeneral容器配置-02

1.实际EthIfGeneral的配置实例 关闭DET接口开启发送确认中断开启接收中断主周期接收timeout主周期 2. 代码实例参考 阅读此部分代码,搞清楚代码分为几个section,大概瞄一眼就好,不用深究其含义,只需有一个宏观的层次结构的映像即可。 //Appl/GenData/EthIf_Cfg.h #

‘pnpm’ 不是内部或外部命令,也不是可运行的程序或批处理文件。

‘pnpm’ 不是内部或外部命令,也不是可运行的程序或批处理文件。 1.情况: npm -v 和 node -v的都正常就是 pnpm-v 无效 检查环境变量也没看出问题 2.分析 没有正确添加环境变量 3.解决 找到npm的全局安装目录 npm list -g --depth 0这里出现了npm的全局安装…

Docker 部署 SpringBoot VUE项目

是一套基于若依的wms仓库管理系统 一、后端部署 后端地址:https://gitee.com/zccbbg/wms-ruoyi/tree/v1/ 1、用IDEA拉代码,并修改API统一后缀 2、复制一个配置文件 application-dev.yaml,并修改里面的mysql与redis配置 3、将打包的jar上传…

面试基础篇---迭代器,yield, tcp, 等

1.谈谈python的装饰器,迭代器,yield? 迭代器在内存中通常是一次性遍历的,也就是说,一旦遍历完所有元素,它就会停止工作,不可再用。 惰性计算:生成器按需生成数据,即只有在…

【文档搜索引擎】搜索模块的完整实现

调用索引模块,来完成搜索的核心过程 主要步骤 简化版本的逻辑: 分词:针对用户输入的查询词进行分词(用户输入的查询词,可能不是一个词,而是一句话)触发:拿着每个分词结果&#xf…

帝国cms灵动标签调用相关文章

帝国cms相关文章调用的方法很多,官方默认调用方法是使用标签 [!--other.link--] 那么内容页调用相关文章,什么时候用到灵动标签呢 答案是调用同类型的文章,比如有相同关键词或者相同tags标签的文章 使用灵动标签是如何调用的呢&#xff0…

低空经济的地理信息支撑:构建安全、高效的飞行管理体系

随着无人机等低空飞行器的广泛应用,低空空域管理的重要性日益凸显。地理信息技术作为低空空域管理的重要支撑,对于保障低空经济的健康发展具有不可替代的作用。 地理信息技术在低空空域管理中的作用 地理信息技术在低空空域管理中扮演着关键角色&#x…

一体式IO模块:打印机加工产线国产化降本增效的新利器

在当今全球化的市场竞争中,打印机制造行业面临着前所未有的挑战与机遇。为了提升生产效率、降低成本,并加速国产化进程,各大打印机制造商纷纷寻求技术创新与升级。明达技术自研推出的MR20一体式IO模块作为工业自动化领域的核心组件&#xff0…

「下载」智慧产业园区-数字孪生建设解决方案:重构产业全景图,打造虚实结合的园区数字化底座

数字孪生技术作为一种创新的管理工具,正逐步展现出其在智慧园区建设中的重要意义。以下将从几个方面详细阐述数字孪生在智慧园区建设中的关键作用。 一、提升园区运营管理的智能化水平 数字孪生技术通过构建园区的虚拟镜像,实现了对园区物理世界的全面…

ICASSP 2025 中了 ,不去印度参会就撤稿?

近日,ICASSP 2025正式放榜,身边很多同学都收到了好消息,虽然目前官方还没有给出正式的数据,但据知情人士透露,今年的投稿编号超过8000,可以说是创造了历史新高,预测整体录取率在46%左右。 根据…