【传知代码】疯狂交互学习的BM3推荐算法(论文复现)

news2025/1/16 2:42:06

在当今信息爆炸的时代,我们每天接触的数据量已经超出我们大脑的处理能力。在这个背景下,个性化推荐系统以其独特的能力和智能化的算法引起了广泛关注。其中,基于行为的推荐系统成为了引领潮流的前沿技术之一,本文将深入探讨疯狂交互学习(Crazy Interactions)背景下的BM3推荐算法。

本文所涉及所有资源均在传知代码平台可获取

目录

概述

损失函数

实验分析

写在最后


概述

        多模态推荐系统是一种利用多种不同类型的数据源(例如文本、图像、视频、音频等)来进行推荐的系统。传统的推荐系统通常只依赖于单一模态的数据,例如用户的评分或点击行为,而多模态推荐系统则结合了来自多个模态的信息,从而可以提供更准确和个性化的推荐。其具有以下优点:

1)提高推荐准确性:通过结合多种数据源,可以更全面地了解用户的偏好。

2)丰富的用户体验:多模态数据可以为用户提供更多样化的推荐内容。

3)处理冷启动问题:在用户数据不足的情况下,可以利用其他模态的数据进行推荐。

假设我们有一个电商平台,用户在平台上浏览和购买商品。我们可以使用以下多模态数据来构建推荐系统:

文本:商品的描述和用户的评论;图像:商品的图片;行为:用户的点击和购买记录。

对比学习是一种自监督学习的方法,通过学习样本之间的相似性和差异性来学习数据的有用表示。目标是使得相似的样本在表示空间中更接近,不相似的样本更远离。其关键思想:

1)正样本对 (Positive Pairs):具有相似特征的样本对。

2)负样本对 (Negative Pairs):具有不同特征的样本对。

3)损失函数:通过最小化正样本对之间的距离,最大化负样本对之间的距离来训练模型。  优点

4)无需大量标注数据:对比学习可以在无监督环境中工作。

5)提升特征表达能力:通过对比学习,模型可以学习到更有辨别力的特征。

自监督学习是一种无监督学习的方法,通过生成伪标签来进行训练。模型利用自身的数据生成训练信号,而不是依赖外部的标签数据。自监督学习的目标是通过设计预训练任务,使模型能够学习到数据的有用表示。其优点如下:

1)减少对标签数据的依赖:不需要大量的人工标注数据。  

2)学习到通用特征:通过预训练任务,模型可以学习到适用于多个下游任务的通用特征。

实现自监督学习的方法 ,常见的自监督学习方法包括:图像领域:通过图像旋转、遮挡、拼图等任务来生成伪标签;文本领域:通过词汇预测、句子排序等任务来生成伪标签。

除了用户-项目交互图之外,现有的最先进的方法通常使用辅助图(例如,用户-用户或项目-项目关系图),以增强所学习的用户和/或项目的表示。这些表示通常使用图卷积网络在辅助图上传播和聚合,这在计算和存储器方面可能非常昂贵,特别是对于大型图。

现有的多模态推荐方法通常利用贝叶斯个性化排名(BPR)损失中随机抽样的否定示例来指导用户/项目表示的学习,这增加了大型图上的计算成本,并且还可能将噪声监督信号带入训练过程。解决方案如下:

1)自监督学习的应用:BM3 提出了一个新的自监督学习模型,不需要使用负样本或复杂的图增强技术。这简化了现有的自监督学习框架,减少了模型参数。

2)Dropout 增强机制:通过 dropout 增强生成用户和项目的对比视图,而不是通过图或图像增强。这种设计减少了内存和计算成本。

3)多模态对比损失函数:设计了一个专门用于多模态推荐的对比损失函数,该函数在重建用户-项目交互图的同时对齐不同模态之间的特征,并减少来自同一模态的不同增强视图之间的差异。

下面框架图展示了BM3模型的结构,包括几个关键部分。首先是"Backbone Network"(骨干网络),它接收用户和物品的ID嵌入,并生成初始嵌入表示 huhu​ 和 hihi​。然后,这些嵌入与物品的视觉特征和文本特征通过投影网络 fvfv​ 和 ftft​ 进行处理,生成图像和文本的嵌入表示 hvhv​ 和 htht​。接下来,“Contrastive View Generator”(对比视图生成器)通过增强技术生成这些嵌入的对比视图(例如 h~uh~u​、 h~ih~i​、 h~vh~v​、 h~th~t​),并应用于三个损失函数。“Graph Reconstruction Loss” LrecLrec​ 通过对比用户和物品嵌入及其对比视图来增强嵌入表示的鲁棒性和泛化能力;“Inter-modality Feature Alignment Loss” LalignLalign​ 通过对比不同模态(例如图像和文本)的嵌入和对比视图,促进跨模态的一致性;“Intra-modality Feature Masked Loss” LmaskLmask​ 通过对比同一模态内部的嵌入和对比视图,进一步增强单模态的鲁棒性。最终,这些损失函数的加权和形成了整体的多模态对比损失 LL,优化模型以提升推荐系统的性能:

损失函数

        图重构损失:假设用户uu对项目ii有正反馈,那么huhu​和hihi​应该有较高的相似度。通过对比学习,如果huhu​与hi′hi′​(项目的对比视图)也有较高的相似度,这表明模型对项目特征的变化(如视图变化、噪声)具有鲁棒性。新用户u′u′可能没有与很多项目交互过,但如果hu′hu′​(用户的对比视图)与某些项目的嵌入hihi​保持相似性,那么模型可以根据hu′hu′​推荐相关的项目ii。类似地,新项目i′i′可能没有很多用户交互数据,但如果hi′hi′​(项目的对比视图)与某些用户的嵌入huhu​保持相似性,那么模型可以根据hi′hi′​推荐给相关的用户uu。如果模型只学习huhu​和hihi​的相似性,可能会导致模型只记住某些用户-项目对,而无法泛化到其他用户-项目对。通过对称的损失,即huhu​和hi′hi′​以及hihi​和hu′hu′​的相似性,模型必须学习更广泛的特征,从而减少模式崩溃的风险。

1)增强鲁棒性:通过对比学习,模型需要在不同的增强视图之间保持一致性,这使得模型对噪声和变动具有更强的鲁棒性。用户的嵌入和项目的对比视图之间的一致性可以防止模型过拟合到特定的用户-项目对。
2)促进泛化能力:通过对比用户和项目的对比视图嵌入,模型能够学习到更通用的特征表示。这使得模型在面对新的数据或未见过的用户-项目对时,仍然能够保持较好的性能。
3)减少模式崩溃:在对比学习中,如果只关注正例对的相似性,可能会导致模式崩溃(模式崩溃指的是模型只记住了特定的模式而未能学习到通用的特征)。通过对称的对比视图嵌入损失,可以有效防止模式崩溃。

        模态间对齐损失:相当于Item是标签,这些Text和Image是特征,相互学习的过程,把Text赋予标签信息,然后在Item里面增加更多的Text和Image的特征信息,同时由于Dropout可以保证学习的不崩溃:

1)统一性和稳定性:项目(item)的嵌入表示相对于用户(user)的嵌入表示更为稳定和统一。用户的行为和兴趣可能会随时间和情境发生变化,而项目的特征相对固定,因此使用项目嵌入可以提供更稳定的对齐基础。
2)多视图一致性:多视图特征表示 $ h_m’ $ 是从不同模态(如文本、图像、音频等)中提取的。这些特征通常描述的是项目的不同方面,因此使用项目的嵌入来对齐多视图特征可以确保不同模态下的项目特征一致性。
3)提高泛化能力:使用项目嵌入来对齐多视图特征可以帮助模型更好地捕捉项目的多模态特性,从而提高模型在处理多模态推荐任务时的泛化能力。这意味着模型可以更好地理解和推荐多种类型的项目,即使在用户行为发生变化时,模型仍然能够提供有效的推荐。

        模态内特征遮蔽损失:计算单模态特征屏蔽损失:将上述两个余弦相似度的负值求和,得到最终的单模态特征屏蔽损失:Lintra=−(cos(hv,hv′)+cos(ht,ht′))Lintra​=−(cos(hv​,hv′​)+cos(ht​,ht′​))假设图像 v 经过数据增强(如旋转、裁剪等)后生成对比视图 v’。通过使hv和 hv’ 具有高相似度,模型可以更好地应对图像中的噪声和变动,保证图像嵌入的一致性。如果模型能够在不同的图像视图(如不同的拍摄角度或光照条件)之间保持一致性,那么当遇到新的图像时(如不同场景或对象),模型也能够有效地提取相关特征。如果模型只学习原始图像的特征,可能会过拟合到特定的图像内容或风格。而通过对比原始图像和其增强视图,模型必须学习更通用的图像特征,从而减少模式崩溃的风险。

增强单模态的鲁棒性:通过对比学习,模型需要在同一模态内的不同视图之间保持一致性,这使得模型在面对该模态的数据变动时具有更强的鲁棒性。

促进模态内的泛化能力:通过对比单模态内的嵌入表示和对比视图,模型能够学习到更通用的特征表示。这使得模型在面对同一模态的新的数据时,仍然能够保持较好的性能。

减少单模态的模式崩溃:在单模态的对比学习中,如果只关注单一视图的特征,可能会导致模式崩溃(即模型只记住了特定的模式而未能学习到通用的特征)。通过对比视图嵌入损失,可以有效防止模式崩溃。

实验分析

环境部署:git clone https://github.com/enoche/BM3.git ;

环境配置:pip install -r requirements.txt ;conda install --file requirements.txt

数据集配置:通过这个地址–>dataset下载> baby\elec\sports这三个数据集,然后将这些文件放入源码的data文件夹下。

代码运行:进入到src目录下:cd .\src;然后执行命令,-m 代表模型的名称 -d 代表数据集名称python main.py -m BM3 -d baby,结果如下:

下面这部分通过在不同模态不同视图之间进行Loss,可以实现论文中的Loss创新,并且框架中Dropout也在该部分,具体分析均在以下代码的注释当中:

    def calculate_loss(self, interactions):
        # online network
        u_online_ori, i_online_ori = self.forward()
        t_feat_online, v_feat_online = None, None
        if self.t_feat is not None:
            t_feat_online = self.text_trs(self.text_embedding.weight)
        if self.v_feat is not None:
            v_feat_online = self.image_trs(self.image_embedding.weight)

        with torch.no_grad():  # 停止梯度更新,这样在下面的操作中不会计算梯度,节省内存和计算资源
            u_target, i_target = u_online_ori.clone(), i_online_ori.clone()  # 复制在线用户和物品的原始特征向量
            u_target.detach()  # 分离用户目标特征向量,使其不参与梯度计算
            i_target.detach()  # 分离物品目标特征向量,使其不参与梯度计算
            u_target = F.dropout(u_target, self.dropout)  # 对用户目标特征向量应用Dropout,生成用户对比试图
            i_target = F.dropout(i_target, self.dropout)  # 对物品目标特征向量应用Dropout,生成物品对比试图

            if self.t_feat is not None:  # 检查时间特征是否存在
                t_feat_target = t_feat_online.clone()  # 复制时间特征向量
                t_feat_target = F.dropout(t_feat_target, self.dropout)  # 对时间特征向量应用Dropout,生成image对比试图
            if self.v_feat is not None:  # 检查image特征是否存在
                v_feat_target = v_feat_online.clone()  # 复制image特征
                v_feat_target = F.dropout(v_feat_target, self.dropout)  # 对image特征向量Dropout,生成text对比试图

        # 预测用户和物品的在线特征向量
        u_online, i_online = self.predictor(u_online_ori), self.predictor(i_online_ori)

        # 获取交互数据中的用户和物品索引
        users, items = interactions[0], interactions[1]

        # 根据用户和物品索引提取相应的在线特征和目标特征
        u_online = u_online[users, :]  # 提取在线用户特征
        i_online = i_online[items, :]  # 提取在线物品特征
        u_target = u_target[users, :]  # 提取目标用户特征
        i_target = i_target[items, :]  # 提取目标物品特征

        # 初始化各类损失为0
        loss_t, loss_v, loss_tv, loss_vt = 0.0, 0.0, 0.0, 0.0

        if self.t_feat is not None:  # 检查时间特征是否存在
            t_feat_online = self.predictor(t_feat_online)  # 通过预测器更新在线时间特征
            t_feat_online = t_feat_online[items, :]  # 提取更新后的在线时间特征
            t_feat_target = t_feat_target[items, :]  # 提取目标时间特征
            # 计算时间特征和物品目标特征的余弦相似度损失
            loss_t = 1 - cosine_similarity(t_feat_online, i_target.detach(), dim=-1).mean()
            # 计算时间特征和目标时间特征的余弦相似度损失
            loss_tv = 1 - cosine_similarity(t_feat_online, t_feat_target.detach(), dim=-1).mean()

        if self.v_feat is not None:  # 检查视觉特征是否存在
            v_feat_online = self.predictor(v_feat_online)  # 通过预测器更新在线视觉特征
            v_feat_online = v_feat_online[items, :]  # 提取更新后的在线视觉特征
            v_feat_target = v_feat_target[items, :]  # 提取目标视觉特征
            # 计算视觉特征和物品目标特征的余弦相似度损失
            loss_v = 1 - cosine_similarity(v_feat_online, i_target.detach(), dim=-1).mean()
            # 计算视觉特征和目标视觉特征的余弦相似度损失
            loss_vt = 1 - cosine_similarity(v_feat_online, v_feat_target.detach(), dim=-1).mean()

        # 计算用户在线特征和物品目标特征的余弦相似度损失
        loss_ui = 1 - cosine_similarity(u_online, i_target.detach(), dim=-1).mean()
        # 计算物品在线特征和用户目标特征的余弦相似度损失
        loss_iu = 1 - cosine_similarity(i_online, u_target.detach(), dim=-1).mean()

        # 返回总损失,包括余弦相似度损失、正则化损失和对比损失
        return (loss_ui + loss_iu).mean() + self.reg_weight * self.reg_loss(u_online_ori, i_online_ori) + \
            self.cl_weight * (loss_t + loss_v + loss_tv + loss_vt).mean()

写在最后

本文深入探讨了疯狂交互学习(Crazy Interactions)背景下的BM3推荐算法,这一算法以其创新性和效果在个性化推荐领域引起了广泛关注。我们从算法的基本原理出发,详细分析了其如何利用用户的动态行为数据实现更精准的推荐结果。

首先,我们讨论了BM3算法如何解决传统推荐系统中的冷启动和长尾问题,通过实时捕捉用户行为变化,提升了推荐的准确性和个性化水平。其次,我们探索了算法背后的机制,包括多元化特征的整合和动态权重调整,这些都为提升用户体验和平台效果提供了坚实的理论基础。

此外,本文还分析了BM3算法在实际应用中的成功案例,并探讨了其可能的未来发展方向。随着数据技术的进步和用户需求的变化,BM3算法有望继续在推荐系统领域发挥重要作用,为用户提供更加智能和个性化的服务。

总之,疯狂交互学习的BM3推荐算法不仅是推荐系统技术的重要进步,更是信息时代个性化服务的典范。它的应用和研究将继续推动我们对用户需求理解和满足的能力,为数字化社会的发展开辟新的可能性。

详细复现过程的项目源码、数据和预训练好的模型可从该文章下方附件获取。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1972591.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

未来已来:AI在提升企业客户服务质量与效率中的应用

随着人工智能(AI)技术的飞速发展,其在企业客户服务领域的应用正以前所未有的速度改变着我们的服务模式。AI技术的引入,不仅极大地提升了客户服务的效率,还显著提高了客户满意度,为企业创造了新的竞争优势。…

【kubernetes】kubeadm部署k8s集群

1、环境准备 master01: 192.168.10.25master02: 192.168.10.26master03: 192.168.10.27node01: 192.168.10.28node02: 192.168.10.29负载均衡器1:192.168.10.30负载均衡器2:192.168.10.31 //所有节点,关闭防火墙规则,关闭selinu…

秋招突击——算法训练——8/1——用友集团笔试

文章目录 引言正文小友的生产线个人实现参考实现 小友策划游戏人物个人实现参考实现 最佳工作任务安排个人实现参考实现 大众评分最高的一次旅程 总结 引言 今天晚上七点钟到九点钟是用友集团的笔试,作为今天算法练习的主要内容!具体怎么样,…

MinIO DataPod:百亿亿次级计算的参考架构

现代企业通过其数据来定义自己。这需要用于 AI/ML 的数据基础设施,以及作为现代数据湖基础的数据基础设施,该数据基础设施能够支持商业智能、数据分析和数据科学。如果他们落后、起步或使用 AI 获得高级见解,则情况确实如此。在可预见的未来&…

又一个GPT4级的模型免费了?MiniMax史诗级更新

又有一个超性价比的国产大模型出现了!这里是智匠AI,MiniMax刚刚对他们的主力模型abab6.5s,进行了大幅降价,输入和输出成本都达到了1元/百万tokens。我们今天就来进行评测这款abab6.5s。 abab6.5s在文科任务、内容理解、文字生成及…

WebKit引擎:探索现代网页渲染的幕后魔法!

WebKit 是一个开源的浏览器引擎,它负责解析和渲染网页内容,包括HTML、CSS和JavaScript。WebKit的工作流程涵盖了加载资源、解析文档、应用样式、布局渲染树等一系列步骤,最终将网页内容呈现在用户的屏幕上。 WebKit简介 WebKit是一个开源的浏…

Python在气象与海洋中的应用

Python是功能强大、免费、开源,实现面向对象的编程语言,能够在不同操作系统和平台使用,简洁的语法和解释性语言使其成为理想的脚本语言。除了标准库,还有丰富的第三方库,并且能够把用其他语言(C/C、Fortran…

Python SyntaxError: unexpected EOF while parsing

Python SyntaxError: unexpected EOF while parsing 在Python编程中,SyntaxError: unexpected EOF while parsing是一个常见的错误,通常发生在Python解释器在源代码中找到意外的文件结尾(EOF,即End Of File)时。这个错…

大模型LLM关键技术手段

大语言模型(LLM)是人工智能领域的一个突破性进展,它通过多种技术手段实现对自然语言的理解和生成。用比较通俗的话来列举一些我认为比较关键的技术手段: 深度学习技术:就像我们通过不断学习来掌握知识一样,…

SRM供应商管理系统有哪些实际用处?

随着供应商数量的不断增加,订单处理的复杂性与日俱增,传统的采购模式让订单的生成、跟踪到交货的每一个环节都可能成为潜在的瓶颈。在这样的背景下,SRM供应商管理系统的出现,为采购商提供了一个全面、高效的解决方案。 我想以真实…

白盒测试基础与实践:Python示例及流程图设计

文章目录 前言一、白盒测试是什么?主要特点常用方法优点缺点 二、白盒测试常用技术语句覆盖判定覆盖条件覆盖判定/条件覆盖条件组合覆盖路径覆盖 三、程序流程图设计四、测试用例设计1. 基本路径法2. 语句覆盖3. 判断覆盖4. 条件覆盖5. 判断/条件覆盖6. 条件组合覆盖…

【传知代码】基于图的去中心化社会推荐过滤器(论文复现)

在当今信息爆炸的时代,社交媒体和数字平台已经成为我们获取信息、交流观点以及发现新内容的主要途径。然而,随着内容数量的剧增,用户面临着信息过载和质量参差不齐的挑战。为了解决这一问题,基于图的去中心化社会推荐过滤器应运而…

AIR 调用 Python 脚本的解决方案

1. 问题背景 在 AIR 1.5 中,无法直接调用系统命令或运行可执行文件(如 Python 解释器)。 2. 解决方案 由于安全限制,AIR 应用程序无法直接调用系统命令或运行可执行文件。因此,以下解决方案仅适用于能够共享详细信息…

【传知代码】LAD-GNN标签注意蒸馏(论文复现)

近年来,随着图神经网络(GNN)在各种复杂网络数据中的广泛应用,如何提升其在大规模图上的效率和性能成为了研究的热点之一。在这个背景下,标签注意蒸馏(Label Attention Distillation,简称LAD&…

分包—小程序太大,上传不上去,采用分包处理方式

在 app.json 中配置 subpackages 字段来定义分包。创建分包目录如左边红框。例如:

[Meachines] [Easy] Mirai Raspberry树莓派默认用户登录+USB挂载文件读取

信息收集 IP AddressOpening Ports10.10.10.48TCP:22,53,80,1276,32400,32469 $ nmap -p- 10.10.10.48 --min-rate 1000 -sC -sV PORT STATE SERVICE VERSION 22/tcp open ssh OpenSSH 6.7p1 Debian 5deb8u3 (protocol 2.0) | ssh-hostkey: | 1024 aa:ef:5c:…

vue-cli3脚手架详细讲解 基于webpack

1.安装vue3:新建一个文件夹,进入该文件夹下,执行 vue create ( 项目名称) , 如下图: vuecli3为项目名称,进入下一步, 我们选择第3个,进入下一步 这里要我们选择一个配置,按住上下键进行调转&a…

240802-Python代码混淆及加密的一些工具

1. 有哪些开源免费的工具,可以对Python代码加密 加密Python代码可以通过多种方法实现,尽管这些方法主要是为了保护代码不被轻易阅读或修改,但无法完全防止逆向工程。以下是一些开源免费的工具和方法,可以用于加密Python代码&…

聊聊ChatGLM-6B的源码分析

基于ChatGLM-6B第一版,要注意还有ChatGLM2-6B以及ChatGLM3-6B PrefixEncoder 作用:在微调时(以P-Tuning V2为例),方法训练时冻结模型的全部参数,只激活PrefixEncoder的参数。 其源码如下,整体来…