联邦学习与推荐系统

news2025/1/10 20:47:21

[Personalized Federated Recommendation via Joint Representation Learning, User Clustering, and Model Adaptation]
(https://dl.acm.org/doi/abs/10.1145/3511808.3557668)

CIKM2022(CCF-B)

论文精读

Abstract

在这里插入图片描述

  • 联邦推荐的背景:联邦推荐使用联邦学习技术在推荐系统中来保护用户隐私。它通过在用户设备和中央服务器之间交换模型,而不是原始用户数据,来实现这一点。
  • 用户属性和数据的异构性:由于每个用户的属性和本地数据可能都有所不同,因此为了提高联邦推荐的性能,获得针对每个用户的个性化模型是关键。
  • PerFedRec框架:文章提出了一个基于图神经网络的个性化联邦推荐框架(PerFedRec)。这个框架通过联合表示学习、用户聚类和模型适应来实现其目的。
  • 构建协同图并整合属性信息:具体来说,框架首先构建一个协同图,然后融合属性信息,以通过联邦GNN联合学习表示。
  • 基于表示的用户聚类:一旦学到了这些表示,就可以将用户聚类到不同的用户组中,并为每个聚类学习个性化模型。
  • 用户的个性化学习:每个用户会通过结合全局联邦模型、集群级联邦模型和用户的微调本地模型来学习一个个性化模型。
  • 减轻通信负担:为了减少沉重的通信负担,系统聪明地选择了每个集群中的一些代表性用户(而不是随机选择的用户)来参与训练。
  • 实验结果:在真实世界的数据集上的实验结果表明,提出的方法在性能上超过了现有的方法
    总之,这篇文章提出了一个新的联邦推荐框架,该框架结合了图神经网络、用户聚类和模型适应技术,旨在提高推荐的性能,同时也注重保护用户隐私。

Introduction

在这里插入图片描述
在这里插入图片描述

  • 联邦推荐的目标:联邦推荐旨在帮助用户筛选有用的信息,同时保护用户的个人数据隐私。
  • 联邦推荐的工作原理:根据联邦学习的原则,联邦推荐在用户设备和中央服务器之间交换模型,而不是原始的用户数据。
  • 联邦推荐的应用:这种分布式学习范式已经被应用于内容推荐、移动众包任务推荐和自动驾驶策略推荐等领域。
  • 现有方法的限制:尽管有一些经典的推荐算法已经被扩展到联邦设置中(如联邦协同过滤、联邦矩阵分解和联邦图神经网络),但这些方法有两个主要缺点:
    • 一是它们为所有用户提供相同的推荐,忽略了用户的异构性(例如数据分布的非独立同分布性和不同的计算资源水平)。
    • 二是它们需要与众多用户进行频繁杂的模型交换,导致高通信成本。

PerFedRec框架:为了解决上述问题,文章提出了一个基于图神经网络的联邦推荐框架 - PerFedRec。该框架从用户/项目的属性和协同信息中学习表示,并通过GNN将用户划分为不同的簇。每个簇都有一个簇级联邦推荐模型,而中央服务器有一个全局模型。通过结合簇级模型和全局模型,可以为每个用户提供个性化的推荐。减轻通信负担:此外,为了减轻通信负担,PerFedRec框架通过在每个簇中选择一部分代表性用户来更新全局模型,而不是所有用户。这种"用户退出"策略在通信受限的场景中(如自动驾驶策略推荐)非常有用。
总结和贡献:总的来说,文章的贡献可以归结为三点:表示学习、用户聚类和模型适应,这三者都是为了提供个性化的推荐。
所提出的框架主要做了以下三点工作:

  • 联合表示学习、用户聚类和模型适应:

    • 提出了一个框架,它在联邦推荐中结合了表示学习、用户聚类和模型适应。这是为了实现个性化的推荐,同时考虑到用户的本地数据和资源的多样性。
    • 通过使用图神经网络(GNN)学习用户的合作和属性信息,可以有效地聚类相似的用户,并学习个性化的模型。
  • 选取代表性用户:为了训练,从每个聚类中仔细挑选了一些代表性的用户。
    这种方法减少了与服务器之间的通信成本,特别适合带宽有限、延迟要求低的应用场景。

  • 改进现有基线的性能: 该提议的方法在多个真实世界的数据集上都提高了与现有技术基线相比的性能。
    在这里插入图片描述
    Problem Formultion
    系统构成:

  • 该系统包括一个中央服务器和N个分布式用户。 每个用户具有一个由dua维度组成的属性uₙ。
    系统中有M个项目,每个项目具有一个由dia维度组成的属性vₘ。

  • 用户与项目的交互:
    每个用户都有与项目的历史交互记录,例如给项目打分。 但由于隐私关注,中央服务器不能观察到用户的历史交互和属性。

  • 数据交换:
    由于上述隐私问题,与服务器之间的数据交换不包括用户数据。相反,只有推荐模型可以在服务器和用户设备之间交换。

我们提出的方案

  • 系统目标:在这些约束条件下,系统的目标是为不同的用户训练个性化的推荐模型。

在这里插入图片描述
在这里插入图片描述

这段论文描述了一个名为PerFedRec的推荐框架。以下是主要的点和组成部分:

  • PerFedRec框架概述:
    • 框架由两部分组成:
      • 用户端的端到端本地推荐网络
      • 服务器端的聚类聚合器
  • 用户端本地推荐网络:
  • 这个网络由三个主要模块组成:
    - a. 原始嵌入模块 (Raw Embedding Module):
    - 此模块预处理用户和项目的属性。 使用注意力机制,它结合属性信息与合作信息(即用户与项目的交互)。
    - 形式上,用户n和项目m的合作信息表示为一个d维的嵌入 E i d u , n E_{idu,n} Eidu,n E i d , i , m E_{id,i,m} Eid,i,m
    - 这些嵌入是随机初始化的,并在基于用户-项目交互的训练过程中进行更新。
    - 用户n和项目m的属性通过一个线性层和一个特征交叉层传递,以生成属性嵌入 E f u , n E_{fu,n} Efu,n E f i , m E_{fi,m} Efi,m
    - 数学上,属性嵌入的生成可以由以下公式表示:
    在这里插入图片描述
    在这里插入图片描述在这里插入图片描述

在这里插入图片描述

- b.局部GNN模块:
 - 当获取所有商品的嵌入和用户自己的嵌入后,系统需要用户-商品交互矩阵来训练局部GNN模型。
 - 但是,存在一个问题:用户-商品交互信息是私有的本地数据,不应被与服务器或其他用户分享。
  • 解决隐私问题:

  • 为了解决上述隐私问题,作者采用了一个与文献[17]类似的方法:

    • 每个用户上传受保护的嵌入和经过加密的商品ID(使用对所有用户相同的加密方式)。
    • 然后服务器将加密的商品ID和用户嵌入发送给所有用户。
    • 为了进一步减少通信成本,服务器只将加密的商品ID和与该商品交互过的其他用户的嵌入发送给某个用户。
  • 因此,每个用户能够得到多个用户的嵌入信息以及对应的商品,而不暴露这些用户的身份。这样,每个用户可以探索其周围的用户和商品,从而扩展其本地交互图。

  • GNN模块的输出:
    在这里插入图片描述

  • 应用嵌入:
    这些嵌入将被输入到一个个性化预测网络中,用于进行评分或偏好预测。这种策略提供了插件,并使用了GNN模块,如PinSage[18]、NCF[16]和LightGCN[8]。

在这里插入图片描述在这里插入图片描述

- C.个性化预测模块

在这里插入图片描述
这段文本描述了一个推荐系统中的个性化预测模块。这个模块结合了用户特定的模型集群级模型全局模型,以实现更为个性化的推荐。

服务器端基于聚类的联邦模块

在这里插入图片描述
在这里插入图片描述
这部分论文详细描述了“Server-Side Clustering Based Federation”模块,即服务器端基于聚类的联邦模块。以下是对该部分的解读:

  • 主要功能:这个服务器端的联邦模块有三个主要功能:用户聚类、用户选择和参数聚合

  • 用户聚类(User Clustering):

    • 基于用户嵌入 E u , n E_{u,n} Eu,n,服务器将用户聚类成 K 个组。
    • 用户 n 归属于某个特定的集群 C ( n ) C(n) C(n)
    • 聚类方法可以是任何常用的方法,如K-means。
    • 由于节点表示 E u , n E_{u,n} Eu,n是基于每个用户的属性和协作信息共同学习得到的,因此表示更加丰富。
  • 用户选择(User Selection):

    • 为了降低在关键情况下的通信成本,该框架提供了一个基于集群的用户选择功能。
    • 在每个集群内,可以根据集群大小适应性地选择一些随机用户参与每次迭代中的模型聚合。
  • 参数聚合(Parameter Aggregation):

    • 框架同时进行网络模型聚合和嵌入聚合。
    • 用户嵌入存储在本地设备上,但可以通过服务器交换,而不会泄露用户身份。商品的嵌入则由所有客户端共享和更新。
    • 对于网络模型,服务器会根据所有参与用户的加权总和来聚合一个全局模型 以及针对每个集群 C(n)的集群级模型,后者则根据该集群中所有参与用户的加权总和来聚合。
  • 个性化推荐:全局模型和集群级模型将提供给用户 n,以实现个性化的推荐。

  • 总结:这部分描述了一个服务器端的联邦学习框架,该框架通过用户聚类、用户选择和参数聚合,以实现个性化推荐。

实验部分

实验设置

在这里插入图片描述
在这里插入图片描述

  • 数据集:
    • 研究使用三个真实世界的数据集进行实验:MovieLens-100K、Yelp和Amazon-Kindle。
    • MovieLens-100K 是一个电影评分数据集,包含100,000个用户评分。
    • Yelp 和 Amazon-Kindle分别是其他常用的基准数据集,其中 Yelp是关于商业评论的,而 Amazon-Kindle 用于推荐电子书。
  • 基线方法:
    • 研究比较了提议的 PerFedRec 方法和现有的 FedGNN 方法。此外,PerFedRec 旨在通过对用户进行聚类以改进FedAvg算法来提供更加个性化的推荐
  • 性能比较:
    • 表格2显示了在三个数据集上的性能比较。用两种指标衡量性能:HR@K 和
      NDCG@K。从结果可以看出,对于大多数数据集和评估指标,PerFedRec 都优于 FedAvg。
  • 不同聚类数量的性能:
    • 表格3展示了在MovieLens数据集上使用不同数量的聚类(K=5, 10,
      20)时的性能。这有助于了解在该数据集上聚类数量对性能的影响。
  • 实验设置:
    • 实验使用了名为 LightGCN 的轻量级模型,并采用点乘来实现评分预测。用户和项目的嵌入向量都隐藏在表示中,维度为64。
    • 为了评估,研究使用了留一法,并使用了HR@K和NDCG@K进行评估。
    • 在测试时,每位用户的最后一次行为用于测试,倒数第二次用于验证,其他的用于训练

表现分析

在这里插入图片描述
在这里插入图片描述

  • 总体性能比较:
    • Table 2 展示了三种方法在三个数据集上的性能。
    • 中心化方法(Centralized method)在几乎所有场景中都取得了最好的结果。
    • FedAvg 表现最差,因为它忽略了特征信息并且不提供个 性化的推荐。
  • PerFedRec vs. Centralized & FedAvg:
    • 提议的 PerFedRec 性能接近于中心化方法。
    • 与 FedAvg 相比,PerFedRec 在所有三个数据集上的平均 HR@10 提高了 29.47%,而 NDCG@10 提高了57.67%。
  • 数据集稀疏性的影响:
    • MovieLens 数据集上的性能提升最为显著。
    • 稀疏的数据集(如 Kindle)上的改进较小,但仍然达到了平均 19.40% 的提升。
    • 尤其在 Kindle 数据集上,尽管它没有外部特征信息,但仍然取得了改进,这显示了个性化推荐的重要性。
  • 总结:这段文本主要对比了不同推荐系统方法的性能,并强调了PerFedRec方法相对于其他方法的优越性,尤其是在稀疏数据集上。

模型分析和消融实验

在这里插入图片描述

  • 模型分析
    • 关键超参数的影响:
      文章讨论了一个关键的超参数:模型训练中的簇数量(clusters K)。
      Table 3显示,当改变超参数时,性能保持相对稳定,这减少了调整超参数的困难
  • 在MovieLens数据集上的消融实验。
    • 比较了 PerFedRec 和它的三个变种(Variation 1, 2, 3)。
    • 原始的 PerFedRec 在 HR@10、NDCG@10、HR@20 和 NDCG@20 的指标上都取得了相对较好的性能。
  • 研究提议的框架中每个模块对性能的贡献。
    • PerFedRec-Variation 1: 不使用个性化推荐。
    • PerFedRec-Variation 2: 不使用特征信息。
    • PerFedRec-Variation 3: 不使用用户聚类。
  • 主要发现:
    • 从Table 4可以看出,性能的最大提升来自个性化推荐
    • 加入特征信息显著提高了性能。
    • 与没有用户聚类的 Variation 3 相比,PerFedRec 的性能下降很小,但通过用户聚类减少了通信成本

文章总结

  • 用户聚类的重要性:
    • 文章强调了在分布式推荐中用户聚类的重要性,并提出了一个新的个性化分布式推荐框架。
  • 框架的工作原理:
    • 该框架通过合作性和属性信息的 GNNs 学习用户表示,对相似的用户进行聚类,并通过结合用户级别、簇级别和全局模型来获取个性化推荐模型。
  • 通信成本的减少:
    • 为了减少与选定的代表性客户的通信成本,从每个簇中选择客户进行模型联合。
  • 实验结果:
    在三个真实世界的数据集上的实验表明,提议的框架性能优越,与传统的联邦推荐相比。

代码链接

代码解析

代码主要分为两个部分,utility文件下封装的一些工具类代码和其余的针对这个模型的代码,其中utility文件夹下的代码和NGCF这篇论文中的工具类代码一摸一样,应该是直接在这个基础上修改的,这里主要讨论下图中的几个代码:
Central.py,FedAvg.py,PerFedRed.py,GNN.py
其余的几个代码主要是:
在这里插入图片描述
其中Central.py表示不采用联邦学习,直接使用主服务器训练。
FedAvg.py表示采用联邦学习中的平均聚合方式,PerFedRec.py是本文提出的框架:基于联合表示学习、用户聚类和模型自适应的个性化联合推荐

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1147255.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

四十、【进阶】索引失效情况2

1、or的使用 在使用索引查询时,如果使用了or,会出现以下情况: (情况一)or左边是索引查询,or右边不是索引查询 结果:索引查询失效 (情况二)or左边不是索引查询&#x…

Java字节码技术

Java 字节码简介 Java 中的字节码,英文名为 bytecode, 是 Java 代码编译后的中间代码格式。JVM 需要读取并解析字节码才能执行相应的任务。 从技术人员的角度看,Java 字节码是 JVM 的指令集。JVM 加载字节码格式的 class 文件,校验之后通过 J…

B. Qingshan Loves Strings(贪心规律)

Problem - B - Codeforces 解析&#xff1a; 首先判断 t 字符串是不是相邻不同并且两端不同。 然后遍历 s 并且判断每一个相邻的相同字符&#xff0c;必须 t 字符符合并且两侧不同。 #include<bits/stdc.h> using namespace std; #define int long long const int N2e55…

私有云:【15】Composer安装无法使用cloudadmin进行下去

私有云&#xff1a;【15】Composer安装无法使用cloudadmin进行下去 1、Composer安装提示不支持windows授权2、这时候别退出3、稍微等待一会儿即可安装完成 1、Composer安装提示不支持windows授权 2、这时候别退出 上一步确定完之后&#xff0c;下一步让进行安装&#xff0c;不…

【软件测试02】测试方法

测试方法 学习目标&#xff1a; 1、能对穷举场景设计测试点---等价类划分法 2、能对限定边界规则设计测试点---边界值分析法 3、能对多条件依赖关系进行设计测试点---判定表法 4、能对项目业务进行设计测试点 一、等价类划分法 1、说明&#xff1a;在所有的测试数据中&am…

Spring更加简单的读取和存储对象

前言&#xff1a;在上篇文章中&#xff0c;小编写了一个Spring的创建和使用的相关博客&#xff1a;Spring的创建和使用-CSDN博客&#xff0c;但是&#xff0c;操作/思路比较麻烦&#xff0c;那么本文主要带领大家走进&#xff1a;Spring更加简单的读取和存储对象&#xff01; 本…

【数据结构】数组和字符串(十):稀疏矩阵的链接存储:十字链表的矩阵操作(加法、乘法、转置)

文章目录 4.2.1 矩阵的数组表示4.2.2 特殊矩阵的压缩存储a. 对角矩阵的压缩存储b~c. 三角、对称矩阵的压缩存储d. 稀疏矩阵的压缩存储——三元组表4.2.3三元组表的转置、加法、乘法、操作4.2.4十字链表0. 十字链表的基本操作1. 矩阵加法2. 矩阵乘法3. 矩阵转置4. 主函数 5. 代码…

linux 系统编程复习07-信号

1 复习目标 了解信号中的基本概念熟练使用信号相关的函数参考文档使用信号集操作相关函数熟练使用信号捕捉函数signal熟练使用信号捕捉函数sigaction熟练掌握使用信号完成子进程的回收 信号介绍 信号的概念 信号是信息的载体&#xff0c;Linux/UNIX 环境下&#xff0c;古老…

【C语言】优化通讯录管理系统

大家好&#xff0c;我是苏貝&#xff0c;本篇博客带大家优化上一篇的通讯录&#xff0c;如果你觉得我写的还不错的话&#xff0c;可以给我一个赞&#x1f44d;吗&#xff0c;感谢❤️ 目录 一. 前言二. 动态通讯录2.1 通讯录结构体2.2 初始化通讯录2.3 增加联系人2.4 销毁通讯…

【需要理解】80 单词搜索

单词搜索 题解1 回溯&#xff08;需要改变起点&#xff09; 给定一个 m x n 二维字符网格 board 和一个字符串单词 word 。如果 word 存在于网格中&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 单词必须按照字母顺序&#xff0c;通过相邻的单元格内…

数据结构——线性表①(顺序表)

一、线性表定义 线性表是一种数据结构&#xff0c;它是由n个具有相同数据类型的数据元素a1,a2,…,an组成的有限序列。 其中&#xff0c;除第一个元素a1外&#xff0c;每一个元素有且只有一个直接前驱元素&#xff0c;除了最后一个元素an外&#xff0c;每一个元素有且只有一个…

IDEA 如何运行 SpringBoot 项目

步骤一&#xff1a;配置 Maven 第一步&#xff1a;用 IDEA 打开项目&#xff0c;准备配置 maven 环境 &#xff0c;当然如果本地没有提前配置好 maven&#xff0c;就用 IDEA 默认的配置即可 配置 maven 步骤 情况 1&#xff1a;如果本地没有配置过 maven&#xff0c;可以保持如…

【Spring】IOC容器与Bean的常用属性配置

文章目录 1.前言2.IOC容器2.1 BeanFactory 容器2.2 ApplicationContext 容器 3.Bean的常用属性配置4. 总结 1.前言 在之前的文章-IOC的快速入门中讲过Bean这个概念. 本来就来介绍容器与Bean的常用属性配置 在Spring框架中&#xff0c;Bean指的是被Spring加载生成出来的对象。 …

ubuntu 18.04 编译安装flexpart 10.4(2023年) —— 筑梦之路

2023年10月29日 环境说明 操作系统版本&#xff1a;ubuntu 18.04 python版本&#xff1a;3.6.9 gcc版本&#xff1a;7.5.0 编译安装路径&#xff1a;/usr/local cmake: 3.10.2 所需要的源码包我已经打包放到我的资源。 2021年1月份已经写过一篇Ubuntu 编译安装的帖子F…

Android OpenGL ES 2.0入门实践

本文既然是入门实践&#xff0c;就先从简单的2D图形开始&#xff0c;首先&#xff0c;参考两篇官方文档搭建个框架&#xff0c;便于写OpenGL ES相关的代码&#xff1a;构建 OpenGL ES 环境、OpenGL ES 2.0 及更高版本中的投影和相机视图。 先上代码&#xff0c;代码效果如下图…

MQ——进阶

文章目录 消息可靠性生产者消息确认消息持久化消费者确认演示none模式演示auto模式 失败重试机制本地重试失败策略 死信交换机初始死信交换机TTL延迟队列安装DelayExchange插件使用DelayExchange 惰性队列消息堆积问题惰性队列 MQ集群集群分类普通集群镜像模式镜像模式的配置 仲…

私有云:【6】VCenter安装SqlServer

私有云&#xff1a;【6】VCenter安装SqlServer 1、VCenter安装SqlServer1.1、通过模板创建虚拟机1.2、安装sqlserver服务 2、搭建sqlserver群集2.1、安装群集功能2.2、在ad域服务器创建共享文件夹&#xff0c;供集群选举使用 3、创建故障转移群集【只需安装一台即可】3.1、创建…

操作系统 --- 存储器管理

一、简答题 1.存储器管理的基本任务&#xff0c;是为多道程序的并发执行提供良好的存储器环境。请问好的存储器环境”应包含哪几个方面&#xff1f; 答&#xff1a; 2.内存保护是否可以完全由软件实现&#xff1f;为什么&#xff1f; 答&#xff1a;内存保护的主要任务是确保每…

LeetCode热题100——双指针

双指针 1.移动零2.盛最多水的容器3.三数之和 1.移动零 给定一个数组 nums&#xff0c;编写一个函数将所有 0 移动到数组的末尾&#xff0c;同时保持非零元素的相对顺序。 // 题解&#xff1a;使用双指针&#xff0c;其中快指针指向非零元素&#xff0c;慢指针指向首个零元素下…

msvcp120.dll怎么修复,五种方法教你如何修复msvcp120.dll文件

在运行软件时&#xff0c;我们常常会遇到一些错误提示&#xff0c;其中之一就是“由于找不到msvcp120.dll无法继续执行代码”。这个错误通常发生在使用Microsoft Visual C 2013编译的程序运行时。本文将介绍5种修复这个问题的方法&#xff0c;帮助各位解决这个困扰。 方法一、使…