RS-FAIRFRS: COMMUNICATION EFFICIENT FAIR FEDERATED RECOMMENDER SYSTEM

news2024/11/22 18:01:37

RS-FAIRFRS: COMMUNICATION EFFICIENT FAIR FEDERATED RECOMMENDER SYSTEM

Anonymous authors
Paper under double-blind review
communication efficient fair federated recommender system
ICLR 2023

1. What does literature study?

  1. 结合随机抽样和确定每轮通信中要抽样的客户端数量以保持模型在FRS中的准确性;训练本地客户端建立公平的全局模型,以减少客户端层面的人口偏见。

2. What’s the innovation?

1. Past shortcomings

  1. 监督学习算法通过在训练损失中添加公平约束来减轻群体偏见,这需要与服务器共享受保护的属性

2.Innovation:

  1. 提出的基于随机抽样的公平联邦推荐系统无需分享其受保护的属性。
  2. 提供了客户端采样复杂度界限提高了通信成本。
  3. 在两个数据集(ML-1M,ML-100K)和不同的敏感特征(年龄和性别)中证明RS-FAIRFRS有助于降低通信成本人口统计偏差,提高了模型的准确性。

3. What was the methodology?

在这里插入图片描述

利用FedRec作为基础模型,使用矩阵分解识别潜在特征向量。最小化损失函数:
L M F = ∑ u ∈ [ n ] ∑ i ∈ [ m ] p u i ( r u i − U u ⋅ V i T ) 2 + λ r ( ∥ V i ∥ 2 + ∥ U u ∥ 2 ) \mathcal{L}^{\mathcal{M F}}=\sum_{u \in[n]} \sum_{i \in[m]} p_{u i}\left(r_{u i}-U_u \cdot V_i^T\right)^2+\lambda^r\left(\left\|V_i\right\|^2+\left\|U_u\right\|^2\right) LMF=u[n]i[m]pui(ruiUuViT)2+λr(Vi2+Uu2)

1.随机采样

利用霍夫丁约束支持不替换的抽样,随机均匀采样(无替换,不重复)将包含来自每个集群的大致相等数量的客户端。
采样 C T C^{\mathcal{T}} CT个客户端的平均项目向量: V ˉ i τ = 1 n τ ∑ i ∈ C τ V i \bar{V}_i^\tau=\frac{1}{n \tau} \sum_{i \in C^\tau} V_i Vˉiτ=nτ1iCτVi,总的 n n n个客户端的平均项目向量: V ˉ i n = 1 n ∑ i = 1 n V i \bar{V}_i^n=\frac{1}{n} \textstyle\sum_{i=1}^n V_i Vˉin=n1i=1nVi。使样本和整个训练集预测评分的期望相等 E [ U u T V ˉ i τ ] = E [ U u T V ˉ i n ] \mathbb{E}[U_u^T\bar{V}_i^\tau]=\mathbb{E}[U_u^T\bar{V}_i^n] E[UuTVˉiτ]=E[UuTVˉin]

2.双公平更新

精度奇偶性 L a p = 1 ∣ g ∣ ∑ u ∈ g 1 ∣ I u ∣ ∑ I ∈ I u ( r ^ u i − r u i ) 2 − 1 ∣ ¬ g ∣ ∑ u ∈ ¬ g 1 ∣ I u ∣ ∑ I ∈ I u ( r ^ u i − r u i ) 2 \mathcal{L}^{a p}=\frac{1}{|g|} \sum_{u \in g} \frac{1}{\left|I_u\right|} \sum_{I \in I_u}\left(\hat{r}_{u i}-r_{u i}\right)^2-\frac{1}{|\neg g|} \sum_{u \in \neg g} \frac{1}{\left|I_u\right|} \sum_{I \in I_u}\left(\hat{r}_{u i}-r_{u i}\right)^2 Lap=g1ugIu1IIu(r^uirui)2∣¬g1u¬gIu1IIu(r^uirui)2,表示两个群体之间的差异。对于模型 θ {\theta} θ θ ˉ \bar{\theta} θˉ,如果 L a p ( θ ) < L a p ( θ ˉ ) \mathcal{L}^{a p}({\theta})<\mathcal{L}^{a p}(\bar{\theta}) Lap(θ)Lap(θˉ),则 θ {\theta} θ更公平。
服务器端20%的客户端数据用来评估公平损失: min ⁡ U , V L M F + λ f L a p \min\limits_{U,V}\mathcal{L}^{MF}+\lambda^f\mathcal{L}^{ap} U,VminLMF+λfLap以获得 V f a i r V_{fair} Vfair发给客户端。
客户端从服务器下载 V f a i r V_{fair} Vfair V i V_{i} Vi;公平目标函数为: min ⁡ U , V L M F + η ( ∣ ∣ V f a i r − V i ∣ ∣ 2 ) \min\limits_{U,V}\mathcal{L}^{MF}+\eta(||V_{fair}-V_i||^2) U,VminLMF+η(∣∣VfairVi2)

4. What are the conclusions?

  1. 结论:
    在这里插入图片描述
    在这里插入图片描述
    经过实验客户端抽样比率为 T = 35 % {\mathcal{T}}=35\% T=35%作为理想值;>18和男性群体数量多可以获得更低的损失;RS-FairFRS可以实现公平性。

5. others

男多女少,平均抽样

  1. 我们提出了一种具有两个阶段的双公平向量更新技术。在阶段1中,服务器聚合接收到的项目向量,并对其进行训练,使其在一小部分数据上公平。在第2阶段,客户端将本地误差降至最低,并学习更接近全局公平项目向量的项目向量。

  2. 利用FedRec作为基础模型,客户端上传项目梯度,从服务器下载项目向量。
    (1)FRS中的人口统计学偏差问题,量化为不同组间平均错误率差异。
    (2)给出了FRS的样本复杂度边界。

  3. 集中式RS领域的公平性:
    (1)Sirui Yao and Bert Huang. Beyond parity: Fairness objectives for collaborative filtering. Advances in neural information processing systems, 30, 2017.
    RecBole-FairRec-Optimized/focf.py at 5c88cb8c2f2586febe6bff8832d7bdc326e8392b · Keyvantajfar/RecBole
    RecBole-FairRec/focf.py at 08a7f4cf330477bc4e755749df7dda826e96384a · TangJiakai/RecBole-FairRec
    (2) Yunqi Li, Hanxiong Chen, Zuohui Fu, Yingqiang Ge, and Yongfeng Zhang. User-oriented fairness in recommendation. In Proceedings of the Web Conference 2021, pp. 624–632, 2021.
    https://github.com/rutgerswiselab/user-fairness

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/703539.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vmware总结

1、CD/DVD设置 如果设备状态没有勾选已连接,那么当挂载镜像的时候,就会提示找不到设备。

有没有好用的ai图片处理器?这几款软件都能实现ai图片处理

朋友们,我今天要和你们聊一聊一个非常有趣的话题——ai图片网站!没错,你没听错,就是那种可以让你在瞬间找到想要的图片的神奇网站。想象一下,你需要一张火爆的表情包,或者一幅令人心旷神怡的风景图&#xf…

为什么高并发这么难?非停事故频频发生?一天宕机三次?【B站、唯品会也难幸免】我们该怎么做?

宕机事件 原因解析: 1、一方面故障是不可避免的,有人为的故障(是人就容易出错的)和非人为的故障(机器 Failure)。这些是无法避免的停机,还有有计划的停机,如发布新系统、升级维护、更…

PHP 的 Logo 为什么是大象?

因为大象是世界上最好的动物。 当然,这只是开玩笑,那么为什么PHP的LOGO是大象呢?还有哪些关于PHP的LOGO的有趣的事情呢? 吉祥物-大象 ElePHPant 是一款可爱的 PHP 吉祥物,其设计中有一头大象。 最初的LOGO 1998 年…

golang,OpenGL,计算机图形学(一)

开发环境与依赖 github.com/go-gl/gl/v4.1-core/gl github.com/go-gl/glfw/v3.2/glfw OpenGL只提供了绘图功能,创建窗口是需要自己完成的。这就需要学习相应操作系统的创建窗口方法,比较复杂,并且每个操作系统都不同。为简化创建窗口的过程…

JavaScript ,16种常用数组方法

前言 📗众所周知,向后端请求数据,处理数据是前端工程师必备的技能,从后端请求回来的数据往往是数组的形式返回到前端,因此数组处理方法的重要性可想而知;每次在处理对应数据都需要查阅一下因此记录一下使用…

MVVM框架代码逻辑整合

文章目录 逻辑总结为什么要将业务和视图分开为了解耦数据不同数据层数据冗余视图层非业务数据业务数据再处理 保证各层数据的封闭性 逻辑总结 将前端分为视图层,中间层,业务层。 视图层负责页面渲染业务层负责数据处理中间层负责业务层和视图层的关系 …

Mariadb读写分离

zzhttps://mp.csdn.net/mp_blog/creation/editor/131087599https://mp.csdn.net/mp_blog/creation/editor/131087599准本环境 systemctl stop firewalld setenforce 0 #关闭防火墙 iptables -F 192.168.1.2 #主库服务器 192.168.1.3 #从库服…

【Flutter】Flutter 使用 json_serializable 进行 JSON 序列化

文章目录 一、前言二、 json_serializable 简介三、如何在 Flutter 中安装和配置 json_serializable四、json_serializable 的基本使用五、一个实际的 Flutter 应用示例六、版本信息七、总结 一、前言 嗯啊,你好呀!欢迎来到我的博客。 今天我们要聊聊的…

基于安卓的初中英语语法APP设计与实现(源码+文档+PPT)

智能手机的普及使移动学习成为一种全新的学习方式,越来越受到研究者与学习者的关注。调查显示,移动学习对英语学习特别是应用英语的学习有良好的效果。基于Android设计开发的英语语法APP包含“练习题册”、“语法分析”、“搜索语法”三大功能模块,能够帮助学生利用碎片时间学习…

HBase(11):shell管理操作

1 status 例如:显示服务器状态 2 whoami 显示HBase当前用户,例如: 3 list 显示当前所有的表 4 count 统计指定表的记录数,例如: 5 describe 展示表结构信息 6 exists 检查表是否存在,适用于表量特别多的情况

nginxWebUI 远程命令执行漏洞

漏洞介绍 nginxWebUI是一款图形化管理nginx配置的工具,能通过网页快速配置nginx的各种功能,包括HTTP和TCP协议转发、反向代理、负载均衡、静态HTML服务器以及SSL证书的自动申请、续签和配置,配置完成后可以一键生成nginx.conf文件&#xff0c…

Adobe中修改注释签名

控制面板-> 系统和安全-> 管理工具-> 计算机管理-> 打开“计算机管理”对话框-> 在左边栏的系统工具下选择本地用户和组-> 点击“用户”->选择要改的用户名->右键重命名 打开Adobe Acrobat->点击"编辑"->首选项->注释 ->把 “登…

vue实现复制文本格式化

vue全局方法 实现复制文本格式化,方法简单实用易懂,100%成功 先上效果图 实现步骤 第一步 ,在main.js 插入以下代码 Vue.prototype.copys = function copys(text) {var isRTL = document.documentElement.getAttribute(dir) === rtl;var element = document.createElemen…

【半监督图像分割 2022 CVPR】UCC

文章目录 【半监督图像分割 2022 CVPR】UCC摘要1. 简介2. 相关工作2.1 半监督分类2.2 半监督语义分割。 3. 交叉头协同训练的半监督学习3.1 整体预览3.2 弱增强和强增强3.3 动态交叉集复制粘贴策略3.4 不确定度估计 4. 实验4.1 实验设置4.2 对比sota4.3 消融实验 5. 总结 【半监…

《移动互联网技术》第六章 资源管理: 掌握定制控件样式、界面主题、可绘制资源程序的编写方法

🌷🍁 博主 libin9iOak带您 Go to New World.✨🍁 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~&#x1f33…

Linux下的分布式迁移工具dsync使用

一、Linux下的分布式迁移工具dsync使用 dsync 是一个在 Linux 系统上用于迁移文件和目录的工具。它可以在不同的存储设备之间进行数据同步和迁移操作。dsync 是 rsync 工具的一个衍生版本,专注于在本地文件系统之间进行数据迁移。 这里是官网:dsync 1、…

【强化学习】常用算法之一 “DQN”

作者主页:爱笑的男孩。的博客_CSDN博客-深度学习,活动,python领域博主爱笑的男孩。擅长深度学习,活动,python,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域.https://blog.csdn.net/Code_and516?typeblog个…

5、多层感知机:过拟合解决方法:权重衰退、丢弃法

1、权重衰退 1. 基础概念 实际上,限制特征的数量是缓解过拟合的一种常用技术。然而,简单地丢弃特征对这项工作来说可能过于生硬。我们继续思考多项式回归的例子,考虑高维输入可能发生的情况。多项式对多变量数据的自然扩展称为单项式&#…

微信小程序学习记录3 案例分享<蓝牙小车UI>

效果 页面1 一键连接蓝牙 页面2 控制页面 思路 页面1 旋转动画一键连接蓝牙(写死了device id和uuid) 页面2 轮播图按键 按键绑定不同事件即可