一种有效的隐私保护联邦学习方法-文章翻译

news2024/12/26 23:04:43

一种有效的隐私保护联邦学习方法

摘要

联邦学习已成为协作学习和隐私保护学习的一种很有前途的方法。联合学习过程中的参和者通过交换模型参数而不是实际的训练数据(他们可能希望保持私有)来合作训练模型。然而,参数交互和生成的模型仍然可能会披露有关所用训练数据的信息。为了解决这些隐私问题,已经提出了几种基于差异隐私和安全多方计算(SMC)等的方法。它们通常会导致较大的通信开销和较慢的训练时间。在本文中,我们提出了一种基于函数加密的SMC协议的隐私保护联邦学习方法HbridAlpha。该协议简单、高效,对退出的参与者具有弹性。我们使用联邦学习过程在MNIST数据集上训练CNN,评估我们关于训练时间和交换数据量的方法。对现有基于加密的SMC解决方案的评估表明,Hybridalpha可以平均减少68%的训练时间和92%的数据传输量,同时提供与现有解决方案相同的模型性能和隐私保证。

1 引入

机器学习(ML)已在工业界和学术界广泛应用于各种领域[23,26]。虽然传统的ML方法依赖于集中管理的训练数据集,但隐私考虑促使人们对分散学习框架感兴趣,在这种框架中,多个参与者协作训练ML模型,而不共享各自的训练数据集。联邦学习(FL)[25,28]被认为是一个分散的过程,可以扩展到数千名参与者。由于培训数据不会离开每个参与者的领域,FL适合于对数据共享敏感的用例。这包括医疗保健、金融服务和其他对隐私特别敏感或受监管要求约束的场景。在FL中,每个参与者在本地训练一个模型,并且只与其他人交换模型参数,而不是主动的敏感训练数据。一个实体调用不同参与者的模型参数。通常,聚合器是一个中心实体,它还将合并的模型参数重新分配给所有参与者,但也使用了其他拓扑,例如,将聚合器与每个参与者共同定位。然而,这种方法仍然存在隐私风险:学习阶段的推理攻击已经被[30]提出;从经过培训的模型中获取私人信息已在[37]中得到证明;[19]中提出了一种模型反转攻击。为了解决这种隐私泄露问题,针对学习框架[1,31]提出了差异隐私[15,17],其中可信聚合器控制隐私暴露,以保护模型输出的隐私。类似地,[32]建议将差异隐私技术和安全多方计算(SMC)相结合,以支持对来自不同数据提供商的私有数据进行隐私保护分析,而[6]在故障鲁棒协议中结合了秘密共享和认证加密,以安全聚合高维数据。受混合方法[32]的启发,最近的一篇论文[38]也提出了一种混合解决方案,该解决方案提供了强大的隐私保障,同时仍然支持良好的模型性能。这种混合方法结合了降噪差分隐私方法和SMC协议保护,其中底层的安全基础是加性同态加密,即阈值Paillier系统[11]。该混合方法虽然具有良好的模型性能和隐私保障,但训练时间长,数据传输成本高,且不能处理FL过程中参与者退出的问题。在表1中,我们从威胁模型、隐私保障和所提供的特性等方面总结了现有的隐私保护方法。
在这里插入图片描述

我们认为,一个保护隐私的FL框架应该努力实现强大的隐私保障、高通信效率和对变化的弹性。如表1所示,提供隐私保障的方法会导致大量的通信回合,从而大大增加FL系统的培训时间。为了应对上述挑战,我们提出了一种有效的隐私保护方法Hybridalpha。Hybridalpha使用功能加密来执行SMC。使用功能加密,我们定义了一种简单有效的隐私保护FL方法,该方法还支持在学习过程中不断变化的参与者群体。我们将主要贡献总结如下:

  • 我们提出了一种有效的隐私保护FL方法HbridAlpha,它采用了一种差分隐私机制,并从多输入函数加密方案中定义了SMC协议。我们对该方案进行了调整,并加入了其他条款,以降低好奇的聚合者和串通参与者推断私人信息的风险。
  • 我们在理论上和实验上实现并比较了函数加密方案与常见的传统加密方案,如加法同态加密及其变体,后者通常用于SMC。我们的基准测试结果将指导未来在为FL选择适当的SMC时采用这些密码系统。
  • 我们描述了一种混合方法的实现,并将其应用于卷积神经网络。在MNIST数据集上的实验结果表明,我们的Hybridalpha框架在训练时间和通信成本方面都有效率的提高,同时提供了与其他方法相同的模型性能和隐私保证。
  • 同时,我们展示了一个动态参与者群体问题的解决方案,这表明我们提出的框架对参与者的退出或加入具有鲁棒性。我们还分析了HybridAlpha框架在可信TPA、诚实但好奇的聚合器和部分不诚实的参与者中定义的威胁模型下的安全和隐私保障。

据我们所知,这是第一种保护隐私的联邦学习方法,它演示了如何利用函数加密来防止某些推理攻击,而这些攻击可能是通过天真地应用这种密码系统而可能发生的。我们证明,与现有解决方案相比,我们的方法具有更好的模型性能、更强的隐私保证、更低的训练时间和更高效的通信。

3 具体架构

在本节中,我们将介绍用于隐私保护的联邦学习的混合框架的具体构造。我们的框架可防止来自好奇聚合器的推理攻击,并限制共谋参与者的推理能力,详见下文的威胁模型。
图1展示了HybridAlpha的概述。参与者需要协作学习机器学习模型,而无需与系统中的任何其他实体共享其本地数据。他们同意只与聚合器共享模型更新。该实体负责接收来自多个参与者的模型更新,以构建通用的机器学习模型。
在这里插入图片描述
参与者希望在FL过程中保护他们的数据不受任何推理攻击和最终模型的影响。为此,他们加入了HybridAlpha,它有一个第三方授权机构(TPA)。该实体提供密钥管理服务,该服务启动密码系统并向各方提供功能加密密钥。为了防止潜在的信息泄漏,HybridAlpha还包括一个推理预防模块,该模块限制了提供的功能加密密钥的类型。此模块旨在确保好奇的聚合器无法获得解密密钥,并限制潜在的共谋攻击。我们在§3.2.2中详细介绍了这个模块。

3.1 威胁模型

我们考虑以下威胁模型:
诚实但好奇的聚合器:我们假设聚合器正确地遵循算法和协议,但可以尝试通过检查过程中参与者发送的模型更新来学习私有信息。这是一个常见的假设[6,38]。
好奇和共谋的参与者:我们假设参与者可能通过检查与聚合器或最终模型交换的消息来共谋,试图从其他参与者那里获取私人信息。
受信任的TPA:该实体是一个独立机构,受参与者和集合体的广泛信任。在实际情况中,不同的经济部门已经有了可以扮演这一角色的实体。例如,在银行业,中央银行通常扮演完全受信任的角色,而在其他部门,第三方公司(如服务或咨询公司)可以体现TPA。我们还注意到,假设这种受信任和独立的机构是现有密码系统中的常见假设,这些密码系统将TPA用作基础设施[7,8,21]。TPA负责持有主私钥和公钥。TPA还可以执行公钥分发和函数派生密钥生成。同样,推理预防模块也是完全可信的。

我们假设在所有通信中都使用了安全通道,从而防止了中间人和琐碎的窥探攻击。我们还假设有一个安全的密钥提供过程(如DiffieHellman)来保护密钥机密性。最后,旨在创建拒绝服务攻击或注入恶意模型更新的攻击超出了本文的范围。
基于上述威胁模型,我们提出的隐私保护框架可以确保(i)半诚实聚合器无法学习除差异隐私机制预期输出之外的其他信息,以及(ii)恶意串通参与者无法学习其他诚实参与者的参数。具体的安全和隐私分析见§5。

3.2 详细操作

我们现在详细描述HybridAlpha的操作,并从介绍所使用的符号开始。设A是聚合器,SP是n个参与者的集合,每个参与者Pi持有自己的数据集Di。我们将待训练的学习算法表示为LFL。在本节中,我们首先介绍该框架在非对抗性设置下的操作,然后解释如何使用其他功能来防范威胁模型部分中定义的推理攻击。
3.2.1 Non-adversarial设置。HybridAlpha在非对抗设置下的操作如算法1所示。HybridAlpha以一组参与者、用于训练的算法和微分隐私参数御夫作为输入。
HybridAlpha通过系统中的TPA设置键启动。特别地,TPA运行§2.3中介绍的Setup和PKDistribute算法,因此每个参与者Pi有自己的公钥pki(行1-5)。我们注意到HybridAlpha允许新参与者加入培训过程,即使它已经开始。为此,TPA规定了比初始参与者集合更多的密钥(第2行)。这样,当新的参与者加入培训过程时,他们需要从TPA获得个人公钥,然后参与学习协议;所有这些都不需要其他参与者做出任何改变。
在这里插入图片描述

当接收到所有响应时,假设存在法定人数, A需要从TPA请求一个密钥,该密钥对应于加权向量 w p w_p wp,用于计算内积。也就是说,聚合器从基于 w p w_p w

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1574217.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Mysql故障解析

目录 一、Mysql单实例故障排查 1.故障一 2.故障二 3.故障三 4.故障四 5.故障五 6.故障六 7.故障七 8.故障八 二、Mysql主从故障排查 1.故障一 2.故障二 3.故障三 三、Mysql优化 1.硬件方面 (1)关于CPU (2)关于内…

在线监测系统在水厂水质管理工程中的应用与研究

【摘要】:随着水厂水质管理技术和管理水平的提升,达到了在线监测系统通过监测数据的反馈,及时发现问题,快速处理事故,优化了水资源的利用率,提高了供水系统的稳定性和安全性,从而有效地提高供水…

2024.4.4-day09-CSS 布局模型(标准流模型、浮动模型)

个人主页:学习前端的小z 个人专栏:HTML5和CSS3悦读 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结,欢迎大家在评论区交流讨论! 文章目录 作业 2024.4.4-学习笔记1 CSS 布局模型1.1 标准流1.2 CSS 浮动1.3 去除塌陷 2…

RabbitMQ的交换机与队列

一、流程 首先先介绍一个简单的一个消息推送到接收的流程,提供一个简单的图 黄色的圈圈就是我们的消息推送服务,将消息推送到 中间方框里面也就是 rabbitMq的服务器,然后经过服务器里面的交换机、队列等各种关系(后面会详细讲&am…

文件读写(相关函数详解)

1.文件的顺序读写 相关函数: 1.1 fputc函数 fputc的参数如下 它的功能是把字符character输出到stream指向的文件中,字符的本质就是它的ascll值所以这里用int类型接收。如果写入成功则返回写入的字符的ascll码,失败则返回-1(即EOF) 示例代码…

【洛谷】P9236 [蓝桥杯 2023 省 A] 异或和之和

题目链接 P9236 [蓝桥杯 2023 省 A] 异或和之和 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 思路 1. 暴力求解 直接枚举出所有子数组,求每个子数组的异或和,再对所有的异或和求和 枚举所有子数组的时间复杂度为O(N^2)&…

C++ 【原型模式】

简单介绍 原型模式是一种创建型设计模式 | 它使你能够复制已有对象,客户端不需要知道要复制的对象是哪个类的实例,只需通过原型工厂获取该对象的副本。 以后需要更改具体的类或添加新的原型类,客户端代码无需改变,只需修改原型工…

线程安全--深入探究线程等待机制和死锁问题

꒵˂͈꒱ write in front ꒰˃͈꒵˂͈꒱ ʕ̯•͡˔•̯᷅ʔ大家好,我是xiaoxie.希望你看完之后,有不足之处请多多谅解,让我们一起共同进步૮₍❀ᴗ͈ . ᴗ͈ აxiaoxieʕ̯•͡˔•̯᷅ʔ—CSDN博客 本文由xiaoxieʕ̯•͡˔•̯᷅ʔ 原创 CSDN 如需转…

影院座位选择简易实现(uniapp)

界面展示 主要使用到uniap中的movable-area&#xff0c;和movable-view组件实现。 代码逻辑分析 1、使用movable-area和movea-view组件&#xff0c;用于座位展示 <div class"ui-seat__box"><movable-area class"ui-movableArea"><movab…

C++ 内存分配时地址对齐

如果数据地址的对齐与CPU相兼容&#xff0c;那么CPU读写内存时性能会更高。 因此在C中&#xff0c;有时会希望在堆或栈中分配内存时&#xff0c;返回的地址能按照特定的长度对齐。 如果希望在栈中分配的内存时&#xff0c;返回地址按照特定长度对齐&#xff0c;可以使用 alig…

IVS模型解释

核心思路 【Implied volatility surface predictability: The case of commodity markets】 半参数化模型&#xff1a;利用各种参数(或者因子)对隐含波动率进行降维&#xff08;静态参数化因子模型&#xff09;&#xff0c;对参数化因子的时间序列进行间接的建模 基于非对称…

蓝桥杯 十一届C++A组 字符排序 21分(运行超时)

思路&#xff1a; 1. 此题考查的冒泡排序中的交换次数&#xff0c;其实就是考察当前数与后面的逆序对个数问题。而为了最大利用位数&#xff0c;应当使每一位都不小于后面的字符&#xff0c;否则会造成一次逆序对的浪费&#xff08;贪心&#xff0c;为了使总位数最少&#xff…

代码随想录算法训练营三刷 day45 | 动态规划 之 70. 爬楼梯 (进阶) 322. 零钱兑换 279.完全平方数

三刷day45 70. 爬楼梯 &#xff08;进阶&#xff09;1. 确定dp数组以及下标的含义2.确定递推公式3.dp数组如何初始化4.确定遍历顺序5.举例来推导dp数组 322. 零钱兑换1. 确定dp数组以及下标的含义2.确定递推公式3.dp数组如何初始化4.确定遍历顺序5.举例推导dp数组 279.完全平方…

01.IDEA中出现Cannot resolve symbol ‘SpringApplication异常

试了很多次&#xff0c;看了这篇文章终于发现了问题。IDEA解决springboot工程中Cannot resolve symbol SpringApplication异常-CSDN博客 我存在的问题在于Maven home path有误&#xff0c;改正之后就没有问题&#xff0c;不标红了。

逆向案例十二——看准网企业信息json格式的信息

网址&#xff1a;【全国公司排行|排名榜单|哪家好】-看准网 打开开发者工具——刷新——网络——XHR——下滑页面加载新的页面——找到数据包 发现参数加密&#xff0c;返回的数据也进行了加密 按关键字在下方搜索 kiv进入第一个js文件 ctrlf打开文件里面的搜索框继续搜kiv找到…

【机器学习入门】使用YOLO模型进行物体检测

系列文章目录 第1章 专家系统 第2章 决策树 第3章 神经元和感知机 识别手写数字——感知机 第4章 线性回归 第5章 逻辑斯蒂回归和分类 第5章 支持向量机 第6章 人工神经网络(一) 第6章 人工神经网络(二) 卷积和池化 第6章 使用pytorch进行手写数字识别 文章目录 系列文章目录前…

ECAI 2024投稿指南

诸神缄默不语-个人CSDN博文目录 ECAI也写一下&#xff0c;作为备胎。毕竟ECAI是CCF B会。 ECAI dblp官网&#xff1a;https://dblp.uni-trier.de/db/conf/ecai/index.html 征文网址&#xff1a;https://www.ecai2024.eu/calls/main-track ECAI 2024在西班牙开&#xff0c;如…

伦敦银行情上涨时投资盈利

在讨论如何根据伦敦银行情上涨时机投资盈利之前&#xff0c;投资者需要了解伦敦银的特性以及影响其价格波动的因素。伦敦银&#xff0c;即银的伦敦市场交易价格&#xff0c;是全球贵金属交易中的重要参考价。银的价格受到多种因素的影响&#xff0c;包括全球经济状况、货币政策…

FJSP:巨型犰狳优化算法(Giant Armadillo Optimization,GAO)求解柔性作业车间调度问题(FJSP),提供MATLAB代码

一、柔性作业车间调度问题 柔性作业车间调度问题&#xff08;Flexible Job Shop Scheduling Problem&#xff0c;FJSP&#xff09;&#xff0c;是一种经典的组合优化问题。在FJSP问题中&#xff0c;有多个作业需要在多个机器上进行加工&#xff0c;每个作业由一系列工序组成&a…

网络安全流量平台_优缺点分析

FlowShadow&#xff08;流影&#xff09;&#xff0c;Ntm&#xff08;派网&#xff09;&#xff0c;Elastiflow。 Arkimesuricata&#xff0c;QNSMsuricata&#xff0c;Malcolm套件。 Malcolm套件优点&#xff1a;支持文件还原反病毒引擎&#xff08;clamav/yara&#xff09;…