一种保护隐私的混合联邦学习方法-文章翻译

news2024/11/26 22:23:47

一种保护隐私的混合联邦学习方法

摘要

联邦学习促进了模型的协作培训,而无需共享原始数据。然而,最近的攻击表明,仅仅在培训过程中维护数据位置并不能提供足够的隐私保证。相反,我们需要一个联邦学习系统,该系统能够防止对训练期间交换的消息和最终训练的模型进行推理,同时确保生成的模型也具有可接受的预测准确性。现有的联合学习方法要么使用易受推断影响的安全多方计算(SMC),要么使用差异隐私,这可能会导致准确性较低,因为大量参与方的数据量相对较小。在本文中,我们提出了一种替代方法,利用差异隐私和SMC来平衡这些权衡。将差异隐私与安全多方计算相结合,使我们能够在保持预定义的信任率的同时,在不牺牲隐私的情况下,随着参与方数量的增加,减少噪声注入的增长。因此,我们的系统是一种可扩展的方法,可以防止推理威胁,并生成高精度的模型。此外,我们的系统可以用来训练各种机器学习模型,我们在3种不同的机器学习算法上的实验结果验证了这一点。我们的实验表明,我们的方法比最先进的解决方案更有效。

1 引入

在传统的机器学习(ML)环境中,培训数据由执行学习算法的一个组织集中保存。分布式学习系统通过使用一组学习节点访问共享数据或将数据从中心节点发送到参与节点来扩展这种方法,所有这些节点都是完全可信的。例如,Apache Spark的MLlib假设有一个可信的中心节点来协调分布式学习过程[28]。另一种方法是参数服务器[26],它同样需要一个完全可信的中心节点来收集和聚合在不同数据集上学习的许多节点的参数。

然而,一些学习场景必须解决不太开放的信任边界,特别是当涉及多个组织时。虽然较大的数据集可以提高经过培训的模型的性能,但由于法律限制或参与者之间的竞争,组织通常无法共享数据。例如,考虑三个不同的业主为同一个城市服务的医院。与每家医院创建自己的预测模型来预测患者的癌症风险不同,医院希望创建一个在整个患者群体中学习的模型。然而,隐私法禁止他们共享患者的数据。类似地,服务提供商可以在欧洲和美国收集使用数据。由于法律限制,服务提供商的数据不能存储在一个中心位置。但是,在创建预测服务使用情况的预测模型时,应使用所有数据集。

联邦学习(FL)领域解决了这些限制性更强的环境,其中数据持有者在整个学习过程中相互协作,而不是依赖可信的第三方来保存数据[6,39]。FL中的数据持有者在本地运行机器学习算法,只交换模型参数,这些参数由一个或多个中心实体聚合和重新分配。然而,这种方法不足以提供合理的数据隐私保障。我们还必须考虑到,信息可以从学习过程[30]中推断出来,信息可以在最终训练的模型[40]中追溯到其来源。

以前的一些工作已经提出使用可信聚合器来控制隐私暴露[1],[32]。使用局部差异隐私的FL方案也解决了隐私问题[39],但会给来自每个节点的模型参数数据添加太多的噪声,通常会导致生成的模型性能不佳。

我们提出了一种新的联邦学习系统,它提供正式的隐私保证,考虑各种信任场景,并且与现有的隐私保护方法相比,生成的模型具有更高的准确性。数据永远不会离开参与者,使用安全多方计算(SMC)和差异隐私来保证隐私。我们通过一个可定制的信任阈值,考虑了个人参与者的潜在推断以及参与者之间的共谋风险。我们的贡献如下:

• 我们提出并实现了一个FL系统,该系统提供正式的隐私保证和模型,与现有方法相比具有更高的准确性。
• 我们包括了一个可调的信任参数,该参数考虑了各种信任场景,同时保持了改进的准确性和正式的隐私保证。
• 通过使用三种显著不同的ML模型(决策树、卷积神经网络和线性支持向量机)对我们的系统进行实验评估,我们证明了使用所提出的方法训练各种ML模型是可能的。
• 我们包括第一个联邦方法,用于私有和准确地训练神经网络模型。

本文的其余部分组织如下。我们概述了系统中的构建块。然后,我们讨论FL系统中的各种隐私注意事项,然后概述我们的威胁模型和一般系统。然后,我们提供了系统实现过程的实验评估和讨论。最后,我们给出了相关工作的概述和一些结论。

2 预定义

在本节中,我们将介绍我们的方法的构建块,并解释各种方法如何无法保护FL中的数据隐私。

2.1差别隐私

差分隐私(DP)是一个严格的数学框架,其中,当且仅当在训练数据集中包含单个实例时,算法的输出只会发生统计上无关紧要的变化,该算法可以被描述为差异隐私。例如,考虑来自特定医院的私人医疗信息。[40]的提交人表明,只要访问经过训练的ML模型,攻击者就可以推断某人是否是医院的病人,从而侵犯了他们的隐私权。DP对单个个体的影响设置了理论上的限制,从而限制了攻击者推断此类成员的能力。DP的形式化定义为[13]:

定义1(差别隐私)。随机机制K提供(ϵ,δ)-差分隐私,如果相邻数据库D1和D2仅在一个条目上存在差异,∀S⊆Range(K),
在这里插入图片描述
如果δ=0,则K满足ϵ-差分隐私。
为了实现DP,将噪声添加到算法的输出中。该噪声与输出的灵敏度成正比,其中灵敏度测量由于包含单个数据实例而导致的输出的最大变化。
实现DP的两种常用机制是拉普拉斯机制和高斯机制。高斯的定义是
在这里插入图片描述

其中 N ( 0 , S f 2 σ 2 ) N(0,S^2_fσ^2) N(0,Sf2σ2)为均值为0,标准差为 S f σ S_fσ Sfσ的正态分布。将高斯机制应用于灵敏度函数Sf,如果δ≥5/4exp(−(σϵ)2/2),且ϵ<1[16],就能满足(ϵ,δ)-差分隐私。为了实现ϵ-差分隐私,拉普拉斯机制可以通过用从Lap(Sf/ϵ)中提取的随机变量替换 N ( 0 , S f 2 σ 2 ) N(0,S^2_fσ^2) N0Sf2σ2[16]以相同的方式使用。当算法需要多种加性噪声机制时,隐私保证的评估遵循基本合成定理[14,15]或高级合成定理及其扩展[7,17,18,23]。

2.2 门限/阈值 同态加密

附加同态加密方案保证了以下特性:

对于某些预定义函数◦. 这种方案在隐私保护数据分析中很流行,因为不受信任的方可以对加密值执行操作。

其中一个加性同态方案是Paillier密码系统[31],这是一个概率加密方案,基于组Z∗n2中的计算,其中n是RSA模数。在[11]中,作者对该加密方案进行了扩展,并提出了一种阈值变体。在阈值变体中,一组参与者能够共享密钥,因此小于预定义阈值的各方子集都不能解密值。

2.3联邦学习中的隐私
在集中式学习环境中,一方P使用数据集D执行一些学习算法 f M f_M f

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1577519.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

货物摆放-C++题解

计算本题前先了解一下约数 约数&#xff0c;又称因数。整数a除以整数b(b≠0) 除得的商正好是整数而没有余数&#xff0c;我们就说a能被b整除&#xff0c;或b能整除a。a称为b的倍数&#xff0c;b称为a的约数 然后首先要求出n的所有因数&#xff0c;因为题目需要满足的条件是nLWH…

柯桥外语培训之【韩语干货】如何用韩语作简单自我介绍

안녕하세요! 意思是“您好”“你好”&#xff0c;这是最常用的问候语&#xff0c;正式场合可以使用“안녕하십니까?" 제 이름은 [你的名字]이고, [你的年龄] 살입니다. 意思是“我的名字是~&#xff0c;~岁了”&#xff0c;这是比较谦虚的自我介绍方式 介绍自己的名字…

Python第四次作业

周六&#xff1a; 1. 找出10000以内能被5或6整除&#xff0c;但不能被两者同时整除的数&#xff08;函数&#xff09; def find_number():for number in range(0,10000):if number % 5 0 or number % 6 0:if number % 5 ! number % 6:ls.append(number)print(ls)ls [] fin…

CSS 基础:设置背景的 5 个属性及简写 background 注意点

你好&#xff0c;我是云桃桃。 一个希望帮助更多朋友快速入门 WEB 前端的程序媛。大专生&#xff0c;一枚程序媛&#xff0c;感谢关注。回复 “前端基础题”&#xff0c;可免费获得前端基础 100 题汇总&#xff0c;回复 “前端工具”&#xff0c;可获取 Web 开发工具合集 263篇…

谷歌浏览器用不了怎么办?

打开谷歌浏览器点击右上角的三个点 &#xff0c; 点击设置 在搜索引擎里面把这个改成百度 然后越狱登录你的谷歌账号就可以用了 我个人用的越狱软件是r2rayn &#xff0c; 浏览器上面可以搜索的 默认浏览器那里可以设置成谷歌

Vue - 你知道Vue2中对象动态新增属性,视图无法更新的原因吗

难度级别:中高级及以上 提问概率:55% 这道题面试官会这样描述,比如有这样一个场景,一个对象里有name属性,可以正常显示在页面中。但后续动态添加了一个age属性,通过调试打印发现对象里的age属性已经添加了上了,但试图中却没有展示出来,…

有了这款开源的电子签就再也不用重复造轮子了!

程序员的公众号&#xff1a;源1024&#xff0c;获取更多资料&#xff0c;无加密无套路&#xff01; 最近整理了一份大厂面试资料《史上最全大厂面试题》&#xff0c;Springboot、微服务、算法、数据结构、Zookeeper、Mybatis、Dubbo、linux、Kafka、Elasticsearch、数据库等等 …

LeetCode刷题之105. 从前序与中序遍历序列构造二叉树

文章目录 1.题目描述2. 分析2.1 前序遍历2.1.1 什么是前序遍历&#xff1f;2.1.2 前序遍历有什么特点&#xff1f; 2.2 中序遍历2.2.1 什么是中序遍历2.2.2 中序遍历有什么特点&#xff1f; 2.3 后序遍历2.3.1 什么是后序遍历&#xff1f;2.3.2 特点 2.4 总结 3. 解法 1.题目描…

职场成功的关键因素:如何成为一位优秀的职场人

在竞争激烈的职场环境中&#xff0c;如何脱颖而出&#xff0c;成为一位优秀的职场人&#xff0c;成为了许多职场人士关注的焦点。本文将探讨职场成功的关键因素&#xff0c;帮助您在职场中取得更好的发展。 一、专业技能 专业技能是职场成功的基础。具备扎实的专业技能&#xf…

D-ID介绍以及订阅教程

D-ID 是一家提供人工智能仿真人视频产品服务和开发的公司。 用户只需上传人像照片&#xff0c;输入要说的内容&#xff08;台词&#xff09;&#xff0c;D-ID 就能利用AI 语音机器人自动将用户输入的文字转换成音频&#xff0c;用户甚至还能直接上传录音文件&#xff0c;快速获…

[Mac]安装App后“XX已损坏,无法打开“

问题&#xff1a; “xx.app”已损坏&#xff0c;无法打开。你应该将它移到废纸篓。 解决&#xff1a; 终端输入sudo xattr -r -d com.apple.quarantine 后将Applications中对应的问题app拖入生成路径&#xff0c;然后执行。 $ sudo xattr -r -d com.apple.quarantine /Appli…

做抖店什么东西好卖?什么商品赚钱?抖音小店的选品标准来了!

哈喽~我是电商月月 做抖店&#xff0c;选品决定了一切&#xff01; 而从没接触过抖店的新手朋友&#xff0c;根本不知道什么样的商品才能算的上是好商品 在这里&#xff0c;我不敢告诉大家这个商品好卖&#xff0c;你们快去卖&#xff01;店铺的情况不同&#xff0c;运营方式…

蓝桥杯算法题:练功

【问题描述】 小明每天都要练功&#xff0c;练功中的重要一项是梅花桩。 小明练功的梅花桩排列成 n 行 m 列&#xff0c;相邻两行的距离为 1&#xff0c;相邻两列的距离也为 1。 小明站在第 1 行第 1 列上&#xff0c;他要走到第 n 行第 m 列上。小明已经练了一段时间&#xff…

如何使用固定公网地址SSH远程访问本地内网openEuler系统

文章目录 1. 本地SSH连接测试2. openEuler安装Cpolar3. 配置 SSH公网地址4. 公网远程SSH连接5. 固定连接SSH公网地址6. SSH固定地址连接测试 欧拉操作系统(openEuler, 简称“欧拉”)是面向数字基础设施的操作系统,支持服务器、云计算、边缘openEuler是面向数字基础设施的操作系…

xgo: golang基于-toolexec实现猴子补丁

注&#xff1a; 转载请注明出处&#xff0c; 原文链接。 概述 在这篇博客中&#xff0c;我将详细介绍 xgo 的实现细节。 如果你不知道&#xff0c;xgo 项目位于 https://github.com/xhd2015/xgo。 它的作用很简单&#xff0c;就是在每个 Go 函数的开头添加拦截器&#xff0…

【C++】手搓 list 容器

送给大家一句话&#xff1a; 若结局非你所愿&#xff0c;就在尘埃落定前奋力一搏。—— 《夏目友人帐》 手搓 list 容器 1 前言1. 1 底层结构1.2 使用场景1.3 功能简介 2 框架搭建2.1 节点类2.2 list 类2.3 迭代器类 3 功能实现3.1 begin() 与 end()3.2 插入操作3.3 删除操作…

Ps 滤镜:查找边缘

Ps菜单&#xff1a;滤镜/风格化/查找边缘 Filter/Stylize/Find Edges 查找边缘 Find Edges滤镜能够突出图像中的边缘&#xff0c;同时保留原图的颜色信息。 “查找边缘”滤镜通过分析图像的色彩和亮度变化来识别边缘。 这种处理方式使得图像的主要轮廓以一种艺术化的线条形式被…

SAP ABAP-BOPF基础培训-02 导入、节点和关联

1. 介绍-Introduction 业务对象实例示例&#xff1a;本次案例主要探讨客户发票业务对象内容。ESR中建模的业务对象示例&#xff1a; 发票的结构和属性在ESR中建模。在使用业务对象之前&#xff0c;我们需要首先实现该模型的所有功能。 2. 导入业务对象代理-Importing a Bus…

力扣刷题 二叉树层序遍历相关题目

NO.107 二叉树的层次遍历 II 给定一个二叉树&#xff0c;返回其节点值自底向上的层次遍历。 &#xff08;即按从叶子节点所在层到根节点所在的层&#xff0c;逐层从左向右遍历&#xff09; 示例 1&#xff1a; 输入&#xff1a;root [3,9,20,null,null,15,7] 输出&#xff1…

面试题:volatile

一旦一个共享变量&#xff08;类的成员变量、类的静态成员变量&#xff09;被volatile修饰之后&#xff0c;那么就具备了两层语义&#xff1a; 1. 保证线程间的可见性 保证了不同线程对这个变量进行操作时的可见性&#xff0c;即一个线程修改了某个变量的值&#xff0c;这新值…