我的隐私计算学习——联邦学习(5)

news2024/10/6 14:32:13

笔记内容来自多本书籍、学术资料、白皮书及ChatGPT等工具,经由自己阅读后整理而成。


(七)联邦迁移学习

​ 相关研究表明,联邦迁移学习不需要主服务器作为各参与方间的协调者,旨在让模型具备举一反三能力,在各参与方样本空间以及特征空间均存在较少交叉信息的情况下,使用迁移学习算法互助地构建模型,可解决标签样本少和数据集不足的问题,例如,某国电商平台与其他国家银行间的数据迁移场景,联邦迁移学习可以很好地解决数据交流问题。联邦迁移学习模式使用某参与方在当前迭代中已训练好的模型参数,迁移到另外一个参与方上,协助其进行新一轮模型训练。联邦迁移学习的主要步骤如下:

(1)参与方根据自身数据集,构建本地模型,获得数据表征,以及一组中间结果,加密后发送给其他参与方;
(2)其他参与方利用接收到的中间结果计算模型的加密梯度和损失值,加入掩码后发给原参与方,解密并更新各自的模型。

​ 不断重复以上的步骤,直至损失函数收敛。在此过程中,相当于每个参与方都利用了其他参与方的当前模型和数据潜在的表征来更新各自的本地模型,买现了迁移学习的联邦模式,即联邦迁移学习。一般而言,联邦迁移学习还可以分为以下几种:

  1. 基于样本的联邦迁移学习

    各参与方通过有选择地调整用于训练的样本权重来减少不同参与方样本之间分布的差异性,协同地训练得到一个联邦迁移模型。

  2. 基于特征的联邦迁移学习

    通过最小化不同参与方之间的样本分布差异性或特征差异性来协同学习一个共同的特征空间,并以此特征空间来降低分类类别数或回归误差来实现联邦迁移模型的构建。

  3. 基于参数的联邦迁移学习

    各参与方利用其他参与方的模型信息或先验关系来初始化或更新本地模型,以此借鉴其他参与方的数据表征和知识。

  4. 基于相关性的联邦迁移学习

    对不同参与方的知识或特征空间进行相关性映射,并按照相关性顺序来利用其他参与方的知识映射更新本地模型,以此借鉴更多的知识。

​ 总之,相较于传统的迁移学习,联邦迁移学习最大的特点是:基于多参与方的数据表征进行建模,但各参与方的原始数据不允许流向其他参与方,有效保护用户数据的隐私性和安全性。

(八)值得关注的联邦学习项目

image-20230328192155301

​ 除此之外,还有基于 Python 实现的视觉横向联邦开源框架 FedVision、基于 TensorFlow 的 TFF 框架、百度公司的 PaddleFL 框架、华控青交的 PrivPy 隐私计算平台、MesaTEE 安全计算平台 Teaclave、Conclave 查询系统、……

(九)联邦学习的落地应用方向

​ 上面所述的横向联邦学习,典型案例是手机的输入法预测技术和视觉目标检测技术。纵向联邦学习中,典型案例则是银行和电商平台联合训练的推荐系统。企业之间多以纵向联邦学习的方式为主。

  • 联邦学习 + 智慧金融
    • 银行(智能营销系统、智能贷款风险管理、银行反欺诈检测系统……推荐更为个性化的银行产品。)
    • 保险(车险出险概率预测、个性化健康险定制……预测出险率,使车辆和居民承保及定价更合理。)
    • 投资(基金、证券行业可以通过联邦学习获取更多维度的特征,从而进行更加精准的市场走势预测。)
  • 联邦学习 + 智慧医疗
    • 医疗影像诊断(对大量影像特征、患者年龄、病史记录等信息,给出精准的综合判断和识别结果。)
    • 疾病风险预测(建立统计模型来预测具有某些特征的人群在未来某种事件下或时间范围内患病的概率。)
    • 药物挖掘(引入结合药物分子活性预测模块和药物分子活性筛选模块进行建模,增加分子活性预测的准确率,极大提升了药物开发的效率和效果。)
    • 医护资源配置(根据患者个人信息预测其所需医护资源,进而提前部署,完成医护资源的配置。)
  • 联邦学习 + 智慧城市
    • 零售(学习用户的偏好和近期搜索,个性化产品推荐;根据销售模型进行销量预测和具体的商品定价;实现精准的广告投放,实现精准营销。)
    • 交通(供实时服务,准确预估通过当前路段的时间,估算当前路口的车流量,进而优化出行路径。)
    • 物流(收集所有的基础销售数据,加入联合训练中,就可以准确预测在接下来一段时间内消费者的消费趋势与动向。)
    • 政府(声纹案件侦破、电力资源调度……实现跨市联合、跨省联合等。)
    • 安防(多家工厂联合训练,进行风险预测,实现提前预警。通过摄像头的实时图像传输,保证内部工作人员防护合格,降低事故发生率。)
  • 联邦学习 + 物联网
    • 车联网(高精度判断车辆队列分布,帮助有效缩短车辆队列长度,优化道路资源配置。)
    • 智慧家居(将不同企业的产品数据、用户特征数据等进行多维度联合建模,节约研发成本,还可以进行技术创新,提升用户体验感和满意度。)
    • 可穿戴设备(根据异常数据快速预测出用户可能存在的疾病,提示用户健康隐患,医生根据设备中的日常记录,给出全面专业的诊疗意见。)
    • 机器人(实现语音客服机器人的多轮对话技术,解决各平台数据共享的问题。)

(十)联邦学习的研究展望

总的来说,联邦学习未来的发展可着眼于以下几个方面:

  1. 面向资源受限场景的应用研究

    ​ 联邦学习的本质是一个分布式机器学习框架,网络通信是分布式节点间共同训练机器学习模型的重要基础,然而以边缘计算为代表的资源受限生产环境普遍存在。网络连接状态直接影响通信效率,需要设计灵活的本地模型更新方式、部分联邦学习参与方的选择机制、负载容错机制、模型压缩方法、模型协同训练方式,以解决存储、计算、网络连接、续航能力等资源受限带来的应用问题。

  2. 面向云边端一体化的联邦学习

    ​ 由于 5G 通信、边缘计算等技术的发展,云边端一体化架构已成为信息技术服务的趋势;同时,泛在连接的终端促使大量异构终端接入联邦学习体系;如何高效融合资源,改进联邦学习的架构、机制、模式是重要的研究方向。

  3. 联邦学习的数据建模

    ​ 数据联邦学习面临大量跨设备、非均匀、非独立同分布数据,需要在保证准确性和公平性前提下解决异构数据建模的非凸优化问题;同时,深入研究元学习和多任务学习等方法有助于数据的统计异质性建模。此外,基于异构数据的联邦学习要提升共享模型训练过程的收敛性。

  4. 严格的隐私安全

    ​ 造成数据孤岛的一个重要原因就是数据隐私安全限制,而联邦学习可为各参与方提供数据隐私保护,将私有数据保留在本地。然而这需要在更精细级别上定义隐私,例如,本地或全局级别的隐私,以保证不同场景下联邦学习模型的准确性。此外,可以通过区块链的共识机制解决联邦学习参与方间的信任问题,建立最小信任模型。

  5. 合理的激励机制

    ​ 在企业之间的联邦学习合作落地进程中,设计一个合理的、被广泛认可的纵向联邦学习激励机制,让参与到联邦建模的设备能获得额外的汇报,是迫切的需求,有着重要的商业意义。

  6. 与区块链联合

    ​ 联邦学习旨在创造价值,而区块链旨在表示和转移价值。有以下两种基本结合方式,即攻击溯源和收益分配。第一种结合是利用区块链的记录不可被篡改的特性,对联邦学习合作方可能面临的恶意攻击进行追溯和惩罚。例如,多个参与方进行联邦学习的同时,部署区块链用于记录联邦学习的数据指纹(包括建模样本、推理样本、交互信息),而对应的原始数据存储于参与方本地。当发现有样本遭受恶意攻击时,由参与方或者第三方组成调查组,依据区块链记录的指纹对原始数据进行核验。第二种结合是利用区块链的价值表示和转移功能,对联邦学习服务所创造的价值进行记账和收益分配。例如,多个参与方进行联邦学习的同时,部署区块链用于记录服务的接口调用日志指纹、各个参与方的贡献、该服务所产生的收益,并通过智能合约自动将收益分配给各个参与方。

关于联邦学习,除了以上提及的横向联邦学习、纵向联邦学习和联邦迁移学习,还可以扩展延伸以下两个方向:

  • 联邦持续学习(不遗忘之前学习到的知识)
  • 联邦强化学习(联邦学习与深度神经网络相结合)
  • 链式联邦学习(联邦学习与区块链相结合)
  • 元学习(与模型无关的联邦学习)

2023年10月份新开了一个GitHub账号,里面已放了一些密码学,隐私计算电子书资料了,之后会整理一些我做过的、或是我觉得不错的论文复现、代码项目也放上去,欢迎一起交流!Ataraxia-github

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1412121.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++ 11 多线程库初步学习

在C11标准中&#xff0c;可以简单通过使用thread库&#xff0c;来管理多线程。 thread库可以看做对不同平台多线程API的一层包装&#xff1b;因此使用新标准提供的线程库编写的程序是跨平台的。 使用时需要#include <thread>头文件&#xff1b; #include <iostream&g…

【SpringCloud Nacos】 微服务治理介绍及Nacos引入初体验

文章目录 前言服务治理介绍什么是服务治理1、服务发现2、服务配置3、服务健康检测 常见的注册中心ZookeeperEurekaConsulNacos Nacos 简介Nacos 实战入门搭建nacos环境1、安装nacos2、配置nacos3、访问nacos 将商品微服务注册到 nacos1、在 pom. xml 中添加 nacos 的依赖2、在主…

Pycharm2023.3.2使用conda创建工程

1 conda环境 举个例子&#xff0c;创建一个环境&#xff0c;名叫Pytorch&#xff0c;使用的python版本是3.7 &#xff08;1&#xff09;创建环境 conda create -n Pytorch python3.7&#xff08;2&#xff09;激活环境 conda activate Pytorch&#xff08;3&#xff09;查看…

小型商用机器人,如何做到小而强?

兼顾体型和性能。 体型和性能的矛盾 一直以来&#xff0c;商用清洁机器人的应用场景主要集中在大型商场、超市、写字楼等&#xff0c;为什么1000平米以下的小型商超等中小场景却很少涉足&#xff1f;原因可以说有很多&#xff0c;但核心为两方面&#xff0c;一方面&#xff0…

windows?linux?如何使用JMeter

windows?linux?如何使用JMeter 安装JMeter的步骤以GUI模式启动JMeter如何在非GUI模式下运行JMeter在linux中使用JMeter 安装JMeter的步骤 JMeter 是一个纯 Java应用程序&#xff0c;应该在任何具有兼容Java实现的系统上正确运行。 安装 JMeter 的步骤 步骤1&#xff09;安…

网络安全防御保护实验(一)

目录 一、规划ip地址 二、配ip地址 三、交换机和防火墙的配置 四、进行测试 实验要求&#xff1a;防火墙向下使用子接口连接生产区和办公区&#xff0c;所有分区设备可以ping通网关。 一、规划ip地址 二、配ip地址 三、交换机和防火墙的配置 四、进行测试

IP被封怎么办?访问网站时IP被阻止?解决IP禁令全方法

相信很多人遇到过IP禁令&#xff1a;比如你在访问社交媒体、搜索引擎或电子商务网站时会被限制访问&#xff0c;又或者你的的账号莫名被封&#xff0c;这些由于网络上的种种限制我们经常会遭遇IP被封的情况&#xff0c;导致无法使用继续进行网络行动。在本文中&#xff0c;我们…

Android开发修炼之路——(一)Android App开发基础-1

本文介绍基于Android系统的App开发常识&#xff0c;包括以下几个方面&#xff1a;App开发与其他软件开发有什么不一样&#xff0c;App工程是怎样的组织结构又是怎样配置的&#xff0c;App开发的前后端分离设计是如何运作实现的&#xff0c;App的活动页面是如何创建又是如何跳转…

scoped属性和深度选择器

在Vue单文件组件&#xff08;SFC&#xff09;中&#xff0c;为了防止样式全局污染&#xff0c;可以给 所有的scoped的css编译出来都会变成.class[哈希值]的形式 我们只能修改带data-v-0dca3a9a作用域的样式&#xff0c;像是 如果修改el-table的宽度 .el-table {width: 60…

惠友小课堂】拇外翻常见的几个误区,来看看你中了几个?

拇外翻作为常见的足部畸形&#xff0c;在日常生活中困扰着许多人。歪脚趾不仅外观不好看&#xff0c;还会出现疼痛、影响行走运动。但大多数人对于拇外翻的认识都不足常常落入认知误区&#xff0c;快来看看你中了几个&#xff1f; 误区一 Q 我都没穿过高跟鞋&#xff0c;怎么也…

科大讯飞 再次引爆Ai

去年「科大讯飞版ChatGPT」星火大模型刚上线的时候&#xff0c;小编给大家推荐过一波&#xff0c;演示了其强大的功能&#xff0c;不少小伙伴都立马申请体验了一把&#xff0c;有小伙伴还私信我说功能非常强大&#xff0c;工作效率提高不少&#xff0c;支持国产大模型之类赞扬。…

Azure AI - 沉浸式阅读器,阅读障碍用户福音

目录 一、什么是沉浸式阅读器将内容划分开来提高可读性显示常用字词的图片突出显示语音的各个部分朗读内容实时翻译内容将单词拆分为音节 二、沉浸式阅读器如何工作&#xff1f;环境准备创建 Web 应用项目设置身份验证配置身份验证值安装标识客户端 NuGet 包更新控制器以获取令…

Dify学习笔记-工具(七)

1、工具 工具定义 工具可以扩展 LLM 的能力&#xff0c;比如联网搜索、科学计算或绘制图片&#xff0c;赋予并增强了 LLM 连接外部世界的能力。Dify 提供了两种工具类型&#xff1a;第一方工具和自定义工具。 你可以直接使用 Dify 生态提供的第一方内置工具&#xff0c;或者轻…

基于Java的高校运动会管理系统的设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言 详细视频演示 具体实现截图 技术栈 后端框架SpringBoot 前端框架Vue 持久层框架MyBaitsPlus 系统测试 系统测试目的 系统功能测试 系统测试结论 代码参考 数据库参考 源码获取 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN特邀作者、…

倍增算法笔记

主要应用场景 RMQ&#xff1a;区间最值问题 LCA&#xff1a;最近公共祖先问题 RMQ问题——区间最值 如果用数组f[N]存储,用数组a[i][j]表示从第i个数起连续 2^j 个数中的最大值,[i,i 2^j - 1],显然a[i][0] f[i],则很容易得到状态转移方程: a[i][j] max(a[i][j - 1], a[i …

免 费 小程序商城搭建之鸿鹄云商 SAAS云产品概述

【SAAS云平台】打造全行业全渠道全场景的SaaS产品&#xff0c;为店铺经营场景提供一体化解决方案&#xff1b;门店经营区域化、网店经营一体化&#xff0c;本地化、全方位、一站式服务&#xff0c;为多门店提供统一运营解决方案&#xff1b;提供丰富多样的营销玩法覆盖所有经营…

Java Web(五)--DOM

介绍 DOM 全称是 Document Object Model 文档对象模型&#xff1b; DOM 是 W3C&#xff08;万维网联盟&#xff09;的标准。 DOM 定义了访问 HTML 和 XML 文档的标准&#xff1a; "W3C 文档对象模型 &#xff08;DOM&#xff09; 是中立于平台和语言的接口&#xff0…

伊恩·斯图尔特《改变世界的17个方程》薛定谔方程笔记

想法是等这学期学到薛定谔方程后再把整份完善下。 它告诉我们什么&#xff1f; 这个方程不是把物质作为粒子&#xff0c;而是作为波&#xff0c;并描述这样的波如何传播。 为什么重要&#xff1f; 薛定谔方程是量子力学的基础&#xff0c;它与广义相对论一起构成了当今最有效的…

JAVA_EE_api_中英文对照版

点击即可下载&#xff1a; JAVA_EE_api_中英文对照版

外包干了4个月,技术退步太明显了。。。。。

先说一下自己的情况&#xff0c;本科生生&#xff0c;18年通过校招进入武汉某软件公司&#xff0c;干了差不多4年的功能测试&#xff0c;今年国庆&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能…