联邦学习将如何影响您的日常生活?

news2025/1/9 16:45:06

 

人工智能 (AI) 被认为是下一次工业革命的最大创新之一,其中包括机器学习。另一方面,随着原油和电力成为现代工业的基础资源,数据成为人工智能和机器学习的关键要素。

数据隐私与需求之间的冲突
训练的数据样本的大小决定了可用于增强 AI 性能的机器学习 (ML) 结果的可靠性和准确性。然而,从互联网上获取有用的数据并不总是一件容易的事。Web 爬取通常用于为饥饿的 ML 算法提供最新的数据。然而,网络爬行有时会变成一个道德问题,例如 Facebook-Cambridge Analytica 数据丑闻。他们收集和使用个人数据影响了美国 2016 年总统大选和英国脱欧公投的结果。随后,许多国家出台了数据保护法规,例如欧洲的通用数据保护条例(GDPR),其重点是数据相关组织对个人数据的使用和保护。

什么是联邦学习
联邦学习如何解决隐私信息保护与数据需求的矛盾?

联邦学习是一种分布式学习方法,具有与传统机器学习算法相同的建模效果。然而,联邦学习不是像传统 ML 那样集中所有原始数据,而是将计算任务分发到多个节点。这种方法可以实现与传统方法相同的结果,同时将数据保存在参与者可以控制其数据和设备的本地数据库中。

让我们用一个经典的类比。ML模型是羊,数据是草。一种传统的饲养绵羊的方法是购买草并将其运送到绵羊所在的位置,就像我们购买数据集并将它们移动到中央服务器一样。然而,隐私问题和法规阻止我们物理移动数据。草不能再离开它的区域。相反,联合收入采用双重方法。我们可以让绵羊在多片草地上吃草——我们的 ML 模型是以分布式方式构建的,数据不会在其局部区域之外传播。最终,ML 模型从每个人的数据中成长,就像羊吃每个人的草一样(2020,联邦学习)。

参与联邦学习的不仅是企业服务器和 IoT 设备,还有个人设备,例如您的智能手机或 PC,具体取决于数据所在的位置。最初,参与者从组织联邦学习的服务器接收模型参数。将模型应用于参与者的本地数据,并使用结果反复更新模型,直到模型变得稳定。在下一步中,来自所有参与者的模型参数由服务器收集并集成到最终模型中。这个过程被称为联合平均算法。在整个过程中,数据从不传输;仅传输模型参数。

Cyber​​vien提供了一个联邦学习平台,允许数据库所有者利用他们停滞不前的资源,让研究人员在安全有效的环境中为他们饥饿的 AI 模型提供数据,而数据不会离开本地服务器。浙江大学Cyber​​Vein研发中心是Cyber​​Vein的技术研发总部;目标是消除数据孤岛并使数据更有价值。

Cyber​​Vein 联邦学习允许垂直和水平联邦学习。垂直联邦学习旨在增加跨数据库的样本特征维度,这些数据库可能具有相同的人但缺乏背景。水平联邦学习旨在增加跨数据库的样本量,这些数据库可能具有相同的背景但缺乏人员。两种类型的学习都使公司能够使用本地数据训练他们的模型,然后将所有公司的模型集成到一个联合模型中,在加密下分离模型,从而提高信息安全级别。

在企业之间,联邦学习为跨行业挖掘数据带来了机会,无需担心数据泄露或违反数据保护法。数据永远不会离开原始数据库。

潜在应用
汽车保险

如果您想购买汽车保险,您提供的信息对于确定您的风险等级起着至关重要的作用。汽车保险公司希望通过为每个客户设置定制的保险计划来最大限度地降低风险和最大化利润。因此,他们的数据库应该包括多方位的信息,例如来自银行机构的消费数据、来自汽车公司的IoV(车联网)数据以及来自各种来源的信用评级。数据库还需要经常更新,覆盖范围广,并包含与客户匹配的信息。然而,大多数保险公司——尤其是小型保险公司——从他们过去客户的内部历史中获得的信息很少,而且关于新客户的数据也很有限。

信息不对称会导致对所有客户的定价不公平,因为平均每个客户的总风险是解决该问题的唯一解决方案。但是,在确定保费时,有限的信息可能会产生偏差或缺陷。

通过联合学习,保险公司可以从不同部门获取信息来丰富他们的定价模型,从而创建一种准确有效的方式来动态预测风险。因此,客户可以享受低保险费率而无需承担高风险客户的风险,保险公司可以实现利润最大化。

卫生保健
Cyber​​Vein 的联邦学习平台通过其医疗大数据平台支持各种应用,例如诊断角膜炎。该算法模型可以增强医生诊断的准确性,尤其是对于经验不足的医生。诊断算法模型已通过联邦学习进行训练,因此它适用于来自不同医院的案例样本,而不会损害患者隐私或数据机密性。

由细菌、真菌和病毒引起的不同类型的角膜炎在视觉上存在细微的差异,很难用肉眼正确诊断它们并为患者确定正确的治疗方案。如果出现重大故障,患者可能会失明。经过测试的联邦学习模型实现了 80% 的诊断准确率,优于 96% 的自愿参加实验的医生。

这种新的诊断方法提高了所有医生的能力,对所有患者具有最高水平的准确性。即使是经验不足的医生也能达到与经验丰富的医生相同水平的诊断准确性。通过准确的诊断,医生可以制定合适的治疗方案,最终提高疾病的治愈率。

越来越多的国家正在实施用户数据保护政策,因此公司必须合作开发他们的人工智能,使用一种既不会牺牲人们隐私又能为所有人带来便利的新方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/137006.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CPT203-Software Engineering(2)

文章目录5. Scrum Framework5.1 Scrum Roles5.2 Scrum Activities and Artifacts6. Requirements Engineering6.1 User requirements and system requirements6.2 Functional & Non-functional requirements6.2.1 Functional requirements6.2.2 Non-functional requirement…

第一章:C++算法基础之基础算法

系列文章目录 文章目录系列文章目录前言一、排序(1)快速排序核心思想思路分析模板(2)归并排序核心思想思路分析模板稳定性时间复杂度二分查找(1)整数二分核心思想思路分析模板(2)浮点…

jetson nano系统引导安装(无外设安装方式)

文章目录一.硬件设置二.系统设置一.硬件设置 插入烧写好系统的SD卡将micro USB线接到jetson nano上,另一端USB A接到电脑上为jetson nano插入电源,开机等待电脑检测到如下盘符说明jetson nano连接成功 二.系统设置 进入电脑的设备管理器,查…

【linux】三种权限的使用和更改、粘滞位和yum的使用

目录 1.权限问题 ①什么是权限? ②小问题 ③默认权限 ④如何更改“人”的权限呢? ⑤更改权限的八进制方案 ⑥强制改权限里的“人”(权限人文件属性) 2.粘滞位 2.yum的使用 1.权限问题 ①什么是权限? 权限人&a…

HTTP协议解析

HTTP概述 HTTP (全称为 "超文本传输协议") 是一种应用非常广泛的应用层协议~~我们平时打开一个网站, 就是通过 HTTP 协议来传输数据的。 HTTP工作过程: 当我们在浏览器中输入一个 "网址",此时浏览器就会给对应的服务器发送一个 H…

CTF中的PHP特性函数(上)

前言 对于PHP大家一定不陌生,但你知道PHP在CTF中是如何考察的吗,本文给大家带来的是通过PHP特性来进行CTF比赛中解题出题的知识,会介绍一下CTF中常见的php特性以及围绕该知识点的相关案例,因为内容过多这里分成上中下三篇来讲&am…

操作系统的特征

文章目录🎀前言:本篇博客知识总览🍔并发🎇概念:🍔共享🎇概念:🍔虚拟🎇概念:🍔异步🎇概念:🏳️‍&a…

ThinkPHP 多应用模式之Api路由分组+中间件

ThinkPHP 6.1 在多应用模式下实现API路由分组中间件验证业务 目录 1.创建中间件文件 2.迁移中间件到子应用目录中 3.编辑中间件验证业务 修改命名空间 编写handle处理代码 4.注册中间件 编辑中间件文件 TP内置中间件 5.设置路由分组 优化相同控制器前缀 最终效果&am…

【信息论与编码 沈连丰】第六章:连续信息和连续信道

【信息论与编码 沈连丰】第六章:连续信息和连续信道第六章 连续信息和连续信道6.1 连续消息的信息6.2 连续消息在信道上的传输问题6.3 香农信道容量公式6.4 连续消息的识别和理想接收机6.5 连续信源的数字处理及其编码第六章 连续信息和连续信道 6.1 连续消息的信息…

在 KubeSphere 上部署 OpenLDAP 并进行对接使用

在 KubeSphere 上部署 OpenLDAP 并进行对接-进阶背景前置条件KubeSphere 中部署 LDAP部署 LDAP 应用ApacheDirectoryStudio 验证 LDAP下载部署 ApacheDirectoryStudioApacheDirectoryStudio 测试 LDAP创建 Ldap Search ,KS 对接时可选择使用KubeSphere 对接 LDAPHar…

【区块链 | EVM】深入理解学习EVM - 深入Solidity数据存储位置:内存

图片来源: Mech Mind on Unsplash 这是深入Solidity数据存储位置系列的另一篇。在今天的文章中,我们将学习EVM内存的布局,它的保留空间,空闲内存指针,如何使用memory引用来读写内存,以及使用内存时的常规最佳做法。 我们将使用 Ethereum Name Service (ENS)中的合约代码…

实模式和保护模式的区别

实模式和保护模式的区别 实模式和保护模式的来历 最早期的8086 CPU只有一种工作方式 ---- 实模式。数据总线为16位,地址总线为20位。实模式下所有寄存器都是16位。 从80286开始就有了保护模式,从80386开始CPU数据总线和地址总线均为32位,而且…

开发板测试手册——SPI FLASH 读写、USB WIFI 模块(2)

目录 1.8 SPI FLASH 读写测试 20 1.9 USB 接口读写测试 21 1.10 网络接口测试 23 1.10.1 网络连通测试 23 1.10.2 网络速度测试 25 2 网络静态 IP 设置 27 3 USB WIFI 模块测试 31 3.1 WIFI STA 功能测试 32 3.2 WIFI AP 功能测试 35 3.3 USB WIFI 驱动编译 39 前 言…

scikit-learn线性模型之线性回归

scikit-learn线性模型之线性回归线性回归参考文献线性回归 有监督学习中主要解决两个问题,一个是分类,另一个是回归。 在回归问题中,我们需要利用我们已知的特征 x1,x2,...,xpx_1,x_2,...,x_px1​,x2​,...,xp​ 去预测我们的目标变量 yyy 。…

隐私计算一体机,金融大数据规模商用的催化剂

一股隐私计算的浪潮正席卷金融行业。 银行通过隐私计算引入外部不动产数据,与行内贷款企业的时点贷款余额、注册资本等数据联合建立企业贷中预警监测模型,提升银行风险监测业务能力;银行利用联邦学习与互联网公司的客户特征数据完成联合建模…

Linux:使用telnet命令提示:Connection refused

我是 ABin-阿斌:写一生代码,创一世佳话,筑一览芳华。如果小伙伴们觉得不错就一键三连吧~ 下一篇:Linux安装telnet命令教程 文章目录一、分析没有xinetd服务:二、讲解: 什么是 telnet 命令具体语法具体参数三…

Node.js--》如何在Node.js中操作MySQL

目录 数据库 MySQL的安装与配置 SQL管理数据库 WHERE子句 AND和OR ORDER BY子句 COUNT(*)函数 在Express项目中操作MySQL 数据库 数据库(database)是用来组织、存储和管理数据的仓库。当今世界是一个充满着数据的互联网世界,充斥着大量的数据。数据的来源有…

算法拾遗二十三之暴力递归到动态规划一

算法拾遗二十三之暴力递归到动态规划一题目一优化Code(空间换时间)优化二题目二优化一(缓存法)优化三(严格表优化)题目一 假设有排成一行的N个位置,记为1~N,N 一定大于或等于 2 开始…

Softing与Portainer合作,为工业物联网提供灵活高效的机器连接管理解决方案

Softing工业自动化成为了Portainer的增值经销商。Portainer.io是一个用于管理容器软件应用的平台,而Softing连接产品与其相结合可以使用户更轻松地管理工业物联网解决方案。 (左边:Thomas Hilz,Softing工业自动化常务董事&#xf…

创建odoo15项目

Odoo 提供了一种机制来帮助建立一个新模块 python 启动项目名称 scaffold 模块名称 模块创建的文件夹如下两种方式: 1)可新建manage.py文件来启动脚手架 import os import sysLIB_PATH os.path.join(os.path.split(os.path.realpath(__file__))[0], .…