【隐私计算篇】全同态加密应用场景案例(隐私云计算中的大模型推理、生物识别等)

news2024/12/30 2:13:51

1.题外话

        最近因为奖项答辩,一直在忙材料准备,过程非常耗费时间和精力,很难有时间来分享。不过这段时间虽然很忙碌,但这期间有很多新的收获,特别是通过与领域内专家的深入交流和评审过程,对密码学和隐私计算领域有了更深层次的理解。此外,也体会到工作中严谨和科学的工作方法的重要性。

2. 全同态加密应用案例

2.1 关于全流程加密、密算云的讨论

        近期在全同态加密算法的一些实践,特别是利用GPU来加速密文的处理(可以看下前段时间分享的《替换半同态使用全同态加速计算联邦机器学习算法的实证分析及性能对比》)。在此过程中,全同态加密算法进行了多方面的改进,性能效率显著优化。让我们看到全同态在联邦机器学习、联邦深度学习上的性能潜力。

        近期行业内逐步出现密算云的实践,我称之为“隐私云计算”。密算是指整个数据以密算形式流通,保障它在存储计算、运维研发全链路是安全可控的【1】。全链路密算的概念,和2022年富数科技以及腾讯、2023年蓝象智联提出的全匿踪联邦学习、全链路加密处理【2】有相似之处,都强调全流程的安全可控以及密态形式数据流转,而不再是原来追求隐私计算的片面安全性,关于隐私计算的片面安全性,可以参考阅读《隐私计算使用不当也会泄露原始数据》。

2.2 关于全同态加密算法及应用案例

2.2.1 全同态加密算法略谈

        关于全链路密算的隐私计算模式,全同态加密算法是一种可行解。 全同态加密(Fully Homomorphic Encryption, FHE)允许对加密数据进行计算,而无需解密。这种特性使得在处理敏感数据时,可以在保护数据隐私的同时,仍然能够执行必要的计算操作。

        全同态加密的工作原理是,通过对数据进行加密后,任何对这些加密数据的计算结果都可以在不泄露原始数据的情况下,得到与直接在明文上计算相同的结果。这使得它在云计算和分布式计算环境中,面向需要保护用户隐私的场景中,有很好的应用潜力。

        在全链路密算中,全同态加密能够有效解决数据传输和存储中的隐私问题。无论是在数据收集、传输还是存储阶段,数据始终保持加密状态,避免了数据在传输过程中的潜在泄露风险。此外,通过全同态加密,参与方可以在保持各自数据隐私的前提下,协同完成复杂的计算任务,实现数据共享与合作。

        全同态加密算法,目前主流和常用的主要是BFV以及CKKS。其中BFV(Brakerski/Fan-Vercauteren)方案主要面向整数向量进行密文处理。基于 CKKS(Cheon-Kim-Kim-Song)方案则是面向实数向量进行密文处理。密文处理又涉及密文 - 密文向量以及密文 - 明文向量进行逐元素的加法、减法和乘法操作, 点积和矩阵乘法等【4】。

2.2.2 全同态加密算法应用案例

        【3】中介绍了几种密算云的应用案例,感觉不错,这里做下分享。

2.2.2.1 案例1--大模型密算

        大模型(云)能够辅助完成各种任务,从训练成本和实用功能的角度来看,具有显著的数据价值,通常作为通用服务提供给用户。然而,大模型应用中一个备受关注的问题是,用户提供给模型的输入可能包含敏感信息。当用户以明文形式输入这些信息时,一方面,模型服务方(云)可能直接获取这些敏感数据;另一方面,模型可能学习到输入内容,从而导致进一步的信息泄露。关于这一点,我会在后续的大模型评估中谈到,其实模型评估的时候也会遇到类似问题,你的prompt很快就会被作为微调或者训练语料被记忆到大模型中,导致静态评估的失效。

        为了解决这一问题,可以采用全同态加密技术。用户可以将自己的输入信息进行全同态加密,然后在密文状态下执行大模型的推理计算,从而生成密文形式的回答。最终,用户可以解密该回答,获得明文内容。在整个过程中,用户的输入和输出信息都得到了有效保护,未发生泄漏。同时,模型所有方也确保了计算过程在自己的服务器上进行,避免了模型信息的泄露。

2.2.2.2 案例2--生物识别

        关于生物识别,之前我们介绍了利用MPC实现人脸识别的案例,对VGG16深度学习模型进行密态推理,可以参考《利用多方安全计算MPC实现VGG16人脸识别隐私推理》。而本案例提出基于全同态加密的方式进行处理。

        公有云平台提供人脸识别及人脸数据库管理服务,应用方(如 APP 公司)可以将用户的人脸数据库委托给公有云进行管理。云平台不仅提供数据库的查询和修改服务,还提供人脸图像的比对、定位和分析等 AI 模型服务。由于人脸数据属于个人生物信息,相关法规要求使用人脸识别技术的产品必须确保人脸数据的安全。针对这一场景,可以采用全同态加密技术,以支持在密文状态下对人脸数据库进行处理和推理。通过将人脸数据库以密文形式托管,不仅可以确保应用方用户的个人数据隐私不被公有云泄露,还能有效防止潜在黑客获取存储在公有云数据库中的敏感信息。在MPC方案中,是通过对数据进行碎片化分布式保存,也就是黑客只要没有拿到全部的碎片或者说没有达到原始数据的恢复碎片数量阈值,就不可能窃取到明文人脸数据。基于全同态加密和安全多方计算实现数据安全保护的方式还是有比较大的差异的。

2.2.2.3 案例3--医疗数据

        基因数据是现代医学研究和疾病诊断的重要组成部分,但同时也涉及到个人隐私的关键数据。在基因诊断应用中,用户需提供自己的基因数据,但必须防止数据泄漏。同时,医疗机构(云)提供的生物信息算法也是其重要资产,机构同样希望保护这些信息不被泄露。通过使用全同态加密算法,用户可以将自己的基因片段加密后发送给医疗机构(云)。医疗机构(云)在密文状态下执行生物信息算法,并将所得结果返回给用户。用户随后解密结果,便可以获得诊断信息。在这一过程中,双方的隐私得到了有效保护,同时用户所获得的诊断结果与在明文数据下的结果一致。

        同样这个模式也适用其他敏感的医疗场景隐私数据的处理,比如用户关于某种自身罕见疾病的信息查询。

3. 参考材料

【1】大模型密算平台(隐语)

【2】全匿踪联邦学习(富数、腾讯、蓝象、洞见等)

【3】全同态密码云计算平台(格物)

【4】全同态加密张量运算库解读

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2228919.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

elasticsearch 8.x 插件安装(三)之拼音插件

elasticsearch 8.x 插件安装(三)之拼音插件 elasticsearch插件安装合集 elasticsearch插件安装(一)之ik分词器安装(含MySQL更新) elasticsearch 8.x插件(二)之同义词安装如何解决…

mac-ubuntu虚拟机(扩容-共享-vmtools)

一、磁盘扩容 使用GParted工具对Linux磁盘空间进行扩展 https://blog.csdn.net/Time_Waxk/article/details/105675468 经过上面的方式后还不够,需要再进行下面的操作 lvextend 用于扩展逻辑卷的大小,-l 选项允许指定大小。resize2fs 用于调整文件系统的…

2024 年 11 个最佳开源网络爬虫和抓取工具

用于网络爬行的免费软件库、软件包和 SDK?或者它是您需要的网络抓取工具吗? 嘿,我们是 Apify 。您可以在 Apify 平台上构建、部署、共享和监控您的抓取工具和爬虫。 来看看我们吧。 如果您厌倦了专有网络抓取工具的限制和成本,或者厌倦了被单一供应商锁定,开源网络爬虫和…

Centos安装ZooKeeper教程(单机版)

本章教程介绍,如何在Centos7中,安装ZooKeeper 3.9.3版本。 一、什么是ZooKeeper ? Apache ZooKeeper 是一个分布式协调服务,用于大型分布式系统中的管理和协调。它为分布式应用提供了一个高性能的通信框架,简化了开发人员在构建复杂分布式系统的任务。ZooKeeper 能够解决一…

检索引擎Elasticsearch

一.为什么要用Elasticsearch 由于我们在运行我们的项目的时候通常都是将数据存到mysql或者sql serve等数据库中,在进行数据搜索时使用sql 语句 like进行模糊匹配查询,其一:虽然可以查到数据,但是它模糊匹配查询速度较慢&#xff0…

CentOS9 Stream 支持输入中文

CentOS9 Stream 支持输入中文 方法一:确保 gnome-control-center 和相关组件已更新方法二:手动添加输入法源配置方法三:配置 .xinputrc 文件方法四:检查语言包 进入centos9 stream后,点击右上角电源键,点击…

基于PHP的http字段查询与注册(V1)(持续迭代)

目录 版本说明: 实现环境(WAMP): 数据库链接 查询页面 php处理逻辑 字段添加 版本说明: 该查询功能以查询http首部字段为目的实现的字段属性、字段内容的查询,以及对新字段信息的数据注册。 v1实现…

无人机之集群控制方法篇

无人机的集群控制方法涉及多个技术和策略,以确保多架无人机能够协同、高效地执行任务。以下是一些主要的无人机集群控制方法: 一、编队控制方法 领航-跟随法(Leader-Follower) 通过设定一架无人机作为领航者(长机&am…

jenkins搭建及流水线配置

1.安装docker curl https://mirrors.aliyun.com/repo/Centos-7.repo >> CentOS-Base-Aliyun.repomv CentOS-Base-Aliyun.repo /etc/yum.repos.d/yum -y install yum-utils device-mapper-persistent-data lvm2yum-config-manager --add-repo http://mirrors.aliyun.com/…

Python+Playwright(Nuitka、Pyinstaller打包)

安装驱动 playwright install # 这个安装所有默认的浏览器 playwright install chromium # 一般只装这一个浏览器就够了,要是装另外两个浏览器,后面的参数名可以修改查看各个驱动的位置 playwright install --dry-run创建打包目录 在运行的包里面…

一篇文章理解CSS垂直布局方法

方法1&#xff1a;align-content: center 在 2024 年的 CSS 原生属性中允许使用 1 个 CSS 属性 align-content: center进行垂直居中。 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewpo…

《鸿蒙生态:机遇与挑战并行,创新引领未来》

《鸿蒙生态&#xff1a;机遇与挑战并行&#xff0c;创新引领未来》 一、鸿蒙生态崛起&#xff1a;机遇涌现&#xff08;一&#xff09;技术创新引领潮流&#xff08;二&#xff09;市场潜力巨大 二、抓住机遇的策略&#xff08;一&#xff09;开发者的黄金时代&#xff08;二&a…

Fakelocation 步道乐跑(Root真机篇)

前言:需要 Fakelocation&#xff0c;真机Root,步道乐跑&#xff0c;Dia&#xff0c;MT管理器系统需求 Fakelocation | MT管理器 | Dia | 环境模块 任务一 真机Root&#xff08;德尔塔&#xff0c;过momo&#xff0c;刷环境模块&#xff09; 任务二 前往Dia查看包名&#xff08…

docker离线安装达梦数据库

文章目录 下载达梦数据库docker镜像上传DM8镜像文件将DM8镜像导入到本地docker镜像仓库中查看本地docker镜像仓库是否存在DM8镜像带参数启动DM8docker启动DM8默认用户名/密码 下载达梦数据库docker镜像 达梦数据库官网 https://www.dameng.com/ 点击下载中心&#xff0c;选择D…

SD教程 ControlNet之OpenPose

ControlNet 是神经网络结构&#xff0c;用于控制预训练的大型扩散模型&#xff0c;以支持额外的输入条件。ControlNet 以端到端的方式学习任务特定的条件&#xff0c;即使训练数据集很小&#xff08;< 50k&#xff09;&#xff0c;学习也是稳健的。此外&#xff0c;训练一个…

HarmonyOS:自定义组件冻结功能

一、简介 自定义组件冻结功能专为优化复杂UI页面的性能而设计&#xff0c;尤其适用于包含多个页面栈、长列表或宫格布局的场景。在这些情况下&#xff0c;当状态变量绑定了多个UI组件&#xff0c;其变化可能触发大量UI组件的刷新&#xff0c;进而导致界面卡顿和响应延迟。为了提…

智慧工地:标准化、信息化、数字化与智能化的融合与实践

智慧工地&#xff0c;作为智慧地球理念在工程领域的具体实践&#xff0c;代表了一种全新的工程全生命周期管理方式。 智慧工地是建筑行业数字化转型的重要方向&#xff0c;它通过应用物联网、大数据、云计算、人工智能等新兴技术&#xff0c;对建筑工地进行数字化、信息化、智…

网络编程 TCP编程 Linux环境 C语言实现

所有基于数据传输通信的程序&#xff0c;都会被分成两种角色&#xff1a; 1. 服务端&#xff1a;又称为服务器 server 提供一种通信服务的进程 基本工作过程是&#xff1a;1> 接收请求数据 2> 处理请求数据 3> 发送处理结果 2. 客户端&#xff1a;client 使用一种通…

Docker 安装HomeAssistant智能家居系统

HomeAssistant 介绍 简介 Home Assistant是一个自由开源的智能家居自动化平台&#xff0c;它可以控制并监测各种智能家居设备、传感器和其他物联网设备。Home Assistant可以运行在树莓派、NVIDIA Jetson Nano等低功耗设备上&#xff0c;使用户可以快速搭建自己的智能家居系统。…

vim的使用方法

常见的命令可参考&#xff1a; Linux vi/vim | 菜鸟教程​www.runoob.com/linux/linux-vim.html​编辑https://link.zhihu.com/?targethttps%3A//www.runoob.com/linux/linux-vim.html 1. vim的工作模式 vi/vim 共分为三种模式&#xff0c;命令模式、编辑输入模式和末行&am…