文章目录
- 背景
- 相关技术简介
- 区块链扩张性
- 电子病历数据安全
- 安全医疗保健的架构
- 基于可扩展区块链架构的机器学习概述
- 基于可扩展区块链架构的机器学习工作流程
- 小结
摘要 |
---|
从3.0到4.0的工业革命已经改变了医疗保健环境。患者电子健康记录(EHR)与医学研究机构共享,用于临床研究和管理国家疾病爆发。实施集中式机器学习模型的医疗保健系统面临着暴露患者私人数据的网络攻击风险。基于区块链的数据存储系统,保障电子病历数据安全。然而,去中心化系统的低事务/分钟限制了医疗保健系统的性能,并增加了网络瓶颈问题。在本文中,我们提出了一个基于机器学习的区块链架构,用于安全的医疗保健系统,使用联邦学习保护患者数据隐私,并通过添加侧链来处理不断增长的事务请求来解决区块链瓶颈问题。一个使用机器学习的本地模型在当地医院训练数据,并通过智能合约将其上传到公共医疗系统,用于全球模型训练。侧链能够提高智能合约的处理速度,减少网络中的拥塞,并增加主链中的每秒交易量。 |
背景
将人工智能(AI)、区块链和物联网(IoT)集成在一起,共同成为智能和安全医疗保健系统的基础。医疗保健4.0将患者医疗记录存储在分散的系统中,确保支持智能医疗系统的机器学习模型所需的数据安全性和数据完整性。医院存储电子病历,但用户数据隐私是公民的共同权利。因此,根据欧盟的《通用数据保护条例》(GDPR)和英国的《数据保护法》(DPA),每个患者都有权控制与外部实体共享他们的电子病历。区块链中的数据存储使用智能合约提供访问权限,需要保险组织或研究中心等外部实体在访问患者的医疗记录之前获得患者的许可。基于以太坊的区块链网络中交易请求的扩展已经从70万增长到140万,加剧了网络拥塞。智能合约审批延迟,影响分散式数据存储系统的可伸缩性。随着患者数量的增长,现有的医疗保健系统需要新的隐私保护架构以支持不断增长的数据存储和访问权限
物联网设备产生大量数据,这使得机器学习能够解决数据驱动的挑战。不断增长的数据量有助于高质量的人工智能模型支持智能产品和服务的开发。将数据上传到集中存储位置的做法影响了患者的医疗数据隐私权。执行GDPR和DPA的国家禁止与所有者未知的来源共享数据。联邦学习是谷歌提出的一种去中心化学习方法,它在本地训练数据,而不需要在不可信的集中式服务器上聚合数据。研究中心、公共医疗保健组织和医疗保健保险公司仍然无法访问患者数据。每个医院都接收一组本地学习参数,要求他们在本地训练数据,只与外部权威机构共享梯度信息。区块链技术使用双向链路,可以形成与主链连接的侧链。侧链是解决区块链可伸缩性的理想方法,因为它能够执行并行处理。侧链被用于几种加密货币中,以测试新功能或启动具有单独法规的新货币,如共识模型。数据在主链和侧链之间交换,从而支持区块链技术的可伸缩性问题。侧链区块的验证速度比主链更快,因为它的需求更少,分布式同意也更少。当受感染的侧链被充分隔离时,主链的安全性得到保护,防止任何影响主链的攻击。
本文的主要目标如下:
- 分散的联邦学习模型通过在本地训练医疗数据并将结果存储在私有的区块链中来确保医疗数据的私密性。
- 智能合约确保临床研究中心等外部实体能够访问未来的模型更新,以进行全球模型培训。
- 3.运行全球模型的公共医疗系统实现了两条侧链,负责处理智能合约和减少主链中的拥塞。
相关技术简介
区块链扩张性
最近的一些研究提出了解决医疗保健系统中的隐私问题和区块链的可伸缩性问题的解决方案。MedShare提供了一个使用区块链技术在保管人之间共享医疗数据的无信任环境。分散式技术可以对共享的医疗信息进行检查、数据推导和分析。智能合约和访问控制措施监控数据流,并在违反合同条款时撤销恶意托管人的访问权限。Medshard解决了在医疗保健系统中使用分片共享电子健康记录的区块链可伸缩性问题。网络被划分为更小的碎片,并通过在碎片内运行的共识模型并行处理事务。碎片是基于患者先前访问过的医疗服务和基于事务的分片技术形成的。LaPadula模型通过要求对等点根据分配的访问控制策略维护分类帐,解决了区块链可伸缩性的挑战。四种访问控制策略(读取、注释、删除和更新)被构造为智能合约中的条件。网络中的每个对等点不需要拥有所有交易的完整历史记录,智能合约委托发布的访问策略。hOCBS框架将医疗保健数据传输到链下进行计算和存储。研究目标是解决数据隐私和区块链可伸缩性问题。数据访问权由智能合约跟踪,出于保密和匿名的考虑,仅限患者使用。
电子病历数据安全
其他一些研究集中在使用区块链和星际文件系统维护电子健康记录的用户隐私和数据安全。基于区块链的安全存储方案使用密文策略属性加密系统管理医疗保健数据访问控制。数据存储在分散的IPFS中。公共区块链系统用于记录存储的数据哈希地址,以便将来检索数据。研究的目的是防止将来发生医疗纠纷,解决医疗过失案件。安全的电子健康记录系统着重于使用Public区块链和IPFS安全存储患者医疗数据。智能合约在患者和医疗服务提供商之间建立了一个可信的访问控制媒介。这项研究旨在防止未经授权访问私人电子健康记录。基于以太坊区块链的智能合约方案确保患者对自己的健康记录拥有唯一的访问控制权。患者的医疗记录使用对称密钥加密并存储在IPFS中。医生请求数据需要得到患者的许可,而oracle则试图计算加密密钥的哈希值。最后的解密由医生执行,并访问记录的明文形式
安全医疗保健的架构
本文旨在解决基于区块链的医疗保健系统的可伸缩性和性能问题,以及集中式机器学习模型的隐私问题。医疗保健系统实现了一个基于联邦学习的机器学习模型,以识别和跟踪医院患者中的传染病。公共医疗系统要求医院从医疗物联网设备收集数据,使用机器学习进行数据处理,并识别受感染的患者。使用卷积神经网络(CNN)训练的局部模型存储在区块链中。公共医疗系统(Public health System)要求,在使用患者的数据进行全球模型训练时,必须获得每位患者的许可。每家医院都维护一个带有侧链的Private区块链来管理智能合约。智能合约在主链上的工作量会对医院主链网络的吞吐量性能产生负面影响。Federated Learning使用Chest XRay数据集执行机器学习任务,以维护数据的隐私并支持公共医疗保健系统。
基于可扩展区块链架构的机器学习概述
图1展示了所提出的基于区块链的机器学习架构的概述。公共医疗系统旨在记录传染病传播的增长,如猴痘和Covid-19。每家医院都由几个医疗物联网设备组成,这些设备从患者那里收集数据,并将其存储在当地的私有区块链网络中。公共医疗系统传输本地模型参数,并要求每个医院使用智能合约提交其训练结果。本地模型被训练并存储在私有的区块链中。基于GDPR的用户隐私法需要患者许可才能访问电子病历。公共医疗系统和患者之间可验证的智能合约确保安全记录患者的同意,并为区块链系统中所有未来的模型更新转让访问权。
在拟议的方案中,公共医疗系统的目标是获得医院内高传染性疾病在患者中的传播程度。为了遵守GDPR政策,公共医疗系统和每家医院必须保护患者隐私。私人区块链使医院能够在医疗物联网设备的初始记录期间单独管理患者的医疗记录。此外,在本地模型训练期间,由于医院是存储数据的唯一权威和验证者,因此降低了中毒攻击的风险。区块链网络实现了侧链作为分支,以支持存储医疗数据的不断增长和频繁的交易请求,并使用智能合约在患者和公共医疗系统之间适应本地模型请求。
基于可扩展区块链架构的机器学习工作流程
基于联邦学习的机器学习模型通过在本地边缘数据中心训练模型来防止隐私问题的丢失。联邦学习模型的目标如下:
1)物联网设备提交胸部x光片和CT扫描,以检测Covid-19感染患者。
2).基于cnn的机器学习模型以图像为输入,提供正输出或负输出。
3).为训练CNN模型而收集的数据保存在医院内,存储在私人区块链。由于只有医院可以访问IIoT医疗数据,因此可以防止中毒攻击
4).最终输出存储在Private区块链网络中,以维护患者数据的私密性。
在提出的方案中,公共医疗系统发布了一个智能合约,其目标有以下两个:
1)首先,公共医疗系统设计了一个智能合约来定义所需的数据集参数、初始模型和评估标准。
2).各医院收到合同,使用与请求数据集参数匹配的数据参数对数据进行训练。
3).数据在医院本地进行训练,结果存储在私立医院区块链中。
4).其次,生成一个单独的智能合约,其中公共医疗系统需要每个患者的许可来访问使用他们的EHR记录训练的本地模型。
5).一旦提供了患者的同意,公共医疗系统就会通知医院,并获得本地模型的访问权,以进行进一步的全球模型培训。
智能合约使公共医疗系统能够构建医院中所有报告的感染性疾病患者的整体报告。智能合约建立在基于医院私人区块链网络的单独侧链上。侧链是建立在主链的基础上的,在本文中,我们假设它们是相似的构造。在我们提议的框架中,侧链的目标如下:
1).从物联网设备收集的越来越多的医疗数据需要大量的事务/秒来处理存储在块中的数据。其他块批准每个存储的患者记录的共识。
2)主链上较少的交易可以防止网络瓶颈的形成。每个医院都有一个单独的侧链,用于处理智能合同并存储从每个医院收到的本地模型。
3).随着私有区块链网络中数据量的增长,网络的可扩展性也随之增长。随着网络性能的下降,进一步的侧链被添加来支持以块记录数据。
提议的方案始于医疗物联网设备记录和收集患者的胸部x光片。流程如下:
1)医院在其本地区块链上分配一个单独的侧链来发布、处理和记录智能合约细节。
2)公共医疗系统设计一个智能合约,具有指定的参数,如数据集需求、平均预期精度、完成任务的奖励以及指定的任务、分类和预测。
3)医院下载提供的模型,并根据所需的数据集特征对模型进行训练。
4)每家医院预计完成的平均准确度和时间周期。
5)本地模型使用医疗物联网设备的数据进行训练。
6)各医院在公共医疗系统发布的智能合约上提交模型更新结果。
7)侧链实现一个中间件与主链进行跨链通信,使公共医疗系统能够分析模型更新结果。
8)模型精度要求由公共医疗系统验证,并用于训练最终的全局模型。
小结
所提议的体系结构为所有患者医疗记录提供数据安全性和数据完整性,并为与其健康记录相关的患者提供隐私。公共医疗系统在访问每位患者的记录进行全球模型训练之前,需要获得他们的许可。以太坊网络上不断增加的交易处理和恒定的交易率带来了网络拥塞的挑战。医院在其网络中引入了一个侧链,用于并行处理所有智能合同交易,并减轻了处理医疗记录的主链。