[TPAMI 2022] 用深度神经网络解决欠定问题——考虑鲁棒性?

news2025/1/19 20:37:30

Solving Inverse Problems With Deep Neural Networks – Robustness Included?

https://ieeexplore.ieee.org/abstract/document/9705105

摘要

在过去的五年中,深度学习方法已经成为解决各种反问题的最先进方法。在此类方法可以应用于安全关键领域之前,必须对其可靠性进行验证。最近的工作指出了深度神经网络在几个图像重建任务中的不稳定性。类似于分类中的对抗性攻击,结果表明输入域中的轻微失真可能会导致严重的伪影。本文通过对基于深度学习的算法解决欠定逆问题的鲁棒性进行广泛研究,对这一问题提出了新的看法。这包括使用高斯测量的压缩传感以及从傅立叶和氡测量中恢复图像,包括磁共振成像的真实场景(使用 NYU-fastMRI 数据集)。我们的主要重点是计算使重建误差最大化的测量的对抗性扰动。我们的方法的一个显着特征是与总变异最小化的定量和定性比较,这是一种可证明是稳健的参考方法。与之前的发现相比,我们的结果表明,标准的端到端网络架构不仅可以抵抗统计噪声,还可以抵抗对抗性扰动。所有考虑的网络都是通过常见的深度学习技术训练的,没有复杂的防御策略。我们的方法的一个显着特征是与总变异最小化的定量和定性比较,这是一种可证明是稳健的参考方法。与之前的发现相比,我们的结果表明,标准的端到端网络架构不仅可以抵抗统计噪声,还可以抵抗对抗性扰动。所有考虑的网络都是通过常见的深度学习技术训练的,没有复杂的防御策略。我们的方法的一个显着特征是与总变异最小化的定量和定性比较,这是一种可证明是稳健的参考方法。与之前的发现相比,我们的结果表明,标准的端到端网络架构不仅可以抵抗统计噪声,还可以抵抗对抗性扰动。所有考虑的网络都是通过常见的深度学习技术训练的,没有复杂的防御策略。

引言

间接测量的信号重建在各种应用中起着核心作用,包括医学成像[1]、通信理论[2]、天文学[3]和地球物理学[4]。此类任务通常被表述为一个逆问题,其原型、有限维形式如下:

无处不在的噪声使得重建方法必须对加性扰动具有鲁棒性是必不可少的元素. 此外,测量过程通常成本高昂且可能有害。

尽管压缩感知在各种实际应用中是最先进的,但相关算法的实用性通常受到计算成本、手动参数调整以及稀疏模型和数据之间不匹配的限制。

基于最近人工智能在计算机视觉领域取得的成功[6]、[7]、[8],已经付出了相当大的努力来通过深度学习解决逆问题(1),例如,参见[9],[10] , [11] , [12] , [13] , [14] , [15] , [16] , [17] , [18]和[19]最近的调查。这一进步主要基于拟合人工神经网络 (NN)在监督训练过程中对大量数据点进行建模。可以公平地说,这种数据驱动的方法在重建精度和速度方面可以显着优于经典方法。另一方面,有人可能会争辩说,神经网络的基本机制在很大程度上仍不清楚[20]。因此,在缺乏形式(2)的理论保证的情况下,对它们的准确性和对测量噪声的鲁棒性进行经验验证是至关重要的。

虽然许多作品报告了对噪声的显着恢复能力[17]、[21]、[22],但一些令人担忧的发现表明基于深度学习的重建方案通常是不稳定的[23]、[24]、[25]、[26]。特别是最近对 Antun等人的研究。 [24]表明,逆问题的深度学习是以不稳定性为代价的,从某种意义上说,“[...] 图像和采样域中某些微小的、几乎检测不到的扰动,可能会导致重建中的严重伪影[...]”. 在关于分类的机器学习研究中,神经网络的这种敏感性是一个公认的现象。由 Szegedy等人 发起。[27],大量文献致力于对抗性攻击(及其防御),即计算视觉上难以察觉的输入变化,从而愚弄神经网络。通常,“攻击者”利用基于梯度的信息来跨越分类器的不连续决策边界。对于错误预测会带来安全风险的敏感应用程序来说,这可能是一个严重的问题——想象一下自动驾驶中错误分类的停车标志[28]、[29]。

尽管有这些发现,但通过基于深度学习的方案解决反问题可能变得不稳定似乎很奇怪。学习重建算法可以被视为回归任务,其中测量值被映射到高维信号流形(例如,医学图像)。相反,NN 分类器映射到低维、离散输出域,从而导致“易受攻击”的决策边界。此外,众所周知,许多反问题都存在稳健且准确的算法。由于这些通常用作神经网络架构的模板,因此后者遭受严重的不稳定性似乎令人惊讶。显然,抗噪声的鲁棒性对于深度学习在实践中的应用至关重要,尤其是在生物医学成像等敏感领域。

贡献

本文致力于对基于神经网络的方法解决欠定反问题的稳健性进行全面的数值研究。我们实验的主要目的是分析重建误差随噪声水平增长的程度η. 我们从统计噪声和对抗噪声的角度研究这种关系:前者意味着测量噪声是从适当的概率分布中提取的,而后者则探索最坏情况下的扰动,使固定的重建误差最大化η. 与分类中的对抗性攻击类似,计算最坏情况噪声基于非凸公式,该公式由自动微分和梯度下降方案解决。在缺乏稳健性经验证明的情况下,我们分析的一个核心和独特组成部分是与具有可证明保证的经典基准方法进行系统比较,即总变差 (TV) 最小化。在这种情况下,评估梯度是非常重要的,并且通过展开底层优化问题来执行。

我们的实验将几个原型逆问题视为用例。这包括具有高斯测量的经典压缩传感以及从氡和傅里叶测量重建幻影图像。此外,基于 NYU-fastMRI 数据集[30]、[31] ,研究了磁共振成像 (MRI) 的真实场景。我们检查了学习重建架构的代表性选择,从简单的后处理 NN 到迭代方案。总的来说,这项工作对超过 25 个神经网络进行了鲁棒性分析,每个神经网络都使用公开可用的代码进行内部训练。1个

我们的主要发现可归纳如下:

  1. 在每个考虑的场景中,我们发现基于深度学习的方法在对抗性噪声方面至少与TV最小化一样稳健。这不需要复杂的架构或防御策略。然而,对于梯度稀疏信号,没有一个训练有素的 NN 像 TV 最小化一样准确。

  1. 所有受过训练的神经网络都对统计噪声具有显着的鲁棒性。尽管 TV 最小化可能会为无噪声测量产生精确的恢复,但在中高噪声条件下,它仍然优于学习方法。

  1. 重建性能受底层神经网络架构的影响。例如,促进迭代方案中的数据一致性可以提高准确性和鲁棒性。

  1. 人们不应该犯下使用无噪声数据训练神经网络的“逆向犯罪” ,这可能会导致较高噪声水平的不稳定行为。我们证明,简单地将高斯白噪声添加到训练测量中是一种有效的补救措施——一种在机器学习研究中通常称为抖动的正则化技术这种适应对分布内精度的影响几乎察觉不到,但可能会影响分布外特征(参见第 5.2 节)。这导致了稳定性和准确性之间有趣的权衡

讨论

在一系列广泛的实验中,这项工作分析了基于深度学习的反问题求解方法的稳健性。我们方法的核心是研究对抗性噪声的影响,即最大化重建误差的测量的最坏情况扰动。与基于模型的参考方法的系统比较表明,标准深度 NN 方案对统计和对抗性失真具有显着的弹性。另一方面,我们已经证明,不稳定性可能是由使用无噪声数据进行训练的“逆向犯罪”引起的。在这方面一个简单的补救措施是抖动——深度学习中的标准正则化和鲁棒化技术[8]. 然而,众所周知,这并不能解决深度神经网络分类器的对抗性弱点,这需要更复杂的防御策略[84]。虽然这种防御也可以提高图像恢复上下文中的鲁棒性[26],但我们的结果得出了一个令人惊讶的结论:在训练阶段注入高斯随机噪声似乎足以获得对其他类型的反问题有抵抗力的解决方法。噪声,包括对抗性扰动。

不可否认,有几个方面超出了我们的研究范围:

(i) 我们仅限于选择端到端的 NN 架构,不包括其他方法,例如生成模型[16]、深度图像先验[ 85],或学习正则化器[86]。然而,由于这些算法通常涉及更多基于模型的组件,我们希望它们的鲁棒性能够与当前工作中考虑的方案相媲美。

(ii) 由于(5)的非凸性,我们的攻击策略缺乏理论最优性证明。尽管如此,我们的结果提供了我们已经充分解决问题的经验证据:最坏情况和统计​​扰动之间的差距在所有考虑的场景中似乎是一致的。更重要的是,我们已经验证了检测由对抗性噪声引起的错误放大的能力(见图11)。

(iii) 我们的分析从稳健性的数学角度出发,因此依赖于标准的相似性度量,特别是欧几里得范数。众所周知,此类定量指标对几种类型的视觉失真不敏感。例如,数据驱动方法的一个特征是它们倾向于生成逼真的图像,即使在受到损害时也是如此(参见第 5.4 节)). 这会阻碍故障模式的检测,并可能导致误报/漏报[25]。

(iv) 基于 NN 的重建的可靠性可能会受到其他缺点的影响,这些缺点与缺乏对抗鲁棒性没有直接关系。例如,即使是 2019 年 fastMRI 挑战赛的获胜网络有时也无法捕获数据中很少出现的某些微小病理特征[87]。这个问题在 2020 年的 fastMRI 挑战赛中得到了专门解决,该挑战赛侧重于病理学描述而不是整体图像质量评估[88]. 然而,这一次出现了幻觉,即重建网络产生的非物理特征。对原因和补救措施的调查似乎是未来研究的一个有前途的方向,例如,参见[89]。

人工智能对未来医疗保健的相关性是不可否认的。可靠的重建方法在该领域不可或缺,因为不稳定性引起的错误可能是致命的。鉴于医疗成像中故意操纵的威胁[90],知道原则上可能出错的限制是令人欣慰的。具有类似实际意义的是对随机扰动的鲁棒性,这是常见成像模式的标准噪声模型。我们相信我们的工作在这两个方面都取得了进展,通过在使用深度神经网络解决成像中的反问题方面显示出乐观的结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/161541.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2022年度总结和展望2023年

文章目录 前言 2022年的成就总结 2023年的行动目标 如何完成这些目标? 前言 从2018年更新CSDN第一篇的博文,我就和CSDN产生联系。当时想法很纯粹,就是将积累的知识写成文章,无论去到哪里都能查到,所以前面三年都是…

Python实现预测客户是否会购买房车险源码+数据集,基于伯努利朴素贝叶斯预测客户购买房车险源码,Python预测客户购买房车险

伯努利朴素贝叶斯预测客户购买房车险 根据2000年数据挑战赛保险公司的客户特征数据,预测客户是否会购买房车险。 使用伯努利朴素贝叶斯模型,我获得了更好的预测效果 完整代码下载地址:Python实现预测客户是否会购买房车险源码数据集 数据集…

中国化工发展的新态势

顺势而为的企业才可能有好的未来,在一年之初,回顾总结一下中国化工行业的发展态势,对企业认清形势,确定企业的行业发展方向和发展战略至关重要。 自2022年以来,中国快速增长的化工行业按收入计算一直是世界上最大的&am…

【Java、Redis】通过中心经纬度与半径获取范围内的结果集(类似附近的人)

文章目录需求解决方案什么是Redis GeoHashJava实现InitEquLongLatTask.javaControllerservicexml sql语句引用的pom依赖需求 通过百度地图的覆盖物功能,用户在页面上画圈选定某个区域,前端传输中心点经纬度与半径给后端,后端需要返回位置在圈…

表格存储 Tablestore 十年发展总结

作者:周赵锋 阿里云基础产品团队 ​表格存储Tablestore上线已有十年,随着业务规模变大,稳定性挑战也随之而来,需要不断优化架构来提升可用性。本文将为大家分享表格存储Tablestore在技术层面近年来的功能演进、技术架构演进以及稳…

与哈希函数有关的结构:布隆过滤器、一致性哈希

1、认识哈希函数 (out f(in data)) 输入参数in,其值域范围可以看作是无穷大的。输出函数out,其值域范围可能性很大,但是一定是有穷尽的哈希函数没有任何随机的机制,固定的输入一定是固定的输出输入无穷多但…

计算机基础——无处不网络

作者简介:一名云计算网络运维人员、每天分享网络与运维的技术与干货。 座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​​ 目录 前言 一.计算机网络概述 1.计算机网络发展史 二.计算机网络应用领域 三.计算机网…

基于YOLOv6m的接打电话检测识别分析系统

本身在实际项目开发应用中YOLO都是目标检测任务的绝对主力,从v3一直跟着到了v7,做了很多的项目,处理了很多的数据,当然了也积累了一些自己的成果和心得,这里主要是以不常用到的yolov6m系列的模型来开发构建接打电话行为…

python基础篇之函数

大家好,我是csdn的博主:lqj_本人 这是我的个人博客主页:lqj_本人的博客_CSDN博客-微信小程序,前端,vue领域博主lqj_本人擅长微信小程序,前端,vue,等方面的知识https://blog.csdn.net/lbcyllqj?spm1000.2115.3001.5343 哔哩哔哩欢迎关注&…

最简最速搭建grpc分布式服务的Mac系统开发环境

文章目录环境详情基本原理什么是 Protobuf工具安装环境搭建编写服务类的实现启动服务客户端测试环境详情 golang 1.18 macOS Big Sur protobuf 3 基本原理 整个RPC过程就是: 客户端 发送 数据(以字节流的方式)服务端接收,并…

Spring Boot 大型线上商城项目实战教程试学(文末视频版)

视频链接在文末 在学习一门技术的时候,相信很多开发者会在开源网站上寻找对应技术栈的开源项目,通过阅读源码,学习项目作者的开发思路、解决问题的方法,这一过程,对大多人来说没那么容易,要么一开始不知从…

共享模型之管程(八)

1.线程的活跃性 1>.定义: 线程内的有限代码因为某种原因一直无法执行完毕(/执行不完); 1.1.线程活跃性的现象-死锁 1>.有这样的情况:一个线程需要同时获取多把锁,这时就容易发生死锁; 2>.案例 ①.t1线程已经获得A对象锁,接下来想获取B对象的锁; ②.t2线…

Python和MySQL对比(4):用Pandas 实现MySQL的行列转换语法效果

文章目录一、前言二、语法对比数据表concat(多列合并为一列)group_concat(多行合并为一行)一列拆分为多列一行拆分为多行多行转为多列多列转为多行三、小结一、前言 环境: windows11 64位 Python3.9 MySQL8 pandas1.4.…

【Linux】make/Makefile的简单使用

人生的态度是,抱最大的希望,尽最大的努力,做最坏的打算。 – 柏拉图 《理想国》 目录一.Linux项目自动化构建工具-make/Makefile1.为什么需要使用make/Makefile2.简单理解make和Makefile3.如何编写Makefile文件3.1生成可执行程序&#xff1a…

智算中心掀落地热潮,加速AI普惠化

11日,国家信息中心与浪潮信息联合发布的《智能计算中心创新发展指南》显示,目前全国有超过30个城市正在建设或提出建设智算中心,“十四五”期间,对智算中心的投资可带动人工智能核心产业增长约2.9-3.4倍。 《科创板日报》记者注意…

python+人脸识别+opencv实现真实人脸驱动的阿凡达(中)

目录一、前言二、消除图片拼接缝隙三、基于一张图片正脸转侧脸的实现1、人体头部的二维成像知识2、用特征点驱动的方法实现侧脸2.1python核心代码三、后续工作一、前言 我们在上篇名叫python人脸识别opencv实现真实人脸驱动的阿凡达(上博文里已经实现了基于三角映射…

教资报名啦 有问题欢迎评论区提问~

报考小tips: ①一次选报你所有准备报考的学科 ②看好类别,有些是“音体美专业”专属 ③审核前如果发现有漏报的科目,可以先取消再报 ④一旦审核通过,就不能更改/增加/较少报考科目 ⑤缴费成功后,不退费【如果考试前几天…

德云社、本山传媒齐聚辽宁卫视春晚,郭德纲和本山大叔会参加吗

腊月二十九,屋里走。不得不说辽宁卫视会选时间,兔年的春晚定在了农历腊月二十九这一天。备受关注的辽宁卫视春晚,准备在农历的腊月二十九晚上七点三十分,正式与广大观众见面。 辽宁卫视春晚之所以倍受期待,是因为这些年…

【MySQL】深入理解MySQL事务(上篇)

MySQL事务前言事务的ACID 特性事务提交方式事务常见操作方式正常演示 - 证明事务的开始与回滚非正常演示1 - 证明未commit,客户端崩溃,MySQL自动会回滚(隔离级别设置为读未提交)非正常演示2 - 证明commit了,客户端崩溃…

2021年大数据挑战赛A题智能运维中的异常检测与趋势预测求解全过程论文及程序

2021年大数据挑战赛 A题 智能运维中的异常检测与趋势预测 原题再现: 异常检测(异常诊断/发现)、异常预测、趋势预测,是智能运维中首当其冲需要解决的问题。这类问题是通过业务、系统、产品直接关联的 KPI 业务指标进行分析诊断&…