深度学习中的不确定性量化:技术、应用和挑战综述(一)

news2024/12/24 19:04:29

不确定性量化(UQ)在减少优化和决策过程中的不确定性方面起着关键作用,应用于解决各种现实世界的科学和工程应用。贝叶斯近似和集成学习技术是文献中使用最广泛的两种UQ方法。在这方面,研究人员提出了不同的UQ方法,并测试了它们在各种应用中的性能,如计算机视觉(如自动驾驶汽车和物体检测)、图像处理(如图像恢复)、医学图像分析(如医学图像分类和分割)、自然语言处理(如文本分类、社交媒体文本和惯犯风险评分)、生物信息学等。本文综述了深度学习中使用的UQ方法的最新进展,探讨了这些方法在强化学习中的应用,并强调了与UQ领域相关的基础研究挑战和方向。

论文题目:
A Review of Uncertainty Quantification in Deep Learning: Techniques, Applications and Challenges
作者:
Moloud Abdar*, Farhad Pourpanah, Member, IEEE,Sadiq Hussain, Dana Rezazadegan, Li Liu, Senior
Member, IEEE, Mohammad Ghavamzadeh, Paul Fieguth, Senior Member, IEEE, Xiaochun Cao, Senior
Member, IEEE, Abbas Khosravi, Senior Member, IEEE, URajendra Acharya, Senior Member, IEEE,
Vladimir Makarenkov and Saeid Nahavandi, Fellow, IEEE

我们处理许多领域的不确定性,从投资机会和医疗诊断到体育比赛和天气预报,目的是根据收集到的观察和不确定的领域知识做出决策。
任意性不确定性和认识性不确定性的主要区别示意图。
模型的预测具有不确定性,除了在不确定性情况下固有的归纳假设外,还容易受到噪声和错误的模型推断的影响。因此,在任何基于人工智能的系统中,以可信的方式表示不确定性是非常可取的。这种自动化系统应该能够通过有效地处理不确定性而准确地执行。不确定性原理在具体学习算法[3]、主动学习(AL)[4]、[5]等人工智能设置中发挥着重要作用。

不确定性的来源发生在测试和训练数据不匹配时,数据不确定性的发生是因为类重叠或由于数据中存在噪声[6]。与数据不确定性相比,知识不确定性的估计更为困难,数据不确定性是通过最大似然训练自然测量的结果。预测中的不确定性来源对于解决不确定性估计问题至关重要[7]。不确定性主要有两种来源,概念上称为任意不确定性和认知不确定性8。

数据中不可约的(Irreducible)不确定性导致预测中的不确定性是一种任意不确定性(也称为数据不确定性)。这种类型的不确定性不是模型的属性,而是数据分布的固有属性;因此它是不可约的。另一种不确定性是认知不确定性(也称为知识不确定性),这种不确定性是由于知识和数据不足而产生的。人们可以定义模型来回答基于模型的预测中不同的人类问题。在数据丰富的问题中,存在大量数据的集合,但可能信息贫乏[10]。在这种情况下,基于人工智能的方法可以用来定义有效的模型,从数据中描述紧急特征。这些数据往往是不完整的、有噪声的、不一致的和多模态的[1]。
图2

不确定性量化(UQ)是当今许多关键决策的基础。没有UQ的预测通常是不可信和不准确的。为了理解深度学习(Deep Learning, DL)[11],[12]过程生命周期,我们需要理解UQ在DL中的作用。DL模型从收集最全面和潜在相关的数据集开始,这些数据集可用于决策过程。深度学习场景的设计是为了满足一些性能目标,以便在使用标记数据训练模型后选择最合适的深度学习架构。
在这里插入图片描述

图2给出了三种不同的不确定性模型[9](MC dropout、Boostrap模型和GMM)的比较图。此外,不确定性感知模型(BNN)与OoD分类器的两种图形表示如图3所示。

在涉及的步骤中,有几个不确定因素需要量化。这些步骤中明显的不确定性有:
(i)训练数据的选择和收集,
(ii)训练数据的完整性和准确性,
(iii)理解DL(或传统机器学习)模型的性能界限及其局限性,以及
(iv)不确定性对应于基于操作数据的模型的性能[13]。

数据驱动的方法,如与UQ相关的深度学习,至少带来了四组重叠的挑战:(i)缺乏理论,(ii)缺乏随机模型,(iii)对不完美数据的敏感性,以及(iv)计算费用。为了减轻这些挑战,有时采用模型变异性研究和敏感性分析等特别解决方案。不确定性估计和量化在深度学习和传统机器学习中得到了广泛的研究。在下面,我们简要总结了一些最近的研究,这些研究检验了处理不确定性的各种方法的有效性。

研究目标及研究大纲

在大数据、机器学习和深度学习的时代,对不同原始数据的智能使用具有巨大的潜力,可以使各个领域受益。然而,不同ML和DL方法中的UQ可以显著提高其结果的可靠性。Ning等[15]对不确定性下数据驱动优化范式的主要贡献进行了总结和分类。可以看出,本文只回顾了数据驱动的优化。在另一项研究中,Kabir等人[16]回顾了基于神经网络的UQ。作者着重于概率预测和预测区间(pi),因为它们是UQ文献中最广泛使用的技术之一。

我们注意到,从2010年到2020年(6月底),在各个领域(如计算机视觉、图像处理、医学图像分析、信号处理、自然语言处理等)发表了2500多篇关于AI中的UQ的论文。

与昆士兰大学领域以前的综述论文不同,本研究回顾了最近发表的使用不同方法量化人工智能(ML和DL)不确定性的文章。此外,我们渴望找到UQ如何影响真实案例,解决AI中的不确定性,从而帮助获得可靠的结果。同时,在现有的方法中发现重要的聊天记录是为未来的研究指明道路的一个很好的方法。在这方面,这篇综述文章为未来在ML和DL中研究UQ的研究人员提供了更多的投入。我们调查了最近在UQ领域应用于ML和DL方法的研究。因此,我们总结了目前关于ML和DL中UQ的研究较少。值得一提的是,本研究的主要目的不是比较不同的UQ方法的性能,因为这些方法是针对不同的数据和特定的任务而引入的。因此,我们认为比较所有方法的性能超出了本研究的范围。因此,本研究主要关注DL、ML和强化学习(RL)等重要领域。因此,本研究的主要贡献如下:

  • 据我们所知,这是第一篇关于在ML和DL方法中使用的UQ方法的综合综述论文,值得该领域的研究人员使用。
  • 对新提出的UQ方法进行了全面的综述。
  • 此外,还列出了UQ方法重要应用的主要类别。
  • 指出了UQ方法的主要研究空白。
  • 最后,讨论了几个可靠的未来方向。

贝叶斯不确定性预测

预测不确定性包括两部分:认知不确定性(EU)和任意不确定性(aleatoric uncertainty)
(AU),可以写成这两部分之和:
在这里插入图片描述
认知不确定性可以表示为模型参数上的概率分布。对于分类,可以使用softmax似然:
在这里插入图片描述
,可以假设高斯似然进行回归:
在这里插入图片描述
因此,需要最小化关于θ的Kullback-Leibler (KL)[20]散度。两个分布之间的相似程度可以用下面的方法来衡量:
在这里插入图片描述
预测分布可以通过最小化KL散度近似,如下所示:在这里插入图片描述
where qθ∗(ω) indicates the optimized objective.

KL散度最小化也可以重新排列为证据下界(ELBO)最大化:
在这里插入图片描述

这个过程被称为变分推理(VI)。Dropout VI是最常用的方法之一,已被广泛用于在复杂模型中近似推断[22]。最小化目标如下[23]:
在这里插入图片描述
其中,N和P分别表示样本数量和dropout概率。

为了获得与数据相关的不确定性,可以将精度τ 表示为数据的函数。获得认知不确定性的一种方法是混合两个函数:预测平均值,即fθ(x)和模型精度,即gθ(x),似然函数可以写成yi = N(fθ(x),gθ(x))。在模型的权重上放置一个先验分布,然后计算给定数据样本的权重变化量。欧几里得距离损失函数(3)可改编为:
在这里插入图片描述
预测方差可由下式得到:
在这里插入图片描述

使用贝叶斯技术进行不确定性量化

1 贝叶斯深度学习/贝叶斯神经网络

尽管标准深度学习方法在解决各种现实问题方面取得了成功,但它们无法提供有关其预测可靠性的信息。为了缓解这一问题,可以使用贝叶斯深度学习(BDL)/贝叶斯神经网络(BNNs)[24]、[25]、[26]、[27]、[28]、[29]、[30]、[31]来解释模型参数。bnn /BDL对过拟合问题具有鲁棒性,可以在小数据集和大数据集上进行训练[32]。

蒙特卡洛(MC) dropout

如前所述,计算精确的后继推理是困难的,但它可以被近似。在这方面,蒙特卡罗(MC)[33]是一种有效的方法。尽管如此,当集成到深层体系结构中时,它是一种缓慢且计算代价昂贵的方法。为了解决这个问题,引入了MC (MC) dropout,它使用dropout[34]作为正则化项来计算预测不确定性[35]。Dropout是解决深度神经网络过拟合问题的一种有效方法。在训练过程中,dropout随机丢弃一些神经网络单元,以避免它们过多地共调。假设ANN有L层,其中Wl、bl和Kl分别表示第L层的权矩阵、偏置向量和维数。NN的输出和第i个输入xi (i =1,…)的目标类, N)分别用i和yi表示。使用L2正则化的目标函数可以写成:
在这里插入图片描述
Dropout对每个输入数据和每层(输出层除外)的每个网络单元进行二进制变量采样,对于第i层的概率为pi,如果其值为0,则对给定输入数据丢弃单元i。在向后传递中使用相同的值来更新参数。图4显示了在简单神经网络上的几种变分分布的可视化[36].

一些研究使用MC dropout[37]来估计UQ。Wang等人[38]从像素和结构两个层面分析了基于cnn的深度医学图像分割问题的认知和任意不确定性联系。他们在测试阶段对输入图像进行增强,以估计变换的不确定性。具体来说,使用MC采样来估计输出分割的分布。Liu等人[39]提出了一个统一的模型,使用SGD来近似存在普遍对抗性扰动的cnn的认知和任意不确定性。在神经元的输出端应用具有伯努利分布的MC dropout来估计认知不确定性。此外,他们还引入了纹理偏差来更好地近似任意不确定性。Nasir等[40]在3D CNN中使用MC dropout来估计四种不确定性,包括MC样本方差、预测熵和互信息(MI),从而从MRI序列中分割病变。

在这里插入图片描述
在[41]中,实现了两种dropout方法,即基于元素的Bernoulli dropout[34]和空间Bernoulli dropout[42],用于计算端到端自动驾驶车辆控制的bnn中的模型不确定性。McClure和Kriegeskorte[36]表示,与单位抽样相比,使用伯努利或高斯加权抽样可以更准确地描述不确定性。然而,根据文献[36]得出的结果,可以认为使用伯努利或高斯dropout都可以提高CNN的分类精度。基于这些发现,他们通过结合伯努利或高斯dropout提出了一种新的模型(称为spike- and-slab sampling)。

Do等[43]对基于cnn的深度模型U-Net[44]进行改进,分割心肌动脉自旋标记并估计不确定性。具体来说,在每个卷积层和分辨率尺度之后分别添加批处理归一化和dropout。后来,Teye等人[45]提出了MC批归一化(MCBN),可用于通过批归一化来估计网络的不确定性。他们表明批归一化可以看作是一个近似的贝叶斯模型。Yu等人[46]提出了从3D MR图像中分割左心房的半监督模型。它由教师和学生两个模块组成,并将它们用于UA框架中,称为UA自集成平均教师(UA- mt)模型(见图5)。因此,学生模型通过最小化教师模型的标记样本和目标的分割和一致性损失来学习教师模型。此外,设计了基于MC dropout的UA框架,利用教师模型获得的不确定性信息,帮助学生模型学习更好的模型。表1列出了直接应用MC dropout近似不确定性的研究及其应用。

MC dropout与其他UQ方法的比较

他们发现,这两种模型都能很好地表达浅层bnn中的不确定性。然而,平均场高斯VI不能很好地近似后验来估计深度神经网络的不确定性。Ng等人[66]使用U-Net[44]作为基本分类器,比较了MC dropout和BBB。Siddhant等[67]对NLP的各种DAL模型进行了实证研究。在预测过程中,他们对cnn和rnn应用dropout来估计不确定性。Hubschneider等[9]将MC dropout与基于自举集成的方法和高斯混合方法进行了比较,以完成车辆控制任务。此外,Mukhoti[68]将MC dropout与几个模型一起用于估计回归问题中的不确定性。Kennamer等[69]对天文观测条件下的MC退出进行了实证研究。

马尔科夫链蒙特卡罗(MCMC)

马尔可夫链蒙特卡罗(MCMC)[70]是另一种用于近似推理的有效方法。它首先从分布q(z0)或q(z0|x)中随机抽取z0。然后,对z0进行随机转变,如下:

在这里插入图片描述
选择这个转换算子并重复T次,结果是一个随机变量,在分布上收敛到精确的后验。Salakhutdinov等[71]使用MCMC近似电影的预测分布评分值。尽管传统的MCMC取得了成功,但迭代次数是否足够还是个未知数。此外,MCMC需要较长的收敛时间到一个理想的分布。

为了克服这些缺点,已经进行了几项研究。例如,Salimans等人[72]将空间扩展为一组辅助随机变量,并将随机马尔可夫链解释为变分近似。

变分推理(VI)

在这里插入图片描述
各种VI方法的总结BDL是基于[89]复制的。请注意,权重分担(意思是在[89]提出的方法基础上,加入场假设+戏剧性缩减)。

变分推理(VI)是一种学习BNN权值后验分布的近似方法。基于vi的方法将贝叶斯推理问题作为一个优化问题来考虑SGD训练dnn。图7总结了BNN的各种VI方法[89]。

对于bnn,基于vi的方法旨在近似NN权重上的后验分布。为此,可以将损失定义为:

在这里插入图片描述
Posch等人[90]用高斯分布与对角协方差矩阵的乘积定义了变分分布。对于每个网络层,网络参数的后验不确定性表示。后来,在[91]中,他们用传统的对角协方差矩阵取代了对角协方差矩阵,以允许网络参数相互关联。受迁移学习和经验贝叶斯(EB)[92]的启发,mped[93]使用非确定性权重,该权重来源于具有相同架构的预训练dnn,以在权重空间上选择有意义的先验分布。后来,在[94]中,他们将一种基于参数EB的方法集成到贝叶斯深度神经网络中平均场VI的mped中,并使用完全因式高斯分布对权重进行建模。此外,他们使用了一个真实世界的案例研究,即糖尿病视网膜病变诊断,来评估他们的方法。Subedar等人[95]提出了一种基于多模态贝叶斯融合的不确定性感知框架用于活动识别。他们通过结合确定性层和变分层将BDNN扩展到更深的结构。Marino等人[96]提出了一种基于随机建模的模型不确定性方法。具体来说,使用DBNN来学习系统的随机学习。变分BNN[97]是一种基于生成的模型,用于预测超导转变温度。具体来说,VI被用来计算模型在潜在空间中的分布。

Louizos和Welling[98]采用随机梯度VI[99]计算神经网络权值的后验分布。Hubin和Storvik[100]提出了随机VI方法,该方法同时考虑了bnn中模型和参数的不确定性,并引入了一个潜在的二元变量来包含/排除模型的某些权重。Liu等[101]将VI集成到一个时间-时间神经网络中,以近似网络的后验参数分布并估计预测的概率。Ryu等人[102]将图卷积网络(GCN)集成到贝叶斯框架中,以学习表征并预测分子性质。Swiatkowski等[89]对高斯平均场VI进行了实证研究,他们将变分参数分解为低秩分解,使其近似更紧凑,并提高了SG在估计变分下界时的信噪比。Franquhar等人[103]使用均值场VI更好地训练深度模型。他们认为,更深的线性平均场网络可以提供类似于浅全协方差网络的函数空间分布。所提出的方法的示意图如图8所示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1647422.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

10.Java对象内置结构

文章目录 Java对象内置结构1.Java对象的三个部分1.1.对象头1.2.对象体1.3.对齐字节 2.对象结构中核心字段的作用2.1.MarkWord(标记字)2.2.Class Pointer(类对象指针)2.3.Array Length(数组长度)2.4.对象体2.5.对齐字节 3.Mark Word的结构信息3.1.不同锁状态下的Mark Word字段结…

GraphGPT——图结构数据的新语言模型

在人工智能的浪潮中,图神经网络(GNNs)已经成为理解和分析图结构数据的强大工具。然而,GNNs在面对未标记数据时,其泛化能力往往受限。为了突破这一局限,研究者们提出了GraphGPT,这是一种为大语言…

部署YUM仓库以及NFS共享服务

YUM仓库部署 一.YUM概述 YUM仓库源是一种软件包管理工具,用于在Linux系统上安装、更新和删除软件包。YUM仓库源包含了软件包的元数据信息和实际的软件包文件。用户可以通过配置YUM仓库源,从中下载和安装软件包。 常见的YUM仓库源包括: 本…

pip install dotenv出现error: subprocess-exited-with-error的解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

springboot+vue+elementui实现校园互助平台大作业、毕业设计

目录 一、项目介绍 二、项目截图 管理后台 1.登录(默认管理员账号密码均为:admin) 2. 用户管理 ​编辑 3.任务管理 互助单(学生发布) 行政单(教师发布) ​编辑 审核(退回需…

36.Docker-Dockerfile自定义镜像

镜像结构 镜像是将应用程序及其需要的系统函数库、环境、配置、依赖打包而成。 镜像是分层机构,每一层都是一个layer BaseImage层:包含基本的系统函数库、环境变量、文件系统 EntryPoint:入口,是镜像中应用启动的命令 其他:在…

电脑c盘太满了,如何清理 电脑杀毒软件哪个好用又干净免费 电脑预防病毒的软件 cleanmymacX有必要买吗 杀毒软件排行榜第一名

杀毒软件通常集成监控识别、病毒扫描和清除、自动升级、主动防御等功能,有的杀毒软件还带有数据恢复、防范黑客入侵、网络流量控制等功能,是计算机防御系统的重要组成部分。 那么,对于Mac电脑用户来说,哪款电脑杀毒软件更好呢&a…

PCB光控打孔机第二版程序(一)

/*PCB机程序 XY同时启动 L9751 CODE61068 2018 6 19 08:00 固定位置释放吸盘*/ /*修正寻点第十二条结束调用计算坐标L5091,自动运行Y计算L6280 6281***/ /*** 开外部中断2关闭定时器2XY轴输出信号,自动运行循环检测外部中断高电平重启XY轴输出信号 增加寻…

LeetCode 难题解析 —— 正则表达式匹配 (动态规划)

10. 正则表达式匹配 思路解析 这道题虽然看起来不难理解,但却存在多种可能,当然这种可能的数量是有限的,且其规律对于每一次判别都使用,所以自然而然就想到用 动态规划 的方法啦 接下来逐步分析可能的情况: &#x…

探索中位数快速排序算法:高效寻找数据集的中间值

在计算机科学领域,寻找数据集的中位数是一个常见而重要的问题。而快速排序算法作为一种高效的排序算法,可以被巧妙地利用来解决中位数查找的问题。本文将深入探讨中位数快速排序算法的原理、实现方法以及应用场景,带你领略这一寻找中间值的高…

[UDS][OTA] 自定义 IntelHEX (IHEX) format read/write library in C

参考修改 参考github的MIT协议开源项目 ihex 改写的代码 https://gitee.com/liudegui/intelhex-c 修改点: 修改Makefile脚本,支持x86_X64平台和aarch64平台将默认读取行长度设置为16位删除与ihex和bin之间的转换无关的示例代码 十六进制描述 HEX格式…

C++容器——deque

deque容器 定义:动态数组,是一种双向开口的线性容器,意味着你不仅可以像在普通队列的末尾添加和移除元素,还可以在前端执行这些操作。 与其他容器相比不同的点: 与vector的主要区别: 连续性:…

基于 Spring Boot 博客系统开发(六)

基于 Spring Boot 博客系统开发(六) 本系统是简易的个人博客系统开发,为了更加熟练地掌握 SprIng Boot 框架及相关技术的使用。🌿🌿🌿 基于 Spring Boot 博客系统开发(五)&#x1f…

商标不做检索分析,直接申请通过率很低!

今天有个网友拿到驳回通知书找到普推知产老杨,让分析驳回通过率如何,他主要两个文字商标和两个图形商标,文字商标都是两个字的,两个字的商标名称基本都有相同或高近,引用了好几个高度近似,直接做驳回复审通…

Unity 性能优化之光照优化(七)

提示:仅供参考,有误之处,麻烦大佬指出,不胜感激! 文章目录 前言一、测试目的一、实时光源是什么?二、开始测试1.场景中只有一个光照的数值情况2.添加4个点光源后4.结果 总结 前言 实时光源数量越多&#x…

【前端】创建跳动字符效果的前端技术实现

创建跳动字符效果的前端技术实现 在前端开发中,动态视效能够显著增强用户体验。本文介绍一种实现字符跳动效果的技术方案,通过简单的HTML、CSS和JavaScript代码,你可以为网页文本添加生动的交互动画。这种效果可以用于吸引用户注意、增强品牌…

<网络安全>《77 概念讲解<第十课 物联网常用协议-(近距离通信)感应层协议>》

协议简称全称名称内容说明RFIDRadio Frequency Identification射频识别阅读器与标签之间进行非接触式的数据通信,达到识别目标的目的。RFID的应用非常广泛,典型应用有动物晶片、汽车晶片防盗器、门禁管制、停车场管制、生产线自动化、物料管理。完整的RF…

SQLI-labs-第十三关和第十四关

目录 第十三关 1、判断注入点 2、判断当前数据库 3、爆表名 4、爆字段名 5、爆值 第十四关 1、判断注入点 知识点:POST方式的单引号和括号闭合错误,报错注入 第十三关 思路: 1、判断注入点 使用Burpsuite抓包 首先加入一个单引号,…

【管理篇】管理三步曲:团队建设(二)

目录标题 如何着手团队建设提升个人能力1、要提升员工的什么能力2、提升员工个人能力的初衷是什么?3、如何达成上述目标4、应该如何激发员工学习的动力和意愿呢5、关于提升员工的能力,有两个信念特别重要: 提升员工的工作意愿和积极性1、管理…

2024年中国AI大模型产业发展报告,洞见下一个智能时代!

人民网财经研究院、至顶科技联合发布的《开启智能新时代:2024年中国AI大模型产业发展报告》,全面梳理了我国AI大模型产业的发展背景、现状、应用案例、面临的挑战以及未来趋势。报告指出,AI大模型是全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,在我国…