【论文阅读笔记】Towards Universal Unsupervised Anomaly Detection in Medical Imaging

news2025/1/17 6:07:09

Towards Universal Unsupervised Anomaly Detection in Medical Imaging

arxiv,19 Jan 2024 【开源】

【核心思想】

本文介绍了一种新的无监督异常检测方法—Reversed Auto-Encoders (RA),旨在提高医学影像中病理检测的准确性和范围。RA通过生成类似健康的重建图像,能够检测到更广泛的病理类型,这在现有技术中是一个挑战。RA方法在多种医学成像模态(如脑部磁共振成像、儿童腕部X光片和胸部X光片)中展示了卓越的检测性能,与现有最先进的方法相比,RA在检测各种病理、解剖结构和成像模态方面都表现出更高的准确性和稳健性。此外,RA的自动异常检测能力在缺乏放射学专业知识的环境中特别有价值。然而,该研究也指出了在检测极其微妙的异常方面的限制,强调了需要改进异常图计算和开发更为复杂的评估指标,以满足临床诊断的精细需求。总的来说,RA框架在医学成像领域展现出巨大潜力,其能够准确地检测广泛的异常,对于推动医学成像与人工智能的结合、提高诊断过程的准确性具有重要意义。

【医学影像中的异常检测的常用方法概述】

  1. 自监督方法:这些方法通过数据增强或预文本任务生成替代监督信号,利用数据固有特征和有限注释来识别异常。但这些方法可能会在预期的异常分布中引入偏见,尤其是当噪声或人工改变作为真实病理特征的代理时。例如,去噪自编码器(DAE)学习消除人工添加的粗糙高斯噪声,这种方法可能对特定异常(如脑肿瘤)有效,但对更广泛的异常检测应用有限。
  2. 无监督异常检测:无监督方法旨在从正常人群中学习标准分布,然后将这些知识应用于异常检测。传统的自编码器(AE)和变分自编码器(VAE)在此领域起到了基础性作用。AEs通过编码解码架构捕捉和重建输入数据,假设异常将表现为显著的重建错误。然而,AEs常常难以学习详细的正常解剖特征,并不适合泛化到病理。VAEs通过规范化潜在空间并将其视为概率分布来解决AE的一些局限性。这种规范化允许更受约束的学习过程,使VAEs能更紧密地遵循标准分布。然而,这种规范化经常导致重建的图像模糊,这在识别微妙异常时可能是一个缺点。
  3. 遮蔽自编码器(MAEs):这些方法也利用了先进的神经网络架构的优势,但从不同的角度来处理异常检测问题。MAEs通过选择性地遮蔽输入数据的部分,并让模型预测这些遮蔽部分来工作。
  4. 生成对抗网络(GANs):GANs引入了对抗性训练方法,能够生成高度真实的图像。然而,它们可能会遭受模式崩溃,或生成与输入数据不一致的图像。为解决这些挑战,像软内省变分自编码器(SI-VAEs)等进步技术已经出现,它们融合了VAEs和GANs,旨在克服GANs在异常检测中的特定局限性。
  5. 去噪扩散概率模型(DDPMs):DDPMs采用一种迭代方法,涉及在图像空间中添加和随后去除噪声。然而,DDPMs的一个关键方面在于精心选择噪声水平,这一决策极大地影响它们的性能。

【方法】

1.方法提出的背景

在训练阶段(左),使用多尺度反向嵌入损失 L Reversed  \mathcal{L}_{\text {Reversed }} LReversed  ,结合证据下界(ELBO)和对抗优化,对编码器和解码器网络进行优化。在此过程中,解码器从随机噪声中生成合成图像,目的是欺骗编码器将其视为真实图像 x fake  x_{\text {fake }} xfake  。在推理阶段(右),RA模型处理一个新的输入 x x x ,将其编码并重建为伪健康图像 x p h x_{\mathrm{ph}} xph 。异常检测是通过计算 x x x x p h x_{\mathrm{ph}} xph 之间的 L1 范数和感知差异来进行的,从而得到突出显示病理区域的异常图。

image-20240125150148636

将“正常”称为没有病理。给定一组正态样本 x ∈ X ⊂ R N x \in X \subset \mathbb{R}^{N} xXRN ,AE的目标是找到函数 f : R N → R D f: \mathbb{R}^{N} \rightarrow \mathbb{R}^{D} f:RNRD g : R D → R N g: \mathbb{R}^{D} \rightarrow \mathbb{R}^{N} g:RDRN 使得 x ≈ g ( f ( x ) ) x \approx g(f(x)) xg(f(x)) f f f 分别 g g g 称为编码器和解码器,将 f f f 输入映射到较低维的表示形式。无监督异常检测(UAD)的基本假设是,这些学习的表示包含描述规范分布的特征,即使对于异常样本 x ˉ ∉ X \bar{x} \notin X xˉ/X 也是如此。因此, x p h = ( g ( f ( x ˉ ) ) ) ∈ X x_{p h}=(g(f(\bar{x}))) \in \mathcal{X} xph=(g(f(xˉ)))X 表示 x ˉ \bar x xˉ 的伪健康重建。异常分数通常来自输入与其重建之间的像素差异: s ( x ) = ∣ x − g ( f ( x ) ) ∣ s(x)=|x-g(f(x))| s(x)=xg(f(x))​ 。

在变分推理框架中,目标是通过最大化观测样本 x x x 的对数似然 log ⁡ p θ ( x ) \log p_{\theta}(x) logpθ(x) 来优化潜在变量模型 ��⁢(�) p θ ( x ) p_{\theta}(x) pθ(x) 的参数 θ \theta θ 。为了解决这个问题,真正的后验 p θ ( z ∣ x ) p_{\theta}(z \mid x) pθ(zx) 通过使用证据下限 (ELBO) 的提议分布 q ϕ ( z ∣ x ) q_{\phi}(z \mid x) qϕ(zx) 来近似: log ⁡ p θ ( x ) ≥ E q ( z ∣ x ) [ log ⁡ p θ ( x ∣ z ) ] − KL ⁡ [ q ϕ ( z ∣ x ) ∣ ∣ p ( z ) ] = ELBO ⁡ ( x ) \log p_{\theta}(x) \geq \mathbb{E}_{q(z \mid x)}\left[\log p_{\theta}(x \mid z)\right]-\operatorname{KL}\left[q_{\phi}(z \mid x)|| p(z)\right]=\operatorname{ELBO}(x) logpθ(x)Eq(zx)[logpθ(xz)]KL[qϕ(zx)∣∣p(z)]=ELBO(x)

p θ ( x ∣ z ) p_{\theta}(x \mid z) pθ(xz) q ϕ ( z ∣ x ) q_{\phi}(z \mid x) qϕ(zx)分别是解码器 D θ D_{\theta} Dθ和编码器 E ϕ E_{\phi} Eϕ,AE 通常使用正态分布作为先验分布 p ( z ) = N ( μ , σ ) p(z)=\mathcal{N}(\mu, \sigma) p(z)=N(μ,σ) ,并采用重参数化技巧来最大化 ELBO。为了将 VAE 的潜在特性与 GAN 的图像合成能力相结合,SI-VAE为 VAE 训练引入了对抗性损失。关键的创新是以对抗方式利用VAE的编码器和解码器,而无需外部鉴别器。该编码器旨在通过最小化真实样本和先验样本的潜在分布的KL散度来区分真实样本和生成样本,同时最大化生成样本的KL散度。相反,解码器通过使用标准ELBO重建真实数据样本并最小化编码器压缩的生成样本的KL散度来训练来“欺骗”编码器。编码器和解码器的优化目标如下:

L E ϕ ( x , z ) = ELBO ⁡ ( x ) − 1 α ( exp ⁡ ( α ELBO ⁡ ( D θ ( z ) ) ) ) , L D θ ( x , z ) = ELBO ⁡ ( x ) + γ ELBO ⁡ ( D θ ( z ) ) , \begin{array}{l} \mathscr{L}_{E_{\phi}}(x, z)=\operatorname{ELBO}(x)-\frac{1}{\alpha}\left(\exp \left(\alpha \operatorname{ELBO}\left(D_{\theta}(z)\right)\right)\right), \\ \mathscr{L}_{D_{\theta}}(x, z)=\operatorname{ELBO}(x)+\gamma \operatorname{ELBO}\left(D_{\theta}(z)\right), \end{array} LEϕ(x,z)=ELBO(x)α1(exp(αELBO(Dθ(z)))),LDθ(x,z)=ELBO(x)+γELBO(Dθ(z)),

2.RA: Reversed Autoencoders

RA的主要创新在于其复杂的训练机制,旨在学习和准确重建正常的解剖模式。通过三种不同训练策略的独特组合来实现:首先,利用ELBO对平滑潜在空间进行正则化处理,使模型能够有效地捕捉正常解剖特征的潜在分布;其次,实现了RA的编码器和解码器组件之间的内省对抗相互作用。这种相互作用确保了规范分布的高保真表示的生成,因为编码器和解码器相互挑战以优化其输出。最后,为了增强输入与其重建之间的连贯性——这在可能发生重大分歧的恢复阶段尤其重要——我们引入了“反向损失”。该损失函数旨在最大限度地减少原始图像与其重建版本之间的差异,从而确保 RA 在重建正常解剖结构时保持高度准确性,同时突出显示异常。

  • Reversed Embedding Similarity

在编码器中实现反向多尺度嵌入相似性损失。这种方法确保输入表示与其生成的重建的嵌入紧密对齐,在多个尺度上执行:

L Reversed  ( x ) = ∑ l = 0 L [ ( 1 − L Sim  ( E ϕ l ( x ) , E ϕ l ( x rec  ) ) ) + 1 2 MSE ⁡ ( E ϕ l ( x ) , E ϕ l ( x rec  ) ) ] , \begin{array}{r} \mathcal{L}_{\text {Reversed }}(x)=\sum_{l=0}^{L}\left[\left(1-\mathcal{L}_{\text {Sim }}\left(E_{\phi}^{l}(x), E_{\phi}^{l}\left(x_{\text {rec }}\right)\right)\right)\right. \\ \left.+\frac{1}{2} \operatorname{MSE}\left(E_{\phi}^{l}(x), E_{\phi}^{l}\left(x_{\text {rec }}\right)\right)\right], \end{array} LReversed (x)=l=0L[(1LSim (Eϕl(x),Eϕl(xrec )))+21MSE(Eϕl(x),Eϕl(xrec ))],

其中 E ϕ l E_{\phi}^{l} Eϕl 表示 L L L 个编码器层的第 l l l 个嵌入, x rec  = D θ ( E ϕ ( x ) ) , L Sim  x_{\text {rec }}=D_{\theta}\left(E_{\phi}(x)\right), \mathcal{L}_{\text {Sim }} xrec =Dθ(Eϕ(x)),LSim  是余弦相似度, M S E MSE MSE​ 是均方误差。编码器的目标函数结合了反向相似性的概念,定义为:

L E ϕ ( x , z ) = ELBO ⁡ ( x ) − 1 α ( exp ⁡ ( α ELBO ⁡ ( D θ ( z ) ) ) + λ L Reversed  ( x ) \mathcal{L}_{E_{\phi}}(x, z)=\operatorname{ELBO}(x)-\frac{1}{\alpha}\left(\exp \left(\alpha \operatorname{ELBO}\left(D_{\theta}(z)\right)\right)+\lambda \mathcal{L}_{\text {Reversed }}(x)\right. LEϕ(x,z)=ELBO(x)α1(exp(αELBO(Dθ(z)))+λLReversed (x)

  • 异常分数计算

    除了重建之外,准确检测异常还需要强大的异常评分计算方法。传统的基于残差的方法由于依赖于强度差异而经常面临局限性。为了解决这个问题,在计算残差之前应用自适应直方图均衡 。此外,还整合了感知差异,以增强异常检测的鲁棒性: s ( x ) = ∣ e q ( x p h ) − e q ( x ˉ ) ∣ × ( S lpips  ( x p h , x ˉ ) × S lpips  ( e q ( x p h ) , e q ( x ˉ ) ) ) s(x)=\left|\mathrm{eq}\left(x_{p h}\right)-\mathrm{eq}(\bar{x})\right| \times\left(\mathcal{S}_{\text {lpips }}\left(x_{p h}, \bar{x}\right) \times \mathcal{S}_{\text {lpips }}\left(\mathrm{eq}\left(x_{p h}\right), \mathrm{eq}(\bar{x})\right)\right) s(x)=eq(xph)eq(xˉ)×(Slpips (xph,xˉ)×Slpips (eq(xph),eq(xˉ)))

其中 S lpips  \mathcal{S}_{\text {lpips }} Slpips ​ 表示学习的感知图像贴片相似度指标。

Perceptual Image Patch Similarity (PIPS)度量是一种用于评估图像之间相似性的方法,特别关注于感知特征。这种度量通常基于深度卷积神经网络(CNN)的特征,利用这些网络提取的特征来判断图像片段(patch)之间的相似度。PIPS度量的关键在于它不仅考虑像素级别的差异,而且还着眼于图像的感知特性,如结构和纹理。这使得PIPS度量能够更好地与人类视觉系统的感知一致,特别是在处理具有复杂纹理和结构的图像时。

【应用】

  • 脑 MRI 异常定位

    image-20240125152605722

  • 儿科手腕 X 光异常定位

    image-20240125152632979

  • 胸部 X 光异常检测

    image-20240125152712100

image-20240125152721669

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1410853.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

1990-2019年城市维度区域创新创业指数面板数据/地级市创新创业指数面板数据

1990-2019年城市维度区域创新创业指数面板数据/地级市创新创业指数面板数据 1、时间:1990-2019年 2、范围:地级市(290) 3、指标:序号、年份、城市码、城市、总维度:总量指数得分、人均得分、单位面积得分…

《WebKit 技术内幕》学习之十(4): 插件与JavaScript扩展

4 Chromium扩展机制 4.1 原理 Chromium的扩展(Extension)机制 (1) 原先是Chromium推出的一项技术,该机制能够扩展浏览器的能力,例如笔者使用的一个扩展实例名为“switchy proxy”,它可以帮助用户方便的切换Chromium…

阿里云服务器4核16G3M32.25元,4核32G10M113.24元深度测评与购买建议

2024年1月24日,阿里云再次为用户带来了惊喜,推出了两款极具性价比的特价云服务器。其中,4核16G3M带宽的特惠价格仅为32.25元/月、96.75元/3个月,而4核32G10M带宽的特惠价格也仅为113.24元/月、339.72元/3个月。那么,这…

Redis性能运行参数的监测工具 - WGCLOUD

WGCLOUD是一款开源免费的运维监控平台,可以监测Redis的运行情况,比如redis的Key数量,过期Key数量,Redis的端口号,Redis的版本,同步状态,集群模式,使用内存等等数据 中间件Redis监测…

java基础:随机生成几个整数存放到数组里并按顺序输出案例分析

思路分析 具体步骤如下: 创建一个数组,用于存放生成的随机数。 定义最大值和最小值,用于限定随机数的取值范围。 使用循环和Random类中的方法生成随机数,并将其添加到数组中。 使用Arrays类中的sort()方法对数组进行排序&#…

牛客——都别吵吵了,我才是签到(质因数分解和统计质因数次数)

链接:登录—专业IT笔试面试备考平台_牛客网 来源:牛客网 题目描述 陶陶刚上一年级,今天数学课上老师教了乘法和除法,老师留了一道课后习题,陶陶很快地写完了,现在想请你帮助他检查一下是否和答案一致。…

应急响应红蓝工程师白帽子取证Linux和windows入侵排查还原攻击痕迹,追溯攻击者,以及各种木马和病毒以及恶意脚本文件排查和清除

应急响应红蓝工程师白帽子取证Linux入侵排查还原攻击痕迹,追溯攻击者,以及各种木马和病毒以及恶意脚本文件排查和清除。 一般服务器被入侵的迹象,包括但不局限于:由内向外发送大量数据包(DDOS肉鸡)、服务器资源被耗尽(挖矿程序)、不正常的端口连接(反向shell等)、服务…

简单模拟实现一个线程池

废话不多说之间上代码 import java.util.ArrayList; import java.util.List; import java.util.concurrent.ArrayBlockingQueue; import java.util.concurrent.BlockingQueue;public class MyThreadPoolExecutor {private List<Thread> listnew ArrayList<>();pri…

安全防御综合组网实验

题目 要求 生产区在工作时间可以访问服务器区&#xff0c;仅可以访问http服务器。办公区全天可以访问服务器区&#xff0c;其中10.0.2.20 可以访问FTP服务器和http服务器。10.0.2.10仅可以ping通10.0.3.10。办公区在访问服务器区时采用匿名认证的方式进行上网行为管理。办公区…

cmd_to_robot 讨论及 G29 控制优化

cmd_to_robot 讨论及 G29 控制优化 cmd_to_robot 讨论 转向电机控制代码中&#xff0c;补偿信息在循环中发布&#xff0c;转向完成信息在回调函数中发布 转动电机控制代码中&#xff0c;对转动电机的控制在转向完成的回调函数中实现 这就意味着如果一直没有 /cmd_vel 消息发…

基于蒙特卡洛模拟的家用电动汽车充电负荷预测(MATLAB实现)

采用蒙特卡洛模拟法&#xff0c;对家用电动汽车充电负荷进行预测&#xff0c;电动汽车分为快、中、慢三种充电功率&#xff0c;且分为一天一充、一天两充、一天三充三种类型。全部MATLAB代码在下方给出&#xff0c;可以直接运行。 %%%%%%%%%%%%%%%%%%%%%%%%输入电动汽车相关原…

【征服redis14】认真理解一致性Hash与Redis的三种集群

前面我们介绍了主从复制的方式和sentinel方式&#xff0c;这里我们看第三种模式-Cluster方式。 目录 1.前两种集群模式的特征与不足 2.Cluster模式 2.1 Cluster模式原理 2.2 数据分片与槽位 2.3 Cluster模式配置和实现 3.一致性Hash 3.1 哈希后取模 3.2 一致性Hash算法…

探索未知:量子计算机的崛起

探索未知&#xff1a;量子计算机的崛起 Exploring the Unknown: The Rise of Quantum Computing 在2024年1月6日&#xff0c;中国安徽省量子计算工程研究中心和量子计算芯片安徽省重点实验室宣布&#xff0c;中国第三代自主超导量子计算机“本源悟空”正式上线运行。搭载72位自…

爬虫js逆向分析——x平台(实现)

爬虫js逆向分析——x平台&#xff08;实现&#xff09; &#xff08;仅供学习&#xff0c;本案例只是分析流程没有账号&#xff09;网址&#xff1a;https://xuexi.chinabett.com/ 1.分析请求包格式 打开控制台&#xff0c;并勾选保存日志&#xff0c;然后点击登录看发送了什…

W3School离线手册(2017.03.11版)

点击下载 W3School离线手册(2017.03.11版)

Miniconda安装及使用

B站课程 下载地址 Index of /anaconda/miniconda/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror anaconda | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 1.为什么会诞生Python虚拟环境管理工具 Python 应用经常需要使用一些包第三…

C++ 关于静态成员对象、函数学习整理:

类的静态成员为类创建的所有对象所共有的成员&#xff0c;不单独属于某一对象&#xff0c;而属于整个类&#xff0c;而静态成员分为静态成员变量、静态成员函数。 静态成员变量&#xff08;静态数据成员&#xff09;&#xff1a; 引入及解决问题的优势&#xff1a; 类创建了…

pytorch与tensorflow如何选择?

目录 1.动态图和静态图1.1 tensorflow是静态图1.2 pytorch动态图 2. 易用性3. 编程语言4. 性能和扩展性5. 社区支持和生态系统 1.动态图和静态图 1.1 tensorflow是静态图 如上图&#xff1a; 定义计算图&#xff08;公式&#xff0c;包括定义变量x,y ,zx*y&#xff09;给公式…

Shiro实战详解(3)

Shiro实战详解&#xff08;3&#xff09; 04 Springboot集成Shiro1、技术栈2、数据库设计3、注解方式鉴权 05 实现分布式会话SessionManager1、会话的问题2、分布式会话实现思路3、实现步骤&#xff1a;1.创建RedisSessionDao extends AbstractSessionDAO2.配置ShiroConfig 04 …

BGP路由协议通告原则

1仅将自己最优的路由发给BGP邻居 一般情况下,如果BGP Speaker学到去往同一网段的路由多于一条时,只会选择一条最优的路由给自己使用,即用来发布给邻居,同时上送给IP路由表。但是,由于路由器也会选择最优的路由给自己使用,所以BGP Speaker本身选择的最优的路由也不一定被…