6.26.8 基于多视角深度卷积神经网络的高分辨率乳腺癌筛查

news2024/11/24 19:46:40

1. 介绍

1.1 乳腺癌筛查

        开发了一种新的DCN,它能够处理乳房x线摄影筛查的多个视图,并利用大分辨率图像而不缩小。将这种DCN称为多视图深度卷积网络(MV-DCN)。网络学习预测放射科医生的评估,将传入的样本分类为BI-RADS 0(“不完整”),BI-RADS 1(“正常”)或BI-RADS 2(“良性发现”)。研究了数据集大小和图像分辨率对所提出的MV-DCN筛选性能的影响,这将作为优化未来深度神经网络用于医学成像的事实上的指导方针。

        通过可视化预测进一步研究了所提出的MV-DCN的潜力。最后,在测试集的随机子集上,提出的模型几乎与放射科医生委员会提供的相同数据一样准确。此外,通过将模型的预测与放射科医生委员会的预测平均,获得了最好的结果。

2. 高分辨率多视图深度卷积神经网络 

2.1 深度卷积神经网络

        深度卷积神经网络[9],[10]是一种以图像x为输入的分类器,通常有多个通道对应不同的颜色(如RGB),输出p(y\mid x)类别上的条件概率分布。通过一系列非线性函数来完成的,函数逐渐变换输入的像素级图像。深度卷积网络区别于多层感知器的一个主要特性是,它严重依赖于卷积层和池化层,这使得网络对输入中视觉特征的局部平移保持不变。

2.2 多视图深度卷积神经网络

        自然图像的物体识别任务通常一次只涉及一个物体,相比之下,医学成像检查通常有一组视图。例如,在筛查乳房x线摄影中,获得患者每个乳房的颅尾侧(CC)和中外侧斜位(MLO)视图是标准的,结果是一组四张图像。我们将它们称为L-CC、R-CC、L-MLO和R-MLO。 

        首先,有研究使用深度自编码器的一种变体[11],[12],[13]从多个视图中进行无监督特征提取。通常用未标记的例子训练一个多视图深度神经网络,并使用这种网络的输出作为特征提取器,然后使用标准分类器。另一方面,Su等[14]提出直接构建多视图深度卷积网络进行分类。 

        Su等人[14]提出了一种MV-DCN的变体。MV-DCN分两个阶段计算输出。在第一阶段,将一些卷积层和池化层分别应用于每个视图。我们用h_v表示这种特定于视图的表示,其中 v 指的是视图的索引。这些特定于视图的表示被连接起来形成一个向量,[hL−CC; hR−CC; hL−MLO; hR−MLO],这是第二阶段的输入-一个完全连接的层,然后是一个产生输出分布p(y\mid x)的softmax层。 

        整个网络通过反向传播随机梯度下降联合训练[15]。此外,采用了许多正则化技术来避免由于训练数据集相对较小而导致的过拟合行为,例如通过随机裁剪[16]和dropout[17]进行数据增强。

2.3 高分辨率卷积神经网络

        在自然图像的目标识别和检测中,严重降低原始高分辨率图像的比例是很常见的。例如,ImageNet Challenge 2015(分类任务)中表现最好的网络的输入是一张缩小到224 × 224的图像[18]。这样做通常是为了在计算和内存方面提高计算效率,而且还因为在更高分辨率的图像上没有观察到明显的改进。它反映了自然图像的固有属性,其中感兴趣的物体通常比其他物体呈现出相对较大的部分,最重要的是它们的宏观结构,如形状、颜色和其他全局描述符。然而,在医学图像的情况下,输入图像的缩小是不可取的,特别是基于乳房x光检查的早期筛查。诊断的线索往往是一个细微的发现,只有在最初的分辨率下才能识别出来。

        为了解决处理全分辨率图像的计算问题,建议使用主动卷积和池化层。首先,在前两个卷积层中使用步长大于1的卷积层。而且,第一个池化层比其他池化层的步幅更大。因此,大大减少了网络早期特征映射的大小。虽然这种激进的卷积和池化会损失一些空间信息,但在训练过程中调整了网络的参数以最小化这些信息损失。这与输入的降尺度不同,它会无条件地丢失信息。其次,在最后一层对特征图进行平均,然后再将它们连接起来[19],而不是简单地将特征图平坦化,然后再将它们连接起来[16],[20]。这极大地降低了特定于视图的向量的维数,而没有太多(如果有的话)性能下降[21]。使用这两种方法,能够构建一个MV-DCN,它需要四个2600 × 2000像素的图像(每个视图一个)作为输入,而不需要任何降比例。

3. 相关工作

3.1 多阶段vs端到端方法

        传统上,乳腺癌筛查和病变检测分三个阶段进行:检测、分析和最终评估/管理。在第一阶段,乳房x光图像被分割成不同类型的区域,如前景(乳房)和背景。在乳房的分割区域内,第二阶段的重点是提取一组感兴趣的区域(ROI),这些区域将被更详细地检查。在第三阶段,确定每个ROI是否是恶性病变。第三阶段的结果用于对由多个视图组成的给定案例做出最终决定。

        Kooi等[29]提出使用随机森林分类器进行质量检测,然后使用DCN对每个检测到的质量进行分类。Becker等人[30]也提出了类似的方法。Akselrod-Ballin等人[31]进一步提出使用深度卷积网络进行大规模检测和分类,有可能实现端到端训练。 

3.2 数据大小

        为了避免小训练数据的问题,大多数早期的工作都采用许多小补丁或ROI进行训练,避免端到端训练。一个例外是Carneiro等人[33]的工作,他们使用了整个图像,然而,深度卷积网络在自然图像中预训练了对象识别。与这些早期的方法不同,我们使用了一个前所未有的大规模数据集,由886,437张图像组成。这使我们能够仔细研究训练数据集大小的影响。 

3.3 自然分配vs控制分配

        INBreast在良性和恶性病例之间大致达到了平衡。这种人为的平衡,或者相当于恶性病例的上采样,可能会使模型更频繁地预测一个给定的病例是恶性的,并且需要比必要的更频繁地召回。与这些早期的工作不同,在本文中,使用了完整的数据,而没有人为地平衡结果,以确保任何训练过的深度卷积网络都能紧密地反映结果的自然分布。

4. 数据预处理和增强

        对于每个图像,我们计算其像素的平均值µ和标准差σ。然后我们从每个像素减去µ,并将每个像素除以σ。此外,我们水平翻转了R-CC和R-MLO视图的图像,使乳房始终在图像的同一侧。 

        由于图像的大小不同,并且每个图像的大部分表面是空的,因此将它们裁剪为2600 × 2000像素的大小。这么做有两个原因。首先,要统一图像的大小(我们需要在训练时将它们放在小批量中),同时保持它们的规模相似;其次,避免处理不包含任何信息的背景。

5. 定量结果分析

5.1 尺度的影响

        首先,验证了之前关于需要大规模数据来充分利用深度卷积神经网络的说法。在不同大小的训练集上训练单独的网络;原始训练集的100%,50%,20%和10%,5%,2%和1%。在表III中,我们观察到分类性能随着训练样本数量的增加而提高。这说明了使用大型训练集的重要性。这与计算机视觉、自然语言处理和语音识别等许多其他领域的观察结果一致[8]。 

5.2 分辨率的影响

        使用完整的训练集,训练了具有不同输入分辨率的网络;将输入的两个维度分别缩放×1/8, ×1/4和×1/2。使用双三次插值来缩小输入。当输入分辨率明显小于原始分辨率时,由于特征映射的大小小于卷积核的大小,后期的一些卷积层无法应用。在这种情况下,直接跳过剩下的层,直到全局平均池化。如表4所示,当输入的每个维度缩小一半时,已经看到了性能的下降。随着更大幅度的缩小,性能进一步下降。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1870166.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MATLAB2024a下的神经网络聚类工具箱聚类

1 打开神经网络聚类工具箱GUI界面 图1-1 2 导入训练数据 图2-1 导入训练集如图2-2,图2-3、图2-4所示 图2-2 图2-3 图2-4 如图2-4,确认无误点击确定 3 模型训练 如图3-1,调整验证集与测试集比例及映射大小后点击”训练“,开始训练…

手写SpringMVC之ApplicationContextListener

什么是Spring MVC? Spring Web MVC是基于Servlet API构建的原始Web框架,从一开始就包含在Spring Framework中。正式名称“Spring Web MVC”来自其源模块的名称( spring-webmvc ),但它通常被称为“Spring MVC”。 手写…

2024最新特种设备(锅炉作业)题库分享。

1.锅炉蒸发量大小是由(  )决定的。 A.压力的高低 B.受压元件多少 C.受热面积大小 答案:C 2.哪项不是自然循环的故障?( ) A.停滞 B.倒流 C.下降管带汽 D.上升管带汽 答案:D 3.水冷壁被现代大型锅炉广泛采用的是(  )。 A.光管水冷壁 B.膜…

锐捷AP从其它项目拆下,怎么也加入不了到现在这个网络里来

环境: AP 产品型号:RG-RAP2260G 问题描述: 锐捷AP从其它项目拆下,怎么也加入不了到现在这个网络里来,现网是WIFI5的,想把2260G用来升级,恢复出厂设置后,插上网线,现网找不到这个AP 解决方案: 1.通电重置AP后,连接AP WiFi进入管理页面,要求先快速配置 2.开始配置…

【电路笔记】-MOSFET放大器

MOSFET放大器 文章目录 MOSFET放大器1、概述2、电路图3、电气特性3.1 ** I D = F ( V G S ) I_D=F(V_{GS}) ID​=F(VGS​)**特性3.2 I D = F ( V D S ) I_D=F(V_{DS}) ID​=F(VDS​)特性4、MOSFET放大器5、输入和输出电压6、电压增益7、总结1、概述 在前面的文章中,我们已经…

01.Ambari自定义服务开发-项目初始化

文章目录 基础环境在PyCharm中初始化项目配置项目相关依赖在PyCharm中导入依赖 基础环境 PyCharmPython 2.7已经安装完成的Ambari服务端 在PyCharm中初始化项目 项目名称就是我们要安装服务的名称,要求名称为全大写,如:DORIS创建Python2.7…

网格处理库 pmp-library 编译及应用笔记 -- 已全部解决√

多边形网格处理库Polygon Mesh Processing Library,简称pmp-library的 编译及应用笔记 – 已全部解决√ 官网:https://www.pmp-library.org/index.html 代码:https://github.com/pmp-library/pmp-library 平台:Ubuntu1 20.04&…

知识图谱——Neo4j数据库实战

数据与代码链接见文末 1.Neo4j数据库安装 JDK 安装:https://www.oracle.com/java/technologies/javase-downloads.html Neo4j 安装:https://neo4j.com/download-center/ 配置好 JDK 和 Neo4j 的环境变量

多电商账户为什么要用指纹浏览器?

随着电子商务的蓬勃发展,越来越多的商家选择开设多店来扩大经营规模。然而多店运营也带来了一系列的挑战,其中之一就是账号安全。 1. 了解反检测浏览器和代理服务器 在我们开始讨论如何有效地使用反检测浏览器之前,我们首先需要了解这两个工…

Excel 宏录制与VBA编程 —— 12、文本字符串类型相关(转换、拆分、分割、连接、替换、查找、“Like“)

字符串分割,文末示例(文末代码3附有源码) 代码1 - 基础字符串 代码2 - 字符串拆分 代码3 - 字符串分割 Option ExplicitSub WorkbooksClear()Dim DataRange As RangeSet DataRange Range("C2:E12")DataRange.Clear End SubSub Wo…

爆火网络的 AI 粘土风照片,如何用免费的AI绘画工具Stable Diffusion实现?只需一个Lora即可轻松解决!

大家好,我是画画的小强 最近粘土滤镜照片在小某书上爆火,随便一翻就出现好多 这些丑可爱丑可爱的粘土滤镜是这样紫。 这些照片都是通过手机APP Remini 来转绘的。Remini原来是由国人开发,据说卖给了国外公司,现在排在了谷歌商店下…

最年轻获奖者诞生!一文带你了解历届国家最高科学技术奖获奖人

内容来源:量子前哨(ID:Qforepost) 文丨浪味仙 排版丨沛贤 深度好文:4000字丨15分钟阅读 作为国家层面面向科学、技术领域的最高级别奖励,国家最高科学技术奖于 2000 年由国务院设立,每年评选…

8. Revit API UI: DockablePane(可停靠窗口)

8. Revit API UI: DockablePane(可停靠窗口) 接着前面的预览控件和外部事件,这一篇,我们来看看可停靠窗口DockablePane的实现。 实现流程 可停靠窗口相关的类与接口主要有DockablePane和IDockablePageProvider,都是…

探索Facebook的未来世界:数字社交的演进之路

在数字化和全球化的浪潮中,社交网络如Facebook已经成为了人们日常生活不可或缺的一部分。然而,随着技术的迅猛发展和用户需求的不断变化,Facebook正在经历着社交平台的演进之路。本文将探索Facebook的未来世界,分析数字社交的发展…

Android 13 为应用创建快捷方式

参考 developer.android.google.cn 创建快捷方式 来自官网的说明: 静态快捷方式 :最适合在用户与应用互动的整个生命周期内使用一致结构链接到内容的应用。由于大多数启动器一次仅显示四个快捷方式,因此静态快捷方式有助于以一致的方式执行…

ADC位数、增益调制与参考电压

位数:12bit、10bit、8bit 一般就是对应的ADC值分别为:4095、1023、255,也就选用对应位数时ADC的最大值。 增益的作用 增益设置用于放大或缩小输入信号,使其适配到ADC的输入范围。增益设置可以通过配置SAADC的通道配置寄存器来实…

第一后裔The First Descendant开服时间、配置要求一览

第一后裔是一款采用虚幻5引擎打造的第三人称合作射击动作RPG,玩家将化身为一名继承者,通过各种任务和故事不断成长,为守护人类与对抗侵略者战斗。该作即将上线,为了不让玩家们错过这款精彩的游戏,本文整理了第一后裔上…

[行业原型] Web端原型案例:康欣医疗后台管理系统

​医疗管理系统是一个业务复杂,功能庞大的系统,以下为HIS医院管理系统的常见模块,供大家参考。 本周为大家带来Web端原型案例:康欣医疗后台管理系统,先上原型: 完整文档加班主任微信号 添加班主任回复 “1…

推荐两款电脑文件处理工具,强大到你不舍得卸载

EasyFileCount EasyFileCount是一款基于Java开发的多功能文件管理工具,旨在帮助用户更轻松地管理和优化他们的文件存储。以下是EasyFileCount的主要功能和特点: 查看文件夹大小:用户可以快速统计和查看文件夹的总大小,实时显示各…

基于C++实现的EventLoop与事件驱动编程

一,概念介绍 事件驱动编程(Event-Driven)是一种编码范式,常被应用在图形用户界面,应用程序,服务器开发等场景。 采用事件驱动编程的代码中,通常要有事件循环,侦听事件,…