5.25.6 深度学习在放射图像中检测和分类乳腺癌病变

news2024/11/18 15:30:36

计算机辅助诊断 (CAD) 系统使用数字化乳房 X 线摄影图像并识别乳房中存在的异常情况。深度学习方法从有限数量的专家注释数据中学习图像特征并预测必要的对象。卷积神经网络(CNN)在图像检测、识别和分类等各种图像分析任务中的性能近年来表现出色。本文提出利用高精度和先进的对象检测深度学习方法 Faster R-CNN 对乳房 X 光照片中的乳腺癌病灶进行自动检测和分类。所提出的 CAD 系统使用 330 个乳房 X 线摄影图像,其中 121 个带注释的图像用于训练 Faster R-CNN 网络。

1. 介绍

有助于早期发现乳腺癌的三个重要预防措施是每月乳房自我检查、定期临床乳房检查和筛查乳房X光检查。高死亡率主要是由于缺乏癌症的早期发现。

乳房X光检查还可能有助于确定高风险癌症因素,例如含有大量腺体组织的致密乳房。乳房X线照相过程被认为是耗时、乏味的,更重要的是它容易出现错误[4]。事实证明,CAD 系统在准确诊断医学图像方面效果良好,可用于乳房 X 光检查来解决这些问题。

1.1 文章贡献

本文提出利用高精度和先进的对象检测深度学习方法 Faster R-CNN 对乳房 X 光照片中的乳腺癌病灶进行自动检测和分类。

Faster R-CNN 具有三个模块,即作为完全连接网络的基本模型提取出特征图,第二个模块识别所有感兴趣的区域,第三个模型检测第二个模型提出的区域中存在的确切对象[ 7]。本文使用预训练的 VGG-16 网络作为基础卷积网络来提取区域和用于对象检测的 Fast R-CNN [8,9]。

1.2 数据集 

所提出的 CAD 系统使用迷你 MIAS 数据库作为实验数据集,它是 MIAS 数据库的子集。 Mini-MIAS 数据库拥有 330 张分辨率为 50 微米的数字化乳房 X 光图像。其分辨率已降低至 1024 x 1024 像素的 200 微米分辨率。

2. 材料和方法

2.1 问题定义

如果乳腺癌发现得早,而且肿瘤很小并且没有扩散,那么乳腺癌很容易成功治疗。定期筛查是早期乳腺癌发现的最佳方法之一。

乳房 X 光检查乳房图像是通过将乳房暴露在较低剂量的辐射下生成的。由癌症、脂肪细胞或囊肿等其他情况引起的乳房异常可以在数字化乳房 X 光图像中显示为肿块。微钙化是微小的钙簇,甚至暴露在数字化的乳房X光图像中。

2.2 相关工作

乳腺X线摄影图像中图像分类任务的挑战是识别微小的肿瘤细胞。尽管手动注释的 ROI 分类是重要的第一步,但 CAD 系统必须能够对整个乳房 X 线照片进行操作,以提供已知病变之外的附加信息并增强临床解释。乳房X线摄影数据库中带注释的mamo图像可以轻松使用对象检测和分类方法,例如基于区域的卷积神经网络(R-CNN)及其变体[14-16]。

目前 CNN 模型的设计方式可以提高放射科医生在最早阶段发现最小乳腺癌的能力。这有助于向放射科医生发出需要进一步分析的警报[18]。研究表明,CNN 为微小病变提供了额外的描述,有助于放射科医生更好的诊断和准确的预测 [19]。 

2.3 数据

实验数据集 mini-MIAS 数据库有 330 个数字化乳房 X 光照片。在这 330 张乳房 X 光检查图像中,67 张被证明是良性的,54 张是恶性的,209 张是正常的。实验数据集还包括其他发现,例如图像中存在的异常类别、它们的位置以及乳腺组织的类型,即脂肪、脂肪腺和致密腺。

2.4 方法

本文提出了一种使用深度学习技术对数字化乳腺X线图像进行自动乳腺癌病灶识别的方法。一般来说,CNN 包含两个或多个层的堆栈,如输入层、隐藏层和输出层。一个或多个卷积层、池化层和全连接层是 CNN 隐藏层的一部分。目前的目标检测网络主要依赖于提取区域的算法。本文提出了一种先进的基于 CNN 的目标检测系统 Faster R-CNN,用于数字化乳房图像中的病变检测。

Faster R-CNN 具有基础网络 RPN 和对象检测网络 Fast R-CNN。


RPN 是一个完全连接的卷积网络,它根据训练图像中每个位置的高概率分数来确定对象的边界框。

RPN 与 Fast R-CNN 共享全图像卷积特征,有助于检测对象。

对象检测网络使用区域提议算法来检测对象位置。这些区域提议算法生成边界框,其中该区域中对象存在的概率很高。这些边界框是 RPN 通过对特征图执行卷积运算产生的。这些特征图包含专家注释的输入图像的主要特征。这些特征图由基础网络 VGG-16 生成。


2.5 CNN 训练和前后处理方法

121 个异常(67 个良性和 57 个恶性)乳房 X 光检查图像均已缩小为 600 x 600 像素大小的图块,以便更快地进行训练。数据集分为 106 张图像的训练集和 15 张图像的测试集。

Faster R-CNN 的两个模块由三部分组成,即基础网络、区域提议网络和分类器层。该模型使用的基础网络是 VGG16,有 16 层[21]。用于训练的基本模型是在 ImageNet 数据集中的 120 万张图像上进行预训练的。该网络给出的特征图被传递到区域提议网络和分类器层,如图所示

RPN是一个小型卷积神经网络,它使用基础网络生成的特征图,并提出区域/框束(锚点)来检测物体的存在。更准确地说,RPN 预测锚点是背景或前景的可能性,并细化锚点,如下图 所示。得分超过阈值的区域将被传递给 Fast R-CNN 分类器。

在 RPN 提出的不同大小的区域之前,它们会在 ROI 池化层进行变换,通过最大池化生成固定大小的特征图,如图 3 所示。从重叠框中,使用非最大抑制 [22] 选择最佳预测。

乳房 X 线摄影图像中的物体(病变)比 imageNet 图像中的物体小很多。因此,所提出的系统将物体检测阈值从 0.7 降低到 0.6。在分类器层,RPN 提出的病变边界框(区域)被回归并分类为恶性和良性标签。

3. 结果和讨论

实验数据集 mini-MIAS 数据库有 121 张异常乳房 X 光检查图像。所提出的网络 Faster R-CNN 使用基础网络 VGG16 和生成的特征图进行训练。基础网络生成的特征图已传递给 RPN。RPN 使用此特征图来提出用于检测物体存在的区域/框束。得分超过阈值的区域将传递到分类器最终层。分类器最终层进一步回归并将 RPN 提出的边界框分类为正常、恶性和良性。

任何 CNN 模型最初都会从训练数据中学习特征。在很好地拟合训练数据后,该模型会尝试概括并对传入的新数据做出准确的预测。如果模型训练数据太好,就会遇到过度拟合问题。过度拟合会学习最佳特征,而图像的噪声会导致错误的预测,从而影响模型的准确性。可以通过将数据集拆分为训练和测试数据的交叉验证来克服过度拟合。使用训练集对模型进行训练,并使用验证集评估其预测性能。为了对最终模型进行无偏评估,将测试集应用于模型。

Faster-RCNN 在测试数据上运行,并生成带有相关置信度分数的边界框列表。如果置信度分数大于给定的阈值,则相应边界框内存在对象。如果预测框的 IoU 大于阈值 (0.5),则该框被宣布为真阳性。否则,它就是假阳性。在 Faster R-CNN 等模型中,最终结果是在两个任务(即对物体进行分类(良性或恶性)和定位(边界框预测))的综合执行后获得的。

虽然传统的 Faster R-CNN 无法检测到几个较小的物体,但通过调整一些参数,如减少锚框尺度和 RPN 重叠值,在检测较小的病变方面比传统的 Faster R-CNN 效果更好。较小物体的另一个问题是网络可能会忘记在初始阶段学习到的特征。应该实施一种将在起始层学习到的特征传播到最后一层的方法。这可以使用残差网络作为基础网络来完成。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1713200.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

用易查分制作研学活动报名,支持在线签名,一键导出报名统计表格!

学校组织研学活动时,需要家长扫码在线填写报名信息,确认安全承诺和手写签名,提交报名后希望分配报名号,应该如何实现? 易查分的新建填表功能就可以实现上述需求,下面就来教大家如何制作吧。 📌使…

常用IP核的引脚图

一、复数乘法 这是一个Xilinx(赛灵思)的复数乘法IP核的接口图,包含了几个主要的AXI-Stream接口。每个接口都有其特定的用途,下面将详细解释各个引脚的作用。 主要接口和引脚说明 S_AXIS_A(输入复数A) s…

【网络安全】新的恶意软件:无文件恶意软件GhostHook正在广泛传播

文章目录 推荐阅读 一种新的恶意软件 GhostHook v1.0 正在一个网络犯罪论坛上迅速传播。这种创新的无文件浏览器恶意软件由 Native-One 黑客组织开发,具有独特的分发方式和多功能性,对各种平台和浏览器构成重大威胁。 GhostHook v1.0 支持 Windows、Andr…

一个交易者的自白:念念不忘的交易,10个日内9个亏

一、新手: 面对爆仓,我像个白痴 我是在2012年开始接触的,这些年里我尝到了残酷失败的滋味,更品尝过胜利带来的喜悦。刚刚接触时很自信,总想着自己有一天一定会变成千万富翁的,用杠杆获取暴利。 在我首次爆仓的时候,我的…

QT6.2.4 MSVC2019 连接MySql数据库,无驱动问题

1.下载 查询一下数据库驱动 qDebug()<<QSqlDatabase::drivers(); 结果显示&#xff0c;没有QMYSQL的驱动。 QList("QSQLITE", "QMARIADB", "QODBC", "QPSQL") MySql6.2.4驱动下载地址&#xff0c;如果是别的版本&#xff0c;…

使用Python构建CART决策树回归模型

数据预处理 此次构建模型是根据泰坦迪克号邮轮票价、乘客性别、船上亲友数量等特征信息来预测乘客存活率的模型&#xff0c;使用的数据集为泰坦尼克数据集&#xff0c;下载地址&#xff1a;taitanic | Kaggle。 在下载完数据集后&#xff0c;可以先试用 ydata_profiling库&am…

Codeforces Round 946 (Div. 3) A~G

A.Phone Desktop (枚举) 题意&#xff1a; 小 A A A的手机有一个桌面&#xff08;或称启动器&#xff09;。桌面可以由多个屏幕组成。每个屏幕表示为大小为 5 3 5 \times 3 53 的网格&#xff0c;即五行三列。 有 x x x 个应用程序的图标大小为 1 1 1 \times 1 11 个单…

高铁Wifi是如何接入的?

使用PC端的朋友&#xff0c;请将页面缩小到最小比例&#xff0c;阅读最佳&#xff01; 在飞驰的高铁上&#xff0c;除了窗外一闪而过的风景&#xff0c;你是否好奇过&#xff0c;高铁Wifi信号如何连接的呢&#xff1f; 远动的火车可不能连接光纤吧&#xff0c;难道是连接的卫星…

6.2 Go 切片(Slice)

&#x1f49d;&#x1f49d;&#x1f49d;欢迎莅临我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…

OrangePi AIpro初体验:开启嵌入式开发之旅

概述 随着物联网和智能设备时代的到来&#xff0c;单板电脑因其独特的优势成为创新项目和教育实践的重要工具。在众多单板电脑中&#xff0c;香橙派以其出色的性能和亲民的价格&#xff0c;十分吸引博主这初涉嵌入式开发的新手。博主有幸被CSDN邀请对OrangePi AIpro进行测评。…

Anaconda虚拟环境安装Pybullet

Anaconda虚拟环境安装Pybullet 当直接使用pip install Pybullet的时候出现以下问题&#xff1a; 查看报错信息和CSDN上的许多博客教程&#xff0c;基本都在说与缺少C的依赖有关需要安装几个G的microsoft visual 我尝试使用Conda 包管理器从 conda-forge 通道安装名为 pybulle…

PyTorch自定义张量操作开发指南【CFFI+CUDA】

PyTorch 与 TensorFlow 一起成为深度学习研究人员和从业者的标准。虽然 PyTorch 在张量运算或深度学习层方面提供了多种选择&#xff0c;但一些专门的操作仍然需要手动实现。在运行时至关重要的情况下&#xff0c;应使用 C 或 CUDA 来完成此操作&#xff0c;以支持 CPU 和 GPU …

快团团供货大团长如何打印电子面单?

一、功能说明 快团团打单平台是目前唯一一个服务于快团团团长的打单发货工具&#xff0c;免费提供给团长使用。可帮助团长快速打印面单、分拣包裹、完成发货。 目前快团团打单平台已支持大批量打印快递单、自定义快递面单、自动发货、绑定拼多多电子面单账号等功能&#xff0c…

摸鱼大数据——Hive表操作——复杂类型

1、hvie的SerDe机制 其中ROW FORMAT是语法关键字&#xff0c;DELIMITED和SERDE二选其一。本次我们主要学习DELIMITED关键字相关知识点 如果使用delimited: 表示底层默认使用的Serde类:LazySimpleSerDe类来处理数据。 如果使用serde:表示指定其他的Serde类来处理数据,支持用户自…

香橙派AIpro开发板初体验

香橙派AIpro开发板初体验 一、引言 在当前的AI发展浪潮中&#xff0c;边缘计算逐渐成为了研究的热点。香橙派AIpro开发板作为一款基于昇腾AI技术的开发板&#xff0c;凭借其强大的算力和丰富的接口&#xff0c;为AI边缘计算提供了强大的支持。最近&#xff0c;我也是拿到了官…

揭秘SQL中的公用表表达式:数据查询的新宠儿

欢迎来到我的博客&#xff0c;代码的世界里&#xff0c;每一行都是一个故事 揭秘SQL中的公用表表达式&#xff1a;数据查询的新宠儿 前言公用表表述的概述非递归CTE的作用递归CTE的作用CTE性能优化 前言 你是否曾经为SQL查询的复杂性而困扰不已&#xff1f;尤其是那些读写层子…

数据结构(一)顺序表

目录 一、概念&#xff08;一&#xff09;数据结构的三元素1. 逻辑结构&#xff08;1&#xff09;线性结构&#xff08;2&#xff09;非线性结构 2. 存储结构&#xff08;1&#xff09;顺序存储&#xff08;2&#xff09;链式存储&#xff08;3&#xff09;索引存储 3. 运算 &a…

douyin-vue:使用Vue3、Pinia和Vite5打造高度还原的抖音仿制项目

一&#xff1a;引言 在前端技术日新月异的今天&#xff0c;Vue.js作为一款流行的前端框架&#xff0c;不断吸引着开发者的目光。最近&#xff0c;GitHub上出现了一个备受瞩目的项目——douyin-vue&#xff0c;这是一个基于Vue3、Pinia和Vite5的移动端短视频项目&#xff0c;旨…

CCF20220301——未初始化警告

CCF20220301——未初始化警告 代码如下&#xff1a; #include<bits/stdc.h> using namespace std; #define Max 100000 int x[Max]{0},y[Max]{0}; int main() {int n,k;int cnt1,flag0;cin>>n>>k;for(int i1;i<k;i)cin>>x[i]>>y[i];for(in…

Linux命令 jps(Java Process Status)解释

文章目录 1、第一种解释2、第二种解释3、第三种解释 1、第一种解释 jps 命令本身并不是一个标准的 Unix/Linux 命令&#xff0c;但您可能是想提到 jps 的一个变种或误写了 jps 为 jps&#xff0c;而实际上可能是想提及 jps&#xff08;Java Virtual Machine Process Status To…