6.26.7 两阶段卷积神经网络在乳腺癌组织学图像分类中的应用

news2024/10/6 8:59:38

        本文探讨了乳腺组织显微图像的分类问题。根据主要的癌症类型,目标是将图像分为四类:正常、良性、原位癌和浸润性癌。给定合适的训练数据集,利用深度学习技术来解决分类问题。由于训练数据集中每个图像的大小很大,提出了一种基于patch的技术,该技术由两个连续的卷积神经网络组成。第一个“patch-wise”网络作为自动编码器,提取图像patch中最显著的特征,而第二个“image-wise”网络对整个图像进行分类。第一种网络经过预训练,旨在提取局部信息,第二种网络获取输入图像的全局信息。使用ICIAR 2018年乳腺癌组织学大挑战(BACH)数据集训练网络。与先前文献中报道的77%的准确率相比,所提出的方法在验证集上产生95%的准确率。

1. 引言

        在活组织检查中,通过手术取出组织样本进行分析。这可以表明哪些细胞癌变,如果癌变,这些细胞与哪种类型的癌症有关。活检标本的显微成像数据体积大,性质复杂。因此,病理学家在组织病理学癌症诊断方面面临着大量的工作量增加。

        近年来,深度学习技术的出现解决了医学图像处理领域的许多问题。提出了一种基于深度卷积神经网络(CNN)的乳腺癌组织图像分类方案。当输入是高维数据(如图像)时,卷积网络被认为是分类问题的最新技术。这些网络“学习”从图像中提取局部特征,并根据提取的特征对输入进行分类。显微镜图像的尺寸非常大,由于硬件障碍,文献[3,4,5]中提出了几种基于patch的CNN方法,将输入图像处理为一组较小的patch。在这些模型中,每个图像被分成更小的补丁,每个补丁被“补丁智能”分类器网络分类并分配给一个标签。

        为了在整个图像级别进行分类,在patch-wise网络之后是另一个分类器,该分类器接收来自第一个网络的输出标签作为输入,并生成标签分数。这些技术在图像斑块上实现了高精度和高置信度,然而,它们无法捕获图像的全局属性:一旦所有图像斑块被标记,空间信息被忽略,并且斑块之间可能共享的任何特征都丢失了。

        提出了一种新的两阶段卷积神经网络,以一种补丁式的方式,旨在利用输入的局部和全局信息。该方法不需要大量的端到端训练内存占用。在该方案中,补丁智能网络的唯一目的是从每个补丁中提取空间较小的特征映射。经过训练后,该网络将根据图像的局部信息从所有斑块中提取出最显著的特征图。这些特征图堆叠在一起,形成空间上较小的“图像智能”网络的3D输入。该网络基于从图像中提取的局部特征和不同patch之间共享的全局信息对图像进行分类。

        使用ICIAR 2018乳腺癌组织学大挑战(BACH)数据集[6]来训练我们的网络,该数据集包含400张苏木精和伊红(H&E)染色的乳腺组织学显微镜图像。模型在验证集上达到了95%的准确率,在分类准确率方面优于[3]。        

2. 相关工作

        在过去的几年中,已经发表了一些针对使用cnn进行乳腺癌检测和分类的工作[7,8,9,10,11,5,12]。虽然所有这些作品的目的都非常相似,但每个作品都考虑了特定类型的问题。例如,[7,8,9]提出了两类(恶性和良性)分类器。[10,11]中的其他作品考虑了更复杂的3类分类(正常癌、原位癌和浸润癌)。最后,[5,12]制定了乳腺癌的分割方案。 工作在本质上与Ara´ujo等[3]的工作相似。其是第一个考虑乳房组织图像的四类分类器的团队。开发了CNN,然后是支持向量机(SVM)分类器。在他们的技术中,首先将原始图像分成12个连续的不重叠的小块。使用patch-wise训练的CNN和CNN+SVM分类器计算patch类概率。最后,采用三种不同的斑块概率融合方法进行图像分类。这三种方法分别是“majority voting”、“maximum probability”和“sum of probabilities”[3]。 

3. 方法

        给定一张高分辨率(2048 × 1536)的组织学图像,目标是将图像分为四类:正常组织、良性组织、原位癌和浸润癌。

3.1 基于patch的CNN方法

        数据集中图像的高分辨率特性以及从中提取相关歧视性特征的需要,对实现常规前馈卷积网络施加了额外的限制。在高分辨率图像上训练CNN需要非常大的内存占用,这在大多数情况下是不可用的,或者逐步减少图像的空间大小,以便下采样版本可以存储在内存中。然而,对图像进行降采样会增加失去鉴别特征(如细胞核信息及其密度)的风险,从而无法正确区分癌细胞和非癌细胞。此外,如果在大型显微镜图像上进行训练,神经网络可能会学会只依赖最显著的特征,而完全抛弃其他所有特征。 

        遵循由[3,4,5]提出的patch-wise CNN方法,然后是一个image-wise CNN,将组织学图像分为四类。给定一个显微镜图像,通过在图像上滑动一个大小为k × k的补丁(窗口),步长为s来提取固定大小的补丁。 总共提取了总数为[1+\frac{I_{W}-k}{s}]\times [1+\frac{I_{H}-k}{s}]的补丁,其中I_{W}I_H分别是图像的宽度和高度。选择k = 512的patch大小。还选择了s = 256的步长,得到了7 × 5 = 35个重叠的图像patch。允许重叠对于补丁智能网络学习补丁之间共享的特征是必不可少的。适当的步幅是通过考虑两个网络在一起“工作”时的接受域来选择的。图1概述了我们的两阶段CNN。注意,训练集中的标签仅为整个图像提供,而单个补丁标签是未知的,然而我们使用基于相应显微镜图像标签的分类交叉熵损失来训练补丁智能网络。

这个网络就像一个自动编码器,学习提取图像补丁中最显著的特征。

        一旦训练完成,丢弃该网络的分类器层,并使用最后一个卷积层从图像中任意数量的补丁中提取大小为(C × 64 × 64)的特征映射,其中C是我们提出的系统中的另一个超参数,它控制输出特征映射的深度。

CNN是在图像块上训练的。从所有图像补丁中提取的特征映射叠加在一起,传递给第二个CNN,后者学习预测图像级标签。

3.2 网络体系架构

        使用一系列3 × 3卷积层,然后是池化层,每次下采样后通道数量增加一倍,来设计patch-wise CNN。所有卷积层之后是批处理归一化[14]和ReLU非线性[15]。我们遵循[16]的指导原则,通过使用2的步幅来实现偶尔降维的齐次全卷积网络。在测试中,发现stride为2的2 × 2内核在性能方面优于传统的最大池化层。对于分类任务,不是使用完全连接的层,而是使用1 × 1的卷积层从其下的卷积层获得特征映射的空间平均值,因为置信度类别和结果向量被馈送到softmax层[17]。稍后使用这个特征映射作为图像CNN的输入。为了进一步控制和实验使用空间平均层的效果,引入了另一个控制输出特征图深度的超参数C。批归一化和全局平均池化都是结构性正则器[17,14],它们天生就能防止过拟合。因此,没有在模型中引入任何dropout或权重衰减。总的来说,网络中有16个卷积层,输入在第3层、第6层和第9层被下采样3次。图2展示了所建议的逐补丁网络的总体结构。 

        对于提出的image-wise网络,遵循类似的模式。一系列3 × 3的卷积层之后是一个2×2卷积,步长为2,用于下采样。每层之后是批归一化和ReLU激活函数。使用与之前相同的1 × 1卷积层来获得分类器之前激活图的空间平均值。卷积层之后是3个完全连接的层,最后是一个softmax分类器。与patch-wise网络不同,过拟合是该网络的主要问题,因此,使用dropout[18]以0.5的比率对该网络进行了大量正则化,并在验证精度没有提高时使用提前停止来限制过拟合。网络架构如图3所示。 

        最后一个卷积层相对于patch-wise网络的接受野为252[19]。原则上,这个数字必须是在提取patch时可以选择的最大跨距值s,以覆盖输入图像的整个表面。在实验中,s = 256几乎具有相同的精度。大的补丁大小(512 × 512)使网络对s的小变化不变性。注意,s的小值使训练时间变慢,网络容易过度拟合。

4. 实验和结果

        数据集由400张高分辨率苏木精和伊红(H&E)染色的乳腺组织学显微镜图像组成,这些图像被标记为正常、良性、原位癌和浸润性癌(每个类别100张图像)。这些图像是从整个幻灯片图像中提取的补丁,并由两位医学专家注释。病理学家之间存在分歧的图像被丢弃。图4突出显示了样本图像中的可变性。 

        对于卷积网络来说,数据集的大小相对较小。为了防止斑块智能网络过度拟合,对从显微镜图像中提取的斑块进行了一些数据增强。病理图像不具有规范取向,分类问题是旋转不变性的[12,3]。为了扩大数据集,将每个补丁旋转4倍90度,有镜像和没有镜像,这导致每个补丁有8个有效的变化。根据[20]的建议,进一步将随机颜色扰动应用于这些变化,并产生8个以上的斑块。颜色增强过程有助于我们的模型学习颜色不变性特征,使预处理颜色归一化[21]步骤变得不必要。补丁数据集的总大小变成16×35×400。

5. 总结和未来工作

        考虑了使用显微组织图像进行乳腺癌分类的问题。利用深度学习技术,提出了一种新的两阶段CNN管道,以克服处理超大图像所带来的硬件限制。第一个所谓的patch-wise网络作用于整个图像的较小的补丁,并输出空间较小的特征图。第二个网络在补丁网络之上运行。它接收来自patch-wise网络的特征映射堆栈作为输入,并生成图像级标签分数。在这个框架中,patch-wise网络负责捕获输入的局部特征,而image-wise网络则学习组合这些特征并找到相邻补丁之间的关系,以全局推断图像的特征并生成类自信分数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1869466.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

美团校招机试 - 小美的平衡矩阵(20240309-T1)

题目来源 美团校招笔试真题_小美的平衡矩阵 题目描述 小美拿到了一个 n * n 的矩阵,其中每个元素是 0 或者 1。 小美认为一个矩形区域是完美的,当且仅当该区域内 0 的数量恰好等于 1 的数量。 现在,小美希望你回答有多少个 i * i 的完美…

软件测试面试题:Web View如何测试?

Web View介绍 Web View(网页视图)是一种用于在应用程序中显示网页内容的组件或控件。提供了一种将网页内容嵌入到应用程序中的方式,使用户能够在应用程序中浏览和交互网页。 Web View通常用于开发移动应用程序,特别是混合应用程…

SOBEL图像边缘检测器的设计

本项目使用FPGA设计出SOBEL图像边缘检测器,通过分析项目在使用过程中的工作原理和相关软硬件设计进行分析详细介绍SOBEL图像边缘检测器的设计。 资料获取可联系wechat 号:comprehensivable 边缘可定义为图像中灰度发生急剧变化的区域边界,它是图像最基本…

2024年G1工业锅炉司炉证考试题库及G1工业锅炉司炉试题解析

题库来源:安全生产模拟考试一点通公众号小程序 2024年G1工业锅炉司炉证考试题库及G1工业锅炉司炉试题解析是安全生产模拟考试一点通结合(安监局)特种作业人员操作证考试大纲和(质检局)特种设备作业人员上岗证考试大纲…

LED裸眼3D显示屏:开启视觉新体验

随着科技的不断进步,LED显示屏作为一种新型的显示技术,已经被广泛应用于各个领域。而其中,LED裸眼3D显示屏更是因其独特的技术原理和令人震撼的视觉效果,成为了业界关注的焦点。 裸眼3D显示屏是一种前沿的显示技术,它…

超越规模的冒险之旅:引导人工智能价值对齐

在茫茫技术之林中,人工智能凭借大模型占据了重要地位。人们已经不再局限于人机对弈和AI识图,开始探索那些能够模仿人类思考的机器。无论是日常聊天、文本写作,还是[在完美的提示词引导下创作出惊艳的诗歌],我们不得不承认AI工具已…

计算机网络:如何隐藏真实的IP和MAC地址?

目录 一、什么是MAC地址二、什么是IP地址三、如何隐藏真实的MAC地址四、如何隐藏真实的IP地址 一、什么是MAC地址 MAC地址,全称为媒体访问控制地址(Media Access Control Address),是一种用于网络通信的唯一标识符。它是由IEEE 8…

Windows 计划任务 运行 Bat 的配置参考

打开Windows 计划任务- 创建任务 属性设置 - 常规 属性设置 - 触发器 属性设置 - 操作

今天不看文章,明天变垃圾(明天收费)-----字节数据分析发展过程中所遭遇的挑战

字节数据分析发展过程中所遭遇的挑战 三个核心议题: 海量数据分析性能:会议指出Spark分析性能不足成为了一个显著问题,尤其是在需要毫秒级响应的业务场景中。实时导入与查询能力:目前Kylin只能以T1的形式提供分析服务&#xff0…

MySQL内存使用率高且不释放问题排查与总结

背景 生产环境mysql 5.7内存占用超过90%以上,且一直下不来。截图如下: 原因分析 1、确定mysql具体的占用内存大小,通过命令:cat /proc/Mysql进程ID/status查看 命令执行后的结果比较多(其他参数的含义想了解可参考这…

Redis-实战篇-实现商铺缓存与数据库的双写一致(超时剔除和主动更新)

文章目录 1、给查询商铺的缓存添加超时剔除和主动更新的策略2、根据id查询店铺2.1、queryById2.2、RedisConstants.java 3、根据id修改店铺3.1、ShopController.java3.2、update 1、给查询商铺的缓存添加超时剔除和主动更新的策略 修改ShopController中的业务逻辑,满…

ONLYOFFICE 桌面编辑器 8.1华丽登场

简介:全新ONLYOFFICE 桌面编辑器 8.1解锁全新PDF编辑、幻灯片优化与本地化体验,立即下载! 前言:在数字化时代,高效的办公协作工具是企业和个人不可或缺的利器。ONLYOFFICE,作为一款功能强大的云端和桌面办公…

亚马逊风控策略揭秘:测评系统为何这么重要?

在亚马逊这个竞争激烈的电商平台上,许多卖家都渴望通过测评来提升产品销量和排名。然而,亚马逊对测评行为的监管之严格,可以说是业内首屈一指。即便你采用的是由真实客户购买并评价的“真人测评”模式,也难免存在一定的风险。 那么…

Psychtoolbox 脑电实验范式之mp4视频绘制

1. 读取 首先需要使用到Screen(‘OpenMovie’)函数,该函数可以读取mp4、gif格式的数据,具体方式如下: clear; clc; Screen(Preference, SkipSyncTests, 1); screens Screen(Screens); screenNum max(screens); [window, screenRect] Scr…

参加六西格玛绿带培训是投资未来,还是花冤枉钱?

是否值得花费资金参加六西格玛绿带培训,取决于多个因素。 从积极的方面来看,参加六西格玛绿带培训具有以下潜在价值: 1. 提升专业技能:使您掌握一套系统的问题解决方法和流程改进工具,有助于在工作中更高效地解决复杂…

甄美天使1+3退休模式创富模型,甄美天使商业模式特点

甄美天使13退休模式级差,每个人都有机会成为千万的受益人; 坐标:厦门,我是肖琳 深耕社交新零售行业10年,主要提供新零售系统工具及顶层商业模式设计、全案策划运营陪跑等。 甄美天使的创富模型采用了社交电商的传播理…

千年织锦:中国古代包文化的辉煌历程与现代传承

追溯至远古,我们的祖先就开始利用自然界的恩赐——皮革、植物纤维等,制作出最原始的包袋。随着时间的推移,技艺的提升,包的材质逐渐丰富起来,从粗糙到精致,从简单到复杂,每一次材质的革新都是人…

Linux学习第54天:Linux WIFI 驱动:蓝星互联

Linux版本号4.1.15 芯片I.MX6ULL 大叔学Linux 品人间百味 思文短情长 数字化、现代化的今天,随处的WIFI给与了大众极大的方便,也感受到了科技的力量。万物互联、无线互联越来越成为一个不可逆转的趋势。现在比较火…

面试相关-接口测试常问的问题

1.为什么要做接口测试 (1)现在大多系统都是前后端分离的项目,前端和后端的进度可能不一样,那为了尽早的进入测试,前端界面没有开发完成的情况下,只要后端的接口开发完了,就可以提前做接口测试了; (2)基于安全考虑,只依赖前端进行限制,已经完全不满足系统的安全性…

DLS MARKETS外汇:日元暴跌,日本是否会再次干预汇市?

摘要 近日,日元兑美元汇率暴跌至1986年以来的最低水平,引发市场对日本政府可能再次干预汇市的猜测。尽管地缘政治紧张局势为日元带来压力,但美国和日本之间的巨大利差也是关键因素。本文将详细分析当前日元贬值的原因、日本当局的可能反应以及…