基于Transformer进行乳腺癌组织病理学图像分类的方法比较

news2025/1/13 6:19:33

        为了提高视觉变压器的精度和泛化能力,近年来出现了基于Poolingbased Vision Transformer (PiT)、卷积视觉变压器(CvT)、CrossFormer、CrossViT、NesT、MaxViT和分离式视觉变压器(SepViT)等新模型。

        它们被用于BreakHis和IDC数据集上的图像分类,用于数字乳腺癌组织病理学。在BreakHis上训练之后,在IDC数据集上进行微调,以测试他们的泛化能力。MaxViT被发现是最好的基于Transformer的分类器,在BreakHis上达到91.57%的测试准确率,在IDC上达到91.8%,在BreakHis上预训练然后在IDC上微调时达到92.12%。然而,与现有作品相比,所选择的模型都没有表现出显着改善的性能。因此,突出了表现最好的模型的共同特征,并对进一步提高模型的精度和泛化能力提出了结构性建议。


1. 引言

        组织病理学是医学诊断的一个重要分支,涉及组织疾病的研究和发现。组织病理学家在显微镜下观察组织样本的许多特性,如细胞密度、大小、细胞核和组织颜色。由此,他们可以了解组织是否患病,如果患病,患病程度如何。在乳腺癌组织病理学中,需要检测的组织样本取自患者的乳房,用于诊断患者是否患有乳腺癌。诊断还可以揭示病人可能患的癌症的阶段和类型。

        当模型被训练来明确区分代表健康和癌变乳腺组织样本的图像时,这个过程被称为数字乳腺癌组织病理学。然而,为该任务选择最佳分类器的问题仍然存在。

        Vision Transformers(ViTs)的发明[4],它显示出在使用更少的计算资源的同时提供更高分类精度的潜力。因此,ViT模型可能被证明是解决数字乳腺癌组织病理学中智能图像分类问题的方法。

2. 文献综述

        CNN模型仍然是处理计算机视觉任务的首选。它们被广泛用于各种应用,如蒙面识别[13]、行人检测[14]、植物病害分类[15]、道路物体检测[16]等。AlexNet, ResNet和VGG-16架构似乎是最受欢迎的,并且很少显示出低于95%的准确性。这种普及延伸到医疗计算机视觉任务。通过CT、MRI和x线扫描,CNN模型已被用于几种疾病的计算机辅助诊断(CAD)。在LUNA16数据集中,使用SGD优化器的AlexNet在肺癌检测方面相对表现最好[17]。使用MRI图像识别脑肿瘤的CNN架构也是如此[18]。另一项针对脑肿瘤分类的研究发现,ResNet50是该任务的最佳模型[19]。CNN模型在四个相关数据集上进行了尝试和测试,发现即使对于阿尔茨海默病的诊断也是可靠的[20]。这些模型在针对特定任务进行微调时也显示出性能的提高[21]。

        虽然CNN模型表现出良好的性能和效率,但没有一种架构可以最有效地适用于所有医疗计算机视觉任务。此外,训练模型时使用的预处理技术、优化器和其他参数会显著影响性能。因此,寻找最佳模式的工作仍在继续。受Transformer结构在语言处理任务中的成功启发,视觉转换器(Vision transformer, ViT)[4]被创造出来。通过对该模型的实验表明,尽管ViT对任何类型的图像数据都具有良好的分类精度,但它缺乏归纳偏差。为此,一些作品提出了混合变压器和CNN架构,以便将两者的优点结合到一个模型中。其他基于ViT的模型则提出了改进的注意机制来提高其泛化能力。

        这些模型大多是在大型数据集(如ImageNet-21k)上进行训练和测试的,这些数据集不关注特定类型的图像数据。因此,这项工作冒险在更小的、专门的数据集上测试它们的性能。它们的泛化能力是通过微调阶段来测试的。

3. 实验方法

3.1 数据集

        选择BreakHis和IDC两个乳腺癌组织病理学数据集。来自这些数据集的图像在用于训练和测试所选模型之前进行数据增强,作为后续方法的一部分。应用数据增强的实验阶段如图3所示,所使用的确切技术将在第4节中介绍。

3.1.1 BreakHis数据集

        BreakHis数据集由7909张乳腺肿瘤组织图像组成,以四种不同的放大倍数:40倍、100倍、200倍和400倍[1]。其中良性样本2480个,恶性样本5429个。每张图像的大小为700 x 460像素,3通道(RGB),并提供PNG格式。BreakHis中的图像可以根据特定的肿瘤类型进一步分类。良性肿瘤可分为腺病、纤维腺瘤、叶状瘤、管状腺瘤等类型,恶性肿瘤可分为导管癌、小叶癌、粘液癌、乳头状癌等类型。然而,本研究仅将数据集用于二元分类(即良性或恶性分类)。

3.1.2 IDC数据集

        IDC数据集[2,3]采集了162张40x扫描的浸润性导管癌(乳腺恶性肿瘤的一种)整张幻灯片图像,从中提取5

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2068453.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【机器学习】4. 相似性比较(二值化数据)与相关度(correlation)

SMC Simple Matching Coefficient 评估两组二进制数组相似性的参数 SMC (f11 f00) / (f01f10f11f00) 其中,f11表示两组都为1的组合个数,f10表示第一组为1,第二组为0的组合个数。 这样做会有一个缺点,假设是比较稀疏的数据&…

readpaper在读论文时候的默认规定

红色代表主旨思想 蓝色代表专业名词解析

如何为你的SEO策略找到竞争对手的关键词

你有没有想过你的竞争对手是如何总是设法保持领先一步的?或者他们似乎如何扼杀了您所在行业的大部分搜索流量?他们成功的秘诀可能比你想象的要简单——关键词。 在本文中,我们将解释如何使用 SE Ranking、Google Keyword Planner 和 Bing Ke…

Qt坐标系统之三个坐标系和两个变换

前言 Qt坐标系统由QPainter类控制。它和QPaintDevice和QPaintEngine类一起构成Qt绘图系统的基础。QPainter用于执行绘图操作,QPaintDevice是QPainter用来绘制的一个二维空间的抽象,QPaintEngine提供在不同设备绘图的接口。 Qt 的坐标分为逻辑坐标和物理…

深度学习-局部最小值与鞍点【Datawhale X 李宏毅苹果书 AI夏令营】

在网络优化时,有时会出现随时参数不断更新,训练的损失可能不会再下降,但训练结果并不满意。为什么会出现这样的情况呢? 假设排除数据集优劣的问题,可能需要进一步考虑的是为什么网络不再有新的最优值了,在…

【记录】MICCAI BraTs 2020数据集

简介 本文 MICCAI 竞赛中公布的用于脑肿瘤分割 BraTS 2020数据集,根据官方统计,该数据集中共含有660例数据,训练集369、验证集125,测试集166。不过仅有训练集中给出了详细的分割标签,验证集虽然公布了 但是仅为了验证,没有给出具体的Ground Truth。所以如果进行实验主要还…

昇腾 - AscendCL C++应用开发 图像文件的解码时硬件对图像的宽度和高度的处理方式

昇腾 - AscendCL C应用开发 图像文件的解码时硬件对图像的宽度和高度的处理方式 flyfish 假如是这样的 输入图片格式(YUV分量比例) jpeg(420) 输出图片格式 YUV420SP NV12 8bit 输出图片宽、高对齐要求 宽2对齐 高2对齐 输出图片宽Stride、高St…

CMake构建学习笔记2-zlib库的构建

文章目录 1. 概述2. 详论2.1 设置构建目录2.2 配置构建2.3 构建项目2.4 安装项目2.5 清理构建目录 3. 总结 1. 概述 Zlib是一个数据压缩库,它提供了在内存中对数据进行压缩和解压缩的功能。这个库非常泛用,除了直接使用这个库之外,很多依赖库…

学历不高能进大厂么?

吉祥知识星球http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247485367&idx1&sn837891059c360ad60db7e9ac980a3321&chksmc0e47eebf793f7fdb8fcd7eed8ce29160cf79ba303b59858ba3a6660c6dac536774afb2a6330#rd 《网安面试指南》http://mp.weixin.qq.com/s?…

《终身学习——10个你必须掌握的未来生存法则》读书笔记

无论你遵守与否,大自然的法则是无法改变的,你若无视“重力法则”,从屋顶跳下,那给你善后的就不是“重力警察”了。同理,如果你不遵循成长法则,也不会有“成长警察”找你麻烦,你只会发现自己的成…

结合 curl 与住宅代理实现高效数据抓取

引言 什么是 curl?有哪些功能? 基本 curl 命令有哪些? 为什么要使用 curl 处理 HTTP 请求? 如何使用 curl 和住宅代理进行网络抓取? 总结 引言 在当今数据驱动的商业环境中,数据的获取和分析能力是企…

HttpMessageNotReadableException

项目本身用的全是JSON,但是对接MES的时候他们用的XML,就添加了对XML的支持,然后发现AGV发送任务的接口报下面的错误了。 Error while extracting response for type [class java.lang.String] and content type [application/json;charsetut…

77 智能卡ATR TA1通信速率计算

1 前言 智能卡读卡器在读卡前期会以默认标准通信速率9600与卡片交互,期间可通过卡片返回的ATR值中TA1字段获取卡片支持的最大通信速率,然后读卡器通过PPS指令与卡片协商更改通信速率,最后以协商的速率进行通信。 起初默认9600波特率是比较慢的…

图片高清修复怎么做?4种高清修复方法分享给你

照片已经成为我们记录生活、珍藏回忆的重要方式。然而,随着时间的推移,不少珍贵的照片可能因保存不当或拍摄技术限制而变得模糊不堪。想要将这些模糊的照片变清晰成为当下的急迫需求。不过不用担心,下面就来给大家分享4种高清修复图片方法&am…

TCP系列相关内容

一、TCP上传文件 loop——本地回环测试地址。 void *memset(void *s,int c,size_t n)——给一个变量设定一个值。 1、“粘包”问题 两次分别发送的数据,被一起接收形成该现象。 原因:TCP流式套接字,数据与数据间没…

超低排放验收流程的全方位指南

近年来,随着环保要求的不断升级,朗观视觉超低排放验收成为了众多工业企业必须面对的关键环节。本文将详细介绍超低排放验收流程的安装要求、最新政策、国家标准以及企业应对的解决方案,帮助企业更好地理解和应对这一重要课题。 一、超低排放验…

校园一卡通_q7e7o

TOC springboot576校园一卡通_q7e7o--论文 第一章 概述 1.1 研究背景 近些年,随着中国经济发展,人民的生活质量逐渐提高,对网络的依赖性越来越高,通过网络处理的事务越来越多。随着校园一卡通的常态化,如果依然采用…

JS中Promise用法(简要说明)

文章目录 1、下方自定义名词约定2、官方流程图3、构造函数Promise <状态>fulfilled 用法代码图示 4、构造函数Promise <状态>rejected 用法代码图示 5、第3和4结合使用&#xff0c;可以将promise状态settled为2种情况之一代码图示&#xff08;图中if和else都是调…

移动硬盘直接拔下来有什么影响吗?数据丢失如何恢复

在日常的工作与生活中&#xff0c;移动硬盘成为了我们不可或缺的数据存储和传输设备。然而&#xff0c;很多人或许都曾有过这样的经历&#xff1a;在数据传输或使用中&#xff0c;由于一时疏忽或赶时间&#xff0c;直接拔下了正在工作的移动硬盘。这样的行为&#xff0c;虽然看…

冷却液温度传感器检测诊断

检测发动机冷却液温度&#xff0c;向ECU输入温度信号&#xff0c;作为燃油喷射和点火正时的修正信号&#xff0c;同时也是其他控制系统的控制信号。 冷却液温度传感器安装位置 冷却液温度传感器&#xff08;俗称水温传感器&#xff09;一般安装在缸体水道上&#xff0c;缸盖水…