文章发表丨求臻医学发布病理AI模型,实现肿瘤精准分型

news2024/11/13 8:44:10

近日,求臻医学科研团队研发一款基于数字病理图像的肿瘤分型深度学习模型—TMG(The Transformer-based Multiple instance learning with Global average pooling)。该模型可有效消除对病理图像细粒度标记的依赖,实现高准确率的分型,将用于原发灶不明肿瘤(CUP)的预测,助力肿瘤精准分型。目前,该研究成果已在线发表于国际生物信息学重要会议International Symposium on Bioinformatics Research and Applications(ISBRA 2023,波兰)。

c5ea8504eeb0c41cc5b05fa55204ed4c.jpeg


研究背景

病理诊断作为肿瘤诊断的“金标准”,是治疗方案选择和预后评估的首要环节,病理诊断结果的准确性对于患者的精准诊疗尤为重要。然而,仅依靠病理医生的传统病理诊断模式面临着诸多挑战,如高水平病理医生短缺、诊断结果易受到主观影响以及诊断报告获取耗时较长等问题。为应对这些挑战,智能化病理图像分析方法的开发迫在眉睫。


随着数字扫描技术的进步,病理图像数字扫描仪能够获取高分辨率的全视野病理组织切片(WSI),并完整地保留原始的组织结构。同时,基于深度学习的图像分类方法在自然图像和医学图像领域展现出了巨大的潜力和有效性。这些先进技术方法的应用使得病理图像的分析和诊断进入了一个全新的数字化和智能化的发展阶段。


然而,数字病理图像存在分辨率高、图像特征差异微小等特点,传统的深度学习方法并不适用于WSI的自动分类。现有常用方法是使用细粒度标记的高分辨率的图像块来训练模型,并在图像块级别上进行预测,最终通过聚合算法得到患者级别的预测结果。但是,获取细粒度标记的数据是一项昂贵且具有挑战性的任务,将限制模型的性能和应用范围。


为解决以上问题,本研究提出了一种名为TMG的模型,该模型将基于Transformer的多示例学习与全局平均池化结合到组织病理图像中,可以在不使用细粒度数据标记的情况下实现WSI的精准分类,模型性能优异。同时,该模型不仅具有较低的计算复杂度,还能够处理更大尺寸的图片,应用前景广阔。


创新点

1. 传统的自注意力机制计算复杂度高,限制了其在处理大规模数据时的应用。为更加高效地捕捉到关键信息,本研究将线性注意力集成到TMG中,能够在保持分类性能不降低的同时,有效降低模型的复杂度至O(n),在处理更大规模的数据时保持较低的计算资源需求,提高了模型的可扩展性和实用性。


2. 为综合感知不同分辨率WSI中的空间信息和形态特征,本研究提出了基于卷积的多维条件位置编码(CMCPE),可以为不同分辨率大小的WSI生成位置信息,模型能够获得更准确的位置编码,从而提高对于位置相关特征的捕捉能力。


3. 为使特征图与最终分类结果之间的转换更加自然,本研究在Vision Transformer(ViT)中使用全局平均池化(GAP)层对WSI进行分类,从而提高模型的鲁棒性。


794d2cf6b761b74aab3e64c01c61c8e8.jpeg

图1. TMG工作流程


研究方法

数据:通过TCIA CPTAC病理门户获取了包含肿瘤组织的WSI的病理切片和相应的标签,这些WSI对应八个类别,包括肺、肾、脑等多个部位。本研究总共从CPTAC中获得了有代表性的6037个WSI。


WSI处理:鉴于WSI分辨率巨大,需要先对WSI中的组织进行分割,以提取出有价值的信息。首先,将图像从RGB转换为HSV颜色空间,然后对图像的降采样饱和度通道应用二值阈值处理,以计算组织区域的二进制掩码。接下来,根据二进制掩码分割组织区域,将分割出的区域裁剪成256×256大小的图块。


模型架构:TMG由实例特征提取器、特征聚合器和全局平均池化(GAP)组成。输入组织学图像被划分为小块,并输入实例特征提取器,以获得长度为1024的紧凑低维特征向量。所获得的特征被输入到特征聚合器中,以捕捉WSI中的局部空间信息和形态特征。特征聚合器的输出进一步输入到GAP中,以建立特征聚合器提取的关键信息与最终预测的类别信息之间的关联。


研究结果

评价:为验证TMG在WSI分类中的性能,使用CPTAC数据集进行评估,将TMG与包括MIL、CLAM、TOAD和TransMIL在内的最先进方法进行了比较,为确保比较的公平性,这些方法都使用了在ImageNet32上预训练的ResNet50进行特征提取。结果显示,TMG在k = 1、3、5的top-k准确性分别为94.8%、98.0%和100%。在独立测试集上,TMG表现出色,获得了最佳性能,其top-1准确性超过第二名的TransMIL约2.6%,并且在测试集上具有最低的错误率,仅为5.21%(图2)。

ebb2a95660b698e0f537457d4129e06a.jpeg

图2. TMG的模型性能


消融实验:为了验证模型的参数作用,本研究进行了全面的消融实验结果表明,选择最后的M个标记特征作为关键特征,同时捕获卷积核大小为1、3和5的邻域的位置信息,将GAP层添加到类别特征图,对top-1准确性和AUC值有积极影响。

1e6d57898dd9f8abd478ceaa8cd79515.jpeg


模型收敛性及降维:图3展示了TMG以及最新的MIL方法(包括TransMIL、TOAD、MIL、CLAM-mb和CLAM-sb)在不同的训练周期内的训练/验证准确性和训练/验证损失。与这些方法不同,TMG利用了实例之间的形态和空间信息,TMG在性能上表现都优于其他MIL方法。为了评估GAP层位置对模型有效性的影响,本研究通过改变模型中GAP层位置,使用不同模型分别从八种肿瘤类型中提取了特征,并利用一种非线性降维方法t-SNE来将这些特征在二维中可视化。图4显示了在类别特征映射中加入GAP层(右图)会提高WSI分类性能。

ee1bfe1aa68d48bfa4e607b86690ca04.jpeg

图3:TMG以及最新的MIL方法的训练/验证准确性和训练/验证损失

ad070a0fd40087190c0d6b5dc03aca94.jpeg

图4:WSI 特征表示的 t-SNE 可视化


讨论

本研究提出了一种创新性病理AI模型TMG,该模型由实例特征提取器、基于Transformer和MIL的特征聚合器,以及全局平均池化(GAP)层三个主要组件构成。在测试数据集中TMG展现出了卓越的性能,能够准确地预测八种不同的肿瘤类别,其AUC值高于0.996。这为实现高准确度的肿瘤分类提供了有力支持,推动了人工智能在肿瘤病理学诊断领域的广泛应用。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1123180.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

武汉凯迪正大—线圈匝间耐压测试仪

产品概述 KDYD2830绕组匝间冲击耐压试验仪适用于试验电压30kV及以下高压电机、中小型电机、直流电机的绕组匝间绝缘检测;也可用于变压器绕组、电器线圈绕组的匝间绝缘检测。因电机、变压器绕组由于绝缘结构和绝缘材料的不一致,特别是操作者工艺水平的不…

全志R128适配 ST7789v LCD

适配 ST7789v LCD R128 平台提供了 SPI DBI 的 SPI TFT 接口,具有如下特点: Supports DBI Type C 3 Line/4 Line Interface ModeSupports 2 Data Lane Interface ModeSupports data source from CPU or DMASupports RGB111/444/565/666/888 video form…

华为bug汇报:华为NPU竟成“遥遥领先”?

华为bug汇报:华为NPU竟成“遥遥领先”? 本文为我汇报在Ascend / pytorch 社区的一个bug,其中对NPU的实际算力进行了测试,并发现了华为NPU实际显存与销售宣传时存在着较大差差距的问题(算力问题见问题一、显存问题见问…

数据分析和机器学习的11个高级可视化图表介绍

可视化是一种强大的工具,用于以直观和可理解的方式传达复杂的数据模式和关系。它们在数据分析中发挥着至关重要的作用,提供了通常难以从原始数据或传统数字表示中辨别出来的见解。 可视化对于理解复杂的数据模式和关系至关重要,我们将介绍11…

【软考】12.3 质量管理/风险管理

《质量管理》 影响质量:范围、进度、成本质量规划 ——> 质量保证(阶段性评审) ——> 质量控制(实时监控) 质量特性 功能性、可靠性、可用性、效率、可维护性、可移植性 McCall质量模型 产品修正、产品转移、…

CPU和GPU有什么区别?

CPU:叫做中央处理器(central processing unit)作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。 GPU:叫做图形处理器。图形处理器(英语:Graphics Processing Unit&#x…

快来get策略模式,告别编程困惑,轻松变身编程高手✨

🎬 江城开朗的豌豆:个人主页 🔥 个人专栏 :《 VUE 》 《 javaScript 》 📝 个人网站 :《 江城开朗的豌豆🫛 》 ⛺️ 生活的理想,就是为了理想的生活 ! ​ 目录 ⭐ 专栏简介 📘 文章引言 一…

【网络】网络编程套接字(二)

网络编程套接字 二 简单的TCP网络程序1、服务端创建套接字并绑定2、服务端监听2、服务端获取连接3、服务端处理请求4、客户端进行连接5、客户端发起通信6、通信测试 简单的TCP网络程序 TCP服务器创建套接字的做法与UDP服务器是基本一样的,但是TCP服务器会更加繁琐一…

独立产品灵感周刊 DecoHack #053 - 有意思的地图网站

本周刊记录有趣好玩的独立产品设计开发相关内容,每周发布,往期内容同样精彩,感兴趣的伙伴可以 点击订阅我的周刊。为保证每期都能收到,建议邮件订阅。欢迎通过 Twitter 私信推荐或投稿。 周刊继续发布 ❤️ 💻 产品推…

电脑屏幕模糊?这5个方法教你恢复清晰屏幕!

“我的电脑最近看着看着莫名就觉得好模糊,这到底是为什么呢?有什么方法可以解决电脑屏幕模糊的问题吗?” 使用电脑时,电脑屏幕是否清晰会很影响我们的使用体验感。如果电脑屏幕模糊,可能会给我们带来一种视觉上的不好体…

C#中的日期时间比较和格式化的方法

摘要:在C#中,日期和时间的比较以及格式化是常见的操作。了解如何正确比较和格式化日期和时间可以帮助我们更好地处理这些数据。本文将介绍C#中常用的日期时间比较方法(CompareTo、Equals和比较运算符)以及日期时间格式化方法&…

vue重修之路由【下】

文章目录 版权声明路由重定向、404,路由模式重定向404路由模式 声明式导航vue-routerrouter-link-active 和 router-link-exact-active定制router-link-active 和 router-link-exact-active跳转传参两种跳转传参总结 编程式导航两种语法路由传参path路径跳转传参nam…

Kafka3.x安装以及使用

一、Kafka下载 下载地址:https://kafka.apache.org/downloads 二、Kafka安装 因为选择下载的是 .zip 文件,直接跳过安装,一步到位。 选择在任一磁盘创建空文件夹(不要使用中文路径),解压之后把文件夹内容剪…

10个最流行的开源机器视觉标注工具

推荐:用 NSDT编辑器 快速搭建可编程3D场景 我们知道寻找良好的图像标记和注释工具对于创建准确且有用的数据集的重要性。 随着图像注释空间的增长,我们看到开源工具的可用性激增,这些工具使任何人都可以免费标记他们的图像并从强大的功能中受…

这5种炫酷的动态图,都是用Python实现的!

数据可以帮助我们描述这个世界、阐释自己的想法和展示自己的成果,但如果只有单调乏味的文本和数字,我们却往往能难抓住观众的眼球。而很多时候,一张漂亮的可视化图表就足以胜过千言万语。本文将介绍 5 种基于 Plotly 的可视化方法&#xff0c…

IP地址SSL证书 IP证书

在许多企业用例中,公司需要SSL证书作为IP地址。公司使用IP地址通过Internet访问各种类型的应用程序。 公网IP地址的SSL证书: 内部IP(也称为私有IP)是IANA设置为保存的IPv4或IPv6地址,例如: RFC 1918范围内…

编译原理如何写出不带回溯的递归子程序?

递归子程序 使用不带回溯的递归子程序解析文法是预测性语法分析的基础,这通常需要该文法是LL(1)文法。每个非终结符对应一个递归子程序,并使用当前的输入符号和FIRST集合来决定调用哪个产生式。 让我们以一个简单的文法为例: 对于此文法&am…

大模型开发06:LangChain 概述

大模型开发06:LangChain 概述 LangChain 是一个基于语言模型开发应用程序的框架。它可以实现以下功能: 上下文感知: 将语言模型与上下文源相连接(提示词、示例、用于支撑响应的内容等)推理能力: 依赖语言模型进行推理(如何根据提供的上下文来回答问题或采取哪些行动等)La…

抖音手把手带,开放到月底!

这个月一直在做的两件事,一个是带内部社员,去把抖音项目跑通。一个是招募合伙人。简单说下这两个事,之前一直没在公众号说。 带学员这件事,默认收徒只到月底。感兴趣的直接报名,价格4980。这块无需多言,做一…

如何解散微信群?这两个方法收藏好!

微信群,简单来说就是多人社交,能够让用户与多个人进行交流与互动。群主可以邀请有共同爱好的朋友在一个群里聊天、分享信息等等,以此来增强社交互动。 如果是一些临时活动群或者群成员已经不活跃的情况下,那么群主可能会选择将群…