DGMIL:分布引导的WSI分类多实例学习

news2024/11/25 14:42:55

文章目录

  • DGMIL: Distribution Guided Multiple Instance Learning for Whole Slide Image Classification
    • 摘要
    • 本文方法
      • Cluster-Conditioned Feature Distribution Modeling
      • Pseudo Label-Based Feature Space Refinement
    • 实验结果

DGMIL: Distribution Guided Multiple Instance Learning for Whole Slide Image Classification

摘要

背景
多实例学习(MIL)被广泛用于组织病理学全玻片图像(WSI)的分析。然而,现有的MIL方法并没有明确地对数据分布进行建模,相反,它们只通过训练分类器来有区别地学习袋级或实例级的决策边界。

本文方法
一个用于WSI分类和正patch定位的特征分布引导的深度MIL框架
揭示了组织病理学图像数据的固有特征分布可以作为非常有效的指导,例如分类
提出了一种基于聚类条件的特征分布建模方法和一种基于伪标签的迭代特征空间细化策略,以便在最终的特征空间中可以容易地分离正实例和负实例
代码链接

本文方法

bag:是指同一张图像的patch集合(不重叠),标签为分类标签和是否为W(从W中提取的patch),每一个patch为实例
阴性bag中所有实例的标签都是阴性的,而阳性bag中至少有一个阳性实例,但哪些是阴性的是未知的

肿瘤组织和正常组织之间的细胞形态存在显著差异,因此,如果能够找到合适的潜伏空间,它们在特征空间中的分布也应该显著不同。在此基础上,我们的目标是对特征空间进行适当的建模,使负实例和正实例在特征空间中容易分离。由于我们的方法是基于实例的特征,因此我们在本文后面提到的实例都是指它们的特征向量。

在这里插入图片描述
图1说明了我们提出的DGMIL的总体框架。具体来说,我们使用mask的自动编码器来执行自监督学习(MAE),以训练编码器将所有实例映射到初始潜在特征空间,该空间将被迭代细化。

在推理过程中,我们将WSI中的测试实例映射到细化的潜在特征空间,并计算其实例级分类的正分数。对于Bag级分类,我们只使用简单的平均池化方法来聚合bag中所有实例的正分数。由于训练和推理都是基于每个独立的实例(即不使用幻灯片中的位置信息),因此我们的方法具有排列不变性。

Cluster-Conditioned Feature Distribution Modeling

我们提出了一种基于K-均值聚类和马氏距离的特征分布建模方法。具体来说,我们首先使用K-means算法将训练集中负WSI的所有实例聚类为M个聚类,其中每个聚类表示为Cm。接下来,我们使用训练集中负滑动和正滑动的所有实例的Mahalanobis距离计算正得分si,j

在这里插入图片描述

Pseudo Label-Based Feature Space Refinement

基于MAE的初始特征空间的直接使用并不能很好地对正实例和负实例的分布建模,因为MAE的训练是完全自我监督的,并且没有利用袋级监督。

因此,我们进一步提出了一种基于伪标签的特征空间细化策略来对其进行细化。

这种特征空间细化策略是一个迭代过程。在每次迭代中,我们首先使用K-means算法对训练集中负面WSI中的所有实例进行聚类,并计算正面和负面WSI中所有实例的正分数。正WSI中具有最高正得分的实例的比例和负WSI中具有最低正得分的例子的比例被称为极端实例,并且它们分别被分配伪标签1和0。利用这些极端实例及其伪标签,我们以监督的方式训练了一个简单的二元分类器,该分类器由一个FC层线性投影头和一个FC级分类头组成。最后,我们利用线性投影头将当前实例特征重新映射到新的特征空间中,以实现特征空间的细化。上述特征空间细化过程进行迭代,直到收敛。

实验结果

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/472002.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

花了几百万,上的软件全成了垃圾,数字化转型不是这么搞的!

企业信息化建设很复杂,不同的行业、业务部门对应的选型、评估方式都是不一样的,如果真有这样一套选型标准的出现,那多半掺水,不可信。 现在市面上比较多且还算通用的,都是从行业角度出发的评判标准,下面给…

记录 docker linux部署jar

第一步 web sso user admin 中yml文件还原到阿里mysql数据库 第二步 各个jar进行打包处理 第三步 正式服务器的Jar备份 第四步 拉取以上jar包 到正式服务器中 第五步 查看 docker images 其中 web_service 1.0.2是上一个版本 上一个版本build 镜像命令是这样的(需…

代码评审平台Gerrit安装配置方法介绍

Gerrit是一款开源免费的基于 web 的代码审查工具,是基于 Git 的版本控制系统。在代码入库之前对开发人员的提交进行审阅,检视通过的代码才能提交入库。本文记录如何安装部署gerrit平台。 目录 Gerrit简介环境准备1. 安装Java2. 安装Git3. 安装nginx4. 安…

宝塔面板+悟空CRM功能模块安装搭建部署教程 环境配置

悟空CRM目录结构 wk_modules ├── module – 无代码模块 ├── common – 基础模块 平台使用的主要技术栈 名称 版本 说明 spring-cloud-alibaba 2021.0.4 核心框架 spring-boot 2.6.11 spring版本 mybatis-plus 3.5.2 ORM框架 nacos 2.1.0 注册中心以及配置管理 seata 1.2.…

论文笔记:A Simple Framework for Contrastive Learning of Visual Representations

0 简介 论文:A Simple Framework for Contrastive Learning of Visual Representations 代码:https://github.com/google-research/simclr 发表:2020年发表在ICML会议上 1 核心思想 如何构建对比学习的比较对象?本文按如下方式…

国民技术N32G430开发笔记(8)- 内部Flash的读写操作

N32G430 内部Flash的读写操作 1、主存储区最大为 64KB,也称作主闪存存储器,包含 32 个 Page,用于用户程序的存放和运行,以及数 据存储。 每一页的大小为2K字节 2、IAP 升级我们将64K的flash分区如下: Boot 0x800000…

scanf老是出错?带你详细解决输入缓冲区问题

文章目录 1.前言2.getchar 和 putchar3.缓冲区问题3.1先观察一个代码3.2输入缓冲区3.3清除缓冲区 结尾 1.前言 我们一般在进行输入输出的时候,就会用到 scanf / printf 。并且根据格式指定可以输入输出各种类型的数据。可以输入整形,字符,浮…

【元分析研究方法】学习笔记4.评估研究的质量

评估研究的质量 该步骤的作用该步骤中需要注意的问题该步骤中知识点1:判断编码的分类方式该步骤中知识点2:统计识别异常值 参考来源:库珀 (Cooper, H. M. )., 李超平, & 张昱城. (2020). 元分析研究方法: A step-by step approach. 中国人…

SpringBoot的事务与锁

在一人一单问题里,为什么加了事务还是会出现一人下多单呢? 本质的原因是,我们使用Java的对象锁,可以保证临界区只有一个线程访问,但是这和SpringBoot里加Transactional注解不是等价的。数据库里的事务保证的是要么全部…

ChatGPT+Word的智能化文字生成和应用

在Word中引入OpenAI代码需要使用VBA编辑器。以下是在Word中引入OpenAI代码的步骤: 打开Word文档,按下Alt F11键打开VBA编辑器。 在VBA编辑器中,选择“插入”菜单,然后选择“模块”。 在新建的模块中,将OpenAI代码粘…

【教学类-35-01】(256*256*256)RGB色卡图片

作品展示: 背景需求: 甲流传染病,班级来了三位孩子,他们玩折纸的时候讨论, 09号问:“绿色和蓝色混合是什么颜色?” 08号问:“绿色加蓝色加浅蓝合在一起是什么颜色” 17号说&…

逆向学习X64DBG

目标游戏:焰影神兵 目的:更改玩家名称(中文名称) 使用X64dbg可以快速搜索游戏人名,所以本次逆向使用该工具进行工作。 原来的名字:平家物语 现在我们想改成:源氏物语。所以打开X32/64dbg 附…

免费域名申请

title: 免费域名申请 20230428153405|left 🌈Description: ​ 本文将介绍如何免费申请域名,在最近的折腾中发现,域名真的很重要,不然好多服务是无法访问的。 备注:由于freenom基于技术原因,暂时…

感知机学习

定义 感知机:假设输入控件(特征空间)是 X ⊆ R n \mathcal{X} \subseteq \mathbb{R}^n X⊆Rn,输出空间是 Y { 1 , − 1 } \mathcal{Y}\left\{1, -1\right\} Y{1,−1},输入 x ∈ X \mathbf{x}\in\mathcal{X} x∈X表示实例的特征向量&#x…

使用Pano2VR实现背景音乐、放大/缩小、旋转、缩略图和直线/立体/鱼眼模式等

内容简介 本文在文章《使用Pano2VR实现客厅VR效果》基础上,增加背景音乐、放大/缩小、旋转、缩略图和直线/立体/鱼眼模式等;效果如下图(为了可以上传缩小屏幕,属于PC端运行): 实现过程 1. 运行Pano2VR软件后…

【初学人工智能原理】【1】一元一次函数:感知器如何描述直觉

前言 本文教程均来自b站【小白也能听懂的人工智能原理】,感兴趣的可自行到b站观看。 本文【原文】章节来自课程的对白,由于缺少图片可能无法理解,故放到了最后,建议直接看代码(代码放到了前面)。 代码实…

企业管理中,如何组建数据团队

数字化已经成为了当前时代的标志,也变为人们对未来社会发展的共识,一时间数字化相关技术、理念、应用都开始向各行各业普及。此时人工智能、云计算、大数据、互联网、物联网等的发展也越来越快,给人们的生活和企业的经营管理模式带来了深刻改…

设计模式 -- 原型模式

前言 月是一轮明镜,晶莹剔透,代表着一张白纸(啥也不懂) 央是一片海洋,海乃百川,代表着一块海绵(吸纳万物) 泽是一柄利剑,千锤百炼,代表着千百锤炼(输入输出) 月央泽,学习的一种过程,从白纸->吸收各种知识->不断输入输出变成自己的内容 希望大家一起坚持这个过程,也同…

【问题解决】RabbitMQ启动出现epmd error for host xx.xx: nxdomain (non-existing domain)

问题描述 【k8s】或【普通容器】或【Linux】部署的RabbitMQ启动时出现了 epmd error for host xx.xx: nxdomain (non-existing domain) 错误,MQ无法启动成功。 其中 xx.xx 为无法解析的域名。 RabbitMQ官方还提到报错 Error during startup: {error,no_epmd_port}…

回归区间预测 | Matlab基于分位数随机森林算法(QRF)的回归预测

文章目录 效果一览文章概述部分源码参考资料效果一览 文章概述 Matlab基于分位数随机森林算法(QRF)的回归预测,matlab代码。 基于分位数随机森林算法(QRF)回归预测,matiab代码,单变量输入模型。 评价指标包括:R2、MAE、MSE、RMSE和区间覆盖率和区间平均宽度百分比等,代码质…