Panoptic Domain Adaptive Mask R-CNN (PDAM) 论文总结

news2024/12/23 5:55:03

论文(CVPR会议): Unsupervised Instance Segmentation in Microscopy Images via Panoptic Domain Adaptation and Task Re-weighting

(TMI期刊):PDAM: A Panoptic-Level Feature Alignment Framework for Unsupervised Domain Adaptive Instance Segmentation in Microscopy Images

PDAM: A Panoptic-Level Feature Alignment Framework(全景级特征对齐框架) for Unsupervised(无监督)Domain Adaptive(领域自适应)Instance Segmentation(实例分割)in Microscopy Images(显微图像

全景级特征:用于描述整个场景的高级特征或全局特征。

任务重加权:在多任务学习中,不同任务可能具有不同的重要性或难度,因此在训练过程中,希望能够给予不同任务不同的权重,以便更好地平衡它们对模型的贡献。

领域自适应:是一种机器学习技术,旨在解决在训练数据与测试数据的分布不匹配时所导致的问题。在领域自适应中,通常有两个或多个不同的数据集,称为域(Domain),每个域都有自己的数据分布。在许多情况下,希望将模型从一个域(通常称为源域)迁移到另一个域(通常称为目标域),并在目标域上表现良好。

一、摘要

研究背景:用于细胞核实例分割的无监督域自适应(UDA)对于数字病理学非常重要,因为它减轻了数据集之间的劳动密集型注释和域转移的负担。

主要工作:在这项工作中,提出了一个Cycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)架构,通过从荧光显微镜图像中学习,用于组织病理学图像中的无监督细胞核分割。

  • 1. 更具体地说,首先提出了一个核修复机制以消除合成图像中的辅助生成的对象
  • 2. 其次,设计了一个语义分支和一个领域自适应器实现了全景级的领域自适应
  • 3. 第三,为了避免源偏向特征的影响,我们提出了一种任务重加权机制动态地为特定于任务的损失函数添加权衡权重

研究成果:在三个数据集上的实验结果表明,提出的方法明显优于最先进的UDA方法,并表现出与完全监督方法相似的性能。

二、引言

结构:细胞核实例分割研究背景介绍(对病理学的研究价值,手工标注成本高昂等)—> 无监督域自适应(UDA)方法介绍(UDA方法的优点 和 图像迁移学习方法的缺点) —>  引出UDA细胞核实例分割任务面临哪些挑战 —> 引出主要工作(为了解决这些问题提出新的方法) —> 实验细节(数据集和源域的选择) —>贡献

三、方法

3.1 CyCADA with Mask R-CNN(基线)

由于之前的UDA方法都不是专门为实例分割设计的,因此将CyCADA 扩展到基于Mask R-CNN 的实例分割版本,作为基线。(CyCADA是一种领域自适应生成对抗网络)

整体架构:首先设计了一个域自适应Mask R-CNN。这项工作中的Mask R-CNN的主干是由 ResNet101 和 特征金字塔网络(FPN)构建的。受先前用于对象检测的UDA方法的启发,在 FPN 之后添加一个分支用于 图像级自适应,在 实例分支 之后添加另一个分支用于 实例级自适应,如图所示。

对于图像级自适应,FPN输出的多分辨率特征图首先通过平均池化下采样到8 × 8的大小,然后求和以进行图像级自适应。图像级卷积层由4个卷积层和一个用于对抗学习的梯度反转层(GRL)组成。

实例级自适应中,Mask 分支中的14 × 14 × 256特征图通过平均池化被缩小到2 × 2 × 256的大小,然后调整大小为1024 × 1,以与来自边界框分支的1024 × 1特征求和。实例级的实例层由3个全连接层和一个GRL组成,GRL的输入是上述特征的总和。

Mask分支:边界框分支

( semantic branch在 Panoptic Level Domain Adaptation 章节介绍

3.2 Nuclei Inpainting Mechanism (核修复机制

问题:合成图像中存在冗余和不期望的核。

方法:为了避免这个问题,设计了一个辅助的对象修复机制,以消除这些不需要的核在合成的组织病理学图像。

过程:将原始合成的组织病理学图像表示为Sraw并且将其对应的掩模表示为M,首先获得所有辅助生成的核的掩模预测Maux,公式化为:

其中ostu(Sraw)表示基于 Otsu 阈值的二进制分割方法。给定一幅图像,Otsu阈值算法自动生成一个阈值,用于背景和前景分割。

然后,在去除这些核之后得到新合成的图像 Sinp ,其可以表示为:

其中 inp 是一种基于快速行进的方法,用于修复对象,通过将Maux中标记的辅助核的像素值替换为未标记背景的像素值。

(a)原始荧光显微镜图像块;(B)对应的细胞核注释;(c)来自CycleGAN的初始合成图像;(d)细胞核修补机制之后的最终合成图像。

3.3 Panoptic Level Domain Adaptation(全景水平域自适应)

问题:由于Mask R-CNN只关注每个对象的局部特征,缺乏整个图像的语义视图,因此在语义级特征中存在域偏差。

方法:提出了一种语义级自适应,以引导模型基于前景和背景之间的关系来学习域不变特征。通过结合语义级和实例级自适应,全景域自适应方法减少了全局和局部视图中的跨域差异。

思想:首先在FPN之后设计一个语义分支用于语义分割预测。Semantic entropy map(语义熵图)通过对抗域搜索来学习语义级别的域不变特征。对齐跨域熵分布有助于最小化目标域中的熵预测,这使得模型适用于目标图像。模块结构如下表所示:

3.4 Task Re-Weighting Mechanism(任务重加权机制)

问题:在PDAM中,检测和分割学习是基于合成图像的。在一些训练迭代过程中,对抗域鉴别器的不稳定学习过程可能导致预测的特征远离决策边界并包含特定于域的因素

方法:为了解决这个问题,提出了一个任务重新加权机制,通过增加检测和分割损失函数的权衡权重。为了评估所提取的特征是否是域不变的,采用域预测来计算权衡权重。将最终任务预测之前的特征图属于源域和目标域的概率分别表示为ps和pt,并且将任务特定损失函数表示为L,重新加权的任务特定损失Lrw为:

其中,β是一个阈值。根据等式2.如果任务预测之前的特征图是源偏置的(ps → 1),则该任务损失函数被向下加权,以防止模型偏向源域

3.5 目标函数

Lrpn是RPN的损失函数,包括回归的平滑L1回归损失和分类的交叉熵损失。Ldet是Mask R-CNN的实例分割和检测损失,其中包含实例分类,坐标回归和掩码分割的损失函数。L(sem-seg)是语义分割的交叉熵损失。L(img-da)、L(sem-da)和L(ins-da)是图像、语义和实例级别的域分类的交叉熵损失。

四、实验

4.1 数据集描述和实验准备 

数据集(数据集容量 + 获取方式 + 受试人员):采用荧光显微镜数据集BBBC039V1 作为源域,组织病理学数据集Kumar 和TNBC 作为目标域。BBBC039V1包含高通量化学筛选下U2OS细胞的200个520 × 696图像这些图像是灰度的,因为它们是用单个视场的DNA通道染色获得的。Kumar来自癌症基因组图谱(TCGA),包含来自不同患者的30张40倍放大的全载玻片图像的30个注释的1000 × 1000个斑块。这些图像来自18家不同的医院和7个不同的器官(乳腺、肝脏、肾脏、前列腺、膀胱、结肠和胃)。与Kumar的疾病多样性相反,TNBC数据集特别关注三阴性乳腺癌。在TNBC数据集中,有来自居里研究所的11名不同患者的50个注释的512 × 512斑块,放大倍数为40倍。三个数据集的示例图像如图5所示。

4.2 评估指标

评估指标(指标 + 用途目的)为了评估我们的方法,在像素和对象级别采用了三个常用的指标。对于对象级指标,使用聚合Jaccard指数(AJI)和Panoptic质量(PQ)。AJI通过考虑假阳性预测来扩展每个对象的Jaccard指数PQ最初是为全景分割设计的,它将用于对象检测的F1分数和用于实例分割的IoU分数相乘。因此,PQ反映了检测和分割的性能,并广泛用于细胞核实例分割。对于像素级评估,采用F1分数,这是二进制分割预测的精确度和召回率之间的平均调和平均值。

4.3 对比实验

对比方法不足之处 + 所提方法优势)如表所示,提出的方法在不同的组织病理学数据集上的性能大大优于所有比较方法。Chen等人在图像和实例级别学习域不变特征。然而,由于荧光显微镜和真实的组织病理学图像之间的差异很大,仅特征级自适应不足以减少域间隙。通过对外观的像素级自适应,所有其他方法都获得了更好的性能。与基线方法CyCADA 相比,我们的CyC-PDAM有6-12%的大幅改进,这是由于我们提出的核修复机制,全景级自适应和任务重新加权机制的有效性。

4.4 消融实验(去模块策略)

基于CyC-PDAM,去除了用于全景水平自适应的核修复机制、任务重新加权机制和语义分支,并使用与Sec相同的设置和数据集训练消融模型。在没有任务重新加权机制(w/o TR)的方法的预测中,存在一些具有不规则尺寸的对象。任务重新加权机制防止模型受到源域中特定于域的特征的影响,因此,将其移除会导致源偏置预测。与我们的方法相比,没有语义分支的模型(w/o SEM)不能在语义层面上学习领域不变的特征,包括核对象的空间分布和背景中的详细信息。

  

五、结论

  • 1. 主要工作:本文提出了一个CyC-PDAM架构的UDA细胞核分割的组织病理学图像。
    • 细胞核修复机制作用):设计了一种细胞核修复机制,以去除合成图像中的辅助对象,进一步避免假阴性预测。
    • 特征级自适应(作用):在特征级自适应中,提出了一个语义分支来适应前景和背景的特征,并结合语义和实例级自适应使模型能够在全景级学习域不变特征。
    • 任务重加权机制(作用):此外,提出了一种任务重加权机制,以减少偏差。
  • 2. 实验结果:在三个公共数据集上的实验表明,我们提出的方法比最先进的UDA方法有很大的优势,并达到了与完全监督方法相同的水平。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1631523.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微软如何打造数字零售力航母系列科普03 - Mendix是谁?作为致力于企业低代码服务平台的领头羊,它解决了哪些问题?

一、Mendix 成立的背景 Mendix的成立是为了解决软件开发中最大的问题:业务和IT之间的脱节。这一挑战在各个行业和地区都很普遍,很简单:业务需求通常被描述为IT无法正确解释并转化为软件。业务和IT之间缺乏协作的原因是传统的代码将开发过程限…

[论文笔记]Language Modeling with Gated Convolutional Networks

引言 今天带来论文Language Modeling with Gated Convolutional Networks的笔记,该篇工作提出了GLU(Gated Linear Units,门控线性单元)。 注意该篇工作是2016年发表,是在Transformer论文发表之前。当时作者认为语言建模的主要方法是基于循环…

百度语音识别的springboot应用

1、pom依赖 <dependency> <groupId>com.baidu.aip</groupId> <artifactId>java-sdk</artifactId> <version>4.16.18</version> </dependency> 2、测试的demo 创建语音识别应用 百度智能云-管理中心 (baidu.com) 代码中要…

qt-C++笔记之滑动条QSlider和QProgressBar进度条

qt-C笔记之滑动条QSlider和QProgressBar进度条 —— 2024-04-28 杭州 本例来自《Qt6 C开发指南》 文章目录 qt-C笔记之滑动条QSlider和QProgressBar进度条1.运行2.阅读笔记3.文件结构4.samp4_06.pro5.main.cpp6.widget.h7.widget.cpp8.widget.ui 1.运行 2.阅读笔记 3.文件结构…

ubuntu安装Anaconda安装及conda使用

一. 安装anaconda3详细教程 1、下载镜像 清华大学开源软件镜像站下载地址&#xff1a; https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 下拉到最低端选择Linux&#xff0c;选择最新版&#xff08;32/64位&#xff09;下载。这里我下载的是版本Anaconda3-4.3.30-Linux…

《微服务设计》读书笔记

此为阅读纽曼《微服务设计》一书后总结的读书笔记&#xff0c;点此处下载PDF文档。 一、微服务的概念 微服务&#xff08;或称微服务架构&#xff09;是一种云原生架构方法&#xff0c;其核心思想在于将单个应用拆分为众多 小型、松散耦合的服务&#xff0c;服务之间均通过网…

AI视频教程下载:构建一个ChatGPT股票配对交易机器人

ChatGPT及其后续版本GPT-4已经开始改变世界。人们对新机会感到兴奋&#xff0c;同时对我们社会可能受到的影响感到恐惧。这门课程结合了两个主题&#xff1a;AI和财务&#xff08;算法交易&#xff09;。 你将会学到的&#xff1a; 使用ChatGPT构建一个Python配对交易机器人 …

车载系统的 加减串器应用示意

overview 车载系统上使用加减串器来实现camera&#xff0c; led液晶显示屏等 图像数据的远距离传输&#xff0c;将原先在短距离传输视频信号的mipi csi&#xff0c;dsi 等的TX&#xff0c;RX中间&#xff0c;插入加减串器&#xff0c;实现长距离的可靠传输。 示意图如下 往往…

认清新形势 适应新变化 明确新要求 九河云召开渠道合作沙龙座谈

为推动“聚势、合作、共赢”主题沙龙高质量开展&#xff0c;牢牢把握“守初心、担责任&#xff0c;找差距、抓落实”的总要求&#xff0c;按照九河有关部署和集团实施方案有关安排&#xff0c;连日来&#xff0c;九河云领导班子成员分别讲授专题培训&#xff0c;讲本心传递精神…

最新发布:中国移动建成全球运营商最大单体智算中心

4月28日&#xff0c;中国移动正式对外发布全球运营商最大单体智算中心——中国移动智算中心&#xff08;呼和浩特&#xff09;&#xff0c;目前已投产使用。 该智算中心填补了我国人工智能广泛应用所需算力的巨大缺口&#xff0c;快速赋能交通、医疗、教育、能源、金融等行业大…

图神经网络入门与实战:从图嵌入(GE)到图神经网络(GNN)

目录 一. 图的基本概念(Graph) 1.1 图的定义 1.2 图表示的基本概念 1.3 图的应用场景 1.4 图的分类 二. 图嵌入(Graph Embedding) 2.1 图嵌入的基本概念 2.2 图嵌入方法分类 2.3 图嵌入和图神经网络的区别 三. 图神经网络(Graph Neural Network) 3.1 图神经网络的基…

挑战一周完成Vue3项目Day2:路由配置+登录模块+layout组件+路由鉴权

一、路由配置 经过分析&#xff0c;项目一共需要4个一级路由&#xff1a;登录&#xff08;login&#xff09;、主页&#xff08;home&#xff09;、404、任意路由&#xff08;重定向到404&#xff09;。 1、安装路由插件 pnpm install vue-router 2、创建路由组件 在src目…

237基于matlab的偏振态仿真

基于matlab的偏振态仿真&#xff0c;不同偏振态下光强计算。本仿真软件可以仿真波片对偏振光的相位调制过程。用户可以通过改变波片的类型&#xff0c;波片长轴与 X 轴的夹角&#xff0c;起偏器透光与 X 轴的夹角&#xff0c;检偏器透光轴与 X 轴的夹角等参数&#xff0c;来观察…

服务器部署教程下(线下、线上部署)

1、线下部署 1.1 前端 首先将拉代码下来&#xff0c;cd到想启动项目的目录下(控制台 cd 文件夹名称) 比如 blog-v3(cd blog-v3)要在存在package.json文件的目录才能进行依赖下载、项目启动操作 检查一下自己的node版本是否为18级以上(node -v) 博客前台blog-v3使用vite4开发…

【介绍下IDM的实用功能】

&#x1f3a5;博主&#xff1a;程序员不想YY啊 &#x1f4ab;CSDN优质创作者&#xff0c;CSDN实力新星&#xff0c;CSDN博客专家 &#x1f917;点赞&#x1f388;收藏⭐再看&#x1f4ab;养成习惯 ✨希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出…

五•一颂|广州流辰信息致敬每一个辛勤的劳动者,祝大家五一快乐!

时光飞逝&#xff0c;一年一度的五一国际劳动节如期而至。在这个竞争激烈的社会中&#xff0c;拥有勤劳品质的人儿总会在适当的时机迎来人生的高光时刻。或许你的人生经历非常丰富&#xff0c;或顺利&#xff0c;或坎坷&#xff0c;不管是哪种状态&#xff0c;勤劳的人应该是这…

大核注意力 LKA | Visual Attention Network

论文名称&#xff1a;《Visual Attention Network》 论文地址&#xff1a;2202.09741 (arxiv.org) 尽管最初是为自然语言处理任务而设计的&#xff0c;但自注意力机制最近在各个计算机视觉领域迅速崭露头角。然而&#xff0c;图像的二维特性给计算机视觉中的自注意力应用带来了…

Polyscope,一款简洁的三维可视化工具!

Polyscope是用于三维数据&#xff08;如meshes、point clouds&#xff09;的可视化工具&#xff0c;通过编程或动态GUI完成&#xff1b;支持C和Python编程&#xff1b;追求“一行代码”为数据提供有用的可视界面展示。 下面来简单介绍Polyscope使用。 Polyscope效果 Point Cl…

【数据结构】最小生成树(Prim算法、Kruskal算法)解析+完整代码

5.1 最小生成树 定义 对一个带权连通无向图 G ( V , E ) G(V,E) G(V,E)&#xff0c;生成树不同&#xff0c;每棵树的权&#xff08;即树中所有边上的权值之和&#xff09;也可能不同。 设R为G的所有生成树的集合&#xff0c;若T为R中边的权值之和最小的生成树&#xff0c;则T称…

OpenMM——教程学习(1)

如何从零开始做一个蛋白小分子动力学模拟 AmberTools将被用来生成输入文件&#xff0c;OpenMM 将被用来运行模拟&#xff0c;模拟平台为在线百度AI Stuio, 并使用GPU加速。 First thing’s first, 到PDB 蛋白数据库下载一需要模拟的靶点晶体&#xff0c;备用。 1. H web server…