研读论文之Image Quality-aware Diagnosis via Meta-knowledge Co-embedding

news2024/11/24 11:35:06

研读论文之 Image Quality-aware Diagnosis via Meta-knowledge Co-embedding

  • 前言
  • 一、简介
  • 二、主要内容
    • 2.1. 图像退化
    • 2.2. 图像质量感知诊断(IQAD)
    • 2.3. 元知识协同嵌入网络(MKCNet)
  • 三、实现过程
    • 3.1. IQAD问题
    • 3.2. 元知识协同嵌入网络 (MKCNet)
      • 3.2.1功能
      • 3.2.2优化策略
      • 3.2.3 Task Net的设计
      • 3.2.4 Meta Learner的设计
  • 四、优缺点
    • 4.1. 优点
    • 4.2. 缺点

前言

最近看了一篇医学图像论文,来分享下相关的内容。
在这里插入图片描述

一、简介

题目Image Quality-aware Diagnosis via Meta-knowledge Co-embedding
作者单位香港科技大学
论文地址https://arxiv.org/abs/2303.15038
代码地址https://github.com/chehx/MKCNet
发布时间2023 年 3 月 27 日

文章先抛出了一个问题,在进行医学图像处理的时候会出现图像退化问题,因此产生了许多低质量图像,过去的研究中主要工作就是剔除这些低质量图像,而本文提出了一个新的方法,也就是题目的中文翻译基于元知识协同嵌入的图像质量感知诊断,它有效地利用低质量图像及其质量标签,将其加入模型中,助模型识别可能的误差,从而提高诊断的准确性。

二、主要内容

2.1. 图像退化

文章用图1向我们解释了图像退化给诊断结果带来的影响;首先看第一列是正常眼底的高质量(HQ)图像,第二列是患病眼底的HQ图像,第三列是正常眼底的低质量(LQ)图像;
这里会发现明明是正常眼底,但是由于图像退化导致的低质量图像显示的却和患病眼底的图像相似,这很容易给疾病诊断带来很大的误差。

图1 图像退化对眼底(上)和OCTA(下)图像诊断语义的影响。第一行:退化使部分血管结构模糊不清,呈现病变样斑点;第二行:退化导致中央凹无血管区(中央圆形区域)扩大。

因此,过去的实验中往往是选择相对HQ的图像而舍弃相对LQ的图像;然而,LQ图像存在很大的潜在价值,在此基础上本文重新考虑了LQ图像和相应图像质量标签的价值,并提出了图像质量感知诊断(IQAD)问题。

2.2. 图像质量感知诊断(IQAD)

        IQAD旨在使模型能够利用LQ图像,同时学习图像质量标签,以实现准确和稳健的诊断。然而,对于多任务学习框架来说,有效地利用质量标签进行诊断并非易事。具体来说,图像质量评估可以被认为是与疾病诊断“无关”的任务,因为它侧重于捕捉图像退化,而诊断侧重于识别病变。
        为了实现IQAD,本文提出了一种新的元知识协同嵌入网络(MKCNet),它由任务网络(Task Net)和元学习器(Meta Learner)两个子网组成。

2.3. 元知识协同嵌入网络(MKCNet)

它由任务网络(Task Net)和元学习器(Meta Learner)两部分组成。

  • Task Net的主要功能是进行诊断预测。为了充分利用图像质量的信息,它通过知识协同嵌入特征进行预测,这些特征结合了图像质量和疾病诊断的知识。
  • 这些知识协同嵌入特征是通过Meta Learner学习辅助标签嵌入来构建的。具体来说,Meta Learner提供了一种辅助的标签嵌入方法,这种方法可以帮助Task Net进行优化,并鼓励其学习有效的知识协同嵌入特征。
  • 为了确保辅助标签嵌入的有效性和语义性,并避免获取精细的图像质量标签的困难,引入了元学习和联合编码掩码。联合编码掩码通过结合质量标签和诊断标签的方式,从Meta
    Learner的输出中选择一部分作为辅助标签嵌入。

三、实现过程

本节首先介绍了IQAD,并介绍了一个初步的实验,以及所涉及的挑战。然后介绍本文提出的解决方案MKCNet,它有效地解决了这些挑战。

3.1. IQAD问题

问题抽象化:对于给定的图像x,其对应的疾病诊断标签是y_d,而图像质量标签是y_q。IQAD的目标是通过同时利用高质量(HQ)和低质量(LQ)图像以及它们对应的诊断和质量标签,训练一个模型F来实现稳健和准确的诊断。

初步实验:直观地说,将图像质量评估(IQA)视为多任务学习框架中的一个辅助分支似乎是一个简单直接的解决方案。为了探索这种方法,作者对VGG16(Vanilla)进行了一个初步的实验。图2结果显示,利用LQ图像对模型学习是有益的。但出乎意料的是,尽管这些标签包含错误的异常信息并提供额外的有用的诊断信息,但将它们纳入模型中只会略微增强或甚至阻碍诊断性能。这表明,有效地利用质量标签并非易事。
在这里插入图片描述

图 2. LQ 图像和IQA模块的影响。对于Vanilla来说,利用LQ图像是很有用的,但是 IQA 模块只有很小的改进,或者会损害性能。

在多任务学习的背景下,本文认为IQAD的挑战是双重的。

  1. 第一个挑战:图像质量和疾病诊断之间的关系并不直接。通常,为疾病诊断训练的模型会关注损伤区域和解剖结构,而图像质量评估则需要模型捕捉图像退化。这两个任务的焦点不同,因此需要一个专门的设计来使模型能够有效地利用质量信息。为了解决这个问题,作者设计了Task
    Net,它包括一个明确的使用机制,用于利用知识协同嵌入特征进行诊断。
  2. 第二个挑战:二分类或多分类的质量注释的粒度有限,无法捕获图像退化的多样性和程度。这导致了模型缺乏可以指导其的详细信息,并使得建立图像质量如何影响疾病诊断的固定模式变得具有挑战性。此外,确定图像级别的标签准则用于关联质量和诊断是复杂的,而为退化提供像素级信息的标注是昂贵的。由于标签的局限性,即使存在明确的使用机制,模型也可能无法有效地利用质量信息。为了解决这个问题,作者采用了一个元学习范式,其中Meta Learner被训练为提供表示图像质量和疾病诊断标签之间自适应关联的辅助标签嵌入,从而允许模型有效地利用质量信息。

3.2. 元知识协同嵌入网络 (MKCNet)

组成:如图3所示,MKCNet由两个子网组成,分别是Task Net(表示为M_θ)和 Meta Learner(表示为M_Φ)。
在这里插入图片描述

图3. MKCNet 架构

3.2.1功能

给定一个图像x及其对应的图像质量和疾病诊断标签y_q和y_d,Meta Learner 从其输出向量中获取一个辅助标签嵌入y_ω。Task Net对于y_q、y_d和y_ω的预测分别表示为M_θ^q (x)、M_θ^d (x)和M_θ^ω (x)。

3.2.2优化策略

作者采用了两阶段的学习范式来优化MKCNet。第一阶段中,Task Net 使用y_q、y_d和y_ω进行训练。在第二阶段,Meta Learner通过元学习学习提供y_ω,以优化Task Net中的知识协同嵌入特征。这两个阶段在每个训练周期中都是迭代的,这导致了两个子网之间的端到端交互。

3.2.3 Task Net的设计

Task Net先从backbone提取出包含综合语义的特征图F_θ,然后通过三个基于全局注意块(GAB)的分支,分别对应监督信号y_q、y_d和y_ω,用于解耦包含诊断相关信息的特征f_θd,包含图像质量评估相关信息f_θq,包含了疾病诊断和图像质量的联合语义的知识协同嵌入特征f_θ^ω。
此外,作者还设计了元知识辅助块(MAB)来明确探索f_θω在疾病诊断中的潜在帮助。MAB首先通过一个通道式注意块过滤与疾病诊断无关的f_θω通道,然后使用包含诊断相关信息的特征f_θd和滤波后的f_θω进行最后的诊断。
Task Net〖 M〗_θ的目标函数L_θ表示为
在这里插入图片描述

3.2.4 Meta Learner的设计

Meta Learner的目的是提供一个与图像质量和疾病诊断都相关的监督信号y_ω,并通过联合编码掩码和元辅助学习确保了f_θ^ω的语义约束和有效性。
联合编码掩码的过程:
(1)基于疾病诊断标签y_d和图像质量标签y_q,进行联合编码以生成y_(d,q)。这个联合编码实际上是将两者的标签组合在一起,形成一个新的编码,代表了诊断和图像质量的联合信息。
(2)基于这个联合编码,创建一个二进制掩码B_(y_(d,q) )。这个掩码为与y_(d,q)相关的位置分配值1,为其他位置分配值0。例如,考虑y_q和y_d都属于{0,1},并且〖 M〗Φ (x)的长度为 4。在这种情下,联合标签编码将是y(d,q)∈{00,01,10,11} ,而B_(y_(d,q) )将分别为[1,0,0,0], [0,1,0,0], [0,0,1,0]和[0,0,0,1]。
(3)进一步,从〖 M〗Φ (x)中派生出y_ω为:y_ω=B(y_(d,q) )⊙〖 M〗_Φ (x)。
在每个优化步骤中,Meta Learner 使用特定的切片y_ω优化〖 M〗_Φ (x),鼓励在不同的标签组合中构建有区分性的辅助嵌入。这种机制将f_θ^ω与图像质量和疾病诊断的联合语义信息绑定在一起。元辅助学习的任务是优化φ以最小化Task Net M_θ的目标函数L_θ,过程为:
(1)首先,执行一步伪更新,使用学习率α来模拟y_ω对θ的影响,得到θ ̃。在这里插入图片描述

(2)然后,使用第二导数技巧来更新。
(3)为了避免辅助标签嵌入崩溃,通过增加〖 M〗_Φ (x)的熵来引入一个正则化项R(∙) 。
在这里插入图片描述

四、优缺点

4.1. 优点

(1)提出了图像质量感知诊断(IQAD)问题,并通过探讨该问题的价值和挑战性来解决实际应用中的难题。
(2)借鉴了多任务学习框架,提出了Meta-Knowledge Co-Embedding Network (MKCNet),通过有效地利用低质量图像及其质量标签来提高模型的准确性和鲁棒性。
(3)MKCNet包含两个子网络:Task Net和Meta Learner。Task Net构建了一个明确的质量信息利用机制,通过知识嵌入特征增强诊断;而Meta Learner则通过元学习和联合编码屏蔽确保这些特征的有效性和语义约束。
(4)MKCNet在五个数据集上进行了广泛的实验验证,结果表明其具有较高的效果和泛化能力。

4.2. 缺点

(1)复杂度:由于该方法涉及到两个子网络(Task Net 和 Meta Learner)以及元学习技术,这可能会导致模型的复杂度增加,从而对计算资源的需求更高。
(2)质量标签的挑战:本文提到,由于图像质量和疾病诊断之间的目标关系较浅,因此有效利用质量标签来辅助诊断仍然是具有挑战性的。这意味着该方法的成功与否取决于如何设计有效的机制来处理这种相关性。
(3)算法解释性:虽然该方法可以在一定程度上提高模型的准确性,但如何解释模型为何能够做出这样的决策仍然需要进一步研究。这对于医疗应用来说非常重要,因为医生需要了解模型是如何得出诊断结论的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1174092.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

轻信息服务展示预约小程序的内容是什么

预约几乎是适应所有经营商家的,可以提升客户服务/产品获取度、锁客及便捷性需求,同时也利于提升商家整体经营效率,无论获客还是留存线索都有很高帮助。 尤其对线下服务实体店来说,需要预约形式将客户引流到店,传统商家…

考研数学(数二)核心要点(极限)

前言 okey,今天难得有时间那就稍微整理一下数学部分的内容。注意,本文仅适用于考研冲刺阶段,对知识点进行复习使用。前提是你已经知道了相关知识点,我这里只是把我认为比较重要的,我自己总结的内容给出来,…

基于机器学习的学生成绩预测

学生成绩预测是一个基于回归问题的流行数据科学案例研究。对于数据科学初学者来说,这是一个很好的回归问题,因为它很容易解决和理解。本文中,将带你通过使用Python的机器学习来完成学生成绩预测的任务。 学生成绩预测(案例研究&a…

本地idea远程调试服务器程序

本文主要介绍idea本地调试远程服务器程序的方式。相信很多同行跟我一样,在最初接触公司项目的时候,遇到测试提出的缺陷,往往会在本地进行调试、替换jar包远程调试等方式,本地调试往往会导致数据和环境不一致的问题使得问题无法复现…

机器学习领域经典书籍推荐

机器学习领域经典书籍 1. 数据挖掘概念与技术2. 机器学习3. 统计学习方法4. 深度学习5. 动手学深度学习(PyTorch版) 1. 数据挖掘概念与技术 原名: Data Mining:Concepts and Techniques,Third Edition 作者: (美&#…

Solidity入门第一步之数据类型

各种类型介绍 数值类型(Value Type):包括布尔型(bool),整数型(int、uint、uint256)等等,这类变量赋值时候直接传递数值。引用类型(Reference Type):包括数组和结构体,这类变量占空间大,赋值时候直接传递地…

Leetcode—707.设计链表【中等】

2023每日刷题(十七) Leetcode—707.设计链表 设计单链表实现代码 typedef struct Node {int val;struct Node* next; } MyLinkedList;MyLinkedList* myLinkedListCreate() {MyLinkedList* mList (MyLinkedList *)malloc(sizeof(MyLinkedList));mList-…

chroot

1.chroot技术 在Linux系统中,系统默认的目录结构都是以/,即根(root)开始的。而在使用chroot之后,进程的系统目录结构将以指定的位置作为根(/)位置。chroot实际作用就是将进程描述符中struct fs_struct中的root的值设置为选定的目录。 在经过…

深度学习之基于Yolov5人体姿态摔倒识别分析报警系统(GUI界面)

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 系统设计概述: 传感器采集:通过在场景中布置摄像头或红外传感器等设备,采集人体…

latex自定义缩写

Latex 写文章可能常用到一些缩写,如: .e.g.i.e.cf.etc.w.r.t.i.i.d.et al. 其中有些要斜体,如果每次都要用 \textit{...}、{\it ...} 弄斜,有点麻烦。CVPR 模板中有定义一些命令,可以更方便地输入这些缩写。这里记录…

openebs

1. 简介 OpenEBS是一款使用Go语言编写的基于容器的块存储开源软件。OpenEBS使得在容器中运行关键性任务和需要数据持久化的负载变得更可靠。 OpenEBS是一组存储引擎,允许您为有状态工作负载(StatefulSet)和Kubernetes平台类型选择正确的存储解决方案。 在高层次上…

CCF-CSP真题《202309-4 阴阳龙》思路+python,c++满分题解

想查看其他题的真题及题解的同学可以前往查看:CCF-CSP真题附题解大全 试题编号:202309-4试题名称:阴阳龙时间限制:2.0s内存限制:1.0GB问题描述: 问题描述 西西艾弗岛的下方是一个庞大的遗迹群,神…

项目实战:优化Servlet,把所有围绕Fruit操作的Servlet封装成一个Servlet

1、FruitServlet 这些Servlet都是围绕着Fruit进行的把所有对水果增删改查的Servlet放到一个Servlet里面,让tomcat实例化一个Servlet对象 package com.csdn.fruit.servlet; import com.csdn.fruit.dto.PageInfo; import com.csdn.fruit.dto.PageQueryParam; import c…

Go语言文本处理:正则表达式与字符串操作

大家好,我是[lincyang]。 今天,我们将一起探讨Go语言在文本处理方面的强大功能,特别是正则表达式和字符串操作。 Go语言以其简洁和高效而闻名,这些特性在文本处理上也得到了很好的体现。 接下来,我将通过丰富的案例…

FPGA的元素组件

注意:关于FPGA的元素这一块儿内容,稍有出入。例如:吉姆莱丁 著,陈会翔 译,由清华大学出版社出版的《构建高性能嵌入式系统》中提到:FPGA通常由查找表、触发器、块RAM、DSP切片、及其他功能元件等元素组成。…

C语言----每日五道选择题Day1

1.第一题 1、指出下列代码的缺陷&#xff08; &#xff09;【多选】 float f[10]; // 假设这里有对f进行初始化的代码 for(int i 0; i < 10;) {if(f[i] 0)break; } A: for(int i 0; i < 10;)这一行写错了 B: f是float型数据直接做相等判断有风险 C: f[i]应该是…

C++初阶--类与对象--const成员和日期类的实现

文章目录 const 成员对一个日期类的实现源码解析构造函数的验证运算符的重复利用前置与后置其他运算符的验证 const 成员 将const修饰的成员函数称之为const成员函数。 在一个成员函数里面&#xff0c;对于this指针指向的对象&#xff0c;是隐藏式的&#xff0c;没有办法用常规…

B-DS二叉树_输出所有目标路径

Description 给定二叉树和一个整数目标targetSum&#xff0c;输出所有从根结点到叶子结点的路径总和等于targetSun的路径。 Input 第一行输入t&#xff0c;表示有t个测试样例。 第二行起&#xff0c;每一行首先输入一个整数targetSum&#xff0c;接着输入n&#xff0c;接着输…

带你拿捏链表

本专栏内容为&#xff1a;数据结构学习专栏&#xff0c;分为初阶和进阶两部分。 通过本专栏的深入学习&#xff0c;你可以了解并掌握数据结构。 &#x1f493;博主csdn个人主页&#xff1a;小小unicorn ⏩专栏分类&#xff1a;数据结构 &#x1f69a;代码仓库&#xff1a;小小u…

Mega Sales购物季营销,掌握流量密码不是事

“Mega Sales”购物季是东南亚地区“双十一、双十二”的两个重要节点&#xff0c;在年末即将来临之际&#xff0c;全球电商市场都正进入激动人心的备货大卖时期。面对这样的重要节目&#xff0c;商家应该如何做好营销铺垫&#xff0c;全面备战大促的不同阶段&#xff1f; 作为…