可解释医学视觉问答的反事实因果干预| 文献速递-基于深度学习的多模态数据分析与生存分析

news2025/1/23 15:02:29

Title

题目

Counterfactual Causal-Effect Intervention for  Interpretable Medical Visual Question Answering

可解释医学视觉问答的反事实因果干预

01

文献速递介绍

深度学习的进步在计算机视觉、自然语言处理和信息检索领域成功地取得了最先进的(SOTA)成果。在医疗行业,深度学习技术促成了许多重要的应用。例如,在自然语言处理方面,利用患者临床记录进行预测分析的几项引人注目的研究已经出现。视觉问答(VQA)是一项计算机视觉和自然语言处理中的复杂任务,旨在回答与给定图像相关的自然语言问题。在通用领域,深度学习在VQA方面取得了巨大成功。将通用VQA迁移到医疗领域催生了一项新的下游任务:医学视觉问答(VQA-Med)。在VQA-Med任务中,使用患者的放射扫描(X射线、磁共振成像(MRI)和CT)代替通用领域的标准图像,并配有临床相关的问答(QA)对。VQA-Med技术可以帮助医生提高诊断效率,并帮助患者理解他们的病情。然而,VQA-Med具有挑战性,因为它需要对专业医学图像和文本QA对进行深入理解和高水平交互,以生成合理且可信的答案。

Abstract

摘要

医学视觉问答(VQA-Med)是一项具有挑战性的任务,涉及回答与医学图像相关的临床问题。然而,大多数当前的VQA-Med方法忽略了特定病变或异常特征与答案之间的因果关系,同时也未能为其决策提供准确的解释。为了探索VQA-Med的可解释性,本文提出了一种基于反事实因果干预策略的新型CCIS-MVQA模型。该模型由用于图像特征提取的改进ResNet、用于问题特征提取的GloVe解码器、用于视觉和语言特征融合的双线性注意网络以及用于生成可解释性和预测结果的可解释性生成器组成。所提出的CCIS-MVQA引入了一种层级相关传播方法,以自动生成反事实样本。此外,CCIS-MVQA在整个训练阶段应用反事实因果推理,以增强可解释性和泛化能力。在三个基准数据集上的大量实验表明,所提出的CCIS-MVQA模型优于最先进的方法。生成了足够的可视化结果来分析CCIS-MVQA的可解释性和性能。

Method

方法

The VQA-Med task is a multi-class classification problem, and we consider an image-question pair ( ) , V Q , where Qrepresents a medical-related question, and V is a medical image. A dataset { } , ,Nii i i D v q a = consists of triplets of images i v V ∈ , questions i q Q∈ , and candidate answers i a A ∈ . VQA-Med can be expressed as a question-and-answer model to find the answer with the highest probability from candidate answers as: ( ) ˆ argmax | ,ii i iaa P a v q θ∈=A, (1) where θ is the parameter in question answering model. As shown in Fig. 1, the proposed CCIS-MVQA consists of four main components.

VQA-Med任务是一个多类分类问题,我们考虑一个图像-问题对 (V,Q)(V, Q)(V,Q),其中 QQQ 代表一个与医学相关的问题,VVV 是一张医学图像。一个数据集 {(vi,qi,ai)}i=1N{(v_i, q_i, a_i)}_{i=1}^N{(vi,qi,ai)}i=1N 由图像 vi∈Vv_i \in Vvi∈V、问题 qi∈Qq_i \in Qqi∈Q 和候选答案 ai∈Aa_i \in Aai∈A 的三元组组成。VQA-Med可以表示为一个问答模型,从候选答案中找到具有最高概率的答案:\hat{a} = \arg\max_{a_i \in A} P(a_i | v, q; \theta) \tag{1}其中 θ\thetaθ 是问答模型中的参数。如图1所示,所提出的CCIS-MVQA由四个主要组件组成。

Conclusion

结论

This paper proposed a novel CCIS-MVQA framework to discuss how to mitigate the influence of language bias and enhance the interpretability of the VQA-Med model in mixed causal data. The proposed CCIS-MVQA framework consists of image feature extraction, question feature extraction, BAN, and interpretation generator. This paper focused on theinterpretation generator to explore the interpretability and language bias of VQA-Med. We incorporated counterfactual interpretation and causal-effect reasoning into CCIS-MVQA to explore how the VQA-Med system responds to causal intervention strategy (such as the covered image of a given focus, how the model generates predictive answers), and quantify the effects of such intervention strategies.

本文提出了一种新颖的CCIS-MVQA框架,旨在讨论如何减轻语言偏差的影响并增强VQA-Med模型在混合因果数据中的可解释性。所提出的CCIS-MVQA框架包括图像特征提取、问题特征提取、BAN(双线性注意网络)和解释生成器。本文重点研究了解释生成器,以探索VQA-Med的可解释性和语言偏差。我们将反事实解释和因果推理引入CCIS-MVQA,探讨VQA-Med系统如何响应因果干预策略(例如,给定焦点的覆盖图像,模型如何生成预测答案),并量化这些干预策略的效果。

Figure

图片

Fig. 1. The proposed CCIS-MVQA framework based on counterfactual causal-effect intervention strategy

图1:基于反事实因果干预策略的CCIS-MVQA框架

图片

Fig. 2. Factual and counterfactual interpretations on VQA-Med dataset.

图2:VQA-Med数据集上的事实和反事实解释。

图片

Fig. 3. Causal graph model based on counterfactual samples. (a) Original image X; Answer Y: Vascular malformation. (b) Counterfactual imageX ; Answer Y: NOT Vascular malformation. (c) Counterfactual imageX⌢; Answer Y: Vascular malformation. (d) SCM model.

图3:基于反事实样本的因果图模型。(a) 原始图像X;答案Y:血管畸形。(b) 反事实图像X;答案Y:非血管畸形。(c) 反事实图像X⌢;答案Y:血管畸形。(d) SCM模型。

图片

Fig. 4 Training and optimization process of CCIS-MVQA at epoch i

图4:CCIS-MVQA在第i个epoch的训练和优化过程

图片

Fig. 5. Examples of counterfactual samples between the causal and non-causal correlations.

图5:因果相关和非因果相关之间反事实样本的示例。

图片

Fig.6. Examples for interpretable causal saliency map.

图6:可解释因果显著性图示例。

图片

Fig.7. Visualization results of the debiasing ability with CCIS-MVQA.

图7:CCIS-MVQA去偏能力的可视化结果。

图片

Fig. 8. Ablation studies on batch size and parameter k

图8:关于批处理大小和参数k的消融研究

图片

Fig.9. The confusion matrix of Plane

图9:平面的混淆矩阵

Table

图片

TABLE I   quantitative verification results of model overall performance (acc. %)

表 I 模型整体性能的定量验证结果(准确率%)

图片

TABLE II effect of different k value on ccis-mvqa performance (acc. %)

表 II不同K值对CCIS-MVQA性能的影响(准确率%)

图片

TABLE IIIthe quantitative verification results of model debiasing ability (acc. %)

表 III模型去偏能力的定量验证结果(准确率%)

图片

TABLE IV   effect of pre-training process on ccis-mvqa

表 IV 预训练过程对CCIS-MVQA的影响

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1936008.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot连接PostgreSQL+MybatisPlus入门案例

项目结构 一、Java代码 pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://mave…

基于秒杀系统的企业开发设计思考

一、需求分析 需求描述为实现某商品秒杀活动&#xff0c;结果为商品库存为0&#xff0c;订单数量和商品原有库存数量相等&#xff0c;即保障系统数据一致性同时&#xff0c;保障系统稳定性 二、流程设计 三、数据库设计 本次示例仅涉及商品表、订单表&#xff0c;这里分享数…

2024可信数据库发展大会:TDengine CEO 陶建辉谈“做难而正确的事情”

在当前数字经济快速发展的背景下&#xff0c;可信数据库技术日益成为各行业信息化建设的关键支撑点。金融、电信、能源和政务等领域对数据处理和管理的需求不断增加&#xff0c;推动了数据库技术的创新与进步。与此同时&#xff0c;人工智能与数据库的深度融合、搜索与分析型数…

《Towards Black-Box Membership Inference Attack for Diffusion Models》论文笔记

《Towards Black-Box Membership Inference Attack for Diffusion Models》 Abstract 识别艺术品是否用于训练扩散模型的挑战&#xff0c;重点是人工智能生成的艺术品中的成员推断攻击——copyright protection不需要访问内部模型组件的新型黑盒攻击方法展示了在评估 DALL-E …

AI算法18-最小角回归算法Least Angle Regression | LARS

​​​ 最小角回归算法简介 最小角回归&#xff08;Least Angle Regression, LAR&#xff09;是一种用于回归分析的统计方法&#xff0c;它在某些方面类似于最小二乘回归&#xff0c;但提供了一些额外的优点。最小角回归由Bradley Efron等人提出&#xff0c;主要用于处理具有…

【鸿蒙学习笔记】舜和酒店项目开发

这里写目录标题 前期准备1. 环境准备2. 开发工具准备 创建项目1. 使用 deveco-studio 创建 ShunHeHotel 项目2. 把ShunHeHotel 项目使用git进行版本控制3. 提交第1个commit&#xff0c;Alt0 → 输入commit message → 提交4. 查看已经提交的第一个提交5. gitcode 创建同名远程项…

数据库系统概论:关系型数据库系统

引言 如今最为重要的数据模型便是关系模型。关系数据库就是支持关系模型的数据库系统&#xff08;Relational Database Management System, RDBMS&#xff09; 关系模型可以简单理解为二维表格模型&#xff0c;一个关系型数据库就是由二维表及其之间的关系组成的一个数据组织。…

1、常用模块讲解(simulink仿真)

1、常用模块讲解&#xff08;simulink仿真&#xff09; Simulate有很多库 进入simulink 命令行simulink再回车 &#xff0c;或点击菜单栏 Export model to 可以将高版本保存为低版本 1&#xff0c;在MATLAB主界面&#xff0c;新建编辑器&#xff0c; a1:100; bsin(a*0.2); pl…

argparse部分用法

文章目录 一、一个简单的示例1.导入模块2.创建解析器3.添加参数4.解析参数5.使用解析的参数6.完整程序7.运行 二、更多用法1.ArgumentParser对象创建时的参数2.add_argument()的参数&#xff08;1&#xff09;name&#xff1a;名称1&#xff09;位置参数2&#xff09;可选参数3…

priority_queue的使用与模拟实现

目录 priority_queue的使用 priority_queue的介绍 priority_queue的定义方式 priority_queue成员函数的介绍 priority_queue的模拟实现 1&#xff1a;堆的向上调整算法 2&#xff1a;堆的向下调整算法 两种算法的比较与各自最佳使用 priority_queue的模拟实现 priorit…

使用VMware虚拟机安装kali 2019

一、下载kali linux镜像 下载 kali Linux的ISO镜像文件 网盘链接&#xff1a;https://pan.baidu.com/s/1GRtJxGBlqFfmU24HLEy3-g?pwd57u3 提取码&#xff1a;57u3 二、安装并配置 Kali Linux 新建虚拟机 在虚拟机创建向导中&#xff0c;选择经典配置 选择下载好的kali镜…

细说MCU用定时器控制ADC采样频率的实现方法并通过Simulink查看串口输出波形

目录 一、硬件工程 二、建立Simulink模型 1.安装MATLAB和Simulink 2.建立Simulink模型 三、代码修改 1.修改回调函数 2.产看结果 3.完整的main.c 本文作者的文章 细说MCU用定时器控制ADC采样频率的实现方法-CSDN博客 https://wenchm.blog.csdn.net/article/details/…

WSL-Ubuntu20.04环境使用YOLOv8 TensorRT推理加速

在阅读本章内容之前,需要把部署环境以及训练环境都安装好。 1.TensorRTX下载 这里使用Wang-xinyu大佬维护的TensorRTX库来对YOLOv8进行推理加速的演示,顺便也验证一下前面环境配置的成果。 github地址:GitHub - wang-xinyu/tensorrtx,下载后放到wsl的路径下,我这里放在/h…

JavaScript日期对象倒计时案例

思路&#xff1a;1.先求出当前时间的总毫秒数 2.再求出所需要求的时间的总毫秒数 3.用所求时间的减去当前时间的可得到倒计时剩余时间 4.最后将所求的倒计时剩余时间转换为天&#xff0c;小时&#xff0c;分钟&#xff0c;秒即可 <!DOCTYPE html> <html lang"en…

Java并发04之线程同步机制

文章目录 1 线程安全1.1 线程安全的变量1.2 Spring Bean1.3 如果保证线程安全 2 synchronized关键字2.1 Java对象头2.1.1 对象组成部分2.1.2 锁类型2.1.3 锁对象 2.2 synchronized底层实现2.2.1 无锁状态2.2.2 偏向锁状态2.2.3 轻量级锁状态2.2.4 重量级锁2.2.5 锁类型总结2.2.…

【动态规划】力扣2266.统计打字方案数

Alice 在给 Bob 用手机打字。数字到字母的 对应 如下图所示。在这里插入图片描述 为了 打出 一个字母&#xff0c;Alice 需要 按 对应字母 i 次&#xff0c;i 是该字母在这个按键上所处的位置。 比方说&#xff0c;为了按出字母 ‘s’ &#xff0c;Alice 需要按 ‘7’ 四次。…

C++:类的默认成员函数

默认成员函数就是⽤⼾没有显式实现&#xff0c;编译器会⾃动⽣成的成员函数称为默认成员函数。⼀个类&#xff0c;我们不写的情况下编译器会默认⽣成以下6个默认成员函数&#xff0c;需要注意的是这6个中最重要的是前4个。 定义一个空类&#xff1a; class A { }; 经过编译器…

Etsy开店指南:分步指南与防封技巧

您的Etsy帐户在注册后不久就被封了吗&#xff1f;如果是这样&#xff0c;您在设置Etsy帐户时就已经错误了&#xff0c;其实这其中还是有很多细节需要注意&#xff1b;本文全面讲解了如何逐步创建帐户&#xff0c;如果你也正在准备&#xff0c;那就继续看吧&#xff01; 一、在开…

基于Java的汽车租赁管理系统设计(含文档、源码)

本篇文章论述的是基于Java的汽车租赁管理系统设计的详情介绍&#xff0c;如果对您有帮助的话&#xff0c;还请关注一下哦&#xff0c;如果有资源方面的需要可以联系我。 目录 摘 要 系统运行截图 系统总体设计 系统论文 资源下载 摘 要 近年来&#xff0c;随着改革开放…

元宇宙:科技巨头的下一个战场

热门标题&#xff1a; “元宇宙&#xff1a;科技巨头的下一个战场” 相关文章问题&#xff1a; 问题&#xff1a; 在科技巨头纷纷布局元宇宙的背景下&#xff0c;元宇宙将如何影响未来的科技产业和日常生活&#xff1f; 文章概要&#xff1a; 随着Facebook更名为Meta&…