TransFusionNet:JetsonTX2下肝肿瘤和血管分割的语义和空间特征融合框架

news2024/11/14 1:26:11

TransFusionNet: Semantic and Spatial Features Fusion Framework for Liver Tumor and Vessel Segmentation Under JetsonTX2

  • TransFusionNet:JetsonTX2下肝肿瘤和血管分割的语义和空间特征融合框架
    • 背景
    • 贡献
    • 实验
    • 方法
      • Transformer-Based Semantic Feature Extraction Module(transformer语义特征提取模块)
      • Local Spatial Feature Extraction Module(局部空间特征提取模块)
      • Edge Extraction Module(边缘提取模块)
      • Multi-Scale Feature Fusing Module(多尺度特征融合模块)
      • Multi Task Training Strategy(多任务训练策略)
      • Applying Transfer Learning to TransFusionNet(迁移学习在TransFusionNet上的应用)
      • Quantification and Fine-Tuning of Inference Models(推理模型的量化与微调)
    • 损失函数
    • Thinking

TransFusionNet:JetsonTX2下肝肿瘤和血管分割的语义和空间特征融合框架

IEEE JOURNAL OF BIOMEDICAL AND HEALTH INFORMATICS, VOL. 27, NO. 3, MARCH 2023

背景

CT图像中肝脏肿瘤和血管的分割和重建可以为医生的术前计划和手术干预提供便利。介绍了一个TransFusionNet框架,该框架由语义特征提取模块局部空间特征提取模块边缘特征提取模块多尺度特征融合模块组成,以实现肝脏肿瘤和血管的细粒度分割。此外,我们将迁移学习方法应用于使用公共数据集进行预训练,然后对模型进行微调,以进一步提高拟合效果。此外,我们提出了一种智能量化方案来压缩模型权重,并在JetsonTX2上实现了高性能推理。TransFusionNet框架在血管分割任务中实现了0.854的平均IoU,在肝肿瘤分割任务中获得了0.927的平均IoU。在分析量化推理的计算性能时,我们的量化模型在NVIDIA RTX3090的Node上实现了4TFLOP,在JetsonTX2上实现了132GFLOP。这种前所未有的分割效果在一定程度上解决了自动分割的准确性和性能瓶颈。
需要解决的问题:
(1)如何设计一种准确、快速的肝肿瘤血管自动分割和三维重构方法?
(2) 如何设计一个能够学习空间语义融合特征的分割框架,以提高肿瘤和血管细节的分割精度?
(3) 如何设计高效的模型量化方法,实现肿瘤和血管的高性能模型推断和3D重建?
(4) 如何优化模型的计算和存储开销,以构建轻量级模型并将分割模型部署到JetsonTX2设备?

贡献

1)我们提出了TransFusionNet框架,该框架结合了CT图像的空间语义边缘特征,实现了对肝脏肿瘤肝内动脉血管系统的精确精细分割。
2) 我们提出了一种基于强化学习智能量化方案来压缩模型的权重,使模型在JetsonTX2和NVIDIA RTX3090 GPU的节点上都达到了最佳的推理性能。
3) 通过仔细量化,我们的模型使用NVIDIA RTX3090 GPU和JetsonTX2设备在Node上实现了高性能的肝血管肿瘤推断和三维重建。

实验

数据集:LITS(肝和肝肿瘤分割,https://competitions.codalab.org/competitions/17094)数据集包含130例肿瘤、转移瘤和囊肿。这些CT扫描具有较大的空间分辨率和视场(FOV)差异[4]。
3Dircadb(用于算法数据库比较的3D图像重建,https://www.ircad.fr/research/3d-ircadb-01/)是一个公共数据集,可用于训练和测试肝血管分割方法,包括20名不同图像分辨率、血管结构、强度分布和肝血管对比CT增强的患者[29]。
同时,我们收集了18例患者的CT增强图像,并构建了肝肿瘤血管(LTBV)数据集。为了清楚地区分肝脏中的血管并减轻标记负担,我们只保留了18名患者的动脉期图像。由于可训练样本的稀缺性,我们只分为训练数据集和测试数据集。我们使用这两个数据集进行模型预训练,并使用我们的私人数据集对肝动脉和肿瘤分割任务的模型进行微调训练。以上三个数据集按照8:2的比例分为训练集和测试集。

在这里插入图片描述
消融实验
在这里插入图片描述

方法

在这里插入图片描述

Transformer-Based Semantic Feature Extraction Module(transformer语义特征提取模块)

有效解决了传统深度CNN网络中感知场缺陷导致的信息缺失问题
可以学习全局特征表示的编码器,该编码器由基于特征提取主干的特征嵌入模块基于Transformer感测图像的语义相关信息表示的特征提取模块组成[31]。该模块采用了一种全新的特征提取思想,通过对图片特征进行语义表示,并学习语义特征的全局表示。

Local Spatial Feature Extraction Module(局部空间特征提取模块)

在这里插入图片描述
基于Transformer的特征提取模块是一个非常强大的语义信息特征提取模块,因为Transformer特征提取模块在学习语义相关特征方面具有优势。然而,在许多方面,Transformer并不是传统卷积运算的有效替代品。对于提取一些图像中更细微的特征,如感兴趣区域的特征和微小血管的特征,CNN是一个完美的解决方案。我们设计了一种基于多层SEBottleNet堆叠的局部残差网络编码器。我们在BottleNet中引入了挤压和激励(SE)[51],以增强特征图通道之间的相互依赖性
确保每个模块都有不同的特征提取任务。我们在模块中间引入了挤压和激励模块,以更好地学习特征图通道维度的重要性,从而使SEBottleNet在特征提取过程中具有更强的学习重点。通过SEBottleNet和maxpool的连续叠加,编码器可以连续提取输入CT图像的局部特征表示。同时,由于每个SEBottleNet都设置了剩余连接,这使编码器能够有效地缓解网络深化带来的降级问题。

Edge Extraction Module(边缘提取模块)

由于肝动脉血管非常小,因此进一步细化血管和肝脏的分割是一项具有挑战性的任务。为了让模型能够学习更详细的空间特征,我们引入了EEM,它专门用于学习感兴趣的血管和肿瘤区域的边缘特征,并将边缘特征融合到分割网络中。
在这里插入图片描述
EEM以特征提取层的特征图Canny算法[18]提取的CT边缘图(图3(b))为输入,预测边缘结果e∈RH×W。该模块预测边缘信息,并将预测的特征图组合到分割网络中。为了完成这项任务,我们处理分割注释以获得边缘注释er(图第3(d)段),它可以用作该模块的监督条件

在本模块中,我们使用了门控激励卷积(GEC)层。GEC是EEM中最重要的单元,它可以过滤掉一些不相关的信息,集中精力提取图像的边缘特征。GEC应用于EEM和特征提取模块之间。它使用门控机制来停用其自身的激活,这些激活被提取模块[52]中包含的高级信息认为不相关。同时,我们在门控激活层中引入了一个激励模块,以学习不同特征图的重要性。
在这里插入图片描述

从理论上讲,GEC可以简单地看作是对特征图的空间维度和通道维度的关注的集合。通过GEC运算,注意力图αi选择性地保留了边缘语义特征。我们取消了对特征提取器的浅层特征图的GEC操作,因为馈送到卷积层的图像主要学习一般的低级特征,同时,输出的特征图保留了丰富的边缘信息。随着网络的深入,特征图将保留高级特征。在理论上,使用GEC运算可以有效地对高级特征的有用边缘信息进行加权
在这里插入图片描述
Canny算子可以有效地滤除图像中不相关的特征,得到如图所示的Canny图像。第3(b)段。我们认为它适用于医学图像分割。因此,我们首先将canny图像和最后一个GEC模块输出en连接起来。然后,我们将它们与两个特征提取器的输出特征图一起提供给融合模块。同时,边缘提取模块以边缘损失为损失函数以边缘标签为监督,对预测边缘图进行优化

Multi-Scale Feature Fusing Module(多尺度特征融合模块)

多尺度特征融合解码模块,以对三个模块学习到的语义特征进行采样。该模块将三个模块提取的特征图作为输入,并输出预测的类别分布图
在这里插入图片描述
主要融合三个特征提取模块的特征图。参考空间金字塔池(SPP)来设计模块。首先,该模块使用C1×1和C3×3卷积分别从语义特征图空间特征图的拼接结果中提取特征。接下来,我们将其输入到池化层,并融合边缘特征图。通过上述操作,获得了三个不同感受野的特征图。最后,我们对这三个特征图进行采样并连接,以输出融合的特征图。从理论上讲,这些模块输出的特征图可以保留丰富的空间特征语义相关特征边缘特征。在连续融合不同尺度的低级特征图后,解码器可以从粗到细地学习图像的语义信息。

Multi Task Training Strategy(多任务训练策略)

分割任务、边界任务、
优化过程中,特征提取模块和边缘提取模块的参数将基于损失进行优化。接下来,我们将边缘提取模块输出的特征图输入到融合模块中,以预测分割结果。因此,边缘提取模块学习到的先验知识保留在y中。同时,在优化过程中,分割损失会更加关注边缘特征

Applying Transfer Learning to TransFusionNet(迁移学习在TransFusionNet上的应用)

由于癌症筛查后增强CT图像的稀缺性以及肿瘤和血管的标记困难,我们获得了18例患者的CT图像。数据过少将不可避免地影响模型的性能,并加深过度拟合问题。为此,我们引入了一种迁移学习策略,该策略不需要具有确切代表性的训练数据,并且能够利用数据集之间的相似性,在模型的训练阶段捕获特定的先验知识,以构建新的分割模型

首先使用公共数据集LITS和3Dircadb对模型进行预训练,分别获得肝脏肿瘤分割模型和肝脏血管分割模型。然后,我们使用我们的肝脏肿瘤数据和肝脏血管数据来重新训练通过预训练获得的模型。当我们需要对肝脏肿瘤和CT图像的血管进行分割时,我们只需要输入一张CT图像,模型就会分别对CT图像中的肿瘤和血管部分进行分割。

Quantification and Fine-Tuning of Inference Models(推理模型的量化与微调)

提出了一种基于硬件感知自动量化(HAQ)[55]的模型量化方案,以压缩框架的CNN和密集层,并优化计算和存储开销
在这里插入图片描述

损失函数

分割损失
在这里插入图片描述
边界损失
在这里插入图片描述
形状正则化损失,y是预测的分割图,e是预测的边缘图。在模型训练开始时,由于边缘提取模块是随机初始化的,无法准确预测e,(10)不起任何作用。因此,我们引入了一种动态调整策略,在100个历元之前将λ4设置为0,在100历元之后将λ4≥0
在这里插入图片描述

Thinking

双编码器分支,语义特征编码器在中间层加入Transformer,SEBottleNet分支提取局部特征,融合模块,边界特征提取模块,用标签的canny边缘图作为监督

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1249093.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CentOS7安装Docker运行环境

1 引言 Docker 是一个用于开发,交付和运行应用程序的开放平台。Docker 使您能够将应用程序与基础架构分开,从而可以快速交付软件。借助 Docker,您可以与管理应用程序相同的方式来管理基础架构。通过利用 Docker 的方法来快速交付,…

短视频ai剪辑矩阵分发saas系统源头技术开发

抖音账号矩阵系统是基于抖音开放平台研发的用于管理和运营多个抖音账号的平台。它可以帮助用户管理账号、发布内容、营销推广、分析数据等多项任务,从而提高账号的曝光度和影响力。 具体来说,抖音账号矩阵系统可以实现以下功能: 1.多账号多…

虚拟KOL搅动“网红圈”,出海品牌该如何与其合作?

近年来,虚拟KOL已经成为了数字营销领域的一股强大力量。虚拟网红的崛起在社交媒体平台上引起了广泛的关注,其独特的吸引力和影响力使其成为了各类品牌愿意与之合作的理想伙伴。特别是对于那些试图进军国际市场的出海品牌来说,与虚拟网红合作不…

系列六、Spring整合单元测试

一、概述 Spring中获取bean最常见的方式是通过ClassPathXmlApplicationContext 或者 AnnotationConfigApplicationContext的getBean()方式获取bean,那么在Spring中如何像在SpringBoot中直接一个类上添加个SpringBootTest注解,即可在类中注入自己想要测试…

JMeter 测试脚本编写技巧

JMeter 是一款开源软件,用于进行负载测试、性能测试及功能测试。测试人员可以使用 JMeter 编写测试脚本,模拟多种不同的负载情况,从而评估系统的性能和稳定性。以下是编写 JMeter 测试脚本的步骤。 第 1 步:创建测试计划 在JMet…

【Unity】EventSystem.current.IsPointerOverGameObject()对碰撞体起作用

本来我是用 EventSystem.current.IsPointerOverGameObject()来检测是否点击在UI上的,但是发现,他对我的碰撞体也是返回ture,研究半天。。。。找不出问题,然后发现我的相机上挂载了PhysicsRaycaster,去掉之后就好了,至于…

2014年全国硕士研究生入学统一考试管理类专业学位联考数学试题——解析版

文章目录 2014 年考研管理类联考数学真题一、问题求解(本大题共 15 小题,每小题 3 分,共 45 分)下列每题给出 5 个选项中,只有一个是符合要求的,请在答题卡上将所选择的字母涂黑。真题(2014-01&…

蓝桥杯物联网竞赛_STM32L071_3_Oled显示

地位: 对于任何一门编程语言的学习,print函数毫无疑问是一种最好的调试手段,调试者不仅能通过它获取程序变量的运行状态而且通过对其合理使用获取程序的运行流程,更能通过关键变量的输出帮你验证推理的正确与否,朴素的…

12V降3.3V100mA稳压芯片WT7133

12V降3.3V100mA稳压芯片WT7133 WT71XX系列是一款采用CMOS工艺实现的三端高输入电压、低压差、小输出电流电压稳压器。 它的输出电流可达到100mA,输入电压可达到18V。其固定输出电压的范围是2.5V~8.0V,用户 也可通过外围应用电路来实现可变电压…

使用dbutil工具类查询数据表时,servlet传入sql数据 返回结果为null

使用dbutil工具类查询数据表时,servlet传入sql数据 返回结果为null 原本数据表中该有的数据却返回为空 解决办法: 在jdbc.properties配置文件中url连接里面加上utf-8字符集 urljdbc:mysql://localhost:3306/qfedu?useUnicodetrue&characterEncodi…

Maven - 打包之争:Jar vs. Shade vs. Assembly

文章目录 Pre概述Jar 打包方式_maven-jar-pluginOverview使用官方文档 Shade 打包方式_maven-shade-pluginOverview使用将部分jar包添加或排除将依赖jar包内部资源添加或排除自动将所有不使用的类排除将依赖的类重命名并打包进来 (隔离方案)修改包的后缀…

【合集一】每日一练30讲,轻松掌握Verilog语法

本原创教程由深圳市小眼睛科技有限公司创作,版权归本公司所有,如需转载,需授权并注明出处(www.meyesemi.com) 第一练:如何区分<=表示的含义? 题目:请描述以下两种方法产…

什么年代了,你还不会自动化测试?

一、前言 在软件测试中,自动化测试指的是使用独立于待测软件的其他软件来自动执行测试、比较实际结果与预期并生成测试报告这一过程。在测试流程已经确定后,测试自动化可以自动执行的一些重复但必要测试工作。也可以完成手动测试几乎不可能完成的测试。…

葡萄酒怎么按照饮用时间分类?

不同的葡萄酒搭配不同的餐食,会让饮酒人有不一样的感受和体会,所以,葡萄酒是分场合并且有饮用时间的。云仓酒庄的品牌雷盛红酒分享一般按照饮用时间分类可以把葡萄酒分为三大类,分别是餐前酒、佐餐酒和餐后酒。 餐前酒&#xff1…

C++之模版初阶(简单使用模版)

前言 在学习C的模版之前,咱们先来说一说模版的概念,模版在我们的日常生活中非常常见,比如我们要做一个ppt,我们会去在WPS找个ppt的模版,我们只需要写入内容即可;比如我们的数学公式,给公式套值&…

Python监控服务进程及自启动服务方法与实践

1. 需求概述 当我们在Windows Server环境中部署XX系统的实际应用中,往往会遇到一些运维管理的挑战。为了确保系统的持续稳定运行,特别是在服务程序因各种原因突然关闭的情况下,我们可以借助Python的强大生态系统来构建一个监控与自动重启的管…

CBTC 2023氢能展倒计时6天,最新同期会议活动Plus版发布

随着时间的推移,CBTC2023深圳氢能技术展览会即将拉开序幕。这场盛会将于11月30日在深圳福田会展中心盛大开幕,以“以储赋能,智造未来”为主题,旨在搭建一个商务交流、供需合作、创新产品发布的平台,让氢能全产业链之间…

要想固态跑得稳,散热器也要够扎实,ORICO J-10 固态散热组合体验

我们在日常工作中,经常需要读写各种体积庞大的文件和数据,如果硬盘速度跟不上的话,工作效率就会大大降低。最近我发现M.2固态硬盘的价格已经大幅降低了,越来越多的国产品牌开始加入其中。所以我最近入手了一款ORICO J-10固态硬盘&…

HHDESK客户端连接导入导出

HHDESK客户端连接可以一键导出xlsx表格进行备份,也可一键导入设置连接。 1 导出 点击“资源”——“导出” 在弹出框中选择“保存”即可。 2 导入 右键“资源”——“导入” 点击“浏览”,选择相应的xlsx文档; 点击“确认”。 选择“…