【论文速看】DL最新进展20240925-医学图像分割、目标跟踪、图像超分

news2024/11/15 16:44:22

目录

    • 【医学图像分割】
    • 【目标跟踪】
    • 【图像超分】

【医学图像分割】

[2024] UU-Mamba: Uncertainty-aware U-Mamba for Cardiovascular Segmentation

论文链接:https://arxiv.org/pdf/2409.14305

代码链接:https://github.com/tiffany9056/UU-Mamba

在深度学习模型在心血管结构分割方面取得成功的基础上,越来越多的关注集中在提高泛化能力和鲁棒性上,特别是在小型标注数据集方面。尽管最近取得了进展,但当前方法常常面临过拟合和准确性限制等挑战,这主要是由于它们依赖于大型数据集和狭隘的优化技术。本文引入了UU-Mamba模型,作为U-Mamba架构的扩展,旨在解决心脏和血管分割中的这些挑战。通过结合锐度感知最小化(SAM),该模型通过针对损失景观中较平坦的极小值来增强泛化能力。此外,作者提出了一种不确定性感知损失函数,结合了基于区域、基于分布和基于像素的组件,通过捕捉局部和全局特征来提高分割准确性。虽然UU-Mamba模型已经展示了出色的性能,但需要进一步测试以全面评估其泛化能力和鲁棒性。文中通过在ImageCAS(冠状动脉)和Aorta(主动脉分支和区域)数据集上进行实验来进行评估,这些数据集比作者之前工作中使用的ACDC数据集(左心室和右心室)呈现出更复杂的分割挑战,展示了模型的适应性和韧性。实验说明,UU-Mamba在TransUNet、Swin-Unet、nnUNet和nnFormer等领先模型上的卓越性能。此外,通过广泛的实验提供了对模型鲁棒性和分割准确性的更全面评估。

在这里插入图片描述


【目标跟踪】

[202401] TrackNetV3: Enhancing ShuttleCock Tracking with Augmentations and Trajectory Rectification

论文链接:https://dl.acm.org/doi/10.1145/3595916.3626370

代码链接:https://github.com/qaz812345/TrackNetV3

文中提出了TrackNetV3,这是一个复杂的模型,旨在提高广播羽毛球视频中羽毛球定位的精度。TrackNetV3由两个核心模块组成:轨迹预测和校正。轨迹预测模块利用估计的背景作为辅助数据,在视觉干扰波动的情况下定位羽毛球。该模块还结合了mixup数据增强技术,以构建复杂场景来增强网络的鲁棒性。由于羽毛球有时会被遮挡,通过分析预测轨迹创建修复掩码,随后通过修复来校正路径。这一过程显著提高了跟踪的准确性和轨迹的完整性。实验结果表明,与之前的标准方法相比,性能大幅提升,将准确性从87.72%提高到97.51%。这些结果验证了TrackNetV3在羽毛球比赛背景下推进羽毛球跟踪的有效性。


[202409] TrackNetV4: Enhancing Fast Sports Object Tracking with Motion Attention Maps

论文链接:https://arxiv.org/pdf/2409.14543

代码链接:[无]

准确检测和跟踪高速、小型物体(如体育视频中的球)具有挑战性,这是由于运动模糊和遮挡等因素。尽管最近的深度学习框架如TrackNetV1、V2和V3在网球和羽毛球的跟踪方面取得了进展,但在部分遮挡或低可见性场景中它们常常遇到困难。这主要是因为这些模型严重依赖视觉特征,而没有明确结合对精确跟踪和轨迹预测至关重要的运动信息。本文通过融合高级视觉特征与可学习的动态注意力图,引入了对TrackNet家族的增强,有效强调了移动球的位置并提高了跟踪性能。所提方法利用帧差分图,通过一个动态提示层进行调制,以突出随时间变化的关键运动区域。在网球和羽毛球数据集上的实验结果表明,所提方法增强了TrackNetV2和V3的跟踪性能。将这一轻量级、即插即用的解决方案称为TrackNetV4,它构建在现有的TrackNet之上。


【图像超分】

[WACV2024] BSRAW: Improving Blind RAW Image Super-Resolution

论文链接:https://arxiv.org/pdf/2312.15487

代码链接:https://github.com/mv-lab/AISP

在智能手机和紧凑型相机中,图像信号处理器(ISP)将原始传感器图像转换为人类可读的sRGB图像。大多数流行的超分辨率方法从sRGB图像出发,进一步提高其质量。然而,由于非线性ISP转换,建模sRGB域中的退化是复杂的。尽管存在这一已知问题,但只有少数方法直接处理RAW图像并解决现实世界中的传感器退化问题。作者解决RAW域中的盲图像超分辨率问题。文中设计了一个专门针对使用原始传感器数据训练模型的现实退化pipeline。所提方法考虑了传感器噪声、散焦、曝光和其他常见问题。使用该pipeline训练的BSRAW模型可以放大真实场景的RAW图像并提高其质量。作为这项工作的一部分,还介绍了一个新的DSLM数据集和基准。

在这里插入图片描述


[ECCV2024] BurstM: Deep Burst Multi-scale SR using Fourier Space with Optical Flow

论文链接:https://arxiv.org/abs/2409.15384

代码链接:https://github.com/Egkang-Luis/burstm

多帧超分辨率(MFSR)比单帧超分辨率(SISR)表现更好,因为MFSR利用了多个帧中的丰富信息。最近的MFSR方法采用可变形卷积网络(DCN)来对齐帧。然而,现有的MFSR由于DCN的局限性,如小感受野和预定义的核数量,存在参考帧与源帧之间的错位问题。因此,现有的MFSR方法难以表示高频信息。为此,作者提出了一种基于傅里叶空间和光流的深度Burst多尺度SR(BurstM)。所提方法通过估计光流偏移来实现精确对齐,并预测每帧的连续傅里叶系数以表示高频纹理。此外,还通过支持各种超分辨率(SR)比例因子的unimodel增强了网络的灵活性。实验展示了所提方法在性能和灵活性上均优于现有的MFSR方法。

在这里插入图片描述


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2165638.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【NLP】循环神经网络--RNN学习.day3

一.初步认识RNN 循环神经网络(Recurrent Neural Network, RNN)是一种用于处理序列数据的深度学习模型。与传统的静态神经网络相比,RNN 可以有效处理输入数据的时间序列特性。这使得 RNN 在处理自然语言处理(NLP)、时间…

【Python报错已解决】TypeError: forward() got an unexpected keyword argument ‘labels‘

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 专栏介绍 在软件开发和日常使用中,BUG是不可避免的。本专栏致力于为广大开发者和技术爱好者提供一个关于BUG解决的经…

使用API有效率地管理Dynadot域名,注册域名服务器(NS)信息

前言 Dynadot是通过ICANN认证的域名注册商,自2002年成立以来,服务于全球108个国家和地区的客户,为数以万计的客户提供简洁,优惠,安全的域名注册以及管理服务。 Dynadot平台操作教程索引(包括域名邮箱&…

【9.模块化开发和代码重用之——头文件、动静态库】

目录 前言软件工程的基本原则程序的模块化开发和代码重用技术开发自己的头文件定义实现自己的头文件编写实现文件(源文件)编译代码链接目标文件到可执行文件 实现类似标准库效果的几种方法实际使用的开发方法头文件库 尝试自动链接静态库(好像…

替换jar包中class文件

虽然.jar文件是一种Java归档文件,可以使用压缩软件打开,但是并不能通过压缩软件来修改其内容,只能通过jar命令来更新文件。 一、背景 在使用血氧仪SDK时出现了问题,经过分析是在申请权限时版本不兼容导致的闪退异常,…

大数据新视界 --大数据大厂之 Kylin 多维分析引擎实战:构建数据立方体

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

全国信息学奥赛泄题事件:一场对公平与公正的严峻考验

在科技与教育日益融合的今天,信息学奥林匹克竞赛作为选拔计算机科学领域未来人才的重要平台,始终承载着培养青少年逻辑思维、编程能力和创新潜力的重任。然而,2024年9月发生的一起全国CSP-J/S认证考试泄题事件,却如同一枚重磅炸弹…

SpringBoot教程(三十) | SpringBoot集成Shiro权限框架

SpringBoot教程(三十) | SpringBoot集成Shiro权限框架 一、 什么是Shiro二、Shiro 组件核心组件其他组件 三、流程说明shiro的运行流程 四、SpringBoot 集成 Shiro (shiro-spring-boot-web-starter方式)1. 添加 Shiro 相关 maven2…

领导让部署一个系统服务,我该怎么弄?

文章目录 Dockerdocker基础通过Dockerfile构建镜像打包镜像,离线使用docker修改代理内容 Nginxubuntu安装nginxnginx基本操作 问题Sqlalchemy可以反射一些表,另外一些反射为None查看服务器的架构和版本,查看本机外网IPPG数据库创建角色创建库…

CentOS7 离线部署docker和docker-compose环境

一、Docker 离线安装 1. 下载docker tar.gz包 下载地址: Index of linux/static/stable/x86_64/ 本文选择版本:23.0.6 2.创建docker.service文件 vi docker.service文件内容如下: [Unit] DescriptionDocker Application Container Engi…

SpringBoot中XXL-JOB实现灵活控制的分片处理方案

❃博主首页 &#xff1a; 「码到三十五」 &#xff0c;同名公众号 :「码到三十五」&#xff0c;wx号 : 「liwu0213」 ☠博主专栏 &#xff1a; <mysql高手> <elasticsearch高手> <源码解读> <java核心> <面试攻关> ♝博主的话 &#xff1a…

9.25盒马鲜生一面

1.自我介绍 2.css两种盒子模型 ​3.rem和em 4.px概念 5.transition和animation的区别 6.移动端适配方案 7.vh、vw、% 8.js基本数据类型 9.call、apply、bind的区别 10.js实现继承的方法 11.get和post的区别 12.web安全&#xff08;XSS&#xff0c;CSRF&#xff09; …

甩锅笔记:好好的服务端应用突然起不来,经定位是无法访问外网了?测试又说没改网络配置,该如何定位?

在工作中、团队协作时&#xff0c;可能遇到的问题&#xff0c;如集成测试等场景。但是作为偏前端的全栈&#xff0c;锅从天上来&#xff0c;不是你想甩就能甩&#xff0c;尤其面对测试等比较强势的团体&#xff08;bug创造者&#xff09;&#xff0c;你必须有强大的心理承受能力…

Vscode Run Code Py中文乱码问题

F1打开命令行界面&#xff0c;找到settings.json文件&#xff1b;选Workspace这个 找/直接输"code-runner.executorMap" python值改为"$pythonPath $fullFileName"

进程和线程的区别;线程的多种创建方式;Thread 类及常见方法;线程的状态

文章目录 进程和线程的区别线程的创建方式继承Thread&#xff0c;重写run&#xff08;创建单独的类/匿名内部类&#xff09;实现Runnable&#xff0c;重写run&#xff08;创建单独的类/匿名内部类&#xff09;实现Callable&#xff0c;重写call&#xff08;创建单独的类/匿名内…

828华为云征文 | 云服务器Flexus X实例,Docker集成搭建 Jupyter Notebook

828华为云征文 | 云服务器Flexus X实例&#xff0c;Docker集成搭建 Jupyter Notebook Docker 部署 Jupyter Notebook 是一个方便且快速的方式&#xff0c;可以帮助你搭建一个用于数据分析、机器学习和科学计算的环境 华为云端口放行 服务器放行对应端口9955 Docker安装并配置镜…

计算物理精解【1】-C++计算(1)

文章目录 基础hello,worldgetlinestd::cin引用与指针函数数据类型基本数据类型更多类型sizeof 正则表达式单次匹配多次匹配组匹配字符串的匹配 splitmap基础实战整型变量符号表简单分析生成整型变量表 正则表达式基础regex_matchregex_replaceswap Eigen概述简单例子Matrix基础…

DNS协议解析

DNS协议解析 什么是DNS协议 IP地址&#xff1a;一长串唯一标识网络上的计算机的数字 域名&#xff1a;一串由点分割的字符串名字 网址包含了域名 DNS&#xff1a;域名解析协议 IP>域名 --反向解析 域名>IP --正向解析 域名 由ICANN管理&#xff0c;有级别&#xf…

2.1 HuggingFists系统架构(二)

部署架构 上图为HuggingFists的部署架构。从架构图可知&#xff0c;HuggingFists主要分为服务器(Server)、计算节点(Node)以及数据库(Storage)三部分。这三部分可以分别部署在不同的机器上&#xff0c;以满足系统的性能需求。为部署方便&#xff0c;HuggingFists社区版将这三部…

Python | Leetcode Python题解之第419题棋盘上的战舰

题目&#xff1a; 题解&#xff1a; class Solution:def countBattleships(self, board: List[List[str]]) -> int:return sum(ch X and not (i > 0 and board[i - 1][j] X or j > 0 and board[i][j - 1] X)for i, row in enumerate(board) for j, ch in enumerat…