当CNN遇上Mamba,高性能与高效率通通拿下!

news2024/9/22 19:28:44

传统视觉模型在处理大规模或高分辨率图像时存在一定限制,为解决这个问题,研究者们就最近依旧火热的Mamba,提出了Mamba结合CNN的策略。

这种结合可以让Mamba在处理长序列数据时既能够捕捉到序列中的时间依赖关系,又能够利用CNN的局部特征提取能力来加速处理过程,实现计算效率与模型性能的双赢,因此被广泛应用于各大领域。

比如在医学图像分割领域的应用中,Weak-Mamba-UNet等网络架构通过结合两者优势,有效地解决了医学图像中复杂的结构和模式识别问题,准确率高达99.63%。

另外还有HC-Mamba、InsectMamba等,都是最新提出的效果nice的结合成果。为帮助大家快速了解并掌握前沿,我挑选并整理了2024新发表的9篇Mamba+CNN高质量工作,可参考的创新点都提炼好了,开源代码已附。

论文原文+开源代码需要的同学看文末

HC-MAMBA: VISION MAMBA WITH HYBRID CONVOLUTIONAL TECHNIQUES FOR MEDICAL IMAGE SEGMENTATION

方法:论文提出了新型医学图像分割模型HC-Mamba。HC-Mamba基于Mamba结合了多种为医学图像优化的卷积技术,包括扩张卷积和深度可分离卷积。这些技术的结合使得HC-Mamba能够在保持高性能的同时,以更低的计算成本处理大规模医学图像数据。

HC-Mamba模型在医学图像分割任务中表现出色,实验结果显示其具有高准确率(94.84%)、mIoU(80.72%)和DSC(89.26%)的有效性,证明了其在医学图像分割领域的有效性和实用性。

创新点:

  • 提出了一种用于医学图像分割的混合卷积 Mamba 模型(HC Mamba),它结合了多种针对医学图像优化的卷积方法,以提高模型的感受野并减少模型的参数。

  • 引入了 HC-Mamba 模型中的扩张卷积技术,让模型能够在不增加计算成本的情况下捕捉更广泛的上下文信息,通过扩展卷积核的感知域来增强模型对不同尺度图像结构的感知能力。

InsectMamba: Insect Pest Classification with State Space Model

方法:论文介绍了一个名为InsectMamba的新型方法,它结合了SSMs、CNNs、多头自注意力机制以及MLPs。InsectMamba通过在Mix-SSM块中整合这些不同的视觉编码策略,来提取更全面的视觉特征,用于昆虫害虫分类任务。论文还提出了一个选择性模块,用于自适应地聚合不同编码策略中的特征,增强模型识别害虫特征的能力。

创新点:

  • 首次尝试将基于SSM的模型应用于昆虫害虫分类,提出了InsectMamba模型。

  • 提出了一种选择性聚合模块,可以自适应地组合来自不同编码策略的视觉特征,从而使模型能够选择用于分类的相关特征。

  • 实验结果显示,InsectMamba在准确率、精确度、召回率和F1分数等评价指标上均优于现有模型,特别是在农业害虫数据集上达到了91%的准确率。

Weak-Mamba-UNet: Visual Mamba Makes CNN and ViT Work Better for Scribble-based Medical Image Segmentation

方法:论文介绍了一个名为Weak-Mamba-UNet的新型弱监督学习框架,它结合了CNN、ViT以及最新的视觉Mamba架构,用于基于涂鸦(scribble-based)注释的医学图像分割。其在公开可用的MRI心脏分割数据集上表现出色,Dice系数达到0.9171,准确率达到0.9963。

创新点:

  • Weak-Mamba-UNet是一种创新的弱监督学习框架,通过结合CNN、ViT和VMamba的特征学习能力,显著降低了注释所需的成本和资源。

  • 该框架采用多视角交叉监督学习方法,增强了不同网络架构的适应性,使它们能够相互受益。

Large Window-based Mamba UNet for Medical Image Segmentation: Beyond Convolution and Self-attention

方法:论文介绍了一个名为LMa-UNet的新型网络结构,用于2D和3D医学图像分割。LMa-UNet利用了Mamba进行长距离依赖建模,并且结合了大窗口的优势,以实现局部空间建模和全局建模的高效性。论文中还设计了一种新颖的分层和双向Mamba块(LM块),以进一步增强Mamba在全局和邻域空间建模能力。

创新点:

  • 提出了一种用于2D/3D医学图像分割的大内核Mamba UNet模型(LKM-UNet)。

  • 通过给SSM层分配大内核,实现了大感受野的空间建模能力。

  • 设计了一种双向和分层的Mamba模块,增强了SSM的局部和全局特征建模能力。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“曼巴CNN”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1911002.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

android自定义键盘弹窗

样式布局 要在Android中自定义键盘弹窗&#xff0c;先要创建一个新的XML布局文件&#xff0c;用于定义键盘弹窗的外观和布局。例如&#xff0c;创建一个名为key_alert_dialog.xml的文件&#xff0c;并在其中添加所需的按钮和其他UI元素。 <?xml version"1.0" e…

7月9日学习打卡-回文链表,交叉链表

大家好呀&#xff0c;本博客目的在于记录暑假学习打卡&#xff0c;后续会整理成一个专栏&#xff0c;主要打算在暑假学习完数据结构&#xff0c;因此会发一些相关的数据结构实现的博客和一些刷的题&#xff0c;个人学习使用&#xff0c;也希望大家多多支持&#xff0c;有不足之…

海外多语言盲盒APP系统开发

随着盲盒的全球化发展&#xff0c;盲盒已经成为了一个热门行业&#xff0c;不仅深受我国消费者的青睐&#xff0c;更是深受海外消费者的喜爱。目前&#xff0c;盲盒出海已经成为了企业拓展市场的新机会。 在数字化时代&#xff0c;海外盲盒APP为企业提供了一个快速打开海外盲盒…

57、基于概率神经网络(PNN)的分类(matlab)

1、基于概率神经网络(PNN)的分类简介 PNN&#xff08;Probabilistic Neural Network&#xff0c;概率神经网络&#xff09;是一种基于概率论的神经网络模型&#xff0c;主要用于解决分类问题。PNN最早由马科夫斯基和马西金在1993年提出&#xff0c;是一种非常有效的分类算法。…

MyBatis框架学习笔记(一):MyBatis入门

1 MyBatis 介绍 1.1 官方文档 MyBatis 中文手册&#xff1a; &#xff08;1&#xff09;https://mybatis.org/mybatis-3/zh/index.html &#xff08;2&#xff09;https://mybatis.net.cn/ Maven 仓库&#xff1a; https://mvnrepository.com/ 仓库作用&#xff1a;需要…

android Dialog全屏沉浸式状态栏实现

在Android中&#xff0c;创建沉浸式状态栏通常意味着让状态栏背景与应用的主题颜色一致&#xff0c;并且让对话框在状态栏下面显示&#xff0c;而不是浮动。为了实现这一点&#xff0c;你可以使用以下代码片段&#xff1a; 1、实际效果图&#xff1a; 2、代码实现&#xff1a;…

第一次坐火车/高铁,如何坐?全流程讲解

第一次坐动车注意事项 第一次乘动车流程&#xff1a;进站→安检→候车厅→找检票口→过闸机→站台候车→找车厢→上车找座→下车→出站 乘车流程 一、进火车站/高铁站&#xff1a;刷购票证件原件进站 1、自助闸机刷证&#xff1a;身份证 2、人工通道&#xff1a;护照、临时…

Oracle通过procedure调用webservice接口

文章目录 准备工作方法体如下Oracle语句详情重要参数说明Web Service的URL地址构造SOAP请求包体构造SOAP请求包体方法依次如下操作即可&#xff1a; 如果需要把上面的功能变成function或者procedure&#xff0c;请自行搜索相关的方法实现即可。 准备工作 定义测试的webservice…

怎么将图片旋转30度?旋转图片的几种方法推荐

怎么将图片旋转30度&#xff1f;在创作过程中&#xff0c;我们常常需要处理图片的镜像效果&#xff0c;确保其视觉效果和构图都达到最佳状态。镜像效果的合理运用不仅可以解决视觉单调的问题&#xff0c;还能在艺术作品中吸引观者的注意力。此外&#xff0c;镜像可以有效地调整…

MoRA: High-Rank Updating for Parameter-Efficient Fine-Tuning

文章汇总 LoRA的问题 与FFT相比&#xff0c;低秩更新难以记忆新知识。虽然不断提高LoRA的秩可以缓解这一问题&#xff0c;但差距仍然存在。 动机 尽可能地利用相同的可训练参数来获得更高的 Δ W \Delta W ΔW秩。 考虑到预训练权值 W 0 ∈ R d k W_0\in R^{d\times k} W0​…

Mac电脑上有什么好玩的肉鸽游戏推荐 苹果电脑怎么玩以撒的结合

Mac电脑尽管在游戏兼容性上可能不及Windows。但是&#xff0c;对于喜欢在Mac上游玩的玩家来说&#xff0c;依然有不少优秀的游戏可以选择&#xff0c;尤其是那些富有挑战性和策略性的肉鸽游戏。此外&#xff0c;对于经典游戏《以撒的结合》&#xff0c;Mac平台也提供了良好的游…

原创作品—数据可视化大屏

设计数据可视化大屏时&#xff0c;用户体验方面需注重以下几点&#xff1a;首先&#xff0c;确保大屏信息层次分明&#xff0c;主要数据突出显示&#xff0c;次要信息适当弱化&#xff0c;帮助用户快速捕捉关键信息。其次&#xff0c;设计应直观易懂&#xff0c;避免复杂难懂的…

论文 | Chain-of-Thought Prompting Elicits Reasoningin Large Language Models 思维链

这篇论文研究了如何通过生成一系列中间推理步骤&#xff08;即思维链&#xff09;来显著提高大型语言模型进行复杂推理的能力。论文展示了一种简单的方法&#xff0c;称为思维链提示&#xff0c;通过在提示中提供几个思维链示例来自然地激发这种推理能力。 主要发现&#xff1…

飞睿智能会议室静止雷达人体检测传感器,实时监测使用状态,有人、无人智能感应节能减

在这个科技日新月异的时代&#xff0c;每一个细微的创新都可能成为推动行业创新的关键力量。今天&#xff0c;让我们聚焦于一项看似不起眼却实则潜力无限的技术——飞睿智能静止雷达人体检测传感器&#xff0c;以及它在会议室这一商务交流核心区域中的巧妙应用。想象一下&#…

嵌入式c语言——指针加修饰符

指针变量可以用修饰符来修饰

图吧工具箱:DIY爱好者必备工具合集

名人说&#xff1a;莫道谗言如浪深&#xff0c;莫言迁客似沙沉。 ——刘禹锡《浪淘沙》 创作者&#xff1a;Code_流苏(CSDN)&#xff08;一个喜欢古诗词和编程的Coder&#x1f60a;&#xff09; 目录 一、概述二、主要功能1、硬件检测2、测试与故障诊断 三、使用方法四、总结 很…

我是如何渗透电信网络的

TLDR&#xff1b;作为一个电信公司的红队&#xff0c;从该公司的网络监控系统&#xff08;NMS&#xff09;获得一个立足点。通过基于HTTP协议的SSH隧道解决了Shell反连问题。通过HTTP获得SSH连接时&#xff0c;使用了Ninja。搭建代理以进行内部网络扫描。使用SS7应用程序访问CD…

斯坦福大学博士在GitHub发布的漫画机器学习小抄,竟斩获129k标星

斯坦福大学数据科学博士Chris Albon在GitHub上发布了一份超火的机器学习漫画小抄&#xff0c;发布仅仅一天就斩获GitHub榜首标星暴涨120k&#xff0c;小编有幸获得了一份并把它翻译成中文版本&#xff0c;今天给大家分享出来&#xff01; 轻松的画风配上让人更容易理解的文字讲…

瑞萨RH850 RTC计时进位异常

RH850 MCU的RTC&#xff08;实时时钟&#xff09;采用BCD&#xff08;二进制编码的十进制&#xff09;编码格式&#xff0c;支持闰年自动识别&#xff0c;并具有秒、分、时、日、周、月、年的进位功能。其中&#xff0c;秒和分为60进位&#xff0c;时为12或24进位&#xff0c;周…

救生拉网的使用方法及注意事项_鼎跃安全

水域救援在夏季尤为重要&#xff0c;随着气温的升高&#xff0c;人们更倾向于参与水上活动&#xff0c;如游泳、划船、垂钓等&#xff0c;这些活动虽然带来了乐趣和清凉&#xff0c;但同时也增加了水域安全事故的风险。救生拉网作为水域安全的重要工具之一&#xff0c;其重要性…