深度学习水论文怎么缝模块?搭积木永不过时!(附80个即插即用模型)

news2024/11/16 3:50:02

深度学习如何创新?如何水模型?总结来说就八个字:排列组合,会讲故事。说直白点,就是缝模块。

先看看别人怎么做,然后根据自己的实际情况将这些模块来一波随机组合,这样效率会高很多。我这边已经整理好了80个常用有效的模块,包括多尺度、注意力机制、卷积...代码都是可复现的。

需要80个即插即用模块的同学看文末

那么深度学习到底该如何创新?我们具体可以从这三个方面入手:

1.创造新的模块

这个方向适合大神以及有功能强大的算力的玩家,大多数人都是hold不住的,如果你是想要快速搞定论文,那我是不推荐的。

2.创造新的缝合网络的方法

这点也是我最推荐各位去做的,既然创造新的模块非人人可行,那在缝合网络的基础上做改进总会了吧。

这里给大家列举一下缝合网络的几种常见方式:

串行

串行缝合将多个神经网络模块按顺序连接起来,形成一个统一的网络结构。它提供了一种相对简单直接的方法来整合多个网络模块,有助于提升模型的性能,同时保持了一定的灵活性。这种方法特别适合于那些希望快速原型开发或需要在资源受限的情况下运行高效模型的场景。

并行(推荐)

并行缝合是一种将不同的网络模块同时运行,然后合并它们的输出的方法,主要思想是利用多个网络模块的计算能力,通过同时处理数据来提高效率和性能。这种方法特别适合于需要处理大量数据或实时性要求较高的应用场景。

代表性论文

标题:Inception Transformer

方法:本文介绍了一种新颖的Transformer骨干网络——iFormer。iFormer采用通道分离机制,将卷积/最大池化和自注意力简单高效地结合起来,使得Transformer在频谱中更加关注高频信息,并扩展了其感知能力。基于灵活的Inception token mixer,作者进一步设计了频率斜坡结构,实现了在所有层之间高频和低频成分的有效权衡。

创新点:

  • Inception Token Mixer:通过引入Inception Token Mixer,将卷积和最大池化的优势与Transformer相结合,从而增强了ViTs在频谱中的感知能力。通过将输入特征沿通道维度进行分割,并分别将分割的组件馈送到高频混合器和低频混合器,实现了高频和低频信息的并行建模。

  • 频率斜坡结构:为了有效权衡不同层之间的高频和低频成分,引入了频率斜坡结构。该结构通过逐渐减小馈送到高频混合器的维度并增加馈送到低频混合器的维度,使底层更多地捕捉高频细节,而顶层更多地建模低频全局信息。这种结构能够在不同层之间有效地平衡高频和低频成分。

交互

交互缝合是一种将不同的网络模块以交互的方式进行组合的方法,它通常涉及模型架构的创新和模块的整合,其核心在于不同网络模块之间的相互作用和信息交换。这种方法适合于需要综合利用多种信息源或模型的场景,例如在自然语言处理、图像识别等领域中的应用。

多尺度融合(推荐)

多尺度融合网络的优势在于能够同时捕捉到图像的细节信息和全局上下文信息,这对于许多视觉任务来说是非常重要的。例如,在物体检测任务中,小尺度特征有助于定位物体的精确位置,而大尺度特征有助于理解物体的语义信息。

代表性论文

标题:Centralized Feature Pyramid for Object Detection

方法:论文介绍了目标检测中的一个新方法,称为CFP。该方法基于全局显式的中心特征调节,通过引入轻量级的多层感知机(MLP)来捕捉全局的长程依赖关系,并使用可学习的视觉中心来捕捉输入图像的局部角落区域。CFP通过在自底向上的方式中使用来自最深层内部特征的显式视觉中心信息来调节所有前端浅层特征,从而能够捕捉全局的长程依赖关系,并有效地获得全面而具有区分性的特征表示。

创新点:

  • 作者提出了一种基于全局显式中心化特征调节的CFP目标检测方法,该方法能够捕捉全局长距离依赖关系,并有效地获取全面而有区分性的特征表示。

  • 作者提出了一种空间显式的视觉中心方案,利用轻量级MLP捕捉全局长距离依赖关系,并使用可并行学习的视觉中心来捕捉输入图像的局部角区域。

  • 作者提出了一种自顶向下的特征金字塔的GCR方法,利用从最深层内部特征获得的显式视觉中心信息来调节所有前端浅层特征。

3.相同模块用于不同的场景

举个例子,目前基于Mamba的魔改已经从NLP领域应用到了CV领域,具有代表性的研究成果就是U-Mamba。

论文:U-Mamba: Enhancing Long-range Dependency for Biomedical Image Segmentation

方法:介绍了一种新的架构U-Mamba,用于通用生物医学图像分割,它结合了CNN的局部模式识别和Mamba的全局上下文理解的优势。U-Mamba可以自动配置自身以适应不同的数据集,使其成为生物医学成像中多样化分割任务的多功能和灵活工具。U-Mamba的性能提升主要归因于其架构设计,可以同时提取多尺度的局部特征和捕捉长程依赖关系。

创新点:

  • U-Mamba是一种新的通用网络架构,用于生物医学图像的分割任务。

  • U-Mamba采用了创新的混合CNN-SSM架构,能够捕捉图像中的局部细粒度特征和长程依赖关系。

  • U-Mamba相比于基于Transformer的架构,在特征大小方面具有线性扩展的能力,而不是传统Transformer架构中的二次复杂度。

  • U-Mamba具有自配置能力,可以适应不同的数据集,提高了在生物医学图像分割任务中的可扩展性和灵活性。

有任何问题或有更好的新方法都欢迎大家评论区讨论!

关注下方《学姐带你玩AI》🚀🚀🚀

回复“模块80”获取80个即插即用模块

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1430547.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

冰冻天气恰逢春运,“观冰精灵”化身电力供应守护者

据中国路网,截至2月1日14时,受降雪及路面结冰影响,河北、山西、内蒙古、黑龙江、江苏、安徽、河南、山东、西藏、陕西、宁夏、甘肃、新疆共封闭路段66个(涉及44条高速公路、5条普通国道、5条普通省道),关闭…

Pandas.Series.clip() 修剪数值范围 详解 含代码 含测试数据集 随Pandas版本持续更新

关于Pandas版本: 本文基于 pandas2.2.0 编写。 关于本文内容更新: 随着pandas的stable版本更迭,本文持续更新,不断完善补充。 传送门: Pandas API参考目录 传送门: Pandas 版本更新及新特性 传送门&…

前端JavaScript篇之map和Object的区别、map和weakMap的区别

目录 map和Object的区别map和weakMap的区别 map和Object的区别 Object是JavaScript的内置对象,用于存储键值对。Object的键必须是字符串或符号,值可以是任意类型。Map是ES6引入的新数据结构,用于存储键值对。Map的键可以是任意类型&#xff…

高中数学两面角习题练习1

用到的定理 2 第1问证明: 第2问用到的知识和例子: 二面角锐角钝角判断的快速技巧 https://www.bilibili.com/video/BV13P41157K1/?spm_id_from333.788.recommend_more_video.0&vd_source91b03ee59c462b7b3cfbd57346cf1001 叉乘的几何意义及应用 …

day39 不同路径 不同路径Ⅱ

题目1:62 不同路径 题目链接:62 不同路径 题意 机器人位于m*n网格的左上角每次只能向下或向右移动一步,到达网格的右下角,返回不同路径的数量 动态规划 动规五部曲 1)dp数组及下标i的含义 dp[i][j]:到达(i,j)有…

2024年 复习 HTML5+CSS3+移动web 笔记 之CSS遍 第5天

第 五 天 整个网站例 5.1 准备工作 项目目录与版心 base.css 5.2 网页制作思路 5.3 header 区域-整体布局 5.4 header区域-logo 5.5 header区域-导航 index.html <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8">&l…

代码随想录算法训练营29期Day41|LeetCode 343,96

文档讲解&#xff1a;整数拆分 不同的二叉搜索树 343.整数拆分 题目链接&#xff1a;https://leetcode.cn/problems/integer-break/description/ 思路&#xff1a; 题目要求我们拆分n&#xff0c;拆成k个数使其乘积和最大&#xff0c;然而题目中并没有给出k&#xff0c;所以…

[python]基于opencv实现的车道线检测

【检测原理】 一、首先进行canny边缘检测&#xff0c;为获取车道线边缘做准备 二、进行ROI提取获取确切的车道线边缘&#xff08;红色线内部&#xff09; 三、利用概率霍夫变换获取直线&#xff0c;并将斜率正数和复数的线段给分割开来 四、离群值过滤&#xff0c;剔除斜率…

uniapp 高德地图显示

1. uniapp 高德地图显示 使用前需到**高德开放平台&#xff08;https://lbs.amap.com/&#xff09;**创建应用并申请Key   登录 高德开放平台&#xff0c;进入“控制台”&#xff0c;如果没有注册账号请先根据页面提示注册账号   打开 “应用管理” -> “我的应用”页面…

Springboot集成Camunda并完成一条流程实例

&#x1f496;专栏简介 ✔️本专栏将从Camunda(卡蒙达) 7中的关键概念到实现中国式工作流相关功能。 ✔️文章中只包含演示核心代码及测试数据&#xff0c;完整代码可查看作者的开源项目snail-camunda ✔️请给snail-camunda 点颗星吧&#x1f618; &#x1f496;设计流程定…

028 方法的重载

方法重载的定义 使用案例 public static void main(String[] args) {// 匹配到max(int a, int b)System.out.println(max(1, 3));// 匹配到max(double a, double b)System.out.println(max(1L, 3L));// 匹配到max(double a, double b, double c, double d)&#xff0c;int自动…

SQL 函数(十二)

SQL 函数&#xff08;十二&#xff09; 一、函数分类 1.1 单行函数 单行函数仅对单个行进行运算&#xff0c;并且每行返回一个结果。 常见的函数类型&#xff1a; 字符、数字、日期、转换 1.2 多行函数 多行函数能够操纵成组的行&#xff0c;每个行组给出一个结果&#x…

【拜年神器】AI写真保姆级教程

1. 介绍 废话不说&#xff0c;先上图看效果 功能简介 上传几张自己的照片&#xff0c;训练之后&#xff0c;就能生成各种风格的AI写真照&#xff0c;主要有无限风格写真、固定模板写真、AI虚拟试衣、人物说话视频四个类别 无限风格写真 固定模板写真 证件照 工作照 婚纱…

k8s中cert-manager管理https证书

前言 目前https是刚需,但证书又很贵,虽然阿里云有免费的,但没有泛域名证书,每有一个子域名就要申请一个证书,有效期1年,1年一到全都的更换,太麻烦了。经过搜索,发现了自动更新证书神器cert-manager;当然cert-manager是基于k8s的。 安装采用Helm方式 Chart地址: ht…

萝卜视频源码前后端带视频演示

萝卜影视源码前端是用JAVA开发的全原生APP源码&#xff0c;后端用的是二次开发的苹果CMS&#xff0c;支持局域网投屏&#xff0c;视频软解硬解&#xff0c;播放器自带弹幕功能。支持解析官方视频&#xff0c;支持M3U8&#xff0c;MP4。 开屏广告&#xff0c;全局广告&#xff0…

lava学习-接口

接口-Interface 1.什么是接口&#xff1f; 例&#xff1a;构造器&#xff0c;代码块在接口中统统没有&#xff0c;也不能创建对象 构造器的使用-----实现类 例&#xff1a;下图中的B类就是一个 实现类 2.接口的好处 继承只能单继承&#xff0c;而接口可以弥补类单继承的不足&am…

iPad“粘贴自”字样不消失解决办法

iPad“粘贴自”字样不消失解决办法 好无语&#xff0c;写论文主要就靠iPad看资料&#xff0c;复制粘帖的时候卡死搞得我无敌焦躁&#xff0c;问了&#x1f34e;支持的客服才解决&#xff0c;方法如下&#xff1a;1.音量上键按一下 2.音量下键按一下 3.一直按开关机键直到出现苹…

备战蓝桥杯---搜索(应用入门)

话不多说&#xff0c;直接看题&#xff1a; 显然&#xff0c;我们可以用BFS&#xff0c;其中&#xff0c;对于判重操作&#xff0c;我们可以把这矩阵化成字符串的形式再用map去存&#xff0c;用a数组去重现字符串&#xff08;相当于map映射的反向操作&#xff09;。移动空格先找…

Nicn的刷题日常之打印水仙花数

目录 1.题目描述 2.解题思路 3.解题 1.题目描述 求出0&#xff5e;100000之间的所有“水仙花数”并输出。 “水仙花数”是指一个n位数&#xff0c;其各位数字的n次方之和确好等于该数本身&#xff0c;如:153&#xff1d;1^3&#xff0b;5^3&#xff0b;3^3&#xff0c;则1…

使用C#读取PDF中所有文本内容

先安装如下包 using iTextSharp.text.pdf; using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Text;namespace ReadPdfText {class Program{static void Main(string[] args){string path "0017_审判流程管理信息表2…