多尺度神经网络新一代创新!精度与速度完美平衡,实现多领域应用落地

news2025/1/20 15:43:35

多尺度神经网络的设计通常基于对频率原则的理解,目的是为了解决高频成分学习慢的问题。这些网络通过特殊设计,比如给高频成分加更多的权重或者将高频成分平移到低频,来提高学习效率。

为了满足在不同层次上理解和处理数据的需求,多尺度神经网络包含了各种网络结构,常见的多尺度神经网络类型有:多尺度图神经网络、多尺度卷积神经网络、多尺度注意力神经网络、多尺度特征融合网络等。其关键优势在于它们能够整合来自不同尺度的信息,从而提高模型的性能和泛化能力。

为帮助各位理解并掌握,我整理了这些网络结构今年最新的技术成果以及应用实例。

论文以及开源代码需要的同学看文末

多尺度特征融合网络

scale-Adaptive Feature Aggregation for Efficient Space-Time Video Super-Resolution

方法:本文的研究背景是超高清视频超分辨率重建(STVSR)模型的复杂性问题。为了解决这个问题,研究者提出了一种高效的一阶STVSR模型,并介绍了一种创新的SAFE(Scale-Adaptive Flow Estimation)块来改进运动估计和模型效率。研究者通过对比实验证明了该方法在处理大运动和复杂纹理区域时的优势,并指出了一些可能影响感知的缺陷。

创新点:

  • 设计了模型中的动态推理路径来处理不同的场景,以解决多样的运动幅度和物体尺寸对光流估计的挑战。

  • 通过一个玩具实验澄清了尺度不一致问题,并证明了为每个视频剪辑选择自适应推理尺度的有效性。

  • 使用SAFE块进行中间光流估计,采用迭代的试错方式,通过双向网络将特征从两个方向投影到时刻t的特征上。

  • 引入了一种创新的SAFE块,以可训练的块级尺度选择方式迭代地估计运动。

Towards Efficient Use of Multi-Scale Features in Transformer-Based Object Detectors

方法:论文主要研究目标是提出一种名为Iterative Multi-scale Feature Aggregation (IMFA)的技术,用于在基于Transformer的目标检测器中高效使用多尺度特征。研究的动机来自两个关键观察:高分辨率特征的计算通常存在冗余,因为背景通常占据了图像空间的大部分,因此只有少部分高分辨率特征对目标检测有用;与ConvNet不同,Transformer的注意机制不需要网格状特征图,这使得只从可能包含感兴趣对象的特定区域聚合多尺度特征成为可能。

创新点:

  • 迭代多尺度特征聚合(IMFA):提出了一种简洁有效的技术,可以作为Transformer-based目标检测器中多尺度特征高效使用的通用范例。

  • 对基于Transformer的检测方法的重新审视:由于作者的方法是在最近提出的基于Transformer的目标检测器的基础上开发的,作者首先简要回顾了基于Transformer的目标检测器的检测流程,以DETR为例。

  • 从代表性关键点中采样自适应尺度特征:IMFA直接从由骨干网络生成的特征金字塔(在实验中是ResNet的C2-C5)中采样多尺度特征。然而,即使是稀疏采样的有希望的区域仍然包含大量高分辨率特征尺度的特征标记。

  • 多尺度特征的迭代聚合:为了利用采样的多尺度特征进行精细的目标检测,将采样特征和编码图像特征输入到后续的编码器层中,使用注意力机制进行聚合。

多尺度卷积/注意力神经网络

A Deep Convolutional Neural Network With Multiscale Feature Dynamic Fusion for InSAR Phase Filtering

方法:本文提出了一种基于深度卷积神经网络的干涉相位滤波方法,并证实其具有比目前广泛使用的相位滤波方法更好的滤波性能和更高的计算效率。首先使用钻石-方算法模拟干涉相位,并将其转化为复数域,以提供模型训练所需的数据集,并将实部和虚部作为网络的输入和输出,以避免将相位边缘判断为噪声。然后,在模型中嵌入SE-block,构建具有多尺度特征动态融合的卷积神经网络模型,使网络在预测干净干涉相位时能够同时考虑多尺度语义的深层和浅层特征,以增强噪声抑制和保证细节保留。最后,使用主观评价和客观评价来评估所提出方法的性能。

创新点:

  • 多尺度特征动态融合:与传统的前馈神经网络(FNN)不同,该方法采用了一种多尺度特征动态融合策略,考虑了干涉相位的深层和浅层特征,同时在相位滤波过程中兼顾了图像细节保留和噪声抑制。通过主动融合不同尺度或不同类型的特征,提高了网络的性能和效率。

  • 更好的滤波性能和泛化能力:通过主观和客观评估,使用模拟数据的实验结果证明了该方法在噪声抑制和细节保留方面优于常用方法,并且滤波性能对噪声水平的依赖性较小。使用真实数据的实验结果证实了该方法具有更好的泛化能力,能够满足实际应用的精度要求。

Multiscale Convolutional Neural Network Based on Channel Space Attention for Gearbox Compound Fault Diagnosis

方法:本文提出了一种基于通道-空间注意力的多尺度卷积神经网络(CSAM-MSCNN)用于齿轮箱复合故障诊断。该网络结构包括原始信号输入、基于通道-空间注意力的多尺度特征提取和故障诊断三个部分。通过通道-空间注意力机制,从多尺度结构中提取的大量故障特征信息被加权映射,以增强关键特征并削弱冗余特征,解决了多尺度特征融合引起的特征冗余问题,提高了故障诊断的效率。

创新点:

  • 基于通道-空间注意力的多尺度特征提取
    • 通过引入通道注意力模块(CSAM),实现了对多尺度特征的融合和提取。

    • CSAM优化了通道注意力模块的瓶颈结构,避免了副作用,并降低了模型复杂度。

    • 通过CSAM对融合特征进行加权,增强了关键故障信息,抑制了无用信息,解决了多尺度特征融合带来的特征冗余问题,提高了故障诊断的效率。

  • 复合故障的多标签分类
    • 提出了一种结合多标签分类和CSAM-MSCNN的复合故障诊断方法,能够将复合故障分解为多个单一故障。

    • 传统分类器只能输出一个标签,无法将复合故障分类为两个或更多的单一故障,而CSAM-MSCNN可以实现这一目标。

多尺度图神经网络

Predicting COVID‑19 positivity and hospitalization with multi‑scale graph neural networks

方法:论文采用了类似于之前研究的实验方案,通过训练模型来预测每个部门未来一段时间内的病例数和住院患者数。研究考虑了不同的时间分辨率,通过设置不同的预测天数来评估模型在短期、中期和长期预测中的有效性。研究使用了多个模型进行预测,并通过定量结果来评估它们的性能。

创新点:

  • 引入额外信息:作者提出的模型可以轻松扩展以适应额外的信息。例如,可以将封锁措施和天气条件等信息作为节点属性加入模型。COVID-19的传播在很大程度上取决于这些特征,因此我们期望这些特征能够提高模型的预测性能。

  • 引入疫苗数据集:作者指出,疫苗接种数据是研究COVID-19传播的另一个重要因素。疫苗接种可以阻止传播并预防严重住院。

  • 引入Facebook移动数据集:为了研究COVID-19等病毒的传播,我们需要追踪人口流动,这是最重要的因素之一。作者使用了Facebook提供的移动数据集,这些数据集可以提供关于人类流动模式变化的准实时信息,从而帮助改进干预措施。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“神经网络22”获取论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1447125.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++:我真的,服了

即我用C做的一个石头剪刀布的“小”程序 上代码&#xff01;&#xff01;&#xff01; ​ #include <bits/stdc.h>//万能头 #include <windows.h>//定义Sleep函数&#xff0c;Sleep(x)即把程序暂停x毫秒 #include <stdlib.h> /*定义system函数&#xff0c;…

chatglm3-6b使用

源码地址 GitHub - THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型 创建环境 conda create -n chatglm36 python3.11.7 修改源码中依赖&#xff0c;使得使用cuda&#xff0c;否则太慢了 pip3 install torch2.1.2 torchvision0.16.2 to…

AIGC盛行,带你轻松调用开发

文章目录 前言一、&#x1f4d6;AIGC简介二、&#x1f4e3;开通体验开通模型获取API-KEY 三、&#x1f4dd;基于java实现调用1.设置API-KEY2.体验大语言模型多轮对话演示补充流式输出 3.体验通义千问VL使用官方提供照片本地文件多轮对话流式输出 总结 前言 本篇文章基于java和…

MYSQL笔记:简单的SQL操作和select查询

MYSQL笔记&#xff1a;简单的SQL操作和select查询 文章目录 MYSQL笔记&#xff1a;简单的SQL操作和select查询结构化查询语句SQL库操作表操作CRUD操作单表查询select 查询例子 分页查询与limitlimit 只是对结果条数有限制还是会提高查询效率&#xff1f; order bygroup by多表连…

【数据结构】常见八大排序算法(附动图)

一、前言 关于排序&#xff0c;有一些术语&#xff0c;例如算法的稳定/不稳定&#xff0c;内部排序和外部排序等&#xff0c;需要我们了解一下 稳定&#xff1a;当未排序时a在b前面且ab&#xff0c;排序后a仍然在b前面 不稳定&#xff1a;当未排序时a在b前面且ab&#xff0c;排…

微信小程序的图片色彩分析,解决画布网络图片报错问题,窃取网络图片的主色调

1、安装 Mini App Color Thief 包 包括下载包&#xff0c;简单使用都有&#xff0c;之前写了&#xff0c;这里就不写了 网址&#xff1a;微信小程序的图片色彩分析&#xff0c;窃取主色调&#xff0c;调色板-CSDN博客 2、 问题和解决方案 问题&#xff1a;由于我们的窃取图片的…

【SpringBoot】Validator组件+自定义约束注解实现手机号码校验和密码格式限制

&#x1f3e1;浩泽学编程&#xff1a;个人主页 &#x1f525; 推荐专栏&#xff1a;《深入浅出SpringBoot》《java对AI的调用开发》 《RabbitMQ》《Spring》《SpringMVC》 &#x1f6f8;学无止境&#xff0c;不骄不躁&#xff0c;知行合一 文章目录 前言一、Cons…

Linux防火墙开放

记录一次问题 写的网络服务无法通信 代码没问题&#xff0c;IP绑定、端口绑定没问题&#xff0c;就是无法进行通信&#xff0c;这里要分2步走。 服务器控制台开放 进入防火墙 添加规则&#xff0c;这里以开放udp的8899端口为例 这里在服务器后台就已经开放了&#xff0c;但此时…

Redis相关介绍

概念 Redis&#xff1a;非关系型数据库&#xff08;non-relational)&#xff0c;Mysql是关系型数据库(RDBMS) Redis是当今非常流行的基于KV结构的作为Cache使用的NoSQL数据库 为什么使用NoSQL 关系型 数据库无法应对每秒上万次 的读写请求 表中的存储记录 数量有限 无法简单…

9.【CPP】List (迭代器的模拟实现||list迭代器失效||list的模拟实现)

介绍 list是可以在常数范围内在任意位置进行插入和删除的序列式容器&#xff0c;并且该容器可以前后双向迭代。list的底层是双向链表结构&#xff0c;双向链表中每个元素存储在互不相关的独立节点中&#xff0c;在节点中通过指针指向其前一个元素和后一个元素。list与forward_…

QGIS打开shp地图

地图shp文件如何打开查看 提示 open sans字体没有安装 字体天下-提供各类字体的免费下载和在线预览服务 这里搜索open sans下载 但是 还是不显示 省份名称。

数据结构——lesson2线性表和顺序表

目录 前言 一、顺序表是什么&#xff1f; 1. 静态顺序表&#xff1a;使用定长数组存储元素 2. 动态顺序表&#xff1a;使用动态开辟的数组存储。 二、接口实现 1.动态顺序表存储 2.基本增删查改接口 (1)初始化顺序表 (2)顺序表摧毁 (3)检查空间 (4)顺序表打印 (5)顺…

【JVM篇】什么是jvm

文章目录 &#x1f354;什么是Java虚拟机&#x1f6f8;Java虚拟机有什么用&#x1f339;Java虚拟机的功能&#x1f388;Java虚拟机的组成 &#x1f354;什么是Java虚拟机 JVM指的是Java虚拟机&#xff0c;本质上是一个运行在计算机上的程序&#xff0c;可以运行 Java字节码文件…

pytorch花式索引提取topk的张量

文章目录 pytorch花式索引提取topk的张量问题设定代码实现索引方法gather方法验证 补充知识expand方法gather方法randint pytorch花式索引提取topk的张量 问题设定 或者说&#xff0c;有一个(bs, dim, L)的大张量&#xff0c;索引的index形状为(bs, X)&#xff0c;想得到一个(…

位运算+leetcode ( 2 )

题一&#xff1a;只出现一次的数字&#xff08;1&#xff09; 1.链接 136. 只出现一次的数字 - 力扣&#xff08;LeetCode&#xff09; 2.思想 借用位运算中异或操作符的特点&#xff0c;a^a0&#xff0c;0^aa先定义一个sum0就用一个循环来遍历这个数组&#xff0c;每次都进行…

lv15 平台总线框架及案例 2

一、总线、设备、驱动 硬编码式的驱动开发带来的问题&#xff1a; 垃圾代码太多 结构不清晰 一些统一设备功能难以支持 开发效率低下 1.1 初期解决思路&#xff1a;设备和驱动分离 struct device来表示一个具体设备&#xff0c;主要提供具体设备相关的资源&#xff08;如…

小游戏和GUI编程(7) | SimpleNN 界面源码解析

小游戏和GUI编程(7) | SimpleNN 界面源码解析 0. 简介 SimpleNN 是 AdamYuan 在高中一年级时用 1 天时间写出来的简易 CNN, 使用 SFML 做 UI, 用于交互式输入手写数字&#xff0c;这个数字被训练好的 CNN 网络执行推理得到识别结果, 它的运行效果如下&#xff1a; 这一篇我们…

C语言——oj刷题——调整数组使奇数全部都位于偶数前面

题目&#xff1a; 输入一个整数数组&#xff0c;实现一个函数&#xff0c;来调整该数组中数字的顺序使得数组中所有的奇数位于数组的前半部分&#xff0c;所有偶数位于数组的后半部分。 一、实现方法&#xff1a; 当我们需要对一个整数数组进行调整&#xff0c;使得奇数位于数…

Solidworks:挑战新问题,不知道如何画出斜视图?

如果图形都是基于XYZ三个方向构造&#xff0c;没什么难度。如果有其他倾斜方向的&#xff0c;问题就难了。今天试了一下&#xff0c;看看我的3D模型。 出图纸的时候&#xff0c;不知道如何才能投影出斜视图&#xff0c;一边准确描述下面的那个小局部孔位。 补充&#xff1a;查了…

C++ Qt框架开发 | 基于Qt框架开发实时成绩显示排序系统(3) 保存表格数据

对上两篇篇的工作C Qt框架开发| 基于Qt框架开发实时成绩显示排序系统&#xff08;1&#xff09;-CSDN博客和C Qt框架开发 | 基于Qt框架开发实时成绩显示排序系统&#xff08;2&#xff09;折线图显示-CSDN博客继续优化&#xff0c;增加一个保存按钮&#xff0c;用于保存成绩数据…