【计算机视觉】Image Feature Extractors方法介绍合集(二)

news2025/1/5 17:37:10

文章目录

    • 一、Mixed Depthwise Convolution
    • 二、Deformable Kernel
    • 三、Dynamic Convolution
    • 四、Submanifold Convolution
    • 五、CondConv
    • 六、Active Convolution
    • 七、Depthwise Dilated Separable Convolution
    • 八、Involution
    • 九、Dilated convolution with learnable spacings
    • 十、Attention-augmented Convolution
    • 十一、PP-OCR
    • 十二、Displaced Aggregation Units
    • 十三、Dimension-wise Convolution
    • 十四、Local Relation Layer
    • 十五、Lightweight Convolution
    • 十六、Hamburger
    • 十七、Span-Based Dynamic Convolution
    • 十八、ShapeConv

一、Mixed Depthwise Convolution

MixConv(或混合深度卷积)是一种深度卷积,它自然地在单个卷积中混合多个内核大小。 它基于深度卷积将单个内核大小应用于所有通道的见解,MixConv 通过结合多个内核大小的优点来克服这一问题。 它通过将通道划分为组并向每个组应用不同的内核大小来实现此目的。

在这里插入图片描述

二、Deformable Kernel

可变形核是一种用于变形建模的卷积算子。 DK 学习内核坐标上的自由形式偏移,将原始内核空间变形为特定的数据模态,而不是重新组合数据。 这可以直接调整有效感受野(ERF),同时保持感受野不变。 它们可以用作刚性内核的直接替代品。

在这里插入图片描述
在这里插入图片描述

三、Dynamic Convolution

DynamicConv 是一种用于顺序建模的卷积,它的内核随着时间的推移而变化,作为各个时间步长的学习函数。 它基于 LightConv 构建并采用相同的形式,但使用时间步相关的内核:

在这里插入图片描述
在这里插入图片描述

四、Submanifold Convolution

在这里插入图片描述

五、CondConv

CondConv(或条件参数化卷积)是一种卷积类型,它为每个示例学习专门的卷积核。

为了有效地增加 CondConv 层的容量,开发人员可以增加专家的数量。 这比增加卷积核本身的大小更具计算效率,因为卷积核应用于输入内的许多不同位置,而每个输入仅组合专家一次。

在这里插入图片描述

六、Active Convolution

主动卷积是一种没有固定感受野形状的卷积,可以采用更多样化的感受野形式进行卷积。 它的形状可以通过训练期间的反向传播来学习。 可以看作是卷积的推广; 它不仅可以定义所有常规卷积,还可以定义具有分数像素坐标的卷积。 我们可以自由改变卷积的形状,这为形成 CNN 结构提供了更大的自由度。 其次,卷积的形状是在训练时学习的,不需要手动调整

在这里插入图片描述

七、Depthwise Dilated Separable Convolution

深度扩张可分离卷积是一种将深度可分离性与扩张卷积的使用相结合的卷积类型。

在这里插入图片描述

八、Involution

卷积是深度神经网络的原子操作,它颠倒了卷积的设计原理。 卷积核在空间范围上是不同的,但在通道之间是共享的。 如果对合核被参数化为固定大小的矩阵(如卷积核)并使用反向传播算法进行更新,则学习到的对合核将无法在具有可变分辨率的输入图像之间传输。

作者认为对合相对于卷积有两个好处:(i)对合可以在更广泛的空间排列中总结上下文,从而克服对远程交互建模的困难; (ii)对合可以自适应地分配不同位置的权重,从而优先考虑空间域中信息最丰富的视觉元素。

在这里插入图片描述

九、Dilated convolution with learnable spacings

具有可学习间距的扩张卷积(DCLS)是一种卷积类型,允许在训练期间学习内核非零元素之间的间距。 这使得在不增加参数数量的情况下增加卷积的感受野成为可能,从而可以提高网络在需要长程依赖的任务上的性能。

扩张卷积是一种允许内核跳过某些输入特征的卷积。 这是通过在内核的非零元素之间插入零来完成的。 这样做的效果是在不增加参数数量的情况下增加卷积的感受野。

DCLS 通过允许在训练期间学习内核的非零元素之间的间距,将这一想法向前推进了一步。 这意味着网络可以根据手头的任务学习跳过不同的输入特征。 这对于需要远程依赖的任务特别有用,例如图像分割和对象检测。

DCLS 已被证明对多种任务有效,包括图像分类、对象检测和语义分割。 这是一种有前途的新技术,有潜力提高卷积神经网络在各种任务上的性能。

在这里插入图片描述

十、Attention-augmented Convolution

注意力增强卷积是一种具有二维相对自注意力机制的卷积,可以取代卷积作为图像分类的独立计算原语。 与变形金刚一样,它采用了缩放点积注意力和多头注意力。

在这里插入图片描述
与卷积类似,注意力增强卷积 1) 与平移等变,2) 可以轻松地对不同空间维度的输入进行操作。

在这里插入图片描述

十一、PP-OCR

PP-OCR是一个OCR系统,由文本检测、检测框校正和文本识别三部分组成。 文本检测的目的是定位图像中的文本区域。 在 PP-OCR 中,可微分二值化 (DB) 用作基于简单分割网络的文本检测器。 它集成了特征提取和序列建模。 它采用连接主义时间分类(CTC)损失来避免预测和标签之间的不一致。

在这里插入图片描述

十二、Displaced Aggregation Units

置换聚合单元用可学习的单元位置取代了 ConvNet 中的经典卷积层。 这引入了层次组合的显式结构,并带来了几个好处:

通过空间可调的滤波器单元实现完全可调和可学习的感受野
减少空间覆盖参数,实现高效推理
将参数与感受野大小解耦

在这里插入图片描述

十三、Dimension-wise Convolution

在这里插入图片描述
在这里插入图片描述

十四、Local Relation Layer

局部关系层是一种图像特征提取器,是卷积算子的替代品。 直觉上,卷积中的聚合基本上是一种应用固定滤波器的模式匹配过程,这在对具有不同空间分布的视觉元素进行建模时效率很低。 局部关系层根据局部像素对的组成关系自适应地确定聚合权重。 有人认为,通过这种关系方法,它可以以更有效的方式将视觉元素组合成更高级别的实体,从而有利于语义推理。

在这里插入图片描述

十五、Lightweight Convolution

LightConv 是一种用于顺序建模的深度卷积,它共享某些输出通道,并且使用 softmax 在时间维度上对权重进行归一化。 与自注意力相比,LightConv 具有固定的上下文窗口,它通过一组不随时间步长变化的权重来确定上下文元素的重要性。 LightConv 计算以下内容序列和输出通道中的第一个元素:

在这里插入图片描述
在这里插入图片描述

十六、Hamburger

Hamburger 是一个全局上下文模块,它采用矩阵分解将学习到的表示分解为子矩阵,从而恢复干净的低秩信号子空间。 关键思想是,如果我们将像全局上下文这样的归纳偏差表述为目标函数,则最小化目标函数的优化算法可以构造一个计算图,即我们在网络中需要的架构。

在这里插入图片描述

十七、Span-Based Dynamic Convolution

基于跨度的动态卷积是 ConvBERT 架构中使用的一种卷积类型,用于捕获标记之间的局部依赖关系。 内核是通过获取当前 token 的本地范围来生成的,这更好地利用了本地依赖并区分同一 token 的不同含义(例如,如果输入句子中“a”位于“can”前面,则“can”显然是 名词而非动词)。

具体来说,使用经典卷积,我们将为所有输入标记共享固定参数。 因此,动态卷积是更可取的,因为它在捕获不同标记的局部依赖性方面具有更高的灵活性。 动态卷积使用内核生成器为不同的输入标记生成不同的内核。 然而,这种动态卷积无法区分不同上下文中的相同标记并生成相同的内核(例如,图(b)中的三个“can”)。

因此,基于跨度的动态卷积被开发出来,通过接收输入跨度而不是仅接收单个标记来产生更具适应性的卷积核,这使得能够区分不同上下文中相同标记的生成核。 例如,如图(c)所示,基于跨度的动态卷积为不同的“can”标记生成不同的内核。

在这里插入图片描述

十八、ShapeConv

ShapeConv,即形状感知卷积层,是用于处理室内 RGB-D 语义分割中的深度特征的卷积层。 首先将深度特征分解为形状分量和基本分量,接下来引入两个可学习的权重来独立地与它们配合,最后对这两个分量的重新加权组合应用卷积。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1015300.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Elastic Stack 8.10:更简单的跨集群搜索和身份验证等等

作者:Tyler Perkins, Gilad Gal, Shani Sagiv, George Kobar, Michael Peterson, Aris Papadopoulos Elastic Stack 8.10 增强了跨集群和向量搜索、数据摄取、Kibana 和云注册。 配置远程搜索时获得更大的灵活性,并提供更多信息来分类问题,…

小白备战大厂算法笔试(八)——搜索

搜索 二分查找 二分查找是一种基于分治策略的高效搜索算法。它利用数据的有序性,每轮减少一半搜索范围,直至找到目标元素或搜索区间为空为止。 Question: 给定一个长度为n的数组 nums ,元素按从小到大的顺序排列,数组…

git基本手册

Git and GitHub for Beginners Tutorial - YouTube Kevin Stratvert git config --global user.name “xxx” git config --global user.email xxxxx.com 设置默认分支 git config --global init.default branch main git config -h查看帮助 详细帮助 git help config 清除 cl…

计网第五章(运输层)(二)(端口号、复用和分用)

一、端口号 (1)基本概念 在上部分(计网第五章(运输层)(一)_永无魇足的博客-CSDN博客)提到运输层用不同的端口对应不同的应用进程。 端口就是用来区分不同应用进程的标识符。 每个…

HarmonyOS/OpenHarmony应用开发-DevEco Studio新建项目的整体说明

一、文件-新建-新建项目 二、传统应用形态与IDE自带的模板可供选用与免安装的元服与IDE中自带模板的选择 三、以元服务,远程模拟器为例说明IDE整体结构 1区是工程目录结构,是最基本的配置与开发路径等的认知。 2区是代码开发与修改区,是开发…

分支分支分支分支

分支 查看分支 git branch -v 创建分支 git branch 分支名 切换分支 git checkout 分支名 合并分支 git merge 分支名 把指定的分支合并到当前分支上

【CMU15-445 Part-11】Join Algorithms

Part11-Join Algorithms Why Do We Need to Join? Join其实是关系数据库和范式化表时候所产生的副产物。 也就是说我们范式化表是为了减少冗余信息,而我们使用join就是为了去重建reconstruct 这些原本的tuple Join Algorithms 主要关注两表的inner equijoin a…

UE5学习笔记(1)——从源码开始编译安装UE5

目录 0. 前期准备1. Git bash here2. 克隆官方源码。3. 选择安装分支4. 运行Setup.bat,下载依赖文件5. 运行GenerateProjectFiles.bat生成工程文件6. 生成完成,找到UE5.sln/UE4.sln7. 大功告成 0. 前期准备 0.1 在windows的话,建议装一个Git…

基于SpringBoot的驾校管理系统

基于SpringBootVue的驾校管理系统、前后端分离 开发语言:Java数据库:MySQL技术:SpringBoot、Vue、Mybaits Plus、ELementUI工具:IDEA/Ecilpse、Navicat、Maven 【主要功能】 角色:管理员、用户、教练 管理员&#x…

Python 可迭代对象、迭代器、生成器

可迭代对象 定义 在Python的任意对象中,只要它定义了可以返回一个迭代器的 __iter__ 魔法方法,或者定义了可以支持下标索引的 __getitem__ 方法,那么它就是一个可迭代对象,通俗的说就是可以通过 for 循环遍历了。Python 原生的列…

(手撕)数据结构--->堆

文章内容 目录 一:堆的相关概念与结构 二:堆的代码实现与重要接口代码讲解 让我们一起来学习:一种特殊的数据结构吧!!!! 一:堆的相关概念与结构 在前面我们已经简单的学习过了二叉树的链式存储结…

城市管网污水监测方案,科技助力污水排放管理!

根据《国务院办公厅关于加强入河入海排污口监督管理工作的实施意见》各地要明确“水污染,谁治理”和政府兜底的原则,明确排污主体责任。根据排污口类型集中整治,划分主体。加大私设暗管借道排污的监察力度溯源主体责任。加强科技研发&#xf…

【数据结构】C++实现AVL平衡树

文章目录 1.AVL树的概念2.AVL树的实现AVL树结点的定义AVL树的插入AVL树的旋转左单旋右单旋左右双旋右左双旋插入代码 AVL树的验证AVL树的查找AVL树的修改AVL树的删除AVL树的性能 AVL树的代码测试 1.AVL树的概念 二叉搜索树虽然可以提高我们查找数据的效率,但如果插…

计网第四章(网络层)(八)(最短路径优先协议OSPF)

在第七节(计网第四章(网络层)(七)_永无魇足的博客-CSDN博客)我们总结了路由信息协议RIP。在最后我们提到了RIP协议有坏消息传的慢的问题,这是距离向量算法的本质决定的,所以这种问题…

c语言练习59:深入理解char类型的取值范围

深入理解char类型的取值范围 例如&#xff1a; #include <stdio.h> int main() {char a[1000];int i;for(i0; i<1000; i){a[i] -1-i;}printf("%d",strlen(a));return 0; }结果为255 ab以%d的形式打印结果为&#xff1a;300 而c由于unsigned char的取值范…

【CMU15-445 Part-9】Multi-Threaded Index Concurrency Control

Part09-Multi-Threaded Index Concurrency Control 多线程下索引的并发控制 Concurrency Control 强制所有访问数据结构的线程都使用某种协议或者某种方式。并发控制协议的概念&#xff1a;并发控制协议是一种当并发操作作用在一个共享对象上时DBMS用来确保correct的method。…

【杂记】git管理工具的相关应用

这里记录一些用git管理工具进行开发的命令&#xff0c;便于自己查看&#xff0c;我认为下面两篇博客写的很详细&#xff0c;但是为了自己方便查看&#xff0c;所以自己写了一些命令供自己进一步理解。gitee相对git来说更方便一些&#xff08;毕竟国内的不用担心墙&#xff09;&…

JavaEE 网络原理——TCP的工作机制(初篇 包含 UDP 协议的再次阐述)

文章目录 一、再次简述 UDP 协议二、再次简述 TCP 协议三、描述部分 TCP 内部的工作机制1. 确认应答2. 超时重传 前提&#xff1a; 在前面的文章中&#xff0c;我向大家分别简单介绍了 TCP 协议和 UDP 包装一个数据形成数据报发送信息。 除此之外&#xff0c;还通过代码编写了 …

QT中摄像头的使用

QT中摄像头相关类 摄像头的使用 QT中摄像头的使用主要分为三个方面&#xff0c;显示画面、抓取图片和视频录制。这三个方面对应着摄像模块的三种模式。模式如下&#xff1a; ConstantValueDescriptionQCamera::CaptureViewfinder0相机仅配置为显示取景器。QCamera::CaptureSt…

React入门

一、react开始 1、react是什么 用于构建用户界面的JavaScript库 操作DOM呈现页面 &#xff08;发送请求获取数据和处理数据不由react处理&#xff09;fessbook开发 2、为什么要学 原生js操作DOM繁琐、效率低 使用原生js直接操作DOM&#xff0c;浏览器会进行大量重绘重排 原…