卷积神经网络中 6 种经典卷积操作

卷积神经网络中 6 种经典卷积操作

news2026/2/15 0:38:23

深度学习的模型大致可以分为两类，一类是卷积神经网络，另外一类循环神经网络，在计算机视觉领域应用最多的就是卷积神经网络（CNN）。CNN在图像分类、对象检测、语义分割等经典的视觉任务中表现出色，因此也早就有一大批各种各样的经典卷积神经网络模型与一些鬼斧神工的卷积操作，今天小编就斗胆总结一波这些经典的卷积操作都有哪些？（不完全版本，欢迎补充….）

01 正常的卷积与参数

一个正常的图像卷积，其工作方式与原理如下图所示：

图-1 (二维图像卷积)

图-2 (三维图像卷积)

可以看出其基本的参数有：

卷积核大小（Convolution filter）

图-1中卷积核大小为ksize x ksize=3x3，步长(stride) 这里指每次移动的像素距离，步长为1，表示卷积核每次移动一个像素距离，依此类推。

填充（padding）

表示卷积核对边缘的处理方式，常见的填充方式有两种：same与valid，其中same表示根据卷积核大小填充ksize/2 。当卷积核为3x3时，填充1个像素；5x5时，填充两个像素，依此类推。Valid表示不填充。输入与输出通道数目从图二可以看出输入的6x6x3的图像数据，有三个通道输入，通过两个4x4x3的filter之后输出的是3x3x2的图像数据，有两个通道输出。

02 空洞卷积（Dilated Convolution）

看到这些卷积与参数，第一个变化就出现了，通过改变卷积核大小，担心不改变参数数目，实现了卷积核的多尺度，从而实现了对特征多尺度提取，它就是空洞卷积。图示如下：

在保持卷积核参数不变的情况下，扩大了感受野区域。空洞卷积在图像分类、对象检测、语义分割网络模型中均有应用。

03 转置卷积(transposed convolution)

转置卷积又被称为反卷积，此反卷积跟不同于图像处理中的反模糊卷积。2D转置卷积的计算基本原理如下图所示：

举例说明，卷积操作为：

转置卷积操作为：

最终图示如下：

04 1x1卷积

1x1卷积在输出指定通道数目特征图，升降卷积神经网络的通道数上面有特殊用途，在Inception系列网络中开始大量应用，在网络模型结构设计有重要作用，Faster-RCNN中RPN网络就是使用1x1实现指定通道输出的典范。1x1卷积图示如下：

1x1 Conv

1x1卷积的好处是可以升降维度通道数目，同时它还是一个channel-wise的卷积操作，可以降低卷积核的参数数目，减小模型规模。此外1x1卷积还有一个很高级隐藏应用技巧就是做全局深度池化操作，实现基于通道数的池化操作。

05 组合卷积

组合卷积最早见AlexNet模型的相关论文，集大成者是ShuffleNet网络，关于组合卷积跟正常卷积的区别，见下图：

组合卷积主要是基于filter分组，实现分组卷积，正常的卷积如下：

分组filter之后的分组卷积：

分组卷积的优势是可以更好的结构化学习，克服过拟合，减少参数、产生类似正则化效果，从而提升整个网络的精度与效率。

06 深度可分离卷积

深度可分离卷积结构是构建轻量化网络模型的利器之一，最早出现在相关的模型结构是以MobileNet为代表的轻量级网络模型，应用于图像分类、对象检测、语义分割当场景下。深度可分类卷积的图示如下：

深度可分离卷积可以大幅减少卷积神经网络的参数，因此它在模型层数不变而模型总参数量却可以大幅下降而精度只会稍微损失，因此是模型小型化设计与轻量化模型推理的很好骨干网络。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1181603.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【React-Native开发3D应用】React Native加载GLB格式3D模型并打包至Android手机端

【React-Native开发3D应用】React Native加载GLB格式3D模型并打包至Android手机端

【React-Native开发3D应用】React Native加载GLB格式3D模型并打包至Android手机端【加载3D模型】**React Native上如何加载glb格式的模型**第零步，选择相关模型第一步，导入相关模型加载库第二步，自定义GLB模型加载钩子第三步，借助…

阅读更多...

浅析淘宝为什么会严查套红包行为，如何从技术层面实现红包检测规避

浅析淘宝为什么会严查套红包行为，如何从技术层面实现红包检测规避

最近不少做淘系电商的商家，遇到了一个普遍的问题就是：订单存在买手套红包导致被平台稽查的情况。这种情况，东哥了解到不是发生在某一两个商家身上，而是一个普遍现象。下面东哥从为什么会稽查套红包的行为、稽查后会有什么后果、如…

阅读更多...

学习使用JS实现Echarts的图表保存为图片功能：saveAsImage和getDataURL

学习使用JS实现Echarts的图表保存为图片功能：saveAsImage和getDataURL

学习使用JS实现Echarts的图表保存为图片功能接口getDataURL实现思路需求分析实际项目开发过程中经常会有图表展示功能，同时为了满足用户需要，会附带着图表导出功能，主要形式就是保存为图片。在Echarts中本身就提供这种配置项，…

阅读更多...

期中考试后，如何DIY一个成绩发布系统？

期中考试后，如何DIY一个成绩发布系统？

期中考试结束后，对于老师们来说，一项重要的任务就是公布考试成绩。然而，传统的成绩公布方式不仅耗时，而且容易出错。为了提高效率，减少误差，我们可以通过各种代码和Excel来实现一个让学生自助查询成绩的系统…

阅读更多...

一物一码需求，标签制作功能轻松解决

一物一码需求，标签制作功能轻松解决

许多行业存在为人员、物品、设备等做一物一码标签的需求，可使用草料标签制作功能。直接选择标签样式，填入数据，即可批量生成标签，还可批量排版，更易落地。还可保存标签样式，后续多次复用样式，批…

阅读更多...

基于java web的计算机office课程平台设计与实现

基于java web的计算机office课程平台设计与实现

末尾获取源码开发语言：Java Java开发工具：JDK1.8 后端框架：SSM 前端：Vue 数据库：MySQL5.7和Navicat管理工具结合服务器：Tomcat8.5 开发软件：IDEA / Eclipse 是否Maven项目：是目录…

阅读更多...

linux入门---消费者生产者模型模拟实现

linux入门---消费者生产者模型模拟实现

目录标题消费者生产者模型的理解单生产单消费模拟实现blockqueue.cpp准备工作MainCp.cpp的准备工作构造函数和析构函数的模拟实现push函数的实现pop函数的实现poductor_func函数的实现consumer_func函数的实现程序的测试程序改进一程序的改进二程序的改进三多生产多消费模拟实…

阅读更多...

什么是CCS Concepts

什么是CCS Concepts

在撰写论文时，看到了CCS Concepts，注意这是对自己论文的分类，不能随便填写。在ACM的网页"http://dl.acm.org/ccs/ccs.cfm"中选择自己论文的分类： 然后点击左侧的“Assign This CCS Concept”，再选择相关性…

阅读更多...

【TDK 电容】介电质代码对应温度及变化率

【TDK 电容】介电质代码对应温度及变化率

JB 电解质是什么？没找到，只有TDK有，也只有这个温度的区别，并且已经停产在售。对比发现是mouser网站关于电容的描述错误。下图显示正确的，再然后是错误的。在TDK官网，这样的描述温度特性分类标准代码温…

阅读更多...

制作电子画册的有好帮手---FLBOOK

制作电子画册的有好帮手---FLBOOK

随着互联网的发展，越来越多的人开始使用电子书来阅读书籍。而将PDF文件转换成在线翻页电子书，则是一种非常方便的方式。今天，给大家推荐一个可以将PDF转在线翻页电子书的网站。这个网站就是FLBOOK在线制作电子杂志平台，只需要三步…

阅读更多...

C++——类和对象（初始化列表、匿名对象、static成员、类的隐式类型转换和explicit关键字、内部类）

C++——类和对象（初始化列表、匿名对象、static成员、类的隐式类型转换和explicit关键字、内部类）

初始化列表、匿名对象、static成员、类的隐式类型转换和explicit关键字、内部类本章思维导图： 注：本章思维导图对应的xmind文件和.png文件都已同步导入至资源文章目录初始化列表、匿名对象、static成员、类的隐式类型转换和explicit关键字、内部类1.…

阅读更多...

案例-注册页面(css)

案例-注册页面(css)

html页面用css控制样式，画一个注册页面。页面最终效果如下： 页面代码： <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>注册页面</title> <style>*{…

阅读更多...

文献阅读 - JADE：具有可选外部存档的自适应差分进化

文献阅读 - JADE：具有可选外部存档的自适应差分进化

文章目录标题摘要关键字结论研究背景I. INTRODUCTION 常用基础理论知识II. BASIC OPERATIONS OF DEIII. ADAPTIVE DE ALGORITHMSA. DESAPB. FADEC. SaDED. jDE 研究内容、成果IV. JADEA. DE/Current-to-pbestB. Parameter AdaptationC. Explanations of the Parameter Adaptat…

阅读更多...

WSGI与ASGI：两种Python Web服务器网关接口的比较

WSGI与ASGI：两种Python Web服务器网关接口的比较

在当今的Web开发领域，选择合适的服务器网关接口（Server Gateway Interface，简称SGI）对于提高Web应用程序的性能和并发性至关重要。在Python中，有两种常见的SGI：WSGI和ASGI。本文将深入探讨这两种SGI的异同点…

阅读更多...

中国人民大学与加拿大女王大学金融硕士——在职读研，让人生的火花迸发

中国人民大学与加拿大女王大学金融硕士——在职读研，让人生的火花迸发

每个人都像是一块未经雕琢的宝石，隐藏着无尽的光芒。然而，生活、工作中的困难、挫折和压力，就像尘土一样，掩盖了我们的闪亮之处。只有当我们冲破这些阻碍，才能让内在的光芒照亮世界。中国人民大学与加拿大女王大学金融…

阅读更多...

Q-Vision+CANpro Max总线解决方案

Q-Vision+CANpro Max总线解决方案

智能联网技术在国内的发展势头迅猛，随着汽车智能化、网联化发展大潮的到来，智能网联汽车逐步成为汽车发展的主要趋势。越来越多整车厂诉求，希望可以提供本土的测量软件，特别是关于ADAS测试。而风丘科技推出的Q-Vision软件不仅可支…

阅读更多...

一键批量剪辑：视频随机分割新玩法，高效剪辑不再难

一键批量剪辑：视频随机分割新玩法，高效剪辑不再难

随着视频内容的日益丰富，人们对于视频剪辑的需求也日益增长。而传统的视频剪辑方式往往需要耗费大量的时间和精力，让许多非专业人士望而却步。然而，现在有一款名为“云炫AI智剪”的软件，它为我们提供了一种全新的视频剪辑方式——…

阅读更多...

数据结构：AVL树的旋转（平衡搜索二叉树）

数据结构：AVL树的旋转（平衡搜索二叉树）

1、AVL树简介 AVL树是最先发明的自平衡二叉查找树。在AVL树中任何节点的两个子树的高度最大差别为1，所以它也被称为高度平衡树。增加和删除可能需要通过一次或多次树旋转来重新平衡这个树。AVL树得名于它的发明者G. M. Adelson-Velsky和E. M. Landis，他们…

阅读更多...

uniapp原生插件之安卓串口操作原生插件

uniapp原生插件之安卓串口操作原生插件

插件介绍安卓串口操作原生插件，支持设置串口，波特率，停止位，数据位，校验位，流控以及延迟，支持粘包处理解决分包问题，支持多串口操作，无需root 插件地址安卓串口操作…

阅读更多...

2023年【危险化学品经营单位安全管理人员】考试资料及危险化学品经营单位安全管理人员考试试卷

2023年【危险化学品经营单位安全管理人员】考试资料及危险化学品经营单位安全管理人员考试试卷

题库来源：安全生产模拟考试一点通公众号小程序 2023年危险化学品经营单位安全管理人员考试资料为正在备考危险化学品经营单位安全管理人员操作证的学员准备的理论考试专题，每个月更新的危险化学品经营单位安全管理人员考试试卷祝您顺利通过危险化学品经…

阅读更多...

推荐文章

最新文章