各种卷积的说明

各种卷积的说明

news2025/7/15 19:32:40

一、普通卷积

1、多通道输入，单通道输出

输入为三通道的6*6*3，过滤器也是三通道的分别对应RGB三个通道。其中：

过滤器的通道数需要和被卷积目标的通道数保持一致。
输出通道数=卷积核个数

计算过程包含了先卷积再融合的过程。3个通道各种卷积得到一个值，然后3个通道的值相加得到最终的值。具体来说：首先会拿这个3*3*3的卷积核放到最左上角的位置，这个3*3*3的卷积核有27个数字，分别与原始图像对应的27个数字做内积，这样就得到了第一个数字，然后再根据相应的步长向右、向下移动。

2、多通道输入，多通道输出

随着神经网络层数的加深，我们常会增加输出通道的维数，通过减少空间分辨率以获得更大的通道深度。直观地说，我们可以将每个通道看作是对不同特征的反应。

6*6*3的图像和两个3*3*3的过滤器卷积，得到4*4*2的输出。

所以，假设c0表示输入通道数，c1表示输出通道数，则有n*n*c0和一个c1*f*f*c0的卷积核进行处理，得到m*m*c1的输出。

以上参考：https://www.cnblogs.com/ml-JoJo/p/16630037.html

3、总结

单通道输出是多通道输出的一种特殊情况。

CNN中完整的卷积是对于两个4维张量进行操作。其中输入X大小为N*C*H*W，分别代表了batch_size， input_channel, input_height, input_width。而卷积核大小为D*C*K*K，分别代表输出通道数，输入通道数，卷积核尺寸。在每个输出通道上如第（1）中所示，由C*K*K的单个卷积核与C*H*W输入通道分别进行卷积，再累加在一起形成该输出通道上的二维的输出。

使用代码可以表示为：out = torch.einsum( 'nchwkj,dckj->ndhw', x, weight)

上文参考：https://zhuanlan.zhihu.com/p/349683405

二、深度卷积（Depthwise Convolution）

所谓深度卷积，在进行卷积的时候，只是各个输入通道对应相乘，而不在输入通道上进行累加求和。它满足：

卷积核channel=1
输入特征矩阵channel=卷积核个数=输出特征矩阵channel
卷积核权重shape为C*1*K*K

使用代码可以表示为：out = torch.einsum('nchwkj,ckj->nchw', x, weight)

三、分组卷积（Group Convolution）

分组卷积就是在进行卷积运算时，输入通道不是全部参与计算，而是分割开来成为几组，每组内部进行正常卷积。

四、参数量计算

（1）普通卷积

输入L，输出K，滤波器大小N*M，则权重总数为：(N*M*L+1)*K

解释：输入有L=32个特征图，K=64个特征图作为输出，滤波器大小为N=3、M=3，它是一个3*3*32的过滤器。因为我们的输入有32个维度，我们学习64个不同的3*3*32过滤器，因此总权重的总数为N*M*L*K。然后每个特征图也有一个偏置项，所以我们的参数总数为(N*M*L+1)*K

（2）全连接

输入N，输出M，权重总数为：(N+1)*M

解释：对于N个输入和M个输出，权重数为N*M。此外，对每个输出节点都有一个偏差，因此有(N+1)*M个参数。

（3）深度可分离卷积

输入L，输出K，滤波器大小为N*M，则权重总数为:(N*M*1+1)*L+(1*1*L+1)*K

假设卷积核大小为3*3，输入通道为16，输出通道为32。

普通卷积：(3*3*16+1)*32=4640个

深度可分离卷积：先用16个3*3的卷积核（3*3*1）作用于16个通道的输入图像，得到了16个特征图。在做融合操作之前，接着用16个大小为1*1的卷积核（1*1*16）遍历上述得到32个特征图。则参数量为：(3*3*1+1)*16 + (1*1*16+1)*32=706个。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/141733.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

图像处理：二值掩膜影像去噪与边缘强化

图像处理：二值掩膜影像去噪与边缘强化

前言这篇博客主要解决的一个问题是掩膜图像的噪声去除和边缘强化，如下图1所示。可以看到掩膜图像上有很多的斑点噪声，而且掩膜的轮廓也不够清晰。所以我们的目标就是一方面尽可能把这些斑点噪声去除，另一方面尽量突出掩膜边界。另外处理后的掩…

阅读更多...

c#入门-多播委托，匿名函数

c#入门-多播委托，匿名函数

多播委托委托作为变量，也可以和-。委托可以和方法组相加，但方法组和方法组不能相加。储存多个函数时，调用委托会按照加的顺序依次执行。但返回值只使用最后绑定的函数。使用 – 时，如果储存了这个值，那么会移除第一…

阅读更多...

深圳电子行业的mes系统的需求分析方法~先达智控

深圳电子行业的mes系统的需求分析方法~先达智控

深圳电子行业mes系统的需求分析方法导读：如今，制造业的行业竞争越来越激烈，减少产品成本、提高产品质量，缩短开发周期，已成为当前企业生产与发展中的一个重点方向。而对电子行业而言，厂家着重考虑并解决了产…

阅读更多...

我们想要赚钱，就要理解赚钱的本质、要素、公式和障碍

我们想要赚钱，就要理解赚钱的本质、要素、公式和障碍

想要赚钱，就要先理解赚钱，只有理解了赚钱，才能够赚到钱。赚钱的本质是商业，而商业的本质是交易，那交易的本质又是什么呢？就是价值交换。价值交换，就是我们怎么能与别人达成合作，并且…

阅读更多...

朱江明赋予了零跑新的活力

朱江明赋予了零跑新的活力

作为今年风云的智能自主化新能源汽车品牌，零跑汽，一度是人们谈论的热点话题。零跑汽车在今年也取得了非常不错的销量，这么一个响当当的品牌在之前其实发展几度遭遇挫折，而正是创始人朱江明几次将零跑汽车起死回生，赋予…

阅读更多...

使用基于python的neurora进行表征相似性分析（RSA）

使用基于python的neurora进行表征相似性分析（RSA）

发现了一款用于表征分析的Python API，还是挺方便的，这里简单介绍一下进行表征相似性分析的使用方法。官方文档见https://neurora.github.io/documentation/index.html下载pip install neurora表征相似性分析的知识可见：https://zhuanlan.zhih…

阅读更多...

QSqlDatabase::drivers()输出为空的解决办法

QSqlDatabase::drivers()输出为空的解决办法

解决问题：今天项目中需要用到QT连接MYSQL数据库进行数据库访问，使用数据库驱动加载代码： qDebug()<<"数据库驱动："<<QSqlDatabase::drivers();打印出来的结果居然为空“()”。尝试解决方案： …

阅读更多...

逻辑漏洞渗透与攻防（三）之登录前端验证漏洞

逻辑漏洞渗透与攻防（三）之登录前端验证漏洞

目录前言登录前端验证漏洞忘记密码给邮箱/手机发验证码前端验证绕过设置新密码时改他人密码编辑某网站密码找回功能链接的形式-链接token参数可逆服务端验证逻辑缺陷登录状态下修改密码等验证条件参数带用户名等多阶段验证重置密码重置后的默认密…

阅读更多...

软件产品科技成果鉴定需要提供哪些材料?软件测试费用怎么算?

软件产品科技成果鉴定需要提供哪些材料?软件测试费用怎么算?

一、软件产品科技成果鉴定是什么? 软件产品科技成果鉴定是有效评价科技成果质量和水平的方法之一，也是鼓励科技成果通过市场竞争等方式得到有效的评价和认可，可以推动科技成果的进步和转化。软件产品科技成果鉴定测试报告是申报国家、省、市科技成果奖…

阅读更多...

SQLite Database Introduction

SQLite Database Introduction

Use SQLite installed on Linux (CentOS7) to introduce.(You can also use python to install SQLite3 for learning.)•SQLite Preface•Introduction to SQLite Features•SQLite Data Type•SQLite Constraint•SQLite Syntax•SQLite Join•SQLite Database & Table•…

阅读更多...

第01讲：ElasticSearch安装

第01讲：ElasticSearch安装

一、什么是ElasticSearch 二、ElasticSearch的安装 Elasticsearch 分为 Linux 和 Windows 版本，基于我们主要学习的是 Elasticsearch 的 Java 客户端的使用，所以课程中使用的是安装较为简便的 Windows 版本。 2.1、Windows系统下安装ElasticSearch W…

阅读更多...

KubeSphere 使用 OpenLDAP 进行统一认证完全指南

KubeSphere 使用 OpenLDAP 进行统一认证完全指南

作者：申红磊，青云QingCloud 容器解决方案架构师，开源项目爱好者，KubeSphere Member。背景在实际使用中，会有一些用户，在不同场景中经常碰到 OpenLDAP 对接问题： 能否对接 LDAP？对…

阅读更多...

go sync.Map源码分析

go sync.Map源码分析

概述 go 语言中的map并不是并发安全的,在Go 1.6之前,并发读写map会导致读取到脏数据,在1.6之后则程序直接panic. 因此之前的解决方案一般都是通过引入RWMutex(读写锁)进行处理, 关于go为什么不支持map的原子操作,概况来说,对map原子操作一定程度上降低了只有并发读,或不存在并…

阅读更多...

多线程看这一篇文章就够了

多线程看这一篇文章就够了

第一章多线程概述 1 2 31. 什么是程序? 2. 什么是进程? 3. 什么是线程?程序1是为完成特定任务、用某种语言编写的一组指令的集合(一段静态的代码)进程1是程序的一次执行过程，或是正在运行的一个程序线程1 2 3进程可进一步细化为线程，是一个程序内部的…

阅读更多...

软考网络工程师上午常考点

软考网络工程师上午常考点

软考网络工程师上午常考点： **计算机硬件基础：**根据考纲分析，本章主要考查三个模块：计算机体系结构、存储系统、I/O输入输出系统，其中每一模块又分若干知识点。“计算机硬件基础”相当于软考中的“公共基础课”&…

阅读更多...

12月更新 | Visual Studio Code Python

12月更新 | Visual Studio Code Python

我们很高兴地宣布，2022年12月发布的适用于 Visual Studio Code Python 和 Jupyter 扩展现已推出！此版本包括以下改进：Pylance 自动缩进预览：浏览器中运行与调试 Python社区提供新扩展：Ruff如果您有兴趣，可…

阅读更多...

C51单片机基础之串口编程实战

C51单片机基础之串口编程实战

目录一、串口编程寄存器分析 1、PCON : 电源控制寄存器 2、SCON：串行控制寄存器二、自己实现串口初始化编程三、发送一串字符串给到PC端编程四、PC发送指令控制LED编程五、串口中断实时控制LED编程 1、串口中断的中断号：interrupt4 2、串口…

阅读更多...

Apache Doris Join 实现与调优实践｜未来源码

Apache Doris Join 实现与调优实践｜未来源码

推荐语： SQL 的支持力度和粒度，已经作为今天所有大数据计算引擎的重要衡量标准之一，而 SQL 的所有操作，可以分为简单操作（如 where、limit等 filter 操作）和复杂操作（groupby、join 等聚合操作&…

阅读更多...

SpringCloud微服务项目实战 - 3.App端文章

SpringCloud微服务项目实战 - 3.App端文章

经历了新冠疫情始末，之后，多出门走走，看看山，看看海，吃好吃的系列文章目录项目搭建App登录及网关App文章文章目录系列文章目录一、文章列表1. 数据库⑴. 导入文章数据库⑵. 表结构分析①. ap_article 文章基本信息…

阅读更多...

MySQL慢SQL探究

MySQL慢SQL探究

文章目录前言1、慢SQL捕获慢查询追踪配置方式2、情况分析为什么查询会慢？2.1 SQL执行计划分析explain执行计划分析PROFILE分析OPTIMIZER_TRACE分析3、引擎参数配置分析I/O性能分析MySQL I/O参数其他原因分析网络抖动单表数据量过大总结前言我们在日常开发中&#…

阅读更多...

推荐文章

最新文章