深度学习基础—卷积运算

news2025/1/22 19:45:33

1.1.卷积运算法则


        在计算机视觉领域,卷积运算撑起了半边天,因此在学习计算机视觉前,首先来了解一下卷积运算是如何运算的。

        假设正在进行边缘检测,垂直边缘检测会把图片中接近垂直的边缘提取出来,即人的侧边、栏杆等。而水平边缘检测会把图片中接近水平的边缘提取出来,即横杆、自行车轮的上侧等。现在以垂直边缘检测为例,解释一下卷积运算是如何进行的?

        卷积运算用*符号表示,一张图片表示的矩阵*一个过滤器(或被称为核,在图像处理领域又被称为滤波器)=新的图片表示的矩阵。

        进行上图所示的卷积运算,得到是4*4的矩阵表示的图片,其中新矩阵的(0,0)元素是将过滤器放置6*6矩阵的左上角,如下所示:

        然后把矩阵所盖住的区域和过滤器各个位置对应的元素相乘,得到新的3*3矩阵,如下所示:

        最后把矩阵的各元素累加,得到(0,0)位置的元素:

        当计算(0,1)位置的元素时,把过滤器右移一个单位,然后再次进行上述的运算,即如下:

        直到本行计算结束,得到如下结果:

        当计算(1,0)位置的元素时,把(0,0)下标时过滤器所在的位置下移一个步长,依次按照上述计算方式计算各个位置的元素,最终得到:

        相信对于学习过图像处理的朋友们,这里并不陌生,而对于没有学过图像处理的同学,一定会好奇这样操作为什么就会检测出垂直边缘,下面再通过一个例子了解一下其中的原理:

        把正数定义为白色块,0定义为灰色块,负数定义为黑色块,则进行垂直边缘检测得到的4*4矩阵如上图,可以发现中间两列是白色条带,边缘两列是灰色条带。这是由于当图像中出现边缘时,边缘两侧的颜色通常差别较大,因此若过滤器完全覆盖边缘的一侧(这一侧颜色一般接近,因此矩阵的数值也接近),则计算后结果接近0,也就是定义的灰色。若过滤器覆盖在边缘上,则计算后结果要么是很大的正数,要么是很大的负数,也就是白色或黑色,这和非边缘的数值差别很大,所以就凸显了垂直边缘。如果想要垂直边缘检测后的图像边缘较细,就需要用到维度更小的过滤器,从而精细处理。

        上图需要检测的图片的边缘是由亮变暗,那么如果图片是由暗变亮,是否还能使用相同的垂直过滤器检测出来?

        如上图所示,检测结果将边缘变成了黑边,原来的30变成了-30,表明图片是由暗向亮过渡。如果不在意两者的区别,只是为了检测出区别,对卷积后的矩阵取绝对值即可。

        上述的例子都是垂直过滤器,很容易猜到,水平过滤器是中间一行为0,上下行为正负数的样子。如下所示:

        即水平过滤器检测到了水平边缘,右图左侧两列是正边(边界为整数),所以原图对应由亮变暗;右侧两列是负边(边界为负数),所以原图由暗变亮。细心的可以发现,在边界处出现了(30)->(10)和(-10)->(-30)的过滤带,这是由于过滤器太大而图片太小的原因,如果选择较大的图片和较小的过滤器,就不会出现过滤带了。

1.2.其他卷积核(过滤器)


(1)Sobel过滤器

        增加了中间一行元素的权重,使结果的鲁棒性更好。旋转90度变成对应的水平过滤器。

(2)Scharr过滤器

        Sobel过滤器的缺点是,当结构较小时,精确度不高,而Scharr算子具有更高的精度。旋转90度变成对应的水平过滤器。

(3)可学习的过滤器

        把过滤器的每个元素都作为参数,参与神经网络的学习,利用反向传播算法进行学习,从而学习到的过滤器可以检测任意角度的边缘,捕捉到任意数据特征。

1.3.Padding


        在了解Padding前,首先来看看没有进行Padding操作的卷积结果,6*6的图片经过3*3的过滤器,结果是4*4的新图片,那么经过多次卷积操作后,图片最终变为1*1,此时图片已经损失了大量的特征,因此神经网络的识别效果就很差。这其中的维度变化规律如下:假设原图片是n*n的大小,过滤器是f*f的大小,则卷积后的结果是(n-f+1)*(n-f+1)。

        第二个缺点是,对于图片边缘的像素点,过滤器只覆盖了一次,而对于图片中间的像素点,过滤器覆盖了多次,因此边缘的像素点蕴含的特征信息也损失了很多。

        那如果可以进行填充,比如在原图像周围填充一定的像素,那么过滤器就可以对原边界进行多次覆盖,从而减少边缘损失的信息。并且图片变大,卷积后结果不会变小太多,从而保证图片不会一直变小。

        假设p是填充的圈数,p=1时,如上图所示,6*6的图片变为8*8,再通过3*3的过滤器后,卷积后的图片变为(6+2*1-3+1)*(6+2*1-3+1)=6*6,即图片大小不变,没有被缩小。这里很容易总结出卷积维度变化公式:

        当然,p也可以为其他数,比如p=2,填充结果如下:

        填充的像素值通常是0,填充的像素个数有两种选择,一种是Valid卷积,一种是Same卷积。

(1)Valid卷积

        这种方式p=0,也就是不填充,n*n的图片经过f*f的卷积核结果为(n-f+1)*(n-f+1)。

(2)Same卷积

        这种方式从字面意思来看就是保持相同,实际也是这样的意思,通过填充一定的像素使原图片和卷积后的图片大小保持不变,类似上面p=1时,卷积后图片还是6*6。

        事实上,利用Padding操作的维度变化公式:(n+2p-f+1)*(n+2p-f+1),让变化前后的图片相等,即n=n+2p-f+1,可以解得:

        也就是,为了让卷积前后的图片相等,填充的像素p只和过滤器的大小有关,例如3*3的过滤器,只有p=1时,才能保证相等。

        也许有人已经发现,过滤器大小通常是奇数,比如3*3、5*5等。如果是偶数,就会出现两种情况:第一种,填充的p为小数,这样就会造成填充的一侧为多,一侧为少,出现不对称。第二种,过滤器没有中心,这样就会造成很多不便,比如难以定位过滤器的位置。

1.4.卷积步长


        前面关于卷积的讨论都是默认步长为1,即过滤器一次只移动一个单位,如果步长为2呢?如下图所示:

        此时(0,1)位置的元素应该对应如下:

        同样的,在列方向过滤器的移动也是步长为2,纠错:下图中结果(0,2)的下标实际是88:

        相信步长这点不难懂,这里不再赘述。总结一下,假设图片是n*n,过滤器是f*f,padding填充为p,步长为s,则卷积后的图片大小为:

        如果计算出来是整数,则无需做任何处理。如果不是整数,那就向下取整,此时就说明选择的步长可能会造成部分边缘无法被覆盖,即蓝色区域一部分在图像中,一部分超出图像,此时不再计算该位置即可。其实可以选择合理的步长、填充p和过滤器大小f避免向下取整,也可以直接取整,效果都差不多。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2082748.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

组合式API-reactive和ref函数,computed计算属性,watch函数

一.reactive&#xff08;&#xff09;接收一个对象类型的数据&#xff0c;返回一个响应式的对象&#xff1a; <script setup> import {reactive} from vue const state reactive({count:100 }) const setCount () > {state.count } </script> <template>…

MySql【数据查询语言DQL】

DQL[非常重要] DQL 主要指查询语句,有查询单表数据,也有查多表数据表,单表查询 基本查询 条件查询 模糊查询 排序查询 聚合查询 去重查询 分组查询 限制查询 1、 数据准备 将发的stu.sql导入到MySql中 2、 基本查询 select 字段1,字段2,... from 表名; 查询返回的是一张…

吉利银河L6 第二年保险 出险对保费的影响

出险情况 出险一次 自己责任 自己修车走车损,1000多元; 给对方修车走交强险,1000多元. 导致保费上涨1100左右. 车损,三者等项目都上涨 注意:如果出险流程没走完(不会导致第二年报价上涨),恰好可以买第二年保险(保险到期前一个月),如果你买了,这次出险没给你加钱,会在第二年给…

远程控制电脑的软件有哪些?精选4个小妙招分享!

远程控制电脑的软件多种多样&#xff0c;它们各自具有不同的特点和优势。 以下是精选的四种远程控制软件及其使用小妙招&#xff0c;供您参考&#xff1a; 1.安企神 软件特点&#xff1a; 远程控制&#xff1a; 实时桌面控制&#xff1a;能够实时查看和控制远程计算机的桌面…

[译] RAGFlow 使用说明

本文翻译整理自&#xff1a;https://ragflow.io/docs/dev/ 本文档更多是 RAGFlow 系统操作内容&#xff0c;虽然不难/深刻&#xff0c;但有些细节没有注意&#xff0c;在搭建和使用的时候就容易出各类问题。所以读完这个文档是有必要的。 文章目录 快速启动一、先决条件二、启…

插入排序:直接插入排序、希尔排序详细说明

插入排序 基本思想&#xff1a;直接插入排序是⼀种简单的插入排序法&#xff0c;其基本思想是&#xff1a;把待排序的记录按其关键码值的大小逐个插入到⼀个已经排好序的有序序列中&#xff0c;直到所有的记录插入完为止&#xff0c;得到⼀个新的有序序列。 在玩扑克牌整理手中…

【操作系统】实验:指示灯开关控制

目录 一、实验目的 二、实验内容 三、实验步骤 四、记录与处理 五、思考 六、成果文件提取链接 一、实验目的 学习51单片机通用I/O口的基本输入/输出功能&#xff0c;掌握汇编程序编程与仿真设计方法。 二、实验内容 &#xff08;1&#xff09;创建一个包含80C51固件&am…

diffusion model(扩散模型)DDPM解析

DDPM 前向阶段 重复 2-5 步骤 x 0 ∼ q ( x 0 ) \mathbf{x}_0\sim q(\mathbf{x}_0) x0​∼q(x0​)从数据集中采样一张图片 t ∼ U n i f o r m ( { 1 , … , T } ) t\sim\mathrm{Uniform}(\{1,\ldots,T\}) t∼Uniform({1,…,T})&#xff0c;从 1~T 中随机挑选一个时间步 t ϵ …

JavaWeb实战教程:如何打造旅行社网站系统,提升在线服务能力?

✍✍计算机毕业编程指导师 ⭐⭐个人介绍&#xff1a;自己非常喜欢研究技术问题&#xff01;专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目&#xff1a;有源码或者技术上的问题欢迎在评论区一起讨论交流&#xff01; ⚡⚡ Java、…

rockyliunx 救援模式下禁用docker

目录地址 /usr/lib/systemd/system/docker.service 进入系统界面&#xff1a; 选择系统 按E 按e出现 如下界面&#xff0c;找到 quite 后面添加 init/bin/bash 按 ctrl x 保存 后&#xff0c;到如下界面 加载文件系统为读写 输入命令 mount -o remount, rw / 修改docer.s…

P7910[CSP-J2021]插入排序

题目描述 插入排序是一种非常常见且简单的排序算法。小 Z 是一名大一的新生&#xff0c;今天 H 老师刚刚在上课的时候讲了插入排序算法。 假设比较两个元素的时间为O(1)&#xff0c;则插入排序可以以 O(n^2)的时间复杂度完成长度为 n 的数组的排序。不妨假设这 n 个数字分别存储…

win11找环境变量

第一步&#xff1a;win&#xff0b;i 第二步&#xff1a; 第三步&#xff1a; 第四步&#xff1a; 第五步&#xff1a;

从屎山代码到RTOS,老工程师的架构进化史

很多老铁和我反馈&#xff0c;说很喜欢看我写的内容&#xff0c;不管是朋友圈还是文章&#xff0c;能在字里行间&#xff0c;受益匪浅。 想想也很久没时间没写长文了&#xff0c;既然大家喜欢看&#xff0c;我尽量抽时间多写。 长文预警&#xff0c;全文5800多字&#xff0c;…

云动态摘要 2024-08-28

给您带来云厂商的最新动态&#xff0c;最新产品资讯和最新优惠更新。 最新优惠与活动 [免费领用]电商出海AIGC福利包活动 腾讯云 2024-08-20 腾讯云智能助力中小电商企业用户出海&#xff0c;帮助企业用户轻松打造全场景AIGC应用。 注册阿里云免费领云服务器_云服务器ECS_阿…

【达梦数据库】表空间重命名新建用户下的模式

目录 背景需求解决方法 背景 达梦数据库中&#xff0c;一个用户对应一个表空间&#xff0c;用户会创建默认模式0。 在使用过程中&#xff0c;客户需要新建模式1&#xff0c;并且模式1和原来的表空间对应。 需求 1、表空间如何重命名 2、如何新建用户下的模式1 解决方法 表…

Linux设备树初步

一.设备树的概念 设备树&#xff1a;是一种描述硬件资源的数据结构&#xff0c;不是将设备的每个细节都硬编码到操作系统中&#xff0c;而是可以在引导时传递给操作系统的数据结构中描述硬件的许多方面。 设备树是描述一个硬件平台的硬件资源。这个“设备树”可以被bootloade…

综合能源充电站有序充电策略

随着电动汽车的发展&#xff0c;充电用户越来越多&#xff0c;同时也出现了一系列问题&#xff0c;尤其是无序充电带来的充电成本高、充电排队时间长和电网负荷安全影响等问题&#xff0c;制约着电动汽车和充电设施的发展。为解决此类问题&#xff0c;文章研究和设计有序充电策…

Kevin‘s notes about Qt---Episode 4 多次点击按钮反复执行机械臂动作

原先版本 SDK 1.2.1 - 2020-04-02 HMI 界面 4.0.6.135135 控制器 1.7.5 升级程序 0.6.4 伺服版本 不详(似乎也并不重要) 前言 在之前的工作中,这个问题并没有得到有效解决,情况如下: 在之前版本的程序中,每次动作执行完后需要关闭Qt界面,下一次想要运行机械臂程序时,…

数据链路层(Mac帧,报头字段,局域网通信原理),MTU,MSS,ip报文的分包与组装(ip报头字段介绍,组装过程,判断是否被分片/收到全部分片)

目录 数据链路层 介绍 MTU 介绍 在哪一层分片 IP报文的分包与组装 16位标识 3位标志 13位片偏移 示例 组装过程 确定是否被分片 确定是否收到全部分片 注意点 数据链路层与网络层的关系 Mac帧 Mac地址 报头格式 目的/源地址 类型 局域网通信原理 图解 碰撞…

TCP并发服务端的实现

思想&#xff1a;创建多个套接字&#xff0c;由"我"来管理这些套接字 方法&#xff1a; 1.多进程 2.多线程 3.IO多路复用 tcp服务器端创建流程&#xff1a; socket() bind() listen() connfd accept IO多路复用&#xff1a; 多个文件I复用同一个进程 IO…