基础学习——关于卷积层的记录

news2025/1/13 10:12:31

文章目录

    • 前言
    • 一、功能层
      • 1、池化层
      • 2、nn.BatchNorm2d()
      • 3、全连接层
      • 4、softmax层
    • 二、卷积层
      • 1、普通卷积
      • 2、空洞卷积
      • 3、多尺度卷积
      • 4、分组卷积
      • 5、深度可分离卷积
      • 6、形变卷积

前言

老是忘有些模块的具体作用,记录一下。

一、功能层

1、池化层

池化层夹在连续的卷积层中间,用于 压缩数据和参数的量,在构建卷积神经网络时,往往会用在卷积层之后,通过池化来降低卷积层输出的特征维度,有效减少网络参数的同时还可以防止过拟合现象。
下图为最大池化,平均池化也类似。
在这里插入图片描述

2、nn.BatchNorm2d()

作用:卷积层之后总会添加BatchNorm2d进行数据的归一化处理,这使得数据在进行Relu之前不会因为数据过大而导致网络性能的不稳定。

torch.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)

num_features:一般输入参数为batch_size×num_features×height×width,即为其中特征的数量
eps:分母中添加的一个值,目的是为了计算的稳定性,默认为:1e-5
momentum:一个用于运行过程中均值和方差的一个估计参数
affine:当设为true时,会给定可以学习的系数矩阵gamma和beta

3、全连接层

全连接层是神经网络中的一种常见层,也称为密集层(Dense Layer)。它将上一层的所有神经元都连接到当前层的所有神经元上,因此被称为全连接。在全连接层中,每个输入神经元都与输出层的所有神经元相连,并对输出层中的每个神经元产生影响。
全连接层的优点是可以表达出非常复杂的函数,适用于识别复杂的模式和特征。然而,全连接层中的参数数量很多,因此容易出现过拟合的问题。此外,全连接层在输入数据存在位置关系的情况下,无法对空间信息进行有效的编码和处理。倒数第二列的向量就是全连接层。
在这里插入图片描述

4、softmax层

softmax层是神经网络中常用的一种激活函数,通常用于多分类问题。在神经网络的输出层中,通过softmax函数将每个输出节点的值映射到0到1之间,并且归一化,使得所有输出节点的值之和为1,表示每个类别的概率分布。
softmax函数的数学表达式为:
y i = e x i ∑ j = 1 n e x j y_i = \frac{e^{x_i}}{\sum_{j=1}^{n}{e^{x_j}}} yi=j=1nexjexi
其中, x i x_i xi表示输入节点i的值, n n n表示输出节点的总数, y i y_i yi表示第i个输出节点的输出值。softmax函数将每个输入节点的值通过指数函数映射到非负数,然后再将所有节点的值相加作为分母,并将每个节点的指数值除以分母,得到每个节点的输出值。
softmax层在深度学习中广泛应用于分类问题,例如图像分类、自然语言处理中的情感分类、命名实体识别等。

二、卷积层

1、普通卷积

浅层:从输入图像中提取不同方面的特征,比如水平,垂直 ,边缘或对角线。
深层:通过浅层特征的组合,提取更加抽象的高层语义特征或全局特征

在这里插入图片描述
在这里插入图片描述

2、空洞卷积

空洞卷积(Dilated Convolution)是一种卷积神经网络中的操作,也被称为扩张卷积。它的作用是在不增加参数和计算量的情况下,增加神经网络的感受野(Receptive field),从而提高网络的性能。
在传统的卷积操作中,每个卷积核都会与相邻的像素进行卷积运算,而在空洞卷积中,卷积核会跳过一些像素点而只与部分像素点进行卷积运算,这样就能够扩大感受野。具体来说,空洞卷积通过在卷积核内部插入一些间隔点,使得卷积核在进行卷积时能够跳过这些间隔点,从而实现感受野的扩张。
常见的空洞卷积有两种:一种是一维空洞卷积,一种是二维空洞卷积。在实际应用中,空洞卷积常用于图像分割、语义分割等领域。
在这里插入图片描述

3、多尺度卷积

多尺度卷积是一种卷积神经网络(CNN)中的技术,它可以在不同的尺度下对输入数据进行卷积操作,从而提取不同层次的特征。在多尺度卷积中,通常会使用不同大小的卷积核来对同一层的输入数据进行卷积操作,这样就可以捕捉到不同尺度的特征信息。
例如,在图像识别任务中,多尺度卷积可以对输入的图像进行不同尺度的卷积操作,从而可以捕捉到不同尺度的物体特征,如小物体、中等大小的物体和大物体的特征。这样可以使模型更加全面地了解输入图像的特征,从而提高识别准确率。
多尺度卷积在许多应用中都有广泛的应用,如图像处理、语音识别、自然语言处理等。缺点:下图左图计算量太大,改进后的右图插入1×1的卷积降通道,减少了计算量。
SKNet模块可以自适应的决定哪个分支的信息更重要。
在这里插入图片描述

4、分组卷积

分组卷积是指在卷积层中,将输入的特征图分成若干个组,每个组内的特征图只与该组内的卷积核进行卷积操作,最终将各组的结果拼接在一起得到输出特征图。这种操作可以减少参数数量和计算量,因为组内的特征图共享同一个卷积核,减少了需要学习的参数数量。同时,分组卷积也可以提高模型的并行计算能力,因为各组的卷积操作可以在不同的计算设备上进行。
下图为普通卷积:
在这里插入图片描述
下图为分组卷积:计算之后再拼接起来
在这里插入图片描述
缺点:信息流通不通畅

5、深度可分离卷积

深度可分离卷积是一种卷积神经网络中的特殊卷积类型,其核心思想是将卷积操作拆分成深度卷积和空间卷积两个步骤进行处理。具体而言,深度可分离卷积首先使用一个只涉及深度方向跨度的卷积核进行深度卷积,然后再使用一个普通的卷积核进行空间卷积。这样可以大大减少卷积操作的总量,从而提高计算效率,同时也有助于缓解过拟合问题。深度可分离卷积在一些轻量级的神经网络中应用得比较广泛,例如MobileNetV1等。
深度可分离卷积主要事先通过逐层卷积得到每个层的特征层如下
逐层卷积:
在这里插入图片描述
然后再通过逐点卷积(1*1的卷积层)进行合并
逐点卷积:
在这里插入图片描述

6、形变卷积

形变卷积(deformable convolution)是一种卷积神经网络中的卷积操作,它可以在输入特征图中根据学习到的偏移量进行形变并且对相应位置的像素进行卷积计算。
传统的卷积操作只能在固定的空间位置进行计算,而形变卷积可以根据实际情况对输入特征图进行形变,从而更好地适应目标的形状和姿态。形变卷积的计算过程类似于传统卷积,但是在卷积核的计算过程中,每个位置的权重不再是固定的,而是根据学习到的偏移量来进行计算。这使得形变卷积能够更好地适应目标的形状和姿态,并且在目标检测、语义分割等任务中取得了良好的效果。

这个还没完全搞明白!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/560683.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

总结最全面的TCP、UDP、Socket、HTTP网络编程面试题

先看一天面试的经验: 第一场: 面试官:你说一下TCP的三次握手 我:第一次Client将SYN置1......、第二次Server收........、 第三次........ 面试官:很难背吧? 我:......是啊,很难&…

harbor安装

文章目录 先决条件硬件软件网络端口 安装docker签发证书生成证书颁发机构证书 生成服务器证书向 Harbor 和 Docker 提供证书 下载harbor安装包containerd 配置私有仓库(二选一)分发证书(如上文只是路径变了)配置登录加密登录打标签并推送与拉取 docker 配…

【EasyPoi实战系列】Spring Boot使用EasyPoi动态控制导出的列 - 第471篇

历史文章(文章累计460) 《国内最全的Spring Boot系列之一》 《国内最全的Spring Boot系列之二》 《国内最全的Spring Boot系列之三》 《国内最全的Spring Boot系列之四》 《国内最全的Spring Boot系列之五》 《国内最全的Spring Boot系列之六》 用…

机器学习神经网络——GBDT(Gradient Boosting Decision Tree 梯度提升决策树)算法

系列文章目录 机器学习神经网络——Adaboost分离器算法 机器学习之SVM分类器介绍——核函数、SVM分类器的使用 机器学习的一些常见算法介绍【线性回归,岭回归,套索回归,弹性网络】 文章目录 系列文章目录 前言 一、GBDT(Gradient Boos…

计算机网络:物理层

物理层 1. 通信基础1.1 基本概念1.1.1 通信模型1.1.2 通信方式1.1.3 数据传输方式1.1.4 数据同步的传输/通信方式1.1.5 码元1.1.6 速率1.1.7 带宽 1.2 奈氏准则|香农定理1.2.1 奈氏准则1.2.2 香农定理 1.3 编码、调制1.3.1 数字数据编码为数字信号1.3.2 数字数据调制为模拟信号…

Google Colab的使用方法

什么是 Google Colab? Colaboratory是一个 Google 研究项目,旨在帮助传播机器学习培训和研究成果。是一个Jupyter 笔记本环境,不需要进行任何设置就可以使用,并且完全在云端运行。Colaboratory笔记本存储在 Google 云端硬盘中&…

“超级品牌”已成型!解码名创优品的进阶之路

随着经济复苏,消费者心智和市场趋势逐渐发生变化,零售市场竞争步入深水区,为品牌带来了更大考验。但反过来,也令更多潜力股加速崛起。 北京时间5月16日,名创优品集团(NYSE:MNSO;HKEX: 9896)公布…

ResourceManager启动报错:Queue configuration missing child queue names for root【已解决】

Queue configuration missing child queue names for root 现象报错分析ResourceManager输出日志解决 现象 start-all.sh后缺少RM的进程 报错 查看启动日志输出文件 2023-05-23 19:28:19,863 INFO [main] resourcemanager.RMNMInfo (RMNMInfo.java:<init>(63)) - Re…

【Linux】进程控制 — 进程终止 + 进程等待

文章目录 &#x1f4d6; 前言1. 再次理解fork()函数1.1 fork()之后子进程代码和数据问题&#xff1a;1.2 fork()之后操作系统做了什么&#xff1a;1.3 为什么要写时拷贝&#xff1f;&#xff1f; 2. 进程终止2.1 main函数的返回值&#xff1a;2.2 exit() 和 _exit()&#xff1a…

以京东首页为例,设计用例框架。

以下是一个可能的京东首页的用例框架设计&#xff1a; 1. 区域划分&#xff1a; a. 顶部导航栏&#xff1a;包括京东的Logo、搜索框、登录/注册入口、购物车等。 b. 主要内容区域&#xff1a;展示各类商品、促销活动、广告位等。 c. 商品分类导航&#xff1a;提供各类…

复习之Linux下的文件管理

1.文件的建立 #touch westos-------建立空文件/修改文件的建立时间 &#xff08;1&#xff09;建立空文件 &#xff08;2&#xff09;修改文件的建立时间 ----右击点属性显示文件的建立时间 ---- 再次输入touch westos,westos文件的建立时间更新&#xff01; -----westos -t…

使用 Kafka Assistant,为您的开发加速

简要介绍 快速查看所有 Kafka 集群&#xff0c;包括Brokers、Topics和Consumers支持各种认证模式&#xff1a;PLAINTEXT、SASL_PLAINTEXT、SSL、SASL_SSL对Kafka集群进行健康检查查看分区中的消息内容并添加新消息查看消费者订阅了哪些主题&#xff0c;以及分区被分配给了哪些…

金融、医疗、教育等各场景下小程序SDK的应用

近年来&#xff0c;随着数字经济的飞速发展和移动终端的迅速普及&#xff0c;移动互联网全面覆盖&#xff0c;各类应用服务层出不穷&#xff0c;涵盖了方方面面的生活、工作和学习。 而小程序作为一种轻量级的应用形态&#xff0c;越来越受到开发者和用户的欢迎。为了满足不同行…

DataNode启动报错Failed to add storage directory [DISK]file:【已解决】

Failed to add storage directory [DISK]file hadoop启动后缺少DataNode进程报错out文件报错log文件解决 hadoop启动后缺少DataNode进程 jps查看hadoop进程缺少DataNode的进程 报错out文件 查看DataNode的out日志 DataNode启动报错 ulimit -a for user root core file size…

前k个高频单词

&#x1f495;**不要害怕前方的未知和困难&#xff0c;因为它们都是你成长的机会。不要过于在意别人的眼光和评价&#xff0c;因为唯有你的内心才知道自己真正的价值。珍惜当下&#xff0c;享受生活的点滴&#xff0c;让自己变得更加坚强、自信、成熟。**&#x1f495; &#x…

LG Gram 14 (14Z90N) 电脑 Hackintosh 黑苹果efi引导文件

原文来源于黑果魏叔官网&#xff0c;转载需注明出处。&#xff08;下载请直接百度黑果魏叔&#xff09; 硬件型号驱动情况 主板LG Gram 14 (14Z90N) 处理器Intel Core i5-1035G4已驱动 内存M471A1G44AB0-CWE * 2已驱动 硬盘MTFDHBA512TDV-1AZ1AABYY已驱动 显卡Intel Iris …

Axel – 用于 Linux 的命令行文件下载加速器

动动发财的小手&#xff0c;点个赞吧&#xff01; 如果您是那种喜欢下载和试用多个 Linux 发行版的人&#xff0c;我们相信您会张开双臂欢迎一个说到做到的下载加速器——一个按照其描述进行操作的下载加速器。 在本指南[1]中&#xff0c;我们将向您介绍 Axel&#xff0c;这是一…

由浅入深Dubbo核心源码剖析高可用集群

目录 1 服务集群的概述1.1 概述1.2 调用过程1.3 组件介绍 2 集群容错机制2.1 内置集群容错策略2.2 集群容错调优2.3 源码分析 3 集群负载均衡策略3.1 负载均衡的主要作用3.2 内置的负载均衡策略3.3 负载均衡总结 4 服务治理4.1 服务治理的概述4.2 执行过程4.3 服务治理功能 1 服…

由浅入深Dubbo核心源码剖析服务暴露与发现

目录 1 概述2 Spring中自定义Schema2.1 案例使用2.2 dubbo中的相关对象 3 服务暴露机制3.1 术语解释3.2 流程机制3.3 源码分析3.4 总结 4 服务发现4.1 服务发现流程4.2 源码分析4.3 总结 1 概述 dubbo是一个简单易用的RPC框架&#xff0c;通过简单的提供者&#xff0c;消费者配…

《深入理解Java虚拟机》Java虚拟机的监控及诊断工具相关命令行

《深入理解Java虚拟机》Java虚拟机的监控及诊断工具相关命令行 1.jps 查看当前系统正在运行的java进程 相关参数 -l 打印模块名以及包名 -v 打印虚拟机相关参数 -m 打印传给主类的参数 -mlv 以上内容都打印 2.jstat 打印目标 Java 进程的性能数据 -gc 打印gc回收相关信息…