【深度学习基础】关于卷积神经网络你了解多少?

news2025/1/23 7:13:52

文章目录

    • 卷积
    • 稀疏交互
    • 参数共享
    • 池化层
    • 全连接层
    • 转置卷积
    • 空洞卷积
    • 卷积神经网络与全连接神经网络

本篇博客主要是讲解一些本人对于卷积的理解,包括:

  • 为什么会出现卷积操作?
  • 最基本的卷积操作?
  • 卷积的优缺点。
  • 空洞卷积等等。
  • 卷积操作牵扯的分辨率等问题。
  • 灰度值,RGB值等

卷积

参考链接
卷积到底是什么?卷积到底卷了个啥?

  1. 卷积是一个数学概念,公式如下:
    ∫ − ∞ + ∞ f ( τ ) g ( x − τ ) d τ \int_{-\infty }^{+\infty } f(\tau )g(x-\tau )d\tau +f(τ)g(xτ)dτ
  2. 如何理解该公式:举一个例子
    假设 f ( t ) f(t) f(t)表示到 t t t时刻一个人进食量, g ( t ) g(t) g(t)表示t时刻胃对食物的消化率。如果要求下午两点还剩多少食物改怎么求呢?
    ∫ 0 t f ( x ) g ( t − x ) d x \int_{0}^{t} f(x )g(t-x )dx 0tf(x)g(tx)dx
    在这里插入图片描述
    所以卷积其实就是两个函数的积分,一个不稳定的输入函数 f ( x ) f(x) f(x),还有一个相对稳定的输出函数 g ( x ) g(x) g(x),求这两个函数乘积的积分。
    卷积还可以理解为t时刻发生的事件受前面x事件的影响程度。
  3. 图像卷积过程:
    首先有一个卷积核,我们可以理解为g(x),还有一个输入f(x)。卷积核所覆盖的部分对应点相乘再相加。然后输出一个点,填入到中心位置。
    在这里插入图片描述
  1. 如何理解卷积过程?
    第一种理解:周围点对于中心点的影响。例如平滑卷积,一个 3 × 3 3\times 3 3×3的卷积核,数值全部为 1 / 9 1/9 1/9,这样的话就相当于这九个数相加求平均,可以缩小像素点之间的差异,使像素点更加平滑,效果如下:
    在这里插入图片描述
    第二种理解:过滤器,中心点对于周围点的试探。对于卷积核所覆盖的9个点,进行筛选。所以卷积操作可以提取局部特征,具体例子如下:
    在这里插入图片描述
    总结:神经网络中的卷积层可以通过卷积核提取特征。

卷积的特点:
参考链接:卷积神经网络中的稀疏交互和参数共享

稀疏交互

对于全连接网络,任意一对输入与输出神经元之间都产生交互,形成稠密的连接结构。在下图中可以看到, s i s_i si , i = 1 , . . . , 5 i = 1,...,5 i=1,...,5 与输入的所有神经元 x i x_i xi , i = 1 , . . . , 5 i = 1,...,5 i=1,...,5都有连接。

在这里插入图片描述
具体来讲,假设网络中相邻两层分别具有 m m m个输入和 n n n个输出,全连接网络中的权值参数矩阵将包含 m ∗ n m*n mn个参数。对于稀疏交互的卷积网络,如果限定每个输出与前一层神经元的连接数为 k k k,那么该层的参数总量为 k ∗ n k*n kn。在实际应用中,一般 k k k值远小于 m m m就可以取得较为可观的效果;而此时优化过程的时间复杂度将会减小几个数量级,过拟合的情况也得到了较好的改善。

在这里插入图片描述
稀疏交互的物理意义是,通常图像、文本、语音等现实世界中的数据都具有局部的特征结构,我们可以先学习局部的特征,再将局部的特征组合起来形成更复杂和抽象的特征。

参数共享

参数共享是指在同一个模型的不同模块中使用相同的参数,它是卷积运算的固有属性。全连接网络中,计算每层的输出时,权值参数矩阵中的每个元素只作用于某个输入元素一次;而在卷积神经网络中,卷积核中的每一个元素将作用于每一次局部输入的特定位置上。根据参数共享的思想,我们只需要学习一组参数集合,而不需要针对每个位置的每个参数都进行优化,从而大大降低了模型的存 储需求。

参数共享的物理意义是使得卷积层具有平移等变性。假如图像中有一只猫, 那么无论它出现在图像中的任何位置,我们都应该将它识别为猫,也就是说神经网络的输出对于平移变换来说应当是等变的。

池化层

  • 为什么要做池化操作

卷积操作的为了提取特征,卷积操作的结果是获取特征图,但是通常 3 × 3 3 \times 3 3×3的卷积核获取的特征图包含的数据量还是很大,计算量很大。例如在自动驾驶的时候要在几毫秒内做出判断,因此为了减少计算量,我们应该在保留特征的前提下降低计算量,也就是降低数据量。这就需要池化操作。
总结:池化可以在不改变特征的情况下降低数据量,减少计算量。

  • 有哪些池化操作?

max pooling: 只保留最大值。
在这里插入图片描述
average pooling: 求平均值保留。
在这里插入图片描述

全连接层

全连接层就是每个节点都与上一个节点相连接。一般是在最后与softmax层一起用。就是计算每个节点的得分,然后判断属于哪一类。
在这里插入图片描述
在这里插入图片描述

转置卷积

参考链接

  • 上面说的卷积层,池化层等都是对于分类问题的。但是对于分割问题,输出图像应该与输入图像一样大,如果只用卷积层和池化层肯定不满足要求,因为卷积不能增大输入的高宽,通常要么不变,要么减半。
  • 转置卷积可以增大输入的高宽。具体计算如下,输入的每个位置的元素与卷积核相乘填在对应位置,最后将他们加在一起。
  • 转置卷积是一对多,一个元素产生多个位置。卷积是多对一,多个元素产生一个位置。
    在这里插入图片描述
    为什么叫转置?
  1. 对于卷积我们可以写成 Y = W ⋅ X Y=W\cdot X Y=WX,其中 " ⋅ \cdot "代表卷积运算,
  2. 这里也可以对 W W W构造一个矩阵 V V V,使得卷积运算等价于矩阵乘法 Y ′ = V X ′ Y'=VX' Y=VX 。其中 Y ′ Y' Y X ′ X' X Y Y Y X X X对应的向量版本。
    假设 X ′ X' X m m m行, Y ′ Y' Y n n n行,矩阵 V V V则是 n × m n\times m n×m。现在要把 Y ′ Y' Y作为输入, X ′ X' X作为输出,即 X ′ = ( ) Y ′ X'=()Y' X=()Y。不难推算()应该是 m × n m\times n m×n V T V^{T} VT
  3. 转置卷积等价于 X ′ = V T Y ′ X'=V^{T}Y' X=VTY,即转置卷积可以将反向放大。

空洞卷积

卷积神经网络与全连接神经网络

  • 全连接神经网络
  1. 由一个一个的感知机组成。
  2. 权重是w,每个感知机的w可能不一样。
  3. 每个感知机与上一层(下一层)的感知机全部相连。
    在这里插入图片描述
  • 卷积神经网络
  1. 由卷积层、池化层、全连接层、激活函数搭积木组成。
  2. 权重是卷积核的数值,但是每一层可以共用同一个卷积核,也就是权重共享。
  3. 由于卷积神经网络不是只有全连接层,因此卷积神经网络是局部连接的。可以理解为如果卷积神经网络全部是全连接层,那么就是全连接的。
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2044630.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

启明智显借 AI 之翼重塑人机交互,强劲赋能智能硬件升级腾飞

在科技日新月异的今天,启明智显作为人机交互(HMI)与物联网人工智能(AIoT)硬件领域的领航者,正以前所未有的决心和行动力,推动着智能硬件行业的深刻变革。公司不仅致力于将最先进的人工智能技术融…

Java 中高级面试题:16题

1. Java 中有哪些不同类型的线程优先级?JVM 分配的线程默认优先级是多少? 线程优先级是这样的概念:每个线程都有一个优先级,用外行人的语言来说,可以说每个对象都有优先级,用 1 到 10 之间的数字表示。Jav…

Openleyer 获取features样式

目录 一、需求说明: 二、业务功能分析: 三、地图点击事件 四、地图要素select事件 五、地图双击事件 六、移动到地图点事件 一、需求说明: 若聚合情况下,点击聚合要素,若只有一个要素,则显示详情信息…

【安卓】WebView的用法与HTTP访问网络

文章目录 WebView的用法使用http访问网络使用HttpURLConnection使用OkHttp 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。 点击跳转到网站。 WebView的用法 新建一个WebViewTest项目,然后修…

管易云与金蝶K3-WISE对接集成发货单查询打通新增其他出库

管易云与金蝶K3-WISE对接集成发货单查询打通新增其他出库 对接系统:管易云 管易云是金蝶旗下专注提供电商企业管理软件服务的子品牌,先后开发了C-ERP、EC-OMS、EC-WMS、E店管家、BBC、B2B、B2C商城网站建设等产品和服务,涵盖电商业务全流程。…

本地连接服务器上docker中的redis

在上一篇本地连接服务器redis这篇文章中详细介绍了。 这里连接服务器中docker中的redis,同样的操作步骤 1.看一下服务器上redis实例的运行状态: [rootiZuf67k70ucx14s6zcv54dZ var]# ps aux | grep redis-server若显示: 则说明服务器上do…

Denser Retriever: RAG中更强大的AI检索器,让您10 分钟内构建聊天机器人应用

一、Denser Retriever 介绍 Denser Retriever 是一个企业级的RAG检索器,将多种搜索技术整合到一个平台中。在MTEB数据集上的实验表明,Denser Retriever可以显著提升向量搜索(VS)的基线(snowflake-arctic-embed-m模型,…

如何在PyCharm使用conda虚拟环境,如何使用远程Linux系统上的conda虚拟环境。

目录 在PyCharm使用conda虚拟环境(windows) 使用远程Linux系统上的conda虚拟环境 在PyCharm使用conda虚拟环境(windows) 首先请创建好虚拟环境 点击输入 conda create -n pyspark python3.8 # conda create -n 名字任取 py…

智谱AI与和鲸科技签署战略合作协议,共拓大模型产业应用与人才培养新未来

8月9日,北京智谱华章科技有限公司(智谱 AI)与上海和今信息科技有限公司(和鲸科技)在北京签署战略合作协议。智谱 AI 总裁王绍兰与和鲸科技创始人、CEO 范向伟亲临现场,发表致辞并见证签约。智谱 AI AIGC 事…

Python软件包和PIP镜像下载地址

一、Python软件下载地址 1. 官网下载 https://www.python.org/downloads/ 2. 国内第三方镜像 https://mirrors.huaweicloud.com/python/ https://registry.npmmirror.com/binary.html?pathpython/ 从以上国内镜像即可下载安装程序,Windows平台,不论是In…

网络安全 DVWA通关指南 DVWA File Inclusion(文件包含)

DVWA File Inclusion(文件包含) 文章目录 DVWA File Inclusion(文件包含)本地文件包含(LFI)漏洞利用 远程文件包含(RFL)漏洞利用 修复建议 LowMediumHighImpossible 本地文件包含(LFI) 文件包含漏洞的产生原因是 PHP 语言在通过引…

我的世界 异地联机教程 无需公网IP、服务器

主要内容 什么是Minecraft(JAVA国际版) 搭建该服务,需要准备什么 详细步骤 1.启动器 安装MC并运行MC 2.运行 MoleSDN 进行异地联机 3.小伙伴皮蛋加入鼠鼠的MC 完成联机 什么是我的世界 一款3D沙盒电子游戏,由Mojang Studio…

ComfyUI大猫咪写真工作流,哩布线上一键运行

前言 这次教程是用ComfyUI做的大猫咪写真。 视频教程 打开下面这个网站,点击【在线运行工作流】就可以一键运行ComfyUI工作流了 所有的AI设计工具,模型和插件,都已经整理好了,👇获取~ 正面关键词: Chin…

基于二叉树的近似最近邻搜索-Annoy

在推荐系统的召回阶段,会实时计算用户的表征向量(user/query),然后去物料库去寻找与用户最匹配的N个物料返回给用户;在搜索系统,也同样存在这样的需求,用户的搜素(query)…

Efficient DETR:别再随机初始化了,旷视提出单解码层的高效DETR | CVPR 2021

Efficient DETR结合密集检测和稀疏集合检测的优点,利用密集先验来初始化对象容器,弥补单层解码器结构与 6 层解码器结构的差距。在MS COCO上进行的实验表明,仅 3 个编码器层和 1 个解码器层即可实现与最先进的目标检测方法竞争的性能&#xf…

指针函数与函数指针的区别

1、指针函数 1-1、定义 指针函数,顾名思义,是一个函数,但其返回类型是指针。这意味着当这个函数被调用时,它会返回一个地址值,这个地址值指向某个类型的数据。 1-2、特点 函数性质:首先,它是…

【2024】20个高级 Java 面试问题及答案

1:解释Java序列化中transient关键字的意义。 在 Java 中,“ transient ”关键字用于指示变量在对象序列化期间不应被序列化。当变量被标记为“transient”时,意味着该变量应被序列化机制忽略。 这在处理不应持久的敏感或临时数据时特别有用…

基础 - 前端知识体系详解

一、前端三要素 HTML(结构): 超文本标记语言(Hyper Text Markup Language),决定网页的结构和内容。CSS(表现): 层叠样式表(Cascading Style Sheets&#xff0…

基于飞腾平台的Hbase的安装配置

【写在前面】 飞腾开发者平台是基于飞腾自身强大的技术基础和开放能力,聚合行业内优秀资源而打造的。该平台覆盖了操作系统、算法、数据库、安全、平台工具、虚拟化、存储、网络、固件等多个前沿技术领域,包含了应用使能套件、软件仓库、软件支持、软件适…

人脸操作:从检测到识别的全景指南

人脸操作:从检测到识别的全景指南 在现代计算机视觉技术中,人脸操作是一个非常重要的领域。人脸操作不仅包括检测图像中的人脸,还涉及到人脸识别、表情分析、面部特征提取等任务。这些技术在各种应用中发挥着关键作用,从社交媒体…