深度学习(卷积神经网络)

news2024/11/16 9:19:04

文章目录

  • 动物视觉神经,以及脑科学
      • 视网膜——视觉第一站
      • 外膝体——信息中转站
      • 视皮层——中央处理器
      • 小tips
  • 人工神经网络
  • 神经认知机模型
  • 卷积神经网络结构(Convolutional Neural Network,CNN)
    • 卷积层
    • 池化层
    • 全连接层
    • 输出层
      • softmax函数
      • 线性输出函数
    • 神经网络的训练方法
      • 卷积神经网络中的调整参数
      • 卷积神经网络中的预设参数

动物视觉神经,以及脑科学

引自:http://www.ion.ac.cn/kpwz/201907/t20190703_5332551.html

视网膜——视觉第一站

光信号转换成电信号

在这里插入图片描述
视网膜中的神经元,根据不同的形态和功能主要分为五大类:光感受器、双极神经元细胞、神经节细胞、水平细胞、无长突细胞

  • 光感受器负责光电转换
  • 双极神经元负责接收光感受器输出的信号并传递给下游的视网膜神经节细胞
  • 信息从光感受器到双极细胞以及从双极细胞到神经节细胞的传递过程分别受到水平细胞无长突细胞调节
  • 视网膜神经节细胞对信息进行加工整合后将电信号向下一级脑区外膝体的中继细胞进行传递
    在这里插入图片描述

简单来说,前一级神经元的电活动促使其分泌特定的化学物质(即神经递质)并作用在下一级神经元上进而引起下一级神经元电活动的变化。

有的神经递质可以增强下一级神经元的电活动,有的神经递质则会抑制下一级神经元的电活动,比如双极神经元释放的神经递质可以增强神经节细胞的电活动,而无长突细胞释放的递质可以抑制神经节细胞的电活动

一种简单的模型是说,光感受器将信息传递给十多个亚型的双极细胞,可以理解为十多条并行的通路,这十多条通路在对视觉信息进行平行传递时由水平细胞和无长突细胞进行加工处理,最终将视觉信息的不同要素(比如明暗变化,颜色,运动速度与方向等)抽提出来传递给不同亚型的神经节细胞。

外膝体——信息中转站

外膝体类似于视网膜,其中的神经元也是规则地分层排列,不同类型的神经元分布在不同分层,接收不同亚型的视网膜神经节细胞的输入,再将这些信息传输给初级视皮层

外膝体中大约25%的中间神经元,一方面接收视网膜神经节细胞的指令,另一方面同时接收视皮层的反馈,作用则是调节其他神经元的电活动。这里就出现了另外一个科学家们在20世纪晚期才注意到的重要现象,视皮层接收外膝体中继细胞的信息之后,会反过来就外膝体进行负反馈的调节。就像一个系统,有兴奋就需要有抑制,有正反馈就需要有负反馈,这样才有可能使系统保持相对的稳定而不至于能量无限的增益直至衰竭崩溃。所以,像前文提到过的中间神经元可以抑制其他神经元的电活动、高级皮层可以对低级脑区进行负反馈调节,这些都是使得神经系统可以正常工作的重要功能

视网膜应用多条平行通路进行信息的传递和处理,同样的,视觉信息在脑内的处理过程也有类似的平行模式,即不同性质的视觉信息成分经不同的神经环路通道预处理,最终由不同性质的皮层细胞来分别进行分析处理与整合。目前的证据表明,中枢视觉信息的处理既是由低级向高级逐步升级的过程,又遵循着平行处理的原则。而外膝体作为视觉信息的中转站,在平行信息处理通道中起到了关键的作用,将不同细胞种类的平行通道、左右眼信息通道、空间频率通道、颜色信息处理通道、空间方位信息通道、运动方位信息通道等分别传送到专门处理这些信息的皮层神经元。
在这里插入图片描述

视皮层——中央处理器

在神经系统这部“巅峰之作”中,大脑皮层的形成可称为“画龙点睛之笔”。进化过程中哺乳动物才开始出现的皮层结构在学习记忆、语言思考以及知觉意识等高级功能方面发挥着至关重要的作用,且越是高等的生物,其皮层的结构和功能则越是发达。
外侧膝状体至初级视皮层各层的投射关系、初级视皮层内部的投射关系及初级视皮层向外侧膝状体、上丘及其他皮层区域的投射关系。

图:外侧膝状体至初级视皮层各层的投射关系、初级视皮层内部的投射关系及初级视皮层向外侧膝状体、上丘及其他皮层区域的投射关系。
(张雯孙新尧绘制,修改自《Principles of neuralscience》第5版572页,原文处标注经许可修改自Blasdel和Lund1983)

通常所说的视皮层主要包括初级视皮层(又称作纹状皮层或视觉第一区域,即V1)和纹外皮层(例如视觉第二、第三、第四、第五区域等,即V2、V3、V4、V5)。

有一种模型认为,整个的皮层信息处理过程由两条并行的通路完成:

  • V1、V2、V4等组成的腹侧通路主要处理物体形状、颜色等信息;
  • V1、V2、V5等组成的背侧通路主要负责对运动等信息的感知

在这里插入图片描述

视觉通路的平行处理模型。主要分为背侧通路和腹侧通路。
(周桢宁 绘制,修改自《Principles of neural science》第5版571页, 原文处标注经许可图中所示视网膜神经节细胞的形态使用了Dennis Dacey的实验数据)

Hubel和Wiesel根据对视觉刺激的反应特征,在视皮层发现了多种神经元,分别叫做简单细胞、复杂细胞以及超复杂细胞。
并证实了皮层功能柱的结构:许多具有相同特性皮层细胞,在视皮层内按照一定的规则在空间上排列起来,这种按功能排列的皮层结构,即皮层的功能构筑,沿着皮层的不同层次呈现柱状分布

小tips

在这里插入图片描述

人工神经网络

原文链接:https://blog.csdn.net/xuesen_lin/article/details/116107168

人们根据脑神经科学,设计出了人工神经元。
在这里插入图片描述
人工神经元的连接数随着时间的推移,呈现出快速增长的趋势

  1. 自适应线性单元 (Widrow and Hoff, 1960)
  2. 神经认知机 (Fukushima, 1980)
  3. GPU-加速 卷积网络 (Chellapilla et al., 2006)
  4. 深度玻尔兹曼机 (Salakhutdinov and Hinton, 2009a)
  5. 无监督卷积网络 (Jarrett et al., 2009b)
  6. GPU-加速 多层感知机 (Ciresan et al., 2010)
  7. 分布式自编码器 (Le et al., 2012)
  8. Multi-GPU 卷积网络 (Krizhevsky et al., 2012a)
  9. COTS HPC 无监督卷积网络 (Coates et al., 2013)
  10. GoogLeNet (Szegedy et al., 2014a)

在这里插入图片描述
纵轴是神经元数量

神经认知机模型

这是一种分层神经网络模型。

神经认知机模型由如下三个细胞层组成:

  • 负责对比度提取的G细胞层
  • 负责图像特征提取的S细胞层(由简单细胞首字母命名)
  • 抗变形的C细胞层(由复杂细胞首字母命名)

S细胞层C细胞层交替排列的结构。会将底层提取的局部特性逐渐变成全局特性。

通过引入神经网络中的误差反向传播算法,人们得出卷积神经网络

卷积神经网络结构(Convolutional Neural Network,CNN)

卷积神经网络由以下层组成

  • 输入层(input layer)
  • 卷积层(convolution layer)
  • 池化层(pooling layer)
  • 全连接层(fully connected layer)
  • 输出层(output layer)

在这里插入图片描述
通过增加卷积层和池化层,还可以得到更深层次的网络。
全连接层可以采用多层结构。

卷积层

[ 原理在这里不再阐述 ]

需要注意的点:

  1. 卷积层用于提取物体特征,多种不同的卷积核可以提取出的特征信息
    (详细内容参考 《计算机视觉》 方面的内容)
  2. 在卷积层的误差传播中,卷积核中的数据即为 权重 w w w ,因此反向误差传播调整的权重即为卷积核内数据

池化层

池化层的作用是 减少卷积层产生的特征图的尺寸
池化操作降低了特征值的维度,使得特征表示对输入数据的位置变换具有稳健性。

主要池化方法:

  • 最大池化:选取图像区域内最大值作为新特性
  • 平均池化
  • Lp池化:突出图像区域内的中央值作为新的特征图

在这里插入图片描述

全连接层

全连接层中的每个神经元与其前一层的所有神经元进行全连接.全连接层可以整合卷积层或者池化层中具有类别区分性的局部信息
在这里插入图片描述

  • 输入:池化层或卷积层的输出
  • 处理:将各特征值 x i x_i xi 与权重 w i w_i wi 相乘求和,得到该类型的权值和。再通过激活函数得出该类型的相似度。
  • 输出:相似度

在这里插入图片描述

输出层

与多层感知层的输出层一样,卷积神经网络的输出层也是使用似然函数计算各类别的似然概率

softmax函数

在视觉识别中常使用softmax函数。
p ( y k ) = e x p ( u 2 k ) ∑ q = 1 Q e x p ( u 2 q ) p(y^k) = \frac{exp(u_{2k})}{\sum_{q=1}^Q exp(u_{2q})} p(yk)=q=1Qexp(u2q)exp(u2k)

线性输出函数

在递归问题中,一般使用线性输出函数计算各单元的输出值。

p ( y p ) = ∑ m = 1 M w p m x m p(y^p) = \sum_{m=1}^M w_{pm}x_m p(yp)=m=1Mwpmxm

神经网络的训练方法

卷积神经网络中的调整参数

卷积神经网络的参数包括:

  • 卷积层的卷积核权重
  • 全连接层的连接权重偏置值

误差更新使用误差反向传播算法训练

  • 池化层的误差传播:只在选定的单元中传播(例如:最大池化中只选定最大的单元)
  • 卷积层的误差传播:由于卷积核会对多个位置进行卷积操作,所以需要累计所有单元的连接权重的调整值,得到最终的调整值。

卷积神经网络中的预设参数

与神经网络有关的主要参数

  • 卷积层的卷积核大小卷积核个数
  • 激活函数的种类
  • 池化方法的种类
  • 网络的卷积、归一、池化层结构个数
  • 全连接层个数
  • Dropout的概率(让某个神经元的激活值以一定的概率p,让其停止工作)
  • 有无预处理
  • 有无归一化

与训练有关的参数

  • Mini-Batch的大小(小批量梯度下降的子集个数)
  • 学习率 η \eta η
  • 迭代次数
  • 有无预训练

根据CIFAR-10数据集,比较各参数对神经网络学习能力的学习情况

CIFAR-10 数据集简介
CIFAR-10 是由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一个用于识别普适物体的小型数据集。一共包含 10 个类别的 RGB 彩色图 片:飞机( a叩lane )、汽车( automobile )、鸟类( bird )、猫( cat )、鹿( deer )、狗( dog )、蛙类( frog )、马( horse )、船( ship )和卡车( truck )。图片的尺寸为 32×32 ,数据集中一共有 50000 张训练圄片和 10000 张测试图片。

在这里插入图片描述
在这里插入图片描述
引自:《图解深度学习》学习笔记(二)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/605326.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

智能离网微逆变系统

文章目录 一、功能描述二、硬件部分2.1、单片机选型及中断号2.1.1、引脚分配 2.2、EG80102.3、控制电路图2.4、主电路图 三、代码流程图四、代码部分展示4.1、主函数4.2、modbus 五、项目演示 一、功能描述 把风光能,逆变为可调压调频的交流电可通过串口屏&#xf…

通过python封装采集商品ID请求获取京东商品详情数据,京东商品详情接口,京东API接口

使用Python封装采集商品ID请求获取京东商品详情数据。具体步骤如下: 使用Python中的requests库发送HTTP请求,获取商品ID列表。采集方法可根据需求选择,如爬虫框架Scrapy、Selenium等。导入京东API的Python SDK,如jdapi&#xff0…

YARN【工作机制】

Yarn概念 Yarn 是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式 的 操作系统平台 ,而 MapReduce 等运算程序则相当于运行于 操作系统之上的应用程序 。 Yarn的四大组件 YARN 主要由 ResourceManager(…

javascript基础十九:说说你对正则表达式的理解?应用场景?

一、是什么 正则表达式是一种用来匹配字符串的强有力的武器 它的设计思想是用一种描述性的语言定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的 在 JavaScript中,正则表达式也是…

MySQL架构简介

MySQL是系统架构中最常见的中间件,主要由Server层(连接器Connectors、连接池Connection Pool、查询缓存query cache、分析器Parser、优化器Optimizer、执行器、binlog)以及存储引擎层组成。 MySQL架构简介 连接器 与客户端建立连接、认证身…

0803平面及其方程-向量代数与空间解析几何

文章目录 1 曲面方程与空间曲线方程的概念1.1 曲面方程1.2 空间曲线的方程 2 平面的点法式方程3 平面的一般方程4 两平面的夹角4.1 两平面夹角的定义4.2 夹角的余弦公式4.3 点到平面的距离 结语 1 曲面方程与空间曲线方程的概念 1.1 曲面方程 如果曲面与三元方程 ​ F ( x …

安捷伦MSOX4104A示波器/Agilent MSO-X4104A

安捷伦MSOX4104A示波器/Agilent MSO-X4104A 简介: 1GHz带宽 4个模拟通道 集成逻辑计时分析仪 配有业界*大的 12.1 英寸电容触摸屏 产品特点: 五合一的仪器 示波器 逻辑分析仪(可选) 串行协议分析仪(USB2.0、ARIN…

柔性车间作业调度

1柔性车间作业调度 n n n个工件 { J 1 , J 2 , ⋯ , J n } \{J_1,J_2,\cdots,J_n\} {J1​,J2​,⋯,Jn​}要在 m m m台机器 { M 1 , M 2 , ⋯ , M m } \{M_1,M_2,\cdots,M_m\} {M1​,M2​,⋯,Mm​}上加工。每个工件包含一道或多道工序,工序顺序是预先确定的&#xf…

【Java|多线程与高并发】Thread 常见的方法总结

文章目录 1. 前言2. 方法getId()3. 方法getName()4. 方法getState()5. 方法getPriority(int newPriority)6. 方法isDaemon()和setDaemon()7. 方法isAlive()8. 方法isInterrupted()9. 方法currentThread()10. 方法sleep()11. 方法join()12. 总结 1. 前言 本文主要介绍Thread类常…

第11章_数据库的设计规范

第11章_数据库的设计规范 1. 为什么需要数据库设计 我们在设计数据表的时候,要考虑很多问题。比如: 用户都需要什么数据?需要在数据表中保存哪些数据?如何保证数据表中数据的正确性,当插入、删除、更新的时候该进行怎样的约束检查?。如何降低数据表…

javascript基础十八:说说你对JavaScript中事件循环的理解​

一、是什么 JavaScript 在设计之初便是单线程,即指程序运行时,只有一个线程存在,同一时间只能做一件事 为什么要这么设计,跟JavaScript的应用场景有关 JavaScript 初期作为一门浏览器脚本语言,通常用于操作 DOM &#…

【C++】C++11新特性的讲解

新特性讲解第一篇~ 文章目录 前言一、较为重要的新特性 1.统一的初始化列表2.decltype关键字3.右值引用移动语义总结 前言 C11 简介 : 在 2003 年 C 标准委员会曾经提交了一份技术勘误表 ( 简称 TC1) ,使得 C03 这个名字已经取代了 C98 称为 C11 之前的…

【游戏编程扯淡精粹】工作第三年总结

工作第三年总结 文章目录 工作第三年总结#1 做了什么自研路线Lua 脚本系统ToolX #2 职业发展如何做事技术中台化内卷的职业市场个人成长 #3 心态建设Owner vs 打工人 今年仍然是个人成长视角更多一些,额外新学到的重点是,借助团队力量 先介绍两个词&…

通过自由度比较迭代次数

( A, B )---3*30*2---( 1, 0 )( 0, 1 ) 让网络的输入只有3个节点,AB训练集各由5张二值化的图片组成,让A中有7个1,B中全是0,让A的5行1的数量为1,1,1,2,2;让A的3列1的数量…

chatgpt赋能python:Python列表从后往前删除的方法及注意事项

Python列表从后往前删除的方法及注意事项 Python是一种功能强大而易于使用的编程语言。在Python中,列表是重要的数据类型之一,它可以存储任意类型的数据,例如整数、字符串、浮点数和对象等,而且列表数据可以动态添加或删除。在编…

numpy模块

目录 ❤ numpy简介 ❤ 为什么用numpy ❤ 创建numpy数组 ❤ numpy数组的常用属性 ❤ 获取numpy数组的行列数 ❤ 切割numpy数组 ❤ numpy数组元素替换 ❤ numpy数组的合并 ❤ 通过函数创建numpy数组 array arange linspace/logspace zeros/ones/eye/empty …

多功能电子听诊器(CMS-VESD)产品使用说明

Copyright reserved 子曰:桃李不言,下自成蹊。 Copyright reserved Ⅰ . 产品描述 : C M S − V E S D Ⅰ. 产品描述:^{CMS-VESD} Ⅰ.产品描述:CMS−VESD Ⅰ . 1 主要特点 : 如有疑问可留言沟通交流 Ⅰ.1 主要特点:^{如有疑问可留言沟通交流} Ⅰ.1主要特…

[python bezier贝塞尔曲线] 数值解法、德卡斯特里奥解法解法以及bezier库的使用demo

修改自这个老哥的,非常的nice,此处仅作为学习记录。 matplotlib3.7.0 可行 Note: 数值解法是真的快 先上图 import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D import numpy as np import math import timeclass Bezier:def __init__(se…

使用HTML5开发Kinect体感游戏

一、简介 我们要做的是怎样一款游戏? 在前不久成都TGC2016展会上,我们开发了一款《火影忍者手游》的体感游戏,主要模拟手游章节《九尾袭来 》,用户化身四代,与九尾进行对决,吸引了大量玩家参与。 表面上看…

Makerbase SimpleFOC ESP32 例程5 双电机闭环位置测试

Makerbase SimpleFOC ESP32 例程5 双电机闭环位置测试 第一部分 硬件介绍 1.1 硬件清单 序号品名数量1ESP32 FOC V1.0 主板12YT2804电机2312V电源适配器14USB 线156pin杜邦线2 注意:YT2804是改装的云台无刷电机,带有AS5600编码器,可实现360连续运转。…