【5-卷积神经网络】北京大学TensorFlow2.0

news2025/1/9 2:19:39

课程地址:【北京大学】Tensorflow2.0_哔哩哔哩_bilibili

Python3.7和TensorFlow2.1

六讲:

  1. 神经网络计算:神经网络的计算过程,搭建第一个神经网络模型

  1. 神经网络优化:神经网络的优化方法,掌握学习率、激活函数、损失函数和正则化的使用,用Python语言写出SGD、Momentum、Adagrad、RMSProp、Adam五种反向传播优化器

  1. 神经网络八股:神经网络搭建八股,六步法写出手写数字识别训练模型

  1. 网络八股扩展:神经网络八股扩展,增加自制数据集、数据增强、断点续训、参数提取和acc/loss可视化,实现给图识物的应用程序

  1. 卷积神经网络:用基础CNN、LeNet、AlexNet、VGGNet、InceptionNet和ResNet实现图像识别

  1. 循环神经网络:用基础RNN、LSTM、GRU实现股票预测


前两讲:使用六步法搭建了全连接网络,训练了MNIST数据集和FASHION数据集,实现了图像识别应用

本讲:讲解卷积神经网络,利用基础CNN、LeNet、AlexNet、VGGNet、InceptionNet和ResNet实现图像识别


全连接网络回顾

全连接网络中的每一个神经元小球与前后相邻层的每一个神经元都有连接关系,输入是特征,输出是预测结果。实践证明,全连接网络对识别和预测都有非常好的效果

上一讲中输入全连接网络的是一幅28行28列的784个像素点的灰度值图片,仅两层全连接网络就有十万多个待训练参数

全连接网络的参数量

在实际项目中,输入神经网络的是具有更高分辨率的彩色图片,使得送入全连接网络的输入特征数过多。随着隐藏层层数增加,网络规模过大,待优化参数过多,很容易使模型过拟合


卷积神经网络

卷积计算过程

为了减少待训练参数,在实际应用时,会先对原始图片进行特征提取,把提取出来的特征送给全连接网络,让全连接网络输出识别结果比如一幅彩色图片进入神经网络时,会先对它进行若干层特征提取,把提取到的特征送入全连接网络进行识别

全连接网络的改进

卷积计算是一种有效提取图像特征的方法。一般会用一个正方形的卷积核,按指定步长,在输入特征图上滑动,遍历这张输入特征图里的每个像素点,每滑动一个步长,卷积核会与输入特征图部分像素点重合,重合区域对应元素相乘求和,再加上偏置项,得到输出特征图的一个像素点

  • 如果输入特征是单通道灰度图,使用深度为1的单通道卷积核

  • 如果输入特征是三通道彩色图,使用一个3*3*3或5*5*3的卷积核,总之要使卷积核的通道数与输入特征图的通道数一致。因为要想让卷积核与输入特征图对应点匹配上,必须让卷积核的深度与输入特征图的深度一致,所以输入特征图的深度(channel数)决定了当前层卷积核的深度

由于每个卷积核在卷积计算后,会得到一张输出特征图,所以当前层使用了几个卷积核,就有几张输出特征图,即当前层卷积核的个数决定了当前层输出特征图的深度

如果觉得某层模型的特征提取能力不足,可以在这一层多用几个卷积核,提高这一层的特征提取能力

里面的每一个小颗粒都存储着一个待训练参数。在执行卷积计算时,卷积核里的这些参数是固定的,每次反向传播时,这些小颗粒中存储的待训练参数会被梯度下降法更新。卷积就是利用立体卷积核,实现了参数的空间共享

对于输入特征图是单通道的,选择单通道卷积核:

对于输入特征图是三通道的,选择三通道卷积核:

每滑动一步,输入特征图与卷积核里的27个元素重合,它们对应元素相乘求和再加上偏置项b,得到输出特征图中的一个像素值

用多个卷积核可实现对同一层输入特征的多次特征提取,卷积核的个数决定输出层的通道数(channels),即输出特征图的深度

卷积核在输入特征图上按指定步长滑动,每个步长,卷积核会与输入特征图上部分像素点重合,重合区域输入特征图与卷积核对应元素相乘求和,得到输出特征图中的一个像素点。当输入特征图被遍历完成,得到一张输出特征图,完成了一个卷积核的卷积计算过程;当有n个卷积核时,会有n张输出特征图,叠加在一起

Convolutional Neural Networks - Basics

感受野(Receptive Field)

输出特征图中一个像素点映射到原始输入图片的区域大小

同样一个5*5的原始输入图片,经过两层3*3卷积核作用,和经过一层5*5卷积核作用一样,都得到一个感受野是5的输出特征图

两层3*3卷积核和一层5*5卷积核的特征提取能力是一样的,选择哪种好? —— 要考虑它们所承载的待训练参数量和计算量

图片大小是x*x,卷积核为3*3,每计算出一个像素点需要9次乘加计算(卷积核大小为9)

  • x*x经过第一次卷积计算后得到的图片大小为(x-2)*(x-2),故第一次卷积的乘加计算个数为(x-2)*(x-2)*9

  • 同理,(x-2)*(x-2)经过第二次卷积计算得到的图片大小为(x-4)*(x-4),故第二次卷积的乘加计算个数为(x-4)*(x-4)*9

  • 所以计算量为(x-2)*(x-2)*9+(x-4)*(x-4)*9

图片大小是x*x,卷积核为5*5,每计算出一个像素点需要25次乘加计算(卷积核大小为25)

  • x*x经过第一次卷积计算后得到的图片大小为(x-4)*(x-4),故第一次卷积的乘加计算个数为(x-4)*(x-4)*25

  • 所以计算量为(x-4)*(x-4)*25

当采用尺寸不同的卷积核时,最大的区别就是感受野的大小不同,所以经常会 采用多层小卷积核来替换一层大卷积核,在保持感受野相同的情况下减少参数量和计算量,例如十分常见的 用2层3*3卷积核来替换1层5*5卷积核的方法

全零填充(Padding)

希望卷积计算保持输入特征图尺寸不变,可以使用全零填充,在输入特征图周围填充0

5*5*1的输入特征图经过全零填充后,再通过3*3*1的卷积核,进行步长为1的卷积计算,输出特征图仍是5*5*1,如图:

全零填充的输出特征尺寸计算

卷积输出特征图维度的计算公式:

对于5*5*1的图像来说,当padding='SAME'时,输出图像边长为5;当padding='VALID'时,输出图像边长为3


TensorFlow2描述卷积计算层

在TensorFlow框架下利用Keras来构建CNN中的卷积层,使用的是tf.keras.layers.Conv2D函数

tf.keras.layers.Conv2D (
    input_shape = (高, 宽, 通道数)   # 输入特征图维度,仅在第一层有,可省略
    filters = 卷积核个数,   # 整数
    kernel_size = 卷积核尺寸,   # 正方形写核长整数,或(核高h,核宽w)
    strides = 滑动步长,   # 横纵向相同写步长整数(通常是相同的),或(纵向步长h,横向步长w),默认1
    padding = “same” or “valid”,   # 使用全零填充是“same”,不使用是“valid”(默认)
    activation = “ relu ” or “ sigmoid ” or “ tanh ” or “ softmax”等 ,  # 如果这一层卷积后还有批标准化BN操作,不在这里进行激活,不写激活函数
)

在利用TensorFlow框架构建卷积网络时,一般会利用Batch Normalization函数构建BN层进行批标准化,所以在Conv2D函数中经常不写激活函数

# 采用6个5*5的卷积核,不使用全零填充,激活函数用sigmoid

# 写法1
Conv2D(6, 5, padding='valid', activation='sigmoid')

# 写法2
Conv2D(6, (5,5), padding='valid', activation='sigmoid')

# 写法3(推荐关键字传递参数的方法,代码可读性强)
Conv2D(filters=6, kernel_size=(5,5), padding='valid', activation='sigmoid')

卷积神经网络中的操作

卷积神经网络就是借助卷积核对输入特征进行特征提取,再把提取到的特征送入全连接网络进行识别预测

提取特征包括卷积、批标准化、激活、池化四步

批标准化(Batch Normalization,BN)

神经网络对0附近的数据更敏感,但是随着网络层数的增加,特征数据会出现偏离0均值的情况。标准化可以使数据符合以0为均值,1为标准差的标准正态分布,把偏移的特征数据重新拉回到0附近

批标准化,是对一个batch的数据在网络各层的输出做标准化处理,使数据回归标准正态分布常用在卷积操作和激活操作之间(BN层位于卷积层之后,激活层之前)

可以通过下面这个式子计算批标准化后的输出特征图:

批标准化操作,会让每个像素点进行减均值除以标准差的自更新计算。注意,是对第k个卷积核产生的batch张输出特征图集体求均值和标准差

BN操作将原本偏移的特征数据重新拉回到0均值,使进入激活函数的数据分布在激活函数的线性区,使得输入数据的微小变化更明显地体现到激活函数的输出,提升了激活函数对输入数据的区分力

BN将神经网络每层的输入都调整到均值为0,方差为1的标准正态分布,其目的是解决神经网络中的梯度消失问题

但是这种简单的特征数据标准化使特征数据完全满足标准正态分布,集中在激活函数中心的线性区域,使激活函数丧失了非线性特性。BN操作的另一个重要步骤是缩放和偏移,在BN操作中为每个卷积核引入两个可训练参数:缩放因子γ和偏移因子β,反向传播时,两个因子会与其他待训练参数一同被训练优化,使标准正态分布后的特征数据通过缩放因子和偏移因子优化了特征数据分布的宽窄和偏移量,保证了网络的非线性表达力

TensorFlow提供了BN操作的函数:tf.keras.layers.BatchNormalization()

池化(Pooling)

池化操作用于减少卷积神经网络中特征数量(降维),主要方法有最大池化和均值池化

  1. 最大池化(MaxPool2D):可以提取图片纹理

  1. 均值池化(AveragePooling2D):可以保留背景特征

TensorFlow给出了池化函数:tf.keras.layers.MaxPool2Dtf.keras.layers.AveragePooling2D。以MaxPool2D为例说明参数,AveragePooling2D同理:

tf.keras.layers.MaxPool2D(
    pool_size=池化核尺寸,  #正方形写核长整数,或(核高h,核宽w),一般池化核的高和宽是一样的
    strides=池化步长,  #步长整数, 或(纵向步长h,横向步长w),默认为pool_size
    padding=‘valid’or‘same’   #使用全零填充是“same”,不使用是“valid”(默认)
)

# 写法1
MaxPool2D(2, 2)
# 写法2
MaxPool2D(2, (2,2))
# 写法3(推荐关键字传递参数的方法,代码可读性强)
MaxPool2D(strides=2, pool_size=(2,2))

舍弃(Dropout)

为了缓解神经网络过拟合,在神经网络训练过程中,常把隐藏层的部分神经元按照一定比例从神经网络中临时舍弃;在使用神经网络时,再把所有神经元恢复到神经网络中

TensorFlow提供了Dropout的函数:tf.keras.layers.Dropout(舍弃的概率)

总结

利用上述知识,就可以构建出基本的卷积神经网络CNN了,其核心思路为:在CNN中利用卷积核(kernel)提取特征后,送入全连接网络

CNN模型的主要模块:一般包括卷积层、BN层、激活函数、池化层以及全连接层

model = tf.keras.models.Sequential([
    Conv2D(filters=6, kernel_size=(5, 5), padding='same'), # 卷积层
    BatchNormalization(), # BN层
    Activation('relu'), # 激活层
    MaxPool2D(pool_size=(2, 2), strides=2, padding='same'), # 池化层
    Dropout(0.2), # dropout层  随机舍弃掉20%的神经元
])

卷积就是特征提取器,CBAPD

  1. C:卷积层 Conv2D()

  1. B:BN层 BatchNormalization()

  1. A:激活层 Activation()

  1. P:池化层 MaxPool2D() 或 AveragePooling2D()

  1. D:dropout层 Dropout()


卷积神经网络搭建示例

构建神经网络的八股套路:

  1. import引入TensorFlow、Keras、numpy等所需模块

  1. 读取数据集

  1. 像MNIST、CIFAR10等基础数据集可以直接从sklearn等模块中引入

  1. 实际应用中,大多需要从图片和标签文件中读取所需数据集

  1. 搭建所需的网络结构

  1. 当网络结构比较简单时,可以利用Keras模块中的tf.keras.models.Sequential来搭建顺序网络模型(更方便)

  1. 当网络不再是简单的顺序结构,而是有其它特殊结构出现(如ResNet中的跳连结构),便需要利用class定义自己的网络结构(实际应用中往往使用这种)

  1. 对搭建好的网络进行编译(compile)。通常在这一步指定所采用的优化器(如Adam、sgd、RMSProp等)、损失函数(如交叉熵函数、均方差函数等)。注意,选择哪种优化器和损失函数往往对训练的速度和效果有很大的影响

  1. 将数据输入编译好的网络来进行训练(model.fit)。在这一步中指定训练轮数epochs、batch_size等信息。由于神经网络的参数量和计算量一般都比较大,训练所需的时间也比较长,尤其是在硬件条件受限的情况下,所以在这一步中通常会加入断点续训、模型参数保存等功能,使训练更加方便,同时防止程序意外停止导致数据丢失的情况发生

  1. 将神经网络模型的具体信息打印出来(model.summary),包括网络结构、网络各层的参数等,便于对网络进行浏览和检查

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/179778.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Junit单元测试框架【基础篇】

Junit单元测试框架【基础篇】🍎一.Junit单元测试框架🍒1.1 注解🍒1.2 断言🍒1.3 用例执行顺序🍒1.4 测试套件🍉1.4.1 指定类🍉1.4.1 指定包🍒1.5 参数化🍉1.5.1 单参数&a…

VBA提高篇_07 Goto跳转 / Exit退出 /VBA错误处理

文章目录使用逻辑变量控制循环使用Goto语句任意跳转捷径:使用Exit语句跳出结构保险: 使用错误处理改善用户体验On Error Goto Lablex:On Error Resume Next使用逻辑变量控制循环 使用Goto语句任意跳转 经常在错误处理时使用 捷径:使用Exit语句跳出结构 注意: 避免使用while…w…

【C++】AVL树(插入)

文章目录AVL树的概念平衡化旋转右单旋转左单旋转先左后右双旋转先右后左双旋转AVL树的插入根据BST树规则进行节点插入平衡化处理重新连接节点完整的插入函数代码AVL树的验证AVL树的性能AVL树的概念 二叉搜索树虽然可以提高查找的效率,但是二叉搜索树有其自身的缺陷&…

Python与Matlab混合编程案例

前言因为项目需要,需要批处理很多Matlab的.m文件,从每个文件中提取结果合并到一个文件中。 很明显,如果手工统计,几百个文件会累死的。 因此立即想到了Python在批处理方面的优势,因此就在网上找了相关资料,…

C++初阶:vector

文章目录1 vector介绍2 实现vector2.1 类的定义2.2 默认成员函数2.2.1 构造函数2.2.2 析构函数2.2.3 拷贝构造2.2.4 赋值重载2.3访问接口2.4 容量接口2.5 修改接口2.5.1 尾插尾删2.5.2 任意位置插入2.5.3 任意位置删除2.6 其他接口1 vector介绍 1 vector是表示可变大小数组的序…

10+编程语言实现云笔记

目标 为编程初学者打造入门学习项目,使用各种主流编程语言来实现。让想学编程的,一个都不落下。 上述基本涵盖了当前编程开发所有主流语言。 左侧为前端版本:安卓、iOS、鸿蒙、Flutter、Vue、uni-app。 右侧为服务器端版本:Jav…

代码随想录算法训练营三期 day 27 - 回溯 (3) (补)

39. 组合总和 题目链接:39. 组合总和 原文链接:39. 组合总和 视频链接:39. 组合总和 本题和 77.组合 ,216.组合总和III 的区别是:本题没有数量要求,可以无限重复,但是有总和的限制。 树形结构&…

【axios】axios的基础知识和使用

一、基础知识概念Axios 是专注于网络数据请求的库,只负责发请求、拿数据,不能操作DOM元素。相比于原生的 XMLHttpRequest 对象,axios 简单易用。相比于 jQuery,axios 更加轻量化,不能操作DOM元素,只专注于网络数据请求…

cubeIDE开发, stm32人工智能开发应用实践(Cube.AI).篇二

一、事有蹊跷 接篇一,前面提到在使用cube.AI生成的c语言神经网络模型API调用时,输入数据数量是24,输出数据数量是4,但上文设想采集了三轴加速度传感器的x/y/z三个各数据,按Jogging(慢跑),Walking(走了)两种态势采集了两…

Java链表OJ题

目录1. 删除链表中等于给定值val的所有结点2. 逆置单链表3. 链表的中间结点4. 链表中倒数第k个结点5. 将两个有序链表合并为一个新的有序链表6. 以给定值x为基准将链表分割成两部分7. 判断是否为回文链表8. 两个链表的第一个公共结点9. 判断链表中是否有环10. 链表开始入环的第…

【Linux】目录权限和默认权限

上期介绍了Linux的文件权限,这期我们仔细来说说Linux环境下目录权限和默认权限一、目录权限1.1 进入目录所需的权限我们在进入目录时需要什么样的权限呢?是r、w还是x呢?下面我们一起来验证一下:📋如下我门拥有全部目录…

Day11 AOP介绍

1 前言AOP,Aspect Oriented Programming,面向切面编程,是对面向对象编程OOP的升华。OOP是纵向对一个事物的抽象,一个对象包括静态的属性信息,包括动态的方法信息等。而AOP是横向的对不同事物的抽象,属性与属…

【Python从入门到精通】第一阶段

文章目录前言python的起源打印hello world注释变量变量基本概念类型类型转换运算符字符串拓展字符串的三种定义方法字符串拼接字符串格式化数据输入input比较布尔类型和比较运算符if判断if elseif elif else嵌套循环while循环while循环嵌套for循环range()的使用函数的使用函数的…

3小时精通opencv(五) 利用TrackBar进行颜色检测

3小时精通opencv(五) 利用TrackBar进行颜色检测 参考视频资源:3h精通Opencv-Python 本章内容介绍如何利用TrackBar调节色域, 手动提取到我们需要的颜色 文章目录3小时精通opencv(五) 利用TrackBar进行颜色检测创建Trackbar色彩检测创建Trackbar 在opencv中使用createTrackbar函…

C语言:数组

往期文章 C语言:初识C语言C语言:分支语句和循环语句C语言:函数 目录往期文章前言1. 一维数组的创建和初始化1.1 数组的创建1.2 数组的初始化2. 一维数组的使用3. 一维数组在内存中的存储4. 二维数组的创建和初始化4.1 二维数组的创建4.2 二维…

大数据技术架构(组件)7——Hive:Filter PushDown Cases And Outer Join Behavior

1.2、Filter PushDown Cases And Outer Join Behavior前提:关闭优化器set hive.auto.convertjoinfalse; set hive.cbo.enablefalse;Inner Join:1、Join On中的谓词: 左表下推、右表下推2、Where谓词:左表下推、右表下推-- 第一种情况: join on 谓词 selectt1.user_id,t2.user_i…

C++函数定义和调用介绍

C函数定义和调用介绍 函数的意义:利用率高,可读性强,利于移植。 一个C程序中主函数有且只有一个,是程序的入口,而函数(或称子函数)可以有很多。 每个 C 程序都至少有一个函数,即主…

2021 XV6 8:locks

实验有两个任务,都是为了减少锁的竞争从而提高运行效率。Memory allocator一开始我们是有个双向链表用来存储空闲的内存块,如果很多个进程要竞争这一个链表,就会把效率降低很多。所以我们把链表拆成每个CPU一个,在申请内存的时候就…

栈和队列的应用

一、栈在括号匹配中的应用 数据结构之栈_迷茫中的小伙的博客-CSDN博客_数据结构之栈栈括号和队列的应用 二、栈在表达式求值中的应用 中缀转 ->后缀 : 左右先 (左边能先算,先算左边,因为这样可以保证确定性,即计算机运算的方式) 后缀转->中缀 &#xff1a…

王者荣耀入门技能树-解答

前言 前段时间写了一篇关于王者荣耀入门技能树的习题,今天来给大家解答一下。 职业 以下哪个不属于王者荣耀中的职业: 射手法师辅助亚瑟 这道题选:亚瑟 王者荣耀中有6大职业分类,分别是:坦克、战士、刺客、法师、…