【人工智能原理自学】卷积神经网络:图像识别实战

news2025/1/15 10:41:24

😊你好,我是小航,一个正在变秃、变强的文艺倾年。
🔔本文讲解卷积神经网络:图像识别实战,一起卷起来叭!

目录

  • 一、“卷”
  • 二、LeNet-5网络

在这里插入图片描述

一、“卷”

这节课我们来看如何把卷积运算融入到神经网络中,我们还是以上节的“5”为例:
在这里插入图片描述
这是一张 8 * 8 的灰度图,用一个 3 * 3 的卷积核对它进行卷积,输出一个 6 * 6 的结果,我们把这个做卷积运算的一层称为卷积层。卷完以后我们把结果拆成一个数组,送入到后面的全连接层神经网络中。

那么问题来了,卷积核中的各个值是多少呢?实际上,我们不必管它,随机初始化这些值就好,卷积核的值也是通过训练学习而来的。

💡那么如何反向传播调整参数呢?
在这里插入图片描述
我们知道,卷积的过程就是:卷积核依次和这些小图(局部数据)对应元素相乘再相加得到一个值。
在这里插入图片描述
这个 3 * 3 的小区域的每个元素值是输入数据卷积核上的值可以看作是对应输入数据的权值参数W。对应元素相乘并相加得到了一个线性函数:
在这里插入图片描述
当然偏置项b、激活函数也不能少:
在这里插入图片描述
不过还需要注意几个细节:

  • 首先这四个神经元的输出是根据卷积的过程排列而成的二维的结构,所以我们在送入全连接层时需要手动进行平铺
  • 然后这四个神经元的输入并不相同,实际上是同一个图片的不同区域
  • 最后这四个神经元的权值参数并不是独立的,它们都来自同一个卷积核,所以实际上它们的权值参数(包括偏置项b)是一样的,我们只是把一个东西强行拆开平铺成4个。也就是说这四个神经元复用了同一套权重参数,这就是所谓的参数共享
    在这里插入图片描述
    相比之下我们使用全连接层,需要特别多的参数:
    在这里插入图片描述
    而对于卷积层,由于使用参数共享,只需要使用10个参数:
    在这里插入图片描述
    实际上你想要提取多少特征就搞多少个卷积核就可以
    在这里插入图片描述
    我们都知道灰度图片是一个通道的,而彩色图片有三个通道的:
    在这里插入图片描述
    此时我们的卷积运算也需要在三维上运算:
    在这里插入图片描述

二、LeNet-5网络

在卷积网络发展的早期,深度学习领域巨头人物LeCun1988年提出了一种经典的卷积神经网络结构:LeNet-5

在这里插入图片描述
可以看出,LeNet-5就卷了两次之后再送入全连接层。
在这里插入图片描述
这两层立方块就是所谓的“池化层”,我们从这个数据的左上角开始,框出 2 * 2 区域,相加取平均值,这就是所谓“平均池化” (当然也可以取最大值,称为“最大池化”
在这里插入图片描述
🔨我们简单的复现一下LeNet-5网络LeNet-5.py.py

简单的补充说明一下:
X_train数据说明:
在这里插入图片描述
卷积前后图像大小的计算:
在这里插入图片描述
卷积-Same模式:
在这里插入图片描述
卷积-Valid模式:
在这里插入图片描述

# 导入数据集
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense
from keras.optimizers import SGD
# One-Hot编码转化
from keras.utils import to_categorical
# 2D卷积层
from keras.layers import Conv2D
# 二维平均池化层
from keras.layers import AveragePooling2D
# 数组平铺
from keras.layers import Flatten

(X_train, Y_train), (X_test, Y_test) = mnist.load_data()
# 减少差距,加快梯度下降,归一化操作
X_train = X_train.reshape(60000, 28, 28, 1) / 255.0
X_test = X_test.reshape(10000, 28, 28, 1) / 255.0

Y_train = to_categorical(Y_train, 10)
Y_test = to_categorical(Y_test, 10)

model = Sequential()
# 卷积层部分
model.add(
    Conv2D(
        filters=6,  # 卷积核/过滤器数量
        kernel_size=(5, 5),  # 卷积核尺寸
        strides=(1, 1),  # 步长
        input_shape=(28, 28, 1),  # 输入形状
        padding='valid',  # 填充模式(越卷越小)
        activation='relu'  # 激活函数
    )
)
# 池化窗口大小为 2*2
model.add(AveragePooling2D(pool_size=(2, 2)))
model.add(
    Conv2D(
        filters=16,  # 卷积核/过滤器数量
        kernel_size=(5, 5),  # 卷积核尺寸
        strides=(1, 1),  # 步长
        padding='valid',  # 填充模式(越卷越小)
        activation='relu'  # 激活函数
    )
)
model.add(AveragePooling2D(pool_size=(2, 2)))
model.add(Flatten())
# 全连接层部分
model.add(Dense(units=120, activation='relu'))
model.add(Dense(units=84, activation='relu'))
model.add(Dense(units=10, activation='softmax'))

# 送入训练
model.compile(loss='categorical_crossentropy', optimizer=SGD(lr=0.05), metrics=['accuracy'])
model.fit(X_train, Y_train, epochs=100, batch_size=256)

# 评估测试集
loss, accuracy = model.evaluate(X_test, Y_test)
print("loss" + str(loss))
print("accuracy" + str(accuracy))

🚩训练结果与测试结果如下:

在这里插入图片描述

📌 [ 笔者 ]   文艺倾年
📃 [ 更新 ]   2023.1.23
❌ [ 勘误 ]   /* 暂无 */
📜 [ 声明 ]   由于作者水平有限,本文有错误和不准确之处在所难免,
              本人也很想知道这些错误,恳望读者批评指正!
🔍 [ 代码 ]   https://github.com/itxaiohanglover/ai_lesson

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/176372.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【青训营】Go语言的基本语法

一、 配置Go语言及其开发环境 Mac配置:http://t.zoukankan.com/zsy-p-6685889.html https://wenku.baidu.com/view/8aeec92b15fc700abb68a98271fe910ef12daeaf.html?wkts1673764660043&bdQuery%E5%A6%82%E4%BD%95%E9%85%8D%E7%BD%AEgopathmac 二、基础语法 p…

避免用Apache Beanutils进行属性的copy。why?让我们一起一探究竟。

在实际的项目开发中,对象间赋值普遍存在,随着双十一、秒杀等电商过程愈加复杂,数据量也在不断攀升,效率问题,浮出水面。 问:如果是你来写对象间赋值的代码,你会怎么做? 答&#xf…

05 |「链表」刷题

前言 前言:链表面试高频题。 文章目录前言一. 基础回顾二. 高频考题1. 例题1)题目链接(LeetCode 206 反转链表)2) 算法思路3)源码剖析4)时间复杂度2. 习题一. 基础回顾 参考上一讲: …

线性代数[向量]

系列文章目录 第一章 线性代数[初等变换(一)] 第二章 线性代数[初等变换(二)] 第三章 线性代数[初等变换(三)] 第四章 线性代数[矩阵的秩] 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.引入 二.向…

计网必会:运输层概述、网络层介绍、TCP、UDP、多路复用、多路分解

文章目录运输层概念回顾TCP 和UDP概述介绍网络层TCP UDP网络层的联系多路复用和多路分解多路复用和多路分解的中国话理解TCP的多路复用和多路分解与UDP的区别HTTP 会话Web服务器和TCPUDP的多路复用和多路分解源端口号的用处的中国话理解UDP套接字无连接运输UDP 的优势运输层概念…

【C语言进阶】指针进阶(详细版)

目录 一、字符指针 二、指针数组 三、数组指针 1、数组指针的定义 2、&数组名和数组名的区别 3、数组指针的使用 四、数组传参和指针传参 1、一维数组传参 2、一级指针传参 3、二维数组传参 4、二级指针传参 五、函数指针 1、函数指针的定义 2、函数指针的使用 六、…

如何与他人交流

上期我们讲了打破预期,顺应主体,我的别人交流,只有在不把别人当成对象(工具人),而是把对方当成主体的情况下(让别人感受到尊重),这是相互尊重的终极本质,也是唯一方法.把别人当人看.认同对方,对方也会认同你.自信从何而来自信本意为相信自己,所以自信本应该是由内而外的事物,但…

【MySQL进阶】MySQL事务详解

序号系列文章5【MySQL基础】字符集与校对集详解6【MySQL基础】MySQL单表操作详解7【MySQL基础】运算符及相关函数详解8【MySQL基础】MySQL多表操作详解文章目录前言1,事务概念2,事务四大特性2.1,原子性2.2,一致性2.3,隔…

ORB SLAM3 ubuntu18.04 ROS 运行 段错误 (核心已转储) 踩坑及解决

问题猜测及解决:opencv版本兼容性 项目版本:ORB SLAM3 V1.0版本 CPU:13600K (大小核架构不知是否会影响) 电脑环境:ubuntu18.04 ROS运行 相机:D435 i opencv版本:3.2 and 4.6 前提:编译无报错&a…

Java 23种设计模式(3.创建者模式-原型模式)

1.概述 用一个已经创建的实例作为原型,通过复制该原型对象来创建一个和原型对象相同的新对象。 2.结构 原型模式包含如下角色: 抽象原型类: 规定了具体原型对象必须实现的的 clone() 方法。 具体原型类: 实现抽象原型类的 clon…

多线程(5)

文章目录前言 :常见锁策略了1.悲观锁 VS 乐观锁2. 轻量级锁 VS 重量级锁3.自旋锁 VS 挂起等待锁4. 读写锁 VS 普通的互斥锁5. 公平锁 和 非公平锁6. 可重入锁 VS 不可重入锁CAS1. CAS 的应用场景2. CAS 的典型问题 : ABA 问题synchronized 原理1.锁升级 / 锁膨胀2.锁…

Ae 效果详解:发光

效果/风格化/发光Effects/Stylize/Glow发光 Glow效果可找到图像中的较亮部分,然后使那些像素和周围的像素变亮,以创建漫射的发光光环。可以创建两种颜色(颜色 A 和颜色 B )之间的渐变发光,并可通过复制发光效果以创建更…

RESTful开发风格 与 SpringMVC跨域访问

RESTful REST:表现层状态转换,资源在网络中以某种表现形式进行状态转移RESTful 是基于 REST理念 的一套开发风格,是具体的开发规则,如果一个架构符合REST 原则,就称为 RESTful 架构。 RESTful 开发规范:…

【leetcode】学了栈和队列却觉得无用武之地?试试这几道题目吧!

目录 0.写在前面 1.leetcode.20 有效的括号 2.leetcode.225 用队列实现栈 3.用栈实现队列 4.设计循环队列 0.写在前面 这些题目所用语言为C语言,由于C语言未提供栈和队列的数据结构,所以需要我们手动实现栈和队列。此外熟练掌握栈和队列的性质对解…

【C++】从0到1入门C++编程学习笔记 - 实战篇:职工管理系统

文章目录一、需求分析二、创建项目2.1 创建新项目2.2 添加文件三、创建管理类3.1 创建文件3.2 头文件实现3.3 源文件实现四、菜单功能4.1 添加成员函数4.2 菜单功能实现4.3 测试菜单功能五、退出功能5.1 提供功能接口5.2 实现退出功能5.3 测试功能六、创建职工类6.1 创建职工抽…

虚拟机克隆两网卡冲突

常见网卡设置 vim /etc/sysconfig/network-scripts/ifcfg-ens33TYPEEthernet BOOTPROTOstatic DEFROUTEyes NAMEens33 UUID025f7880-7357-4148-ae5a-a629d597c133 DEVICEens33 ONBOOTyes DNS18.8.8.8 IPADDR 192.168.100.16 GATEWAY192.168.100.254 NETMASK255.255.255.0有的版…

25/365 java 守护线程 线程同步 synchronized

1.守护线程 线程分为守护线程和用户线程 : daemon thread and non-daemon thread 虚拟机必须等待用户线程执行完毕,但无需等待守护线程执行完毕。 守护线程举例:垃圾回收线程,监控内存线程。 setDaemon(true):默认为false,默…

【LeetCode:121. 买卖股票的最佳时机~~~动态规划】

题目描述 给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票,并选择在 未来的某一个不同的日子 卖出该股票。设计一个算法来计算你所能获取的最大利润。 返回你可以从这笔交易中获取的…

【微信小程序】文章点赞功能的实现

🏆今日学习目标:第二十期——文章点赞功能的实现 ✨个人主页:颜颜yan_的个人主页 ⏰预计时间:15分钟 🎉专栏系列:我的第一个微信小程序 文章目录前言效果图实现步骤总结前言 哈喽大家好,本期是…

Unity简单几行代码让玩家水平移动更丝滑真实

可以先来看看基础的移动代码,接收玩家的输入,然后赋予刚体速度。 但是这种写法存在几个问题,下面一一纠正。 首先,如果直接改变刚体的速度,那么可能会出现穿墙的问题。 而且没有一种从速度0到缓慢加速的过程&#xff…