基于 LeNet 网络的 MNIST 数据集图像分类

基于 LeNet 网络的 MNIST 数据集图像分类

news2026/2/15 17:34:36

1.LeNet的原始实验数据集MNIST

名称：MNIST手写数字数据集

数据类型：灰度图（一通道）

图像大小：28*28

类别数：10类（数字0-9）

1.通过torchvision.datasets.MNIST下载并保存到本地为JPEG图片：

下载数据集并保存图片形式（download_mnist.py）

库：sys,os,tqdm

图片命名的格式为：子数据集名_在子数据集中的编号_真实值标签。

图片大小：28*28

2.使用gzip解析MNIST数据集文件parse_mnist.py

MNIST的图片和标签均通过二进制文件进行保存（.gz），无法直接在Windows中查看手写数字的图片和标签，通过gzip解压,转换为numpy数组。

将标签数据转换为one-hot编码:将每个标签转换为一个向量，其中该标签对应的索引位置为 1，其他位置为 0。

one-hot编码

将类别标签转化为一个 长度为类别数的二进制向量，每个类别的位置对应为 1，其它位置为 0。

one-hot编码

将类别标签转化为一个 长度为类别数的二进制向量，每个类别的位置对应为 1，其它位置为 0。

数字 0 → [1, 0, 0, 0, 0, 0, 0, 0, 0, 0]
数字 1 → [0, 1, 0, 0, 0, 0, 0, 0, 0, 0]
数字 2 → [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

3、预处理数据集(prepare_data.py)

调用parse_mnist函数对原始的mnist数据进行解析，创建数据加载器train_loader

归一化：将加载的图像数据除以 255.0，将图像的像素值从 [0, 255] 范围缩放到 [0, 1]。
转换为 Tensor：将NumPy 数组转换为 PyTorch 的 Tensor 。
重塑图像：将图像数据从 28x28 的二维数组重塑为符合神经网络输入要求的形状 (-1, 1, 28, 28)。
创建数据集和数据加载器：

train_dataset = TensorDataset(train_image, train_label)
#TensorDataset：数据集类，将图像和标签数据封装成一个数据集
train_loader=(train_dataset,batch_size=64,shuffle=True)
#DataLoader：数据加载器类，数据集分成小批次，shuffle=True可打乱

2.LeNet神经网络模型

公式

1.N = (W-F+2P)/S+1

卷积后尺寸=（输入-卷积核+加边像素数）/步长 +1

用于计算卷积层/池化层输出的尺寸，参数含义：

N：输出特征图的大小

W：输入特征图的大小

F：卷积核的大小（5*5）

P：填充（padding）的大小，表示在输入的边缘填充多少像素

S: 步长（stride），卷积核每次滑动的步幅

2.输出通道数 = 卷积核组数量

输入通道数=上一层的输出通道数

卷积层通道数逐渐增加

3.输出图像尺度计算

N = (W-F+2P)/S+1

第一层：C1卷积层

输入：28*28*1

参数：self.c1 = nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, padding=2,stride=1)

输出：28*28*6(padding=2宽高不变，通道数为6)

第二层：S2池化层（使图像尺寸减半）

输入：28*28*6

参数：self.s2 = nn.AvgPool2d(kernel_size=2, stride=2,padding=0)

池化核大小默认等于步长，使输出大小是输入大小的一半

输出：14*14*6

第三层：C3卷积层

输入：14*14*6

参数：self.c3 = nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5,padding=0,stride=1)

输出：10*10*16

第四层：S4池化层

输入：10*10*16

参数：self.s4 = nn.AvgPool2d(kernel_size=2, stride=2)

输出：5*5*16

第五层：C5卷积层

输入：5*5*16

参数self.c5 = nn.Conv2：d(in_channels=16, out_channels=120, kernel_size=5,padding=0,stride=1)

输出：1*1*120

概念

卷积层

卷积核：二维数组

主要功能：对输入数据进行特征提取，卷积操作实质上是把卷积核当滤波器在图像上特征提取。

卷积步骤：

卷积窗口从输入数组的最左上方，从左往右、从上到下，依次在输入数组上滑动。
窗口中的输入子数组与卷积核按元素相乘并求和，得到输出数组中相应位置的元素。

池化层

基本操作：缩小图片，保留重要特征。不会裁剪删除内容。

池化步骤：

池化层对输入数据的局部区域（池化窗口）计算输出，取最大值或平均值，最终降低特征图的尺寸。

最大池化Max Pooling

取局部区域的最大值

作用：保留最明显的特征（边缘、纹理）

平均池化Avg Pooling

取局部区域的平均值

作用：反映特征的整体分布情况。

池化核大小Kernel_size

定义池化窗口的大小

步长stride

控制窗口移动的步长（默认等于池化核大小）

填充padding

在输入特征图的边缘补零：

保持输出大小不变（如 padding=1 可以保持尺寸）。

防止边缘信息丢失

激活函数（非线性函数）

（1）sigmoid函数

输出范围（0,1），适用于输出概率。sigmoid函数清晰地解释神经元激活水平：接近1，更高激活；接近0，较低激活。

应用场景：二分类问题

（2）ReLU激活函数

如果输入x是正数，ReLU 输出 x本身。

如果输入x是负数，ReLU 输出 0。

作用：

激活函数的作用是让网络学习非线性的特征
解决梯度消失问题：Sigmoid 和 Tanh 函数，输入值变的特别大或特别小时，激活函数的梯度接近0.

缺点：

死神经元问题：某些神经元输出永远是 0 时（也就是当输入总是负数时）。这会导致这些神经元在训练过程中不再被更新

（3）tanh函数

输出范围：（-1,1）

优化算法

ADM算法

AGD随机梯度下降

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2312023.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Day4 C语言与画面显示练习

Day4 C语言与画面显示练习

文章目录 1. harib01a例程2. harib01b例程3. harib01e例程4. harib01f例程5. harib01h例程 1. harib01a例程上一章主要是将画面搞成黑屏，如果期望做点什么图案，只需要再VRAM里写点什么就好了，使用nask汇编语言实现一个函数write_mem8&#…

阅读更多...

一周热点-OpenAI 推出了 GPT-4.5，这可能是其最后一个非推理模型

一周热点-OpenAI 推出了 GPT-4.5，这可能是其最后一个非推理模型

在人工智能领域，大型语言模型一直是研究的热点。OpenAI 的 GPT 系列模型在自然语言处理方面取得了显著成就。GPT-4.5 是 OpenAI 在这一领域的又一力作，它在多个方面进行了升级和优化。 1 新模型的出现 GPT-4.5 目前作为研究预览版发布。与 OpenAI 最近的 o1 和 o3 模型不同，…

阅读更多...

《UE5_C++多人TPS完整教程》学习笔记34 ——《P35 网络角色（Network Role）》

《UE5_C++多人TPS完整教程》学习笔记34 ——《P35 网络角色（Network Role）》

本文为B站系列教学视频《UE5_C多人TPS完整教程》 —— 《P35 网络角色（Network Role）》的学习笔记，该系列教学视频为计算机工程师、程序员、游戏开发者、作家（Engineer, Programmer, Game Developer, Author） Stephe…

阅读更多...

手写简易Tomcat核心实现：深入理解Servlet容器原理

手写简易Tomcat核心实现：深入理解Servlet容器原理

目录一、Tomcat概况 1. tomcat全局图 2.项目结构概览二、实现步骤详解 2.1 基础工具包（com.qcby.util） 2.1.1 ResponseUtil：HTTP响应生成工具 2.1.2 SearchClassUtil：类扫描工具 2.1.3 WebServlet：自定义注解…

阅读更多...

mac本地安装运行Redis-单机

mac本地安装运行Redis-单机

记录一下我以前用的连接服务器的跨平台SSH客户端。因为还要准备毕设...... 服务器又过期了，只能把redis安装下载到本地了。目录 1.github下载Redis 2.安装homebrew 3.更新GCC 4.自行安装Redis 5.通过 Homebrew 安装 Redis 安装地址：https://git…

阅读更多...

【ThreeJS Basics 09】Debug

【ThreeJS Basics 09】Debug

文章目录简介从 dat.GUI 到 lil-gui例子安装 lil-gui 并实例化不同类型的调整改变位置针对非属性的调整复选框颜色功能/按钮调整几何形状文件夹调整 GUI宽度标题关闭文件夹隐藏按键切换结论简介每一个创意项目的一个基本方面是能够轻松调整。开发人员和参与项目的其他参与…

阅读更多...

【笔记】STM32L4系列使用RT-Thread Studio电源管理组件（PM框架）实现低功耗

【笔记】STM32L4系列使用RT-Thread Studio电源管理组件（PM框架）实现低功耗

硬件平台：STM32L431RCT6 RT-Thread版本：4.1.0 目录一.新建工程二.配置工程编辑三.移植pm驱动四.配置cubeMX 五.修改驱动文件，干掉报错六.增加用户低功耗逻辑 1.设置唤醒方式 2.设置睡眠时以及唤醒后动作编辑 3.增加测试命…

阅读更多...

类和对象：

类和对象：

1. 类的定义： 1. 类定义格式： 对于我们的类的话，我们是把类看成一个整体，我们的函数里面没有找到我们的成员变量，我们就在我们的类里面找。我们看我们的第二点： 我们的类里面，我们通常会对…

阅读更多...

【十三】Golang 通道

【十三】Golang 通道

💢欢迎来到张胤尘的开源技术站 💥开源如江河，汇聚众志成。代码似星辰，照亮行征程。开源精神长，传承永不忘。携手共前行，未来更辉煌💥 文章目录通道通道声明初始化缓冲机制无缓冲通道代码示例带…

阅读更多...

软考中级_【软件设计师】知识点之【面向对象】

软考中级_【软件设计师】知识点之【面向对象】

简介： 软件设计师考试中，面向对象模块为核心考点，涵盖类与对象、继承、封装、多态等基础概念，重点考查UML建模（类图/时序图/用例图）、设计模式（如工厂、单例模式）及SOLID设计原则。要…

阅读更多...

分布式锁—7.Curator的分布式锁一

分布式锁—7.Curator的分布式锁一

大纲 1.Curator的可重入锁的源码 2.Curator的非可重入锁的源码 3.Curator的可重入读写锁的源码 4.Curator的MultiLock源码 5.Curator的Semaphore源码 1.Curator的可重入锁的源码 (1)InterProcessMutex获取分布式锁 (2)InterProcessMutex的初始化 (3)InterProcessMutex.…

阅读更多...

《UE5_C++多人TPS完整教程》学习笔记35 ——《P36 武器类（Weapon Class）》

《UE5_C++多人TPS完整教程》学习笔记35 ——《P36 武器类（Weapon Class）》

本文为B站系列教学视频《UE5_C多人TPS完整教程》 —— 《P36 武器类（Weapon Class）》的学习笔记，该系列教学视频为计算机工程师、程序员、游戏开发者、作家（Engineer, Programmer, Game Developer, Author） Stephen …

阅读更多...

[密码学实战]Java实现国密TLSv1.3单向认证

[密码学实战]Java实现国密TLSv1.3单向认证

一、代码运行结果 1.1 运行环境 1.2 运行结果 1.3 项目架构二、TLS 协议基础与国密背景 2.1 TLS 协议的核心作用 TLS（Transport Layer Security）是保障网络通信安全的加密协议，位于 TCP/IP 协议栈的应用层和传输层之间，提供： • 数据机密性：通过对称加密算法（如 AE…

阅读更多...

最小栈 _ _

最小栈 _ _

一：题目二：思路解释：一个栈名为st，其用来正常的出入栈，一个栈名为minst，其的栈顶元素一定是最小的元素入栈：第一个元素，两个栈一起入，后面再入栈，只有入栈…

阅读更多...

HTTPS加密原理详解

HTTPS加密原理详解

目录 HTTPS是什么加密是什么 HTTPS的工作流程 1.使用对称加密 2.引入非对称加密 3.引入证书机制客户端验证证书真伪的过程签名的加密流程整体工作流程总结 HTTPS是什么 HTTPS协议也是一个应用程协议，是在HTTP的基础上加入了一个加密层，由…

阅读更多...

黑金风格人像静物户外旅拍Lr调色教程，手机滤镜PS+Lightroom预设下载！

黑金风格人像静物户外旅拍Lr调色教程，手机滤镜PS+Lightroom预设下载！

调色教程针对人像、静物以及户外旅拍照片，运用 Lightroom 软件进行风格化调色工作。旨在通过软件中的多种工具，如基本参数调整、HSL（色相、饱和度、明亮度）调整、曲线工具等改变照片原本的色彩、明度、对比度等属性，将…

阅读更多...

安装pyqt6出现的问题

安装pyqt6出现的问题

安装PyQt6报错： PermissionError: [WinError 32] 另一个程序正在使用此文件，进程无法访问。: C:\\Users\\xyj19\\AppData\\Local\\Temp\\tmp3xfmekh7 [end of output] note: This error originates from a subprocess, and is likely not a pr…

阅读更多...

java调用c++

java调用c++

VScode 配置java 并且使用JNA调用c 动态库安装 Java 开发环境安装 JDK官网直接下载就好，推荐镜像下载通过网盘分享的文件：jdk-8u144-windows-x64.exe 链接: https://pan.baidu.com/s/1Ov9bJkPNnOgcliBL-PSTFQ?pwdpg43 提取码: pg43 直接安…

阅读更多...

gitlab+jenkins+harbor+k8s安装操作流程之Jenkins

gitlab+jenkins+harbor+k8s安装操作流程之Jenkins

准备环境一台centos7系统 4C/8G/100G 如果是jenkins2.5以上版本需要centos8以上版本 JDK1.8编译安装(最新版本jdk需要18以上) MAVEN编译安装 GIT编译安装 JDK1.8步骤 tar -zxvf 解压 vim /etc/profile export JAVA_HOME/data/jdk1.8.0_111 export JRE_HOME$JAVA…

阅读更多...

【机械视觉】C#+VisionPro联合编程———【三、加载CogToolBlock工具详解，以及实例】

【机械视觉】C#+VisionPro联合编程———【三、加载CogToolBlock工具详解，以及实例】

【机械视觉】C#VisionPro联合编程———【三、加载CogToolBlock工具详解，以及实例】在VisionPro中，CogToolBlock 是一种容器工具，可以将多个视觉工具（如CogBlob、CogPMAlign等）组合成一个可复用的流程。通过C#与Visi…

阅读更多...

推荐文章

最新文章