经典卷积神经网络LeNet实现(pytorch版)

news2025/4/2 20:54:33

LeNet卷积神经网络

  • 一、理论部分
    • 1.1 核心理论
    • 1.2 LeNet-5 网络结构
    • 1.3 关键细节
    • 1.4 后期改进
    • 1.6 意义与局限性
  • 二、代码实现
    • 2.1 导包
    • 2.1 数据加载和处理
    • 2.3 网络构建
    • 2.4 训练和测试函数
      • 2.4.1 训练函数
      • 2.4.2 测试函数
    • 2.5 训练和保存模型
    • 2.6 模型加载和预测

一、理论部分

LeNet是一种经典的卷积神经网络(CNN),由Yann LeCun等人于1998年提出,最初用于手写数字识别(如MNIST数据集)。它是CNN的奠基性工作之一,其核心思想是通过局部感受野、共享权重和空间下采样来提取有效特征


1.1 核心理论

  • 局部感受野(Local Receptive Fields)
    卷积层通过小尺寸的滤波器(如5×5)扫描输入图像,每个神经元仅连接输入图像的局部区域,从而捕捉局部特征(如边缘、纹理)

  • 共享权重(Weight Sharing)
    同一卷积层的滤波器在整张图像上共享参数,显著减少参数量,增强平移不变性

  • 空间下采样(Subsampling)
    池化层(如平均池化)降低特征图的分辨率,减少计算量并增强对微小平移的鲁棒性

  • 多层特征组合
    通过交替的卷积和池化层,逐步组合低层特征(边缘)为高层特征(数字形状)


1.2 LeNet-5 网络结构

LeNet-5是LeNet系列中最著名的版本,其结构如下(输入为32×32灰度图像):

层类型 参数说明 输出尺寸
输入层 灰度图像 32×32×1
C1层 卷积层:6个5×5滤波器,步长1,无填充 28×28×6
S2层 平均池化:2×2窗口,步长2 14×14×6
C3层 卷积层:16个5×5滤波器,步长1 10×10×16
S4层 平均池化:2×2窗口,步长2 5×5×16
C5层 卷积层:120个5×5滤波器 1×1×120
F6层 全连接层:84个神经元 84
输出层 全连接 + Softmax(10类) 10

1.3 关键细节

  • 激活函数
    原始LeNet使用Tanh或Sigmoid,现代实现常用ReLU

  • 池化方式
    原始版本使用平均池化,后续改进可能用最大池化

  • 参数量优化
    C3层并非全连接至S2的所有通道,而是采用部分连接(如论文中的连接表),减少计算量

  • 输出处理
    最后通过全连接层(F6)和Softmax输出分类概率(如0-9数字)


1.4 后期改进

  • ReLU替代Tanh:解决梯度消失问题,加速训练
  • 最大池化:更关注显著特征,抑制噪声
  • Batch Normalization:稳定训练过程
  • Dropout:防止过拟合(原LeNet未使用)

1.6 意义与局限性

  • 意义
    证明了CNN在视觉任务中的有效性,启发了现代深度学习模型(如AlexNet、ResNet)

  • 局限性
    参数量小、层数浅,对复杂数据(如ImageNet)表现不足,需更深的网络结构

LeNet的设计思想至今仍是CNN的基础,理解它有助于掌握现代卷积神经网络的演变逻辑

二、代码实现

  • LeNet 是一个经典的卷积神经网络(CNN),由 Yann LeCun 等人于 1998 年提出,主要用于手写数字识别(如 MNIST 数据集)
  • MNIST数据集是机器学习领域中非常经典的一个数据集,由60000个训练样本和10000个测试样本组成,每个样本都是一张28 * 28像素的灰度手写数字图片
  • 总体来看,LeNet(LeNet-5)由两个部分组成:(1)卷积编码器:由两个卷积层组成(2)全连接层密集块:由三个全连接层组成

2.1 导包

import torch
import torch.nn as nn
import torchvision
from tqdm import tqdm
from torchsummary import summary

2.1 数据加载和处理

# 加载 MNIST 数据集
def load_data(batch_size=64):
    transform = torchvision.transforms.Compose([
        torchvision.transforms.ToTensor(),  # 将图像转换为张量
        torchvision.transforms.Normalize((0.5,), (0.5,))  # 归一化
    ])
    
    # 下载训练集和测试集
    train_dataset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
    test_dataset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
    
    # 创建 DataLoader
    train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
    test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)
    return train_loader, test_loader

2.3 网络构建

  • LeNet 的网络结构如下:
    • 卷积层 1:输入通道 1,输出通道 6,卷积核大小 5x5
    • 池化层 1:2x2 的最大池化
    • 卷积层 2:输入通道 6,输出通道 16,卷积核大小 5x5。
    • 池化层 2:2x2 的最大池化。
    • 全连接层 1:输入 16x5x5,输出 120
    • 全连接层 2:输入 120,输出 84
    • 全连接层 3:输入 84,输出 10(对应 10 个类别)
#定义LeNet网络架构
class LeNet(nn.Module):
    def __init__(self):
        super(LeNet,self).__init__()
        self.net=nn.Sequential(
            #卷积层1
            nn.Conv2d

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2326775.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【2】数据结构的单链表章

目录标题 单链表的定义单链表的初始化单链表的建立头插法创建尾插法创建 查找操作按序号查找按内容查找 插入操作删除操作合并操作 单链表总代码与调试 单链表的定义 结点(Node)的定义:数据域(data)和指针域&#xff…

Linux(十一)fork实例练习、文件操作示例及相关面试题目分享

一、fork实例练习 1、思考下面这段代码的打印结果是什么&#xff1f; #include<stdio.h> #include<unistd.h> #include<assert.h> #include<stdlib.h>int main(){int i0;for(;i<2;i){fork();printf("A\n");} exit(0); }所以一共打印6…

open3d教程 (三)点云的显示

官方文档位置&#xff1a; Visualization - Open3D 0.19.0 documentationhttps://www.open3d.org/docs/release/tutorial/visualization/visualization.html核心方法&#xff1a; o3d.visualization.draw_geometries([几何对象列表]) import open3d as o3dprint("Load …

根据模板将 Excel 明细数据生成 Txt 文档|邮件合并

在日常办公中&#xff0c;我们常常会遇到需要批量生成文档的任务。以往&#xff0c;若要将 Excel 中的每一条数据都转化为单独的文档&#xff0c;且文档部分内容依据 Excel 数据动态变化&#xff0c;手动操作不仅繁琐&#xff0c;还容易出错。现在&#xff0c;有一种便捷的方法…

LVGL Dropdown和Calendar详解

LVGL Dropdown和Calendar详解 一、Dropdown详解创建和初始化设置下拉框选项获取选项获取选中项文本&#xff1a;获取选中项索引&#xff1a;设置选中项&#xff1a; 事件处理其他功能和样式设置设置下拉按钮样式&#xff1a;设置下拉框方向&#xff1a;设置最大高度&#xff1a…

Vulnhub-zico2靶机打靶记录

本篇文章旨在为网络安全渗透测试靶机教学。通过阅读本文&#xff0c;读者将能够对渗透Vulnhub系列zico2靶机有一定的了解 一、信息收集阶段 靶机下载地址&#xff1a;https://download.vulnhub.com/zico/zico2.ova 因为靶机为本地部署虚拟机网段&#xff0c;查看dhcp地址池设…

(041)05-01-自考数据结构(20331)树与二叉树大题总结

实际考试中,计算题约占40%,推理题约占30%,算法设计题约占30%。建议重点练习遍历序列相关的递归分治解法, 知识拓扑 知识点介绍 一、计算题类型与解法 1. 结点数量计算 题型示例: 已知一棵完全二叉树的第6层有8个叶子结点,求该二叉树最多有多少个结点? 解法步骤: 完…

Python----机器学习(KNN:使用数学方法实现KNN)

一、原理 以下是K最近邻&#xff08;K-Nearest Neighbors&#xff0c;简称KNN&#xff09;算法的基本流程&#xff0c;用于对给定点进行分类预测。 1. 获得要预测的点 point_predict 。 2. 计算训练点集 point_set_train 中各点到要预测的点 表 l ist_L2_distance 。 3. 对 poi…

网络攻防快速入门笔记pwn | 02 栈溢出题型 | 2.2 ret2libc

上一篇&#xff1a;网络攻防快速入门笔记pwn | 02 栈溢出题型 | 2.1 ret2text和ret2shellcode 下一篇&#xff1a;网络攻防快速入门笔记pwn | 02 栈溢出题型 | 2.3 ret2syscall 欢迎关注~ ret2libc 一、 什么是ret2libc&#xff08;一&#xff09;ret2lib的概念&#xff08;…

Edge浏览器快速开启IE模式

一些老旧的网站&#xff0c;仅支持Internet Explorer&#xff08;IE&#xff09;浏览器访问。 然而&#xff0c;出于安全性的考虑&#xff0c;可能会遇到限制IE浏览器使用的情况。 Microsoft Edge浏览器提供了兼容性配置&#xff0c;可以通过IE模式访问这些网站。 以下是两种…

LeetCode 解题思路 29(Hot 100)

解题思路&#xff1a; 映射关系建立&#xff1a;创建一个哈希表存储数字到字母的映射。递归参数&#xff1a; 给定字符串 digits、结果集 result、当前路径 path、当前位置 start。递归过程&#xff1a; 当当前位置 start 等于 digits 长度时&#xff0c;说明已经遍历完 digi…

LabVIEW永磁同步电机性能测试系统

开发了一种基于LabVIEW的永磁同步电机&#xff08;PMSM&#xff09;性能测试系统的设计及应用。该系统针对新能源汽车使用的电机进行稳态性能测试&#xff0c;解决了传统测试方法成本高、效率低的问题&#xff0c;实现了测试自动化&#xff0c;提高了数据的准确性和客观性。 ​…

MTK Camera 照片切视频Systrace拆解分析

和你一起终身学习&#xff0c;这里是程序员Android 经典好文推荐&#xff0c;通过阅读本文&#xff0c;您将收获以下知识点: 一、Systrace 拆解概览二、Systrace 阶段拆解详解 一、Systrace 拆解概览 MTK Camera 照片切换视频trace 拆解(非切换摄像头类) 照片切换视频模块trace…

某合约任意提取BNB漏洞

1背景描述 合约是一个在满足特定条件时在区块链上执行代码的程序&#xff0c;各方以数字签署合同的方式准许并维护它的其运行。这些代码可以是向朋友汇款、买卖 NFT 虚拟商品等一系列复杂的内容。 存在漏洞的目标合约是一个结合Meme文化病毒式传播与去中心化金融&#xff08;D…

插件实现:分别通过winform和WPF界面输入操作CAD——CAD c#二次开发

效果如下图所示&#xff1a; 主程序 using Autodesk.AutoCAD.ApplicationServices; using Autodesk.AutoCAD.DatabaseServices; using Autodesk.AutoCAD.EditorInput; using Autodesk.AutoCAD.Geometry; using Autodesk.AutoCAD.Runtime; using System; using System.Windows…

白酒迈入3.0时代,珍酒李渡如何穿越周期高质增长?

当下&#xff0c;白酒行业仍处深度调整期&#xff0c;过往通过渠道拓展、硬广宣传等推动规模扩张、提升市场份额的模式&#xff0c;愈发难以为继。 行业迫切需要构建高质增长新模式&#xff0c;完成增长动能转换。中国酒业协会理事长宋书玉提出&#xff0c;白酒消费亟需进入品…

人工智能-LangGraph+ChatUI+DeepSeek API搭建本地智能助手

人工智能-LangGraphChatUIDeepSeek API搭建本地智能助手 0 环境说明1 LangGraph2 Agent Chat UI 0 环境说明 环境项环境说明操作系统Windows11 专业版硬件信息联想拯救者Y9000PcondaAnancondaPython版本3.12NodeJs18.20.0 # 使用conda创建python环境 conda create -n langgra…

虚幻5入门

常用操作 运行时&#xff0c;调试相机&#xff0c;按~键&#xff0c;输入ToggleDebugCamera 。进入自由视角 常用节点 gate节点&#xff1a;用于控制该流程通不通&#xff0c;执不执行。Flip Flop节点&#xff1a;反转执行&#xff0c;一次A&#xff0c;一次B。Set Timer by…

慧通测控:汽车RGB氛围灯功能测试介绍

在汽车内饰不断进化的当下&#xff0c;汽车 RGB 氛围灯已从曾经的小众配置&#xff0c;逐渐成为众多车主提升驾乘体验的热门选择。它宛如车内的 “魔法精灵”&#xff0c;凭借丰富的功能&#xff0c;为单调的车厢披上一层梦幻而温馨的色彩。今天&#xff0c;让我们深入探究汽车…

QML Book 学习基础6(定位/布局元素)

目录 定位元素 Column Row Grid Flow 布局元素 1.元素填充它的⽗元素。 2.对齐 定位元素 Column Column &#xff08;列&#xff09;元素将它的⼦对象通过顶部对⻬的列⽅式进⾏排列。 spacing 属性⽤来设置每个元素之间的间隔⼤⼩ Row Row &#xff08;⾏&#xff09;元…