pytorch深度学习案例（一）——手写数学符号识别

news2025/4/19 14:37:52

文章目录

前言
简介
- 数据集
- 项目结构
- - utils模块
  - - dataLoader
    - models
    - plotShow
  - train模块
  - predict模块
- 下载地址

前言

在前面的两篇文章中我们介绍了现代计算机视觉中常见的结构化和非结构化的CNN模型，本篇我们将使用这些CNN模型在手写数学符号数据集上进行识别。
CNN模型的介绍请参照之前的两篇文章，源码放到最后。

pytorch深度学习基础（十）——常用线性CNN模型的结构与训练

pytorch深度学习基础（十一）——常用结构化CNN模型构建

简介

数据集

所用的数据集是来自kaggle的Handwritten math symbols dataset，其中包括超过30w张图片，共有82个类别。解压后的数据放到extracted_images中作为数据

数据集下载地址：
Handwritten math symbols dataset

项目结构

项目的组织形式如下
在这里插入图片描述

utils模块

utils中包括数据的加载，模型以及画图展示

dataLoader

idxPrepare
传入数据所在的路径，获取标签与索引的对应关系并以字典的形式保存，并返回由(图片，类别)组成的列表

image2txt
传入由(图片，类别)组成的列表，将数据集划分成训练数据和测试数据。并将路径以及对应的标签存放到txt文件中

MyLoader
使用torchvsion加载图片

MyDataLoader
由于数据量稍微有些大，直接使用torch的数据加载有可能会导致OOM，所以构建了一个数据加载的类，这个类并不会将所有的数据一次性全部加载到内存，而是将存有数据路径和对应的类别先全部加载到内存中，当需要用到数据时，再将数据从磁盘中读到内存当中。

LoadDataset
为了方便加载数据，构建了一个数据加载器，传入数据的路径，数据的批量大小和图片的大小，返回训练数据和测试数据的迭代器以供模型的训练

models

包含各种常见的CNN分类模型，包括LeNet、alexNet、vgg11、NiN、GoogLeNet、resNet18、denseNet模型的构建
select_model
用于选择模型，传入模型的名称以及模型的参数，返回选择的分类模型

plotShow

传入由训练损失、训练精度、测试损失、测试精度组成的字典，然后绘制出图像

train模块

用于训练模型
accuracy
传入预测结果和标签，用于评估预测精度
train
传入选择使用的模型，模型参数，训练数据、测试数据、训练轮次、学习率、训练设备、提前终止训练的阈值以及是否保存检查点，进行模型的训练，最终训练结果将会保存在model_weights文件夹中

predict模块

根据不同的参数设置可以进行预测，可选的预测模式有单张图片预测，从文件夹中预测以及随机选取测试集中的数据进行预测

下载地址

GitHub地址：Handwritten-math-symbols-recognition

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/181641.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

pytorch深度学习案例（一）——手写数学符号识别

文章目录

前言

简介

数据集

项目结构

utils模块

dataLoader

models

plotShow

train模块

predict模块

下载地址

相关文章

2022回顾

Grafana 系列文章（一）：基于 Grafana 的全栈可观察性 Demo

剑指 Offer 第9天第10天

Python self用法详解

大数据项目---电商数仓（三）

数据库系统结构、数据库系统的组成

安卓性能优化之内存优化

notes

【IoT】创业：如何找到可以主导的创业市场？

全国地级市1999—2020年污染物排放和环境治理相关指标（废水\废气\粉尘等）

欧拉回路(模板+外加一些优化)

【MySQL】日志

测试篇(四)：测试用例的分类、按测试对象划分、按是否查看代码划分、你平时哪种测试方法用的多？、按照开发阶段划分

AcWing 327. 玉米田（状态压缩DP）

ARM uboot 的源码目录分析

剑指 Offer 第8天

java并发编程面试题目及答案2（持续更新）

Linux find 命令

微服务-高并发-思路

C语言深度解剖-关键字（3）