pytorch集智-5手写数字识别器-卷积神经网络

pytorch集智-5手写数字识别器-卷积神经网络

news2025/4/28 1:43:10

1 简介

简称：CNN，convolutional neural network

应用场景：图像识别与分类（CNN），看图说话（CNN+RNN）等

优越性：和多层感知机相比，cnn可以识别独特的模式，可以自动从数据中提取特征。一般机器学习需要特征工程，cnn可以自动识别，极大代替或取代了特征工程

和多层感知机原理不同点：层包含卷积层，池化层。但也是一种前馈神经网络

输入与输出：输入可为图像，输出为目标分类个数（比如图像目标分5类，则输出可定义有5个输出单元）

2 概念

用例子说明：识别图像里的数字是几，数字0-9，用cnn，则输出有10个单元，输入image为28x28像素彩色图片，每个像素为0-255的灰度值

2.1 识别手写数字流程简介

可简单理解为从一个图像提取出多个简单的小图像（因为要模式识别，多个模式，提取特征），然后从这些小图像输出预测

第一层卷积运算后，变成了28x28x4的结果，可以理解为4张28x28的图像

第二层池化运算后，变成了14x14x4的结果，可理解为4张14x14的图像（变小了）（卷积和池化运算原理后面说）

第二层卷积和池化类似，卷积后图像多了，池化后尺寸小了

第五层可理解为将第四层池化运算后的结果拉伸为1维向量（可以看成特征）

第六层为感知机的隐层，经过隐层计算得到输出。本例为分类问题，输出为各分类概率，加和为1

cnn和mlp（多层感知机）工作流程也一样，包括前馈运算和反馈学习阶段（比如梯度下降）。

2.2 卷积运算

卷积是数学概念，定义为一个卷积核函数在输入信号上序列化的积分计算，比较抽象，看个例子

卷积运算原理和人眼识别物体原理差不多。比如一个图片有很多物品，目标找到图片中所有的鞋子，人眼判断会经历这些流程：1扫描图片：需要看完整个图片，才能知道有多少鞋子 2模式识别，人眼能看出鞋子是因为大脑知道鞋子长什么样，脑海会有一个关于鞋子的模板图案 3模式匹配：扫描图片过程，当看到和鞋子模式高度匹配的地方，就记下这个位置的下标。扫描完成后，所有下标所在位置大概率会有鞋子

卷积核可以看作上例中的鞋子模板，鞋子模板和原始图像匹配的结果叫特征图，是一个二维的灰度图，再看个书里的例子

2.2.1 数学上的卷积运算

接上图，用一个卷积核扫描完原始图像一遍，即可看作完成一次卷积运算

卷积运算结果是特征图尺寸会比原始图像尺寸小，如果不像让特征图尺寸变化，可以在原始图像四周加padding（边距）

可以用多个卷积核（多个模式）对原始图像识别，对应会有数量和卷积核数量相等的特征图生成

卷积运算会越来越小，是因为特征图有一定尺寸，经过卷积运算就会减小

卷积运算越来越厚是因为模式（或特征，或卷积核）越来越多，比如需要从图像识别出多个类别的有用信息

2.3 池化运算

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1387982.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

设计模式—行为型模式之中介者模式

设计模式—行为型模式之中介者模式

设计模式—行为型模式之中介者模式中介者模式(Mediator Pattern)：用一个中介对象来封装一系列的对象交互，中介者使各对象不需要显式地相互引用，减少对象间混乱的依赖关系，从而使其耦合松散，而且可以独立地改变它们之…

阅读更多...

burp靶场-path traversal

burp靶场-path traversal

路径遍历 1.路径遍历漏洞 ### 什么是路径遍历路径遍历也称为目录遍历。这些漏洞使攻击者能够读取正在运行应用程序的服务器上的任意文件。这可能包括： 应用程序代码和数据。后端系统的凭据。敏感的操作系统文件。### <img src"/loadImage?filename218…

阅读更多...

将Sqoop与Hive集成无缝的数据分析

将Sqoop与Hive集成无缝的数据分析

将Sqoop与Hive集成是实现无缝数据分析的重要一步，它可以将关系型数据库中的数据导入到Hive中进行高级数据处理和查询。本文将深入探讨如何实现Sqoop与Hive的集成，并提供详细的示例代码和全面的内容，以帮助大家更好地了解和应用这一技术。为…

阅读更多...

$LLM：Scaling Laws for Neural Language Models 理解$

LLM：Scaling Laws for Neural Language Models 理解

核心结论 1：LLM模型的性能主要与计算量C，模型参数量N和数据大小D三者相关，而与模型的具体结构 (层数/深度/宽度) 基本无关。三者满足: C ≈ 6ND 2. 为了提升模型性能，模型参数量N和数据大小D需要同步放大，但模型和数…

阅读更多...

sizeof与strlen的使用及其区别

sizeof与strlen的使用及其区别

目录 1. sizeof 1.1sizeof简介 1.2 sizeof的使用 1.3 sizeof的使用注意事项 1.4 sizeof用于数组 2.strlen（）函数 3.区别示例1 示例2 示例3 4.总结 1. sizeof 1.1sizeof简介 sizeof是一个编译时运算符，可用于任何变量名、类型名…

阅读更多...

【PID精讲 14 】积分分离PID和抗积分饱和PID

【PID精讲 14 】积分分离PID和抗积分饱和PID

文章目录一、积分分离PID1.1 积分分离PID算法基本思想1.2 积分分离PID算法实现步骤1.3 积分分离PID算法1.4 积分分离PID算法实现1.5 积分分离PID算法仿真实例1.6 积分分离PID算法的优缺点二、抗积分饱和PID2.1 积分饱和现象2.2 抗积分饱和算法2.3 抗积分饱和算法实现2.4 抗积…

阅读更多...

tda7294功放电路图大全

tda7294功放电路图大全

简易电子管功放电路图（一） 6P3P单端A类电子管功放电路图如图为6P3P单端A类电子管功放电路图。VT1、VT2直流通路串联。VT1构成普通的三极管共阴放大器，VTr2构成阴极输出器，对VT1而言VT2是一个带电流负反馈的高阻负载。音频信号由…

阅读更多...

C程序技能：彩色输出

C程序技能：彩色输出

在终端上输出的字体总是单色，但在一些场景彩色输出更能满足需求，在Linux环境中，可以使用终端控制字符来设置输出字符的颜色，在部分版本的Windows系统中也可以使用。本文参考一些文献简要介绍一下在Windows下彩色输出的方法。 1. …

阅读更多...

最新Win11系统怎么删除开机密码 Win11取消登录密码图文教程

最新Win11系统怎么删除开机密码 Win11取消登录密码图文教程

将账户设置为自动输入微软账户的密码，就是省略了手动打密码的步骤而已变成自动化了。教程如下： A方法↓第一步:打开设置——账户——登录选项 ↓第二步:登录选项——其他设置——为了提高安全性，这里选择关闭，这一步是为了降低…

阅读更多...

基于SSM的流浪动物救助站

基于SSM的流浪动物救助站

末尾获取源码开发语言：Java Java开发工具：JDK1.8 后端框架：SSM 前端：Vue 数据库：MySQL5.7和Navicat管理工具结合服务器：Tomcat8.5 开发软件：IDEA / Eclipse 是否Maven项目：是目录…

阅读更多...

提升开发效率的google插件

提升开发效率的google插件

在如今的软件开发领域，Google Chrome浏览器的开发者插件扮演着至关重要的角色，为开发人员提供了丰富的工具和功能，从而提高了开发效率。下面介绍几款强大的 Google 插件，它们在不同方面为开发者提供了便利，并能显著提升…

阅读更多...

任务12：使用Hadoop Streaming解压NCDC天气原始数据

任务12：使用Hadoop Streaming解压NCDC天气原始数据

任务描述知识点： NCDC原始的气象数据上传到HDFSMapReduce程序处理NCDC原始数据重点： 熟练使用HDFS基础命令查看HDFS文件块的分布情况掌握Linux系统Shell脚本的编写熟练使用MapReduce程序解压缩文件使用MapReduce程序处理NCDC气象数据内容&am…

阅读更多...

2024.1.15 网络编程作业

2024.1.15 网络编程作业

思维导图练习题 1.实现TCP服务器和客户端之间的通信 server.c #include <myhead.h>int main(int argc, char const *argv[]) {//创建套接字int sfd socket(AF_INET, SOCK_STREAM, 0);//端口复用，作用：关闭服务器后再启动不会等待int reuse 1…

阅读更多...

谷粒商城篇章8 ---- P236-P247 ---- 购物车【分布式高级篇五】

谷粒商城篇章8 ---- P236-P247 ---- 购物车【分布式高级篇五】

目录 1 环境搭建 1.1 新建购物车服务模块gulimall-cart 1.2 购物车服务相关配置 1.2.1 pom.xml 1.2.2 yml配置 1.2.2.1 application.yml配置 1.2.2.2 bootstrap.yml配置 1.2.3 主类 1.3 SwitchHosts增加配置 1.4 网关配置 1.5 整合SpringSession 1.5.1 session数据…

阅读更多...

RPA与通知机器人的完美结合

RPA与通知机器人的完美结合

写在前面在现代快节奏的工作环境中，我们经常会面临多个任务同时进行的情况，你还在为时间不够用、忙碌而惆怅吗？你还在为时刻盯着电脑流程而烦恼吗？你还在为及时收不到自己的自动化任务进度而焦躁吗？别担心&#xff0…

阅读更多...

Elasticsearch：聊天机器人教程（二）

Elasticsearch：聊天机器人教程（二）

这是继上一篇文章 “Elasticsearch：聊天机器人教程（一）”的续篇。本教程的这一部分讨论聊天机器人实现中最有趣的方面，以帮助你理解它并对其进行自定义。数据摄入在此应用程序中，所有示例文档的摄取都是通过 flask …

阅读更多...

教你用五步让千年的兵马俑跳上现代的科目三？

教你用五步让千年的兵马俑跳上现代的科目三？

以下是一张我上月去西安拍的兵马俑照片： 使用通义千问，5步就能它舞动起来，跳上现在流行的“科目三”舞蹈。千年兵马俑跳上科目三全民舞王第1步打开通义千问App，我使用的是华为手机，苹果版的没试； 在…

阅读更多...

编译 FastDFS 时报错 fatal error: sf/sf_global.h: No such file or directory 解决办法

编译 FastDFS 时报错 fatal error: sf/sf_global.h: No such file or directory 解决办法

编译 FastDFS 时，报错如下 gcc -Wall -D_FILE_OFFSET_BITS64 -D_GNU_SOURCE -g -O1 -DDEBUG_FLAG -c -o ../common/fdfs_global.o ../common/fdfs_global.c -I../common -I/usr/local/include In file included from ../common/fdfs_global.c:21:0: ../common/fdf…

阅读更多...

【控制篇 / 分流】(7.4) ❀ 01. 对指定IP网段访问进行分流 ❀ FortiGate 防火墙

【控制篇 / 分流】(7.4) ❀ 01. 对指定IP网段访问进行分流 ❀ FortiGate 防火墙

【简介】公司有两条宽带，一条ADSL拨号用来上网，一条移动SDWAN，已经连通总部内网服务器，领导要求，只有访问公司服务器IP时走移动SDWAN，其它访问都走ADSL拨号，如果你是管理员，你知道有…

阅读更多...

pod 控制器

pod 控制器

pod 控制器： pv pvc 动态pv pod控制器：工作负载，workload，用于管理pod的中间层，确保pod资源符号预期的状态。预期状态： 1，副本数 2，容器的重启策略 3，镜像拉取策略…

阅读更多...

推荐文章

最新文章