Tensorflow实现手写数字识别

news2025/1/22 16:00:33

模型架构

  • 具有10个神经元,对应10个类别(0-9的数字)。
  • 使用softmax激活函数,对多分类问题进行概率归一化。
  • 输出层 (Dense):
  • 具有64个神经元。
  • 激活函数为ReLU。
  • 全连接层 (Dense):
  • 将二维数据展平成一维,为全连接层做准备。
  • 展平层 (Flatten):
  • 第三层卷积层有64个过滤器。
  • 使用3x3的卷积核。
  • 激活函数为ReLU。
  • 卷积层 (Conv2D):
  • 池化大小为2x2。
  • 最大池化层 (MaxPooling2D):
  • 第二层卷积层有64个过滤器。
  • 使用3x3的卷积核。
  • 激活函数为ReLU。
  • 卷积层 (Conv2D):
  • 池化大小为2x2。
  • 通过池化操作减小特征图的尺寸,同时保留最重要的信息。
  • 最大池化层 (MaxPooling2D):
  • 第一层卷积层有32个过滤器(filters)。
  • 使用3x3的卷积核。
  • 激活函数为ReLU。
  • 输入形状为28x28的单通道图像(黑白图像)。
  • 卷积层 (Conv2D):
import tensorflow as tf

from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist

# 载入 MNIST 数据集
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# 数据预处理
train_images = train_images.reshape((60000, 28, 28, 1)).astype('float32') / 255
test_images = test_images.reshape((10000, 28, 28, 1)).astype('float32') / 255

train_labels = tf.keras.utils.to_categorical(train_labels)
test_labels = tf.keras.utils.to_categorical(test_labels)

# 构建神经网络模型
model = models.Sequential([
    # 第一层:卷积层
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),

    # 第二层:最大池化层
    layers.MaxPooling2D((2, 2)),

    # 第三层:卷积层
    layers.Conv2D(64, (3, 3), activation='relu'),

    # 第四层:最大池化层
    layers.MaxPooling2D((2, 2)),

    # 第五层:卷积层
    layers.Conv2D(64, (3, 3), activation='relu'),

    # 将二维数据展平成一维
    layers.Flatten(),

    # 第六层:全连接层(密集层),64个神经元,ReLU激活函数
    layers.Dense(64, activation='relu'),

    # 输出层:全连接层,10个神经元(对应10个类别,0-9的数字),使用softmax激活函数
    layers.Dense(10, activation='softmax')
])

# 编译模型
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# 训练模型
model.fit(train_images, train_labels, epochs=5, batch_size=64, validation_split=0.2)

# 在测试集上评估模型
test_loss, test_acc = model.evaluate(test_images, test_labels)
print(f'Test accuracy: {test_acc}')

 编译模型:

model.compile( 
	optimizer,    # 优化器,用于配置模型的学习过程。常见的有 'adam'、'sgd' 等。
	loss,         # 损失函数,用于衡量模型在训练时的性能。常见的有 'categorical_crossentropy'、'mse' 等。 
	metrics=None  # 评估指标,用于监控训练和测试性能。可以是一个字符串或字符串列表。例如,'accuracy'。
 )

optimizer(优化器):

优化器决定了模型如何进行参数更新,以最小化损失函数。常见的优化器包括 'adam'、'sgd'、'rmsprop' 等。不同的优化器可能适用于不同类型的问题。

loss(损失函数):

损失函数用于衡量模型在训练时的性能,即模型预测与实际标签之间的差异。对于不同的问题,需要选择合适的损失函数。例如,对于分类问题,常见的是 'categorical_crossentropy',而对于回归问题,可能是 'mse'(均方误差)。

metrics(评估指标):

评估指标用于监控模型的性能。在训练和测试过程中,会输出这些指标的值。例如,'accuracy' 表示模型的准确性。你可以传递一个字符串或一个字符串列表,以同时监控多个指标。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1498859.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Solidworks界面左边FeatureManager/设计树/模型树/树区域/零件树/零件栏不见了

Solidworks界面左边FeatureManager/设计树/模型树/树区域/零件树/零件栏不见了,按F9还原/隐藏,有的笔记本按FnF9

Koa: 打造高效、灵活的Node.js后端 (介绍与环境部署)

在上一篇文章中,我们了解了Node.js的基础知识,今天我们将进一步学习Node.js 较新的一个轻量级Web框架Koa,一起创建NodeJS后端服务器吧! 一、介绍 Koa是一个新生代Node.js Web框架,由Express原团队成员开发&#xff0c…

大模型笔记:最少到最多提示过程 (Least to Most prompting, LtM)

LEAST-TO-MOST PROMPTING ENABLES COMPLEX REASONING IN LARGE LANGUAGE MODELS 2023 ICLR 1 概述 进一步发展维链提示过程 (CoT prompting) 分为两个阶段: 第一阶段:向语言模型提出查询,将问题分解成子问题。第二阶段:再次向语…

【数据结构】二、线性表:2.单链表的插入、删除、查找

文章目录 2.3插入2.3.1按位序插入2.3.2指定结点后插入2.3.3指定结点前插入 2.4删除2.4.1按位序删除2.4.2指定结点删除 2.5查找2.5.1按位查找2.5.2按值查找 2.3插入 2.3.1按位序插入 ListInsert(&L,i,e):插入操作。在表L中的第i个位置上插入指定元素e。 带头结…

【MATLAB第98期】基于MATLAB的MonteCarlo蒙特卡罗结合kriging克里金代理模型的全局敏感性分析模型【更新中】

【MATLAB第98期】基于MATLAB的Monte Carlo蒙特卡罗结合kriging克里金代理模型的全局敏感性分析模型【更新中】 PS:因内容涉及较多,所以一时半会更新不完 后期会将相关原理,以及多种功能详细介绍。 麻烦点赞收藏,及时获取更新消息。 引言 在…

从《繁花》看图数据库的关联力!

2024年开年,最热的电视剧非《繁花》莫属。 这部现象级剧集不仅在全国掀起了一股怀旧潮,还引发了对故事情节和人物关系的深入探讨。 随着《繁花》的热播,不少观众为了更好地理解复杂的故事情节,开始自制人物关系图。 这些关系图以…

【Spring Boot 3】获取已注入的Bean

【Spring Boot 3】获取已注入的Bean 背景介绍开发环境开发步骤及源码工程目录结构总结 背景 软件开发是一门实践性科学,对大多数人来说,学习一种新技术不是一开始就去深究其原理,而是先从做出一个可工作的DEMO入手。但在我个人学习和工作经历…

java SSM科研管理系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计

一、源码特点 java SSM科研管理系统是一套完善的web设计系统(系统采用SSM框架进行设计开发,springspringMVCmybatis),对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S…

OPC UA 学习笔记:状态机/有限状态机

有限状态机 有限状态机 (FSM) 是程序员、数学家、工程师和其他专业人士用来描述具有有限数量条件状态的系统的数学模型。 有限状态机的构成包括以下内容: 一组潜在的输入事件。与潜在输入事件相对应的一组可能的输出事件。系统可以显示的一…

19.题目:编号3865 Alice与Bob的爱恨情仇

题目&#xff1a; ###该题主要考察思维、和博弈 &#xff08;写起来容易&#xff0c;但是不太好想&#xff09; #include<bits/stdc.h> using namespace std; int main(){int n,k;cin>>n>>k;int ans0,x;while(n--){cin>>x;ansx%2;}if(ans%2){cout<…

Effective C++ 学习笔记 条款16 成对使用new和delete时要采取相同形式

以下动作有什么错&#xff1f; std::string *stringArray new std::string[100]; // ... delete stringArray;每件事看起来都井然有序&#xff0c;使用了new&#xff0c;也搭配了对应的delete。但还是有某样东西完全错误&#xff1a;你的程序行为未定义。至少&#xff0c;str…

进程:守护进程

一、守护进程的概念 守护进程是脱离于终端控制&#xff0c;且运行在后端的进程。&#xff08;孤儿进程&#xff09;守护进程不会将信息显示在任何终端上影响前端的操作&#xff0c;也不会被终端产生的任何信息打断&#xff0c;例如&#xff08;ctrlc&#xff09;.守护进程独立…

[密码学]入门篇——加密方式

一、概述 加密方法主要分为两大类&#xff1a; 单钥加密&#xff08;private key cryptography&#xff09;&#xff1a;加密和解密过程都用同一套密码双钥加密&#xff08;public key cryptography&#xff09;&#xff1a;加密和解密过程用的是两套密码 历史上&#xff0c…

POS 之 最终确定性

Gasper Casper 是一种能将特定区块更新为 最终确定 状态的机制&#xff0c;使网络的新加入者确信他们正在同步规范链。当区块链出现多个分叉时&#xff0c;分叉选择算法使用累计投票来确保节点可以轻松选择正确的分叉。 最终确定性 最终确定性是某些区块的属性&#xff0c;意味…

离散数学例题——5.图论基础

基本的图 关联矩阵 子图和补图 度数和握手定理 注意&#xff01;&#xff01;&#xff01;无向图的度数&#xff0c;要行/列和对角线值 根据度数序列判定是否为无向图 度和握手定理证明题 竞赛图 同构图 自补图 通路和回路数量 通路和回路数量 最短路径——dijkstra算法 连通…

21、状态模式(行为性模式)

版本一、get状态指针 #include <iostream> using namespace std;//前置声明 class Context;//状态 class State{ public://4个状态virtual void toUp (Context& context){ }virtual void toDown (Context& context){ }virtual void toLeft (Context& cont…

打造一款用于照片局部修复的“在线橡皮擦”应用(基于Django5和Pytorch,含完整代码)

目录 一、任务概述二、Django微服务开发2.1 创建项目2.1.1 创建Django项目2.1.2 创建主页面2.1.3 编写视图处理函数2.1.4 配置访问路由url2.1.5 启动项目 2.2 前端开发2.2.1 集成Bootstrap52.2.2 初始化各组件2.2.3 自适应展示图像2.2.4 橡皮擦涂抹2.2.5 使用Ajax传输图像 2.3 …

本地部署推理TextDiffuser-2:释放语言模型用于文本渲染的力量

系列文章目录 文章目录 系列文章目录一、模型下载和环境配置二、模型训练&#xff08;一&#xff09;训练布局规划器&#xff08;二&#xff09;训练扩散模型 三、模型推理&#xff08;一&#xff09;准备训练好的模型checkpoint&#xff08;二&#xff09;全参数推理&#xff…

简站wordpress主题看上去差不多 实际大不一样

有人说简站wordpress主题&#xff0c;都差不多嘛。我表示无语。表面看上去是差不多的&#xff0c;实际的细节是不一样的。 下面以编号&#xff1a;JZP4431和编号&#xff1a;JZP4878这两个主题为例子来讲一下&#xff0c;简站wordpress主题&#xff0c;在细节方面的不一样之处…

最简单的基于 FFmpeg 的内存读写的例子:内存视频播放器

最简单的基于 FFmpeg 的内存读写的例子&#xff1a;内存视频播放器 最简单的基于 FFmpeg 的内存读写的例子&#xff1a;内存视频播放器正文源程序结果工程文件下载参考链接 最简单的基于 FFmpeg 的内存读写的例子&#xff1a;内存视频播放器 参考雷霄骅博士的文章&#xff0c;…