清华青年AI自强作业hw3_3:用NN网络拟合MNIST手写数字分类

news2024/10/6 18:26:11

清华青年AI自强作业hw3_3:用NN网络拟合MNIST手写数字分类

    • 实现过程
      • 具体思路
      • 多分类网络模型
      • 训练结果分析
    • 相关链接

在这里插入图片描述

一起学AI系列博客:目录索引

hw3_3:用NN网络拟合MNIST手写数字分类

  • 体会神经网络设计和TF框架编程

  • 对比hw3_1两者的模型、效果差异

实现过程


有了上篇博客:清华青年AI自强作业hw3_1的铺垫,本次任务只需在其基础上进行模型修改即可。

具体思路

  1. 分类模式修改
  2. 由二分类改为多分类模型(十分类)
  3. 网络模型修改

多分类网络模型

  1. 核心思路
    1. 用1个多分类模型处理0-9的分类
    2. 将网络叠加几层,加深加大
  2. MNIST数据预处理(load)
  3. 模型训练过程(train)
    1. 模型搭建
      1. 模型为深度神经网络
      2. 选取相应激活函数
  4. 模型训练
    1. 前向推理与模型参数更新
    2. 按规律预测测试集的精度
  5. 模型推理过程(predict)
    1. 在测试集上验证预测精度
  6. 关键点
    1. 涉及到多分类数据标签的one-hot编码理解和手动处理

神经网络模型说明

  • 网络结构
    • input_layer:784,输入层,784个神经元用于接收一张图(28*28)展开的像素
    • hidden1_layer:16,隐藏层,16个神经元初步提取基础特征
    • hidden2_layer:16,隐藏层,16个神经元提取边缘几何特征
    • output_layer:10,输出层,10个神经元综合特征输出结果
  • 激活函数
    • 中间隐藏层用relu
    • 最后输出层用softmax

训练结果分析

用60000张图片训练得到的模型,再用10000张测试图片来评估,该模型测试集上预测正确率达:92.87%,远超之前的逻辑回归模型结果:18.97%,由此初窥深度神经网络的魔力。

  • 相应实现源码见代码仓:https://github.com/ioMayday/Tsinghua_Youth_AI/tree/master/homework
  • 相关keras使用指导:https://keras.io/zh/getting-started/sequential-model-guide/

相关链接


  1. 文科生都能零基础学AI?清华这门免费课程让我信了,link
  2. 清华青年AI自强作业hw2:线性回归预测,link
  3. 清华青年AI自强作业hw3_1:用线性回归模型拟合MNIST手写数字分类,link
  4. 清华青年AI自强作业hw3_2:前向传播和反向传播实战,link

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/663387.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CLIP和GPT

CLIP CLIP下游应用:VQGAN、DALL-ECLIP-Event:Connecting Text and Images with Event StructuresHierarchical Text-Conditional Image Generation with CLIP LatentsGPT系列算法GPT-1:GPT-2:GPT-3:GPT-3应用:Evaluati…

关于Win搜索太慢我自己写了一个Everything

文章目录 前言使用工具使用技术实现功能关于使用的技术比较OUTJDBC构建数据库FileMetasize处理文件最后修改时间equals重写其他方法 dao数据库源头获取连接关闭资源连接 FileDao初始化插入文件/目录到数据库中查询数据删除数据 特殊处理方法实现测试 服务初始化服务方法 操作单…

简要介绍 | 基于Python的图像形态学处理概述

注1:本文系“简要介绍”系列之一,仅从概念上对基于Python的图像形态学处理进行非常简要的介绍,不适合用于深入和详细的了解。 基于Python的图像形态学处理概述 Digital terrain models from airborne laser scanning for the automatic extra…

蓝牙芯片PHY6222的一些基本信息

摘要:本文简要介绍一下硬件工程师需要关注的PHY6222蓝牙芯片重点信息。 这个蓝牙芯片,支持蓝牙5.2. 内核是ARM Cortex™-M0 32-bit processor ,这就证明它可以像开发STM32那样来为它开发程序。 具有SWD调试接口,那么就可以用少到…

论文解读:Splicing ViT Features for Semantic Appearance Transfer

Project webpage: https://splice-vit.github.io Abstruct 将两张图片中语义相近的目标的结构和风格(外观)拼接 • 输入一个 Structure/ Appearence 图像对 : 训练生成器 。 • 关键思想是利用 预训练 和固定的视觉转换器 ( ViT ) 模型&…

Smartbi内置用户登陆绕过漏洞复现

0x01 产品简介 Smartbi大数据分析产品融合BI定义的所有阶段,对接各种业务数据库、数据仓库和大数据分析平台,进行加工处理、分析挖掘和可视化展现;满足所有用户的各种数据分析应用需求,如大数据分析、可视化分析、探索式分析、复杂…

Push vs Pull

Push好在两点:1.把结果下推到下流节点,与控制流解耦合,有利于cache 2.对于有向无环图,而不仅仅是树的query plan有更好的效果 解释: pull伪代码 push 伪代码 解释一下push,就是把操作下推到叶子节点&#…

4-JVM类加载

目录 1.类加载过程 1.1.加载(去车站) 1.2.验证(过安检) 1.3.准备(候车) 1.4.解析(检票) 1.5.初始化(上车) 2.双亲委派模型 2.1.什么是双亲委派模型&a…

首次曝光!乔布斯这些从未公开的照片,揭露乔布斯的另一面

昨个,大神在群里分享了一本关于乔布斯的书籍。 这本书收录了他的照片、电子邮件、演讲稿和访谈,很多私人的邮件和访谈是第一次看到。 书中用乔布斯自己的视角,记录了他一生的轨迹,包括他的童年,创立、离开、重归苹果的…

【Matter】如何在Linux平台下测试Matter应用级通信(虚拟设备)

如何在Linux平台下测试Matter应用级通信(虚拟设备) 准备工作 1. 递归克隆Matter仓库 执行如下命令: git clone --recurse-submodules gitgithub.com:project-chip/connectedhomeip.git如果克隆过程中发生报错,请执行如下命令来同步子模块:…

【好书精读】网络是怎样连接的 之 委托协议栈发送消息

(该图由AI制作 学习AI绘图 联系我) 目录 数据收发操作概览 创建套接字阶段 连接阶段:把管道接上去 通信阶段:传递消息 断开阶段:收发数据结束 数据收发操作概览 知道了 IP 地址之后 , 就可以委托操…

Spring Boot高阶篇笔记

一、Spring Boot整合Redis缓存 JSR-107、Spring缓存抽象、整合Redis 1、JSR107 Java Caching定义了5个核心接口,分别是CachingProvider, CacheManager, Cache, Entry 和 Expiry。 • CachingProvider定义了创建、配置、获取、管理和控制多个CacheManager。一个应…

打造Top级期货交易系统!成为投资高手!

交易系统在期货市场中得到广泛的应用,技术分析是期货交易系统的重要组成部分之一。技术分析是依靠市场数据来预测未来期货行情的一种方法,通过对期货历史市场信息进行形态分析和统计计算等手段,获取市场行情的走向,为后续的期货交…

初识MFC第一天

文章目录 前言一、初识MFC二、初始相关API附录 前言 刚开始进入Win32开发时,会发现一些变量类型似乎在C语言中未曾见过。其实这些变量类型或是与C/C已有的数据类型相近的,是通过C语言的原始类型重新定义而成的。引入这些数据类型的主要目的是为了便于程…

2023届网课生就业难:挑战与策略探析

🌷🍁 博主 libin9iOak带您 Go to New World.✨🍁 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~&#x1f33…

One-Class SVM详解

简介 One-Class SVM(Support Vector Machine)是一种无监督学习算法,用于异常检测和离群点检测。它的目标是通过仅使用正常数据来建模,识别出与正常模式不同的异常数据点。 One-Class SVM的工作原理如下: 数据映射&a…

潮玩盲盒APP系统开发

盲盒抽奖App软件界面应该包括以下几个部分: 首页:首页需要展示正在进行的抽奖活动、热门盲盒商品和刚刚开奖的中奖名单,让用户快速了解当前的热门活动和优惠。 抽奖详情页:抽奖详情页需要展示抽奖主题、奖品图片、中奖规则…

高频前端面试题汇总之计算机网络篇

一、HTTP协议 1. GET和POST的请求的区别 Post 和 Get 是 HTTP 请求的两种方法,其区别如下: 应用场景: GET 请求是一个幂等的请求,一般 Get 请求用于对服务器资源不会产生影响的场景,比如说请求一个网页的资源。而 P…

SAX解析XML返回对应格式的Map对象

前言 最近有一个解析大型xml的需求,xml大小7M,其中xml结构非常复杂,元素各种嵌套 不乏有元素下对象,元素下集合,集合下对象,集合下集合,兄弟节点,元素下对象下集合,同一元…

数字时代,你想成为一只“弱鸡”,还是一个“超级个体”?

电话延伸了人类的耳朵,屏幕延伸了人类的眼睛,汽车这样的交通工具延伸了人类的腿脚,人类的生存能力开始变得和技术相关,而这个趋势仍在加剧。 如今,Web3延伸了人的综合体验,AI延伸了人类的大脑,它…