利用Numpy实现全连接神经网络实验分析

news2024/12/23 6:42:23

一、实验要求

        用 python 的 numpy 模块实现全连接神经网络。网络结构为一个输入层、一个隐藏层、一个输出层。隐藏层的激活函数为 Relu 函数,输出层的激活函数为 softmax 函数,损失函数为交叉熵。

二、实验目的

  1. 学会构建一个简单的全连接神经网络模型
  2. 学习使用Python的NumPy模块进行神经网络的搭建和训练
  3. 增加对前馈神经网络,参数学习,激活函数的了解
  4. 学会对模型进行优化、改进,比如:学习率调整、正则化等操作

三、实验过程 

1.搭建神经网络

        首先,在虚拟环境进行环境配置,创建虚拟环境,并进入,安装tensorflow和numpy模块。

        用Python完成神经网络模型的构建,包括两个隐藏层和一个输出层,并且使用了矩阵乘法、ReLU激活函数、Softmax函数和交叉熵函数等操作。部分代码讲解:

对图像数据进行预处理

        定义myModel类,是一个简单的神经网络模型,模型包含两个隐藏层和一个输出层,使用了矩阵乘法、ReLU激活函数、Softmax函数和交叉熵函数等操作。类的构造函数 __init__() 初始化了模型的权重 W1 和 W2,这些权重是随机生成的矩阵,以及用于执行矩阵乘法、ReLU、Softmax和交叉熵操作的实例对象。forward() 方法用于执行模型的前向传播操作。该方法首先将输入数据 x 转换为二维矩阵,并在末尾添加偏置项。然后,通过矩阵乘法、ReLU激活函数、矩阵乘法和Softmax函数的顺序,计算模型的输出结果 h2_soft,即预测的概率分布。最后,计算并存储交叉熵损失值 loss。backward() 方法用于执行模型的反向传播操作。接收标签 labels 作为输入,并按照与前向传播相反的顺序,调用各个操作的反向传播方法,计算并存储各个层的梯度值。 

 使用小批量数据执行一次前向传播和反向传播。使用梯度下降更新权重。

 

使用测试数据计算损失和准确性。

        循环训练模型,每个epoch都对训练数据进行多次迭代。并且打印每个batch的损失和准确性。最后,在测试集上评估模型的性能。 

2.对模型进行优化、改进

运行初始代码

序号

学习率

神经元个数

训练轮数

1

1e-5

100

50

 

再次运行 

        发现运行相同的代码,但是每次实验结果并不相同,经过查相关资料,发现是因为没有设置固定的随机种子,每次初始的条件不一致。于是考虑设置随机数种子,一方面是为了在得到比较好的结果时可以复现这个结果,另一方面,每次随机的初始权重一样,有利于实验的比较和改进。

 设置完随机种子后再次训练发现同一情况下准确率相同

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

100

50

9.5599

0.5951

深度学习的优化过程是一个反复迭代的过程,需要不断地调整超参数和算法以达到最优的效果。

选择先调整学习率:

学习率是控制每次参数更新的步长大小的超参数。学习率越大, 输出误差对参数的影响就越大, 参数更新的就越快, 但同时受到异常数据的影响也就越大, 很容易发散.合适的学习率能够使目标函数在合适的时间内收敛到局部最小值

学习率

训练轮数

Test loss

accuracy

1e-4

50

nan

0.098

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-6

100

50

20.3428

0.2211

 

综合比较之后,学习率为1e-5时的准确率最高,故选定学习率为1e-5.

接下来选择调整神经元个数

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

100

50

9.5599

0.5951

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

150

50

5.7203

0.7636

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

200

50

6.5324

0.7355

 

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

250

50

7.7025

0.6984

 

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

300

50

8.2460

0.6831

综合比较,最终神经元个数选为150

接下来调整训练轮次

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

150

100

4.9358

0.7974

 

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

150

150

3.5525

0.839

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

150

200

2.2190

0.8938

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

150

250

2.0297

0.9006

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

150

300

1.8736

0.9069

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

150

500

1.6171

0.9129

最终,选定训练轮数为500

此时,准确率并不是很理想,考虑将神经网络层数加1,但结果并不理想

 

        通过搜查相关资料,可以采用小批量训练的方法,进而提高准确率.具体方法为:将训练数据划分为小批量,而不是整个数据集一次性输入,可以提高内存和计算效率,并提高训练的稳定性。这使得模型能够更好地处理大规模数据集,并加快模型的训练速度。

但使用小批量训练后

 

训练出现过拟合现象,该方法也不可取

四、实验结果 

最终采取以下的参数进行实验,是本次实验得出的最好的模型

学习率

神经元个数

训练轮数

1e-5

150

500

去掉随机数种子的约束,进行三次实验,取三次实验准确率进行求取平均值

最终结果为:

学习率

神经元个数

训练轮数

Test loss

accuracy

1e-5

150

500

1.3570

0.9233

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2185510.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

鸿蒙网络管理模块01——HTTP与WebSocket请求数据

如果你也对鸿蒙开发感兴趣,加入“Harmony自习室”吧!扫描下方名片,关注公众号,公众号更新更快,同时也有更多学习资料和技术讨论群。 1、概述 鸿蒙的网络管理模块主要提供以下功能: HTTP数据请求&#xff1…

影刀RPA实战:网页爬虫之电影数据

1.实战目标 电影自媒体是指个人或团队通过互联网平台,如微博、微信公众号、抖音、B站等,发布与电影相关的内容,包括但不限于电影评论、推荐、幕后制作揭秘、明星访谈等。这些内容旨在吸引电影爱好者,并与之互动,构建起…

十六字心传

中国文化传统中著名的“十六字心传”:“人心惟危,道心惟微;惟精惟一,允执厥中。 ”语出于《虞书大禹谟》。 人心与道心:人的人欲与天理的区别;所谓“人心惟危”,即是说人们的那种物欲情欲&…

【FPGA开发】Xilinx FPGA差分输入时钟的使用方法

正文 以前在使用ZYNQ的领航者ZYNQ7020进行FPGA学习时,它们使用的单端50M的输入时钟,在verlog代码编写上比较简单,而现在使用Alinx的AXU3EG开发板时,发现它使用的是200M的差分输入时钟,哪这个时候,输入时钟要…

pyecharts-快速入门

pyecharts文档:渲染图表 - pyecharts - A Python Echarts Plotting Library built with love. pyecharts-gallery文档:中文简介 - Document (pyecharts.org) 一、快速入门案例 from pyecharts.charts import Barbar Bar() bar.add_xaxis(["衬衫…

7-3 集合的运算-并、交、对称差

顺序表&#xff1a; #include <bits/stdc.h> using namespace std; int main() {int n;cin>>n;int *pnew int[n];for(int i0;i<n;i)cin>>p[i];int m;cin>>m;int *qnew int [m];for(int j0;j<m;j)cin>>q[j];int *bingnew int[nm];int *jia…

详细介绍:API 和 SPI 的区别

文章目录 Java SPI (Service Provider Interface) 和 API (Application Programming Interface) 的区别详解目录1. 定义和目的1.1 API (Application Programming Interface)1.2 SPI (Service Provider Interface) 2. 使用场景2.1 API 的应用场景2.2 SPI 的应用场景 3. 加载和调…

Elasticsearch基础_5.ES聚合功能

文章目录 一、数据聚合1.1、桶聚合1.1.1、单维度桶聚合1.1.2、聚合结果排序1.1.3、限定聚合范围 本文只记录ES聚合基本用法&#xff0c;后续有更复杂的需求可以查看相关书籍&#xff0c;如《Elasticsearch搜索引擎构建入门与实战》 一、数据聚合 聚合可以让我们极其方便的实现…

进程和线程之间的通用方式

进程之间的通信方式有哪些 进程间通信&#xff08;Inter-Process Communication, IPC&#xff09;是指不同进程之间传递信息和数据的机制。由于进程之间的内存空间是相互独立的&#xff0c;因此必须使用特定的通信方式来实现数据共享。 以下是常见的进程间通信方式&#xff1…

【前端开发入门】css快速入门

目录 引言一、css盒模型1. 盒模型概念2. 盒模型案例 二、css编写1. html文件内部编写1.1 标签style属性编写1.2 css选择器关联1.2.1 id选择器1.2.2 class选择器1.2.3 标签选择器1.2.4 css选择器作用域1.2.5 其他选择器1.2.6 各css选择器优先级 2. 单独维护css文件2.1 创建css文…

【韩顺平Java笔记】第6章:数组、排序和查找

文章目录 153. 回顾上节课内容154. 听懂和会做155. 数组的必要性156. 数组快速入门157. 数组使用1158. 数组使用2160. 数组使用3161. 数组注意事项161. 数组练习1162. 数组练习2163. 数组赋值机制1164. 数组赋值机制2165. 数组拷贝166. 数组翻转1168. 169. 数组扩容1,2170. 数组…

解决银河麒麟服务器操作系统中`/etc/bashrc`环境变量不生效的问题

解决银河麒麟服务器操作系统中/etc/bashrc环境变量不生效的问题 1、问题描述2、问题原因3、解决方法 &#x1f490;The Begin&#x1f490;点点关注&#xff0c;收藏不迷路&#x1f490; 在银河麒麟服务器操作系统中&#xff0c;有时你可能会遇到在/etc/bashrc文件中配置的环境…

VMware 设置静态IP

环境 os: centos 7vmware: 16.2.0 build-18760230 设置静态IP 不知道桥接模式和nat模式抽什么疯&#xff0c;忽然用不了了&#xff0c;虚拟机开机之后&#xff0c;本地ssh连接不上&#xff0c;ping 了一下&#xff0c;本机ping不通虚拟机。干脆参考网上的方法&#xff0c;直…

【网络安全 | Java代码审计】某Blog系统

未经许可,不得转载。 文章目录 公告处XSS评论处XSS添加友链处XSS文件上传处XSS公告处XSS 编辑公告处后端代码: 跟进updateNotice()方法: 继续跟进: 公告内容直接插入数据库,看看前端从数据库获取数据时有没有对数据做处理: noticeService 是一个服务层组件,负责业务逻辑…

【Verilog学习日常】—牛客网刷题—Verilog企业真题—VL74

异步复位同步释放 描述 题目描述&#xff1a; 请使用异步复位同步释放来将输入数据a存储到寄存器中&#xff0c;并画图说明异步复位同步释放的机制原理 信号示意图&#xff1a; clk为时钟 rst_n为低电平复位 d信号输入 dout信号输出 波形示意图&#xff1a; 输入描…

在线翻译界的4大宝藏,一站式解决语言难题!

现在全球化越来越厉害&#xff0c;语言根本就不是啥沟通的阻碍了。不管是搞学术研究、商务交流&#xff0c;还是平常学习&#xff0c;翻译工具都成了咱少不了的帮手。今天呢&#xff0c;我给大家推荐四款在 2024 年特别受推崇的邮件翻译神器&#xff0c;像百度在线翻译啥的。这…

Suricata:开源网络分析和威胁检测

Suricata 是一款高性能、开源网络分析和威胁检测软件&#xff0c;被大多数私人和公共组织使用&#xff0c;并被主要供应商嵌入以保护他们的资产。 Suricata 功能 Suricata 提供全面的网络安全监控 (NSM) 功能&#xff0c;包括记录 HTTP 请求、捕获和存储 TLS 证书以及从网络流…

带你深入浅出设计模式:一、单例模式,正确理解懒汉式和饿汉式

此为设计模式第一谈&#xff01; 用总-分-总的结构和生活化的例子给你讲解设计模式&#xff01; 码农不易&#xff0c;各位学者学到东西请点赞收藏支持支持&#xff01; 开始部分&#xff1a; 总&#xff1a;对于单例模式&#xff0c;在开发中通常用于设计配置信息类、数据库…

A/D转换器的基本概念(分辨率+转换时间+采样定律+量化误差)+A/D转换方法(Flash(同步)型A/D转换器+计数型转换器)

2024-10-02&#xff0c;星期三&#xff0c;21:41&#xff0c;天气&#xff1a;晴&#xff0c;心情&#xff1a;晴。Hello&#xff0c;大家好啊&#xff0c;真的是好久没见了&#xff0c;上次更新还是在九月份&#xff0c;九月的最后一周出了一周的差&#xff0c;然后继续上了两…

代码随想录训练营Day19 | 235. 二叉搜索树的最近公共祖先 | 701.二叉搜索树中的插入操作 | 450.删除二叉搜索树中的节点

Leetcode 235. 二叉搜索树的最近公共祖先 题目描述 给定一个二叉搜索树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为&#xff1a;“对于有根树 T 的两个结点 p、q&#xff0c;最近公共祖先表示为一个结点 x&#xff0c;满足 x 是 p、q 的祖先且…