人工神经网络/ANN简介

news2024/10/7 20:30:24

目录

前言

1.什么是训练集、测试集和验证集?

2.人工神经网络和 生物神经元结构对应的理解

3.什么是梯度下降法,在神经网络上如何用于调节权重?

4.为什么神经网络要进行归一化处理?

5.激活函数的形式:

6.NN分类

7.NN的工作过程

8.神经网络的学习方式

9.NN学习算法

10.神经网络分类


前言

首先理解一下人工神经网络和生物元神经元结构的对应关系:细胞核是新陈代谢的中心,由细胞核、细胞体、树突等组成,树突起着接收输入信号的作用,所以树突对应神经网络的输入层(但是计算神经网络层数的时候,输入层不算层数计入);轴突相当于生物元神经的传输通道,起着信息传递作用,轴突终端的突出是生物神经元之间的连接接口,也可以作为输出,所以对应NN的输出层。

图1 生物元神经网络结构

 图2 人工神经元模型

神经网络做预测的本质个人理解:利用训练集(输入和目标输出)让NN不断学习,使其选择到较为精确的权重(weight)、偏值(bias),而权重/连接权/学习因子的调节最常见的是梯度下降法,其本质是目标输出和实际输出的误差平方和(最小二乘法)最小,所以理论上训练集越大,效果越好,学习得到的权重等参数愈加合理,之后利用测试集对学习好的神经网络进行测试,看是否要重新选择训练或者更换激活函数等调试,最后由于训练集不可能无限大包含所有的情况,所以要有验证集对该学习好的神经网络进行鲁棒性验证。好了以上就是自己对网络训练的浅显理解,如有不到位的地方,欢迎指导交流,谢谢!

给出以下链接参考,有兴趣读者可以查阅:

1.什么是训练集、测试集和验证集?

机器学习为什么要划分训练集、测试集和验证集?这3个样本集的区别又在哪里? - 知乎

2.人工神经网络和 生物神经元结构对应的理解

秒懂,神经网络(NN)_哔哩哔哩_bilibili 

3.什么是梯度下降法,在神经网络上如何用于调节权重?

[5分钟深度学习] #01 梯度下降算法_哔哩哔哩_bilibili

4.为什么神经网络要进行归一化处理?

:因为激活函数起着非线性映射的作用,即神经网络的非线性逼近能力,而输入的求和通常是线性求和(线性组合),所以为了避免映射跑偏,一般将限制在(0,1)或者(-1,1)之间,所以上面的NN数学模型即可简单的表述为:

 其中:wkj表示第k个神经元的第i个输入权值;xj为第j个输入;uk为输入线性组合结果;φ(.)为激活函数;yk为第k个神经元的实际输出。θk(bk)为阈值/偏值,通常用于权重的调节。

5.激活函数的形式:

(1)阶跃函数:

(2)分段线性函数:

 (3)s型函数

①sigmoid非对称s函数:

②双曲正切中心对称s函数 :

 

6.NN分类

从功能上来看,神经网络按连接方式可分为前馈型网络和反馈型网络:

(1)前馈神经网络:即没有反馈,前面一层输出(可以输出到多个神经元作为其输入,当然也可以直接作为输出层输出)到后面一层,后面的输入不会反馈到前一层,所以它的节点分为输入单元和计算单元,且计算单元可以有任意个输入,但是只有一个输出。

 (2)反馈型神经网络:又称递归神经网络或回归神经网络,其所有的节点都是计算单元,可以同时接收输入,可以有多个输出,其网络可以堪称一个无向图。

7.NN的工作过程

主要分为两个阶段:

①学习阶段:此时通过训练集学习对连接权的权值进行修改

②工作阶段:对学习阶段学习好的网络用于实战

8.神经网络的学习方式

按环境所提供信息量的大小可分为三种:

①有监督/有教师学习:即存在若干个输入和目标输出组成的训练样本/训练集进行学习,所谓的“教师”即目标输出,通过实际输出与目标输出比较来调整权值和阈值,使实际输出越来越接近目标输出。

②无监督学习/无教师学习:这是一组自组织过程,没有目标输出,貌似没有学习的目的,但是这种类型的算法通过完成聚类操作,即学会将输入划分成某些类型,所以适合量化等应用问题。

③强化学习(再励学习):这种学习机制介于两者之间,外部环境对输出结果只给出奖罚等评价而不给出正确答案,即输入对应某个区间等级,所以适应控制系统领域。

9.NN学习算法

(1)δ学习规则(误差纠正学习规则):即给定一个误差目标函数J(通常为均方误差),通过最小化这个目标函数使神经网络学习得到的实际输出在误差内接近目标函数的目的。

 其中t_ik为第i个神经元在时刻的期望输出,y为实际输出,由于y由学习中的权重决定,所以问题进而转变为求使J为极小值时自变量权重,根据最速梯度下降法得到权重为:

其中η为学习速率也是梯度下降法的搜索补偿(0<η≤1),f(.)为激活函数,x为输入

(2)Hebb学习规则:当某一突触两端的神经元同为激活同步时(同为激活或抑制),连接强度增强,反之减弱。所以是一种无监督的学习规则,即不需要目标函数的任何相关信息。那么这样就无法对学习的权值进行调整。所以增加一个衰减项-dr*w:

 

 其中,衰减系数dr∈[0 1]。

(3)竞争学习规则:即多个输出单元相互竞争,最强激活的单元(将其他输出单元抑制住)作为唯一输出。竞争学习网络结构如下所示:

最常见的竞争学习规则有如下几种:

10.神经网络分类

①MP神经网络

②神经感知机神经网络/感知机

③自适应神经网络

④反向传播(BP)神经网络

⑤径向基(RBF)神经网络

⑥自组织竞争神经网络

⑦自组织特征映射(SOM)神经网络

⑧反传(CPN)神经网络

⑨自适应共振理论(ATR)神经网络

⑩学习向量量化(LVQ)神经网络

(11)Elman神经网络

(12)Hopfield神经网络

(13)Botlzmann神经网络

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/83795.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

序列模型(自回归模型,马尔可夫模型,因果关系)

李沐老师《动手学深度学习 PyTorch版》课程&#xff0c;小破站也有视频51 序列模型【动手学深度学习v2】_哔哩哔哩_bilibili 主要参考8.1. 序列模型 — 动手学深度学习 2.0.0 documentation 目录 1.基本原理 1.1自回归模型 1.2马尔可夫模型 1.3因果关系 2.训练 3.预测 4…

CMake中link_directories/target_link_directories的使用

CMake中的link_directories命令用于添加目录使链接器能在其查找库(add directories in which the linker will look for libraries)&#xff0c;其格式如下&#xff1a; link_directories([AFTER|BEFORE] directory1 [directory2 ...]) 添加路径使链接器应在其中搜索库。提供给…

【云计算与大数据技术】数据分片哈希算法、路由算法、复制算法的讲解(图文解释 超详细)

一、大数据的存储问题 随着结构化数据量和非结构化数据量的不断增长&#xff0c;以及分析数据来源的多样化&#xff0c;之前的存储系统设计已经无法满足大数据应用的需求&#xff0c;对于大数据的存储&#xff0c;存在以下几个不容忽视的问题 容量 - “大容量”通常是指可达P…

Python+Qt相片更换背景颜色窗体程序

程序示例精选 PythonQt相片更换背景颜色窗体程序 如需安装运行环境或远程调试&#xff0c;见文章底部微信名片&#xff0c;由专业技术人员远程协助&#xff01; 前言 QTPython是非常经典的窗体编程组合&#xff0c;功能完善&#xff0c;可视化界面美观易维护&#xff0c;这篇博…

fpga实操训练(按键输入)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 在fpga上面进行按键的输入&#xff0c;要比stm32编写按键输入要容易的多。这里面最主要的工作就是把led输出和按键输入绑定在一起。当然&#xff0…

MySQL MVCC

1.隔离级别 1.1.理论 1.1.1.序列化(SERIALIZABLE) 如果隔离级别为序列化,则用户之间通过一个接一个顺序地执行当前的事务,这种隔离级别提供了事务之间最大限度的隔离; 1.1.2.可重复读(REPEATABLE READ,MySQL默认的隔离级别) 在可重复读在这一隔离级别上,事务不会被看成是一…

代码随想录刷题记录 day42 打家劫舍 1 2 3

代码随想录刷题记录 day42 打家劫舍 1 2 3 参考&#xff1a;代码随想录 198. 打家劫舍 思想 1.dp[i]表示偷取[0,i]房间内获取的最高的金额 2.递推公式 偷取第i号房间时的价值 dp[i]dp[i-2]nums[i]; 不偷取第i号房间时的价值 dp[i]dp[i-1] 所以递推公式 dp[i]Math.max(d…

【Linux】一文简单了解操作系统在硬件中的作用,解析操作系统是做什么的?

目录前言一.操作系统的介绍二.计算机软件体系结构接口各层接口三.操作系统做什么1.不要让CPU打盹多道程序分时系统多任务系统2.设备驱动操作系统对软硬件进行合理的管理&#xff0c;以达到为上层用户提供良好的&#xff0c;稳定的&#xff0c;安全的运行环境的目的&#xff01;…

AppScan使用教程

一、安装 IBM AppScan 该产品是一个领先的 Web 应用安全测试工具&#xff0c;曾以 Watchfire AppScan 的名称享誉业界。Rational AppScan 可自动化 Web 应用的安全漏洞评估工作&#xff0c;能扫描和检测所有常见的 Web 应用安全漏洞&#xff0c;例如 SQL 注入&#xff08;SQL-i…

多时点DID实证流程笔记(Aggregate Effects from Public Works: Evidence from India)

文章、数据及stata代码来源&#xff1a; 链接:https://pan.baidu.com/s/1nBvlYGXkV7ednEx93ge1ZQ 提取码:vs5q本文进行的平行趋势检验、异质性检验均与大部分中文文献的处理方式不同&#xff0c;以及Bacon分解的方法对交叠did的潜在偏误进行诊断的做法也是比较新颖的。另外&a…

林业数字孪生打造实时树木“管家”

数字孪生是物联网、人工智能、虚拟现实、云计算等技术高度融合的综合性集成技术&#xff0c;主要目的是进行数字模型的智能分析、预测&#xff0c;为实体提供决策支持。林业数字孪生应用是智慧林业的具体实现手段&#xff0c;服务于智慧林草的业务需求&#xff0c;从而实现实体…

C语言#include的用法详解(文件包含命令)

#include叫做文件包含命令&#xff0c;用来引入对应的头文件&#xff08;.h文件&#xff09;。#include 也是C语言预处理命令的一种。 #include 的处理过程很简单&#xff0c;就是将头文件的内容插入到该命令所在的位置&#xff0c;从而把头文件和当前源文件连接成一个源文件&…

AI-多模态-2021:FILIP【一种基于交互的细粒度图文预训练模型】

前言 FILIP&#xff08;Fine-grained Interactive Language-Image Pretrain&#xff09;是一种基于交互的细粒度图文预训练模型&#xff0c;用于解决图文双塔匹配模型中的细粒度匹配问题。本文对该论文进行阅读笔记&#xff0c; 论文&#xff1a;https://arxiv.org/abs/2111.…

【C#基础教程】第二十章、事件

目录 事件 1.事件 2.扩展EventArgs类 事件 1.事件 事件的组成&#xff1a;事件由事件发布者和事件订阅者组成。事件内包含一个私有委托。 当事件发布时&#xff0c;事件发布者会发布消息、而事件订阅者会接受到事件已发生的通知&#xff0c;并作出相应的处理。 其中&#xf…

计算机研究生就业方向之考编

我一直跟学生们说你考计算机的研究生之前一定要想好你想干什么&#xff0c;如果你只是转码&#xff0c;那么你不一定要考研&#xff0c;至少以下几个职位研究生是没有啥优势的&#xff1a; 1&#xff0c;软件测试工程师&#xff08;培训一下就行&#xff09; 2&#xff0c;前…

MyBatis的缓存机制

文章目录1 MyBatis的一级缓存1.1 演示1.2 使一级缓存失效的四种情况2 MyBatis的二级缓存2.1 演示2.2 使二级缓存失效的情况&#xff1a;2.3 二级缓存的相关配置&#xff08;了解即可&#xff09;3 MyBatis缓存查询的顺序1 MyBatis的一级缓存 一级缓存是SqlSession级别的&#…

【vue加载16秒优化到2秒】Vue3加载慢的性能优化,打包后页面静态资源chunk-vendors文件过大加载慢响应慢

【写在前面】基于自己之前做vue3项目的时候发现了一个致命的问题&#xff0c;项目部署好了&#xff0c;但是加载起来反应慢半天&#xff0c;控制台一看才发现&#xff0c;有个chunk-vendors的js文件加载了十几秒&#xff0c;这无非是页面体验差到爆炸。今天就针对打包后静态资源…

【密码学基础】混淆电路(Garbled Circuit)

1 概念 混淆电路是一种密码学协议&#xff0c;以实现安全多方计算&#xff08;MPC&#xff09;。场景是当多个通信方需要共同输入数据&#xff0c;然后通过同一个函数计算出一个结果&#xff0c;但是&#xff0c;各个通信方都不允许其他人知道自己的输入是什么。混淆电路就能很…

MySQL错误码大全

MySQL的所有错误码可以从MySQL官网查看。 1.MySQL地址 首页网址 2.文档地址 以此点击如下标志。 MySQL8.0文档地址 3.错误码地址 服务码官网地址 点进去之后&#xff0c;可以看到&#xff1a; 分为三大类&#xff1a; Server Error Message ReferenceClient Error Mes…

Java大型建筑建设综合工程项目管理系统源码带原生APP源码 工程管理系统源码 Java手机端工程项目管理系统源码带客户端操作手册

客户端下载&#xff1a; 1、安卓手机端 先下载“PP助手”应用商店&#xff0c;再在PP助手中搜索“star工程”下载安装。 2、苹果手机端 苹果手机APPstore中搜索“star工程”下载安装。 建设综合工程项目管理系统&#xff0c;让公司业务管理实现可记录&#xff0c;可追踪&#…