《机器学习》周志华-CH5(神经网络)

news2024/12/26 22:18:33

5.1神经元模型

  机器学习中谈论神经网络指“神经网络学习”。

  神经网络基本成分是神经元(neuron)和模型

  1943年,McCulloch and Pitts:M-P神经元模型

在这里插入图片描述

在这里插入图片描述

5.2感知机与多层网络

  感知机(Perceptron)由两层神经元组成,又称“阈值逻辑单元(threshold logic unit)”

在这里插入图片描述

  感知机可实现与、或、非运算, y = f ( ∑ w i x i − θ ) y=f(\sum w_ix_i-\theta) y=f(wixiθ)

  其中,f为阶跃函数, s g n ( x ) { 1 x ≥ 0 0 x < 0 sgn(x) \begin{cases} 1 & x\geq0 \\ 0 & x < 0 \\ \end{cases} sgn(x){10x0x<0
在这里插入图片描述
在这里插入图片描述

  更一般的,给定数据集,权重 w i ( i = 1 , 2... n ) w_i(i=1,2...n) wi(i=1,2...n),阈值 θ \theta θ可通过学习得到; θ \theta θ可看做 w n + 1 w_{n+1} wn+1,输入永远 − 1 -1 1.
在这里插入图片描述

  单层感知机只能“与”、“或”、“非”,非线性“异或”解决不了

  两层感知机可解决“异或”,引出多层前馈神经网络

5.3误差逆传播算法

  逆误差传播(error BackPropagation),BP是其中杰出代表

  通常说“BP网络”一般指用BP算法训练多层前馈神经网络
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

  BP目标是最小化训练集 D D D上的累积误差
E = 1 m ∑ k = 1 m E k \begin{equation} E=\frac{1}{m}\sum_{k=1}^mE_{k} \tag{5.16} \end{equation} E=m1k=1mEk(5.16)

  如何缓解BP网络过拟合???

  (1)“早停”:数据分为训练集和验证集,训练集用于计算梯度、更新权、阈值。验证集用来估计误差,若训练集误差降低但验证集升高,则停止训练。

  (2)“正则化”:在误差目标函数上增加一个可用于描述网络复杂度部分。如权与阈值的平方。
E = λ 1 m ∑ k = 1 m E k + ( 1 − λ ) ∑ i w i 2 \begin{equation} E=\lambda\frac{1}{m}\sum_{k=1}^mE_{k}+(1-\lambda)\sum_{i}w_{i}^2 \tag{5.17} \end{equation} E=λm1k=1mEk+(1λ)iwi2(5.17)

  其中, λ ∈ ( 0 , 1 ) \lambda\in(0,1) λ(01),用于对经验误差与网络复杂度这两项进行折中,常通过交叉验证法来估计。

5.4全局最小与局部极小

  我们常会谈到两种“最优”:“局部最小”(local minimum)和“全局最小”(global minimum)
在这里插入图片描述

在这里插入图片描述

  (1)以多组不同参数值初始化多个神经网络,按标准方法训练后,取其中误差最小的解作为最终参数;

  相当于从多个不同的初始点开始搜索,陷入不同的局部极小,从而选择有可能获得更接近全局最小的结果。

  (2)使用“模拟退火”技术(simulated annealing)

  模拟退火每一步都以一定概率接受比当前解更差的结果。

  每次迭代中,接受“次优解”的概率要随时间推移而降低,保证算法稳定。

  (3)使用随机梯度下降

  在计算梯度时加入了随机因素

  即使陷入局部极小点,计算的梯度仍可能不为零。

  遗传算法(genetic algorithm)也常用来训练神经网络以更好地接近全局最小

  上述方法理论上不够,启发式

5.5其他常见神经网络

5.5.1RBF网络

  RBF(Radial Basis Function,径向基函数)网络是一种单隐层前反馈神经网络,使用径向基函数作为隐层神经元激活函数。输出层则是对隐层神经元输出的线性组合
在这里插入图片描述
  具有足够多隐层神经元的RBF网络能以任意精度逼近任意连续函数。

  两步:

  • 确定神经元中心 C i C_{i} Ci,随机采样,聚集
  • 利用BP确定 w i 和 β i w_{i}和\beta_{i} wiβi
5.5.2ART网络

  什么是竞争性学习?

  竞争性学习(competetitve learining)是神经网络一种常用的无监督学习策略。输出神经元相互竞争,每一时刻仅有一个竞争获得胜利的神经元激活,其他被抑制

  这种成为 胜者通吃(winner-take-all)原则

  ART(Adaptive Resonance Theory,自适应谐振网络理论)是竞争性学习代表,网络由比较层(接收输入样本)、识别层(每个神经元对应一个模式类,神经元数目可在训练过程中动态增长,增加新的模式表)、识别阈值和重置模块构成。

5.5.2.1竞争最简单的方式
  1. 计算输入向量与每个识别神经元所对应的模式类的代表向量之间的距离,距离最小者胜;
  2. 获胜神经元向其他识别层神经元发送信号,抑制激活;
  3. 输入与获胜神经元的相似度大于阈值,归类该属性;
  4. 更新连接权重,后期相似样本计算更大相似度;
  5. 若相似度不大于阈值,增设一个新的神经元,当前输入为代表向量。
5.5.2.2识别阈值
  • 阈值高,输入样本会被细分多种类别
  • 阈值低,产生比较少,比较粗略的类

  ART比较好地缓解了竞争性学习中的“可塑性-稳定性窘境”(stability-plasticity dilemma)

  • 可塑性(指有学习新知识的能力)
  • 稳定性(指学习新知识时要保持对旧知识记忆)

  优点:可进行增量学习(incremental learning)或在线学习(online learning)

5.5.3SOM网络(Self-Origin)

  SOM网络是一种竞争学习型的无监督神经网络,能将高维映射到低维,同时保持高维拓扑结构。高维相似点映射为输出层邻近神经元。
在这里插入图片描述

   步骤:接收样本,每个输出层神经元会计算该样本与自身携带的权向量的距离,距离最近获胜,称最佳匹配单元。

   周围神经元权向量调整,使得权向量与当前输入样本距离缩小,不断迭代,直至收敛。

5.5.4级联相关网络

   结构自适应网络将网络结构也当作学习目标,希望找到合适网络结构。级联相关网络是结构自适应网络的重要代表

在这里插入图片描述

   级联:建立层次连接的结构,开始时只有输入输出层;随着训练新的隐层加入。

   与一般前馈神经网络相比,级联相关网络无需设置网络层次,隐层神经元数目,且训练速度快,但数据较少时容易过拟合。

5.5.5Elman网络

   “递归神经网络”(recurrent neural networks)允许出现环形结构,从而让一些神经元的输出反馈回来作为输入信号。

  使得 t t t时刻输出状态不仅与 t t t时刻输入有关,还与 t − 1 t-1 t1时刻网络状态有关,从而能处理与时间有关的动态变化。

在这里插入图片描述

  与多层前馈网络相似,但隐层神经元输出被反馈回来,与下一时刻输入一起作为下一次隐层输入。 s i g m o i d sigmoid sigmoid激活函数, B P BP BP算法。

5.5.6Boltzmann机

  神经网络有一类模型是为网络定义一个”能量“,能量最小即为理想。训练就是为最小化这个能力函数。

  Boltzmann机就是一种“基于能量的模型”(energy-based-model)
在这里插入图片描述
神经元分两层 { 显层: 用于数据的输入和输出 隐层: 数据的内在表示 神经元分两层 \begin{cases} 显层: & 用于数据的输入和输出 \\ 隐层: & 数据的内在表示 \\ \end{cases} 神经元分两层{显层:隐层:用于数据的输入和输出数据的内在表示

  Boltzmann机中神经元都是布尔型,取0(抑制),1(激活)状态。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5.6深度学习

  1. 典型的深度学习模型就是很深层的神经网络,增加隐层数目。

  2. 然而,多隐层神经网络难以直接用经典算法(如BP)进行训练,因为误差在多隐层内逆传播时,往往会“发散”(diverge)而不能收敛。

  3. 无监督逐层训练(unsupervised layer-wise training)是多隐层网络训练的有效手段.
    训练时将上一层隐结点的输出作为输入,而本层隐结点的输出作为下一层隐结点的输入,成为“预训练”(pre-training);预训练完成后,对整个网络“微调”。

  4. 深度置信网络(deef belief network,简称DBN),每层都是一个受限Boltzmann机,整个网络可视为若干个RBM堆叠而得,使用无监督逐层训练时,首先训练第一层,这是关于训练样本的RBM模型,可按标准的RBM训练;然后,将第一层预训练好的隐结点视为第二层的输入结点,对第二层进行预训练; ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ \cdot\cdot\cdot\cdot\cdot\cdot 各层预训练完成后,在利用BP算法对整个网络进行训练。

  5. 预训练+微调可视为将大量参数分组,局部较优联合为全局寻优,有利于节省训练开销。

  6. “权共享”可节省训练开销,让一组神经元使用相同的连接权。此策略在CNN中发挥了重要作用。

  7. 深度学习又为“特征学习”或“表示学习”
    通过多层处理,逐渐将初始“低层”特征转化“高层”表示,用“简单模型”完成复杂的分类学习任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2094875.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring Cloud Alibaba 快速学习之 Gateway

1 引言 Gateway顾名思义就是“网关”的意思&#xff0c;旨在为微服务提供统一的访问入口&#xff0c;然后转发到各个微服务&#xff0c;通常可以在网关中统一做安全认证、监控、限流等等功能&#xff0c;避免每个微服务都重复实现这些功能。 2 代码 本章演示的项目基于Sprin…

如何使用MabatisPlus

一. 引入相关的Maven依赖 例如下面我所引用的依赖 <dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus-boot-starter</artifactId><version>3.5.3.1</version></dependency>二.将写好的mapper继承BaseMap…

ref 和 reactive 区别

前言 ref 和 reactive是Vue 3中响应式编程的核心。在Vue中&#xff0c;响应式编程是一种使数据与UI保持同步的方式。当数据变化时&#xff0c;UI会自动更新&#xff0c;反之亦然。这种机制大大简化了前端开发&#xff0c;使我们能够专注于数据和用户界面的交互&#xff0c;而不…

【Spring】Spring Boot入门(1)

本系列共涉及4个框架&#xff1a;Sping,SpringBoot,Spring MVC,Mybatis。 博客涉及框架的重要知识点&#xff0c;根据序号学习即可。 目录 1、什么是Spring 1.1 什么是Spring 1.2 Spring与Spring Boot&#xff08;Spring 脚手架&#xff09;的关系 2、了解Maven 2.1 什…

好用的宠物浮毛清理神器,希喂、IAM、范罗士宠物空气净化器大揭秘

最近宠物空气净化器在养宠家庭中的讨论度一直很高&#xff0c;产品主打可以吸附宠物浮毛和异味的功能。养了三只小猫的我对此也很感兴趣&#xff0c;准备入手一台试试。可我没有想到宠物空气净化器的品牌有这么多&#xff0c;功课都做了好久。看了好几天&#xff0c;最后在希喂…

【Python报错已解决】`SyntaxError: can‘t assign to function call`

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525; 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 文章目录 引言&#xff1a;一、问题描述&#xff1a;1.1 报错示例&#xff1a;1.2 报错分析&#xff1a;1.3 解决思路&#xff…

Quartz任务调度框架

文章目录 前言一、介绍二、使用步骤1.创建maven工程&#xff0c;添加依赖2.创建任务3.启动任务 三、基本实现原理1. Scheduler任务调度器2. Triggers触发器2.1 SimpleTrigger2.2 CronTirgger 3. Misfire策略4 任务Job4.1 Job4.2 JobDetail4.3 JobDataMap 前言 最近跟的一个系统…

洞见数据价值,激活组织活力,让决策更精准的智慧地产开源了

智慧地产视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒&#xff0c;省去繁琐重复的适配流程&#xff0c;实现芯片、算法、应用的全流程组合&#xff0c;从而大大减少企业级应用约95%的开发成本。通过计算机视觉和…

Sql查询优化--索引设计与sql优化(包含慢查询定位+explain解释计划+左匹配原则+索引失效)

本文介绍了数据库查询的索引优化方法&#xff0c;依次介绍了慢查询语句定位方法、索引设计与sql语句优化方法&#xff0c;并介绍了左匹配原则和索引失效的场景&#xff0c;最后介绍了explain执行计划要怎么看以调整检验索引设计是否生效和效率情况&#xff0c;创新介绍了如何以…

AWS api数据信息获取(boto3)

GitHub - starsliao/TenSunS: &#x1f984;后羿 - TenSunS(原ConsulManager)&#xff1a;基于Consul的运维平台&#xff1a;更优雅的Consul管理UI&多云与自建ECS/MySQL/Redis同步Prometheus/JumpServer&ECS/MySQL/Redis云监控指标采集&Blackbox站点监控维护&漏…

4家国产数据库上市公司:最好的盈利1个亿,最惨亏8000w

目前国产数据库xc目录中大概有11家公司&#xff0c;其中多家公司已经上市了&#xff0c;且公布了最新的半年报&#xff01; 这里尝试分析一下几家国产数据库上市公司的发展潜力和情况。 达梦数据库 达梦数据库作为国产数据库第一股&#xff0c;业绩增长还是一如既往的猛&…

【零知识证明】通读Tornado Cash白皮书(并演示)

1 Protocol description 协议描述有以下功能&#xff1a; 1.insert&#xff1a;向智能合约中存入资金&#xff0c;通过固定金额的单笔交易完成&#xff0c;金额由N表示&#xff08;演示时用1 ETH&#xff09; 2.remove&#xff1a;从智能合约中提取资金&#xff0c;交易由收…

ncnn之yolov5(7.0版本)目标检测pnnx部署

一、pnxx介绍与使用 pnnx安装与使用参考&#xff1a; https://github.com/pnnx/pnnxhttps://github.com/Tencent/ncnn/wiki/use-ncnn-with-pytorch-or-onnxhttps://github.com/Tencent/ncnn/tree/master/tools/pnnx 支持python的首选pip&#xff0c;否则就源码编译。 pip3 …

Webpack打包常见问题及优化策略

聚沙成塔每天进步一点点 本文回顾 ⭐ 专栏简介Webpack打包常见问题及优化策略1. 引言2. Webpack打包常见问题2.1 打包时间过长问题描述主要原因 2.2 打包体积过大问题描述主要原因 2.3 依赖包版本冲突问题描述主要原因 2.4 动态导入和代码拆分问题问题描述主要原因 2.5 文件路径…

C++系列-继承方式

继承方式 继承的语法继承方式&#xff1a;继承方式的特点继承方式的举例 继承可以减少重复的代码。继承允许我们依据另一个类来定义一个类&#xff0c;这使得创建和维护一个应用程序变得更容易。基类父类&#xff0c;派生类子类&#xff0c;派生类是在继承了基类的部分成员基础…

编程效率进阶:打造你专属的 Git 别名与 PyCharm 完美结合

在日常开发中&#xff0c;Git 是我们不可或缺的工具。掌握常用 Git 命令可以帮助我们更高效地进行版本控制&#xff0c;但随着命令的复杂性增加&#xff0c;记住所有命令变得困难。这时&#xff0c;Git 别名的设置就显得尤为重要。此外&#xff0c;许多开发者使用 PyCharm 作为…

【Android自定义控件】Kotlin实现滚动效果的数字加减控件

前言 因业务上的需要&#xff0c;在APP中点餐时要有商品数目增减操作&#xff0c;数目增减的过程中有翻动的动画效果展现。在Android中有多种方式可以实现&#xff0c;本篇文章记录通过自定义View结合控件的平移动画相结合来实现此需求。 需求分析 根据上图分析控件的实现过程以…

Pillow:一个强大的图像处理Python库

我是东哥&#xff0c;一个热衷于探索Python世界的自媒体人。今天&#xff0c;我要向大家介绍一个在Python图像处理领域中不可或缺的库——Pillow。如果你对图像处理感兴趣&#xff0c;或者正在寻找一个简单易用的库来处理图片&#xff0c;那么Pillow绝对是你的不二之选。 基本…

【前端】代码Git提交规范之限制非规范化提交信息

需求背景 在我们目前的前端项目中&#xff0c;我们采用 git 作为版本控制工具。使用 git 管理项目意味着我们经常需要提交代码。当我们执行 git commit -m "描述信息" 命令时&#xff0c;我们被要求提供一个描述信息。现在使用约定式规范提交&#xff0c;和Commitiz…

用纯 div 实现一个选中和未选中状态

在现代网页设计中&#xff0c;利用 div 元素自定义样式&#xff0c;可以让界面更具有吸引力。通过一些简单的 CSS 样式和布局技巧&#xff0c;可以轻松实现交互自然的选中和未选中效果&#xff0c;而不需要依赖传统的 input 元素。 举个 &#x1f330; HTML <body><…