【博士每天一篇文献-综述】A Modified Echo State Network Model Using Non-Random Topology

news2024/9/28 6:28:42

阅读时间:2023-11-23

1 介绍

年份:2023
作者: Arroyo, Diana Carolina Roca,数学与计算机科学研究所(ICMC)圣保罗大学 (USP)
期刊: 博士论文
引用量:0

这篇论文是一篇博士论文,提出了基于非随机拓扑结构的Echo State Networks (ESN)模型,用于处理时间/序列数据。文档探讨了利用复杂网络模型和聚类模型作为储层中的非随机拓扑结构,以更好地捕捉不同类训练数据的信息。其中,储层基于复杂网络的连接性拓扑结构包括随机网络、无标度网络和小世界网络。聚类模型包括K均值、基于中心点的分割和Ward算法。提出的模型在性能和计算成本方面优于经典ESN。该论文还展示了所提出模型在信号预测和图像中组织成分分类等方面的应用。第一个应用,两个预测任务Rössler和Lorenz系统。第二个应用,应用于人体组织医学图像分类问题。

2 创新点

(1)利用非随机拓扑的修改后的回声状态网络模型:作者通过复杂网络模型和聚类模型提出了新的回声状态网络(ESN)模型,用于处理时间/序列数据。在储层中利用非随机拓扑结构,包括随机网络、无标度网络和小世界网络,以更好地捕捉不同类别训练数据的信息。为了生成聚类的储层,提出使用经典的数据聚类算法:K均值、围绕中位数的分区和Ward算法来模拟社区结构。同时也生成了聚类的无标度网络和小世界网络作为储层。
(2)性能提升和计算成本降低:相比传统ESN模型,所提出的模型在性能上表现更好,并具有更低的计算成本。该论文展示了所提出模型在信号预测和图像组织成分分类中的应用。

3 相关研究


(1)随机网络
随机网络是一种具有N个节点,并且节点之间的连接是随机建立的网络结构。根据两种定义,随机网络分为G(N,L)模型和G(N, p)模型。在G(N,L)模型中,N个标记的节点通过L个随机放置的连接相连。而在G(N, p)模型中,每对N个标记的节点以概率p连接。随机网络的生成过程源自对节点之间的链接随机性设置,这种网络结构在时间序列分析及数据处理中扮演着关键的角色。
image.png
(2)无标度网络(Scaled free)
无标度网络是一种特殊类型的复杂网络,其特点是网络中存在少量的高度节点和大量的低度节点。在无标度网络中,节点的度分布遵循幂律规律,即符合pk ∼ k−λ的表达式。这意味着网络中连接k个节点的节点的比例与k的幂指数λ相关。通常情况下,λ的取值范围为2 < λ < 3。无标度网络的一个显著特征是存在“中心枢纽”,即具有高度连接度的节点,它们更有可能连接到其他节点,而非连接到度较低的节点。
无标度网络可以通过增长和优先连接机制生成,即网络在持续增长过程中趋向于连接到更多连接的节点,不同于随机网络的固定节点数和节点间随机连接的机制e。无标度网络的生成中,从m0个初始节点开始,这些节点最初是随机连接的,每个节点至少有一条连接。随后,在每个时间步骤中,新节点添加到网络中,通过优先连接机制决定将其m(m ≤ m0)条连接连接到网络中的其他节点。新节点更有可能连接到连接度更高的节点,即中心枢纽,而非度较低或少连接节点。
截屏2024-02-26 下午3.22.13.png
(3)小世界网络
小世界网络是一种网络结构,其特点是任意两个节点之间的平均距离很短,这也被称为六度分隔理论。该网络的构建方法是最初让网络中的节点仅与它们的邻居相连,然后随机改变一小部分连接,从而形成小世界网络。数学上,小世界网络的性质表明,在一个N个节点的网络中,每对节点之间的平均距离d与N成正比,而不是N或N的幂次方。这意味着网络的平均路径长度或直径对网络的大小的依赖呈对数关系。
截屏2024-02-26 下午4.01.10.png

(4)聚类复杂网络
聚类复杂网络是指一种网络结构,其中节点之间形成了紧密连接的子网络,不同子网络之间的连接相对稀疏。根据Newman(2010)的说法,通常有两种通用技术将网络分成不同的组或簇:图分区和社区检测算法。图分区的目的在于将网络中的节点分成一定数量的大小相等且无重叠的簇,同时使得簇间的边数量最小化。而社区检测的目的是找到一种自然的方式将网络分割。簇的大小并不是固定或预先确定的,可以在不同簇之间差异很大(Newman, 2010)。 给定网络可以分成几个大的簇,许多小的簇,或者是各种不同大小的混合。总的来说,图分区旨在找到底层网络中节点的最佳分割,而社区检测技术通常提供高效但次优的解决方案。
采用的聚类算法有Kmeans、K-methods、Ward层次聚类算法。

4 算法

在本文中考虑了两种结构:复杂网络和聚类网络。为了生成储层中神经元之间的连接拓扑结构,需要生成邻接矩阵,该矩阵确定神经元之间的连接方式。因此,一旦生成了邻接矩阵,就可以通过为先前建立的连接分配权重(值),来获得储层矩阵(权重矩阵)。
截屏2024-02-26 下午4.54.12.png
截屏2024-02-26 下午5.38.29.png

4.1 复杂网络

(1)基于无标度配置的拓扑结构:获得储备矩阵所需的邻接矩阵是通过生成一个无标度图来实现的。首先,初始化一个具有m0个节点的节点图,最初,它们会随机连接,直到每个节点至少有一个链接。然后,在每个时间步长,会添加一个新节点,该节点决定使用优先连接(即具有较高度)的m个节点(m < m0)连接到哪里。为了实现,使用Networkx模块生成一个Barabási-Albert图。
(2)基于小世界配置的拓扑结构:获得储备矩阵所需的邻接矩阵是通过生成一个小世界图来实现的。最初,创建一个具有n个节点的环。然后,将环中的每个节点与其k个最近邻连接(如果k为奇数,则为k-1个最近邻)。为了引入小世界特性,根据以下规则替换一些边:对于具有k个最近邻的基础环中的每个边u-v,以概率p替换为一个新边u-w,其中现有节点w是均匀随机选择的。为了实现,使用Networkx模块生成一个Watts Strogatz小世界图。

4.2 基于聚类的网络

使用了三种聚类算法:K-Means,K-methods和Ward,来生成集群拓扑结构

5 实验分析

(1)时间序列预测任务
截屏2024-02-26 下午5.54.05.png

截屏2024-02-26 下午5.56.15.png
从结果中我们可以观察到,总体来说,所研究的所有参数都对所提出模型的性能产生影响。具体来说,在两种情况下,可以看到小α值对记忆能力有影响,如图a和b所示。可以看到通过解决从储存器状态矩阵和目标训练集获得的线性回归的训练过程适用于小β值(β ≤ 图c和d。最后,图e和f显示了在模型中拟合偏差可以提高预测性能。根据表现,模型性能关于参数的选择取决于数据的性质。根据所获得的所有结果,可以确认储存器内的聚类改善了ESN模型的性能。
(2)分类任务
截屏2024-02-26 下午6.03.31.png
截屏2024-02-26 下午6.04.17.png

  1. 在具有聚类拓扑结构的储层中,随着聚类数的增加,模型表现更佳。
  2. 对于不同数据集,使用2个和16个聚类在储层中实现ESN模型的分类准确率进行了比较,结果表明使用更多聚类时,模型性能更好。
  3. 内存容量参数,即leak rate α,控制了储层中利用前一状态信息的程度,在实验中发现较大的α值(接近于1)对模型性能有积极影响。
  4. 对于岭参数β的研究显示,模型训练通过解决线性回归任务,适合使用较小的β值(β ≤ 1)。

6 思考

从储层拓扑结构的角度,进行改进。并应用到多种任务,在每个任务下对超参数进行了对比。工作量较大,但是创新点一般。这几种拓扑结构的ESN都已经存在的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1473229.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PostgreSQL 与MySQL 对比使用

一、前言 博主的系统既有 用到MySQL 也有用到PostgreSQL &#xff0c;之所以用到这两种数据库&#xff0c;主要是现在都是国产替代&#xff0c;虽然说这两款数据库也不是国产的&#xff0c;但是相对开源&#xff0c;oracle是不让用了。所以现在使用比较多的就是这两个关系型数据…

geotools解析shp 提示 opengis.*.SimpleFeatureType‘ 不在其界限内

问题:&#xff08; geotools.version&#xff1a;31-SNAPSHOT&#xff09; 解析shp文件时提示类型SimpleFeatureType不在其界限内 解决&#xff1a; 在引用处将org.opengis.feature.simple.SimpleFeatureType 改为 org.geotools.api.feature.simple.SimpleFeatureType

Web JavaScript

目录 1 前言2 原生js常见用法2.1 弹窗操作2.2 for循环操作2.3 打印日志操作2.4 获取页面值操作2.5 判空操作2.6 修改页面内容操作2.7 网页版计算器制作 3 外部js常见用法4 总结 1 前言 JavaScript 是一种脚本&#xff0c;一门编程语言&#xff0c;它可以在网页上实现复杂的功能…

jvm面试题目补充

jdk&jre Java程序设计语言、Java虚拟机、Java API类库这三部分统称为JDK&#xff08;Java Development Kit&#xff09;。 把Java API类库中的Java SE API子集 [1] 和Java虚拟机这两部分统称为JRE&#xff08;Java Runtime Environment&#xff09;&#xff0c;JRE是支持…

缓存一致性问题的解决策略

缓存一致性问题的背景和概念介绍 在一个系统中&#xff0c;我们通常使用数据库来存储数据&#xff0c;以保证数据的持久性。但是&#xff0c;由于数据库的读写速度相对较慢&#xff0c;如果每次请求都直接访问数据库&#xff0c;会降低系统的响应速度。为了提高系统的性能&…

进行模型测量这种量出来坡面的是平面面积还是真实面积?

斜面面积&#xff0c;不是表面积。 DasViewer是由大势智慧自主研发的免费的实景三维模型浏览器,采用多细节层次模型逐步自适应加载技术,让用户在极低的电脑配置下,也能流畅的加载较大规模实景三维模型,提供方便快捷的数据浏览操作。 #DasViewer##实景三维##三维重建##三维模型…

产品经理学习-产品运营《什么是SOP》

目录 什么是SOP 如何执行SOP 执行SOP的重点 什么是SOP SOP就是项目流程操作的说明书 日常工作中的例行操作&#xff1a; 例行操作是指&#xff0c;在每一天&#xff0c;针对每一个用户&#xff0c;在每个项目之中&#xff0c;都必须完成的操作&#xff0c;这些必须完成的操…

Java 的静态代理和动态代理

文章目录 1. 代理设计模式1.1 为什么需要代理设计模式1.2 代理设计模式1.2.1 概念1.2.2 名词解释1.2.3 代理开发的核⼼要素 2. 静态代理2.1 编码2.2 静态代理存在的问题 3. 动态代理3.1 Spring动态代理的概念3.2 动态代理细节分析3.3 动态代理的实现3.3.1 JDK 动态代理3.3.2 CG…

apachectl: line 79: 20233 Segmentation fault (core dumped) $HTTPD “$@“

[TOC](apachectl: line 79: 20233 Segmentation fault (core dumped) $HTTPD “$”) 1、问题描述 apache 启动报错 apachectl: line 79: 20233 Segmentation fault (core dumped) $HTTPD “$” 2、问题分析 参考链接: https://stackoverflow.com/questions/43726930/apache…

我的服务器为什么会被攻击?

时常的网站运行中&#xff0c;很多站长可能会遇到网站被黑客攻击的情况&#xff0c;其中同行之间恶性竞争&#xff0c;不正当的竞争关系&#xff0c;导致互联网关系越来越差&#xff0c;攻击的方式多种多样&#xff0c;网站遭受攻击的频次也越来越高。其次&#xff0c;就网络黑…

CUDA编程 - 用向量化访存优化 elementwise 核函数 - 学习记录

Cuda elementwise 一、简介1.1、ElementWise1.2、 float4 - 向量化访存 二、实践2.1、如何使用向量化访存2.2、Cuda elementwise - Add2.3、Cuda elementwise - Sigmoid2.3.1、简单的 Sigmoid 函数2.3.2、ElementWise Sigmoid float4&#xff08;向量化访存&#xff09; 2.4、C…

Facebook与社交创新:数字时代的社交构建者

在当今数字化时代&#xff0c;社交媒体已经成为人们日常生活中不可或缺的一部分。而在这个庞大的社交网络中&#xff0c;Facebook作为其中的巨头之一&#xff0c;不仅扮演着连接人们的桥梁&#xff0c;更是社交创新的领导者和推动者。本文将探讨Facebook在数字时代的社交构建中…

算法打卡day3|链表篇|Leetcode 203.移除链表元素、 707.设计链表 、 206.反转链表

链表基本概念 定义 链表是一种通过指针串联在一起的线性结构&#xff0c;每一个节点由两部分组成&#xff0c;一个是数据域一个是指针域&#xff08;存放指向下一个节点的指针&#xff09;&#xff0c;最后一个节点的指针域指向null&#xff08;空指针的意思&#xff09;。其…

leetcode.无重复字符的最长字串(刷题日记)

自从刷题开始之后&#xff0c;就突然有种感觉。 就是在刷完题之后当时是知道方法了&#xff0c;但是当再次遇到知道就又不会做了&#xff0c;就只好打开解题观摩大佬的代码&#xff0c;你别说&#xff0c;每次都感觉自己是s13。 所以我就想通过写博客来总结一下每次做完新的题…

十一、计算机视觉-膨胀操作

文章目录 前言一、什么是膨胀二、膨胀操作的实现1.引入库 三、膨胀的原理 前言 上节我们学习了腐蚀操作&#xff0c;本节我们讲一下膨胀操作&#xff0c;膨胀和腐蚀实际上是相反的操作。上节我们把云峰这2个字周围没用的像素去掉了&#xff0c;但是云峰这2个字也变细了&#x…

C#,弗洛伊德-瑞文斯特(Floyd-Rivest)算法与源代码

Robert W. Floyd 1 Floyd-Rivest 算法 Floyd-Rivest 算法是一种选择算法&#xff0c;用于在不同元素的数组中找到第k个最小元素。它类似于快速选择算法&#xff0c;但在实际运行中有更好的运行时间。 和 QuickSelect 一样&#xff0c;该算法基于分区的思想工作。对数组进行分…

SINAMICS V90 指导手册 第2章 2.2_系统配套表

V90 PN配套表一共有三张&#xff0c;分别是200V低惯量配套表、400V高惯量配套表和400V带直型连接器的配套表。其中200V电压等级低惯量伺服功率范围从0.05-2kW&#xff0c;额定扭矩从0.16-6.37Nm&#xff0c;电缆长度分别是3m、5m、10m、20m四种型号&#xff1b;400V电压等级带直…

《数据治理简易速速上手小册》第4章 数据安全与合规性(2024 最新版)

文章目录 4.1 数据安全的基本原则4.1.1 基础知识4.1.2 重点案例&#xff1a;在线零售商的数据加密4.1.3 拓展案例 1&#xff1a;医疗机构的访问控制4.1.4 拓展案例 2&#xff1a;金融服务提供商的数据备份和恢复 4.2 遵循数据合规性的策略4.2.1 基础知识4.2.2 重点案例&#xf…

如何在项目中考虑非功能需求

软件的非功能需求指的是除了软件的功能需求以外&#xff0c;软件需要满足的一些其他需求。常见的非功能需求包括&#xff1a; 性能需求&#xff1a;软件需要在特定的时间内完成特定的任务&#xff0c;例如响应时间、吞吐量等。可靠性需求&#xff1a;软件需要在各种环境下都能…

MySQL基础(二)

文章目录 MySQL基础&#xff08;二&#xff09;1. 数据库操作-DQL1.1 介绍1.2 语法1.3 基本查询1.4 条件查询1.5 聚合函数1.6 分组查询1.7 排序查询1.8 分页查询1.9 案例1.9.1 案例一1.9.2 案例二 2. 多表设计2.1 一对多2.1.1 表设计2.1.2 外键约束 2.2 一对一2.3 多对多2.4 案…