第五十周:文献阅读+IGRA-ISSA-LSTM

news2024/11/18 7:42:21

目录

摘要

Abstract

文献阅读:基于IGRA-ISSA-LSTM模型的水质预测

现有问题

提出方法

方法论

灰色关联分析(GRA)

改进的灰色关联分析(IGRA)

麻雀搜索算法(SSA)

改进的麻雀搜索算法(ISSA)

IGRA-LSTM模型

IGRA-ISSA-LSTM预测模型

总体框架

工作流程

研究实验

数据集

评估指标

实验结果

总结


摘要

本周阅读的文献《Water quality prediction based on IGRA‑ISSA‑LSTM model》中,提出了一种新的基于改进的灰色关联分析(IGRA)、改进的麻雀搜索算法(ISSA)和LSTM的混合水质预测模型IGRA-ISSA-LSTM。采用改进的灰色关联分析确定DO、pH、KMnO 4等水质指标之间的相关性,准确分析了预测变量与剩余变量之间的关系,减少数据维度以此避免LSTM维数灾问题。采用改进的麻雀搜索算法提高寻找最优LSTM超参数的能力,提高模型预测精度。在钱塘江上的试验比较了IGRA和GRA在特征选择方面的优势,以及IGRA-ISSA-LSTM预测方面的优势。结果表明准确分析水质指标间的相关性可以提高模型的预测精度。

Abstract

The literature "Water quality prediction based on IGRA ISSA LSTM model" read this week, proposes a new mixed water quality prediction model IGRA-ISSA-LSTM based on improved grey correlation analysis (IGRA), improved sparrow search algorithm (ISSA), and LSTM. The improved grey correlation analysis was used to determine the correlation between water quality indicators such as DO, pH, and KMnO4. The relationship between predicted variables and residual variables was accurately analyzed to reduce data dimensions and avoid the problem of LSTM dimensionality disaster. Adopting an improved sparrow search algorithm to enhance the ability to find the optimal LSTM hyperparameters and improve the accuracy of model prediction. The experiment on the Qiantang River compared the advantages of IGRA and GRA in feature selection, as well as the advantages of IGRA-ISSA-LSTM prediction. The results indicate that accurately analyzing the correlation between water quality indicators can improve the prediction accuracy of the model.

文献阅读:基于IGRA-ISSA-LSTM模型的水质预测

Water quality prediction based on IGRA-ISSA-LSTM model | Water, Air, & Soil PollutionIt is essential to make an accurate prediction of the concentration of dissolved oxygen (DO), hydrogen ion concentration (pH), and potassium permanganate (icon-default.png?t=N7T8https://doi.org/10.1007/s11270-023-06117-x

  • Published: 02 March 2023

现有问题

  • 在过去的研究中广泛采用机器学习方法和LSTM结合的方法进行水质预测,但这些研究中LSTM的参数都是根据经验选择的,这增加了经验选择参数的盲目性,也限制了模型的适用性,因此,有必要找到LSTM的最佳超参数。麻雀搜索算法(SSA)作为一种新的算法,具有收敛速度快、目标限制低、所需调整参数少等优点。但是SSA仍然存在着容易陷入局部最优的缺陷。
  • 特征选择是水质预测中首先要考虑的问题。特征选择可以从本质上减少神经网络的维数灾难现象,提高预测精度。灰色关联分析(GRA)满足基本关联分析的需要,然而GRA在处理大数据样本时存在区分度低的问题。

提出方法

  • 高维数据的输入会削弱模型的计算能力和泛化能力,而降维可以通过增强数据的可读性来提高模型的预测能力。采用改进的灰色关联分析(IGRA)确定DO、pH、KMnO 4等水质指标之间的相关性,准确分析了预测变量与剩余变量之间的关系,解决长短期记忆(LSTM)维数灾问题,增强模型的学习能力。
  • 具有最优参数的LSTM将具有更好的预测效果,为了避免SSA陷入局部最优,提高寻找最优LSTM超参数的能力,建立了基于改进麻雀搜索算法(ISSA)的LSTM模型,并对学习速率、批量大小、训练次数、隐层节点和全连通隐层节点5个参数进行了自动优化,能够准确预测DO、pH和KMnO 4的浓度。

方法论

灰色关联分析(GRA)

灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。灰色关联分析的基本思想是根据序列曲线集合形状的相似程度来判断其联系是否紧密。曲线越接近,相应序列之间的关联度就越大,反之则越小。灰色关联分析主要有两个作用:一是综合评价,给出研究对象或者方案的优劣排名。二是系统分析,判断影响系统发展的因素的重要性。

GRA由参考序列和比较序列的识别、初始化、灰色关联系数的计算和关联度的计算四个过程组成。在这项研究中DO、pH和KMnO4的值被当作参考系列,其他指标测量水质被当作比较系列。

改进的灰色关联分析(IGRA)

相关度是衡量两类数据相关程度的指标,相关度越大,说明两类特征的相关性越强。IGRA通过结合形状相似性相关系数和距离相似性相关系数,提高了GRA的灰色相关系数。具体步骤如下。

  1. 从比较序列中减去参考序列以形成减法矩阵,如等式(1)所示。
  2. 形状相似性相关系数是通过引入Δ x(k)而形成的,如等式(2)所示。
  3. 将参考序列与比较序列相除以形成除法矩阵,如等式(3)所示。
  4. 距离相似性相关系数是通过引入Δ λ x(k)而形成的,如等式(4)所示。
  5. 最后确定了综合关联度,如等式(5)所示。

麻雀搜索算法(SSA)

算法原理

研究发现,麻雀群内部在觅食过程中有着明确分工。内部麻雀分为两种不同类型,一种为发现者,另外为跟随者。在种群中,发现者麻雀和跟随者麻雀两者的身份是不固定的,可以灵活转变身份。同时,麻雀种群内部也会因为争夺食物而引起竞争。另外,由于种群中靠外部的麻雀更容易受到捕食者的攻击,所以麻雀种群中的个体会不断调整自身位置,向相邻的同伴靠拢或向内部聚集,以此减少被捕食的风险。

群智能算法现在经常被用来解决真实的问题,如信号处理,神经网络训练,整数约束和混合整数约束优化,函数优化和多目标优化。这些算法的可行性和有效性已经通过现实世界的结果得到了证明,麻雀搜索算法(Sparrow Search Algorithm, SSA)是受到麻雀种群的觅食行为和反捕食行为的启发,从而提出的利用麻雀的这种生物特性进行迭代寻优的优化算法。

算法流程

适应度得分越高的麻雀越有可能首先收集食物,在捕食过程中,一旦发现者找到食物,加入者立即放弃原来的位置,与发现者争夺食物;如果成功,他们可以要求食物的所有权;否则,他们继续以原始的方式行事。 麻雀种群遇到捕食者时,处于种群靠外面的麻雀会往种群中部或内部的同伴身边靠拢,这部分发现危险的麻雀称为警备者,当警备者处于边缘时就会发现危险然后调整位置,向其他麻雀靠拢,以此保证自己的安全。

改进的麻雀搜索算法(ISSA)

通过改变种群初始化方法、更新参与者公式、随机变异麻雀进行优化等措施,ISSA可以防止SSA陷入局部最优,提高算法的稳定性和全局寻优能力。改进步骤如下:

(1)正弦映射对总体进行建模。使用正弦模型初始化SSA算法的人数(麻雀数量),提高其全局优化能力。

(2)在参与者更新公式中加入由改进的余弦因子控制的非线性权重。针对麻雀算法寻优能力不稳定,容易陷入全局最优的问题,引入修正余弦控制因子,自动平衡算法的全局和局部寻优能力。当一只麻雀加入一个群体时,它往往只关注一个发现者,错过其他发现者,他们有更好的机会看到猎物,进入局部最佳状态。考虑到这种情况,在参与者公式中添加了改进的余弦控制因子,从而增强了参与者的全局优化能力。

(3)Levy变异策略。结合了短距离和长距离,其中短距离步行可以提高麻雀仔细搜索附近环境的能力,远距离可以使麻雀跳出局部区域,扩大搜索范围。在SSA算法位置更新后,采用轮盘赌法选择更新种群,并引入Levy变异策略提高麻雀种群的多样性。

IGRA-LSTM模型

根据相关分析结果,将GRA和IGRA选取的与DO、pH和KMnO4相关程度较高的3个水质特征分别作为神经网络的第二、第三和第四输入,DO、pH和KMnO4分别作为神经网络的第一输入。形成多输入单输出拓扑,如图所示。

IGRA-ISSA-LSTM预测模型

总体框架

工作流程

  • 首先评估数据部分,先使用隔离森林方法发现离群值并删除,然后使用拉格朗日插值法填充剔除的离群值和缺失数据
  • 然后使用IGRA选择与DO、pH和KMnO 4相关性最高的几个水质指标,此外SSA也得到了改善。
  • 最后,利用ISSA改变LSTM的拓扑结构,建立多输入单输出模型,预测水中DO、pH和KMnO 4含量,并对结果进行研究和比较。

研究实验

研究以DO、pH和KMnO4为例,检验IGRA-ISSA-LSTM水质预测模型的预测精度。

数据集

使用中国环境监测总站提供的钱塘江闸观测站2020年11月8日至2021年6月27日的实时数据。每4小时采样一组数据,共计1300组。(长江是强潮汐河口,由于径流和潮流的相互作用,水质波动很大。此外由于部分设备老化,很容易出现监测数据缺失的情况,因此很难准确预测水质。)

评估指标

使用预测模型常用的四个评估指标,分别为平均绝对百分比(MAPE)、均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)。其中,\dot{y}为真值;\ddot{y}为预测值; \bar{y}为平均值;n为数据量。模型的预测准确性随着MAPE、RMSE和MAE分数的降低而增加,模型拟合数据越好,R2分数越大。

实验结果

一、验证基于IGRA-LSTM模型的水质模型预测效果

将GRA和IGRA选择的相关指标的历史数据以及预测指标的历史数据作为LSTM的输入,形成多输入单输出拓扑(如图10所示),预测第四天的DO、pH和KMnO 4浓度。下图分别是对DO、pH、KMnO4的预测结果,其中图(a)是GRA-LSTM模型的预测结果,图(b)是IGRA-LSTM模型的预测结果。

对于100-150范围内的峰值模拟,IGRA-LSTM提供了更好的拟合效果,这有助于在水质快速变化时确保模拟精度。对于后期的模拟过程,IGRA-LSTM具有较好的拟合度,可以保证水质的长期预测。在初步模拟和峰值模拟过程中,IGRA-LSTM表现更好,虽然存在欠拟合现象,但总体预测优于GRA-LSTM。

如表所示,与GRA-LSTM相比,基于IGRA-LSTM的DO、pH和KMnO 4预测都将MAPE、RMSE和MAE的值降低了,同时R2的值提高了。因此,IGRA可以有效地分析数据之间的关系,更准确地选择数据特征。

二、验证基于IGRA-ISSA-LSTM模型的水质预测效果

通过对IGRA的分析,选取与DO、pH和KMnO 4相关度较高的前3个水质指标分别作为神经网络的输入,建立了多输入单输出神经网络模型。在这项研究中,70%的数据集用作训练集,30%用作测试集,以预测第4天的DO,pH和KMnO 4浓度。下图显示了IGRA-ISSA-LSTM与其他三种模型在预测DO、pH和KMnO 4浓度方面的比较。

从图1可以看出,基于IGRA-ISSA-LSTM的DO预测整体拟合度较好,在峰值模拟时拟合度更好,能够保证水质突发事件的模拟精度。从图2可以看出,基于IGRA-ISSALSTM的pH预测在前期拟合度低于IGRA-SSALSTM,但在中后期有所提高,峰值时模拟效果更好,说明基于IGRA-ISSA-LSTM的pH预测整体性能较好。从图3可以看出,基于IGRA-ISSA-LSTM的KMnO 4预测对低峰值拟合度一般,但对高峰值拟合度较好,整体拟合效果较好。

如表所示,与IGRA-BP、IGRA-LSTM和IGRA-SSA-LSTM相比,基于IGRA-ISSA-LSTM的DO预测使得MAPE、RMSE、MAE都得到了降低,并将R2的值提高了。因此可以说明IGRA-ISA-LSTM可以更准确地解释水质的动态过程

总结

基于IGRA、ISSA和LSTM的DO、pH和KMnO 4浓度混合预测模型(IGRA-ISSA-LSTM),通过IGRA确定水质指标之间的相关性,从而可以降低模型维度,解决LSTM维数灾难问题,而ISSA提高寻找最优LSTM超参数的能力,避免SSA陷入局部最优,增加了预测的精度。改方法提供了一个新的视角如何管理水污染在未来,未来可以发展的方向包括增加数据集的水质指标和使用额外的优化算法来增强LSTM参数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1629868.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Redis】Redis安装、配置、卸载使用可视化工具连接Redis

文章目录 1.前置条件2.安装Redis2.1下载Redis安装包并解压2.2在redis目录下执行make命令2.3修改Redis配置文件2.4启动Redis服务2.5连接redis服务 3.Redis卸载4.使用可视化工具连接Redis 1.前置条件 Linux操作系统需要要是64位.如果不清楚自己Linux上是多少位的,可以使用以下命…

【机器学习原理】决策树从原理到实践

基于树的模型是机器学习中非常重要的一类模型,最基础的就是决策树,本篇主要讲述决策树的原理和几类最常见的决策树算法,这也是更复杂的树模型算法的基础。 参考文章: 1.CSDN-基于熵的两个模型(ID3,C4.5)比较详细,有数字…

JAVA SWING JTABLE表格,点击表头数据可以排序,且第一二行位置固定,不参与排序

对于JAVA SWING 界面开发,使用表格JTABLE开发过程中,一些情况下可能需要在点击表头时对数据进行排序处理。对于简单的排序处理,jtable的setAutoCreateRowSorter方法可满足,但是对于高要求的排序,则满足不了。 比如&am…

【leetcode】数组和相关题目总结

1. 两数之和 直接利用hashmap存储值和对于索引&#xff0c;利用target-nums[i]去哈希表里找对应数值。返回下标。 class Solution { public:vector<int> twoSum(vector<int>& nums, int target) {unordered_map<int, int> mp;vector<int> res;fo…

base64练习

找到password 搜索台搜索password 找到关于password关于base64算法的代码打上断点 点到这个位置在会有一个地址弹出来点击进去 缩小复制 粘贴 运行出数据&#xff0c;成功完成分析

Linux---为什么会有粘滞位?

在前面已经讲过目录的rwx权限&#xff1a; 可读权限(r): 如果目录没有可读权限, 则无法用ls等命令查看目录中的文件内容. 有可写权限(w):如果目录没有可写权限&#xff0c;则无法在目录中创建文件, 也无法在目录中删除文件.可执行权限(x): 如果目录没有可执行权限, 则无法cd到…

新版运营级限速网盘系统源码 带教程

支持用户使用微信扫码登录&#xff0c;上传文件分享链接可自定义&#xff0c;文件可一键保存到我的网盘&#xff0c;支持微信跟支付宝官方接口&#xff0c;易支付接口不强制可自定义&#xff0c;系统整体的架构安全度升级。学习地址

GraspNet-1Billion 论文阅读

文章目录 GraspNet-1Billion总体数据集评价指标网络pointnet&#xff1a;Approach Network:Operation Network&#xff1a;Tolerance Network 摘要相关工作基于深度学习的抓取预测算法抓取数据集点云深度学习 GraspNet-1Billion CVPR2020 上海交大 论文和数据集地址&#xff1…

Python爬虫--Scrapy框架安装

Scrapy框架安装 &#xff0c; Scrapy 是 Python 领域专业的爬虫开发框架&#xff0c;已经完成爬虫程序的大部分通用工具 它使用了 Twisted 异步网络库来处理网络通讯。整体架构大致如下 第一步&#xff1a;挂小灰机或者将要安装的文件下载到本地 Scrapy 框架安装踩坑中 为什…

【delphi 】常用资源网站

在Delphi的日常开发中&#xff0c;经常会用到第三方资源&#xff0c;本文收集的是开源的资源&#xff0c;建议收藏&#xff0c;以备不时之需&#xff01; 目录 一、通用资源 1. JCL 2. JVCL 3. Alcinoe (mirror at GH) 4. Fundamentals Code Library 5. Spring4D 6. The…

IDEA实现Springboot项目自动热部署

每当我们在修改代码时&#xff0c;往往需要重新启动项目&#xff0c;这样不仅浪费时间而且很麻烦&#xff0c;我们可以通过IDEA的热部署来提高效率 1、首先点file >> settings >> Build Excution >> Compire&#xff0c;选择Build project auto matically 2.…

获取1年免费的SSL证书

之所以写这篇帖子是因为一直使用的阿里云和腾讯云免费的ssl证书由一年有效期相继改为了3个月&#xff0c;3个月换一次证书想太过麻烦了&#xff0c;还是需要一年有效期的证书更为适合 有两个站点推荐:(本次以FreeSSL为例) .JoySSL一个提供免费HTTPS证书申请的网站 FreeSSL.c…

25.Feign的最佳用法

将feignClient抽取为独立模块&#xff0c;并把接口有关的entity,默认feign的配置都放到这个模块中&#xff0c;提供给所有的消费者。 1.首先创建一个module,命名为feign-client,然后引入feigh的starter依赖。 2.将order-service中编写的UserCllient、User都移动到feign-clien…

【STM32+HAL】读取电池电量

一、准备工作 有关CUBEMX的初始化配置&#xff0c;参见我的另一篇blog&#xff1a;【STM32HAL】CUBEMX初始化配置 有关定时器触发ADC模式配置&#xff0c;详见【STM32HAL】ADC采集波形实现 有关软件触发ADC模式配置&#xff0c;详见【STM32HAL】三轴按键PS2摇杆 二、所用工具…

C++高级特性:C/C++内存结构模型(十一)

1、内存结构 C/C语言一只被认为是一种底层语言&#xff0c;与其他语言不一样&#xff0c;对内存结构理解是C/C程序员从入门到入土的开端。 其他编程语言对内存管理是透明的&#xff0c;程序员无序关心可以认为是一个黑盒&#xff1b;而C/C不一样理解好内存结构有利于编写健壮性…

day-26 查询网格图中每一列的宽度

思路&#xff1a; 利用两个for循环&#xff0c;外层for用于遍历列数&#xff0c;内层for用于计算每一列的宽度 解题方法&#xff1a; 内层for循环时&#xff1a; 1.当前所在位置的值为0 则宽度为1 2.当前所在位置的值大于0 则宽度通过不断取商得到 3.当前所在位置的值大于0 则…

Vitis HLS 学习笔记--IDE软件高效操作指引

目录 1. 简介 2. 实用软件操作 2.1 C/RTL Cosimulation 选项 2.2 Do not show this dialog again 2.3 New Solution 2.4 对比 Solution 2.5 以命令行方式运行&#xff08;windows&#xff09; 2.6 文本缩放快捷键 2.7 查看和修改快捷键 2.8 将Vitis HLS RTL 导入 Viv…

SpikingJelly笔记之梯度替代

文章目录 前言一、梯度替代二、网络结构三、MNIST分类1、单步模式2、多步模式 总结 前言 在SpikingJelly使用梯度替代训练SNN&#xff0c;构建单层全连接SNN实现MNIST分类任务。 一、梯度替代 1、梯度替代&#xff1a; 阶跃函数不可微&#xff0c;无法进行反向传播 g ( x ) …

自动驾驶新书“五一”节马上上市了

我和杨子江教授合写的《自动驾驶系统开发》终于在清华大学出版社三校稿之后即将在五一节后出版。 清华大学汽车学院的李克强教授和工程院院士撰写了序言。 该书得到了唯一华人图灵奖获得者姚期智院士、西安交大管晓宏教授和科学院院士以及杨强教授和院士等的推荐&#xff0c;…

java:SpringBootWeb请求响应

Servlet 用java编写的服务器端程序 客户端发送请求至服务器 服务器启动并调用Servlet,Servlet根据客户端请求生成响应内容并将其传给服务器 服务器将响应返回给客户端 javaweb的工作原理 在SpringBoot进行web程序开发时,内置了一个核心的Servlet程序DispatcherServlet,称之…