2024/10/13周报

news2025/1/10 11:51:47

文章目录

  • 摘要
  • Abstract
  • 文献阅读
      • 题目
      • 1. 背景与问题提出
      • 2. 提出的CLATT方法
        • 2.1 卷积神经网络(CNN)
        • 2.2 长短期记忆网络(LSTM)
        • 2.3 注意力机制
        • 2.4 滑动窗口方法
      • 3. 实验设计与结果
        • 3.1 数据集
        • 3.2 实验基线与评价指标
        • 3.3 实验结果与分析
      • 4. 消融实验与模型优化
      • 5. 与其他方法的对比
  • 总结

摘要

本周继续撰写年度进展报告,总结分析污水处理厂的各种工艺,并阅读了一篇基于注意力的CNN-LSTM方法用于高效废水水质预测的文章,本文提出了一种基于注意力机制的CNN-LSTM混合模型(CLATT),用于预测污水处理厂(WWTP)出水水质,通过结合CNN、LSTM和注意力机制,成功提高了污水处理厂出水水质的预测精度和稳定性。

Abstract

This week, I continued to write the annual progress report, summarizing and analyzing various processes of sewage treatment plants, and read an article on the use of attention based CNN-LSTM method for efficient wastewater quality prediction. This article proposes a CNN-LSTM hybrid model (CLATT) based on attention mechanism for predicting the effluent quality of sewage treatment plants (WWTP). By combining CNN, LSTM, and attention mechanism, the prediction accuracy and stability of wastewater treatment plant effluent quality have been successfully improved.

文献阅读

题目

An Attention-Based CNN-LSTM Method for Effluent Wastewater Quality Prediction

本文提出了一种基于注意力机制的CNN-LSTM混合模型(CLATT),用于预测污水处理厂(WWTP)出水水质。污水处理是水资源循环利用的重要环节,预测出水水质对于污水处理厂制定高效的操作策略、节约资源具有重要意义。传统的污水处理厂通常依靠物理、化学和生物方法来处理污水,通过传感器获得污水处理过程中的水质指标,并据此调控处理过程。然而,现有的控制方法通常存在滞后性,使得难以实现有效控制,甚至需要依赖过度处理(如增加化学品用量、加大曝气等)来确保出水水质达标,这不仅浪费了大量资源,还降低了污水处理的整体效率。因此,开发基于预测的水质控制方法,能够根据水质的变化提前调整操作,避免资源浪费,提高处理效率。

1. 背景与问题提出

污水处理厂需要应对处理过程中水质的复杂变化,现有的处理控制方法往往基于后续结果调整工艺,导致操作效率不高。污水处理过程涉及复杂的生化反应,随着污水成分、控制设定和气候条件的变化,这些反应的速率也会发生变化,增加了控制过程的复杂性。为了解决这些问题,越来越多的研究者开始采用数据驱动的神经网络方法,来代替基于反应机制的模型方法。

传统基于反应机制的模型,如活性污泥模型(ASM),通过微分方程模拟污水处理中的动态过程,并在实践中得到了验证。然而,这类模型需要大量的参数,并且这些参数需要随着时间和工况的变化不断更新,以保证预测的准确性。参数更新过程不仅需要大量的人工干预,还消耗了大量的物质资源。因此,基于神经网络的预测方法因其强大的非线性建模能力和自动学习特征的能力,在污水处理预测领域受到了广泛关注。

现有的基于神经网络的预测方法,如人工神经网络(ANN)、卷积神经网络(CNN)、长短期记忆网络(LSTM)等,已经在污水处理中的某些指标预测中取得了显著的效果。然而,这些方法往往采用单一的神经网络结构,非线性建模能力较弱,难以准确捕捉污水处理过程中复杂的生化反应。此外,污水处理是一个连续流动和混合的过程,采样时间点相邻的数据之间具有较强的相关性,现有方法往往忽略了这些相邻时刻水质数据之间的关联性,影响了预测的准确性。

2. 提出的CLATT方法

为了解决上述问题,本文提出了一种基于卷积神经网络、长短期记忆网络和注意力机制的混合模型(CLATT),结合滑动窗口方法,预测污水处理厂的出水水质。该方法的基本思想是在时间序列中利用CNN捕捉局部模式,利用LSTM整合长期依赖关系,使用注意力机制来增强相邻采样时刻之间的信息交互。此外,滑动窗口方法将预测过程划分为多步预测,动态更新模型参数,从而提高预测的准确性和稳定性。
在这里插入图片描述
在这里插入图片描述

2.1 卷积神经网络(CNN)

卷积神经网络是一类前馈神经网络,包含卷积计算操作,具有深层结构。CNN通过卷积操作提取特征,卷积核通过滑动的方式扫描输入特征图,并对局部区域进行加权求和,生成特定位置的特征值,从而提取输入数据中的局部特征。在本研究中,CNN被用作编码器,用于捕捉污水处理过程中时间序列数据的局部模式,如水质指标的变化趋势。

2.2 长短期记忆网络(LSTM)

LSTM是一种专门用于处理时间序列数据的递归神经网络。它通过引入输入门、遗忘门和输出门等结构,控制信息流动,从而有效地捕捉时间序列中的长期依赖性。LSTM被广泛应用于语音识别、文本分类和时间序列预测等领域。在本研究中,LSTM被用作解码器,整合CNN输出的特征,并进一步处理时间序列数据,以预测未来的污水处理结果。

2.3 注意力机制

注意力机制最早来源于对人类视觉系统的研究,它能够自动聚焦于特定目标,忽略其他无关信息。在机器学习领域,注意力机制常用于提高模型处理复杂信息的能力。在污水处理预测中,注意力机制用于整合相邻采样时刻的水质信息,提取关键特征,从而提高预测精度。
在这里插入图片描述

2.4 滑动窗口方法

在这里插入图片描述

为了解决模型预测性能随时间下降的问题,本文提出了滑动窗口方法。滑动窗口方法将原始预测过程分为多个步骤,每一步仅预测与训练集相邻的部分数据,并在预测完成后滑动窗口继续下一步预测,最终将所有预测结果组合起来。滑动窗口方法不仅可以实现模型的动态更新,还能够通过“数据增强”技术生成新的训练数据,从而防止模型过拟合特定数据段。

3. 实验设计与结果

3.1 数据集

实验数据来自中国福建省某污水处理厂,涵盖了2022年5月30日至2023年2月1日期间的2622个样本,采样频率为每两小时一次。数据集包括六个进水水质指标和四个出水水质指标,进水水质指标包括化学需氧量(COD)、氨氮(NH3-N)、总磷(TP)、总氮(TN)、水流量和pH值,出水水质指标包括COD、NH3-N、TP和TN。
超参数设置如下:
在这里插入图片描述

3.2 实验基线与评价指标

本文采用了三种基于神经网络的现有方法作为基线模型,包括基于CNN的Reg-CNN模型、CNN-LSTM混合模型和基于注意力机制的SSAA-LSTM模型。为了评价模型的预测性能,实验中使用了三种评价指标:均方误差(MSE)、平均绝对百分比误差(MAPE)和极限误差率(LER)。其中,MSE用于评估模型的整体预测误差,MAPE用于衡量模型的准确性,而LER则衡量模型在不同工作条件下的稳定性。

3.3 实验结果与分析

在这里插入图片描述
在这里插入图片描述

实验结果表明,CLATT模型在出水水质指标预测中表现出较高的准确性和稳定性。使用滑动窗口方法后,MSE减少了0.25,MAPE降低了5%,LER减少了7%。此外,消融实验结果显示,LSTM模块对时间序列的依赖关系学习能力在提高预测精度方面起到了关键作用,CNN模块能够有效提取特征信息,而注意力机制则增强了相邻时刻信息的整合。

在与其他方法的对比中,CLATT模型的MSE、MAPE和LER指标均优于基线模型,表明其在非线性建模和时间序列依赖关系处理方面具有更强的能力。此外,滑动窗口方法显著提高了模型在不同时间段的预测性能,使得模型在长时间预测过程中保持了较高的稳定性和准确性。

4. 消融实验与模型优化

为了进一步验证模型的合理性,本文进行了消融实验。通过分别去除CNN、LSTM和注意力机制模块,实验结果表明,去除LSTM后模型性能显著下降,说明时间序列中的依赖关系对污水处理预测至关重要;去除CNN后,模型的特征提取能力有所下降;去除注意力机制后,模型在处理相邻时刻信息整合方面的能力减弱。

此外,本文还对CNN中的残差块和批归一化层(BN层)进行了消融实验。结果表明,残差块有助于将原始信息传递到网络深处,避免梯度爆炸现象,而BN层能够平衡各水质指标的贡献,提高模型的预测性能。

5. 与其他方法的对比

与其他方法相比,CLATT模型表现出更强的非线性建模能力和时间序列依赖处理能力。特别是在预测COD、NH3-N、TP和TN等水质指标时,CLATT模型的点云图比其他模型更密集,预测值更接近于实际值。实验结果表明,CLATT在所有基于LSTM的模型中实现了最优的预测性能和最稳定的训练时间。

总结

本文提出的CLATT模型通过结合CNN、LSTM和注意力机制,成功提高了污水处理厂出水水质的预测精度和稳定性。

滑动窗口方法的引入不仅解决了预测性能随时间下降的问题,还增强了模型的动态更新能力。消融实验验证了模型各模块的合理性,与其他方法的对比实验表明,CLATT在多项评价指标上均实现了最优性能。

未来的研究方向包括:提高模型的泛化性能,使其适应不同污水来源的处理需求;将污水处理厂的操作方式(如化学品投加量、曝气能力等)纳入模型输入,以进一步增强模型的预测能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2212149.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用清华大学开源软件镜像站下载JDK

在软件开发和日常使用中,Java Development Kit(JDK)是不可或缺的一部分。它提供了Java运行环境和开发工具,使得开发者可以编写、编译和运行Java应用程序。本文将指导你如何从清华大学开源软件镜像站(TUNA)下…

通信工程学习:什么是UART通用异步收发器

UART:通用异步收发器 UART,全称Universal Asynchronous Receiver/Transmitter,即通用异步收发传输器,是一种广泛应用于嵌入式领域的串行、异步、全双工通信协议。以下是关于UART的详细介绍: 一、定义与特点 定义&…

数据分析:R语言计算XGBoost二分类模型的SHAP值

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 文章目录 介绍SHAP用途计算方法:应用加载R包导入数据建模平均SHAP值计算单个样本的每个特征的SHAP值蜜蜂图依赖图单个样本的SHAP解释(Force Plot)其他方法计算SHAP值单个个体预测结果系统信息…

MLM之Llama-3:Llama 3.2的简介、安装和使用方法、案例应用之详细攻略

MLM之Llama-3:Llama 3.2的简介、安装和使用方法、案例应用之详细攻略 目录 Llama 3.2 简介 1、Llama 3.2 的特点 2、模型评估 轻量级指令调优基准 视觉指令调整基准 Llama 3.2 的安装和使用方法 1、下载模型 2. 开发环境准备 3. 使用模型进行推理和微调 4…

Ubuntu命令行快速部署C++语言的GDAL库

本文介绍在Linux系统的Ubuntu电脑中,在命令行中一句代码快速配置C 环境下的gdal库的方法。 在文章Ubuntu基于Docker快速配置GDAL的Python、C环境(https://blog.csdn.net/zhebushibiaoshifu/article/details/133433838)中,我们就介…

【JVM】内存模型

文章目录 内存模型的基本概念案例 程序计数器栈Java虚拟机栈局部变量表栈帧中局部变量表的实际状态栈帧中存放的数据有哪些 操作数栈帧数据 本地方法栈 堆堆空间是如何进行管理的? 方法区静态变量存储 直接内存直接内存的作用 内存模型的基本概念 在前面的学习中,我们知道了字…

施磊C++ | 进阶学习笔记 | 3.绑定器和函数对象、lambda表达式

三、绑定器和函数对象、lambda表达式 文章目录 三、绑定器和函数对象、lambda表达式3.1模板的完全特例化和非完全(部分)特例化1.完全特例化和非完全(部分)特例化2.模板的实参推演 3.2 C STL中的绑定器bind1stbind2nd自己实现一个b…

深度学习——线性神经网络(三、线性回归的简洁实现)

目录 3.1 生成数据集3.2 读取数据集3.3 定义模型3.4 初始化模型参数3.5 定义损失函数3.6 定义优化算法3.7 训练 在上一节中,我们通过张量来自定义式地进行数据存储和线性代数运算,并通过自动微分来计算梯度。实际上,由于数据迭代器、损失函数…

基于深度学习的西红柿成熟度检测系统

简介: 基于深度学习技术的西红柿成熟度检测系统是一种利用人工智能算法对西红柿成熟程度进行自动识别和分类的智能系统。该系统通过采集西红柿的图像数据,运用深度学习模型对图像中的西红柿进行特征提取和分析,从而实现对西红柿成熟度的准确判…

【C】printf()与scanf()详介以及如何在VS中使用scanf(保姆级详细版)

printf() 基本用法 printf()的作用是将参数文本输出到屏幕,它名字里面的f 代表 format(格式化)&#xff0c;表示可以定制输出文本的格式。 1 #include <stdio.h>//standard input output标准输入输出操作 2 int main() 3{ 4 printf("Hello World"); 5 retu…

DVWA CSRF 漏洞实践报告

1. 漏洞简介 CSRF&#xff08;跨站请求伪造&#xff09;是一种攻击&#xff0c;使得攻击者能够以受害者的身份执行非预期的操作。在靶场DVWA中&#xff0c;我将尝试通过CSRF漏洞更改管理员密码。 2. 实验环境 DVWA版本&#xff1a;DVWA-old浏览器&#xff1a;火狐默认管理员账…

QtModel

QModelIndex index1 model->index(row,column,QModelIndex());QModelIndex index2 model->index(row.column,index2); QSqlQuery::size() 仅在使用了 QSqlQuery::exec() 后并且查询结果集的所有行都被读取时才有效。如果结果集很大或在使用游标的情况下&#xff0c;返回…

Linux 内核态,用户态,以及如何从内核态到用户态,交互方式有哪些

一、Linux 内核态&#xff0c;用户态 Linux 内核态&#xff0c;用户态&#xff0c;以及如何从内核态到用户态&#xff0c;我来说下我的理解 很多面试官&#xff0c;面试也是照搬照套&#xff0c;网上找的八股文面试题&#xff0c;面试的人也是背八股文&#xff0c;刚好背到了&…

全面讲解C++

数据类型 1.1 基本数据类型 1.1.1 整型&#xff08;Integer Types&#xff09; 整型用于表示整数值&#xff0c;分为以下几种类型&#xff1a; int&#xff1a;标准整数类型&#xff0c;通常为4字节&#xff08;32位&#xff09;。short&#xff1a;短整型&#xff0c;通常…

被装物联网系统|DW-S305系统是一套成熟系统

东识被装仓库管理系统&#xff08;智被装DW-S305&#xff09;作业管理软件系统包括收发管理、库房管理、库存统计、环境监测、预警管理、数据展示、系统管理等功能&#xff0c;主要功能如下&#xff1a; 收发管理&#xff1a;对库房收发物资进行管理&#xff0c;支持收发物单据…

通信工程学习:什么是TCP/IP(传输控制协议/互联网议)

TCP/IP&#xff1a;传输控制协议/互联网议 TCP/IP&#xff08;Transmission Control Protocol/Internet Protocol&#xff0c;传输控制协议/互联网协议&#xff09;是互联网的基本协议&#xff0c;也是国际互联网络的基础。它不仅仅是一个协议&#xff0c;而是一个协议族&#…

Github 2024-10-13php开源项目日报 Top10

根据Github Trendings的统计,今日(2024-10-13统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量PHP项目10Vue项目2JavaScript项目1TypeScript项目1Blade项目1Coolify: 开源自助云平台 创建周期:1112 天开发语言:PHP, Blade协议类型:Apach…

算法题总结(十四)——贪心算法(上)

贪心算法 什么是贪心 贪心的本质是选择每一阶段的局部最优&#xff0c;从而达到全局最优。 贪心的套路&#xff08;什么时候用贪心&#xff09; 刷题或者面试的时候&#xff0c;手动模拟一下感觉可以局部最优推出整体最优&#xff0c;而且想不到反例&#xff0c;那么就试一试…

Vscode+Pycharm+Vue.js+WEUI+django火锅(五)Django的API

如果只是嫌弃Djanggo的前台不好&#xff0c;用vue替换&#xff0c;只要在Djanggo项目里面创建一个Vue项目文件夹&#xff0c;然后 1.修改urls.py 修改路由 2.修改settings.py中&#xff0c;增加templates内容指向vue文件夹 3.静态文件staticfile_dir中也添加vue文件夹 但因为我…

深圳大学-Java程序设计-选实验3 包及继承应用

实验目的与要求&#xff1a; 实验目的&#xff1a;熟悉面向对象编程中package,import等语句的使用。 实验要求&#xff1a; (1).编写一个计算机与软件学院类CSSE、一个研究所/中心类Institute和一个教学系类Department。CSSE类中包含有多个Institute类的实例和多个Department…