2023.07.23 学习周报

news2025/1/11 23:40:34

文章目录

  • 摘要
  • 文献阅读
    • 1.题目
    • 2.问题
    • 3.解决方案
    • 4.方法
      • 4.1 框架
      • 4.2 基于高斯扩散的修复方法
      • 4.3 PM2.5的误差校正模型
      • 4.4 PM2.5数据修复的GD-GRU模型
      • 4.5 评估指标
    • 5.实验
      • 5.1 网络参数
      • 5.2 实验结果
    • 6.结论
    • 7.展望
  • Ns方程
    • 1.NS方程每一项的物理意义
    • 2.NS方程的推导过程
    • 3.深度学习与NS方程
    • 4.PINNs模型
    • 5.NS方程描述污染物的运动
  • 总结


摘要

This week, I read an computer science about a deep learning repair method for atmospheric environmental quality data based on Gaussian diffusion. Since deviation or missing atmospheric environmental data will greatly affect regional atmospheric quality analysis, this paper proposes a deep learning repair method based on Gaussian diffusion and gate cycle unit, GD-GRU, to improve the accuracy of atmospheric environmental data repair. The inputs are meteorological parameters and pollutant parameters, and the errors of estimates and observations are used as GRU outputs to calculate the missing data. The experimental analysis shows that the GD-GRU model has good performance and is superior to other models on average when applied to the repair of long sequence missing data. In addition, I continue to learn the relevant knowledge of NS equations and the possibility of thinking about the combination of NS equations and deep learning, using deep learning to optimize PDE solutions.

本周,阅读了一篇基于高斯扩散的大气环境质量数据深度学习修复方法的文章。由于大气环境数据出现偏差或缺失会对区域大气质量分析造成很大影响,对此文章提出了一种基于高斯扩散和门循环单元的深度学习修复方法,GD-GRU,旨在提高大气环境数据修复精度。输入为气象参数和污染物参数,估计值和观测值的误差作为GRU的输出,以此计算缺失数据。通过实验分析显示,将GD-GRU模型应用到长序列缺失数据的修复中,表现出良好的性能,并且平均优于其他模型。此外,我继续学习了NS方程的相关知识,以及思考NS方程与深度学习结合的可能性,即用深度学习优化PDE求解。


文献阅读

1.题目

文献链接:A deep learning method to repair atmospheric environmental quality data based on Gaussian diffusion

2.问题

1)在理想条件下,由于参数的默认和缺乏,物理模型处理非线性问题存在局限性。
2)虽然非线性机器学习模型可以提高预测精度,但它不能增强时间序列数据的时间滞后或长期学习依赖性。
3)虽然RNN等深度学习模型可以提高预测精度,但它是用既定数据训练的,因此无法预测没有历史数据集的极值。

3.解决方案

1)通过物理模型和深度学习模型提高模型训练的准确性,但为了有效修复空气质量数据,必须限制极值的预测精度。
2)建立了一个高斯扩散和门循环单元的耦合模型(GD-GRU),以提高数据修复的准确性。
3)利用深度学习和物理模型对极值进行高精度仿真和预测,可以解决物理模型参数监测和机器学习模型训练不足的问题。

4.方法

4.1 框架

组成部分:数据收集、高斯扩散、误差修正模型、结果分析和应用。
研究数据:桂林市各监测站的站点数据和空气质量数据
在这里插入图片描述

4.2 基于高斯扩散的修复方法

1)使用Pearson系数来计算站间的相关性,分析台站间PM2.5的相关强度。
在这里插入图片描述
表中数据显示,具有显著相关性的台站主要位于目标台站的逆风位置,这些区域容易形成湍流,不利于PM2.5扩散。
2)高斯扩散模型:
在这里插入图片描述
其中:X(X, y, z, t, H)为下风X米、横向y米、离地面z米;σx、σy、σz分别是根据大气稳定性选择参数计算的x、y、z轴上的扩散参数;H为监测点高度;u为平均风速。

均方根误差:
在这里插入图片描述

4.3 PM2.5的误差校正模型

1)目标:根据过去几个小时的PM2.5误差、天气和污染物来预测未来几个小时的PM2.5误差。于是将参数矩阵化:
在这里插入图片描述
误差修正模型采用GRU神经网络建立,其中f(⋅)为训练函数。上式可重写为:
在这里插入图片描述
2)GRU的结构:
在这里插入图片描述
3)计算公式:
在这里插入图片描述
GRU很好地捕捉了长期相关性,可以记住长时间内空气质量的周期性模式。

4.4 PM2.5数据修复的GD-GRU模型

GD-GRU模型结构示意图:
在这里插入图片描述
输入输出均为连续时间序列,利用PM2.5估计值和PM2.5误差计算预测PM2.5。

4.5 评估指标

采用MAE、RMSE和SMAPE三个评价指标评价GD-GRU的预测性能:
在这里插入图片描述
其中:n为样本总数,yi为实测时间序列,yi′为预测时间序列。

5.实验

5.1 网络参数

1)通过实验数据显示,神经元数目为64个,时间步长为10个时,效率最高,更有利于建模。
在这里插入图片描述
2)采用自相关函数分析PM2.5浓度时间序列之间的时间相关性:
在这里插入图片描述
3)随着时间步长的增加,较早的事件受当前状态的影响较小,呈明显的下降趋势。当时间步长小于9时,自相关系数大于0.8,具有较高的时间相关性。因此,将时间步长设置为10。
在这里插入图片描述

5.2 实验结果

1)预测表现
在这里插入图片描述
在整个预测范围内,GD-GRU预测性能很准确。即使在污染数据突然变化的情况下,GD-GRU也能表现出良好的性能。因此,实验结果表明所建立的模型可以在不同情况下修复数据。

2)高斯扩散对预测性能的影响
在这里插入图片描述
实验结果表明,高斯扩散模型与GRU具有相似的性能,GD-GRU保证了基于物理规律的预测趋势与实际趋势更加一致。

3)GD-GRU与其他方法的比较
在这里插入图片描述
与其它模型相比,GD-GRU对污染物的局部急剧变化更为敏感,这主要是因为高斯扩散模型能够获得更丰富的局部变化信息。GD-GRU可以修复自动在线监测站的污染物数据,并为改善人类健康提供许多有用的信息。

6.结论

1)为了修复偏差和缺失的大气环境监测数据,文章提出了一种基于高斯扩散法和神经网络耦合的大气污染数据修复模型。
2)训练数据集由气象、污染物参数和均方根误差数据的一组序列数据构建,其中均方根误差数据由高斯扩散模型的观测值和预测值计算得到。
3)实验结果表明,GD-GRU模型的预测效果优于高斯扩散模型和GRU模型,能够有效修复大气污染数据。
4)GD-GRU模型的优势是在一些极端情况下,可以计算出物理过程的极值,并使误差函数最小化,使数据恢复的趋势仍然符合大气污染物传播的自然规律。

7.展望

1)文章忽略了不同湍流风向在微观尺度上的物理效应,因此在未来每个点独立建模,用于风向分析的落后气团轨迹模型被小尺度湍流模型取代。
2)GD-GRU模型只能解决PM2.5在特定尺度条件下按照物理规律的传输和数据恢复问题,因为PM2.5受到化学变化、地理等诸多因素的影响。
3)在PM2.5扩散分析中考虑化学变化过程和地理因素,可以将误差限制在非常小的范围内,利用深度学习模型解决误差修正,达到更高的精度。

Ns方程

1.NS方程每一项的物理意义

在这里插入图片描述
其中:
1)公式左边:时间项,对流项;
2)公式右边:压力项,体积力和粘性力。

2.NS方程的推导过程

1)动量方程
在这里插入图片描述
其中:P是动量;V是一个关于xyzt的速度表达式,即是一个向量;u,v,w是V在xyz方向上的速度分量。

2)作用在流体粒子上的力
在这里插入图片描述
图中表示作用在流体粒子的力,对于一个流体粒子的中心来说,它会受到应力和剪切力,即类似压强,乘以面积后就是力。
在这里插入图片描述
3)微分动量方程
汇总动量方程和作用在流体粒子的力之后,可以得到下面的方程:
在这里插入图片描述
4)Navier Stokes方程
应力和剪切力的公式为:
在这里插入图片描述
其中:p是局部热力学压力
在这里插入图片描述
当应用于具有恒定粘度的不可压缩的流体时,方程大大简化,就得到了常见的NS方程:
在这里插入图片描述

3.深度学习与NS方程

PDE求解方法分为两种:
1)传统方法:有限元和有限微分
有限元:粗糙分辨率网格必然快且不准,而精细分辨率网格必然慢但是精准;计算的时候,需要做网格无关性验证,即网格增加一倍后,精度不变;网格过少,得不到准确结果的;网格过多,也无意义,甚至有副作用。
2)数据驱动
Finite-dimensional operators:神经网络参数化一个有限维的算子,输入和输出都是有限维的欧几里得空间;这些方法依赖于网格,并且需要针对不同的分辨率和离散化进行修改和调整,以实现一致的误差。
Neural-FEM:使用一组有限的基函数来参数化特定条件下方程的解

4.PINNs模型

PINNs模型是AI在偏微分方程领域应用中的模型,只需要初边值条件和方程即可求解,并且在精度上具有超越数值方法的潜力。
在这里插入图片描述
以Burgers方程为例:
在这里插入图片描述
使用初边界条件做约束,直接计算模型的输出在初始和边界时和条件的MSE:
在这里插入图片描述
PINNs模型的亮点在于计算方程的Loss,当输出的u和对应的导数满足方程时,f是等于0的。因此,目标是让f尽可能的接近0。这样就实现了即使不知道真值u,也能计算出方程的Loss用于指导神经网络参数的更新,实现了非监督学习的效果。
在这里插入图片描述
写成MSE的形式:
在这里插入图片描述
而二者的权重分配,分别采用了定值和动态调整的策略:
在这里插入图片描述

5.NS方程描述污染物的运动

1)确定初始条件和边界条件
初始条件描述了在t=0时刻的流体速度和污染物浓度分布,而边界条件反映了流体速度和污染物浓度在流体区域边界的行为。
2)数值求解
一般情况下,NS方程是非线性的偏微分方程,很难找到解析解。因此,考虑使用有限元法求解这些方程的数值解,可以在计算机上进行模拟,得到流体速度场和污染物浓度场随时间和空间的变化。
3)预测污染物运动
通过这样的模拟,可以了解污染物在流体中的传输过程,预测污染物的扩散范围,以及对不同条件下的污染物传输行为进行研究。


总结

本周,我学习了NS方程的相关知识,以及思考NS方程与深度学习结合的可能性。下周,我将继续补充学习NS方程的理论知识,怎么用NS方程表述污染物的运动,继续思考怎么将NS方程与深度学习结合起来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/782146.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

机器学习预测指数

导包,收集数据 import numpy as np import pandas as pd import talib import warnings warnings.filterwarnings(ignore) import tushare as tsdata ts.get_k_data(codehs300, start2005-04-08, end2023-11-08, ktypeD) data data.set_index(date) data data[[…

ftp和sftp区别,以及xftp的使用

网上找链接找的很辛苦对吧! 网上下载的破解版还不用。而且用没多久又说要更新了,又得重新找。 这下直接把官方免费获取链接发给你,就不用在被这种事情麻烦了。 家庭/学校免费 - NetSarang Website (xshell.com):家庭/学校免费 - NetSarang W…

JVM运行时数据区——方法区、堆、栈的关系

方法区存储加载的字节码文件内的相关信息和运行时常量池,方法区可以看作是独立于Java堆的内存空间,方法区是在JVM启动时创建的,其内存的大小可以调整,是线程共享的,并且也会出现内存溢出的情况,也可存在垃圾…

Idea中git push to origin/master was rejected错误解决方案

Idea中git push to origin/master was rejected错误解决方案 问题描述解决方法 问题描述 idea开发中,需要将项目发布到gitee上,在gitee上创建仓库后,通过idea中git推送项目代码提示: push to origin/master was rejected 解决方法 gitee创建仓库时创建了README.md文件,本地…

C# 通用OCR识别 文字识别 中文识别 服务

软件说明 基于以下开源项目,做了再次封装 GitHub - sdcb/PaddleSharp: .NET/C# binding for Baidu paddle inference library and PaddleOCR 自带模型,可离线部署; 技术路线:VS2022Sdcb.PaddleInferenceSdcb.PaddleOCRNLogNan…

uniapp 微信小程序 文章详情页顶部标题动态对应文章列表页返回的标题

文章详情页代码图&#xff1a; 代码&#xff1a; template <template><view class"policy-detail"><view class"title">{{description}}</view><view class"time">{{createTime}}</view><view class&q…

FIO的安装及使用

简介 FIO是一款测试IOPS的工具&#xff0c;用于对磁盘进行压力测试和验证&#xff0c;磁盘I/O是检查磁盘性能的重要指标&#xff0c;可以按照负载情况分成照顺序读写&#xff0c;随机读写两大类&#xff0c;FIO可产生很多线程或进程并执行用户指定的特定类型的I/O操作&#xf…

python_day12_map

map方法&#xff08;算子&#xff09; 导包 from pyspark import SparkConf, SparkContext import os为pyspark指向python解释器 os.environ[PYSPARK_PYTHON] "D:\\dev\\python\\python3.10.4\\python.exe"创建SparkContext对象 conf SparkConf().setMaster(&qu…

Flask 页面展示文件目录及文件,通过勾选复习框删除

(45条消息) flask 读取文件夹文件&#xff0c;展示在页面&#xff0c;可以通过勾选删除_U盘失踪了的博客-CSDN博客 基本实现 针对上面的功能再优化 项目结构 app.py import os import shutil from flask import Flask, render_template, request, redirect, url_forapp F…

【蓝牙AVDTP A2DP协议】

蓝牙AVDTP A2DP 一.AVDTP1.1 AVDTP概念1.2 Source Sink整体框架1.3 AVDTP术语1.3.2 Stream1.3.2 SRC and Sink1.3.3 INT and ACP1.3.4 SEP&#xff1a; 1.4 AVDTP体系1.4.1 体系概括1.4.2 Transport Services 1.5 Signaling Procedures1.5.1 General Requirements1.5.2 Transac…

学习 C语言第一天 :C语言常见概念

1.C语言是什么&#xff1f; 那人和计算机是怎么交流的呢&#xff1f;使用计算机语言。 C语言就是众多计算机语言中的一种&#xff0c;当然C/Java/Go/Python都是计算机语言。 2.了解 C语言的历史和辉煌 初衷&#xff1a;C语言最初是作为 Unix系统开发工具而发明的。 历史过程&am…

uniapp uni.$emit()失效

1.业务场景 settle.vue页面引入bjs-settle.vue组件&#xff0c;bjs-settle.vue组件点击后在settle.vue中进行结算操作&#xff08;过程中有跳转&#xff09; 本来以为使用vue的this.$emit()就可以实现子组件回调父组件中的方法&#xff0c;但是发现没用。 然后看到uniapp中需…

Linux性能与统计命令

目录&#xff1a; linux常用命令之性能统计linux常用统计命令linux进程与线程Linux性能统计 1.linux常用命令之性能统计 为什么要学习性能统计&#xff1f; 性能统计是衡量系统性能的重要手段&#xff0c;通过对系统各项指标的监控和分析&#xff0c;可以及时发现系统瓶颈和…

山西电力市场日前价格预测【2023-07-24】

日前价格预测 预测明日&#xff08;2023-07-24&#xff09;山西电力市场全天平均日前电价为338.25元/MWh。其中&#xff0c;最高日前电价为377.59元/MWh&#xff0c;预计出现在20: 30。最低日前电价为283.56元/MWh&#xff0c;预计出现在13: 30。 价差方向预测 1&#xff1a;实…

Linux系统初装后的配置

目录 1、学习环境关闭SElinux 2、关闭防火墙 3、添加用户 4、使用sudo进行权限管理 5、修改ssh服务的默认配置 6、修改网卡参数 环境&#xff1a;centOS7 1、学习环境关闭SElinux 临时关闭 &#xff1a;setenforce 0;查看状态&#xff1a;getenforce;临时开启&#xff…

uniapp 小程序 查看评价

查看评价效果图&#xff1a; 评分组件在上一篇文章&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01; <template><view class"view-comments"><view class"evaluate-box"><view class"ti…

C++ | set与map的用法指南

前言 前面我们学习了vector、list等容器&#xff0c;其实他们都属于序列式容器&#xff0c;因为其底层为线性结构&#xff1b;今天我们学习使用的set与map是属于关联式容器&#xff0c;关联式容器更注重于数据检索访问的效率&#xff1b;本文所有的资料均查阅于文档&#xff0c…

Python实战项目——旅游数据分析(四)

由于有之前的项目&#xff0c;所以今天我们直接开始&#xff0c;不做需求分析&#xff0c;还不会需求分析的可以看我之前的文章。Python实战项目——用户消费行为数据分析&#xff08;三&#xff09; 导入库 import numpy as np import pandas as pd import matplotlib.pyplo…

Sentinel授权规则与规则持久化

&#x1f333;&#x1f333;&#x1f333;&#x1f333;&#x1f333;&#x1f333;&#x1f333; 学习授权规则前&#xff0c;先想想SpringCloud Gateway的黑白名单&#xff0c;请求过网关&#xff0c;gateway会去鉴权。但如果有人把微服务信息泄露出去了呢&#xff1f;此时微…

输出函数print

print("hello world") # 可以输出数字 print(1111) print(2222) # 可以输出字符串 print(helloworld) print("helloworld") # 可以输出运算符的表达式 print(56) # 将数据输出文件中&#xff0c;注意点&#xff1a;1.所指定的盘符存在&#xff0c;2.使…