2023.08.20 学习周报

news2024/11/26 0:51:32

文章目录

  • 摘要
  • 文献阅读
    • 1.题目
    • 2.现有问题
    • 3.解决方案
    • 4.本文贡献
    • 5.方法
      • 5.1 利用长短期记忆网络学习时空演化特征
      • 5.2 构建用于气象辅助信息编码的堆叠自编码器
      • 5.3 使用多任务学习发现全市通用模式
      • 5.4 模型
    • 6. 实验
      • 6.1 数据集
      • 6.2 实验设置
      • 6.3 实验结果
    • 7.结论
    • 8.展望
  • 大气污染物传输
  • 总结


摘要

This week, I read a computer science that predicted the time series of PM2.5 in multiple locations in Beijing. Existing data-driven methods ignore the dynamic relationship between multiple sites in urban areas, resulting in unsatisfactory prediction accuracy. To solve this problem, a long short-term memory-Autoencoder multitask learning model (LSTM-Autoencoder) is proposed to predict PM2.5 time series at multiple locations across the city. The multi-layer LSTM network can simulate the spatiotemporal characteristics of urban air pollution particles, the autoencoder can encode the key evolution model of urban meteorological system, and the multi-task learning can automatically discover the dynamic relationship between multiple key pollution time series. The simulation results of PM2.5 in Beijing show the effectiveness of the proposed method. In addition, I learn the basic knowledge of air pollutant transmission.

本周,阅读了一篇预测北京市多个地点的PM2.5时间序列的文章。现有的数据驱动方法会忽略城市地区多个站点之间的动态关系,导致预测精度不理想。针对这个问题,提出了一种长短期记忆-自编码器多任务学习模型(LSTM-Autoencoder)来预测全市多个地点的PM2.5时间序列。展开来说,多层LSTM网络可以模拟城市空气污染颗粒物的时空特征,自编码器可以对城市气象系统关键演化模式进行编码,多任务学习可以自动发现多个关键污染时间序列之间的动态关系。对北京市PM2.5进行模拟,实验结果表明了该方法的有效性。此外,我学习了大气污染物传输的基础知识。


文献阅读

1.题目

文献链接:Multitask Air-Quality Prediction Based on LSTM-Autoencoder Model

2.现有问题

现有的基于人工神经网络的PM2.5时间序列预测方法,主要是选择一个地点进行建模,容易造成信息丢失。

3.解决方案

1)采用多位置PM2.5时间序列,利用LSTM学习时空演化特征。
2)考虑到深度学习模型的有效性,提出了带气象信息编码器的多任务LSTM模型,用于PM2.5时间序列的建模。
3)采用多LSTM层提取PM2.5时间序列的时空特征,提出叠置式自编码器对多个地点的气象信息进行编码,使用级联并行架构进行多任务学习。

4.本文贡献

1)考虑到空气污染物的复杂时空动态,通过多层LSTM网络的时空学习,探索城市多个地点颗粒物的时空特征。
2)利用气象信息,采用稀疏约束叠加自编码器对进化信息进行编码。
3)PM2.5时间序列在多个地点之间具有很强的相关性,于是利用多任务学习自动探索重点污染监测站之间的联系,并通过深度学习模型隐式描述各地点之间的关系。
4)对北京市多站PM2.5时间序列和气象观测资料的建模与仿真表明,该方法考虑了多站间的相互关系,取得了满意的效果。

5.方法

5.1 利用长短期记忆网络学习时空演化特征

LSTM网络图:
在这里插入图片描述

5.2 构建用于气象辅助信息编码的堆叠自编码器

1)定义了一个特征学习函数h = fθ (X),其中fθ(·)称为编码器函数。然后,解码函数X = gθ (h)学习重构原始信号。特征向量h是原始输入的压缩表示。
2)目标是构建气象信息的向量表示,并将其用于PM2.5时间序列的建模。气象自编码器的目标函数可表示为:
在这里插入图片描述
其中:XMeteo,i为第i个监测点位置的气象信息,R(θ)是自编码器权值的约束项。

5.3 使用多任务学习发现全市通用模式

1)在硬参数共享中,学习神经网络基础层的公共特征子空间。在基础层中参数是完全相同的,可以防止过拟合问题,有更好的泛化效果。
2)在软参数共享中,任务的模型参数可以是不同的、受规则约束的特征子空间。
3)多任务学习的参数学习图:
在这里插入图片描述
4)多任务学习的目标函数:
在这里插入图片描述
其中:X为多任务输入,Yi为各自的多任务学习目标,θi是第i个任务对应的学习参数,N是任务数。

5.4 模型

1)模型架构图:
在这里插入图片描述
多层LSTM网络对PM2.5时空序列特征进行学习,层叠式自编码器可以逐层压缩有用信息,提高性能。
2)在更高层次的特征学习上,使用两层密集网络学习PM2.5综合演化信息和气象辅助。基于深度特征,利用多个亚密集层对全市范围内多个地点的PM2.5时间序列进行建模,并输出预测值。整个模型的目标函数为:
在这里插入图片描述
其中:yi,j为PM2.5时间序列实值,N为空气质量监测站的个数,n是时间序列的个数。XPM2.5为所有空气质量监测站的记录值,XMeteo是辅助气象信息的输入,θ为所提模型的所有参数。

6. 实验

6.1 数据集

1)主要包括几种空气污染物的浓度:PM2.5(μg/m3)、PM10(μg/m3)、NO2(μg/m3)、CO(mg/m3)、O3(mg/m3)和SO2(μg/m3)。共有18个监测站,站点名称、经纬度如下所示:
在这里插入图片描述
2)时间序列从2017年1月30日下午4点到2018年1月31日下午3点每小时采样一次,共8784个样本。
3)利用气象信息作为辅助信息,包括温度、压力、湿度、风向、风速和天气情况。共有13个气象站,位置如下所示:
在这里插入图片描述

6.2 实验设置

优化方法是最常用的ADAM优化器,使用三个评价指标来比较所提出模型的性能:均方根误差(RMSE)、平均绝对误差(MAE)和对称平均绝对百分比误差(SMAPE)。

6.3 实验结果

1)该模型在北京市多个气象监测站的预报结果:
在这里插入图片描述
从图中可以看出,多个地点的PM2.5时间序列趋势是一致的,但地点之间的细节差异很明显。
2)该方法对PM2.5时间序列的一步前预测结果和三步前预测结果:
在这里插入图片描述
从表中可以看出,提出的方法在各个指标(RMSE、MAE、SMAPE)上都有更好的表现,每个指标的预测误差都比对比方法好10%左右。
3)LSTM-Autoencoder模型和传统LSTM模型的预测结果
在这里插入图片描述
两者之间预测结果相差很大,LSTM-Autoencoder模型在12月21日的预测结果优于传统的LSTM模型。预测曲线增长快,能有效地预测空气质量。相比之下,传统LSTM无法跟踪PM2.5时间序列的趋势。

7.结论

1)提出了一种新的多任务深度学习模型,该模型具有自动编码的辅助信息,用于空气质量时间序列预测。
2)模型可以利用历史PM2.5时间序列和全市多地点的气象时间序列,而多任务学习范式可以隐式捕捉跨任务演化模式,用于时间序列建模。
3)克服了数据驱动的PM2.5预测方法的局限性,模拟结果证实了模型的有效性。
4)模型可以跟踪PM2.5时间序列发生剧烈变化时的演变模式,并且可以隐式学习多个站点的多个PM2.5时间序列的共同模式。

8.展望

在PM2.5时间序列建模中加入更多的辅助信息,如经济因素、气体排放等,即传统PM2.5预测模型从未考虑过的确定性过程。

大气污染物传输

1.大气污染物传输的本质是空气中污染物的扩散和迁移过程,而大气污染物传输的主要因素包括风、大气稳定度、地形、气象条件等。
1)风:风的方向和速度决定了污染物的扩散方向和速率。强风能够将污染物快速地从污染源地带到其他地区,而相对较弱的风可能导致污染物在源地积累。
2)大气稳定度:大气稳定度指的是大气中垂直气流的强弱。在稳定的大气条件下,污染物容易积聚在较低的空气层中,形成雾霾等现象。而在不稳定的大气条件下,污染物可能会被较强的垂直气流带到较高的空气层,减少地表的浓度。
3)地形:山脉、山谷等地形特征能够影响风的流动,并且可能导致污染物在某些地区的积聚或稀释。
4)气象条件:温度的变化可以影响空气密度,从而影响污染物的上升和下沉。湿度可以影响污染物的溶解和反应。

2.利用高维数学方法来建立模型预测大气污染物传输
1)偏微分方程:大气污染物传输通常涉及多个自变量,如时间、空间坐标等。偏微分方程是用来描述多个自变量之间关系的数学方程。
2)扩散方程:扩散方程是描述物质传输和扩散过程的数学模型。在高维数学中,可以使用偏微分方程来表示扩散方程。这些方程可以考虑污染物浓度随时间和空间的变化,同时考虑风速、大气稳定度等因素。
3)数值模拟方法:由于复杂的大气流动和扩散过程难以解析地求解,数值模拟方法成为了预测大气污染物传输的重要工具。通过将扩散方程离散化,可以在计算机上模拟大气污染物的传输过程。
4)数据同化:将观测数据与模型预测结果进行融合,从而提高预测的准确性。数据同化技术可以将实际观测数据与模型预测进行比较,通过优化算法来调整模型参数,使模型的输出与实际观测数据更加一致。
5)随机过程:大气传输过程中存在不确定性因素,如风速和方向的随机变化。随机过程理论可以用来建立随机扩散模型,考虑这些不确定性因素对污染物传输的影响。

3.大气污染物传输过程需要遵循的物理规律
1)质量守恒:在任何给定的空间区域内,污染物的质量不能凭空产生或消失,只能通过传输和转化来改变。这意味着传输过程中,污染物的流入流出量必须相等。
2)扩散:它描述了污染物在浓度梯度驱动下在空气中的随机运动。扩散过程可以使用菲克定律来描述,该定律表明扩散通量与浓度梯度成正比。
3)对流:对流可以通过空气的运动来将污染物从一个地区传输到另一个地区,其中风的方向和速度决定了污染物的传输路径。
4)沉降:大气中的颗粒物和气溶胶等污染物会因重力作用而沉降到地面,这被称为沉降过程。沉降速率取决于颗粒物的大小、密度以及空气的粘度和密度。
5)化学反应:大气中的污染物可能会发生化学反应,导致浓度的变化。其中化学反应可以影响污染物的浓度分布和组成。
6)辐射传输:辐射传输是指太阳辐射或其他电磁辐射对污染物传输的影响。一些污染物可能吸收或散射辐射,从而影响大气的温度和辐射平衡。


总结

本周,我阅读了一篇预测北京市多个地点的PM2.5时间序列的文章,它是一个基于神经网络的预测模型,该模型使用神经网络来模拟气候污染物的运输过程。 此外,我学习了大气污染物传输的基础知识,其中包含了大气污染物传输的影响因素以及需要遵循的物理规律。下周,我会学习一些数学方法或者模型能够有效地分析大气污染的变化规律,预测大气污染物未来的走势,理解其中的优势点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/903883.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

04 - Vue3语法系统进阶 - 全面掌握Vue3特性

目录 01-ref属性在元素和组件上的分别使用02-利用nextTick监听DOM更新后的情况03-自定义指令与自定义全局属性及应用场景04-复用组件功能之Mixin混入05-插件的概念及插件的实现06-transition动画与过渡的实现07-动态组件与keep-alive组件缓存08-异步组件与Suspense一起使用09-跨…

在线SHA256计算哈希(不可逆的加密又称摘要)工具

具体请前往: 在线计算Sha256摘要工具

7.10 SpringBoot实战 全局异常处理

文章目录 前言RestControllerAdvice项目实战最后 前言 在一个项目中,异常处理 是你无法绕过去的话题! 不论你多牛逼,你写的代码都可能会出现异常,有的异常非常容易测试出来,但有的异常却需要在非常极端情况下才会出现…

线性代数的学习和整理7:各种特殊矩阵(草稿-----未完成)

目录 1 单位矩阵 为什么单位矩阵I是 [1,0;0,1]T 而不是[1,1;1,1]T 2 旋转矩阵 3 伸缩矩阵 放大缩小倍数矩阵 4 镜像矩阵 5 剪切矩阵 矩阵 行向量 列向量 方阵 1 单位矩阵 [ 1 0 0 1] 为什么单位矩阵I是 [1,0;0,1]T 而不是[1,1;1,1]T 因为 矩阵 [1,0;0,1] 代表…

netty(一):NIO——处理消息边界

处理消息边界 为什么要处理边界 因为会存在半包和粘包的问题 1.客户端和服务端约定一个固定长度 优点:简单 缺点:可能造成浪费 2.客户端与服务端约定一个固定分割符 *缺点 效率低 3.先发送长度,再发送数据 TLV格式: type…

LeetCode 1162. As Far from Land as Possible【多源BFS】中等

本文属于「征服LeetCode」系列文章之一,这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁,本系列将至少持续到刷完所有无锁题之日为止;由于LeetCode还在不断地创建新题,本系列的终止日期可能是永远。在这一系列刷题文章…

网络编程(字节序)

一、字节序的概念 字节序是指不同类型CPU主机,内存存储 多字节整数 序列的方式。 float, char, 字符串均没有字节序的说法 short, int , long , long long 有字节序的说法 小端字节序:低字节存储在低地址,高字节存储在高地址 大端字节序…

基于IMX6ULLmini的linux裸机开发系列九:时钟控制模块

时钟控制模块 核心 4个层次配置芯片时钟 晶振时钟 PLL与PFD时钟 PLL选择时钟 根时钟/外设时钟 系统时钟来源 RTC时钟源:32.768KHz 系统时钟:24MHz,作为芯片的主晶振使用 PLL和PFD倍频时钟 7路锁相环电路(每个锁相环电路…

Maven打包后的jar文件只有几kb情况解决方法

1、pom文件添加如下代码 <build><plugins><plugin><groupId>org.springframework.boot</groupId><artifactId>spring-boot-maven-plugin</artifactId></plugin></plugins></build> 2、打开ide的maven工具侧边栏…

solidwords(5)

我们打算从上面画出总体&#xff0c;再从上面、侧面切除 最后成品

Java网络编程(二)NIO实现简易的多人聊天

服务端实现 package com.bierce.io; import java.io.IOException; import java.net.InetSocketAddress; import java.nio.ByteBuffer; import java.nio.channels.*; import java.nio.charset.Charset; import java.util.Iterator; import java.util.Set; //服务器端 public cl…

红绿灯识别、倒计时识别(毕业设计)

交通标志识别 本项目使用YOLO 模型&#xff0c;并在对数字信号灯进行数字识别时采用opencv算法。 环境安装 所需环境 python 3.7.11 torch1.2.00 使用 pip install -r requirements.txt安装所需的包。 文件下载 训练所需的预训练权重可在百度网盘中下载。 链接&#xf…

ARM体系结构学习笔记:任何算法可通过下面的三种模式组合而成

任何算法可通过下面的三种模式组合而成 条件跳转和无条件跳转 条件命名规则 关于比较的一些哲学问题 汇编实现if else [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-R8R5cYTQ-1692236026691)(https://cdn.jsdelivr.net/gh/nzcv/picgo/202201172242…

Gin+微服务实现抖音视频上传到七牛云

文章目录 安装获取凭证Gin处理微服务处理 如果你对Gin和微服务有一定了解&#xff0c;看本文较容易。 安装 执行命令&#xff1a; go get github.com/qiniu/go-sdk/v7获取凭证 Go SDK 的所有的功能&#xff0c;都需要合法的授权。授权凭证的签算需要七牛账号下的一对有效的A…

回归预测 | MATLAB实现BES-LSSVM秃鹰搜索算法优化最小二乘支持向量机多输入单输出回归预测(多指标,多图)

回归预测 | MATLAB实现BES-LSSVM秃鹰搜索算法优化最小二乘支持向量机多输入单输出回归预测&#xff08;多指标&#xff0c;多图&#xff09; 目录 回归预测 | MATLAB实现BES-LSSVM秃鹰搜索算法优化最小二乘支持向量机多输入单输出回归预测&#xff08;多指标&#xff0c;多图&a…

手写模拟SpringBoot核心流程(二):实现Tomcat和Jetty的切换

实现Tomcat和Jetty的切换 前言 上一篇文章我们聊到&#xff0c;SpringBoot中内置了web服务器&#xff0c;包括Tomcat、Jetty&#xff0c;并且实现了SpringBoot启动Tomcat的流程。 那么SpringBoot怎样自动切换成Jetty服务器呢&#xff1f; 接下来我们继续学习如何实现Tomcat…

网络编程面试笔试题

一、OSI 7层模型&#xff0c;TCP/IP 4层模型 5层模型。 以及每一层的功能&#xff08;重点&#xff1a;第三层 第四层&#xff09; 答&#xff1a; 7层模型&#xff08;①物理层&#xff1a;二进制比特流传输&#xff0c;②数据链路层&#xff1a;相邻结点的可靠传输&#xf…

Ctfshow web入门 命令执行RCE篇 web29-web77 与 web118-web124 详细题解 持续更新中

Ctfshow 命令执行 web29 pregmatch是正则匹配函数&#xff0c;匹配是否包含flag&#xff0c;if(!preg_match("/flag/i", $c))&#xff0c;/i忽略大小写 可以利用system来间接执行系统命令 flag采用f*绕过&#xff0c;或者mv fl?g.php 1.txt修改文件名&#xff0c…

Docker搭建LNMP----(超详细)

目录 ​编辑 一、项目环境 1.1 所有安装包下载&#xff1a; 1.3 服务器环境 1.4任务需求 二、Ngin 2.1、建立工作目录 2.2 编写 Dockerfile 脚本 2.3准备 nginx.conf 配置文件 2.4生成镜像 2.5创建自定义网络 2.6启动镜像容器 2.7验证 nginx、 三、Mysql 3.1建立…

生产环境下的终极指南:使用 Docker 部署 Nacos 集群和 MySQL

&#x1f337;&#x1f341; 博主猫头虎 带您 Go to New World.✨&#x1f341; &#x1f984; 博客首页——猫头虎的博客&#x1f390; &#x1f433;《面试题大全专栏》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33a; &a…