【2023华中杯】C题 空气质量预测与预警 56页论文及Python代码
1 题目
空气污染对人类健康、生态环境、社会经济造成危害,其污染水平受诸多因素的影响, 如 PM2.5、PM10、CO、气温、风速、降水量等,探究 PM2.5 等污染物浓度的因素,更精准的预测 PM2.5 浓度和 AQI 指数等是科学界和决策者共同关心的问题,对于解析污染影
响因素和有效制订控制策略具有重要意义。
为了健全和针对完善重污染天气的应对处置机制,提高重污染天气预防预警、应急响应能力和环境精细化管理水平,消除重度及以上污染天气,作为突发环境事件应急预案体系的重要组成部分,某地发布污染天气应急预案,该预案将加强监测预警和节能减排,最大程度降低污染天气的影响。其预警等级划分为四级应急响应:
蓝色预警:预测日 AQI>150 或日 AQI>100 持续 48 小时及以上。黄色预警:预测日 AQI>200 或日 AQI>150 持续 48 小时及以上。
橙色预警:预测日 AQI>200 持续 48 小时或日 AQI>150 持续 72 小时及以上。红色预警:预测日 AQI>200 持续 72 小时且日 AQI>300 持续 24 小时及以上。请参赛团队根据问题要求,完成以下问题(任务):
问题一:根据附件 1 和附件 2,对数据进行分析和处理,筛选出与 PM2.5 浓度变化有关的因素,并说明筛选出的因素对 PM2.5 浓度影响的程度。
问题二:自行划分训练集和测试集,根据附件 1 和附件 2,基于问题一构建 PM2.5 浓度多步预测模型,分别使用均方根误差(RMSE)对 3 步、5 步、7 步、12 步预测效果进行评估,其结果请用表 1 格式在正文中具体给出,并对测试集及其预测结果进行可视化。同时,用该模型预测附件 3 所给定时间的 PM2.5 浓度,其结果请用表 2 格式在正文中具 体给出。
表 1 PM2.5 浓度预测的 RMSE 结果(样表)
预测步长 | 3 步预测 | 5 步预测 | 7 步预测 | 12 步预测 |
---|---|---|---|---|
RMSE |
表 2 PM2.5 浓度预测结果(样表)
日期(年/月/日) | 20**// | 20**// | 20**// | …… | 20**// |
---|---|---|---|---|---|
PM2.5 |
问题三:构建 AQI 多步预测模型,使用均方根误差(RMSE)对建模效果进行评估, 并对测试集及其预测结果进行可视化。同时,用该模型预测附件 3 所给定时间的 AQI,并给出每天空气质量的预警等级,其结果请用表 3 和表 4 格式在正文中具体给出。
表 3 AQI 预测结果(样表)
日期(年/月/日) | 20**// | 20**// | 20**// | …… | 20**// |
---|---|---|---|---|---|
AQI | |||||
预警等级颜色 |
注:不需要发布预警等级时,填“无”.
表 4 预警等级颜色次数汇总 (样表)
预警等级颜色 | 蓝色 | 黄色 | 橙色 | 红色 | 无 | 合计 |
---|---|---|---|---|---|---|
天数(天) |
附件说明:
-
附件 1 和附件 2 提供了该监测点近年来空气质量预报基础数据,包括污染物浓度数据(见附件 1)和气象数据(见附件 2)。
-
附件 3 为待预测时间点。
2 论文介绍
随着城市化进程的加速和工业化水平的提高,空气污染成为全球性的问题。空气质量预测与预警是解决空气污染问题的重要手段之一。随着大数据和人工智能技术的发展,基于机器学习模型的空气质量预测与预警方法逐渐得到了广泛应用。本文旨在构建一个准确可靠的数学模型,对空气质量进行预测和预警,为城市管理部门提供科学的决策支持,促进城市空气质量的改善和保护。
本文尝试建立以 XGBoost、随机森林、LSTM、LGBM 等机器学习算法的组合模型来探索空气质量的趋势以及预测未来一段时间内的空气质量情况,以便于政府和相关部门及时采取应对措施,避免空气质量影响到居民的正常生活。
针对问题一,我们采用了多种方法对数据进行相关性影响分析,如灰色关联分析法、多配对样本 Friedman 检验等方法进行相关性分析,研究样本之间是否存在差异以及其程度。接着我们又构建了机器学习组合模型,通过调参交叉验证得到最优的模型,并采用了启发式算法,如:PSO,遗传算法等,最后我们用 shap 模型计算得出各个特征对模型的贡献程度。
针对问题二和问题三,我们主要使用 LSTM 神经网络模型对时间序列数据集分别以 3 步、5 步、7 步、12 步进行进行预测和可视化,对数据进行时间窗口滑动处理,并使用 RMSE 对预测效果进行评估。其中包括一个 LSTM 层和一个全连接层,使用 adam 优化器和均方误差(MSE)损失函数进行训练模型,将训练集输入模型,通过反向传播优化模型参数,并在训练集和测试集上分别评估模型的性能, 最终预测出未来 12 天的空气质量情况以及每日空气质量预警等级,预测结果详见正文。
关键词:空气质量预测 机器学习 LSTM 相关性分析 RMSE
3 下载
转到知乎文章底部