2024 年 MathorCup妈杯A题台风的分类与预测论文首发+代码分享

news2024/11/24 8:37:13

基于多模型方法的台风分类、路径预测及登陆后降水影响分析

摘要

台风作为全球最严重的自然灾害之一,具有极大的破坏性和复杂性,其预测和分类具有重要意义。本文基于历史台风数据,针对台风的特征分类、路径预测以及登陆后的降水量和风速变化进行了详细分析,并结合多种模型进行求解。

在数据预处理方面,本文对 1945 年至 2023 年的台风数据进行了系统性的处理,包括缺失值的插值填充、时间格式的转换、异常值的检测与剔除,以及对非数值型数据的编码处理。这些步骤为后续的模型建立提供了干净且高质量的数据基础。

问题一中,目标是对台风的特征参数(如强度、风速等)进行分类。该问题采用了 随机森林分类模型 来分析台风的特征与气象因素的关系,通过对历史数据的特征选择和分类模型训练,成功将台风分类为不同类别(例如夏台风与秋台风),并分析了各类别的主要特征与差异。该方法的创新点在于结合气象因素与多维度特征进行分类,有助于提高对台风性质的理解。

问题二中,目标是对台风路径进行预测。我们使用 函数型主成分分析 (FPCA) 与 多层感知器 (MLP) 相结合的方法对台风路径进行预测,提取了台风路径的主要变化模式,结合 FPCA 对路径特征进行了降维,再使用神经网络模型进行了时间序列预测,并通过 动态时间规整 (DTW) 算法与实际路径进行对比。结果表明,FPCA 有效提取了路径的主要特征,模型对路径的预测表现良好。创新点在于通过 FPCA 提取路径特征并结合 M

图片

一、模型的建立与求解

5.1 数据预处理

5.1.1 数据编码

为了在模型中有效利用台风强度的分类信息,本研究对台风强度的数据进行了必要的编码转换。由于原始数据中使用汉字或者字母表示台风的强度类别,如"超强台风(Super TY)"、"强热带风暴(STS)"等,

表1:数据编码原始数据

图片

为了便于计算机处理并应用于后续模型建立,必须将这些分类转换为数值编码。具体编码方案如下:

·空白 (代表未记录的强度) : 0

·超强台风 (Super TY) : 1

·强热带风暴(STS):2

·强台风 (STY) : 3

·热带低压 (TD) : 4

·热带风暴 (TS) : 5

·台风 (TY) : 6

编码后的数据可以表示为一个向量形式,其中每一类台风强度都对应唯一的数值。对于数据的数值编码过程,可以用公式表示如下:

5.1.2 数据处理

原始数据中的时间格式无法直接被计算机识别和处理,因此需要进行统一的格式转换以便于后续分析和建模。题目中所给的时间数据是基于六小时间隔记录的,这样的时间数据形式如果不加以标准化,很难在计算中正确使用。因此,我们将时间数据转换为标准的 YYYYMMDDHH 格式,以方便时间序列的处理与分析。

·时间转换规则:
 假设原始数据的时间记录包含年、月、日及每六小时的间隔(例如,0时、6时、12时、 18时),需要将这些信息合并成一个统一的时间表示。

·转换后的时间格式为 YYYYMMDDHH ,其中:
  YYY 表示年份

·MM 表示月份
 DD 表示日
 HH 表示小时 (范围为  ,表示六小时间隔)

图片

5.2 问题一模型的建立与求解

5.2.1 台风特征参数与气象因素的关系

为了建立台风特征参数与气象因素之间的关系,本研究对历史台风数据进行了相关性分析。考虑到台风特征数据(如台风强度、风速、气压等)不符合正态分布,因此我们使用 Spearman 相关系数 来分析变量之间的关系。Spearman 相关系数是一种非参数的相关性度量方法,用于衡量两个变量之间的单调关系,适合处理非正态分布的数据。

Spearman 相关性计算

·Spearman 相关系数:Spearman 相关系数用于度量两个变量之间的单调相关性,定义为两个变量的秩值之间的皮尔逊相关系数。假设我们有两个变量  和  ,Spearman 相关系数  计算如下:

1数据排序:对两个变量的数据进行排序,得到其秩次  和  ,分别表示  和 的秩序统计量。

图片

其 Spearman 相关系数为 0.9961,这意味着风速越高,台风等级也越高,这种结果符合我们对台风的物理特性理解。风速是影响台风等级的重要因素,台风的破坏力主要由其风速决定,因此两者呈现出如此强的正相关性。此外,气压与风速之间呈现出高度负相关的关系,相关系数为 -0.9433,这也符合气象学中的常识,即气压越低,风速通常越大。类似的,气压与台风等级也存在高度的负相关关系,相关系数为 -0.9422,说明低气压通常意味着较高的台风等级,这一结果也与物理学中台风的形成原理相吻合。

图片

5.2.3 实际分类展示

在完成历史数据的分类后,我们将建立的随机森林模型应用于 2024年台风数据。首先,我们读取 "2024年台风数据.xlsx" 文件,并提取与模型相对应的特征列(风速、气压、移动速度)。对台风起始时间字段进行预处理,将其转换为标准的日期格式 YYYYMMDDHH,并提取台风发生的月份。根据月份信息,我们将台风分为夏台风和秋台风两类,其中  月的台风为眰台风,9、10、11月的台风为秋台风。

具体的分类规则为:

·台风发生月份属于  时,类别为 夏台风。

·台风发生月份属于  时,类别为秋台风。

随后,我们使用之前训练好的随机森林模型对 2024 年的台风数据进行分类,得到每条记录的类别预一致的分类结果,类似于之前处理历史数据的方式。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2223938.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux网络编程5——Posix API和网络协议栈,使用TCP实现P2P通信

文章目录 Posix API和网络协议栈,使用TCP实现P2P通信1. socket()2. bind()3. listen()4. connect()5. accept()6. read()/write(), recv()/send()7. 内核tcp数据传输7.1 TCP流量控制7.2 TCP拥塞控制——慢启动/拥塞避免/快速恢复/快速重传 8. shutdown()9. close()9…

Jvm中的堆和栈

JVM中的堆和栈分别存放不同的数据类型和内容。 ‌栈(Stack)‌: 存储基本数据类型(如int, char, boolean等)和对象的引用。存储局部变量、方法调用、程序运行状态、方法返回值等。每个线程都有一个独立的线程栈&#…

【 IC每日一题】

IC每日一题 1 八股题:低功耗设计方法1.1 功耗类型1.1.1 动态功耗1.1.2 静态功耗 1.2 SoC低功耗设计方法1.2.1 基于时钟clock的低功耗设计1.2.2 基于电压域voltage的低功耗设计1.2.3 多阈值库1.2.4 RTL低功耗设计 2 手撕题:序列检测2.1 移位寄存器写法2.2…

ClickHouse 3节点集群安装

ClickHouse 简介 ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。 官方网站:https://clickhouse.com/ 项目地址:https://github.com/ClickHouse/ClickHouse 横向扩展集群介绍 此示例架构旨在提供可扩展性。它包括三个节点&#xff…

ffmpeg视频滤镜: 色温- colortemperature

滤镜简述 colortemperature 官网链接 》 FFmpeg Filters Documentation 这个滤镜可以调节图片的色温,色温值越大显得越冷,可以参考一下下图: 咱们装修的时候可能会用到,比如选择灯还有地板的颜色的时候,选暖色调还是…

提升产品竞争力之--IPD产品成本篇

在汉捷的咨询过程中,很多企业老总交流时都会提起这个抱怨:“现在产品竞争太激烈了,客户买产品首先看价格,你价格高一点就买别家的啦……” 汉捷咨询在前文谈到“通过定义产品包需求,来提升产品竞争力。差异化开发&…

Maven - Assembly实战

文章目录 PreAssembly插件基本配置使用示例示例1:创建包含依赖的JAR包示例2:自定义描述符示例3:多模块项目打包 实战 _qiwenfile结构pom.xml触发脚本 实战 _nacos输出 zip / tar.gz常见问题及解决方案 Pre Spring Boot - 瘦身大作战&#xf…

Go 版本升级 | 统计 Github 社区 Go 版本分布情况

背景 因为最近三年用的 Go 版本是 1.16,但最新的版本升级到了 1.23,很多依赖的三方包最新文件都已经升级,使用了泛型以及 GO 新版本的特性,导致我只能适配 Go1.16 的三方包旧版本,但这种问题发生的频率多了后&#xf…

解决运行jar错误: 缺少 JavaFX 运行时组件, 需要使用该组件来运行此应用程序

报错 众所周知jdk8以上都没有Javafx java -jar target/myyscan-1.0-SNAPSHOT.jar 错误: 缺少 JavaFX 运行时组件, 需要使用该组件来运行此应用程序解决 https://gluonhq.com/products/javafx/ 去下载/javafx/到本地,选择自己的型号 然后记得指定路径 java --m…

React类组件详解

React类组件是通过创建class继承React.Component来创建的,是React中用于构建用户界面的重要部分。以下是对React类组件的详细解释: 一、定义与基本结构 类组件使用ES6的class语法定义,并继承自React.Component。它们具有更复杂的功能&#xf…

R语言机器学习算法实战系列(十二)线性判别分析分类算法 (Linear Discriminant Analysis)

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 文章目录 介绍LDA的原理LDA的步骤教程下载数据加载R包导入数据数据预处理数据描述数据切割构建模型预测测试数据评估模型模型准确性混淆矩阵模型评估指标ROC CurvePRC Curve保存模型总结优点:缺…

《性能之巅:洞悉系统、企业与云计算》-观测工具-笔记

《性能之巅:洞悉系统、企业与云计算》第一章(绪论)和第二章(方法)的笔记,请参考Part 1,第三章(操作系统)的笔记,请参考Part 2,本文是第四章——观…

鸿蒙开发融云demo发送文本消息

鸿蒙开发融云demo发送文本消息 融云鸿蒙版是不带UI的,得自己一步步搭建。 这次说如何发送文本消息,并且显示文本消息 一、思路 发送用:IMEngine.getInstance().sendMessage 显示文本: Text(ImUtils.dealMyTextContent(this.ms…

Linux:磁盘深潜:探索文件系统、连接之道与库的奥秘

✨✨✨学习的道路很枯燥,希望我们能并肩走下来! 文章目录 目录 文章目录 前言 一 磁盘 1.1 磁盘的物理结构 1.2 磁盘的存储结构 1.3 磁盘的逻辑结构 ​编辑二 文件系统 2.1 简单了解 2.2 inode 2.3 文件描述符,进程与文件系统的关系 ​编辑2…

格姗知识圈博客网站开源了!

格姗知识圈博客 一个基于 Spring Boot、Spring Security、Vue3、Element Plus 的前后端分离的博客网站!本项目基本上是小格子一个人开发,由于工作和个人能力原因,部分技术都是边学习边开发,特别是前端(工作中是后端开…

模型选择拟合

1.通过多项式拟合交互探索概念 import math import numpy as np import torch from torch import nn from d2l import torch as d2l 2.使用三阶多项式来生成训练和测试数据的标签 max_degree 20 # 多项式的最大阶数 n_train, n_test 100, 100 # 训练和测试数据集大小 true…

SQL Server 当前日期及其未来三天的日期

当前日期及其未来三天的日期,并分别以 YYYY-MM-DD 和 yyyyMMdd 的格式展示 1、当前日期及其未来三天的日期,以 YYYY-MM-DD的格式展示 WITH CurrentDate AS (SELECT GETDATE() AS 当前日期 ) -- 使用 CONVERT 函数 SELECTCONVERT(VARCHAR(10), 当前日期,…

【论文笔记】MLSLT: Towards Multilingual Sign Language Translation

🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 基本信息 标题: MLSLT: Towards Multiling…

springboot医疗物品采购系统-计算机设计毕业源码10210

摘 要 本文基于Spring Boot框架,设计并实现了一个医疗物品采购系统。该系统旨在解决医疗物品采购中的管理和信息化问题,提供便捷的服务和支持。通过系统的设计与实现,实现了医疗物品的供应商家管理、物品类型管理、物品仓库管理、采购计划管…

小渡Ai论文写作:文献综述黑科技LitMaps30s找到所有文献

✨Litmaps 究竟是什么呢? Litmaps 是一款极为强大的文献搜索与追踪工具! 它不但能够助力你找到相关的研究文献,还能够依据你提供的文献生成一张学术地图,清晰地展现文献之间的引用链以及研究发展趋势。 恰似一张璀璨的星空图&a…