利用AI技术预测未被充分监测的流域中的极端洪水事件笔记

news2024/9/21 12:33:00

利用人工智能(AI)技术预测未被充分监测的流域(ungauged watersheds)中的极端洪水事件


文章目录

  • 利用人工智能(AI)技术预测未被充分监测的流域(ungauged watersheds)中的极端洪水事件
  • 前言
  • 一、论文主要内容
    • 1.1 主要内容
    • 1.2 主要数据
    • 1.3 模型处理
  • 二、论文相关的问答
    • 2.1 数据分布如何
    • 2.1 AI模型效果如何
    • 2.1 为什么选择未被充分监测流域
    • 2.1 LSTM模型的预测能力如何?
    • 2.1 为什么会被选为nature


前言

介绍:
论文:Global prediction of extreme floods in ungauged watersheds
Github:https://github.com/tommylees112/neuralhydrology/tree/pixel
参考链接:https://mp.weixin.qq.com/s/GoOPqLtdYvPv3_no7GJUJQ


一、论文主要内容

1.1 主要内容

洪水影响:洪水是最常见的自然灾害之一,对发展中国家的影响尤为严重,因为这些国家往往缺乏密集的流量测量网络。准确及时的洪水预警对于减轻洪水风险至关重要。

AI预测模型:研究表明,基于人工智能的预测模型能够在没有长期数据记录的情况下,对未监测流域的极端河流事件进行可靠预测,预测时间可长达五天,与当前最先进的全球模型系统(Copernicus Emergency Management Service Global Flood Awareness System,简称GloFAS)的即时预报(零天预测时间)的可靠性相当或更好。

预测准确性:AI模型在预测一年至十年重现期事件的准确性与当前一年重现期事件的准确性相当或更好。这意味着AI可以为未监测流域提供更早的洪水预警,覆盖更大范围和更具影响力的事件。

实际应用:研究中开发的模型已被纳入一个实时预警系统,该系统在80多个国家提供公开可用的(免费和开放)实时预报。这些预报可以通过https://g.co/floodhub访问。

数据可用性:文章强调了增加水文数据可用性的重要性,以继续提高全球范围内可靠洪水预警的获取能力。

研究方法:AI模型使用长短期记忆(LSTM)网络,通过7天的预测时间范围预测日流量。模型的训练和测试使用了随机k折交叉验证,涵盖了5680个流量测量站的数据。

模型比较:与GloFAS相比,AI模型在不同重现期事件的预测中显示出更高的精确度和召回率。特别是在5年重现期事件的预测中,AI模型的表现优于GloFAS。

地理差异:两种模型在世界不同地区的可靠性存在差异。例如,在南美洲和西南太平洋地区,AI模型的表现与GloFAS存在显著差异。

预测可靠性:研究还探讨了在没有地面真实数据的地点评估预测可靠性的挑战,并尝试使用流域属性(地理、地球物理数据)来预测不同模型的可靠性。

1.2 主要数据

ECMWF Integrated Forecast System (IFS) High Resolution (HRES) atmospheric model: 提供了包括总降水量(TP)、2米温度(T2M)、地表净太阳辐射(SSR)、地表净热辐射(STR)、雪fall(SF)和地表压力(SP)等变量的日聚合单层预测数据。

ECMWF ERA5-Land reanalysis: 与上述HRES模型相同的六个变量。

NOAA Climate Prediction Center (CPC) Global Unified Gauge-Based Analysis of Daily Precipitation: 提供了降水估计数据。

NASA Integrated Multi-satellite Retrievals for GPM (IMERG) early run: 同样提供了降水估计数据。

HydroATLAS database: 提供了地质、地球物理和人为的流域属性数据。

所有输入数据都是根据每个测量站或预测点的上游总面积,对流域多边形进行面积加权平均处理。研究中使用的5680个评估测量站的上游总面积范围从2.1平方千米到4,690,998平方千米不等

1.3 模型处理

  • 数据收集:首先,从各个数据源收集所需的气象数据、降水数据、流域属性数据以及流量测量数据。

  • 数据整合:将收集到的数据整合到一起,确保它们具有相同的时间序列和空间分辨率。这可能涉及到数据的合并、对齐和匹配。

  • 缺失值处理:对于缺失的数据,采用合适的插值方法进行填充。例如,可以使用其他数据源的相似变量数据进行替换,或者使用历史数据的平均值进行插值,并添加标记以示区分。

  • 面积加权平均:对于流域属性数据,需要根据每个测量站上游的总面积进行面积加权平均,以得到代表整个流域的综合特征。

  • 标准化:对所有数值型数据进行标准化处理,通常包括去除均值和除以标准差,以便在模型训练中减少不同特征量纲的影响。

  • 特征选择:根据模型的需要,选择与洪水预测相关的特征。这可能包括气象数据中的降水量、温度等,以及流域属性数据中的流域面积、土壤类型等。

  • 序列构建:将选定的特征按照时间序列顺序排列,构建成输入序列。对于LSTM模型,这通常包括一个固定长度的历史数据窗口,例如过去365天的数据。

  • 目标变量定义:定义模型的输出目标,即未来一段时间内的流量预测。这可能涉及到将流量数据转换为适合模型学习的格式,例如,使用流量的对数变换来处理数据的偏态分布。

  • 数据集划分:将整合和预处理后的数据划分为训练集和测试集。这通常涉及到时间序列的分割,确保训练集和测试集在时间上是不重叠的。

  • 模型训练:使用处理好的训练数据集来训练LSTM模型。在训练过程中,模型会学习如何根据输入的历史数据来预测未来的流量。

  • 交叉验证:为了评估模型的泛化能力,使用交叉验证技术来重复训练和测试过程,确保模型在不同的数据子集上都有稳定的表现。

  • 性能评估:使用测试集数据评估模型的性能,计算精确度、召回率、F1分数等指标,以确定模型在预测洪水事件方面的准确性和可靠性。


二、论文相关的问答

2.1 数据分布如何

在这里插入图片描述
如图分析,从分布上分析,大部分数据分布在美洲和欧洲,尤其是北美地区,中国比较少,因此该实验不适合国情。

2.1 AI模型效果如何

在这里插入图片描述
不管是目前在应用的全球洪水系统GloFAS还是AI模型预测的结果来说,分数都是低于0.5;AI模型的precision和recall的值域比GloFAS要大。时间越长,预测分数越低。

2.1 为什么选择未被充分监测流域

数据稀缺性:许多流域,尤其是在发展中国家,缺乏足够的流量测量站来提供长期的数据记录。

风险缓解需求:未被充分监测的流域往往位于易受洪水影响的地区,这些地区的居民和基础设施面临较高的洪水风险。

技术挑战:在未被充分监测的流域进行洪水预测是一个技术挑战,因为它要求模型能够在没有或只有很少现场数据的情况下进行准确预测。

模型泛化能力:通过在未被充分监测的流域上测试模型,可以评估模型的泛化能力,即模型在不同地理、气候和水文条件下的适用性和预测性能。

提高预测效率:开发能够在未被充分监测流域有效工作的洪水预测模型,可以减少对传统监测基础设施的依赖,提高预测效率,并降低在这些地区实施洪水预警系统的成本。

论文说是为了发展中国家进行分析,地图上的点上看都是发达国家的点,发达国家【69.4%】 发展中国家【31.6%】

2.1 LSTM模型的预测能力如何?

在这里插入图片描述
这些子图显示了在不同预测时间(从0天到5天)和不同重现期的洪水事件下,模型预测性能的变化。确实前5天的分数都是高于GloFAS。

2.1 为什么会被选为nature

创新性方法:用LSTM编码水文学、气象学的相关数据,并提供了一套标准化、合理化的清洗手段,来预测极端天气的内容
全球影响:洪水是全球性的问题,对人类社会和自然环境都有重大影响,虽然发达国家数据居多,但是发展中国家的数据也不少
数据稀缺性:该研究展示了在数据稀缺环境下,如何利用现有数据和AI技术提高预测能力,5680点位的数据是混合数据,有监测数据的内容也有合成的内容,其中一项挑战是去预测未监测流域的情况。
提高了风险预测的准确性:确实是高于GloFAS.
跨学科合作:该研究可能涉及气象学、水文学、数据科学、机器学习等多个学科的合作,这种跨学科的方法是解决复杂问题的重要途径。
项目还开源了:鼓励全球进行合作和提高行业的整体水平

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1546288.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

bsd猜想 Murmuration of Eliptic Curves(笔记)

BSD Alexey Pozdnyakov (University of Connecticut) YUTUBE视频, B站搬运地址新生代女数学家Nina Zubrilina得到椭圆曲线椋鸟群飞模式精确公式与证明 Arithmetic Geometry算术几何 希尔伯特第十问题 希尔伯特第十问题(Hilbert’s Tenth Problem&#…

TransUNet论文笔记

论文:TransUNet:Transformers Make Strong Encoders for Medical Image Segmentation 目录 Abstract Introduction Related Works 各种研究试图将自注意机制集成到CNN中。 Transformer Method Transformer as Encoder 图像序列化 Patch Embed…

拼板注意事项和步骤

拼板注意事项和步骤 综述:本文讲述了AD软件中拼板的注意事项以及拼板的步骤。 1. 拼板注意事项 拼板时应注意定位孔、光学定位点、工艺边、间距和器件冲突等问题。 2. 拼板步骤 ①点击“放置”→“拼板阵列”→“panels”→“properties”,浏览需要…

晴问算法 动态规划(简单)

动态规划的递归写法和递推写法 斐波那契数列II 题目描述 给定正整数�,求斐波那契数列的第�项�(�)。 令�(�)表示斐波那契数列的第�项,它的定义是: 当&…

【MD】激光驱动原子动力学的全尺寸从头算模拟

Zeng Q, Chen B, Zhang S, et al. Full-scale ab initio simulations of laser-driven atomistic dynamics[J]. npj Computational Materials, 2023, 9(1): 213.核心研究内容: 本文研究了激光驱动的原子动力学的全尺度从头算模拟。研究的重点是探讨在极端条件下材料…

C语言结构体之位段

位段(节约内存),和王者段位联想记忆 位段是为了节约内存的。刚好和结构体相反。 那么什么是位段呢?我们现引入情景:我么如果要记录一个人是男是女,用数字0 1表示。我们发现只要一个bit内存就可以完成我们想…

讯优随身WiFi可靠吗?讯优和格行随身WiFi哪个好?随身wifi推荐测评!随身WiFi哪个牌子比较好用?随身WiFi怎么选?随身WiFi推荐第一名!

随身WiFi挑花眼?不知道哪款好用?今天,我将为大家带来迅优与格行两大随身WiFi品牌的真实测评。 价格方面:迅优随身WiFi以价格优惠为卖点,吸引了众多消费者的目光。对于预算有限的用户来说,迅优确实提供了一个…

刷题记录:最长公共前缀

编写一个函数来查找字符串数组中的最长公共前缀。 如果不存在公共前缀,返回空字符串 ""。 示例 1: 输入:strs ["flower","flow","flight"] 输出:"fl"示例 2: 输…

治疗植物神经功能紊乱的关键竟是它!

植物神经紊乱,是指交感神经系统和副交感神经系统之间的平衡失调,导致心率不规律、胃肠问题、焦虑、失眠等一系列症状。长期植物神经紊乱可能导致更严重的心血管疾病、消化系统问题以及心理健康隐患。它可能源于饮食结构失衡、物理环境压力过大、心理压力…

Xinstall:用智能数据传递,打造高效的App推广体系

随着移动互联网的快速发展,App已经成为人们日常生活中不可或缺的一部分。然而,对于开发者来说,如何有效地推广App并衡量推广效果却是一个巨大的挑战。这时,Xinstall作为一站式App全渠道统计服务商,提供了强有力的解决方…

模板(一)

文章目录 模板(一)1.泛型编程2.函数模板2.1函数模板概念2.2函数模板格式2.3函数模板的原理2.4函数模板的实例化2.4.1隐式实例化2.4.2显式实例化 2.5模板参数的匹配原则 3.类模板3.1类模板的定义格式3.2类模板的实例化 模板(一) 1…

25.7 MySQL 数据库和表的基本操作

1. 基础知识 1.1 一条数据的存储过程 存储数据确实是处理数据的基石, 只有确保数据被准确无误且有条理地存储, 我们才能对其进行深入的处理和细致的分析. 否则, 这些数据就像是一团毫无章法的乱麻, 让我们难以捉摸其内在的逻辑和价值.那么, 如何才能够将用户那些与经营紧密相关…

人工智能时代如何高效完成营销内容计划

智能对话升级!【Kompas AI】AI对话助手,让沟通更高效 在人工智能时代,要高效完成营销计划,我们可以利用人工智能的多种能力来增强营销策略的精准度和执行效率。借助人工智能的力量,企业不仅可以提高营销计划的执行效率…

Rust高级爬虫:如何利用Rust抓取精美图片

引言 在当今信息爆炸的时代,互联网上的图片资源丰富多彩,而利用爬虫技术获取这些图片已成为许多开发者的关注焦点。本文将介绍如何利用Rust语言进行高级爬虫编程,从而掌握抓取精美图片的关键技术要点。 Rust爬虫框架介绍 Rust语言生态中有…

一文说清:AI大模型在制造业中的应用类型

在过去的几年里,全球制造业的竞争格局正在发生重构,数字化和智能化成为推动变革的关键力量。AI 大模型作为一种通用人工智能技术,其革命性特征体现在能够生成代码、构建人机交互新模式,并与产品研发、工艺设计、生产作业、产品运营…

2024软考

报考链接: 中国计算机技术职业资格网 (ruankao.org.cn) 报名有效时间: 天津2024-03-24 09:00 ~ 2024-04-02 17:00 河北2024-03-20 09:30 ~ 2024-03-26 17:00 山西2024-03-18 14:30 ~ 2024-04-02 11:30 宁波2024-03-20 10:00 ~ 2024-03-26 16:00 辽宁…

C语言调用云端 Python接口

利用C语言调用阿里云Python接口,来实现垃圾的智能识别 文章目录 利用C语言调用阿里云Python接口,来实现垃圾的智能识别1、如何开启阿里云服务2、实验程序介绍2.1 py程序改造2.2 c语言调用py2.3 测试代码 3、实验结果 1、如何开启阿里云服务 大家可以自行…

RHCE作业:搭建web网站

综合练习: 请给openlab搭建web网站 网站需求: 1.域名访问网站 基于域名www.openlab.com可以访问网站内容为 welcome to openlab!!! 2.创建界面 给该公司创建三个子界面分别显示学生信息,教学资料 和缴费网站,基于www.openlab.com…

【精简】Spring笔记

文章目录 跳转链接(学习路线)及前言(更新中) 快速入门配置文件详解依赖注入(bean实例化)自动装配集合注入使用spring加载properties文件容器注解开发bean管理注解开发依赖注入第三方bean整合mybatis整合junit AOP入门案例切入点表…

【git分支管理策略】如何高效的管理好代码版本

目录 1.分支管理策略 2.我用的分支管理策略 3.一些常见问题 1.分支管理策略 分支管理策略就是一些经过实践后总结出来的可靠的分支管理的办法,让分支之间能科学合理、高效的进行协作,帮助我们在整个开发流程中合理的管理好代码版本。 目前有两套Git…