深度学习对抗海洋赤潮危机!浙大GIS实验室提出ChloroFormer模型,可提前预警海洋藻类爆发

news2024/9/19 10:38:50

2014 年 8 月,美国俄亥俄州托莱多市超 50 万名居民突然收到市政府的一则紧急通知——不得擅自饮用自来水!

水是人类生存的基本供给,此通告关系重大,发出后也引起了不小的恐慌。究其原因,其实是美国伊利湖爆发了大规模的蓝藻繁殖,水面被数十亿单细胞藻类覆盖。当地 2 家水处理厂商检测到湖水中堆积的毒素已达到危险级别,水质不再适合居民饮用。

这种在特定环境下,由于海洋藻类生物爆发而导致的生态异常现象,就是人们常说的赤潮,又称有害藻华 (HABs)。 专家表示,有害藻华对海洋生态平衡、当地经济和人类健康产生了严重威胁。具体而言,海水表面聚集的大量藻类生物可以通过遮蔽阳光、降低水体透明度,危及深层海洋生物的生存。这些生物分泌的粘液还可以粘附于鱼类的鳃上,导致它们呼吸困难,甚至窒息死亡。更进一步地,饮用水源受污染,赤潮生物引发的毒素还会通过食物链传递至人体,人类的健康也受到了严重影响。

在这里插入图片描述

赤潮现象

图源:前瞻网

由此可见,对有害藻华进行观测、预警和防控至关重要。通常情况下,叶绿素 a (chl-a) 浓度可以作为评价 HABs 是否泛滥的关键性指标, 其准确预测将直接影响后续的防控策略。目前,机器学习在预测 chl-a 浓度方面取得了显著进步,然而,它在有效建模复杂动态时间模式、处理数据噪声和不可靠性方面,仍存在不足。

对此,浙江大学 GIS 实验室的研究人员提出了一种全新的深度学习预测模型 ChloroFormer,该模型将傅里叶分析和 Transformer 神经网络结合,采用时序分解架构,有效地改进了 chl-a 浓度预测的准确性。 此外,研究人员还在 2 个不同沿海研究区域开展实验,结果表明,所提模型不仅在多步预测准确性上优于其他 6 种对比模型,在极端和频繁的藻华情况下也能保持相对优势。ration of fourier analysis and transformer networks」为题,发表在 Water Research 上。

研究亮点:

  • 深度学习模型 ChloroFormer 在叶绿素 a 的短期和中期预测上,都超越了基线。

  • ChloroFormer 在预测叶绿素 a 峰值方面表现出色,准确度高,与观察到的数据分布保持较高的拟合优度。

在这里插入图片描述

论文地址:

https://doi.org/10.1016/j.watres.2024.122160

数据集:以台州海域和 Ala Wai 港为例

本研究选取了浙江省台州海域、夏威夷州瓦胡岛 Ala Wai 港作为研究区域, 这两个地方的有害藻华状况各异。其中,台州海域由于经济发展被过度集约利用,大量废弃污染物涌入,海水水质恶化导致赤潮频发。Ala Wai 港作为划船和游艇的热门场所,存在各种人类活动,例如冲浪、划船、帆船、游泳和钓鱼,HABs 很容易发生。

具体而言,台州海域数据 TZ02 包括 2014 年 5 月 30 日至 2021 年 7 月 29 日期间的叶绿素-a (chl-a) 浓度,以每小时为间隔进行监测。Ala Wai 港的数据 NSS002 则涵盖了 2013 年 3 月 1 日至 2018 年 7 月 26 日的 chl-a 浓度,数据通过 4 分钟间隔的水质监测传感器收集,并对 15 个时间点进行平均处理。更进一步地,数据集经过了标准化处理和自然对数转换,目的是为了减少数据范围并提升模型的预测精度。

在这里插入图片描述

用于叶绿素 a 浓度预测的数据集概述

模型架构:周期性和趋势性并存,多步预测 chl-a 浓度

本研究提出深度学习模型 ChloroFormer 来预测 chl-a 浓度。模型框架如下图所示:首先, 将原始时间序列通过移动平均方法分解为周期性 (Periodic lnit) 和趋势性 (Trend lnit) 分量,并分别进行建模处理。
在这里插入图片描述

ChloroFormer 模型

(a) ChloroFormer网络架构,两条路径分别是周期和趋势序列成分

(b) 频率注意力模块的内部结构

其次, 针对趋势组件,研究人员使用 Transformer 神经网络,利用其自注意力机制捕捉长程依赖关系。针对周期性分量,研究人员在 Transformer 网络的基础上设计了基于傅里叶分析的注意力机制,包括频率滤波器 (Frequency Filter) 和频率注意力机制 (Frequency Attention),能够在频率上更有效地捕捉周期性模式。

最后, 研究人员将建模后的 2 个子时序结合,通过线性投影直接映射到多步预测结果。

实验结论:可预测高度非平稳时间动态的 chl-a 浓度

研究人员将 ChloroFormer 模型用于短期和中期的 chl-a 浓度预测,结果如下图所示,短期预测中,ChloroFormer 在 2 个研究区域的精度均高于其他对比模型,误差率显著降低。

在这里插入图片描述

不同模型在短期预测范围中的性能

(a) TZ02监测站点中MAE、RMSE和CORR度量值的比较

(b) NSS002监测站点中3个度量值的比较

如下图所示,在中期预测中,尽管整体预测精度有所下降,但 ChloroFormer 仍优于其他模型。

在这里插入图片描述

不同模型在中期预测范围中的性能

(a) TZ02监测站点中MAE、RMSE和CORR度量值的比较

(b) NSS002监测站点中3个度量值的比较

此外,研究人员还在频繁藻华条件下比较不同模型预测峰值 chl-a 浓度的结果,如下图所示,ChloroFormer 在短期预测中的准确性较高,但随着预测时间的增加,ChloroFormer 在长期预测的准确性上有所降低。总体而言,与其他模型相比,ChloroFormer 在捕捉时间序列趋势、准确匹配极端点方面表现优异,这能为藻华预警提供重要信息。

在这里插入图片描述

使用NSS002检验数据集在1、6、12、24小时范围内真实值和模型预测值的分布密度

最后,本研究还通过 Kolmogorov - Smirnov 测试,证明了 ChloroFormer 的预测结果与实际观测数据分布具有高度一致性,这说明 ChloroFormer 模型稳健,能准确反映数据特征。 另一方面,通过分析注意力权重分布,研究人员还发现 ChloroFormer 能捕捉到不同数据集中的关键时间模式。

综上所述,本研究提出了一种深度学习模型 ChloroFormer,它整合了傅里叶分析技术和 Transformer 网络,提高了具有高度非平稳时间动态 chl-a 浓度的预测准确性,是环境管理中有害藻华预测可靠且经济高效的工具。

以科技之力筑梦蓝色未来

海洋是地球上最大的生命支持系统,保护海洋生物多样性就是保护我们共同的未来。然而,随着人类活动的不断扩张,气候变化、过度捕捞、栖息地破坏以及污染等危机不断涌现,海洋生态系统正面临着严峻的挑战。对此,国内外研究人员们纷纷响应,期待共筑蓝色防线。

近年来,随着数据的积累和深度学习等新技术的发展,针对海洋保护领域的创新性研究不断涌现。比如,本文所提到的浙江大学 GIS 实验室研究团队,就长期致力于海洋保护领域的探索与创新。 他们曾将机器学习与卫星产品结合,深入研究了全球海洋溶解氧的高动态变化,并探索海洋缺氧现象的规律及其成因。

具体而言,研究人员开发了一个全球海表溶解氧综合建模框架 DOsurface-Pred Framework,并基于该框架生成了一个大规模海表溶解氧数据集 SSDO。研究结果表明,即使在氧气充足的海表区域,其溶解氧含量也出现了下降趋势,而这种下降主要归因于海表温度 (SST) 的变化。

更多详情:解构海洋缺氧:浙大 GIS 实验室融合机器学习及卫星测绘,发布全球海表溶解氧综合建模框架

此外,法国蒙彼利埃大学研究团队也曾结合随机森林模型和人工神经网络, 对 4,992 种数据不足或未评估的海洋鱼类物种进行灭绝风险预测。研究结果表明,海洋鱼类的灭绝威胁实则远超先前的普遍认知,未来我们需要更加关注数据不足的物种和关键热点区域,确保后续的保护工作能够有的放矢,直击要害。通过此次研究,科学家们不仅填补了海洋鱼类保护领域的数据空白,还为全球保护优先级的调整提供了新视角。

这些前沿研究成果如同点点星光,汇聚成保护海洋的璀璨星河,未来,我们有理由相信,随着更多科研团队、政府机构、非政府组织以及公众的加入,这场守护海洋生态的战役将会愈发有力,我们定能为海洋生态筑起坚固的防线。

参考资料:

https://dialogue.earth/zh/3/42441/

https://m.thepaper.cn/newsDetail_forward_4890474

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2146108.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

油烟机制造5G智能工厂物联数字孪生平台,推进制造业数字化转型

油烟机制造5G智能工厂物联数字孪生平台,是智能制造与信息技术的深度融合产物。数字孪生工业互联平台通过部署在工厂各个环节的传感器和设备,实时采集、分析和处理生产过程中的海量数据,构建出高度逼真的数字孪生模型。这一模型不仅能够真实反…

基于树莓派ubuntu20.04的ros-noetic小车

目录 一、小车的架构 1.1 总体的概述 1.2 驱动系统 1.3 控制系统 二、驱动系统开发 2.1 PC端Ubuntu20.04安装 2.2 树莓派Ubuntu20.04安装 2.3 PC端虚拟机设置静态IP 2.4 树莓派设置静态IP 2.5 树莓派启动ssh进行远程开发 2.5 arduino ide 开发环境搭建 2.5.1 PC…

深入探索Docker核心原理:从Libcontainer到runC的演化与实现

随着容器技术的发展,Docker从早期的Libcontainer逐步演化到runC,推动了容器运行时的标准化进程。Libcontainer是Docker容器的核心管理工具,而runC则在此基础上发展成为符合OCI(Open Container Initiative)标准的轻量级…

Vue常用PC端和移动端组件库、Element UI的基本使用(完整引入和按需引入)

目录 1. Vue常用PC端和移动端组件库2. Element UI的基本使用2.1 完整引入2.2 按需引入 1. Vue常用PC端和移动端组件库 提供常用的布局、按钮、输入框、下拉框等UI布局,以组件的形式提供。使用这些组件,结构、样式、交互就都有了 移动端常用UI组件库 Van…

windows10 修改默认输入法

右键桌面,选择个性化 左侧搜索 语言 选择编辑语言和键盘选项 点击键盘 默认替代输入法 选择你想要设置的。重启电脑。如下图

C语言18--头文件

头文件的作用 通常,一个常规的C语言程序会包含多个源码文件(.c),当某些公共资源需要在各个源码文件中使用时,为了避免多次编写相同的代码,一般的做法是将这些大家都需要用到的公共资源放入头文件&#xff…

光学超表面在成像和传感中的应用

光学超表面已成为解决笨重光学元件所带来的限制,极具前景的解决方案。与传统的折射传播技术相比,它们提供了一种紧凑、高效的光操纵方法,可对相位、偏振和发射进行先进的控制。本文概述了光学超表面、它们在成像和传感技术中的各种应用以及这…

Broadcast:Android中实现组件与进程间通信

目录 一,Broadcast和BroadcastReceiver 1,简介 2,广播使用 二,静态注册和动态注册 三,无序广播和有序广播 1,有序广播的使用 2,有序广播的截断 3,有序广播的信息传递 四&am…

力扣(LeetCode)每日一题 1184. 公交站间的距离

题目链接https://leetcode.cn/problems/distance-between-bus-stops/description/?envTypedaily-question&envId2024-09-16 环形公交路线上有 n 个站,按次序从 0 到 n - 1 进行编号。我们已知每一对相邻公交站之间的距离,distance[i] 表示编号为 i …

Python燃烧废气排放推断算法模型

🎯要点 宏观能耗场景模型参数化输入数据,分析可视化输出结果,使用场景时间序列数据模型及定量和定性指标使用线图和箱线图、饼图、散点图、堆积条形图、桑基图等可视化模型输出结果根据气体排放过程得出其时间序列关系,使用推断模…

nginx基础篇(一)

文章目录 学习链接概图一、Nginx简介1.1 背景介绍名词解释 1.2 常见服务器对比IISTomcatApacheLighttpd其他的服务器 1.3 Nginx的优点(1)速度更快、并发更高(2)配置简单,扩展性强(3)高可靠性(4)热部署(5)成本低、BSD许可证 1.4 Nginx的功能特性及常用功能基本HTTP服…

GlusterFS 分布式文件系统

一、GlusterFS 概述 1.1 什么是GlusterFS GlusterFS 是一个开源的分布式文件系统,它可以将多个存储服务器结合在一起,创建一个大的存储池,供客户端使用。它不需要单独的元数据服务器,这样可以提高系统的性能和可靠性。由于没有…

python毕业设计基于django+vue医院社区医疗挂号预约综合管理系统7918h-pycharm-flask

目录 技术栈和环境说明预期达到的目标具体实现截图系统设计Python技术介绍django框架介绍flask框架介绍解决的思路性能/安全/负载方面可行性分析论证python-flask核心代码部分展示python-django核心代码部分展示操作可行性技术路线感恩大学老师和同学详细视频演示源码获取 技术…

【Finetune】(二)、transformers之Prompt-Tuning微调

文章目录 0、prompt-tuning基本原理1、实战1.1、导包1.2、加载数据1.3、数据预处理1.4、创建模型1.5、Prompt Tuning*1.5.1、配置文件1.5.2、创建模型 1.6、配置训练参数1.7、创建训练器1.8、模型训练1.9、推理:加载预训练好的模型 0、prompt-tuning基本原理 prompt…

【机器学习】任务五:葡萄酒和鸢尾花数据集分类任务

目录 1.实验基础知识 1.1 集成学习 (1)随机森林 (2)梯度提升决策树(GBDT) (3)XGBoost (4)LightGBM 1.2 参数优化 (1)网格搜索…

编写第一个hadoop3.3.6的mapreduce程序

hadoop还是用的上个伪分布环境。 hadoop安装在龙蜥anolis8.9上,开发是在windows下。 1、windows下首先要下载hadoop的包,hadoop-3.3.6.tar.gz,比如我的解压到d:\java\hadoop-3.3.6中。 配置环境:HADOOP_HOME,内容为&am…

ava总结篇系列:Java泛型Java sort用法详解

一. 泛型概念的提出(为什么需要泛型)? 首先,我们看下下面这段简短的代码: 1 public class GenericTest { 2 3 public static void main(String[] args) { 4 List list new ArrayList(); 5 list.add(&q…

【Elasticsearch系列四】ELK Stack

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

mysql事务的隔离级别学习

事务的隔离级别: ⅰ. 读未提交 ⅱ. 对已提交 (解决 脏读) ⅲ. 可重复读 (解决 不可重复读) ⅳ. 串行化 (解决 脏读 不可重复读 幻读 问题 ) 隔离级别分类如下,在不同的隔离级别下可能产生不…

网络安全。

文章目录 目录 文章目录 一. 网络安全概述 二. 密码学原理 三. 报文完整性和数字签名 密码散列函数 报文鉴别码 数字签名 公钥认证 四. HTTPS通信 总结 一. 网络安全概述 网络安全是保护计算机网络及其数据免受各种威胁和攻击的实践和技术。随着互联网的普及和数字化…