解构海洋缺氧:浙大 GIS 实验室融合机器学习及卫星测绘,发布全球海表溶解氧综合建模框架

news2024/12/22 4:46:43

多年前,海洋专家 Eric Prince 在进行鱼类标记追踪时发现了一个异常现象:蓝色马林鱼在美国东南部通常会下潜至 800 米的深海捕食,而在哥斯达黎加海域却只在海洋表层活动。作为潜水行家的马林鱼,为什么突然不潜水了呢? 长期研究长嘴鱼类的 Eric Prince 决心探究这一反常现象。

其实,这是海洋生物面对海洋环境变化所作出的自我保护反应,而 Eric Prince 的这一次探究则是将其背后的「海洋缺氧」现象进一步推向大众视野——正是由于哥斯达黎加海域的深层氧含量正在下降,缺氧区域逐步扩大,马林鱼为了避免窒息只得在表层活动。

人们通常将因缺氧而导致大量海洋生物死亡的区域称为海洋「死亡地带」,但事实上,海洋缺氧带来的负面影响不仅仅只针对海洋生物本身,还会波及到渔业、乃至社会经济。 现如今,随着全球环境问题的加剧,海洋缺氧也愈演愈烈。

2019 年,世界自然保护联盟 (IUCN) 曾在海洋缺氧报告中表明,当前低氧浓度的海洋区域正在扩大,相较于上世纪 60 年代的 45 个缺氧海域地带,目前已增加了 600 多个受低氧条件影响的区域。报告指出,在同一时期,全球海洋中缺氧水域的数量增长了 4 倍。

为了更好地维护海洋生态系统健康、保护渔业资源,开展科学的海洋溶解氧水平测定至关重要。

然而,目前海洋实地观测的成本昂贵,现有观测数据空间分布不均匀,加之溶解氧浓度的测量手段多样,所得数据的质量也存在较大差异,这都给研究全球海洋的溶解氧水平变化带来了一定的挑战。

对此,来自浙大 GIS 实验室的研究人员提出了一种新的方法,将机器学习技术与卫星产品相结合,开发了一个全球海表溶解氧综合建模框架 DOsurface-Pred Framework,并基于该框架生成了一个跨越 2010 年-2018 年的大规模海表溶解氧数据集 SSDO。 研究结果表明了即使在氧气充足的海表区域,其溶解氧含量也出现了下降趋势,而这种下降主要归因于海表温度 (SST) 的变化。

研究亮点:

  • 提出了一个全球海表溶解氧综合建模框架

  • 引入 SHAP 解释器,确定了关键变量及其对预测溶解氧结果的影响

  • 有助于了解全球海洋溶解氧的高动态变化、探索脱氧现象规律及其成因

在这里插入图片描述

论文地址:
https://pubs.acs.org/doi/10.1021/acs.est.3c08833

SSDO 数据集地址:
https://go.hyper.ai/BBlqA

数据集:卫星 + 现场测量数据

本研究使用的数据包括卫星数据、固定船只和电导仪现场测量数据。

卫星数据集包括海表温度 (SST)、海表盐度 (SSS)、叶绿素-a (Chl-a)、海表风 (SSW) 和海平面异常 (SLA)。SST 数据来自 OISST 数据集,SSS 数据来自欧洲空间局 (ESA) 的 CCI 项目,Chl-a 数据来自 MODIS Aqua 和 Terra 卫星,SSW 数据由 VAM 方法结合跨平台交叉校准的多卫星微波风和仪器观测而来,SLA 数据来自 AVISO 项目。

固定船只和电导仪现场测量数据来自 2018 年世界海洋数据库 (WOD) 中的海洋站数据 (OSD) 和高分辨率导电-温度-深度 (CTD) 子数据库。

本研究使用的现场测量数据如图所示,共计 28,044 条记录,其中包含了 241 条来自 2019 年的记录数据。

在这里插入图片描述

现场测量的数据分布和数据相关性分析

a. 现场测量数据的空间分布
b. 现场测量数据的时间分布
c. 不同海洋现场测量的数据分布
d. 7 个主要海洋水文变量之间的相关性矩阵分析

模型构架:DOsurface-Pred Framework 的三大组成部分

在这里插入图片描述

全球海洋溶解氧的可解释时空机器学习框架

研究人员提出了一种时空信息嵌入的可解释机器学习框架。 该框架由三个主要部分组成:Spatio-temporal Information Embedding Module、Backbone Regression Module 和 SHAP Explainer Module。

第一部分, 用多个卫星和现场测量的时空信息数据,即样本 Xi= {Xi spatial,

Xi temporal, Xi satellite1, ……, Xi satellite n} 作为输入。通过时空信息嵌入模块,将空间和月份信息转换为极坐标表示,转换后得到 X’i={X’i spatial, X’i temporal, X’i satellite1, ……, X’i satellite n} 的全局表示。

随后,X’i 被传递到第二部分。 用多步网格搜索交叉验证 (gridsearch cross-validation) 对不同模型进行评估。

在这里插入图片描述

不同模型性能评价表

上表是 backbone models 的性能评价表,与未采用此框架的模型相比,DOsurface-Pred 框架的性能得到了提升。

此外,所有基于树形结构的机器学习模型 (tree-based machine-learning models) 在性能上均优于 benchmark 多元线性回归模型(multiple linear regression model)。这些模型按性能降序排列如下:ET、RF、GBDT、XGBoost、MLP。其中,ET 模型在所有评估指标上表现最佳,RMSE 值 为 11.67 μmol/kg,该模型在溶解氧 (DO) 建模中具备更好的泛化能力,可以降低模型的过拟合现象。

在第三部分, 研究人员利用 SHAP 可解释性方法评估样本特征值对模型输出结果的影响。通过该框架,在最优模型下生成预测结果。

SHAP 可以量化不同特征值对预测结果的贡献程度,使模型的输出更容易理解,进而确定关键变量及其对溶解氧预测结果的影响。

实验结论:SST 是影响海表溶解氧含量的主要原因

DOsurface-Pred Framework 可以对全球海表溶解氧浓度进行精确评估,研究人员基于该框架生成了一个跨越 2010 年-2018 年的大规模海表溶解氧数据集,称其为 SSDO 产品。

在这里插入图片描述

DO 预测的不确定性估计

(a,b) 均方根误差 (RMSE) 和偏差误差 (biaserror)
(c,d) 不同年、月下总不确定性及其组成 (M、R、P)

为了评估最优模型生成的结果,研究人员进行了不确定性估计和时空验证。

首先,评估 SSDO 产品的误差和不确定性。实验结果表明,3 种误差(测量误差 M、表示误差 R 和预测误差 P)共同造成总不确定性,其总不确定性估计为 ±13.02 μmol/kg。

在这里插入图片描述

独立浮标 (PFL) 测量的评估

(a) 预测值和 PFL 测量值的散点密度图
(b) 匹配的 PFL 点空间位置,序号与下面 (c-h) 提供的图号相对应
(c-h) 每个位置氧气异常的时间趋势,与 PFL 测量异常值进行比较

其次,研究人员利用独立的浮标测量数据集进一步检验了 SSDO 的准确性和时间序列。结果表明,预测结果与 PFL 数据库具有良好的拟合性,R² 值为 0.86。

此外,研究人员还对不同海洋地区的长期浮标观测位置进行了比较评估,结果表明,预测结果与浮标测量的空间变化和长期趋势方面具备一致性。 这些评估可靠地验证了预测结果,有助于分析它们在不同场景下的适用性。

研究人员还对 SSDO 产品进行统计分析。结果表明,SSDO 数据具备与 WOD 长期记录数据相似的空间分布。低氧区持续扩张的影响下,海表的溶解氧水平也出现了欠饱和的现象,即使是在溶解氧充分交换的海表,其溶解氧也呈现出平均每年 0.22 μmol/kg 的下降趋势。 此外,海表溶解氧的年际变化表现出与海洋典型变化现象的相关性。

在这里插入图片描述

溶解氧建模因素可解释性分析

(a) 评估全球特征平均值对模型输出结果的影响
(b) 评估局部特征对模型输出结果的影响
(c,d) 分析 SST 和 SSS 对模型输出的影响
(e,f) SST 和 SSS 特征影响的空间分布

研究人员利用 SHAP 可解释性方法,进一步揭示了温盐等海洋因素对海表溶解氧的驱动机制。其中,温度 (SST) 和盐度 (SSS) 为主控因子,对溶解氧呈现出负面影响,SST 对溶解氧水平影响最大。 该评估有助于提升建模的可靠性,为探索海洋溶解氧时空分布变化状况与脱氧现象成因提供了可解释的因素量化结果。

综上,研究人员利用 DOsurface-Pred 框架生成了 SSDO 数据集,并引入 SHAP 可解释性方法,证实了即使在氧气充足的海表区域,其溶解氧含量也出现了下降趋势,而这种下降主要归因于 SST 变化。

AI 与海洋,探索未知的深海奥秘

IUCN 全球海洋和极地项目海洋科学与保护高级顾问 Dan Laffoley 曾表示,「海洋中的溶解氧浓度正在持续下降,这让本就面临着升温与酸化压力的海洋生态系统雪上加霜。」

目前,除了加速全球、全行业碳减排外,通过对海洋缺氧现象的深入研究,分析气候影响地球生命体的重要因素,也可以让人们对不同生物体灭绝或幸存原因有更准确的认知,进一步「对症下药」。

在这一过程中,物联网、AI 等新兴技术的能力逐渐得到了更加深入的应用。除了上文中提到的海标溶解氧分析框架外,也有学者基于卫星遥感、无人机、浮标、声纳、水下光学等海洋数据,围绕海洋垃圾控制、海洋多样性保护等方面展开了研究。

例如,2019 年,联合国环境规划署就曾发布了一个针对湄公河及恒河流域塑料污染的反措施项目 CounterMEASURE, 该项目利用无人机在湄公河流域拍摄航空图像,并开发了一个识别和监测模型,用于查明湄公河流域塑料垃圾的来源和路径,准确率达到 83.9%。

此外,澳大利亚的 The Ripper Group 公司,也曾研发出了一款用无人机+机器视觉技术来识别鲨鱼的产品。 该产品不仅用于避免沿海地区被鲨鱼打扰,对保护鲨鱼生态也起到重要作用。

诚然,人类社会高居不下的碳排放已经对全球气候、生态环境造成了严重影响,其中,作为地球生命的起源,海洋生态环境保护也刻不容缓,期待不久后的将来,AI 驱动的环保措施在揭开海水升温、溶解氧浓度下降真相的同时,得以治标治本、从根源上还大海以清澄。

参考资料
1.https://mp.weixin.qq.com/s/bUbYptqccBXC2T9dvkfOfA
2.https://www.cdstm.cn/gallery/hycx/qyzx/201909/t20190904_923957.html
3.http://www.cbcgdf.org/NewsShow/4854/10658.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1620877.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【k8s】Kubernetes 1.29.4离线安装部署(总)

(一)kubernetes1.29.4离线部署之-安装文件准备 (二)kubernetes1.29.4离线部署之-镜像文件准备 (三)kubernetes1.29.4离线部署之-环境初始化 (四)kubernetes1.29.4离线部署之-组件安装…

Educational Codeforces Round 164 (Rated for Div. 2) A-E

A. Painting the Ribbon 暴力模拟即可 #include <bits/stdc.h>using namespace std; const int N 2e5 5; typedef long long ll; typedef pair<ll, ll> pll; typedef array<ll, 3> p3; // int mod 998244353; const int maxv 4e6 5; // #define endl &…

Maven的基础使用

1 Maven概述 引入案例&#xff1a;idea创建javaWeb项目&#xff0c;如何打包并发布tomcat上去&#xff0c;以便于客户端访问&#xff1f; 方案一&#xff1a;DOS命令完成打包&#xff0c;操作性不方便&#xff0c;代码频繁修改&#xff0c;频繁使用命令打包一阶段可以打包&am…

SHELL脚本(全是干货)

一、shell是什么&#xff1f; 1. 1 shell 是一种脚本语言 脚本语言的本质是一个文件&#xff0c;文件里面存放的是特点格式的指令&#xff0c;系统可以使用脚本解析器翻译或者解析指令&#xff0c;并且执行&#xff08;它不需要编译&#xff09; shell 即是应用程序&#xff…

【Linux】Linux权限管理详解

&#x1f331;博客主页&#xff1a;青竹雾色间 &#x1f331;系列专栏&#xff1a;Linux &#x1f618;博客制作不易欢迎各位&#x1f44d;点赞⭐收藏➕关注 目录 1. Linux权限概念2. 文件访问者分类a) 文件和目录的访问者&#xff1a;b) 文件类型和访问权限 3. 文件权限值的表…

Linux的磁盘分区,格式化,挂载

1.需要提前添加几个磁盘&#xff0c;以做实验 2.把nvme0n2磁盘用来分区实验 3.分了一个主分区&#xff0c;和一个扩展分区&#xff08;扩展分区是不能使用的&#xff0c;所以又在扩展分区里分了一个逻辑分区&#xff09;分区的大小自己定义 4.格式化分出来的区&#xff0c;这…

xgp怎么注册阿根廷账号 微软商店xgp阿根廷账号注册教程

xgp怎么注册阿根廷账号 微软商店xgp阿根廷账号注册教程 xgp游戏平台是微软公司针对pc用户开发的一款游戏平台&#xff0c;在平台内有着知名的月包服务&#xff0c;玩家们只需每个月支付固定的费用&#xff0c;即可免费玩到不同的游戏大作&#xff0c;xgp平台也正是由月包服务…

1.C++入门(下)

目录 1.引用和指针 2.内联函数 2.1 概念&#xff1a; 2.2 特性&#xff1a; 2.3 与宏对比 3.auto关键字 3.1 简介&#xff1a; ​3.2 使用&#xff1a; 3.3 局限 4.基于范围的for循环 1.引用和指针 因为这个面试中常考&#xff0c;就接着上一篇&#xff0c;把这个放…

Linux 底软开发——对CAN的详细操作(周期发送,异常检测,过滤报文)

Linux底软开发—对CAN发送接收详细操作 文章目录 Linux底软开发—对CAN发送接收详细操作1.保证多条CAN数据发送的周期性2.解析CAN报文数据3.CAN总线异常机制应对4.对CAN报文进行过滤操作5.完整的接收报文代码&#xff08;过滤&#xff0c;心跳检测&#xff0c;解析&#xff09;…

刚刚,百度真来炸场了!

文章目录 前言再看文心智能体开发工具&#xff1a;AgentBuilderAI原生应用开发工具&#xff1a;AppBuilder各种尺寸的模型定制工具&#xff1a;ModelBuilder结语 前言 不知道大家还记得不&#xff0c;去年 ChatGPT 火遍全球的时候&#xff0c;国内率先推出 AI 大模型的是百度家…

【热门话题】AI作画算法原理解析

&#x1f308;个人主页: 鑫宝Code &#x1f525;热门专栏: 闲话杂谈&#xff5c; 炫酷HTML | JavaScript基础 ​&#x1f4ab;个人格言: "如无必要&#xff0c;勿增实体" 文章目录 AI作画算法原理解析AI作画算法概述基础原理&#xff1a;机器学习与深度学习卷积…

再谈C语言——理解指针(四)

assert断⾔ assert.h 头⽂件定义了宏 assert() &#xff0c;⽤于在运⾏时确保程序符合指定条件&#xff0c;如果不符合&#xff0c;就报错终⽌运⾏。这个宏常常被称为“断⾔”。 assert(p ! NULL); 上⾯代码在程序运⾏到这⼀⾏语句时&#xff0c;验证变量 p 是否等于 NULL 。…

基于Kepware的Hadoop大数据应用构建-提升数据价值利用效能

背景 Hadoop是一个由Apache基金会所开发的分布式系统基础架构&#xff0c;它允许用户在不需要深入了解分布式底层细节的情况下&#xff0c;开发分布式程序。Hadoop充分利用集群的威力进行高速运算和存储&#xff0c;特别适用于处理超大数据集。 Hadoop的生态系统非常丰富&…

【如何使用chrome开发者工具调试javascript代码】

创作背景 平常开发时我们去解决bug可能会用console.log来来调试&#xff0c;但是断点可以更快地完成工作。 log调试的劣势&#xff1a;但是使用console.log时需要我们手动的打开源码&#xff0c;找到相关代码&#xff0c;插入log语句&#xff0c;然后重新加载页面&#xff0c…

【MySQL】数据库操作指南:数据类型篇

&#x1f331;博客主页&#xff1a;青竹雾色间 &#x1f331;系列专栏&#xff1a;MySQL探险日记 &#x1f618;博客制作不易欢迎各位&#x1f44d;点赞⭐收藏➕关注 ✨人生如寄&#xff0c;多忧何为 ✨ 文章目录 1. 数值类型1.1 tinyint 类型1.2 bit 类型1.3 小数类型1.3.1 f…

屏幕状态自动检测+鼠标自动操作

目录 一、写在前面 1.1适用场景 1.2涉及到的库 二、函数库 2.1pyautogui-屏幕截图&鼠标操作 2.1.1屏幕截图screenshot函数 2.1.2鼠标移动及单击 2.2Opencv-模板匹配 2.2.1matchTemplate函数 2.2.2minMaxLoc函数 2.2.3相关代码 2.3base64-图片转base64 2.3.1在线…

顺序表的应用-通讯录

顺序表的应用-通讯录 1.操作2.功能要求2.1.功能要求2.2.思路小结2.3.文件梳理2.4.代码实现"SeqList.h""Contact.h""SeqList.c""Contact.c""test.c" 1.操作 链接: 顺序表专题 这篇文章介绍了顺序表的概念与基本操作。 本文将…

54位大咖演讲精华! 中国生成式AI大会圆满收官,TOP50企业榜单揭晓

54位大咖演讲精华&#xff01; 中国生成式AI大会圆满收官&#xff0c;TOP50企业榜单揭晓© 由 红板报 提供 智东西4月19日报道&#xff0c;为期两天的2024中国生成式AI大会&#xff0c;今日在京圆满收官。 54位产学研投嘉宾代表全程干货爆棚&#xff0c;报名咨询人数逾52…

机械臂模型更换成自己的urdf模块

1.将urdf生成slx文件 smimport(rm_65_flange.urdf);%生成Simscape物理模型 2.更换joint部分&#xff08;对应与几个输入几个输出&#xff09;&#xff08;依次更换&#xff09; 3.更改关节部分&#xff08;依次更换&#xff09; 找到urdf文件夹下的meshes文件夹&#xff0c;看…

python爬虫 - 爬取 json 格式数据(股票行情信息:雪球网,自选股)

文章目录 1. 第一步&#xff1a;安装requests库2. 第二步&#xff1a;获取爬虫所需的header和cookie3. 第三步&#xff1a;获取网页4. 第四步&#xff1a;解析网页5. 第五步&#xff1a;解析 json 结构数据体6. 代码实例以及结果展示 python爬虫五部曲&#xff1a; 第一步&…