土地利用的时序建模

news2024/11/14 14:53:48

1、LULC 模型的现状

最近的土地利用和土地覆盖 (LULC) 建模进展来自两种方法。 在一种方法中,现有模型适用于 LULC,而在另一种方法中,模型架构是针对 LULC 明确设计的。

随着大型基础模型的兴起,人工智能和深度学习取得了重大进展。 这些模型已经过大量训练数据的训练,可以适应各种领域和数据集。 一个很好的例子是 Segment Anything Model,它是各种分割任务的基础模型。 我们已经开始探索 GeoAI 的分割任意模型的潜力。 通用图像分类模型的其他示例包括 FCN、UNet 或 DeepLab,所有这些模型的主干网络都在 Imagenet(标记摄影图像的参考数据集)上进行了预训练。

虽然这些基础模型有潜力解决一般分割任务,但它们仅限于单图像输入。 然而,正如我们之前概述的那样,时间维度对于准确的 LULC 建模至关重要。 GeoAI 的一个令人兴奋的研究领域特别关注利用时间维度。 这些模型成功地使用卷积、循环编码器和自注意力,通过从时间序列数据中学习来获得出色的结果。

下表总结了两种 GeoAI 方法的优缺点:

模型类别优点缺点
基础或重新调整用途现有训练数据的深层堆栈,众所周知的架构和行为,即用型软件实施,预先训练的模型可以快速产生良好的结果光谱带使用不足,专注于 3 波段 RGB,忽略红外波段,不知道时间维度,针对 2D 卷积进行训练,仅单图像分类
时间序列感知架构面向特定的 LULC 挑战,例如变化检测,文献中证明了高 LULC 精度,时间感知架构利用图像堆栈需要大量的训练数据,而这对于许多项目来说是不可用的,从头开始训练模型既困难又昂贵,需要更多的专业知识,因为软件实施通常不公开或易于安装

2、退一步才能前进

LULC 建模的一大限制是缺乏训练数据。 不同 LULC 模型的目标各不相同,通常需要自定义训练数据。 检测北非的城市地区与检测西亚或北美的城市地区是一个非常不同的挑战。 因此,在许多实际例子中,训练数据必须从头开始创建。

虽然建立基础模型是为了克服这一限制,但它们不适用于时间动态很重要的 LULC 制图。 另一方面,专业模型需要大量高质量的训练数据,而这些数据几乎不可能在合理的时间范围和预算限制内创建。

解决这个难题的方法之一是退后一步,专注于目标。 如果我们简化模型并利用数据最重要的方面,我们就可以用更少的努力获得高质量的结果。 我们尝试了利用数据的多光谱和时间性质的模型,但没有考虑土地覆盖的空间特征。

卫星图像堆栈中的光谱和时间信息可以补偿空间背景。 在我们的实验中,即使不利用空间特征,基于像素的模型也可以产生与 2D 模型相同质量的结果。

2.1 简化的训练数据集创建

为 LULC 项目创建训练数据集是一项劳动密集型工作。 简化标记过程可以说是抛开空间上下文的最重要优势。 打标签者不必非常详细地理解和追踪空间背景。 这使得生成训练数据集变得快速而简单。

在绘制 2D 映射的分割掩模时,需要对图像中的每个像素进行注释(图 1 中的左图)。 此过程可能需要 5 到 30 分钟,具体取决于土地利用类别或景观的复杂程度。

一维模型的注释方法更直接、更快速。 注释者只需标记他们最有信心的像素,无需注释每个像素或处理复杂的空间细节(图 1 中的右图)。 不必追踪每个功能的每个细节,可以大大降低复杂性。 此过程通常会将每个图像的标记时间缩短至 5 秒到一分钟。

图 1:2D标注 vs. 1D标注

2.2 紧凑模型

简化的模型更小,因此更容易训练和部署。 与卷积模型相比,它们的可训练参数大小减少了高达 1000 倍。 简化的模型也需要更少的数据来实现良好的拟合。 最后,即使在常规 CPU 实例上,较小模型的训练和推理速度也很快。 这使得运行和使用模型的成本大大降低。 对于资源有限的项目来说,这可能是一个显着的优势。

2.3 快速迭代

随着创建训练数据和训练模型的周转速度加快,简化的模型加快了迭代过程,促进了高效的模型细化。 在这些模型之上构建主动学习循环变得毫不费力。

这就是建模周期在实践中的样子:

  • 在数小时内创建第一个训练数据集。
  • 训练模型并创建第一个模型预测。
  • 在模型输出的基础上创建额外的标签,专注于主动学习并在最需要的地方帮助模型。
  • 返回步骤 2 并迭代,直到模型输出令人满意。

3、森林类型映射测试用例

我们在一个项目中测试了上述技术,其目标是区分森林类型和景观类别。 使用具有四个月内每两周一次的时间序列和十个光谱带的单像素模型,我们实现了与 U-Net 2D 模型相同的质量。

图 2 中的可视化显示了一些基于像素的模型输出以及每个预测的基础图像系列:

图 2:该模型对于不断变化的景观、季节性和大气影响具有稳健性。

对于此示例,我们开发了一种基于像素的小规模模型,而不是用于 LULC 映射的深层模型。 该编码器由一个 2 层 1D 卷积块组成,具有不同的内核映射,用于处理时间序列数据立方体的各种属性。 这些提取的特征被输入多层感知器(MLP)以生成像素级掩模。

通过采用基于像素的模型,我们还克服了在处理平铺数据时 2D 模型中常见的边缘伪影的挑战。

高级模型结构如下图所示。 有关我们如何实现模型架构的更多详细信息,您可以查看以下模型要点文件。

图3:Data Cube模型结构

为了有效地查询数据集,我们利用了时空资产目录(STAC)。 我们利用了云优化的 GeoTIFF (COG) 格式,这使我们能够在基于云的基础设施上执行高效的查询。

查询数据集时,我们使用元数据指定我们的要求,例如:

  • 目录类型(例如“哨兵”、“陆地卫星”、“hls”等)。
  • GeoJSON 或用于定义感兴趣的地理区域的边界框。
  • 用于指定数据时间范围的时间范围(例如“2021 年 1 月 - 2022 年 5 月”)。

对于每个训练样本,我们随时间收集一堆图像,并定期合成图像。 在上面的示例中,我们使用 14 天的间隔和简单的云去除算法来尽可能减少云。

对于模型训练,我们使用 xarray 创建数据立方体,由沿时间维度的像素复合组成。 这些数据立方体还包括每个土地利用类别的栅格化标签。 该管道的概述如图 4 所示。

图 4:数据管道

4、结束语

我们强调了时间序列数据在土地利用建模中的关键作用。 时间信息在准确绘制土地利用地图方面的重要性变得显而易见,特别是随着深度时间档案的可访问性不断提高。 在土地利用模型中包含时间序列数据可以增强其稳健性和准确性。

此外,时间上下文可以成为获取空间 2D 上下文的可行替代方案,而空间 2D 上下文通常具有挑战性。 通过用时间上下文替代空间上下文,为更简单的模型创建训练数据变得更快、更经济、更高效。 这种替代在许多实际用例中证明是有价值的,证明时间上下文和频谱深度可以有效地替代空间上下文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1535965.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

广告增量实时索引构建实践

本期作者 1.前言 在广告检索系统中,增量索引(实时索引)是一类常见的技术,用于使广告信息的变更及时生效。其中一种主要的思路即由检索系统消费广告更新数据流,实时更新内存索引,对此行业中已有很多优秀方案…

Linux: 线程安全

Linux 线程共享了进程的资源(地址空间, 页表等), 多个线程同时访问同一个资源就可能产生问题:数据竞争 临界资源: 多个线程共享的资源临界区: 访问临界资源的区域互斥: 任何时刻, 只有一个执行流能进入临界区同步: 以一定顺序访问临界资源原子性: 要么完成, 玩么未完成 锁 死…

【Leetcode每日一题】 递归 - Pow(x, n)(难度⭐⭐)(40)

1. 题目解析 题目链接:50. Pow(x, n) 这个问题的理解其实相当简单,只需看一下示例,基本就能明白其含义了。 2.算法原理 在这个算法中,递归函数的任务是求出 x 的 n 次方。那么,这个函数是怎么工作的呢?它…

Linux_开发工具_yum_vim_gcc/g++_gdb_make/makefile_进度条_git_2

文章目录 一、Linux软件包管理器yum1. centos7 中安装软件方式2.安装,卸载,查看3.yum源4.安装lrzsz5.安装扩展源 二、Linux编辑器-vim1.安装vim2.vim的三种模式3.命令模式-文本批量化操作4.vim配置 三、Linux编译器-gcc/g使用1.安装2.gcc如何完成1、 预处…

安全工具介绍 SCNR/Arachni

关于SCNR 原来叫Arachni 是开源的,现在是SCNR,商用工具了 可试用一个月 Arachni Web Application Security Scanner Framework 看名字就知道了,针对web app 的安全工具,DASTIAST吧 安装 安装之前先 sudo apt-get update sudo…

qt5-入门-标签页部件QTabWidget-1

参考: C GUI Programming with Qt 4, Second Edition 本地环境: win10专业版,64位,Qt5.12 目录 效果实现Qt Designer操作代码addStretch()解释 效果 首页有三个按钮和最近文件列表。 拖动窗口,按钮和文件列表仍然处…

【算法与数据结构】总结

目录 引言 一、线性数据结构 1. 1 数组(Array) 1.2 链表(Linked List) 1.3 栈(Stack) 1.4 队列(Queue) 二、图形数据结构 2.1 深度优先搜索(DFS)&…

谈谈我对 AIGC 趋势下软件工程重塑的理解

作者:陈鑫 今天给大家带来的话题是 AIGC 趋势下的软件工程重塑。今天这个话题主要分为以下四大部分。 第一部分是 AI 是否已经成为软件研发的必选项;第二部分是 AI 对于软件研发的挑战及智能化机会,第三部分是企业落地软件研发智能化的策略…

VPCFormer:一个基于transformer的多视角指静脉识别模型和一个新基准

文章目录 VPCFormer:一个基于transformer的多视角指静脉识别模型和一个新基准总结摘要介绍相关工作单视角指静脉识别多视角指静脉识别Transformer 数据库基本信息 方法总体结构静脉掩膜生成VPC编码器视角内相关性的提取视角间相关关系提取输出融合IFFN近邻感知模块(NPM) patch嵌…

使用jscpd对比重复代码

背景 检查项目中重复的代码,或者代码片段 jscpd 两个文件对比 Jscpd 是一个用于检测代码复制和粘贴的工具,它可以比较两个文件并报告相似性的百分比。 以下是如何使用 Jscpd 来比较两个文件的示例: 首先,确保你已经安装了 Nod…

数据库系统概论-第16章 数据仓库与联机分析处理技术

概念性的介绍,一略而过,不重要。 16.1 数据仓库技术 16.2 联机分析处理技术 16.3 数据挖掘技术 16.4 大数据时代的新型数据仓库 16.5 小结

大数据信用报告查询:三种查询方式揭秘,哪种更适合你?

了解大数据信用与人行信用的区别对于理解个人信用状况至关重要。本文将探讨大数据信用报告的查询方法,评估不同方式的优劣,并给出建议。 大数据信用报告的查询途径 1. 二维码分享查询 通过搜索引擎找到的相关文章可能会包含查询二维码。这类方式通常只提…

FMEA常见误区与能力提升方法——FMEA软件

免费试用FMEA软件-免费版-SunFMEA 新版FMEA(故障模式与影响分析)作为一种重要的质量管理工具,被广泛应用于产品设计、生产和服务等领域。然而,在实际应用中,许多组织和个人常常陷入一些误区,导致FMEA的效果…

浅谈Javascript虚拟列表(virtaul list)改造成虚拟表格(virtaul table)的技术

前端加载百万条数据列表,如果采用真实的DOM插入100万个div(或li)标签,肯定是非常卡顿的。这就不得不使用虚拟列表技术方案,但是虚拟列表技术方案网上有很详细的实现方法,今天我就来谈谈根据网上的方案&…

【软考高项】十六、信息系统工程之安全工程

1、基础概念 定义:建造一个信息安全系统,它是整个信息系统工程的一部分,而且最好是与业务应用信息系统工程同步进行,主要围绕“信息安全”内容 信息安全系统三维空间: 包括安全机制、网络参考模型和安全服务 X轴是…

23 OpenCV 直方图比较

文章目录 直方图比较的目的相关性计算 (CV_COMP_CORREL)卡方计算 (CV_COMP_CHISQR)十字计算(CV_COMP_INTERSECT)巴氏距离计算 (CV_COMP_BHATTACHARYYA )compareHist 直方图比较算子示例 直方图比较的目的 直方图比较的目的是衡量两幅图像之间的相似度或差异度。通过计算图像的颜…

如何在 Windows 中恢复永久删除的文件

即使您从电脑或笔记本电脑中永久删除文件或文档,您也可以轻松恢复它们。因此,在本文的帮助下,我们将了解一些轻松恢复丢失数据的最佳和最值得信赖的方法。 生活中,难免会发生错误。这就是我们作为个人学习和成长的方式。这些错误…

OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file

想折腾bert的同学,应该也遇到这个问题。 一、报错信息分析 完整报错信息:OSError: We couldnt connect to https://huggingface.co to load this file, couldnt find it in the cached files and it looks like google/mt5-small is not the path to a…

比堆垛机方案省电65% 实施快50% 四向车系统柔性化建设进程异军突起

对物流企业来说,供应链的数智化升级并非“赶时髦”,它需要找到一个既懂物流行业,又有数字化技术作基础的仓储方案提供商。而河北沃克基于AI底层技术、软硬一体化产品体系和技术创新行业经验双轮驱动的业务团队等“技术产品人才”三位一体优势…

杭州克鲁斯机器人控制信号线缆故障维修攻略,快来了解一下!

克鲁斯机器人作为工业自动化的重要组成部分,其稳定运行对于生产效率至关重要。克鲁斯机器人控制信号线缆作为机器人与外部控制设备之间的桥梁,承担着传输指令和反馈信号的重要任务。 一、克鲁斯机器人控制信号线缆故障识别与诊断 故障现象:当…