历史标签如何时间迁移?

news2025/1/20 14:53:58

本文解析的论文是:
Lin, C.; Du, P.; Samat, A.; Li, E.; Wang, X.; Xia, J. Automatic Updating of Land Cover Maps in Rapidly Urbanizing Regions by Relational Knowledge Transferring from GlobeLand30. Remote Sens. 2019, 11, 1397. https://doi.org/10.3390/rs11121397
本篇论文的目的是在同一个区域中,如何利用历史已有的分类数据作为参考,来对其他时间的影像进行分类,已达到不用人为选择样本即可完成分类的目的。
注意:文章中的方法是针对同一个区域,进行不同时间的样本迁移,而关于不同区域相同时间或不同时空的样本迁移,后文会补充其他论文的解析。
先验:我们知道同一个区域,在不同时间内肯定会有变化,而区域较大的话,其不变的大于变化的概率会更大。如果我们找到此区域不变的区域,同时在此不变的区域中从历史标签中选择部分样本,同时利用一定的策略对此样本清洗一下(为什么要对历史标签中样本进行清洗呢,因为历史标签可能存在部分分类错误),那完全可以作为其他时间的真实标签作为训练样本。

根据先验的分析,需要具体完成以下几点:

  1. 样本如何清洗,历史数据从哪来?
  2. 不变区域如何获取?
    根据上述对论文的分析,以下分别展开描述;

1 样本获取清洗?

1.1 实验数据介绍

先简单描述一下相关的实验数据,如下,以南京和杭州两个区域为例,选择了landsat5/8作为数据源
在这里插入图片描述
辅助数据:
夜间灯光数据:DMSP/OLS NTL云免费年度合成数据的第四版
数字表面模型(DSM):日本宇宙航空研究开发机构开发的“ALOS World 3D”。
数字地形模型(DEM):日本经济、贸易和工业部(METI)和美国宇航局(NASA)共同开发的ASTER全球数字高程模型。

标签数据:
GlobeLand30数据集:包括耕地、森林、草地、水体、湿地、人造表面等十种类型。2010年的数据被用于本研究,整体准确率达到80.33%。
同时选择2010年的两个研究区的影像和标签数据配对,作为标签分类时的影像,因为真实对应标签的影像时间难以获取,所以选择同年份的遥感影像。

1.2 基本清洗

相关数据介绍之后,开始对2010年的影像和标签进行处理了,以清洗掉不符合影像中的类别或者是分类错误的标签。
方法:

基于GlobeLand30的统计结果,实验区域主要包含六种土地覆盖类型:耕地、森林、草地、水体、湿地和人造表面。灌木地和裸地的比例都不到0.03%,而永久性冰雪和冻原在实验区域并不存在。这六种土地覆盖类型足以构成快速城市化地区的类别体系,并且可以满足大多数城市地区研究和应用的需求。因此,提出的土地覆盖优化策略仅考虑与这六种类型相关的决策规则。
由于GlobeLand30的整体准确率低于85%,这意味着土地覆盖产品中存在许多分类错误的区域。为了最小化这些因素影响,提出了一种基于多模态数据集提供的土地覆盖信息的土地覆盖优化策略。该策略通过建立决策规则,整合了质量增强的NTL数据、从DSM提取的高程和坡度信息,以及从Landsat影像中提取的一系列指数。
我们计算了与植被、水和不透水表面相关的指数,以帮助制定决策规则。
归一化植被差异指数(NDVI)被广泛接受用于增强植被与非植被之间的差异。
改进的归一化水差异指数(MNDWI)可以显著增强水信息,尤其是在城市场景中。
生物物理组成指数(BCI)已被证明与不透水表面丰度的关系比其他指数更密切。
这三个指数被用来帮助制定决策规则。
基于先验知识,为六种土地覆盖类型建立了优化策略。耕地类别应包括灌溉农田、温室耕地、经济耕地等。BCI和NTL可以检测到耕地类别中的一些分类错误的像素,尤其是农村小屋。由于人类管理,耕地通常耕作在相对平坦的地形上,这与其他植被不同。人造表面主要包括城市地区、道路、农村小屋等。与其他土地覆盖类型不同,其对应的像素通常具有较大的BCI和NTL值,以及较小的MNDWI和NDVI值。NDVI可以纠正森林和草地的分类结果,MNDWI可以纠正水体的分类结果。为了获得更好的优化结果,另外两个指数被选为这三种土地覆盖类型的决策规则。
关于BCI指数:Deng, C.; Wu, C. BCI: A biophysical composition index for remote sensing of urban environments. Remote Sens.
Environ. 2012, 127, 247–259

如图显示了用于优化GlobeLand30的策略。变量σi表示不同土地覆盖类别的不同特征的阈值。为了自动实现土地覆盖类别,应用Otsu的二值化算法进行阈值决策。
在这里插入图片描述

通过上述方法完成了初步的数据清洗,由于分类数据集本来精度也挺高,在对标签进行纠偏之后,有的文献就直接将其应用到2010年的影像上进行训练分类了。但这时候依然无法完成向其他时间的迁移,这时候有人在把其他时间,比如2020年的影像和历史标签,比如这里的2010的标签利用上述方法进行清洗,然后作为训练样本进行分类。
这没有考虑到影像和标签时间差异较大,如果清洗效果不好的话,后直接影响到后面分类效果。
ps:不复杂的区域,这样做,其实精度可能也还行。
而本文处理后续还有进一步的数据清洗,以获取高精度的样本。

1.3 进一步清洗

基于上述决策规则的策略用于从GlobeLand30中移除可能分类错误的像素。此外,设计了知识转移过程的工作流程。工作流程包括三个主要步骤:
(1) 使用优化过程的输出执行基于光谱特征(SC)的聚类;
(2) 根据聚类结果使用区分标准分配训练集T1;
(3) 识别变化和未变化区域,并使用转移的土地覆盖知识标记X2中的未变化像素。在上述三个步骤之后,历史地图中的土地覆盖知识被转移到新的卫星图像上。这三个步骤的详细描述如下。
在这里插入图片描述

我们先来看SC聚类:
在文章中提到的"spectral characteristic-based clusters"方法(利用了不同土地覆盖类型在光谱曲线上的独特形状来进行分类。这种方法的目的是将具有相似光谱特性的像素聚集在一起,形成不同的类别或"聚类",以便于后续的土地覆盖分类。
其原理如下:

光谱曲线向量:在每一类像元中的每个像素,计算一个光谱曲线向量,该向量包含了像素在不同波段间的反射率差异。这些差异是通过比较每个波段的反射率值来计算的,使用如下公式:
在这里插入图片描述
其中( s_{m,p,q} )是像素( m )在波段( p )和( q )的光谱曲线特征值,( x_{m,p} )和( x_{m,q} )分别是该像素在波段( p )和( q )的反射率值,( f )是一个二值化函数,当反射率差异大于0时取1,否则取0。
其实Sm就是一个波段与其他波段的差值,如b1,b2,b3, 进行f(b2-b1),f(b3-b2),f(b3-b1),根据正负确定0/1,这样组成每个像元的光谱曲线向量。

聚类操作:接下来,根据计算出的光谱曲线向量,将相同的曲线分类为一个子类。注意这里是在每个标签类别所在的像元里面,计算这些像元的光谱曲线向量,然后将向量一样的进一步划分为子类,和一般的k-means分类不一样。

统计直方图:对每个类别所在的像元里面的每个子类的聚类的像素数量进行统计,形成一个直方图,这有助于识别哪些聚类代表了图像中的主要土地覆盖类型。
去除小聚类:最后,移除那些像素数量很少的聚类,因为它们可能不代表主要的土地覆盖类型,或者可能是由于噪声或异常值造成的。

至此,在每个类别所在像元内部,进一步划分若干个子类,这些子类按照像元数量进行直方图统计,因为就算是一个类别,其内部之间也是有差异的,只不过这种差异可能比和其他的类别之间的较小而已。

那如何判定类间差异和类类之间的差异大小,以进一步筛选出子类呢?
为了分类目的,不同土地覆盖类别的训练样本应该具有足够的可分性。从这个角度来看,基于类相似性为SC聚类输出定义了区分标准。因此,根据不同土地覆盖类别中子类的区分标准进一步选择聚类结果。类相似性是根据J-M距离来衡量的。对于不同土地覆盖类别的子类i和子类j,计算它们之间的J-M距离。
区分标准如下:通过J-M距离成对计算每个直方图中除第一类之外的所有子类的类相似性。对于给定的子类i和不同土地覆盖类别中的子类j,如果J-M距离的结果低于用户定义的阈值(假定为1),则建议删除这对。
最终剩余的子类构成了训练集T1。

至此,利用JM距离对各子类进一步筛选,以去掉可分离性较小的像元,剩下的样本组成T1样本集。

2 不变区域获取

以上完成了样本清洗工作,目前已经有2010年相对于遥感影像的质量较好的一组样本集T1。

刚刚强调过,如果直接选择其他时间的遥感影像,比如2020年,完成上述的清洗工作,获取的样本可以直接作为2020年遥感影像的训练样本进行分类,但考虑到精度问题,这里不是这样做。

现在考虑如何将样本进行迁移工作,我们知道一个区域在不同时间肯定有变化的,而变化分为变化区域和不变区域,如果找到不变区域,将不变区域中的T1样本集中的标签取出来作为其他时间的训练样本不就行了?

基于此思路,文中直接将其他时间遥感影像,如2018年遥感影像的各波段和2010影像波段直接做差,然后求和,计算出变化强度特征,然后利用OTSU方法进行阈值分割获取不变区域mask
在这里插入图片描述

然后利用mask和T1相交,即获取不变区域的各类别样本的稳定标签。
关于变化检测的方法可参考:
变化检测综述

至此获取到其他时间的稳定的训练样本,进入到正常分类流程即可,选择合适的分类特征和分类器即可。

总结:

本文主要利用历史标签数据完成了在不同时间上的样本迁移,前提是要在同一个区域,在其他时间获取到稳定的样本之后,可以完成高精度的分类。

欢迎点赞,收藏,关注,支持小生,打造一个好的遥感领域知识分享专栏 。遥感学习专栏

同时欢迎私信咨询讨论学习,咨询讨论的方向不限于:地物分类/语义分割(如水体,云,建筑物,耕地,冬小麦等各种地物类型的提取),变化检测,夜光遥感数据处理,目标检测,图像处理(几何矫正,辐射矫正(大气校正),图像去噪等),遥感时空融合,定量遥感(土壤盐渍化/水质参数反演/气溶胶反演/森林参数(生物量,植被覆盖度,植被生产力等)/地表温度/地表反射率等反演)以及高光谱数据处理等领域以及深度学习,机器学习等技术算法讨论,以及相关实验指导/论文指导,考研复习等多方面。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1978725.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一刷代码随想录(动态规划2)

62.不同路径 题意: 一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为 “Finish” )。 问总共有多少…

我的面包多

我的面包多主页:https://mbd.pub/o/author-bGubnGpq 欢迎咨询。

JavaSE面试篇章——一文干破Java集合

文章目录 Java集合——一文干破集合一、集合的理解和好处1.1 数组1.2 集合 二、集合的框架体系三、Collection接口和常用方法3.1 Collection接口实现类的特点3.2 Collection接口遍历元素方式1-使用Iterator(迭代器)3.2.1 基本介绍3.2.2 迭代器的执行原理3.2.3 Iterator接口的方…

数据库典型例题2-ER图转换关系模型

1.question solution: 2.做题步骤 一些解释&#xff1a; <1弱实体把强属性的主键写进去&#xff0c;指向强属性。eg:E6_A13指向E5_A13 <21:1&#xff0c;1:n&#xff0c;m:n&#xff1a;将完全参与的一方&#xff08;双线&#xff09;指向另一方&#xff0c;并将对方的…

AutoCAD ObjectArx二次开发(三) 创建MFC界面

主题&#xff1a;本章节主要介绍在ObjectARX项目中如何使用MFC界面进行交互操作&#xff0c;具体采用模态对话框的形式。 一、创建MFC的对话框 在项目中添加新项&#xff0c;选择MFC类&#xff0c;点击确定按钮&#xff0c;如下图所示。 然后会出现下图界面&#xff0c;填写类…

苹果应用程序清理卸载工具:App Cleaner Uninstaller Pro for Mac

App Cleaner & Uninstaller Pro 是一款专为 Mac OS X 操作系统设计的应用程序清理和卸载工具。这款软件的主要功能是帮助用户彻底删除不需要的应用程序、插件和残留文件&#xff0c;从而释放磁盘空间并提高系统性能。 特点和优势&#xff1a; 彻底卸载应用程序&#xff1a;…

【软件设计书】详细设计说明书和概要设计说明书(Word原件直接套用)

系统详细设计说明书案例&#xff08;直接套用&#xff09; 1.系统总体设计 2.性能设计 3.系统功能模块详细设计 4.数据库设计 5.接口设计 6.系统出错处理设计 7.系统处理规定 软件开发全文档下载&#xff08;下面链接或者本文末个人名片直接获取)&#xff1a;本文末个人名片直接…

【C语言】文件操作(下)

文章目录 前言1. 文件的读和写2. 文件的顺序读写2.1 顺序读写函数的介绍2.1.1 fgetc 和 fputc2.1.2 fgets 和 fputs 3. 文件缓冲区4. 总结 前言 在之前文件操作&#xff08;上&#xff09;和文件操作&#xff08;中&#xff09;的文章中&#xff0c;我从为什么要使用文件再到文…

RabbitMQ高级特性 - 生产者消息确认机制

文章目录 生产者消息确认机制概述confirm 代码实现return 代码实现 生产者消息确认机制 概述 为了保证信息 从生产者 发送到 队列&#xff0c;因此引入了生产者的消息确认机制. RabbitMQ 提供了两种解决方案&#xff1a; 通过事务机制实现.通过发送确认机制&#xff08;confi…

CPU利用率100%该怎么办

1 节拍率 Linux 作为一个多任务操作系统&#xff0c;将每个 CPU 的时间划分为很短的时间片&#xff0c;再通过调度器轮流分配给各个任务使用&#xff0c;因此造成多任务同时运行的错觉。 为了维护 CPU 时间&#xff0c;Linux 通过事先定义的节拍率&#xff08;内核中表示为 H…

AI大模型定级体系

前言&#xff1a;一直以来人们对通用人工智能&#xff08;AGI&#xff09;的定义始终缺乏一个具体的衡量标准&#xff0c;而现在OpenAI已创建了一套分级系统。 AI大模型定级 OpenAI对于其大模型的定级有一个独特的分级体系&#xff0c;旨在描述其人工智能系统的发展阶段以及距…

网络安全埋头干活,也要抬头看路

24年的Hvv大家干的正是热火朝天&#xff0c;也有的干的无可奈何&#xff0c;确实Hvv的核心其实是在Hvv前的准备阶段&#xff0c;Hvv中可能更多的是盯监控。 7月份我也出了两趟差&#xff0c;看了一下在Hvv项目上的小伙伴&#xff0c;30%的时间是在处理误报&#xff0c;60%的时…

51 for 循环与 while 循环

Python 主要有 for 循环和 while 循环两种形式的循环结构&#xff0c;多个循环可以嵌套使用&#xff0c;并且还经常和选择结构嵌套使用来实现复杂的业务逻辑。 while 循环一般用于循环次数难以提前确定的情况&#xff0c;当然也可以用于循环次数确定的情况。 for 循环一般用于…

共享`pexlinux`数据文件的网络服务

实验环境准备&#xff1a; 1.红帽7主机 2.要全图形安装 3.配置网络为手动&#xff0c;配置网络可用 4.关闭vmware DHCP功能 一、kickstart自动安装脚本制作 1.安装图形化生成kickstart自动脚本安装工具 2.启动图形制作工具 3.图形配置脚本 这里使用的共享方式是http&#xff0…

SpringBoot + Vue + ElementUI 的人力资源管理系统-附项目源码与配套文档

摘 要 在如今这个人才需求量大的时代&#xff0c;各方企业为了永葆企业的活力与生机&#xff0c;在不断开 拓进取的同时&#xff0c;又广泛纳用人才&#xff0c;为企业的长久发展奠定了基础。于是&#xff0c;各个企业与部 门机构&#xff0c;都不可避免地会接触到人力资源管理…

微信小程序之behaviors

目录 概括 Demo演示 进阶演示 1. 若具有同名的属性或方法 2. 若有同名的数据 3. 若有同名的生命周期函数 应用场景 最后 属性&方法 组件中使用 代码示例&#xff1a; 同名字段的覆盖和组合规则 概括 一句话总结: behaviors是用于组件间代码共享的特性, 类似一…

03 RabbitMQ:HelloWorld

03 RabbitMQ&#xff1a;HelloWorld 1. 目标2. 实现2.1. 新建Spring Boot 项目2.1.1. 新建生产者&#xff08;producer&#xff09;项目2.1.2. 新建生产者&#xff08;consumer&#xff09;项目 2.2. 导入依赖2.3. 代码2.3.1. 发送消息&#xff08;producer&#xff09;2.3.2. …

TiKV Raft 快照全流程丨TiKV 源码解读(二十二)

导读 TiKV 是一个支持事务的分布式 Key-Value 数据库&#xff0c;目前已经是 CNCF 基金会的顶级项目。它通过 Raft 协议实现数据的高可用性和强一致性&#xff0c;是 TiDB 分布式数据库系统的重要组成部分。本文作为 TiKV 源码解读系列的增补&#xff0c;详细介绍了 TiKV 8.2.…

2024华数杯C题保姆级分析完整思路+代码+数据教学

2024华数杯C题保姆级分析完整思路代码数据教学 C题题目&#xff1a;老外游中国 接下来我们将按照题目总体分析-背景分析-各小问分析的形式来 1 总体分析&#xff1a; 题目要求本题目基于中国境内旅游景点数据&#xff0c;旨在通过数学建模解决外国游客在中国旅游时可能遇到的…

安装pytorch GPU方法

参考全网最详细的安装pytorch GPU方法&#xff0c;一次安装成功&#xff01;&#xff01;包括安装失败后的处理方法&#xff01;-CSDN博客 整体来看&#xff0c;一共下面三个安装步骤&#xff1a; 显卡驱动&#xff08;nvidia-smi&#xff09;-》显卡深度学习驱动&#xff08…