可见光遥感目标检测(一)任务概要介绍

news2024/11/25 22:36:59
前言  本篇开始对遥感图像的目标检测进行介绍,介绍了其目标前景、数据集以及评价指标。

本教程禁止转载。同时,本教程来自知识星球【CV技术指南】更多技术教程,可加入星球学习。

Transformer、目标检测、语义分割交流群

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

遥感图像介绍

本文介绍的是可见光遥感图像上的目标检测,首先我们来了解一下什么是遥感图像,遥感图像,也称为高分辨率遥感图像(Very High-resolution Imagery),但是在遥感图像的领域内,除了可见光遥感图像之外,还有其他两种遥感图像,一种是高光谱遥感图像(Hyperspectral Imagery),一种是雷达遥感图像(Synthetic Aperture Radar Imagery),其分类依据是根据成像的介质不同来进行分类的。我们主要用到的是高分辨率遥感图像,接下来说以下可见光遥感图像的成像优点。第一,其成像方式更符合我们人类眼睛成像方式;第二,其分辨率超高,能以更精细的分辨率产生地球表面的全色多光谱图像;第三,基于成像特点,对于进行图像分析(检测、分割等)十分友好。用一张图片直观的了解一下三种遥感图像的区别:

 图1 a图是可见光,b图是高光谱,c图是雷达


遥感图像特点及应用前景

遥感图像图像特点主要包含如下几个方面:

  1. 背景复杂,目标信息少,背景信息多。

  2. 图像中物体的方向各不相同,这点在水平视角中不存在。

  3. 基于遥感图像的拍摄尺度高,导致图像中有较多的小物体

  4. 目标尺度多样性复杂,一张图片中可能会同时存在飞机与汽车,明显飞机的尺度远远高于汽车的尺度。

  5. 图像中目标密集程度高,一张图片中可能会有多个目标,比如露天停车场。

上面这些特点,也是遥感图像算法设计中需要突出解决的问题

简单总结遥感图像应用,我们从军用与民用的角度划分:

  1. 军用角度:舰船、飞机的检测、定位、追踪。

  2. 民用角度:港口调度、资源勘探、森林防护。


可见光遥感图像目标检测

目标检测是一个比较“古老”的话题了,它的分水岭是在2014年,以前的方法我们不做介绍,这里们说一下14年以后的深度学习具有代表性的算法。主流分为两类算法 — 一阶段检测与二阶段检测。二阶段比较早出现的,代表的算法有R-CNN、  FAST-RCN、  SPP-NE、 FASTER-RCNN。一阶段出现较晚,代表算法有YOLOV1 ------ YOLOV7系列等,后续还有anchor free系列的方法,Query-based以Transformer为代表的方法等等。

旋转目标检测(Oriented Object Detect)可以看作是目标检测的一个子集,它与通用的目标检测最大的不同之处在于我们需要在定位目标位置及其宽高的基础上还需要额外回归出其朝向。最常见的是在遥感图像中的目标检测任务,通过卫星、航空航天器等拍摄的图片中存在各种带有方向属性的目标比如船只,汽车等。由于这些目标在遥感图像中尺寸一般较小,传统的矩形框很难贴合满足我们的要求,这个时候就需要加上朝向来得到一个更为贴合的矩形框。


数据集

深度学习离不开数据集,只有大规模的数据才能得到更优秀的模型,下面介绍一下关于可见光遥感图像的数据集。

  1. DOTA系列数据集:2018年武汉大学首发DOTA1.0版本的数据集共分为15个类别,采用定向边界框的标注方式。DOTA数据集1.5版本共分为16个类别,DOTA数据集2.0版本共分为18个类别,DOTA数据集在数据的类别与质量上都明显优于其他遥感方向的数据集。随着版本的提升检测的挑战性越来越大,其中顶会论文使用1.0版本与1.5版本居多,鲜有用2.0版本。

  2. HRSC2016数据集:西北工业大学发布的数据集,包含从几个著名港口收集的大量条形定向物体,外观不同,用于船舶识别。整个数据集有1061幅图像,从300 × 300到1500 × 900不等。

  3. UCAS-AOD数据集:拥有1510张图片,其中510张汽车图片和1000张飞机图片。总共有14,596个实例。整个数据集按照5:2:3的比例随机分为755张用于训练的图像、302张用于验证的图像和453张用于测试的图像。所有图像的大小约为1280 × 659。

  4. DIOR数据集:含23463张图片和190288实例,覆盖20种目标,大小为800×800,比DOTA数据集更大!这20个对象类是飞机、机场、棒球场、篮球场、桥梁、烟囱、水坝、高速公路服务区、高速公路收费站、港口、高尔夫球场、地面田径场、天桥、船舶、体育场、储罐、网球场、火车站、车辆和风磨。

  5. LEVIR数据集:由大量 800 × 600 像素和0.2m〜1.0m /像素的高分辨率Google Earth图像和超过22k的图像组成。LEVIR数据集涵盖了人类居住环境的大多数类型地面特征,例如城市,乡村,山区和海洋。数据集中未考虑冰川,沙漠和戈壁等极端陆地环境。数据集中有3种目标类型:飞机,轮船(包括近海轮船和向海轮船)和油罐。所有图像总共标记了11k个独立边界框,包括4,724架飞机,3,025艘船和3,279个油罐。数据集图像简略观看 提供了四张图片,2张来自DOTA数据集,2张来自HRSC2016数据集

    图2 来自HRSC2016数据集

        

不在贴放更多图片,提供了数据集的下载地址,有兴趣自己下载。

LEVIR数据集下载地址:

https://pan.baidu.com/s/1eUAq2PszdHeE2VSG3q5cw 

提取码: j9jp

DOTA数据集下载地址:

https://pan.baidu.com/s/1o4Tsx7hgh2a2O73kxJRVLg 

提取码: yvi1

UCAS-AOD数据集下载地址:

https://pan.baidu.com/s/1Poo0zEHTHDfBTnKPb5YTCg 

提取码: 7zsi

HRSC2016数据集下载地址:

https://pan.baidu.com/s/1Sz2aohknDVCYrnXcnPQuaQ 

提取码: 7fx1


常见评估指标

旋转目标检测的评估指标与通用目标检测指标基本一致采用AP50mAP来评估,需要注意的是计算IOU的时候要使用旋转框来计算交并比。

另外在实验分析中我们也可以将角度偏小的水平框和角度偏大的旋转框分别评估AP来判断当前算法是否对大的角度目标有很好的性能。

 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群:470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。

模型部署交流群:732145323。用于计算机视觉方面的模型部署、高性能计算、优化加速、技术学习等方面的交流。

其它文章

上线一天,4k star | Facebook:Segment Anything

3090单卡5小时,每个人都能训练专属ChatGPT,港科大开源LMFlow

Efficient-HRNet | EfficientNet思想+HRNet技术会不会更强更快呢?

实践教程|GPU 利用率低常见原因分析及优化

ICLR 2023 | SoftMatch: 实现半监督学习中伪标签的质量和数量的trade-off

目标检测创新:一种基于区域的半监督方法,部分标签即可(附原论文下载)

CNN的反击!InceptionNeXt: 当 Inception 遇上 ConvNeXt

神经网络的可解释性分析:14种归因算法

无痛涨点:目标检测优化的实用Trick

详解PyTorch编译并调用自定义CUDA算子的三种方式

深度学习训练模型时,GPU显存不够怎么办?

CV各大方向专栏与各个部署框架最全教程整理

计算机视觉入门1v3辅导班

计算机视觉各个方向交流群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/525621.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

机器学习13(正则化)

文章目录 简介正则化经验风险和结构风险过拟合正则化建模策略 逻辑回归逻辑回归评估器 练习评估器训练与过拟合实验评估器的手动调参 简介 这一节详细探讨关于正则化的相关内容,并就 sklearn 中逻辑回归(评估器)的参数进行详细解释由于 skle…

javaweb项目实战之myBlog

项目简介 技术栈: Java Mysql Html Ajax Css JS Json 项目说明 :项目使用maven创建,使用MVC架构模式 表示层:通俗讲就是展现给用户的界面和控制器层Servlet,接受请求、封装数据、调用业务 逻辑层,响…

libevent高并发网络编程 - 05_libevent实现http客户端

文章目录 1 http客户端相关的APIevhttp_uri_parse()evhttp_uri_get_scheme()evhttp_uri_get_port()evhttp_uri_get_host()evhttp_uri_get_path()evhttp_uri_get_query()evhttp_connection_base_bufferevent_new()evhttp_request_new()evhttp_make_request()evhttp_request_get_…

刷题刷题,开心

一先来每日一题 在一个仓库里,有一排条形码,其中第 i 个条形码为 barcodes[i]。 请你重新排列这些条形码,使其中任意两个相邻的条形码不能相等。 你可以返回任何满足该要求的答案,此题保证存在答案。 示例 1: 输入&…

基于html+css图展示59

准备项目 项目开发工具 Visual Studio Code 1.44.2 版本: 1.44.2 提交: ff915844119ce9485abfe8aa9076ec76b5300ddd 日期: 2020-04-16T16:36:23.138Z Electron: 7.1.11 Chrome: 78.0.3904.130 Node.js: 12.8.1 V8: 7.8.279.23-electron.0 OS: Windows_NT x64 10.0.19044 项目…

Prompt learning 教学[最终篇]:Chatgpt使用场景推荐、优秀学习资料推荐、AI工具推荐

Prompt learning 教学[最终篇]:Chatgpt使用场景推荐、优秀学习资料推荐、AI工具推荐 1.chatgpt使用场景推荐 各位应该在各种平台看到不少可以尝试使用的场景,我这里仅收录: 有意思的场景:一般比较垂直或者小众,或者出…

CobaltStrike项目实战

环境介绍 模拟内网有三台机器:WEB、PC和DC。 WEB服务器有两个网络适配器,适配器1处于NAT模式用于连接外网,适配器2用于内网。 PC和WEB服务器一样,有两个适配器,能够同时访问外网和内网;DC作为域控制器&…

神经网络的训练过程、常见的训练算法、如何避免过拟合

神经网络的训练是深度学习中的核心问题之一。神经网络的训练过程是指通过输入训练数据,不断调整神经网络的参数,使其输出结果更加接近于实际值的过程。本文将介绍神经网络的训练过程、常见的训练算法以及如何避免过拟合等问题。 神经网络的训练过程 神…

henan Problem E. 矩阵游戏

hunan Problem E. 矩阵游戏 Attachments - 2023 CCPC Henan Provincial Collegiate Programming Contest - Codeforces 思路: 我们考虑用dp,定义f[i][j][k],代表从1,1走到i,j并且使用k次变换操作能够获得的最大 价值,那么类似于01背包,接下…

分布式数据库集成解决方案2

分布式数据库集成解决方案2 扩展阅读内部结构1.表空间(TABLESPACE) # 摘要 : 本文讨论了某公司发货系统的分布式数据库集成解决方案。该公司由于业务的发展,要在另三个城市设立货仓进行发货。为此,需要增加原先的MIS系统实现这一功…

javaweb系列-js函数、数组、字符串

1.4 函数 JavaScript中的函数被设计为执行特定任务的代码块&#xff0c;通过关键字function来定义。JavaScript中定义函数有2种语法。 第一种方法&#xff1a; <script>//定义function add(a,b){return a b;}//调用var a add(1,2);alert(a); </script> 第二种方…

【LeetCode】204.计数质数

204.计数质数&#xff08;中等&#xff09; 思路 埃拉托斯特斯筛法&#xff08;简称埃氏筛法&#xff09;&#xff0c;适用于「判断一个整数是否是质数」&#xff0c;该方法可以在判断一个整数 n 时&#xff0c;同时判断所有小于 n 的整数。 从 1 到 n 进行遍历&#xff0c;假…

内网渗透之权限维持-域控后门-SSPHOOKDSRMSIDSkeleton-Key

权限维持-基于验证DLL加载-SSP 方法一:但如果域控制器重启&#xff0c;被注入内存的伪造的SSP将会丢失。 mimikatz privilege::debug misc::memsspC:\Windows\System32\mimilsa.log 记录登录的账号密码 方法二:使用此方法即使系统重启&#xff0c;也不会影响到持久化的效果…

Plus and Multiply

题目&#xff1a; 题意解析&#xff1a; 有一个无穷大的正整数集合 S&#xff0c;该集合按下面所述方法生成&#xff1a; 数字 1 在集合 S 中。 若数字 x 在该集合中&#xff0c;那么数 xa 和数 xb 均在集合 S 中。&#xff08;其中 a 与 b 为给定常数&#xff09; 现在给出…

快速创作攻略:10分钟让你实现从文章撰写到多平台发布,支持公众号、B站、微博、知乎、头条等20种

快速创作攻略&#xff1a;10分钟让你实现从文章撰写到多平台发布&#xff0c;支持公众号、B站、微博、知乎、头条等20种 很多文字内容创作者&#xff0c; 想分享一个idea&#xff0c; 想介绍一个工具&#xff0c; 想分享经验或知识。 常碰到以下难题&#xff1a; 有个灵感但是要…

神经网络的基本概念、架构和训练方法

神经网络是一种由多个神经元按照一定的拓扑结构相互连接而成的计算模型。其灵感来自于人类大脑中神经元之间的相互作用。 在过去的几十年里&#xff0c;神经网络一直是人工智能领域中的热门研究方向之一。随着深度学习的兴起&#xff0c;神经网络的应用越来越广泛。本文将详细…

目标检测经典论文精读-R-CNN

目标检测经典论文精读-R-CNN R-CNN基本原理产生候选框-Selective Search 论文链接&#xff1a; https://www.cv-foundation.org/openaccess/content_cvpr_2014/papers/Girshick_Rich_Feature_Hierarchies_2014_CVPR_paper.pdf 论文技术报告链接&#xff1a; https://arxiv.org/…

无热图不组学!高阶文献热图R语言绘制小专场拿捏

一、概述 近在阅读近五年的一区高分的机器学习文献&#xff0c;其中有一种图出现频率特别高——热图。《Machine Learning and the Future of Cardiovascular Care: JACC State-of-the-Art Review》 《Comparison of Machine Learning Methods for Predicting Outcomes After…

阿里云服务器可以干嘛?ChatGPT等12件小事

拥有一台阿里云服务器可以用来做什么&#xff1f;ChatGPT最近很火&#xff0c;可以在云服务器上部署本地ChatGPT&#xff0c;搭建个人博客、企业网站&#xff0c;学习Linux、跑Python爬虫等&#xff0c;阿里云服务器网分享使用阿里云服务器用途的12件小事&#xff1a; 阿里云服…

cda星型模式、星座模式和雪花模式是什么鬼,怎么记

一、星型模式、雪花模式、星座模式的英文 星型模式 star schema 雪花模式 snowflake schema 二、形象记忆三种模式 星型模式&#xff0c;就像海绵宝宝里面的派大星&#xff0c;它长了多只手&#xff0c;每只手都抓着一个人。注意&#xff01;只有一个派大星&#xff08;只有…