开源多波束前视声呐目标识别数据集

news2024/11/16 23:39:20

        鉴于水下实验的高成本,高专业性,高复杂度的情况,开源水下数据集一直较为稀少。拥有数据的研究机构基本上也只限于自身使用。虎鲸开源计划致力于构建一个开放的实验平台,实验场地、硬件、软件、数据均在开源开放的范畴内。虎鲸开源计划期望能改善当前水下研究的条件,降低水下研究的门槛,促进水下研究的发展。

      目前我们团队在虎鲸开源计划中开源了一个多波束前视声呐目标识别数据集UATD(Underwater Acoustic Target Detection)。数据集含10类目标,共9200张带标注的声呐图像。同时,数据集相关文章已发表于《Scientific Data》杂志,欢迎广大研究爱好者关注使用。另外不得不吐槽一下,杂志排版工作是印度团队做的,实在是太丑了,三哥真的不靠谱。我个人在arXiv上的版本链接我也会一并列出。文章doi如下:

A Dataset with Multibeam Forward-Looking Sonar for Underwater Object Detection | Scientific DataMultibeam forward-looking sonar (MFLS) plays an important role in underwater detection. There are several challenges to the research on underwater object detection with MFLS. Firstly, the research is lack of available dataset. Secondly, the sonar image, generally processed at pixel level and transformed to sector representation for the visual habits of human beings, is disadvantageous to the research in artificial intelligence (AI) areas. Towards these challenges, we present a novel dataset, the underwater acoustic target detection (UATD) dataset, consisting of over 9000 MFLS images captured using Tritech Gemini 1200ik sonar. Our dataset provides raw data of sonar images with annotation of 10 categories of target objects (cube, cylinder, tyres, etc). The data was collected from lake and shallow water. To verify the practicality of UATD, we apply the dataset to the state-of-the-art detectors and provide corresponding benchmarks for its accuracy and efficiency.https://doi.org/10.1038/s41597-022-01854-w

https://doi.org/10.48550/arXiv.2212.00352https://doi.org/10.48550/arXiv.2212.00352

      在此简要说一下我们数据集的特色,详细情况还请直接阅读文章。

      我们数据集最大的特色为提供前视声呐原始的回波强度数据。前视声呐输出的信息以距离和方位角为维度,为了满足人类的视觉习惯,厂商提供的前视声呐软件通常会对数据做一些处理,包括滤波和伪色彩等,最特殊的是输出图像是扇形处理后的。如下图:

      处理后的声呐图像更方便人类操作员辨认目标,但滤波和伪色彩处理可能会导致部分数据丢失,扇形的图像在标注时可能会引入多余的信息(扇形区域外),这对于计算机目标识别算法的研究来说都是不友好的。

      诚然,目前还是存在一些开源前视声呐数据集的,但这些数据集一来都是处理过的,二来数据集规模也较小,具体情况请参考文章。我们的数据与其它数据集数据对比如下图:

      我们为历届全国水下机器人大赛(UPRC)线上赛目标识别赛声学赛道提供赛题数据。2022年的比赛地址如下:DC竞赛——领先的大数据与人工智能竞赛平台DataCastle(DC竞赛)是国内领先的大数据与人工智能竞赛平台,提供在线编程工具DCLab、数据集、开源分享和在线课程,积累20万数据科学领域用户。https://challenge.datacastle.cn/v3/cmptDetail.html?id=680

      我们在大连金石滩和茂名好心湖等地采集了10类目标的数据,从中筛选质量较好的数据进行标注,最终选取9200张形成数据集。10类目标及其尺寸(m)如下图:

      数据集分3个压缩文件:"UATD_Training.zip", "UATD_Test_1.zip", "UATD_Test_2.zip"。每个压缩文件内有两个文件夹,image文件夹存声呐图像,annotation文件夹存标注文件。Trainning压缩文件内含7600对数据(图像加标注),其余两个压缩文件内含800对数据。

      一对数据范例如下图所示:

      我们给出了采集数据时声呐的工作状态信息,包括量程,开角,声速,工作频率等,因为我们认为这些信息对声呐目标识别是有帮助的。具体标注文件中各参数请参考文章。

      由于声呐数据的特殊性,我们还开发了一款用于声呐图像标注软件OpenSLT。软件的具体信息请参考文章。软件也打包为"UATD_OpenSLT.zip"和数据集一起开源了,里面的README.md可视为用户手册。

      数据集经历了三次大赛的验证,当然我们也用一些通用的识别算法框架对数据集进行了验证。

      文章中的数据集的链接地址是在figshare上,对国内平台不太友好。我们也将数据集上传到了虎鲸开源平台,但平台上的数据集是我们的早期版本,不是文章的配套版本,但差异不大,仅删除了一些无用的标注的参数项,以及一些参数名称的修正使之更准确。平台地址:

海洋空间环境感知(虎鲸)开源计划 - OpenI - 启智AI开源社区提供普惠算力!OpenI启智开源社区旗下的一站式AI开发协作平台,汇聚人工智能开源项目;提供代码托管、数据共享、模型训练等AI开发流水线功能;用户可在线使用鹏城实验室搭建的鹏城云脑、中国算力网的普惠算力,包含GPU、NPU等多样化加速资源。https://openi.pcl.ac.cn/OpenOrcinus_orca项目名为URPC2022_sonar_images_dataset。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/63715.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring Cloud(十四):微服务灰度发布 --- Discovery

灰度发布微服务全链路灰度全链路灰度设计思路 标签路由节点打标流量染色分布式链路追踪 ThreadLocal流量治理平台 Nacos 配置中心 全链路灰度实现Discovery使用 一、父pom引入Discovery二、Gateway 引入 — 网关 discovery-plugin-strategy-starter-gateway三、微服务 引入 — …

[附源码]JAVA毕业设计论文管理系统(系统+LW)

[附源码]JAVA毕业设计论文管理系统(系统LW) 环境项配置: Jdk1.8 Tomcat8.5 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术:…

Allegro如何使用快捷键快速切换层面操作指导

Allegro如何使用快捷键快速切换层面操作指导 Allegro可以用快捷键快速切换层面,比如在command下方输入数字1,可以自动打开top层 具体操作如下 打开系统属性,选择环境变量 找到home的环境变量的路径是哪里 找到路径下的pcbenv文件夹 找到env文件 用记事本打开env文件…

自学软件测试,学到什么程度可以出去找工作?

其实初级测试学的东西并不多,如果脱产学习的话2~3个月差不多就能简单入门。 另外不要担心,初级测试对于Python/Java编程,自动化测试,性能测试这些都是初步的了解和学习。如果说要深度掌握,那确实是还需要很多时间。 …

【pen200-lab】10.11.1.10

pen200-lab 学习笔记 【pen200-lab】10.11.1.10 🔥系列专栏:pen200-lab 🎉欢迎关注🔎点赞👍收藏⭐️留言📝 📆首发时间:🌴2022年12月5日🌴 🍭作者水平很有限,如果发现错误,还望告知,感谢! 文章目录 pen200-lab 学习笔记信息收集拓展信息收集 只开放了…

61张图,图解Spring事务,拆解底层源码

下面我会简单介绍一下 Spring 事务的基础知识,以及使用方法,然后直接对源码进行拆解。 不 BB,上文章目录。 ​1. 项目准备 需要搭建环境的同学,代码详见:https://github.com/lml200701158/program_demo/tree/main/spr…

09-18-k8s-二进制方式搭建

09-k8s-二进制方式搭建: 1、创建多台虚拟机,安装Linux操作系统 (1)一台或多台机器,操作系统 CentOS7.x-86_x64 (2)硬件配置:2GB 或更多 RAM,2 个 CPU 或更多 CPU&…

大数据_数据中台_数据汇聚联通

目录 一、数据采集、汇聚的方法和工具 1、线上行为采集 2、线下行为采集 3、互联网数据采集 4、内部数据汇聚 二、数据交换产品 1、数据源管理 2、离线数据交换 3、实时数据交换 三、数据存储的选择 1、在线与离线 2、OLTP与OLAP 3、存储技术 构建企业级的数据中台…

Java swing(GUI) mysql实现的仓库进销存管理系统源码+运行教程

今天给大家介绍下由Java swing mysql实现的一款仓库库存管理系统,该系统实现了基本的仓库进退货管理、用户管理等操作,主要涉及的知识点有:Java swing awt界面编程、数据库的基本操作(增删改查),多线程等&a…

第十二章:synchronized与锁升级

相关面试题锁优化背景Synchronized 锁性能变化jdk5 以前复习:为什么任意一个对象都能成为锁?jdk6 之后synchronized的种类以及锁升级流程锁升级流程无锁偏向锁是什么作用小总结偏向锁的持有偏向锁 JVM 参数说明多线程环境下总结轻量级锁轻量级锁的获取代…

Java成员方法的声明和调用

声明成员方法可以定义类的行为,行为表示一个对象能够做的事情或者能够从一个对象取得的信息。类的各种功能操作都是用方法来实现的,属性只不过提供了相应的数据。 一个完整的方法通常包括方法名称、方法主体、方法参数和方法返回值类型,其结…

6-脱氧-β- L -半乳吡喃糖基鸟苷 5′-二磷酸,Guanosine 5‘-diphospho-fucose,GDP-BETA-L-FUCOSE

产品名称:6-脱氧-β- L -半乳吡喃糖基鸟苷 5′-二磷酸,GDP-L-岩藻糖,GDP-L-FUCOSE二钠盐 英文名称:Guanosine 5-diphospho-fucose,GDP-BETA-L-FUCOSE,GDP-L-Fuc.2Na CAS号:148296-47-3 英文同义词:Guanos…

【深度学习】常用算法生成对抗网络、自编码网络、多层感知机、反向传播等讲解(图文解释 超详细)

觉得有帮助请点赞关注收藏~~~ 一、生成对抗网络GAN Generative Adversarial Network 两个组件组成:一个生成器,用于生成虚拟数据,另一个是鉴别器,用于(GAN)生成式深度学习算法,可创建类似于训练数据的新数据实例。 G…

2022-kaggle-nlp赛事:Feedback Prize - English Language Learning

文章目录零、比赛介绍0.1 比赛目标0.2 数据集0.3 注意事项一、设置1.1 导入相关库1.2 设置超参数和随机种子1.3 启动wandb二、 数据预处理2.1 定义前处理函数,tokenizer文本2.2 定义Dataset,并将数据装入DataLoader三、辅助函数四、池化五、模型六、定义…

jmeter-事务控制器与并发控制器与if控制器项目实践

前言 在做性能压测的时候,除了做单接口这种基准压测,我们还需要多接口串联的混合场景,比如打开小程序展示的首页,购物下单时的结算页。如果这些接口都是串行的,那就非常简单了,仅仅只需要创建事务控制器&a…

【GD32F427开发板试用】+rtt-thread nano+finsh极简开发

本篇文章来自极术社区与兆易创新组织的GD32F427开发板评测活动,更多开发板试用活动请关注极术社区网站。作者:理想三旬 引言 在工作闲暇之际,逛逛论坛,无意间看到GD的试用活动,一如既往的积极,在官方还没发…

Linux 驱动的内核适配 - 方法

原生与野生 Linux 的驱动代码大致可分为两种:一种是已经进入 mainline 的,当内核 API 变化时,会被同步地修改;还有一种是 out-of-tree 的,需要用一套驱动代码去适配不同版本的内核。由于内核 API 持续变动的特性&…

带你实现react源码的核心功能

React 的几种组件以及首次渲染实现React 更新机制的实现以及 React diff 算法 React 的代码还是非常复杂的,虽然这里是一个简化版本。但是还是需要有不错的面向对象思维的。React 的核心主要有一下几点。 虚拟 dom 对象(Virtual DOM)虚拟 d…

RabbitMQ_消息确认机制

消息确认机制分为消息发送确认机制与消息消费确认机制 消息发送确认机制 消息发送确认机制:消息由producer发送后,确认其是否到达broker,又是否被exchange转发至对应queue的机制 该机制分为两部分:producer---broker&#xff0c…

Android 性能优化之内存优化——重识内存

我们知道,手机的内存是有限的,如果应用内存占用过大,轻则引起卡顿,重则导致应用崩溃或被系统强制杀掉,更严重的情况下会影响应用的留存率。因此,内存优化是性能优化中非常重要的一部分。但是,很…