图像处理数据集

news2025/2/23 2:26:47

BSDS500

Berkeley Segmentation Dataset 500 是第一个用于评估超像素算法的数据集。对于参数优化,使用了验证集。

500张数据集=200训练集train+100验证集val+200测试集test
每张图像有 5 个不同的高质量地面真值分割(groundTruth,是.mat文件)

1.从这里下载BSDS500数据集

2.把BSR/BSDS500/data 提取到data/BSDS500(覆盖data/BSDS500/images和data/BSDS500/csv_groundTruth所提供的例子)。
 
还要注意,之后有三个文件夹:groundTruth、csv_groundTruth和images。

3.在lib_tools/bsds500_convert_script.m中,调整目录的路径,即正确设置BSDS500_DIR。

4.Run the script. 这需要花费一些时间。

说明还可以在 lib_tools/bsds500_convert_script.m中查看。

NYUV2

b83473e637a64c1da8f9c52b34ba3683.png

 NYU Depth Dataset V2=1449张带有预处理深度的图像。ps.室内场景数据集

该数据集提供了带有实例标签的语义基础真值分段。按照Ren和Bo的做法,对地面实况进行了预处理,以去除未标记的小段。

(随机选择作为)验证集199张+399张测试集

具有的特点:

1、1449个密集标记的RGB和深度图像对齐对

2、来自3个城市的464个新场景

3、407,024个新的未标记帧

4、每个对象都标有一个类和一个实例号(cup1,cup2,cup3等)

 

数据集包含几个组成部分:

Labeled Dataset(标记数据集:是原始视频数据的子集它由成对的RGB和深度帧组成,这些帧已同步并为每个图像标注了密集标签。此数据还包含了一组预处理的深度图,其缺失值已使用Levin等人的着色方案进行了填充。与raw数据集不同的是,带有标签的数据集作为Matlab .mat文件提供,具有以下变量:...(网站链接里写了)

Raw Dataset(原始数据集:Kinect提供的原始rgb,深度和加速度计数据。RGB和深度相机的采样率介于20到30 FPS(随时间变化)。当帧不同步时,每个RGB,深度和加速度计文件的时间戳都作为每个文件名的一部分包含在内,可以使用工具箱中的get_synched_frames.m函数进行同步以产生连续的视频。

工具箱:matlab 工具箱有几个处理数据的有用函数。用于处理数据和标签的有用功能。

在对未标记的区域进行瘦身后,地面实况被转换为.csv文件。
转换后的数据集可在数据存储库中找到: davidstutz/superpixel-benchmark-data.

为了手动转换NYUV2数据集并提取使用的验证和测试子集,请使用lib_tools/nyuv2_convert.script.m

  1. 从这里下载数据集。确认下载的文件是:nyu_depth_v2_labeled.mat.
  2. 把数据放在 data/NYUV2/.中
  3. 确保 data/NYUV2 包含 nyuv2_test_subset.txt,
    nyuv2_train_subset.txt,
    nyuv2_test.txt ,
    nyuv2_train.txt.
  4. 在lib_tools/nyuv2_convert.script.m中,设置NYUV2_DIR指向data/NYUV2目录。
  5. Run the script. 这需要花费一些时间。

说明还可以在 lib_tools/nyuv2_convert.script.m中查看

SBD

斯坦福背景数据集(SBD)结合了几个数据集的715张图像。这些图像的大小、质量和场景各不相同。所提供的语义基础真实分割需要进行预处理,以保证连接成分。
(随机选择作为)验证集238张+477张测试集

groundTruth被转换为.csv文件。转换后的数据集可在数据存储库中获得: davidstutz/superpixel-benchmark-data.

要手动转换SBD并选择验证和测试图像,请遵循lib_tools/sbd_convert_script.m:

  1. 从这里 下载数据集
  2. 提取数据集,使数据/SBD包含两个文件夹:图像(images)和标签(labels.)。
  3. 确保 data/SBD 包含 sbd_test.txt 和sbd_train.txt.
  4. 在lib_tools/sbd_convert_script.m中,调整下面的变量SBD_DIR,以匹配data/SBD的路径。
  5. Run the script.

说明还可以在 lib_tools/sbd_convert_script.m中查看

 

SUNRGBD

SUNRGBD数据集包含10335幅图像,包括预处理的深度。

该数据集提供了语义上的地面真实分割,需要进行类似于NYUV2数据集的预处理。
(随机选择)验证集200+测试集400。也包括在NYUV2数据集中的图像被忽略了。

The ground truth was converted to .csv files. The converted dataset is available in the data repository: davidstutz/superpixel-benchmark-data.

To manually convert the dataset, follow lib_tools/sunrgbd_convert_script.m:

  1. Download the SUNRGBD dataset from here.
  2. Make sure to download both the SUNRGBD V1 dataset and the SUNRGBDtoolbox containing the annotations.
  3. From the SUNRGBDtoolbox extract SUNRGBD2dseg.mat and SUNRGBDMeta.mat to data/SUNRGBD.
  4. From the SUNRGBD V1 dataset extract all files into data/SUNRGBD; note that this may take quite some time! It might be wise to extract the contained directories (xtion, realsense, kv1, kv2) separately.
  5. In lib_tools/sunrgbd_convert_script.m, adapt ROOT_DIR to point to the data directory (i.e. the parent directory of the SUNRGBD directory).
  6. Run the script. Note that this may take some time and memory.

The instructions are also found in lib_tools/sunrgbd_convert_script.m.

 

Fash

The Fashionista dataset [7] contains 685 images with semantic ground truth segmentations. The ground truth segmentations were pre-processed to ensure connected segments. Validation set and training set of size 222 and 463, respectively, were chosen at random.

The ground truth needs to be converted to .csv files using the steps in lib_tools/fash_convert_script.m:

  1. Download the Fashionista dataset from here.
  2. Extract fashionista_v0.2.1.mat into data/Fash.
  3. Adapt the below variables to match the path where data/Fash can be found.
  4. Run the script. Note that this may take some time and memory.

 

位姿估计数据集:https://zhuanlan.zhihu.com/p/89951893

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/416578.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android 中的混音器 AudioMixer 实现分析

Android framework 的音频处理模库 libaudioprocessing (位于 frameworks/av/media/libaudioprocessing) 提供了混音器组件 AudioMixer,它主要用在 audioflinger 里,用来将多路音频源数据混音,以方便送进音频设备播放出来。 音频混音操作本身…

MyBatis(九)MyBatis小技巧

一、#{}和${} #{}:先编译sql语句,再给占位符传值,底层是PreparedStatement实现。可以防止sql注入,比较常用。 ${}:先进行sql语句拼接,然后再编译sql语句,底层是Statement实现。存在sql注入现象。…

第09章_异常处理

第09章_异常处理 讲师:尚硅谷-宋红康(江湖人称:康师傅) 官网:http://www.atguigu.com 本章专题与脉络 1. 异常概述 1.1 什么是生活的异常 男主角小明每天开车上班,正常车程1小时。但是,不出…

计网第五章.运输层—TCP流量控制与可靠传输

以下来自湖科大计算机网络公开课笔记及个人所搜集资料 目录一、流量控制死锁死锁的解决:二、超时重传时间的选择解决方案Karn算法三、可靠传输补充:其实TCP的流量控制,可靠传输,拥塞控制,都是围绕滑动窗口机制来实现的…

SpringBoot的统一功能处理

目录 1.统一用户的的登录权限校验 最开始的用户登录 Spring拦截器 2.统一数据返回格式 统一数据的返回格式意义 统一数据返回格式的实现 3.统一异常处理 在上篇博客中我介绍了Spring AOP的基础知识,这篇博客则是AOP的实践练习,通过借助AOP实现三个目标 1.统一用户登录权…

VContainer 初体验

IOC 控制反转 IOC 提供一个对象生成容器,在我们需要取得某个对象时,不再使用New关键字进行对象生成操作,而是通过IOC容器内部控制来获得对象。 使用这种思想方式,可以让我们无需关心对象的生成方式,只需要告诉容器我需…

xmanager连接linux桌面教程 xmanager连接之后黑屏

xmanager 是一款专业的远程服务器管理软件,但习惯了使用Windows系统下的桌面,一时会无法适应linux服务器的命令行界面。下面我就为大家介绍xmanager连接linux桌面教程,xmanager连接之后黑屏的相关内容,让大家在使用linux更加方便。…

node.js详解

文章目录1.Node.js1.1 Node.js 模块化1.2 模块暴露数据1.2.1 模块初体验1.2.2 暴露数据1.3.导入(引入)模块1.4 JavaScript引擎1.5 什么是Node.js1.6 BFF2.包管理工具2.1 npm2.1.1 npm 的安装2.1.2 npm 基本使用2.1.2.1 初始化2.1.2.2 搜索包2.1.2.2 下载安装包2.1.2.3 require …

java遍历字符串的方法

在 java中,我们需要遍历字符串,如何遍历呢?首先我们先了解一下遍历的概念: 在我们的计算机中,存储的都是二进制数据,为了方便存储和管理,我们把一段数据分成多个字符串。在 java中,遍…

BM36-判断是不是平衡二叉树

题目 输入一棵节点数为 n 二叉树,判断该二叉树是否是平衡二叉树。 在这里,我们只需要考虑其平衡性,不需要考虑其是不是排序二叉树 平衡二叉树(Balanced Binary Tree),具有以下性质:它是一棵空…

LabVIEW-簇数据类型

簇数据类似于 C 语言的结构体,创建时,首先将“簇”放置到前面板上: 然后放置簇内的元素,比如“数值输入控件”,当“簇框架”内边沿出现虚线框时,单击“数值输入控件”即可添加到簇中:在簇中也可以修改“数值…

常见网络协议汇总(一)

“网络协议”是指为完成特定的任务而制定的一套规则。网络协议通常用来表示数据传输中一组用于实现一个或多个OT模型级别的规则或规范。在通信时,网络协议定义了在通信时如何进行通信。今天海翎光电的小编就汇总了常见的网络协议,来一起看看。我们先回顾…

Linux基础IO(下)

Linux基础IO(下)FILE自己模拟实现fopen/fclose、fread/fwrite理解文件系统OS如何看待磁盘管理磁盘硬链接软连接ACM时间动态库和静态库见一见Linux下的库为什么要有库写一写库制作一个静态库制作一个动态库关于动静态库的一点小实验FILE 通过前面学习我们…

【SSM】Spring6(十二.Spring6集成MyBatis3.5)

文章目录1. 实现步骤2.具体实现2.1 准备数据库2.2 创建模块,引入依赖2.3 创建包2.4 创建Pojo类2.5 编写mapper接口2.6 编写Mapper配置文件2.7 编写service接口和service接口实现类2.8 编写jdbc.properties配置文件2.9 编写mybatis-config.xml配置文件2.10编写spring…

什么是数字“指纹”?

今天的网站收集有关访问者的大量信息,不仅用于广告、业务优化和用户体验,还用于安全目的。 除了 cookie 之外,网站还使用“指纹识别”来收集有关用户网络浏览器、硬件、设备配置、时区甚至行为模式的信息,以授权合法用户或取消对…

考虑可再生能源消纳的电热综合能源系统日前经济调度模型

目录 1 主要内容 模型示意图 目标函数 程序亮点 2 部分程序 3 程序结果 4 程序链接 1 主要内容 本程序参考文献《考虑可再生能源消纳的建筑综合能源系统日前经济调度模型》模型,建立了电热综合能源系统优化调度模型,包括燃气轮机、燃气锅炉、余热…

飞腾D2000 UOS下安装KVM虚拟机

其他的和x86环境都差不多,开了开发者模式后,virt-manager qemu-efi-aarch64 qemu-system 几个包补齐,启动libvirtd服务,查看日志,报以下日志, 4月 09 21:13:34 actionchen-PC systemd[1]: Starting Virtu…

SQL select总结(基于选课系统)

表详情: 学生表: 学院表: 学生选课记录表: 课程表: 教师表: 查询: 1. 查全表 -- 01. 查询所有学生的所有信息 -- 方法一:会更复杂,进行了两次查询,第一…

C语言实现扫雷教学

本篇博客会讲解,如何使用C语言实现扫雷小游戏。 0.思路及准备工作 使用2个二维数组mine和show,分别来存储雷的位置信息和排查出来的雷的信息,前者隐藏,后者展示给玩家。假设盘面大小是99,这2个二维数组都要开大一圈…

JavaDS——数据结构易错选择题总结

1. 下列关于线性链表的叙述中,正确的是( ) A. 各数据结点的存储空间可以不连续,但它们的存储顺序与逻辑顺序必须一致 B. 各数据结点的存储顺序与逻辑顺序可以不一致,但它们的存储空间必须连续 C. 进行插入与删除时&am…