【记录】USSOCOM Urban3D 数据集读取与处理

news2025/4/1 10:09:26

Urban3D数据集内容简介

Urban3D数据集图像为正摄RGB影像，分辨率为50cm。
从SpaceNet上使用aws下载数据，文件夹结构为：

|- 01-Provisional_Train
	|- GT
		|- GT中包含GTC，GTI，GTL.tif文件，GTL为ground truth building footprint。
	|- Inputs
		|- Inputs中包含DSM，DTM，RGB.tif文件，DSM为Digital Surface Models，DTM为Digital Terrain Models，normalized DSM (nDSM = DSM - DTM)
|- 02-Provisional_Test
|- 03-Sequestered_Test
|- 04-Unused_Data
|- AOI_polygons
|- Pretrained_Models
   |- 包含前6名参赛团队的模型

每一块.tif大小为2048*2048。

Urban3D数据集读取

from torchvision import transforms
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import sys
rgb = Image.open("/01-Provisional_Train/Inputs/JAX_Tile_016_RGB.tif")
dsm = Image.open("/01-Provisional_Train/Inputs/JAX_Tile_016_DSM.tif")
gtl = Image.open("/01-Provisional_Train/GT/JAX_Tile_016_GTL.tif")
print(rgb.size, dsm.size, gtl.size) >> (2048, 2048) (2048, 2048) (2048, 2048)
print(np.array(rgb).shape, np.array(dsm).shape, np.array(gtl).shape) >> (2048, 2048, 3) (2048, 2048) (2048, 2048)
print(np.array(rgb).dtype, np.array(dsm).dtype,  np.array(gtl).dtype) >> uint8 float32 uint8

fig = plt.figure()
plt.subplot(131)
plt.imshow(np.array(rgb))
plt.subplot(132)
plt.imshow(np.array(dsm))
plt.subplot(133)
plt.imshow(np.array(gtl))

print(np.max(gtl), np.min(gtl)) >> 6, 2

Urban3D数据读取

Urban3D数据集Pytorch处理

使用深度学习需要对Urban3D数据进行裁剪，这里采用torchvision.transforms.RandomCrop进行裁剪。RandomCrop可以直接作用于PIL.Image打开的文件和torch类型的数据上，但不能作用于numpy数组。具体内容可以参考numpy, PIL, tensor类型在torchvision.transforms时使用

def type_convert(x):
    x_ = np.array(x).astype(np.float32)
    return x_
def to_tensor(x):
    x_ = np.expand_dims(x, axis=0)
    x_ = torch.from_numpy(x_)
    return x_
trans = transforms.Compose([
    transforms.RandomCrop(size=256),
    transforms.Lambda(type_convert),
    transforms.Lambda(to_tensor)
])

torch.random.manual_seed(16)
rgb_crop = trans(rgb)
torch.random.manual_seed(16)
dsm_crop = trans(dsm)
torch.random.manual_seed(16)
gtl_crop = trans(gtl)
print(rgb_crop.size(), dsm_crop.size(), gtl_crop.size())
fig = plt.figure()
plt.subplot(131)
plt.imshow(rgb_crop[0,:,:,0])
plt.subplot(132)
plt.imshow(dsm_crop[0,:,:])
plt.subplot(133)
plt.imshow(gtl_crop[0,:,:])

After RandomCrop

同时还需要注意的一点是为了保证RandomCrop后data和label的一致性，需要设置随机数种子。对于GTL需要改变label的值。

def type_convert_gtl(x):
    x_ = np.array(x).astype(np.float32)
    x_[x_==6]=1
    x_[x_==2]=0
    return x_

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/945793.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【记录】USSOCOM Urban3D 数据集读取与处理

Urban3D数据集内容简介

Urban3D数据集读取

Urban3D数据集Pytorch处理

相关文章

Linux学习之RAID

产品经理NPDP考什么？

C语言——程序执行的三大流程

[FlareOn6]Snake 题解

新手入门吉他是要越贵越好吗？2023年最全面吉他选购指南，十大初学者吉他品牌推荐！【建议收藏】

Python学习笔记：Requests库安装、通过url下载文件

谷歌浏览器调试技巧

图解SQL查询之having

【LeetCode-中等题】98. 验证二叉搜索树

2023 在Windows上的安装Faiss-GPU（使用anaconda）

Docker 的快速使用

CSS按钮-跑马灯边框

多线程网络实现在线聊天系统（详细源码）

数论基础（II）。

【USRP】调制解调系列5：16QAM、32QAM、64QAM、256QAM、1024QAM、基于labview的实现

打造互动体验：品牌 DTC 如何转变其私域战略

嵌入式通用硬件模块设计——串口音频播放模块

【Unity小技巧】手戳一个简单易用的游戏UI框架（附源码）

对于Android开发，我们为何要学Jetpack Compose？

万户协同办公平台 ezoffice存在未授权访问漏洞附POC