遥感影像为什么需要分块处理

news2024/11/26 7:52:47

原理

遥感影像通常具有极高的分辨率和大量的数据量,这就使得全景处理遥感影像成为一项极具挑战的任务。首要的问题是,大规模的遥感影像可能会超过硬件设备,特别是GPU的内存容量。其次,处理大规模遥感影像的计算复杂度非常高,可能会导致处理速度缓慢,效率低下。

在具体的应用中,例如深度学习的训练过程,我们通常需要将遥感影像切割成较小的样本,如512x512像素的图像块,以适应GPU的内存限制。这样的操作不仅可以有效地避免内存溢出,而且可以提高数据处理的速度,因为小图像块的处理速度通常比大图像快。

为了实现这样的分块处理,我们通常会采用双重循环的方式。首先,外层循环负责遍历图像的行,然后内层循环遍历每一行的列。这样,我们就可以逐块地访问和处理图像,而不需要一次性加载整个图像到内存中。这种方法既节省了硬件资源,又提高了数据处理的效率,对于处理大规模的遥感影像具有非常重要的意义。

代码

分块处理的核心部分如下:

# 遍历输入文件的每一个块
for x in range(0, xsize, block_ysize):
   if x + block_xsize < xsize:
       cols = block_xsize
   else:
       cols = xsize - x
   for y in range(0, ysize, block_ysize):
       if y + block_ysize < ysize:
           rows = block_ysize
       else:
           rows = ysize - y
       # 读取块的数据
       data = in_band.ReadAsArray(x, y, cols, rows)

以上代码的运行逻辑是:

  1. 该代码首先通过外层循环遍历图像的列(x轴),并且每次遍历的步长是block_xsize。这意味着图像被分割成了宽度为block_xsize的垂直条带。

  2. 对于每个垂直条带,如果条带的右边界超过了图像的宽度,那么就将条带的宽度设置为从当前位置到图像右边界的距离,否则就使用block_xsize作为条带的宽度。

  3. 然后,内层循环遍历当前垂直条带的行(y轴),并且每次遍历的步长是block_ysize。这意味着垂直条带被进一步分割成了大小为block_xsizexblock_ysize的块。

  4. 对于每个块,如果块的下边界超过了图像的高度,那么就将块的高度设置为从当前位置到图像下边界的距离,否则就使用block_ysize作为块的高度。

  5. 最后,使用ReadAsArray函数读取当前块的数据。这个函数的参数是块的左上角坐标(x,y)和块的大小(cols,rows),返回的是一个二维数组,包含了块内的所有像素值。

我们具体的例子,进一步展示分块处理,以下是我们的Python函数:

import os
import numpy as np
from osgeo import gdal

# 改变当前工作目录到包含输入文件的文件夹
os.chdir(r'D:\data1\\dem')

# 打开输入的DEM文件
in_ds = gdal.Open('gt30w.tif')
# 获取第一波段的数据
in_band = in_ds.GetRasterBand(1)
# 获取栅格的大小(行数和列数)
xsize = in_band.XSize
ysize = in_band.YSize
# 获取波段的块大小
block_xsize, block_ysize = in_band.GetBlockSize()
# 获取无数据值
nodata = in_band.GetNoDataValue()

# 创建输出的DEM文件,设置其大小、数据类型等与输入文件相同
out_ds = in_ds.GetDriver().Create(
   'dem_feet.tif', xsize, ysize, 1, in_band.DataType)
# 设置投影和地理变换参数与输入文件相同
out_ds.SetProjection(in_ds.GetProjection())
out_ds.SetGeoTransform(in_ds.GetGeoTransform())
# 获取输出文件的第一波段
out_band = out_ds.GetRasterBand(1)

# 遍历输入文件的每一个块
for x in range(0, xsize, block_ysize):
   if x + block_xsize < xsize:
       cols = block_xsize
   else:
       cols = xsize - x
   for y in range(0, ysize, block_ysize):
       if y + block_ysize < ysize:
           rows = block_ysize
       else:
           rows = ysize - y
       # 读取块的数据
       data = in_band.ReadAsArray(x, y, cols, rows)
       # 将米转换为英尺
       data = np.where(data == nodata, nodata, data * 3.28084)
       # 写入转换后的数据到输出文件
       out_band.WriteArray(data, x, y)

# 将缓存的数据写入磁盘
out_band.FlushCache()
# 设置输出文件的无数据值
out_band.SetNoDataValue(nodata)
# 计算输出文件的统计信息
out_band.ComputeStatistics(False)
# 生成输出文件的概览图
out_ds.BuildOverviews('average', [2, 4, 8, 16, 32])
# 删除输出文件对象,关闭文件
del out_ds

这个脚本的主要部分是一个双层的循环,遍历输入文件的每一个块。对于每一个块,它先读取数据,然后将单位从米转换为英尺,然后将转换后的数据写入到输出文件。

这个过程使用了NumPy的where函数,它可以根据一个条件来选择数组的元素。在这里,它用于保留无数据值不变,而将其他的值乘以3.28084(米到英尺的转换系数)。

附上同款CPP代码

#include <iostream>
#include <string>
#include <gdal_priv.h>

int main()
{
 GDALAllRegister();

 // 打开输入的DEM文件
 GDALDataset *in_ds = (GDALDataset*) GDALOpen("D:\\data1\\dem\\gt30w.tif", GA_ReadOnly);
 if (in_ds == NULL) {
   std::cerr << "Failed to open input dataset\n";
   return 1;
}

 // 获取第一波段的数据
 GDALRasterBand *in_band = in_ds->GetRasterBand(1);
 // 获取栅格的大小(列数和行数)
 int xsize = in_band->GetXSize();
 int ysize = in_band->GetYSize();
 // 获取波段的块大小
 int block_xsize, block_ysize;
 in_band->GetBlockSize(&block_xsize, &block_ysize);
 // 获取无数据值
 int nodata;
 in_band->GetNoDataValue(&nodata);

 // 创建输出的DEM文件,设置其大小、数据类型等与输入文件相同
 GDALDataset *out_ds = in_ds->GetDriver()->Create("D:\\data1\\dem\\dem_feet.tif", xsize, ysize, 1, in_band->GetRasterDataType());
 if (out_ds == NULL) {
   std::cerr << "Failed to create output dataset\n";
   return 1;
}
 // 设置投影和地理变换参数与输入文件相同
 out_ds->SetProjection(in_ds->GetProjectionRef());
 out_ds->SetGeoTransform(in_ds->GetGeoTransform());

 // 获取输出文件的第一波段
 GDALRasterBand *out_band = out_ds->GetRasterBand(1);

 // 遍历输入文件的每一个块
 for (int x = 0; x < xsize; x += block_xsize) {
   int cols = (x + block_xsize < xsize) ? block_xsize : xsize - x;
   for (int y = 0; y < ysize; y += block_ysize) {
     int rows = (y + block_ysize < ysize) ? block_ysize : ysize - y;

     // 读取块的数据
     float *data = new float[cols * rows];
     in_band->RasterIO(GF_Read, x, y, cols, rows, data, cols, rows, GDT_Float32, 0, 0);

     // 将米转换为英尺
     for (int i = 0; i < cols * rows; i++) {
       if (data[i] != nodata) {
         data[i] *= 3.28084;
      }
    }

     // 写入转换后的数据到输出文件
     out_band->RasterIO(GF_Write, x, y, cols, rows, data, cols, rows, GDT_Float32, 0, 0);

     delete[] data;
  }
}

 // 将缓存的数据写入磁盘
 out_band->FlushCache();
 // 设置输出文件的无数据值
 out_band->SetNoDataValue(nodata);
 // 计算输出文件的统计信息
 int bApproxOK;
 out_band->ComputeStatistics(0, NULL, NULL, NULL, NULL, &bApproxOK);
 // 生成输出文件的概览图
 out_ds->BuildOverviews("AVERAGE", NULL);

 // 关闭文件
 GDALClose((GDALDatasetH) in_ds);
 GDALClose((GDALDatasetH) out_ds);

 return 0;
}

小结

分块处理有没有缺陷?

其实是有的,比如,请看下图

处理数据时参数选择不一样导致块与块之间出现了明显的尾痕。

一般解决的方式就是处理局部块数据使用全局参数。

此外,问一个问题?为什么要学cpp的代码呢?因为cpp的速度比python的运行速度要快得多。python可以作为前期的技术验证,工程化落地的话还是改写为CPP更稳妥。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1582615.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux常见使用命令

查看CPU内存 cat /proc/cpuinfo 动态查看 top 部分版本中没有&#xff0c;需要自行安装的命令 dstat 查看内核版本号 uname -r 系统版本的全部信息 uname -a 查看所有关于网络的相关信息 netstat -anp 查看8080端口是否被占用 netstat -anp | grep 8080 指定进程名字都有那些连…

【Linux-运维】查看操作系统的指定端口占用情况确定端口是哪个服务占用

不同的查看端口占用的方法&#xff0c;应用场景有所不同 一、查询某个端口是否被占用&#xff1f;lsof -i:端口号lsof -i:协议 查看某个协议的占用情况netstat -tlnp|grep 端口号ss -tlnp|grep 端口号fuser 端口号/协议ls -l /proc/$(lsof -t -i:端口号)|grep exe 二、确认指定…

【RAG实践】Rerank,让大模型 RAG 更近一步

RAGRerank原理 上一篇【RAG实践】基于LlamaIndex和Qwen1.5搭建基于本地知识库的问答机器人 我们介绍了什么是RAG&#xff0c;以及如何基于LLaMaIndex和Qwen1.5搭建基于本地知识库的问答机器人&#xff0c;原理图和步骤如下&#xff1a; 这里面主要包括包括三个基本步骤&#…

【Spring进阶系列丨第八篇】Spring整合junit 面向切面编程(AOP)详解

文章目录 一、Spring整合junit1.1、导入spring整合junit的jar1.2、在测试类上添加注解1.3、说明 二、面向切面编程(AOP)2.1、问题引出2.2、AOP2.2.1、概念2.2.2、作用2.2.3、优势2.2.4、实现方式2.2.5、专业术语2.2.5.1、连接点2.2.5.2、切入点2.2.5.3、通知/增强2.2.5.4、织入…

归并排序核心代码

核心&#xff1a; void merge(int a[],int l,int r){ if(l>r) return; int mid lr>>1; merge(a,l,mid);//先递归再归并 merge(a,mid1,r); int t0; //左右半段的起点 int il,jmid1; while(i < mid && j < r){ …

(源码)基于Spring Boot和Vue植物养殖技巧学习系统的设计与实现

前言 &#x1f497;博主介绍&#xff1a;✌专注于Java、小程序技术领域和毕业项目实战✌&#x1f497; &#x1f447;&#x1f3fb; 精彩专栏 推荐订阅&#x1f447;&#x1f3fb; 2024年Java精品实战案例《100套》 &#x1f345;文末获取源码联系&#x1f345; &#x1f31f…

动态规划9,最长定差子序列,最长斐波那契子序列长度,最长等差数列

如果还没有做过前面的题&#xff0c;建议先去尝试动态规划8 1218. 最长定差子序列 如果对之前的题比较熟悉的话&#xff0c;比较容易直接这样写&#xff0c;但是这样会超出时间限制&#xff1a; 所以我们要变成一次遍历&#xff0c;就得倒着推&#xff0c;就像这样&#xff1a…

windows server 2019 -DNS服务器搭建

前面是有关DNS的相关理论知识&#xff0c;懂了的可以直接跳到第五点。 说明一下&#xff1a;作为服务器ip最好固定下来&#xff0c;以DNS服务器为例子&#xff0c;如果客户机的填写DNS信息的之后&#xff0c;服务器的ip如果变动了的话&#xff0c;客户机都得跟着改&#xff0c…

HJ53 杨辉三角的变形(基础数学,生成数组不行,会越界,使用规律)

第一种方法&#xff1a; 生成杨辉三角的方法不行&#xff0c;会出现越界&#xff0c; 数组从[0][0]开始&#xff0c;i行j列 只看列 每一行的最右侧坐标为2*i,下坐标为 0&#xff0c; 0&#xff0c;1&#xff0c;2 0&#xff0c;1&#xff0c;2&#xff0c;3&#xff0c;4 … …

学习:面向云备份提供商的 Solidigm 固态硬盘

SSD与HDD的区别 SSD和HDD之间的主要区别在于它们如何存储和传输数据。HDD有一个旋转盘片或磁盘&#xff0c;用于读取和写入数据。HDD的每GB初始价格通常低于SSD&#xff0c;这使其成为大型机构&#xff08;如金融机构、政府数据存储设施、高性能计算中心&#xff08;HPC&#…

OJ 栓奶牛【C】【Python】【二分算法】

题目 算法思路 要求的距离在最近木桩与最远木桩相隔距离到零之间&#xff0c;所以是二分法 先取一个中间值&#xff0c;看按照这个中间值可以栓多少奶牛&#xff0c;再与输入奶牛数比较&#xff0c;如果大于等于&#xff0c;则增大距离&#xff0c;注意这里等于也是增大距离…

NC报销单设置了转换模板后,没有生成临时凭证的排查。

NC报销单设置了转换模板后&#xff0c;没有生成临时凭证的排查 1、检查转换模板 2、检查交易类型 3、检查平台设置

RTK大气延迟建模精度分析

大气建模内插精度与终端定位性能密切相关。与流动站最近的参考站称为主参考站&#xff0c;此算例中&#xff0c;LXJS作为HF06的主参考站。图5分别给出了LXJS-HF06基线GPS时&#xff08;GPS time&#xff0c;GPST&#xff09; 00:00—24:00内GPS和BDS可视卫星的双差电离层延迟结…

App加固:不同类型和费用对比

文章目录 [TOC]引言应用程序加固是什么不同类型[App加固](https://www.ipaguard.com/)的费用对比基础加固高级加固云加固 白嫖的混淆加密工具](https://www.ipaguard.com/)-[ipaguard总结参考资料 引言 在当前移动应用市场中&#xff0c;安全性已经成为一个非常重要的话题。为…

2024年厨房大家电行业未来趋势分析(厨电行业线上分析报告)

如今&#xff0c;种种迹象都表明厨电行业正在向高端化、智能化、品质化做根本性的转变。不少厨房大家电的市场规模相较去年都有明显增长&#xff0c;其中也包括线上市场。 鲸参谋数据显示&#xff0c;从今年综合传统电商平台&#xff08;京东天猫淘宝&#xff09;1月至2月的数…

图片超分辨率重构实战——SRGAN

数据与代码链接见文末 论文地址:Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network https://arxiv.org/abs/1609.04802v4 1.概述 通常来说,分辨率越低,图像越模糊,分辨率越高,图像越清晰,图像超分辨率重构就是将分辨率低的图像重…

怎么在手机中制作gif动图?用这个网站一键在线做

手机已经是我们日常生活中必不可少的日用品了&#xff0c;很多以前电脑上的软件现在在手机上也能操作了。我们想要在手机上制作一个gif动图还不想下载一些操作复杂的软件的时候&#xff0c;要怎么办呢&#xff1f;很简单&#xff0c;不用着急只要在手机浏览器上搜索专业的Gif制…

刷题之Leetcode54题(超级详细)

54. 螺旋矩阵54. 螺旋矩阵 - 力扣&#xff08;LeetCode&#xff09;https://leetcode.cn/problems/spiral-matrix/submissions/521329682/ 给你一个 m 行 n 列的矩阵 matrix &#xff0c;请按照 顺时针螺旋顺序 &#xff0c;返回矩阵中的所有元素。 示例 1&#xff1a; 输入…

搭建基于Hexo的个人博客

测试命令 hexo clean hexo g hexo s 上传命令 hexo clean hexo g hexo d 一、安装hexo 参考B站CodeSheep视频&#xff1a;手把手教你从0开始搭建自己的个人博客 |无坑版视频教程| hexo_哔哩哔哩_bilibili 安装node.js nodejs.org下载长期支持版 用管理员身份进入powersh…

全排列与全错排列

import java.util.Arrays; import java.util.Scanner; // 1:无需package // 2: 类名必须Main, 不可修改public class Main {public static void main(String[] args) {Scanner scan new Scanner(System.in);//在此输入您的代码...long f10;long f21;long temp0;for (int i 3;…