- 操作系统:ubuntu22.04
- OpenCV版本:OpenCV4.9
- IDE:Visual Studio Code
- 编程语言:C++11
算法描述
cv::detail::createLaplacePyr 是 OpenCV 中的一个函数,用于构建图像的拉普拉斯金字塔 (Laplacian Pyramid)。拉普拉斯金字塔是一种多尺度图像表示方法,通常用于图像融合、图像压缩和其他多分辨率分析任务。
函数原型
void cv::detail::createLaplacePyr
(
InputArray img,
int num_levels,
std::vector<UMat>& pyr
);
参数
-
img (InputArray)
输入图像。可以是单通道或三通道图像(灰度图或彩色图)。
类型:cv::Mat 或 cv::UMat。
注意:输入图像必须是 8 位无符号整数类型(CV_8U)。 -
num_levels (int)
拉普拉斯金字塔的层数。
表示金字塔的分解层数,通常与图像的尺寸有关。
例如,如果图像的宽度和高度为 W×HW×H,则金字塔的最大层数受限于 min(log2(W),log2(H))min(log2(W),log2(H))。 -
pyr (std::vector&)
输出的拉普拉斯金字塔。
这是一个向量,存储每一层的拉普拉斯金字塔图像。
向量的大小等于 num_levels + 1,因为最后一层通常包含原始图像的最低分辨率版本。
功能描述
拉普拉斯金字塔是通过对高斯金字塔进行差分计算得到的。具体步骤如下:
- 首先,构建高斯金字塔(Gaussian Pyramid),即通过对图像进行多次下采样(缩小)得到一系列逐渐缩小的图像。
- 然后,对高斯金字塔的每一层进行上采样(放大)并减去上一层的高斯图像,得到拉普拉斯金字塔的每一层。
- 最终结果是一个包含多个分辨率层次的拉普拉斯金字塔。
拉普拉斯金字塔的特点是:
- 每一层图像包含的是图像在不同尺度上的细节信息。
- 最底层通常是原始图像的最低分辨率版本。
代码示例
#include <opencv2/core/cuda.hpp>
#include <opencv2/opencv.hpp>
#include <vector>
int main()
{
// 读取输入图像
cv::Mat img = cv::imread( "/media/dingxin/data/study/OpenCV/sources/images/stich1.png", cv::IMREAD_COLOR );
if ( img.empty() )
{
std::cerr << "Error: Could not load image!" << std::endl;
return -1;
}
// 定义拉普拉斯金字塔的层数
int num_levels = 4;
// 存储拉普拉斯金字塔的向量
std::vector< cv::UMat > laplacian_pyramid;
// 创建拉普拉斯金字塔
cv::detail::createLaplacePyr( img, num_levels, laplacian_pyramid );
// 显示金字塔的每一层
for ( int i = 0; i < laplacian_pyramid.size(); ++i )
{
// 将 UMat 转换为 Mat
cv::Mat level = laplacian_pyramid[ i ].getMat( cv::ACCESS_READ );
cv::Mat result_8u;
level.convertTo( result_8u, CV_8U ); // 转换为 8 位无符号整型:ml-citation{ref="3,8" data="citationList"}
cv::imshow( "Laplacian Pyramid Level " + std::to_string( i ), result_8u );
}
cv::waitKey( 0 );
return 0;
}