OpenCV图像拼接（5）构建图像的拉普拉斯金字塔 (Laplacian Pyramid)

news2026/2/14 11:01:00

操作系统：ubuntu22.04
OpenCV版本：OpenCV4.9
IDE:Visual Studio Code
编程语言：C++11

算法描述

cv::detail::createLaplacePyr 是 OpenCV 中的一个函数，用于构建图像的拉普拉斯金字塔 (Laplacian Pyramid)。拉普拉斯金字塔是一种多尺度图像表示方法，通常用于图像融合、图像压缩和其他多分辨率分析任务。

函数原型

void cv::detail::createLaplacePyr
(
    InputArray img, 
    int num_levels, 
    std::vector<UMat>& pyr
);

参数

img (InputArray)

输入图像。可以是单通道或三通道图像（灰度图或彩色图）。
类型：cv::Mat 或 cv::UMat。
注意：输入图像必须是 8 位无符号整数类型（CV_8U）。
num_levels (int)

拉普拉斯金字塔的层数。
表示金字塔的分解层数，通常与图像的尺寸有关。
例如，如果图像的宽度和高度为 W×HW×H，则金字塔的最大层数受限于 min⁡(log⁡2(W),log⁡2(H))min(log2(W),log2(H))。
pyr (std::vector&)

输出的拉普拉斯金字塔。
这是一个向量，存储每一层的拉普拉斯金字塔图像。
向量的大小等于 num_levels + 1，因为最后一层通常包含原始图像的最低分辨率版本。

功能描述

拉普拉斯金字塔是通过对高斯金字塔进行差分计算得到的。具体步骤如下：

首先，构建高斯金字塔（Gaussian Pyramid），即通过对图像进行多次下采样（缩小）得到一系列逐渐缩小的图像。
然后，对高斯金字塔的每一层进行上采样（放大）并减去上一层的高斯图像，得到拉普拉斯金字塔的每一层。
最终结果是一个包含多个分辨率层次的拉普拉斯金字塔。

拉普拉斯金字塔的特点是：

每一层图像包含的是图像在不同尺度上的细节信息。
最底层通常是原始图像的最低分辨率版本。

代码示例

#include <opencv2/core/cuda.hpp>
#include <opencv2/opencv.hpp>
#include <vector>

int main()
{
    // 读取输入图像
    cv::Mat img = cv::imread( "/media/dingxin/data/study/OpenCV/sources/images/stich1.png", cv::IMREAD_COLOR );
    if ( img.empty() )
    {
        std::cerr << "Error: Could not load image!" << std::endl;
        return -1;
    }

    // 定义拉普拉斯金字塔的层数
    int num_levels = 4;

    // 存储拉普拉斯金字塔的向量
    std::vector< cv::UMat > laplacian_pyramid;

    // 创建拉普拉斯金字塔
    cv::detail::createLaplacePyr( img, num_levels, laplacian_pyramid );

    // 显示金字塔的每一层
    for ( int i = 0; i < laplacian_pyramid.size(); ++i )
    {
        // 将 UMat 转换为 Mat
        cv::Mat level = laplacian_pyramid[ i ].getMat( cv::ACCESS_READ );
        cv::Mat result_8u;
        level.convertTo( result_8u, CV_8U );  // 转换为 8 位无符号整型‌:ml-citation{ref="3,8" data="citationList"}
        cv::imshow( "Laplacian Pyramid Level " + std::to_string( i ), result_8u );
    }

    cv::waitKey( 0 );
    return 0;
}