c/c++的opencv图像金字塔缩放实现

 更新时间:2025年05月31日 09:23:01   作者:whoarethenext  
本文主要介绍了c/c++的opencv图像金字塔缩放实现,通过对原始图像进行连续的下采样或上采样操作,生成一系列不同分辨率的图像,具有一定的参考价值,感兴趣的可以了解一下

图像金字塔是计算机视觉中一种重要且基础的多尺度表示方法。它通过对原始图像进行连续的下采样(缩小)或上采样(放大)操作,生成一系列不同分辨率的图像。这些图像按尺寸大小排列,形似金字塔,故此得名。图像金字塔在诸如特征检测、图像分割、目标识别和图像融合等任务中扮演着关键角色。

本文将重点介绍如何使用 OpenCV C++ API 中的函数来实现图像金字塔的基本缩放操作:下采样和上采样。

图像金字塔简介

图像金字塔通常包含两种主要类型:

  • 高斯金字塔 (Gaussian Pyramid):用于图像的下采样。在每一层,图像首先经过高斯模糊处理,然后去除偶数行和偶数列,从而将图像尺寸减半。
  • 拉普拉斯金字塔 (Laplacian Pyramid):用于图像重建,可以从高斯金字塔中恢复图像。它存储了高斯金字塔中相邻层之间的差异信息。

本文主要关注构成高斯金字塔基础的下采样 (cv::pyrDown) 和其逆操作的上采样 (cv::pyrUp)。

图像下采样 (cv::pyrDown)

cv::pyrDown 函数用于将输入图像的宽度和高度都缩小一半。

函数原型

void cv::pyrDown(InputArray src, OutputArray dst, const Size& dstsize = Size(), int borderType = BORDER_DEFAULT);
  • src: 输入图像。
  • dst: 输出图像,其尺寸将是输入图像的一半(除非指定了 dstsize)。
  • dstsize: 可选参数,指定输出图像的尺寸。如果未指定(默认),则输出图像尺寸计算为 Size((src.cols+1)/2, (src.rows+1)/2)。通常我们让其自动计算。
  • borderType: 像素外推方法,用于处理边界(一般使用默认值)。

工作原理
cv::pyrDown 的典型实现步骤如下:

  • 对输入图像应用高斯滤波器(通常是 5 × 5 5 \times 55×5 的核)。
  • 对滤波后的图像进行下采样,即删除所有偶数行和偶数列。

图像上采样 (cv::pyrUp)

cv::pyrUp 函数用于将输入图像的宽度和高度都放大一倍。这个操作试图从一个较低分辨率的图像重建一个较高分辨率的图像,但通常会伴随一些模糊,因为它无法凭空创造细节。

函数原型

void cv::pyrUp(InputArray src, OutputArray dst, const Size& dstsize = Size(), int borderType = BORDER_DEFAULT);
  • src: 输入图像。
  • dst: 输出图像,其尺寸将是输入图像的两倍(除非指定了 dstsize)。
  • dstsize: 可选参数,指定输出图像的尺寸。如果未指定(默认),则输出图像尺寸计算为 Size(src.cols*2, src.rows*2)。通常我们让其自动计算。
  • borderType: 像素外推方法(一般使用默认值)。

工作原理
cv::pyrUp 的典型实现步骤如下:

  • 将输入图像的尺寸扩大两倍,新增的行和列通常用0填充(或者其他插值方式)。
  • 对扩大后的图像应用高斯滤波器(与 pyrDown 中使用的核类似,但通常乘以4以保持亮度范围)。这一步是为了平滑由于插入0值而产生的块状效应。

C++ OpenCV 代码示例

下面的 C++ 代码演示了如何加载一张图像,对其进行下采样,然后再对下采样后的图像进行上采样,并显示结果。

#include <opencv2/imgproc.hpp>
#include <opencv2/highgui.hpp>
#include <iostream>

int main(int argc, char** argv) {
    // 检查命令行参数
    if (argc != 2) {
        std::cout << "用法: " << argv[0] << " <图片路径>" << std::endl;
        return -1;
    }

    // 1. 加载源图像
    cv::Mat srcImage = cv::imread(argv[1], cv::IMREAD_COLOR);
    if (srcImage.empty()) {
        std::cerr << "错误: 无法加载图像 " << argv[1] << std::endl;
        return -1;
    }
    std::cout << "原始图像尺寸: " << srcImage.cols << "x" << srcImage.rows << std::endl;

    // 2. 图像下采样 (缩小一半)
    cv::Mat downsampledImage;
    cv::pyrDown(srcImage, downsampledImage);
    std::cout << "下采样后图像尺寸: " << downsampledImage.cols << "x" << downsampledImage.rows << std::endl;

    // 3. 图像上采样 (放大一倍,基于下采样后的图像)
    cv::Mat upsampledImage;
    cv::pyrUp(downsampledImage, upsampledImage);
    std::cout << "上采样后图像尺寸: " << upsampledImage.cols << "x" << upsampledImage.rows << std::endl;
    
    // 4. 为了比较,我们也可以对原始图像直接进行一次上采样
    cv::Mat upsampledOriginalImage;
    cv::pyrUp(srcImage, upsampledOriginalImage);
    std::cout << "原始图像直接上采样后尺寸: " << upsampledOriginalImage.cols << "x" << upsampledOriginalImage.rows << std::endl;


    // 5. 显示图像
    cv::imshow("原始图像", srcImage);
    cv::imshow("下采样图像 (pyrDown)", downsampledImage);
    cv::imshow("上采样图像 (pyrUp on downsampled)", upsampledImage);
    cv::imshow("原始图像直接上采样 (pyrUp on original)", upsampledOriginalImage);

    cv::waitKey(0); // 等待按键
    cv::destroyAllWindows(); // 关闭所有窗口

    return 0;
}

代码解释

  • 包含头文件
    • opencv2/imgproc.hpp: 包含了图像处理函数,如 pyrDown 和 pyrUp。
    • opencv2/highgui.hpp: 包含了图像的显示和加载函数,如 imread, imshow, waitKey。
    • iostream: 用于控制台输出。
  • 加载图像:使用 cv::imread() 从命令行参数指定的路径加载图像。
  • cv::pyrDown(srcImage, downsampledImage);:对原始图像 srcImage 进行下采样,结果存储在 downsampledImage 中。输出图像的宽高大约是输入图像的一半。
  • cv::pyrUp(downsampledImage, upsampledImage);:对之前下采样得到的 downsampledImage 进行上采样,结果存储在 upsampledImage 中。输出图像的宽高大约是输入图像的两倍。注意,upsampledImage 的尺寸应该与 srcImage 的尺寸大致相同(由于整数除法可能存在1个像素的差异),但其内容会比原始图像模糊,因为下采样过程丢失了信息。
  • 显示图像:使用 cv::imshow() 分别显示原始图像、下采样后的图像以及上采样后的图像。cv::waitKey(0) 使程序暂停,直到用户按下任意键。

编译与运行

要编译以上 C++ 代码,你需要安装好 OpenCV,并有一个 C++ 编译器(如 g++)。

编译命令示例 (Linux/macOS):

g++ image_pyramid.cpp -o image_pyramid_app `pkg-config --cflags --libs opencv4` -std=c++11

(如果你的 pkg-config 配置的是 opencv 而不是 opencv4,请相应修改。-std=c++11 或更高版本均可。)

运行命令:

./image_pyramid_app <你的图片路径.jpg>

例如:

./image_pyramid_applena.png

应用场景 🖼️

图像金字塔在许多计算机视觉算法中都有广泛应用:

  • 多尺度特征检测:如 SIFT、SURF 等算法会在图像金字塔的不同层上检测特征,以实现尺度不变性。
  • 图像融合:例如,将多张不同曝光的图像融合成一张高动态范围 (HDR) 图像。
  • 目标检测:在不同尺度上搜索目标,以适应目标大小的变化。
  • 图像分割:先在低分辨率图像上进行粗略分割,然后逐步优化到高分辨率。
  • 视频压缩和流媒体:根据带宽和设备能力提供不同分辨率的视频流。

总结

cv::pyrDown 和 cv::pyrUp 是 OpenCV 中实现图像金字塔缩放的基础操作。它们简单易用,且是许多高级图像处理和计算机视觉算法的重要组成部分。通过理解和运用这些函数,开发者可以有效地处理和分析不同尺度下的图像信息。

到此这篇关于c/c++的opencv图像金字塔缩放实现的文章就介绍到这了,更多相关opencv图像金字塔缩放内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • C语言中的setlinebuf()、utmpname()、rewind函数使用

    C语言中的setlinebuf()、utmpname()、rewind函数使用

    这篇文章主要介绍了C语言中的setlinebuf()、utmpname()、rewind函数使用,是C语言中操作文件的一些基本函数,需要的朋友可以参考下
    2015-08-08
  • MySQL的C语言API接口

    MySQL的C语言API接口

    这篇文章主要介绍了MySQL的C语言API接口,需要的朋友可以参考下
    2015-08-08
  • C++编程中指针的声明与基本使用讲解

    C++编程中指针的声明与基本使用讲解

    这篇文章主要介绍了详解C++编程中C++编程中指针的声明与基本使用讲解,文中举了简单的例子来讲如何在基本的数据结构中使用指针,以及固定和可变指针的介绍,需要的朋友可以参考下
    2016-01-01
  • C++编程语言中赋值运算符重载函数(operator=)的使用

    C++编程语言中赋值运算符重载函数(operator=)的使用

    本文主要介绍了C++编程语言中赋值运算符重载函数(operator=)介绍,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-06-06
  • 聊聊C++ 运算符重载知识

    聊聊C++ 运算符重载知识

    运算符重载是一种形式的C++多态,重载运算符可以使代码看起来更加自然,下面通过例子介绍下C++ 运算符重载知识,感兴趣的朋友一起看看吧
    2021-11-11
  • 使用C++获取逻辑执行毫秒数的方法

    使用C++获取逻辑执行毫秒数的方法

    这篇文章主要为大家详细介绍了如何使用C++获取逻辑执行毫秒数的方法,文中借助c++11提供的steady_clock,实现了精确获取逻辑执行时间的方法,需要的可以参考下
    2024-02-02
  • 详细解读C++编程中的匿名类类型和位域

    详细解读C++编程中的匿名类类型和位域

    这篇文章主要介绍了C++编程中的匿名类类型和位域,是C++入门学习中的基础知识,需要的朋友可以参考下
    2016-01-01
  • C++中双冒号::的作用浅析

    C++中双冒号::的作用浅析

    在C++中经常使用双冒号::,很多朋友不知道是什么意思,这篇文章主要介绍了C++中双冒号::的作用,需要的朋友可以参考下
    2018-06-06
  • C语言基础之二分查找知识最全汇总

    C语言基础之二分查找知识最全汇总

    这篇文章主要介绍了C语言基础之二分查找知识最全汇总,文中有非常详细的二分查找基础知识详解,对正在学习C语言基础的小伙伴们有非常好的帮助,需要的朋友可以参考下
    2021-04-04
  • C++实现教务管理系统

    C++实现教务管理系统

    这篇文章主要为大家详细介绍了C++实现教务管理系统,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-06-06

最新评论