当前位置：首页 > news >正文

机器学习：opencv--图像金字塔

news 来源：原创 2024/9/21 5:23:39

一、图像金字塔

1.图像金字塔是什么？

2.有哪些常见类型？

3.金字塔的构建过程

4.图像金字塔的作用

二、图像金字塔中的操作

1.向下采样

2.向上采样

3.注意--无法复原

三、代码实现

1.高斯金字塔向下采样

2.高斯金字塔向上采样

3.无法复原

4.拉普拉斯金字塔

一、图像金字塔

1.图像金字塔是什么？

是由一幅图像的多个不同分辨率的子图构成的图像集合。
是通过一个图像不断的降低采样率产生的，最小的图像可能仅仅有一个像素点。
图像金字塔的底部是待处理的高分辨率图像（原始图像），而顶部则为其低分辨率的近似图像。

2.有哪些常见类型？

<1> 高斯金字塔

通过逐层应用高斯滤波和下采样，生成不同分辨率的图像以表示多尺度信息。

<2> 拉普拉斯金字塔

拉普拉斯金字塔是由高斯金字塔向下采样时丢失的信息构成。

3.金字塔的构建过程

<1> 高斯金字塔

初始图像：导入原始图像。
高斯滤波：对图像应用高斯滤波。
下采样：将图像尺寸减半，生成下一级图像。
重复：重复高斯滤波和下采样步骤，直到达到所需的层数或图像尺寸过小。

<2> 拉普拉斯金字塔

生成高斯金字塔：先创建高斯金字塔。
上采样：将高斯金字塔的每层图像上采样到前一层的尺寸。
计算细节：用前一层的高斯图像减去上采样后的图像，得到拉普拉斯细节图像。
最后一层：拉普拉斯金字塔的最后一层即为高斯金字塔的最后一层。

4.图像金字塔的作用

<1> 特征点提取

图像金字塔允许在不同尺度下检测特征点，提高特征点检测的尺度不变性。

<2> 模板匹配

图像金字塔帮助处理不同尺度的模板匹配问题，提高匹配的准确性。

<3> 光流跟踪

通过在不同尺度层中估计光流，图像金字塔帮助处理大范围的运动，提高光流估计的精度。

二、图像金字塔中的操作

1.向下采样

向金字塔顶部移动时，图像的尺寸和分辨率都不断地降低。通常情况下，每向上移动一级，图像的宽和高都降低为原来的1/2。

<1> 步骤

高斯滤波（减少高频噪声）
删除其偶数行和偶数列（所以所用图像一般高宽都是偶数）

<2> 图示

2.向上采样

通常将图像的宽度和高度都变为原来的2倍。这意味着，向上采样的结果图像的大小是原始图像的4倍。因此，要在结果图像中补充大量的像素点。对新生成的像素点进行赋值的行为，称为插值。

<1> 步骤

插值
高斯滤波（减少由于插值产生的人工边界和不自然的过渡）

<2> 图示

3.注意--无法复原

通过以上分析可知，向上采样和向下采样是相反的两种操作。但是，由于向下采样会丢失像素值，所以这两种操作是不可逆的。也就是说，对一幅图像先向上采样、再向下采样，是无法恢复其原始状态的；同样，对一幅图像先向下采样、再向上采样也无法恢复到原始状态

三、代码实现

1.高斯金字塔向下采样

使用cv2.pyrDown()函数实现向下采样

import cv2  # opencv读取的格式是BGR2# 高斯金字塔操作中的向下采样
# 下采样 是一种减小图像尺寸的方法，它通常涉及到降低图像的分辨率，即减少图像中像素的数量，从而使图像看起来更小
# 上釆样 是一种增大图像尺寸的方法，它通过插值和滤波技术来恢复图像的分辨率和细节，通常用于图像放大或者与下采样后的图像进行比较。
# resize函数 是一种通用的图像尺寸调整方法，它可以按照指定的目标尺寸来缩放图像，不涉及金字塔结构或者特定的滤波操作。
# dst = cv2.pyrDown(src [,dst, dstsize [, borderType] ])
# dst:目标图像
# src:原始图像
# dstsize:目标图像的大小
face = cv2.imread('face.jpg')  # G0
face = cv2.resize(face, (400, 400))
cv2.imshow('face', face)
cv2.waitKey(0)# 向下采样
face_down_1 = cv2.pyrDown(face)  # 下采样G1
cv2.imshow('face_down_1', face_down_1)
cv2.waitKey(0)
face_down_2 = cv2.pyrDown(face_down_1)  # G2
cv2.imshow('face_down_2', face_down_2)
cv2.waitKey(0)

输出：

可以看出来图像的宽高逐层减半

2.高斯金字塔向上采样

使用cv2.pyrUp()函数实现向上采样
默认双线性插值法

import cv2  # opencv读取的格式是BGR2# 高斯金字塔操作中的向上采样
# dst = cv2.pyrUp(src [,dst, dstsize [, borderType] ])
# dst:目标图像
# #src:原始图像
# dstsize:目标图像的大小
face = cv2.imread('face.jpg')  # G0
face = cv2.resize(face, (400, 400))
cv2.imshow('face', face)
cv2.waitKey(0)
face_up_1 = cv2.pyrUp(face)
cv2.imshow('face_up_1', face_up_1)  # G1
cv2.waitKey(0)
face_up_2 = cv2.pyrUp(face_up_1)
cv2.imshow('face_up_2', face_up_2)  # G2
cv2.waitKey(0)
cv2.destroyAllWindows()

输出：

可以看到向上采样之后的图像宽高逐层变成2倍

3.无法复原

# 对下采样后图像进行上采样,图像变模糊，无法复原
# 对上采样后图像进行下采样,图像变模糊，无法复原
face_down_1_up = cv2.pyrUp(face_down_1)  # 下采样G1
face_up_1_down = cv2.pyrDown(face_up_1)  # 上采样G1
cv2.imshow('yuantu', face)
cv2.imshow('down_1_up', face_down_1_up)
cv2.imshow('up_1_down', face_up_1_down)
cv2.waitKey(0)
cv2.destroyAllWindows()

输出：

可以看到两种操作之后的图像大小与原图一样
但是清晰度却比原图差了不少

4.拉普拉斯金字塔

# 拉普拉斯金字塔
face_down_2_up = cv2.pyrUp(face_down_2) 
L0 = face - face_down_1_up
L1 = face_down_1 - face_down_2_up
fuyuan = face_down_1_up + L0
cv2.imshow('L0', L0)
cv2.imshow('L1', L1)
cv2.imshow('fuyuan', fuyuan)
cv2.waitKey(0)

输出：