当前位置: 首页 > news >正文

机器学习:opencv--图像金字塔

目录

一、图像金字塔

1.图像金字塔是什么?

2.有哪些常见类型

3.金字塔的构建过程

4.图像金字塔的作用

二、图像金字塔中的操作

1.向下采样

2.向上采样

3.注意--无法复原

三、代码实现

1.高斯金字塔向下采样

2.高斯金字塔向上采样

3.无法复原

4.拉普拉斯金字塔


一、图像金字塔

1.图像金字塔是什么?

  1. 是由一幅图像的多个不同分辨率的子图构成的图像集合
  2. 是通过一个图像不断的降低采样率产生的,最小的图像可能仅仅有一个像素点。
  3. 图像金字塔的底部是待处理的高分辨率图像(原始图像),而顶部则为其低分辨率近似图像

 

2.有哪些常见类型?

<1> 高斯金字塔

        通过逐层应用高斯滤波下采样,生成不同分辨率的图像以表示多尺度信息。        

<2> 拉普拉斯金字塔

        拉普拉斯金字塔是由高斯金字塔向下采样丢失信息构成

 

3.金字塔的构建过程

<1> 高斯金字塔

  1. 初始图像:导入原始图像。
  2. 高斯滤波:对图像应用高斯滤波。
  3. 下采样:将图像尺寸减半,生成下一级图像。
  4. 重复:重复高斯滤波和下采样步骤,直到达到所需的层数或图像尺寸过小。

<2> 拉普拉斯金字塔

  1. 生成高斯金字塔:先创建高斯金字塔。
  2. 上采样:将高斯金字塔的每层图像上采样到前一层的尺寸。
  3. 计算细节:用前一层的高斯图像减去上采样后的图像,得到拉普拉斯细节图像。
  4. 最后一层:拉普拉斯金字塔的最后一层即为高斯金字塔的最后一层。

 

4.图像金字塔的作用

<1> 特征点提取

  • 图像金字塔允许在不同尺度下检测特征点,提高特征点检测的尺度不变性

<2> 模板匹配

  • 图像金字塔帮助处理不同尺度的模板匹配问题,提高匹配的准确性

<3> 光流跟踪

  • 通过在不同尺度层中估计光流,图像金字塔帮助处理大范围的运动,提高光流估计的精度

 

二、图像金字塔中的操作

1.向下采样

        向金字塔顶部移动时,图像的尺寸和分辨率都不断地降低。通常情况下,每向上移动一级,图像的宽和高都降低为原来的1/2

<1> 步骤

  1. 高斯滤波(减少高频噪声)         
  2. 删除其偶数行和偶数列(所以所用图像一般高宽都是偶数)

<2> 图示

 

2.向上采样

        通常将图像的宽度和高度都变为原来的2倍。这意味着,向上采样的结果图像的大小是原始图像的4倍。因此,要在结果图像中补充大量的像素点。对新生成的像素点进行赋值的行为,称为插值

<1> 步骤

  1. 插值         
  2. 高斯滤波(减少由于插值产生的人工边界和不自然的过渡)

<2> 图示

 

3.注意--无法复原

        通过以上分析可知,向上采样和向下采样是相反的两种操作。但是,由于向下采样丢失像素值,所以这两种操作是不可逆的。也就是说,对一幅图像先向上采样、再向下采样,是无法恢复其原始状态的;同样,对一幅图像先向下采样、再向上采样也无法恢复到原始状态

 

三、代码实现

1.高斯金字塔向下采样

  • 使用cv2.pyrDown()函数实现向下采样
import cv2  # opencv读取的格式是BGR2# 高斯金字塔操作中的向下采样
# 下采样 是一种减小图像尺寸的方法,它通常涉及到降低图像的分辨率,即减少图像中像素的数量,从而使图像看起来更小
# 上釆样 是一种增大图像尺寸的方法,它通过插值和滤波技术来恢复图像的分辨率和细节,通常用于图像放大或者与下采样后的图像进行比较。
# resize函数 是一种通用的图像尺寸调整方法,它可以按照指定的目标尺寸来缩放图像,不涉及金字塔结构或者特定的滤波操作。
# dst = cv2.pyrDown(src [,dst, dstsize [, borderType] ])
# dst:目标图像
# src:原始图像
# dstsize:目标图像的大小
face = cv2.imread('face.jpg')  # G0
face = cv2.resize(face, (400, 400))
cv2.imshow('face', face)
cv2.waitKey(0)# 向下采样
face_down_1 = cv2.pyrDown(face)  # 下采样G1
cv2.imshow('face_down_1', face_down_1)
cv2.waitKey(0)
face_down_2 = cv2.pyrDown(face_down_1)  # G2
cv2.imshow('face_down_2', face_down_2)
cv2.waitKey(0)

输出:

  • 可以看出来图像的宽高逐层减半

 

2.高斯金字塔向上采样

  • 使用cv2.pyrUp()函数实现向上采样
  • 默认双线性插值法
import cv2  # opencv读取的格式是BGR2# 高斯金字塔操作中的向上采样
# dst = cv2.pyrUp(src [,dst, dstsize [, borderType] ])
# dst:目标图像
# #src:原始图像
# dstsize:目标图像的大小
face = cv2.imread('face.jpg')  # G0
face = cv2.resize(face, (400, 400))
cv2.imshow('face', face)
cv2.waitKey(0)
face_up_1 = cv2.pyrUp(face)
cv2.imshow('face_up_1', face_up_1)  # G1
cv2.waitKey(0)
face_up_2 = cv2.pyrUp(face_up_1)
cv2.imshow('face_up_2', face_up_2)  # G2
cv2.waitKey(0)
cv2.destroyAllWindows()

输出:

  • 可以看到向上采样之后的图像宽高逐层变成2倍

 

3.无法复原

# 对下采样后图像进行上采样,图像变模糊,无法复原
# 对上采样后图像进行下采样,图像变模糊,无法复原
face_down_1_up = cv2.pyrUp(face_down_1)  # 下采样G1
face_up_1_down = cv2.pyrDown(face_up_1)  # 上采样G1
cv2.imshow('yuantu', face)
cv2.imshow('down_1_up', face_down_1_up)
cv2.imshow('up_1_down', face_up_1_down)
cv2.waitKey(0)
cv2.destroyAllWindows()

输出:

  • 可以看到两种操作之后的图像大小与原图一样
  • 但是清晰度却比原图差了不少

 

4.拉普拉斯金字塔

# 拉普拉斯金字塔
face_down_2_up = cv2.pyrUp(face_down_2) 
L0 = face - face_down_1_up
L1 = face_down_1 - face_down_2_up
fuyuan = face_down_1_up + L0
cv2.imshow('L0', L0)
cv2.imshow('L1', L1)
cv2.imshow('fuyuan', fuyuan)
cv2.waitKey(0)

输出:

  • 可以看到拉普拉斯金字塔的复原效果还是不错的
  • 我这里使用的是彩色图片,所以拉普拉斯图像是彩色的
  • 如果使用的图片是灰度图,那么就是黑白的

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 《Nginx核心技术》第16章:实现Nginx的高可用负载均衡
  • HDMI彩条显示——FPGA学习笔记12
  • 从基础到进阶:利用EasyCVR安防视频汇聚平台实现高效视频监控系统的五步走
  • 物业小程序|提升管理效率,打造智慧物业社区
  • mysql学习教程,从入门到精通,MySQL 子查询 子句(11)
  • 恐怖类游戏智能体————恐怖探险家
  • 使用PHP和MQTT构建高效的物联网数据转发服务器流程
  • 基于SpringBoot+Vue的美妆购物系统
  • LAMP环境下项目部署
  • 前端Excel热成像数据展示及插值算法
  • ARM32开发——DMA
  • 011. Oracle-约束
  • 【设计模式】UML类图和六大设计原则
  • [基于 Vue CLI 5 + Vue 3 + Ant Design Vue 4 搭建项目] 08 创建项目的目录结构介绍
  • ggplot2 缩小的/一般长度的、带箭头的坐标轴 | R语言
  • 77. Combinations
  • Angularjs之国际化
  • HTML-表单
  • Java知识点总结(JDBC-连接步骤及CRUD)
  • linux安装openssl、swoole等扩展的具体步骤
  • Logstash 参考指南(目录)
  • php中curl和soap方式请求服务超时问题
  • React 快速上手 - 07 前端路由 react-router
  • thinkphp5.1 easywechat4 微信第三方开放平台
  • vue从创建到完整的饿了么(11)组件的使用(svg图标及watch的简单使用)
  • 等保2.0 | 几维安全发布等保检测、等保加固专版 加速企业等保合规
  • 动手做个聊天室,前端工程师百无聊赖的人生
  • 读懂package.json -- 依赖管理
  • 翻译 | 老司机带你秒懂内存管理 - 第一部(共三部)
  • 紧急通知:《观止-微软》请在经管柜购买!
  • 前端攻城师
  • 前嗅ForeSpider采集配置界面介绍
  • 浅谈Golang中select的用法
  • 如何将自己的网站分享到QQ空间,微信,微博等等
  • 如何进阶一名有竞争力的程序员?
  • 软件开发学习的5大技巧,你知道吗?
  • 设计模式走一遍---观察者模式
  • 数组的操作
  • CMake 入门1/5:基于阿里云 ECS搭建体验环境
  • 阿里云服务器购买完整流程
  • 哈罗单车融资几十亿元,蚂蚁金服与春华资本加持 ...
  • !!java web学习笔记(一到五)
  • # 服务治理中间件详解:Spring Cloud与Dubbo
  • #【QT 5 调试软件后,发布相关:软件生成exe文件 + 文件打包】
  • $refs 、$nextTic、动态组件、name的使用
  • (02)Cartographer源码无死角解析-(03) 新数据运行与地图保存、加载地图启动仅定位模式
  • (超简单)使用vuepress搭建自己的博客并部署到github pages上
  • (翻译)terry crowley: 写给程序员
  • (免费领源码)Java#ssm#MySQL 创意商城03663-计算机毕业设计项目选题推荐
  • (淘宝无限适配)手机端rem布局详解(转载非原创)
  • (转)IIS6 ASP 0251超过响应缓冲区限制错误的解决方法
  • (转)Spring4.2.5+Hibernate4.3.11+Struts1.3.8集成方案一
  • (转载)虚幻引擎3--【UnrealScript教程】章节一:20.location和rotation
  • ./indexer: error while loading shared libraries: libmysqlclient.so.18: cannot open shared object fil
  • .Mobi域名介绍