当前位置: 首页 > news >正文

OpenCV||超详细的几何变换

2D图像几何变换的3×3矩阵:

图像常见的几何变换:

 图像来源:《OpenCV 4.5计算机视觉开发实战:基于Python》作者:朱文伟 李建英;

1. 平移(Translation)

在OpenCV中,平移不是直接通过一个函数完成的,而是先通过创建一个平移矩阵,然后使用warpAffine函数应用这个矩阵。

cv2.getTranslationMatrix2D(center, offset, scale)

  • center:源图像中的变换中心。
  • offset:沿x和y方向移动的距离。
  • scale:通常设置为1.0,因为平移不涉及缩放。

返回的矩阵然后传递给warpAffine函数进行实际的平移操作。

2. 旋转(Rotation)

cv2.getRotationMatrix2D(center, angle, scale)

  • center:旋转中心。
  • angle:旋转角度,以度为单位。正值表示逆时针旋转。
  • scale:图像缩放比例。

这个函数返回一个2x3的旋转矩阵,该矩阵可以传递给warpAffine进行图像的旋转。

图像旋转后显示完整图像示例代码

import cv2  
import numpy as np  def rotate_image(image, angle):  # 获取图像尺寸  (h, w) = image.shape[:2]  # 计算图像中心  center = (w // 2, h // 2)  # 获取旋转矩阵(注意角度需要转换为弧度)  M = cv2.getRotationMatrix2D(center, angle, 1.0)  # 计算旋转后图像的边界框  cos = np.abs(M[0, 0])  sin = np.abs(M[0, 1])  nW = int((h * sin) + (w * cos))  nH = int((h * cos) + (w * sin))  # 调整旋转矩阵以考虑平移  M[0, 2] += (nW / 2) - center[0]  M[1, 2] += (nH / 2) - center[1]  # 执行旋转  rotated = cv2.warpAffine(image, M, (nW, nH))  return rotated  # 读取图像  
image = cv2.imread('your_image.jpg')  # 旋转图像,例如旋转45度  
rotated_image = rotate_image(image, 45)  # 显示原始和旋转后的图像  
cv2.imshow("Original Image", image)  
cv2.imshow("Rotated Image", rotated_image)  
cv2.waitKey(0)  
cv2.destroyAllWindows()

3. 缩放(Resizing)

缩放通常使用resize函数,而不是通过几何变换矩阵。

cv2.resize(src, dsize, fx=0, fy=0, interpolation=cv2.INTER_LINEAR)

  • src:输入图像。
  • dsize:输出图像的大小。这是一个宽度和高度的元组。如果它是零,则通过fxfy计算大小。
  • fxfy:沿x轴和y轴的缩放比例。
  • interpolation:插值方法,用于确定如何计算输出图像中的像素值。

4. 仿射变换(Affine Transformation)

仿射变换是一个更一般的变换,包括旋转、平移、缩放和倾斜。

cv2.warpAffine(src, M, dsize, flags=cv2.INTER_LINEAR, borderMode=cv2.BORDER_CONSTANT, borderValue=(0,0,0))

  • src:输入图像。
  • M:2x3的变换矩阵。
  • dsize:输出图像的大小。
  • flags:插值方法。
  • borderMode:边界像素模式。
  • borderValue:当borderMode=cv2.BORDER_CONSTANT时,边界像素的值。

5. 透视变换(Perspective Transformation)

透视变换用于从一个视角转换到另一个视角,需要一个3x3的变换矩阵。

cv2.warpPerspective(src, M, dsize, flags=cv2.INTER_LINEAR, borderMode=cv2.BORDER_CONSTANT, borderValue=(0,0,0))

  • 参数与warpAffine相似,但M是一个3x3的透视变换矩阵。

6 图像金字塔(Image Pyramid)

在Python的OpenCV库中,图像金字塔(Image Pyramid)是一种用于图像多尺度表达的有效结构,主要用于图像特征检测、图像分割和图像压缩等领域。图像金字塔通过逐步减小图像的分辨率来创建一系列图像,这些图像以金字塔形状排列,层级越高,图像越小,分辨率越低。

OpenCV提供了两个主要的函数来实现图像金字塔的构建:cv2.pyrDown()cv2.pyrUp()

1. cv2.pyrDown(src[, dst[, dstsize[, borderType]]])

功能:对图像进行下采样(缩小),生成图像金字塔的下一层。

参数解释

  • src:输入图像,即当前层的图像。
  • dst:输出图像,即下采样后的图像。这是一个可选参数,如果提供,则输出图像会存储在这里。
  • dstsize:输出图像的大小。如果此参数为0(默认值),则输出图像的尺寸将是输入图像尺寸的一半(宽度和高度都减半)。
  • borderType:边界像素的插值方法。在大多数情况下,使用默认值cv2.BORDER_DEFAULT即可。

返回值:下采样后的图像。如果提供了dst参数,则函数返回None;否则,返回下采样后的图像。

2. cv2.pyrUp(src[, dst[, dstsize[, borderType]]])

功能:对图像进行上采样(放大),尝试从图像金字塔的下一层重建当前层。但需要注意的是,上采样并不是下采样的完全逆操作,因为上采样过程中会丢失一些信息,导致重建的图像比原始图像模糊。

参数解释

  • src:输入图像,即金字塔下一层的图像。
  • dst:输出图像,即上采样后的图像。这是一个可选参数,如果提供,则输出图像会存储在这里。
  • dstsize:输出图像的大小。如果此参数为0(默认值),则输出图像的尺寸将是输入图像尺寸的两倍(宽度和高度都加倍)。但通常建议明确指定dstsize,以匹配原始图像的尺寸或所需的尺寸。
  • borderType:边界像素的插值方法。在大多数情况下,使用默认值cv2.BORDER_DEFAULT即可。

返回值:上采样后的图像。如果提供了dst参数,则函数返回None;否则,返回上采样后的图像。

7 图像翻转(Flipping) 

cv2.flip(src, flipCode)
  • src:输入图像,即你想要翻转的图像。
  • flipCode:指定翻转方向的标志。它是一个整数,决定了图像翻转的方式。
    • flipCode为0时,表示沿x轴翻转(即上下翻转),实际上这并不会改变图像,因为x轴是水平的,而翻转通常是相对于垂直轴(y轴)或水平轴(但在这里不适用,因为x轴翻转在视觉上没有效果,除非你改变了坐标系统的解释)。但这里通常理解为参数设置错误或不适用于此上下文。
    • flipCode > 0时(通常是1),表示沿y轴翻转(即左右翻转)。
    • flipCode < 0时(通常是-1),表示沿x轴和y轴同时翻转(即上下左右翻转,相当于180度旋转)。
import cv2  # 读取图像  
img = cv2.imread('your_image_path.jpg')  # 左右翻转图像  
flipped_img_lr = cv2.flip(img, 1)  # 上下左右翻转图像(180度旋转)  
flipped_img_udlr = cv2.flip(img, -1)  # 显示原图和翻转后的图像  
cv2.imshow('Original Image', img)  
cv2.imshow('Flipped Left-Right', flipped_img_lr)  
cv2.imshow('Flipped Up-Down and Left-Right', flipped_img_udlr)  cv2.waitKey(0)  
cv2.destroyAllWindows()

8 极坐标变换(Polar Transformation)

极坐标变换通常需要将图像的笛卡尔坐标(x, y)转换为极坐标(ρ, θ)。在OpenCV中,没有直接的函数来完成这个转换,但你可以通过以下步骤实现:

  1. 计算每个像素的极坐标:这通常涉及到遍历图像的每个像素,并计算其对应的ρ和θ值。

  2. 重新映射到极坐标网格:由于极坐标网格在ρ=0附近是密集的,而在ρ较大时变得稀疏,因此你可能需要创建一个新的图像,其大小取决于你想要的ρ和θ的分辨率。

  3. 插值:将原图像中的像素值映射到新的极坐标网格时,可能需要进行插值,因为源像素和目标像素之间可能不会一一对应。

由于这个过程比较复杂,且OpenCV没有直接提供这样的函数,因此通常需要自己编写代码来实现。

9 逆极坐标变换(Inverse Polar Transformation)

逆极坐标变换是极坐标变换的逆过程,即将极坐标(ρ, θ)转换回笛卡尔坐标(x, y)。同样,OpenCV没有直接的函数来完成这个转换,但你可以通过以下步骤来近似实现:

  1. 确定目标图像的大小:这取决于你想要的输出图像的分辨率。

  2. 计算每个目标像素的笛卡尔坐标:这通常是通过遍历目标图像的每个像素,并将其(x, y)坐标计算出来。

  3. 转换到极坐标:将(x, y)坐标转换为(ρ, θ),以便你可以从原始极坐标图像中检索对应的像素值。

  4. 插值:由于极坐标和笛卡尔坐标之间的映射可能不是一一对应的,因此你可能需要使用插值方法来获取最终的像素值。

链接跳转:

章节一、OpenCV||超细节的基本操作

章节二、OpenCV||超简略的Numpy小tip

章节三、OpenCV||超详细的图像处理模块

章节四、OpenCV||超详细的灰度变换和直方图修正

章节五、OpenCV||超详细的图像平滑

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • C#初级——方法/函数(ref 和 out关键字)(引用传参和输出传参)
  • Linux|最佳命令行下载加速器
  • 【C语言】分支与循环(循环篇)——结尾猜数字游戏实现
  • zlm-openRtpServer使用
  • 全面解锁:通过JSP和Ajax实现钉钉签到数据展示及部门筛选功能
  • TypeScript 迭代器和生成器详解
  • Python venv 虚拟环境
  • kafka从浅入深
  • #进阶:轻量级ORM框架Dapper的使用教程与原理详解
  • 基于MFC对话框吸管实验
  • 嵌入式初学-C语言-练习三
  • 【51单片机仿真】基于51单片机设计的整数/小数计算器系统仿真源码文档——文末资料下载
  • Leetcode第136场双周赛题解(c++)
  • 云原生应用程序简介
  • 《计算机网络》(第8版)第1章 概述 复习笔记
  • JavaScript/HTML5图表开发工具JavaScript Charts v3.19.6发布【附下载】
  • JavaScript学习总结——原型
  • JS正则表达式精简教程(JavaScript RegExp 对象)
  • Mithril.js 入门介绍
  • mysql外键的使用
  • nodejs调试方法
  • Python语法速览与机器学习开发环境搭建
  • React16时代,该用什么姿势写 React ?
  • React的组件模式
  • underscore源码剖析之整体架构
  • vue数据传递--我有特殊的实现技巧
  • 创建一种深思熟虑的文化
  • 官方解决所有 npm 全局安装权限问题
  • 蓝海存储开关机注意事项总结
  • 前端面试题总结
  • 前嗅ForeSpider中数据浏览界面介绍
  • 推荐一个React的管理后台框架
  • 微信开放平台全网发布【失败】的几点排查方法
  • 优化 Vue 项目编译文件大小
  • 远离DoS攻击 Windows Server 2016发布DNS政策
  • 怎么将电脑中的声音录制成WAV格式
  • 最简单的无缝轮播
  • LevelDB 入门 —— 全面了解 LevelDB 的功能特性
  • 树莓派用上kodexplorer也能玩成私有网盘
  • ​插件化DPI在商用WIFI中的价值
  • #laravel部署安装报错loadFactoriesFrom是undefined method #
  • #pragma 指令
  • (12)Hive调优——count distinct去重优化
  • (9)目标检测_SSD的原理
  • (C语言)求出1,2,5三个数不同个数组合为100的组合个数
  • (Redis使用系列) SpringBoot 中对应2.0.x版本的Redis配置 一
  • ***测试-HTTP方法
  • ***汇编语言 实验16 编写包含多个功能子程序的中断例程
  • *setTimeout实现text输入在用户停顿时才调用事件!*
  • .NET C#版本和.NET版本以及VS版本的对应关系
  • .net core webapi 部署iis_一键部署VS插件:让.NET开发者更幸福
  • .net refrector
  • .NET/C# 使用 SpanT 为字符串处理提升性能
  • .NET6 开发一个检查某些状态持续多长时间的类
  • .NET版Word处理控件Aspose.words功能演示:在ASP.NET MVC中创建MS Word编辑器