当前位置: 首页 > news >正文

从零开始学cv-5: 图像的仿射变换

文章目录

  • 一,简介:
  • 二,图像仿射变换详解
    • 2.1,图像平移:
    • 2.2 ,图像旋转:
    • 2.3,仿射变换:


一,简介:

仿射变换(Affine Transformation 或 Affine Map)是一种将二维坐标(x, y)映射到另一组二维坐标(u, v)的线性变换。在这种变换中,坐标点的相对位置和属性保持不变,即变换是保持直线平行性和直线交点不变的。仿射变换主要包括以下几种基本操作:平移、旋转、镜像、缩放、翻转和错切。

二,图像仿射变换详解

具体来说,仿射变换的过程可以描述为以下几种情况:

● 平移:将图像沿某个方向移动一定距离。
● 旋转:围绕某个点将图像旋转一定角度。
● 镜像:以某条线为轴,将图像进行对称翻转。
● 缩放:按照一定比例增大或缩小图像。
● 翻转:将图像沿水平或垂直方向进行翻转。
● 错切:沿某一方向倾斜图像,使得图像的一侧发生平移,而另一侧保持不动。

以下图所示,可以直观地展示这些仿射变换的效果。需要注意的是,虽然仿射变换是线性的,但它包括了非线性成分(如错切),因为它可以表示为线性变换的组合,并附加一个平移项。
在这里插入图片描述
在opencv_python中,实现放射变换的函数为:
cv2.warpAffine(img,M,size,flags,borderMode,borderValue)
函数说明:可以通过构建不同的M矩阵以及设置不同的参数来实现不同的仿射变换效果.

参数说明:
img:输入图像,可以是灰度图像或彩色图像。
M:一个 2×3 的变换矩阵,用于定义仿射变换。
size:输出图像的大小,格式为 (width, height)。
flags:插值方法标志,用于确定如何计算输出图像的像素值。常见的插值方法包括:
cv2.INTER_NEAREST:最近邻插值。
cv2.INTER_LINEAR:双线性插值(默认值)。
cv2.INTER_AREA:使用像素区域关系进行重采样。
cv2.INTER_CUBIC:双三次插值。
cv2.INTER_LANCZOS4:Lanczos 插值。
borderMode:边界模式,用于处理边界外的像素。默认值为 cv2.BORDER_CONSTANT。其他选项包括:
cv2.BORDER_REPLICATE:复制边界像素。
cv2.BORDER_REFLECT:反射边界像素。
cv2.BORDER_REFLECT101:反射边界像素,不包括边缘。
cv2.BORDER_WRAP:包裹模式。
borderValue:当 borderMode 为 cv2.BORDER_CONSTANT 时,用于填充边界外的像素的值。默认值为 (0, 0, 0),对于灰度图像是单一值,对于彩色图像是三个值。
borderValue - 边界填充值; 默认情况下,它为0
其中:M作为仿射变换矩阵,一般反映平移或旋转的关系,为InputArray类型的2×3的变换放射变换的构建可以遵循下图
在这里插入图片描述
简而言之,cv2.warpAffine 函数通过指定的变换矩阵 M 对输入图像 img 进行仿射变换,生成指定大小 size 的新图像,并使用指定的插值方法和边界模式来处理变换过程中的像素计算和边界问题。

2.1,图像平移:

将图像中所有的点按照指定的平移量水平或者垂直移动。根据上图中可知,要想实现图像平移操作,需要设置移动的距离X,Y
在这里插入图片描述
代码实现:

import cv2
import numpy as np
img = cv2.resize(cv2.imread(r'D:\pythonProject\13.jpg'), (256,256))
# 构造移动矩阵H
# 在x轴方向移动多少距离,在y轴方向移动多少距离
H = np.float32([[1, 0, 100], [0, 1, 100]])
rows, cols = img.shape[:2]
# 注意这里rows和cols需要反置,即先列后行
res = cv2.warpAffine(img, H, (cols*2, rows*2))  # 输出dsize必须大于原图,不然平移的时候会丢失像素
cv2.imshow('origin_picture', img)
cv2.imshow('new_picture', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

效果:
原图:
在这里插入图片描述
效果图:
在这里插入图片描述
图像从原始位置像右下方移动了100个像素

2.2 ,图像旋转:

以图像的中心为原点,旋转一定的角度,也就是将图像上的所有像素都旋转一个相同的角度。旋转后图像的大小一般会改变,即可以把转出显示区域的图像截去,或者扩大图像范围来显示图像的所有部分。图像旋转的仿射矩阵m的构建如下所示:
在这里插入图片描述
此仿射矩阵的构建需要确定旋转角度的正弦和余弦值,相对平移而言稍显麻烦,所以opencv提供了一个简单的获取仿射矩阵的方法cv2.getRotationMatrix2D(center, angle, scale)
参数说明:

center:旋转的中心点坐标,格式为 (centerX, centerY)。
angle:旋转角度,正值表示逆时针旋转,负值表示顺时针旋转,单位为度。
scale:图像缩放比例,如果 scale 为 1,则图像大小保持不变;如果 scale 大于 1,图像放大;如果 scale 小于 1,图像缩小。
返回值:返回一个 2×3 的变换矩阵,可以传递给 cv2.warpAffine 函数来对图像进行旋转

代码:

import cv2
import numpy as np
img = cv2.resize(cv2.imread(r'D:\pythonProject\13.jpg'), (256,256))
# 构造移动矩阵Hrows, cols = img.shape[:2]
M = cv2.getRotationMatrix2D((cols/2, rows/2), 45, 1)  # 旋转中心为图像中点,角度为四十五度,逆时针旋转炳保持原大小
# 注意这里rows和cols需要反置,即先列后行
res = cv2.warpAffine(img, M, (cols*2, rows*2))  # 输出dsize必须大于原图,不然平移的时候会丢失像素
cv2.imshow('origin_picture', img)
cv2.imshow('new_picture', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

效果:
在这里插入图片描述

2.3,仿射变换:

仿射变换是线性变换,除了简单的进行单独使用,还可以将其中的几种结合在一起实现新的仿射变换,但若执行的操作很多,相应要构造的仿射矩阵也会更复杂,所以OpenCV提供了一个求仿射变换矩阵的函数:cv2.getAffineTransform( src, dst ):
cv2.getAffineTransform 用于计算从一个三角形到另一个三角形的仿射变换矩阵。这个矩阵可以用来进行图像的仿射变换,如平移、旋转、缩放和剪切。cv2.getAffineTransform( src, dst ):
函数说明:

通过找原图像中三个点的坐标和变换图像的相应三个点坐标,创建一个2X3的矩阵。最后这个矩阵会被传给函数cv2.warpAffine()
功能:计算从一个二维三角形到另一个二维三角形的仿射变换矩阵。
参数:
src:源三角形三个顶点的坐标,格式为浮点数数组
dst:目标三角形三个顶点的坐标,格式与 src 相同。
返回值:返回一个
2×3 的仿射变换矩阵,可以传递给 cv2.warpAffine 函数来对图像进行变换。
简而言之,cv2.getAffineTransform 通过三个对应点的坐标来计算仿射变换矩阵。这三个点可以是任意位置,但通常它们被选为图像中的关键特征点,以确保变换后的图像与目标位置对齐。下面贴一张图片加深理解:
在这里插入图片描述
将左图三个点空间拉伸到右图三个点位置

代码:

import cv2
import numpy as npimg = cv2.imread(r'D:\pythonProject\13.jpg')
rows, cols, ch = img.shapepts1 = np.float32([[0, 0], [200, 50], [50, 200]])
pts2 = np.float32([[10, 100], [200, 50], [100, 250]])
M = cv2.getAffineTransform(pts1, pts2)
dst = cv2.warpAffine(img, M, (cols, rows))cv2.imshow("dst", dst)
cv2.waitKey(0)

效果:
在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • FlinkCEP - Flink的复杂事件处理详解
  • 推荐使用阿贝云免费云服务器、免费虚拟主机
  • docker GBase 8sV8.8使用的常见错误
  • pip出问题了,重装,获取python3.7 get-pip.py
  • python(7) : Windows守护python程序
  • 《Cloud Native Data Center Networking》(云原生数据中心网络设计)读书笔记 -- 07数据中心的边缘
  • 医学装备(即设备全生命周期)管理系统背景及必要性
  • 如何选择需求跟踪管理软件?8款优质推荐
  • 一款功能强大的本地数据全文搜索引擎Anytxt Searcher
  • 基于ssm+vue+uniapp的医院挂号预约系统小程序
  • 爬虫笔记21——DrissionPage自动化框架的使用
  • 30秒内批量删除git本地分支
  • 干货| Python日常高频写法总结
  • 【图文教程】Hexo+GitHubPages搭建个人博客
  • Matlab处理H5文件
  • “寒冬”下的金三银四跳槽季来了,帮你客观分析一下局面
  • Android开源项目规范总结
  • Apache Spark Streaming 使用实例
  • AzureCon上微软宣布了哪些容器相关的重磅消息
  • CAP理论的例子讲解
  • Django 博客开发教程 8 - 博客文章详情页
  • Dubbo 整合 Pinpoint 做分布式服务请求跟踪
  • JavaScript服务器推送技术之 WebSocket
  • k个最大的数及变种小结
  • QQ浏览器x5内核的兼容性问题
  • rabbitmq延迟消息示例
  • Sass 快速入门教程
  • springboot_database项目介绍
  • SQLServer之索引简介
  • TypeScript迭代器
  • vue和cordova项目整合打包,并实现vue调用android的相机的demo
  • 前端性能优化--懒加载和预加载
  • 如何在 Tornado 中实现 Middleware
  • 新书推荐|Windows黑客编程技术详解
  • 一加3T解锁OEM、刷入TWRP、第三方ROM以及ROOT
  • 运行时添加log4j2的appender
  • ### Cause: com.mysql.jdbc.exceptions.jdbc4.MySQLTr
  • #VERDI# 关于如何查看FSM状态机的方法
  • #周末课堂# 【Linux + JVM + Mysql高级性能优化班】(火热报名中~~~)
  • (附源码)ssm失物招领系统 毕业设计 182317
  • (回溯) LeetCode 77. 组合
  • (机器学习的矩阵)(向量、矩阵与多元线性回归)
  • (七)c52学习之旅-中断
  • (五)activiti-modeler 编辑器初步优化
  • (转)JVM内存分配 -Xms128m -Xmx512m -XX:PermSize=128m -XX:MaxPermSize=512m
  • (转)PlayerPrefs在Windows下存到哪里去了?
  • (转)关于如何学好游戏3D引擎编程的一些经验
  • (转)平衡树
  • (转)树状数组
  • ***原理与防范
  • *2 echo、printf、mkdir命令的应用
  • .net 怎么循环得到数组里的值_关于js数组
  • .net后端程序发布到nignx上,通过nginx访问
  • .net解析传过来的xml_DOM4J解析XML文件
  • .NET开源快速、强大、免费的电子表格组件