当前位置：首页 > news >正文

从零开始学cv-5：图像的仿射变换

news 来源：原创 2024/9/19 9:50:07

文章目录

一，简介：
二，图像仿射变换详解
- 2.1，图像平移：
- 2.2 ，图像旋转：
- 2.3，仿射变换：

一，简介：

仿射变换（Affine Transformation 或 Affine Map）是一种将二维坐标（x, y）映射到另一组二维坐标（u, v）的线性变换。在这种变换中，坐标点的相对位置和属性保持不变，即变换是保持直线平行性和直线交点不变的。仿射变换主要包括以下几种基本操作：平移、旋转、镜像、缩放、翻转和错切。

二，图像仿射变换详解

具体来说，仿射变换的过程可以描述为以下几种情况：

● 平移：将图像沿某个方向移动一定距离。
● 旋转：围绕某个点将图像旋转一定角度。
● 镜像：以某条线为轴，将图像进行对称翻转。
● 缩放：按照一定比例增大或缩小图像。
● 翻转：将图像沿水平或垂直方向进行翻转。
● 错切：沿某一方向倾斜图像，使得图像的一侧发生平移，而另一侧保持不动。

以下图所示，可以直观地展示这些仿射变换的效果。需要注意的是，虽然仿射变换是线性的，但它包括了非线性成分（如错切），因为它可以表示为线性变换的组合，并附加一个平移项。
在这里插入图片描述
在opencv_python中，实现放射变换的函数为：
cv2.warpAffine(img,M，size,flags,borderMode,borderValue)
函数说明：可以通过构建不同的M矩阵以及设置不同的参数来实现不同的仿射变换效果.

参数说明：
img：输入图像，可以是灰度图像或彩色图像。
M：一个 2×3 的变换矩阵，用于定义仿射变换。
size：输出图像的大小，格式为 (width, height)。
flags：插值方法标志，用于确定如何计算输出图像的像素值。常见的插值方法包括：
cv2.INTER_NEAREST：最近邻插值。
cv2.INTER_LINEAR：双线性插值（默认值）。
cv2.INTER_AREA：使用像素区域关系进行重采样。
cv2.INTER_CUBIC：双三次插值。
cv2.INTER_LANCZOS4：Lanczos 插值。
borderMode：边界模式，用于处理边界外的像素。默认值为 cv2.BORDER_CONSTANT。其他选项包括：
cv2.BORDER_REPLICATE：复制边界像素。
cv2.BORDER_REFLECT：反射边界像素。
cv2.BORDER_REFLECT101：反射边界像素，不包括边缘。
cv2.BORDER_WRAP：包裹模式。
borderValue：当 borderMode 为 cv2.BORDER_CONSTANT 时，用于填充边界外的像素的值。默认值为 (0, 0, 0)，对于灰度图像是单一值，对于彩色图像是三个值。
borderValue - 边界填充值; 默认情况下，它为0
其中：M作为仿射变换矩阵，一般反映平移或旋转的关系，为InputArray类型的2×3的变换放射变换的构建可以遵循下图

简而言之，cv2.warpAffine 函数通过指定的变换矩阵 M 对输入图像 img 进行仿射变换，生成指定大小 size 的新图像，并使用指定的插值方法和边界模式来处理变换过程中的像素计算和边界问题。

2.1，图像平移：

将图像中所有的点按照指定的平移量水平或者垂直移动。根据上图中可知，要想实现图像平移操作，需要设置移动的距离X，Y
在这里插入图片描述
代码实现：

import cv2
import numpy as np
img = cv2.resize(cv2.imread(r'D:\pythonProject\13.jpg'), (256,256))
# 构造移动矩阵H
# 在x轴方向移动多少距离，在y轴方向移动多少距离
H = np.float32([[1, 0, 100], [0, 1, 100]])
rows, cols = img.shape[:2]
# 注意这里rows和cols需要反置，即先列后行
res = cv2.warpAffine(img, H, (cols*2, rows*2))  # 输出dsize必须大于原图，不然平移的时候会丢失像素
cv2.imshow('origin_picture', img)
cv2.imshow('new_picture', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

效果：
原图：
在这里插入图片描述
效果图：

图像从原始位置像右下方移动了100个像素

2.2 ，图像旋转：

以图像的中心为原点，旋转一定的角度，也就是将图像上的所有像素都旋转一个相同的角度。旋转后图像的大小一般会改变，即可以把转出显示区域的图像截去，或者扩大图像范围来显示图像的所有部分。图像旋转的仿射矩阵m的构建如下所示：
在这里插入图片描述
此仿射矩阵的构建需要确定旋转角度的正弦和余弦值，相对平移而言稍显麻烦，所以opencv提供了一个简单的获取仿射矩阵的方法cv2.getRotationMatrix2D(center, angle, scale)
参数说明：

center：旋转的中心点坐标，格式为 (centerX, centerY)。
angle：旋转角度，正值表示逆时针旋转，负值表示顺时针旋转，单位为度。
scale：图像缩放比例，如果 scale 为 1，则图像大小保持不变；如果 scale 大于 1，图像放大；如果 scale 小于 1，图像缩小。
返回值：返回一个 2×3 的变换矩阵，可以传递给 cv2.warpAffine 函数来对图像进行旋转

代码：

import cv2
import numpy as np
img = cv2.resize(cv2.imread(r'D:\pythonProject\13.jpg'), (256,256))
# 构造移动矩阵Hrows, cols = img.shape[:2]
M = cv2.getRotationMatrix2D((cols/2, rows/2), 45, 1)  # 旋转中心为图像中点，角度为四十五度，逆时针旋转炳保持原大小
# 注意这里rows和cols需要反置，即先列后行
res = cv2.warpAffine(img, M, (cols*2, rows*2))  # 输出dsize必须大于原图，不然平移的时候会丢失像素
cv2.imshow('origin_picture', img)
cv2.imshow('new_picture', res)
cv2.waitKey(0)
cv2.destroyAllWindows()

效果：
在这里插入图片描述

2.3，仿射变换：

仿射变换是线性变换，除了简单的进行单独使用，还可以将其中的几种结合在一起实现新的仿射变换，但若执行的操作很多，相应要构造的仿射矩阵也会更复杂，所以OpenCV提供了一个求仿射变换矩阵的函数：cv2.getAffineTransform( src, dst )：
cv2.getAffineTransform 用于计算从一个三角形到另一个三角形的仿射变换矩阵。这个矩阵可以用来进行图像的仿射变换，如平移、旋转、缩放和剪切。cv2.getAffineTransform( src, dst )：
函数说明：

通过找原图像中三个点的坐标和变换图像的相应三个点坐标，创建一个2X3的矩阵。最后这个矩阵会被传给函数cv2.warpAffine()
功能：计算从一个二维三角形到另一个二维三角形的仿射变换矩阵。
参数：
src：源三角形三个顶点的坐标，格式为浮点数数组
dst：目标三角形三个顶点的坐标，格式与 src 相同。
返回值：返回一个
2×3 的仿射变换矩阵，可以传递给 cv2.warpAffine 函数来对图像进行变换。
简而言之，cv2.getAffineTransform 通过三个对应点的坐标来计算仿射变换矩阵。这三个点可以是任意位置，但通常它们被选为图像中的关键特征点，以确保变换后的图像与目标位置对齐。下面贴一张图片加深理解：

将左图三个点空间拉伸到右图三个点位置

代码：

import cv2
import numpy as npimg = cv2.imread(r'D:\pythonProject\13.jpg')
rows, cols, ch = img.shapepts1 = np.float32([[0, 0], [200, 50], [50, 200]])
pts2 = np.float32([[10, 100], [200, 50], [100, 250]])
M = cv2.getAffineTransform(pts1, pts2)
dst = cv2.warpAffine(img, M, (cols, rows))cv2.imshow("dst", dst)
cv2.waitKey(0)