OpenCV仿射变换实现图像扭曲与旋转
创始人
2024-11-15 13:34:06
0

目录

1. 仿射变换

2. 仿射变换的求解

3. 代码实现

3.1 图像扭曲

3.2 图像旋转

参考内容


1. 仿射变换

仿射变换是一种可以表达为乘以一个矩阵(线性变换)再加上一个向量(平移)的变换。在几何中,就是将一个向量空间进行一次线性变化并接上一个平移。

因此我们可以用仿射变化表达如下内容:

  1. 旋转Rotations(线性变换,linear transformation);
  2. 平移Translations(矢量加,vector addition);
  3. 缩放操作Scale operations(线性变换)。

由此可见,在图像处理当中,仿射变换本质上反映了两个图像之间的关系。

我们通常使用2×3矩阵来表示仿射变换。

对于“乘以一个矩阵”的线性变换,我们引入矩阵A:

A=\left[\begin{matrix}a_{00}&a_{01}\\a_{10}&a_{11}\\\end{matrix}\right]

对于加法部分(平移),我们引入矩阵B:

B=\left[\begin{matrix}b_{00}\\b_{10}\\\end{matrix}\right]

设待转换的二维列向量为X,转换后的向量为T,则:

X=\left[\begin{matrix}x\\y\\\end{matrix}\right]

T=AX+B=A\cdot\left[\begin{matrix}x\\y\\\end{matrix}\right]+B

考虑齐次坐标和齐次矩阵更易于进行仿射几何变换,令:

M=[\begin{matrix}A&B\\\end{matrix}]=\begin{bmatrix} a_{00} & a_{01} & b_{00}\\ a_{10} & a_{11} & b_{10} \end{bmatrix}

二维向量X视作一个点,其齐次坐标表示为这样的列向量:

\left[\begin{matrix}x\\y\\1\\\end{matrix}\right]

这样,我们可以借助齐次坐标,把平移变量也通过一个矩阵表示,则有:

T=M\cdot\left[\begin{matrix}x\\y\\1\\\end{matrix}\right]

可见矩阵M就是我们所需要的仿射变换矩阵。

2. 仿射变换的求解

参考内容通过几何方式(三角形三个顶点的映射)描述仿射变换的求解过程,我们也可以用代数知识表达,对于不共线的三点,令:

T=\begin{bmatrix} {x}'\\ {y}' \end{bmatrix} =\begin{bmatrix} {x_0'} & {x_1'} & {x_2'} \\ {y_0'} & {y_1'} & {y_2'} \end{bmatrix}

X=\begin{bmatrix} {x}\\ {y} \end{bmatrix} =\begin{bmatrix} {x_0} & {x_1} & {x_2} \\ {y_0} & {y_1} & {y_2} \end{bmatrix}

方程

T=M\left[\begin{matrix}X\\1\\\end{matrix}\right]=M\left[\begin{matrix}x\\y\\1\\\end{matrix}\right]

其方程组形式为:

\left\{\begin{matrix} a_{00}x_0+a_{01}y_0+b_{00}={x_0'} \\ a_{10}x_0+a_{11}y_0+b_{10}={y_0'} \\ a_{00}x_1+a_{01}y_1+b_{00}={x_1'} \\ a_{10}x_1+a_{11}y_1+b_{10}={y_1'} \\ a_{00}x_2+a_{01}y_2+b_{00}={x_2'} \\ a_{10}x_2+a_{11}y_2+b_{10}={y_2'} \end{matrix}\right.

有唯一解,从而可以求出仿射矩阵M。

在OpenCV中,我们可以通过cv::getAffineTransform函数求解仿射矩阵或cv::getRotationMatrix2D,求解二维旋转矩阵。

Mat cv::getAffineTransform

(

InputArray

src,

InputArray

dst 

)

Python:

cv.getAffineTransform(

src, dst

) ->

retval

getRotationMatrix2D()

Mat cv::getRotationMatrix2D

(

Point2f

center,

double 

angle,

double 

scale 

)

inline

Python:

cv.getRotationMatrix2D(

center, angle, scale

) ->

retval

3. 代码实现

3.1 图像扭曲

#include "opencv2/imgcodecs.hpp" #include "opencv2/highgui.hpp" #include "opencv2/imgproc.hpp" #include   using namespace cv;  int main() {     // 读取图像     Mat src = imread("park.jpg");     if (src.empty())     {         std::cout << "Could not open or find the image!\n" << std::endl;         return -1;     }     // 选定三角形三个顶点     Point2f srcTri[3];     srcTri[0] = Point2f(0.f, 0.f);     srcTri[1] = Point2f(src.cols - 1.f, 0.f);     srcTri[2] = Point2f(0.f, src.rows - 1.f);     // 假定转换后的三个顶点坐标     Point2f dstTri[3];     dstTri[0] = Point2f(0.f, src.rows * 0.33f);     dstTri[1] = Point2f(src.cols * 0.55f, src.rows * 0.25f);     dstTri[2] = Point2f(src.cols * 0.35f, src.rows * 0.7f);     // 求解仿射矩阵     Mat warp_mat = getAffineTransform(srcTri, dstTri);     // 求解扭曲后的图像     Mat warp_dst;     warpAffine(src, warp_dst, warp_mat, src.size());      imshow("Warped Image", warp_dst);      waitKey(0);      return 0; }
# 图像扭曲 import cv2 import numpy as np  # 读取图像 img = cv2.imread('park.jpg')  # 图像扭曲 (rows, cols) = img.shape[:2] srcTri = np.array( [[0, 0], [img.shape[1] - 1, 0], [0, img.shape[0] - 1]] ).astype(np.float32) dstTri = np.array( [[0, img.shape[0]*0.33], [img.shape[1]*0.55, img.shape[0]*0.25], [img.shape[1]*0.35, img.shape[0]*0.7]] ).astype(np.float32) M = cv2.getAffineTransform(srcTri, dstTri) warped_img = cv2.warpAffine(img, M, (cols, rows))  # 显示旋转后的图像  cv2.imshow('Warped Image', warped_img)  # 等待用户输入并关闭窗口 cv2.waitKey(0) cv2.destroyAllWindows()

3.2 图像旋转

#include "opencv2/imgcodecs.hpp" #include "opencv2/highgui.hpp" #include "opencv2/imgproc.hpp" #include   using namespace cv;  int main() {     // 读取图像     Mat src = imread("park.jpg");     if (src.empty())     {         std::cout << "Could not open or find the image!\n" << std::endl;         return -1;     }     // 设置旋转中心、旋转角度和缩放比例     Point center = Point(src.cols / 2, src.rows / 2);     double angle = 35;     double scale = 0.5;     // 获取旋转矩阵     Mat rot_mat = getRotationMatrix2D(center, angle, scale);     // 旋转后的图像     Mat rotated_dst;     warpAffine(src, rotated_dst, rot_mat, src.size());         // 显示图像     imshow("Rotated Image", rotated_dst);      waitKey(0);      return 0; }
# 图像旋转 import cv2  # 读取图像 img = cv2.imread('park.jpg')  # 旋转图像 (rows, cols) = img.shape[:2] M = cv2.getRotationMatrix2D((cols/2, rows/2), 35, 0.5) rotated_img = cv2.warpAffine(img, M, (cols, rows))  # 显示旋转后的图像  cv2.imshow('Rotated Image', rotated_img)  # 等待用户输入并关闭窗口 cv2.waitKey(0) cv2.destroyAllWindows()

参考内容

OpenCV: Affine Transformations

注:OpenCV这个文档的示例代码中,C++代码和Python代码并不匹配,Python代码中的dstTri第一个点的y坐标,shape[1]应为shape[0](见本文示例代码)。

相关内容

热门资讯

AI大模型大厂面试真题:「20... AI大模型岗的大厂门槛又降低了!实在太缺人了,大模型岗位真的强烈建议各位...
计算机网络知识点面试总结4 #来自ウルトラマンゼロ(赛罗)1 传输层提供的服务1.1 功能传输层向它...
电脑启动CAD软件时出现闪屏问... 电脑打开CAD软件出现闪屏可能是由于显卡驱动问题、软件兼容性问题或系统资源不足等原因引起的。建议更新...
2024华为数通HCIP-da... 请注意,华为HCIP-Datacom考试831已变题请注意,华为HCIP...
如何找到e安全网站的官方网址? e安全网站的网址是:https://www.easyicon.net/【e安全网站网址是什么】(图片...
猪神与服务器之父之间有何神秘联... 猪神和服务器之父之间没有直接的关系。猪神通常指的是一个网络用语,用来形容某个人在某个领域非常厉害或者...
服务器及网络流量费用究竟指什么... 服务器及网络流量费用是指为维护和运行网站或在线服务所产生的成本。这包括租用服务器硬件资源的费用,以及...
高原上的数据中心,为何互联网巨... 互联网服务器不常设在高原的原因包括:极端气候影响设备稳定性,高海拔可能导致冷却效率降低和硬件故障率升...
spring boot + v... 1:准备工作        1.1:进入钉钉开放平台创建开发者应用。应用...
科技新动态(决胜麻将)外挂透明... 科技新动态(决胜麻将)外挂透明挂辅助软件(有科技)全面教程(2024已更新)(哔哩哔哩);决胜麻将最...