【圖像處理入門】3. 幾何變換基礎：從平移旋轉到插值魔法

在這里插入圖片描述

摘要

掌握圖像的幾何變換相當于學會「圖像的空間魔法」。本文將帶你理解平移/旋轉/縮放的數學原理，掌握OpenCV中warpAffine和getAffineTransform的核心用法，對比最近鄰、雙線性等插值算法的優劣。通過圖像翻轉、鏡像、透視變換實戰，學會用變換矩陣控制圖像的空間形態，為圖像配準、目標檢測等高級應用鋪路。

一、幾何變換的數學本質：變換矩陣

所有幾何變換均可表示為矩陣運算：
通用變換公式：
$\begin{bmatrix} x' \\ y' \\ 1 \end{bmatrix} = \begin{bmatrix} a & b & c \\ d & e & f \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \\ 1 \end{bmatrix}$

線性變換：左上角2x2矩陣（縮放、旋轉、剪切）
平移變換：第三列（c,d）決定平移量

OpenCV通過warpAffine函數實現仿射變換，需先計算變換矩陣M。

二、基礎變換實戰：平移、旋轉、縮放

1. 平移變換：圖像的「空間位移」

import cv2
import numpy as np# 定義平移矩陣：向右平移100像素，向下平移50像素
M = np.float32([[1, 0, 100], [0, 1, 50]])  
translated = cv2.warpAffine(color, M, (width+100, height+50))  # 可視化對比
plt.subplot(121), plt.imshow(rgb), plt.title('Original')
plt.subplot(122), plt.imshow(cv2.cvtColor(translated, cv2.COLOR_BGR2RGB)), plt.title('Translated')

2. 旋轉變換：繞原點的「順時針舞蹈」

# 獲取旋轉矩陣：繞中心旋轉30°，縮放因子1.0
height, width = color.shape[:2]
center = (width//2, height//2)
M = cv2.getRotationMatrix2D(center, 30, 1.0)  
rotated = cv2.warpAffine(color, M, (width, height))  # 注意：旋轉后圖像可能超出邊界，需擴大輸出尺寸避免裁剪

3. 縮放變換：放大縮小的「像素重組」

# 方法1：直接指定尺寸（最近鄰插值）
zoomed_nearest = cv2.resize(color, (width*2, height*2), interpolation=cv2.INTER_NEAREST)  # 方法2：按比例縮放（雙線性插值，更平滑）
zoomed_bilinear = cv2.resize(color, None, fx=0.5, fy=0.5, interpolation=cv2.INTER_LINEAR)

三、插值算法：變換時的像素「重建魔法」

不同插值算法在速度和質量間權衡：

算法	速度	圖像質量	適用場景
最近鄰（NEAREST）	最快	鋸齒明顯	縮小圖像、實時處理
雙線性（LINEAR）	中等	邊緣平滑	放大/縮小/旋轉
雙三次（CUBIC）	最慢	細節保留最佳	高質量圖像重建
區域插值（AREA）	中等	邊緣清晰	縮小圖像（優于NEAREST）

# 對比不同插值的縮放效果
plt.figure(figsize=(15, 5))
plt.subplot(131), plt.imshow(zoomed_nearest[:200, :200]), plt.title('Nearest')
plt.subplot(132), plt.imshow(zoomed_bilinear[:200, :200]), plt.title('Bilinear')
plt.subplot(133), plt.imshow(zoomed_cubic[:200, :200]), plt.title('Bicubic')

四、進階變換：翻轉、鏡像與透視

1. 翻轉與鏡像：圖像的「左右互搏」

# 水平翻轉（左右鏡像）
flipped_horizontal = cv2.flip(color, 1)  
# 垂直翻轉（上下顛倒）
flipped_vertical = cv2.flip(color, 0)  
# 同時水平+垂直翻轉
flipped_both = cv2.flip(color, -1)

2. 透視變換：從平面到3D的「視覺欺騙」

# 定義原始四邊形頂點和目標頂點（均為順時針順序）
src_points = np.float32([[50, 50], [450, 50], [450, 450], [50, 450]])  
dst_points = np.float32([[100, 200], [400, 200], [400, 300], [100, 300]])  # 獲取透視變換矩陣并應用
M_perspective = cv2.getPerspectiveTransform(src_points, dst_points)  
perspective_img = cv2.warpPerspective(color, M_perspective, (width, height))

五、實戰：證件照尺寸標準化

假設需要將200x300像素的證件照縮放為標準1寸（295x413像素），并保持頭像區域不變：

# 1. 計算縮放比例（保持寬高比）
src_h, src_w = img.shape[:2]
dst_w, dst_h = 295, 413
scale_w = dst_w / src_w
scale_h = dst_h / src_h
scale = min(scale_w, scale_h)# 2. 計算縮放后尺寸和填充區域
new_w = int(src_w * scale)
new_h = int(src_h * scale)
dx = (dst_w - new_w) // 2
dy = (dst_h - new_h) // 2# 3. 縮放+邊緣填充（黑色背景）
resized = cv2.resize(img, (new_w, new_h), interpolation=cv2.INTER_AREA)
standardized = cv2.copyMakeBorder(resized, dy, dst_h-new_h-dy, dx, dst_w-new_w-dx, cv2.BORDER_CONSTANT, value=(0,0,0))

六、避坑指南：變換中的尺寸計算

旋轉后的尺寸溢出：
旋轉后圖像可能超出原尺寸，需提前計算最小包圍矩形：

rows, cols = img.shape[:2]
M = cv2.getRotationMatrix2D((cols/2, rows/2), 30, 1)
# 計算旋轉后的新尺寸
cos = np.abs(M[0,0]); sin = np.abs(M[0,1])
new_cols = int(rows*sin + cols*cos)
new_rows = int(rows*cos + cols*sin)
M[0,2] += (new_cols - cols)/2; M[1,2] += (new_rows - rows)/2

透視變換的頂點順序：
頂點必須按順時針/逆時針順序排列，否則會出現扭曲

總結

幾何變換是圖像處理的空間操作基石：

平移/旋轉/縮放通過仿射變換矩陣實現，本質是像素的坐標映射
插值算法的選擇直接影響變換后的圖像質量，雙線性插值是平衡之選
warpAffine和warpPerspective是處理2D/3D變換的核心函數

下一篇我們將進入圖像增強領域，學習如何通過直方圖均衡化、伽馬校正等技術提升圖像視覺效果。現在請打開一張傾斜的文檔照片，嘗試用透視變換將其矯正為正視角度吧！

思考：為什么旋轉后的圖像邊緣會出現黑邊？如何用邊界填充解決這個問題？

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/907692.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/907692.shtml
英文地址，請注明出處：http://en.pswp.cn/news/907692.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！