OpenCv高階(六)——圖像的透視變換

目錄

一、透視變換的定義與作用

二、透視變換的過程

三、OpenCV 中的透視變換函數

1.?cv2.getPerspectiveTransform(src, dst)

2.?cv2.warpPerspective(src, H, dsize, dst=None, flags=cv2.INTER_LINEAR, borderMode=cv2.BORDER_CONSTANT, borderValue=0)

四、文檔掃描校正(將傾斜文檔轉為正視圖)

五、透視變換 vs 仿射變換

六、注意事項

1、點坐標的準確性

2、邊界黑邊處理

3、非平面場景的限制

七、總結


一、透視變換的定義與作用

透視變換是將圖像從一個視平面投影到另一個視平面的幾何變換,用于解決圖像的透視畸變問題(如近大遠小的視覺效果),或實現視角轉換(如從傾斜圖像恢復正視圖)。

  • 核心目標:通過 4 組對應點(原圖像與目標圖像中的坐標對),計算單應性矩陣(Homography Matrix),將任意四邊形區域映射為矩形(或其他四邊形),實現視角校正或投影變換。
  • 應用場景:文檔掃描校正、無人機航拍圖像視角調整、增強現實(AR)中的虛擬物體疊加、目標檢測中的視角歸一化等。

二、透視變換的過程

????????對一張我們即將做透視變換圖像,首先要獲取到圖像中的4個坐標點,用于與目標圖像中的坐標對應,這四個點還是有順序的以坐標軸原點為參照點,距離原點最近的點為0號坐標,最遠的為2號坐標,這兩個點是最容易區分出來的;1號和3號位置可以通過坐標相減作為區分,距離X軸近的坐標的y值小于x值,所以按照x坐標減去y坐標得到的值1號坐標的值大于3號坐標的值。

? ? ? ? 區分0和2號坐標點:對四個點每個點坐標的x和y的值相加求和,我們發現,針對任意圖片輪廓,如果被四個點描繪,距離原點最近的點求和的值最小,在右下點的值求和的數值最大,可以區分出左上和右下兩個點

?????????區分1和3號坐標點:對四個點每個點坐標的x和y的值相減(x-y),針對任意圖片輪廓,如果被四個點描繪,位于右上角做差的值為一個很大的正數,在左下點的值做差的數值為負數,可以區分出左下和右上兩個點

三、OpenCV 中的透視變換函數

OpenCV 提供兩個核心函數實現透視變換:cv2.getPerspectiveTransform?和?cv2.warpPerspective

1.?cv2.getPerspectiveTransform(src, dst)

  • 功能:根據 4 組對應點對計算單應性矩陣?H。

  • 參數

    • src:原圖像中 4 個點的坐標(形狀為?(4,2)?或?(4,1,2)?的浮點型數組)。

    • dst:目標圖像中對應 4 個點的坐標(形狀同上,通常取矩形的四個角點,如?(0,0), (w,0), (w,h), (0,h))。

  • 返回值:單應性矩陣?H(形狀為?(3,3)?的浮點型矩陣)。

2.?cv2.warpPerspective(src, H, dsize, dst=None, flags=cv2.INTER_LINEAR, borderMode=cv2.BORDER_CONSTANT, borderValue=0)

  • 功能:根據單應性矩陣?H?對圖像進行透視變換。

  • 參數

    • src:輸入圖像(單通道或三通道)。

    • H:單應性矩陣(由?getPerspectiveTransform?計算得到)。

    • dsize:輸出圖像的大小(元組?(width, height))。

    • flags:插值方法(默認?cv2.INTER_LINEAR,常用?cv2.INTER_NEAREST?或?cv2.INTER_CUBIC)。

    • borderMode:邊界填充模式(默認?cv2.BORDER_CONSTANT,可填充黑色或自定義顏色)。

    • borderValue:邊界填充值(默認 0,即黑色)。

四、文檔掃描校正(將傾斜文檔轉為正視圖)

假設原圖像中文檔的四個角點坐標為?src_points,目標圖像中希望將其映射為寬度?w、高度?h?的矩形(四個角點為?dst_points):

import cv2
import numpy as np# 讀取圖像
img = cv2.imread('document.jpg')
h, w = img.shape[:2]# 定義原圖像中的4個角點(需手動選擇或通過特征匹配獲取)
src_points = np.float32([[92, 112], [381, 90], [390, 264], [120, 309]])  # 左上、右上、右下、左下(順序需對應)
# 定義目標圖像中的4個角點(通常為矩形的四個角,左上、右上、右下、左下)
dst_points = np.float32([[0, 0], [w, 0], [w, h], [0, h]])# 計算單應性矩陣
H = cv2.getPerspectiveTransform(src_points, dst_points)# 應用透視變換
warped_img = cv2.warpPerspective(img, H, (w, h))# 顯示結果
cv2.imshow('Original Image', img)
cv2.imshow('Warped Image', warped_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

?可以看出我們將一張歪歪扭扭的照片扶正了,那么接下來我們就可以對圖片做一些圖像處理,使文本信息更加清晰。

關鍵點說明:

  1. 點的順序

    • src_points?和?dst_points?中的點必須一一對應,通常按?左上→右上→右下→左下?的順序排列,確保映射區域正確。

  2. 手動選點

    • 可通過鼠標交互函數(如?cv2.setMouseCallback)手動選擇圖像中的四個角點,提高靈活性。

  3. 目標圖像大小

    • dsize?決定輸出圖像的寬度和高度,需根據實際需求設置(如原圖像尺寸或自定義尺寸)。

五、透視變換 vs 仿射變換

特性

透視變換

仿射變換

變換類型

3D 投影到 2D 平面(非線性變換)

2D 平面內的線性變換 + 平移

對應點要求

至少 4 個不共線點對

至少 3 個不共線點對

保持性質

直線映射為直線,但平行線可能不平行

直線、平行線、相對距離比例保持不變

變換矩陣

3×3 矩陣(8 個自由度)

2×3 矩陣(6 個自由度)

應用場景

視角校正、文檔掃描、AR 視角變換

旋轉、縮放、平移、剪切等簡單變換

仿射變換的知識我們將在后面通過案例來詳細介紹。?

六、注意事項

1、點坐標的準確性

輸入點對的微小誤差會顯著影響變換結果,建議通過特征匹配(如 SIFT、ORB)+ 隨機抽樣一致性算法(RANSAC)自動獲取魯棒的點對。

2、邊界黑邊處理

變換后的圖像可能出現黑邊(超出原圖像范圍),可通過調整?dsize?或裁剪去除黑邊。

3、非平面場景的限制

透視變換假設場景為平面(如文檔、墻面),若處理 3D 物體(如立方體),需分面處理或使用 3D 重建技術。

七、總結

透視變換是圖像處理中解決視角畸變的核心技術,通過單應性矩陣實現任意四邊形到矩形(或其他四邊形)的映射,廣泛應用于文檔校正、圖像拼接、AR 等領域。關鍵在于準確獲取 4 組對應點對,并合理設置輸出圖像尺寸和插值方法。實際應用中,結合特征檢測與匹配算法(如 SIFT+RANSAC)可實現自動化的透視變換,提高魯棒性和效率。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/79694.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/79694.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/79694.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

資源-又在網上淘到金了

前言: 本期再分享網上沖浪發現的特效/動畫/視頻資源網站。 一、基本介紹: mantissa.xyz,about作者介紹為:Midge “Mantissa” Sinnaeve (米奇辛納夫)是一位屢獲殊榮的藝術家和導演,提供動畫、…

Linux疑難雜惑 | 云服務器重裝系統后vscode無法遠程連接的問題

報錯原因:本地的known_hosts文件記錄服務器信息與現服務器的信息沖突了,導致連接失敗。 解決方法:找到本地的known_hosts文件,把里面的所有東西刪除后保存就好了。 該文件的路徑可以在報錯中尋找:比如我的路徑就是&a…

FFMPEG-視頻解碼-支持rtsp|rtmp|音視頻文件(低延遲)

本人親測解碼顯示對比延遲達到7到20毫秒之間浮動兼容播放音視頻文件、拉流RTSP、RTMP等網絡流 基于 Qt 和 FFmpeg 的視頻解碼播放器類,繼承自 QThread,實現了視頻流的解碼、播放控制、幀同步和錯誤恢復等功能 工作流程初始化階段: 用戶設置URL和顯示尺寸 調用play()啟動線程解…

【音視頻】音視頻FLV合成實戰

FFmpeg合成流程 示例本程序會?成?個合成的?頻和視頻流,并將它們編碼和封裝輸出到輸出?件,輸出格式是根據?件擴展名?動猜測的。 示例的流程圖如下所示。 ffmpeg 的 Mux 主要分為 三步操作: avformat_write_header : 寫?件…

全鏈路開源數據平臺技術選型指南:六大實戰工具鏈解析

在數字化轉型加速的背景下,開源技術正重塑數據平臺的技術格局。本文深度解析數據平臺的全鏈路架構,精選六款兼具創新性與實用性的開源工具,涵蓋數據編排、治理、實時計算、聯邦查詢等核心場景,為企業構建云原生數據架構提供可落地…

JAVA設計模式——(1)適配器模式

JAVA設計模式——(1)適配器模式 目的理解實現優勢 目的 將一個類的接口變換成客戶端所期待的另一種接口,從而使原本因接口不匹配而無法一起工作的兩個類能夠在一起工作。 理解 可以想象成一個國標的插頭,結果插座是德標的&…

Qt C++ 解析和處理 XML 文件示例

使用 Qt C 解析和處理 XML 文件 以下是使用 Qt C 實現 XML 文件處理的幾種方法&#xff0c;包括解析、創建和修改 XML 文件。 1. 使用 QXmlStreamReader (推薦方式) #include <QFile> #include <QXmlStreamReader> #include <QDebug>void parseXmlWithStr…

坐標上海,20~40K的面試強度

繼續分享最新的面經&#xff0c;面試的崗位是上海某公司的Golang開發崗&#xff0c;給的薪資范圍是20~40K&#xff0c;對mongodb要求熟練掌握&#xff0c;所以面試過程中對于mongodb也問的比較多。 下面是我整理好的面經&#xff08;去除了項目相關的問題&#xff09;&#xf…

B端管理系統:企業運營的智慧大腦,精準指揮

B端管理系統的定義與核心功能 B端管理系統&#xff08;Business Management System&#xff09;是專門設計用于支持企業內部運作和外部業務交互的一套軟件工具。它集成了多種功能模塊&#xff0c;包括但不限于客戶關系管理(CRM)、供應鏈管理(SCM)、人力資源管理(HRM)以及財務管…

IDE中使用Spring Data Redis

步驟一&#xff1a;導入Spring Data Redis的maven坐標 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId></dependency> 步驟二&#xff1a;配置Redis數據源 步驟三&…

ARINC818協議的幀格式

SOFi:sof initiale;這個是第一個ADVB幀的SOF開始&#xff0c;一幀只有一個SOFi。 SOFn:sof normal;這個是非首個ADVB幀的SOF頭的normal頭。 Vsync為場同步&#xff0c;兩個SOFi之間為Vsync信號&#xff0c;也就是一幀&#xff0c;也就是VS信號。 Hsync為行同步&#xff0c;如果…

Git核心命令

Git核心命令完全指南&#xff1a;從入門到高效協作 前言 在軟件開發領域&#xff0c;Git已成為現代版本控制的代名詞。據統計&#xff0c;全球超過90%的開發團隊使用Git進行代碼管理。然而&#xff0c;許多開發者僅停留在基礎命令的機械使用層面&#xff0c;未能真正掌握Git命…

【計算機視覺】CV實戰項目- Face-and-Emotion-Recognition 人臉情緒識別

Face-and-Emotion-Recognition 項目詳細介紹 項目概述項目功能項目目錄結構項目運行方式1. 環境準備2. 數據準備3. 模型訓練4. 模型運行 常見問題及解決方法1. **安裝依賴問題**2. **數據集問題**3. **模型訓練問題**4. **模型運行問題** 項目實戰建議項目參考文獻 項目概述 F…

java lambda

案例1 lambda表達式看做成一個函數對象 方法引用 1.Math是類型&#xff0c;max是靜態方法 2.Student是對象&#xff0c;getName是非靜態方法 3.對象&#xff1a;&#xff1a;非靜態方法 4.類型&#xff1a;&#xff1a;new關鍵字 練習1 假設已有對象 常見函數接口 predicate…

并發網路通信-套接字通信

套接字通信就是網絡通信 在網絡通信時,客戶端和服務器的比例是N:1 服務器如何處理多個客戶端的請求 并發處理方式 1.多線程并發處理->線程池并發處理,線程池可以對多個線程進行管理 2.多進程->進程池 3.io多路轉接,使用select或者epoch進行處理,使用io轉接函數…

AI當前狀態:有哪些新技術

一、到目前為址AI領域出現的新技術 到目前為止&#xff0c;AI領域涌現了許多令人興奮的新技術。以下是一些關鍵的進展&#xff0c;涵蓋了從基礎模型到實際應用的多個方面&#xff1a; 1. 更強大的大型語言模型 (LLMs): 性能提升: 新一代LLM&#xff0c;例如OpenAI的GPT-4o和…

AI與IT的共生

AI并非“職業終結者”&#xff0c;而是IT從業者的“認知杠桿”。通過工具化協作、技能升級與倫理治理&#xff0c;人類可釋放創造力&#xff0c;探索量子計算、生物啟發算法等深水區。未來的IT行業將呈現“AI賦能人類&#xff0c;人類定義AI邊界”的共生格局。 一、AI如何改變…

swagger的簡介及使用方法

Swagger 是一個用于描述、生成、文檔化和測試 RESTful API 的開源工具集。它可以自動生成 API 文檔&#xff0c;幫助開發者理解和使用 API。Swagger 由 Swagger.io 提供&#xff0c;并已經發展成了一套廣泛應用于 API 設計和文檔的標準。 Swagger 項目的歷史可以追溯到 2010 年…

解決Flutter 2.10.5在升級Xcode 16后的各種報錯

Flutter 環境 Flutter version 2.10.5Dart version 2.16.2DevTools version 2.9.2CocoaPods version 1.16.2Xcode 16.3 問題一&#xff1a;XCResult parsing error: Error: This command is deprecated and will be removed in a future release, --legacy flag is required t…

Vue + Spring Boot 整合全解析

一、引言 在當今的Web開發領域&#xff0c;前后端分離架構已成為主流。Vue.js作為一款流行的前端框架&#xff0c;以其簡潔易用和高效的特點深受開發者喜愛&#xff1b;Spring Boot則是Java后端開發中快速構建應用的利器。將Vue和Spring Boot整合&#xff0c;能夠充分發揮兩者…