LetterBox類比理解:想象你要把一張任意形狀的照片放進一個正方形的相框里,照片不能變形拉伸,所以你先等比例縮小照片,然后在空余的地方填上灰色背景。
第1章 數學原理
當我們有一個原始圖像的尺寸為 1920×1080(寬××高),并希望使用 letterbox
方法將其轉換為 640×640 的正方形尺寸時,我們需要遵循以下步驟進行數學推導。目的是保持原始圖像的長寬比不變,并通過填充來達到目標尺寸。
1.1?計算縮放比例
首先,我們需要計算縮放比例,以確保圖像能完全適應目標尺寸中的一個維度(高度或寬度)而不會超出,同時保持其原始比例。
取兩者中的最小值作為最終的縮放比例:
1.2 應用縮放比例調整圖像尺寸
根據縮放比例調整圖像的尺寸:
這意味著原圖在保持比例的情況下被縮小到 360×640 的尺寸。
1.3 計算填充區域
由于我們的目標尺寸是 640×640,而縮放后的圖像尺寸為 360×640,我們需要在上下兩側添加填充以達到目標尺寸。
因此,頂部和底部各填充 140 像素。
1.4 計算偏移量
最后計算偏移量,這里僅考慮垂直方向上的偏移(因為水平方向沒有偏移):
這表示在垂直方向上,填充部分占了總高度的大約 21.875%。
總結
在這個例子中,原始圖像從 1920×1080被按比例縮小到了 640×360,然后在上下兩邊分別添加了 140像素的填充,使得最終輸出的圖像尺寸為 640×640。這樣既保證了圖像的比例不變,又滿足了模型輸入所需的固定尺寸要求。
具體數值總結如下:
這個過程確保了原始圖像的內容不被拉伸或壓縮,同時達到了模型輸入所需的標準尺寸。