Enhancing Underwater Imaging for Robot through Embedded Polarization Neural Network
EPNN:基于嵌入式偏振神經網絡的水下成像增強方法
1 論文核心概念
本文提出了一種名為嵌入式偏振神經網絡(Embedded Polarization Neural Network, EPNN) 的方法,用于顯著提升水下機器人在高散射、高吸收水域中的成像能力。該方法通過結合偏振相機與深度學習模型,實現了對水下低質量圖像的快速高質量重建,擴展了水下機器人的視覺范圍,提升了成像速度與質量。
最核心的區別:它巧妙地繞過了水下視覺領域“缺乏真實配對數據”這個根本性障礙,通過一個基于物理光學模型(公式1)的“仿真流水線”,生成了無限量的、高質量的“算法級真值”訓練數據。
物理模型與深度學習模型的結合提高泛化能力:
物理模型與深度學習模型的結合,其提升泛化能力的核心在于物理模型參數化的隨機性。在生成訓練數據時,物理退化模型中的關鍵參數(如衰減系數 c 和拍攝距離 z)并非固定不變,而是在一個符合真實水下情況的合理范圍內動態隨機取值。這意味著,同一張清晰的地面圖像,能夠被模擬生成出成千上萬張在不同渾濁度、不同距離下拍攝的、退化程度各異的低質圖像。因此,神經網絡在訓練中學到的并非是一種單一的修復映射,而是一種應對各種可能退化情況的通用性物理逆變換能力。當模型在真實水下環境中遇到它從未見過的場景時,該場景的退化模式