一、簡介
在本文中,我們提出了一種新的多內容互補網絡 (MCCNet) 來探索 RSI-SOD 的多內容互補性。具體來說,MCCNet 基于通用的編碼器-解碼器架構,并包含一個名為 multi-content complementation module (MCCM) 的新型關鍵組件,它將編碼器和解碼器連接起來。在 MCCM 中,我們考慮了對 RSI-SOD 至關重要的多種類型的特征,包括前景特征、邊緣特征、背景特征和全局圖像級特征,并利用它們之間的內容互補性,通過注意力機制突出 RSI 特征中不同尺度上的顯著區域。此外,我們在訓練階段全面引入了像素級、映射級和度量感知損失。
我們首先將前臺內容集成到我們的 MCCM 中,我們引入了邊緣內容,我們采用邊緣監督來生成邊緣注意力圖,用于特征中的邊緣激活。對于 RSI-SOD,我們認為除了前景和邊緣之外,背景也很重要。在這里,我們考慮光學 RSI 的復雜背景內容。以上三種內容詳細介紹了本地信息。我們整合了全局圖像級內容,以實現全面的內容補充。通過這種方式,我們的 MCCM 可以同時捕獲本地和全局內容,這對于準確感知突出區域和區分雜亂的背景區域非常有效。此外,為了提高 MCCM 的穩健性,我們在多個特征尺度上實施了 MCCM。我們將 MCCM 部署在編碼器-解碼器網絡中,這是 NSI-SOD 的通用骨干。
二、文章提到的前人的技術和論文
- Multilevel/scale fusion(多層 /尺度融合):在顯著目標檢測中,不同層次或尺度的特征包含不同的信息。例如,淺層特征可能包含圖像的細節和邊緣信息,而深層特征則更側重于語義信息。通過多層 /尺度融合技術,可以將不同層次或尺度的特征進行組合,以獲得更全面和準確的特征表示。如在一些方法中,會將卷積神經網絡中不同層的特征圖進行融合,使網絡能夠同時利用低層次的細節信息和高層次的語義信息來更好地檢測顯著目標,提高對不同大小和復雜程度目標的檢測能力。
- Edge guidance/preservation(邊緣引導 /保留):邊緣是物體的重要邊界信息,對于確定顯著目標的形狀和位置至關重要。邊緣引導技術利用圖像中的邊緣信息來指導顯著目標的檢測過程,例如通過將邊緣區域的特征與其他區域特征進行特殊處理或加權,使網絡更關注邊緣附近的區域,從而更準確地勾勒出顯著目標的輪廓。邊緣保留則側重于在特征處理過程中盡量保持邊緣信息的完整性,防止邊緣信息在卷積、池化等操作中丟失或模糊,確保網絡能夠利用清晰的邊緣特征進行目標檢測。
- Attention(注意力機制):注意力機制使網絡能夠動態地聚焦于圖像中的關鍵區域或特征。在顯著目標檢測中,它可以幫助網絡自動學習到哪些區域更有可能是顯著目標,從而分配更多的計算資源和權重給這些區域。例如,通過像素級或區域級的注意力機制,網絡可以根據圖像內容的不同,對前景區域、高對比度區域或具有特定紋理的區域等給予更高的關注,增強這些區域在特征表示中的重要性,提高顯著目標檢測的準確性和效率。
- Complementary losses(互補損失):在訓練過程中,單一的損失函數可能無法全面地衡量模型的性能。互補損失通過引入多種不同類型的損失函數來共同監督模型的訓練。例如,除了常用的二元交叉熵(BCE)損失用于衡量預測的顯著圖與真實標簽之間的差異外,還可能引入如交并比(IoU)損失來關注目標區域的重疊程度,或F - measure損失來綜合考慮精度和召回率等指標。這些不同的損失函數從不同角度對模型進行約束和優化,使模型能夠學習到更全面和準確的顯著目標檢測能力,避免模型在某些方面的過擬合或欠擬合
- LVNet2019 將多分辨率輸入融合在嵌套結構中,以感知不同大小的物體
- PDFNet2020 集成了來自五個分支的 5 個尺度特征,以實現全面檢測
- DAFNet2021 不僅使用突出的邊緣映射作為額外的監督,而且還以密集流暢的方式進行關注
- 與DAFNet類似,EMFINet2021采用三種不同分辨率的光學RSI作為輸入,但與DAFNet不同的是,它采用邊緣監督來生成具有邊緣感知約束的特征,并引入混合損失來推斷具有形狀邊界的顯著對象
三、模型結構
四、總結
主要是學習提出的MCCM模塊,集成了前景,背景,全局,邊緣的特征。學會了怎么引入邊緣特征