DiffDet4SAR——首次將擴散模型用于SAR圖像目標檢測，來自2024 GRSL（ESI高被引1%論文）

?一. 論文摘要

????????合成孔徑雷達（SAR）圖像中的飛機目標檢測是一項具有挑戰性的任務，由于離散的散射點和嚴重的背景雜波干擾。目前，基于卷積或基于變換的方法不能充分解決這些問題。

????????本文首次探討了SAR圖像飛機目標檢測的擴散模型，并提出了一種新的基于擴散模型的SAR圖像的飛機目標檢測模型。所提出的DiffDet 4SAR產生用于SAR飛機目標檢測的兩個主要優點：1）DiffDet4SAR將SAR飛機目標檢測任務映射到邊界框的去噪擴散過程，而無需啟發式錨大小選擇，2）專門設計的散射特征增強（SFE）模塊進一步降低了雜波強度，并在推理過程中增強了目標顯著性。在SAR-AIRcraft-1.0數據集上的大量實驗結果表明，所提出的DiffDet4SAR實現了88.4%mAP50，比最先進的方法高出6%。

二. 模型整體架構

（a）我們提出的DiffDet4SAR的總體框架和（b）SFE模塊（Scattering Feature Enhancement Module 散射特征增強模塊）的詳細實現。主干從輸入SAR圖像中提取特征圖，SFE模塊應用于高級語義特征圖。以噪聲邊界框和多尺度特征作為輸入，檢測器然后預測目標類別，位置此外，我們還設計了SFE模塊來抑制背景雜波，增強目標的顯著性。

? ? ? ? ?整體框架的細節這里就不贅述了，因為DiffDet4SAR是在DiffusionDet的基礎上完成的，整體框架幾乎和DiffusionDet完全一致，有關于DiffusionDet的完整詳細的解讀大家可以參考我的這篇博客：

DiffusionDet: Diffusion Model for Object Detection——首次將擴散模型用于目標檢測的模型https://blog.csdn.net/LWK999999/article/details/149329493?spm=1001.2014.3001.5501

論文創新點

1) 據我們所知，這篇論文介紹了第一個將擴散模型引入SAR目標檢測的研究，提供了一個新穎的、高度簡單但有效的框架，稱為DiffDet 4SAR，專為SAR目標檢測而設計。

2) 提出的DiffDet 4SAR基于兩個核心設計：首先，我們將SAR目標檢測問題轉化為從噪聲包圍盒到精確目標包圍盒的去噪擴散過程;其次，我們設計了一個SFE模塊，有效地降低背景雜波的散射強度，突出目標，以緩解飛機目標散射點離散和背景干擾嚴重的問題。

3) 通過結合這兩種設計，DiffDet 4SAR的性能在SAR-AIRcraft-1.0數據集上顯著超過了最新技術水平。

三. SFE 散射特征增強模塊

SAR 圖像中的飛機目標具有以下特點：

離散散射點結構：目標結構不連續，容易被誤檢/漏檢；
背景雜波強：建筑物、金屬體等背景物體的散射強度接近飛機；
高分辨率但低對比度：使得目標邊界模糊，難以準確定位。

因此，傳統特征提取模塊容易受到紋理噪聲干擾，SFE 模塊被提出用于增強目標顯著性并抑制背景。

SFE 模塊主要包含兩部分：

1. 中心像素差卷積（PDC：Pixel Difference Convolution）

作用：替代普通卷積，突出目標區域的異質性，壓制背景的同質性。
原理：在每個局部區域中，不是直接卷積計算加權和，而是用當前像素與其鄰域像素的差值作為輸入。

數學公式：

vanilla convolution
$y = \sum_{i=1}^{k \times k} w_i \cdot x_i$
PDC:
$y = \sum_{(x_i, x'_i)} w_i \cdot (x_i - x'_i)$
其中 $(x_i, x'_i)$ 是卷積窗口中當前像素與其鄰居像素對。

直觀理解：對于背景區域，由于其紋理一致，差值很小 → 被壓制；目標區域結構復雜，差值較大 → 被增強。

2. 高層語義特征處理與融合

PDC 并不是用于淺層特征，因為淺層更關注紋理細節，會產生誤增強（false alarm）；
它被應用于 高層語義特征圖（如 P5），這些層包含更加穩定的目標語義信息；
融合策略：將原始特征圖和 PDC 后的特征圖做融合（類似殘差連接）：
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? $F_{\text{enhanced}} = F_{\text{PDC}} + F_{\text{original}}$

3. SFE 模塊的工作流程（總結）

從主干網絡（ResNet50）中提取高層特征圖（如 P5 層）；
對特征圖進行中心差分卷積處理，得到抑制背景、增強目標的特征圖；
將原始特征圖與差分卷積結果進行融合，增強目標區域的散射特征；
送入 ROI Align 和檢測頭進行類別與邊界框預測。

????????所提出的SFE模塊對不同深度的特征圖的影響。結果顯示了沒有（頂行）和有SFE模塊的特征圖（底行）。特征圖從左到右，即從p2到p5變得更深。紅框表示ground truth，綠色框表示檢測結果。紫色橢圓表示在特征層p5中未使用SFE模塊的情況下出現假陰性的實例。使用 SFE 后，目標區域更亮，背景雜波明顯減弱。

四. 實驗結果

1. 普通實驗結果

????????SAR-AIRcraft-1.0數據集檢測性能比較。每個類別的結果由mAP（%）和F1-SCORE（%）表示，交集超過聯合閾值0.5（IOU = 0.5）。最佳和次佳結果以粗體和下劃線顯示。

????????在隨機選擇的圖像上顯示不同方法下的檢測結果。紅色框表示真實值，綠色框表示檢測結果。黃色橢圓表示誤報，紫色橢圓表示誤報實例。

2. 消融實驗結果

2.1 SFE 模塊的有效性消融實驗

目的：驗證中心像素差卷積（PDC）和特征融合策略在不同特征層（P3、P4、P5）上的效果。?

單獨使用 PDC：在不同層上（P3/P4/P5）都有提升，但提升有限。
最佳效果出現在融合 Vanilla+PDCp5 的組合，其中：
- mAP50 提升至 88.4%（+1.8%）
- mAP75 提升至 68.2%（+1.3%）
- 小目標檢測（mAPs）從 13.6% 大幅提升至 30.0%！
將 PDC 應用于語義特征最強的 P5 層，結合原始特征可以保留背景上下文，同時突出目標差異。
對小目標的增強尤其明顯，說明 SFE 對微弱目標信號具有放大作用。

2.2 Signal Scale（擴散信號強度）消融實驗

目的：研究擴散過程中的信號縮放因子（SNR 控制）對檢測效果的影響。

過低（0.1）→ 噪聲不足，難以學習魯棒特征；
過高（2.0、3.0）→ 噪聲過大，目標信息被背景雜波掩蓋；
scale=1.0 達到最優效果，說明在 SAR 圖像中適中 SNR 能平衡“泛化性”與“細節保留”。

2.3 $N_{train}$ 與 $N_{eval}$ ?匹配性消融實驗

目的：探索訓練階段使用的噪聲框數量 $N_{train}$ 和推理階段采樣框數 $N_{eval}$ 對性能的影響。

訓練時的 $N_{train}$ 更關鍵，使用更多的隨機框訓練（如 500）能更好學習目標的紋理和分布；
推理時的 $N_{eval}$ 數量影響不大，因為大部分框最終被非極大值抑制（NMS）拋棄。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/88877.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/88877.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/88877.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！