ICML
Size-invariance Matters: Rethinking Metrics and Losses for Imbalanced Multi-object Salient Object Detection
code
Abstacrt
:本文探討了顯著性檢測中評價指標的尺寸不變性,尤其是當圖像中存在多個大小不同的目標時。作者觀察到,當前的指標是尺寸敏感的,較大的對象被關注,較小的對象被忽略。針對此,本文提出一種通用方法,分別評估每個顯著對象,有效緩解尺寸的不平衡。此外,作者進一步開發了一個針對這一目標的優化框架。
Spider: A Unified Framework for Context-dependent Concept Segmentation
code
Abstacrt
:上下文獨立與顯著性檢測相結合。本文提出一個統一的模型Spider
,只有一組參數,訓練一次。在圖像-掩碼組提示符驅動的概念過濾器的幫助下,Spider
能理解并區分各種強上下文依賴的概念,從而準確地捕捉提示符的意圖。
TCSVT
Learning Adaptive Fusion Bank for Multi-modal Salient Object Detection
code
Abstacrt
:針對多模態顯著性檢測問題,即MSOD
,本文提出adaptive fusion bank
,專注于解決MSOD
的五個主要挑戰,即center bias
、scale variation
、image clutter
、low illumination
、thermal crossover
。為對多模態輸入自適應地選擇合適的融合方案,引入自適應集成模塊,形成自適應融合bank
,嵌入到層級中,以充分融合不同的源數據。此外,還設計了一個間接交互引導模塊,通過對高層語義信息和底層空間細節的跳躍集成精確檢測顯著目標。
TII
MINet: Multi-scale Interactive Network for Real-time Salient Object Detection of Strip Steel Surface Defects
code
Abstacrt
:針對目前參數大、計算成本高、推理速度慢等問題,本文提出多尺度交互模塊,即MI
,采用深度卷積和點卷積分別獨立提取并交互融合不同尺度的特征。在此模塊基礎上,提出輕量級的多尺度交互網絡,即MINet
,對表面缺陷的工業物件進行實時顯著目標檢測。
TMM
Alignment-Free RGBT Salient Object Detection: Semantics-guided Asymmetric Correlation Network and A Unified Benchmark
code
Abstacrt
:目前需手動對齊多模態,本文首次在沒有手動對齊的情況下訓練網絡。具體說,提出一個語義引導的非對稱關聯網絡,即SACNet
,由兩部分組成:1)非對稱關聯模塊,利用語義語義引導注意力建模非對齊顯著區域的跨模態相關性;2)關聯特征采樣模塊,根據RGB特征對熱力圖特征進行采樣,進行多模態特征集成。除此之外,作者構建了一個基準數據集,即UVT2000
,該數據集包含直接從各種真實場景中獲取的2000對RGB和熱圖像對,無手動對齊,以促進無對齊RGB-T SOD
的研究。