摘要
論文介紹
本文介紹了一種名為DynamicHead的模塊,該模塊旨在通過注意力機制統一目標檢測頭部,以提升目標檢測的性能。論文詳細闡述了DynamicHead的工作原理,并通過實驗證明了其在COCO基準測試上的有效性和效率。
創新點
DynamicHead模塊的創新之處在于它首次嘗試在一個統一的框架中結合了尺度感知、空間感知和任務感知的注意力機制。這三個注意力機制分別作用于特征張量的不同維度上,但它們的性能可以相互補充,從而顯著提高了目標檢測頭的表征能力。
方法
DynamicHead模塊的方法主要包括三個步驟:尺度感知注意力、空間感知注意力和任務感知注意力。首先,尺度感知注意力模塊學習各種語義層級的相對重要性,以便根據物體的尺度增強單個物體在適當層級的特征。其次,空間感知注意力模塊在空間維度上連貫地學習空間位置中具有辨別力的表征。最后,任務感知注意力模塊在通道上部署,以實現聯合學習并泛化對象的不同表示。這三個注意力機制是順序應用的,可以多次嵌套以有效地將多個注意力塊堆疊在一起。
模塊作用
DynamicHead模塊的主要作用是提升目標檢測的性能。通過將DynamicHead加入Yolo11的Detect head中,可以充分利用其注意力機制來增強特征表示,從而提高檢測的準確性