關注gongzhonghao【CVPR頂會精選】
神經網絡卷積想找新亮點?不妨考慮:動態結構設計。作為深度學習架構搜索與高效建模兩大熱點的結合,動態神經網絡憑借自適應推理與高效特征利用的優勢,在視覺識別、視頻理解等任務中脫穎而出,發展前景相當可觀,已成為CVPR發文熱門。
這一方向尤其在輕量化推理、場景自適應等任務中容易產出創新點。近年頂會頂刊收錄的趨勢也顯示,結構重構、條件計算、稀疏激活等方向極具潛力。今天小圖給大家精選3篇CVPR有關神經網絡方向的論文,請注意查收!
論文一:Training-free Neural Architecture Search through Variance of Knowledge of Deep Network Weights
方法:
作者以隨機初始化的候選網絡和少量數據為輸入,并統計權重層面的“知識方差”,用以量化架構的可學性與泛化潛力。 這些局部統計被在層與網絡尺度上進行歸一化與加權匯聚,形成對模型規模不敏感的單一評分,從而能公平比較不同深度與寬度的候選結構。最終將該評分作為訓練免費代理嵌入NAS流程,快速篩選并重評分候選,幾乎無需訓練即可鎖定高質量架構,顯著降低搜索時間與算力消耗并在標準圖像分類基準上取得SOTA表現。
創新點:
提出以Fisher信息為核心的知識方差指標,作為零訓練準確率預測器,擺脫完整訓練與參數更新的束縛。
通過層級與全局統計的穩健匯聚獲得高排名相關性,在多搜索空間與數據集上均可穩定指引架構選擇。
將極低開銷代理融入NAS循環,實現數量級的計算加速,同時保持甚至提升最終性能,優于現有訓練免費與輕訓練基線。
論文鏈接:
https://arxiv.org/abs/2502.04975
圖靈學術論文輔導
論文二:Brain-Inspired Spiking Neural Networks for Energy-Efficient Object Detection
方法:
作者構建MSD框架,以脈沖神經元堆疊形成多尺度特征主干,并通過跨尺度聚合與輕量級檢測頭,把離散時間步中的脈沖活動凝練為類別與邊界框預測,兼顧細粒度與全局語義。在訓練階段,采用時間展開的端到端優化與替代梯度,對分類與回歸目標聯合約束,同時調控發放稀疏度以平衡信息保真與能耗。推理時模型以少量時間步傳播并依賴稀疏計算完成檢測,在降低運算密度與時延的同時保持甚至提升精度,體現出顯著的能源效率優勢。
創新點:
提出融合多尺度時空特征的脈沖檢測架構,充分利用脈沖稀疏性同時兼顧小物體與大場景表征。
端到端的時序脈沖推理與訓練設計,實現有限時間步內的高效檢測,顯著降低能耗與延遲。
在多數據集與多基線下展現優越的能效-準確率折中,整體性能穩定優于現有方法,具備良好可部署性。
論文鏈接:
https://ieeexplore.ieee.org/document/11092565
圖靈學術論文輔導
論文三:VISTREAM: Improving Computation Efficiency of Visual Streaming Perception via Law-of-Charge-Conservation Inspired Spiking Neural Network
方法:
作者將VISTREAM以SNN作為主干并注入“電荷守恒”啟發式,約束跨時間步的脈沖積累與轉移,保留關鍵信息同時削減冗余脈沖以源頭降算。 面向持續視頻流,系統依據幀間變化自適應調節時間步與稀疏度,復用跨幀狀態并進行多尺度時空聚合,從而在低延遲路徑上維持穩健的感知精度。訓練與推理端到端一體優化,對能耗—準確率折中進行顯式權衡,最終在多基準上實現顯著節能且精度不降的平衡表現。
創新點:
引入“電荷守恒”理念約束脈沖傳播,抑制冗余放電與震蕩,顯著減少無效計算。
面向流式輸入設計動態計算機制,按內容變化自適應分配時空算力,穩住精度同時降能耗。
統一端到端框架兼顧效率與準確性,在真實視覺流任務上穩定優于現有方法,具備部署友好性。
論文鏈接:
https://ieeexplore.ieee.org/document/11092726
本文選自gongzhonghao【CVPR頂會精選】