使用Mambaout替換YOLObackbone 整合全局信息,提升遮擋目標檢測中定位能力,以及小目標、多尺度

?????????近年來,Transformer 架構雖在各類任務中成為主流,但注意力機制的二次復雜度對長序列處理構成挑戰。為此,類似 RNN 的模型如 Mamba 被引入,其核心是狀態空間模型(SSM),旨在以線性復雜度處理長序列。然而,將 Mamba 應用于視覺任務時,其性能常不及卷積和基于注意力的模型。研究發現,Mamba 更適合兼具長序列和自回歸特性的任務,而多數視覺任務(如圖像分類)并不滿足這些特性。基于此,研究者提出 MambaOut,通過移除 Mamba 塊中的 SSM,僅保留門控 CNN 結構,驗證 SSM 在視覺任務中的必要性。

1.Mambaout原理

????????MambaOut 的核心原理是基于對 Mamba 適用場景的分析:Mamba 的 SSM 機制具有 RNN 特性,適合處理長序列且需因果 token 混合(自回歸)的任務,而視覺理解任務(如分類)無需因果限制,且短序列場景下 SSM 優勢不明顯。MambaOut 通過堆疊門控 CNN 塊構建模型,門控 CNN 塊與 Mamba 塊的區別在于不含 SSM,其 token 混合依賴深度卷積,結合 MLP 和門控機制,在保證計算效率的同時,避免了 SSM 在非長序列視覺任務中的冗余性。實驗表明,該結構在 ImageNet 分類中超越含 SSM 的視覺 Mamba 模型,驗證了 SSM 的非必要。

????????MambaOut 采用類似 ResNet 的分層架構,包含四個階段,每個階段堆疊門控 CNN 塊。門控 CNN 塊的具體結構為:輸入經歸一化后,通過線性層分為門控信號(g)、輸入信號(i)和卷積信號(c);c 經深度卷積(如 7×7 kernel)處理后,與 i 拼接并與 g 的激活值相乘,再通過線性層輸出,最終與殘差連接相加。模型配置根據尺寸(如 Femto、Tiny、Small、Base)調整通道數、塊數量等參數,例如 Small 版本包含(3, 4, 27, 3)個塊,通道數為(96, 192, 384, 576)。?

2.Mambaout習作思路?

???????????MambaOut 采用 7×7 深度 wise 卷積作為 Token Mixer,通過局部感受野聚合信息,相較于 Mamba 的 SSM 模塊更專注于空間局部模式提取,在遙感缺陷檢測中能精準捕獲裂縫、破損等小目標缺陷的邊緣與結構特征,其類似 ResNet 的四階段分層架構可從不同尺度解析缺陷形態,避免長序列依賴引入的無關上下文干擾,結合門控機制與深度卷積的高效特征交互,在抵御云層、地物紋理等背景干擾的同時,充分利用 GPU 并行計算能力,實現高分辨率遙感圖像中多尺度缺陷的精準定位與快速檢測。

3. YOLO與Mambaout的結合? ???? ? ?

? ? ? ? ?MambaOut 替換 YOLO 主干時,通過門控 CNN 強化局部特征提取,7×7 深度卷積擴大感受野,顯著提升小目標檢測能力。其架構移除 SSM 避免因果約束,能更好整合全局信息,提升遮擋目標檢測中定位能力。

4. Mambaout代碼部分

使用Mambaout替換YOLO backbone 整合全局信息,提升遮擋目標檢測中定位能力,以及小目標、多尺度_嗶哩嗶哩_bilibili

?代碼獲取:https://github.com/tgf123/YOLOv8_improve

5. Mambaout引入到YOLOv12中

將百度網盤的壓縮包下載后解壓,用編輯器打開運行即可

6. Mambaout引入到YOLOv11中

將百度網盤的壓縮包下載后解壓,用編輯器打開運行即可

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/910158.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/910158.shtml
英文地址,請注明出處:http://en.pswp.cn/news/910158.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

力扣網C語言編程題:接雨水(動態規劃實現)

一. 簡介 本文記錄力扣網上的邏輯編程題,涉及數組方面的,這里記錄一下 C語言實現和Python實現。 二. 力扣網C語言編程題:接雨水 題目:接雨水 給定 n 個非負整數表示每個寬度為 1 的柱子的高度圖,計算按此排列的柱子…

關于ubuntu環境下vscode進行debug的隨筆

CMakeLists.txt的編寫 頂層目錄的CMakelists.txt 目錄:./CMakeLists.txt #./CMakeLists.txt cmake_minimum_required(VERSION 3.10) project(xxx_project_name LANGUAGES CXX) #設置工程名# 設置 C 標準和編譯選項 set(CMAKE_CXX_STANDARD 17) set(CMAKE_CXX_ST…

技術演進中的開發沉思-9:window編程系列-內核對象線程同步(下)

今天我們繼續走進 Windows 內核的世界,就昨天沒說完的內核對象與線程同步內容接著繼續,它們就像精密儀器里的齒輪,雖不顯眼,卻至關重要。 異步設備 I/O 在 Windows 系統中,異步設備 I/O 就像是一場精心編排的接力賽。…

用AI從0開始量化交易-Anaconda環境(env)和緩存(pkg)更改儲存位置

之前介紹了Anaconda的安裝和環境建立,最近自己的量化交易工具開發的差不多了,卻發生了尷尬的問題,C盤被不斷增大的conda環境和緩存占據得快滿了。 在網上找了些教程,大多是講遷移的,專門講改本地改儲存位置的比較少&am…

Python爬蟲工作基本流程及urllib模塊詳解

在2025年的數據驅動時代,網絡數據成為企業與個人的“金礦”,而Python爬蟲則是挖掘這金礦的“利器”!無論是抓取電商價格、分析社交媒體趨勢,還是構建知識庫,Python爬蟲都能讓你事半功倍。然而,爬蟲開發并非…

thinkphp8 模型-一對一,一對多,多對多 學習

thinkphp 命令創建模型(和laravel基本一樣) php think make:model User 在模型里創建字段 protected $table User; protected $pk id; // 定義返回哪些字段 protected $field [id, name]; // 返回字段的類型 protected $schema [id > int] 模…

非線性方程組求解:復雜情況下的數值方法

在科學研究和工程應用中,非線性方程組的求解是一個常見的挑戰。尤其當方程組包含復雜函數(如特殊函數、積分、微分等),使得雅可比矩陣難以解析求導時,傳統的基于解析雅可比矩陣的 Newton-Raphson 方法難以直接應用。本…

邊緣計算網關EG8200Mini首發開箱視頻丨破解工業互聯“協議孤島”,重塑數據價值核心引擎行業痛點直擊|低代碼開發

數據采集4G邊緣計算網關plc 工業現場設備品牌林立(西門子、三菱、歐姆龍等30品牌PLC)、協議碎片化(Modbus/OPC UA/BACnet等)、網絡環境復雜(戶外無光纖、車間電磁干擾)——傳統網關難以實現多源異構設備統一…

2024-2025下期《網絡設備與配置》期末模擬測試

一、 單選題(每題2分,共60分) RIP協議的默認最大跳數是( ) A. 10 B. 15 C. 20 D. 30以下哪個命令可以用來在交換機上進入全局配置模式?( ) A. 使用enable命令 B. 使用configure terminal命令 C. 使用inte…

虹科案例 | 欣旺達如何實現動力電池測試的長期穩定性+自動化?

新能源汽車產業狂飆突進,動力電池測試正面臨前所未有的技術大考。 傳統電池測試方案常因數據丟幀、協議適配等問題,導致測試周期延長和交付延期。在這場關乎安全與效率的產業競速中,高精度數據采集與全球化交付能力,已成為動力電…

第17天:數據庫學習筆記1

數據庫學習筆記 1 SQL語言介紹 2 數據庫的安裝 2.1 啟動數據庫 方式一:net start mysql 方式二:在計算機管理里面手動打開數據庫 2.2 登錄MySQL 方式一:本地登錄 即數據庫與客戶端在同一臺電腦上。 方式二:遠程登錄 mysq…

ChromaDB完全指南:從核心原理到RAG實戰

一、引言:擁抱AI時代的“記憶”變革 在人工智能(AI)浪潮席卷全球的今天,大型語言模型(LLM)以其強大的自然語言處理能力,正在重塑我們與信息的交互方式。然而,LLM并非萬能,它們普遍存在知識截止日期、無法訪問私有數據等“記憶”短板。為了突破這一瓶頸,向量數據庫應…

XCUITest + Swift 詳細示例

??親愛的技術愛好者們,熱烈歡迎來到 Kant2048 的博客!我是 Thomas Kant,很開心能在CSDN上與你們相遇~?? 本博客的精華專欄: 【自動化測試】 【測試經驗】 【人工智能】 【Python】

Spring Boot + MyBatis + Redis Vue3 Docker + Kubernetes + Nginx

前言 前些天發現了一個巨牛的人工智能免費學習網站,通俗易懂,風趣幽默,忍不住分享一下給大家。點擊跳轉到網站 1.1 畢設項目需求分析(附需求文檔片段) 一、項目全景與技術選型 1.1 畢設項目需求分析(附需…

【云計算領域數學基礎】組合數學優化

一、組合數學優化 1.1、定義與本質特征 1.1.1、組合數學優化的核心原理 ?問題本質與數學工具? ?組合爆炸問題?:軟件輸入參數、路徑組合隨規模指數級增長,如10個二值參數需1024個用例。組合數學通過覆蓋數組(Covering Array)、…

企業文檔如何變身AI語料庫?無憂文檔NLP+OCR技術實戰解析

當企業爭相采購ChatGPT、文心一言等通用大模型時,卻忽略了:企業文檔其實是這座數字油田的核心資產。從產品手冊、客戶案例到會議紀要,企業沉淀的海量文檔,這些看似零散的信息,其實正通過AI技術被轉化為可復用的“語料庫…

掌握Python編程的核心能力,能快速讀懂并上手項目開發。

掌握Python編程的核心能力,能快速讀懂并上手項目開發。 一套系統且通俗的講解,理論講解 實戰技巧 代碼框架模板,讓你能: 看懂Python項目結構 能自己寫代碼:函數、流程控制、類和模塊 能寫出一個完整、規范的Pytho…

「Linux文件及目錄管理」硬鏈接與軟連接

知識點解析 在Linux系統中,硬鏈接(Hard Link)和軟鏈接(Symbolic Link,又稱軟連接)是兩種不同的文件鏈接方式: 1.硬鏈接(Hard Link): 本質:硬鏈接是文件的一個別名,與原文件共享相同的inode和磁盤數據塊。特點: 數據共享:硬鏈接與原文件指向同一數據塊,修改任…

分清display三個屬性

display 三兄弟行為對比表格 屬性值是否換行能否設置寬高默認寬度常用標簽典型用途block是可以撐滿父容器<div>, <p>, <section>頁面結構、布局容器inline否不行隨內容大小<span>, <a>文字中嵌套、小圖標inline-block否可以隨內容大小<img&g…

《棒球青訓》打造幾個國家級運動基地·棒球1號位

Youth Baseball/Softball Base Development Plan | 青少年棒壘球基地建設方案 Core Strategies | 核心戰略 Regional Hub Construction | 區域樞紐建設 優先在 長三角/珠三角/成渝經濟圈 建設 3大示范性基地 每個基地包含&#xff1a; ?? 國際標準青少年賽場&#xff08;…