《BASeg: Boundary aware semantic segmentation for autonomous driving》論文解讀

期刊:Neural Networks | Journal | ScienceDirect.com by Elsevier

年份:2023

代碼:https://github.com/Lature-Yang/BASeg

摘要

語義分割是自動駕駛領域街道理解任務的重要組成部分。現有的各種方法要么專注于通過聚合全局或多尺度上下文信息來構建對象內部的一致性,要么簡單地將語義特征與邊界特征相結合來細化對象細節。盡管令人印象深刻,但大多數都忽略了內部對象和邊界之間的長程依賴關系。本文提出一種邊界感知網絡(BASeg)用于語義分割,利用邊界信息作為指導上下文聚合的重要線索。具體而言,在BASeg中提出了邊界細化模塊(Boundary Refined Module, BRM),通過骨架中的高層多尺度語義特征來細化Canny檢測器粗粒度的底層邊界特征;在此基礎上,進一步提出了上下文聚合模塊(Context Aggregation Module, CAM),以捕獲邊界區域與目標內部像素之間的長程依賴關系,實現相互增益并增強類內一致性。此外,所提出方法可以插入到其他CNN主干中以較小的計算預算獲得更高的性能,并在數據集ADE20K、Cityscapes和CamVid上分別獲得了45.72%、81.2%和77.3%的mIoU。與一些最新的基于resnet101的分割方法相比,大量的實驗證明了該方法的有效性。

Introduction

主要貢獻

  • 針對語義分割問題,提出了由邊界特征、語義特征和聚合特征組成的語義分割框架BASeg,該框架采用基于注意力的機制來引導邊界特征的上下文聚合。
  • 將邊界細化模塊(BRM)集成到BASeg中,從Canny檢測器獲得的粗輪廓中生成顯著的細化邊界信息。
  • 在Cityscapes和CamVid等公共駕駛場景數據集和ADE20K等語義數據集上進行了廣泛的實驗,證明了所提出模型的優越性能。

Method

網絡架構

  • BASeg網絡由邊界流、語義流和聚合流組成,利用邊界上下文信息來分割對象。
  • 邊界流用于預測給定圖像的二值邊界,語義流用于生成語義特征圖,聚合流用于捕獲語義特征圖和邊界特征圖之間的長距離依賴。
  • 網絡架構包括使用ResNet101作為主干網絡,ASPP(Atrous Spatial Pyramid Pooling)模塊用于提取空間信息,以及引入全局平均池化分支以提供圖像級信息。

主要組件:?

  • AGB:注意門塊,過濾噪聲并增強更高層級特征的細節
  • ASPP:Atrous空間金字塔池,融合多尺度特征
  • CAM:上下文聚合模塊,用于捕獲邊界區域與對象內部像素之間的長距離依賴關系,實現相互增益并增強類內一致性。
  • BRM:邊界細化模塊,用于通過高級多尺度語義特征來細化Canny檢測器粗略檢測到的低級邊界特征。
  • Canny:邊緣檢測器

2.1 Boundary Refine Module(BRM)

提升從Canny邊緣檢測器獲得的粗略邊界特征,并將其與深層的語義特征結合起來,以便于網絡能夠更準確地識別和細化對象的邊界。

AGB中,特征信號X(來自Canny檢測的輪廓特征)和門控信號G(來自語義特征圖的高級特征)被結合起來,以增強邊界區域的特征。

2.2 Context Aggregation Module?(CAM)

負責捕獲邊界區域與對象內部像素之間的長距離依賴關系,以增強語義分割的性能。

計算過程:

  1. 特征轉換:CAM通過三個1×1卷積層將語義特征F和邊界特征B轉換為三個新的特征圖Q (Query), K (Key), V (Value)。這有助于減少參數數量和計算成本。
  2. 親和力矩陣計算:通過計算Key和Query之間的親和力矩陣S,來衡量不同像素間的相互影響。親和力矩陣S是通過Key和Query的矩陣乘法以及Softmax函數得到的。
  3. 注意力機制:親和力矩陣S反映了像素間的相關性,通過Softmax函數進行歸一化處理,以突出顯示重要像素對其他像素的影響。
  4. 特征適應:對親和力矩陣S應用另一個1×1卷積層進行特征適應,以進一步優化特征表示。
  5. 上下文聚合:利用親和力矩陣和Value特征圖V,通過元素級求和操作,聚合輸入的語義特征圖和上下文注意力圖,生成聚合后的特征圖F。

?2.3?Loss function

用來衡量模型預測與真實標簽之間的差異,并指導網絡訓練過程中的參數更新。BASeg采用了一個多任務損失函數,它聯合了三個獨立的損失來優化網絡的不同部分:

1. body loss:計算了網絡對每個像素預測的類別概率與真實標簽之間的差異。

2. bound loss:衡量了預測的邊界與真實邊界標簽之間的差異,有助于細化邊界區域的分割。

?3. 輔助損失:像素級交叉熵損失,用于對選定的中間層特征進行輔助監督,以幫助網絡學習更泛化的特征表示。中間層 F4 施加輔助監督來訓練模型、

4. 聯合損失:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/44883.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/44883.shtml
英文地址,請注明出處:http://en.pswp.cn/web/44883.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

曠野之間20 - Google 研究的推測 RAG

為什么選擇 RAG 新興能力 直到最近,人們發現 LLM 具有新興能力,即在與用戶或任務交互過程中出現的意外功能。 這些功能的示例包括: 解決問題: LLM 可以利用其語言理解和推理能力,為未經過明確培訓的任務提供富有洞…

js的原型鏈

原型鏈: 1.如何構成原型鏈? 2.原型鏈上屬性的增刪改查。 3.絕大多數對象的最終都會繼承自Object.prototype (var obj Object.create(null或者undefined)沒有原型)。 4.Object.create(原型)。 構成原型鏈和操作原型鏈屬性: //最頂的原型是Object.pro…

性能優化篇:SQL數據庫查表速度優化

SQL數據庫查詢的性能優化是確保數據庫能夠快速響應和高效處理請求的關鍵。以下是一些常見的SQL數據庫查詢性能優化方法: 索引優化: 創建適當的索引:為經常在WHERE子句中使用的列、JOIN操作涉及的列以及排序操作涉及的列創建索引。避免過多的索引:雖然索引可以提高查詢速度,…

python的字符串

字符串 簡單操作 創建 利用 ‘ ’ 或 “ ” 將字符或數字包裹起來的都為字符串 a"你好" 格式化字符串 元組的字符格式化 字符串格式化函數 srt.format() f格式化 方法 split()//指定分割符經行分割 strip()//指定移除字符頭尾的字符 join()//指定序列中的字符連接成新…

【Perl】Perl 語言入門

1. Perl語言介紹 Perl 是一種高級、解釋型、動態編程語言,由Larry Wall在1987年發布。Perl 以其強大的文本處理能力而聞名,特別是在處理報告生成、文件轉換、系統管理任務等方面。它吸收了C、Shell腳本語言、AWK、sed等語言的特性,并加入了大…

Go:常量運算符流程控制

目錄 一、常量 1.1 常量基本定義 1.2 常量組的定義 1.3 常量枚舉 二、運算符 2.1 算數運算符 2.2 關系運算符 2.3 邏輯運算符 2.4 位運算符 2.5 賦值運算符 2.6 指針運算符 2.7 運算符優先級 三、流程控制 3.1 if-else 條件語句 3.2 switch-case語句 3.3 for 循…

5、 測試

這里寫目錄標題 1、自動化測試簡介(1)自動化測試是什么(2)為什么要寫測試測試節約你的時間發現錯誤,預防錯誤測試使得代碼更有吸引力 2、基礎測試策略3、開始寫第一個測試(1)首先得有個bug&…

Not Invented Here 不是在這里發明的 / Proudly found elsewhere 自豪地在其他地方找到

注: 機翻,未校對。 兩篇關于創新管理的小文章 Not Invented Here 不是在這里發明的 In the history of organizational success, the enterprises that dominate tend to flawlessly execute on ideas that were created elsewhere. Examine just abo…

智慧水利解決方案:從理論到實踐的全面跨越,展示其在水資源管理、水災害預警、水生態保護等方面的創新應用

目錄 一、引言:智慧水利的時代背景與意義 二、智慧水利的理論框架與技術體系 1、理論框架 2、技術體系 三、智慧水利在水資源管理中的應用 1、水資源優化配置 2、水量水質協同管理 四、智慧水利在水災害預警中的應用 1、洪水預警與應急響應 2、干旱監測與評…

git 創建分支--命令行

在Git中創建分支是一個相對簡單且重要的操作,它允許開發者在不影響主代碼庫的情況下進行開發或修復工作。以下是創建Git分支的步驟: 一、基本步驟 打開命令行終端: 首先,需要打開命令行終端(在Windows上可以是CMD、Po…

Mediapipe-姿態估計實例

Mediapipe簡介 Mediapipe 是由 Google Research 開發的一款開源框架,旨在幫助開發者輕松地構建、測試和部署復雜的多模態、多任務的機器學習模型。它特別擅長于實時處理和分析音頻、視頻等多媒體數據。以下是 Mediapipe 的一些關鍵特點和組件: 關鍵特點…

基于微信小程序的音樂播放平臺

基于微信小程序的音樂播放平臺 音樂播放小程序項目簡介技術棧功能模塊項目流程系統E-R圖項目頁面 音樂播放小程序 項目簡介 微信音樂小程序旨在提供一個簡潔高效的音樂播放平臺,用戶可以方便地搜索、播放和收藏自己喜歡的音樂。整個項目采用前后端分離的架構&…

WIN10開機突然,過一會就自動重啟藍屏DRIVER_IRQL_NOT_LESS_OR_EQUAL

環境: Win10 專業版 DELL7080 問題描述: WIN10開機突然,過一會就自動重啟藍屏DRIVER_IRQL_NOT_LESS_OR_EQUAL 事件日志 解決方案: 1.找到MEMORY.DMP文件內容,分析一下 Microsoft (R) Windows Debugger Version 10…

主機安全-開源HIDS字節跳動Elkeid安裝使用

目錄 概述什么是HIDSHIDS與NIDS的區別EDR、XDR是啥? Elkeid架構Elkeid Agent && Agent centerElkeid DriverElkeid RASPElkeid HUBService DiscoveryManager安裝數據采集規則&告警 參考 概述 什么是HIDS HIDS( host-based intrusion detec…

使用Gitee倉庫鏡像管理功能實現Gitee與Github 雙向同步

進入你所需要同步的倉庫,點擊「管理」->「鏡像倉庫管理」,點擊「添加鏡像」選項; 如果你的Gitee賬號還沒有綁定過 GitHub 帳號,先根據彈窗的提示綁定 GitHub 帳號; 添加鏡像時候,在「鏡像方向」中選擇…

二次開發源碼 借貸系統uniapp/借貸認證系統/小額信貸系統/工薪貸APP/資金貸系統h5

前端:UNIAPP 后端:ThinkPHP 數據庫: Mysql 前端使用的uniapp 可以打包APP H5 小程序 系統提供了完善的網絡借貸體系,為金融中介平臺提供從獲客到貸后管理全流程服務,解決了借貸手續繁瑣、流程緩慢等問題 此源碼為運營…

ES6操作符使用總結

最近做新項目時候用到了ES6 添加的一些運算符,使用起來很方便,簡化了代碼,增強了代碼容錯性。使用感不錯,下面做了總結,本文也會持續維護。 1. !!props.useDefaultColor 這個技巧的作用是將任何 JavaScript 值轉換為…

管理Linux本地用戶和組

什么是用戶 用戶賬戶在可以運行命令的不同人員和程序之間提供安全界限。 在Linux系統中,系統通過分配唯一的標識號(用戶ID或UID)來區分不同的用戶帳戶。 在Linux系統中,用戶帳戶有以下三種主要類型: 超級用戶 負責…

分布式一致性算法:Raft學習

分布式一致性算法:Raft學習 1 什么是分布式系統? 分布式系統是由一組通過網絡進行通信、為了完成共同的任務而協調工作的計算機節點組成的系統。這些節點可能位于不同的物理位置,但它們協同工作以提供一個統一的計算平臺或服務。分布式系統…

對于復雜的數學模型,怎樣利用 MATLAB 的優化工具箱進行準確的參數估計和模型擬合?

要利用MATLAB的優化工具箱進行準確的參數估計和模型擬合,可以按照以下步驟進行: 定義模型:根據問題的需求和數學模型的形式,定義好模型的數學表達式。 收集數據:收集實際觀測數據,這些數據將用于擬合模型和…