角度回歸——八參數檢測四邊形Gliding Vertex

文章目錄

  • 一、介紹
    • (一)五參數檢測方法( 基于角度)
    • (二)八參數檢測方法(point-based)的邊界
  • 二、方案分析
    • (一)問題定義
    • (二)方案
    • (三)Gliding Vertex方案的問題
  • 參考

一、介紹

遙感目標檢測Gliding Vertex 是四邊形檢測器,而且都考慮到了順序標簽點(sequential label points)的問題。我們先給出這兩篇文章的鏈接:

  • https://arxiv.org/abs/1911.09358

(一)五參數檢測方法( 基于角度)

在當前常用的旋轉檢測框的角度定義下,由于存在旋轉角度的邊界問題,會產生不必要的損失!
在這里插入圖片描述

(二)八參數檢測方法(point-based)的邊界

如果是藍框是anchor,紅框是ground-truth,那么通過點的排序之后,實際和理想的回歸方式是一樣的(按照回歸的距離定義)
在這里插入圖片描述

二、方案分析

(一)問題定義

首先我們要了解一下為什么在做四邊形檢測前要對四個角點進行排序。舉一個簡單的例子,如果一個四邊形的ground-truth是(x1,y1,x2,y2,x3,y3,x4,y4)并且所有的ground-truth并不是按一定規則順序標注的,那么檢測器有可能給出的預測結果是(x2,y2,x3,y3,x4,y4,x1,y1)。其實這兩個是框是完全重合的,但是網絡訓練算損失的時候并不知道,它會按對應位置計算損失,此時的損失值并不為0甚至很大。

(二)方案

基于上述問題:
1. Gliding Vertex的Head設計
Gliding Vertex文章通過改變框的表示方式避免了排序的麻煩。 先檢測水平框,這個是沒有序列問題的,然后學習水平框四個角點的偏移量來達到四邊形檢測的目的,其實這里的(偏移量,對應的水平框的點)配對就有排序的意思了。

原文是這樣寫的:By limiting the offset on the corresponding side of horizontal bounding box, we may facilitate offset learning and also avoid the confusion for sequential label points in directly regressing the four vertices of oriented objects

在這里插入圖片描述

Gliding Vertex通過水平框滑動偏移的方式預測旋轉框,避免了直接回歸無序角點的問題。其head結構包含以下輸出分支:

  • 分類分支(Cls Score):預測目標類別。
  • 水平框回歸分支:回歸水平外接矩形 ( c e n t e r x , c e n t e r y , w , h ) (center_x, center_y, w, h) (centerx?,centery?,w,h)
  • 偏移比例分支(Alpha):預測四個角點相對于水平框對應頂點的偏移比例 ( α 1 , α 2 , α 3 , α 4 ) (\alpha_1, \alpha_2, \alpha_3, \alpha_4) (α1?,α2?,α3?,α4?),通過 s i = α i ? w s_i = \alpha_i \cdot w si?=αi??w計算實際偏移量。
  • 傾斜因子(Obliquity Factor):定義為旋轉框面積與水平框面積的比值 r = ∣ O ∣ ∣ B h ∣ r = \frac{|O|}{|B_h|} r=Bh?O?,用于區分近水平目標( r ≈ 1 r \approx 1 r1時退化為水平框)和傾斜目標。

關鍵點順序控制
通過固定水平框的頂點順序(左上→右上→右下→左下),間接約束偏移量的對應關系,避免了角點排序問題。

(三)Gliding Vertex方案的問題

Gliding Vertex 預測水平框時存在問題,因此提出 obliquity factor的預測值,來控制當前所要預測目標是否可以直接采用(x,y,w,h)。
在這里插入圖片描述

參考

https://zhuanlan.zhihu.com/p/108185873

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/906572.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/906572.shtml
英文地址,請注明出處:http://en.pswp.cn/news/906572.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

鴻蒙系統電腦:開啟智能辦公新時代

鴻蒙系統電腦:開啟智能辦公新時代 引言 2025 年 5 月 8 日,華為正式推出了鴻蒙系統電腦,這款具有里程碑意義的產品,不僅彰顯了華為在智能設備領域的創新實力,也為用戶帶來了全新的智能辦公體驗。在數字化轉型加速的背…

計量單片機 RN8302:特性、使用與應用

在現代電力監測與能源管理領域,精確的電能計量至關重要。計量單片機 RN8302 作為一款高性能的電能計量芯片,憑借其卓越的特性與功能,在眾多應用場景中發揮著關鍵作用。本文將全面深入地介紹 RN8302 的各項特性、使用方法、注意事項以及廣泛的…

Flink 的窗口機制

&#x1fa9f; 1. 基于時間驅動的滾動時間窗口&#xff08;Tumbling Time Window - Time-based&#xff09; ? 定義&#xff1a; 每隔固定的時間周期開啟一個新的窗口。窗口之間不重疊。 &#x1f552; 示例&#xff1a; DataStream<Tuple2<String, Integer>>…

【RA-Eco-RA2L1-48PIN】ADC 電壓表與OLED顯示

【RA-Eco-RA2L1-48PIN】ADC 電壓表與OLED顯示 本文介紹了 RA-Eco-RA2L1-48PIN 開發板通過瑞薩 e2 Studio 靈活軟件包&#xff08;FSP&#xff09;編程實現 ADC 串口采集電壓和OLED顯示電壓數值的項目設計&#xff0c;包括串口電壓值串口打印、硬件 IIC 通信協議配置、 OLED顯示…

GraphQL在.NET 8中的全面實踐指南

一、GraphQL與.NET 8概述 GraphQL是一種由Facebook開發的API查詢語言&#xff0c;它提供了一種更高效、更靈活的替代REST的方案。與REST不同&#xff0c;GraphQL允許客戶端精確指定需要的數據結構和字段&#xff0c;避免了"過度獲取"或"不足獲取"的問題。…

Elasticsearch 寫入性能優化有哪些常見手段?

Elasticsearch 寫入性能優化常見手段主要有以下 10 個方向&#xff0c;建議根據具體業務場景組合使用&#xff1a; 批量寫入優化 使用_bulk API 批量提交文檔建議每批次 5-15MB 數據量并發執行多個批量請求 索引配置調優 PUT /my_index {"settings": {"inde…

【圖像大模型】基于深度對抗網絡的圖像超分辨率重建技術ESRGAN深度解析

基于深度對抗網絡的圖像超分辨率重建技術ESRGAN深度解析 一、技術背景與核心創新1.1 圖像超分辨率技術演進1.2 核心技術創新對比 二、算法原理深度解析2.1 網絡架構設計2.1.1 RRDB模塊結構 2.2 損失函數設計2.2.1 對抗損失&#xff08;Adversarial Loss&#xff09;2.2.2 感知損…

第八天 搭建車輛狀態監控平臺(Docker+Kubernetes) OTA升級服務開發(差分升級、回滾機制)

前言 在智能網聯汽車快速發展的今天&#xff0c;車輛狀態監控和OTA&#xff08;Over-The-Air&#xff09;升級已成為智能汽車的核心能力。本文將手把手帶你從零開始搭建基于云原生技術的車輛狀態監控平臺&#xff0c;并開發完整的OTA升級服務系統。無論你是剛接觸容器技術的開…

五分鐘學會如何封裝Jsckson工具類

前言&#xff1a;在 Java 開發中&#xff0c;JSON 是一種非常常見的數據格式&#xff0c;而 Jackson 是處理 JSON 的主流庫之一&#xff0c;為了提高代碼的復用性、可維護性&#xff0c;我們通常會將 Jackson 的操作封裝成一個工具類&#xff0c;簡化使用。 ???這里是秋刀魚…

InternLM 論文分類微調實踐(XTuner 版)

1.環境安裝 我創建開發機選擇鏡像為Cuda12.2-conda&#xff0c;選擇GPU為100%A100的資源配置 Conda 管理環境 conda create -n xtuner_101 python3.10 -y conda activate xtuner_101 pip install torch2.4.0cu121 torchvision torchaudio --extra-index-url https://downloa…

軟考中級軟件設計師——設計模式篇

一、設計模式核心分類 設計模式分為 3 大類&#xff0c;共 23 種模式&#xff08;考試常考約 10-15 種&#xff09;&#xff1a; 分類核心模式考試重點創建型模式工廠方法、抽象工廠、單例、生成器、原型單例模式的實現&#xff08;懶漢、餓漢&#xff09;、工廠模式的應用場…

小米2025年校招筆試真題手撕(一)

一、題目 小A每天都要吃a,b兩種面包各一個。而他有n個不同的面包機&#xff0c;不同面包機制作面包的時間各不相同。第i臺面包機制作a面包 需要花費ai的時間&#xff0c;制作b面包則需要花費bi的時間。 為能盡快吃到這兩種面包&#xff0c;小A可以選擇兩個不同的面包機x&…

【微信小程序 + 高德地圖API 】鍵入關鍵字搜索地址,獲取經緯度等

前言 又到熟悉的前言&#xff0c;接到個需求&#xff0c;要引入高德地圖api&#xff0c;我就記錄一下&#xff0c;要是有幫助記得點贊、收藏、關注&#x1f601;。 后續有時間會慢慢完善一些文章&#xff1a;&#xff08;畫餅時間&#xff09; map組件自定義氣泡、mark標記點…

uni-app(2):頁面

1 頁面簡介 uni-app項目中&#xff0c;一個頁面就是一個符合Vue SFC規范的 vue 文件。 在 uni-app js 引擎版中&#xff0c;后綴名是.vue文件或.nvue文件。 這些頁面均全平臺支持&#xff0c;差異在于當 uni-app 發行到App平臺時&#xff0c;.vue文件會使用webview進行渲染&…

Axure實戰:智慧水務管理系統原型設計速覽

本原型通過Axure構建覆蓋生產到服務的全流程交互模型&#xff0c;聚焦"數據驅動智能決策"核心價值&#xff0c;助力水務企業實現管理效率提升與運營成本優化。 系統采用"13N"架構&#xff1a; 1個統一入口&#xff1a;集成單點登錄與角色動態權限&#xff…

十二、Linux實現截屏小工具

系列文章目錄 本系列文章記錄在Linux操作系統下&#xff0c;如何在不依賴QT、GTK等開源GUI庫的情況下&#xff0c;基于x11窗口系統&#xff08;xlib&#xff09;圖形界面應用程序開發。之所以使用x11進行窗口開發&#xff0c;是在開發一個基于duilib跨平臺的界面庫項目&#x…

藍橋杯分享經驗

系列文章目錄 提示&#xff1a;小白先看系列 第一章 藍橋杯的錢白給嗎 文章目錄 系列文章目錄前言一、自我介紹二、經驗講解:1.基礎知識2.進階知識3.個人觀點 三、總結四、后續 前言 第十六屆藍橋杯已經省賽已經結束了&#xff0c;相信很多小伙伴也已經得到自己的成績了。接下…

XC3588H搭載國產麒麟系統可用于政務/社保一體機嗎?

答案是肯定的。 向成電子XC3588H搭載的國產銀河麒麟系統和國產星光麒麟系統已完成適配&#xff0c;適用于政務服務、社保服務一體機的所有外設&#xff0c;運行穩定流暢。 在數字化政務快速發展的今天&#xff0c;政務服務終端的穩定性、安全性與高效性成為提升群眾辦事體驗的關…

如何排查服務器 CPU 溫度過高的問題并解決?

服務器CPU溫度過高是一個常見的問題&#xff0c;可能導致服務器性能下降、系統穩定性問題甚至硬件損壞。有效排查和解決服務器CPU溫度過高的問題對于確保服務器正常運行和延長硬件壽命至關重要。本文將介紹如何排查服務器CPU溫度過高的問題&#xff0c;并提供解決方法&#xff…

物聯網、云計算技術加持,助推樓宇自控系統實現智能高效管理

在建筑智能化發展的進程中&#xff0c;樓宇自控系統作為實現建筑高效管理的核心載體&#xff0c;正面臨著數據海量復雜、設備協同困難、管理響應遲緩等挑戰。而物聯網與云計算技術的深度融合&#xff0c;為樓宇自控系統的升級提供了全新的解決方案&#xff0c;賦予其智能感知、…