【佳佳怪文獻分享】使用點云從半監督到全監督房間布局估計

標題:From Semi-supervised to Omni-supervised Room Layout Estimation Using Point Cloud

作者:Huan-ang Gao, Beiwen Tian, Pengfei Li, Xiaoxue Chen, Hao Zhao, Guyue Zhou , Yurong Chen and Hongbin Zha

來源:2023 IEEE International Conference on Robotics and Automation (ICRA 2023)

這是佳佳怪分享的第6篇文章

摘要

房間布局估計是一項存在已久的機器人視覺任務,對環境感知和運動規劃都有好處。然而,由于標注困難,使用點云(PC)進行布局估計仍存在數據稀缺的問題。因此,我們基于模型指數移動平均的理念,解決了這一任務的半監督設置問題。但要將這一方案調整為基于 PC 的布局估計的最先進(SOTA)解決方案并非易事。為此,我們定義了一種四元組匹配策略,并根據為布局四元組量身定制的指標定義了幾種一致性損失。此外,我們還提出了一種新的在線偽標簽采集算法,該算法將四邊形和 PC 之間的混合距離度量分布分解為兩個部分。該技術無需手動選擇閾值,可直觀地鼓勵四邊形與可靠的布局點對齊。令人驚訝的是,這一框架也適用于完全監督設置,在 ScanNet 基準測試中取得了新的 SOTA。最后但并非最不重要的一點是,我們還將半監督設置推向了現實的全監督設置,在新注釋的 ARKitScenes 測試集上展示了顯著提升的性能。我們的代碼、數據和模型都是公開的。

在這里插入圖片描述
圖 1. (a) 輸入是三維點云,其顏色僅用于可視化。(b) 我們僅使用 ScanNet 訓練集中 20% 的標注數據訓練前 SOTA 方法 PQ-Transformer,并將其作為基線。? 我們在整個 ScanNet 訓練集上采用我們的方法,只使用 20% 的標注數據,結果布局預測更加準確。
在這里插入圖片描述
?圖 2. 方法概述。在每次訓練迭代中,我們從有標簽數據集和無標簽數據集中分別抽取樣本,形成一個批次。首先對輸入批次進行隨機變換,然后將其輸入學生模型,生成預測結果。與此同時,輸入批次也被送入教師模型,然后經過變換得出預測結果。在采用的兩種轉換中,FPS 采樣使用不同的種子,而旋轉、翻轉和縮放則完全相同。我們總共施加了三種損失:(1) 轉化標簽與學生模型預測之間的監督損失。(2) 一致性損失,即最小化學生預測與教師預測之間的差異。(3) 鼓勵四邊形與可靠布局點對齊的偽標簽損失。學生參數根據三種損失之和通過梯度下降法更新,而教師參數則通過學生參數的指數移動平均(EMA)法更新。
在這里插入圖片描述
圖 3. 師生對齊圖解。(a) 對于每一個教師預測的四邊形,我們都會找到最近的學生預測的四邊形。盡管教師的預測是有噪聲的,但四邊形度得分卻能說明預測的準確性。預測的準確性。(b) 這三個圖說明了兩個四邊形之間定義距離的三個組成部分。定義的兩個四邊形之間的距離。
在這里插入圖片描述
圖4。關于Gamma混合濾波的插圖。我們在(b)中計算了所提出的點和四邊形之間的混合度量,其中較暖的顏色表示較短的距離。然后,我們將度量的分布分解為兩個分量,分別對應于屬于四邊形和不屬于四邊形的點。我們使用混合分布模型(如(c)所示)過濾掉冗余點,并以更高的精度重新估計四邊形,供學生模型學習。
在這里插入圖片描述
圖 5. ScanNet 的定性結果。比例代表使用中的注釋數據比例。
在這里插入圖片描述
圖 6. ARKitScenes 的定性結果。地面真實布局由crowd-sorcing注釋。
在這里插入圖片描述
表I 掃描網的布局估計F1-SCORES
在這里插入圖片描述
表 II 場景布局估計 F1 分數
在這里插入圖片描述
表III 數據轉換策略的消融
在這里插入圖片描述
表IV 四均值教師消融
在這里插入圖片描述

表 V 伽馬混合濾波的消融情況

結論

我們的研究邁出了僅使用點云進行全監督布局估計的第一步,這在機器人領域具有很好的應用前景。我們的訓練框架結合了四均值教師和伽瑪混合濾波,以更好地利用未標記的數據。實驗結果證明了我們的方法在半監督、全監督和全監督環境中的有效性。盡管我們的方法有效,但局限性仍然存在。在不完整的場景中,我們的方法的預測是不令人滿意的,在這些場景中,不足的點無法形成布局墻。未來,由于PQ Transformer[29]實現帶來的準實時速度,我們將考慮可能的糾正措施,包括整合在線推理結果。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/39919.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/39919.shtml
英文地址,請注明出處:http://en.pswp.cn/news/39919.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

根據源碼,模擬實現 RabbitMQ - 通過 SQLite + MyBatis 設計數據庫(2)

目錄 一、數據庫設計 1.1、數據庫選擇 1.2、環境配置 1.3、建庫建表接口實現 1.4、封裝數據庫操作 1.5、針對 DataBaseManager 進行單元測試 一、數據庫設計 1.1、數據庫選擇 MySQL 是我們最熟悉的數據庫,但是這里我們選擇使用 SQLite,原因如下&am…

手機出現 不讀卡 / 無信號時應該怎么辦?

當手機屏幕亮起,一般在屏幕最上方都會有代表手機卡狀態的顯示,其中網絡信號和讀卡狀態的標識,依舊有很多人分不太清,更不清楚改怎么辦了。 1、當我們的手機里有兩張卡時,則會有兩個信號顯示 2、信號狀態一般是由短到…

CSS自己實現一個步驟條

前言 步驟條是一種用于引導用戶按照特定流程完成任務的導航條,在各種分步表單交互場景中廣泛應用。例如:在HIS系統-門診醫生站中的接診場景中,我們就可以使用步驟條來實現。她的執行步驟分別是:門診病歷>遺囑錄入>完成接診…

ArcGIS Pro基礎入門、制圖、空間分析、影像分析、三維建模、空間統計分析與建模、python融合、案例全流程科研能力提升

目錄 第一章 入門篇 GIS理論及ArcGIS Pro基礎 第二章 基礎篇 ArcGIS數據管理與轉換 第三章 數據編輯與查詢、拓撲檢查 第四章 制圖篇 地圖符號與版面設計 第五章 空間分析篇 ArcGIS矢量空間分析及應用 第六章 ArcGIS柵格空間分析及應用 第七章 影像篇 遙感影像處理 第八…

Python random模塊用法整理

隨機數在計算機科學領域扮演著重要的角色,用于模擬真實世界的隨機性、數據生成、密碼學等多個領域。Python 中的 random 模塊提供了豐富的隨機數生成功能,本文整理了 random 模塊的使用。 文章目錄 Python random 模塊注意事項Python random 模塊的內置…

大語言模型控制生成的過程Trick:自定義LogitsProcessor實踐

前言 在大模型的生成過程中,部分原生的大語言模型未經過特殊的對齊訓練,往往會“胡說八道”的生成一些敏感詞語等用戶不想生成的詞語,最簡單粗暴的方式就是在大模型生成的文本之后,添加敏感詞庫等規則手段進行敏感詞過濾&#xf…

30行JS代碼帶你手寫自動回復語音聊天機器人

🥂(???)您的點贊👍?評論📝?收藏?是作者創作的最大動力🤞 前言 現如今生活中到處都是聊天機器人的身影,聊天機器人不僅僅能減少人工的聊天壓力,而且十分的可愛有趣,安卓系統的小AI&#xf…

Springboot整合Mybatis調用Oracle存儲過程

1、配置說明 Oracel11g+springboot2.7.14+mybatis3.5.13 目標:springboot整合mybatis訪問oracle中的存儲過程,存儲過程返回游標信息。 mybatis調用oracle中的存儲過程方式 2、工程結構 3、具體實現 3.1、在Oracle中創建測試數據庫表 具體數據可自行添加 create table s…

Lodash——使用與實例

1. 簡介 Lodash是一個一致性、模塊化、高性能的JavaScript實用庫。Lodash通過降低array、number、objects、string等等的使用難度從而讓JavaScript變得簡單。Lodash的模塊方法,非常適用于: 遍歷array、object 和 string對值進行操作和檢測創建符合功能的…

字符個數統計(同類型只統計一次)

思路:因為題目圈定出現的字符都是 ascii 值小于等于127的字符,因此只需要定義一個標記數組大小為128 ,然后將字符作為數組下標在數組中進行標記,若數組中沒有標記過表示第一次出現,進行計數,否則表示重復字…

簡單線性回歸:預測事物間簡單關系的利器

文章目錄 🍀簡介🍀什么是簡單線性回歸?🍀簡單線性回歸的應用場景使用步驟:注意事項: 🍀代碼演示🍀結論 🍀簡介 在數據科學領域,線性回歸是一種基本而強大的統…

Kali Linux助您網絡安全攻防實戰

Kali Linux:黑客與防御者的神器 Kali Linux是一款專為網絡安全測試和攻防實踐而設計的操作系統。它匯集了大量的安全工具,可以用于滲透測試、漏洞掃描、密碼破解等任務,不僅為黑客提供了強大的攻擊能力,也為安全防御者提供了測試和…

Kafka 入門到起飛 - 什么是 HW 和 LEO?何時更新HW和LEO呢?

上文我們已經學到, 一個Topic(主題)會有多個Partition(分區)為了保證高可用,每個分區有多個Replication(副本)副本分為Leader 和 Follower 兩個角色,Follower 從Leader同…

爬蟲逆向實戰(十八)--某得科技登錄

一、數據接口分析 主頁地址:某得科技 1、抓包 通過抓包可以發現數據接口是AjaxLogin 2、判斷是否有加密參數 請求參數是否加密? 查看“載荷”模塊可以發現有一個password加密參數和一個__RequestVerificationToken 請求頭是否加密? 無…

【Linux】Reactor模式

Reactor模式 Reactor模式的定義 Reactor反應器模式,也叫做分發者模式或通知者模式,是一種將就緒事件派發給對應服務處理程序的事件設計模式。 Reactor模式的角色構成 Reactor主要由以下五個角色構成: reactor模式的角色 角色解釋Handle(句…

保姆級別講解Python數據處理,你絕對能會

名字:阿玥的小東東 學習:Python、C/C 主頁鏈接:阿玥的小東東的博客_CSDN博客-python&&c高級知識,過年必備,C/C知識講解領域博主 目錄 1. 文件讀取 2. 數據處理 3. 處理結果輸出 總的來說 為了咱們讓程序跑起來,我們需…

DAY3,ARM(LED點燈實驗)

1.匯編實現開發板三盞燈點亮熄滅&#xff1b; .text .global _start _start: /**********LED123點燈**************/RCC_INIT:1使能PE10 PF10 PE8RCC..寄存器,E[4]1 F[5]1 0x50000a28ldr r0,0x50000a28ldr r1,[r0]orr r1,r1,#(0x3 << 4)str r1,[r0]LED1_INET:2初始化LED…

酷開系統 | 酷開科技大數據,更好的與目標消費人群建立聯系

眾所周知&#xff0c;OTT的一大優勢在于強曝光&#xff0c;能夠給消費者帶來強烈的視覺沖擊&#xff0c;強化品牌認知。但是&#xff0c;要想達到提升品牌認知&#xff0c;首先要保證OTT的流量規模&#xff0c;實現對目標人群的有效覆蓋。得年輕消費者得“天下”&#xff0c;年…

tk切換到mac的code分享

文章目錄 前言一、基礎環境配置二、開發軟件與擴展1.用到的開發軟件與平替、擴展情況 總結 前言 最近換上了coding人生的第一臺mac&#xff0c;以前一直偏好tk&#xff0c;近來身邊的朋友越來越多的用mac了&#xff0c;win的自動更新越來越占磁盤了&#xff0c;而且win11拋棄了…

vue elementui v-for 循環el-table-column 第一列數據變到最后一個

這個動態渲染table表格時發現el-table-column 第一列數據變到最后一個 序號被排到后面 代碼 修改后 <el-table:data"tableData"tooltip-effect"dark"style"width: 100%"height"500"><template v-for"(item, index) i…