傳統的6d位姿估計fangfa1_李飛飛團隊最新論文:基于anchor關鍵點的類別級物體6D位姿跟蹤...

點擊上方“3D視覺工坊”,選擇“星標”

干貨第一時間送達

c94126ea608a826988a5a0da61f500a7.png

簡介

作者提出了一種基于RGB-D的深度學習方法6PACK,能夠實時的跟蹤已知類別物體。通過學習用少量的3D關鍵點來簡潔地表示一個物體,基于這些關鍵點,通過關鍵點匹配來估計物體在幀與幀之間的運動。這些關鍵點使用無監督端到端學習來實現有效的跟蹤。實驗表明該方法顯著優于現有方法,并支持機器人執行簡單的基于視覺的閉環操作任務。

問題的提出

在機器人抓取任務中,實時跟蹤物體6D位姿的能力影響抓取任務的實施。現有的6D跟蹤方法大部分是基于物體的三維模型進行的,有較高的準確性和魯棒性。然而在現實環境中,很難獲得物體的三維模型,所以作者提出開發一種類別級模型,能夠跟蹤特定類別從未見過的物體。

創新點

1、這種方法不需要已知物體的三維模型。相反,它通過新的anchor機制,類似于2D對象檢測中使用的proposals方法,來避免定義和估計絕對6D位姿。2、這些anchor為生成3D關鍵點提供了基礎。與以往需要手動標注關鍵點的方法不同,提出了一種無監督學習方法,該方法可以發現最優的3D關鍵點集進行跟蹤。3、這些關鍵點用于簡潔的表示物體,可以有效地估計相鄰兩幀之間位姿的差異。這種基于關鍵點的表示方法可以實現魯棒的實時6D姿態跟蹤。

核心思想

作者提出的模型使用RGB-D圖像,基于之前位姿周圍采樣的anchors(紅點),來魯棒地檢測和跟蹤一組基于3D類別的關鍵點(黃色)。然后利用連續兩幀中預測的關鍵點,通過最小二乘優化求解點集對齊的問題,計算出6D物體的位姿變化:

437daeedd5a4d705e89d21d2aae61e51.png

問題的定義

將類別級物體6D位姿跟蹤定義為:物體在連續時間t?1和t之間的位姿變化問題。初始位姿是針對相同類別的所有目標物體定義的標準框架相對于相機框架的平移和旋轉。例如,對于類別“相機”,將框架放置在物體的質心處,x軸指向相機物鏡的方向,y軸指向上方。將3D關鍵點定義為:在整個時間序列中幾何和語義上一致的點。給定兩個連續的輸入幀,需要從兩幀中預測匹配的關鍵點列表。基于剛體假設的基礎,利用最小二乘優化來解決點集對齊問題,從而得到位姿的變化?p。

模型

首先在預測物體實例的周圍剪裁一個放大的體積,將其歸一化為一個單元;在體積塊上生成anchor網格;之后使用DenseFusion計算M個點的幾何與顏色融合特征;根據距離將它們平均池化成N個anchor特征;注意力機制網絡使用anchor特征來選擇最接近質心的點;用質心生成一組有序的關鍵點。將這種關鍵點生成方法應用在前一幀和當前幀,得到兩組有序的關鍵點來計算幀間的位姿變化。6ea9dad38692bcca2e2f31d4836b19b3.png6-PACK算法在預測位姿周圍生成anchor網格的過程中使用了注意力機制。每個點用RGB-D點單獨特征的距離加權和來表示體積。使用anchor信息在新的RGB-D框架中找到物體的粗略質心,并指導對其周圍關鍵點的后續搜索,這比在無約束的三維空間中搜索關鍵點效率更高。?

實驗與結果

作者采用的數據集是NOCS-REAL275,包含六個類別。通過對比三個模型的baseline來評估作者的方法。NOCS:類別級物體6D位姿估計sota。ICP:Open3D中中實現的標準點對面ICP算法。KeypointNet:直接在三維空間中生成3D關鍵點。308fbc2f6eeee0c3f12d14b6cca21584.png1)6-PACK指標5°/5cm比NOCS高出15%以上,指標IoU25高出12%。說明與使用所有輸入像素作為關鍵點的NOCS相比,6-PACK能夠檢測出最適合類別級6D跟蹤的3D關鍵點。實驗結果如下圖所示:83acdd49b9d8f6a4f97fd9e9e774b1df.png其中,前兩列為NOCS和6-PACK的定性對比,后兩列為關鍵點匹配的結果。2)6-PACK所有指標都優于KeypointNet,KeypointNet經常跟丟。作者的方法避免了丟失物體的軌跡(IoU25>94%),基于anchor的注意力機制提高了整體的跟蹤性能。3)為了檢驗不同方法的魯棒性和穩定性,作者計算了沒有前x幀的平均性能。這樣就能測量出初始位姿對性能的影響(接近初始位姿的幀很容易跟蹤)。如下圖,除了NOCS之外,所有方法的性能都有所下降,因為NOCS是位姿估計方法,而不是位姿跟蹤方法。在整個過程中,6-PACK的性能比NOCS高出10%以上,并在初始幀100后停止下降。bf9c5ed76245ceb8d9712b346b4784aa.png4)作者在機器人上進行了實時測試,超過60%的試驗中,成功地跟蹤了目標(目標在可視范圍內),而沒有丟失。

論文地址:https://arxiv.org/abs/1910.10750v1

代碼鏈接:https://sites.google.com/view/6PACKtracking

上述內容,如有侵犯版權,請聯系作者,會自行刪文。

推薦閱讀

吐血整理|3D視覺系統化學習路線

那些精貴的3D視覺系統學習資源總結(附書籍、網址與視頻教程)

超全的3D視覺數據集匯總

大盤點|6D姿態估計算法匯總(上)

大盤點|6D姿態估計算法匯總(下)

機器人抓取匯總|涉及目標檢測、分割、姿態識別、抓取點檢測、路徑規劃

匯總|3D點云目標檢測算法

匯總|3D人臉重建算法那些年,我們一起刷過的計算機視覺比賽總結|深度學習實現缺陷檢測深度學習在3-D環境重建中的應用匯總|醫學圖像分析領域論文大盤點|OCR算法匯總

重磅!3DCVer-知識星球和學術交流群已成立

3D視覺從入門到精通知識星球:針對3D視覺領域的知識點匯總、入門進階學習路線、最新paper分享、疑問解答四個方面進行深耕,更有各類大廠的算法工程人員進行技術指導,550+的星球成員為創造更好的AI世界共同進步,知識星球入口:

學習3D視覺核心技術,掃描查看介紹,3天內無條件退款690610f30159eac89aa20c2314a83f70.png

?圈里有高質量教程資料、可答疑解惑、助你高效解決問題

歡迎加入我們公眾號讀者群一起和同行交流,目前有3D視覺CV&深度學習SLAM三維重建點云后處理自動駕駛、CV入門、醫療影像、缺陷檢測、行人重識別、目標跟蹤、視覺產品落地、視覺競賽、車牌識別等微信群,請掃描下面微信號加群,備注:”研究方向+學校/公司+昵稱“,例如:”3D視覺?+ 上海交大 + 靜靜“。請按照格式備注,否則不予通過。添加成功后會根據研究方向邀請進去相關微信群。原創投稿也請聯系。

adc857a3e08ea6ed30fa0edacd879f96.png▲長按加群或投稿

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/533794.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/533794.shtml
英文地址,請注明出處:http://en.pswp.cn/news/533794.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

c語言的程序結構語序,第3章 C語序結構.doc

第3章 C語序結構第三章 基本語句本章要求:1.表達式語句,空語句,復合語句2.數據的輸入與輸出,輸入,輸出函數的調用C語句概述C程序的執行部分是由語句組成的。 程序的功能也是由執行語句實現的。3.1 賦值語句賦值語句: 是由賦值表達式再加上分號構成的表達…

安卓system鏡像分區_玩機愛好者想要的PT分區到底是什么?可以使現有的安卓系統更快!...

小編第一次看見PT分區這個詞。就比較好奇他到底是什么神仙技術。今天,小編給大家科普一下,可能小編理解的也不是特別準確,請各位諒解!! 歡迎關注小編。各位玩機愛好者總是沉浸在各種ROM包、第三發Rec,以及各…

計算器軟件C語言課程設計實驗報告,c簡單計算器實驗報告_相關文章專題_寫寫幫文庫...

時間:2019-05-15 12:55:15 作者:admin計算器實驗報告班級: 07計本(1)班姓名: 王林學號: 20706031047指導老師: 韓靜一、 需求分析(1)制作一個計算器界面工程,有數字運算符等鍵,輸入表…

python求和1到100_python等差數列求和公式前 100 項的和實例

python等差數列求和公式前 100 項的和實例 最近跑去學了下python,一個很簡單的題,結果發現數學公示忘了,在不用for循環的情況下居然有些懵,記錄為下.. 題:等差數列可以定義為每一項與它的前一項的差等于一個常數,可以用…

android mqtt詳解_Android mqtt入門 Android studio(轉)

Android mqtt入門 Android studio2018年04月09日 14:02:30 hbw020 閱讀數:1564分享 mqtt簡單使用介紹:1、as創建工程2、官網下載mqtt支持包放入lib文件,點擊打開鏈接,https://repo.eclipse.org/content/repositories/paho-release…

jupyter kernel_新鄉聯通案例分享:Jupyter開發環境配置的常用技巧

Jupyter開發環境配置的常用技巧新鄉聯通網管中心 邢少華Python開發環境中,大部分人使用的是Jupyter,在Jupyter中有幾個令人困擾的問題:1. Jupyter的默認打開目錄如何修改2. Jupyter默認使用的瀏覽器如何修改3. 好用的Jupyter插件如何安裝4.…

東北大學c語言及程序設計,東大20秋學期《C語言及程序設計》在線平時作業1參考...

20秋學期《C語言及程序設計》在線平時作業1( j- V: Z* f0 i V& k% b, S. ?/ _8 ~1.[單選題] 在C語言中,引用數組元素時,其數組下標的數據類型允許是()。2 6 g, p1 C$ P; B$ _( J附件是答案,核對題目下載4 m1 F; D: R* q; AA.整型常量- _…

mac安裝ipython_Mac下安裝ipython與jupyter

IPython從Python發展而來,更傾向于科學計算。互聯網數據分析更喜歡用。首先切換root用戶:sudo su -pip3自動安裝ipythonMacBook-Pro:~ root# pip3 install ipython自動安裝完成后建立軟連接,方便使用MacBook-Pro:bin root# ln -s /Library/Fr…

二叉樹 中序遍歷 python_LeetCode 105 樹 從前序與中序遍歷序列構造二叉樹(Medium)

17(105) 從前序與中序遍歷序列構造二叉樹(Medium)描述根據一棵樹的前序遍歷與中序遍歷構造二叉樹。注意: 你可以假設樹中沒有重復的元素。示例例如,給出前序遍歷 preorder [3,9,20,15,7] 中序遍歷 inorder [9,3,15,20,7]返回如下的二叉樹:3/ 9 20/ 1…

c語言刪除雙向鏈表重復元素,求一個雙向鏈表的建立,插入刪除的c語言程序完整版的,借鑒一下思想,再多說一下就是能運行的那種...

最佳答案//鏈表的操作編輯//線性表的雙向鏈表存儲結構typedef struct DuLNode{ElemType data;struct DuLNode *prior,*next;}DuLNode,*DuLinkList;////帶頭結點的雙向循環鏈表的基本操作void InitList(DuLinkList L){ /* 產生空的雙向循環鏈表L */L(DuLinkList)malloc(sizeof(D…

華為p10和p10plus區別_華為p10和p10plus哪個好 華為p10與p10plus區別對比【圖文】

華為p10與p10plus是華為在2017年的首發旗艦手機,作為顏值與配置都很亮眼的華為p10與p10plus自然成了大眾的焦點,當然也就避不可免的用來對比。究竟華為p10和p10plus哪個好?下面小編就來給大家講講華為p10與p10plus的區別對比。華為P10與P10 Plus區別對比…

python數學圓周率_Python編程超簡單方法算圓周率

我們都知道,圓周率是3.1415926也就是π,但你有沒有想過,圓周率是怎么算出來的呢? 這個是德國數學家萊布尼茲發明的算圓周率的方法,公式為:π4(1-1/31/51/71/9-1/11……),其中,分母每…

計算payload長度c語言,C語言0長度數組(可變數組/柔性數組)詳解

1 零長度數組概念眾所周知, GNU/GCC 在標準的 C/C 基礎上做了有實用性的擴展, 零長度數組(Arrays of Length Zero) 就是其中一個知名的擴展.多數情況下, 其應用在變長數組中, 其定義如下struct Packet{ int state; int len; char cData[0]; //這里的0長結構體就為變長結構體提供…

iphone主屏幕動態壁紙_iPhone8怎么設置動態壁紙?iPhone8動態壁紙設置教程

iPhone8怎么設置動態壁紙?朋友們平時想把一些拍攝的動態圖片設置iPhone8壁紙,該怎么設置呢?估計有 不少朋友還不知道如何設置, 在這里我就來為大家介紹一下iPhone8設置動態壁紙的教程,一起來看一看吧!iPhone8動態壁紙設置教程首先打開iPhon…

python封裝介紹_談python3的封裝

這章給大家介紹,如何封裝一個簡單的python庫首先創建一個以下型式的文件結構rootFile/setup.pyexample_package/__init__.pyexample_module.pyexample_package2/__init__.pyexample_module.py其中的兩個__init__.py可以是一個空文件,但是它是導入package…

go語言調用c 的頭文件 so,golang 學習(10): 使用go語言調用c語言的so動態庫-Go語言中文社區...

一、前言最近在學習go,因為需要調用c語言打包成的so動態庫里面的方法,避免自己再去造輪子,所以想直接使用golang調用so,但是參考了其他博客大佬寫的,我每一步原封不動的寫下來,結果都是一堆錯誤&#xff0c…

log nginx 客戶端請求大小_Nginx日志分析和參數詳解

本文檔主要介紹Nginx設置日志參數的作用,以及Nginx日志常用分析命令基本大綱:1.Nginx日志記錄格式的介紹2.Nginx日志參數詳解3.Web服務流量名詞介紹4.Nginx日志常用分析命令示范一:Nginx日志記錄格式的介紹log_format用來設置日志的記錄格式&…

python函數的封裝調用_Python封裝一個函數來打印到變量

如果我有一個包含大量打印語句的函數: 即. def funA(): print "Hi" print "There" print "Friend" print "!" 我想做的是這樣的事情 def main(): ##funA() does not print to screen here a getPrint(funA()) ##where get…

android 開機動畫 漸變,[Parallax Animation]實現知乎 Android 客戶端啟動頁視差滾動效果...

前言Parallax Scrolling (視差滾動),是一種常見的動畫效果。視差一詞來源于天文學,但在日常生活中也有它的身影。在疾馳的動車上看風景時,會發現越是離得近的,相對運動速度越快,而遠處的山川河流只是緩慢的移動著&…

js訪問對方手機文件夾_求JS大神幫我寫個利用JS來實現手機端和PC端訪問自動選擇樣式文件代碼...

展開全部現在比較流行的辦法是 一個網站2套代碼,一套是手機一套pc,在網站首頁開e68a84e8a2ad3231313335323631343130323136353331333363353735頭寫上一段識別各瀏覽器的判斷方法,根據結果引入不同的樣式詳細判斷如下:var browser{…