論文閱讀筆記——Reactive Diffusion Policy

RDP 論文

  • 通過 AR 提供實時觸覺/力反饋;
  • 慢速擴散策略,用于預測低頻潛在空間中的高層動作分塊;快速非對稱分詞器實現閉環反饋控制。

ACT、 π 0 \pi_0 π0? 采取了動作分塊,在動作分塊執行期間處于開環狀態,無法及時響應環境變化,缺乏觸覺輸入,無法適應高精度(力控制)任務和及時響應。現有的觸覺輸入是側重于觀察方面,利用觸覺輸入提供視覺遮擋或接觸狀態判斷等信息。在數據上,MTDP(Mixed-Teleoperation Demonstration Policy)通過增強現實(AR)技術實現了兩大突破性改進:1)異構機器人兼容性 - 克服了傳統ALOHA雙邊控制系統必須使用同構機器人的限制;2)成本優化 - 相比基于專業力/扭矩傳感器的觸覺反饋方案,顯著降低了硬件成本。并且現有的觸覺輸入的方案均排除了視覺輸入。

  • 力/扭矩傳感器——直接測量末端或關節的力/扭矩數值,高速運動時噪聲明顯且成本高。
  • 觸覺傳感器
    • 電學式觸覺傳感器——通過電容、電阻等原理感知,空間分辨率較低,且少數型號能直接輸出法向力與切向力,且需依賴力/扭矩傳感器標定;
    • 光學式觸覺傳感器——通過相機捕捉凝膠變形的高分率圖像,追蹤凝膠表面的法向/剪切變形場,力/扭矩信息需通過剪切長間接表征
      MTDP 采取 GelSight Mini 和 MCTrac 兩種光學式觸覺傳感器和機器臂關節扭矩傳感器。將法向力、剪切力、視覺 RGB 輸入輸入為統一的 visual-tactile policy
      數據集為利用 GelSIght Mini 收集的 30min 的隨機交互視頻和使用 MCTrac 為剝皮任務收集的 60 次演示,為擦拭任務收集的 80 次演示,為雙手抬舉任務收集的 50 次演示。

TactAR

在這里插入圖片描述

25 Hz 是因為限制于 GelSight 幀速率限制。

從二維光流推算力數據依賴傳感器的標定,采用可視化三維變形場

  • 標記點提取:通過 OpenCV 從觸覺圖像 I t I_t It? 中提取歸一化標記點位置 D t D_t Dt?
  • 光流計算:基于得分追蹤算法(Gelsight SDK)計算初始幀 D 0 D_0 D0? 與當前幀 D t D_t Dt? 的二維光流 F t = [ d x , d y ] = F l o w ( D 0 , D t ) F_t=[d_x,d_y]=Flow(D_0,D_t) Ft?=[dx?,dy?]=Flow(D0?,Dt?)
  • 三維變形場:將光流擴展為含 z 軸偏移 o z o_z oz? 的三維變形場 V t = [ f x , f y , f z ] V_t=[f_x,f_y,f_z] Vt?=[fx?,fy?,fz?]
    通過 OpenCV 和輕量級追蹤算法,規避傳統光學傳感器的依賴,直接力矢量渲染。

構建流程:使用 Meta Quest3 的 color passthrough 在 Unity 中創建 AR 場景 -> SLAM 實時跟蹤頭顯和控制器位姿 -> 力矢量渲染 -> 根據機器人末端執行器(TCP)實時位姿,通過 ROS2 同步觸覺數據、機器人狀態和相機流

跟蹤算法延遲 10ms,Quest3 渲染延遲 10ms,網絡延遲 1-6ms,光學觸覺傳感器 10-60ms,力傳感器延遲 1ms

RDP

在這里插入圖片描述
VISK 通過聚合同一時間步的多次迭代的預測結果實現實時反饋,但削弱了策略對多模態分布和非馬兒可夫動作的建模能力,且對平滑系數相當敏感。
AT 由一個 1D-CNN(建模時序性) 和 GRU decoder 組成。通過觸覺序列 F r e d u c e d F^{reduced} Freduced (經過 PCA 降維后——光學觸覺傳感器的變形場可以被分解為幾個高度可解釋的獨立成分)重建動作 A ^ = D ( c o n c a t ( [ Z , F r e d u c e d ] ) ) \hat{A}=\mathcal{D}\left(concat([\boldsymbol{Z},\boldsymbol{F}^{reduced}])\right) A^=D(concat([Z,Freduced])) ,采用 L1 重建損失和 Kullback-Leibler(KL)懲罰損失:(1ms)(通過插值的方式調整)
L A T = E A , F r e d u c e d ∈ D p o l i c y [ ∣ ∣ A ? A ^ ∣ ∣ 1 + λ K L L K L ] L_{AT}=\mathbb{E}_{\boldsymbol{A},\boldsymbol{F}^{reduced}\in\mathcal{D}_{policy}}\left[||A-\hat{A}||_1+\lambda_{KL}L_{KL}\right] LAT?=EA,FreducedDpolicy??[∣∣A?A^1?+λKL?LKL?]
LDP 利用學習到的梯度場 ? E ( A ) \nabla E(A) ?E(A),通過隨機 Langevin 動力學,以較低的頻率預測動作。 (100ms)(DP 120ms)
L L D P = E ( O , A 0 ) ∈ D p o l i c y , k , ? k ∥ ? k ? ? θ ( O , Z 0 + ? k , k ) ∥ 2 L_{LDP}=\mathbb{E}_{(\mathbf{O},\mathbf{A}^0)\in\mathcal{D}_{policy},k,\epsilon^k}\|\epsilon^k-\epsilon_\theta(\mathbf{O},\mathbf{Z}^0+\epsilon^k,k)\|_2 LLDP?=E(O,A0)Dpolicy?,k,?k??k??θ?(O,Z0+?k,k)2?
在這里插入圖片描述
使用相對末端執行器軌跡進行動作表示,基準幀是動作塊的最后一個觀察幀,計算相對于基準幀的相對變換,將絕對軌跡轉化為相對軌跡。

實驗結果

在這里插入圖片描述
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/76784.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/76784.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/76784.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

swagger 注釋說明

一、接口注釋核心字段 在 Go 的路由處理函數(Handler)上方添加注釋,支持以下常用注解: 注解名稱用途說明示例格式Summary接口簡要描述Summary 創建用戶Description接口詳細說明Description 通過用戶名和郵箱創建新用戶Tags接口分…

STM32 HAL庫 OLED驅動實現

一、概述 1.1 OLED 顯示屏簡介 OLED(Organic Light - Emitting Diode)即有機發光二極管,與傳統的 LCD 顯示屏相比,OLED 具有自發光、視角廣、響應速度快、對比度高、功耗低等優點。在嵌入式系統中,OLED 顯示屏常被用…

Web開發-JavaEE應用動態接口代理原生反序列化危險Invoke重寫方法利用鏈

知識點: 1、安全開發-JavaEE-動態代理&序列化&反序列化 2、安全開發-JavaEE-readObject&toString方法 一、演示案例-WEB開發-JavaEE-動態代理 動態代理 代理模式Java當中最常用的設計模式之一。其特征是代理類與委托類有同樣的接口,代理類…

K8s是常用命令和解釋

K8s高頻命令 獲取資源信息,如獲取 Pod、Service、Deployment等資源狀態信息 kubectl get創建資源如創建Pod、Service、Deployment等資源 kubectl create刪除資源,如刪除Pod、Service、Deployment等資源 kubectl delete 應用配置文件,如引用D…

【模態分解】EMD-經驗模態分解

算法配置頁面,也可以一鍵導出結果數據 報表自定義繪制 獲取和下載【PHM學習軟件PHM源碼】的方式 獲取方式:Docshttps://jcn362s9p4t8.feishu.cn/wiki/A0NXwPxY3ie1cGkOy08cru6vnvc

TDengine 語言連接器(Go)

簡介 driver-go 是 TDengine 的官方 Go 語言連接器,實現了 Go 語言 database/sql 包的接口。Go 開發人員可以通過它開發存取 TDengine 集群數據的應用軟件。 Go 版本兼容性 支持 Go 1.14 及以上版本。 支持的平臺 原生連接支持的平臺和 TDengine 客戶端驅動支持…

鏈接世界:計算機網絡的核心與前沿

計算機網絡引言 在數字化時代,計算機網絡已經成為我們日常生活和工作中不可或缺的基礎設施。從簡單的局域網(LAN)到全球互聯網,計算機網絡將數以億計的設備連接在一起,推動了信息交換、資源共享以及全球化的進程。 什…

AI agents系列之全面介紹

隨著大型語言模型(LLMs)的出現,人工智能(AI)取得了巨大的飛躍。這些強大的系統徹底改變了自然語言處理,但當它們與代理能力結合時,才真正釋放出潛力——能夠自主地推理、規劃和行動。這就是LLM代理大顯身手的地方,它們代表了我們與AI交互以及利用AI的方式的范式轉變。 …

如何使用AI輔助開發CSS3 - 通義靈碼功能全解析

一、引言 CSS3 作為最新的 CSS 標準,引入了眾多新特性,如彈性布局、網格布局等,極大地豐富了網頁樣式的設計能力。然而,CSS3 的樣式規則繁多,記憶所有規則對于開發者來說幾乎是不可能的任務。在實際開發中&#xff0c…

復刻系列-星穹鐵道 3.2 版本先行展示頁

復刻星穹鐵道 3.2 版本先行展示頁 0. 視頻 手搓~星穹鐵道~展示頁~~~ 1. 基本信息 作者: 啊是特嗷桃系列: 復刻系列官方的網站: 《崩壞:星穹鐵道》3.2版本「走過安眠地的花叢」專題展示頁現已上線復刻的網…

爬蟲:IP代理

什么是代理 代理服務器 代理服務器的作用 就是用來轉發請求和響應 在爬蟲中為何需要使用代理? 有些時候,需要對網站服務器發起高頻的請求,網站的服務器會檢測到這樣的異常現象,則會講請求對應機器的ip地址加入黑名單&#xff…

協程的原生掛起與恢復機制

目錄 🔍 一、從開發者視角看協程掛起與恢復 🧠 二、協程掛起和恢復的機制原理:核心關鍵詞 ? suspend 函數 ≠ 普通函數 ? Continuation(協程的控制器) 🔧 三、編譯器做了什么?&#xff0…

c++11--std::forwaord--完美轉發

std::forword的作用 完美轉發的核心目的是保持參數的原始類型(包括const/volatile限定符和左值/右值性質)不變地傳遞給其他函數。 為什么需要完美轉發 在沒有完美轉發之前,我們面臨以下問題: 模板參數傳遞中的值類別丟失 當參數…

Linux安裝開源版MQTT Broker——EMQX服務器環境從零到一的詳細搭建教程

零、EMQX各個版本的區別 EMQX各個版本的功能對比詳情https://docs.emqx.com/zh/emqx/latest/getting-started/feature-comparison.html

計算機組成原理-存儲器

1. 存儲器的定義與作用 存儲器是計算機系統中用于存儲程序、數據和中間結果的硬件設備,是計算機五大核心部件之一。 核心功能: 提供數據的 臨時或永久存儲 能力。支持CPU按需快速存取指令和數據,是程序運行的物理基礎。 2. 存儲器的分類 …

單片機領域中哈希表

以下是單片機領域中哈希表的實際應用及編程實例: 1.哈希表在單片機中的實際應用場景 ? 命令解析:在單片機通信中,經常需要解析接收到的命令。使用哈希表可以快速地將命令字符串映射到對應的處理函數,提高命令解析的效率。 ? 數…

算法思想之位運算(一)

歡迎拜訪:霧里看山-CSDN博客 本篇主題:算法思想之位運算(一) 發布時間:2025.4.12 隸屬專欄:算法 目錄 滑動窗口算法介紹六大基礎位運算符常用模板總結 例題位1的個數題目鏈接題目描述算法思路代碼實現 比特位計數題目鏈接題目描述…

封裝Tcp Socket

封裝Tcp Socket 0. 前言1. Socket.hpp2. 簡單的使用介紹 0. 前言 本文中用到的Log.hpp在筆者的歷史文章中都有涉及,這里就不再粘貼源碼了,學習地址如下:https://blog.csdn.net/weixin_73870552/article/details/145434855?spm1001.2014.3001…

全星APQP軟件:為用戶提供高效、合規、便捷的研發管理體驗

全星APQP軟件:為用戶提供高效、合規、便捷的研發管理體驗 為什么選擇全星APQP軟件系統? 在汽車及高端制造行業,研發項目管理涉及APQP(先期產品質量策劃)、FMEA(失效模式與影響分析)、CP&#x…

CTF--網站被黑

一、原題: (1)提示:網站被黑了 黑客會不會留下后門 (2)原網頁: 二、步驟: 1.在終端掃描網址: 2.掃描后發現:shell.php 3.輸入網址:http://117.…