論文解讀 | Franka 機器人沉浸式遠程操作:高斯濺射 VR 賦能的遙操框架研發與應用

研究背景

在工業制造、危險環境作業等領域,機器人遠程操作技術是突破人類作業邊界的關鍵手段。傳統遠程操作依賴2D 相機反饋與操縱桿控制,存在空間感知差、操作精度低、沉浸感弱等問題,難以滿足復雜移動操作任務需求。

例如在核設施退役、災后救援等場景中,操作員無法精準判斷機器人與障礙物的相對位置,易導致操作失誤。

針對這一痛點,研究人員以Franka Research 3機器人為核心實驗載體,提出 “高斯濺射 + VR” 融合的雙階段遠程操作框架。該框架通過高斯濺射技術構建高保真3D 環境模型,結合VR設備實現沉浸式交互,同時設計 “導航 - 操作” 雙階段工作流程,解決傳統系統在遮擋處理、空間連貫性、操作直觀性上的缺陷。

最終通過實驗驗證,該框架能使66%的操作者完成任務時間平均縮短43%,93%的操作者更偏好該操作模式,顯著提升遠程操作的效率與可靠性。

圖 1:本圖展示了我們所提出框架的一個應用示例。左側為通過高斯濺射(Gaussian splattering)技術重建的機器人及場景的虛擬現實呈現;右側為安裝在移動基座上的實體機器人在實際環境中執行操作階段的狀態。

研究核心亮點

高斯濺射3D 環境重建:通過 “多視角圖像采集→SfM 算法特征計算與姿態估計→神經渲染訓練高斯模型” 流程,生成含位置、顏色、透明度參數的高保真 3D 場景,有效處理遮擋問題,支持 VR 環境內自由調整視角,提升空間感知能力。

?2Splat?界面,顯示了疊加在顯示屏上的兩個攝像頭視圖。實際處于虛擬現實(VR)環境中的用戶,看到的是疊加在物體上方的靜態?Splat(而非物體本身),并且能夠對?VR?中顯示的操縱器末端執行器(End Effector)進行操作。

雙階段遠程操作邏輯:導航階段用2D 相機視頻流 + VR 控制器速度指令,控制移動基座精準定位;操作階段通過 VR 界面直接拖動虛擬機械臂末端,實時同步真實 Franka 機械臂運動,兼顧移動效率與操作精度。

跨平臺適配架構:基于Unity+ROS+TCP 通信,支持 URDF 模型導入,僅需修改 ROS 話題與關節參數,即可適配不同型號機械臂,降低技術遷移成本。

實驗配置

  • 核心機器人Franka Research 3機械臂,負責完成按鈕按壓、精細抓取等操作任務;搭配 Robotnik Summit-XL移動基座,提供長距離移動能力。

  • 視覺采集設備:Intel RealSense D435F RGB-D相機,安裝于機械臂末端,用于采集場景圖像以生成高斯濺射模型,同時提供真實場景視頻反饋。

  • 交互與計算設備:Meta Quest 2 VR頭顯,提供沉浸式操作界面;Intel NUC作為控制中樞,連接相機、機械臂與基座;搭載NVIDIA RTX 3090 GPU的計算機,運行Unity引擎與高斯濺射模型訓練算法。

軟件系統

操作系統與中間件:機器人端采用Ubuntu 20.04系統,部署ROS Noetic實現設備通信與指令調度;VR交互端基于Windows 10系統,運行Unity 2022.3構建VR 交互界面。

算法庫:集成OpenCV預處理圖像,COLMAP實現SfM計算,自定義PyTorch框架模塊訓練高斯濺射模型,保障3D重建與實時渲染效率。

實驗設計與驗證

遮擋環境按鈕操作:實驗臺放置?Household?物品遮擋目標按鈕,模擬工業場景視線受阻任務;操作員先通過導航階段定位至實驗臺,再用?VR +?高斯濺射模型控制機械臂繞過遮擋按壓按鈕。

圖3:本圖展示了第一個操作場景的設置情況:在雜亂環境中,機器人需觸達某一按鈕。該按鈕安裝在一個基座上,此基座會遮擋機器人攝像頭的視野。

Franka沉浸式遙操

動態障礙燈光激活:實驗區域擺放帶頂部燈光的錐形障礙,操作員控制機器人在障礙間導航,到達目標后按壓按鈕激活燈光,驗證導航?-?操作”?流程連貫性。

?4:操作員使用我們的遙操作框架執行兩項局部操作任務的演示。(a)至(c)圖展示機器人向目標位置導航,并成功觸達按鈕且無任何碰撞;(d)至(f)圖呈現操作員通過該框架靠近每個椎體,通過與椎體交互激活其頂部安裝的指示燈。

驗證方法

用戶研究:選取?15?名操作員(含?5?名?VR?經驗者、10?名無經驗者),對比傳統?雙相機?+?操縱桿”?與本框架的任務完成時間、精度,通過?7?分量表評估易用性、沉浸感等指標。

實物驗證:在真實場景中重復任務?10?次,記錄機械臂操作成功率、碰撞發生率,驗證框架穩定性。

圖5:用戶研究中量表問題的結果,該研究用于評估兩種界面的可用性與直觀性。研究采用 7 分量表,其中 1 分代表 “強烈不同意”,7 分代表 “強烈同意”。

關鍵成果與突破

突破空間感知瓶頸:高斯濺射+VR解決2D反饋的平面化缺陷,遮擋場景操作精度提升40%以上,降低操作認知負荷,推動遠程操作向低門檻化發展。

建立一體化控制范式:雙階段流程實現“高效移動 - 精準操作” 閉環,適配倉儲分揀、設備維護等場景;跨平臺架構降低企業技術升級成本,助力產業化應用。

拓展應用邊界:可用于核輻射、化工等危險環境無人作業,未來結合動態重建技術可適配流水線等動態場景,為醫療遠程手術等領域提供技術支撐。

結語

研究人員以Franka Research 3為載體,研發的 “高斯濺射 + VR” 遠程操作框架,從技術上解決傳統系統的核心痛點,經實驗驗證具備效率、精度與易用性優勢。

未來將聚焦三方向優化:一是突破SfM 限制,提升高斯模型生成速度以適配動態場景;二是引入 AI 輔助決策,提供操作路徑推薦;三是拓展多機器人協同功能,滿足大型場景聯動需求。該框架不僅為機器人遠程操作提供新路徑,也為工業自動化、危險環境作業等領域技術升級奠定基礎。

論文詳情:https://arxiv.org/pdf/2504.15229

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/95455.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/95455.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/95455.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Unity Shader學習筆記】(四)Shader編程

一、OpenGL與DirectX 這是計算機圖形學中兩個最核心的應用程序接口(API),它們充當了應用程序與顯卡硬件之間的橋梁,讓開發者能夠調用GPU進行圖形渲染和通用計算。 特性維度 OpenGL DirectX 主導公司 Khronos Group (原SGI) Microsoft

程序員之電工基礎-初嘗線掃相機

一、背景 興趣愛好來了,決定研發一個產品。涉及到電工和機械等知識,所以記錄一下相關的基礎知識。本期主題是初嘗線掃相機,雖然又回到了編程,但是對于我來說,硬件集成的經驗不足,缺乏相機、鏡頭的專業知識。…

qt QWebSocket詳解

1、概述 QWebSocket是Qt網絡模塊中的一個類,用于實現WebSocket協議的通信。WebSocket是一種全雙工的通信協議,允許在客戶端和服務器之間建立實時的雙向通信。QWebSocket提供了對WebSocket協議的支持,使得開發者能夠在Qt應用中方便地實現實時…

Java基礎IO流全解析:常用知識點與面試高頻考點匯總

Java基礎IO流全解析:常用知識點與面試高頻考點匯總 前言 IO(Input/Output)流是Java中處理數據傳輸的核心機制,無論是文件操作、網絡通信還是數據持久化,都離不開IO流的身影。對于Java初學者而言,IO流的分類…

PDF.AI-與你的PDF文檔對話

本文轉載自:PDF.AI-與你的PDF文檔對話 - Hello123工具導航 ** 一、🤖 PDF.AI:秒懂 PDF 的智能對話助手 PDF.AI 是一款超實用的AI 文檔分析工具,專門幫你快速搞定各種 PDF 文件。不管多長的合同、報告或論文,你只需上…

微軟出品!這個免費開源工具集獲得了GitHub 123k程序員點贊

大家晚上好,我是顧北,是一名AI應用探索者,當然也是GitHub開源項目收集愛好者。最近我在整理Windows效率工具時,發現了一個讓我一晚上沒睡著覺的開源項目——微軟官方出品的 PowerToys,可謂是徹夜難眠啊。經過我兩個月多…

【開題答辯全過程】以 小眾商戶小程序為例,包含答辯的問題和答案

個人簡介一名14年經驗的資深畢設內行人,語言擅長Java、php、微信小程序、Python、Golang、安卓Android等開發項目包括大數據、深度學習、網站、小程序、安卓、算法。平常會做一些項目定制化開發、代碼講解、答辯教學、文檔編寫、也懂一些降重方面的技巧。感謝大家的…

Vue 3.5 重磅新特性:useTemplateRef 讓模板引用更優雅、更高效!

Vue 3.5 重磅新特性:useTemplateRef 讓模板引用更優雅、更高效! 目錄 前言 什么是 useTemplateRef 傳統 ref 的問題 useTemplateRef 的優勢 基礎用法 進階用法 最佳實踐 遷移指南 性能對比 注意事項 總結 前言 Vue 3.5 帶來了一個激動人心的新特性 useTemplateRef,它徹底革…

uni app 的app端 寫入運行日志到指定文件夾。

uni app 的app 端 寫入指定目錄文件夾。并自動生成當前日期的日志文件。刪除十日前的日志文件其中 writefile.js 代碼如下const {default: logger } require("./logger")var name var url var params var method var resfunction setlog(name, url, params, method)…

桌面應用開發語言與框架選擇指南

桌面應用開發的語言和框架選擇非常豐富,從原生性能到跨平臺解決方案應有盡有。下面我將它們分為幾大類進行詳細介紹,并附上各自的優缺點和適用場景。 一、 原生開發 (Native Development) 原生開發能提供最佳的性能和與操作系統最完美的集成體驗。 1. …

C++知識

文章目錄1.Cmap為什么線程不安全?2.map大量插入會有性能問題,為什么3.set的應用場景4.map set mutiset mutimap unordered_map unordered_set的底層實現、使用場景、優缺點1.Cmap為什么線程不安全? 其實STL中的容器都是線程不安全的,如果想要線程安全…

自學嵌入式第三十四天:網絡編程-TCP

一、UDP用戶數據報收發次數要對應;數據與數據之間有邊界,多次調用收發時都是不同的數據報;接收方的數據大小>發送方的數據大小,如果接受方數據小了則會丟棄未讀的部分,再次調用只會讀下一包數據;二、服務…

Apache IoTDB:國產時序數據庫的崛起與工業物聯網的未來

📑前言 在工業物聯網的浪潮中,數據不再是副產品,而是驅動決策的核心資產。"隨著物聯網、工業互聯網和智能監控的迅猛發展,時序數據正以前所未有的速度爆發。據預測,到2025年全球物聯網設備將達750億臺&#xff0c…

一鍵核驗,安全無憂!手機號三要素詳情版API,為您的業務筑牢身份認證防線

一、什么是手機號三要素核驗API? 手機號三要素核驗API 是一種通過編程接口,實時驗證一條個人身份信息是否與該國運營商登記的實名信息一致的在線服務。 這里的“三要素”特指: 姓名 身份證號碼 手機號碼 核驗過程:用戶提交上述三個…

輕松上手 qData 數據中臺開源版:Docker Compose 助你10分鐘跑起來

說在前面 誰適合看這份指南? 初次接觸 qData,希望快速體驗功能的小伙伴不想折騰復雜環境配置和前端打包的人想用“一鍵啟動”省事體驗完整平臺的用戶 我們已經為你準備好“開箱即用”的完整部署包,包括: ? 前端靜態資源&…

Qt讀寫Excel--QXlsx基本使用

1、概述 Document 類是一個用于操作 XLSX 文件的類,繼承自 QObject。它提供了對 Excel 文件的讀寫操作,包括單元格的讀寫、圖片和圖表的插入、單元格合并、列和行的格式化、數據驗證和條件格式化等功能。此外,它還支持對工作簿和工作表的操作…

P13929 [藍橋杯 2022 省 Java B] 山 題解

縮減一下題目的意思,問區間 [2022,2022222022] 有多少個數是回文數并且先單調不減,后單調不增。 因為有這兩條條件,我們可以得知在判斷時只用判斷前半段的每個數是不是和對面相應的位置相等,以及是否單調不減。 為什么不用看后半段…

Unity Android 文件的讀寫

配置AndroidManifest 文件在Assets 目錄下查找AndroidManifest 文件&#xff0c;添加權限聲明&#xff0c;在application 節點中添加requestLegacyExternalStorage 屬性。<!-- 權限聲明 --> <uses-permission android:name"android.permission.READ_EXTERNAL_STO…

Pydantic模型驗證測試:你的API數據真的安全嗎?

url: /posts/03b2afdf35f55dbaef631710ab6da82c/ title: Pydantic模型驗證測試:你的API數據真的安全嗎? date: 2025-09-03T23:46:18+08:00 lastmod: 2025-09-03T23:46:18+08:00 author: cmdragon summary: Pydantic在FastAPI中用于數據驗證和序列化,通過Python類型注解自動…

【Proteus仿真】AT89C51單片機中斷系列仿真——INT0中斷控制LED小燈/INT0和INT1中斷控制數碼管

目錄 0案例視頻效果展示 0.1例子1&#xff1a;INT0控制LED閃爍 0.2例子2&#xff1a;INT0中斷控制數碼管計數 0.3例子3&#xff1a;INT0中斷實現秒表功能 0.4例子4&#xff1a;INT0INT1中斷控制數碼管計數 1基礎知識補充——中斷系統 1.1 中斷源一覽 1.2 控制寄存器 1…