Science Robotics 耶魯大學開源視觸覺新范式,看出機器人柔性手的力感知

摘要:在機器人視觸覺傳感領域,如何兼顧成本與性能始終是一大挑戰。耶魯大學在《Science Robotics》上發表最新研究,提出了一種“Forces for Free”(F3)新范式。該研究通過觀測一個經過特殊優化的開源柔性手(F3 Gripper)的形變,僅利用標準RGB攝像頭,便能精準估算接觸力,為機器人賦予了幾乎零額外硬件成本的力感知能力。借助這樣的感知能力,能完成小孔插銷、擦拭曲面,甚至寫書法這樣需要精細力控的任務。在這里插入圖片描述

圖:使用該3F柔性手進行寫書法實驗及其力反饋各項指標圖在機器人與物理世界進行交互時,力的感知至關重要。它不僅是完成插拔、打磨等接觸式任務(contact-rich tasks)的基礎,也是高級人機交互與物理推理的關鍵。然而,傳統的高精度力/扭矩(F/T)傳感器價格昂貴、笨重且易因撞擊損壞,而集成式的指尖觸覺傳感器則面臨著布線復雜、易磨損和僅能提供局部信息等問題。近年來,視觸覺傳感技術為解決這一難題提供了新思路,即利用視覺信號來推斷觸覺信息。但許多方案依賴于在傳感器內部嵌入標記點(如GelSight),或需要定制化的傳感皮膚。有沒有一種更簡潔、更低成本的實現路徑?耶魯大學的研究團隊給出了一個極具吸引力的答案:Forces for Free。其核心思想是,對于一個已經配備了柔性手爪和腕部攝像頭的機器人系統,對于外界力的感知能力可以通過軟件算法“免費”獲得,無需增加任何額外傳感硬件。在這里插入圖片描述
圖:該系統的核心在于利用已有的攝像頭和柔性手爪,通過算法解鎖力感知能力,無需額外添置昂貴的F/T傳感器(如圖中箭頭所示,F/T傳感器僅用于訓練和驗證)。這也是“3F”中“Free”的核心。——物理媒介:為“被看見”而優化的F3柔性手——實現視覺力感知的先決條件,是擁有一個在受力時能產生穩定、可觀測形變的物理媒介。為此,研究團隊并沒有隨意選擇一款柔性手,而是在耶魯大學經典的開源T42手爪基礎上,進行了深度優化,設計出F3 (Forces-for-Free) Gripper。優化目標也非常明確:提升基于視覺的力估算信噪比,可以從兩個角度來實現:1.最大化運動學可操縱性 (Kinematic Manipulability):傳統柔性手在某些姿態下可能接近“奇異構型”(singular configuration),此時即便利度發生很大變化,其外觀形態也幾乎不變,導致力無法被識別。研究團隊通過優化手指的連桿長度比和靜止角度,使其在工作區間內遠離奇異點,確保任何方向的力都能引起足夠大的視覺形變。這項優化基于對運動學矩陣的分析,旨在最大化這一可操縱性度量。2.最小化摩擦與遲滯 (Friction and Hysteresis):纜繩驅動的柔性手普遍存在摩擦和遲滯效應,這是導致“部分可觀察性”(partial observability,即相同的手指形態可能對應不同力值)的根本原因。F3手爪將所有纜繩路徑上的金屬銷釘替換為微型滾珠軸承,并優化布線以減少接觸角,從而顯著降低了內部摩擦力(從約4.0N降至0.6N),為更精確的力估算奠定了物理基礎。在這里插入圖片描述
圖:F3手爪的設計優化。(左)相較于T42原型,F3采用了等長連桿和滾珠軸承以提升可操縱性并降低摩擦。 (右)運動學可操縱性分析表明,連桿等長且關節角為90°時(黑色連桿所示位置),形變響應最佳。——計算核心:具備時序記憶與視覺焦點的估算器——有了高質量的物理媒介,接下來的挑戰便是如何從圖像序列中解碼出精確的力信息。耶魯大學的研究團隊為此構建了一個精巧的深度學習估算器。為了應對“部分可觀察性”,該團隊的解決方案是:引入時間記憶。為了解決由殘余摩擦和遲滯效應帶來的模糊性,該模型不處理單幀圖像,而是輸入一段包含近期運動歷史的圖像序列(如20幀,采樣頻率1Hz)。模型采用CNN-Transformer架構,其中CNN負責提取每幀圖像的空間特征,而Transformer則捕捉這些特征在時間維度上的內在關聯。這種對時空信息的綜合處理,讓模型能夠根據歷史運動趨勢來推斷當前最可能的力狀態,有效緩解了“同形不同力”的問題。消融實驗證明,20幀的記憶長度能達到最佳性能。為了應對視覺干擾,該團隊采用視覺基礎模型加持的方案:真實場景下的背景和被抓物會嚴重干擾識別。研究團隊利用了視覺基礎模型SAM (Segment Anything Model),僅通過少量標注數據進行微調,便能穩健地將手爪從復雜的視覺環境中分割出來。這相當于為估算器戴上了一副“濾鏡”,使其能完全專注于手爪本身的形變,實現了對背景和物體變化的魯棒性。此外,通過在訓練中引入隨機遮擋的數據增強,模型還能抵抗真實世界中常見的部分遮擋情況。在這里插入圖片描述
圖:估算器神經網絡架構概覽。圖像序列首先由SAM進行分割以消除視覺干擾,隨后由共享的CNN提取特征,最后通過Transformer網絡處理時序信息,輸出最終的力預測值。——實驗驗證:從0.2N的精度到閉環動態控制——該系統的有效性在一系列嚴苛的實驗中得到了驗證:在這里插入圖片描述
在對新物體的靜態力預測任務中,估算誤差在0.2N至0.4N之間。這一預測精度遠高于先前相關工作報告的約1.6N的誤差,展示了其卓越的性能。對于動態閉環控制的實驗設計,該估算器被成功置于控制環路中,完成了三項復雜的動態任務:1.孔中插銷:通過感知接觸力,引導機器人完成探測、對準和插入的系列動作。在這里插入圖片描述
2.曲面擦拭:維持恒定的法向力(1N),在不平整的表面上進行擦拭。3.書法寫作:通過實時調整下壓力,控制毛筆筆畫的粗細,完成漢字書寫。在這里插入圖片描述
圖:估算器在閉環動態任務中的出色表現。無論是精密的裝配(上)、力控的表面操作(中),還是需要細膩力度變化的書法(下),系統均能提供準確的力反饋。在這些任務中,系統均表現出高精度和魯棒性,平均力誤差甚至低至0.15N左右。這是一個非常驚人的數字,這表明該系統在沒有額外傳感器的輔助下,已經能幾乎實現完成這些需要精細力控的任務。耶魯大學的這項研究,為低成本機器人力感知提供了一個優雅且實用的解決方案。它不僅是一個巧妙的工程實現,更提出了一種富有潛力的“Forces for Free”新范式,證明了在不增加額外硬件的前提下,僅通過算法和對現有組件(柔性手)的優化,即可解鎖高質量的力感知能力,重新定義了視觸覺傳感的成本效益邊界。在這里插入圖片描述
這也是“Free”的核心所在;此外在系統完整性方面,提供了從硬件優化(F3手爪)到算法設計(時序模型與SAM)再到實驗驗證的一整套完整、開源的解決方案,極大地降低了其他研究者的使用門檻。盡管目前該系統主要處理二維力,且響應速度(10Hz)尚不及商業F/T傳感器,不適用于碰撞檢測等高速場景,但它為大量接觸式操作任務提供了足夠精確、魯棒且幾乎“免費”的力反饋。未來,該范式有望擴展至三維力/力矩估算、多指靈巧手,并通過多視角相機來解決更復雜的遮擋問題。這項工作無疑將推動先進力控技術在更廣泛的機器人平臺(尤其是低成本平臺)上的普及與應用。資料鏈論文原文:https://www.science.org/doi/10.1126/scirobotics.adq5046開源硬件、代碼與數據: 詳見論文末尾“Data and materials availability”部分

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/88253.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/88253.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/88253.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

關于java項目中maven的理解

我的理解:maven是java項目的依賴管理工具,通過pom.xml文件配置要下載的依賴,settings.xml配置maven下載的鏡像沒有就默認在maven中央倉庫下載依賴,本地倉庫是存儲下載好的依賴ai:1. 功能定位局限Maven 不只是依賴管理工具&#xf…

緩存三大問題詳解與工業級解決方案

文章目錄緩存三大問題詳解與工業級解決方案概念總覽問題詳解1. 緩存穿透 (Cache Penetration)問題描述典型場景危害2. 緩存擊穿 (Cache Breakdown)問題描述典型場景危害3. 緩存雪崩 (Cache Avalanche)問題描述典型場景危害工業級解決方案緩存穿透解決方案方案1: 布隆過濾器方案…

FreeRTOS 中主函數 while 循環與任務創建的緊密聯系

FreeRTOS 中主函數 while 循環與任務創建的緊密聯系 在嵌入式開發領域,FreeRTOS 是一款被廣泛應用的輕量級實時操作系統,為開發者提供了高效的多任務調度機制。對于初學者來說,理解主函數中的 while 循環與通過 xTaskCreate 創建的任務之間的…

Flutter基礎(前端教程⑦-Http和卡片)

1. 假設后端返回的數據格式{"code": 200,"data": [{"name": "張三","age": 25,"email": "zhangsanexample.com","avatar": "https://picsum.photos/200/200?random1","statu…

pytorch chunk 切塊

目錄 chunk切塊 chunk???????切塊 import torch# 創建一個形狀為 [2, 3, 4] 的張量 x torch.arange(6).reshape(2, 3) print("原始張量形狀:", x.shape) print("x:", x) # 輸出: 原始張量形狀: torch.Size([2, 3, 4])# 沿著最后一個維度分割成 2 …

PCIe基礎知識之Linux內核中PCIe子系統的架構

5.1 先驗知識 驅動模型:Linux建立了一個統一的設備模型,分別采用總線、設備、驅動三者進行抽象,其中設備和驅動均掛載在總線上面,當有新的設備注冊或者新的驅動注冊的時候,總線會進行匹配操作(match函數),…

2.2 TF-A在ARM生態系統中的角色

目錄2.2.1 作為ARM安全架構的參考實現2.2.2 與ARM處理器內核的協同關系2.2.3 在啟動鏈中的核心地位2.2.4 與上下游軟件的關系與底層固件的協作與上層軟件的接口2.2.5 在ARM生態系統中的標準化作用2.2.6 典型應用場景2.2.1 作為ARM安全架構的參考實現 TF-A(Trusted …

Chrome 開發者警告:`DELETE err_empty_response` 是什么?jQuery AJAX 如何應對?

在Web開發的世界里,我們時常會遇到各種各樣的錯誤信息,它們像一個個謎語,等待我們去破解。今天我們要聊的這個錯誤——DELETE err_empty_response,尤其是在使用 jQuery 的 $.ajax 發送 DELETE 請求時遇到,確實讓人頭疼。它意味著瀏覽器嘗試刪除某個資源,卻收到了一個空蕩…

python作業 1

1.技術面試題 (1)TCP與UDP的區別是什么? 答: TCP建立通信前有三次握手,結束通信后有四次揮手,數據傳輸的可靠性高但效率較低;UDP不需要三次握手就可傳輸數據,數據傳輸完成后也不需要…

centos7 java多版本切換

文章目錄前言一、卸載原來的jdk二、下載jdk三、解壓jdk三、配置環境變量四、切換JAVA環境變量前言 本來是為了安裝jenkins,安裝了對應的java,node,maven,git等環境,然后運行jenkins時候下載插件總是報錯,我下載的jenkins是 2.346.1 版本&…

用Python和OpenCV從零搭建一個完整的雙目視覺系統(四)

本系列文章旨在系統性地闡述如何利用 Python 與 OpenCV 庫,從零開始構建一個完整的雙目立體視覺系統。 本項目github地址:https://github.com/present-cjn/stereo-vision-python.git 在上一篇文章中,我們完成了相機標定這一最關鍵的基礎步驟…

STM32-中斷

中斷分為兩路:12345用于產生中斷;678產生事件外設為NVIC設計流程:使能外設中斷設置中斷優先級分組初始化結構體編寫中斷服務函數初始化結構體:typedef struct {uint8_t NVIC_IRQChannel; 指定要使能或禁用的中斷通道例如: TIM3_I…

Shader面試題100道之(61-80)

Shader面試題(第61-80題) 以下是第61到第80道Shader相關的面試題及答案: 61. 什么是UV展開?它在Shader中有什么作用? UV展開是將3D模型表面映射到2D紋理空間的過程,用于定義紋理如何貼合模型。在Shader中&a…

C#基礎:Winform桌面開發中窗體之間的數據傳遞

1.主窗體using System; using System.Windows.Forms;public partial class MainForm : Form {public MainForm(){InitializeComponent();}// 打開二級窗體private void btnOpenSecondaryForm_Click(object sender, EventArgs e){// 創建二級窗體并訂閱事件SecondaryForm second…

工程改Mvvm

導入CommunityToolKit vs2017只能導入7 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using CommunityToolkit.Mvvm.ComponentModel; using CommunityToolkit.Mvvm.Input;namespace WpfApp1.vi…

【HarmonyOS Next之旅】DevEco Studio使用指南(四十二) -> 動態修改編譯配置

目錄 1 -> 通過hook以及插件上下文實現動態配置 2 -> 在hvigorfile.ts中通過overrides關鍵字導出動態配置 3 -> 通過hook以及插件上下文動態配置構建配置 3.1 -> 修改每個hvigorNode中的build-profile.json5 3.2 -> 修改module.json5中的配置信息 3.3 -&g…

Android View事件分發機制詳解

Android 的 View 事件分發機制是處理用戶觸摸(Touch)事件的核心流程,它決定了觸摸事件如何從系統傳遞到具體的 View 并被消費。理解這個機制對于處理復雜的觸摸交互、解決滑動沖突至關重要。 核心思想:責任鏈模式 事件分發遵循一個…

【CMake】自定義package并通過find_package找到

在一些場景下我們需要編寫一些庫,并希望其他程序可以找到這些庫并引用。 CMake采用package這個概念來解決這個問題。 關于CMake的find_package文章有很多,但這些文章的內容大多不直觀講了一堆講不到點子上,讓人看了一頭霧水。因此我想通過本文…

【MATLAB例程】AOA與TDOA混合定位例程,適用于二維環境、3個錨點的定位|附代碼下載鏈接

本 MATLAB 程序實現了基于 Angle of Arrival (AOA) 與 Time Difference of Arrival (TDOA) 的二維定位方法,通過自適應融合與最小二乘優化,實現對未知目標的高精度估計。本例中固定使用了 3 個基站(錨點),算法框架支持…

磐維數據庫panweidb集中式集群配置VIP【添加、刪除和修改】

0 說明 panweidb集中式集群為了防止主備切換后應用連接無法切換到新主庫,需要配置vip,應用可以只通過該ip與數據庫連接,不用感知數據庫在哪個節點上。 panweidb中配置 VIP主要依賴 CM 組件的 VIP 仲裁功能,通過回調腳本在主備切換…