復現 MODEST 機器人抓取透明物體 單目 ICRA 2025

MODEST 單目透明物體抓取算法,來自ICRA 2025,本文分享它的復現過程。

輸入單個視角的RGB圖像,模型需要同時處理深度和分割任務,輸出透明物體的分割結果和場景深度預測。

論文地址:Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion

代碼地址:https://github.com/D-Robotics-AI-Lab/MODEST

將算法遷移到真實機器人平臺,開展了透明物體抓取實驗。實驗平臺主要由UR機械臂和深度相機組成。

在借助MODEST方法對透明物體進行分割和深度預測,生成點云數據作為輸入,進而采用GraspNet生成抓取位姿。

1、創建Conda環境

使用conda創建一個虛擬環境,名字為modest,指定使用python3.8

然后進入modest環境

conda create -n modest python=3.8
conda activate modest

2、安裝torch和CUDA

需要安裝torch==1.10.1+cu111,執行下面命令:

pip install torch==1.10.1+cu111 torchvision==0.11.2+cu111 torchaudio==0.10.1 -f https://download.pytorch.org/whl/cu111/torch_stable.html

然后安裝其他依賴

sudo apt-get install openexr libopenexr-dev

3、安裝依賴庫requirements.txt

下載MODEST代碼到本地,然后解壓

打開requirements.txt,注釋torch==1.10.1+cu111、torchvision==0.11.2+cu111,因為上面安裝了

?

然后執行命令,安裝依賴庫

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

4、準備數據集ClearPose?

ClearPose 數據集是使用 RealSense L515 攝像頭在室內環境中捕獲的,捕獲了 63 個透明物體。

它包含 RGB、原始深度、地面真實深度、地面真實表面法線圖像以及所有物體實例6D位姿。

代碼地址:https://github.com/opipari/ClearPose

下載地址:點擊下載clearpose

ClearPose 被分成 9 個集合,其中 Set1 只包含化學透明物體,Set2-7 只包含家居物品,Set8-9 還包含其他對抗因素。

文件夾結構如下:

<dataset_path>
|-- set1|-- scene1|-- metadata.mat            # |-- 000000-color.png        # RGB image|-- 000000-depth.png        # Raw depth image|-- 000000-depth_true.png   # Ground truth depth image|-- 000000-label.png        #|-- 000000-normal_true.png  #...
|-- model|-- <object1>|-- <object1>.obj|-- <object2>|-- <object2>.obj...

示例數據:

5、下載模型權重

?Syn-TODD 數據集上預先訓練的模型權重:https://drive.google.com/file/d/1haxiir4PdBNE9Zr1AA4D9bVJ4KCzqa8v/view

真實世界數據集 ClearPose?的模型權重:https://drive.google.com/file/d/1798AE_u6KrMV6mpUGBxz_jaLrg_21A39/view

然后創建文件夾ckpt,放到里面:

6、進行推理

首先配置文件:config/config.json,指定預訓練權重ISGNet_clearpose.p

使用CPU運行,"device":"cpu";如果使用GPU,"device":"cuda"

?

然后在推理代碼inference.py中,需要修改圖片路徑,比如:?

image_path = "./datasets/clearpose_downsample_100/set1/scene1/000000-color.png"?

推理代碼如下

import json
from models.Trainer import Trainer
from utils.visualize import *image_path = "./datasets/clearpose_downsample_100/set1/scene1/000000-color.png"################ load the config file ##################
with open('config/config.json', 'r') as f:config = json.load(f)############### load the trainer ###############
trainer = Trainer(config)############### start inference ##############
trainer.inference(image_path)

執行代碼:

?

運行結果,在results目錄保存了

原圖是這樣的

模型預測的深度圖:

模型預測的分割效果:

MODEST對透明物體進行分割和深度預測,生成點云數據作為輸入,進而采用GraspNet生成抓取位姿。

分享完成~

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/71880.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/71880.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/71880.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

新手學習爬蟲的案例

首先你的電腦上肯定已經安裝了python,沒安裝的去官網安裝,我使用的是Pycharm作為操作的IDE 環境準備 安裝必要的庫 爬蟲需要用到requests和beautifulsoup4 使用命令行或者終端運行下面的命令 pip install requests beautifulsoup4 -i https://mirrors.aliyun.com/pypi/sim…

Octave3D 關卡設計插件

課程參考鏈接 這位大佬有在視頻合集中有詳細的講解&#xff0c;個人體驗過&#xff0c;感覺功能很強大 https://www.bilibili.com/video/BV1Kq4y1C72P/?share_sourcecopy_web&vd_source0a41d8122353e3e841ae0a39908c2181 Prefab資源管理 第一步 在場景中創建一個空物體…

【Transformer優化】Transformer的局限在哪?

自2017年Transformer橫空出世以來&#xff0c;它幾乎重寫了自然語言處理的規則。但當我們在享受其驚人的并行計算能力和表征能力時&#xff0c;是否真正理解了它的局限性&#xff1f;本文將深入探討在復雜度之外被忽視的五大核心缺陷&#xff0c;并試圖在數學維度揭示其本質。 …

SpringBoot(一)--搭建架構5種方法

目錄 一、?Idea從spring官網下載打開 2021版本idea 1.打開創建項目 2.修改pom.xml文件里的版本號 2017版本idea 二、從spring官網下載再用idea打開 三、Idea從阿里云的官網下載打開 ?編輯 四、Maven項目改造成springboot項目 五、從阿里云官網下載再用idea打開 Spri…

Python爬蟲實戰:一鍵采集電商數據,掌握市場動態!

電商數據分析是個香餑餑&#xff0c;可市面上的數據采集工具要不貴得嚇人&#xff0c;要不就是各種廣告彈窗。干脆自己動手寫個爬蟲&#xff0c;想抓啥抓啥&#xff0c;還能學點技術。今天咱聊聊怎么用Python寫個簡單的電商數據爬蟲。 打好基礎&#xff1a;搞定請求頭 別看爬蟲…

樂鑫打造全球首款 PSA Certified Level 2 RISC-V 芯片

樂鑫科技 (688018.SH) 榮幸宣布 ESP32-C6 于 2025 年 2 月 20 日獲得 PSA Certified Level 2 認證。這一重要突破使 ESP32-C6 成為全球首款基于 RISC-V 架構獲此認證的芯片&#xff0c;體現了樂鑫致力于為全球客戶提供安全可靠、性能卓越的物聯網解決方案的堅定承諾。 PSA 安全…

圖像滑塊對比功能的開發記錄

背景介紹 最近&#xff0c;公司需要開發一款在線圖像壓縮工具&#xff0c;其中的一個關鍵功能是讓用戶直觀地比較壓縮前后的圖像效果。因此&#xff0c;我們設計了一個對比組件&#xff0c;它允許用戶通過拖動滑塊&#xff0c;動態調整兩張圖像的顯示區域&#xff0c;從而清晰…

tcc編譯器教程2 編譯lua解釋器

本文主要介紹了使用tcc編譯器編譯lua解釋器源碼。 1 介紹 lua是一門編程語言,開源且源碼很容易編譯,我平時用來測試C語言編程環境時經常使用。一般能編譯成功就說明編程環境設置正常。下面用之前設置好的tcc編程環境進行測試。 2 獲取源碼 我一般有保留多個版本的lua源碼進…

Unity DOTS從入門到精通之 自定義Authoring類

文章目錄 前言安裝 DOTS 包什么是Authoring1. 實體組件2. Authoring類 前言 DOTS&#xff08;面向數據的技術堆棧&#xff09;是一套由 Unity 提供支持的技術&#xff0c;用于提供高性能游戲開發解決方案&#xff0c;特別適合需要處理大量數據的游戲&#xff0c;例如大型開放世…

comctl32!ListView_OnSetItem函數分析LISTSUBITEM結構中的image表示圖標位置

第一部分&#xff1a; BOOL ListView_SetSubItem(LV* plv, const LV_ITEM* plvi) { LISTSUBITEM lsi; BOOL fChanged FALSE; int i; int idpa; HDPA hdpa; if (plvi->mask & ~(LVIF_DI_SETITEM | LVIF_TEXT | LVIF_IMAGE | LVIF_STATE)) { …

【算法】大數據查重

大數據查重 哈希表 找出第一個出現重復的數字 || 找所有重復出現的數字 #include <iostream> #include <vector> #include <unordered_map> #include <unordered_set> #include <stdlib.h> #include <time.h> #include <string> …

模型微調-基于LLaMA-Factory進行微調的一個簡單案例

模型微調-基于LLaMA-Factory進行微調的一個簡單案例 1. 租用云計算資源2. 拉取 LLaMa-Factory3. 安裝依賴環境4. 啟動 LLaMa-Factory 界面5. 從 Huggingface 下載模型6. 模型驗證7. 模型微調 1. 租用云計算資源 以下示例基于 AutoDL 云計算資源。 在云計算平臺選擇可用的云計…

【單片機】ARM 處理器簡介

ARM 公司簡介 ARM&#xff08;Advanced RISC Machine&#xff09; 是英國 ARM 公司&#xff08;原 Acorn RISC Machine&#xff09; 開發的一種精簡指令集&#xff08;RISC&#xff09; 處理器架構。ARM 處理器因其低功耗、高性能、廣泛適用性&#xff0c;成為嵌入式系統、移動…

springboot的實體類字段校驗的分組校驗

分組校驗&#xff08;Group Validation&#xff09;允許在不同的場景下對同一個實體類應用不同的校驗規則。例如&#xff0c;在新增數據和更新數據時&#xff0c;可能需要對某些字段的校驗規則進行調整。以下是分組校驗的具體實現步驟&#xff1a; 一、定義分組接口 創建空的標…

vue3,Element Plus中隱藏樹el-tree滾動條

el-tree&#xff0c;節點過多&#xff0c;默認會出現垂直滾動條&#xff0c;顯得不美觀 可以使用隱藏組件 el-scrollbar 將 el-tree 包裹&#xff0c;就可以隱藏垂直滾動條 <el-scrollbar> <el-tree> ... </el-tree> </el-scrollbar> /* 滾動條禁用鼠…

mysql練習

創建數據庫db_ck&#xff0c;再創建表t_hero&#xff0c;將四大名著中的主要人物都插入這個表中&#xff0c;將實現過程中sql提交上上來 1、創建數據庫db_ck mysql> create database db_ck; 2、創建表t_hero mysql> use db_ck Database changed mysql> create table …

svn刪除所有隱藏.svn文件,文件夾脫離svn控制

新建一個文件&#xff0c;取名remove-svn-folders.reg&#xff0c;輸入如下內容&#xff1a; Windows Registry Editor Version 5.00 [HKEY_LOCAL_MACHINE\SOFTWARE\Classes\Folder\shell\DeleteSVN] "Delete SVN Folders" [HKEY_LOCAL_MACHINE\SOFTWARE\Class…

文心一言:中國大模型時代的破局者與探路者

2023年&#xff0c;生成式人工智能&#xff08;AIGC&#xff09;的浪潮席卷全球&#xff0c;而百度推出的“文心一言”&#xff08;ERNIE Bot&#xff09;作為中國AI領域的代表性產品&#xff0c;迅速成為行業焦點。這款基于百度自主研發的“文心大模型”打造的對話式AI工具&am…

Ubuntu 安裝docker docker-compose

Docker 通過提供輕量級、可移植且高效的解決方案&#xff0c;簡化了軟件開發和部署。“docker build”命令是 Docker 鏡像創建過程的核心。本文將探討 Docker 構建命令、用法以及 Docker 構建的優化。 Docker 構建有什么作用&#xff1f; Docker build 是一個命令行界面 CLI命…

Unity開發——CanvasGroup組件介紹和應用

CanvasGroup是Unity中用于控制UI的透明度、交互性和渲染順序的組件。 一、常用屬性的解釋 1、alpha&#xff1a;控制UI的透明度 類型&#xff1a;float&#xff0c;0.0 ~1.0&#xff0c; 其中 0.0 完全透明&#xff0c;1.0 完全不透明。 通過調整alpha值可以實現UI的淡入淡…