Fourier-Lerobot——把斯坦福人形動作策略iDP3封裝進了Lerobot(含我司七月人形研發落地實踐)

前言

近期在摳lerobot源碼時,看到其封裝了ALOHA ACT、diffusion policy、π0時,我就在想,lerobot其實可以再封裝下idp3

  1. 我甚至考慮是否從我聯合帶的那十幾個具身研究生中選幾個同學做下這事,對他們也是很好的歷練
  2. 然當25年3.18日晚上,我把lerobot摳的差不多了「比如此文《LeRobot源碼剖析——對機器人各個動作策略的統一封裝:包含ALOHA ACT、Diffusion Policy、VLA模型π0》
    卻發現傅利葉fork了lerobot,并在fork的fourier-lerobot中,把idp3封裝了進去,實在是卷啊..

再加之工廠機械臂開發訂單之外,我司「七月在線」近期接到的B端人形開發訂單越來越多了(且還有多個人形開發需求正在并行推進中)

  1. 對于其中一個人形開發訂單,我(們)準備把ipd3作為備選,既然fourier把ipd3封裝進了lerobot,那這個fourier-lerobot便是我們在落地中會嘗試的庫之一
  2. 當然了,idp3外,像vla π0 我們也會考慮并行嘗試,而π0此前已經封裝進了lerobot,故π0官方庫、lerobot庫都是可以選擇的?

我們非常缺人,如果有志于做具身智能或人形研發的,歡迎私我,我還順帶在微博上感慨

而FFTAI/fourier-lerobot對huggingface/lerobot的主要擴展集中在以下幾個方面:

  1. 數據集支持:添加了對Fourier ActionNet數據集的全面支持,包括轉換工具和可視化工具
  2. 訓練管道:擴展了IDP3訓練管道,針對人形機器人優化
  3. 工具擴展:提供了特定于Fourier數據集的工具鏈

這些修改使FFTAI/fourier-lerobot成為一個專為人形機器人開發優化的版本,而保持了與原始huggingface/lerobot項目的核心框架兼容性

第一部分 fourier-lerobot新增的獨立scripts

FFTAI/fourier-lerobot添加了一個完全獨立的scripts目錄(與lerobot/scripts不同),包含:

  • convert_to_lerobot_v2.py:這是一個專門為Fourier數據集開發的轉換工具,用于將Fourier ActionNet數據集轉換為LeRobotDatasetV2格式
    該腳本處理了:
    HDF5格式的機器人狀態和動作數據
    攝像機RGB和深度視頻數據
    點云數據生成和處理
    時間戳對齊
    特定于人形機器人的關節數據處理
  • `fourier_viz.py`:用于可視化Fourier數據集的專用工具
  • `requirements.txt`:Fourier數據集處理工具的依賴項

1.1?convert_to_lerobot_v2.py

1.2?fourier_viz.py

第二部分 全新的`idp3`訓練管道實現

即在新增的lerobot/common/policies/idp3目錄之下,包含以下文件:
- `configuration_idp3.py`
- `modeling_idp3.py`?
- `pointnet_extractor.py`

這是一個重要的擴展,因為原始huggingface/lerobot項目中不包含IDP3訓練管道

// 待更

第三部分 Fourier數據集的可視化和處理與文檔擴展

3.1 pyproject.toml中的修改:以支持Fourier數據集的可視化和處理

添加了`fourier_viz`可選依賴組,包含以下軟件包:

fourier_viz = ["opencv-python>=4.10.0.84","rerun-sdk==0.22.0","h5py>=3.12.1","tqdm>=4.67.1","loguru","numpy","rich",
]

這些依賴項專門用于支持Fourier數據集的可視化和處理

3.2 文檔擴展

- 添加了完整的`DATASET.md`文件,詳細說明了Fourier ActionNet數據集的結構和使用方法
- 修改了`README.md`,添加了關于Fourier-Lerobot的介紹段落和功能說明

第四部分?傅利葉開源人形機器人數據集Fourier ActionNet

// 待更

第五部分?我司七月人形研發落地實踐

// 待更

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/898666.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/898666.shtml
英文地址,請注明出處:http://en.pswp.cn/news/898666.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

MySQL拒絕訪問

1. 問題 使用圖形界面工具連接MySQL數據庫,拒絕訪問! 2. 解決方法 以管理員的身份打開cmd,輸入命令,啟動MySQL net start mysql版本號 3. 參考 暫無

多模態SVG生成新標桿:StarVector從圖像文本生成高精度SVG的AI模型

一、引言:矢量圖形的崛起與挑戰 在現代數字世界中,圖像扮演著至關重要的角色,而可伸縮矢量圖形(SVG)正因其獨特的優勢,在網頁設計、圖形設計等領域占據著越來越重要的地位。與傳統的基于像素的柵格圖像不同…

Netty——BIO、NIO 與 Netty

文章目錄 1. 介紹1.1 BIO1.1.1 概念1.1.2 工作原理1.1.3 優缺點 1.2 NIO1.2.1 概念1.2.2 工作原理1.2.3 優缺點 1.3 Netty1.3.1 概念1.3.2 工作原理1.3.3 優點 2. Netty 與 Java NIO 的區別2.1 抽象層次2.2 API 易用性2.3 性能優化2.4 功能擴展性2.5 線程模型2.6 適用場景 3. 總…

游戲引擎學習第175天

回顧和今天的計劃 今天的主要任務是完成稀疏 Unicode 支持。之前我們已經完成了所有的思考和設計工作,但代碼部分尚未完成,因為有許多內容需要調整和重構。因此,今天的目標就是把這些內容全部整理好并最終實現。 回顧當前測試資源構建器的狀…

零基礎上手Python數據分析 (7):Python 面向對象編程初步

寫在前面 回顧一下,我們已經學習了 Python 的基本語法、數據類型、常用數據結構和文件操作、異常處理等。 到目前為止,我們主要采用的是 面向過程 (Procedural Programming) 的編程方式,即按照步驟一步一步地編寫代碼,解決問題。 這種方式對于簡單的任務已經足夠,但當程序…

CNN的空間歸納偏置(Inductive Bias):深入解析其本質與影響(與transformer的比較)

CNN的空間歸納偏置(Inductive Bias):深入解析其本質與影響 在深度學習領域,卷積神經網絡(Convolutional Neural Networks, CNN)和Transformer代表了兩種截然不同的設計哲學。CNN憑借其卓越的性能長期主導計…

1-4 麻雀優化深度核極限學習機超參數

本博客來源于CSDN機器魚,未同意任何人轉載。 更多內容,歡迎點擊本專欄目錄,查看更多內容。 目錄 0.引言 1.原理 2.具體實現 3.結語 0.引言 在博客【深度核極限學習機】里我們講述了深度核極限學習機原理,今天我們對其繼續進…

miniconda安裝保姆級教程|win11|深度學習環境配置

一、官網安裝miniconda miniconda官網:Miniconda - Anaconda 點擊Download按鈕 在紅框位置輸入郵箱并點擊submit,下載鏈接將會發到郵箱中 郵箱中將會收到如圖所示郵件,點擊下載 選擇windows對應的miniconda安裝包 miniconda安裝包安裝完成如…

AI安全、大模型安全研究(DeepSeek)

DeepSeek 點燃AI應用革命之火,但安全 “灰犀牛” 正在逼近 DeepSeek-R1國產大模型的發布,以技術創新驚艷了全球,更是極致的性價比推動國內千行百業接入 AI,政府、企業競速開發智能業務處理、智能客服、代碼生成、營銷文案等應用,“落地效率” 成為第一關鍵詞。然而與此相…

機器學習——Numpy的神奇索引與布爾索引

在 NumPy 中,神奇索引(Fancy Indexing) 和 布爾索引(Boolean Indexing) 是兩種強大的索引方式,用于從數組中提取特定元素或子集。以下是它們的詳細說明和示例: 1. 神奇索引(Fancy In…

Android Studio最后一個綁定JDK8的版本,但是官方下載是最新的,怎么下載Android Studio歷史版本包,這篇文章幫你解決。

最近需要安裝Android Studio 編輯器 發現官網最新的編輯器已經不支持 jdk8了 經過查閱資料: Android Studio最后一個綁定JDK8的版本:4.1.3 下載地址:https://developer.android.google.cn/studio/archive 如果你打開是這樣的 下載頁 這是因為你用的中…

Next-Auth 認證系統:用戶與管理員雙角色登錄配置

概述 本文檔介紹了如何使用 Next-Auth 配置一個同時支持普通用戶和管理員用戶登錄的認證系統。 基本配置 首先,我們需要設置 Next-Auth 的基本配置,包括提供者、回調函數和頁面路由。 import type { NextAuthConfig } from next-auth import type { …

CentOS配置永久靜態IP

在 CentOS 6 中,配置永久 IP 地址需要修改網絡配置文件。以下是詳細步驟: 1. 找到網卡名稱 首先,確定你需要配置 IP 的網卡名稱,通常是 eth0 或類似的名稱。 運行以下命令查看網卡信息: bash ifconfig或者&#xf…

springboot Actuator 指標分析

http.server.requests HTTP 接口性能瓶頸 http.server.requests.max system.cpu.usage 代碼熱點分析或橫向擴容 核心接口性能指標,包含以下維度: count:請求總數 max/sum:最大及總響應時間 status:HTTP 狀態碼分布&a…

在K8S中掛載 Secret 到 Pod

在 Kubernetes 里,把 Secret 掛載到 Pod 中有兩種主要方式:作為卷掛載和作為環境變量掛載。下面為你提供相應的代碼示例。 作為卷掛載 Secret 將 Secret 作為卷掛載到 Pod 時,Secret 的每個鍵會成為掛載目錄下的一個文件,文件內…

mac npm run dev報錯 error:0308010C:digital envelope routines::unsupported

并且提示 Unsupported engine { npm WARN EBADENGINE package: achrinza/node-ipc9.2.2, npm WARN EBADENGINE required: { node: 8 || 10 || 12 || 14 || 16 || 17 }, npm WARN EBADENGINE current: { node: v18.18.0, npm: 9.8.1 } npm WARN EBADENGINE } package.jso…

「宇樹科技」13家核心零部件供應商梳理!

2025年2月6日,摩根士丹利(Morgan Stanley)發布最新人形機器人研報:Humanoid 100: Mapping the Humanoid Robot Value Chain(人形機器人100:全球人形機器人產業鏈梳理)。 2025年2月20日&#xf…

MySQL 性能優化方向

MySQL 性能優化是一個系統性的工作,涉及數據庫設計、查詢優化、索引優化、硬件配置等多個方面。以下是 MySQL 性能優化的主要方向和具體優化方案: 一、數據庫設計優化 1. 合理設計表結構 規范化設計:避免數據冗余,確保數據一致性。適度反規范化:在查詢頻繁的場景下,適當…

MyBatis plus詳解

核心功能 代碼生成器 它能夠依據數據庫表結構,自動生成涵蓋實體類、Mapper 接口、Mapper XML 文件、Service 接口與實現類等在內的基礎代碼。開發人員只需簡單配置數據庫連接信息、表名以及生成代碼的相關參數,即可快速生成符合項目規范的基礎代碼&…

背包問題——多重背包(C語言)

代碼如下&#xff1a; #include<stdio.h>int knapsack(int weight[], int value[], int count[], int n, int capacity) {int* dp (int*)malloc(sizeof(int) * (capacity 1));for (int i 0; i < capacity; i){dp[i] 0;}for (int i 0; i < n; i)//核心代碼{fo…