vla學習 富

# 基于diffusion
# π0
## 架構
其核心思想是在預訓練好的視覺語言模型(VLM)基礎上添加一個“動作專家”(action expert),通過流匹配(flow matching)的方式生成連續的高頻控制指令。整個架構可以概括為:

?- 預訓練VLM Backbone
利用 PaliGemma 等大規模預訓練的 VLM,將圖像和文本信息嵌入統一的表示空間,繼承了互聯網規模的語義知識和視覺信息提取能力。
?- 跨機器人平臺數據
論文中使用了來自 7 種不同機器人配置、68 個任務的大規模數據(總計約 10,000 小時),實現跨平臺、跨任務的聯合訓練,從而提升模型的泛化能力。
?- 動作生成 via Flow Matching
針對連續動作生成的挑戰,論文采用了一種基于擴散思想的流匹配方法(flow matching),使得模型能夠生成高頻(例如 50Hz)且精細的動作序列。與傳統 autoregressive 離散生成方法相比,流匹配可以更好地處理連續控制信號和復雜動作分布。
?- 混合專家(Mixture of Experts)設計
模型內部將輸入分為兩大部分:一部分(圖像和文本)走 VLM backbone;另一部分(機器人狀態和動作)通過專門設計的“動作專家”處理,這種設計有助于更好地融合預訓練知識和機器人特定的控制需求。


## 訓練流程:預訓練 + 后訓練
類似大語言模型的訓練流程,π0 模型的訓練分為兩個階段:

?1. 預訓練階段:利用海量、但可能質量參差不齊的多任務、多平臺數據,使模型具備廣泛的基礎能力和恢復錯誤的能力。
?2. 后訓練(微調)階段:使用高質量、任務特定的數據對模型進行微調,從而獲得更高效、流暢和魯棒的動作執行策略。后訓練階段能夠顯著提升模型在復雜、多階段任務(如疊衣服、組裝盒子等)上的表現。

[添加鏈接描述](https://zhuanlan.zhihu.com/p/19518316721)
這篇博客講的更詳細一些,輸入輸出,
# 其他
π0.5
hi Robot

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/908877.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/908877.shtml
英文地址,請注明出處:http://en.pswp.cn/news/908877.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

降雨預測系統(機器學習)

這是一個基于Python開發的降雨預測系統,使用機器學習算法對指定月份的降雨概率進行預測。該系統提供了友好的圖形用戶界面(GUI),支持數據可視化和交互式操作。 ## 功能特點 - ?? 生成歷史降雨數據(2015-2024年) - ?? 使用邏輯回歸模型進行降雨預測 - ?? 可視化…

邏輯回歸與Softmax

Softmax函數是一種將一個含任意實數的K維向量轉化為另一個K維向量的函數,這個輸出向量的每個元素都在(0, 1)區間內,并且所有元素之和等于1。 因此,它可以被看作是某種概率分布,常用于多分類問題中作為輸出層的激活函數。這里我們以拓展邏輯回歸解決多分類的角度對Softmax函…

基于PSO與BP神經網絡分類模型的特征選擇實戰(Python實現)

說明:這是一個機器學習實戰項目(附帶數據代碼文檔),如需數據代碼文檔可以直接到文章最后關注獲取。 1.項目背景 在機器學習建模過程中,特征選擇是提升模型性能、降低計算復雜度的重要環節。尤其在高維數據場景下&…

深度學習之模型壓縮三駕馬車:基于ResNet18的模型剪枝實戰(1)

一、背景:為什么需要模型剪枝? 隨著深度學習的發展,模型參數量和計算量呈指數級增長。以ResNet18為例,其在ImageNet上的參數量約為1100萬,雖然在服務器端運行流暢,但在移動端或嵌入式設備上部署時&#xf…

uni-app學習筆記二十四--showLoading和showModal的用法

showLoading(OBJECT) 顯示 loading 提示框, 需主動調用 uni.hideLoading 才能關閉提示框。 OBJECT參數說明 參數類型必填說明平臺差異說明titleString是提示的文字內容,顯示在loading的下方maskBoolean否是否顯示透明蒙層,防止觸摸穿透,默…

【大模型RAG】六大 LangChain 支持向量庫詳細對比

摘要 向量數據庫已經成為檢索增強生成(RAG)、推薦系統和多模態檢索的核心基礎設施。本文從 Chroma、Elasticsearch、Milvus、Redis、FAISS、Pinecone 六款 LangChain 官方支持的 VectorStore 出發,梳理它們的特性、典型應用場景與性能邊界&a…

【MySQL】數據庫三大范式

目錄 一. 什么是范式 二. 第一范式 三. 第二范式 不滿足第二范式時可能出現的問題 四. 第三范式 一. 什么是范式 在數據庫中范式其實就是一組規則,在我們設計數據庫的時候,需要遵守不同的規則要求,設計出合理的關系型數據庫,…

Coze工作流-語音故事創作-文本轉語音的應用

教程簡介 本教程將帶著大家去了解怎么樣把文本轉換成語音,例如說我們要做一些有聲故事,我們可能會用上一些語音的技術,來把你創作的故事朗讀出來 首先我們創建一個工作流 對各個模塊進行編輯,如果覺得系統提示詞寫的不好&#xf…

5.子網劃分及分片相關計算

某公司網絡使用 IP 地址空間 192.168.2.0/24,現需將其均分給 市場部 和 研發部 兩個子網。已知: 🏢 市場部子網 🖥? 已分配 IP 地址范圍:192.168.2.1 ~ 192.168.2.30🌐 路由器接口 IP:192.16…

三體問題詳解

從物理學角度,三體問題之所以不穩定,是因為三個天體在萬有引力作用下相互作用,形成一個非線性耦合系統。我們可以從牛頓經典力學出發,列出具體的運動方程,并說明為何這個系統本質上是混沌的,無法得到一般解…

機器學習算法時間復雜度解析:為什么它如此重要?

時間復雜度的重要性 雖然scikit-learn等庫讓機器學習算法的實現變得異常簡單(通常只需2-3行代碼),但這種便利性往往導致使用者忽視兩個關鍵方面: 算法核心原理的理解缺失 忽視算法的數據適用條件 典型算法的時間復雜度陷阱 SV…

uniapp 對接騰訊云IM群組成員管理(增刪改查)

UniApp 實戰:騰訊云IM群組成員管理(增刪改查) 一、前言 在社交類App開發中,群組成員管理是核心功能之一。本文將基于UniApp框架,結合騰訊云IM SDK,詳細講解如何實現群組成員的增刪改查全流程。 權限校驗…

OPENCV圖形計算面積、弧長API講解(1)

一.OPENCV圖形面積、弧長計算的API介紹 之前我們已經把圖形輪廓的檢測、畫框等功能講解了一遍。那今天我們主要結合輪廓檢測的API去計算圖形的面積,這些面積可以是矩形、圓形等等。圖形面積計算和弧長計算常用于車輛識別、橋梁識別等重要功能,常用的API…

一.設計模式的基本概念

一.核心概念 對軟件設計中重復出現問題的成熟解決方案,提供代碼可重用性、可維護性和擴展性保障。核心原則包括: 1.1. 單一職責原則? ?定義?:一個類只承擔一個職責,避免因職責過多導致的代碼耦合。 1.2. 開閉原則? ?定義?&#xf…

React第五十七節 Router中RouterProvider使用詳解及注意事項

前言 在 React Router v6.4 中&#xff0c;RouterProvider 是一個核心組件&#xff0c;用于提供基于數據路由&#xff08;data routers&#xff09;的新型路由方案。 它替代了傳統的 <BrowserRouter>&#xff0c;支持更強大的數據加載和操作功能&#xff08;如 loader 和…

Opencv中的addweighted函數

一.addweighted函數作用 addweighted&#xff08;&#xff09;是OpenCV庫中用于圖像處理的函數&#xff0c;主要功能是將兩個輸入圖像&#xff08;尺寸和類型相同&#xff09;按照指定的權重進行加權疊加&#xff08;圖像融合&#xff09;&#xff0c;并添加一個標量值&#x…

C++ 基礎特性深度解析

目錄 引言 一、命名空間&#xff08;namespace&#xff09; C 中的命名空間? 與 C 語言的對比? 二、缺省參數? C 中的缺省參數? 與 C 語言的對比? 三、引用&#xff08;reference&#xff09;? C 中的引用? 與 C 語言的對比? 四、inline&#xff08;內聯函數…

關于面試找工作的總結(四)

不同情況下收到offer后的處理方法 1.不會去的,只是面試練手2.還有疑問,考慮中3.offer/職位不滿足期望的4.已確認,但又收到更好的5.還想挽回之前的offer6.確認,準備入職7.還想拖一下的1.不會去的,只是面試練手 HR您好,非常榮幸收到貴司的offer,非常感謝一直以來您的幫助,…

什么是高考?高考的意義是啥?

能見到這個文章的群體&#xff0c;應該都經歷過高考&#xff0c;突然想起“什么是高考&#xff1f;意義何在&#xff1f;” 一、高考的定義與核心功能 **高考&#xff08;普通高等學校招生全國統一考試&#xff09;**是中國教育體系的核心選拔性考試&#xff0c;旨在為高校選拔…

L1和L2核心區別 !!--part 2

哈嘍&#xff0c;我是 我不是小upper~ 昨天&#xff0c;咱們分享了關于 L1 正則化和 L2 正則化核心區別的精彩內容。今天我來進一步補充和拓展。 首先&#xff0c;咱們先來聊聊 L1 和 L2 正則化&#xff0c;方便剛接觸的同學理解。 L1 正則化&#xff08;Lasso&#xff09;&…