數據開源 | “白虎”數據集首批開源,邁出百萬數據征途第一步

“白虎”數據集首批開源

在機器人智能不斷邁向自主化、通用化的進程中,如何解決人形機器人的“喂養”難題、走出“數據荒漠”,已成為具身智能領域亟需攻克的關鍵課題。為此,2025 年初,全國首個異構人形機器人訓練場在模力社區正式啟用,超百臺異構本體在場景中日復一日演練、采集、優化,構建出一個前所未有的數據工程體系。而在這片“進化之地”中孕育而生的,正是被譽為機器人“糧倉”的——“白虎”數據集。

“白虎”數據集開源直達https://www.openloong.org.cn/cn/dataset?utm_source=referral&utm_medium=csdn&utm_campaign=data&utm_content=250728

"白虎"數據集由國家地方共建人形機器人創新中心(以下簡稱“國地中心”)牽頭打造的,作為全球首個規模突破百萬量級的異構機器人數據集,其數據源自真實應用場景,全面覆蓋多種全尺寸人形機器人、類人形輪式機器人以及機械臂等異構平臺,并經過嚴格的質量控制與校驗。它不僅在體量上實現突破,更在采集方法、采集內容、數據管理上形成了標準規范,成為驅動人形機器人能力躍遷的數據基座。

本次正式開源的數據集,正是從“白虎”數據集中精心選取的一部分子集,聚焦于四款主流機器人本體和兩類典型末端類型,共計10萬余條高質量任務數據。這是白虎數據集面向開源社區邁出的第一步,未來“白虎”數據集將持續逐步開放,預計最終累計開源超百萬條數據,構建起全球領先的具身智能數據開放體系。

圖片

值得一提的是,該數據集已通過中國信息通信研究院組織的具身智能數據集質量評估,獲得官方頒發的《數據集質量檢測報告》《具身智能數據集質量評估證書》成為我國首個獲得信通院權威認證的具身智能機器人數據集。

四大機器人、兩類末端、五大真實場景、數十類任務

本次開源數據涵蓋四款主流機器人本體,分別為:青龍、智元A2D、傅利葉GR2、樂聚夸父,在構型設計與適用場景上各具代表性。青龍是全尺寸開源公版人形機器人,具備高度仿生軀干設計特性,適用于科研、工業制造、民生服務等多種場景;智元A2D采用輪式結構設計,主要面向工業及數采場景;傅利葉GR-2配備了仿生靈巧手,適合高精度操作;樂聚夸父采用開源鴻蒙系統驅動,具備高動態運動構型特征。

在末端類型上,數據集覆蓋夾爪與靈巧手兩類類型,分別適用于簡單結構件抓取與精細操作,構成了具身控制中極具代表性的末端類型分布,為不同末端類型的操作模型訓練提供了數據支撐。

數據樣本涉及五大真實場景工業制造、家居家政、餐飲服務、商超藥店和通用抓取放置,合計覆蓋30余類高頻任務類型,每類任務均配套詳細自然語言描述、動作標簽、場景信息、傳感器及機器人硬件參數,并采用統一的數據處理與管控方法,對具身模型的泛化性提升具有極高的價值,滿足深度學習、控制策略、語義理解等不同層次的建模需求。

部分任務示例包括:

電池抓取

冰箱拿取物體

插花

為提升數據的通用性與結構清晰度,每條數據配套多維度語義標簽信息,具體包括:

物品標簽

涵蓋工業件、餐具、日用器具、藥品等多種物品;

技能標簽:

如抓取、放置、旋轉、推進、拉取、按壓等基本操作原語;

任務與場景標識

任務名統一編碼,場景維度區分操作上下文語義;

末端類型:

分別記錄夾爪或靈巧手執行動作,可用于策略差異建模;

語言描述:

如“從傳送帶抓取藥盒并放置到指定托盤”,支持自然語言與動作對齊建模。

該標簽體系作為“白虎”數據集數據標準的核心要素,未來將在持續開放的數據集中復用。

高質量數據的三重保障

任務多樣,數據真實

數據采集任務緊貼現實應用場景,從流水線操作、家庭生活服務,到餐飲商用與通用交互任務全面覆蓋,構建出一個面向泛化智能系統訓練的任務譜系。例如在工業制造場景中,“電池抓取”“傳送帶物品分揀”等任務模擬典型自動化操作流程;而在家庭家政與商超服務類任務中,“咖啡機使用”“文具收納”“藥品上架”等任務則更具復雜操作步驟與物品交互多樣性。

與仿真數據不同,本數據集100%來源于真實機器人在真實物理環境中的任務執行記錄,數據通過“數據質量驗證”和“本體算法驗證”雙重機制,形成了系統化、工程化、前置化的數據質量保障路徑。

圖片

多元異構,差異全面覆蓋

與傳統數據集相比,該數據集最顯著的特點在于異構本體間任務的高度統一與復用性設計。每一個關鍵任務都在多個機器人平臺上進行了采集,例如“文具收納”任務在青龍、智元A2D、傅利葉GR2等本體上均有執行版本,這種跨本體一致采集設計,為遷移學習、模仿學習、通用動作策略訓練等研究方向提供了非常理想的實驗基礎。

同時,在執行過程中,機器人所采用的末端類型也被詳細記錄,包括夾爪與靈巧手兩種典型類型。不同末端結構對物品的操控方式、夾取路徑、姿態控制等都有顯著差異,這也使得數據集天然支持控制策略的對比研究和結構適應性評估:

機器人本體異構性

青龍為全尺寸開源公版人形機器人,具備高度仿生軀干設計、智元A2D為輪式結構,面向工業及數采場景、傅利葉GR-2配備仿生靈巧手,適合高精度操作、樂聚夸父為開源鴻蒙系統驅動,高動態運動構型,多者結合綜合體現了機器人本體異構性;

末端執行器差異

夾爪主要用于規則物體處理,靈巧手支持復雜物品抓握、工具使用、人類類比動作執行;

任務分布廣泛

同一任務在不同機器人上執行,形成天然的跨本體對照實驗語料,有利于訓練具備泛化能力的策略模型。

這套異構數據結構使數據集具備了極強的可拓展性與對比分析能力,是實現“通用任務能力”驗證的核心基礎之一。

數據規范統一, 可直接調用

本數據集采用人形機器人具身智能訓練數據集管理標準,明確不同來源、不同類型的數據結構和表示方法,并規范數據質量評價方法,有效解決多源異構數據格式不統一、質量層次不齊等問題,保障規模化數據集的高質量生產,同時為行業內的數據生產與管理提供了標準參考。

圖片

向更廣闊的數據生態邁進

具身智能離不開大規模真機數據。我們希望這批由真實本體、真實任務、真實執行過程構建的高質量數據,能夠助力更多開發者和研究者開發更強健的具身智能系統、構建統一可對比的任務基準,推動從“能動”到“會做”的能力躍遷

本次開源標志著“白虎”數據集向開源社區邁出的堅實一步,但遠未終點。白虎數據集開源的全量規模未來將突破百萬條任務數據,不斷引入更多機器人類型、末端形式、任務內容與多模態傳感輸入(視覺、力覺、語音等),構建面向通用具身智能系統訓練的完整數據基座

OpenLoong 社區也將攜手行業開發者與生態伙伴,持續推動具身智能數據生態開放,共建基準測試、開源評測、技能遷移與大模型訓練等關鍵環節,共同打通“真實數據-算法建模-智能演化-實體應用”的閉環鏈路。

歡迎各位加入OpenLoong開源社區,如果您在使用過程中有任何建議或合作需求,歡迎與我們取得聯系。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/91123.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/91123.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/91123.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

第17章——多元函數積分學的預備知識

文章目錄思維導圖場論初步方向導數梯度散度與旋度今日格言:如果凡事缺少了實行的勇氣,再有智慧與仁愛也是枉然。思維導圖 場論初步 場就是空間區域ΩΩΩ上的一種對應法則。可分為:數量場和向量場。 比如一個數量函數uu(x,y,z)uu(x,y,z)uu(x…

Vue》》Slot 插槽

插槽的概念 插槽就是子組件中的提供給父組件使用的一個占位符,用slot標簽 表示,父組件可以在這個占位符中填充任何模板代碼,如 HTML、組件等,填充的內容會替換子組件的slot標簽。簡單理解就是子組件中留下個“坑”,父組…

AKS部署.Net Shopping(K8S本地部署/AKS部署/key-value)

文章目錄 項目地址 一、Api配置修改 1.1 配置docker 1. docker-compose配置環境變量 2. 修改appsettings 二、本地k8s部署 2.1 將本地鏡像Push到dockerHub 2.2 制作K8S yaml文件 1. mogodb 2. shopping api 3. shoppingclient 3. port補充 4. Service 的type 三、部署到AKS 3.1…

vue3 el-table 去除小數

在 Vue 3 中使用 Element Plus 的 <el-table> 組件時&#xff0c;如果你希望去除表格列中的小數&#xff0c;你可以通過幾種方式來實現&#xff1a;1. 使用 formatter 屬性<el-table-column> 組件的 formatter 屬性允許你自定義單元格的顯示格式。你可以使用這個屬…

JavaScript數組去重性能優化:Set與Object哈希表為何效率最高

文章目錄 數組去重性能優化:為什么Set和Object哈希表的效率最高 引言 一、數組去重的常見方法 1.1 雙重循環法 1.2 indexOf/includes方法 1.3 排序后相鄰比較法 1.4 filter + indexOf方法 1.5 使用Set數據結構 1.6 使用Object哈希表 二、性能對比分析 2.1 時間復雜度對比 2.2 …

在VS Code中克隆項目失敗

前提條件&#xff1a;電腦中已經安裝好了Git一、錯誤原因&#xff1a;1、打開命令面板 快捷鍵 CtrlShiftP&#xff0c;輸入Git: Clone 并回車&#xff1b;2、輸入倉庫URL回車后就發現報錯了可以看到最后一行的報錯內容&#xff1a;Git 無法找到或讀取 SSL 證書文件&…

ASP.NET Core MVC中taghelper的ModelExpression詳解

Microsoft.AspNetCore.Mvc.ViewFeatures.ModelExpression 是 ASP.NET Core MVC 框架中的一個核心類型&#xff0c;用于表示對模型屬性的強類型引用。它在 Razor 視圖、表單綁定和自定義 Tag Helper 中扮演關鍵角色&#xff0c;下面從技術細節、應用場景和最佳實踐三個方面詳細解…

樓宇 3D 建模:驅動建筑領域革新的數字力量

在科技飛速發展的當下&#xff0c;數字化技術正深刻改變著各個行業&#xff0c;建筑領域也不例外。樓宇 3D 建模作為關鍵的數字化技術&#xff0c;逐漸成為建筑設計、施工和管理過程中不可或缺的工具。它通過將現實中的樓宇以三維數字模型呈現&#xff0c;為建筑行業帶來前所未…

打通視頻到AI的第一公里:輕量RTSP服務如何重塑邊緣感知入口?

在 AI 系統大規模部署、設備邊緣化、數據實時化趨勢下&#xff0c;視頻能力的部署方式正迎來深刻變革。2025世界人工智能大會&#xff08;WAIC&#xff09;上&#xff0c;視頻感知與智能決策之間的“連接效率”成為關鍵話題。而在這場連接能力的競爭中&#xff0c;輕量級、標準…

旅行短視頻模糊的常見原因及應對方法

在旅行中拍攝短視頻時&#xff0c;你是否經常遇到這樣的問題&#xff1a;明明景色很美&#xff0c;但拍出來的視頻卻模糊不清&#xff0c;色彩暗淡&#xff0c;甚至噪點嚴重&#xff1f;尤其是在弱光環境&#xff08;如夜景、洞穴&#xff09;或快速移動&#xff08;如航拍、運…

【基礎篇四】ASGI:Python異步Web的新標準

目錄 一、ASGI規范深度解析 1.1 ASGI的誕生背景 1.2 ASGI核心概念 1.3 ASGI規范版本演進 二、WSGI vs ASGI&#xff1a;深度對比分析 2.1 架構模式對比 2.2 性能特性對比 2.3 適用場景分析 三、ASGI支持的協議類型 3.1 HTTP協議支持 3.1.1 HTTP處理流程 3.2 HTTP S…

51 單片機單文件多文件結構工程模板的創建教程

本章將詳細介紹KEIL C51軟件的使用方法及51單片機工程的創建流程。通過本章學習&#xff0c;掌握建立51單片機工程模板的技能&#xff0c;為后續51 單片機編程學習奠定基礎。 單文件與多文件結構對比 對比項單文件結構多文件結構項目規模小項目、實驗項目中大型項目、正式開發…

【Git】實用Git操作指南:從入門到高效協作

目錄 1. Git 工作流程圖 2. 基本配置 3. 獲取本地倉庫 4. 基礎操作 5. 分支 6. Git遠程倉庫 6.1 常用的托管服務[遠程倉庫] 6.2 注冊碼云 6.3創建遠程倉庫 6.4 配置SSH公鑰 6.5 操作遠程倉庫 7. 在IDEA中使用Git 附&#xff1a;鐵令 下載地址&#xff1a;Git - Downloads 安裝&…

InstructBLIP:通過指令微調邁向通用視覺-語言模型

溫馨提示&#xff1a; 本篇文章已同步至"AI專題精講" InstructBLIP&#xff1a;通過指令微調邁向通用視覺-語言模型 摘要 大規模預訓練和指令微調在構建通用語言模型方面取得了顯著成功。然而&#xff0c;構建通用視覺-語言模型仍然面臨挑戰&#xff0c;這主要源于…

[python][flask]flask藍圖使用方法

在 Flask 中&#xff0c;藍圖&#xff08;Blueprint&#xff09;是一種用于組織和管理代碼的機制&#xff0c;可以將應用分解為多個模塊&#xff0c;每個模塊專注于特定的功能。以下是使用藍圖的基本步驟和方法&#xff1a;1. 創建藍圖首先&#xff0c;需要創建一個藍圖對象。藍…

學習dify:一個開源的 LLM 應用開發平臺

Dify 是一個開源的 LLM 應用開發平臺。其直觀的界面結合了 AI 工作流、RAG 管道、Agent、模型管理、可觀測性功能等&#xff0c;讓您可以快速從原型到生產。以下是其核心功能列表&#xff1a; 1. 工作流: 在畫布上構建和測試功能強大的 AI 工作流程&#xff0c;利用以下所有…

VEX實現物體沿線條流動

1. 效果如下&#xff1a;float offset fit01(rand(ptnum654),0.5,1)*Time*chf("speed") rand(ptnum547);int num nprimitives(1); vector pos primuv(1,"P",ptnum%num,offset%1);P pos;2.效果如下&#xff1a; float min detail(1,"min");…

puppeteer 系列模塊的系統性、詳細講解

puppeteer 系列模塊的系統性、詳細講解 &#x1f9e9; 一、核心模塊介紹 1. puppeteer全功能 Puppeteer 包&#xff0c;默認包含 Chromium 瀏覽器npm install puppeteer包含內容&#xff1a;Puppeteer API Chromium 瀏覽器適合場景&#xff1a; 想直接運行&#xff0c;不關心瀏…

golang實現一個規則引擎,功能包括實時增加、修改、刪除規則

以下是一個用 Go 實現的輕量級規則引擎,支持實時增加、修改、刪除規則,并基于表達式評估觸發規則動作: package mainimport ("errors""fmt""sync" )// Rule 定義規則結構體 type Rule struct {ID string // 規則唯一標…