人形機器人加快先進AI機器人開發

物理AI的新時代

通用人形機器人專為快速適應現有的以人類為中心的城市和工業工作空間而構建,用以承擔枯燥、重復性或對體力要求高的工作任務。這些機器人正在從工廠車間走向醫療健康機構,通過自動化幫助人類工作,緩解勞動力短缺問題。

圖片

但是,構建人形機器人涉及多層復雜性并面臨艱巨的工程挑戰。這些挑戰涵蓋模擬人類的感知、自由度、靈巧性、移動性、認知功能和全身協調控制等方面。

這需要加快機器人研究領域和技術的發展,推動人工智能 (AI)、機器學習、基于物理仿真、傳感器技術和機電一體化等關鍵技術的突破。

技術運用-推進人形機器人開發

NVIDIA正在開發加速系統、blueprints、工具、服務、算法和其他機器人技術,以構建符合人類形態規格的通用機器人。

三臺計算機解決方案

人形機器人需具備在特定環境中自主感知、規劃與行動的能力,這要求其能實時處理海量數據。這需要訓練支撐機器人大腦的基礎模型,對機器人大腦進行模擬和驗證,并最終將優化后的大腦和相關軟件部署到實體機器人上。?

這三種 AI 系統為:?

  • 一臺 NVIDIA AI 超級計算機— NVIDIA DGX? 搭載 NVIDIA H100 或 B100 處理器—用于訓練強大的生成式 AI 模型和機器人基礎模型。?

  • 一臺 NVIDIA OVX? 計算機,搭載 NVIDIA RTX?GPU,用于合成數據生成、機器學習和仿真測試以及基于 NVIDIA Omniverse?構建的仿真框架,比如 NVIDIA Isaac Sim?and Isaac?Lab。?

  • 一臺安裝在機器人本體上的實時計算機,比如NVIDIA Jetson Thor?— 構建于NVIDIA’s Blackwell架構之上—可以運行低延遲和高吞吐量推理。

圖片

NVIDIA Isaac GR00T

GR00T是一個專注于通用機器人基礎模型和數據工作流的研究計劃和開發平臺,可加速人形機器人開發進程。

機器人基礎模型

人形機器人需要不同的技能來完成各種任務,傳統上需要單獨的、昂貴的 AI 模型。機器人基礎模型通過基于廣泛數據進行訓練、開發通用技能來解決這一問題。這使得機器人能夠適應不同的任務和環境。

NVIDIA Isaac GR00T N是全球首個用于通用人形機器人推理和技能的開源基礎模型。這種跨具身本體模型接受包括語言和圖像在內的多模態輸入,在不同環境中執行操作任務。GR00T N基于龐大的人形數據集上訓練,該數據集由真實捕獲的數據、使用NVIDIA Isaac GR00T-Mimic blueprint組件生成的合成數據和互聯網級視頻數據組成。它可以通過后訓練針對特定實施、任務和環境進行調整。

圖片

機器人學習和仿真框架

仿真對于開發者來說至關重要,在將人形機器人部署到現實世界中之前,能夠在各種物理精確的環境和條件下對其進行訓練。

機器人學習和仿真框架,比如NVIDIA Isaac Sim 和 NVIDIA Isaac Lab—基于 Omniverse平臺構建 — 實現物理精確仿真,以并行訓練和驗證多個人形機器人智能體。?

Isaac Lab是一個基于Isaac Sim構建的開源統一機器人學習框架,為機器人策略訓練提供高效的學習技術支持。然后,訓練后的機器人策略可以在Isaac Sim中進行驗證Isaac Sim是一個基于物理的虛擬環境平臺,專用于構建、模擬和測試人形機器人參考應用。

圖片

GR00T工作流

數據生成和處理

收集大量高質量的真實數據集可能極具挑戰性,成本高昂且耗時。基于物理精確仿真生成的合成數據可以加速數據收集,并提供泛化機器人學習模型所需的多樣性,從而應對這一挑戰。

NVIDIA Isaac GR00T-Dreams blueprint幫助生成大量合成運動,可以教會機器人新的行為以及如何適應不斷變化的環境。

開發人員可以先為他們的機器人進行Cosmos Predict 2世界基礎模型 (WFM) 的后訓練。然后,使用單張圖片作為輸入,GR00T-Dreams可以幫助生成機器人在新環境中執行新任務的多個視頻。之后,該 blueprint 會提取動作 token—這些經過壓縮、易于理解的數據片段,用于教導機器人如何執行這些新任務。

GR00T-Dreams blueprint是對Isaac GR00T-Mimic blueprint的補充。GR00T-Mimic使用NVIDIA Omniverse和Cosmos增強現有數據,而GR00T-Dreams則使用 Cosmos生成全新數據。

圖片

靈巧操作

人形機器人抓取功能需具備類似人類的靈巧操作技能,能夠同時執行粗略抓取和精細操作任務。GR00T-Dexterity是一套基于強化學習的全面模型和策略框架,通過與參考工作流深度結合,可實現這些高級靈巧功能的開發。

移動性

在復雜且動態環境中實現通用導航功能需要進行大量廣泛調整。借助GR00T-Mobility 參考工作流,您可以構建一個通用移動工作流,可在不同設置和機器人具身之間實現無縫導航。

圖片

全身控制

在人形機器人中實現全身控制具有挑戰性,需同時滿足穩定操作和強勁運動要求。GR00T-Control通過一整套先進運動規劃和控制模型、策略和參考工作流來解決這一問題,從而簡化高效控制系統的開發。

通過使用模仿學習和遠程操作數據集,GR00T-Control有助于訓練強大的全身運動策略,從而使人形機器人能夠學習靈巧的操作和運動技能。

圖片

基于AI的機器人感知

為了提高態勢感知和交互效率,人形機器人需具備長期記憶,對事件、空間、個性化設置和上下文感知做出精確響應。?

GR00T-Perception借助基于 Isaac Sim 和 Isaac ROS構建的強大感知庫、基礎模型和參考工作流實現這一目標。這些工具集成了視覺語言模型和檢索增強內存等先進技術,能提升人形機器人的感知、認知和適應能力。

新一代機器人本機計算平臺

機器人硬件對于運行多模態 AI 模型集群也至關重要,這些模型可在不同條件下為人形機器人提供所需的性能、低延遲和功能安全保障。?

基于NVIDIA Blackwell GPU架構的NVIDIA Jetson AGX Thor可提供卓越AI計算性能并搭載新型Transformer引擎。這為邊緣計算提供必要的AI超級能力,從而實現新一代人形機器人開發。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/90430.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/90430.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/90430.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AI 驅動開發效能躍升:企業級智能開發全流程優化方案?

企業軟件開發正面臨 “三高困境”:需求變更頻率高、人力成本占比高、線上故障風險高。破解這些難題的核心在于構建 AI 驅動的全流程智能開發體系,通過系統化效能優化實現開發能力升級。? 需求分析作為開發起點,常因理解偏差導致后期返工。A…

時序數據庫 TDengine × Ontop:三步構建你的時序知識圖譜

在做設備預測性維護或能源管理分析時,你是否也曾思考過:如何才能讓機器“理解”我們收集的大量時序數據?工業現場的數據是結構化的,而語義分析、知識推理卻往往需要 RDF 等圖譜格式。換句話說,“會說話”的數據更聰明&…

Android啟動圖不拉伸且寬占滿屏幕

Android啟動圖不拉伸且寬占滿屏幕 一般啟動圖的做法&#xff1a; start_app_bg.xml <?xml version"1.0" encoding"utf-8"?> <layer-list xmlns:android"http://schemas.android.com/apk/res/android"><item><shape>&l…

rust-方法語法

方法語法 方法類似于函數&#xff1a;我們用 fn 關鍵字和一個名稱來聲明它們&#xff0c;它們可以有參數和返回值&#xff0c;并且包含一些在從其他地方調用該方法時運行的代碼。與函數不同&#xff0c;方法是在結構體&#xff08;或枚舉、trait 對象&#xff0c;分別在第6章和…

【C++】C++ 的入門語法知識1

本文主要講解C語言的入門知識&#xff0c;包括命名空間、C的輸入與輸出、缺省參數以及函數重載。 目錄 1 C的第一個程序 2 命名空間 1&#xff09; 命名空間存在的意義 2&#xff09; 命名空間的定義 3&#xff09; 命名空間的使用 3 C的輸出與輸入 1&#xff09; C中…

SpringBoot6-10(黑馬)

JWT令牌簡介&#xff1a;1.JWT全稱:JSON Web Token(https://iwt.io/)定義了一種簡潔的、自包含的格式&#xff0c;用于通信雙方以json數據格式安全的傳輸信息。2.組成: >第一部分:Header(頭)&#xff0c;記錄令牌類型、簽名算法等。例如:("alg":“HS256",“t…

智能制造場景195個術語的16個分類

說明&#xff1a;《智能制造典型場景參考指引&#xff08;2025年版&#xff09;》日前&#xff0c;由工信部辦公廳正式發布&#xff0c;將成為眾多制造型企業的工作綱領 1. 工廠數字化規劃設計&#xff08;1.1&#xff09;&#xff1a;在電腦上用專業軟件設計工廠布局、規劃生產…

[論文閱讀] 人工智能 + 軟件工程 | 微信閉源代碼庫中的RAG代碼補全:揭秘工業級場景下的檢索增強生成技術

微信閉源代碼庫中的RAG代碼補全&#xff1a;揭秘工業級場景下的檢索增強生成技術 論文標題&#xff1a;A Deep Dive into Retrieval-Augmented Generation for Code Completion: Experience on WeChatarXiv:2507.18515 A Deep Dive into Retrieval-Augmented Generation for Co…

RabbitMQ—仲裁隊列

上篇文章&#xff1a; RabbitMQ集群搭建https://blog.csdn.net/sniper_fandc/article/details/149312481?fromshareblogdetail&sharetypeblogdetail&sharerId149312481&sharereferPC&sharesourcesniper_fandc&sharefromfrom_link 目錄 1 Raft一致性算法…

[2025CVPR-目標檢測方向] CorrBEV:多視圖3D物體檢測

1. ?研究背景與動機? 論文關注自動駕駛中相機僅有的多視圖3D物體檢測&#xff08;camera-only multi-view 3D object detection&#xff09;問題。盡管基于鳥瞰圖&#xff08;BEV&#xff09;的建模近年來取得顯著進展&#xff08;如BEVFormer和SparseBEV等基準模型&#xf…

oracle 數據庫批量變更數據 將a表字段批量更新為b表字段

需求&#xff1a;將excel表中的數據批量更新到 taccoinfo表中vc_broker字段0、備份&#xff1a;create table taccoinfo0724 as select vc_custno ,vc_broker from taccoinfo 1、創建臨時表&#xff1a; create table taccoinfo0724_1 as select vc_custno ,vc_broker from…

vim-xcode 項目常見問題解決方案

vim-xcode 項目常見問題解決方案 項目基礎介紹 vim-xcode 是一個開源項目&#xff0c;旨在通過 Vim 編輯器與 Xcode 項目進行交互。該項目允許開發者在 Vim 中直接構建、測試和運行 Xcode 項目&#xff0c;從而提高開發效率。vim-xcode 主要使用 Vimscript 編寫&#xff0c;并依…

個性化網頁計數器

需要一個服務器環境來存放我們的計數器腳本和數據庫。對于初學者來說&#xff0c;PHP和MySQL是一個不錯的組合&#xff0c;因為它們易于學習且廣泛應用。接下來&#xff0c;我們開始編寫PHP腳本。這個腳本的主要任務是接收來自網頁的請求&#xff0c;并將訪問信息存儲到數據庫中…

詳解力扣高頻SQL50題之1683. 無效的推文【入門】

傳送門&#xff1a;1683. 無效的推文 題目 表&#xff1a;Tweets ----------------------- | Column Name | Type | ----------------------- | tweet_id | int | | content | varchar | ----------------------- 在 SQL 中&#xff0c;tweet_id 是這個表的主鍵。 content 只…

Spring Boot與Python的聯動:實戰案例解析

目錄一、背景與需求二、技術準備2.1 Spring Boot 基礎2.2 Python 環境搭建三、基于 RESTful API 的調用3.1 創建 Python Flask 應用3.2 創建 Spring Boot 應用3.3 測試與驗證四、通過 ProcessBuilder 調用 Python 腳本4.1 創建 Python 腳本4.2 Spring Boot 中調用腳本4.3 注意事…

力扣刷題(第九十七天)

靈感來源 - 保持更新&#xff0c;努力學習- python腳本學習密鑰格式化解題思路移除原字符串中的所有破折號&#xff0c;并將小寫字母轉換為大寫。從后向前遍歷處理后的字符串&#xff0c;每 K 個字符為一組。最后將各組逆序拼接&#xff0c;并用破折號分隔。class Solution:def…

ESP32入門實戰:PC遠程控制LED燈完整指南

引言&#xff1a;物聯網遠程控制基礎 遠程控制是物聯網應用的基礎功能之一&#xff0c;通過ESP32實現PC遠程控制LED燈不僅是一個經典入門項目&#xff0c;更是理解網絡通信、嵌入式開發和物聯網交互的絕佳實踐。本文將詳細介紹如何通過WiFi和UDP協議&#xff0c;從零開始構建一…

主流攝像頭協議及其開源情況,GB/T 28181協議介紹

一、主流攝像頭協議及開源情況 1. RTSP&#xff08;Real Time Streaming Protocol&#xff09; 技術特性&#xff1a;基于TCP/UDP的實時流傳輸協議&#xff0c;支持雙向通信&#xff08;如暫停、播放控制&#xff09;。應用場景&#xff1a;攝像頭實時監控、視頻點播系統。開源…

「iOS」——RunLoop學習

底層學習iOS--RunLoop學習RunLoop的概念RunLoop與線程的關系RunLoop的結構ModeObserverTimerSourceRunLoop 執行流程RunLoop 的應用1.AutoreleasePool是什么時候釋放的2.觸控事件的響應3.刷新界面4.線程保活小知識mach Port**Toll-Free Bridging&#xff08;對象橋接&#xff0…

從零構建 Node20+pnpm+pm2 環境鏡像:基于 Dockerfile 的兩種方案及持久化配置指南

前言&#xff1a;在Node.js項目部署中&#xff0c;環境一致性和服務自動恢復是運維的核心需求。無論是本地開發還是生產部署&#xff0c;使用Docker封裝Node20、pnpm&#xff08;高效包管理&#xff09;和pm2&#xff08;進程守護&#xff09;環境&#xff0c;能避免“本地能跑…