走出實驗室的人形機器人,將復刻ChatGPT之路?

1月7日,在2025年CES電子展現場,黃仁勛不僅展示了他全新的皮衣和采用Blackwell架構的RTX 50系列顯卡,更進一步展現了他對于機器人技術領域,特別是人形機器人和通用機器人技術的篤信。黃仁勛認為機器人即將迎來ChatGPT般的突破,有望成為世界上規模最大的技術產業。

我們知道,人形機器人的技術難度和門檻頗高,很多人認為人形機器人從走出實驗室到落地之路必然艱辛。但事實上,近兩年,隨著通用大模型的發展,人形機器人被賦予了強大的泛化能力,吸引了特斯拉、Open AI、英偉達、三星等科技巨頭紛紛布局。這些公司的入局不僅加速了人形機器人的技術落地,也推動了其商業化進程。

今天為大家分析的這份報告便對人形機器人的現狀、技術市場等進行了分析,深度剖析了構成人形機器人的執行系統、感知系統和控制系統。

2025,人形機器人元年

如今我們談及人形機器人似乎早習以為常,但是人形機器人真正的發展其實也只是進入21世紀之后的事情。在早期發展階段,人形機器人的研究主要集中在高校和科研機構。

1963年,NASA造出了一個名為“機動多關節假人”的機器人,能夠模擬35種基本人類動作,這也被認為是人形機器人的鼻祖之一。1973年,日本早稻田大學的加藤一郎團隊推出了世界上首個全尺寸人形智能機器人WABOT-1,這也啟發了諸多的文藝作品和后續研究。

而中國的人形機器人研究最早可能要追溯到1985年,哈爾濱工業大學首次開啟二足步行機器人的相關研究,這也標志著國內人形機器人探索的開啟。而進入新世紀以來,人形機器人的研究開始高度集成發展。2000年,本田推出了身高一米二、可用雙腳流暢直立行走的Asimo。2005年,本田對Asimo進行了升級改造,實現了人形機器人的奔跑,速度達到6km/h。這一時期,人形機器人在運動能力和智能化方面取得了顯著進步,但距離商業化應用仍有較大差距。

真正讓人形機器人走進普通人視野的,應該是2016年由波士頓動力打造的Atlas,其擁有運動平衡能力震驚世界。同年,540臺優必選Alpha機器人亮相央視春晚,這也展示了人形機器人在娛樂領域的應用潛力。而從2021年開始,人形機器人進入了商業化落地的初級階段。2021年8月,特斯拉在AI Day上首次發布人形機器人Optimus概念,并于2023年末發布Optimus-Gen2,在感知、大腦、運控能力方面有顯著提升。此外,國內如小米、華為等,國外的OpenAI、英偉達、三星等巨頭也在紛紛入局,全面推動人形機器人的商業化落地。

那么,為什么巨頭們會偏愛人形機器人呢?首先,人形意味著能夠很好地適應人類設計的工作和生活場景,無需改變現有設施。其次則是人形機器人在交互過程中更容易被人接受,具有更高的情感價值。但是,人形機器人的主要問題集中于成本和技術兩個方面的挑戰。例如,波士頓動力的Atlas和本田的Asimo成本均達到了百萬美元以上,且在軟件的適應性、交互能力、運控平衡能力,以及硬件的續航能力、執行器的精度和功率密度等方面仍有待提升。

那么為什么會判定2025年會是人形機器人元年呢?這主要是從技術發展、商業化落地和政策扶持三個角度所作出的判斷。首先,伴隨過去幾年通用大模型的發展,人形機器人被賦予了強大的泛化能力,使之能夠適應更多復雜場景,而且非專業人員無需編程即可實現操作,極大地推動了人形機器人的商業化進程。“具身智能”的機器人不再是機械式地完成單一任務,而是能夠基于感知到的任務和環境進行自主規劃、決策、行動和執行的新個體,語言交互、智能決策、自主學習、多模態感知等能力全面提升。

其次,科技巨頭的加速入局為人形機器人的發展注入動力。除了前文介紹的特斯拉外,OpenAI投資了挪威人形機器人公司1X Technologies,并重啟機器人團隊;英偉達發布了人形機器人大模型Project GR00T,成立通用具身智能體研究部門。巨頭開卷,必然會使這個行業成為“風口上的豬”。而且,人形機器人的應用場景也在從工廠逐步擴展到制造業、商業服務,最終有望進入家庭。報告中預估,至2030年全球人形機器人需求有望達200萬臺,對應市場空間超5700億元。

最后,政策層面的支持為人形機器人的發展鋪平了道路。2023年,工信部發布的《人形機器人創新發展指導意見》提出人形機器人有望成為繼計算機、智能手機、新能源汽車后的顛覆性產品,并明確了人形機器人2025年實現量產、2027年深度應用的發展目標。

人形機器人的技術組成

人形機器人的技術難點不僅僅是AI發展水平,還有大量的硬件系統和零部件等。從大的方向來看,人形機器人主要由執行系統、感知系統和控制系統三個部分構成,這部分在報告中占比較高且涉及大量的產業鏈相關信息,筆者僅對其中關鍵價值進行闡述,不做過多參數分析。

執行系統

執行系統是人形機器人的運動基礎,決定了其運動的靈活性和精度。其關鍵部件包括電機、絲杠、減速器、靈活手等。

  • 無框力矩電機:主要用于人形機器人的線性關節和旋轉關節,提供高精度和高效率的運動控制,是實現復雜動作的關鍵部件。其能夠直接集成到轉軸元件上,降低系統慣量,提高運動和穩定時間,增加系統帶寬,從而提高整體效率。
  • 減速器:精密減速器主要包括3種類型,RV減速器可以提供穩定的機械支撐,確保機器人在高負載下的精度和穩定性;諧波減速器適用于需要高精度控制的關節,提供精細的運動控制;行星減速器適用于需要較高承載能力的關節,確保機器人的穩定性和可靠性。
  • 絲杠:人形機器人線性執行器的重要組成部分,是將旋轉運動變成直線運動的傳動附件。根據摩擦特性可分為滑動絲杠、滾動絲杠和靜壓絲杠三類。其中,行星滾柱式絲杠負載高、壽命長、速度大,更適用于人形機器人場景,只不過其生產工藝難度較大,門檻較高,但相應的未來發展空間也較為廣闊。
  • 靈巧手:靈巧手是人形機器人的末端執行器,具備高精度、多功能性和良好的人機交互能力。通過微特電機和多種傳動方式的結合,靈巧手能夠執行復雜的任務,適應不同的工作場景。其關鍵技術包括空心杯電機、無刷有齒槽電機、線繩傳動、齒輪傳動、連桿傳動、差速器機構、機械自適應和微型絲杠等,這些技術共同確保了靈巧手的高性能和可靠性。靈巧手在工業制造、醫療領域、服務機器人和特種作業等場景中具有廣泛的應用前景。

感知系統

感知系統是人形機器人與環境交互的媒介,其核心就是各類傳感器,包括力矩傳感器、視覺傳感器、觸覺傳感器和編碼器等。

  • 力矩傳感器:力矩傳感器用于檢測機器人關節上的扭矩,將扭力的物理變化轉化為精確的電信號,為機械臂提供實時的力和力矩信息,從而協助機械臂完成精細和智能的操作任務。在人形機器人中,在對柔順控制要求高的手腕和腳踝有望使用六維力矩傳感器,而身體的其他關節將使用單維的關節扭矩傳感器。相比之下,多維力矩傳感器工藝要求高且成本較高,但屬于未來的發展趨勢。
  • 視覺傳感器:視覺感知系統是機器人的“智慧之眼”,賦予機器人觀察世界、規劃執行的能力,結合當前技術發展的多模態感知能力和AI算法,能夠實現環境理解、任務執行、安全和避障等功能,其也是人形機器人實現人機交互的關鍵。不過,由于不同傳感器在不同環境下的檢測能力和可靠性受到限制,因此多傳感器融合是當前發展的主要趨勢,其可以提高目標檢測和識別的準確性。
  • 觸覺傳感器:能夠使機器人感知與外界環境接觸時的溫度、濕度、壓力和振動等物理量,以及目標物體材質的軟硬程度、物體形狀和結構大小等,從而實現對物體的精準定位以及執行各種操作任務。觸覺傳感器按照原理主要分為電容式、壓阻式、壓電式、磁敏式、光纖式,其中前三者更為常見,未來主要的發展趨勢為大陣列、柔性化、多功能化、多維度、自供電等是觸覺傳感器的重要發展趨勢。
  • 編碼器:一種用于運動控制的傳感器,利用光電、電磁、電容或電感等感應原理檢測物體的機械位置及其變化,并將此信息轉換為電信號,再將電信號轉換為可傳輸和存儲的信號形式,最后反饋給各種運動控制裝置。伴隨著工業自動化的發展,編碼器未來的國產化占比有望進一步提升。

控制系統

主要是指運動控制系統,其主要充當了人形機器人的“小腦”職責,對機械運動部件的位置、速度、方向等進行實時控制,使其按照預期的運動軌跡和規定的運動參數進行運動。控制系統一般包括控制器、執行器和傳感器,其性能直接影響機器人的運動精度、穩定性和響應速度。

控制系統的控制器能夠接收操作指令后進行運動軌跡規劃,為電機或其他動力和執行裝置提供正確的控制信號;執行器和傳感器上文已經談及則不再贅述。一般來講,控制系統的難點在于通信、算力和軟件三個部分。

  • 通信:眾多伺服關節需解決高速同步通信難點,走線要求高。
  • 算力:計算復雜度隨著自由度的增加而顯著增加,算法也需要適應不同工作環境,對控制器的算力要求高。
  • 軟件:控制系統需提供實時運行框架滿足不同運行周期的算法APP實時計算的要求。

機器人控制系統按照控制方式可分為集中控制、主從控制和分布式控制人形機器人一般采用分布式控制,其通常有數十個關節自由度,而采用分布式控制有利于系統功能的并行執行、縮短響應時間,即每個關節配置一個控制器、胸腔配置總控制器,這也將大幅增加控制器需求。

站在2025年的開端總體來看,人形機器人在過去的幾年里有了長足的發展,尤其是大模型等技術的落地為人形機器人商業化鏈路的構建提供了更好的模板。而伴隨各大企業和政策扶持的加碼,人形機器人元年的大幕有望展開。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/66085.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/66085.shtml
英文地址,請注明出處:http://en.pswp.cn/web/66085.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

EF Core執行原生SQL語句

目錄 EFCore執行非查詢原生SQL語句 為什么要寫原生SQL語句 執行非查詢SQL語句 有SQL注入漏洞 ExecuteSqlInterpolatedAsync 其他方法 執行實體相關查詢原生SQL語句 FromSqlInterpolated 局限性 執行任意原生SQL查詢語句 什么時候用ADO.NET 執行任意SQL Dapper 總…

Java中網絡編程的學習

目錄 網絡編程概述 網絡模型 網絡通信三要素: IP 端口號 通信協議 IP地址(Internet Protocol Address) 端口號 網絡通信協議 TCP 三次握手 四次揮手 UDP TCP編程 客戶端Socket的工作過程包含以下四個基本的步驟: 服務器程序…

HarmonyOS NEXT開發進階(七):頁面跳轉

文章目錄 一、前言二、頁面跳轉三、頁面返回四、頁面返回前增加確認對話框4.1 系統的默認詢問框4.2 自定義詢問框 五、拓展閱讀 一、前言 APP開發過程中,多頁面跳轉場景十分常見,例如,登錄 -> 首頁 -> 個人中心。在鴻蒙開發中&#xf…

【Python】第一彈---解鎖編程新世界:深入理解計算機基礎與Python入門指南

?個人主頁: 熬夜學編程的小林 💗系列專欄: 【C語言詳解】 【數據結構詳解】【C詳解】【Linux系統編程】【MySQL】【Python】 目錄 1、計算機基礎概念 1.1、什么是計算機 1.2、什么是編程 1.3、編程語言有哪些 2、Python 背景知識 2.…

LeetCode:131. 分割回文串

跟著carl學算法,本系列博客僅做個人記錄,建議大家都去看carl本人的博客,寫的真的很好的! 代碼隨想錄 LeetCode:131. 分割回文串 給你一個字符串 s,請你將 s 分割成一些子串,使每個子串都是回文串。返回 s 所…

優化神馬關鍵詞排名原理(優化神馬搜索引擎關鍵詞排名規則)

優化神馬(即百度)關鍵詞排名的原理主要基于搜索引擎的算法和用戶體驗的考量。以下是一些關鍵的優化原理: 一、搜索引擎算法 網頁重要性評估: 搜索引擎通過復雜的算法評估網頁的重要性和權威性,如基于PageRank的評估方…

學習threejs,使用FlyControls相機控制器

👨??? 主頁: gis分享者 👨??? 感謝各位大佬 點贊👍 收藏? 留言📝 加關注?! 👨??? 收錄于專欄:threejs gis工程師 文章目錄 一、🍀前言1.1 ??THREE.FlyControls 相機控制…

Vue 3前端與Python(Django)后端接口簡單示例

項目 后端(Django)前端(Vue 3) 后端(Django) 創建Django項目和應用: 確保你已經安裝了Django。如果沒有安裝,可以使用以下命令安裝: pip install django創建一個新的Dja…

MCP Server開發的入門教程(python和pip)

使用python技術棧開發的簡單mcp server 需要安裝 MCP server的需要使用python-sdk,python需要 3.10,安裝如下 pip install mcpPS: MCP官方使用的是uv包管理工具,我平時使用pip比較多,所以文中以pip為主。因為mcp的一些依賴包版本并不是最新的,所以最好弄一個干凈的環境…

Spark vs Flink分布式數據處理框架的全面對比與應用場景解析

1. 引言 1.1 什么是分布式數據處理框架 隨著數據量的快速增長,傳統的單機處理方式已經無法滿足現代數據處理需求。分布式數據處理框架應運而生,它通過將數據分片分布到多臺服務器上并行處理,提高了任務的處理速度和效率。 分布式數據處理框…

隱私計算,構建安全的未來數據空間

大數據產業創新服務媒體 ——聚焦數據 改變商業 在醫療領域,不同醫院之間需要共享患者數據,以提供更全面準確的診斷和治療方案。 傳統的數據處理方式通常是數據經過轉換隱藏重要數據后再進行分析,雖然可以保護數據隱私,但在數據源…

PID控制器 (Proportional-Integral-Derivative Controller) 算法詳解及案例分析

PID控制器 (Proportional-Integral-Derivative Controller) 算法詳解及案例分析 目錄 PID控制器 (Proportional-Integral-Derivative Controller) 算法詳解及案例分析1. 引言2. PID控制器的基本概念2.1 PID控制器的定義2.2 PID控制器的核心思想2.3 PID控制器的應用領域3. PID控…

rtthread學習筆記系列(3) -- FINSH模塊

文章目錄 3. FINSH模塊3.1MSH3.1.1初始化3.1.1.1FSymtab段3.1.1.2 宏 3.1.2遍歷FINSH命令3.1.3TAB補全實現3.1.3.1 msh_auto_complete3.1.3.2 msh_opt_auto_complete 3.1.4 TAB 子選項自動補全 3.2 SHELL3.2.1 finsh_system_init分配finsh結構體使用內存3.2.2 finsh_thread_ent…

Redis 知識速覽

文章目錄 1. Redis 簡介2. Redis 優缺點3. Redis 高性能4. Redis VM 機制5. Redis 數據類型6. 應用場景7. 持久化8. 過期策略9. 內存相關10. 線程模型11. 事務12. 集群 1. Redis 簡介 定義:Redis 是一個用 C 語言編寫的高性能非關系型(NoSQL&#xff09…

nginx-lua緩存機制

一. 簡述: 緩存是一個大型系統中非常重要的一個組成部分。在硬件層面,大部分的計算機硬件都會用緩存來提高速度,比如CPU會有多級緩存、RAID卡也有讀寫緩存。在軟件層面,我們用的數據庫就是一個緩存設計非常好的例子,在…

Java 面試中的高頻算法題詳解

💖 歡迎來到我的博客! 非常高興能在這里與您相遇。在這里,您不僅能獲得有趣的技術分享,還能感受到輕松愉快的氛圍。無論您是編程新手,還是資深開發者,都能在這里找到屬于您的知識寶藏,學習和成長…

【Python項目】手寫數字識別系統

【Python項目】手寫數字識別系統 技術簡介:采用Python技術、Django框架、MYSQL數據庫等實現。 系統簡介:手寫數字識別系統主要的功能有手寫字識別、手寫字管理、修改密碼、個人信息和用戶管理。 背景: 在當今這個飛速發展的時代,…

Springboot + vue 小區物業管理系統

🥂(???)您的點贊👍?評論📝?收藏?是作者創作的最大動力🤞 💖📕🎉🔥 支持我:點贊👍收藏??留言📝歡迎留言討論 🔥🔥&…

空指針:HttpSession異常,SpringBoot集成WebSocket

異常可能性: 404 : 請檢查攔截器是否將請求攔截WebSocket握手期間HttpSession為空 HttpSession為空 方法一 : 網上參考大量的文檔,有說跟前端請求域名有關系的。 反正對我來說,沒啥用無法連接。 需使用 localhost&a…