1月7日,在2025年CES電子展現場,黃仁勛不僅展示了他全新的皮衣和采用Blackwell架構的RTX 50系列顯卡,更進一步展現了他對于機器人技術領域,特別是人形機器人和通用機器人技術的篤信。黃仁勛認為機器人即將迎來ChatGPT般的突破,有望成為世界上規模最大的技術產業。
我們知道,人形機器人的技術難度和門檻頗高,很多人認為人形機器人從走出實驗室到落地之路必然艱辛。但事實上,近兩年,隨著通用大模型的發展,人形機器人被賦予了強大的泛化能力,吸引了特斯拉、Open AI、英偉達、三星等科技巨頭紛紛布局。這些公司的入局不僅加速了人形機器人的技術落地,也推動了其商業化進程。
今天為大家分析的這份報告便對人形機器人的現狀、技術市場等進行了分析,深度剖析了構成人形機器人的執行系統、感知系統和控制系統。
2025,人形機器人元年
如今我們談及人形機器人似乎早習以為常,但是人形機器人真正的發展其實也只是進入21世紀之后的事情。在早期發展階段,人形機器人的研究主要集中在高校和科研機構。
1963年,NASA造出了一個名為“機動多關節假人”的機器人,能夠模擬35種基本人類動作,這也被認為是人形機器人的鼻祖之一。1973年,日本早稻田大學的加藤一郎團隊推出了世界上首個全尺寸人形智能機器人WABOT-1,這也啟發了諸多的文藝作品和后續研究。
而中國的人形機器人研究最早可能要追溯到1985年,哈爾濱工業大學首次開啟二足步行機器人的相關研究,這也標志著國內人形機器人探索的開啟。而進入新世紀以來,人形機器人的研究開始高度集成發展。2000年,本田推出了身高一米二、可用雙腳流暢直立行走的Asimo。2005年,本田對Asimo進行了升級改造,實現了人形機器人的奔跑,速度達到6km/h。這一時期,人形機器人在運動能力和智能化方面取得了顯著進步,但距離商業化應用仍有較大差距。
真正讓人形機器人走進普通人視野的,應該是2016年由波士頓動力打造的Atlas,其擁有運動平衡能力震驚世界。同年,540臺優必選Alpha機器人亮相央視春晚,這也展示了人形機器人在娛樂領域的應用潛力。而從2021年開始,人形機器人進入了商業化落地的初級階段。2021年8月,特斯拉在AI Day上首次發布人形機器人Optimus概念,并于2023年末發布Optimus-Gen2,在感知、大腦、運控能力方面有顯著提升。此外,國內如小米、華為等,國外的OpenAI、英偉達、三星等巨頭也在紛紛入局,全面推動人形機器人的商業化落地。
那么,為什么巨頭們會偏愛人形機器人呢?首先,人形意味著能夠很好地適應人類設計的工作和生活場景,無需改變現有設施。其次則是人形機器人在交互過程中更容易被人接受,具有更高的情感價值。但是,人形機器人的主要問題集中于成本和技術兩個方面的挑戰。例如,波士頓動力的Atlas和本田的Asimo成本均達到了百萬美元以上,且在軟件的適應性、交互能力、運控平衡能力,以及硬件的續航能力、執行器的精度和功率密度等方面仍有待提升。
那么為什么會判定2025年會是人形機器人元年呢?這主要是從技術發展、商業化落地和政策扶持三個角度所作出的判斷。首先,伴隨過去幾年通用大模型的發展,人形機器人被賦予了強大的泛化能力,使之能夠適應更多復雜場景,而且非專業人員無需編程即可實現操作,極大地推動了人形機器人的商業化進程。“具身智能”的機器人不再是機械式地完成單一任務,而是能夠基于感知到的任務和環境進行自主規劃、決策、行動和執行的新個體,語言交互、智能決策、自主學習、多模態感知等能力全面提升。
其次,科技巨頭的加速入局為人形機器人的發展注入動力。除了前文介紹的特斯拉外,OpenAI投資了挪威人形機器人公司1X Technologies,并重啟機器人團隊;英偉達發布了人形機器人大模型Project GR00T,成立通用具身智能體研究部門。巨頭開卷,必然會使這個行業成為“風口上的豬”。而且,人形機器人的應用場景也在從工廠逐步擴展到制造業、商業服務,最終有望進入家庭。報告中預估,至2030年全球人形機器人需求有望達200萬臺,對應市場空間超5700億元。
最后,政策層面的支持為人形機器人的發展鋪平了道路。2023年,工信部發布的《人形機器人創新發展指導意見》提出人形機器人有望成為繼計算機、智能手機、新能源汽車后的顛覆性產品,并明確了人形機器人2025年實現量產、2027年深度應用的發展目標。
人形機器人的技術組成
人形機器人的技術難點不僅僅是AI發展水平,還有大量的硬件系統和零部件等。從大的方向來看,人形機器人主要由執行系統、感知系統和控制系統三個部分構成,這部分在報告中占比較高且涉及大量的產業鏈相關信息,筆者僅對其中關鍵價值進行闡述,不做過多參數分析。
執行系統
執行系統是人形機器人的運動基礎,決定了其運動的靈活性和精度。其關鍵部件包括電機、絲杠、減速器、靈活手等。
- 無框力矩電機:主要用于人形機器人的線性關節和旋轉關節,提供高精度和高效率的運動控制,是實現復雜動作的關鍵部件。其能夠直接集成到轉軸元件上,降低系統慣量,提高運動和穩定時間,增加系統帶寬,從而提高整體效率。
- 減速器:精密減速器主要包括3種類型,RV減速器可以提供穩定的機械支撐,確保機器人在高負載下的精度和穩定性;諧波減速器適用于需要高精度控制的關節,提供精細的運動控制;行星減速器適用于需要較高承載能力的關節,確保機器人的穩定性和可靠性。
- 絲杠:人形機器人線性執行器的重要組成部分,是將旋轉運動變成直線運動的傳動附件。根據摩擦特性可分為滑動絲杠、滾動絲杠和靜壓絲杠三類。其中,行星滾柱式絲杠負載高、壽命長、速度大,更適用于人形機器人場景,只不過其生產工藝難度較大,門檻較高,但相應的未來發展空間也較為廣闊。
- 靈巧手:靈巧手是人形機器人的末端執行器,具備高精度、多功能性和良好的人機交互能力。通過微特電機和多種傳動方式的結合,靈巧手能夠執行復雜的任務,適應不同的工作場景。其關鍵技術包括空心杯電機、無刷有齒槽電機、線繩傳動、齒輪傳動、連桿傳動、差速器機構、機械自適應和微型絲杠等,這些技術共同確保了靈巧手的高性能和可靠性。靈巧手在工業制造、醫療領域、服務機器人和特種作業等場景中具有廣泛的應用前景。
感知系統
感知系統是人形機器人與環境交互的媒介,其核心就是各類傳感器,包括力矩傳感器、視覺傳感器、觸覺傳感器和編碼器等。
- 力矩傳感器:力矩傳感器用于檢測機器人關節上的扭矩,將扭力的物理變化轉化為精確的電信號,為機械臂提供實時的力和力矩信息,從而協助機械臂完成精細和智能的操作任務。在人形機器人中,在對柔順控制要求高的手腕和腳踝有望使用六維力矩傳感器,而身體的其他關節將使用單維的關節扭矩傳感器。相比之下,多維力矩傳感器工藝要求高且成本較高,但屬于未來的發展趨勢。
- 視覺傳感器:視覺感知系統是機器人的“智慧之眼”,賦予機器人觀察世界、規劃執行的能力,結合當前技術發展的多模態感知能力和AI算法,能夠實現環境理解、任務執行、安全和避障等功能,其也是人形機器人實現人機交互的關鍵。不過,由于不同傳感器在不同環境下的檢測能力和可靠性受到限制,因此多傳感器融合是當前發展的主要趨勢,其可以提高目標檢測和識別的準確性。
- 觸覺傳感器:能夠使機器人感知與外界環境接觸時的溫度、濕度、壓力和振動等物理量,以及目標物體材質的軟硬程度、物體形狀和結構大小等,從而實現對物體的精準定位以及執行各種操作任務。觸覺傳感器按照原理主要分為電容式、壓阻式、壓電式、磁敏式、光纖式,其中前三者更為常見,未來主要的發展趨勢為大陣列、柔性化、多功能化、多維度、自供電等是觸覺傳感器的重要發展趨勢。
- 編碼器:一種用于運動控制的傳感器,利用光電、電磁、電容或電感等感應原理檢測物體的機械位置及其變化,并將此信息轉換為電信號,再將電信號轉換為可傳輸和存儲的信號形式,最后反饋給各種運動控制裝置。伴隨著工業自動化的發展,編碼器未來的國產化占比有望進一步提升。
控制系統
主要是指運動控制系統,其主要充當了人形機器人的“小腦”職責,對機械運動部件的位置、速度、方向等進行實時控制,使其按照預期的運動軌跡和規定的運動參數進行運動。控制系統一般包括控制器、執行器和傳感器,其性能直接影響機器人的運動精度、穩定性和響應速度。
控制系統的控制器能夠接收操作指令后進行運動軌跡規劃,為電機或其他動力和執行裝置提供正確的控制信號;執行器和傳感器上文已經談及則不再贅述。一般來講,控制系統的難點在于通信、算力和軟件三個部分。
- 通信:眾多伺服關節需解決高速同步通信難點,走線要求高。
- 算力:計算復雜度隨著自由度的增加而顯著增加,算法也需要適應不同工作環境,對控制器的算力要求高。
- 軟件:控制系統需提供實時運行框架滿足不同運行周期的算法APP實時計算的要求。
機器人控制系統按照控制方式可分為集中控制、主從控制和分布式控制。人形機器人一般采用分布式控制,其通常有數十個關節自由度,而采用分布式控制有利于系統功能的并行執行、縮短響應時間,即每個關節配置一個控制器、胸腔配置總控制器,這也將大幅增加控制器需求。
站在2025年的開端總體來看,人形機器人在過去的幾年里有了長足的發展,尤其是大模型等技術的落地為人形機器人商業化鏈路的構建提供了更好的模板。而伴隨各大企業和政策扶持的加碼,人形機器人元年的大幕有望展開。