8月9日,在世界機器人大會的演講臺上,宇樹科技創始人王興興談論到目前機器人運動控制領域存在的RL Scaling Law問題,他認為現在的機器人在學習一項新的技能時,往往都是需要從頭開始研究以及教學。
而在未來更加希望的是能夠在原有的基礎上去不斷學習,使得他們的學習速度更加快速以及效果更好。
整個具身智能行業在目前并沒有人將強化學習的Scaling Law做好,所研究的算力增長、數據堆積,并不能直接讓機械手臂變得更加靈巧,或者讓雙足的機器人走得更穩。
事實上,問題并不在于我們所提供的硬件、數據不夠好,而是其“大腦進化”以及環境不斷適應,那么,面對具身智能Scaling Law缺失,我們是否應該如同嬰兒時的教學,讓其不斷嘗試,具備真正不斷演化的能力,促使機器人界的"摩爾定律"誕生?
算力增長≠智能進化:具身智能的物理瓶頸困局
在目前的人工智能領域,我們逐漸認為當我們提供了更多的數據以及算力時,就能夠支撐機器人擁有更聰明的能力。
例如,ChatGPT的發展似乎印證了這一點——給它更大的模型、更多的訓練文本,它就能寫出更流暢的文章,解答更復雜的問題。
我們可以知道在虛擬ai領域,數據是單一的,規則是明確的,所以增加算力和數據就能夠去提升虛擬ai的性能。
但當這樣的方式放到機器人的身上,在它與現實世界交互的時候,我們發現其真實效果往往就會受到不同材質的摩擦、空氣阻力、物體形變等產生隨機性影響,比如,運行中會被一些障礙物絆倒等。
哈佛大學的"機器螞蟻"實驗生動地展示了這個困境。研究人員給這個小機器人增加了10倍的運算能力,期待它能更好地適應復雜地形。
但結果令人失望:它的環境適應能力只提升了微不足道的2%。問題不在于芯片不夠強,而在于螞蟻的機械腿無法像真實昆蟲那樣靈敏地感知和適應地面變化。
所以,現實世界中無數的物理特性就讓機器人在運行出現了無數個"意外狀況"。
并且,如今機器人在學習新的技能以及適應新環境時,其芯片總是會需要較大的能耗。
這并不是通過技術的不斷進化,從而減少能耗的消耗量能夠解決的問題,而是應該去面對根本性的缺陷:機器人還在用"蠻力計算"來對抗物理法則。
這樣的困境揭示了一個深刻的事實:在機器人領域,單純的算力增長就像給汽車裝了強勁的引擎,卻忘了我們所要前行的道路是崎嶇、坑洼的道路,它是否能夠實時應對路況呢?
我們更加希望的是其能夠像人類的生物系統一樣,總是在原有的基礎之上不斷進化,去面臨并解決受物理世界制約的困境。
達爾文式進化:具身智能的身體適應智慧
真正智能的關鍵并不是在于它的“大腦”學習的東西是不是足夠多,就比如在自然界中,章魚沒有脊椎動物那樣集中的大腦,它的5億神經元分布在觸手中,卻能讓八條腕足各自獨立抓取、探測甚至"思考"。
然而,這樣的生物所體現的行為是不同于機器人的集中依靠數據驅動的“大腦”智能模式,而是將身體本身也作為計算的一部分。
過去,機器人和AI的進步主要靠堆算力和數據,就像不斷給計算機提供大量的知識,希望它變得更加聰明。
但事實上的現實智能發展,無論是人類嬰兒學步,還是動物的精準捕獵,都依賴著我們的身體與環境的實時互動。
所以我們更加需要它的身體有著的自己適應能力——就像人類肌肉會在出現突發狀況時,主動產生一定的行為。
然而機器人需要適應的是未在提前預設的情況下,根據指令以及環境變換,提供不同的狀態和行為。
正如,王興興所提及希望當機器人處于一個新的環境時,能夠主動去探索一些事物,來滿足我們所提供的指令,而不是我們將一些具體的數據提供給它,只需要照做就行。
未來的突破點可能在于其“身體”和“大腦”的像自然生物一樣共同進化,算法不再需要為每個細微的環境狀況進行不斷地訓練,而是像生物那樣在互動中自然調整。
這條路雖然艱難,但自然界的進化史當中已經證明其可行性。從單細胞生物到人類,生命進化或許給我們提供了較優方向。
未來的機器人或許需要向生物學習,發展出與物理世界和諧共處的"身體智能"。
真正的突破,不是建造更精密的機械臂,而是創造出更加具有生命力的機器人。
重塑衡量標準:具身智能需要擁抱"生存力"
對于具身智能來說,真正的考驗從來不是重復完成某個固定任務,而是在變化中保持穩定。
目前的機器人缺乏真正的抗干擾智慧——不是避免犯錯,而是犯錯后快速修正的本事。
我們總是笑著現在的機器人有著些許笨拙的行為,甚至對于它們的動作稱之為“老太行為”,但對于這樣還需不斷進化的具身智能來說,應該把"容錯率"變成衡量智能的新尺度。畢竟在真實世界里,穩定比精準更重要。
像在孩童時期,當我們拿起保溫杯時,不需要重新學習"抓握"這個動作——我們知道它和馬克杯一樣都是圓柱形容器,只需微調力度,就能夠同樣的拿起這個東西。
但今天的機器人完美掌握馬克杯后,面對保溫杯時又要從零開始訓練。問題不在于它不夠"聰明",而在于它缺乏對"杯子"這個概念的真正理解。
這種"泛化能力"的缺失,暴露了當前機器人學習的核心缺陷:它們通過海量數據只能記住對于這個特定物體的抓取方式,卻無法抽象出通用規律。
真正的突破可能需要讓機器人像孩子一樣,先理解"抓握"的本質(形狀、重量、摩擦力之間的關系),而不是死記硬背每個物體的數據。
當測評標準轉向"生命力"而非"精準度",具身智能才能突破現在的天花板,邁向真正的實用化。
參考資料:
1。杭州ai之都— —王興興“炸裂”發言:機器人的ChatGPT時刻 即將到來丨王興興在2025世界機器人大會演講實錄(文字+視頻)
2. 機器之心— —?機器人邁向ChatGPT時刻!清華團隊首次發現具身智能Scaling Laws