人形機器人的理想與現實

ba35f0febea347abb6750b65a9895b6a.jpeg

李開復曾提到過一個AI界流傳的“騙子又來了曲線”。?人會不斷給機器進行“是否具有人類智能”的鑒定,而這個過程,總是從被人工智能在某些領域的驚艷表現震撼,到逐漸認識到當時的人工智能還有各種局限,以至于產生巨大心理落差。

近來,人形具身智能機器人在WAIC世界人工智能大會上密集亮相,我們在現場所感受到的就是“人類要毀滅了”與“騙子又來了”,兩種聲音同時存在的復雜現象。

9135583da57b55678919040438887467.png

具體來說,認為“人類要毀滅了”,大多是不明覺厲的普通觀眾,而冷靜甚至不看好人形機器人的多為AI、機器人領域的業內人士。

比如獵豹移動董事長兼CEO、獵戶星空董事長傅盛就表示,“機器人在今年的展廳里是爆發了,但在日常生活當中,我們并沒有看到它在哪個地方被大規模用起來。機器人行業的產業爆發還遠遠沒有到來……對人形機器人的不看好一定會被時間證明”。

這兩種心態,究竟哪一種才代表人形機器人產業的真相呢?

其實并沒有什么真相。不同的心態,是由不同的判定標準而產生的。大眾、從業者和技術專家,都有一張“我心中的人形機器人”打分表,評價尺度各不相同。

而關于人形機器人的期待,在人形、大模型、具身三個標準上,大眾的預期、媒體的宣傳、產業的實際進展等都有比較大的分野。這構成了當前,人形機器人的理想與現實。

a568caa92fb74c09054a9f728cfed11c.png

“變形金剛”的理想與現實

“他們怎么不動啊,不表演有什么必要插電源?”

“插電亮著好看。”

本屆WAIC最吸睛的,就是中央展廳的“十八金剛”了。18個人形機器人同臺而立,幾乎每個參觀者都聚集在展臺前打卡拍照,在展臺旁邊,我聽到了這段對話。

大眾理想中,人形機器人就是變形金剛、機甲戰士那樣,走路又穩又快,行動靈活,隨意移動,無論是工廠上班、護理老人還是投遞包裹,都手拿把掐。

16cded617f81a26cb42af6730e568c43.png

但產業現實中,WAIC上的人形機器人大多數時間都待在展臺上,在特定時間表演一些拿蘋果、端杯子之類的手部動作,特斯拉的機器人甚至始終待在玻璃展柜中一動不動。和全場溜達的機器狗相比,人形機器人顯得“內向”很多。

由此可見,到底需不需要“雙足行走”,成了目前公眾和從業者對人形機器人,最大的認知差異。

總的來說,雙足人形機器人是“機器人的皇冠”,是終極方向,才是大眾期待的“變形金剛”。

但至少要走過三步:雙足行走、執行復雜任務、規模商用。

而目前,僅僅是第一步“雙足行走”,在技術和商業上都并不是最佳狀態。

一方面,穩定的行走,需要系統擁有極高的魯棒性。

機器人在面臨各種異常情況和輸入時,仍然能快速通過運動控制模塊調整姿態,保持正常運行。

要提升系統的魯棒性(或者說穩健性),依賴于機器人與人類、物理世界的真實交互,來積累高質量數據。如果遇到訓練環境中沒有出現過的問題,機器人就可能出現異常或“死機”,系統研發效率是比較低的。

05ebc530bc2c025568341d50aa9f7c8d.png

另外,商業上“雙足行走”也并不是剛需。

比如特斯拉、Figure等都宣布要讓人形機器人“進廠打工”,從事電池分揀等工作。但實際上,制造環節80%以上生產作業動作,其實很少用到下肢,用到軀干,主要是靠手來完成的。這種上肢為主的簡單系統,可以減少控制難度,降低投入成本,并且更容易規模化量產,因為只需要將最重要的一部分功能(手部)進行復制。一旦加上四肢、軀干,控制難度、續航、成本都會大幅提升。

所以,目前能夠規模化應用的機器人形態,都是以機器狗、機械手等單一、極簡形態。滿足大眾期待的“變形金剛”,要在邁過很多步之后,才能帶來極大產業效應。

幾年之內,我們應該都會更常在展臺和展柜中看見人形機器人,而非零距離互動。

大模型的理想與現實

02724cd284373686c4d978f051fe6f12.png

“現場機器人好多,我都感覺主題有點跑偏了”,一位計算領域的從業者對我說道。

智能機器人在人工智能大會上遍地開花,根本邏輯是——大模型為具身智能開啟了新的解決方案的大門

傳統的人工智能系統,受限于缺乏先驗知識,理解力與泛化能力捉襟見肘,導致機器人難以像人類一樣擁有基本的常識判斷能力,這嚴重制約了高級別具身智能的發展。機器人執行任務時,往往需要人類工程師將復雜指令拆解為一系列簡化的、程序化的步驟,再由機器人(如機械臂)逐一執行。顯然,這種“智能水平”并不算很高,還需要人來做大量的代碼和開發工作。

e400dee606a822bf2a0efc128ecfd27a.png

理想中,大模型會為人形機器人的“智能水平”,帶來顛覆性的變革。

大模型相較于傳統機器學習方法,擁有更加強大的泛化能力,可以為人形機器人的大量任務,比如復雜任務解析、流暢連續對話、零樣本推理等,提供全新的解決方案。

舉個例子,告訴人形機器人“我餓了”,它會自動分析這句話背后的需求,并拆解為可執行的具體動作,通過觀察物理環境,從冰箱里拿出一個蘋果給你吃,不需要人來拆分指令。

但現實中,大模型給人形機器人帶來的變革,仍然停留在初級的“自然語言交互”。

目前絕大多數人形機器人,更多是擁有了類ChatGPT的“嘴”。這種結合,雖然能提供更自然生動的交互體驗,但只是將現有的語音交互進行了升級,并非“端到端”任務執行能力的顛覆式突破。

90828cecd240fbd7f870219ec5cd3bdb.png

無需人工參與的高度自動化,為什么有了大模型也沒能快速實現呢?

究其根本,機器人是一個非常復雜的學科,涉及精密機械、自動控制、電氣電子、計算科學,最后呈現出一個非常復雜智能機電一體化系統。

從有監督機器學習到大語言模型,是計算領域的技術突破,可以在交互、規劃、決策等環節發揮作用。然而,從機械化到高度自動化,人形機器人的再進化,還需要感知技術、驅動與傳動技術、萬兆網絡等的技術和資源支持。

9bfc5b32c4aec1c44f6526d9796e2eaf.png

國產機器人崛起的理想與現實

“美國公司負責忽悠概念,中國公司負責讓機器人落地、商用,把價格打下來,讓人人實現機器人自由。”

此次WAIC大會,國產人形機器人的表現確實要比海外公司亮眼很多。無論是特斯拉、谷歌,在機器人的展示上都堪稱乏味。而國產人形機器人不僅批量化、大規模出現,而且展現出了在很多具體場景中的商用能力,比如做飯機器人、電信機器人、家政陪伴機器人等。

8f080cdc8b03061b3e4379ea341568bf.png

那么,這是不是意味著國產人形機器人廠商會很快崛起呢?

我們當然希望這一天能盡快實現,但目前來看現實還有不確定性。

數據層面,特斯拉、谷歌等科技巨頭,在自動駕駛領域有多年積累,可以將足夠多的空間數據喂給模型,解決人形機器人在復雜空間中的學習問題,從而更好地進行迭代學習。而在WAIC現場,我們看到的大多數國產人形機器人廠商的業務面還比較孤立,百度、商湯等數據積累面廣的AI公司,則更多聚焦在汽車形態的智能機器人。這意味著,解決人形機器人的數據問題,還有賴于產生生態化、產業化、多方共建的解決方案。

算法層面,類GPT-4o能力的國產多模態大模型還比較稀缺,這使得人形機器人通過視覺、音頻等多維度數據來識別地圖和復雜場景的能力,大大受到限制。目前,海外產學界已經在多模態大模型上系統性發力。比如OpenAI基于GPT-4o為Figure 01構建了一個具身智能AI模型,谷歌推出了多模態具身視覺語言模型PaLM-E。加州大學伯克利分校推出了LM Nav,來實現硬件本體、運動小腦、決策大腦三部分逐漸融合。目前來看,國產基礎大模型還有一段路要追趕。

7dbdfb0dd91e5d0512e2478a0d4d92c9.png

發展國產人形機器人產業,是一條難而正確的路。在這條路上,我們既不希望“騙子又來了”,也不希望“人類被毀滅了”。歷史告訴我們,技術發展過程中一定會經歷上升、頂峰、陷入低谷、攀升、穩定5個階段。

人形機器人產業要避免跌入低谷,持續發展,就要在理想與現實中,不斷校正自己的坐標,在每一個發展階段兌現實用價值。

2a2a34d5381ab5d1db1fb920d60640c2.gif

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/44768.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/44768.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/44768.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

html js 3d z軸移動 實現星空

用chatgpt還有kimi 讓實現動畫效果的星空,都太垃圾了 不是y軸移動,就是x軸移動, 我要z軸移動,他們就是搞不出來, ai寫代碼還有很長的路。 <!DOCTYPE html> <meta charset="utf-8" /> <head> <title>ai相關博客</title> </h…

【操作系統】手把手帶你搭建DNS服務器!

DNS服務器 DNS服務器指域名系統或者域名服務。域名系統為Internet上的主機分配域名地址和IP地址&#xff0c;用戶使用域名地址&#xff0c;該系統就會自動把域名地址轉為IP地址。域名服務是運行域名系統的Internet工具。執行域名服務的服務器稱之為DNS服務器&#xff0c;通過DN…

51單片機嵌入式開發:8、 STC89C52RC 操作LCD1602原理

STC89C52RC 操作LCD1602原理 1 LCD1602概述1.1 LCD1602介紹1.2 LCD1602引腳說明1.3 LCD1602指令介紹 2 LCD1602外圍電路2.1 LCD1602接線方法2.2 LCD1602電路原理 3 LCD1602軟件操作3.1 LCD1602顯示3.2 LCD1602 protues仿真 4 總結 1 LCD1602概述 1.1 LCD1602介紹 LCD1602是一種…

maven——(重要)手動創建,構建項目

創建項目 手動按照maven層級建好文件夾&#xff0c;并寫上java&#xff0c;測試代碼和pom文件 構建項目 在dos窗口中執行如下命令 compile編譯 當前maven倉庫中什么都沒有。 在pom所在層級下&#xff0c;執行&#xff1a; mvn compile 就開始顯示下面這些&#xff0c;…

數據庫-ubuntu環境下安裝配置mysql

文章目錄 什么是數據庫&#xff1f;一、ubuntu環境下安裝mysql二、配置mysql配置文件1.先登上root賬號2.配置文件的修改show engines \G; mysql和mysqld數據庫的基礎操作登錄mysql創建數據庫顯示當前數據庫使用數據庫創建表插入students表數據打印students表數據select * from …

前端使用Vue和Element實現可拖動彈框效果,且不影響底層元素操作,Cesium作為底圖(可拖拽的視頻實時播放彈框,底層元素可以正常操作)

簡述&#xff1a;在前端開發中&#xff0c;彈框和實時視頻播放是常見的需求。這里來簡單記錄一下&#xff0c;如何使用Vue.js和Element UI實現一個可拖動的彈框&#xff0c;并在其中播放實時視頻。同時&#xff0c;確保在拖拽彈框時&#xff0c;底層元素仍然可以操作。這里來記…

vue 畫二維碼及長按保存

需求 想要做如下圖的二維碼帶文字&#xff0c;且能夠長按保存 前期準備 一個canvas安裝qrcode&#xff08;命令&#xff1a;npm i qrcode&#xff09; 畫二維碼及文字 初始化畫布 <template><div><canvas ref"canvas" width"300" he…

JAVASE進階day07(泛型,集合,Set,TreeSet,枚舉,數據結構)

泛型 1.泛型的基本使用 限制集合存儲的數據類型 package com.lu.day07.generics;/*** 定義了一個泛型類* E 泛型通配字母(不固定代替真實數據類型A-Z都可以)* 常見的泛型通配字母:* E:element 元素* T:type 類型* R:return 返回值類型* K:key 鍵* …

14.爬蟲---Selenium 經典動態渲染工具的使用

14.Selenium 經典動態渲染工具的使用 1.查看chrome瀏覽器版本2.ChromeDriver 安裝3.Selenium 安裝4.驗證安裝5.基本用法5.1啟動瀏覽器5.2導航到頁面5.3查找元素5.3.1單個元素 find_element5.3.2多個元素 find_elements 5.4 執行操作5.5 動作鏈ActionChains5.6 執行 JavaScript …

Python基礎語法:運算符詳解(算術運算符、比較運算符、邏輯運算符、賦值運算符)②

文章目錄 Python中的運算符詳解一、算術運算符二、比較運算符三、邏輯運算符四、賦值運算符五、綜合示例結論 Python中的運算符詳解 在Python編程中&#xff0c;運算符用于執行各種操作&#xff0c;例如算術計算、比較、邏輯判斷和賦值。了解并掌握這些運算符的使用方法是編寫…

pychopper的安裝與使用

文章目錄 安裝使用 安裝 在Linux環境下使用conda安裝 通常習慣一個軟件一個虛擬環境&#xff1a; conda create -n pychopper -c nanoporetech -c conda-forge -c bioconda "nanoporetech::pychopper"使用 參考官方文檔&#xff1a; https://github.com/epi2me-la…

N-(4-Azido-2-nitrophenyl)-N‘‘-biotinylnorspemidine

?一、基本信息 常用名&#xff1a;N-(4-Azido-2-nitrophenyl)-N-biotinylnorspemidine 英文名&#xff1a;N-(4-Azido-2-nitrophenyl)-N-biotinylnorspemidine CAS號&#xff1a;786609-83-4 分子式&#xff1a;C22H33N9O4S 分子量&#xff1a;519.62 二、結構特點 該化…

SQL職場必備:掌握數據庫技能提升職場競爭力

&#x1f482; 個人網站:【 摸魚游戲】【網址導航】【神級代碼資源網站】&#x1f91f; 一站式輕松構建小程序、Web網站、移動應用&#xff1a;&#x1f449;注冊地址&#x1f91f; 基于Web端打造的&#xff1a;&#x1f449;輕量化工具創作平臺&#x1f485; 想尋找共同學習交…

vue3 + tsx 表格 Action 單獨封裝組件用法

前言 先上圖看右側列 action 的 UI 效果&#xff1a; 正常來說&#xff0c;如果一個表格的附帶 action 操作&#xff0c;我們一般會放在最右側的列里面實現&#xff0c;這個時候有些UI 框架支持在 SFC 模板里面定義額外的 solt&#xff0c;當然如果不支持&#xff0c;更通用的…

【網絡】SCTP協議概念

SCTP協議 SCTP&#xff08;Stream Control Transmission Protocol&#xff09;是一種傳輸層協議&#xff0c;設計用于提供可靠的數據傳輸服務&#xff0c;同時具備一些類似UDP&#xff08;User Datagram Protocol&#xff09;的屬性。以下是SCTP協議的基本概念、優缺點以及與T…

Linux進行vi編譯代碼出現“E45: ‘readonly‘ option is set (add ! to override)”(完美解決)。

用vi修改文件&#xff0c;保存文件時&#xff0c;提示沒有修改該文件的權限“E45: ‘readonly’ option is set (add ! to override)”的解決方法。 E45: ‘readonly’ option is set (add ! to override) 如果您遇到了“當前用戶沒有權限對文件作修改”的錯誤 1. 檢查文件…

2024.7.11最新版IDM破解,操作簡單

前言 IDM的強勁對手&#xff0c;100%免費&#xff0c;如果破解IDM失敗&#xff0c;推薦使用FDM&#xff0c;下載地址&#xff1a;Free Download Manager 破解步驟 打開PowerShell&#xff0c;非CMD 在左下角開始菜單右鍵點擊后選擇PowerShell&#xff0c;注意不是打開CMD。…

園林類專刊《花卉》簡介及投稿郵箱

園林類專刊《花卉》簡介及投稿郵箱 《花卉》雜志是經國家新聞出版總署批準&#xff0c;廣東省農業科學院主管&#xff0c;廣東省農業科學院環境園藝研究所主辦&#xff0c;面向國內外公開發行林業系統專業期刊&#xff0c;是全國從事林業、園林、生態、環保、旅游、自然資源、…

CentOS7安裝部署git和gitlab

安裝Git 在Linux系統中是需要編譯源碼的&#xff0c;首先下載所需要的依賴&#xff1a; yum install -y curl-devel expat-devel gettext-devel openssl-devel zlib-devel gcc perl-ExtUtils-MakeMaker方法一 下載&#xff1a; wget https://mirrors.edge.kernel.org/pub/s…

【文檔+源碼+調試講解】冷凍倉儲管理系統

摘 要 隨著互聯網時代的到來&#xff0c;同時計算機網絡技術高速發展&#xff0c;網絡管理運用也變得越來越廣泛。因此&#xff0c;建立一個B/S結構的冷凍倉儲管理系統&#xff0c;會使冷凍倉儲管理系統工作系統化、規范化&#xff0c;也會提高冷凍倉儲管理系統平臺形象&#x…