?數據智能產業創新服務媒體
——聚焦數智?· 改變商業
在6月的世界人工智能大會上,馬斯克在致辭中宣稱,到2023年底,特斯拉便可實現L4級或L5級的完全自動駕駛(FSD)。兩個月之后,馬斯克又在X社交平臺上發言:特斯拉正在攻關車輛控制技術,完成FSD人工智能的最后一塊拼圖。
這意味著,在絕大多數廠商集中攻關L2級、L3級自動駕駛之際,特斯拉直接跳過L3級,直達L4級、L5級的技術終局。馬斯克的一系列發言,震驚了汽車業界。
特斯拉的進展,讓BEV+Transformer算法的技術路線,逐漸成為業界的主流。中國的蔚小理+華為緊隨其后,在城市NOA取得突破。城市NOA是高階自動駕駛的蝶變,已接近L3級自動駕駛。2023年又被稱為城市NOA元年。
在城市NOA火爆之際,國內的L4級自動駕駛,也在取得突破。就在7月,北京亦莊、上海嘉定先后批準了自動駕駛“車內無人”的相關試點。
通向自動駕駛之路,是一次道阻且長的遠征。正當智能輔助駕駛進入下半場之際,數據猿邀請利氪科技合伙人兼副總裁文亮、火山引擎智駕云負責人張路、焱融科技分布式存儲架構師馬志剛舉行一場直播對話,直面自動駕駛的問題和解法,展望自動駕駛的未來,獻上一場思維碰撞的盛宴。
以下為完整直播回放:
分級正在淡化,業界更關心落地場景
《汽車駕駛自動化分級》國家標準將自動駕駛劃分為L0-L5六個等級標準:L0是純人工駕駛,L1是駕駛自動化,L2是輔助駕駛,L3是自動輔助駕駛,L4是自動駕駛,L5是無人駕駛。
在行業發展趨勢上,隨著自動泊車、高速巡航、城市NOA等自動駕駛功能走向普及,業界關注的重心已從熱衷追求自動駕駛等級,轉向具體場景落地。
利氪科技的文亮說,自動駕駛等級由國際性汽車工程師研究會(SAE)明確提出,目的是展示從“人駕”到“人機共駕”最后到“機器駕”的演變過程。但在具體實踐中,從L0級-L5級的劃分正慢慢淡化,業界更關注自動駕駛的落地場景。落地場景,有泊車場景,有高速場景,有城市場景,業界根據這些場景劃分功能,部署落地,更多是從客戶體驗出發,以客戶的最終感受為主。
火山引擎的張路說,自動駕駛業界正圍繞城市NOA等點狀功能在布局,對L0級-L5級別的劃分并不在意。在張路看來,乘用車最終賣給消費者,消費者關注什么,企業就應當做什么。消費者不在乎自動駕駛等級,更關注的是具體的功能。通過“堆硬件”方式追求L3級、L4級自動駕駛的一些公司發現,消費者對此根本不會埋單。因此,“堆”硬件的方式在業界早已過時,行業的重心是圍繞點狀功能展開布局,滿足消費者的需求。商用車的自動駕駛,則更關心商業閉環能不能成功,對自動駕駛等級的劃分,也不在意。
焱融科技的馬志剛也認為,自動駕駛的最終落地,離不開具體的場景。在他看來,自動駕駛的普及要最終落到“點”上,也就是落到駕駛安全、用戶體感這些“點”上。對于自動駕駛,安不安全、好不好用,才是最關鍵之處。
純視覺還是雷達,要看產品本身的表現
場景化,是自動駕駛的未來。為實現場景化的自動駕駛,各大廠商提出了不同的技術路線。純視覺方案pk激光雷達的技術路線之爭,正是自動駕駛領域的一大看點。
在火山引擎的張路看來,特斯拉BEV+Transformer算法的技術標準已經跑通,在美國,特斯拉很快就可以實現FSD。在這個背景下,國內廠商的技術路線已經趨同,不同的只是推進速度的快慢。據張路介紹,以蔚小理為代表的造車新勢力技術路線已十分明確,就是BEV+Transformer路線,解決方案上視覺為主,雷達為輔。
對于視覺和雷達之爭,利氪的文亮說,其實對于用不用雷達,特斯拉也糾結了許久。對于自動駕駛而言,從安全上考慮,感知工具越多越好,但要落地量產,就一定要有一個取舍。特斯拉的純視覺方案,目前來看似乎代表了一個方向,但從長遠來看,用激光雷達還是用純視覺方案,還要看產品本身的表現。在文亮看來,即便特斯拉的純視覺方案取得了成功,激光雷達、毫米波雷達也不會被徹底淘汰,仍會沿著既定的技術路線走向去。或許在將來的某個時間點,激光雷達也會出現新的技術突破。
焱融的馬志剛更為傾向視覺+雷達的組合式方案。在馬志剛看來,每一種探測手段,都有自己的局限性。之所以自動駕駛至今還不夠完美,主要是數據感知、數據處理、數據治理的閉環尚未完善。自動駕駛的現狀是,從數據的感知,到中間的決策,再到最后的執行,越往后反而越成熟。前端的感知,是數據的入口,其實最難。馬志剛介紹說,從實踐上看,攝像頭、雷達其實各有所長。焱融服務的商用車、乘用車客戶,大多采用組合式方案,而焱融也更擅長處理混合型數據。
巨額數據成本,企業不得不面對的難題
無論是純視覺方案,還是視覺+雷達的組合式方案,數據都是自動駕駛的靈魂。沒有數據建設、數據處理、數據治理,自動駕駛也就無從談起。
在馬志剛看來,數據的建設、數據的閉環處理,其實有一定的門檻。對自動駕駛企業而言,數據量基本都呈指數級膨脹。數據量的增長,使得算法越來越復雜。自動駕駛的研發過程,是一個升級打怪的過程,會越來越難。居高不下的數據管理成本,是企業不得不面對的現實問題。
火山引擎的張路說,對自動駕駛企業來說,目前兩塊成本最大,一塊是數據管理,一塊是模型訓練。在數據管理方面,自動駕駛企業處理的數據,已達到幾十、上百PB的量級,每年消耗上億的成本。怎么挖掘海量數據的價值,一直是行業的難點。
在模型訓練方面,在大模型成熟之前,數據標注也需要配備大量的人力,消耗大量的成本。有一種說法是,對自動駕駛而言,有多少人工,就有多少智能。另一方面,Transformer算法也是未來通用人工智能領域一個繞不開的算法。大模型對GPU的需求十分大,不少自動駕駛公司每年都是上億的投入在模型訓練里邊。
張路說,作為字節跳動旗下的云計算公司,火山引擎將在數據處理、模型訓練方面提供解決方案,為客戶降本增效。
據張路介紹,火山引擎復用了抖音處理非結構化視頻的能力,抖音在數據挖掘上沉淀的能力,正好跟自動駕駛行業相匹配。
只有形成商業閉環,Robotaxi才可走下去
在海量數據?+ 人工智能算法的基礎上,自動駕駛逐漸由夢想變成現實。在國內,多家公司的Robotaxi產品都已上路測試,成為高階自動駕駛領域關注的焦點。
據火山引擎的張路觀察,一些公司前些年十分激進,直接在走L4級自動駕駛的道路,但在商業上無法實現閉環。一些以往做Robotaxi的公司,一直在降級,為了生存不得不去接一些L2、L2+的項目,用這些項目的資金流養活自己。從這些現象可以看出,Robotaxi的路,奇點還沒有到。其實,行業其實已經達成共識,通向自動駕駛之路,一定是漸進式的,跳躍式已被論證不可商業化。
焱融的馬志剛說,Robotaxi當下的困境,實際引出了另外一個話題,就是乘用車的自動駕駛、商用車的自動哪一個更容易實現。從數據管理的角度看,在干線物流、礦山、港口、園區這些商用場景更容易實現L3、L4級別的自動駕駛。與商用場景相比,乘用車在數據類型、算法上不同,又受到法律法規的限制,一般都在L2級這個水平,正在向L3級發起沖擊。
在利氪的文亮看來,自動駕駛必須在某一規則、某一框架、某一場景下才能夠實現,Robotaxi是自動駕駛一個運輸工具類場景,未來肯定可以落地。當然,作為一個新生事物,商業閉環是一個必須考慮的問題。如果Robotaxi通過技術進步、車路協同,可以解決商業閉環的問題,一定可以走下去。
文亮說,利氪科技主要做線控底盤,首先切入的產品是線控制動。Robotaxi上沒有駕駛員,對于安全、冗余、可靠,要求十分高。利氪科技的線控制動產品完全可以滿足相關安全、冗余的要求。
走向自動駕駛,汽車芯片是一個短板
談及自動駕駛,芯片是一個繞不開的話題。長期以來,國內汽車芯片市場由國外大廠主導,國產芯片公司剛剛起步,生存狀況艱難。
在利氪的文亮看來,這三年來國內汽車行業一直面臨缺芯的問題,國產化替代是芯片的發展趨勢。一個芯片是否安全可靠,需要大量的數據、大量的使用方可驗證。
焱融的馬志剛充分認同文亮的觀點。在他看來,芯片是自動駕駛的載體,汽車行業缺芯是一個嚴峻的問題。就整個自動駕駛產業鏈而言,有一個木桶效應,芯片便是一個短板,必須要加以解決。要解決缺芯問題,只能對外促成合作,向內謀求自身發力,實現國產化替代。
在火山引擎的張路看來,芯片國產化是一個國家戰略,目標就是要做到戰略可控。一個好消息是,地平線、黑芝麻智能這些國產芯片早已突圍而出,至少在AI芯片方面能有一席之地。在MCU、域控制器方面,國產化的比例也越來越高。芯片國產化的路雖然很艱辛,但這的確是一個行業趨勢。
張路認為,國產化芯片依舊缺乏一個產業鏈生態。一個芯片研發出來,必須要有驅動程序、軟件、系統方面的配套,必須有主機廠去使用,才有可能生存。這其實是一個巨大的挑戰。
未來出行,城市大腦實現統一調度
在大算力、大數據、大模型的推動下,全面自動駕駛的時代一定會來臨。以始為終地展望,未來的出行市場會出現怎樣的形態?
火山引擎的張路認為,在全自動駕駛時代來臨之后,汽車可能演變為一個出行服務。要實現這一路徑,一定會出現大的運營類的公司去承載這些業務,慢慢形成寡頭。自動駕駛與智慧城市結合,一定會產生一個城市大腦,實現交通網的統一調度。
利氪的文亮則認為,即便全自動駕駛時代來臨,依舊會分不同的情景、不同的需求。消費者有的情況下需要全無人駕駛,有的情況下則想要體驗駕駛的樂趣,人機共駕,也有許多需求。
焱融的馬志剛說,如果L5級的全自動駕駛落地,一定會出現類似公共交通的大集中統一協調。當然,在不同的場景下,人有不同的需求,有的場景下需要需要全自動駕駛,有的場景下則需求人工智能輔助駕駛。所以,未來的交通形態一定是綜合式解決,既有公共交通全部集中化管理的一面,又有一部分個性化需求得以滿足。為了達成這一目標,需要所有上下游的參與者都去發力,才可能實現。
文:Bugle-X?/?數據猿