0. 前言
按照國際慣例,首先聲明:本文只是我自己學習的理解,雖然參考了他人的寶貴見解及成果,但是內容可能存在不準確的地方。如果發現文中錯誤,希望批評指正,共同進步。
本篇文章是這個系列的第二篇,介紹地平線公司的車載SoC芯片,主要是征程?(Journey?)系列產品。
自動駕駛汽車AI芯片系列目錄:
1. NVIDIA篇
地平線機器人科技有限公司(Horizon Robotics)是一家中國的人工智能計算平臺公司,專注于邊緣人工智能芯片的研發,以及基于此的解決方案。征程系列芯片是由地平線自主研發的,主要面向汽車智能駕駛領域,包括輔助駕駛、自動駕駛等應用場景。
這些芯片設計用于處理復雜的人工智能任務,具備高性能、低功耗的特點,代表了中國在車規級AI芯片領域的自主研發成果。尤其是在ZM關系日益復雜的今天,“自主研發”顯得尤為重要!
在本篇正式開始前,首先我要吐槽下地平線沒有類似NVIDIA的developer zone,也找不到一些公開的技術手冊。本文的信息大部分基于公開演講提取、整理出來,部分插圖質量會非常差,請諒解。
1. BPU
在開始介紹整體SoC產品之前我想先聊聊地平線的獨門秘技——BPU(Brain Processing Unit):
1.1 BPU介紹
BPU是由地平線提出的一種專門為人工智能應用設計的處理器架構,特別聚焦于深度神經網絡的高效計算。它是地平線在嵌入式人工智能領域的重要技術創新,旨在解決傳統處理器在處理大規模并行計算任務時的效率問題,特別是在圖像識別、語音處理、自然語言理解和控制等領域。
1.2 BPU架構理念
高度優化的AI計算引擎:BPU設計的核心是為深度學習算法量身定制,通過優化的硬件加速器實現卷積神經網絡(CNN)、循環神經網絡(RNN)、Transformer等復雜神經網絡模型的快速計算。這使得在有限的功耗和成本下,能夠達到更高的計算效率和性能。
軟硬件協同優化:地平線在開發BPU時強調軟硬件的深度整合,確保算法、編譯器和硬件架構三者之間的緊密配合。通過這種協同,BPU能夠更好地適應不斷發展的深度學習算法,實現算法效率和硬件效率的雙重提升。
1.3 BPU迭代發展
高斯架構:第一代BPU架構,標志著地平線在嵌入式人工智能領域的重大突破。這一架構專注于提升深度學習算法在邊緣設備上的運行效率(地平線一直很注重芯片能效比),以及視覺處理性能。
伯努利架構:第二代BPU架構,應用于征程2和征程3等芯片中,以其性價比、靈活性和可靠性獲得了廣泛應用。
貝葉斯架構:第三代BPU架構,用于征程5芯片,這是全球少數實現量產的大算力智能駕駛芯片之一,專為高等級智能駕駛設計,展現了強大的數據處理和實時決策能力。
納什架構:第四代BPU架構,進一步優化了深度學習加速計算,尤其擅長處理大規模參數的Transformer模型,強化了對自動駕駛場景的支持,提升了能效比和計算密度,征程6即采用了這一架構。
2. 地平線征程系列產品
2.1 征程2系列
征程2系列是地平線推出的首款車規級AI芯片,搭載伯努利1.0 BPU,標志著中國在車載AI芯片領域的突破。適用于高級輔助駕駛(ADAS)、智能座艙等場景,支持基于深度學習的圖像處理、識別等功能。
2.2 征程3系列
基于自研的BPU伯努利2.0架構,專為高級輔助駕駛設計,高效能且應用廣泛。支持深度學習的圖像檢測、分類、像素級分割,以及視頻編碼,實現自動泊車輔助等功能。理想ONE 2021款搭載征程3芯片,實現了導航輔助駕駛功能。
2.3 征程5系列
提供強大的計算能力,足以滿足未來幾年內智能汽車行業的發展需求。支持更復雜的自動駕駛功能,如NOA(Navigate on Autopilot)功能,已在理想汽車的L系列車型中應用。除了理想汽車,還有其他多家汽車廠商合作,展示了其在高級別自動駕駛領域的實力。
2.4 征程6系列
于2024年4月剛剛正式發布,預計同年第四季度完成首批量產車型交付。旗艦產品算力高達560 TOPS,是業界首款覆蓋從低到高全階智能駕駛需求的車載智能計算方案。采用第四代BPU架構“納什”,專為大規模參數的Transformer模型和高級智能駕駛優化。與比亞迪、理想汽車等十家主流車企達成合作,加速智能駕駛平權,引領未來出行。本文也將重點針對征程6系列產品進行說明。
2.5 綜合特點
統一架構:征程系列采用統一的硬件架構、工具鏈和軟件棧,便于開發和維護,支持跨代兼容。
高效能低功耗:設計注重能效比,適合車載環境的嚴苛要求。
廣泛生態:構建了開放的生態系統,促進軟硬件生態伙伴的合作,加速智能駕駛的商業化落地。
3. 征程6介紹
與以往征程系列前幾代產品不同的是,征程6(我們業內稱為J6,“鉤6”)并不是一款芯片,而是根據算力大小,分成了J6B/J6L/J6E/J6M/J6H/J6P 6款!
3.1 J6P芯片參數
CPU:18核心的ARM Cortex-A78AE,算力是410K DMIPS
BPU:如上文介紹,采用了納什架構第四代BPU,560TOPS算力(注意上圖左下角的一行小字:560TOPS算力是等效1/2稀疏網絡下的算力,必須嚴謹!)
算法支持:對Transformer算法的支持效率在業內領先,同時支持大規模交互式博弈等前沿算法,表明其在處理復雜AI任務上的優越性能。
功能安全:通過ISO 26262 ASIL-D功能安全流程認證,主動安全AEB ASIL-B產品級功能安全認證。
關于J6的GPU和MCU目前沒有獲取相關參數,公開后我會再補充。
3.2 四芯合一的芯片架構
J6芯片所實現的“四芯合一”是指將以下四種關鍵處理單元集成在同一顆系統級芯片SoC上:
1. CPU(Central Processing Unit):負責通用計算任務,處理非特定的計算工作負載,是芯片的控制中心,執行操作系統的指令和應用程序的邏輯控制。
2. BPU(Brain Processing Unit):地平線自主研發的神經網絡處理單元,專門針對人工智能算法和深度學習任務進行了優化,如圖像識別、自然語言處理等,是實現智能駕駛核心算法的關鍵。
3. GPU(Graphics Processing Unit):圖形處理器,除了傳統意義上的圖形渲染,現代GPU也廣泛用于并行計算,特別是在機器視覺、環境感知等需要大量并行處理的場景中。
4. MCU(Microcontroller Unit):微控制器單元,常用于實現嵌入式控制功能,具有功能全、體積小、集成度高等特點。在J6中,MCU被集成用以處理功能安全相關的任務,確保系統的可靠性。
這種高集成度的設計不僅提升了系統性能,還顯著提高了性價比,降低了部署難度,使得單顆征程6芯片就能夠支持包括感知、規劃決策、控制、座艙感知等在內的全棧計算任務,適用于多種智能駕駛應用場景。
這種多合一實際上就是SIP(System in Package),SIP技術是一種先進的半導體封裝技術,它允許將多種功能芯片、元器件(如處理器、存儲器、傳感器、RF組件等)以及被動元件(如電阻、電容)集成在一個封裝內部,形成一個具有完整或部分系統功能的封裝模塊。與傳統的單一封裝只包含一個主要芯片(如SoC)不同,SIP技術通過并排排列、堆疊或采用3D封裝等方法,將多個獨立的芯片和組件緊密集成,從而實現了更高的集成度和更小的封裝尺寸。
總結:本文介紹了地平線公司自動駕駛SoC芯片,尤其是征程系列J6芯片。但是由于地平線的公開信息實在較少,本文僅能基于較少已有信息進行說明,后續如有進一步的公開信息,我會再補充本文內容。