關于比亞迪“天神之眼”計算平臺的算力設計(預計500-1000 TOPS),其技術路徑和行業意義值得深入探討。以下從實現方式、技術挑戰和行業影響三個維度展開分析:
1. 多芯片互聯的技術實現路徑
(1)芯片選型方案
- 英偉達Thor方案:
- 單顆Thor芯片算力達2000 TOPS,但比亞迪可能通過降頻/裁剪模塊實現功耗與成本平衡(如啟用50%算力)。
- 優勢:直接獲得成熟的CUDA生態,快速部署BEV算法。
- 地平線征程6集群:
- 單顆征程6算力560 TOPS(INT8),通過PCIe 5.0互聯2顆芯片實現1000+TOPS。
- 優勢:國產化供應鏈,支持定制化指令集。
- 自研ASIC+第三方IP:
- 類似特斯拉Dojo模式,自研NPU加速器(如專注Occupancy網絡計算)+ 外購CPU/GPU IP。
(2)互聯拓撲結構
- 共享內存架構:
- 通過Chiplet技術(如臺電InFO-SoW封裝)實現芯片間超低延遲通信(<1μs)。
- 典型案例:AMD MI300X的GPU+CPU混合封裝。
- 分布式計算:
- 按功能劃分算力單元(如1顆芯片專處理激光雷達點云,1顆運行BEV模型),通過以太網TSN同步數據。
(3)能效優化
- 動態算力分配:
- 城區場景激活全部算力(1000 TOPS),高速巡航僅啟用200 TOPS以降低功耗。
- 液冷散熱:
- 參考蔚來ADAM平臺的液冷模塊,確保高負載下芯片溫度<85℃。
2. 技術挑戰與突破點
(1)芯片間通信瓶頸
- 帶寬需求:
- BEV模型參數量約1-10B,芯片間需傳輸高達100GB/s的中間特征圖。
- 解決方案:采用HBM3高帶寬內存(如SK海力士的6.4Gbps HBM)。
(2)軟件棧適配
- 編譯器優化:
- 需重構深度學習編譯器(類似特斯拉的PyTorch2.0優化),使Transformer模型能自動拆分到多芯片。
- 實時性保障:
- 多芯片任務調度延遲需控制在10ms級(否則影響AEB響應)。
(3)成本控制
- 芯片良率:
- 7nm Chiplet設計的良率可能低于60%,需與封測廠(如日月光)深度合作。
- BOM占比:
- 目標將智駕硬件成本控制在整車5%以內(1000 TOPS方案約8000元/車)。
3. 行業影響與差異化
(1)對比行業方案
方案 | 算力(TOPS) | 特點 | 代表車型 |
---|---|---|---|
比亞迪天神之眼 | 500-1000 | 多芯片互聯+無圖BEV | 仰望U9 |
特斯拉HW4.0 | 720 | 純視覺+Dojo訓練 | Cybertruck |
華為MDC 810 | 400 | 車云協同+鴻蒙生態 | 問界M9 |
英偉達Thor單芯片 | 2000 | 艙駕一體 | 極氪009改款 |
(2)比亞迪的核心優勢
- 垂直整合能力:
- 電池管理系統可優先為智駕芯片供電(如刀片電池直供12V電源)。
- 數據規模壁壘:
- 2024年保有量超600萬輛,年新增數據量相當于Waymo的100倍(非公開數據估算)。
(3)潛在合作方
- 黑芝麻智能:A2000芯片支持多片互聯,提供國產化備選方案。
- 寒武紀:MLU370-X8集群經驗可遷移至車規場景。
4. 量產展望
- 工程驗證階段:
- 2024年完成-40℃~105℃環境測試(吐魯番/黑河極限測試)。
- 落地時間表:
- 2025Q2:首搭仰望U9(限量版),支持城區記憶泊車+紅綠燈啟停。
- 2026年:下放至騰勢品牌,實現20萬元級車型標配500TOPS。
結語
比亞迪的1000TOPS級方案不僅是算力堆砌,更是芯片架構、算法效率、能源管理的系統工程。其成功將取決于:
- 能否突破多芯片間納秒級同步技術;
- 能否建立比特斯拉更高效的中國場景數據閉環;
- 能否在成本與性能間找到規模化平衡點。
這或將成為中國車企沖擊L4級自動駕駛的關鍵一役。