作者:Hello,Panda
各位朋友,大家好,熊貓君這次開個倒車,在這個廣泛使用Xilinx(Altera)高端SoC的時代,分享一個“FPGA+ARM”實現的低功耗高性能傳統方案。
圖1 瑞芯微RK3576電路
當前,包含FPGA和硬核處理器的SoC主要集中于以下幾個系列:
1、Xilinx(現在的AMD):(1)高端的VerSal系列,集成超大容量的FPGA和雙核Cortex-A72/Cortex-A78E處理器;(2)中端的ZYNQ MPSoC,集成中等容量的FPGA和雙核或四核的Cortex-A53處理器;(3)通用的ZYNQ-7000系列SoC,集成一般容量的FPGA和單/雙核的Cortex-A9處理器。
2、Altera(現在的Intel可編程邏輯業務):(1)高端的Agilex和Stratix 10系列SoC均采用四核Cortex-A53處理和超大規模的FPGA;(2)通用的Arria 10和Cyclone V系列SoC均采用單/雙/四核的 Cortex-A9處理器。
3、其他,包括高云、安陸等國內廠家,均有提供集成FPGA和硬核處理器的SoC。硬核處理器大多為ARM Cortex-M3/M4(搭配中小規模FPGA使用)或RISC-V處理(搭配較大規模的FPGA使用),主要還是適合在一些不太復雜的控制領域使用。
通過以上總結可以看到,Xilinx和Altera的大規模和超大規模SoC主要用于驗證AISC設計或原理樣機驗證,不大可能用到量產工業或消費產品中去。中低端的FPGA處理器性能又普遍偏弱,在一些圖形圖像中的處理能力偏弱,功耗也不低,形成優勢產品的難度較大。
在一些手持設備、電池供電的系統或對發熱敏感的高性能圖像應用系統,常常需要在功耗、面積、性能上找到一個最優解。對一個圖像系統而言,常常需要FPGA來做圖像采集、控制和其它接口擴展,處理一些適合Pipeline的圖像或圖像算法等等,同時又需要ARM或DSP做一些較為復雜的應用算法、圖像效果或數據庫等等。這種情況下,封裝尺寸小的“低功耗FPGA+低功耗ARM SoC”分立方案反而成了最優解。
這里一個最典型的應用就是紅外熱成像領域,具有100%指征:
(1)非制冷的手持設備和電池供電設備:對熱量敏感,機器內部發熱會嚴重影響成像效果,帶來靈敏度降低(NETD),熱輻射“鍋蓋”現象等;對續航敏感,無論是測溫設備、穿戴設備還是儀器儀表,都要求待機時間越長越好,因此對低功耗要求高;對計算要求較高,這些機器里面通常需要運行一些圖像處理類的算法外,還需要運行圖像融合,檢測、識別、跟蹤等算法或是較為復雜的圖形界面、樣本數據庫等等,所以這些設備的計算性能要求絕對不低。
當然,也有部分非制冷探測器應用集成封裝FPGA,如國內某頭部紅外制造商堆棧封裝了易靈思Ti60 FPGA;
(2)制冷型的紅外設備:此類設備主要用于儀器和特殊領域使用,雖然對續航時間沒有要求,但其對發熱和性能的要求同樣高,一句話就是:性能盡量高,發熱要小。
一、低功耗FPGA
現在咱們聊一聊低功耗的FPGA。咱們暫且分為國產和進口兩大類。
(1)進口低功耗FPGA:說到功耗低、不發熱,性能又比較好的,必須是Lattice,尤其是其Crosslink-NX系列(包括該系列的國內馬甲芯片),可以說是排在低功耗性能器件的首位;其次是MicroChip的,功耗是真的低,但是容量和性能也是真的低;再次就是Altera的Max10系列,內部集成了Flash和ADC等,功耗性能比上也還是很不錯的(缺點是沒有mipi核,40k以上邏輯沒有小封裝)。綜上:進口低功耗FPGA首選Lattice Crosslink-NX 40K邏輯器件,壓榨其資源(盡可能能用的資源都用上,不含PCIe器件)平均實測功耗≤500mW,直觀的用手去摸芯片表面,基本感受不到發熱(測試FPGA型號為LIFCL-40-7MG121I)。
圖2? :Lattice LIFCL-40電路圖
(2)國產低功耗FPGA:嚴格意義上,國產器件沒有專門的低功耗設計,其功耗由流片工藝決定。高云小蜜蜂、智多晶、京微齊力、紫光同創、安陸等等功耗較低的器件普遍容量小,接口和性能上也差事兒,能做的事情不多。目前來講,可用的主要是高云的GW5A和易靈思的TI60(集成HyperRAM和QSPI Flash)兩個系列的器件上。從實測效果上看,選用GW5AT-60 MG132封裝和Ti60 100pin封裝兩顆器件(邏輯量均為60k),運行相同功能的邏輯,用手接觸芯片表面明顯發熱,整體功耗也在1200mW以上。在對國產化要求有硬性指標的應用場合,這個大概是最佳選項。
圖3 高云GW5AT-LV60UG225電路圖
圖4 易靈思Ti60電路圖
下面是Lattice、高云、易靈思三家器件的對照表:
二、低功耗SoC
SoC的功耗直接與其制程和性能相關。咱們這里不討論國外的如英偉達、高通、TI之類的,主要還是選國產,按照其能打程度,主要還是海思、瑞芯微和全志三大家,但是這三家又各有特點:
(1)海思SoC主要針對圖像處理,ISP性能強,但是自其恢復供貨后,受制造工藝限制,功耗高了不少;
(2)瑞芯微主要針對通用處理,其ISP性能較弱,但是通用計算能力強,接口也很豐富;
(3)全志比較低調,就是純ARM SoC,沒有較強的圖像圖形處理能力,且沒有工業和車載等級器件。
從以上三家的情況來看,“FPGA+ARM”方案,ARM SoC主要承擔的是應用處理算法和圖形、數據處理能力,因此選用瑞芯微器件會更加合適。
下表是RK3576、RK3588和海思Hi3559AV100參數對照表。
實際上,低功耗視覺應用場景圖像的分辨率不會太大,對應的圖像鏈路的處理負載和內存消耗不會太大,對應的輸入輸出接口和Codec的功耗也會較小。其功耗消耗主要是運行前述的復雜算法。
三、案例
以下是一個常規的雙光融合設備的框圖,如前面內容所述,FPGA和RK3576各自分工承擔計算負載,如下圖5所示。像這樣的一個典型應用方案,處理板上的功耗約4瓦(常溫25°C時,不含屏)。
圖5? FPGA+RK3576雙光融合方案框圖
今天就聊這么多,分享結束,感謝大家閱讀,希望能起到拋磚引玉的作用。