香蕉派BPI-F3是一款工業級 8核RISC-V開源硬件開發板,它采用進迭時空(SpacemiT) K1 8核RISC-V芯片設計,CPU集成2.0 TOPs AI計算能力。4G DDR和16G eMMC。2個GbE以太網接口,4個USB 3.0和PCIe M.2接口,支持HDMI和雙MIPI-CSI攝像頭
進迭時空
進迭時空(杭州)科技有限公司是一家成立于2021年11月,專注于高性能RISC-V處理器核、芯片及核心軟件系統的創新與研發的企業。公司由一批國內知名的RISC-V處理器技術專家共同發起,并在杭州、珠海、上海、北京、英國等地設有辦公地點。進迭時空的核心團隊成員來自平頭哥、全志等國內知名的半導體企業,擁有豐富的高端芯片研發與商業運營經驗。公司旨在推動RISC-V架構的技術發展,其產品廣泛應用于邊緣計算到云計算等多個場景,包括高端智能機器人、高性能計算盒子、邊緣服務器、新一代智能云終端、自動駕駛等。
進迭時空 K1 開源硬件開發板: 香蕉派 BPI-F3
基于RISC-V開放指令集架構,致力于打造更節能、更通用的AI處理器平臺,推動全球開源、開放生態計算能力建設。
K1主要用于單板計算機、網絡存儲、云計算機、智能機器人、工業控制、邊緣計算機等。
卓越的CPU性能
8核RISC-V AI CPU,提供50KDMIPS CPU算力和2.0TOPS AI算力
單核CPU算力領先ARM A55 30%以上
強大的向量算力
全球首款支持RVA22 Profile、支持256bit RVV 1.0標準的RISC-V CPU, 提供2倍于Neon的SIMD并行處理算力
通用的AI算力
以CPU核融合方式提供AI算力,實現與所有主流AI生態的快速對接
領先的算力能效
RISC-V架構的精簡和卓越的微架構設計,算力能效比ARM A55高20%
豐富的IO能力
集成多套PCIe、USB、GMAC、SPI等接口,提供全面的外設連接選型
符合工業級標準
CPU在-40?C~85?C的環境溫度下仍能提供穩定可靠的持續算力輸出,滿足工業應用的苛刻環境需求
基于進迭時空的AI技術路線,以輕量化插件的方式,通過開放的軟件棧,使得K1芯片能夠在短時間內支持大量開源模型的部署,目前已累計驗證了包括圖像分類、圖像分割、目標檢測、語音識別、自然語言理解等多個場景的約150個模型的優化部署,timm、onnx modelzoo、ppl modelzoo等開源模型倉庫的支持通過率接近100%,而且理論上我們能夠支持所有的公開onnx模型。
作為進迭時空首顆自研高性能計算芯片,K1芯片除了在AI方面取得了突破性成果,在包括存儲性能、計算性能、浮點性能等芯片的三個核心性能上,相較ARM同級別的Cortex-A55
芯片也都取得代差級優勢。
同等微架構下,存儲性能大幅領先于ARM Cortex-A55
芯片存儲的速度越快,計算機的運行速度也就越快,這也意味著能夠更快地訪問和處理數據,縮短反應時間,對于需要高效數據交換的AI終端應用場景來說,尤為重要。陳志堅博士介紹,在存儲性能方面,同等微架構下,K1芯片搭載的進迭時空自研RISC-V 智算核X60?表現亮眼,大幅領先ARM Cortex-A55 15%。其中,LMbench Write單項來看,最高可達6.32GB每秒,LMbench Copy和Read,分別可達3.35GB每秒和3.56GB每秒,遠超ARM Cortex-A55的讀寫和復制速度。此外,X60智算核在內存stream方面的各項指標也遠超ARM Cortex-A55。
同等微架構下,計算性能大幅領先于ARM Cortex-A55
在各大領域的真實應用中,X60?智算核的實際計算性能也大幅領先ARM Cortex-A55。在相同工藝下,X60?智算核單位頻率的性能大幅領先,這來自于之前提到的出色的各項傳統CPU的性能,也來自于X60?智算核基于RISC-V Vector的強大SIMD性能。圖像性能方面,最高為ARM Cortex-A55圖像性能的2.14倍,壓縮性能的1.2倍,繪制性能的1.19倍。
提高芯片的計算性能,也可以通過提高數據并行性能來實現。這種能力也被稱為向量計算能力。事實上,AI大模型推理涉及大量的向量運算和矩陣運算,利用處理器的向量指令功能,能夠加快模型的推理速度。
據發布會公布的數據顯示,基于RISC-V Vector 1.0標準,X60?智算核可以提供2倍于ARM Neon的256-bit SIMD并行處理算力。相比Arm Neon指令集能在多個領域的應用情況和帶來的性能提升。在圖像預處理、顏色空間轉換、圖形學等算法性能上,X60?是ARM Cortex-A55的1.5倍。此外,進一步在LU分解,QR分解,SVD分解,Chelesky分解,Eigen分解等五大矩陣進行分解后,基于在OpenBLAS+Eigen,核心計算,sgemm的性能上的突出表現,X60智算核是ARM Cortex-A55的1.5倍。更為重要的是,X60智算核的向量計算技術,還解決了SIMD技術帶來的二進制不兼容問題,使同一份代碼可以跑在基于RISC-V架構的任何矢量位寬的處理器上,開發者不需要經歷ARM指令集擴展和代碼重寫,這意味著軟件維護成本將大大降低,對RISC-V生態的建設具有重大意義。
同等微架構下,浮點運算能大幅領先于ARM Cortex-A55
浮點運算能力是芯片在進行浮點計算時的速度和精確度,對于Robot Computer時代里高強度的科學計算和圖型處理等密集運算的應用程序來說,浮點性能尤為關鍵。
陳志堅博士介紹,進迭時空隨機抽取的18個應用程序進行實測后,測試結果顯示,X60?智算核在14個應用程序的運行數據都大幅領先于ARM Cortex-A55。其中,在X60?智算核上運行從頭計算量子化學程序GAMESS,是ARM Cortex-A55的12.2倍,稱得上“遙遙領先”。
下一步工作
面向未來,進迭時空將持續投入 RISC-V 高性能 CPU 核、高性能 CPU 芯片、基礎和系統軟件研發,形成完整計算系統解決方案:
第二代 RISC-V 高性能 CPU 核“X100”研發完畢,采用 12 級流水線和 4 發射亂序執行的超標量處理器架構,通用計算性能Coremark 達到 7.7/MHz,Spec2k6 超過 8.2/GHz,在 12nm 工藝下頻率可達到 2.5GHz。同時完整符合服務器規格要求,是全球首款同時支持完整虛擬化、RAS 特性、安全、標準向量擴展、向量加解密、64 核互聯的 RISC-V CPU 核,獲得中國開放指令生態(RISC-V)聯盟 2023 年度唯一的前沿創新獎。
搭載“X100”核的下一代 RISC-V AI CPU 芯片已啟動研發,未來將繼續拓展 RISC-V 在高性能計算領域的邊界,成為新的標桿級別的量產 CPU 芯片產品。
同時進迭時空作為中電標協 RISC-V 工委會副會長單位,全球 RISC-V生態軟件計劃“RISE”會員單位等,將繼續攜手業界共建 RISC-V 應用生態。
進迭時空表示,堅信 RISC-V 是下一個機器人時代最佳的計算架構,RISC-V讓中國企業有機會從指令集和 CPU 核開始做芯片和計算系統的軟硬件融合優化,為世界交付具有代差級優勢的芯片產品,在中國會誕生出具有全球影響力的 CPU 芯片企業。
BPI-F3 ,接口齊全的RISC-V開發板
豐富的硬件接口:
在線文檔:https://docs.banana-pi.org/zh/BPI-F3/BananaPi_BPI-F3