日前,2022年信息技術自主創新高峰論壇在南京成功召開,來自政府、產業、各行業領域的領導、專家學者、企業代表齊聚長江之濱,共話信息產業自主創新發展。鐵流談談會上幾個亮點。
龍芯LA664追平AMD zen2
相對于一些技術引進CPU在引進海外技術后CPU IPC增長緩慢,性能提高基本依靠購買更好的EDA工具和買臺積電更好的工藝。龍芯一直致力于提升CPU微結構設計水平來提升CPU的性能。沒有盲目去堆核心數量。這種穩扎穩打的做法使龍芯在過去10年中IPC提升了3-4倍,在桌面CPU上成效立竿見影。
CPU的IPC在過去10年中提升了3-4倍,這使龍芯可以在制造工藝上落后技術引進的某ARM CPU一代的情況下,依然可以依靠CPU微結構設計水平做到性能持平或略優于技術引進的某ARM CPU。當龍芯與引進的某ARM CPU采用相同工藝時,龍芯可以憑借其IPC上的優勢在性能上領先某ARM CPU。
3A6000和3A5000采用相同制造工藝,龍芯依靠其設計能力把CPU性能大幅提升。從此前公布的仿真成績看,定點相對于3A5000提升30%,浮點相對于3A5000提升60%,這種提升是非常駭人的——如果仿真成績與最終成績相當,那么,3A6000 SPEC06單核定點Base分大于13/G,浮點Base分大于16/G,如果3A5000為2.5G至2.8G,那么,3A6000的 SPEC06單核定點Base分大于35,浮點將大于45。
從本次大會公布的信息看,在使用相同工藝的情況下,3A6000性能比3A5000提升40%—60%,芯片面積縮小20%,12nm的3A6000對標7nm的AMD Zen2。鐵流做最保守估算,3A6000 SPEC06單核定點Base分為32分(@2.5G)至35分(@2.8G)。這個性能對于信創和日常使用而言都已經明顯過剩了。
多核服務器CPU迎來爆發期
在服務CPU上,由于國內ARM CPU往往采用“堆核戰術”,也就是用64核、128核堆出一款服務器CPU,這導致龍芯的四核CPU雖然在單核性能上更好,但在多核性能上不如ARM CPU。這使龍芯在服務器CPU市場競爭中處于不利地位。
3C5000是龍芯第一款16核CPU,采用完全自主的LoongArch指令架構,16核心單芯片unixbench分值9500以上,雙精度計算能力達560GFlops,16核處理器峰值性能與典型ARM 64核處理器的峰值性能相當,并支持最高16路互連,搭配新一代龍芯7A2000橋片,PCIe吞吐帶寬比上一代提升400%以上。就SPEC2006測試來看,單核定點浮點Base分均大于10/G,單芯片分值超過200。可滿足通用計算、大型數據中心、云計算中心的計算需求。該處理器通過芯片級安全機制可為等保2.0、可信計算、國密算法替代、網絡安全漏洞防護等提供CPU級內生支持。
3C5000最大特點是單核性能強,特別是unixbench這種看重單核和內存性能,多核加速比很低的測試,龍芯只用16核就能跑到9500,某ARM CPU即便有64核也跑不到這個成績。從公開的數據來看,3C5000的性能在信創市場足夠用了,而且16核的核心是使其部署比較靈活。龍芯3D5000研制成果,也就是把兩個3C5000封裝到一起的膠水32核芯片,主要針對一些對性能有更高要求的場景。
2K3000?3C6000 3D6000性能不俗
2K3000的內核相對于2K2000進行了增強,雖然2K2000和2K3000的核心都叫LA364,但其實是兩代核心,IPC是不一樣的,處理器核重新設計,發射寬度降低了,但是效率提高了,新處理器核可以對標A75水平,使用范圍也不局限于工控。
2K3000主頻達2.7Ghz,LG200 GPU也被集成進2K3000,由于芯片SOC化大幅提升了集成度,芯片面積、成本、功耗大幅度降低,屆時龍芯主板價格要低于i3主板,根據計劃,2K3000將在明年上半年流片。
鐵流推測,2K3000 SPEC06定點成績在24分以上(Base @2.7Ghz)。
2K3000一旦量產,將在性能、成本等方面領先當下的盤古900、D2000等ARM方案。作為參照,D2000 SPEC06定點成績在15分左右(Base @2.3Ghz),盤古900的單核成績還不如D2000。
3C6000是16核服務器芯片,內核是LA664,3D6000則是兩片3C6000封裝在一起構成32核服務器CPU,可以匹敵搭載Zen2核心的AMD EPIC。只要軟件能跟上,商業市場已經沒有性能短板了。
龍芯下一代7000系列CPU,進一步提升CPU核性能,IPC瞄準Zen3和12代酷睿,計劃采用7nm工藝,SPEC06定點Base最保守估算是40分,屆時,會有24-32核的3D7000(7nm) 和48-64核3E7000(兩片封裝)。
產學研協作推進產業生態
有鑒于龍芯沒有大型3A游戲,就CPU性能而言,3A5000應對日常使用和單位辦公已經是性能過剩了,3A6000則是進一步性能過剩,7000系列CPU則能進入商業市場競爭。對于龍芯而言,性能已經不是最大短板,軟件生態和產業生態才是短板。
對此,龍芯措施是兩手抓,一方面用二進制翻譯兼容X86生態,另一方面推出自主編程框架。
LATX實現在龍芯linux平臺上運行X86/Windows應用的目標,目前已經可以運行大量X86/Windows應用,預計還需要一年時間完善。以打印機來說,現在97%、98%以上的打印機龍芯不用遷移,可以直接用,這在X86和ARM上都沒有做到,凡是windows有的驅動龍芯都能跑。還有少量的2%、3%的問題,年底之前將全部解決,也就是說在X86和ARM平臺上肯定很多打印機認不了,但在龍芯的平臺上,到明年開始可以保證100%的打印機都能識別。
自主CPU和操作系統的整機產品之所以需要無休止的遷移適配,主要是因為這些系統是不在自主平臺上寫的,現有的應用都是基于別人的編程框架編出來的,自主編程框架是自主操作的重要特征,目前國產操作系統都不是真正意義上的自主操作系統,只是開源操作系統的自主發行版,APP開發者使用的自主編程框架進行編程才能徹底解決無休止的適配問題,所以龍芯在明年爭取推出自主編程框架。未來就像手機APP有蘋果版和安卓版,未來電腦的系統有龍芯版和windows版,這樣龍芯就有自己的生態了。
龍芯啟動百芯計劃基地,東南大學首席教授、江蘇省集成電路學會理事長時龍興在主題匯報中介紹了龍芯百芯計劃項目。該項目旨在讓高校學生進一步參與完成處理器芯片全流程設計,掌握核心科技基礎技術。授權龍芯自主研發的IP核同樣是百芯計劃的一項重要內容。多年來,龍芯中科堅持自主研發核心IP,形成了包括系列化CPU IP核、GPU IP核、內存控制器及PHY、高速總線控制器及PHY等上百種IP核。蘇州雄立科技基于龍芯ip開發了一系列芯片。
另外,龍芯積極與高校合作,教育部高等教育計算機類專業教育指導委員會指導清華大學、北京航天大學、西北工業大學、南開大學、中國科技大學等高校編寫基于龍芯中科loongarch的指令集為基礎的7門教材在上述高校于2023年教學使用。
龍芯與南京大學、東南大學、河海大學、南京航空航天大學等高校共建6個信創實驗室,推動信創產品走進校園、走進課堂。龍芯信息技術應用創新實驗室解決方案,涵蓋信息技術、應用創新、集成電路、云計算、大數據、物聯網、網絡安全等多門課程、實驗、賽事、認證等內容。龍芯中科還發布了“青少年造芯計劃”公益項目。該項目由具有全國性公募資格的中國社會福利基金會社區發展基金和愛心人士共同發起,助力提高青少年信息技術創新能力和科技創新教育水平。
結語
鐵流引用胡偉武老師的話作結尾:我自己覺得2022年起的2到3年是龍芯把自主研發的優勢轉化為性價比和軟件生態優勢的重要轉折點,我希望今天會后的一兩年內整個產業鏈形成這樣的共識:
因為龍芯是自主研發而非引進技術,所以龍芯性能最高;
因為龍芯是自主研發而非引進技術,所以龍芯成本最低;
因為龍芯是自主研發而非引進技術,所以龍芯生態最好;
因為龍芯是自主研發而非引進技術,所以龍芯供應穩定。
我希望大家慢慢打破說龍芯是最基礎,但生態和性能差一點,要在實踐中兩三年就能做到,因為能力已經形成了,槍桿子已經練成。