5 月 17 日,英特爾存儲技術峰會在北京順利舉辦。作為英特爾長期的合作伙伴,星辰天合受邀參加了此次峰會。星辰天合 CTO 王豪邁作為特邀嘉賓之一,作了主題為《LLM 存儲:架構至關重要》的演講,分享了大語言模型(LLM)對存儲的需求以及現有存儲架構的局限與挑戰,與來自阿里云、英特爾等公司的諸位業界專家共同探討了人工智能時代存儲系統的發展愿景與技術趨勢。
人工智能時代的存儲系統技術趨勢
大模型時代企業競爭的核心要素就是數據,在數據處理和流通的過程中,數據存儲是不可或缺的重要一環,而高效可靠的存儲系統將成為人工智能的重要底座。
此次英特爾存儲技術峰會,英特爾邀請了業界合作伙伴、專家等深度探討了人工智能時代存儲系統的發展愿景和技術趨勢,包括如何發揮高性能存儲介質的性能、如何利用新一代互聯技術重構存儲系統、如何進行下一代存儲軟件系統創新等等,旨在通過多方協作,為客戶構建擁有極致性能、安全可靠、高可擴展性和高能效的新一代存儲系統。
XSKY 主題演講:LLM 存儲,架構至關重要
在 XSKY 主題演講環節,XSKY CTO 王豪邁首先介紹了 CPU 和 GPU 在處理大規模 AI 應用中的不同表現。CPU 內存系統優化了低延遲和深度緩存層次結構,適合處理延遲敏感的代碼,例如鏈表操作。相比之下,GPU 內存系統則優化了高吞吐量和高帶寬緩存,更適合數據和數學密集型代碼,例如向量歸約。為此,高帶寬存儲(HBM)成為解決存儲瓶頸的關鍵技術之一,它能夠顯著提升存儲系統的性能,從而滿足未來高性能計算和 AI 應用的需求。
王豪邁指出,HBM 是存儲轉型的驅動力。在大模型訓練中,存儲系統需要處理的大量數據寫入,這使得存儲寫帶寬成為決定性能競爭力的關鍵因素。特別是在多模態場景中,大量小文件的處理對底層存儲性能是一個重大挑戰。
現有的傳統 NAS 存儲架構以及并行文件系統架構,都有對應優勢和適應場景,但是都存在一些架構的限制,使得在一些問題上應對困難,比如在大語言模型的場景下,前者會遭遇寫放大的嚴酷挑戰,而后者在應對多模態場景中的海量小文件時,可能會碰到性能不足的問題。

王豪邁表示,星辰天合最新發布的 XSEA(eXtreme Shared-Everything Architecture,極速全共享架構)將是應對大語言模型存儲需求的理想架構,它由于采用了全共享架構,因此在針對慢盤、亞健康網絡問題時,能在 100 毫秒內快速切換,以保證系統的穩定運行;由于采用了單層 SSD 架構,可以借助 QAT 加速數據壓縮/解壓縮的強大能力,采用大規模的 EC+壓縮,從而實現 100%的存儲空間利用率;也由于采用了端到端的 NVME,因此能夠實現 100 微秒的低延遲。
此外,基于 XSEA、針對大語言模型存儲需求,在即將發布的新產品中,星辰天合將會通過全局 EC 和數據壓縮技術,實現寫放大的 100%降低,提升存儲效率。
XSKY 在存儲架構上的這些關鍵技術創新,不僅減少了寫放大效應,還顯著提高了存儲帶寬利用率和整體性能,可以更好應對大語言模型對底層存儲的挑戰。
展望未來,王豪邁表示,隨著 AI 技術的發展,存儲系統需要處理的數據量和復雜度將不斷增加,優化存儲帶寬和改進存儲技術是應對這些需求的關鍵,XSKY 將繼續致力于存儲技術的研發,通過架構創新和不斷的技術迭代和優化,為客戶提供更高效、更可靠的存儲解決方案。
他特別強調了 HBM 技術在這一過程中的核心作用。通過優化 HBM 技術,可以大幅提升存儲系統的性能,以應對未來高性能計算和 AI 應用的需求。他認為,只有通過持續的技術創新和架構優化,才能在快速發展的 AI 和大數據時代保持競爭優勢。
聯手英特爾 持續推動存儲架構創新
作為領先的專業軟件定義存儲企業,星辰天合致力于與芯片、操作系統、數據庫、人工智能等上下游企業合作,以持續推動存儲架構的創新。 作為英特爾的長期合作伙伴,星辰天合始終緊跟英特爾的技術發展進行創新和研發。在星辰天合最近發布的新一代全閃分布式存儲系統 星飛 XINFINI 9000 中,就采用了英特爾 QAT 加速數據壓縮/解壓縮,從而大幅度提升存儲系統性能,在降低了高吞吐環境下的讀寫時延的同時,也減少了存儲軟件棧中各進程的資源爭用以及相互間的影響。 借助英特爾存儲技術峰會這樣的技術交流平臺,星辰天合將會與英特爾以及更多合作伙伴,圍繞人工智能、大語言模型等新生應用的存儲需求,基于當前及未來的英特爾至強可擴展處理器的能力,進行進一步探索, 通過創新的軟硬件組合進一步發揮分布式全閃存儲的性能潛力,支撐共同的客戶從數據中獲得更多、更富價值的洞察 。