1、摘要
????????2023年5月11日,浪潮信息全國巡展廣州站正式啟航。會上,重磅發布新一代分布式融合存儲AS13000G7,其采用極致融合架構設計理念,實現同一套存儲滿足四種非結構化數據的“All In One”高效融合,數據存力提升300%,IO性能提升100%;同時,實現四種非結構化協議無損訪問,實現多元場景的“All In One”,加速釋放數據要素的價值。
2、引言
????????智算時代,算力是生產力,數據是核心生產要素,也是支撐AI訓練和智慧應用的基礎。在AIGC、智能駕駛、智能制造、智慧醫療等萬千智慧應用場景中,PB級乃至EB多模態數據是支撐智慧應用的關鍵要素。例如,最近爆火的AI大模型,參數量呈現多元、海量且快速增長的態勢。
????????GPT-3語言大模型擁有1750億的參數量,而到了最近的GPT-4,參數量已突破萬億規模,同時數據類型變得更加豐富,除了文本外,還需要圖像、音頻、視頻等多樣化數據。面對千行百業的海量多態的數據場景,企業需要化繁為簡的極致存儲。
????????在自動駕駛、天文觀測、基因測序等場景下,一次數據處理過程通常涉及文件、對象、大數據多種協議的數據存儲和訪問方式。以天文觀測場景為例,一次完整的天文觀測數據處理涉及到數據采集、數據預處理、數據分析和成果保存四個步驟,不同階段使用了不同的訪問協議。傳統分布式存儲僅支持單一協議訪問,即客戶需要同時部署多套存儲系統,并且不同協議處理時,需要進行數據轉換和拷貝,造成存儲空間浪費和存儲成本增加的同時,極大程度降低數據的處理效率。
3、架構介紹
? ? ? ?新一代分布式融合存儲實現了一套集群系統同時支持文件、對象、大數據、視頻四種協議,實現數據融合;同時支持閃存、磁盤、磁帶、光盤四類存儲介質,實現管理融合;可以支持基礎設施云化、結構化、非結構化等全部應用場景;支持全生命周期管理,數據在熱、溫、冷、冰四級存儲間自由、高效流動,實現“一套存儲架構、支持一個數據中心”。
4、關鍵技術?
????????其一,存儲資源融合互通,數據全局共享
???????分布式融合存儲平臺構筑了全局統一存儲資源池,數據及元數據均統一管理,不同協議(NFS/CIFS/HDFS/S3)共享共用,且創建的文件、數據及元數據僅保存一份,有效減少數據重復存儲成本。
????????其二,多協議融合互通,數據零拷貝
????????根據傳統NFS、CIFS、HDFS和S3存儲協議的特點,分布式融合存儲平臺設計出統一的存儲架構。協議層無需數據轉換和拷貝、安裝網關或插件及在計算側或應用層改造,即可直接原生語義無感接入,大大提升數據處理效率。
????????其三,原生語義支持,語義零損失
????????語義損失是導致傳統協議互通方案無法商用的主要原因。文件、HDFS和對象服務由于使用場景的差異,每種服務都有各自獨立的語義,如文件的快照、對象多段上傳及HDFSRanger鑒權等。傳統協議互通方案由于存儲架構和元數據管理不統一,無法實現各協議完整的語義支持,通常需要上層適配修改,造成語義損失。分布式融合存儲平臺在統一存儲架構上實現多協議的統一元數據管理,支持各協議原生無損語義訪問存儲系統,應用無感接入。
????????其四,權限互通,多協議權限聯動
????????由于文件、對象、HDFS協議權限管理方式各不相同,傳統協議互通方案權限管理較為混亂,無法做到權限互通,給用戶訪問帶來極大的不便和困擾。
????????針對Windows用戶、Unix用戶和對象用戶的不同訪問形式及隔離限制,設計出用戶映射機制,實現不同類型用戶權限共享,打破不同類型用戶之間互相隔離的壁壘;提煉出統一的權限管理架構,統一管理非結構化數據權限。可以做到一份數據,一份權限信息,一種協議修改權限,對其它協議同時生效,真正做到了權限實時聯動。
????????其五,冗余保護,數據安全可靠
????????支持更全面的數據保護策略,提供跨節點、跨機架、不同級別的數據冗余保護,用戶無需擔心宕機、掉電等意外故障帶來的數據丟失風險。同時支持數據副本、糾刪冗余策略,能夠實現數據及時快速恢復,提高數據可靠性。
????????其六,數據分級存儲,降低存儲成本
????????隨著數據的爆炸式增長,單一形式的存儲已經無法滿足用戶高性能和低成本的需求。AS13000提供靈活的分級策略,將數據按照設定的策略和熱度分別存儲在高性能存儲介質和相對低成本的存儲介質中,合理利用存儲空間,降低存儲成本,快速響應用戶的數據存儲需求。
????????最后,特性級互通,高效便捷
????????憑借統一的特性架構和操作接口,實現特性級互通,對外提供統一的增值特性服務,如統一配額、統一QoS、統一分級存儲、統一回收站、統一元數據檢索。設置后,對NFS、CIFS、S3、HDFS等多種協議即時同步生效。
5、亮點
????????一套存儲架構 融合海量多態數據
????????伴隨數字化轉型的深入,海量多態數據應用正快速增多,數據融合存儲的訴求日益增長,如何以更優的成本、更高的效率,讓視頻、圖片等多態數據存得更多、更久、更可靠,是業界的挑戰。
????????新一代分布式融合存儲,支持四合一架構的融合存儲,用戶購買一套存儲享有文件、對象、大數據、視頻四種存儲服務,不同非結構化存儲服務間可訪問同一份數據,融合存儲空間利用效率提升200%,實現用一套存儲架構高效支撐一個數據中心,滿足性能需求的同時,幫助企業降低TCO。
????????同時,在海量多模態場景,浪潮信息打造高密專有產品,采用4U60盤位配置,支持20TB大容量硬盤,單節點容量超1PB,一臺頂三臺;同時基于32+2大比例糾刪、數據縮減技術,硬盤利用率高達94%。
????????一套存儲平臺,加速數據處理和流動
????????無論是自動駕駛的路線決策,還是電商平臺的精準營銷,數字化醫療線上問診等數字化智慧應用,背后都離不開對海量圖片、文本、視頻等非結構化數據的采集、訓練、建模分析和決策,2023年實時數據已占到全球數據圈25%的份額。以高精地圖為例,高精地圖一般通過采集車每天采集、回傳數據進行分析刷新繪制,每輛車每天采集的數據達數十TB,實時回傳GPS、軌跡、速度、經緯度等多樣化數據,每秒處理千萬點位。性能,成為智慧應用永無止境的訴求。
????????新一代分布式融合存儲為了提升性能,在一套存儲平臺內推動盤控協同和全鏈路端到端性能優化,讓數據在熱溫冷冰四級存儲內高效互通、流動。AS13000G7搭配第四代英特爾至強CPU、自研PCIe 5.0 NVMe SSD,并通過RDMA協議、CPU專核專用、數據分區、隨機轉順序等技術的代碼級聯合調優實現性能的提升,單節點帶寬超過50GB/s,相當于一秒傳輸25部高清電影。相較上一代產品,AS13000G7新品性能至少提升40%。
????????一套存儲平臺 保障數據安全可靠
????????新一代分布式融合存儲從部件、器件、整機系統、核心軟件、管理軟件到解決方案,用六重保護確保服務永遠在線、數據永不丟失。在器部件層面,嚴選高可靠性的器件,圍繞可靠性去定制硬盤、SSD等部件。在集群層面,基于全對稱分布式架構,最大可擴展至10240節點,基于大比例彈性EC,最大可同時容忍任意4節點失效。
????????面向病毒和防勒索軟件的攻擊,推出了端到端的數據安全解決方案。首先,可以為用戶提供生產存儲、雙活存儲、異地備份的多重保護;其次,通過對讀寫行為的分析,預測勒索行為,即時終止惡意勒索行為并通過高密快照技術迅速恢復數據;再次,通過引入第三方殺毒軟件,殺滅勒索病毒;最后,通過數據防篡改技術、物理隔離技術、加密等技術,讓病毒進不來、改不了,數據看不到、帶不走,打造數據安全的最后一道防線。
參考:
http://www.dostor.com/p/84080.html
https://mp.weixin.qq.com/s/7-xDoN2JiR5HIKXjP5evWA