新一代分布式融合存儲,數據場景All In One

1、摘要

????????2023年5月11日,浪潮信息全國巡展廣州站正式啟航。會上,重磅發布新一代分布式融合存儲AS13000G7,其采用極致融合架構設計理念,實現同一套存儲滿足四種非結構化數據的“All In One”高效融合,數據存力提升300%,IO性能提升100%;同時,實現四種非結構化協議無損訪問,實現多元場景的“All In One”,加速釋放數據要素的價值。

2、引言

????????智算時代,算力是生產力,數據是核心生產要素,也是支撐AI訓練和智慧應用的基礎。在AIGC、智能駕駛、智能制造、智慧醫療等萬千智慧應用場景中,PB級乃至EB多模態數據是支撐智慧應用的關鍵要素。例如,最近爆火的AI大模型,參數量呈現多元、海量且快速增長的態勢。

????????GPT-3語言大模型擁有1750億的參數量,而到了最近的GPT-4,參數量已突破萬億規模,同時數據類型變得更加豐富,除了文本外,還需要圖像、音頻、視頻等多樣化數據。面對千行百業的海量多態的數據場景,企業需要化繁為簡的極致存儲。

????????在自動駕駛、天文觀測、基因測序等場景下,一次數據處理過程通常涉及文件、對象、大數據多種協議的數據存儲和訪問方式。以天文觀測場景為例,一次完整的天文觀測數據處理涉及到數據采集、數據預處理、數據分析和成果保存四個步驟,不同階段使用了不同的訪問協議。傳統分布式存儲僅支持單一協議訪問,即客戶需要同時部署多套存儲系統,并且不同協議處理時,需要進行數據轉換和拷貝,造成存儲空間浪費和存儲成本增加的同時,極大程度降低數據的處理效率。

3、架構介紹

? ? ? ?新一代分布式融合存儲實現了一套集群系統同時支持文件、對象、大數據、視頻四種協議,實現數據融合;同時支持閃存、磁盤、磁帶、光盤四類存儲介質,實現管理融合;可以支持基礎設施云化、結構化、非結構化等全部應用場景;支持全生命周期管理,數據在熱、溫、冷、冰四級存儲間自由、高效流動,實現“一套存儲架構、支持一個數據中心”。

4、關鍵技術?

????????其一,存儲資源融合互通,數據全局共享

???????分布式融合存儲平臺構筑了全局統一存儲資源池,數據及元數據均統一管理,不同協議(NFS/CIFS/HDFS/S3)共享共用,且創建的文件、數據及元數據僅保存一份,有效減少數據重復存儲成本。

????????其二,多協議融合互通,數據零拷貝

????????根據傳統NFS、CIFS、HDFS和S3存儲協議的特點,分布式融合存儲平臺設計出統一的存儲架構。協議層無需數據轉換和拷貝、安裝網關或插件及在計算側或應用層改造,即可直接原生語義無感接入,大大提升數據處理效率。

????????其三,原生語義支持,語義零損失

????????語義損失是導致傳統協議互通方案無法商用的主要原因。文件、HDFS和對象服務由于使用場景的差異,每種服務都有各自獨立的語義,如文件的快照、對象多段上傳及HDFSRanger鑒權等。傳統協議互通方案由于存儲架構和元數據管理不統一,無法實現各協議完整的語義支持,通常需要上層適配修改,造成語義損失。分布式融合存儲平臺在統一存儲架構上實現多協議的統一元數據管理,支持各協議原生無損語義訪問存儲系統,應用無感接入。

????????其四,權限互通,多協議權限聯動

????????由于文件、對象、HDFS協議權限管理方式各不相同,傳統協議互通方案權限管理較為混亂,無法做到權限互通,給用戶訪問帶來極大的不便和困擾。

????????針對Windows用戶、Unix用戶和對象用戶的不同訪問形式及隔離限制,設計出用戶映射機制,實現不同類型用戶權限共享,打破不同類型用戶之間互相隔離的壁壘;提煉出統一的權限管理架構,統一管理非結構化數據權限。可以做到一份數據,一份權限信息,一種協議修改權限,對其它協議同時生效,真正做到了權限實時聯動。

????????其五,冗余保護,數據安全可靠

????????支持更全面的數據保護策略,提供跨節點、跨機架、不同級別的數據冗余保護,用戶無需擔心宕機、掉電等意外故障帶來的數據丟失風險。同時支持數據副本、糾刪冗余策略,能夠實現數據及時快速恢復,提高數據可靠性。

????????其六,數據分級存儲,降低存儲成本

????????隨著數據的爆炸式增長,單一形式的存儲已經無法滿足用戶高性能和低成本的需求。AS13000提供靈活的分級策略,將數據按照設定的策略和熱度分別存儲在高性能存儲介質和相對低成本的存儲介質中,合理利用存儲空間,降低存儲成本,快速響應用戶的數據存儲需求。

????????最后,特性級互通,高效便捷

????????憑借統一的特性架構和操作接口,實現特性級互通,對外提供統一的增值特性服務,如統一配額、統一QoS、統一分級存儲、統一回收站、統一元數據檢索。設置后,對NFS、CIFS、S3、HDFS等多種協議即時同步生效。

5、亮點

????????一套存儲架構 融合海量多態數據

????????伴隨數字化轉型的深入,海量多態數據應用正快速增多,數據融合存儲的訴求日益增長,如何以更優的成本、更高的效率,讓視頻、圖片等多態數據存得更多、更久、更可靠,是業界的挑戰。

????????新一代分布式融合存儲,支持四合一架構的融合存儲,用戶購買一套存儲享有文件、對象、大數據、視頻四種存儲服務,不同非結構化存儲服務間可訪問同一份數據,融合存儲空間利用效率提升200%,實現用一套存儲架構高效支撐一個數據中心,滿足性能需求的同時,幫助企業降低TCO。

????????同時,在海量多模態場景,浪潮信息打造高密專有產品,采用4U60盤位配置,支持20TB大容量硬盤,單節點容量超1PB,一臺頂三臺;同時基于32+2大比例糾刪、數據縮減技術,硬盤利用率高達94%。

????????一套存儲平臺,加速數據處理和流動

????????無論是自動駕駛的路線決策,還是電商平臺的精準營銷,數字化醫療線上問診等數字化智慧應用,背后都離不開對海量圖片、文本、視頻等非結構化數據的采集、訓練、建模分析和決策,2023年實時數據已占到全球數據圈25%的份額。以高精地圖為例,高精地圖一般通過采集車每天采集、回傳數據進行分析刷新繪制,每輛車每天采集的數據達數十TB,實時回傳GPS、軌跡、速度、經緯度等多樣化數據,每秒處理千萬點位。性能,成為智慧應用永無止境的訴求。

????????新一代分布式融合存儲為了提升性能,在一套存儲平臺內推動盤控協同和全鏈路端到端性能優化,讓數據在熱溫冷冰四級存儲內高效互通、流動。AS13000G7搭配第四代英特爾至強CPU、自研PCIe 5.0 NVMe SSD,并通過RDMA協議、CPU專核專用、數據分區、隨機轉順序等技術的代碼級聯合調優實現性能的提升,單節點帶寬超過50GB/s,相當于一秒傳輸25部高清電影。相較上一代產品,AS13000G7新品性能至少提升40%。

????????一套存儲平臺 保障數據安全可靠

????????新一代分布式融合存儲從部件、器件、整機系統、核心軟件、管理軟件到解決方案,用六重保護確保服務永遠在線、數據永不丟失。在器部件層面,嚴選高可靠性的器件,圍繞可靠性去定制硬盤、SSD等部件。在集群層面,基于全對稱分布式架構,最大可擴展至10240節點,基于大比例彈性EC,最大可同時容忍任意4節點失效。

????????面向病毒和防勒索軟件的攻擊,推出了端到端的數據安全解決方案。首先,可以為用戶提供生產存儲、雙活存儲、異地備份的多重保護;其次,通過對讀寫行為的分析,預測勒索行為,即時終止惡意勒索行為并通過高密快照技術迅速恢復數據;再次,通過引入第三方殺毒軟件,殺滅勒索病毒;最后,通過數據防篡改技術、物理隔離技術、加密等技術,讓病毒進不來、改不了,數據看不到、帶不走,打造數據安全的最后一道防線。

參考:

http://www.dostor.com/p/84080.html

https://mp.weixin.qq.com/s/7-xDoN2JiR5HIKXjP5evWA

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/37907.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/37907.shtml
英文地址,請注明出處:http://en.pswp.cn/news/37907.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于WebSocket的在線文字聊天室

與Ajax不同,WebSocket可以使服務端主動向客戶發送響應,本案例就是基于WebSocket的一個在線聊天室,不過功能比較簡單,只能滿足文字交流。演示如下。 案例學習于b站up主,鏈接 。這位up主講的非常清楚,值得去學…

item_get_sales-獲取TB商品銷量詳情

一、接口參數說明: item_get_sales-獲取商品銷量詳情,點擊更多API調試,請移步注冊API賬號點擊獲取測試key和secret 公共參數 請求地址: https://api-gw.onebound.cn/taobao/item_get_sales 名稱類型必須描述keyString是調用key&#xff08…

Idea 快捷鍵整理

Idea快捷鍵和自動代碼補全匯總 idea快捷鍵匯總 Ctrl 快捷鍵說明Ctrl F在當前文件進行文本查找 (必備)Ctrl R在當前文件進行文本替換 (必備)Ctrl Z撤銷 (必備)Ctrl Y刪除光標所在行 或 刪除選中的行 &am…

設計HTML5圖像和多媒體

在網頁中的文本信息直觀、明了,而多媒體信息更富內涵和視覺沖擊力。恰當使用不同類型的多媒體可以展示個性,突出重點,吸引用戶。在HTML5之前,需要借助插件為網頁添加多媒體,如Adobe Flash Player、蘋果的QuickTime等。…

【C++精華鋪】6.C++類和對象(下)類與對象的知識補充及編譯器優化

目錄 1. 再談構造 1.1 成員變量的初始化(初始化列表) 1.2 初始化列表的行為 1.3 explicit關鍵字 2. 類中的static成員 2.1 靜態成員變量 2.2 靜態成員函數 3. 友元 3.1 友元函數 3.1 友元類 4. 內部類 5. 匿名對象 6. 對象拷貝時候的編譯器優化…

GitHub 打不開解決方案

GitHub 這幾年國內普通用戶越來越難以訪問,github 作為全球最大的開源平臺,里面有用的內容很多,不管是對專業用戶還是普通用戶,無法訪問都是很嚴重的問題。 1.GitHub 加速鏡像 kgithub 是一個公益加速項目,僅需在 gi…

【LeetCode每日一題】——41.缺失的第一個正數

文章目錄 一【題目類別】二【題目難度】三【題目編號】四【題目描述】五【題目示例】六【題目提示】七【解題思路】八【時間頻度】九【代碼實現】十【提交結果】 一【題目類別】 哈希表 二【題目難度】 困難 三【題目編號】 41.缺失的第一個正數 四【題目描述】 給你一個…

Compute shader SV 理解圖

本圖轉子:【Computeshader】個人總結_蔣偉博的博客-CSDN博客

【Rust】Rust學習 第十二章一個 I/O 項目:構建一個命令行程序

本章既是一個目前所學的很多技能的概括,也是一個更多標準庫功能的探索。我們將構建一個與文件和命令行輸入/輸出交互的命令行工具來練習現在一些你已經掌握的 Rust 技能。 Rust 的運行速度、安全性、單二進制文件輸出和跨平臺支持使其成為創建命令行程序的絕佳選擇…

談一談在兩個商業項目中使用MVI架構后的感悟

作者:leobertlan 前言 當時項目采用MVP分層設計,組員的代碼風格差異也較大,代碼中類職責賦予與封裝風格各成一套,隨著業務急速膨脹,代碼越發混亂。試圖用 MVI架構 單向流 形成 掣肘 帶來一致風格。 但這種做法不夠以…

linux系列基本介紹

雖然我們常說Linux操作系統,這種叫法是不正確的,嚴格意義上講,Linux并不是操作系統,而是屬于操作系統的一個內核,inux內核提供了操作系統的核心功能,如進程管理、內存管理、文件系統等。 Linux有很多不同的…

LeetCode 熱題 100 JavaScript--33. 搜索旋轉排序數組

整數數組 nums 按升序排列&#xff0c;數組中的值 互不相同 。 在傳遞給函數之前&#xff0c;nums 在預先未知的某個下標 k&#xff08;0 < k < nums.length&#xff09;上進行了 旋轉&#xff0c;使數組變為 [nums[k], nums[k1], …, nums[n-1], nums[0], nums[1], …,…

yolov5 轉換為rknn模型在3588上運行

為了把yolov5在rk3588上跑起來&#xff0c;在網上搜羅了一圈,踩了一些坑。由于瑞芯微的文檔有升級&#xff0c;導致和網絡的文章有出入&#xff0c;所以做個記錄。 rknn-toolkit 轉換文檔&#xff1a; 瑞芯微的轉換文檔在 rknn-toolkit/example/pytorch/yolov5/REAME.md 里 …

LangChain入門:構建LLM驅動的應用程序的初學者指南

LangChain & DemoGPT 一、介紹 你有沒有想過如何使用大型語言模型&#xff08;LLM&#xff09;構建強大的應用程序&#xff1f;或者&#xff0c;也許您正在尋找一種簡化的方式來開發這些應用程序&#xff1f;那么你來對地方了&#xff01;本指南將向您介紹LangChain&#x…

【Sklearn】基于邏輯回歸算法的數據分類預測(Excel可直接替換數據)

【Sklearn】基于邏輯回歸算法的數據分類預測(Excel可直接替換數據) 1.模型原理2.模型參數3.文件結構4.Excel數據5.下載地址6.完整代碼7.運行結果1.模型原理 邏輯回歸是一種用于二分類問題的統計學習方法,盡管名字中含有“回歸”,但實際上是一種分類算法。它的基本原理是通…

網絡基礎--ARP協議介紹

1、ARP作用 ARP&#xff08; Address Resolution Protocol&#xff0c;地址解析協議&#xff09;是將 IP 地址解析為以太網 MAC 地址&#xff08;或稱物理地址&#xff09;的協議。在局域網中&#xff0c;當主機或其它網絡設備有數據要發送給另一個主機或設備時&#xff0c;它必…

Java鷹眼軌跡服務 輕騎小程序 運動健康與社交案例

Java地圖專題課 基本API BMapGLLib 地圖找房案例 MongoDB 百度地圖鷹眼軌跡服務 鷹眼軌跡服務概述 鷹眼是一套軌跡管理服務&#xff0c;提供各端SDK和API供開發者便捷接入&#xff0c;追蹤所管理的車輛/人員等運動物體。 基于鷹眼提供的接口和云端服務&#xff0c;開發者可以迅…

前后端分離------后端創建筆記(05)用戶列表查詢接口(下)

本文章轉載于【SpringBootVue】全網最簡單但實用的前后端分離項目實戰筆記 - 前端_大菜007的博客-CSDN博客 僅用于學習和討論&#xff0c;如有侵權請聯系 源碼&#xff1a;https://gitee.com/green_vegetables/x-admin-project.git 素材&#xff1a;https://pan.baidu.com/s/…

Java通過文件流和文件地址下載文件

通過文件流下載文件 如何使用 MultipartFile 進行文件上傳、下載到本地&#xff0c;并返回保存路徑呢&#xff1a; import org.springframework.web.multipart.MultipartFile;import java.io.BufferedOutputStream; import java.io.FileOutputStream; import java.io.IOExcep…

Redis_緩存2_緩存刪除和淘汰策略

14.5 緩存數據的刪除和替換 14.5.1 過期數據 可以使用ttl查看key的狀態。已過期的數據&#xff0c;redis并未馬上刪除。優先去執行讀寫數據操作&#xff0c;刪除操作延后執行。 14.5.2 刪除策略 redis中每一個value對應一個內存地址&#xff0c;在expires&#xff0c;一個內…