阿里云攜手MiniMax構建云原生數倉最佳實踐:大模型時代的 Data + AI 數據處理平臺

MiniMax簡介

MiniMax是全球領先的通用人工智能科技公司。自2022年初成立以來,MiniMax以“與所有人共創智能”為使命,致力于推動人工智能科技前沿發展,實現通用人工智能(AGI)。MiniMax自主研發了一系列多模態通用大模型,包括MiniMax M1、Hailuo 02、Speech 2.5 和Music 01等,具備超長上下文處理能力,能夠理解、生成并整合包括文本、音頻、圖像、視頻和音樂在內的多種模態。自研模型的飛速進展,有力支撐了MiniMax的全球業務拓展。迄今,MiniMax的自研多模態模型及AI原生應用已累計為來自超過200個國家及地區的逾1.57億名個人用戶,以及來自超過90個國家及地區的50,000余名企業客戶以及開發者提供服務。

業務大數據實踐:數據驅動MiniMax業務高效迭代

業務痛點

自2024年起,MiniMax的海螺AI、MiniMax Audio和星野等業務在國內外迎來快速增長,用戶數據量呈現爆發式增長,快速攀升至數十PB級別,給數據平臺的建設帶來了諸多技術挑戰:

1、異構架構的效率瓶頸

  • 技術棧碎片化:前期MiniMax在國內和海外引入了不同云廠商,部署獨立數據平臺,需要開發團隊同時維護多套不同引擎的開發規范
  • 開發效率低:基于開源Dolphin Scheduler二次開發自建大數據治理工具,功能迭代和維護成本高,無法高效滿足快速發展的業務需求
  • 運維成本高:雙系統并行導致權限治理、資源監控、故障排查等運維工作需要跨平臺執行,管理成本線性增長

2、資源成本與利用率失衡

  • TCO高昂:部分云服務按量付費模式導致數據掃描、數據傳輸、計算節點運行時間等成本難以預測和控制
  • 資源利用率低:部分云服務成熟度不足,在大規模實時數倉等復雜場景下優化效果有限
  • 資源優化瓶頸:開源大數據組件的任務優化高度依賴人工經驗,調優工作耗費大量人力成本

阿里云原生數倉解決方案

阿里云協助MiniMax構建了全球一體化云原生數倉技術架構,該架構以阿里云數據開發治理平臺Dataworks作為一站式開發治理中樞,實現了異構數據源接入、流批計算融合、實時離線數據協同及數據生命周期全鏈路管理

1、數據源層

聚合多模異構存儲,覆蓋OLTP、非結構化數據及實時流數據

2、計算層

  • 數據治理:DataWorks實時數據集成提供異構數據源到數倉的一站式同步能力,具備完善的元數據管理、質量監控和權限管控功能

  • 實時計算:基于阿里云實時計算Flink版處理Kafka流式數據,支撐低延時實時處理

  • 實時數倉:Hologres支撐海量數據實時寫入、更新與分析,提供亞秒級響應能力

  • 離線數倉:MaxCompute承擔批量數據加工處理,支撐復雜離線分析場景

  • 數據檢索:Elasticsearch承載Flink處理后的近實時數據,滿足全文檢索和即席查詢需求

3、存儲層

對象存儲OSS作為冷數據存儲層,無縫對接MaxCompute,實現數據智能冷熱分層,優化成本與性能平衡

業務價值

基于阿里云云原生數倉解決方案,MiniMax構建了覆蓋全球業務的一體化數倉技術棧,依托高性能、低延時與 Serverless 快速彈性能力,為經營分析、用戶增長等關鍵業務場景提供了高效穩定的技術支撐。

1、數據入倉加速,決策效率提升

通過DataWorks可視化ETL實現數據源到Hologres的實時全量與增量同步,利用MaxCompute和Hologres的跨引擎數據聯邦能力,構建實時存儲與離線計算解耦架構,關鍵數據入倉時間提前約1小時,顯著提升業務決策時效性。

2、架構統一,運維效率提升

全球統一技術棧基于阿里云云原生數倉的Serverless存算分離架構,大幅降低運維復雜度,提升團隊交付效率。

3、穩定支撐大規模數據處理

基于DataWorks、 MaxCompute、Hologres等構建的一站式大數據平臺,實現開發、調度、運維與治理全鏈路統一管理,當前數據總量超數十PB,日均處理量達數百TB。

4、資源利用率優化,成本顯著降低

通過存算分離、算子優化等技術手段,計算資源用量降低50%,后續通過進一步優化計算資源利用率,計算資源用量整體降低75%;通過數據生命周期管理策略,存儲成本降低40%,實現性能與成本的最優平衡。

基于阿里云 MaxFrame 構建云原生數據流水線:賦能AI工作流加速

在大模型技術迅猛發展的背景下,數據與人工智能的深度融合已成為企業構建核心競爭力的關鍵要素。大模型訓練持續驅動大規模數據處理技術升級迭代,對計算彈性、預處理算子性能及統一數據治理體系提出了更高要求。基于 MiniMax 在阿里云云原生數倉解決方案上的深度業務實踐,雙方正持續探索更先進的大規模數據處理與AI融合解決方案,致力于通過阿里云MaxFrame等新一代計算框架,進一步提升數據處理效能,加速AI創新落地。

業務痛點

1、資源彈性瓶頸

模型訓練節奏快,常需臨時調用大規模彈性資源,對PB級數據進行短時高效預處理,并在任務完成后快速釋放資源。傳統架構難以兼顧資源彈性、處理時效與成本控制。

2、預處理算子性能不足

數據預處理過程中常出現文件大小限制、內存溢出(OOM)、全量MinHash去重任務無法完成等問題,導致作業成功率低、穩定性差,嚴重影響整體流程效率。

3、缺乏統一任務管理與可視化支持

原有流程依賴Python程序完成開發、調試與生產任務,缺少可視化任務開發、管理、調度和運維能力,多參數迭代效果評估困難,開發效率低下。

4、開發與運維人力投入受限

自研數據預處理(如Common Crawl數據集處理等)需投入大量人力進行開發與維護,團隊難以專注于核心AI業務創新。

解決方案

MiniMax基于阿里云MaxCompute構建了全托管、一站式 Data + AI 數據處理平臺,并通過MaxFrame分布式計算框架實現了對多類數據(結構化與非結構化、多模態等)的統一管理與彈性伸縮的大規模預處理能力:

1、阿里云自研分布式計算框架,統一 Python 開發生態,同時無縫對接MaxCompute 計算資源、數據;

2、提供兼容開源的分布式算子,如 Pandas、Minhash 等,大大提高數據處理效率;

3、支持分布式數據處理、離線推理等場景,構建 Data + AI 開發整體 Pipeline;

4、提供開箱即用的 Python 環境,支持用戶自定義鏡像,提供更便捷的開發體驗。

業務價值

通過引入MaxFrame分布式計算框架,MiniMax在資源利用率、處理效率與平臺架構方面實現顯著提升:

1、資源利用率顯著提高

  • 借助MaxCompute“包月固定資源+按需彈性資源”組合模式,MiniMax可根據業務周期靈活調配資源,高峰時段支持數十萬核計算資源的快速彈性擴展;

  • 實現計算資源利用率提升30%,在資源效率與成本間取得最優平衡;

  • 通過MaxCompute原生存儲冷熱分層能力,對低熱度大表自動實施低頻/長期存儲策略,歷史數據存儲成本降低40%。

2、分布式計算框架帶來性能突破

  • 基于MaxFrame構建的分布式計算架構替代原有開源方案,其內置高性能Minhash等優化算子,縮短大模型數據預處理任務耗時;

  • 加載FastText模型完成文本分類任務,利用MaxCompute彈性CPU資源執行批量推理,顯著提升處理效率。

3、數據平臺完成架構升級,運維效率提升

  • 基于MaxCompute MaxFrame構建國內外一體化Data+AI數據處理平臺,依托全托管云原生PaaS能力,顯著降低自研與維護成本,運維資源投入減少50%;

  • 實現開發、調度、運維閉環統一管理,支持多模態數據與復雜AI工作流的高效協同。

總結與展望

MiniMax與阿里云開展深度技術協同,在大模型時代成功構建了以云原生數據倉庫為核心的高效、低成本Data+AI一體化數據處理平臺,有效應對業務高速迭代與彈性擴展挑戰。該方案不僅實現了數據處理效能的顯著提升和運營成本的大幅優化,也為大模型驅動下的AI應用研發提供了可廣泛復用的工程范式。未來,雙方將持續深化在大模型數據預處理、多模態數據處理等前沿場景的聯合創新,共同推動Data+AI技術在全球范圍內的規模化產業應用。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/95520.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/95520.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/95520.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

一鍵生成PPT的AI工具排名:2025年能讀懂你思路的AI演示工具

人工智能正在重塑PPT制作方式,讓專業演示變得觸手可及。隨著人工智能技術的飛速發展,AI生成PPT工具已成為職場人士、學生和創作者提升效率的得力助手。這些工具通過智能算法,能夠快速將文本、數據或創意轉化為結構化、視覺化的演示文稿&#…

數據庫基礎知識——聚合函數、分組查詢

目錄 一、聚合函數 1.1 count 1.1.1 統計整張表中所有記錄的總條數 1.1.2 統計單列的數據 1.1.3 統計單列記錄限制條件 1.2 sum 1.3 avg 1.4 max, min 二、group by 分組查詢 2.1 語法 2.2 示例 2.3 having 一、聚合函數 常用的聚合函數 函數說明count ([distinc…

改 TDengine 數據庫的時間寫入限制

一 sql連數據庫改 改 TDengine 數據庫的時間寫入限制 之前默認了可寫入時間為一個月,調整為10年,方便測試: SHOW DATABASES;use wi; SELECT CONCAT(ALTER TABLE , table_name, KEEP 3650;) FROM information_schema.ins_tables WHERE db_…

數碼視訊TR100-OTT-G1_國科GK6323_安卓9_廣東聯通原機修改-TTL燒錄包-可救磚

數碼視訊TR100-OTT-G1_國科GK6323_安卓9_廣東聯通原機修改-TTL燒錄包-可救磚刷機教程數碼視訊 TR100-G1 TTL 燒錄刷機教程固件由廣東聯通 TR100-G1 28 原版修改,測試一切正常1、把刷機文件解壓出 備用,盒子主板接好 TTL,不會接自行查找 TTl 接…

TVS防護靜電二極管選型需要注意哪些參數?-ASIM阿賽姆

TVS防護靜電二極管選型關鍵參數詳解TVS(Transient Voltage Suppressor)二極管作為電路防護的核心器件,在電子設備靜電防護(ESD)、浪涌保護等領域發揮著重要作用。本文將系統性地介紹TVS二極管選型過程中需要重點關注的參數指標,幫助工程師做出合理選擇。…

項目經理為什么要有一張PMP?認證?

在項目管理日益成為企業核心競爭力的今天,PMP已成為項目經理職業發展的重要“通行證”。這張由美國項目管理協會(PMI)頒發的全球公認證書,不僅是專業能力的象征,更在職業競爭力、項目成功率、團隊協作等多個維度為項目…

Qt中QSettings的鍵值使用QDataStream進行存儲

1. QDataStream介紹 數據流是編碼信息的二進制流,與主機的操作系統、CPU 或字節順序完全無關。例如,Windows 系統下 PC 寫入的數據流可由運行 Solaris 的 Sun SPARC 讀取。 您還可以使用數據流讀/寫raw unencoded binary data 。如果需要 "解析 &…

Typer 命令行工具使用示例

Typer 命令行工具使用示例 示例1:簡單問候程序 代碼 import typerapp typer.Typer()app.command() def greet(name: str):"""簡單的問候命令"""typer.echo(f"Hello {name}!")if __name__ "__main__":app()使用…

關于CAN總線bus off 理論標準 vs 工程實踐

我是穿拖鞋的漢子,魔都中堅持長期主義的汽車電子工程師。 老規矩,分享一段喜歡的文字,避免自己成為高知識低文化的工程師: 做到欲望極簡,了解自己的真實欲望,不受外在潮流的影響,不盲從,不跟風。把自己的精力全部用在自己。一是去掉多余,凡事找規律,基礎是誠信;二是…

CAN堆棧

PDU映射到HOH將硬件對象句柄HOH抽象成為硬件抽象層CanIf將pdu映射到硬件對象句柄上一個HOH代表一個Can控制器的一個消息緩沖區發送緩存區當所有Can硬件資源被占用時,LPDU存儲在緩沖區中。發送取消為了解決優先級反轉的問題,高優先級L-PDU會請求取消低優先…

sub3G和sub6G的區別和聯系

Sub-3G 和 Sub-6G 的區別與聯系Sub-3G 和 Sub-6G 是無線通信中頻段的不同分類,尤其在4G LTE和5G網絡中,定義了無線信號傳輸的不同頻率范圍。具體來說,Sub-3G 通常指的是低于3 GHz的頻段,而 Sub-6G 是指低于6 GHz的頻段。這些頻段的…

【數據可視化-106】華為2025上半年財報分析:用Python和Pyecharts打造炫酷可視化大屏

🧑 博主簡介:曾任某智慧城市類企業算法總監,目前在美國市場的物流公司從事高級算法工程師一職,深耕人工智能領域,精通python數據挖掘、可視化、機器學習等,發表過AI相關的專利并多次在AI類比賽中獲獎。CSDN…

Scikit-learn Python機器學習 - 特征預處理 - 歸一化 (Normalization):MinMaxScaler

鋒哥原創的Scikit-learn Python機器學習視頻教程: 2026版 Scikit-learn Python機器學習 視頻教程(無廢話版) 玩命更新中~_嗶哩嗶哩_bilibili 課程介紹 本課程主要講解基于Scikit-learn的Python機器學習知識,包括機器學習概述,特征工程(數據…

LINUX_Ubunto學習《2》_shell指令學習、gitee

0、前言: 0.1、為什么學習shell腳本 學習Shell(Shell腳本編程)是提升系統管理和開發效率的重要技能,尤其在Linux/Unix環境中作用顯著。Shell是用戶與操作系統內核的接口,學習Shell有助于掌握系統工作原理。shell的核心…

系統安裝與遷移工具,一鍵下載系統并制作U盤啟動盤

大家好,今天想跟大家分享一款非常實用的軟件——Hasleo WinToUSB 下載地址獲取 點擊獲取:WinToUSB啟動盤 打開后的界面; image Windows To Go USB 可以安裝或克隆 Windows 到 USB 設備,作為便攜式 Windows 使用 可以選擇直接用…

日語學習-日語知識點小記-構建基礎-JLPT-N3階段(26):文法+單詞第8回3 復習 +考え方6

日語學習-日語知識點小記-構建基礎-JLPT-N3階段(26):文法單詞第8回3 復習1、前言(1)情況說明(2)工程師的信仰2、知識點1ー V辭書形 + ことができます。2ーこの橋、&am…

AM J BOT | 黃芪穩健骨架樹構建

Astragalus(黃芪屬,豆科,含約 3,400 種)是最大的被子植物屬之一,其多樣化在北半球多個地區的植被形成與生物多樣性格局中扮演了重要角色。然而,由于屬內物種數量龐大、形態復雜且演化歷史可能受到網狀進化的…

if __name__=‘__main__‘的用處

在 Python 中,if __name__ __main__:是一個常見的代碼模式,用于控制模塊的執行行為。它的核心作用是區分模塊是被直接運行還是被導入到其他文件中。作用詳解:?當文件被直接運行時?__name__會被自動設置為 __main__,此時 if塊內…

MySQL慢查詢優化策略

一、問題定位 1、慢查詢日志 -- 查看當前設置 SHOW VARIABLES LIKE slow_query%; ? -- 開啟慢查詢日志(my.cnf永久配置) [mysqld] slow_query_log 1 slow_query_log_file /var/log/mysql/slow.log long_query_time 1 -- 超過1秒的查詢 log_querie…

如何使用 ASP.NET Core 創建基于角色的 Web API

在使用 ASP.NET Core 構建基于角色的 Web API 時,代碼優先方法是一種強大而高效的方法。使用它,我們可以在代碼中定義數據模型和關系,然后自動生成相應的數據庫模式。這會帶來什么?當然是更快的開發周期和更大的靈活性。為什么&am…