在 “十四五”?規劃全面推進國產化替代的背景下,某大型電網企業聯合鏡舟科技與騰訊云,基于全球領先的開源分析型數據庫 StarRocks 及騰訊 TBDS 大數據平臺,構建電力行業國產化湖倉一體架構。該項目實現 PB 級電力數據的統一管理,為能源行業核心系統國產化升級提供了可復制的技術范本。
數字電力正面臨日益復雜的數據挑戰
隨著數字化轉型深入推進,該電網企業作為服務超 2.5 億用戶的特大型能源企業,面臨著日益復雜的數據管理挑戰:
- 數據鏈路復雜,時效性低:數據供給路徑冗長,導致延遲高,無法滿足實時性要求。
- 資源瓶頸:計算集群資源緊張,CPU 和 IO 高負載,限制了性能擴展。
- 高并發挑戰:先有的業務大量使用寬表設計,查詢并發壓力劇增,現有架構難以支撐。
- 融合計算能力不足:數據分散,跨集群融合計算能力缺失,限制了個性化需求支持。
- 數據治理難度大:全域的數據資產建設,沒有統一的主題劃分,數據分散。
解決方案:基于 StarRocks+TBDS 構建統一數據平臺
作為 StarRocks 核心商業化公司,鏡舟科技聯合騰訊云為該電網企業設計了一套分層漸進式的技術升級方案。
該方案核心在于優化數據鏈路,通過縮短供給路徑并引入實時分析引擎,有效提升數據時效性。同時,通過擴展集群規模提升資源利用率,解決計算資源瓶頸問題。
針對高并發查詢壓力,鏡舟團隊對查詢引擎進行深度優化,增強緩存機制和負載均衡能力。此外,通過構建統一數據平臺,實現跨集群數據整合和計算,滿足多樣化的分析需求,并為數據治理奠定堅實基礎。
在該電網企業實際業務場景下的 POC 測試中,StarRocks 展現了顯著的性能優勢:現網系統查詢耗時:1513 秒,StarRocks 查詢耗時:0.176 秒,實現近 8600 倍的查詢加速。
1. 基于 StarRocks+TBDS 的湖倉技術架構
該電網企業的湖倉架構包含四個關鍵層次,包含從數據采集到業務應用的全鏈路:
- 數據接入層:Flink 實時數據處理
- 數據湖存儲:騰訊 TBDS(Iceberg 表格式)
- 分析加速層:StarRocks 多集群(存算一體 + 存算分離)
- 業務應用層:SmartBI 等可視化工具
2. 關鍵技術提升整體性能
方案實施過程中,團隊重點解決了三大技術難題,確保系統平穩過渡的同時提升整體性能:
1. 國產化適配驗證:
完成包括海光芯片和麒麟 V10 操作系統在內的全棧國產化適配驗證,保障系統在國產化基礎設施上的穩定運行。
2. 業務平滑遷移:
通過支持 Greenplum 語法兼容,成功保障了存量業務的平滑遷移,并利用多集群架構實現了網級與省側業務高效協同。
3. 湖倉數據統一協同:
基于騰訊 TBDS 數據湖構建統一元數據目錄,同時借助 Flink 實現實時數據入湖,StarRocks 提供強大的分析加速能力,形成完整的數據流轉與處理閉環。
StarRocks 數據底座:電力業務騰飛的新引擎
此次升級幫助該電網企業進一步構建統一的基礎數據底座,為各業務平臺提供數據存儲、處理、治理、建模和計算分析等全數據生命周期能力服務,支撐網省各級單位數據應用需求。
- 業務連續性保障:StarRocks 兼容 Greenplum 近 10 萬條 SQL 語法。支持漸進式改造,存算分離與存算一體混合部署模式靈活可選。
- 架構擴展性提升:多集群架構實現分散 MPP 集群的統一納管,彈性擴縮容能力適配業務增長需求。
- 技術自主可控:全國產化技術棧(海光芯片 + 麒麟系統),并與騰訊 TBDS 實現數據湖管理標準統一。
未來,鏡舟科技將持續完善 StarRocks 與騰訊 TBDS 的深度協同,為關鍵行業提供安全可靠的數據基座。
鏡舟科技:企業級數據分析基座構建者
作為 StarRocks 開源項目的主要貢獻者及商業化領軍企業,鏡舟科技基于 “開源 + 商業化” 雙引擎模式,通過企業級產品鏡舟數據庫(Mirrorship)為企業級用戶打造專業的 Lakehouse 解決方案:
- 技術領先性:鏡舟數據庫支持 PB 級實時分析的分布式數據庫,同時鏡舟科技技術團隊深度參與 StarRocks 開源社區建設,并基于此給企業級用戶提供更多技術保障。
- 行業實踐經驗積累:鏡舟科技已成功支撐金融、智能制造等領域的數據分析平臺建設,企業級客戶已覆蓋超百家頭部企業。