鷹角網絡基于阿里云 EMR Serverless StarRocks 的實時分析工程實踐

一、客戶背景與業務挑戰

1.1 客戶介紹

鷹角網絡(HYPERGRYPH) 成立于2017年,總部位于上海,是中國知名游戲研發與發行公司,代表產品包括現象級手游《明日方舟》及《泡姆泡姆》《來自星辰》《終末地》等。公司依托阿里云構建數據平臺,支撐游戲運營、社區生態及用戶行為分析等核心業務,數據規模與實時性需求持續增長。

1.2 業務特征

  • 目前實時業務主要涉及日志分析,廣告歸因,社區運營,審核等
    • 賬號日志分析:涉及用戶注冊、登錄、訂單等明細數據的查詢。
    • 廣告歸因:探查用戶的新增和回流是否由某條廣告導致。
    • 社區運營:實時流水、新增活躍等統計信息。
    • 審核:黑產、賬號封禁等數據分析。

1.3 原有架構痛點

原有架構是基于ClickHouse構建的實時數倉,存在以下瓶頸:

  1. 運維復雜度高:動態擴縮容操作繁瑣,集群穩定性受負載波動影響顯著;
  2. 導入性能不足:高頻實時寫入場景下吞吐量受限,難以支撐高QPS需求;
  3. 數據一致性風險:分布式表缺乏事務保證,查詢可能因節點延遲導致結果偏差;
  4. 計算模型局限:Scatter-Gather架構不支持Shuffle Join等復雜查詢操作;
  5. 元數據穩定性差:ZooKeeper維護的元數據在高負載下易引發服務抖動。

二、技術方案設計

2.1 方案目標

構建高性能、高彈性、易運維的實時分析平臺,需要滿足以下業務訴求:

  • 實時性:毫秒級查詢響應與秒級數據寫入
  • 彈性擴展:動態適配業務流量波動(如游戲開服、活動峰值)
  • 穩定性:消除集群負載抖動與數據一致性風險
  • 兼容性:無縫銜接現有工具鏈與開發習慣

2.2 架構設計

整體架構圖

實時數倉架構
  1. OLTP 源庫
    ? MySQL 等業務數據庫,產生行級變更。
  2. Extract(采集)
    ? Debezium / Kafka-Connect 做 CDC,把 Binlog 轉為 事件流。
    ? 寫入 Kafka,完成緩沖與解耦。
  3. Transform(實時計算)
    ? Flink 從 Kafka 讀取,進行清洗、JOIN、聚合,生成事實/維度結果流。
  4. Load & Query(StarRocks)
    ? StarRocks 負責列式存儲 + 高并發 OLAP 查詢,直接服務 BI、報表、自動查詢工具和 API

三、遷移成效與價值

3.1 技術層面

  • 性能提升
    • 核心查詢響應時間縮短30%以上,復雜廣告歸因分析從分鐘級降至秒級;
    • 高峰期QPS承載能力提升5倍,支撐夏活活動期間百萬級并發請求;
  • 穩定性增強
    • 集群負載波動率降低40%,徹底解決ClickHouse的節點延遲問題;
    • 99.99% SLA保障,故障恢復時間(MTTR)縮短至分鐘級;
  • 運維效率
    • 無感擴縮容操作,開服期間資源伸縮成功率100%;
    • 自動化監控覆蓋主要異常場景,人工干預減少70%。

3.2 財務層面

  • 成本優化
    • 相比ClickHouse集群,同等負載下硬件成本下降22%,CU單價性價比提升顯著;
    • Serverless模式按需付費,避免資源閑置浪費。

3.3 業務層面

  • 開發效率提升
    • MySQL協議兼容性減少適配成本,SQL語法更貼近業務直覺;
    • 內置函數庫覆蓋90%業務場景,UDF開發效率提升50%;
  • 生態適配性
    • 開源社區活躍度高,相比于原有的Clickhouse,StarRocks對于關鍵Bug修復與新特性迭代周期縮短。

四、未來規劃

  1. 存算分離架構:探索遷移至存算分離實例,降低冷熱數據存儲成本;歡迎使用存算分
    離版實例
  2. 權限管理強化:引入Ranger實現細粒度訪問控制,滿足合規要求;
  3. 多模態分析:逐步遷移原有ElasticSearch業務,整合全文檢索與結構化查詢能力。

五、總結

通過與阿里云EMR Serverless StarRocks的深度合作,鷹角網絡成功構建了兼具高性能、高彈性、易運維的實時分析平臺,為游戲業務的精細化運營與用戶洞察提供了堅實支撐。未來,雙方將持續探索技術邊界,推動實時數據價值釋放,助力企業在游戲行業競爭中保持技術領先優勢。

相關文檔:
1. 遷移ClickHouse數據到StarRocks的最佳實踐?

2. 基于EMR Serverless StarRocks構建分鐘級準實時分析

3. 快速使用EMR Serverless StarRocks 存算分離版實例

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/96545.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/96545.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/96545.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

LWIP的IP 協議棧

IP 協議棧 下面的分析把上文對 IPv4 概念的說明與 lwIP 中的具體實現代碼對應起來,便于將理論與實現對照理解。分析覆蓋:輸入處理、路由與轉發、輸出與報文構建、分片/重組、校驗和與各種配置點(hook、選項、統計等)。目錄&#x…

高并發短信網關平臺建設方案概述

本方案涵蓋了架構設計、技術選型、核心功能、高可用保障以及實施路徑,旨在構建一個能夠應對千萬級日吞吐量、穩定、安全、可擴展的現代短信網關平臺。 高并發短信網關平臺建設方案 一、 項目概述與目標 1.1 項目背景 為滿足公司業務(如用戶注冊、登錄、交易驗證、營銷通知…

阿里云服務-開啟對象存儲服務及獲取AccessKey教程

(1)阿里云OSS簡介 (2)打開阿里云網址:阿里云登錄 - 歡迎登錄阿里云,安全穩定的云計算服務平臺 點擊“立即開通” (2)開通成功后,充值任意金額 頂欄選擇“費用”|“充值…

[特殊字符] 高可用高并發微服務架構設計:Nginx 與 API Gateway 的協同實踐

一、Nginx 和 Gateway 的關系:是替代還是協作? 不是替代關系,而是協作關系。 1. Nginx 的角色(通常在最外層) 反向代理 & 負載均衡:將前端請求分發到多個后端服務或網關實例。 靜態資源服務&#xf…

解碼LLM量化:深入剖析最常見8位與4位核心算法

解碼LLM量化:深入剖析8位與4位核心算法 大型語言模型(LLM)的性能日益強大,但其龐大的體積和高昂的計算成本構成了部署的主要障礙。模型量化,作為一種將高精度浮點權重(如16位)映射到低位寬整數&…

提問:溫度不改變 logits 與概率的排名,為何還會影響模型輸出?

你此前圍繞溫度的核心困惑始終是:“溫度不改變 logits 與概率的排名,為何還會影響模型輸出?” 以下總結將緊扣這一困惑,并重點補充核采樣(Top-p)在其中的作用,明確溫度與核采樣如何共同影響輸出…

【文獻閱讀】Lossless data compression by large models

1. 中華人工智能研究中心,鄭州。 2. 鵬程實驗室,深圳。 3. 上海數學與交叉學科研究所,上海。 4. 中國科學院計算技術研究所,北京。 5. 寧波人工智能產業研究所,寧波。 6. 滑鐵盧大學計算機科學學院,加拿大安…

注意力機制:捕獲長距離依賴關系的革命性技術

本文由「大千AI助手」原創發布,專注用真話講AI,回歸技術本質。拒絕神話或妖魔化。搜索「大千AI助手」關注我,一起撕掉過度包裝,學習真實的AI技術! ? 1. 注意力機制概述:為什么需要關注"長距離依賴&qu…

PHP如何使用JpGraph生成柱形圖?

PHP使用JpGraph庫生成各類統計圖形具有顯著優勢,該庫作為專業的PHP圖表生成工具,能夠高效創建包括折線圖、餅圖、散點圖在內的多種數據可視化圖形,其核心價值在于提供了豐富的圖形定制能力和簡潔的API接口。JpGraph通過純PHP實現,…

免費的端口映射工具 ChmlFrp

免費的端口映射工具 ChmlFrp 前言:之前我寫過一篇關于cloudflare tunnel的使用教程,ChmlFrp是一個類似的工具,也可以用來進行內網穿透 我的博客對應文章地址 1.注冊賬號 注冊地址 點擊這個鏈接前往官網注冊一個賬號,過程簡單&…

遙感領域解決方案丨涵蓋:高光譜、無人機多光譜、空天地數據識別與計算

一:AI智慧高光譜遙感實戰:手撕99個案例項目、全覆蓋技術鏈與應用場景一站式提升方案在遙感技術飛速發展的今天,高光譜數據以其獨特的光譜分辨率成為環境監測、精準農業、地質勘探等領域的核心數據源。然而,海量的波段數據、復雜的…

中科米堆CASAIM自動化三維測量設備測量汽車殼體直徑尺寸

隨著新能源汽車產業向輕量化與高集成度發展,殼體作為電池組和電驅系統的核心承載部件,其孔位加工精度直接影響裝配密封性及結構強度,傳統人工測量方式已難以滿足現代化生產需求。自動化三維測量設備的引入,為汽車殼體直徑尺寸測量…

08.21總結

圓方樹 引入 我們注意到,樹結構相比普通圖具有諸多優良特性。若能將在無向圖上求解的問題轉化為樹結構問題,往往能大幅簡化求解過程。圓方樹正是實現這一轉化的有效工具。 定義 我們稱原圖中的點為"圓點"。通過引入方點并調整邊的關系&#xf…

亞馬遜廣告優化新邏輯:從人工苦力到AI智能的進化之路

"為什么我的廣告花費越來越高,轉化卻越來越差?""如何在海量關鍵詞中找到真正能帶來轉化的黃金詞?""為什么手動調整出價總是跟不上流量變化的速度?""怎樣才能避免因庫存問題導致的廣告權重暴跌…

【51單片機】【protues仿真】基于51單片機水位監測系統

目錄 一、主要功能 二、使用步驟 三、硬件資源 四、軟件設計 五、實驗現象 一、主要功能 1、數碼管顯示當前水位值 2、按鍵設置水位上下限閾值 3、當水位低于下限,啟動蜂鳴器警報并抽水至水位上限停止抽水 4、電機模擬水泵,蜂鳴器,指示…

白名單過濾的文件上傳如何bypass:boot2root靶機之fristileaks

靶機提示 base64解碼提取圖片 文件上傳之apache多后綴名解析漏洞 linpeas dirtycow提權 靶機下載 通過網盤分享的文件:FristiLeaks_1.3.ova 鏈接: https://pan.baidu.com/s/1ZWznp8egNGwnQqwh1gkSZg?pwdwwvp 提取碼: wwvp --來自百度網盤超級會員v8的分享主…

Centos 8 管理防火墻

firewall-cmd 檢查與安裝 在 CentOS 8 上安裝和啟用 firewalld(提供 firewall-cmd 工具)的步驟如下:1. 檢查 **firewalld** 是否已安裝 在安裝前,先檢查系統中是否已安裝: sudo firewall-cmd --version如果返回版本號&…

使用PPT進行科研繪圖過程中常用的快捷鍵

PPT科研繪圖常用快捷鍵速查表功能類別快捷鍵功能描述基礎操作與選擇Ctrl A全選幻燈片上的所有對象。Ctrl D快速復制選中的對象,并自動保持等間距排列。Shift Click多選多個對象。Ctrl G將選中的多個對象組合成一個整體。Ctrl Shift G取消組合。Ctrl 拖動復制…

`strchr` 字符串查找函數

1) 函數的概念與用途 strchr 是 C 標準庫中的一個基礎但極其重要的字符串處理函數,它的名字來源于"string chracter"(字符串字符)。這個函數的功能非常明確:在字符串中查找特定字符的第一次出現位置。 可以將 strchr 想…

Redis 678

Redis 8 是當前的最新穩定版(截至 2024 年中),它在 Redis 7 的基礎上帶來了更多重要改進。我們來對這三個主要版本進行一次全面的功能和性能對比。 核心演進脈絡 Redis 6 (2020):多線程時代的開創者。解決了網絡 I/O 瓶頸&#xf…