在 AWS 上重構數據中臺,這家出海企業選擇了數棧

2024年,袋鼠云接到了一個不小的挑戰。

一家貨幣交易所的技術負責人在通話里直接說:“我們現在業務都跑在 AWS(亞馬遜云平臺)?上了,你們的產品(數棧大數據平臺)能不能不改代碼直接跑在 AWS 上?最好別重學。能跑,還得跑得快。”

出海浪潮下,這樣的需求并不稀奇。真正能在 AWS 上 做到“穩定、高性能、權限閉環、體驗一體化”的大數據產品,至今仍是少數。這要求中國的技術公司開始走入一個新戰場——不能再是提供“給中國客戶用的技術”,而是需要適配全球主流云廠商的底層邏輯,用一種全球通用的方式去可靠交付。

所以袋鼠云在全面開啟出海戰略之后,下定決心不僅要讓數棧能跑在 AWS 上,還要在 AWS 上跑得好

不是兼容AWS,而是重做一遍適配體系

對大多數國產數據平臺來說,“適配 AWS”的第一步就是找兼容層:看看 EMR 支不支持 Spark、Flink 能不能訪問 Hdfs,S3或者向Yarn提交任務,再配點訪問策略,就認為大功告成了。

但會很快發現,這種兼容,是一種“不確定性”的存在。

比如:S3 是最終一致性,任務寫完數據后,別的任務讀不到;Flink 的 checkpoint 寫 S3 時丟失元數據;Glue 的 Catalog 怎么都連不上 Hive 元數據;權限策略在多個服務之間不通……

客戶想要的是“業務跑得起來”,但工程師面對的,是“生態全斷裂”。

于是袋鼠云決定重新來過。不是兼容 AWS,而是跟它“合拍”:真正理解 AWS 的每一層能力——從存儲->調度->元數據,從AK&SK->IAM Roles認證——并逐層打通。

這不是插件級適配,而是系統級改造。

數棧對接訪問AWS-EMR的認證、調度、元數據訪問鏈路圖

打造一套“全球化的數據中臺”

開頭提到的貨幣交易所的客戶最終成為了數棧的首批 AWS 適配合作用戶。項目初期,他們面臨的典型問題不止一個:

  • 數據調度工具三天兩頭掛,沒人知道任務跑沒跑完;

  • 計算引擎寫入 S3 的數據總有一致性問題,結果算出來總感覺差一口氣;

  • 每個業務線的數據自己接、自己處理、自己維護,一套數據平臺成了十幾塊孤島。

在袋鼠云看來,這不是產品的問題,而是出海數據基礎設施“整體系統性”的問題

數棧在 AWS 上的適配目標,是搭建一套真正“全球可用”的數據中臺能力。所以我們拆開了五個維度,逐一重構。

存儲適配:不只是能讀寫 S3,而是要“寫得穩、讀得快、控得細”

S3 是 AWS 上的默認存儲選項,但它有個常被忽略的特性——最終一致性。這意味著,你剛寫進去的數據,不一定立刻能讀到。對于流處理、調度依賴、實時寫入的作業來說,這幾乎是“隱形炸彈”。

客戶之前用的是開源 Hadoop 的 S3AFileSystem 接入方式,讀取慢、目錄雜亂、偶發數據“看不見”。袋鼠云對接了 AWS 的原生優化版本?EmrFileSystem的方式,徹底解決了這個問題。

EmrFileSystem讀寫 HDFS配置

EMRFS 有三點關鍵優勢:

  • 支持 強一致性視圖(Consistent View),寫完立馬能讀,Flink/Spark 流任務更穩定;

  • 支持?目錄緩存與智能分段上傳,大文件寫入快、列表速度更快;

  • 支持與 IAM 和 Lake Formation 聯動的權限管控,讓“讀寫誰的數據”不再靠腳本設權限。

計算整合:不只是跑得動 Spark/Flink,而是自動彈性、精細調度

客戶的數據處理任務很雜,有周期性批量任務,有高頻流式計算,還有一些重資源的查詢任務。最早他們用開源集群,調度器負載高就卡死,恢復得靠“看運氣”。

袋鼠云幫助他們把核心任務運行在?EMR on EC2 集群上,也就是 AWS 原生的彈性 Hadoop/Spark 平臺。數棧的調度系統自動識別任務資源需求,提交給 EMR,系統會自動拉起集群、運行任務、再釋放資源。

AWS EMR集群對接

對客戶而言,效果非常直觀:

  • 計算資源彈性拉升,不用擔心凌晨高峰資源不夠;

  • 作業失敗自動重試+告警,運維壓力大幅下降;

  • EMR 成本按分鐘計費,資源利用率提升 40%+。

一句話總結就是:以前靠人盯著調度器跑,現在調度器自己知道怎么跑最合適

?元數據對接:用 Glue Catalog 做平臺級數據資產管理器

元數據聽起來抽象,但對于有幾十上百個表、成千上萬個字段的業務平臺來說,“我有哪些表?結構是不是最新的?別的團隊能不能也用?”這就是數據工程的真實日常。

數棧原本用自建?Hive Metastore?管理表結構,遷到 AWS EMR后,我們對接了 Glue Catalog,把所有表的結構、分區、存儲路徑、Schema?變更,統一托管到 Glue 里。

Glue Catalog數據源構建

Glue Catalog元數據構建

這帶來兩個立竿見影的好處:

  • 不用再維護一個獨立的元數據庫,Glue 是 serverless 的,自動托管、高可用;

  • 所有在 S3、Redshift、Athena 上的數據分析工具,都可以用 Glue 的元數據,真正實現數據資產“一處定義、處處可用”。

而且 Glue 自帶自動 Schema 爬蟲(Crawler),文件一落地,表結構自動生成,再也不需要工程師人肉注冊。

權限控制:不是“能防”,而是“可管理、可審計、可精細分發”

數據權限在出海場景里從不是錦上添花,而是剛需,尤其是面向多團隊、多角色甚至多租戶的系統。

通過AK&SK的方式構建Glue Catalog

袋鼠云能夠支持AK&SK和IAM的認證以及結合IAM Poclic+數據庫自身權限管理實現資源+數據庫級別的訪問控制:

  • 安全效果得到增強,IAM+數據庫雙重認證,憑證泄密也無法通過非法IP進行訪問,能夠實現最小權限的安全落地。

  • 運維管理能力提升,統一的身份管理,基于IAM策略實現動態授權,通過aws審計報告自動生成來提神自動化水平。

  • 業務合規效果增強,滿足了監管需求,實現了多租戶隔離防止跨租戶泄密,審計日志的追蹤鏈路完整。

  • 成本優化效果明顯,資源利用率提升,運維成本降低,安全事件損失減少。

這讓客戶在面對“誰能看交易金額、誰能查鏈上地址”這樣的問題時,不用再靠信任——權限系統自己就能給出答案

產品體驗:界面沒變,但能力變了

袋鼠云做了那么多 AWS 原生集成,對客戶來說最直觀的感受其實是:“體驗沒變。”

拖拽建模、任務調度、血緣分析、實時開發、資產管理……界面還是那個數棧,學習成本沒有提升。但背后的一切都已經跑在 AWS 上,跑得更穩定、更彈性、更安全。

實時開發Catalog管理

客戶說:“用你們的產品,我不用去理解 EMR 里 Spark 怎么配置,Glue Catalog 怎么建表,權限策略怎么穿透,這就夠了。”

出海這件事,技術不能只是“能跑”

“能跑”,是底線;“能跑好”,才是出海平臺的基本功。

數棧與 AWS 的聯合適配,不是為了解決某一個技術問題,而是為了解決出海企業在 “高彈性 + 高安全 + 高治理要求”環境下構建統一數據中臺的需求。

袋鼠云不想把國產技術硬搬過去,而是要在全球通用的云體系下,讓真正想在海外落地的數據業務,有一塊穩定、彈性、好用的“數字地基”。

這不是兼容,這是重構。這不是跑通,而是跑贏。

越來越多的中國企業正在走向全球,這也是數棧為什么要在 AWS 上,重做一遍中臺的真正原因。袋鼠云相信,真正的出海能力,絕不是簡單的“向外復制”,而是深度嵌入全球云生態、以業務為核心進行技術重構。未來,數棧還會繼續拓展全球主流云平臺的適配能力,為更多出海企業構建屬于他們的全球數智基建。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/86503.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/86503.shtml
英文地址,請注明出處:http://en.pswp.cn/web/86503.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

STM32CubeIDE中文注釋變亂碼終極解決方案:3步設置永久解決錕斤拷問題!

STM32CubeIDE中文注釋變亂碼終極解決方案:3步設置永久解決錕斤拷問題! 前言簡述問題STM32CubeIDE的設置STM32CubeIDE軟件的設置當前工程設置 最重要的一環——添加環境變量重要秘方具體做法 前言 你是否在STM32CubeIDE中遇到過這樣的崩潰場景&#xff1…

Windows VMWare Centos環境下安裝Docker并配置MySql

虛擬機安裝 官網下載Centos Stream 10系統鏡像 安裝了Minimal版,Terminal中粘貼、復制指令不方便,又新建了虛擬機,安裝GUI版 終端輸入指令報錯修復 輸入指令報錯:failed to set locale defaulting to C.UTF-8,安裝語言…

AI能力集成設計與Prompt策略

AI能力集成設計與Prompt策略 在智能客服系統中引入AI能力,必須建立一套架構化、可擴展的AI服務集成體系,并根據不同業務場景制定Prompt策略,從而實現穩定、精準、高效的AI響應能力。 AI能力集成的關鍵組件設計 AI能力集成架構的核心在于通…

深入剖析 CVE-2021-3560 與 CVE-2021-4034:原理、區別與聯系

CVE-2021-3560 和 CVE-2021-4034 是 2021 年曝光的兩個 Linux 本地權限提升漏洞,均涉及 Polkit 組件。由于它們影響廣泛且利用門檻較低,迅速引起安全社區關注。本文將深入分析這兩個漏洞的技術原理、影響范圍、區別與聯系,并結合實際案例&…

Jupyter Notebook 完全指南:從入門到生產力工具

Jupyter Notebook 完全指南:從入門到生產力工具 Jupyter Notebook 已成為數據科學、機器學習和科研領域的標準工具,它完美結合了代碼、文檔和可視化功能。本文將帶您全面了解 Jupyter 的強大功能,并展示如何將其轉化為您的超級生產力工具。 …

HKDF密鑰派生原理與應用詳解

HKDF(HMAC-Based Key Derivation Function)是一種基于 HMAC(Hash-based Message Authentication Code)的密鑰派生函數,用于從原始密鑰材料(如共享密鑰、隨機數等)生成多個加密密鑰(如…

SpringBoot + MyBatis 事務管理全解析:從 @Transactional 到 JDBC Connection 的旅程

SpringBoot MyBatis 事務管理全解析:從 Transactional 到 JDBC Connection 的旅程 一、JDBC Connection:事務操作的真正執行者1.1 數據庫事務的本質1.2 Spring 與 Connection 的協作流程 二、從 Transactional 到 JDBC Connection 的完整鏈路2.1 Spring…

Wpf之應用圖標的修改!

前言 Wpf之應用圖標的修改! 一、修改步驟 1、準備好ico圖片。 2、右鍵項目》點擊屬性 3、找到win32資源點擊 4、點擊瀏覽找到ioc圖標 5、點擊運行程序 6、右鍵項目點擊打開在資源管理器中打開 找到以下路徑 在該路徑下能看到.exe文件的圖標已經改成你想要的…

Spring Boot整合Redis指南

一、環境準備 在開始整合前&#xff0c;請確保已完成以下準備工作&#xff1a; 已安裝Redis服務&#xff08;安裝指南&#xff09;創建好Spring Boot項目 二、添加依賴 在項目的pom.xml中添加以下依賴&#xff1a; <!-- Redis核心依賴 --> <dependency><gr…

Re-攻防世界

easyEZbaby_app Jadx 這個文件一般是窗口界面&#xff0c;點擊中間的一般就是主函數 Obj1是用戶名&#xff0c;obj2是密碼 用戶名 public boolean checkUsername(String str) { if (str ! null) { try { if (str.length() ! 0 &&…

矩陣題解——搜索二維矩陣 II【LeetCode】

240. 搜索二維矩陣 II 1.1 核心思想 問題描述&#xff1a;給定一個 m x n 的二維矩陣&#xff0c;矩陣的每一行從左到右遞增&#xff0c;每一列從上到下遞增。判斷目標值 target 是否存在于矩陣中。解決思路&#xff1a; 從矩陣的右上角&#xff08;或左下角&#xff09;開始搜…

dockerfile文件詳解之基礎語法

dockerfile文件詳解之基礎語法 一般而言 Dockerfile 可以分為4個部分 &#xff08;1&#xff09;基礎鏡像信息&#xff0c; &#xff08;2&#xff09;維護者信息 &#xff08;3&#xff09;鏡像操作命令 &#xff08;4&#xff09;啟動時執行指令 1-注釋 用 # 來進行注…

WebFuture:獨立一級域名nginx取消配置Secure屬性的問題

問題分析&#xff1a; 部分站群站點使用了獨立一級域名&#xff0c;但是前臺問卷調查等模塊無法提交&#xff0c;排查是由于主站啟用了https&#xff0c;配置了cookies的Secure屬性是true&#xff0c;但是子站的獨立一級域名沒有使用https&#xff0c;所以瀏覽器不能寫入cooki…

【網站內容安全檢測】之3:獲取所有外部域名訪問后圖像

Go語言調用Chrome瀏覽器去進行截圖的操作&#xff0c;對電腦的性能要求比較高&#xff0c;所以速度比較有限&#xff0c;但是目前來看這種方式可以最佳的去獲取網頁加載后的結果。 main.go package mainimport ("context""errors""flag""…

華曦達港股IPO遞表,AI Home生態構建智能生活新藍圖

在智能家居逐漸普及的當下&#xff0c;華曦達打造的AI Home生態為用戶提供了更智能、便捷的生活解決方案&#xff0c;在行業中展現出獨特優勢。 華曦達AI Home生態由AI Home系統平臺、AI Home基礎設施、AI Home設備以及可連接外部設備的開放式設備矩陣構成&#xff0c;是一個開…

java+vue+SpringBoo智慧農業專家遠程指導系統(程序+數據庫+報告+部署教程+答辯指導)

源代碼數據庫LW文檔&#xff08;1萬字以上&#xff09;開題報告答辯稿ppt部署教程代碼講解代碼時間修改工具 技術實現 開發語言&#xff1a;后端&#xff1a;Java 前端&#xff1a;vue框架&#xff1a;springboot數據庫&#xff1a;mysql 開發工具 JDK版本&#xff1a;JDK1.…

免費AI助手工具深度測評:Claude4本地化部署與實戰應用指南

免費AI助手工具深度測評&#xff1a;Claude4本地化部署與實戰應用指南 AI無限對話免費Rovo工具Claude4碾壓cursor和augment 前言 在AI工具日益普及的今天&#xff0c;大多數高質量的AI助手都需要付費訂閱或有使用限制。然而&#xff0c;最近發現了一款基于Claude 4的免費AI助手…

MCP瀏覽器工具:playwright、chrome-mcp

參考&#xff1a; https://github.com/microsoft/playwright-mcp https://github.com/hangwin/mcp-chrome chrome-mcp安裝需要額外安裝成瀏覽器插件 用cherrystudio v1.4.5測試 mcp配置&#xff1a; "chrome-mcp-server": {"name": "chrome-mcp-serve…

水利水電安全員考試不同等級的考試內容有哪些區別?

水利水電安全員考試一般分為企業主要負責人&#xff08;A 類&#xff09;、項目負責人&#xff08;B 類&#xff09;和專職安全生產管理人員&#xff08;C 類&#xff09;三個等級。不同等級的考試內容都包括安全生產知識和管理能力兩部分&#xff0c;但具體的側重點有所不同。…

關于USB模式的一些內容(附USB接口顏色釋義圖)

今天在處理工作中的事情的時候,突然有個產品的小伙伴來問關于USB的事情,順便給她簡單說了下。USB接口模式主要包括以下幾種:Host(主機模式)、Device(設備模式)、OTG(On-The-Go),以及較少使用的Accessory模式。以下是對這些模式的詳細說明、區別差異及應用場景: 1. H…