熱烈祝賀 Flink 2.0 存算分離入選 VLDB 2025

VLDB 2025 論文

熱烈祝賀 Apache Flink 2.0 的重磅研究成果《Disaggregated State Management in Apache Flink? 2.0?》被數據庫領域頂級會議?VLDB 2025?正式接收!這項工作由?Apache Flink 社區?聯合?阿里巴巴實時計算 Flink 團隊?以及多位學術界研究人員共同完成,從架構上根本解決了在存算一體架構下長久以來快照消耗大、狀態恢復慢,以及狀態和計算捆綁造成成本高的問題,標志著 Flink 在分布式流處理系統狀態管理架構上的重大突破,也代表著 Flink 向云原生架構演進的重要里程碑。

背景與挑戰

隨著實時數據和實時 AI 處理需求的不斷增長,Apache Flink 憑借其優異的一致性狀態管理架構以及豐富的上下游生態,已成為全球流處理引擎標準。然而,面對 TB 級別的狀態存儲與高吞吐、低延遲的訪問要求,傳統耦合的狀態管理機制逐漸暴露出擴展性差、CP 消耗大以及恢復慢等問題。為了解決這一瓶頸,我們在?

Apache Flink 2.0?中提出了一種全新的“解耦式狀態管理架構(Disaggregated State Management)”,將狀態存儲與計算任務分離,利用廉價的對象存儲來共享數據,從而實現更靈活的資源調度、更高的可擴展性和更輕量穩定的容錯能力。

核心貢獻與創新點

為了解決上述挑戰,Flink 2.0 引入了兩項重大創新:

(i) 統一的異步執行框架(Asynchronous Execution Framework)

Flink 2.0 引入了全新的異步執行框架,支持非阻塞狀態訪問與并行異步操作,從而大幅降低延遲、提升整體吞吐能力。該框架具備以下特點:

  • 完全兼容 Flink 1.x 的同步狀態訪問方式;

  • 自動跳過不必要的異步開銷,在無需異步操作時保持高性能;

  • 嚴格保障原有語義和狀態一致性,確保 Exactly-Once 語義不打折扣。

(ii) 解耦式狀態存儲引擎 ForSt(For Streaming)

ForSt 是 Flink 2.0 全新推出的解耦式狀態存儲引擎,它在不改變現有部署架構的前提下,提供統一的 LSM-tree 抽象,實現了本地與遠程狀態訪問的無縫融合:

  • 補齊遠端與本地文件系統的能力差異;

  • 支持共享 Working State 和 Checkpoint 文件,僅需維護一份狀態副本;

  • 實現秒級快照與瞬時狀態恢復,極大提升作業恢復速度與容錯能力。

意義與展望

十年前,Apache Flink 的奠基之作《State Management in Apache Flink》發表于 VLDB,首次系統闡述了流計算中的一致性狀態管理機制,推動了流計算從簡單 ETL 管道向復雜業務邏輯處理的躍遷。

十年后的今天,Flink 已成為大數據領域的基礎設施,而 VLDB 2025 接收的這篇論文《Disaggregated State Management in Apache Flink? 2.0》,不僅代表了學術界對 Flink 技術創新能力的高度認可,更體現了阿里巴巴多年來持續投入 Flink 社區的技術傳承與產業影響力。

這也是 Flink 狀態管理的新起點,未來我們希望能通過 ForSt 存儲引擎的批量計算下推等能力進一步降低流計算的成本,兼具時效性和低成本的能力,開啟 Flink 近實時計算的新紀元,真正做到實時計算的普惠。

作者名單

Yuan Mei, Alibaba Cloud

Zhaoqian Lan, Alibaba Cloud

Lei Huang, Boston University?

Yanfei Lei, Alibaba Cloud

Han Yin, Alibaba Cloud

Rui Xia, Alibaba Cloud

Kaitian Hu, Alibaba Cloud

Paris Carbone, KTH Royal Institute of Technology

Vasiliki Kalavri, Boston University

Feng Wang Alibaba Cloud

致謝

感謝 Apache Flink 社區和兄弟團隊的大力支持與寶貴建議,特別感謝 Jark Wu,Lincoln Lee,Xuyang Zhong?對 Flink 社區 SQL 算子的改寫與適配使得 Flink 端到端存算分離成為可能!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/90411.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/90411.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/90411.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

蓄電池能量管理matlab的simulink仿真

蓄電池能量管理matlab的simulink仿真模型 AlternatorTableData.mat , 7395 Battery_Management_Lib.mdl , 577258 Readme.txt , 1293 license.txt , 1551 ssc_battery_management.mdl , 221248 ssc_lead_acid_battery_50Ah_ini.m , 1760 ssc_lead_acid_battery_80Ah_ini.m , 1…

MyBatisPlus-03-擴展功能

文章目錄【README】【1】基于MyBatisPlus的代碼生成器【2】MyBatisPlus-DB靜態工具【2.1】使用MyBatisPlus的DB靜態工具查詢單個及多個用戶地址【查詢單個用戶的訪問效果】【查詢多個用戶的訪問效果】【3】邏輯刪除【3.1】代碼實現【4】枚舉處理器【4.1】代碼實現【5】JSON處理…

初識Neo4j之Cypher(三)

目錄 一、介紹 二、語法 1、節點 2、關系 3、屬性 4、模式 一、介紹 Cypher 是 Neo4j 的聲明式查詢語言,兼容 GQL 標準。通過 openCypher 項目,Cypher 以開源方式提供。它類似于 SQL,但專為圖數據優化。 Cypher 直觀且接近自然語言&…

19-C#靜態方法與靜態類

C#靜態方法與靜態類 1.static-靜態方法animal.eat();//直接調用 public class animal {public static void eat()//定義靜態方法{messagebox.show("animal eat");} }2.static-靜態類animal.eat();//直接調用public stat…

基于YOLO的足球檢測Web應用:從訓練到部署的完整實戰

用Python和深度學習技術打造一個完整的足球檢測系統,支持圖片檢測、視頻分析和實時監控。本文帶你從零開始構建一個專業的Web應用。🎯 項目背景 在體育賽事分析和足球訓練中,準確識別和定位足球是一個重要需求。本項目利用YOLO深度學習算法&a…

npm 切換 node 版本 和npm的源

在開發過程中,不同項目可能需要不同版本的 Node.js,同時 于由XX原因,我們需要切換npm的源。這時如果需要切換node版本或者npm的源,我們可以使用以下方法。 使用 nvm 切換 Node 版本 1、安裝 npm install nvm -g2、使用 # 列出所有…

Java學習第二十部分——EasyMock

目錄 一.概述 二.作用 三.工作原理 四.使用示例 五.主要特點 六.適用場景 七.其他模擬框架比較 八.idea簡單項目實戰 1.打開idea創建Java項目,注意構建系統選“Maven” 2.為pom.xml文件添加如下依賴,并重新加載Maven依賴,直至不報錯…

機器學習模型在C++平臺的部署

一、概述機器學習模型的訓練通常在Python環境下完成,而現實生產環境的復雜性和多樣性使得模型的部署成為一個值得關注的重點。不同應用場景下有不同適應的實現方式,這里主要介紹通過一種通用中間格式——ONNX(Open Neural Network Exchange&a…

保姆級安裝 Ruby 環境下載及安裝教程, RubyInstaller下載及安裝教程

一、下載安裝 RubyInstaller 1.打開 RubyInstaller 官網:https://rubyinstaller.org/ 點擊跳轉, 官網界面如下圖: 點擊下載最新的 RubyDevkit 版本(如 RubyDevkit 3.4.X (x64) )。如下圖所示: 注意點:如果…

SQL 一鍵生成 Go Struct!支持字段注釋、類型映射、結構體命名規范

SQL 一鍵生成 Go Struct!支持字段注釋、類型映射、結構體命名規范 在 Golang 開發中,尤其是操作數據庫時,我們經常會遇到這種場景: ? 拿到數據庫建表 SQL,卻要手動寫 Go struct? 字段幾十個、類型復雜,…

Web 前端框架選型:React、Vue 和 Angular 的對比與實踐

Web 前端框架選型:React、Vue 和 Angular 的對比與實踐 選擇前端框架就像選擇一個長期合作伙伴。錯誤的選擇可能會讓你的項目在未來幾年內背負沉重的技術債務,而正確的選擇則能讓開發效率飛速提升。 經過多年的項目實踐,我發現很多新人在框架…

C# 值拷貝、引用拷貝、淺拷貝、深拷貝

值拷貝定義:直接復制變量的值,適用于基本數據類型(如int, float, char等)。在 C# 中,值類型(基本數據類型和結構體)默認使用值拷貝。特點:創建原始值的完全獨立副本,修改…

深度學習圖像分類數據集—百種鳥類識別分類

該數據集為圖像分類數據集,適用于ResNet、VGG等卷積神經網絡,SENet、CBAM等注意力機制相關算法,Vision Transformer等Transformer相關算法。 數據集信息介紹:525種鳥類識別分類 訓練數據集總共有84635張圖片,每個文件夾…

零基礎 “入坑” Java--- 八、類和對象(一)

文章目錄一、初識面向對象二、類的定義和使用1.認識類2.類的定義格式三、類的實例化四、this引用五、對象的構造及初始化1.有關初始化2.構造方法3.就地初始化一、初識面向對象 Java是一門純面向對象的語言(OOP),在面向對象的世界里&#xff…

數字孿生技術引領UI前端設計新篇章:智能物聯網的深度集成

hello寶子們...我們是艾斯視覺擅長ui設計、前端開發、數字孿生、大數據、三維建模、三維動畫10年經驗!希望我的分享能幫助到您!如需幫助可以評論關注私信我們一起探討!致敬感謝感恩!一、引言:數字孿生與物聯網的共生革命在智能設備爆發式增長的今天,傳統…

代碼審計-shiro漏洞分析

一、關于shiro介紹 簡單講,shiro是apache旗下的一個Java安全框架,輕量級簡單易上手,框架提供很多功能接口,常見的身份認證 、權限認證、會話管理、Remember 記住功能、加密等等。 二、漏洞分析 1.CVE-2019-12422-shiro550 漏洞原理…

EF提高性能(查詢禁用追蹤)(關閉延遲加載)

EF默認是支持延遲加載的,在加載一個表的數據時,會把關聯表的數據一并加載,這樣會影響性能。 一般建議關閉延遲加載可以提高EF加載的性能。還有其他方法提高性能(查詢禁用追蹤) 如果要實現延遲加載,必須滿足…

Leetcode+JAVA+貪心III

134.加油站在一條環路上有 n 個加油站,其中第 i 個加油站有汽油 gas[i] 升。你有一輛油箱容量無限的的汽車,從第 i 個加油站開往第 i1 個加油站需要消耗汽油 cost[i] 升。你從其中的一個加油站出發,開始時油箱為空。給定兩個整數數組 gas 和 …

Qt信號與槽機制及動態調用

Qt信號與槽機制及動態調用一、信號與槽1、Qt信號與槽機制概述2、信號與槽的基本使用3、信號與槽的特性4、使用Lambda表達式作為槽5、信號與槽的參數傳遞6、注意事項二、動態調用機制1、基本用法2、示例代碼3、帶參數的調用4、返回值處理5、信號與槽的動態連接6、動態方法調用7、…

K8s系列之:Kubernetes 的 OLM

K8s系列之:Kubernetes 的 OLM 什么是 Kubernetes 的 OLM什么是Kubernetes中的OperatorOLM 的功能OLM 的核心組件OLM優勢OLM 的工作原理OLM 與 OperatorHub 的關系OLM示例場景什么是CRDoperator 和 CRD的關系為什么需要 CRD 和 OperatorCRD定義資源類型DebeziumServer如何使用d…