深入解析 Apache Doris 寫入原理：一條數據的“落地之旅”

在日常的數據分析場景中，我們經常會向 Apache Doris 寫入大量數據，無論是實時導入、批量導入，還是通過流式寫入。但你是否想過：一條數據從客戶端發出，到最終穩定落盤，中間到底經歷了哪些步驟？

今天我們就來全面拆解 Doris 寫入原理，帶你走進它的內部世界。

一條寫入數據在 Doris 的“旅程”可以分成若干層次：

入口：客戶端通過 HTTP（Stream Load）、JDBC/SQL（INSERT）、Broker/Spark（批量）、Routine Load（Kafka）等方式把數據送入系統。各種 Load 方法的分類和用途說明鏈接。

FE 層（協調）：SQL 解析、計劃、事務分配、路由與元數據管理（表/分區/Tablet 信息由 FE 管理并存儲）。

BE 層（執行）：負責真實的數據寫入、內存結構、落盤（Segment）、索引構建、Compaction、查詢執行。

選擇合適的寫入模式是發揮 Doris 性能的前提。不同模式的事務粒度、資源占用、延遲表現差異顯著，需根據業務需求精準選型。

流程細分：

核心流程：

內部細節：

Flush 過程：

當Memtable數據寫滿后，會異步flush生成一個Segment進行持久化，同時生成一個新的Memtable繼續接收新增數據導入
在寫入磁盤前會做最終的編碼、壓縮、索引構建（如短鍵索引、列級統計信息、ZoneMap/MinMax），并生成元數據描述該 Segment（如行數、列偏移、壓縮方式）。

事務與可見性：

FE 為寫入分配 Txn ID / Version，用來保證原子性和版本管理。
BE 在本地成功寫入 Segment 后，會向 FE 匯報“寫入完成并持久化”的消息（包含生成的 Segment 元信息）。
FE 收到足夠的確認（通常基于多數副本策略）后，會發 Publish 任務使導入的 Rowset 版本生效。任務中指定了發布的生效 version 版本信息。之后 BE 存儲層才會將這個版本的 Rowset 設置為可見。最后Rowset 加入到 BE 存儲層的 Tablet 進行管理。

元數據更新：

為什么需要 Compaction：

compaction過程示意圖

常見 Compaction 策略：

Cumulative Compaction：優先合并新寫入的小 Rowset，避免直接與大 Rowset 合并導致效率低下。新導入的零散數據（如實時寫入的小批次數據），先通過Cumulative Compaction逐步 “攢大”，減少后續 Base Compaction 的壓力。。
Base Compaction：當Cumulative Rowset 合并到一定規模后，再與歷史大 Rowset（Base Rowset）合并，最終形成更緊湊的大 Rowset。

更多Compaction原理與優化可參考鏈接內容

一條數據寫入到 Doris 的旅程包含多個環節，理解數據寫入的每個環節（MemTable、Flush、Compaction、FE 事務等），能夠更好的幫助我們優化寫入性能與穩定性。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/98230.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/98230.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/98230.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！