bookkeeper基本概念

Apache BookKeeper 架構與基本概念

Apache BookKeeper 是一個高性能的分布式日志存儲系統，主要用于存儲和管理順序寫入的數據。它被設計用來提供低延遲、高吞吐量和強一致性的服務，常用于分布式系統中的日志存儲需求（例如，Apache Kafka 的底層存儲就用到了類似的機制）。以下是它的架構概述：

Bookie：BookKeeper 的存儲節點，負責存儲日志條目（entries）。每個 Bookie 是一個獨立的服務器，管理自己的磁盤存儲。
Ledger：邏輯上的日志單元，是 BookKeeper 的核心抽象。一個 Ledger 是一系列日志條目的集合，類似于一個文件。Ledger 是只追加的，寫入后不可修改。
Client：應用程序通過 BookKeeper Client 與系統交互，負責創建 Ledger、寫入數據和讀取數據。
Metadata Store：元數據存儲，通常使用 Apache ZooKeeper，負責存儲 Ledger 的元數據，例如哪些 Bookie 存儲了某個 Ledger 的數據。

分布式存儲：數據被分片存儲在多個 Bookie 上。每個 Ledger 的日志條目會被復制到多個 Bookie（通常是 3 個副本），以保證高可用性和容錯性。
寫入流程：
1. Client 創建一個 Ledger。
2. Client 將日志條目寫入 Ledger，數據會被發送到多個 Bookie。
3. Bookie 收到數據后，先寫入本地日志（Journal），然后再寫入存儲（Ledger Storage），確保數據持久化。
4. 當足夠數量的 Bookie 確認寫入成功（滿足一致性要求，例如多數派確認），Client 收到寫入成功的響應。
讀取流程：Client 可以從任意存有副本的 Bookie 讀取數據。如果某個 Bookie 不可用，Client 會自動切換到其他副本。
元數據管理：ZooKeeper 負責協調 Bookie 的狀態、Ledger 的分配和故障檢測。

Ledger：
- 一個有序的日志條目序列。
- 每個 Ledger 有唯一的 ID，由 Client 創建。
- 支持只追加寫入，關閉后不可再寫。
Entry：
- Ledger 中的最小數據單元，類似于日志中的一條記錄。
- 每個 Entry 都有一個唯一的 Entry ID。
Ensemble：
- 存儲某個 Ledger 的 Bookie 集合。Ensemble 大小決定了副本數量（例如，3 個 Bookie 組成一個 Ensemble）。
Quorum：
- 寫入或讀取時需要的最小確認數。例如，寫入 Quorum（Write Quorum, WQ）和確認 Quorum（Ack Quorum, AQ）可以配置，以平衡性能和一致性。
Journal：
- Bookie 上的預寫日志（WAL, Write-Ahead Log），用于在數據寫入存儲前記錄操作，確保數據不丟失。
Striping：
- 數據分片機制，將 Ledger 的條目分布到多個 Bookie 上，提升并行性和性能。

Apache BookKeeper 的架構圍繞 Ledger 和 Bookie 構建，通過分布式存儲、元數據管理（ZooKeeper）和多副本機制，實現了高性能、高可用性和強一致性。它的基本概念（如 Ledger、Entry、Ensemble 等）是理解其工作原理的關鍵。

如果您指的是其他“Bookkeeper”（例如某個特定軟件或概念），請提供更多上下文，我會調整回答！

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/74882.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/74882.shtml
英文地址，請注明出處：http://en.pswp.cn/web/74882.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！