1-Kafka介紹及常見應用場景

Kafka 介紹

Apache Kafka 是一個開源的分布式流處理平臺，最初由 LinkedIn 開發，后捐贈給 Apache 軟件基金會。它被設計用于高吞吐量、低延遲、可水平擴展地處理實時數據流。官網地址是：https://kafka.apache.org/

以下是 Kafka 的核心介紹：

消息系統 (Messaging System)
Kafka 充當生產者和消費者之間的消息中間件，解耦系統，確保可靠的數據傳遞。

流處理平臺 (Stream Processing)
支持實時處理數據流（如過濾、轉換、聚合）。

存儲系統 (Storage System)
數據可持久化存儲（默認保留7天，可配置），支持故障恢復。

組件	作用
Producer 生產者	向 Kafka 推送數據（如日志、事件）
Consumer 消費者	從 Kafka 拉取數據并進行處理
Broker Kafka 服務器節點	組成集群，負責存儲和傳遞消息
Topic 邏輯消息分類（如 user_activity）	生產者按 Topic 發送消息
Partition Topic 的分區（物理分片）	實現并行處理和水平擴展。每個分區內消息有序
Replica 分區的副本（Leader 處理讀寫，Follower 同步數據）	保障高可用
ZooKeeper	管理集群元數據、Broker 狀態和選舉（Kafka 3.0+ 逐步移除依賴）

持久化：所有消息直接寫入磁盤（非內存緩存），支持 TB 級數據保留（可配置保留策略）。
高可靠：
? 副本機制（Replication）：每個分區多副本存儲（默認 3 副本）
? ISR（In-Sync Replicas）機制保障數據一致性
? 生產者可配置 acks=all 確保數據寫入所有副本后才確認

去中心化：無單點瓶頸，Broker 節點對等。
故障自愈：
? Leader 分區故障時，Follower 自動選舉為新 Leader
? 消費者組自動重平衡（Rebalance）
? 數據副本保障節點宕機時零數據丟失

多租戶支持：通過認證（SASL/SSL）和配額（Quotas）實現資源隔離。
豐富生態：
? Kafka Connect：快速集成數據庫、ES、S3 等外部系統
? Kafka Streams：輕量級流處理庫（無需額外集群）
? Schema Registry：統一管理 Avro/Protobuf 消息格式

跨系統一致性：通過 Kafka Streams API 或事務型生產者（idempotence=true + 事務）實現：
? 生產端：避免消息重復寫入
? 消費端：確保“處理 + 提交 Offset”原子性

主流版本：Kafka 3.x（已移除 ZooKeeper 依賴，使用 KRaft 共識協議）。

參考：
deepseek
B站項樺瑾Kafka介紹

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/88455.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/88455.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/88455.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！