Kafka 核心機制面試題--自問自答

基礎篇

Q1: Kafka為什么能這么快?

A: Kafka的高性能主要來自三大核心技術:

  1. 零拷貝(Zero-Copy):通過sendfile()系統調用,數據直接從磁盤到網卡,避免了內核態和用戶態之間的多次拷貝
  2. 頁緩存(Page Cache):消息直接寫入操作系統頁緩存而非JVM內存,減少GC影響并利用OS緩存機制
  3. 內存映射(mmap):索引文件通過內存映射實現,操作內存即操作文件

Q2: Kafka的存儲結構是怎樣的?

A: Kafka采用分片-分段式存儲:

  • 每個Topic分為多個Partition(提高并行度)
  • 每個Partition物理上分為多個Segment文件(默認1GB)
  • 每個Segment包含兩個文件:
    • .log文件存儲實際消息
    • .index文件存儲消息偏移量索引
  • 寫入采用順序追加方式,充分利用磁盤順序I/O性能

可靠性篇

Q3: Kafka如何保證消息不丟失?

A: 需要三方協同保障:

生產者端:

  • 設置acks=all(等待所有ISR副本確認)
  • 啟用重試機制retries=MAX_INT
  • 使用冪等生產者或事務

Broker端:

  • 設置replication.factor≥3(多副本)
  • 配置min.insync.replicas≥2(最小同步副本數)
  • 禁用unclean.leader.election(防止數據不一致)

消費者端:

  • 禁用自動提交enable.auto.commit=false
  • 處理完成后手動提交偏移量
consumer.commitSync();  // 同步提交
// 或 
consumer.commitAsync(); // 異步提交

Q4: ISR和OSR是什么?

A: Kafka的副本管理機制:

  • ISR(In-Sync Replicas):與Leader保持同步的副本集合
  • OSR(Out-of-Sync Replicas):落后于Leader的副本
  • 高水位(High Watermark):標識已成功復制到所有ISR的消息位置
  • 只有ISR中的副本才有資格成為Leader,通過replica.lag.time.max.ms控制同步閾值

生產者篇

Q5: 如何實現生產者冪等性?

A: 通過三個機制保證:

  1. PID(Producer ID):每個生產者唯一標識
  2. Sequence Number:每個消息的分區級序列號
  3. Broker端去重:緩存最近接收的序列號

啟用方式:

enable.idempotence=true

Q6: Kafka事務如何工作?

A: 事務實現跨分區原子寫入:

  1. 兩階段提交
    • 階段1:標記事務開始
    • 階段2:提交/中止事務
  2. 事務協調器:管理事務狀態
  3. 事務日志:持久化事務狀態

代碼示例:

producer.initTransactions();
try {producer.beginTransaction();producer.send(record1);producer.send(record2); producer.commitTransaction();
} catch (Exception e) {producer.abortTransaction();
}

消費者篇

Q7: 什么是Consumer Rebalance?

A: 消費者組重新分配分區的過程:

觸發條件

  • 消費者加入/離開組
  • Topic分區數變化
  • 訂閱Topic變化

優化策略

  • 增量Rebalance:僅重新分配變化的分區
  • Sticky分配:盡量保留原有分配關系
  • 參數調優:
    session.timeout.ms=6000
    heartbeat.interval.ms=2000
    

Q8: 如何避免消息重復消費?

A: 結合多種策略:

  1. 消費者冪等處理:業務邏輯實現去重
  2. 外部存儲去重:利用Redis等記錄已處理消息ID
  3. 事務消費:配合Kafka事務實現精確一次處理
  4. 偏移量管理:確保先處理再提交

高級特性篇

Q9: Kafka如何實現死信隊列?

A: 原生不支持但可自建:

  1. 創建專門的DLQ Topic
  2. 消費失敗時發送到DLQ:
try {process(record);
} catch (Exception e) {ProducerRecord<String, String> dlqRecord = new ProducerRecord<>("dlq_topic", record.key(), record.value());dlqProducer.send(dlqRecord);
}
  1. DLQ消息應包含原始Topic、分區、偏移量等元數據

Q10: Kafka架構有哪些重要演進?

A: 兩個關鍵階段:

  1. ZooKeeper時代

    • 依賴ZK進行控制器選舉
    • 元數據存儲在ZK
    • 運維復雜度高
  2. KRaft模式

    • 移除ZK依賴
    • 使用Raft協議自管理元數據
    • 簡化部署架構(KIP-500)

知識擴展:Kafka的性能優化本質上是對計算機體系結構的深度理解——零拷貝利用了DMA技術,頁緩存利用了局部性原理,而順序I/O則規避了機械磁盤的尋道瓶頸。這些設計哲學值得所有分布式系統借鑒。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/912481.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/912481.shtml
英文地址,請注明出處:http://en.pswp.cn/news/912481.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Git遠程倉庫遷移與分支關聯技術分享

背景 開發中常需切換代碼托管平臺&#xff08;如Coding → 自建GitLab&#xff09;。以下通過實際命令演示如何安全遷移倉庫并解決分支關聯問題。 操作步驟及原理分析 1. 查看當前遠程倉庫 bash git remote -v 輸出說明&#xff1a; text origin https://e.coding.net…

HttpURLConnection使用及優化

文章目錄 簡介使用示例GET請求POST請求 HttpURLConnection優化1. 設置合適的超時時間2. 指定字符編碼3. 正確處理響應編碼4. 使用壓縮傳輸&#xff08;如果適用&#xff09;5. 關閉連接釋放資源6. 啟用持久連接&#xff08;Keep-Alive&#xff09;&#xff0c;減少握手開銷 簡介…

【Springai】項目實戰進度和規劃

項目概述 新開一個用于學習實踐springai的項目&#xff0c;springai-novel是一個基于前后端分離的現代化AI實踐應用 前端技術棧 Vue 3 TypeScriptVite Naive UI vicons/ionicons5 后端技術棧 JDK17Spring AI MySQL milvus ollama 已實現功能 (?) ? springaimysql后…

知微傳感Lkam系列線掃輪廓儀SDK例程篇:SDK安裝及VS工程配置

寫在前面 本人從事機器視覺細分的3D相機行業。編寫此系列文章主要目的有&#xff1a; 1、便利他人應用3D相機&#xff0c;本系列文章包含公司所出售相機的SDK的使用例程及詳細注釋&#xff1b;2、促進行業發展及交流。 歡迎與我深入交流&#xff1a;微信號&#xff1a;liu_zhi…

機器學習4——參數估計之貝葉斯估計

貝葉斯估計 問題建模&#xff1a; 后驗概率公式&#xff1a; P ( ω i ∣ x , D ) P ( x ∣ ω i , D i ) P ( ω i ) ∑ j 1 c P ( x ∣ ω j , D j ) P ( ω j ) P\left(\omega_i \mid \mathbf{x}, \mathcal{D}\right)\frac{P\left(\mathbf{x} \mid \omega_i, \mathcal{D…

【C++】命令模式

目錄 一、模式核心概念與結構二、C 實現示例&#xff1a;遙控器與家電控制三、命令模式的關鍵特性四、應用場景五、命令模式與其他設計模式的關系六、C 標準庫中的命令模式應用七、優缺點分析八、實戰案例&#xff1a;數據庫事務命令九、實現注意事項如果這篇文章對你有所幫助&…

基于librdkafka開發的C++客戶端,生產者生產發送數據失敗問題處理

我們的項目使用了開源的librdkafka庫&#xff0c;實現向kafka服務器生產發送數據的功能。使用的librdkafka的版本是1.9.0。 作為客戶端程序&#xff0c;在開發時和客戶協商確認后&#xff0c;支持了SASL_PLAINTEXT認證。以下概念解釋引用自通義千問AI SASL (Simple Authentic…

OpenGL之yaw、pitch、fov 和 lookAt

在 3D 圖形學中&#xff0c;yaw、pitch、fov 和 lookAt 都是控制攝像機&#xff08;Camera&#xff09;行為的關鍵參數&#xff0c;但它們的 作用層級 和 使用場景 不同。 1. yaw、pitch、fov 的作用 (1) yaw&#xff08;偏航角&#xff09; 作用&#xff1a;控制攝像機 左右…

STM32-第一節-新建工程,GPIO,點亮LED,蜂鳴器

一、新建工程&#xff1a; 1.Keil中新建工程&#xff0c;選擇開發板型號。 2.工程文件夾建立Start&#xff0c;Library等分類&#xff0c;復制模版工程中的文件到工程文件夾中。 3.在Keil中添加分組&#xff0c;添加文件。 4.工程選項設置&#xff1a; c/c中&#xff1a;Inc…

Rust標量、復合類型與自定義類型、第三方并發結構

以下是 Rust 中標量類型、對象類型&#xff08;含結構體、復合類型、堆分配類型&#xff09;以及常用第三方并發數據結構的完整分類、示例和區別對比&#xff0c;幫助你系統掌握它們的本質異同&#xff1a; &#x1f7e2; 一、標量類型&#xff08;Scalar Types&#xff0c;存儲…

基于STM32溫濕度檢測—串口顯示

基于STM32溫濕度檢測 &#xff08;仿真&#xff0b;程序&#xff09; 功能介紹 具體功能&#xff1a; 1.使用DHT11檢測溫濕度&#xff1b; 2.單片機處理完控制LCD1602顯示溫濕度&#xff1b; 3.單片機也通過串口顯示檢測到的溫濕度&#xff1b; 添加圖片注釋&#xff0c;不…

Windows 10 查詢 Nginx 進程教程

1. 打開命令提示符&#xff08;CMD&#xff09; 按 Win R&#xff0c;輸入 cmd&#xff0c;回車。或者在開始菜單搜索欄輸入“cmd”&#xff0c;選擇“命令提示符”。 2. 查看是否有正在運行的 Nginx 進程 輸入命令&#xff1a; tasklist | findstr nginx這個命令會列出所有…

使用 Kafka 優化物流系統的實踐與思考

使用 Kafka 優化物流系統的實踐與思考 在現代物流系統中&#xff0c;訂單處理、倉儲管理、運輸調度等環節復雜且實時性要求高。為了滿足異步解耦、高吞吐、高可用、事件驅動和數據可靠性等需求&#xff0c;Kafka 作為分布式消息隊列和流處理平臺&#xff0c;成為了我們的首選。…

Rust中模式匹配let Some(gas_price) = tx.gas_price用法

你問得非常好&#xff0c;let Some(gas_price) tx.gas_price 是 Rust 中的一種模式匹配寫法&#xff0c;它用于從 Option 類型中提取值。 ? 背景知識&#xff1a;什么是 Option&#xff1f; 在 Rust 中&#xff0c;如果一個值可能存在也可能不存在&#xff0c;就會用 Option…

什么是LLM大語言模型

什么是LLM大語言模型 LLM的全稱是&#xff0c;Large Language Model&#xff0c;簡稱LLM&#xff0c;翻譯為大語言模型&#xff0c;其核心是模擬人類語言的復雜規律&#xff0c;實現語義理解、推理分析、文本生成等任務&#xff0c;主要目的是實現能讀懂和說出人類語言的模型。…

雜談-架構時代演進

關于未來 5-10 年軟件系統演化方向 1. 云原生 ? 超云原生&#xff08;Post Cloud Native&#xff09; Kubernetes 平臺自治化&#xff1a; K8s Operator 日益強大&#xff0c;逐步具備自愈、自動擴縮容、自動調優能力。 云廠商與企業私有云逐步融合為一體…

如何查看服務器的運行日志?

&#x1f7e2; 一、Linux服務器 Linux日志都在**/var/log**目錄下&#xff0c;最常用的有&#xff1a; &#x1f4c2; 常用日志文件 文件內容/var/log/messages大部分系統日志&#xff08;CentOS常見&#xff09;/var/log/syslog系統消息日志&#xff08;Ubuntu/Debian常見&a…

在幸狐RV1106開發板上用gcc14.2本地編譯安裝postgresql 17.5數據庫

在幸狐RV1106開發板上用gcc14.2本地編譯安裝postgresql 17.5數據庫 編譯環境&#xff1a; RV1106G3 Linux luckfox-rv1106 5.10.160 #3 Fri Jun 27 14:16:20 AWST 2025 armv7l GNU/Linux BusyBox v1.36.1 gcc version 14.2.0 (GCC) GNU ld (GNU Binutils) 2.44 GNU Make 4.4 n…

Go語言中map[string]interface{} 和 map[string]string的區別

在 Go 語言中&#xff0c;map[string]interface{} 和 map[string]string 是兩種不同類型的 map&#xff0c;它們的主要區別在于值的類型以及這種差異帶來的使用場景和靈活性的不同。 1. 值的類型 map[string]interface{}&#xff1a;這里的 interface{} 表示 Go 中的空接口類型…

AdGuard Home 安裝及使用

AdGuard Home 是 AdGuard 開源的一個私人 DNS 服務端,只需在網關部署,即可實現全局域網的廣告攔截與隱私反追蹤。在 DNS 解析的過程中,匹配規則庫內的 URL 進行攔截,同時在客戶端中,還可以通過自定義過濾規則實現網頁 DOM 的攔截。 基于 Golang 編寫的 AdGuard Home,官方…