1-【源碼剖析】kafka核心概念

從今天開始開始在csdn上記錄學習的筆記,主要包括以下幾個方面:

  • kafka
  • flink
  • doris

本系列筆記主要記錄Kafka學習相關的內容。在進行kafka源碼學習之前,先介紹一下Kafka的核心概念。

消息

消息是kafka中最基本的數據單元,由key和value組成,都是字節數組。key主要來實現路由功能,value是真正的有效負載。

topic&分區&Log

topic是用于存儲消息的邏輯概念,是一個消息集合。

每個topic可以劃分為多個分區,每個分區內的數據是不重疊的,每個消息在添加到分區時,都會分配一個編號offset,來保證消息在分區內的順序。

分區在邏輯上對應著一個Log,當生產者將消息寫入分區時,實際上是寫入到了分區對應的Log中。Log是一個邏輯概念,可以對應磁盤上的一個文件夾,Log由多個Segment組成,每個Segment對應一個日志文件和索引文件。

保留策略&日志壓縮

發送到kafka的數據會被保存下來,但不會像數據庫那樣永久保存,為了避免數據庫被占滿,kafka有相應的保留策略,周期性刪除陳舊消息。kafka中有兩種保留策略:基于時間和topic大小的保留策略。

kafka會對存儲的消息進行壓縮,以減少磁盤占用。

broker

一個單獨的kafka server就是一個broker。broker的主要工作就是接收生產者發過來的消息,同時接收消費者的請求,返回存儲的數據。一般一個broker占一臺物理機器。

副本

kafka對消息進行了冗余備份,每個分區可以有多個副本,每個副本消息是一樣的。每個分區至少有一個副本,所有副本中選取一個當做Leader,其它副本從Leader處拉取消息。
在這里插入圖片描述

一般情況下,同一分區的多個副本會分配到不同的broker上。一個topic包括多個分區,每個分區的數據是不一樣的,可以實現水平擴展,當數據量變大時可以增大分區的數量;每個分區有多個副本,多副本情況下可丟失其中某個副本。

ISR集合

ISR集合表示目前“可用”且消息量與leader差不多的副本集合,是整個副本集合的一個子集。ISR必須滿足兩個條件:1副本所在節點必須維持著與zookeeper的連接;2副本最后一條消息的offset與Leader副本的的最后一條消息offset不能超過指定的閾值。每個分區的Leader副本都會維護此分區的ISR集合。

參考書籍《Apache Kafka源碼剖析》

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/85870.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/85870.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/85870.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

互聯網大廠Java求職面試:云原生架構下的微服務網關與可觀測性設計

互聯網大廠Java求職面試:云原生架構下的微服務網關與可觀測性設計 鄭薪苦懷著忐忑的心情走進了會議室,對面坐著的是某大廠的技術總監張總,一位在云原生領域有著深厚積累的專家。 第一輪面試:微服務網關的設計挑戰 張總&#xf…

【HarmonyOS 5】針對 Harmony-Cordova 性能優化,涵蓋原生插件開發、線程管理和資源加載等關鍵場景

1. ?原生圖片處理插件(Java) package com.example.plugin; import ohos.media.image.ImageSource; import ohos.media.image.PixelMap; import ohos.app.Context; public class ImageProcessor { private final Context context; public ImagePro…

Java-IO流之緩沖流詳解

Java-IO流之緩沖流詳解 一、緩沖流概述1.1 什么是緩沖流1.2 緩沖流的工作原理1.3 緩沖流的優勢 二、字節緩沖流詳解2.1 BufferedInputStream2.1.1 構造函數2.1.2 核心方法2.1.3 使用示例 2.2 BufferedOutputStream2.2.1 構造函數2.2.2 核心方法2.2.3 使用示例 三、字符緩沖流詳…

健康檢查:在 .NET 微服務模板中優雅配置 Health Checks

🚀 健康檢查:在 .NET 微服務模板中優雅配置 Health Checks 📚 目錄 🚀 健康檢查:在 .NET 微服務模板中優雅配置 Health Checks一、背景與意義 🔍二、核心配置 🔧2.1 引入必要的 NuGet 依賴 &…

關于akka官方quickstart示例程序(scala)的記錄

參考資料 https://doc.akka.io/libraries/akka-core/current/typed/actors.html#first-example 關于scala語法的注意事項 extends App是個語法糖,等同于直接在伴生對象中編寫main 方法對象是通過apply方法創建的,也可以通過對象的名稱單獨創建&#x…

基于vue3-elemenyui的頁面加載及新建瀏覽頁案例

1.參考鏈接: 基于創建vue3鏈接:Vue3前端項目創建_vscode創建vue3項目-CSDN博客 基于創建elementui鏈接:Vue3引入ElementPlus_vue引入element-plus-CSDN博客 2.案例內容 該案例實現了基本的app.vue的路由跳轉、新建瀏覽頁參數傳入以及瀏覽…

板凳-------Mysql cookbook學習 (十)

5.6 改變字符串的字符集或字符排序 mysql> set s1 my string; Query OK, 0 rows affected (0.01 sec)mysql> set s2 convert(s1 using utf8); Query OK, 0 rows affected, 1 warning (0.00 sec)mysql> select charset(s1), charset(s2); -------------------------…

使用nginx配置反向代理,負載均衡

首先啥叫反向代理 咋配置呢,那當然是在nginx目錄下改conf文件了 具體咋改呢,那就新增一個新的server配置,然后在location里新增你想代理的服務器 實際上負載均衡也就是根據反向代理的思路來的,如下所示 配置的話實際上也與上…

嵌入式開發之STM32學習筆記day20

STM32F103C8T6 PWR電源控制 1 PWR簡介 PWR(Power Control)電源控制單元是STM32微控制器中一個重要的組成部分,它負責管理系統的電源管理功能,以優化功耗并提高效率。PWR負責管理STM32內部的電源供電部分,可以實現可編…

Spring AI(10)——STUDIO傳輸的MCP服務端

Spring AI MCP(模型上下文協議)服務器Starters提供了在 Spring Boot 應用程序中設置 MCP 服務器的自動配置。它支持將 MCP 服務器功能與 Spring Boot 的自動配置系統無縫集成。 本文主要演示支持STDIO傳輸的MCP服務器 僅支持STDIO傳輸的MCP服務器 導入j…

Java八股文——集合「Set篇」

Set集合有什么特點?如何實現key無重復的? 面試官您好,Set 集合是 Java 集合框架中的一個重要接口,它繼承自 Collection 接口,其最顯著的特點和設計目標就是存儲一組不重復的元素。 一、Set集合的主要特點&#xff1a…

「數據分析 - NumPy 函數與方法全集」【數據分析全棧攻略:爬蟲+處理+可視化+報告】

- 第 104 篇 - Date: 2025 - 06 - 05 Author: 鄭龍浩/仟墨 NumPy 函數與方法全集 文章目錄 NumPy 函數與方法全集1. 數組創建與初始化基礎創建序列生成特殊數組 2. 數組操作形狀操作合并與分割 3. 數學運算基礎運算統計運算 4. 隨機數生成基礎隨機分布函數 5. 文件IO文件讀寫 …

報表/報告組件(二)-實例與實現解釋

上篇《報表/報告組件(一)-指標/屬性組件設計》介紹了組件核心指標/屬性設計,本文以實例介紹各個特性的實現和效果,實例是多個報告融合,顯示所有的特性。 設計 指標/屬性組件是報告/報表關鍵部分,上篇已介紹過,本節回顧…

Flutter嵌入式開發實戰 ——從樹莓派到智能家居控制面板,打造工業級交互終端

一、為何選擇Flutter開發嵌入式設備&#xff1f; 1. 跨平臺能力降維打擊 特性傳統方案Flutter方案開發效率需分別開發Android/Linux一套代碼多端部署內存占用200MB (QtWeb引擎)<80MB (Release模式)熱重載支持不支持支持 2. 工業級硬件支持實測 樹莓派4B&#xff1a;1080…

[藍橋杯]機器人塔

題目描述 X 星球的機器人表演拉拉隊有兩種服裝&#xff0c;A 和 B。 他們這次表演的是搭機器人塔。 類似&#xff1a; A B B A B A A A B B B B B A B A B A B B A 隊內的組塔規則是&#xff1a; A 只能站在 AA 或 BB 的肩上。 B 只能站在 AB 或 BA 的肩上。 你的…

語雀文檔保存失敗URI malformed

原因 原因未知&#xff0c;我用deekseek將回答的答案復制到語雀文檔時出現了這個異常&#xff0c;在知識庫里面一直保存失敗 語雀文檔保存失敗URI malformed 解決方案 使用小記&#xff0c;將里面的內容轉移到小記里&#xff0c;將小記移到知識庫中即可

小明的Java面試奇遇之互聯網保險系統架構與性能優化

一、文章標題 小明的Java面試奇遇之互聯網保險系統架構與性能優化&#x1f680; 二、文章標簽 Java,Spring Boot,MyBatis,Redis,Kafka,JVM,多線程,互聯網保險,系統架構,性能優化 三、文章概述 本文模擬了程序員小明在應聘互聯網保險系統開發崗位時&#xff0c;參與的一場深…

從零開始的嵌入式學習day33

網絡編程及相關概念 UDP網絡通信程序 UDP網絡通信操作 一、網絡編程及相關概念 1. 網絡編程概念&#xff1a; 指通過計算機網絡實現程序間通信的技術&#xff0c;涉及協議、套接字、數據傳輸等核心概念。常見的應用場景包括客戶端-服務器模型、分布式系統、實時通信等。…

Kotlin 1. 搭建Kotlin開發環境

本實戰概述旨在指導用戶搭建Kotlin開發環境&#xff0c;并進行簡單的編程實踐。首先&#xff0c;用戶需安裝IntelliJ IDEA&#xff0c;并進行基本設置&#xff0c;如選擇主題、調整字體和安裝插件等。接著&#xff0c;創建Kotlin項目&#xff0c;設置項目名稱、位置和JDK版本&a…

Mysql的B-樹和B+樹的區別總結

B 樹也稱 B- 樹&#xff0c;全稱為 多路平衡查找樹&#xff0c;B 樹是 B 樹的一種變體。B 樹和 B 樹中的 B 是 Balanced&#xff08;平衡&#xff09;的意思。 目前大部分數據庫系統及文件系統都采用 B-Tree 或其變種 BTree 作為索引結構。 B 樹& B 樹兩者有何異同呢&…