11-Kafka

11-Kafka

news/2025/8/15 12:31:15/文章來源:https://blog.csdn.net/weixin_38753143/article/details/135160076

1 Kafka

Kafka是一個分布式流式數據平臺，它具有三個關鍵特性
- Message System: Pub-Sub消息系統
- Availability & Reliability：以容錯及持久化的方式存儲數據記錄流
- Scalable & Real time

1.1 Kafka架構體系

Kafka系統中存在5個關鍵組件
- Producer
- Consume
- Kafka Cluster
  - Broker：Kafka Server，或Kafka Node
  - Zookeeper: 集群狀態存儲
- Connector：連接應用程序和Topic
- Stream Processor：流處理器，從一個Topic接收并處理流式數據，并將結果存入另一個Topic
還有兩個重要邏輯組件
- Topic
- Partition

在這里插入圖片描述

1.2 Topic和Partition

關于Topic和Partition
- Topic分類的消息流，相關的消息保存于Partition中
  - 一個Topic中的數據，可以分布保存于一至多個Partition中
  - 每個Partition中，通常存在一個leader，以及一至多個replicas/followers
- Topic是Producer發布消息，以及consumer消費消息使用的端點

在這里插入圖片描述

1.3 Topic中的消息記錄

消息及存儲方式
- Kafka中，每個消息記錄(record)的標準格式通常由key、value、timestamp和一些metadata組成；
- 待存入Topic的消息記錄未明確指定目標Partition時，Kafka會根據記錄的key的hash碼選擇一個Partition；未明確指定timestamp時，Producer將會使用當前時間（創建時間或附加到日志的時間）作為其時間戳；
- Kafka將數據持久存儲在log.dir參數指定的目錄中，而各topic會映射進該目錄的子目錄中；
  - Kafka會保留所有記錄，無論它們是否已被消費
  - 記錄在broker配置中定義的retention period內保留，默認時長為7天（168小時）
- Kafka基于Pub/Sub和Queue模型構建Topic，它使用消費者組（Consumer Group）的概念將處理任務劃分為一組消費者進程并行運行，并且可以將消息廣播到多個組中；

1.4 Partition

Partition代表Topic中的數據分片，在其它數據庫系統中，通常稱為replica或shard
- 每個Partition都是一個按時間排序的不可變記錄序列，該序列存儲于日志中;
- 消費者按照記錄在日志中的存儲順序讀取消息;
- 每個消息都有一個稱為offset的id
能夠將一個Topic中的數據并行存儲于多個broker上；
支持以冗余機制（復制因子大于1）存儲多個副本，并能容忍最多N-1個服務器故障，N為復制

因子數量；
消費者讀取一個Topic時，它將從所有Partition中讀取數據

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/532690.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/532690.shtml
英文地址，請注明出處：http://en.pswp.cn/news/532690.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

虛擬內存精粹

虛擬內存精粹

虛擬內存精粹標題：虛擬內存精粹作者：潘建鋒原文：HTTPS://strikefreedom.top/memory-management–virtual-memory 導言虛擬內存是當今計算機系統中最重要的抽象概念之一，它的提出是為了更加有效地管理內存并且降低內存出錯的概…

閱讀更多...

藍橋杯真題訓練 2019.4題

藍橋杯真題訓練 2019.4題

標題： 數的分解（本題總分：10 分） 【問題描述】把 2019 分解成 3 個各不相同的正整數之和，并且要求每個正整數都不包含數字 2 和 4，一共有多少種不同的分解方法？ 注意交換 3 個整數的順序被視…

閱讀更多...

深度學習自動編譯和優化技術調研

深度學習自動編譯和優化技術調研

深度學習自動編譯和優化技術調研轉自：https://moqi.com.cn/blog/deeplearning/ 作者：墨奇科技全棧開發在墨奇科技，我們需要將一些包含深度神經網絡（DNN）的 AI 算法移植到邊緣端的設備， 這些設備往往使用 …

閱讀更多...

三元組數據處理系統

三元組數據處理系統

include<stdio.h> include<stdlib.h> define OK 1 define ERROR 0 define OVERFLOW -2 typedef int Status; typedef float ElemType; typedef ElemType *Triplet; // 聲明Triplet為ElemType指針類型 //三元組的初始化 Status initTriplet(Triplet &T, E…

閱讀更多...

Copy-On-Write COW機制

Copy-On-Write COW機制

Copy-On-Write COW機制轉自：https://zhuanlan.zhihu.com/p/48147304 作者：Java3y 前言只有光頭才能變強在讀《Redis設計與實現》關于哈希表擴容的時候，發現這么一段話： 執行BGSAVE命令或者BGREWRITEAOF命令的過程中&#xff0c…

閱讀更多...

實驗報告：抽象數據類型的表現和實現

實驗報告：抽象數據類型的表現和實現

實驗報告：抽象數據類型的表現和實現實驗內容基本要求： 設計實現抽象數據類型“三元組”，要求動態分配內存。每個三元組由任意三個實數的序列構成，基本操作包括：創建一個三元組，取三元組的任意一個分量&…

閱讀更多...

關于x86、x86_64/x64、amd64和arm64/aarch64

關于x86、x86_64/x64、amd64和arm64/aarch64

關于x86、x86_64/x64、amd64和arm64/aarch64 轉自：https://www.jianshu.com/p/2753c45af9bf 為什么叫x86和x86_64和AMD64? 為什么大家叫x86為32位系統？ 為什么軟件版本會注明 for amd64版本，不是intel64呢？ x86是指intel的開…

閱讀更多...

實驗報告：線性表的基本操作及應用

實驗報告：線性表的基本操作及應用

實驗報告： 線性表的基本操作及應用實驗內容基本要求： （1）實現單鏈表的創建；（2）實現單鏈表的插入；（3）實現單鏈表的刪除 （4）實現單鏈…

閱讀更多...

TVM：源碼編譯安裝

TVM：源碼編譯安裝

TVM：Linux源碼編譯安裝筆者環境： OS：Ubuntu 18.04 CMake：3.10.2 gcc：7.5.0 cuda：11.1 編譯安裝過程總覽本文將簡介 tvm 的編譯安裝過程，包含兩個步驟： 通過C代碼構建共享庫設置相…

閱讀更多...

第2章線性表的基本使用及其cpp示例（第二章匯總,線性表都在這里）

第2章線性表的基本使用及其cpp示例（第二章匯總,線性表都在這里）

2.1線性表的定義和特點【類型定義： *是n個元素的有限序列 *除了第一個元素沒有直接前驅和最后一個沒有直接后驅之外，其余的每個元素只有一個直接前驅和直接后驅； （a1,a2…an） 【特征： *有窮性&#xff1…

閱讀更多...

TVM：通過Python接口（AutoTVM）來編譯和優化模型

TVM：通過Python接口（AutoTVM）來編譯和優化模型

TVM：通過Python接口（AutoTVM）來編譯和優化模型上次我們已經介紹了如何從源碼編譯安裝 tvm，本文我們將介紹在本機中使用 tvm Python 接口來編譯優化模型的一個demo。 TVM 是一個深度學習編譯器框架，有許多不同的模塊…

閱讀更多...

TVM：在樹莓派上部署預訓練的模型

TVM：在樹莓派上部署預訓練的模型

TVM：在樹莓派上部署預訓練的模型之前我們已經介紹如何通過Python接口（AutoTVM）來編譯和優化模型。本文將介紹如何在遠程（如本例中的樹莓派）上部署預訓練的模型。在設備上構建 TVM Runtime 首先我們需要再遠程設備…

閱讀更多...

2.2線性表的順序表

2.2線性表的順序表

2.2.1線性表的順序表示和實現------順序映像【順序存儲】在【查找時】的時間復雜度為【O(1)】，因為它的地址是連續的，只要知道首元素的地址，根據下標可以很快找到指定位置的元素【插入和刪除】操作由于可能要在插入前或刪除后對元素進行移…

閱讀更多...

TVM：交叉編譯和RPC

TVM：交叉編譯和RPC

TVM：交叉編譯和RPC 之前我們介紹了 TVM 的安裝、本機demo和樹莓派遠程demo。本文將介紹了在 TVM 中使用 RPC 進行交叉編譯和遠程設備執行。通過交叉編譯和 RPC，我們可以在本地機器上編譯程序，然后在遠程設備上運行它。當遠程設備資源有限…

閱讀更多...

2.3單鏈表的基本使用及其cpp示例

2.3單鏈表的基本使用及其cpp示例

2.3線性表的鏈式表現與實現 2.3.1.1單鏈表【特點： *用一組任意的存儲單元存儲線性表的數據元素 *利用指針實現用不同相鄰的存儲單元存放邏輯上相鄰的元素 *每個元素ai，除存儲本身信息外，還存儲其直接后繼的元素（后一個元素的地址…

閱讀更多...

TVM：簡介

TVM：簡介

TVM：簡介概述 Apache TVM 是一個用于 CPU、GPU 和機器學習加速器的開源機器學習編譯器框架。它旨在使機器學習工程師能夠在任何硬件后端上高效地優化和運行計算。本教程的目的是通過定義和演示關鍵概念，引導您了解 TVM 的所有主要功能。新用戶應該能夠從…

閱讀更多...

2.3.3單鏈表的雙向鏈表

2.3.3單鏈表的雙向鏈表

2.3.3雙向鏈表插入、刪除指在前驅和后驅方向都能游歷（遍歷）的線性鏈表雙向鏈表的每個結點有兩個指針域【結構】：prior data next 雙鏈表通常采用帶頭結點的循環鏈表形式可理解為首位相接的數據“圈”，每個結點都可以向前…

閱讀更多...

nvidia-smi 命令詳解

nvidia-smi 命令詳解

nvidia-smi 命令詳解簡介 nvidia-smi - NVIDIA System Management Interface program nvidia smi（也稱為NVSMI）為來自 Fermi 和更高體系結構系列的 nvidia Tesla、Quadro、GRID 和 GeForce 設備提供監控和管理功能。GeForce Titan系列設備支持大多數…

閱讀更多...

2.4一元多項式的表示及相加，含cpp算法

2.4一元多項式的表示及相加，含cpp算法

2.4一元多項式的表示及相加 n階多項式的表示： n階多項式有n1項指數按升冪排序【優點： 多項式的項數可以動態增長，不存在存儲溢出的問題插入，刪除方便，不移動元素【表示： 有兩個數據域，一…

閱讀更多...

TVM：使用Tensor Expression (TE)來處理算子

TVM：使用Tensor Expression (TE)來處理算子

TVM：使用Tensor Expression (TE)來處理算子在本教程中，我們將聚焦于在 TVM 中使用張量表達式（TE）來定義張量計算和實現循環優化。TE用純函數語言描述張量計算（即每個表達式都沒有副作用）。當在 TVM 的整體…

閱讀更多...

最新文章