Zookeeper學習2:原理、常用腳本、選舉機制、監聽器

文章目錄

    • 原理
      • 選舉機制(重點)
        • 情況1:正常啟動集群
        • 情況2:集群啟動完,中途有機器掛了
      • 監聽器
      • 客戶端向服務端寫入數據
        • 客戶端向服務端Leader節點寫入
        • 客戶端向服務端Follower節點寫入
      • Paxos算法(每個節點都可以提議者)
      • ZAB協議算法 - Paxos算法的改良 - 集群僅能一位提議者(即Leader)
        • 認識
        • 崩潰恢復
          • Leader掛,重新選舉
          • 數據恢復
      • CAP理倫
    • 腳本
      • 集群統一啟動、關閉、狀態查看腳本
    • 源碼分析(粗略)
      • 輔助源碼
        • 持久化
        • 序列化
      • 服務端啟動流程
      • 服務端選舉Leader流程
      • Leader、Follower數據同步流程
      • 服務端Leader啟動Zk過程
      • 服務端Follower啟動Zk過程
      • 客戶端連接Zk服務端過程

原理

選舉機制(重點)

情況1:正常啟動集群

集群正常總固定票數: conf/zoo.cfg里面的server.的配置行數
?
特點:

  1. 一旦選舉出領導leader,除非作為leader的zookeeper掛了,否則不會在重新選舉,其他新進的zookeeper集群都作為追隨者Following
  2. 存活的zookeeper機器必須【集群正常總固定票數】的一半以上才會進行選舉leader角色,否則一直是Looking
  3. zookeeper可以給自己投票,一旦每個人的票數都一樣,交換myid查看后,誰大就把投自己的票改投成myid最大的那個

在這里插入圖片描述

?

集群中5臺zookeeper機器依次啟動后選舉領導的整個過程
在這里插入圖片描述

情況2:集群啟動完,中途有機器掛了
觸發選舉條件【滿足其一】
1. 有新zookeeper服務器啟動加入
2. 中途在集群中的有zookeeper機器斷聯
選舉過程情景
1. 集群中的Leader沒掛,維持現狀,依然是Leader機器為Leader
2. 集群中的Leader掛了,Leader選舉規則:誰任期Epoch大選誰、任期一致,誰事務ID修改次數大就選誰、事務ID也一致,誰身份證號大就選誰

監聽器

流程: zookeeper客戶端告知服務端需要監聽某某節點的數據變化,服務端一旦節點發生變化,就將變化通知內容推送給客戶端

?
在這里插入圖片描述

1. 首先要有一個main線程
2. 在main線程中創建Zookeeper客戶端,這時就會創建兩個線 程,一個負責網絡連接通信(connet)),一個負責監聽(listener)
3. 通過connectz線程將注冊的監聽事件發送給Zookeeper服務端
4. 在Zookeeper的注冊監聽器列表中將注冊的監聽事件添加到列表中
5. Zookeeper服務端監聽到有數據或路徑變化,就會將這個消息發送給Zookeeper客戶端的listener線程
6. listener線程內部調用了process0方法,處理后續業務邏輯
常見的監聽事件
1. 監聽數據的變化 == get 節點 -w
2. 監聽子節點增刪的變化 == ls 節點 -w

監聽數據的變化
在這里插入圖片描述

監聽子節點增刪的變化
在這里插入圖片描述

客戶端向服務端寫入數據

客戶端向服務端Leader節點寫入

流程: Leader會傳遞給Follower去寫入,如果 超半數的zookeeper都寫入成功,則Leader服務端機器會告訴客戶端數據寫入成功 ,剩下Follower還未寫入的Leader會慢慢通知他們寫入,反正最終zookeeper服務端集群內所有機器都寫入成功

在這里插入圖片描述

客戶端向服務端Follower節點寫入

流程: Follower會先將 客戶端的寫入請求轉給Leader,Leader自己將寫入請求先執行,在將這個寫入請求分發給集群內所有Follower機器 ,所有集群中超過半數的zookeeper都寫入成功,則Leader會告知當初最開始那臺Follower機器說明此次寫入成功,然后由該臺Follower告知客戶端集群此次寫入成功

在這里插入圖片描述

Paxos算法(每個節點都可以提議者)

Paxos算法: 基于消息傳遞且具有高度容錯特性的一致性算法。快速正確的在一個分布式系統保持數據值一致,保證無論發生任何異常都不會破壞系統的一致性
?
Propose(提議): 任務編號
?
Proposal(提案): 任務編號+任務內容

Paxos角色==Zookeeper系統中所有節點==節點可以擁有多角色
提議者(proposer)
接受者(acceptor)
學習者(learner)
Paxos主要階段
準備階段:提議者向接受者發送一個提議編號,接受者如果收到的提議編號比自己已經接受的提議編號大,接受該提議,并返回自己已經接受的提議編號和值
提議階段:提議者收到了大多數接受者的接受,提議者向所有接受者發送一個提議,包括提議編號和值。
學習階段:一旦某值被大多數接受者接受,學習者就可以學習到這個值并應用到系統中
接受者收到提案者空白提案請求時的原則
不在接受提案ID小于等于當前收到的
不在接受提案落檔中提案ID小于當前的
不違背以前做出的承諾

在這里插入圖片描述

?
Paxos算法完美情況
在這里插入圖片描述

?
Paxos算法弊端
在這里插入圖片描述

ZAB協議算法 - Paxos算法的改良 - 集群僅能一位提議者(即Leader)

認識

概念: 只有一臺客戶端(Leader)負責處理外部的寫事務請求,然后Leader客戶端將數據同步到其他Follower節點。即Zookeeper只有一個Leader可以發起提案

ZAB模式
消息廣播
崩潰恢復
ZAB針對事務處理過程(兩階段)
廣播事務階段
廣播事務提交操作
1. 客戶端發起一個寫操作請求
2. Leader服務器將客戶端的請求轉化為事務Proposal提案,同時為每個Proposal分配一個全局的ID,即zxid
3. Leader服務器為每個Follower服務器分配一個單獨的隊列,然后將需要廣播的Proposal依次放到隊列中去,并且根據FIFO策略進行消息發送
4. Follower接收到Proposal后,會首先將其以事務日志的方式寫入本地磁盤中,寫入成功后向Leader反饋一個Ack響應消息
5. Leader接收到超過半數以上Follower的Ack響應消息后,即認為消息發送成功,可以發送commit消息
6. Leaderl向所有Follower廣播commit消息,同時自身也會完成事務提交。Follower接收到commit消息后,會將上一條事務提交

此圖對應的是上圖的流程圖
在這里插入圖片描述

崩潰恢復
Zab協議崩潰恢復同時滿足的要求
1. 已經產生提交(Proposal)的提案(過半數都Ack),Follower必須執行
2. 未提交的提案直接丟棄 - 未proposal給follower的提案
Leader掛,重新選舉
新Leader滿足要求
1. 新Leader必須都是己經提交了Proposall的Follower服務器節點
2. 新選舉的Leader節點中含有最大的zxid)這樣做的好處是可以避免Leader服務器檢查Proposal的提交和丟棄工作
數據恢復
數據恢復
新Leader選舉
開始接收客戶端請求前,首先確認事務日志的所有過半同意的提案已經commit
某個Follower同步完成Leader的提案后,才會將其加入到真正可用的Follower列表中

CAP理倫

分布式系統最多同時滿足CAP其中的兩項,不可能三項同時滿足
?
Zookeeper:滿足的是CP的兩項要求

CAP
一致性(Consistency):集群之間的數據保持一致
可用性(Available):系統服務一直可用,且保證用戶每個操作能在有限時間返回結果
分區容錯性(Partition Tolerance):遇到網絡分區故障,仍然能對外提供可用服務
為什么Zookeeper不滿足A
極端情況下,服務端會丟棄一些客戶端請求
進行Leader選舉時,集群不可用

腳本

集群統一啟動、關閉、狀態查看腳本

zk.sh

#!/bin/bash
# 運行此腳本前必須把當前機器人的公私密鑰給到目標運行機器 == 要不然每次運行此腳本時都會叫你輸入每臺目標機器的密碼
# 命令1(本機生成RSA公私密鑰):ssh-keygen -t rsa
# 命令2(將密鑰傳給目標三臺機器即192.168.19.107、192.168.19.108、192.168.19.109 ):ssh-copy-id root@目標機器IPfor currentHostName in 192.168.19.107 192.168.19.108 192.168.19.109
doecho "=================zookeeper【${currentHostName}】【$1】==============================="case $1 in"start") {ssh $currentHostName "cd /opt/module/zookeeper-3.9.1 && sh bin/zkServer.sh start"};;"stop") {ssh $currentHostName "cd /opt/module/zookeeper-3.9.1 && sh bin/zkServer.sh stop"};;"status") {ssh $currentHostName "cd /opt/module/zookeeper-3.9.1 && sh bin/zkServer.sh status"};;*) {echo "未知命令,僅支持start|stop|status"}esacdone

在這里插入圖片描述

源碼分析(粗略)

輔助源碼

持久化

數據存儲: 集群中的數據會在內存(樹)、磁盤中各存一份
?
接口: 快照【org.apache.zookeeper.server.persistence.SnapShot】、事務記錄【org.apache.zookeeper.server.persistence.TxnLog】
?
事務日志(txnlog): ZooKeeper會將所有的寫操作以事務的形式記錄在事務日志中,這些寫操作包括創建節點、更新節點數據、刪除節點等。事務日志是一個追加寫的日志文件,用于記錄每個寫操作的詳細信息。通過事務日志,ZooKeeper可以保證數據的一致性和持久性
?
快照(snapshot): ZooKeeper定期會生成一個快照文件,用于保存當前內存中所有節點的狀態。快照文件包含了所有節點的數據和元數據信息。當ZooKeeper服務器啟動時,會首先加載最新的快照文件,然后通過回放事務日志來恢復到最新的狀態。
?
Zookeeper啟動數據恢復流程: 先加載最新的快照文件,然后通過回放事務日志來將數據恢復到最新的狀態

在這里插入圖片描述

序列化

接口: 序列化、反序列化【org.apache.jute.Record】

在這里插入圖片描述

服務端啟動流程

入口類: org.apache.zookeeper.server.quorum.QuorumPeerMain#main

在這里插入圖片描述

服務端選舉Leader流程

在這里插入圖片描述

Leader、Follower數據同步流程

概括: Follower必須去看Leader保持一致,而不是Leader跟Follower保持一致
?
【Follower】Learner: org.apache.zookeeper.server.quorum.Learner#registerWithLeader
?
【Leader】LearnerHandler: org.apache.zookeeper.server.quorum.LearnerHandler#run

差異化同步
回滾同步
提交同步
全量同步
同步方式
Diff:Leader、Follower都一樣,無需任何操作
Trunc Follower:Follower的事務ID比Leader大,則Follower回滾成跟Leader一致
Commit:Leader的事務ID比Follower大,則Leader同步提案給Follower執行成一致
Follower沒任何數據:則Leader以Snap方式同步執行恢復給Follower

在這里插入圖片描述

服務端Leader啟動Zk過程

核心: org.apache.zookeeper.server.quorum.Leader#startZkServer

在這里插入圖片描述

服務端Follower啟動Zk過程

核心: org.apache.zookeeper.server.quorum.Follower#followLeader

在這里插入圖片描述

客戶端連接Zk服務端過程

核心入口: org.apache.zookeeper.ZooKeeperMain#main

在這里插入圖片描述

?
剛興趣的同行可以進群溝通交流,內置機器人供大家愉快

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/716997.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/716997.shtml
英文地址,請注明出處:http://en.pswp.cn/news/716997.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AMDGPU KFD Test 編譯使用

ROCT-Thunk-Interface是一個用于在ROCm軟件堆棧中提供設備無關性的層。它是ROCm的一部分,允許不同的硬件平臺(如AMD GPU和Intel CPU)使用相同的API進行計算。 要安裝ROCT-Thunk-Interface,首先需要創建一個新的目錄,并進入該目錄: mkdir rocm-build cd rocm-build然后,…

ng : 無法將ng項識別為 cmdlet、函數、腳本文件或可運行程序的名稱

ng : 無法將“ng”項識別為 cmdlet、函數、腳本文件或可運行程序的名稱”,出現這種錯誤,那說明你angular-cli沒有下載所以環境變量里沒有相應的東西 1、需要在cmd里輸入npm install -g angular/cli 2、之后運行angular命令時還可能出現這種錯誤 “ng : …

ruoyi 圖片等文件資源讀取

老是忘,記錄一下 ResourcesConfig 文件下 /** 本地文件上傳路徑 */ registry.addResourceHandler(Constants.RESOURCE_PREFIX "/**").addResourceLocations("file:" RuoYiConfig.getProfile() "/"); /*** 資源映射路徑 前綴*/ …

kafka消費者重平衡是什么?怎么避免?

消費者重平衡是指主題下的分區怎么分配給消費者的過程。下面這個圖可以看出該過程:原來有2個消費者,3個分區,其中一個消費者肯定就的處理2個分區了。那么當新加入消費者時,則每個消費者就只處理一個分區了。處理這個分區過程的叫協…

詳解Nacos注冊中心的使用

文章目錄 1、安裝2、服務注冊2.1、引入依賴2.2、配置nacos地址2.3、重啟 3、服務分級存儲模型3.1、給user-service配置集群3.2、同集群優先的負載均衡 4、權重配置5、環境隔離5.1、創建namespace5.2、配置namespace 6、Nacos與Eureka的區別7、代碼免費分享 ?🍃作者…

首例以“冠狀病毒”為主題的勒索病毒,篡改系統MBR

前言概述 2020年勒索病毒攻擊仍然是網絡安全的最大威脅,在短短三個月的時間里,已經出現了多款新型的勒索病毒,關于2020年勒索病毒攻擊新趨勢,可以閱讀筆者寫的上一篇文章,里面有詳細的分析,從目前觀察到的…

Linux 學習筆記(9)

九、 運行級別 1 、 Linux 系統的運行級別 (runlevel) Linux 系統有 7 個運行級別, Linux 系統任何時候都運行在一個指定的運行級別上,不同的運行級 別所運行的程序和服務不盡相同,所要完成的工作和要達到的目的也不相同 運行級別…

RH850P1X芯片學習筆記-Generic Timer Module -ATOM

文章目錄 ARU-connected Timer Output Module (ATOM)OverviewGLOBAL CHANNEL CONTROL BLOCK ATOM Channel architectureATOM Channel modesSOMP-Signal Output Mode PWMSOMP - ARUSOMC-Signal Output Mode CompareSOMC - ARUSOMC – COMPARE COMMANDSOMC – OUTPUT ACTIONATOM …

Python縮進規則

Python的縮進規則是Python語法中非常重要的一部分,也是Python語言獨特的特點之一。在Python中,縮進被用來表示代碼塊的層次結構,而不是像其他語言一樣使用大括號或關鍵詞。這種縮進規則使得Python代碼更加簡潔、易讀、易于理解,同…

python模塊百科_操作系統接口_os【一】

python模塊百科_操作系統接口_os【一】 os --- 多種操作系統接口一、相關模塊1.1 os.path 文件路徑1.2 fileinput 文件讀取1.3 tempfile 臨時文件和目錄1.4 shutil 高級文件和目錄1.5 platform 操作系統底層模塊 二、關于函數適用性的說明2.1 與操作系統相同的接口2.2 支持字節…

Git版本管理常用指令

Git常用命令 一、基本指令二、本地倉庫管理三、遠程倉庫管理四、分支管理五、儲藏區六、標簽管理一、基本指令 查看Git安裝版本:git --version 查看log指令的幫助信息:git log --help 配置Git用戶名:git config --global user.name “xxxxx” 配置Git郵箱: git config --…

2024年騰訊云新用戶優惠券領取入口及使用教程

隨著云計算技術的不斷發展和普及,越來越多的個人和企業選擇使用云服務。騰訊云作為國內領先的云服務提供商,為了吸引新用戶,經常推出各種優惠活動,其中就包括新用戶專屬優惠券,本文將為大家分享騰訊云新用戶優惠券的領…

5個好玩神奇還免費的工具網站收藏不后悔-搜嗖工具箱

生命倒計時 http://www.thismuchlonger.com 這是一個相哇塞的網站,可以讓我們靜下心來好好想想我們來這個世界究竟為了什么,因為當我們作為命運的主宰者。敲打鍵盤設定好自己一生長度的時候,我們的剩余壽命已經成絕對值,一旦生命…

創建型模式之原型模式

一、概述 1、工作原理:將一個原型對象傳給要發動創建的對象(即客戶端對象),這個要發動創建的對象通過請求原型對象復制自己來實現創建過程 2、通過克隆方法所創建的對象是全新的對象,它們在內存中擁有新的地址,每一個克隆對象都是獨立的 3…

MySQL 中的 varchar 和 char 有什么區別?MySQL中 in 和 exists 區別?

MySQL 中的 varchar 和 char 有什么區別? char 是一個定長字段,假如申請了char(10)的空間,那么無論實際存儲多少內容.該字段都占用 10 個字符,而 varchar 是變長的,也就是說申請的只是最大長度,占用的空間為實際字符長度1,最后一個字符存儲使用了多長的空間. 在檢索…

李沐動手學習深度學習——3.6練習

本節直接實現了基于數學定義softmax運算的softmax函數。這可能會導致什么問題?提示:嘗試計算exp(50)的大小。 可能存在超過計算機最大64位的存儲,導致精度溢出,影響最終計算結果。 本節中的函數cross_entropy是根據交叉熵損失函數…

JavaScript之數據類型

系列文章目錄 文章目錄 系列文章目錄前言 前言 前些天發現了一個巨牛的人工智能學習網站,通俗易懂,風趣幽默,忍不住分享一下給大家。點擊跳轉到網站,這篇文章男女通用,看懂了就去分享給你的碼吧。 數據類型   Java…

20.圖

圖的基本概念 1.圖的定義 由頂點和邊組成的集合,G(V,E) 2.基本概念 鄰接點: 對于無向圖u v來說,uv互為鄰接點 對于有向圖u->v來說,v是u的鄰接點,但u不是v的臨界點 路徑: 一個頂點到另一個頂點所經過的…

從Poincare猜想看中國數學的國際地位

2006年丘成桐學派利用北京晨興數學中心,宣布一名俄國學者Poincare猜想研究中存在錯誤,已經由華裔學者朱熹平和曹懷東糾正過來,但數年以后我發現作為千禧七問題之一的Poincazre猜想,英國克萊數學所還是把1百萬美元獎金送給俄國人。…

藍橋杯:卡片

題目 小藍有很多數字卡片,每張卡片上都是數字0 到9。 小藍準備用這些卡片來拼一些數,他想從1 開始拼出正整數,每拼一個,就保存起來,卡片就不能用來拼其它數了。 小藍想知道自己能從1 拼到多少。 例如,當小…