解說redis中如何實現高可用

redis中為了實現高可用（High Availability，簡稱HA），采用了如下兩個方式：

主從復制

redis中主從節點復制數據有全量復制和部分復制之分。

舊版本全量復制功能的實現

全量復制使用snyc命令來實現，其流程是：

從服務器向主服務器發送sync命令。
主服務器在收到sync命令之后，調用bgsave命令生成最新的rdb文件，將這個文件同步給從服務器，這樣從服務器載入這個rdb文件之后，狀態就會和主服務器執行bgsave命令時候的一致。
主服務器將保存在命令緩沖區中的寫命令同步給從服務器，從服務器執行這些命令，這樣從服務器的狀態就跟主服務器當前狀態一致了。

舊版本全量復制功能，其最大的問題是從服務器斷線重連時，即便在從服務器上已經有一部分數據了，也需要進行全量復制，這樣做的效率很低，于是新版本的redis在這部分做了改進。

新版本全量復制功能的實現

新版本redis使用psync命令來代替sync命令，該命令既可以實現完整全同步也可以實現部分同步。

復制偏移量

執行復制的雙方，主從服務器，分別會維護一個復制偏移量：

復制積壓緩沖區

主服務器內部維護了一個固定長度的先進先出隊列做為復制積壓緩沖區，其默認大小為1MB。

在主服務器進行命令傳播時，不僅會將寫命令同步到從服務器，還會將寫命令寫入復制積壓緩沖區。

服務器運行ID

每個redis服務器，都有其運行ID，運行ID由服務器在啟動時自動生成，主服務器會將自己的運行ID發送給從服務器，而從服務器會將主服務器的運行ID保存起來。

從服務器redis斷線重連之后進行同步時，就是根據運行ID來判斷同步的進度：

psync命令流程

有了前面的準備，下面開始分析psync命令的流程：

如果從服務器之前沒有復制過任何主服務器，或者之前執行過slaveof no one命令，那么從服務器就會向主服務器發送psync ? -1命令，請求主服務器進行數據的全量同步。
否則，如果前面從服務器已經同步過部分數據，那么從服務器向主服務器發送psync <runid> <offset>命令，其中runid是上一次主服務器的運行id，offset是當前從服務器的復制偏移量。

前面兩種情況主服務器收到psync命令之后，會出現以下三種可能：

主服務器返回+fullresync <runid> <offset>回復，表示主服務器要求與從服務器進行完整的數據全量同步操作。其中，runid是當前主服務器運行id，而offset是當前主服務器的復制偏移量。
如果主服務器應答+continue，那么表示主服務器與從服務器進行部分數據同步操作，將從服務器缺失的數據同步過來即可。
如果主服務器應答-err，那么表示主服務器版本低于2.8，識別不了psync命令，此時從服務器將向主服務器發送sync命令，執行完整的全量數據同步。

哨兵機制概述

redis使用哨兵機制來實現高可用(HA)，其大概工作原理是：