1、Redis集群方案比較
-
哨兵模式
????????在redis3.0以前的版本要實現集群一般是借助哨兵sentinel工具來監控master節點的狀態,如果master節點異常,則會做主從切換,將某一臺slave作為master,哨兵的配置略微復雜,并且性能和高可用性等各方面表現一般,特別是在主從切換的瞬間存在訪問瞬斷的情況,而且哨兵模式只有一個主節點對外提供服務,沒法支持很高的并發,且單個主節點內存也不宜設置得過大,否則會導致持久化文件過大,影響數據恢復或主從同步的效率
-
高可用集群模式
????????redis集群是一個由多個主從節點群組成的分布式服務器群,它具有復制、高可用和分片特性。Redis集群不需要sentinel哨兵·也能完成節點移除和故障轉移的功能。需要將每個節點設置成集群模式,這種集群模式沒有中心節點,可水平擴展,據官方文檔稱可以線性擴展到上萬個節點(官方推薦不超過1000個節點)。redis集群的性能和高可用性均優于之前版本的哨兵模式,且集群配置非常簡單
2、Redis高可用集群搭建
-
redis集群搭建
redis集群需要至少三個master節點,我們這里搭建三個master節點,并且給每個master再搭建一個slave節點,總共6個redis節點,這里用三臺機器部署6個redis實例,每臺機器一主一從,搭建集群的步驟如下:
第一步:在第一臺機器的/usr/local下創建文件夾redis-cluster,然后在其下面分別創建2個文件夾如下
(1)mkdir -p /usr/local/redis-cluster
(2)mkdir 8001 8004第一步:把之前的redis.conf配置文件copy到8001下,修改如下內容:
(1)daemonize yes
(2)port 8001(分別對每個機器的端口號進行設置)
(3)pidfile /var/run/redis_8001.pid # 把pid進程號寫入pidfile配置的文件
(4)dir /usr/local/redis-cluster/8001/(指定數據文件存放位置,必須要指定不同的目錄位置,不然會丟失數據)
(5)cluster-enabled yes(啟動集群模式)
(6)cluster-config-file nodes-8001.conf(集群節點信息文件,這里800x最好和port對應上)
(7)cluster-node-timeout 10000(8)# bind 127.0.0.1(bind綁定的是自己機器網卡的ip,如果有多塊網卡可以配多個ip,代表允許客戶端通過機器的哪些網卡ip去訪問,內網一般可以不配置bind,注釋掉即可)(9)protected-mode no (關閉保護模式)(10)appendonly yes
如果要設置密碼需要增加如下配置:(11)requirepass zhuge (設置redis訪問密碼)(12)masterauth zhuge (設置集群節點間訪問密碼,跟上面一致)第三步:把修改后的配置文件,copy到8004,修改第2、3、4、6項里的端口號,可以用批量替換:
:%s/源字符串/目的字符串/g 第四步:另外兩臺機器也需要做上面幾步操作,第二臺機器用8002和8005,第三臺機器用8003和8006第五步:分別啟動6個redis實例,然后檢查是否啟動成功
(1)/usr/local/redis-5.0.3/src/redis-server /usr/local/redis-cluster/800*/redis.conf
(2)ps -ef | grep redis 查看是否啟動成功第六步:用redis-cli創建整個redis集群(redis5以前的版本集群是依靠ruby腳本redis-trib.rb實現)
# 下面命令里的1代表為每個創建的主服務器節點創建一個從服務器節點
# 執行這條命令需要確認三臺機器之間的redis實例要能相互訪問,可以先簡單把所有機器防火墻關掉,如果不關閉防火墻則需要打開redis服務端口和集群節點gossip通信端口16379(默認是在redis端口號上加1W)
# 關閉防火墻
# systemctl stop firewalld # 臨時關閉防火墻
# systemctl disable firewalld # 禁止開機啟動
# 注意:下面這條創建集群的命令大家不要直接復制,里面的空格編碼可能有問題導致創建集群不成功
(1)/usr/local/redis-5.0.3/src/redis-cli -a zhuge --cluster create --cluster-replicas 1 192.168.0.61:8001 192.168.0.62:8002 192.168.0.63:8003 192.168.0.61:8004 192.168.0.62:8005 192.168.0.63:8006 第七步:驗證集群:
(1)連接任意一個客戶端即可:./redis-cli -c -h -p (-a訪問服務端密碼,-c表示集群模式,指定ip地址和端口號)如:/usr/local/redis-5.0.3/src/redis-cli -a zhuge -c -h 192.168.0.61 -p 800*
(2)進行驗證: cluster info(查看集群信息)、cluster nodes(查看節點列表)
(3)進行數據操作驗證
(4)關閉集群則需要逐個進行關閉,使用命令:
/usr/local/redis-5.0.3/src/redis-cli -a zhuge -c -h 192.168.0.60 -p 800* shutdown
3、Java操作redis集群
借助redis的java客戶端jedis可以操作以上集群,引用jedis版本的maven坐標如下:
<dependency><groupId>redis.clients</groupId><artifactId>jedis</artifactId><version>2.9.0</version>
</dependency>
Java編寫訪問redis集群的代碼非常簡單,如下所示:
public class JedisClusterTest {public static void main(String[] args) throws IOException {JedisPoolConfig config = new JedisPoolConfig();config.setMaxTotal(20);config.setMaxIdle(10);config.setMinIdle(5);Set<HostAndPort> jedisClusterNode = new HashSet<HostAndPort>();jedisClusterNode.add(new HostAndPort("192.168.0.61", 8001));jedisClusterNode.add(new HostAndPort("192.168.0.62", 8002));jedisClusterNode.add(new HostAndPort("192.168.0.63", 8003));jedisClusterNode.add(new HostAndPort("192.168.0.61", 8004));jedisClusterNode.add(new HostAndPort("192.168.0.62", 8005));jedisClusterNode.add(new HostAndPort("192.168.0.63", 8006));JedisCluster jedisCluster = null;try {//connectionTimeout:指的是連接一個url的連接等待時間//soTimeout:指的是連接上一個url,獲取response的返回等待時間jedisCluster = new JedisCluster(jedisClusterNode, 6000, 5000, 10, "zhuge", config);System.out.println(jedisCluster.set("cluster", "hangzhou"));System.out.println(jedisCluster.get("cluster"));} catch (Exception e) {e.printStackTrace();} finally {if (jedisCluster != null)jedisCluster.close();}}
}運行效果如下:
OK
hangzhou
集群的Spring Boot整合Redis連接代碼見示例項目:redis-sentinel-cluster
1、引入相關依賴:
<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId>
</dependency><dependency><groupId>org.apache.commons</groupId><artifactId>commons-pool2</artifactId>
</dependency>
springboot項目核心配置:
server:port: 8080spring:redis:database: 0timeout: 3000password: zhugecluster:nodes: 192.168.0.61:8001,192.168.0.62:8002,192.168.0.63:8003,192.168.0.61:8004,192.168.0.62:8005,192.168.0.63:8006lettuce:pool:max-idle: 50min-idle: 10max-active: 100max-wait: 1000
訪問代碼:
@RestController
public class IndexController {private static final Logger logger = LoggerFactory.getLogger(IndexController.class);@Autowiredprivate StringRedisTemplate stringRedisTemplate;@RequestMapping("/test_cluster")public void testCluster() throws InterruptedException {stringRedisTemplate.opsForValue().set("hangzhou", "666");System.out.println(stringRedisTemplate.opsForValue().get("hangzhou"));}
}
4、Redis集群原理分析
????????Redis Cluster 將所有數據劃分為 16384 個 slots(槽位),每個節點負責其中一部分槽位。槽位的信息存儲于每個節點中。
????????當 Redis Cluster 的客戶端來連接集群時,它也會得到一份集群的槽位配置信息并將其緩存在客戶端本地。這樣當客戶端要查找某個 key 時,可以直接定位到目標節點。同時因為槽位的信息可能會存在客戶端與服務器不一致的情況,還需要糾正機制來實現槽位信息的校驗調整。
槽位定位算法
????????Cluster 默認會對 key 值使用 crc16 算法進行 hash 得到一個整數值,然后用這個整數值對 16384 進行取模來得到具體槽位。
HASH_SLOT = CRC16(key) mod 16384
跳轉重定位
????????當客戶端向一個錯誤的節點發出了指令,該節點會發現指令的 key 所在的槽位并不歸自己管理,這時它會向客戶端發送一個特殊的跳轉指令攜帶目標操作的節點地址,告訴客戶端去連這個節點去獲取數據。客戶端收到指令后除了跳轉到正確的節點上去操作,還會同步更新糾正本地的槽位映射表緩存,后續所有 key 將使用新的槽位映射表。
Redis集群節點間的通信機制
redis cluster節點間采取gossip協議進行通信?
- 維護集群的元數據(集群節點信息,主從角色,節點數量,各節點共享的數據等)有兩種方式:集中式和gossip?
集中式:?
優點在于元數據的更新和讀取,時效性非常好,一旦元數據出現變更立即就會更新到集中式的存儲中,其他節點讀取的時候立即就可以立即感知到;不足在于所有的元數據的更新壓力全部集中在一個地方,可能導致元數據的存儲壓力。?很多中間件都會借助zookeeper集中式存儲元數據。
gossip:?
gossip協議包含多種消息,包括ping,pong,meet,fail等等。?
meet:某個節點發送meet給新加入的節點,讓新節點加入集群中,然后新節點就會開始與其他節點進行通信;
ping:每個節點都會頻繁給其他節點發送ping,其中包含自己的狀態還有自己維護的集群元數據,互相通過ping交換元數據(類似自己感知到的集群節點增加和移除,hash slot信息等);?
pong: 對ping和meet消息的返回,包含自己的狀態和其他信息,也可以用于信息廣播和更新;?
fail: 某個節點判斷另一個節點fail之后,就發送fail給其他節點,通知其他節點,指定的節點宕機了。
????????gossip協議的優點在于元數據的更新比較分散,不是集中在一個地方,更新請求會陸陸續續,打到所有節點上去更新,有一定的延時,降低了壓力;缺點在于元數據更新有延時可能導致集群的一些操作會有一些滯后。
gossip通信的10000端口?
????????每個節點都有一個專門用于節點間gossip通信的端口,就是自己提供服務的端口號+10000,比如7001,那么用于節點間通信的就是17001端口。?每個節點每隔一段時間都會往另外幾個節點發送ping消息,同時其他幾點接收到ping消息之后返回pong消息。
網絡抖動
????????真實世界的機房網絡往往并不是風平浪靜的,它們經常會發生各種各樣的小問題。比如網絡抖動就是非常常見的一種現象,突然之間部分連接變得不可訪問,然后很快又恢復正常。
為解決這種問題,Redis Cluster 提供了一種選項cluster-node-timeout,表示當某個節點持續 timeout 的時間失聯時,才可以認定該節點出現故障,需要進行主從切換。如果沒有這個選項,網絡抖動會導致主從頻繁切換 (數據的重新復制)。
Redis集群選舉原理分析
當slave發現自己的master變為FAIL狀態時,便嘗試進行Failover,以期成為新的master。由于掛掉的master可能會有多個slave,從而存在多個slave競爭成為master節點的過程, 其過程如下:
1.slave發現自己的master變為FAIL
2.將自己記錄的集群currentEpoch加1,并廣播FAILOVER_AUTH_REQUEST?信息
3.其他節點收到該信息,只有master響應,判斷請求者的合法性,并發送FAILOVER_AUTH_ACK,對每一個epoch只發送一次ack
4.嘗試failover的slave收集master返回的FAILOVER_AUTH_ACK
5.slave收到超過半數master的ack后變成新Master(這里解釋了集群為什么至少需要三個主節點,如果只有兩個,當其中一個掛了,只剩一個主節點是不能選舉成功的)
6.slave廣播Pong消息通知其他集群節點。
從節點并不是在主節點一進入 FAIL 狀態就馬上嘗試發起選舉,而是有一定延遲,一定的延遲確保我們等待FAIL狀態在集群中傳播,slave如果立即嘗試選舉,其它masters或許尚未意識到FAIL狀態,可能會拒絕投票
?延遲計算公式:
?DELAY = 500ms + random(0 ~ 500ms) + SLAVE_RANK * 1000ms
?SLAVE_RANK表示此slave已經從master復制數據的總量的rank。Rank越小代表已復制的數據越新。這種方式下,持有最新數據的slave將會首先發起選舉(理論上)。
集群腦裂數據丟失問題
????????redis集群沒有過半機制會有腦裂問題,網絡分區導致腦裂后多個主節點對外提供寫服務,一旦網絡分區恢復,會將其中一個主節點變為從節點,這時會有大量數據丟失。
規避方法可以在redis配置里加上參數(這種方法不可能百分百避免數據丟失,參考集群leader選舉機制):
min-slaves-to-write 1? //寫數據成功最少同步的slave數量,這個數量可以模仿大于半數機制配置,比如集群總共三個節點可以配置1,加上leader就是2,超過了半數,該參數在redis最新版本里名字已經換成了min-replicas-to-write
注意:這個配置在一定程度上會影響集群的可用性,比如slave要是少于1個,這個集群就算leader正常也不能提供服務了,需要具體場景權衡選擇。
集群是否完整才能對外提供服務
????????當redis.conf的配置cluster-require-full-coverage為no時,表示當負責一個插槽的主庫下線且沒有相應的從庫進行故障恢復時,集群仍然可用,如果為yes則集群不可用。
Redis集群為什么至少需要三個master節點,并且推薦節點數為奇數?
????????因為新master的選舉需要大于半數的集群master節點同意才能選舉成功,如果只有兩個master節點,當其中一個掛了,是達不到選舉新master的條件的。
????????奇數個master節點可以在滿足選舉該條件的基礎上節省一個節點,比如三個master節點和四個master節點的集群相比,大家如果都掛了一個master節點都能選舉新master節點,如果都掛了兩個master節點都沒法選舉新master節點了,所以奇數的master節點更多的是從節省機器資源角度出發說的。
Redis集群對批量操作命令的支持
????????對于類似mset,mget這樣的多個key的原生批量操作命令,redis集群只支持所有key落在同一slot的情況,如果有多個key一定要用mset命令在redis集群上操作,則可以在key的前面加上{XX},這樣參數數據分片hash計算的只會是大括號里的值,這樣能確保不同的key能落到同一slot里去,示例如下:
mset {user1}:1:name hangzhou {user1}:1:age 18
假設name和age計算的hash slot值不一樣,但是這條命令在集群下執行,redis只會用大括號里的 user1 做hash slot計算,所以算出來的slot值肯定相同,最后都能落在同一slot。
哨兵leader選舉流程
????????當一個master服務器被某sentinel視為下線狀態后,該sentinel會與其他sentinel協商選出sentinel的leader進行故障轉移工作。每個發現master服務器進入下線的sentinel都可以要求其他sentinel選自己為sentinel的leader,選舉是先到先得。同時每個sentinel每次選舉都會自增配置紀元(選舉周期),每個紀元中只會選擇一個sentinel的leader。如果所有超過一半的sentinel選舉某sentinel作為leader。之后該sentinel進行故障轉移操作,從存活的slave中選舉出新的master,這個選舉過程跟集群的master選舉很類似。
????????哨兵集群只有一個哨兵節點,redis的主從也能正常運行以及選舉master,如果master掛了,那唯一的那個哨兵節點就是哨兵leader了,可以正常選舉新master。
????????不過為了高可用一般都推薦至少部署三個哨兵節點。為什么推薦奇數個哨兵節點原理跟集群奇數個master節點類似。