- Redis持久化+Redis內存管理和優化+Redis三大緩存問題
- 一、Redis高可用
- 二、Redis持久化
- 1、RDB持久化
- 1.1 觸發條件
- (1) 手動觸發
- (2) 自動觸發
- (3) 其他自動觸發機制
- 1.2 執行流程
- 1.3 啟動時加載
- 2、AOF持久化
- 2.1 開啟AOF
- 2.2 執行流程
- (1) 命令追加(append)
- (2) 文件寫入(write)和文件同步(sync)
- (3) 文件重寫(rewrite)
- 2.3 啟動時加載
- 3、RDB和AOF的優缺點
- 三、Redis內存管理和優化
- 1、查看Redis內存使用
- 2、內存碎片率
- 3、內存使用率
- 4、內存回收key
- 5、redis優化
- 四、redis三大緩存問題
- 1、緩存雪崩
- 2、緩存穿透
- 3、緩存擊穿
- 五、如何保證MySQL和Redis的數據一致性?
Redis持久化+Redis內存管理和優化+Redis三大緩存問題
一、Redis高可用
在web服務器中,高可用是指服務器可以正常訪問的時間,衡量的標準是在多長時間內可以提供正常服務(99.9%、99.99%、99.999%等等)。
但是在Redis語境中,高可用的含義似乎要寬泛一些,除了保證提供正常服務(如主從分離、快速容災技術),還需要考慮數據容量的擴展、數據安全不會丟失等。
在Redis中,實現高可用的技術主要包括持久化、主從復制、哨兵和 Cluster集群,下面分別說明它們的作用,以及解決了什么樣的問題。
●持久化:持久化是最簡單的高可用方法(有時甚至不被歸為高可用的手段),主要作用是數據備份,即將數據存儲在硬盤,保證數據不會因進程退出而丟失。
●主從復制:主從復制是高可用Redis的基礎,哨兵和集群都是在主從復制基礎上實現高可用的。主從復制主要實現了數據的多機備份,以及對于讀操作的負載均衡和簡單的故障恢復。缺陷:故障恢復無法自動化;寫操作無法負載均衡;存儲能力受到單機的限制。
●哨兵:在主從復制的基礎上,哨兵實現了自動化的故障恢復。缺陷:寫操作無法負載均衡;存儲能力受到單機的限制。
●Cluster集群:通過集群,Redis解決了寫操作無法負載均衡,以及存儲能力受到單機限制的問題,實現了較為完善的高可用方案。
二、Redis持久化
持久化的功能:Redis是內存數據庫,數據都是存儲在內存中,為了避免服務器斷電等原因導致Redis進程異常退出后數據的永久丟失,需要定期將Redis中的數據以某種形式(數據或命令)從內存保存到硬盤;當下次Redis重啟時,利用持久化文件實現數據恢復。除此之外,為了進行災難備份,可以將持久化文件拷貝到一個遠程位置。
Redis 提供兩種方式進行持久化:
●RDB 持久化:原理是將 Reids在內存中的數據庫記錄定時保存到磁盤上。
●AOF 持久化(append only file):原理是將 Reids 的操作日志以追加的方式寫入文件,類似于MySQL的binlog。
由于AOF持久化的實時性更好,即當進程意外退出時丟失的數據更少,因此AOF是目前主流的持久化方式,不過RDB持久化仍然有其用武之地。
1、RDB持久化
RDB持久化是指在指定的時間間隔內將內存中當前進程中的數據生成快照保存到硬盤(因此也稱作快照持久化),用二進制壓縮存儲,保存的文件后綴是rdb;當Redis重新啟動時,可以讀取快照文件恢復數據。
1.1 觸發條件
RDB持久化的觸發分為手動觸發和自動觸發兩種。
(1) 手動觸發
save命令和bgsave命令都可以生成RDB文件。
save命令會阻塞Redis服務器進程,直到RDB文件創建完畢為止,在Redis服務器阻塞期間,服務器不能處理任何命令請求。
而bgsave命令會創建一個子進程,由子進程來負責創建RDB文件,父進程(即Redis主進程)則繼續處理請求。
bgsave命令執行過程中,只有fork子進程時會阻塞服務器,而對于save命令,整個過程都會阻塞服務器,因此save已基本被廢棄,線上環境要杜絕save的使用。
(2) 自動觸發
在自動觸發RDB持久化時,Redis也會選擇bgsave而不是save來進行持久化。
save m n
自動觸發最常見的情況是在配置文件中通過save m n,指定當m秒內發生n次變化時,會觸發bgsave進行快照。
vim /usr/local/redis/conf/redis.conf
--433行--RDB默認保存策略
# save 3600 1 300 100 60 10000
#表示以下三個save條件滿足任意一個時,都會引起bgsave的調用
save 3600 1 :當時間到3600秒時,如果redis數據發生了至少1次變化,則執行bgsave
save 300 10 :當時間到300秒時,如果redis數據發生了至少10次變化,則執行bgsave
save 60 10000 :當時間到60秒時,如果redis數據發生了至少10000次變化,則執行bgsave--454行--是否開啟RDB文件壓縮
rdbcompression yes
--481行--指定RDB文件名
dbfilename dump.rdb
--504行--指定RDB文件和AOF文件所在目錄
dir /usr/local/redis/data
(3) 其他自動觸發機制
除了save m n 以外,還有一些其他情況會觸發bgsave:
●在主從復制場景下,如果從節點執行全量復制操作,則主節點會執行bgsave命令,并將rdb文件發送給從節點。
●執行shutdown命令時,自動執行rdb持久化。
1.2 執行流程
(1)Redis父進程首先判斷:當前是否在執行save,或bgsave/bgrewriteaof的子進程,如果在執行則bgsave命令直接返回。 bgsave/bgrewriteaof的子進程不能同時執行,主要是基于性能方面的考慮:兩個并發的子進程同時執行大量的磁盤寫操作,可能引起嚴重的性能問題。
(2)父進程執行fork操作創建子進程,這個過程中父進程是阻塞的,Redis不能執行來自客戶端的任何命令
(3)父進程fork后,bgsave命令返回”Background saving started”信息并不再阻塞父進程,并可以響應其他命令
(4)子進程創建RDB文件,根據父進程內存快照生成臨時快照文件,完成后對原有文件進行原子替換
(5)子進程發送信號給父進程表示完成,父進程更新統計信息
1.3 啟動時加載
RDB文件的載入工作是在服務器啟動時自動執行的,并沒有專門的命令。但是由于AOF的優先級更高,因此當AOF開啟時,Redis會優先載入 AOF文件來恢復數據;只有當AOF關閉時,才會在Redis服務器啟動時檢測RDB文件,并自動載入。服務器載入RDB文件期間處于阻塞狀態,直到載入完成為止。
Redis載入RDB文件時,會對RDB文件進行校驗,如果文件損壞,則日志中會打印錯誤,Redis啟動失敗。
2、AOF持久化
RDB持久化是將進程數據寫入文件,而AOF持久化,則是將Redis執行的每次寫、刪除命令記錄到單獨的日志文件中,查詢操作不會記錄; 當Redis重啟時再次執行AOF文件中的命令來恢復數據。
與RDB相比,AOF的實時性更好,因此已成為主流的持久化方案。
2.1 開啟AOF
Redis服務器默認開啟RDB,關閉AOF;要開啟AOF,需要在配置文件中配置:
vim /usr/local/redis/conf/redis.conf
--1380行--修改,開啟AOF
appendonly yes
--1407行--指定AOF文件名稱
appendfilename "appendonly.aof"
--1505行--是否忽略最后一條可能存在問題的指令
aof-load-truncated yessystemctl restart redis-server.service
2.2 執行流程
由于需要記錄Redis的每條寫命令,因此AOF不需要觸發,下面介紹AOF的執行流程。
AOF的執行流程包括:
●命令追加(append):將Redis的寫命令追加到緩沖區aof_buf;
●文件寫入(write)和文件同步(sync):根據不同的同步策略將aof_buf中的內容同步到硬盤;
●文件重寫(rewrite):定期重寫AOF文件,達到壓縮的目的。
(1) 命令追加(append)
Redis先將寫命令追加到緩沖區,而不是直接寫入文件,主要是為了避免每次有寫命令都直接寫入硬盤,導致硬盤IO成為Redis負載的瓶頸。
命令追加的格式是Redis命令請求的協議格式,它是一種純文本格式,具有兼容性好、可讀性強、容易處理、操作簡單避免二次開銷等優點。在AOF文件中,除了用于指定數據庫的select命令(如select 0為選中0號數據庫)是由Redis添加的,其他都是客戶端發送來的寫命令。
(2) 文件寫入(write)和文件同步(sync)
Redis提供了多種AOF緩存區的同步文件策略,策略涉及到操作系統的write函數和fsync函數,說明如下:
為了提高文件寫入效率,在現代操作系統中,當用戶調用write函數將數據寫入文件時,操作系統通常會將數據暫存到一個內存緩沖區里,當緩沖區被填滿或超過了指定時限后,才真正將緩沖區的數據寫入到硬盤里。這樣的操作雖然提高了效率,但也帶來了安全問題:如果計算機停機,內存緩沖區中的數據會丟失;因此系統同時提供了fsync、fdatasync等同步函數,可以強制操作系統立刻將緩沖區中的數據寫入到硬盤里,從而確保數據的安全性。
AOF緩存區的同步文件策略存在三種同步方式,它們分別是:
vim /usr/local/redis/conf/redis.conf
--1439--
●appendfsync always: 命令寫入aof_buf后立即調用系統fsync操作同步到AOF文件,fsync完成后線程返回。這種情況下,每次有寫命令都要同步到AOF文件,硬盤IO成為性能瓶頸,Redis只能支持大約幾百TPS寫入,嚴重降低了Redis的性能;即便是使用固態硬盤(SSD),每秒大約也只能處理幾萬個命令,而且會大大降低SSD的壽命。●appendfsync no: 命令寫入aof_buf后調用系統write操作,不對AOF文件做fsync同步;同步由操作系統負責,通常同步周期為30秒。這種情況下,文件同步的時間不可控,且緩沖區中堆積的數據會很多,數據安全性無法保證。●appendfsync everysec: 命令寫入aof_buf后調用系統write操作,write完成后線程返回;fsync同步文件操作由專門的線程每秒調用一次。everysec是前述兩種策略的折中,是性能和數據安全性的平衡,因此是Redis的默認配置,也是我們推薦的配置。
(3) 文件重寫(rewrite)
隨著時間流逝,Redis服務器執行的寫命令越來越多,AOF文件也會越來越大;過大的AOF文件不僅會影響服務器的正常運行,也會導致數據恢復需要的時間過長。
文件重寫是指定期重寫AOF文件,減小AOF文件的體積。需要注意的是,AOF重寫是把Redis進程內的數據轉化為寫命令,同步到新的AOF文件;不會對舊的AOF文件進行任何讀取、寫入操作!
關于文件重寫需要注意的另一點是:對于AOF持久化來說,文件重寫雖然是強烈推薦的,但并不是必須的;即使沒有文件重寫,數據也可以被持久化并在Redis啟動的時候導入;因此在一些現實中,會關閉自動的文件重寫,然后通過定時任務在每天的某一時刻定時執行。
#文件重寫之所以能夠壓縮AOF文件,原因在于:
●過期的數據不再寫入文件
●無效的命令不再寫入文件:如有些數據被重復設值(set mykey v1, set mykey v2)、有些數據被刪除了(set myset v1, del myset)等。
●多條命令可以合并為一個:如sadd myset v1, sadd myset v2, sadd myset v3可以合并為sadd myset v1 v2 v3。通過上述內容可以看出,由于重寫后AOF執行的命令減少了,文件重寫既可以減少文件占用的空間,也可以加快恢復速度。
#文件重寫的觸發,分為手動觸發和自動觸發:
●手動觸發:直接調用bgrewriteaof命令,該命令的執行與bgsave有些類似:都是fork子進程進行具體的工作,且都只有在fork時阻塞。
●自動觸發:通過設置auto-aof-rewrite-min-size選項和auto-aof-rewrite-percentage選項來自動執行BGREWRITEAOF。 只有當auto-aof-rewrite-min-size和auto-aof-rewrite-percentage兩個選項同時滿足時,才會自動觸發AOF重寫,即bgrewriteaof操作。vim /usr/local/redis/conf/redis.conf
--1480--
●auto-aof-rewrite-percentage 100 :當前AOF文件大小(即aof_current_size)是上次日志重寫時AOF文件大小(aof_base_size)兩倍時,發生BGREWRITEAOF操作
●auto-aof-rewrite-min-size 64mb :當前AOF文件執行BGREWRITEAOF命令的最小值,避免剛開始啟動Reids時由于文件尺寸較小導致頻繁的BGREWRITEAOF
關于文件重寫的流程,有兩點需要特別注意:(1)重寫由父進程fork子進程進行;(2)重寫期間Redis執行的寫命令,需要追加到新的AOF文件中,為此Redis引入了aof_rewrite_buf緩存。#文件重寫的流程如下:
(1)Redis父進程首先判斷當前是否存在正在執行bgsave/bgrewriteaof的子進程,如果存在則bgrewriteaof命令直接返回,如果存在 bgsave命令則等bgsave執行完成后再執行。
(2)父進程執行fork操作創建子進程,這個過程中父進程是阻塞的。
(3.1)父進程fork后,bgrewriteaof命令返回”Background append only file rewrite started”信息并不再阻塞父進程, 并可以響應其他命令。Redis的所有寫命令依然寫入AOF緩沖區,并根據appendfsync策略同步到硬盤,保證原有AOF機制的正確。
(3.2)由于fork操作使用寫時復制技術,子進程只能共享fork操作時的內存數據。由于父進程依然在響應命令,因此Redis使用AOF重寫緩沖區(aof_rewrite_buf)保存這部分數據,防止新AOF文件生成期間丟失這部分數據。也就是說,bgrewriteaof執行期間,Redis的寫命令同時追加到aof_buf和aof_rewirte_buf兩個緩沖區。
(4)子進程根據內存快照,按照命令合并規則寫入到新的AOF文件。
(5.1)子進程寫完新的AOF文件后,向父進程發信號,父進程更新統計信息,具體可以通過info persistence查看。
(5.2)父進程把AOF重寫緩沖區的數據寫入到新的AOF文件,這樣就保證了新AOF文件所保存的數據庫狀態和服務器當前狀態一致。
(5.3)使用新的AOF文件替換老文件,完成AOF重寫。
2.3 啟動時加載
當AOF開啟時,Redis啟動時會優先載入AOF文件來恢復數據;只有當AOF關閉時,才會載入RDB文件恢復數據。
當AOF開啟,但AOF文件不存在時,即使RDB文件存在也不會加載。
Redis載入AOF文件時,會對AOF文件進行校驗,如果文件損壞,則日志中會打印錯誤,Redis啟動失敗。但如果是AOF文件結尾不完整(機器突然宕機等容易導致文件尾部不完整),且aof-load-truncated參數開啟,則日志中會輸出警告,Redis忽略掉AOF文件的尾部,啟動成功。aof-load-truncated參數默認是開啟的。
3、RDB和AOF的優缺點
●RDB持久化
優點:RDB文件緊湊,體積小,網絡傳輸快,適合全量復制;恢復速度比AOF快很多。當然,與AOF相比,RDB最重要的優點之一是對性能的影響相對較小。
缺點:RDB文件的致命缺點在于其數據快照的持久化方式決定了必然做不到實時持久化,而在數據越來越重要的今天,數據的大量丟失很多時候是無法接受的,因此AOF持久化成為主流。此外,RDB文件需要滿足特定格式,兼容性差(如老版本的Redis不兼容新版本的RDB文件)。
對于RDB持久化,一方面是bgsave在進行fork操作時Redis主進程會阻塞,另一方面,子進程向硬盤寫數據也會帶來IO壓力。
●AOF持久化
與RDB持久化相對應,AOF的優點在于支持秒級持久化、兼容性好,缺點是文件大、恢復速度慢、對性能影響大。
對于AOF持久化,向硬盤寫數據的頻率大大提高(everysec策略下為秒級),IO壓力更大,甚至可能造成AOF追加阻塞問題。
AOF文件的重寫與RDB的bgsave類似,會有fork時的阻塞和子進程的IO壓力問題。相對來說,由于AOF向硬盤中寫數據的頻率更高,因此對 Redis主進程性能的影響會更大。
三、Redis內存管理和優化
1、查看Redis內存使用
redis-cli -h 192.168.210.101 -p 6379 -a abc123
info memory
2、內存碎片率
mem_fragmentation_ratio:內存碎片率。mem_fragmentation_ratio = used_memory_rss / used_memory
used_memory_rss:是Redis向操作系統申請的內存。
used_memory:是Redis中的數據占用的內存。
used_memory_peak:redis內存使用的峰值。
#內存碎片如何產生的?
Redis內部有自己的內存管理器,為了提高內存使用的效率,來對內存的申請和釋放進行管理。
Redis中的值刪除的時候,并沒有把內存直接釋放,交還給操作系統,而是交給了Redis內部有內存管理器。
Redis中申請內存的時候,也是先看自己的內存管理器中是否有足夠的內存可用。
Redis的這種機制,提高了內存的使用率,但是會使Redis中有部分自己沒在用,卻不釋放的內存,導致了內存碎片的發生。
#跟蹤內存碎片率對理解Redis實例的資源性能是非常重要的:
●內存碎片率在1到1.5之間是正常的,這個值表示內存碎片率比較低,也說明 Redis 沒有發生內存交換。
●內存碎片率超過1.5,說明Redis消耗了實際需要物理內存的150%,其中50%是內存碎片率。
●內存碎片率低于1的,說明Redis內存分配超出了物理內存,操作系統正在進行內存交換。需要增加可用物理內存或減少 Redis內存占用。
#解決碎片率大的問題:
如果你的Redis版本是4.0以下的,需要在 redis-cli 工具上輸入 shutdown save 命令,讓 Redis 數據庫執行保存操作并關閉 Redis 服務,再重啟服務器。Redis服務器重啟后,Redis會將沒用的內存歸還給操作系統,碎片率會降下來。Redis4.0版本開始,可以在不重啟的情況下,線上整理內存碎片。
config set activedefrag yes #自動碎片清理,內存就會自動清理了。
memory purge #手動碎片清理
3、內存使用率
redis實例的內存使用率超過可用最大內存,操作系統將開始進行內存與swap空間交換。
#避免內存交換發生的方法:
●針對緩存數據大小選擇安裝 Redis 實例
●盡可能的使用Hash數據結構存儲
●設置key的過期時間
4、內存回收key
內存數據淘汰策略,保證合理分配redis有限的內存資源。
當達到設置的最大閥值時,需選擇一種key的回收策略,默認情況下回收策略是禁止刪除。
配置文件中修改 maxmemory-policy 屬性值:
vim /usr/local/redis/conf/redis.conf
--1149--
maxmemory-policy noenviction
●volatile-lru:使用LRU算法從已設置過期時間的數據集合中淘汰數據(移除最近最少使用的key,針對設置了TTL的key)
●volatile-ttl:從已設置過期時間的數據集合中挑選即將過期的數據淘汰(移除最近過期的key)
●volatile-random:從已設置過期時間的數據集合中隨機挑選數據淘汰(在設置了TTL的key里隨機移除)
●allkeys-lru:使用LRU算法從所有數據集合中淘汰數據(移除最少使用的key,針對所有的key)
●allkeys-random:從數據集合中任意選擇數據淘汰(隨機移除key)
●noenviction:禁止淘汰數據(不刪除直到寫滿時報錯)
//其它限制相關
●maxclients
設置redis同時可以與多少個客戶端進行連接。
默認情況下為10000個客戶端。
如果達到了此限制,redis則會拒絕新的連接請求,并且向這些連接請求方發出“max number of clients reached”以作回應。●maxmemory
建議必須設置,否則,將內存占滿,造成服務器宕機。
設置redis可以使用的內存量。一旦到達內存使用上限,redis將會試圖移除內部數據,移除規則可以通過maxmemory-policy來指定。
如果redis無法根據移除規則來移除內存中的數據,或者設置了“不允許移除”,那么redis則會針對那些需要申請內存的指令返回錯誤信息,比如SET、LPUSH等。
但是對于無內存申請的指令,仍然會正常響應,比如GET等。如果你的redis是主redis(說明redis集群有主從),那么在設置內存使用上限時,需要在系統中留出一些內存空間給同步隊列緩存,只有在你設置的是“不移除”的情況下,才不用考慮這個因素。●maxmemory-samples
設置樣本數量,LRU算法和最小TTL算法都并非是精確的算法,而是估算值,所以你可以設置樣本的大小,redis默認會檢查這么多個key并選擇其中LRU的那個。
一般設置3到7的數字,數值越小樣本越不準確,但性能消耗越小。
5、redis優化
1)設置 config set activedefrag yes 開啟內存碎片自動清理,或者定時執行 memory purge 清理內存碎片
2)盡可能使用 hash 數據類型存儲數據。因為 hash 類型的一個 key 可包含多個字段,該類型的數據占用空間較小
3)建議給 key 設置過期時間
4)精簡 key 的鍵名和鍵值,控制 key 占用空間的大小,避免 bigkey 的產生(redis-cli --bigkeys 可用于查找bigKey)
5)修改配置 maxmemory 指定redis可占用的最大內存大小修改配置 maxmemory-policy 指定內存數據淘汰策略(key的回收策略),實現保證內存使用率不超過最大內存修改配置 maxmemory-samples 指定內存數據淘汰策略的樣本數量,一般為3~7,值越大樣本越精確修改配置 maxclients 指定最大客戶端連接數修改配置 tcp-backlog 指定最大連接排隊數修改配置 timeout 指定連接超時時間修改配置 lazyfree-lazy-expire yes 設置惰性刪除,將刪除過期key的操作放在后臺中去執行,避免阻塞主線程修改配置 no-appendfsync-on-rewrite yes 設置AOF文件重寫期間,AOF后臺子進程不進行刷盤操作,避免AOF重寫和fsync競爭磁盤IO資源,導致redis延遲增加
6)設置AOF持久化和主從復制來備份數據,采用哨兵或集群模式實現redis集群的高可用
7)建議設置 config set requirepass 或 修改配置 requirepass 來設置 redis 密碼
四、redis三大緩存問題
正常情況下,大部分的訪問請求應該是先被redis響應的,在redis那里得不到響應的小部分訪問請求才會去請求MySQL數據庫獲取數據,這樣MySQL數據庫的負載壓力是非常小的,且可以正常工作。緩存雪崩/穿透/擊穿三大問題的根本原因在于redis緩存命中率下降,大量請求會直接發送給MySQL數據庫,導致MySQL數據庫壓力過大而崩潰。
1、緩存雪崩
redis中大量緩存key集體過期
解決方案:
使用隨機數設置key的過期時間,防止集體過期
設置緩存標記,如果緩存過期,則自動更新緩存
數據庫使用排他鎖,實現加鎖等待
2、緩存穿透
大量請求訪問redis和MySQL都不存在的資源
解決方案:
對空值也進行緩存
使用布隆過濾器進行判斷攔截一定不存在的無效請求
使用腳本實時監控,進行黑名單限制
3、緩存擊穿
redis中一個熱點key過期,此時又有大量用戶訪問這個熱點key(redis-cli --hotkeys 可用于查找熱Key)
解決方案:
預先對熱點數據進行緩存預熱
監控數據,實時調整過期時長
數據庫使用排他鎖,實現加鎖等待
五、如何保證MySQL和Redis的數據一致性?
更新數據時,先更新MySQL數據庫,再更新redis緩存
刪除數據時,先刪除redis緩存,再刪除MySQL數據庫
對于一些關鍵數據,可以使用MySQL的觸發器來實現同步更新redis緩存。也可以使用定時任務,定時自動進行緩存預熱,來定期同步MySQL和redis的數據。```