mysql主從延遲

在實際的生產環境中,由單臺MySQL作為獨立的數據庫是完全不能滿足實際需求的,無論是在安全性,高可用性以及高并發等各個方面

因此,一般來說都是通過集群主從復制(Master-Slave)的方式來同步數據,再通過讀寫分離(MySQL-Proxy)來提升數據庫的并發負載能力進行部署與實施

總結MySQL主從集群帶來的作用是:

  • 提高數據庫負載能力,主庫執行讀寫任務(增刪改),備庫僅做查詢。

  • 提高系統讀寫性能、可擴展性和高可用性。

  • 數據備份與容災,備庫在異地,主庫不存在了,備庫可以立即接管,無須恢復時間。

圖片

說到主從同步,離不開binlog這個東西,先介紹下binlog吧

biglog

binlog是什么?有什么作用?

用于記錄數據庫執行的寫入性操作(不包括查詢)信息,以二進制的形式保存在磁盤中。可以簡單理解為記錄的就是sql語句

binlog 是 mysql 的邏輯日志,并且由?Server層進行記錄,使用任何存儲引擎的 mysql 數據庫都會記錄 binlog 日志

在實際應用中, binlog 的主要使用場景有兩個:

  • 用于主從復制,在主從結構中,binlog 作為操作記錄從 master 被發送到 slave,slave服務器從 master 接收到的日志保存到 relay log 中。

  • 用于數據備份,在數據庫備份文件生成后,binlog保存了數據庫備份后的詳細信息,以便下一次備份能從備份點開始。

日志格式

binlog 日志有三種格式,分別為 STATMENT 、 ROW 和 MIXED

在 MySQL 5.7.7 之前,默認的格式是 STATEMENT , MySQL 5.7.7 之后,默認值是 ROW

日志格式通過?binlog-format?指定。

  • STATMENT :基于 SQL 語句的復制,每一條會修改數據的sql語句會記錄到 binlog 中

  • ROW :基于行的復制

  • MIXED :基于 STATMENT 和 ROW 兩種模式的混合復制,比如一般的數據操作使用 row 格式保存,有些表結構的變更語句,使用 statement 來記錄

我們還可以通過mysql提供的查看工具mysqlbinlog查看文件中的內容,例如

mysqlbinlog?mysql-bin.00001?|?more

binlog文件大小和個數會不斷的增加,后綴名會按序號遞增,例如mysql-bin.00002等。

主從復制原理

圖片

可以看到mysql主從復制需要三個線程:master(binlog dump thread)、slave(I/O thread 、SQL thread)

  • binlog dump線程:?主庫中有數據更新時,根據設置的binlog格式,將更新的事件類型寫入到主庫的binlog文件中,并創建log dump線程通知slave有數據更新。當I/O線程請求日志內容時,將此時的binlog名稱和當前更新的位置同時傳給slave的I/O線程。

  • I/O線程:?該線程會連接到master,向log dump線程請求一份指定binlog文件位置的副本,并將請求回來的binlog存到本地的relay log中。

  • SQL線程:?該線程檢測到relay log有更新后,會讀取并在本地做redo操作,將發生在主庫的事件在本地重新執行一遍,來保證主從數據同步。

基本過程總結

  1. 主庫寫入數據并且生成binlog文件。該過程中MySQL將事務串行的寫入二進制日志,即使事務中的語句都是交叉執行的。

  2. 在事件寫入二進制日志完成后,master通知存儲引擎提交事務。

  3. 從庫服務器上的IO線程連接Master服務器,請求從執行binlog日志文件中的指定位置開始讀取binlog至從庫。

  4. 主庫接收到從庫的IO線程請求后,其上復制的IO線程會根據Slave的請求信息分批讀取binlog文件然后返回給從庫的IO線程。

  5. Slave服務器的IO線程獲取到Master服務器上IO線程發送的日志內容、日志文件及位置點后,會將binlog日志內容依次寫到Slave端自身的Relay Log(即中繼日志)文件的最末端,并將新的binlog文件名和位置記錄到master-info文件中,以便下一次讀取master端新binlog日志時能告訴Master服務器從新binlog日志的指定文件及位置開始讀取新的binlog日志內容。

  6. 從庫服務器的SQL線程會實時監測到本地Relay Log中新增了日志內容,然后把RelayLog中的日志翻譯成SQL并且按照順序執行SQL來更新從庫的數據。

  7. 從庫在relay-log.info中記錄當前應用中繼日志的文件名和位置點以便下一次數據復制。

并行復制

在MySQL 5.6版本之前,Slave服務器上有兩個線程I/O線程和SQL線程。

I/O線程負責接收二進制日志,SQL線程進行回放二進制日志。如果在MySQL 5.6版本開啟并行復制功能,那么SQL線程就變為了coordinator線程,coordinator線程主要負責以前兩部分的內容

圖片

上圖的紅色框框部分就是實現并行復制的關鍵所在

這意味著coordinator線程并不是僅將日志發送給worker線程,自己也可以回放日志,但是所有可以并行的操作交付由worker線程完成。

coordinator線程與worker是典型的生產者與消費者模型。

圖片

不過到MySQL 5.7才可稱為真正的并行復制,這其中最為主要的原因就是slave服務器的回放與主機是一致的即master服務器上是怎么并行執行的slave上就怎樣進行并行回放。不再有庫的并行復制限制,對于二進制日志格式也無特殊的要求。

為了兼容MySQL 5.6基于庫的并行復制,5.7引入了新的變量slave-parallel-type,其可以配置的值有:

  • DATABASE:默認值,基于庫的并行復制方式

  • LOGICAL_CLOCK:基于組提交的并行復制方式

下面分別介紹下兩種并行復制方式

按庫并行

每個 worker 線程對應一個 hash 表,用于保存當前正在這個worker的執行隊列里的事務所涉及到的庫。其中hash表里的key是數據庫名,用于決定分發策略。該策略的優點是構建hash值快,只需要庫名,同時對于binlog的格式沒有要求。

但這個策略的效果,只有在主庫上存在多個DB,且各個DB的壓力均衡的情況下,這個策略效果好。因此,對于主庫上的表都放在同一個DB或者不同DB的熱點不同,則起不到多大效果

圖片

組提交優化

該特性如下:

  1. 能夠同一組里提交的事務,定不會修改同一行;

  2. 主庫上可以并行執行的事務,從庫上也一定可以并行執行。

具體是如何實現的:

  1. 在同一組里面一起提交的事務,會有一個相同的commit_id,下一組為commit_id+1,該commit_id會直接寫到binlog中;

  2. 在從庫使用時,相同commit_id的事務會被分發到多個worker并行執行,直到這一組相同的commit_id執行結束后,coordinator再取下一批。

更詳細內容可以去官網看看:https://dev.mysql.com/doc/refman/5.7/en/replication-options-slave.html

?

下面開始介紹主從延時

主從延遲

主從延遲是怎么回事?

根據前面主從復制的原理可以看出,兩者之間是存在一定時間的數據不一致,也就是所謂的主從延遲。

我們來看下導致主從延遲的時間點:

  • 主庫 A 執行完成一個事務,寫入 binlog,該時刻記為T1.

  • 傳給從庫B,從庫接受完這個binlog的時刻記為T2.

  • 從庫B執行完這個事務,該時刻記為T3.

那么所謂主從延遲,就是同一個事務,從庫執行完成的時間和主庫執行完成的時間之間的差值,即T3-T1。

我們也可以通過在從庫執行show slave status,返回結果會顯示seconds_behind_master,表示當前從庫延遲了多少秒。

seconds_behind_master如何計算的?

  • 每一個事務的binlog都有一個時間字段,用于記錄主庫上寫入的時間

  • 從庫取出當前正在執行的事務的時間字段,跟當前系統的時間進行相減,得到的就是seconds_behind_master,也就是前面所描述的T3-T1。

?

主從延遲原因

為什么會主從延遲?

正常情況下,如果網絡不延遲,那么日志從主庫傳給從庫的時間是相當短,所以T2-T1可以基本忽略。

最直接的影響就是從庫消費中轉日志(relaylog)的時間段,而造成原因一般是以下幾種:

1、從庫的機器性能比主庫要差

比如將20臺主庫放在4臺機器,把從庫放在一臺機器。這個時候進行更新操作,由于更新時會觸發大量讀操作,導致從庫機器上的多個從庫爭奪資源,導致主從延遲。

不過,目前大部分部署都是采取主從使用相同規格的機器部署。

2、從庫的壓力大

按照正常的策略,讀寫分離,主庫提供寫能力,從庫提供讀能力。將進行大量查詢放在從庫上,結果導致從庫上耗費了大量的CPU資源,進而影響了同步速度,造成主從延遲。

對于這種情況,可以通過一主多從,分擔讀壓力;也可以采取binlog輸出到外部系統,比如Hadoop,讓外部系統提供查詢能力。

3、大事務的執行

一旦執行大事務,那么主庫必須要等到事務完成之后才會寫入binlog。

比如主庫執行了一條insert … select非常大的插入操作,該操作產生了近幾百G的binlog文件傳輸到只讀節點,進而導致了只讀節點出現應用binlog延遲。

因此,DBA經常會提醒開發,不要一次性地試用delete語句刪除大量數據,盡可能控制數量,分批進行。

4、主庫的DDL(alter、drop、create)

1、只讀節點與主庫的DDL同步是串行進行,如果DDL操作在主庫執行時間很長,那么從庫也會消耗同樣的時間,比如在主庫對一張500W的表添加一個字段耗費了10分鐘,那么從節點上也會耗費10分鐘。

2、從節點上有一個執行時間非常長的的查詢正在執行,那么這個查詢會堵塞來自主庫的DDL,表被鎖,直到查詢結束為止,進而導致了從節點的數據延遲。

?

5、鎖沖突

鎖沖突問題也可能導致從節點的SQL線程執行慢,比如從機上有一些select .... for update的SQL,或者使用了MyISAM引擎等。

6、從庫的復制能力

一般場景中,因偶然情況導致從庫延遲了幾分鐘,都會在從庫恢復之后追上主庫。但若是從庫執行速度低于主庫,且主庫持續具有壓力,就會導致長時間主從延遲,很有可能就是從庫復制能力的問題。

從庫上的執行,即sql_thread更新邏輯,在5.6版本之前,是只支持單線程,那么在主庫并發高、TPS高時,就會出現較大的主從延遲。

因此,MySQL自5.7版本后就已經支持并行復制了。可以在從服務上設置?slave_parallel_workers為一個大于0的數,然后把slave_parallel_type參數設置為LOGICAL_CLOCK,這就可以了

mysql>?show?variables?like?'slave_parallel%';
+------------------------+----------+
|?Variable_name??????????|?Value????|
+------------------------+----------+
|?slave_parallel_type????|?DATABASE?|
|?slave_parallel_workers?|?0????????|
+------------------------+----------+

怎么減少主從延遲

主從同步問題永遠都是一致性和性能的權衡,得看實際的應用場景,若想要減少主從延遲的時間,可以采取下面的辦法:

  1. 降低多線程大事務并發的概率,優化業務邏輯

  2. 優化SQL,避免慢SQL,減少批量操作,建議寫腳本以update-sleep這樣的形式完成。

  3. 提高從庫機器的配置,減少主庫寫binlog和從庫讀binlog的效率差。

  4. 盡量采用短的鏈路,也就是主庫和從庫服務器的距離盡量要短,提升端口帶寬,減少binlog傳輸的網絡延時。

  5. 實時性要求的業務讀強制走主庫,從庫只做災備,備份。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/535368.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/535368.shtml
英文地址,請注明出處:http://en.pswp.cn/news/535368.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

16張圖帶你吃透高性能 Redis 集群

現如今 Redis 變得越來越流行,幾乎在很多項目中都要被用到,不知道你在使用 Redis 時,有沒有思考過,Redis 到底是如何穩定、高性能地提供服務的? 你也可以嘗試回答一下以下這些問題: 我使用 Redis 的場景很…

Redis與MySQL雙寫一致性如何保證

談談一致性 一致性就是數據保持一致,在分布式系統中,可以理解為多個節點中數據的值是一致的。 強一致性:這種一致性級別是最符合用戶直覺的,它要求系統寫入什么,讀出來的也會是什么,用戶體驗好,…

weblogic忘記console密碼

進入 cd /sotware/oracle_ldap/Middleware/user_projects/domains/base_domain/security/ 目錄 執行 java -classpath /sotware/oracle_ldap/Middleware/wlserver_10.3/server/lib/weblogic.jar weblogic.security.utils.AdminAccount weblogic(賬號) weblogic123(密碼) . …

Mysql高性能優化技能總結

數據庫命令規范 所有數據庫對象名稱必須使用小寫字母并用下劃線分割 所有數據庫對象名稱禁止使用mysql保留關鍵字(如果表名中包含關鍵字查詢時,需要將其用單引號括起來) 數據庫對象的命名要能做到見名識意,并且最后不要超過32個…

Redis的AOF日志

如果 Redis 每執行一條寫操作命令,就把該命令以追加的方式寫入到一個文件里,然后重啟 Redis 的時候,先去讀取這個文件里的命令,并且執行它,這不就相當于恢復了緩存數據了嗎? 這種保存寫操作命令到日志的持久…

Redis 核心技術與實戰

目錄 開篇詞 | 這樣學 Redis,才能技高一籌 01 | 基本架構:一個鍵值數據庫包含什么? 02 | 數據結構:快速的Redis有哪些慢操作? 鍵和值用什么結構組織? 為什么哈希表操作變慢了? 有哪些底層數…

redis核心技術與實戰(二)緩存應用篇

1.《旁路緩存:redis 在緩存中工作原理》 1.緩存的兩個特征 1.什么是緩存,有什么特征? 磁盤->內存->cpu 之間讀寫速度差異巨大,為了平衡他們之間的差異,操作系統默認使用了兩種緩存; CPU 里面的末級…

redis核心技術與實戰(三) 性能篇

影響redis性能主要有以下部分: Redis 內部的阻塞式操作; CPU核和NUMA架構 Redis關鍵系統配置 Redis內存碎片 Redis緩沖區 下面一個個來介紹這些地方 1.《redis 有哪些阻塞點?》 redis實例主要交互的對象有以下幾點,我們依據下面這…

redis核心與實戰(一)數據結構篇

1.《redis數據結構概覽》 1.數據結構概覽 數據模型:一共5種,String(字符串)、List(列表)、Hash(哈希)、Set(集合)和 Sorted Set(有序集合&#xf…

redis核心技術與實戰(四)高可用高擴展篇

1.《redis架構組成》 1.redis學習維度 2.一個基本的鍵值型數據庫包括什么? 1.訪問框架 redis通過網絡框架進行訪問,使得 Redis 可以作為一個基礎性的網絡服務進行訪問,擴大了redis應用范圍; 過程:如果客戶端發送“pu…

tomcat監控腳本

#!/bin/sh# func:自動監控tomcat腳本并且執行重啟操作# 獲取tomcat進程ID(其中[grep -w .....]中的.....需要替換為實際部署的tomcat文件夾名,如下) TomcatID$(ps -ef |grep tomcat |grep -w /usr/local/tomcat/apache-tomcat-8.5.31|grep -v…

weblogic命令行操作

啟動和停止子節點: [rootoud bin]# cd /sotware/oracle_ldap/Middleware/user_projects/domains/base_domain/bin/ [rootoud bin]# ./startManagedWebLogic.sh Server-0 http://192.168.63.129:7001 -Dweblogic.management.usernameweblogic -Dweblogic.management…

Ansible系列--Copy模塊

copy模塊 copy模塊在ansible里的角色就是把ansible執行機器上的文件拷貝到遠程節點上。 與fetch模塊相反的操作 常用參數 參數名是否必須默認值選項說明srcno 用于定位ansible執行的機器上的文件,需要絕對路徑。如果拷貝的是文件夾,那么文件夾會整體…

ANSIBLE--handlers的概念

handlers可以理解成另一種tasks,handlers是另一種’任務列表’,handlers中的任務會被tasks中的任務進行”調用”,但是,被”調用”并不意味著一定會執行,只有當tasks中的任務”真正執行”以后(真正的進行實際…

ansible--- tags

tags可以幫助我們對任務進行’打標簽’的操作,當任務存在標簽以后,我們就可以在執行playbook時,借助標簽,指定執行哪些任務,或者指定不執行哪些任務。在實際的使用中,我們應該讓tags的值能夠見名知義。 當…

ANSIBLE---變量

注冊變量 ansible的模塊在運行之后,其實都會返回一些”返回值”,只是默認情況下,這些”返回值”并不會顯示而已,我們可以把這些返回值寫入到某個變量中,這樣我們就能夠通過引用對應的變量從而獲取到這些返回值了&…

inux中限制用戶進程CPU和內存占用率

#!/bin/sh PIDStop -bn 1 | grep "^ *[1-9]" | awk { if($9 > 50 || $10 > 25 && id -u $2 > 500) print $1} echo $PIDS for PID in $PIDS dorenice 10 $PIDecho "renice 10 $PID" done

按月拆分數據庫表--oracle

生產有一張日志表,數據量很大,需要按月進行存儲,存儲過程如下: CREATE OR REPLACE PROCEDURE NEWLOG4_SUB_TABLE IStable_name1 VARCHAR2(50);create_table_sql VARCHAR2(4000);insert_data_sql VARC…

plsql定時器

Oralce中的任務有2種:Job和Dbms_job,兩者的區別有: 1. jobs是oracle數據庫的對象, dbms_jobs只是jobs對象的一個實例, 就像對于tables, emp和dept都是表的實例。 2. 創建方式也有…

PL/SQL批處理語句:BULK COLLECT 和 FORALL

PL/SQL程序中運行SQL語句是存在開銷的,因為SQL語句是要提交給SQL引擎處理,這種在PL/SQL引擎和SQL引擎之間的控制轉移叫做上下文卻換,每次卻換時,都有額外的開銷 請看下圖: 但是,FORALL和BULK COLLEC…