爛泥:學習mysql數據庫主從同步復制原理


本文由秀依林楓提供友情贊助,首發於爛泥行天下

說明本篇文章部分轉載自互聯網。

MySQL的Replication(英文為復制)是一個多MySQL數據庫做主從同步的方案,特點是異步復制,廣泛用在各種對MySQL有更高性能、更高可靠性要求的場合。與之對應的是另一個同步技術是MySQL Cluster,但因為MySQL Cluster配置比較復雜,所以使用者較少。

MySQL的Replication是一個異步復制的過程(mysql5.1.7以上版本分為異步復制和半同步兩種模式),它是從一個Mysql instance(instance英文為實例)(我們稱之為Master)復制到另一個Mysql instance(我們稱之slave)。在master與slave之間實現整個復制過程主要由三個線程來完成,其中兩個線程(SQL線程和IO線程)在slave端,另外一個線程(IO線程)在master端。

要實現MySQL的Replication,首先必須打開master端的binlog (mysql-bin.xxxxxx)日志功能,否則無法實現mysql的主從復制。因為mysql的整個主從復制過程實際上就是:slave端從master端獲取binlog日志,然后再在自己身上完全順序的執行該日志中所記錄的各種SQL操作。

有關具體如何開啟mysql的binlog日志功能,可以查看這篇文章《爛泥:學習mysql的binlog配置》。

clip_image001

MySQL主從復制的基本交互過程,如下:

1、slave端的IO線程連接上master端,並請求從指定binlog日志文件的指定pos節點位置(或者從最開始的日志)開始復制之后的日志內容。

2、master端在接收到來自slave端的IO線程請求后,通知負責復制進程的IO線程,根據slave端IO線程的請求信息,讀取指定binlog日志指定pos節點位置之后的日志信息,然后返回給slave端的IO線程。該返回信息中除了binlog日志所包含的信息之外,還包括本次返回的信息在master端的binlog文件名以及在該binlog日志中的pos節點位置。

3、slave端的IO線程在接收到master端IO返回的信息后,將接收到的binlog日志內容依次寫入到slave端的relaylog文件(mysql-relay-bin.xxxxxx)的最末端,並將讀取到的master端的binlog文件名和pos節點位置記錄到master-info(該文件存在slave端)文件中,以便在下一次讀取的時候能夠清楚的告訴master“我需要從哪個binlog文件的哪個pos節點位置開始,請把此節點以后的日志內容發給我”。

4、slave端的SQL線程在檢測到relaylog文件中新增內容后,會馬上解析該log文件中的內容。然后還原成在master端真實執行的那些SQL語句,並在自身按順豐依次執行這些SQL語句。這樣,實際上就是在master端和slave端執行了同樣的SQL語句,所以master端和slave端的數據是完全一樣的。

以上mysql主從復制交互過程比較拗口,理解起來也比較麻煩,我簡化了該交互過程。如下:

1、master在執行sql之后,記錄二進制log文件(bin-log)。

2、slave連接master,並從master獲取binlog,存於本地relay-log中,然后從上次記住的位置起執行SQL語句,一旦遇到錯誤則停止同步。

從以上mysql的Replication原理可以看出:

* 主從間的數據庫不是實時同步,就算網絡連接正常,也存在瞬間主從數據不一致的情況。

* 如果主從的網絡斷開,則從庫會在網絡恢復正常后,批量進行同步。

* 如果對從庫進行修改數據,那么如果此時從庫正在在執行主庫的bin-log時,則會出現錯誤而停止同步,這個是很危險的操作。所以一般情況下,我們要非常小心的修改從庫上的數據。

* 一個衍生的配置是雙主、互為主從配置,只要雙方的修改不沖突,則可以工作良好。

* 如果需要多主庫的話,可以用環形配置,這樣任意一個節點的修改都可以同步到所有節點。


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com