了解mysql三大日志-binlog、redo log和undo log

日志是 mysql 數據庫的重要組成部分,記錄著數據庫運行期間各種狀態信息。mysql日志主要包括錯誤日志、查詢日志、慢查詢日志、事務日志、二進制日志幾大類。作為開發,我們重點需要關注的是二進制日志( binlog )和事務日志(包括redo log 和 undo log ),本文接下來會詳細介紹這三種日志。

binlog

binlog 用于記錄數據庫執行的寫入性操作(不包括查詢)信息,以二進制的形式保存在磁盤中。binlog 是 mysql的邏輯日志,并且由 Server 層進行記錄,使用任何存儲引擎的 mysql 數據庫都會記錄 binlog 日志。

  • 邏輯日志:可以簡單理解為記錄的就是sql語句 。
  • 物理日志:mysql 數據最終是保存在數據頁中的,物理日志記錄的就是數據頁變更 。

binlog 是通過追加的方式進行寫入的,可以通過max_binlog_size 參數設置每個 binlog文件的大小,當文件大小達到給定值之后,會生成新的文件來保存日志。binlog使用場景在實際應用中, binlog 的主要使用場景有兩個,分別是 主從復制 和 數據恢復 。

  1. 主從復制 :在 Master 端開啟 binlog ,然后將 binlog發送到各個 Slave 端, Slave 端重放 binlog 從而達到主從數據一致。
  2. 數據恢復 :通過使用 mysqlbinlog 工具來恢復數據。

binlog刷盤時機

對于 InnoDB 存儲引擎而言,只有在事務提交時才會記錄biglog ,此時記錄還在內存中,那么 biglog是什么時候刷到磁盤中的呢?

mysql 通過 sync_binlog 參數控制 biglog 的刷盤時機,取值范圍是 0-N:

  • 0:不去強制要求,由系統自行判斷何時寫入磁盤;
  • 1:每次 commit 的時候都要將 binlog 寫入磁盤;
  • N:每N個事務,才會將 binlog 寫入磁盤。

從上面可以看出, sync_binlog 最安全的是設置是 1 ,這也是MySQL 5.7.7之后版本的默認值。但是設置一個大一些的值可以提升數據庫性能,因此實際情況下也可以將值適當調大,犧牲一定的一致性來獲取更好的性能。binlog日志格式binlog 日志有三種格式,分別為 STATMENT 、 ROW 和 MIXED。

在 MySQL 5.7.7 之前,默認的格式是 STATEMENT , MySQL 5.7.7 之后,默認值是 ROW。日志格式通過 binlog-format 指定。

  • STATMENT:基于SQL 語句的復制( statement-based replication, SBR ),每一條會修改數據的sql語句會記錄到binlog 中 。

  • 優點:不需要記錄每一行的變化,減少了 binlog 日志量,節約了 IO , 從而提高了性能;

  • 缺點:在某些情況下會導致主從數據不一致,比如執行sysdate() 、 slepp() 等 。

  • ROW:基于行的復制(row-based replication, RBR ),不記錄每條sql語句的上下文信息,僅需記錄哪條數據被修改了 。

  • 優點:不會出現某些特定情況下的存儲過程、或function、或trigger的調用和觸發無法被正確復制的問題 ;

  • 缺點:會產生大量的日志,尤其是alter table 的時候會讓日志暴漲

  • MIXED:基于STATMENT 和 ROW 兩種模式的混合復制(mixed-based replication, MBR ),一般的復制使用STATEMENT 模式保存 binlog ,對于 STATEMENT 模式無法復制的操作使用 ROW 模式保存 binlog

redo log

為什么需要redo log我們都知道,事務的四大特性里面有一個是 持久性 ,具體來說就是只要事務提交成功,那么對數據庫做的修改就被永久保存下來了,不可能因為任何原因再回到原來的狀態 。 那么 mysql是如何保證一致性的呢?最簡單的做法是在每次事務提交的時候,將該事務涉及修改的數據頁全部刷新到磁盤中。但是這么做會有嚴重的性能問題,主要體現在兩個方面:

  1. 因為 Innodb 是以 頁 為單位進行磁盤交互的,而一個事務很可能只修改一個數據頁里面的幾個字節,這個時候將完整的數據頁刷到磁盤的話,太浪費資源了!
  2. 一個事務可能涉及修改多個數據頁,并且這些數據頁在物理上并不連續,使用隨機IO寫入性能太差!

因此 mysql 設計了 redo log , 具體來說就是只記錄事務對數據頁做了哪些修改,這樣就能完美地解決性能問題了(相對而言文件更小并且是順序IO)。redo log基本概念

redo log 包括兩部分:一個是內存中的日志緩沖( redo log buffer ),另一個是磁盤上的日志文件( redo logfile)。

mysql 每執行一條 DML 語句,先將記錄寫入 redo log buffer,后續某個時間點再一次性將多個操作記錄寫到 redo log file。這種 先寫日志,再寫磁盤 的技術就是 MySQL
里經常說到的 WAL(Write-Ahead Logging) 技術。在計算機操作系統中,用戶空間( user space )下的緩沖區數據一般情況下是無法直接寫入磁盤的,中間必須經過操作系統內核空間( kernel space )緩沖區( OS Buffer )。因此, redo log buffer 寫入 redo logfile 實際上是先寫入 OS Buffer ,然后再通過系統調用 fsync() 將其刷到 redo log file

中,過程如下:
image

mysql 支持三種將 redo log buffer 寫入 redo log file 的時機,可以通過 innodb_flush_log_at_trx_commit 參數配置,各參數值含義如下:
image
image

redo log記錄形式前面說過, redo log 實際上記錄數據頁的變更,而這種變更記錄是沒必要全部保存,因此 redo log實現上采用了大小固定,循環寫入的方式,當寫到結尾時,會回到開頭循環寫日志。如下圖:
image

同時我們很容易得知, 在innodb中,既有redo log 需要刷盤,還有 數據頁 也需要刷盤, redo log存在的意義主要就是降低對 數據頁 刷盤的要求 ** 。在上圖中, write pos 表示 redo log 當前記錄的 LSN (邏輯序列號)位置, check point 表示 數據頁更改記錄 刷盤后對應 redo log 所處的 LSN(邏輯序列號)位置。write pos 到 check point 之間的部分是 redo log 空著的部分,用于記錄新的記錄;check point 到 write pos 之間是 redo log 待落盤的數據頁更改記錄。當 write pos追上check point 時,會先推動 check point 向前移動,空出位置再記錄新的日志。啟動 innodb 的時候,不管上次是正常關閉還是異常關閉,總是會進行恢復操作。因為 redo log記錄的是數據頁的物理變化,因此恢復的時候速度比邏輯日志(如 binlog )要快很多。重啟innodb 時,首先會檢查磁盤中數據頁的 LSN ,如果數據頁的LSN 小于日志中的 LSN ,則會從 checkpoint 開始恢復。還有一種情況,在宕機前正處于checkpoint 的刷盤過程,且數據頁的刷盤進度超過了日志頁的刷盤進度,此時會出現數據頁中記錄的 LSN 大于日志中的 LSN,這時超出日志進度的部分將不會重做,因為這本身就表示已經做過的事情,無需再重做。redo log與binlog區別
image

由 binlog 和 redo log 的區別可知:binlog 日志只用于歸檔,只依靠 binlog 是沒有 crash-safe 能力的。但只有 redo log 也不行,因為 redo log 是 InnoDB特有的,且日志上的記錄落盤后會被覆蓋掉。因此需要 binlog和 redo log二者同時記錄,才能保證當數據庫發生宕機重啟時,數據不會丟失。

undo log

數據庫事務四大特性中有一個是 原子性 ,具體來說就是 原子性是指對數據庫的一系列操作,要么全部成功,要么全部失敗,不可能出現部分成功的情況。實際上, 原子性 底層就是通過 undo log 實現的。undo log主要記錄了數據的邏輯變化,比如一條 INSERT 語句,對應一條DELETE 的 undo log ,對于每個 UPDATE 語句,對應一條相反的 UPDATE 的 undo log ,這樣在發生錯誤時,就能回滾到事務之前的數據狀態。同時, undo log 也是 MVCC(多版本并發控制)實現的關鍵。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,117評論 6 537
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,860評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,128評論 0 381
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,291評論 1 315
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,025評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,421評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,477評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,642評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,177評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,970評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,157評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,717評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,410評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,821評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,053評論 1 289
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,896評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,157評論 2 375