事務(wù)是由 MySQL 的引擎來實現(xiàn)的,我們常見的 InnoDB 引擎它是支持事務(wù)的。不過并不是所有的引擎都能支持事務(wù),比如 MySQL 原生的 MyISAM 引擎就不支持事務(wù),也正是這樣,所以大多數(shù) MySQL 的引擎都是用 InnoDB。事務(wù)看起來感覺簡單,但是要實現(xiàn)事務(wù)必須要遵守 4 個特性,分別如下:
MySQL 服務(wù)端是允許多個客戶端連接的,這意味著 MySQL 會出現(xiàn)同時處理多個事務(wù)的情況。那么在同時處理多個事務(wù)的時候,就可能出現(xiàn)臟讀(dirty read)、不可重復(fù)讀(non-repeatable read)、幻讀(phantom read)的問題。接下來,通過舉例子給大家說明,這些問題是如何發(fā)生的。
臟讀
如果一個事務(wù)「讀到」了另一個「未提交事務(wù)修改過的數(shù)據(jù)」,就意味著發(fā)生了「臟讀」現(xiàn)象。舉個栗子。假設(shè)有 A 和 B 這兩個事務(wù)同時在處理,事務(wù) A 先開始從數(shù)據(jù)庫中讀取小林的余額數(shù)據(jù),然后再執(zhí)行更新操作,如果此時事務(wù) A 還沒有提交事務(wù),而此時正好事務(wù) B 也從數(shù)據(jù)庫中讀取小林的余額數(shù)據(jù),那么事務(wù) B 讀取到的余額數(shù)據(jù)是剛才事務(wù) A 更新后的數(shù)據(jù),即使沒有提交事務(wù)。因為事務(wù) A 是還沒提交事務(wù)的,也就是它隨時可能發(fā)生回滾操作,如果在上面這種情況事務(wù) A 發(fā)生了回滾,那么事務(wù) B 剛才得到的數(shù)據(jù)就是過期的數(shù)據(jù),這種現(xiàn)象就被稱為臟讀。
不可重復(fù)讀
在一個事務(wù)內(nèi)多次讀取同一個數(shù)據(jù),如果出現(xiàn)前后兩次讀到的數(shù)據(jù)不一樣的情況,就意味著發(fā)生了「不可重復(fù)讀」現(xiàn)象。舉個栗子。假設(shè)有 A 和 B 這兩個事務(wù)同時在處理,事務(wù) A 先開始從數(shù)據(jù)庫中讀取小林的余額數(shù)據(jù),然后繼續(xù)執(zhí)行代碼邏輯處理,在這過程中如果事務(wù) B 更新了這條數(shù)據(jù),并提交了事務(wù),那么當(dāng)事務(wù) A 再次讀取該數(shù)據(jù)時,就會發(fā)現(xiàn)前后兩次讀到的數(shù)據(jù)是不一致的,這種現(xiàn)象就被稱為不可重復(fù)讀。
幻讀
在一個事務(wù)內(nèi)多次查詢某個符合查詢條件的「記錄數(shù)量」,如果出現(xiàn)前后兩次查詢到的記錄數(shù)量不一樣的情況,就意味著發(fā)生了「幻讀」現(xiàn)象。舉個栗子。假設(shè)有 A 和 B 這兩個事務(wù)同時在處理,事務(wù) A 先開始從數(shù)據(jù)庫查詢賬戶余額大于 100 萬的記錄,發(fā)現(xiàn)共有 5 條,然后事務(wù) B 也按相同的搜索條件也是查詢出了 5 條記錄。接下來,事務(wù) A 插入了一條余額超過 100 萬的賬號,并提交了事務(wù),此時數(shù)據(jù)庫超過 100 萬余額的賬號個數(shù)就變?yōu)?6。然后事務(wù) B 再次查詢賬戶余額大于 100 萬的記錄,此時查詢到的記錄數(shù)量有 6 條,發(fā)現(xiàn)和前一次讀到的記錄數(shù)量不一樣了,就感覺發(fā)生了幻覺一樣,這種現(xiàn)象就被稱為幻讀。
所以,要解決臟讀現(xiàn)象,就要升級到「讀提交」以上的隔離級別;要解決不可重復(fù)讀現(xiàn)象,就要升級到「可重復(fù)讀」的隔離級別。不過,要解決幻讀現(xiàn)象不建議將隔離級別升級到「串行化」,因為這樣會導(dǎo)致數(shù)據(jù)庫在并發(fā)事務(wù)時性能很差。InnoDB 引擎的默認隔離級別雖然是「可重復(fù)讀」,但是它通過next-key lock 鎖(行鎖和間隙鎖的組合)來鎖住記錄之間的“間隙”和記錄本身,防止其他事務(wù)在這個記錄之間插入新的記錄,這樣就避免了幻讀現(xiàn)象。接下里,舉個具體的例子來說明這四種隔離級別,有一張賬戶余額表,里面有一條記錄:然后有兩個并發(fā)的事務(wù),事務(wù) A 只負責(zé)查詢余額,事務(wù) B 則會將我的余額改成 200 萬,下面是按照時間順序執(zhí)行兩個事務(wù)的行為:在不同隔離級別下,事務(wù) A 執(zhí)行過程中查詢到的余額可能會不同:
在「讀未提交」隔離級別下,事務(wù) B 修改余額后,雖然沒有提交事務(wù),但是此時的余額已經(jīng)可以被事務(wù) A 看見了,于是事務(wù) A 中余額 V1 查詢的值是 200 萬,余額 V2、V3 自然也是 200 萬了;
在「讀提交」隔離級別下,事務(wù) B 修改余額后,因為沒有提交事務(wù),所以事務(wù) A 中余額 V1 的值還是 100 萬,等事務(wù) B 提交完后,最新的余額數(shù)據(jù)才能被事務(wù) A 看見,因此額 V2、V3 都是 200 萬;
在「可重復(fù)讀」隔離級別下,事務(wù) A 只能看見啟動事務(wù)時的數(shù)據(jù),所以余額 V1、余額 V2 的值都是 100 萬,當(dāng)事務(wù) A 提交事務(wù)后,就能看見最新的余額數(shù)據(jù)了,所以余額 V3 的值是 200 萬;
在「串行化」隔離級別下,事務(wù) B 在執(zhí)行將余額 100 萬修改為 200 萬時,由于此前事務(wù) A 執(zhí)行了讀操作,這樣就發(fā)生了讀寫沖突,于是就會被鎖住,直到事務(wù) A 提交后,事務(wù) B 才可以繼續(xù)執(zhí)行,所以從 A 的角度看,余額 V1、V2 的值是 100 萬,余額 V3 的值是 200萬。
了解完這兩個知識點后,就可以跟大家說說可重復(fù)讀隔離級別是如何實現(xiàn)的。假設(shè)事務(wù) A 和 事務(wù) B 差不多同一時刻啟動,那這兩個事務(wù)創(chuàng)建的 Read View 如下:事務(wù) A 和 事務(wù) B 的 Read View 具體內(nèi)容如下:
在事務(wù) A 的 Read View 中,它的事務(wù) id 是 51,由于與事務(wù) B 同時啟動,所以此時活躍的事務(wù)的事務(wù) id 列表是 51 和 52,活躍的事務(wù) id 中最小的事務(wù) id 是事務(wù) A 本身,下一個事務(wù) id 應(yīng)該是 53。
在事務(wù) B 的 Read View 中,它的事務(wù) id 是 52,由于與事務(wù) A 同時啟動,所以此時活躍的事務(wù)的事務(wù) id 列表是 51 和 52,活躍的事務(wù) id 中最小的事務(wù) id 是事務(wù) A,下一個事務(wù) id 應(yīng)該是 53。
然后讓事務(wù) A 去讀賬戶余額為 100 萬的記錄,在找到記錄后,它會先看這條記錄的 trx_id,此時發(fā)現(xiàn) trx_id 為 50,通過和事務(wù) A 的 Read View 的 m_ids 字段發(fā)現(xiàn),該記錄的事務(wù) id 并不在活躍事務(wù)的列表中,并且小于事務(wù) A 的事務(wù) id,這意味著,這條記錄的事務(wù)早就在事務(wù) A 前提交過了,所以該記錄對事務(wù) A 可見,也就是事務(wù) A 可以獲取到這條記錄。接著,事務(wù) B 通過 update 語句將這條記錄修改了,將小林的余額改成 200 萬,這時 MySQL 會記錄相應(yīng)的 undo log,并以鏈表的方式串聯(lián)起來,形成版本鏈,如下圖:你可以在上圖的「記錄字段」看到,由于事務(wù) B 修改了該記錄,以前的記錄就變成舊版本記錄了,于是最新記錄和舊版本記錄通過鏈表的方式串起來,而且最新記錄的 trx_id 是事務(wù) B 的事務(wù) id。然后如果事務(wù) A 再次讀取該記錄,發(fā)現(xiàn)這條記錄的 trx_id 為 52,比自己的事務(wù) id 還大,并且比下一個事務(wù) id 53 小,這意味著,事務(wù) A 讀到是和自己同時啟動事務(wù)的事務(wù) B 修改的數(shù)據(jù),這時事務(wù) A 并不會讀取這條記錄,而是沿著 undo log 鏈條往下找舊版本的記錄,直到找到 trx_id 等于或者小于事務(wù) A 的事務(wù) id 的第一條記錄,所以事務(wù) A 再一次讀取到 trx_id 為 50 的記錄,也就是小林余額是 100 萬的這條記錄?!缚芍貜?fù)讀」隔離級別就是在啟動時創(chuàng)建了 Read View,然后在事務(wù)期間讀取數(shù)據(jù)的時候,在找到數(shù)據(jù)后,先會將該記錄的 trx_id 和該事務(wù)的 Read View 里的字段做個比較:
「讀提交」隔離級別是在每個 select 都會生成一個新的 Read View,也意味著,事務(wù)期間的多次讀取同一條數(shù)據(jù),前后兩次讀的數(shù)據(jù)可能會出現(xiàn)不一致,因為可能這期間另外一個事務(wù)修改了該記錄,并提交了事務(wù)。那讀提交隔離級別是怎么實現(xiàn)呢?我們還是以前面的例子來聊聊。假設(shè)事務(wù) A 和 事務(wù) B 差不多同一時刻啟動,然后事務(wù) B 將小林的賬戶余額修改成了 200 萬,但是事務(wù) B 還未提交,這時事務(wù) A 讀到的數(shù)據(jù),應(yīng)該還是小林賬戶余額為 100 萬的數(shù)據(jù),那具體怎么做到的呢?事務(wù) A 在找到小林這條記錄時,會看這條記錄的 trx_id,發(fā)現(xiàn)和事務(wù) A 的 Read View 中的 creator_trx_id 要大,而且還在 m_ids 列表里,說明這條記錄被事務(wù) B 修改過,而且還可以知道事務(wù) B 并沒有提交事務(wù),因為如果提交了事務(wù),那么這條記錄的 trx_id 就不會在 m_ids 列表里。因此,事務(wù) A 不能讀取該記錄,而是沿著 undo log 鏈條往下找。當(dāng)事務(wù) B 修改數(shù)據(jù)并提交了事務(wù)后,這時事務(wù) A 讀到的數(shù)據(jù),就是小林賬戶余額為 200 萬的數(shù)據(jù),那具體怎么做到的呢?事務(wù) A 在找到小林這條記錄時,會看這條記錄的 trx_id,發(fā)現(xiàn)和事務(wù) A 的 Read View 中的 creator_trx_id 要大,而且不在 m_ids 列表里,說明該記錄的 trx_id 的事務(wù)是已經(jīng)提交過的了,于是事務(wù) A 就可以讀取這條記錄,這也就是所謂的讀已提交機制。