出自公眾號:漫畫編程
最近,五一小長假的放假時間調整了,決定趁著假期出去玩一玩。我和女朋友商量好,我負責制定行程,她負責購買出行用品。相安無事,我正在各家比價中,不知道發生了什麼,女朋友買買買竟然不高興了。
在《如何給女朋友解釋什麼是並發和並行》一文中我們介紹過並發和並行。當程序中可能出現並發的情況時,我們就需要通過一定的手段來保證在並發情況下數據的準確性,通過這種手段保證了當用戶和其他用戶一起操作時,所得到的結果和他單獨操作時的禱告的結果是一樣的。
這種手段就叫做並發控制。並發控制的目的是保證一個用戶的工作不會對另一個用戶的工作產生不合理的影響。
沒有做好並發控制,就可能導致髒讀、幻讀和不可重複讀等問題。
我們常說的並發控制,一般都和資料庫管理系統(DBMS)有關,在DBMS中的並發控制的任務是確保在多個事務同時存取資料庫中同一數據時不破壞事務的隔離性和統一性以及資料庫的統一性。實現並發控制的主要手段大致可以分為樂觀並發控制和悲觀並發控制兩種。
在開始介紹之前要明確一下:無論是悲觀鎖還是樂觀鎖,都是人們定義出來的概念,可以認為是一種思想。其實不僅僅是關係型資料庫系統中有樂觀鎖和悲觀鎖的概念,像memcache、hibernate、tair等都有類似的概念。所以,不應該拿樂觀鎖、悲觀鎖和其他的資料庫鎖等進行對比。
當我們要對一個資料庫中的一條數據進行修改的時候,為了避免同時被其他人修改,最好的辦法就是直接對該數據進行加鎖以防止並發。
這種藉助資料庫鎖機制在修改數據之前先鎖定,再修改的方式被稱之為悲觀並發控制(又名「悲觀鎖」,Pessimistic Concurrency Control,縮寫「PCC」)。
之所以叫做悲觀鎖,是因為這是一種對數據的修改抱有悲觀態度的並發控制方式。我們一般認為數據被並發修改的概率比較大,所以需要在修改之前先加鎖。
悲觀並發控制實際上是「先取鎖再訪問」的保守策略,為數據處理的安全提供了保證。
樂觀鎖( Optimistic Locking ) 是相對悲觀鎖而言的,樂觀鎖假設數據一般情況下不會造成衝突,所以在數據進行提交更新的時候,才會正式對數據的衝突與否進行檢測,如果發現衝突了,則讓返回用戶錯誤的信息,讓用戶決定如何去做。
相對於悲觀鎖,在對資料庫進行處理的時候,樂觀鎖並不會使用資料庫提供的鎖機制。一般的實現樂觀鎖的方式就是記錄數據版本。
悲觀鎖的實現,往往依靠資料庫提供的鎖機制。在資料庫中,悲觀鎖的流程如下:
在對記錄進行修改前,先嘗試為該記錄加上排他鎖(exclusive locking)。
如果加鎖失敗,說明該記錄正在被修改,那麼當前查詢可能要等待或者拋出異常。具體響應方式由開發者根據實際需要決定。
如果成功加鎖,那麼就可以對記錄做修改,事務完成後就會解鎖了。
其間如果有其他對該記錄做修改或加排他鎖的操作,都會等待我們解鎖或直接拋出異常。
我們拿比較常用的MySql Innodb引擎舉例,來說明一下在SQL中如何使用悲觀鎖。
要使用悲觀鎖,我們必須關閉mysql資料庫的自動提交屬性,因為MySQL默認使用autocommit模式,也就是說,當你執行一個更新操作後,MySQL會立刻將結果進行提交。set autocommit=0;
我們舉一個簡單的例子,如淘寶下單過程中扣減庫存的需求說明一下如何使用悲觀鎖:
//0.開始事務
begin;
//1.查詢出商品庫存信息
select quantity from items where id=1 for update;
//2.修改商品庫存為2
update items set quantity=2 where id = 1;
//3.提交事務
commit;
以上,在對id = 1的記錄修改前,先通過for update的方式進行加鎖,然後再進行修改。這就是比較典型的悲觀鎖策略。
如果以上修改庫存的代碼發生並發,同一時間只有一個線程可以開啟事務並獲得id=1的鎖,其它的事務必須等本次事務提交之後才能執行。這樣我們可以保證當前的數據不會被其它事務修改。
上面我們提到,使用select…for update會把數據給鎖住,不過我們需要注意一些鎖的級別,MySQL InnoDB默認行級鎖。行級鎖都是基於索引的,如果一條SQL語句用不到索引是不會使用行級鎖的,會使用表級鎖把整張表鎖住,這點需要注意。
使用樂觀鎖就不需要藉助資料庫的鎖機制了。
樂觀鎖的概念中其實已經闡述了他的具體實現細節:主要就是兩個步驟:衝突檢測和數據更新。其實現方式有一種比較典型的就是Compare and Swap(CAS)。
CAS是項樂觀鎖技術,當多個線程嘗試使用CAS同時更新同一個變量時,只有其中一個線程能更新變量的值,而其它線程都失敗,失敗的線程並不會被掛起,而是被告知這次競爭中失敗,並可以再次嘗試。
比如前面的扣減庫存問題,通過樂觀鎖可以實現如下:
//查詢出商品庫存信息,quantity = 3
select quantity from items where id=1
//修改商品庫存為2
update items set quantity=2 where id=1 and quantity = 3;
以上,我們在更新之前,先查詢一下庫存表中當前庫存數(quantity),然後在做update的時候,以庫存數作為一個修改條件。當我們提交更新的時候,判斷資料庫表對應記錄的當前庫存數與第一次取出來的庫存數進行比對,如果資料庫表當前庫存數與第一次取出來的庫存數相等,則予以更新,否則認為是過期數據。
以上更新語句存在一個比較重要的問題,即傳說中的ABA問題。
比如說一個線程one從資料庫中取出庫存數3,這時候另一個線程two也從資料庫中庫存數3,並且two進行了一些操作變成了2,然後two又將庫存數變成3,這時候線程one進行CAS操作發現資料庫中仍然是3,然後one操作成功。儘管線程one的CAS操作成功,但是不代表這個過程就是沒有問題的。
//查詢出商品信息,version = 1
select version from items where id=1
//修改商品庫存為2
update items set quantity=2,version = 3 where id=1 and version = 2;
樂觀鎖每次在執行數據的修改操作時,都會帶上一個版本號,一旦版本號和數據的版本號一致就可以執行修改操作並對版本號執行+1操作,否則就執行失敗。因為每次操作的版本號都會隨之增加,所以不會出現ABA問題,因為版本號只會增加不會減少。
以上SQL其實還是有一定的問題的,就是一旦發上高並發的時候,就只有一個線程可以修改成功,那麼就會存在大量的失敗。
對於像淘寶這樣的電商網站,高並發是常有的事,總讓用戶感知到失敗顯然是不合理的。所以,還是要想辦法減少樂觀鎖的粒度的。
有一條比較好的建議,可以減小樂觀鎖力度,最大程度的提升吞吐率,提高並發能力!如下:
//修改商品庫存
update item
set quantity=quantity - 1
where id = 1 and quantity - 1 > 0
以上SQL語句中,如果用戶下單數為1,則通過quantity - 1 > 0的方式進行樂觀鎖控制。
以上update語句,在執行過程中,會在一次原子操作中自己查詢一遍quantity的值,並將其扣減掉1。
高並發環境下鎖粒度把控是一門重要的學問,選擇一個好的鎖,在保證數據安全的情況下,可以大大提升吞吐率,進而提升性能。
在樂觀鎖與悲觀鎖的選擇上面,主要看下兩者的區別以及適用場景就可以了。
1、樂觀鎖並未真正加鎖,效率高。一旦鎖的粒度掌握不好,更新失敗的概率就會比較高,容易發生業務失敗。
2、悲觀鎖依賴資料庫鎖,效率低。更新失敗的概率比較低。
隨著網際網路三高架構(高並發、高性能、高可用)的提出,悲觀鎖已經越來越少的被使用到生產環境中了,尤其是並發量比較大的業務場景。
覺得文章不錯的,歡迎點在看和轉發,長按下圖關注公眾號 程式設計師喬戈裡,收看更多精彩。
今日問題:你是怎麼理解樂觀和悲觀鎖的?歡迎留言!
5月28日進榜小夥伴公示
注意:
1.這個活動屬於是給公眾號讀者的福利,如果沒有關注,進入前10也無效哈,會將名額讓出。
2.進榜小夥伴記得公眾號後臺-撩我福利-我的微信,加一下好友,登記微信id,以便區分。
競賽打卡規則歡迎點擊:
送書非互推!《漫畫算法》《碼農翻身》經典好書!