數學定義
在數學裡,冪等有兩種主要的定義:
HTTP規範定義
在HTTP/1.1規範中冪等性的定義是:
A request method is considered "idempotent" if the intended effect onthe server of multiple identical requests with that method is the same as the effect for a single such request. Of the request methods defined by this specification, PUT, DELETE, and safe request methods are idempotent.
HTTP的冪等性指的是一次和多次請求某一個資源應該具有相同的副作用。如通過PUT接口將數據的Status置為1,無論是第一次執行還是多次執行,獲取到的結果應該是相同的,即執行完成之後Status =1。
1.2 冪等概念微服務架構中,冪等是一致性方面的一個重要概念。冪等(Idempotent)是一個數學領域與計算機學的概念,常見於抽象代數中。而在編程中,一個冪等操作的特點是指其任意多次執行所產生的影響均與一次執行的影響相同。
有人會簡單的認為,直接禁止所有重試即可。然而,重試是降低微服務失敗率的重要手段。因為網絡波動、系統資源分配的不確定性、跨機房的請求等等原因,都會或多或少的導致一小部分請求的失敗。而這部分失敗的請求中,又有大部分請求其實只需要簡單重試幾次,即可成功。
1.3 重試機制降低微服務失敗率
提高至四個或五個9
提高微服務架構的容錯性
提高微服務架構的高可靠性
2 冪等分析2.1 冪等場景可能會發生重複請求或消費的場景,在微服務架構中是隨處可見的。以下是筆者梳理的幾個常見場景:
網絡波動:因網絡波動,可能會引起重複請求
分布式消息消費:任務發布後,使用分布式消息服務來進行消費
用戶重複操作:用戶在使用產品時,可能會無意的觸發多筆交易,甚至沒有響應而有意觸發多筆交易
未關閉的重試機制:因開發人員、測試人員或運維人員沒有檢查出來,而開啟的重試機制(如Nginx重試、RPC通信重試或業務層重試等)
2.2 CRUD分析新增類請求(C)
查詢類動作(R)
更新類請求(U)
基於主鍵的計算式Update,不具備冪等性,即:UPDATE goods SET number=number-1 WHERE id=1
基於主鍵的非計算式Update,具備冪等性,即:UPDATE goods SET number=newNumber WHERE id=1
基於條件查詢的Update,不一定具有冪等性(需要根據實際情況進行分析判斷)
刪除類請求(D)
2.3 冪等重要性針對一個微服務架構,如果不支持冪等操作,那將會出現以下情況:
電商超賣現象
重複轉帳、扣款或付款
重複增加金幣、積分或優惠券
超賣現象
比如某商品的庫存為1,此時用戶1和用戶2並發購買該商品,用戶1提交訂單後該商品的庫存被修改為0,而此時用戶2並不知道的情況下提交訂單,該商品的庫存再次被修改為-1這就是超賣現象。
究其深層原因,是因為資料庫底層的寫操作和讀操作可以同時進行,雖然寫操作默認帶有隱式鎖(即對同一數據不能同時進行寫操作)但是讀操作默認是不帶鎖的,所以當用戶1去修改庫存的時候,用戶2依然可以都到庫存為1,所以出現了超賣現象。
解決方案A:可以對讀操作加上顯式鎖(即在select …語句最後加上for update)這樣一來用戶1在進行讀操作時用戶2就需要排隊等待了。但問題來了,如果該商品很熱門並發量很高那麼效率就會大大的下降,如何解決呢?(解決方案B)
解決方案B:我們可以有條件有選擇的在讀操作上加鎖,比如可以對庫存做一個判斷,當庫存小於一個量時開始加鎖,讓購買者排隊,這樣一來就解決了超賣現象。
3 何種接口提供冪等性3.1 HTTP冪等性在HTTP規範中定義GET、PUT和DELETE方法應該具有冪等性,具體如下:
The GET method requests transfer of a current selected representatiofor the target resourceGET is the primary mechanism of information retrieval and the focus of almost all performance optimizations. Hence, when people speak of retrieving some identifiable information via HTTP, they are generally referring to making a GET request.
GET方法是向伺服器查詢,不會對系統產生副作用,具有冪等性(不代表每次請求都是相同的結果)。
The PUT method requests that the state of the target resource be created or replaced with the state defined by the representation enclosed in the request message payload.
也就是說PUT方法首先判斷系統中是否有相關的記錄,如果有記錄則更新該記錄,如果沒有則新增記錄。
The DELETE method requests that the origin server remove the association between the target resource and its current functionality. In effect, this method is similar to the rm command in UNIX: it expresses a deletion operation on the URI mapping of the origin server rather than an expectation that the previously associated information be deleted.
DELETE方法是刪除伺服器上的相關記錄。
3.2 實際業務案例現在簡化為這樣一個系統,用戶購買商品的訂單系統與支付系統;訂單系統負責記錄用戶的購買記錄已經訂單的流轉狀態(orderStatus),支付系統用於付款,提供:
1
4boolean pay(int accountid,BigDecimal amount);
訂單系統與支付系統通過分布式網絡交互描述如下:
1boolean pay(int orderId,int accountId,BigDecimal amount);
通過orderId來標定訂單的唯一性,付款系統只要檢測到訂單已經支付過,則第二次調用不會扣款而會直接返回結果:
隨著分布式應用及微服務的普及,因為網絡原因而導致調用應用未能獲取到確切的結果從而導致重試,這就需要被調用應用具有冪等性。例如上文所闡述的支付系統,針對同一個訂單保證支付的冪等性,一旦訂單的支付狀態確定之後,以後的操作都會返回相同的結果,對用戶的扣款也只會有一次。這種接口的冪等性,簡化到數據層面的操作:
1update userAmount set amount = amount - 'value' ,paystatus = 'paid' where orderId= 'orderid' and paystatus = 'unpay'
其中value是用戶要減少的訂單,paystatus代表支付狀態,paid代表已經支付,unpay代表未支付,orderid是訂單號。在上文中提到的訂單系統,訂單具有自己的狀態(orderStatus),訂單狀態存在一定的流轉。訂單首先有提交(0)→付款中(1)→付款成功(2)/ 付款失敗(3),簡化之後其流轉路徑如圖:
1update Order set orderStatus = 1 where OrderId = 'orderid' and orderStatus = 0
當orderStatus 處於0,1兩種狀態時,對訂單執行0->1 的狀態流轉操作應該是具有冪等性的。這時候需要在執行update操作之前檢測orderStatus是否已經=1,如果已經=1則直接返回true即可。
但是如果此時orderStatus = 2,再進行訂單狀態0->1 時操作就無法成功,但是冪等性是針對同一個請求的,也就是針對同一個requestid保持冪等,這時候再執行:
1update Order set orderStatus = 1 where OrderId = 'orderid' and orderStatus = 0
接口會返回失敗,系統沒有產生修改,如果再發一次,requestid是相同的,對系統同樣沒有產生修改。
4 解決方案4.1 全局唯一ID如果使用全局唯一ID,就是根據業務的操作和內容生成一個全局ID,在執行操作前先根據這個全局唯一ID是否存在,來判斷這個操作是否已經執行。如果不存在則把全局ID,存儲到存儲系統中,比如資料庫、Redis等。如果存在則表示該方法已經執行。
使用全局唯一ID是一個通用方案,可以支持插入、更新、刪除業務操作。但是這個方案看起來很美但是實現起來比較麻煩,下面的方案適用於特定的場景,但是實現起來比較簡單。
4.2 去重表這種方法適用於在業務中有唯一標的插入場景中,比如在以上的支付場景中,如果一個訂單只會支付一次,所以訂單ID可以作為唯一標識。這時,我們就可以建一張去重表,並且把唯一標識作為唯一索引,在我們實現時,把創建支付單據和寫入去去重表,放在一個事務中,如果重複創建,資料庫會拋出唯一約束異常,操作就會回滾。
4.3 插入或更新這種方法插入並且有唯一索引的情況,比如我們要關聯商品品類,其中商品的ID和品類的ID可以構成唯一索引,並且在數據表中也增加了唯一索引。這時就可以使用InsertOrUpdate操作。在mysql資料庫中如下:
1insert into goods_category (goods_id,category_id,create_time,update_time)
2 values(
3 on DUPLICATE KEY UPDATE update_time=now()
這種方法適合在更新的場景中,比如我們要更新商品的名字,這時我們就可以在更新的接口中增加一個版本號,來做冪等:
1boolean updateGoodsName(int id,String newName,int version);
在實現時可以如下:
1update goods set name=
這種方法適合在有狀態機流轉的情況下,比如就會訂單的創建和付款,訂單的付款肯定是在之前,這時我們可以通過在設計狀態欄位時,使用int類型,並且通過值類型的大小來做冪等,比如訂單的創建為0,付款成功為100,付款失敗為99。在做狀態機更新時,我們就這可以這樣控制:
1update goods_order set status=#{status} where id=#{id} and status<#{status}
以上就是保證接口冪等性的一些方法。
5 總結冪等性設計不能脫離業務來討論,一般情況下,去重表同時也是業務數據表,而針對分布式的去重ID,可以參考以下幾種方式:
UUID
Snowflake
資料庫自增ID
業務本身的唯一約束
業務欄位+時間戳拼接