成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

分布式事務的六種解決方案,寫得非常好!

開發 后端 分布式
在分布式系統、微服務架構大行其道的今天,服務間互相調用出現失敗已經成為常態。如何處理異常,如何保證數據一致性,成為微服務設計過程中,繞不開的一個難題。

[[407285]]

介紹

在分布式系統、微服務架構大行其道的今天,服務間互相調用出現失敗已經成為常態。如何處理異常,如何保證數據一致性,成為微服務設計過程中,繞不開的一個難題。 

在不同的業務場景下,解決方案會有所差異,常見的方式有:

  1.  阻塞式重試;
  2.  2PC、3PC 傳統事務;
  3.  使用隊列,后臺異步處理;
  4.  TCC 補償事務;
  5.  本地消息表(異步確保);
  6.  MQ 事務。

本文側重于其他幾項,關于 2PC、3PC 傳統事務,網上資料已經非常多了,這里不多做重復。

阻塞式重試

在微服務架構中,阻塞式重試是比較常見的一種方式。

偽代碼示例: 

  1. :db.Insert(sql)  
  2. err :request(B-Service,m)  
  3. func request(url string,body interface{}){  
  4.   for i:=0; i<3; i ++ {  
  5.     result, err = request.POST(url,body)  
  6.     if err == nil {  
  7.         break   
  8.     }else {  
  9.       log.Print()  
  10.     }  
  11.   }  

如上,當請求 B 服務的 API 失敗后,發起最多三次重試。如果三次還是失敗,就打印日志,繼續執行下或向上層拋出錯誤。

這種方式會帶來以下問題:

  1.  調用 B 服務成功,但由于網絡超時原因,當前服務認為其失敗了,繼續重試,這樣 B 服務會產生 2 條一樣的數據。
  2.  調用 B 服務失敗,由于 B 服務不可用,重試 3 次依然失敗,當前服務在前面代碼中插入到 DB 的一條記錄,就變成了臟數據。
  3.  重試會增加上游對本次調用的延遲,如果下游負載較大,重試會放大下游服務的壓力。

第一個問題:通過讓 B 服務的 API 支持冪等性來解決。

第二個問題:可以通過后臺定時腳步去修正數據,但這并不是一個很好的辦法。

第三個問題:這是通過阻塞式重試提高一致性、可用性,必不可少的犧牲。

阻塞式重試適用于業務對一致性要求不敏感的場景下。如果對數據一致性有要求的話,就必須要引入額外的機制來解決。

異步隊列

在解決方案演化的過程中,引入隊列是個比較常見也較好的方式。如下示例: 

  1. :db.Insert(sql)  
  2. err :mq.Publish("B-Service-topic",m) 

在當前服務將數據寫入 DB 后,推送一條消息給 MQ,由獨立的服務去消費 MQ 處理業務邏輯。和阻塞式重試相比,雖然 MQ 在穩定性上遠高于普通的業務服務,但在推送消息到 MQ 中的調用,還是會有失敗的可能性,比如網絡問題、當前服務宕機等。這樣還是會遇到阻塞式重試相同的問題,即 DB 寫入成功了,但推送失敗了。

理論上來講,分布式系統下,涉及多個服務調用的代碼都存在這樣的情況,在長期運行中,調用失敗的情況一定會出現。這也是分布式系統設計的難點之一。另外,MQ 系列面試題和答案全部整理好了,微信搜索Java技術棧,在后臺發送:面試,可以在線閱讀。

TCC 補償事務

在對事務有要求,且不方便解耦的情況下,TCC 補償式事務是個較好的選擇。

TCC 把調用每個服務都分成 2 個階段、 3 個操作:

  •  階段一、Try 操作:對業務資源做檢測、資源預留,比如對庫存的檢查、預扣。
  •  階段二、Confirm 操作:提交確認 Try 操作的資源預留。比如把庫存預扣更新為扣除。
  •  階段二、Cancel 操作:Try 操作失敗后,釋放其預扣的資源。比如把庫存預扣的加回去。

TCC 要求每個服務都實現上面 3 個操作的 API,服務接入 TCC 事務前一次調用就完成的操作,現在需要分 2 階段完成、三次操作來完成。

比如一個商城應用需要調用 A 庫存服務、B 金額服務、C 積分服務,如下偽代碼: 

  1. :db.Insert(sql)  
  2. aResult, aErr :A.Try(m)  
  3. bResult, bErr :B.Try(m)  
  4. cResult, cErr :C.Try(m)  
  5. if cErr != nil {  
  6.     A.Cancel()  
  7.     B.Cancel()  
  8.  C.Cancel()  
  9. } else {  
  10.     A.Confirm()  
  11.     B.Confirm()  
  12.     C.Confirm()  

代碼中分別調用 A、B、C 服務 API 檢查并保留資源,都返回成功了再提交確認(Confirm)操作;如果 C 服務 Try 操作失敗后,則分別調用 A、B、C 的 Cancel API 釋放其保留的資源。

TCC 在業務上解決了分布式系統下,跨多個服務、跨多個數據庫的數據一致性問題。但 TCC 方式依然存在一些問題,實際使用中需要注意,包括上面章節提到的調用失敗的情況。

空釋放

上面代碼中如果 C.Try() 是真正調用失敗,那下面多余的 C.Cancel() 調用會出現釋放并沒有鎖定資源的行為。這是因為當前服務無法判斷調用失敗是不是真的鎖定 C 資源了。如果不調用,實際上成功了,但由于網絡原因返回失敗了,這會導致 C 的資源被鎖定,一直得不到釋放。

空釋放在生產環境經常出現,服務在實現 TCC 事務 API 時,應支持空釋放的執行。

時序

上面代碼中如果 C.Try() 失敗,接著調用 C.Cancel() 操作。因為網絡原因,有可能會出現 C.Cancel() 請求會先到 C 服務,C.Try() 請求后到,這會導致空釋放問題,同時引起 C 的資源被鎖定,一直得不到釋放。

所以 C 服務應拒絕釋放資源之后的 Try() 操作。具體實現上,可以用唯一事務ID來區分第一次 Try() 還是釋放后的 Try()。

調用失敗

Cancel 、Confirm 在調用過程中,還是會存在失敗的情況,比如常見的網絡原因。

Cancel() 或 Confirm() 操作失敗都會導致資源被鎖定,一直得不到釋放。這種情況常見解決方案有:

  1.  阻塞式重試。但有同樣的問題,比如宕機、一直失敗的情況。
  2.  寫入日志、隊列,然后有單獨的異步服務自動或人工介入處理。但一樣會有問題,寫日志或隊列時,會存在失敗的情況。

理論上來講非原子性、事務性的二段代碼,都會存在中間態,有中間態就會有失敗的可能性。

本地消息表

本地消息表最初是 ebay 提出的,它讓本地消息表與業務數據表處于同一個數據庫中,這樣就能利用本地事務來滿足事務特性。

具體做法是在本地事務中插入業務數據時,也插入一條消息數據。然后在做后續操作,如果其他操作成功,則刪除該消息;如果失敗則不刪除,異步監聽這個消息,不斷重試。

本地消息表是一個很好的思路,可以有多種使用方式:

配合MQ

示例偽代碼: 

  1. messageTx :tc.NewTransaction("order")  
  2. messageTxSql :tx.TryPlan("content")  
  3. m,err :db.InsertTx(sql,messageTxSql)  
  4. if err!=nil {  
  5.  return err  
  6.  
  7. aErr :mq.Publish("B-Service-topic",m) 
  8. if aErr!=nil { // 推送到 MQ 失敗  
  9.  messageTx.Confirm() // 更新消息的狀態為 confirm  
  10. }else {  
  11.  messageTx.Cancel() // 刪除消息  
  12.   
  13. // 異步處理 confirm 的消息,繼續推送  
  14. func OnMessage(task *Task){  
  15.    err :mq.Publish("B-Service-topic", task.Value()) 
  16.    if err==nil {  
  17.      messageTx.Cancel()  
  18.    }  

上面代碼中其 messageTxSql 是插入本地消息表的一段 SQL : 

  1. insert into `tcc_async_task` (`uid`,`name`,`value`,`status`)   
  2. values ('?','?','?','?') 

它和業務 SQL 在同一個事務中去執行,要么成功,要么失敗。

成功則推送到隊列,推送成功,則調用 messageTx.Cancel() 刪除本地消息;推送失敗則標記消息為 confirm。本地消息表中 status 有 2 種狀態 try、confirm, 無論哪種狀態在 OnMessage 都可以監聽到,從而發起重試。

本地事務保障消息和業務一定會寫入數據庫,此后的執行無論宕機還是網絡推送失敗,異步監聽都可以進行后續處理,從而保障了消息一定會推到 MQ。

而 MQ 則保障一定會到達消費者服務中,利用 MQ 的 QOS 策略,消費者服務一定能處理,或繼續投遞到下一個業務隊列中,從而保障了事務的完整性。

配合服務調用

示例偽代碼: 

  1. messageTx :tc.NewTransaction("order")  
  2. messageTxSql :tx.TryPlan("content")  
  3. body,err :db.InsertTx(sql,messageTxSql)  
  4. if err!=nil {  
  5.     return err  
  6.  
  7. aErr :request.POST("B-Service",body)  
  8. if aErr!=nil { // 調用 B-Service 失敗  
  9.  messageTx.Confirm() // 更新消息的狀態為 confirm  
  10. }else {  
  11.  messageTx.Cancel() // 刪除消息  
  12.  
  13. // 異步處理 confirm 或 try 的消息,繼續調用 B-Service   
  14. func OnMessage(task *Task){  
  15.   // request.POST("B-Service",body)  

這是本地消息表 + 調用其他服務的例子,沒有 MQ 的引入。這種使用異步重試,并用本地消息表保障消息的可靠性,解決了阻塞式重試帶來的問題,在日常開發中比較常見。

如果本地沒有要寫 DB 的操作,可以只寫入本地消息表,同樣在 OnMessage中處理: 

  1. messageTx :tc.NewTransaction("order")  
  2. messageTx :tx.Try("content")  
  3. aErr :request.POST("B-Service",body) 
  4. // .... 

消息過期

配置本地消息表的 Try 和 Confirm 消息的處理器: 

  1. TCC.SetTryHandler(OnTryMessage())  
  2. TCC.SetConfirmHandler(OnConfirmMessage()) 

在消息處理函數中要判斷當前消息任務是否存在過久,比如一直重試了一小時,還是失敗,就考慮發郵件、短信、日志告警等方式,讓人工介入。 

  1. func OnConfirmMessage(task *tcc.Task) {  
  2. if time.Now().Sub(task.CreatedAt) > time.Hour {  
  3.     err :task.Cancel()  // 刪除該消息,停止重試。  
  4.    // doSomeThing() 告警,人工介入  
  5.     return  
  6.  }  

在 Try 處理函數中,還要單獨判斷當前消息任務是否存在過短,因為 Try狀態的消息,可能才剛剛創建,還沒被確認提交或刪除。這會和正常業務邏輯的執行重復,意味著成功的調用,也會被重試;為盡量避免這種情況,可以檢測消息的創建時間是否很短,短的話可以跳過。

重試機制必然依賴下游 API 在業務邏輯上的冪等性,雖然不處理也可行,但設計上還是要盡量避免干擾正常的請求。另外,推薦 Java 核心技術教程和示例源碼:https://github.com/javastacks/javastack

獨立消息服務

獨立消息服務是本地消息表的升級版,把本地消息表抽離成一個獨立的服務。所有操作之前先在消息服務添加個消息,后續操作成功則刪除消息,失敗則提交確認消息。

然后用異步邏輯去監聽消息,做對應的處理,和本地消息表的處理邏輯基本一致。但由于向消息服務添加消息,無法和本地操作放到一個事務里,所以會存在添加消息成功,后續失敗,則此時的消息就是個無用消息。

如下示例場景: 

  1. err :request.POST("Message-Service",body)  
  2. if err!=nil {  
  3.   return err  
  4.  
  5. aErr :request.POST("B-Service",body)  
  6. if aErr!=nil { 
  7.   return aErr  

這個無用的消息,需要消息服務去確認這個消息是否執行成功,沒有則刪除,有繼續執行后續邏輯。相比本地事務表 try 和 confirm ,消息服務在前面多了一種狀態 prepare。

MQ 事務

有些 MQ 的實現支持事務,比如 RocketMQ 。MQ 的事務可以看作獨立消息服務的一種具體實現,邏輯完全一致。

所有操作之前先在 MQ 投遞個消息,后續操作成功則 Confirm 確認提交消息,失敗則Cancel刪除消息。MQ 事務也會存在 prepare狀態,需要 MQ 的消費處理邏輯來確認業務是否成功。

總結

從分布式系統實踐中來看,要保障數據一致性的場景,必然要引入額外的機制處理。

TCC 的優點是作用于業務服務層,不依賴某個具體數據庫、不與具體框架耦合、資源鎖的粒度比較靈活,非常適用于微服務場景下。缺點是每個服務都要實現 3 個 API,對于業務侵入和改動較大,要處理各種失敗異常。開發者很難完整處理各種情況,找個成熟的框架可以大大降低成本,比如阿里的 Fescar。

本地消息表的優點是簡單、不依賴其他服務的改造、可以很好的配合服務調用和 MQ 一起使用,在大多業務場景下都比較實用。缺點是本地數據庫多了消息表,和業務表耦合在一起。文中本地消息表方式的示例,來源于作者寫的一個庫,有興趣的同學可以參考下 https://github.com/mushroomsir/tcc

MQ 事務和獨立消息服務的優點是抽離出一個公共的服務來解決事務問題,避免每個服務都有消息表和服務耦合在一起,增加服務自身的處理復雜性。缺點是支持事務的 MQ 很少;且每次操作前都先調用 API 添加個消息,會增加整體調用的延遲,在絕大多數正常響應的業務場景下,是一種多余的開銷。

 

責任編輯:龐桂玉 來源: Java技術棧
相關推薦

2025-04-29 04:00:00

分布式事務事務消息

2024-03-26 12:08:53

分布式事務存儲

2019-07-25 15:32:35

分布式事務微服務系統架構

2023-09-14 15:44:46

分布式事務數據存儲

2020-05-28 09:35:05

分布式事務方案

2020-03-31 16:13:26

分布式事務方案TCC

2025-04-28 00:44:04

2019-04-28 11:01:05

云安全云計算CASB

2010-07-21 13:53:41

SQL Server分

2025-05-07 00:10:00

分布式事務TCC模式

2022-07-06 12:03:55

事務解決方案

2023-11-30 07:19:08

.NET開源

2019-01-11 18:22:07

阿里巴巴技術開源

2021-09-28 09:43:11

微服務架構技術

2024-06-13 08:04:23

2021-04-30 20:10:46

類加載Java代碼

2021-06-28 10:03:44

分布式數據庫架構

2024-12-09 09:35:00

2019-09-09 10:09:51

分布式事務 數據庫

2023-03-05 18:23:38

分布式ID節點
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: .国产精品成人自产拍在线观看6 | 欧美爱爱视频网站 | 国产精品久久久亚洲 | 一区二区三区精品视频 | 国产在线精品一区 | 91免费高清 | 91精品久久久久久久久99蜜臂 | 91美女在线观看 | 国产午夜视频 | 精品九九| 欧美亚洲一区二区三区 | 国产欧美一区二区三区在线看 | 黄色一级电影免费观看 | 欧美日本在线观看 | 在线免费小视频 | 亚洲一级毛片 | 日韩成人 | 亚洲欧美一区二区三区1000 | 久久一级大片 | 精品国产欧美在线 | 99国产精品视频免费观看一公开 | 一本岛道一二三不卡区 | 午夜影视 | 夜夜草视频 | 天啪| 日韩欧美一区二区三区四区 | 我我色综合 | 自拍偷拍视频网 | 午夜免费网站 | 国产不卡视频 | 91porn国产成人福利 | 国产剧情久久 | 国产一区免费视频 | 亚洲精品一区二区网址 | 欧美一区二区三区 | 日本精品视频 | 欧美日韩精品在线免费观看 | 亚洲一区二区三区久久 | 小视频你懂得 | 91精品国产乱码久久久 | 四虎国产 |