用 Node 輕松完成一個分布式事務 TCC,保姆級教程
什么是TCC,TCC是Try、Confirm、Cancel三個詞語的縮寫,最早是由 Pat Helland 于 2007 年發表的一篇名為《Life beyond Distributed Transactions:an Apostate’s Opinion》的論文提出。
TCC組成
TCC分為3個階段
-
Try 階段:嘗試執行,完成所有業務檢查(一致性), 預留必須業務資源(準隔離性)
-
Confirm 階段:如果所有分支的Try都成功了,則走到Confirm階段。Confirm真正執行業務,不作任何業務檢查,只使用 Try 階段預留的業務資源
-
Cancel 階段:如果所有分支的Try有一個失敗了,則走到Cancel階段。Cancel釋放 Try 階段預留的業務資源。
TCC分布式事務里,有3個角色,與經典的XA分布式事務一樣:
-
AP/應用程序,發起全局事務,定義全局事務包含哪些事務分支
-
RM/資源管理器,負責分支事務各項資源的管理
-
TM/事務管理器,負責協調全局事務的正確執行,包括Confirm,Cancel的執行,并處理網絡異常
如果我們要進行一個類似于銀行跨行轉賬的業務,轉出(TransOut)和轉入(TransIn)分別在不同的微服務里,一個成功完成的TCC事務典型的時序圖如下:
TCC網絡異常
TCC在整個全局事務的過程中,可能發生各類網絡異常情況,典型的是空回滾、冪等、懸掛,由于TCC的異常情況,和SAGA、可靠消息等事務模式有相近的地方,因此我們把所有異常的解決方案統統放在這篇文章《分布式事務最經典的七種解決方案》的子事務屏障環節進行講解
TCC實踐
下面我們進行一個TCC事務的具體開發
目前可用于TCC的開源框架,主要為Java語言,其中以seata為代表。我們的例子采用nodejs,使用的分布式事務框架為dtm,它對分布式事務的支持非常優雅。下面來詳細講解TCC的組成
下面我們來編寫具體的Try/Confirm/Cancel的處理函數
- router.post('/api/TransOutTry', (ctx, next) => {
- console.log("TransOutTry")
- ctx.body = { result: "SUCCESS" }
- }).post('/api/TransOutConfirm', (ctx, next) => {
- console.log("TransOutConfirm")
- ctx.body = { result: "SUCCESS" }
- }).post('/api/TransOutCancel', (ctx, next) => {
- console.log("TransOutCancel")
- ctx.body = { result: "SUCCESS" }
- }).post('/api/TransInTry', (ctx, next) => {
- console.log("TransInTry")
- ctx.body = { result: "SUCCESS" }
- }).post('/api/TransInConfirm', (ctx, next) => {
- console.log("TransInConfirm")
- ctx.body = { result: "SUCCESS" }
- }).post('/api/TransInCancel', (ctx, next) => {
- console.log("TransInCancel")
- ctx.body = { result: "SUCCESS" }
- })
到此各個子事務的處理函數已經OK了,然后是開啟TCC事務,進行分支調用
- async function FireTcc() {
- let dtm = "http://localhost:8080/api/dtmsvr" // dtm服務地址
- let svc = "http://localhost:4005/api" // 本地服務前綴
- // 開啟一個tcc事務,第二個參數里面,寫全局事務的邏輯
- await dtmcli.tccGlobalTransaction(dtm, async (t) => {
- let req = { amount: 30 } // 子事務需要的負荷
- console.log("calling trans out")
- // 注冊事務分支,并調用分支中的Try
- await t.callBranch(req, svc + "/TransOutTry", svc + "/TransOutConfirm", svc + "/TransOutCancel")
- console.log("calling trans in")
- // 注冊事務分支,并調用分支中的Try
- await t.callBranch(req, svc + "/TransInTry", svc + "/TransInConfirm", svc + "/TransInCancel")
- })
- }
至此,一個完整的TCC分布式事務編寫完成。
如果您想要完整運行一個成功的示例,那么參考這個例子yedf/dtmcli-node-sample,將它運行起來非常簡單
- # 部署啟動dtm
- # 需要docker版本18以上
- git clone https://github.com/yedf/dtm
- cd dtm
- docker-compose up
- # 另起一個命令行
- git clone https://github.com/yedf/dtmcli-node-sample
- cd dtmcli-node-sample
- npm install
- node .
TCC的回滾
假如銀行將金額準備轉入用戶2時,發現用戶2的賬戶異常,返回失敗,會怎么樣?我們給出事務失敗交互的時序圖
這個跟成功的TCC差別就在于,當某個子事務返回失敗后,后續就回滾全局事務,調用各個子事務的Cancel操作,保證全局事務全部回滾。
小結
在這篇文章里,我們介紹了TCC的理論知識,也通過一個例子,完整給出了編寫一個TCC事務的過程,涵蓋了正常成功完成,以及成功回滾的情況。相信讀者通過這邊文章,對TCC已經有了深入的理解。
關于分布式事務更多更全面的知識,請參考《分布式事務最經典的七種解決方案》
文中使用的例子節選自yedf/dtm,支持多種事務模式:TCC、SAGA、XA、事務消息 跨語言支持,已支持 golang、python、Java、PHP、nodejs等語言的客戶端,參考各語言SDK。提供子事務屏障功能,優雅解決冪等、懸掛、空補償等問題。
閱讀完此篇干貨,歡迎大家訪問https://github.com/yedf/dtm項目,給顆星星支持!