MySQL冗余數據的三種方案

作者：58沈劍 2017-07-03 18:24:39

互聯網數據量很大的業務場景，往往數據庫需要進行水平切分來降低單庫數據量。此時常見的架構設計方案，是使用數據冗余這種反范式設計來滿足分庫后不同維度的查詢需求。

一、為什么要冗余數據

互聯網數據量很大的業務場景，往往數據庫需要進行水平切分來降低單庫數據量。

水平切分會有一個patition key，通過patition key的查詢能夠直接定位到庫，但是非patition key上的查詢可能就需要掃描多個庫了。

此時常見的架構設計方案，是使用數據冗余這種反范式設計來滿足分庫后不同維度的查詢需求。

例如：訂單業務，對用戶和商家都有訂單查詢需求：

Order(oid, info_detail); 
T(buyer_id, seller_id, oid);

此時可以使用數據冗余來分別滿足buyer_id和seller_id上的查詢需求：

T1(buyer_id, seller_id, oid) 
T2(seller_id, buyer_id, oid)

同一個數據，冗余兩份，一份以buyer_id來分庫，滿足買家的查詢需求;一份以seller_id來分庫，滿足賣家的查詢需求。

如何實施數據的冗余，是今天將要討論的內容。

二、服務同步雙寫

顧名思義，由服務層同步寫冗余數據，如上圖1-4流程：

優點：

缺點：

如果系統對處理時間比較敏感，引出常用的第二種方案。

三、服務異步雙寫

數據的雙寫并不再由服務來完成，服務層異步發出一個消息，通過消息總線發送給一個專門的數據復制服務來寫入冗余數據，如上圖1-6流程：

優點：

缺點：

不管是服務同步雙寫，還是服務異步雙寫，服務都需要關注“冗余數據”帶來的復雜性。如果想解除“數據冗余”對系統的耦合，引出常用的第三種方案。

四、線下異步雙寫

為了屏蔽“冗余數據”對服務帶來的復雜性，數據的雙寫不再由服務層來完成，而是由線下的一個服務或者任務來完成，如上圖1-6流程：

優點：

缺點：

五、總結

互聯網數據量大的業務場景，常常:

【本文為51CTO專欄作者“58沈劍”原創稿件，轉載請聯系原作者】

責任編輯：趙寧寧來源： 51CTO專欄

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看