面試官：系統有萬億條消息怎么存儲？

作者：李華 2023-12-26 09:34:47

2015 年，Discord 的第一個版本建立在單個 MongoDB 之上。2015 年 11 月左右，MongoDB 存儲了 1 億條消息，其內存無法再容納數據和索引。延遲變得不可預測。消息存儲需要轉移到另一個數據庫。這時 Cassandra 被選中。

我們如何設計一個能存儲數萬億條信息的系統?

Discord 的消息存儲演進給我們提供了真實案例參考。

下圖顯示了 Discord 消息存儲的演變過程：MongoDB -> Cassandra -> ScyllaDB

圖片

第一階段

2017 年，Discord 擁有 12 個 Cassandra 節點，存儲了數十億條消息。

2022 年初，Discord 擁有 177 個 Cassandra 節點，存儲了數萬億條消息。此時，延遲再次變得難以預測，維護的成本也變得過于昂貴。

造成這一問題有幾個原因：

這時，Discord 重新設計了消息存儲的架構：

新架構的優勢在于：

為了進一步保護 ScyllaDB，Discord 針對數據服務還做了以下優化：

優化后的系統性能大大提高：

該系統可輕松應對世界杯流量高峰。

本文參考 Discord blog。

責任編輯：武曉燕來源： ByteByteGo