成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

終于弄明白了 RocketMQ 的存儲模型

存儲 存儲架構
充分考慮業務的查詢場景,支持消息 key ,消息 offsetMsgId 查詢消息數據。也支持消費者通過 tag 來訂閱主題下的不同消息,提升了消費者的靈活性。

RocketMQ 優異的性能表現,必然繞不開其優秀的存儲模型 。

這篇文章,筆者按照自己的理解 , 嘗試分析 RocketMQ 的存儲模型,希望對大家有所啟發。

圖片

一、整體概覽

首先溫習下 RocketMQ 架構。

圖片

整體架構中包含四種角色 :

  • Producer :消息發布的角色,Producer 通過 MQ 的負載均衡模塊選擇相應的 Broker 集群隊列進行消息投遞,投遞的過程支持快速失敗并且低延遲。
  • Consumer :消息消費的角色,支持以 push 推,pull 拉兩種模式對消息進行消費。
  • NameServer :名字服務是一個非常簡單的 Topic 路由注冊中心,其角色類似 Dubbo 中的 zookeeper ,支持 Broker 的動態注冊與發現。
  • BrokerServer :Broker 主要負責消息的存儲、投遞和查詢以及服務高可用保證 。

本文的重點在于分析 BrokerServer 的消息存儲模型。我們先進入 broker 的文件存儲目錄 。

圖片

消息存儲和下面三個文件關系非常緊密:

  1. 數據文件 commitlog
    消息主體以及元數據的存儲主體 ;
  2. 消費文件 consumequeue
    消息消費隊列,引入的目的主要是提高消息消費的性能 ;
  3. 索引文件 indexfile
    索引文件,提供了一種可以通過 key 或時間區間來查詢消息。

RocketMQ 采用的是混合型的存儲結構,Broker 單個實例下所有的隊列共用一個數據文件(commitlog)來存儲。

生產者發送消息至 Broker 端,然后 Broker 端使用同步或者異步的方式對消息刷盤持久化,保存至 commitlog 文件中。只要消息被刷盤持久化至磁盤文件 commitlog 中,那么生產者發送的消息就不會丟失。

Broker 端的后臺服務線程會不停地分發請求并異步構建 consumequeue(消費文件)和 indexfile(索引文件)。

二、數據文件

RocketMQ 的消息數據都會寫入到數據文件中, 我們稱之為 commitlog 。

所有的消息都會順序寫入數據文件,當文件寫滿了,會寫入下一個文件。

圖片

如上圖所示,單個文件大小默認 1G , 文件名長度為 20 位,左邊補零,剩余為起始偏移量,比如 00000000000000000000 代表了第一個文件,起始偏移量為 0 ,文件大小為1 G = 1073741824。

當第一個文件寫滿了,第二個文件為 00000000001073741824,起始偏移量為 1073741824,以此類推。

圖片

從上圖中,我們可以看到消息是一條一條寫入到文件,每條消息的格式是固定的。

這樣設計有三點優勢:

  1. 順序寫

磁盤的存取速度相對內存來講并不快,一次磁盤 IO 的耗時主要取決于:尋道時間和盤片旋轉時間,提高磁盤 IO 性能最有效的方法就是:減少隨機 IO,增加順序 IO 。

圖片

對比隨機和順序讀寫在內存和磁盤中的表現

《 The Pathologies of Big Data 》這篇文章指出:內存隨機讀寫的速度遠遠低于磁盤順序讀寫的速度。磁盤順序寫入速度可以達到幾百兆/s,而隨機寫入速度只有幾百 KB /s,相差上千倍。

2.快速定位

因為消息是一條一條寫入到 commitlog 文件 ,寫入完成后,我們可以得到這條消息的物理偏移量。

每條消息的物理偏移量是唯一的, commitlog 文件名是遞增的,可以根據消息的物理偏移量通過二分查找,定位消息位于那個文件中,并獲取到消息實體數據。

3.通過消息 offsetMsgId 查詢消息數據

圖片

  1. 消息 offsetMsgId 是由 Broker 服務端在寫入消息時生成的 ,該消息編號包含兩個部分:
  • Broker 服務端 ip + port  8個字節;
  • commitlog 物理偏移量 8個字節 。

我們可以通過消息 offsetMsgId ,定位到 Broker 的 ip 地址 + 端口 ,傳遞物理偏移量參數 ,即可定位該消息實體數據。

三、消費文件

在介紹 consumequeue 文件之前, 我們先溫習下消息隊列的傳輸模型-發布訂閱模型 , 這也是 RocketMQ 當前的傳輸模型。

圖片

發布訂閱模型具有如下特點:

  • 消費獨立:相比隊列模型的匿名消費方式,發布訂閱模型中消費方都會具備的身份,一般叫做訂閱組(訂閱關系),不同訂閱組之間相互獨立不會相互影響。
  • 一對多通信:基于獨立身份的設計,同一個主題內的消息可以被多個訂閱組處理,每個訂閱組都可以拿到全量消息。因此發布訂閱模型可以實現一對多通信。

因此,rocketmq 的文件設計必須滿足發布訂閱模型的需求。

那么僅僅 commitlog 文件是否可以滿足需求嗎 ?

假如有一個 consumerGroup 消費者,訂閱主題 my-mac-topic ,因為 commitlog 包含所有的消息數據,查詢該主題下的消息數據,需要遍歷數據文件 commitlog , 這樣的效率是極其低下的。

進入 rocketmq 存儲目錄,顯示見下圖:

圖片

  1. 消費文件按照主題存儲,每個主題下有不同的隊列,圖中 my-mac-topic 有 16 個隊列 ;
  2. 每個隊列目錄下 ,存儲 consumequeue 文件,每個 consumequeue 文件也是順序寫入,數據格式見下圖。

圖片

每個 consumequeue 包含 30 萬個條目,每個條目大小是 20 個字節,每個文件的大小是 30 萬 * 20 = 60萬字節,每個文件大小約5.72M 。和 commitlog 文件類似,consumequeue 文件的名稱也是以偏移量來命名的,可以通過消息的邏輯偏移量定位消息位于哪一個文件里。

消費文件按照主題-隊列來保存 ,這種方式特別適配發布訂閱模型

消費者從 broker 獲取訂閱消息數據時,不用遍歷整個 commitlog 文件,只需要根據邏輯偏移量從 consumequeue 文件查詢消息偏移量 ,  最后通過定位到 commitlog 文件, 獲取真正的消息數據。

這樣就可以簡化消費查詢邏輯,同時因為同一主題下,消費者可以訂閱不同的隊列或者 tag ,同時提高了系統的可擴展性。

四、索引文件

每個消息在業務層面的唯一標識碼要設置到 keys 字段,方便將來定位消息丟失問題。服務器會為每個消息創建索引(哈希索引),應用可以通過 topic、key 來查詢這條消息內容,以及消息被誰消費。

由于是哈希索引,請務必保證key盡可能唯一,這樣可以避免潛在的哈希沖突。

//訂單Id   
String orderId = "1234567890";
message.setKeys(orderId);

從開源的控制臺中根據主題和 key 查詢消息列表:

圖片

進入索引文件目錄 ,如下圖所以:

圖片

索引文件名 fileName 是以創建時的時間戳命名的,固定的單個 IndexFile 文件大小約為 400 M 。

IndexFile 的文件邏輯結構類似于 JDK 的 HashMap 的數組加鏈表結構。

圖片

HashMap數據結構

索引文件主要由 Header、Slot Table (默認 500 萬個條目)、Index Linked List(默認最多包含 2000萬個條目)三部分組成 。

圖片

假如訂單系統發送兩條消息 A 和 B , 他們的 key 都是 "1234567890" ,我們依次存儲消息 A  ,  消息 B 。

因為這兩個消息的 key 的 hash 值相同,它們對應的哈希槽(深黃色)也會相同,哈希槽會保存的最新的消息 B 的索引條目序號 , 序號值是 4 ,也就是第二個深綠色條目。

而消息 B 的索引條目信息的最后 4 個字節會保存上一條消息對應的索引條目序號,索引序號值是 3  , 也就是消息 A 。

五、寫到最后

Databases are specializing – the “one size fits all” approach no longer applies ------ MongoDB設計哲學

RocketMQ 存儲模型設計得非常精巧,筆者覺得每種設計都有其底層思考,這里總結了三點 :

  1. 完美適配消息隊列發布訂閱模型 ;
  2. 數據文件,消費文件,索引文件各司其職 ,同時以數據文件為核心,異步構建消費文件 + 索引文件這種模式非常容易擴展到主從復制的架構;
  3. 充分考慮業務的查詢場景,支持消息 key ,消息 offsetMsgId 查詢消息數據。也支持消費者通過 tag 來訂閱主題下的不同消息,提升了消費者的靈活性。
責任編輯:武曉燕 來源: 勇哥java實戰分享
相關推薦

2021-07-26 05:00:16

算法DfsBfs

2022-03-27 20:32:28

Knative容器事件模型

2021-10-09 00:02:04

DevOps敏捷開發

2021-06-13 12:03:46

SaaS軟件即服務

2021-09-26 15:58:05

MySQL SQL 語句數據庫

2022-05-01 22:09:27

數據模型大數據

2021-10-17 20:38:30

微服務內存組件

2021-12-03 18:25:56

數據指標本質

2021-03-25 11:24:25

爬蟲技術開發

2020-11-03 07:04:39

云計算公有云私有云

2021-08-31 19:14:38

技術埋點運營

2022-04-27 18:25:02

數據采集維度

2021-10-12 18:31:40

流量運營前端

2021-09-03 18:38:13

數據湖數據倉庫

2021-06-29 11:21:41

數據安全網絡安全黑客

2022-07-31 20:29:28

日志系統

2020-11-30 08:34:44

大數據數據分析技術

2022-01-05 18:27:44

數據挖掘工具

2021-03-03 21:31:24

量化投資利潤

2021-02-14 00:21:37

區塊鏈數字貨幣金融
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99久久婷婷国产精品综合 | 99热播精品 | 亚洲成a| 三区在线 | 欧美jizzhd精品欧美巨大免费 | 91精品国产综合久久久久久丝袜 | 亚洲高清一区二区三区 | 日韩成人在线视频 | 亚洲国产高清高潮精品美女 | 国产中文字幕在线 | 97国产精品视频 | 国产一区二区三区四区五区加勒比 | 欧美成人精品一区二区三区 | 国产一区二区自拍 | 在线视频一区二区三区 | 久久久免费少妇高潮毛片 | 超碰最新在线 | 91亚洲免费| 一级看片| 一区二区三区av | 在线日韩欧美 | 激情婷婷 | 狠狠干天天干 | 亚洲国产高清免费 | 国产精品久久久久久久久久了 | 国产丝袜一区二区三区免费视频 | 午夜免费网站 | 欧美做暖暖视频 | 久久久久香蕉视频 | 久久久久久久久久一区 | 日韩精品一区二区三区久久 | 国产一区中文 | 美女一级毛片 | 欧美日韩精品一区二区 | 欧美精品一区二区三区在线播放 | 国产成人在线一区二区 | 成人高清视频在线观看 | 久久av一区二区三区 | 中文字幕欧美日韩 | 午夜精品一区二区三区在线视 | 青青草精品 |