請(qǐng)務(wù)必講清楚你項(xiàng)目里使用的消息中間件（MQ），如何選擇的？

作者：架構(gòu)師公社 2020-07-03 08:53:35

在分布式系統(tǒng)中，要么是通過(guò) rest 調(diào)用，要么是通過(guò) dubbo 等 RPC 調(diào)用，但是有些場(chǎng)景需要解耦設(shè)計(jì)，不能直接調(diào)用。比如消息驅(qū)動(dòng)的系統(tǒng)中，消息發(fā)送者完成本地業(yè)務(wù)，發(fā)送消息，多平臺(tái)的消息消費(fèi)者服務(wù)需要收到推送的消息，然后繼續(xù)處理其他業(yè)務(wù)。

MQ 為什么在系統(tǒng)中使用?一定要在分布式系統(tǒng)中使用嗎?
MQ 有哪些中間件?他們有哪些特點(diǎn)?
MQ 給系統(tǒng)帶來(lái)好處的同時(shí)有沒(méi)有帶來(lái)什么問(wèn)題?如何解決?

[[332190]]

在阿里的面試中，面試官問(wèn)到關(guān)于 MQ 的幾個(gè)問(wèn)題：

你的項(xiàng)目中 MQ 的作用?

為什么選擇這款 MQ 作為消息中間件?

重復(fù)消費(fèi)怎么辦?

如何確保消息被消費(fèi)?

有遇到其他問(wèn)題嗎?

那么接下來(lái)帶著問(wèn)題先思考下，有好的想法可以在評(píng)論區(qū)留言，大家一起分享。

消息中間件在系統(tǒng)中的使用

MQ 在系統(tǒng)中到底有哪些作用呢?拋開(kāi)基本的消息發(fā)布訂閱不說(shuō)，還有以下幾點(diǎn)：

分布式系統(tǒng)解耦
不需要立即返回的業(yè)務(wù)異步處理
削峰填谷，不直接訪問(wèn)服務(wù)，緩解服務(wù)壓力，增加性能
日志記錄

分布式系統(tǒng)解耦

請(qǐng)務(wù)必講清楚你項(xiàng)目里使用的消息中間件（MQ），如何選擇的？

看這兩個(gè)架構(gòu)圖，第一種 BC 都直接依賴(lài) A 服務(wù)，那么如果 A 中的接口修改，BC 都要跟著做修改，耦合度高。第二種，通過(guò) MQ 來(lái)作為中間件收發(fā)消息，BC 只依賴(lài)收到的消息而不是具體的接口，這樣即使 A 服務(wù)修改或者增加其他服務(wù)，都只要訂閱MQ就行。

不要求實(shí)時(shí)的業(yè)務(wù)異步處理

用戶注冊(cè)業(yè)務(wù)流程為例：

用戶注冊(cè)入庫(kù)
用戶驗(yàn)證郵件發(fā)送
用戶驗(yàn)證短信發(fā)送

原來(lái)的系統(tǒng)設(shè)計(jì)，這樣的服務(wù)流程會(huì)串行處理，即先 1-2-3 ;但是這里可以思考下，如果單個(gè)服務(wù)單臺(tái)機(jī)器的情況下，注冊(cè)用戶特別多，系統(tǒng)能不能抗住?

這里假設(shè)各個(gè)階段的時(shí)間 1 = 50ms ， 2 = 50ms ， 3 = 50ms，那么一個(gè)請(qǐng)求下來(lái)就是 all = 150ms; 這里再假設(shè)，這個(gè)服務(wù)器 CPU = 1 ，且只能處理單線程，那么以這種單臺(tái)服務(wù)器單線程的 QPS 來(lái)算;QPS = 1000/150 ≈ 7

現(xiàn)在我要讓這個(gè) QPS * 3 提升三倍，這個(gè)時(shí)候引入 MQ 服務(wù)作為中間件

如圖可見(jiàn)，我在 A 服務(wù)用戶注冊(cè)完成后，就直接返回了，這個(gè)時(shí)候 MQ 用來(lái)發(fā)送異步處理消息，B，C 服務(wù)分別處理。

A 不用等待 B、C 的返回結(jié)果，這樣用戶體驗(yàn)就是只有 50ms 等待時(shí)間。而在郵件、短信這個(gè)階段，因?yàn)榫W(wǎng)絡(luò)延遲原因，用戶可以接受一定時(shí)間的等待。

削峰填谷

一般的服務(wù)，我們的請(qǐng)求訪問(wèn)到系統(tǒng)都是直接請(qǐng)求，這樣的模式在用戶訪問(wèn)量不大的情況下，問(wèn)題不是很大。但是如果用戶請(qǐng)求達(dá)到了一定的瓶頸或者產(chǎn)生了一些問(wèn)題，我們就需要考慮優(yōu)化我們的架構(gòu)設(shè)計(jì)，MQ 中間件正是解決辦法之一。

下面以秒殺系統(tǒng)為例分析問(wèn)題秒殺系統(tǒng)瞬間百萬(wàn)并發(fā)，怎么處理?一般秒殺系統(tǒng)會(huì)進(jìn)行請(qǐng)求過(guò)濾，無(wú)效、重復(fù)都會(huì)被過(guò)濾一遍，剩下的才真正進(jìn)入到秒殺服務(wù)、訂單服務(wù)。但即使這樣并發(fā)仍然很高，如果網(wǎng)關(guān)把全部請(qǐng)求都轉(zhuǎn)發(fā)到下游訂單服務(wù)，一樣會(huì)壓垮下游系統(tǒng)，造成服務(wù)不可用甚至雪崩。

真實(shí)的秒殺系統(tǒng)更復(fù)雜，包含 Nginx 、網(wǎng)關(guān)、注冊(cè)中心、redis 緩存、mysql 集群、消息隊(duì)列集群

解決方式就是將上游處理的較快的任務(wù)，加入到隊(duì)列處理，下游逐一消費(fèi)隊(duì)列，直到所有隊(duì)列消費(fèi)完成。假如秒殺服務(wù)處理請(qǐng)求數(shù)：1000/s，

下游訂單服務(wù)處理請(qǐng)求書(shū)：10/s，

為了不給下游訂單服務(wù)造成壓力，秒殺后的信息發(fā)送到隊(duì)列，訂單服務(wù)就可以從容淡定的每秒處理十個(gè)，而不是直接塞 1000 個(gè)請(qǐng)求

也不管人家愿意不愿意。

到這里，可以總結(jié)下秒殺系統(tǒng)的過(guò)濾方式：

頁(yè)面按鈕點(diǎn)擊一次置灰

每秒透過(guò)請(qǐng)求數(shù)限制，例如 100/s，可以使用 Nginx ，sentinel

過(guò)濾同一用戶的重復(fù)請(qǐng)求，通過(guò)用戶唯一標(biāo)識(shí)、商品信息，

通過(guò)消息隊(duì)列存儲(chǔ)成功的秒殺信息，下游訂單系統(tǒng)處理

日志

所有服務(wù)都將日志發(fā)送到 MQ 服務(wù)用來(lái)作為日志存儲(chǔ)。 MQ 作為中間件對(duì)日志進(jìn)行持久化、轉(zhuǎn)發(fā) 大數(shù)據(jù)服務(wù)對(duì) MQ 讀取和進(jìn)行日志分析

MQ 怎么選

有人上來(lái)就是一通性能比較，然后說(shuō) RabbitMQ 是世界上最好的 MQ…

你把挑選 MQ 比作挑老婆吧，上來(lái)就要全套，膚白貌美、前凸后翹、性感火辣、勤勞能干。。。真是缺乏社會(huì)的教育啊，兄弟養(yǎng)得起嗎?動(dòng)不動(dòng)一套保養(yǎng)套餐，1W/月守得住嗎?隔壁老王經(jīng)常來(lái)你家吃飯吧，瘋狂腦補(bǔ)。。。吃的消嗎?紅棗+枸杞+腎寶片，怕是心有余力不足吧

言歸正傳，其實(shí)我覺(jué)得這是一個(gè)思考題，首先我們要看的應(yīng)該是條件是哪些?

1. 用途?是用來(lái)做日志、解耦、還是異步處理

2. 公司情況?人員是否充足，現(xiàn)有人員技術(shù)棧情況，人員的技術(shù)棧實(shí)力

3. 項(xiàng)目情況?項(xiàng)目周期，人員，用戶量，架構(gòu)設(shè)計(jì)，是否老項(xiàng)目

4. 主流 MQ 現(xiàn)狀?穩(wěn)定可靠度，社區(qū)活躍度，文檔全面性，云服務(wù)支持情況

上圖的例子日志消息就是使用的 kafka，為什么是kafka? Kafka是LinkedIn開(kāi)源的分布式發(fā)布-訂閱消息系統(tǒng)，屬于 Apache 頂級(jí)項(xiàng)目，社區(qū)活躍。

Kafka主要特點(diǎn)是基于Pull的模式來(lái)處理消息消費(fèi)，追求高吞吐量，一開(kāi)始的目的就是用于日志收集和傳輸。后來(lái)版本開(kāi)始支持復(fù)制，不支持事務(wù)，對(duì)消息的重復(fù)、丟失、錯(cuò)誤沒(méi)有嚴(yán)格要求，適合產(chǎn)生大量數(shù)據(jù)的互聯(lián)網(wǎng)服務(wù)的數(shù)據(jù)收集業(yè)務(wù)。但是 kafka 相對(duì)來(lái)說(shuō)很重，需要依賴(lài) zookeeper，大公司里使用沒(méi)問(wèn)題，也少不了專(zhuān)人維護(hù)。

RocketMQ 是阿里開(kāi)源的一套可靠消息系統(tǒng)，已經(jīng)捐贈(zèng) Apache 成為頂級(jí)項(xiàng)目。剛開(kāi)始定位于非日志的可靠消息傳輸，其實(shí)在日志處理方面性能也不錯(cuò)。

目前支持的客戶端包括 java，c++，GO ，社區(qū)比較活躍，文檔還算全面。但是涉及到核心的要修改還是有難度的，畢竟阿里云靠賣(mài)這個(gè)服務(wù)賺錢(qián)呢。

所以如果公司實(shí)力不自信還是慎重選擇吧，實(shí)在不行可以直接購(gòu)買(mǎi)云服務(wù)，省心省力，還是那句話，看實(shí)際情況。

主流 MQ 的特點(diǎn) 下圖是來(lái)源網(wǎng)絡(luò)的圖片，部分描述已經(jīng)過(guò)時(shí)，但是基本不差，僅供參考：

如何確保消息不被重復(fù)消費(fèi)

這里簡(jiǎn)單說(shuō)說(shuō)，后面專(zhuān)門(mén)針對(duì)這個(gè)問(wèn)題進(jìn)行書(shū)寫(xiě)招供。大致就是一些特殊原因例如網(wǎng)絡(luò)原因，服務(wù)重啟造成消息消費(fèi)未被記錄，造成重復(fù)消費(fèi)的可能。一般的處理方式就是保證接口設(shè)計(jì)的冪等性，主旨通過(guò)唯一標(biāo)識(shí)判斷是否存在。

1. redis 緩存使用，唯一性 token 保存redis，每次消費(fèi)后刪除 token

2. 唯一主鍵判斷，數(shù)據(jù)庫(kù)判斷是否存在該主鍵記錄，存在則更新，不存在則插入

責(zé)任編輯：武曉燕來(lái)源：今日頭條