爬蟲架構(gòu) | 消息隊列應(yīng)用場景及ActiveMQ、RabbitMQ、RocketMQ、Kafka對比

前言:在之前的業(yè)務(wù)中,使用了Kafka和RabbitMQ兩種消息隊列,這篇文章來做一個總結(jié)。

消息隊列中間件是分布式系統(tǒng)中重要的組件,主要實(shí)現(xiàn)異步消息,應(yīng)用解耦,流量削峰及消息通訊等功能。
下面舉例說明在實(shí)際應(yīng)用中消息隊列是如何使用的。

一、消息隊列應(yīng)用場景

1.1、異步處理

以用戶注冊,并且需要注冊郵件和短信為例。
用戶注冊后,需要發(fā)送注冊郵件和注冊短信。傳統(tǒng)的做法有兩種:串行和并行方式。如下圖所示:

串行和并行方式

1)串行方式:將注冊信息寫入數(shù)據(jù)庫成功后,發(fā)送注冊郵件,再發(fā)送注冊短信。以上三個任務(wù)全部完成后,返回給客戶端。
2)并行方式:將注冊信息寫入數(shù)據(jù)庫成功后,發(fā)送注冊郵件的同時,發(fā)送注冊短信。以上三個任務(wù)完成后,返回給客戶端。與串行的差別是,并行的方式可以提高處理的時間。

假設(shè)三個業(yè)務(wù)節(jié)點(diǎn)每個使用50毫秒鐘,不考慮網(wǎng)絡(luò)等其他開銷,則串行方式的時間是150毫秒,并行的時間可能是100毫秒。

因?yàn)镃PU在單位時間內(nèi)處理的請求數(shù)是一定的,假設(shè)CPU1秒內(nèi)吞吐量是100次。則串行方式1秒內(nèi)CPU可處理的請求量是7次(1000ms/150ms),并行方式處理的請求量是10次(1000ms/100ms)

小結(jié):如以上案例描述,傳統(tǒng)的方式系統(tǒng)的性能(并發(fā)量,吞吐量,響應(yīng)時間)會有瓶頸。如何解決這個問題呢?

引入消息隊列,將不是必須的業(yè)務(wù)邏輯,異步處理。改造后的架構(gòu)如下:

引入消息隊列方式

按照以上約定,用戶的響應(yīng)時間相當(dāng)于是注冊信息寫入數(shù)據(jù)庫的時間,也就是50毫秒。注冊郵件,發(fā)送短信寫入消息隊列后,直接返回,因此寫入消息隊列的速度很快,基本可以忽略,因此用戶的響應(yīng)時間可能是50毫秒。因此架構(gòu)改變后,系統(tǒng)的吞吐量提高到每秒20 QPS。比串行提高了3倍,比并行提高了兩倍。

1.2、應(yīng)用解耦

以用戶下單購買業(yè)務(wù)為例。
用戶下單后,訂單系統(tǒng)需要通知庫存系統(tǒng)。傳統(tǒng)的做法是,訂單系統(tǒng)調(diào)用庫存系統(tǒng)的接口。如下圖

應(yīng)用耦和

傳統(tǒng)模式的缺點(diǎn):
1)假如庫存系統(tǒng)無法訪問,則訂單減庫存將失敗,從而導(dǎo)致訂單失敗。
2)訂單系統(tǒng)與庫存系統(tǒng)耦合。

如何解決以上問題呢?引入應(yīng)用消息隊列后的方案,如下圖:

應(yīng)用解耦

1)訂單系統(tǒng):用戶下單后,訂單系統(tǒng)完成持久化處理,將消息寫入消息隊列,返回用戶訂單下單成功。
2)庫存系統(tǒng):訂閱下單的消息,采用拉/推的方式,獲取下單信息,庫存系統(tǒng)根據(jù)下單信息,進(jìn)行庫存操作。

假如:在下單時庫存系統(tǒng)不能正常使用。也不影響正常下單,因?yàn)橄聠魏螅唵蜗到y(tǒng)寫入消息隊列就不再關(guān)心其他的后續(xù)操作了。實(shí)現(xiàn)訂單系統(tǒng)與庫存系統(tǒng)的應(yīng)用解耦。

1.3、流量削峰

流量削峰也是消息隊列中的常用場景,一般在秒殺或團(tuán)搶活動中使用廣泛。
秒殺活動,一般會因?yàn)榱髁窟^大,導(dǎo)致流量暴增,應(yīng)用掛掉。為解決這個問題,需要在應(yīng)用前端加入消息隊列。
1)可以控制活動的人數(shù)。
2)可以緩解短時間內(nèi)高流量壓垮應(yīng)用。

流量削峰

1)用戶的請求,服務(wù)器接收后,首先寫入消息隊列。假如消息隊列長度超過最大數(shù)量,則直接拋棄用戶請求或跳轉(zhuǎn)到錯誤頁面。
2)秒殺業(yè)務(wù)根據(jù)消息隊列中的請求信息,再做后續(xù)處理。

1.4、消息通訊

消息通訊是指,消息隊列一般都內(nèi)置了高效的通信機(jī)制,因此也可以用作消息通訊。比如實(shí)現(xiàn)點(diǎn)對點(diǎn)消息隊列,或者聊天室等。

消息通訊

以上實(shí)際是消息隊列的兩種消息模式,點(diǎn)對點(diǎn)或發(fā)布訂閱模式。

二、常用消息隊列(ActiveMQ、RabbitMQ、RocketMQ、Kafka)比較

  • 生產(chǎn)者消費(fèi)者模式(Producer-Consumer)
    ActiveMQ-支持,RabbitMQ-支持,RocketMQ-支持,Kafka-支持。
  • 發(fā)布訂閱模式(Publish-Subscribe)
    ActiveMQ-支持,RabbitMQ-支持,RocketMQ-支持,Kafka-支持。
  • 請求回應(yīng)模型(Request-Reply)
    ActiveMQ-支持,RabbitMQ-支持,RocketMQ-不支持,Kafka-不支持。
  • API完備性
    ActiveMQ-高,RabbitMQ-高,RocketMQ-高,Kafka-高。
  • 多語言支持
    ActiveMQ-支持,RabbitMQ-支持,RocketMQ-只支持JAVA,Kafka-支持。
  • 單機(jī)吞吐量
    ActiveMQ-萬級,RabbitMQ-萬級,RocketMQ-萬級,Kafka-十萬級。
  • 消息延遲
    ActiveMQ-無,RabbitMQ-微秒級,RocketMQ-毫秒級,Kafka-毫秒級。
  • 可用性
    ActiveMQ-高(主從),RabbitMQ-高(主從),RocketMQ-非常高(分布式),Kafka-非常高(分布式)。
  • 消息丟失
    ActiveMQ-低,RabbitMQ-低,RocketMQ-理論上不會丟失,Kafka-理論上不會丟失。
  • 文檔的完備性
    ActiveMQ-高,RabbitMQ-高,RocketMQ-高,Kafka-高。
  • 提供快速入門
    ActiveMQ-有,RabbitMQ-有,RocketMQ-有,Kafka-有。
  • 社區(qū)活躍度
    ActiveMQ-高,RabbitMQ-高,RocketMQ-中,Kafka-高。
  • 商業(yè)支持
    ActiveMQ-無,RabbitMQ-無,RocketMQ-阿里云,Kafka-阿里云。

總體來說:

  • ActiveMQ
    歷史悠久的開源項目,已經(jīng)在很多產(chǎn)品中得到應(yīng)用,實(shí)現(xiàn)了JMS1.1規(guī)范,可以和spring-jms輕松融合,實(shí)現(xiàn)了多種協(xié)議,不夠輕巧(源代碼比RocketMQ多),支持持久化到數(shù)據(jù)庫,對隊列數(shù)較多的情況支持不好。
  • RabbitMQ
    它比Kafka成熟,支持AMQP事務(wù)處理,在可靠性上,RabbitMQ超過Kafka,在性能方面超過ActiveMQ。
  • RocketMQ
    RocketMQ是阿里開源的消息中間件,目前在Apache孵化,使用純Java開發(fā),具有高吞吐量、高可用性、適合大規(guī)模分布式系統(tǒng)應(yīng)用的特點(diǎn)。RocketMQ思路起源于Kafka,但并不是簡單的復(fù)制,它對消息的可靠傳輸及事務(wù)性做了優(yōu)化,目前在阿里集團(tuán)被廣泛應(yīng)用于交易、充值、流計算、消息推送、日志流式處理、binglog分發(fā)等場景,支撐了阿里多次雙十一活動。
    因?yàn)槭前⒗飪?nèi)部從實(shí)踐到產(chǎn)品的產(chǎn)物,因此里面很多接口、API并不是很普遍適用。其可靠性毋庸置疑,而且與Kafka一脈相承(甚至更優(yōu)),性能強(qiáng)勁,支持海量堆積。
  • Kafka
    Kafka設(shè)計的初衷就是處理日志的,不支持AMQP事務(wù)處理,可以看做是一個日志系統(tǒng),針對性很強(qiáng),所以它并沒有具備一個成熟MQ應(yīng)該具備的特性。Kafka的性能(吞吐量、tps)比RabbitMQ要強(qiáng),如果用來做大數(shù)據(jù)量的快速處理是比RabbitMQ有優(yōu)勢的。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容