成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Kafka原理篇:圖解kakfa架構(gòu)原理

開發(fā) 架構(gòu) Kafka
決定圖解 Kakfa,卻讓很多半懂不懂的同學(xué)可以加深對 Kafka 實(shí)現(xiàn)原理的理解。

 我想很多同學(xué)之前可能已經(jīng)看過很多 Kafka 原理相關(guān)的文章,但往往看時"牛逼"聲連連,激情滿滿,總覺得自己又學(xué)習(xí)到了各種“吊炸天”的技術(shù)。但很多同學(xué)往往是不覺明厲,把文章結(jié)合面試題背一背還能應(yīng)付一下半吊子面試官。可以遇到老司機(jī)面試官,或是進(jìn)入實(shí)戰(zhàn),卻對很多概念和實(shí)現(xiàn)摸棱兩可。

所以,決定圖解 Kakfa,卻讓很多半懂不懂的同學(xué)可以加深對 Kafka 實(shí)現(xiàn)原理的理解。

同時建議讀者同學(xué)結(jié)合 Kafka 的配置去了解 Kafka 的實(shí)現(xiàn)原理,Kafka 有大量的配置,這也是 Kafka 高度擴(kuò)展的一個表現(xiàn),很多同學(xué)對 Kafka 的配置也不敢輕易改動。所以理解這些配置背后的實(shí)現(xiàn)原理,可以讓我們在實(shí)踐中懂得如何使用和優(yōu)化 Kafka。既可面試造火箭,也可以實(shí)戰(zhàn)造火箭。

Kafka 配置說明鏈接:https://kafka.apache.org/documentation

下面是本文的主要的內(nèi)容:

由于內(nèi)容太多,怕步子邁太大扯著蛋,決定將文章分成三篇。此文只會涉及上面圖中"橙色"的部分。

從本文你將學(xué)習(xí)到:

  •  Kafka 架構(gòu)設(shè)計哲學(xué)和原理
  •  Kafka 中 zookeeper 的作用
  •  Kafka Controller 實(shí)現(xiàn)原理
  •  Kafka Network 原理 

開篇寄語

盡可能做一些產(chǎn)品出來,有一個作品很重要,這是別人了解你的窗口。如果可能,給自己開一個公眾號或者一個博客,記錄自己每天的見聞思考。剛開始記會很凌亂沒有邏輯,但堅持下去一定會有很大價值。 

Architecture

理解 Kafka 架構(gòu),就是理解 Kafka 的各種組件的概念,以及這些組件的關(guān)系。先簡單看一下各組件及其簡單說明。

不要去嘗試記憶他們

Producer: 生產(chǎn)者,發(fā)送消息的一方。生產(chǎn)者負(fù)責(zé)創(chuàng)建消息,然后將其發(fā)送到 Kafka。

Consumer: 消費(fèi)者,接受消息的一方。消費(fèi)者連接到 Kafka 上并接收消息,進(jìn)而進(jìn)行相應(yīng)的業(yè)務(wù)邏輯處理。

Consumer Group: 一個消費(fèi)者組可以包含一個或多個消費(fèi)者。使用多分區(qū) + 多消費(fèi)者方式可以極大提高數(shù)據(jù)下游的處理速度,同一消費(fèi)組中的消費(fèi)者不會重復(fù)消費(fèi)消息,同樣的,不同消費(fèi)組中的消費(fèi)者消息消息時互不影響。Kafka 就是通過消費(fèi)組的方式來實(shí)現(xiàn)消息 P2P 模式和廣播模式。

Broker: 服務(wù)代理節(jié)點(diǎn)。Broker 是 Kafka 的服務(wù)節(jié)點(diǎn),即 Kafka 的服務(wù)器。

Topic: Kafka 中的消息以 Topic 為單位進(jìn)行劃分,生產(chǎn)者將消息發(fā)送到特定的 Topic,而消費(fèi)者負(fù)責(zé)訂閱 Topic 的消息并進(jìn)行消費(fèi)。

Partition: Topic 是一個邏輯的概念,它可以細(xì)分為多個分區(qū),每個分區(qū)只屬于單個主題。同一個主題下不同分區(qū)包含的消息是不同的,分區(qū)在存儲層面可以看作一個可追加的日志(Log)文件,消息在被追加到分區(qū)日志文件的時候都會分配一個特定的偏移量(offset)。

Offset: offset 是消息在分區(qū)中的唯一標(biāo)識,Kafka 通過它來保證消息在分區(qū)內(nèi)的順序性,不過 offset 并不跨越分區(qū),也就是說,Kafka 保證的是分區(qū)有序性而不是主題有序性。

Replication: 副本,是 Kafka 保證數(shù)據(jù)高可用的方式,Kafka 同一 Partition 的數(shù)據(jù)可以在多 Broker 上存在多個副本,通常只有主副本對外提供讀寫服務(wù),當(dāng)主副本所在 broker 崩潰或發(fā)生網(wǎng)絡(luò)異常,Kafka 會在 Controller 的管理下會重新選擇新的 Leader 副本對外提供讀寫服務(wù)。

Record: 實(shí)際寫入 Kafka 中并可以被讀取的消息記錄。每個 record 包含了 key、value 和 timestamp。

我們理解了也就自然記住了

我們應(yīng)該通過理解的方式去記憶它們。

生產(chǎn)者-消費(fèi)者

生產(chǎn)者-消費(fèi)者是一種設(shè)計模式,生產(chǎn)者和消費(fèi)者之間通過添加一個中間組件來達(dá)到解耦。生產(chǎn)者向中間組件生成數(shù)據(jù),消費(fèi)者消費(fèi)數(shù)據(jù)。

就像 65 哥讀書時給小芳寫情書,這里 65 哥就是生產(chǎn)者,情書就是消息,小芳就是消費(fèi)者。但有時候小芳不在,或者比較忙,65 哥也比較害羞,不敢直接將情書塞小芳手里,于是將情書塞在小芳抽屜中。所以抽屜就是這個中間組件。

在程序中我們通常使用Queue來作為這個中間組件。可以使用多線程向隊(duì)列中寫入數(shù)據(jù),另外的消費(fèi)者線程依次讀取隊(duì)列中的數(shù)據(jù)進(jìn)行消費(fèi)。模型如下圖所示:

生產(chǎn)者-消費(fèi)者模式通過添加一個中間層,不僅可以解耦生產(chǎn)者和消費(fèi)者,使其易于擴(kuò)展,還可以異步化調(diào)用、緩沖消息等。

分布式隊(duì)列

后來 65 哥和小芳異地了,65 哥在卷都奮斗,小芳在魔都逛街。于是只能通過郵局寄曖昧信了。這樣 65 哥、郵局和小芳就成了分布式的了。65 哥將信件發(fā)給郵局,小芳從郵局拿到 65 哥寫的信,再回去慢慢看。

Kafka 的消息生產(chǎn)者就是Producer,上游消費(fèi)者進(jìn)程添加 Kafka Client 創(chuàng)建 Kafka Producer,向 Broker 發(fā)送消息,Broker 是集群部署在遠(yuǎn)程服務(wù)器上的 Kafka Server 進(jìn)程,下游消費(fèi)者進(jìn)程引入 Kafka Consumer API 持續(xù)消費(fèi)隊(duì)列中消息。

因?yàn)?Kafka Consumer 使用 Poll 的模式,需要 Consumer 主動拉去消息。所有小芳只能定期去郵局拿信件了(呃,果然主動權(quán)都在小芳手上啊)。

主題

郵局不能只為 65 哥服務(wù),雖然 65 哥一天寫好幾封信。但也無法挽回郵局的損失。所以郵局是可以供任何人寄信。只需要寄信人寫好地址(主題),郵局建有兩地的通道就可以發(fā)收信件了。

Kafka 的 Topic 才相當(dāng)于一個隊(duì)列,Broker 是所有隊(duì)列部署的機(jī)器。可以按業(yè)務(wù)創(chuàng)建不同的 Topic,Producer 向所屬業(yè)務(wù)的 Topic 發(fā)送消息,相應(yīng)的 Consumer 可以消費(fèi)并處理消息。

分區(qū)

由于 65 哥寫的信太多,一個郵局已經(jīng)無法滿足 65 哥的需求,郵政公司只能多建幾個郵局了,65 哥將信件按私密度分類(分區(qū)策略),從不同的郵局寄送。

同一個 Topic 可以創(chuàng)建多個分區(qū)。理論上分區(qū)越多并發(fā)度越高,Kafka 會根據(jù)分區(qū)策略將分區(qū)盡可能均衡的分布在不同的 Broker 節(jié)點(diǎn)上,以避免消息傾斜,不同的 Broker 負(fù)載差異太大。分區(qū)也不是越多越好哦,畢竟太多郵政公司也管理不過來。

副本

為防止由于郵局的問題,比如交通斷啦,郵車沒油啦。導(dǎo)致 65 哥的曖昧信無法寄到小芳手上,使得 65 哥晚上遠(yuǎn)程跪鍵盤。郵局決定將 65 哥的信件復(fù)制幾份發(fā)到多個正常的郵局,這樣只要有一個郵局還在,小芳就可以收到 65 哥的信了。

Kafka 采用分區(qū)副本的方式來保證數(shù)據(jù)的高可用,每個分區(qū)都將建立指定數(shù)量的副本數(shù),kakfa 保證同一分區(qū)副本盡量分布在不同的 Broker 節(jié)點(diǎn)上,以防止 Broker 宕機(jī)導(dǎo)致所有副本不可用。Kafka 會為分區(qū)的多個副本選舉一個作為主副本(Leader),主副本對外提供讀寫服務(wù),從副本(Follower)實(shí)時同步 Leader 的數(shù)據(jù)。

多消費(fèi)者

哎,65 哥的信件滿天飛,小芳天天跑郵局,還要一一拆開看,65 哥寫的信又臭又長,讓小芳忙得滿身大漢大汗。于是小芳啪的一下,很快啊,變出多個分身去不同的郵局取信,這樣小芳終于可以擠出額外的時間逛街了。

廣播消息

郵局最近提供了定制明信片業(yè)務(wù),每個人都可以設(shè)計明信片,同一個身份只能領(lǐng)取一種明信片。65 哥設(shè)計了一堆,廣播給所有漂亮的小妹妹都可以來領(lǐng)取,美女啪變出的分身也可以來領(lǐng)取,但是同一個身份的多個分身只能取一種明信片。

Kafka 通過 Consumer Group 來實(shí)現(xiàn)廣播模式消息訂閱,即不同 group 下的 consumer 可以重復(fù)消費(fèi)消息,相互不影響,同一個 group 下的 consumer 構(gòu)成一個整體。

最后我們完成了 Kafka 的整體架構(gòu),如下:

 

Zookeeper

Zookeeper 是一個成熟的分布式協(xié)調(diào)服務(wù),它可以為分布式服務(wù)提供分布式配置服、同步服務(wù)和命名注冊等能力.。對于任何分布式系統(tǒng),都需要一種協(xié)調(diào)任務(wù)的方法。Kafka 是使用 ZooKeeper 而構(gòu)建的分布式系統(tǒng)。但是也有一些其他技術(shù)(例如 Elasticsearch 和 MongoDB)具有其自己的內(nèi)置任務(wù)協(xié)調(diào)機(jī)制。

Kafka 將 Broker、Topic 和 Partition 的元數(shù)據(jù)信息存儲在 Zookeeper 上。通過在 Zookeeper 上建立相應(yīng)的數(shù)據(jù)節(jié)點(diǎn),并監(jiān)聽節(jié)點(diǎn)的變化,Kafka 使用 Zookeeper 完成以下功能:

  •  Kafka Controller 的 Leader 選舉
  •  Kafka 集群成員管理
  •  Topic 配置管理
  •  分區(qū)副本管理

我們看一看 Zookeeper 下 Kafka 創(chuàng)建的節(jié)點(diǎn),即可一目了然的看出這些相關(guān)的功能。

 

Controller

Controller 是從 Broker 中選舉出來的,負(fù)責(zé)分區(qū) Leader 和 Follower 的管理。當(dāng)某個分區(qū)的 leader 副本發(fā)生故障時,由 Controller 負(fù)責(zé)為該分區(qū)選舉新的 leader 副本。當(dāng)檢測到某個分區(qū)的 ISR(In-Sync Replica)集合發(fā)生變化時,由控制器負(fù)責(zé)通知所有 broker 更新其元數(shù)據(jù)信息。當(dāng)使用kafka-topics.sh腳本為某個 topic 增加分區(qū)數(shù)量時,同樣還是由控制器負(fù)責(zé)分區(qū)的重新分配。

Kafka 中 Contorller 的選舉的工作依賴于 Zookeeper,成功競選為控制器的 broker 會在 Zookeeper 中創(chuàng)建/controller這個臨時(EPHEMERAL)節(jié)點(diǎn)。

選舉過程

Broker 啟動的時候嘗試去讀取/controller節(jié)點(diǎn)的brokerid的值,如果brokerid的值不等于-1,則表明已經(jīng)有其他的 Broker 成功成為 Controller 節(jié)點(diǎn),當(dāng)前 Broker 主動放棄競選;如果不存在/controller節(jié)點(diǎn),或者 brokerid 數(shù)值異常,當(dāng)前 Broker 嘗試去創(chuàng)建/controller這個節(jié)點(diǎn),此時也有可能其他 broker 同時去嘗試創(chuàng)建這個節(jié)點(diǎn),只有創(chuàng)建成功的那個 broker 才會成為控制器,而創(chuàng)建失敗的 broker 則表示競選失敗。每個 broker 都會在內(nèi)存中保存當(dāng)前控制器的 brokerid 值,這個值可以標(biāo)識為 activeControllerId。

實(shí)現(xiàn)

Controller 讀取 Zookeeper 中的節(jié)點(diǎn)數(shù)據(jù),初始化上下文(Controller Context),并管理節(jié)點(diǎn)變化,變更上下文,同時也需要將這些變更信息同步到其他普通的 broker 節(jié)點(diǎn)中。Controller 通過定時任務(wù),或者監(jiān)聽器模式獲取 zookeeper 信息,事件監(jiān)聽會更新更新上下文信息,如圖所示,Controller 內(nèi)部也采用生產(chǎn)者-消費(fèi)者實(shí)現(xiàn)模式,Controller 將 zookeeper 的變動通過事件的方式發(fā)送給事件隊(duì)列,隊(duì)列就是一個LinkedBlockingQueue,事件消費(fèi)者線程組通過消費(fèi)消費(fèi)事件,將相應(yīng)的事件同步到各 Broker 節(jié)點(diǎn)。這種隊(duì)列 FIFO 的模式保證了消息的有序性。

職責(zé)

Controller 被選舉出來,作為整個 Broker 集群的管理者,管理所有的集群信息和元數(shù)據(jù)信息。它的職責(zé)包括下面幾部分:

  1.   處理 Broker 節(jié)點(diǎn)的上線和下線,包括自然下線、宕機(jī)和網(wǎng)絡(luò)不可達(dá)導(dǎo)致的集群變動,Controller 需要及時更新集群元數(shù)據(jù),并將集群變化通知到所有的 Broker 集群節(jié)點(diǎn);
  2.   創(chuàng)建 Topic 或者 Topic 擴(kuò)容分區(qū),Controller 需要負(fù)責(zé)分區(qū)副本的分配工作,并主導(dǎo) Topic 分區(qū)副本的 Leader 選舉。
  3.   管理集群中所有的副本和分區(qū)的狀態(tài)機(jī),監(jiān)聽狀態(tài)機(jī)變化事件,并作出相應(yīng)的處理。Kafka 分區(qū)和副本數(shù)據(jù)采用狀態(tài)機(jī)的方式管理,分區(qū)和副本的變化都在狀態(tài)機(jī)內(nèi)會引起狀態(tài)機(jī)狀態(tài)的變更,從而觸發(fā)相應(yīng)的變化事件。

    “    65 哥:狀態(tài)機(jī)啊,聽起來好復(fù)雜。    ”

Controller 管理著集群中所有副本和分區(qū)的狀態(tài)機(jī)。大家不要被狀態(tài)機(jī)這個詞唬住了。理解狀態(tài)機(jī)很簡單。先理解模型,即這是什么關(guān)于什么模型,然后就是模型的狀態(tài)有哪些,模型狀態(tài)之間如何轉(zhuǎn)換,轉(zhuǎn)換時發(fā)送相應(yīng)的變化事件。

Kafka 的分區(qū)和副本狀態(tài)機(jī)很簡單。我們先理解,這分別是管理 Kafka Topic 的分區(qū)和副本的。它們的狀態(tài)也很簡單,就是 CRUD,具體說來如下:

分區(qū)狀態(tài)機(jī)

PartitionStateChange,管理 Topic 的分區(qū),它有以下 4 種狀態(tài):

  1.   NonExistentPartition:該狀態(tài)表示分區(qū)沒有被創(chuàng)建過或創(chuàng)建后被刪除了。
  2.   NewPartition:分區(qū)剛創(chuàng)建后,處于這個狀態(tài)。此狀態(tài)下分區(qū)已經(jīng)分配了副本,但是還沒有選舉 leader,也沒有 ISR 列表。
  3.   OnlinePartition:一旦這個分區(qū)的 leader 被選舉出來,將處于這個狀態(tài)。
  4.   OfflinePartition:當(dāng)分區(qū)的 leader 宕機(jī),轉(zhuǎn)移到這個狀態(tài)。

我們用一張圖來直觀的看看這些狀態(tài)是如何變化的,以及在狀態(tài)發(fā)生變化時 Controller 都有哪些操作:

 

副本狀態(tài)機(jī)

ReplicaStateChange,副本狀態(tài),管理分區(qū)副本信息,它也有 4 種狀態(tài):

  1.  NewReplica: 創(chuàng)建 topic 和分區(qū)分配后創(chuàng)建 replicas,此時,replica 只能獲取到成為 follower 狀態(tài)變化請求。
  2.  OnlineReplica: 當(dāng) replica 成為 parition 的 assingned replicas 時,其狀態(tài)變?yōu)?OnlineReplica, 即一個有效的 OnlineReplica。
  3.  OfflineReplica: 當(dāng)一個 replica 下線,進(jìn)入此狀態(tài),這一般發(fā)生在 broker 宕機(jī)的情況下;
  4.  NonExistentReplica: Replica 成功刪除后,replica 進(jìn)入 NonExistentReplica 狀態(tài)。

副本狀態(tài)間的變化如下圖所示,Controller 在狀態(tài)變化時會做出相應(yīng)的操作:

 

Network

Kafka 的網(wǎng)絡(luò)通信模型是基于 NIO 的 Reactor 多線程模型來設(shè)計的。其中包含了一個Acceptor線程,用于處理新的連接,Acceptor 有 N 個 Processor 線程 select 和 read socket 請求,N 個 Handler 線程處理請求并相應(yīng),即處理業(yè)務(wù)邏輯。下面就是 KafkaServer 的模型圖:

 

 

責(zé)任編輯:龐桂玉 來源: Hollis
相關(guān)推薦

2021-04-09 08:54:14

Kafka源碼架構(gòu)開發(fā)技術(shù)

2021-12-07 07:32:09

kafka架構(gòu)原理

2024-10-30 10:06:51

2023-11-07 16:24:49

成員權(quán)限管理

2022-02-25 08:54:50

setState異步React

2021-02-20 20:51:24

工具內(nèi)核kprobe

2023-12-28 11:24:29

IO系統(tǒng)請求

2022-03-02 10:11:41

索引場景數(shù)據(jù)庫

2021-02-21 06:33:27

存儲引擎物聯(lián)網(wǎng)

2022-02-23 09:52:15

InnoDB數(shù)據(jù)索引

2019-09-20 08:54:38

KafkaBroker消息

2022-09-06 08:02:32

LinuxLKRG安全

2021-03-04 08:06:17

Redis面試模型

2018-07-26 15:18:41

阿里JavaKafka架構(gòu)

2021-02-05 15:01:41

GitLinux命令

2024-08-23 16:04:45

2020-03-04 08:47:10

Kafka架構(gòu)原理

2018-08-20 08:30:05

Kafka架構(gòu)系統(tǒng)

2020-09-07 11:14:02

Vue異步更新

2017-06-23 18:25:51

kafka數(shù)據(jù)可靠性
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲免费精品一区 | 特级毛片爽www免费版 | 亚洲综合一区二区三区 | 特黄视频| 中文字幕亚洲免费 | 成人免费观看视频 | 久久国产免费看 | 日韩在线观看网站 | 狠狠久| 欧美日韩在线观看一区 | 亚洲乱码国产乱码精品精98午夜 | 久久中文字幕一区 | av一级一片 | 亚洲视频在线播放 | 99成人精品 | 亚洲精品福利在线 | 国产精品1区2区3区 男女啪啪高潮无遮挡免费动态 | 婷婷激情在线 | 日韩欧美综合 | 国产福利在线看 | 成人国产精品入口免费视频 | 日本国产精品视频 | 欧美性一级 | 能看的av | 精品一区二区三 | 国产精品www | 日本精品视频在线 | 91福利在线观看视频 | 久久精品免费一区二区三 | 日韩精品一区在线 | 久久久久国产一区二区三区 | 日韩黄色小视频 | 欧美一级免费 | 欧美乱大交xxxxx另类电影 | 日本a级大片 | 99久久成人 | 成人精品一区二区户外勾搭野战 | 一级黄色片免费 | 国产精品我不卡 | 亚洲一区二区三区免费观看 | 欧美成人免费在线 |