Kafka一條消息如何被存儲到Broker上?

時間：2020-05-07 01:35:29

關(guān)鍵字： BROKER IO 線程模型

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]來自：z小趙前言經(jīng)過上篇文章的簡單實(shí)戰(zhàn)之后，今天來聊聊生產(chǎn)者將消息從客戶端發(fā)送到 Broker 上背后發(fā)生了哪些故事，看不看由你，但是我保證可以本篇文章你一定可以學(xué)到應(yīng)用背后的一些實(shí)質(zhì)東西。本文我們從以下 4 個方面來探討下一條消息如何被準(zhǔn)確的發(fā)送

Kafka一條消息如何被存儲到Broker上?

來自：z小趙

前言

經(jīng)過上篇文章的簡單實(shí)戰(zhàn)之后，今天來聊聊生產(chǎn)者將消息從客戶端發(fā)送到 Broker 上背后發(fā)生了哪些故事，看不看由你，但是我保證可以本篇文章你一定可以學(xué)到應(yīng)用背后的一些實(shí)質(zhì)東西。

本文我們從以下 4 個方面來探討下一條消息如何被準(zhǔn)確的發(fā)送到 Broker 的 partition 上。

1. 客戶端組件

2. 客戶端緩存存儲模型

3. 確定消息的 partition 位置

4. 發(fā)送線程的工作原理

客戶端組件

KafkaProducer:

KafkaProducer 是一個生產(chǎn)者客戶端的進(jìn)程，通過該對象啟動生產(chǎn)者來發(fā)送消息。

RecordAccumulator:

RecordAccumulator 是一個記錄收集器，用于收集客戶端發(fā)送的消息，并將收集到的消息暫存到客戶端緩存中。

Sender:

Sender 是一個發(fā)送線程，負(fù)責(zé)讀取記錄收集器中緩存的批量消息，經(jīng)過一些中間轉(zhuǎn)換操作，將要發(fā)送的數(shù)據(jù)準(zhǔn)備好，然后交由 Selector 進(jìn)行網(wǎng)絡(luò)傳輸。

Selector:

Selector 是一個選擇器，用于處理網(wǎng)絡(luò)連接和讀寫處理，使用網(wǎng)絡(luò)連接處理客戶端上的網(wǎng)絡(luò)請求。

通過使用以上四大組件即可完成客戶端消息的發(fā)送工作。消息在網(wǎng)絡(luò)中傳輸?shù)姆绞街荒芡ㄟ^二級制的方式，所以首先需要將消息序列化為二進(jìn)制形式緩存在客戶端，kafka 使用了雙端隊(duì)列的方式將消息緩存起來，然后使用發(fā)送線程（Sender）讀取隊(duì)列中的消息交給 Selector 進(jìn)行網(wǎng)絡(luò)傳輸發(fā)送給服務(wù)端（Broker）

以上為發(fā)送消息的主流程，附上部分源碼供大家參考，接下來分析下幾個非常重要流程的具體實(shí)現(xiàn)原理。

客戶端緩存存儲模型

從上圖可以看出，一條消息首先需要確定要被存儲到那個 partition 對應(yīng)的雙端隊(duì)列上；其次，存儲消息的雙端隊(duì)列是以批的維度存儲的，即 N 條消息組成一批，一批消息最多存儲 N 條，超過后則新建一個組來存儲新消息；其次，新來的消息總是從左側(cè)寫入，即越靠左側(cè)的消息產(chǎn)生的時間越晚；最后，只有當(dāng)一批消息湊夠 N 條后才會發(fā)送給 Broker，否則不會發(fā)送到 Broker 上。

了解了客戶端存儲模型后，來探討下確定消息的 partition（分區(qū)）位置？

確定消息的 partition 位置

消息可分為兩種，一種是指定了 key 的消息，一種是沒有指定 key 的消息。

對于指定了 key 的消息，partition 位置的計算方式為：Utils.murmur2(key) % numPartitions，即先對 key 進(jìn)行哈希計算，然后在于 partition 個數(shù)求余，從而得到該條消息應(yīng)該被存儲在哪個 partition 上。

對于沒有指定 key 的消息，partition 位置的計算方式為：采用 round-robin 方式確定 partition 位置，即采用輪詢的方式，平均的將消息分布到不同的 partition 上，從而避免某些 partition 數(shù)據(jù)量過大影響 Broker 和消費(fèi)端性能。

注意

由于 partition 有主副的區(qū)分，此處參與計算的 partition 數(shù)量是當(dāng)前有主 partition 的數(shù)量，即如果某個 partition 無主的時候，則此 partition 是不能夠進(jìn)行數(shù)據(jù)寫入的。

稍微解釋一下，主副 partition 的機(jī)制是為了提高 kafka 系統(tǒng)的容錯性的，即當(dāng)某個 Broker 意外宕機(jī)時，在此 Broker 上的主 partition 狀態(tài)為不可讀寫時（只有主 partition 可對外提供讀寫服務(wù)，副 partition 只有數(shù)據(jù)備份的功能），kafka 會從主 partition 對應(yīng)的 N 個副 partition 中挑選一個，并將其狀態(tài)改為主 partition，從而繼續(xù)對外提供讀寫操作。

消息被確定分配到某個 partition 對應(yīng)記錄收集器（即雙端隊(duì)列）后，接下來，發(fā)送線程（Sender）從記錄收集器中收集滿足條件的批數(shù)據(jù)發(fā)送給 Broker，那么發(fā)送線程是如何收集滿足條件的批數(shù)據(jù)的？批數(shù)據(jù)是按照 partition 維度發(fā)送的還是按照 Broker 維度發(fā)送數(shù)據(jù)的？

發(fā)送線程的工作原理

Sender 線程的主要工作是收集滿足條件的批數(shù)據(jù)，何為滿足條件的批數(shù)據(jù)？緩存數(shù)據(jù)是以批維度存儲的，當(dāng)一批數(shù)據(jù)量達(dá)到指定的 N 條時，就滿足發(fā)送給 Broker 的條件了。

partition 維度和 Broker 維度發(fā)送消息模型對比。

從圖中可以看出，左側(cè)按照 partition 維度發(fā)送消息，每個 partition 都需要和 Broker 建連，總共發(fā)生了四次網(wǎng)絡(luò)連接。而右側(cè)將分布在同一個 Broker 的 partition 按組聚合后在與 Broker 建連，只需要兩次網(wǎng)絡(luò)連接即可。所以 Kafka 選擇右側(cè)的方式。

Sender 的主要工作

第一步：掃描記錄收集器中滿足條件的批數(shù)據(jù)，然后將 partition -> 批數(shù)據(jù)映射轉(zhuǎn)換成 BrokerId -> N 批數(shù)據(jù)的映射。第二步：Sender 線程會為每個 BrokerId 創(chuàng)建一個客戶端請求，然后將請求交給 NetWorkClient，由 NetWrokClient 去真正發(fā)送網(wǎng)絡(luò)請求到 Broker。

NetWorkClient 的工作內(nèi)容

Sender 線程準(zhǔn)備好要發(fā)送的數(shù)據(jù)后，交由 NetWorkClient 來進(jìn)行網(wǎng)絡(luò)相關(guān)操作。主要包括客戶端與服務(wù)端的建連、發(fā)送客戶端請求、接受服務(wù)端響應(yīng)。完成如上一系列的工作主要由如下方法完成。

reday()方法。從記錄收集器獲取準(zhǔn)備完畢的節(jié)點(diǎn)，并連接所有準(zhǔn)備好的節(jié)點(diǎn)。
send()方法。為每個節(jié)點(diǎn)創(chuàng)建一個客戶端請求，然后將請求暫時存到節(jié)點(diǎn)對應(yīng)的 Channel（通道）中。
poll()方法。該方法會真正輪詢網(wǎng)絡(luò)請求，發(fā)送請求給服務(wù)端節(jié)點(diǎn)和接受服務(wù)端的響應(yīng)。

總結(jié)

以上，即為生產(chǎn)者客戶端的一條消息從生產(chǎn)到發(fā)送到 Broker 上的全過程。現(xiàn)在是不是就很清晰了呢？也許有些朋友會比較疑惑它的網(wǎng)絡(luò)請求模型是什么樣的，作者就猜你會你會問，下一篇我們就來扒開它的神秘面紗看看其究竟是怎么實(shí)現(xiàn)的，敬請期待。

特別推薦一個分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容，還沒關(guān)注的小伙伴，可以長按關(guān)注一下：
長按訂閱更多精彩▼
如有收獲，點(diǎn)個在看，誠摯感謝

免責(zé)聲明：本文內(nèi)容由21ic獲得授權(quán)后發(fā)布，版權(quán)歸原作者所有，本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點(diǎn)，不代表本平臺立場，如有問題，請聯(lián)系我們，謝謝！

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風(fēng)險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機(jī) 衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點(diǎn)：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實(shí)提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅(jiān)持高質(zhì)量發(fā)展策略，塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運(yùn)營商數(shù)字經(jīng)濟(jì)

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]