www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 公眾號(hào)精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]大型互聯(lián)網(wǎng)公司一般都會(huì)要求消息傳遞最大限度的不丟失,比如用戶服務(wù)給代金券服務(wù)發(fā)送一個(gè)消息,如果消息丟失會(huì)造成用戶未收到應(yīng)得的代金券,最終用戶會(huì)投訴。為避免上面類似情況的發(fā)生,除了做好補(bǔ)償措施,更應(yīng)該在系設(shè)計(jì)的時(shí)候充分考慮各種異常,設(shè)計(jì)一個(gè)穩(wěn)定、高可用的消息系統(tǒng)。

刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息

大型互聯(lián)網(wǎng)公司一般都會(huì)要求消息傳遞最大限度的不丟失,比如用戶服務(wù)給代金券服務(wù)發(fā)送一個(gè)消息,如果消息丟失會(huì)造成用戶未收到應(yīng)得的代金券,最終用戶會(huì)投訴。

為避免上面類似情況的發(fā)生,除了做好補(bǔ)償措施,更應(yīng)該在系設(shè)計(jì)的時(shí)候充分考慮各種異常,設(shè)計(jì)一個(gè)穩(wěn)定、高可用的消息系統(tǒng)。

認(rèn)識(shí)Kafka

看一下維基百科的定義

Kafka是分布式發(fā)布-訂閱消息系統(tǒng)。它最初由LinkedIn公司開(kāi)發(fā),之后成為Apache項(xiàng)目的一部分。

Kafka是一個(gè)分布式的,可劃分的,冗余備份的持久性的日志服務(wù)。它主要用于處理活躍的流式數(shù)據(jù)。

kafka架構(gòu)

Kafka的整體架構(gòu)非常簡(jiǎn)單,是顯式分布式架構(gòu),主要由producer、broker(kafka)和consumer組成。

刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息
Kafka架構(gòu)(精簡(jiǎn)版)

Producer(生產(chǎn)者)可以將數(shù)據(jù)發(fā)布到所選擇的topic(主題)中。生產(chǎn)者負(fù)責(zé)將記錄分配到topic的哪一個(gè) partition(分區(qū))中??梢允褂醚h(huán)的方式來(lái)簡(jiǎn)單地實(shí)現(xiàn)負(fù)載均衡,也可以根據(jù)某些語(yǔ)義分區(qū)函數(shù)(如記錄中的key)來(lái)完成。

Consumer(消費(fèi)者)使用一個(gè)consumer group(消費(fèi)組)名稱來(lái)進(jìn)行標(biāo)識(shí),發(fā)布到topic中的每條記錄被分配給訂閱消費(fèi)組中的一個(gè)消費(fèi)者實(shí)例。消費(fèi)者實(shí)例可以分布在多個(gè)進(jìn)程中或者多個(gè)機(jī)器上。

Kafka到底會(huì)不會(huì)丟失消息?

在討論kafka是否丟消息前先來(lái)了解一下什么是消息傳遞語(yǔ)義。

刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息
消息傳遞語(yǔ)義

message delivery semantic 也就是消息傳遞語(yǔ)義,簡(jiǎn)單說(shuō)就是消息傳遞過(guò)程中消息傳遞的保證性。主要分為三種:

  • at most once:最多一次。消息可能丟失也可能被處理,但最多只會(huì)被處理一次。
  • at least once:至少一次。消息不會(huì)丟失,但可能被處理多次。可能重復(fù),不會(huì)丟失。
  • exactly once:精確傳遞一次。消息被處理且只會(huì)被處理一次。不丟失不重復(fù)就一次。

理想情況下肯定是希望系統(tǒng)的消息傳遞是嚴(yán)格exactly once,也就是保證不丟失、只會(huì)被處理一次,但是很難做到。

回到主角Kafka,Kafka有三次消息傳遞的過(guò)程:

  1. 生產(chǎn)者發(fā)消息給Kafka Broker。
  2. Kafka Broker 消息同步和持久化
  3. Kafka Broker 將消息傳遞給消費(fèi)者。

在這三步中每一步都有可能會(huì)丟失消息,下面詳細(xì)分析為什么會(huì)丟消息,如何最大限度避免丟失消息。

生產(chǎn)者丟失消息

先介紹一下生產(chǎn)者發(fā)送消息的一般流程(部分流程與具體配置項(xiàng)強(qiáng)相關(guān),這里先忽略):

  1. 生產(chǎn)者是與leader直接交互,所以先從集群獲取topic對(duì)應(yīng)分區(qū)的leader元數(shù)據(jù);
  2. 獲取到leader分區(qū)元數(shù)據(jù)后直接將消息發(fā)給過(guò)去;
  3. Kafka Broker對(duì)應(yīng)的leader分區(qū)收到消息后寫(xiě)入文件持久化;
  4. Follower拉取Leader消息與Leader的數(shù)據(jù)保持一致;
  5. Follower消息拉取完畢需要給Leader回復(fù)ACK確認(rèn)消息;
  6. Kafka Leader和Follower分區(qū)同步完,Leader分區(qū)會(huì)給生產(chǎn)者回復(fù)ACK確認(rèn)消息。
刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息
生產(chǎn)者發(fā)送數(shù)據(jù)流程

生產(chǎn)者采用push模式將數(shù)據(jù)發(fā)布到broker,每條消息追加到分區(qū)中,順序?qū)懭氪疟P(pán)。消息寫(xiě)入Leader后,F(xiàn)ollower是主動(dòng)與Leader進(jìn)行同步。

Kafka消息發(fā)送有兩種方式:同步(sync)和異步(async),默認(rèn)是同步方式,可通過(guò)producer.type屬性進(jìn)行配置。

Kafka通過(guò)配置request.required.acks屬性來(lái)確認(rèn)消息的生產(chǎn):

  • 0表示不進(jìn)行消息接收是否成功的確認(rèn);不能保證消息是否發(fā)送成功,生成環(huán)境基本不會(huì)用。
  • 1表示當(dāng)Leader接收成功時(shí)確認(rèn);只要Leader存活就可以保證不丟失,保證了吞吐量。
  • -1或者all表示Leader和Follower都接收成功時(shí)確認(rèn);可以最大限度保證消息不丟失,但是吞吐量低。

kafka producer 的參數(shù)acks 的默認(rèn)值為1,所以默認(rèn)的producer級(jí)別是at least once,并不能exactly once。

敲黑板了,這里可能會(huì)丟消息的!

  • 如果acks配置為0,發(fā)生網(wǎng)絡(luò)抖動(dòng)消息丟了,生產(chǎn)者不校驗(yàn)ACK自然就不知道丟了。
  • 如果acks配置為1保證leader不丟,但是如果leader掛了,恰好選了一個(gè)沒(méi)有ACK的follower,那也丟了。
  • all:保證leader和follower不丟,但是如果網(wǎng)絡(luò)擁塞,沒(méi)有收到ACK,會(huì)有重復(fù)發(fā)的問(wèn)題。

Kafka Broker丟失消息

Kafka Broker 接收到數(shù)據(jù)后會(huì)將數(shù)據(jù)進(jìn)行持久化存儲(chǔ),你以為是下面這樣的:

刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息
消息持久化,無(wú)cache

沒(méi)想到是這樣的:

刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息
消息持久化,有cache

操作系統(tǒng)本身有一層緩存,叫做 Page Cache,當(dāng)往磁盤(pán)文件寫(xiě)入的時(shí)候,系統(tǒng)會(huì)先將數(shù)據(jù)流寫(xiě)入緩存中,至于什么時(shí)候?qū)⒕彺娴臄?shù)據(jù)寫(xiě)入文件中是由操作系統(tǒng)自行決定。

Kafka提供了一個(gè)參數(shù) producer.type 來(lái)控制是不是主動(dòng)flush,如果Kafka寫(xiě)入到mmap之后就立即 flush 然后再返回 Producer 叫同步 (sync);寫(xiě)入mmap之后立即返回 Producer 不調(diào)用 flush 叫異步 (async)。

敲黑板了,這里可能會(huì)丟消息的!

Kafka通過(guò)多分區(qū)多副本機(jī)制中已經(jīng)能最大限度保證數(shù)據(jù)不會(huì)丟失,如果數(shù)據(jù)已經(jīng)寫(xiě)入系統(tǒng) cache 中但是還沒(méi)來(lái)得及刷入磁盤(pán),此時(shí)突然機(jī)器宕機(jī)或者掉電那就丟了,當(dāng)然這種情況很極端。

消費(fèi)者丟失消息

消費(fèi)者通過(guò)pull模式主動(dòng)的去 kafka 集群拉取消息,與producer相同的是,消費(fèi)者在拉取消息的時(shí)候也是找leader分區(qū)去拉取。

多個(gè)消費(fèi)者可以組成一個(gè)消費(fèi)者組(consumer group),每個(gè)消費(fèi)者組都有一個(gè)組id。同一個(gè)消費(fèi)組者的消費(fèi)者可以消費(fèi)同一topic下不同分區(qū)的數(shù)據(jù),但是不會(huì)出現(xiàn)多個(gè)消費(fèi)者消費(fèi)同一分區(qū)的數(shù)據(jù)。

刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息

消費(fèi)者群組消費(fèi)消息

消費(fèi)者消費(fèi)的進(jìn)度通過(guò)offset保存在kafka集群的__consumer_offsets這個(gè)topic中。

消費(fèi)消息的時(shí)候主要分為兩個(gè)階段:

1、標(biāo)識(shí)消息已被消費(fèi),commit offset坐標(biāo);

2、處理消息。

敲黑板了,這里可能會(huì)丟消息的!

場(chǎng)景一:先commit再處理消息。如果在處理消息的時(shí)候異常了,但是offset 已經(jīng)提交了,這條消息對(duì)于該消費(fèi)者來(lái)說(shuō)就是丟失了,再也不會(huì)消費(fèi)到了。

場(chǎng)景二:先處理消息再commit。如果在commit之前發(fā)生異常,下次還會(huì)消費(fèi)到該消息,重復(fù)消費(fèi)的問(wèn)題可以通過(guò)業(yè)務(wù)保證消息冪等性來(lái)解決。

總結(jié)

那么問(wèn)題來(lái)了,kafka到底會(huì)不會(huì)丟消息?答案是:會(huì)!

Kafka可能會(huì)在三個(gè)階段丟失消息:

(1)生產(chǎn)者發(fā)送數(shù)據(jù);

(2)Kafka Broker 存儲(chǔ)數(shù)據(jù);

(3)消費(fèi)者消費(fèi)數(shù)據(jù);

在生產(chǎn)環(huán)境中嚴(yán)格做到exactly once其實(shí)是難的,同時(shí)也會(huì)犧牲效率和吞吐量,最佳實(shí)踐是業(yè)務(wù)側(cè)做好補(bǔ)償機(jī)制,萬(wàn)一出現(xiàn)消息丟失可以兜底。

- END -

特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒(méi)關(guān)注的小伙伴,可以長(zhǎng)按關(guān)注一下:

刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息

刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息

刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息

長(zhǎng)按訂閱更多精彩▼

刨根問(wèn)底,Kafka消息中間件到底會(huì)不會(huì)丟消息

如有收獲,點(diǎn)個(gè)在看,誠(chéng)摯感謝

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉