www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 公眾號精選 > 架構師社區(qū)
[導讀]大型互聯(lián)網公司一般都會要求消息傳遞最大限度的不丟失,比如用戶服務給代金券服務發(fā)送一個消息,如果消息丟失會造成用戶未收到應得的代金券,最終用戶會投訴。為避免上面類似情況的發(fā)生,除了做好補償措施,更應該在系設計的時候充分考慮各種異常,設計一個穩(wěn)定、高可用的消息系統(tǒng)。

刨根問底,Kafka消息中間件到底會不會丟消息

大型互聯(lián)網公司一般都會要求消息傳遞最大限度的不丟失,比如用戶服務給代金券服務發(fā)送一個消息,如果消息丟失會造成用戶未收到應得的代金券,最終用戶會投訴。

為避免上面類似情況的發(fā)生,除了做好補償措施,更應該在系設計的時候充分考慮各種異常,設計一個穩(wěn)定、高可用的消息系統(tǒng)。

認識Kafka

看一下維基百科的定義

Kafka是分布式發(fā)布-訂閱消息系統(tǒng)。它最初由LinkedIn公司開發(fā),之后成為Apache項目的一部分。

Kafka是一個分布式的,可劃分的,冗余備份的持久性的日志服務。它主要用于處理活躍的流式數(shù)據。

kafka架構

Kafka的整體架構非常簡單,是顯式分布式架構,主要由producer、broker(kafka)和consumer組成。

刨根問底,Kafka消息中間件到底會不會丟消息
Kafka架構(精簡版)

Producer(生產者)可以將數(shù)據發(fā)布到所選擇的topic(主題)中。生產者負責將記錄分配到topic的哪一個 partition(分區(qū))中??梢允褂醚h(huán)的方式來簡單地實現(xiàn)負載均衡,也可以根據某些語義分區(qū)函數(shù)(如記錄中的key)來完成。

Consumer(消費者)使用一個consumer group(消費組)名稱來進行標識,發(fā)布到topic中的每條記錄被分配給訂閱消費組中的一個消費者實例。消費者實例可以分布在多個進程中或者多個機器上。

Kafka到底會不會丟失消息?

在討論kafka是否丟消息前先來了解一下什么是消息傳遞語義。

刨根問底,Kafka消息中間件到底會不會丟消息
消息傳遞語義

message delivery semantic 也就是消息傳遞語義,簡單說就是消息傳遞過程中消息傳遞的保證性。主要分為三種:

  • at most once:最多一次。消息可能丟失也可能被處理,但最多只會被處理一次。
  • at least once:至少一次。消息不會丟失,但可能被處理多次??赡苤貜?,不會丟失。
  • exactly once:精確傳遞一次。消息被處理且只會被處理一次。不丟失不重復就一次。

理想情況下肯定是希望系統(tǒng)的消息傳遞是嚴格exactly once,也就是保證不丟失、只會被處理一次,但是很難做到。

回到主角Kafka,Kafka有三次消息傳遞的過程:

  1. 生產者發(fā)消息給Kafka Broker。
  2. Kafka Broker 消息同步和持久化
  3. Kafka Broker 將消息傳遞給消費者。

在這三步中每一步都有可能會丟失消息,下面詳細分析為什么會丟消息,如何最大限度避免丟失消息。

生產者丟失消息

先介紹一下生產者發(fā)送消息的一般流程(部分流程與具體配置項強相關,這里先忽略):

  1. 生產者是與leader直接交互,所以先從集群獲取topic對應分區(qū)的leader元數(shù)據;
  2. 獲取到leader分區(qū)元數(shù)據后直接將消息發(fā)給過去;
  3. Kafka Broker對應的leader分區(qū)收到消息后寫入文件持久化;
  4. Follower拉取Leader消息與Leader的數(shù)據保持一致;
  5. Follower消息拉取完畢需要給Leader回復ACK確認消息;
  6. Kafka Leader和Follower分區(qū)同步完,Leader分區(qū)會給生產者回復ACK確認消息。
刨根問底,Kafka消息中間件到底會不會丟消息
生產者發(fā)送數(shù)據流程

生產者采用push模式將數(shù)據發(fā)布到broker,每條消息追加到分區(qū)中,順序寫入磁盤。消息寫入Leader后,F(xiàn)ollower是主動與Leader進行同步。

Kafka消息發(fā)送有兩種方式:同步(sync)和異步(async),默認是同步方式,可通過producer.type屬性進行配置。

Kafka通過配置request.required.acks屬性來確認消息的生產:

  • 0表示不進行消息接收是否成功的確認;不能保證消息是否發(fā)送成功,生成環(huán)境基本不會用。
  • 1表示當Leader接收成功時確認;只要Leader存活就可以保證不丟失,保證了吞吐量。
  • -1或者all表示Leader和Follower都接收成功時確認;可以最大限度保證消息不丟失,但是吞吐量低。

kafka producer 的參數(shù)acks 的默認值為1,所以默認的producer級別是at least once,并不能exactly once。

敲黑板了,這里可能會丟消息的!

  • 如果acks配置為0,發(fā)生網絡抖動消息丟了,生產者不校驗ACK自然就不知道丟了。
  • 如果acks配置為1保證leader不丟,但是如果leader掛了,恰好選了一個沒有ACK的follower,那也丟了。
  • all:保證leader和follower不丟,但是如果網絡擁塞,沒有收到ACK,會有重復發(fā)的問題。

Kafka Broker丟失消息

Kafka Broker 接收到數(shù)據后會將數(shù)據進行持久化存儲,你以為是下面這樣的:

刨根問底,Kafka消息中間件到底會不會丟消息
消息持久化,無cache

沒想到是這樣的:

刨根問底,Kafka消息中間件到底會不會丟消息
消息持久化,有cache

操作系統(tǒng)本身有一層緩存,叫做 Page Cache,當往磁盤文件寫入的時候,系統(tǒng)會先將數(shù)據流寫入緩存中,至于什么時候將緩存的數(shù)據寫入文件中是由操作系統(tǒng)自行決定。

Kafka提供了一個參數(shù) producer.type 來控制是不是主動flush,如果Kafka寫入到mmap之后就立即 flush 然后再返回 Producer 叫同步 (sync);寫入mmap之后立即返回 Producer 不調用 flush 叫異步 (async)。

敲黑板了,這里可能會丟消息的!

Kafka通過多分區(qū)多副本機制中已經能最大限度保證數(shù)據不會丟失,如果數(shù)據已經寫入系統(tǒng) cache 中但是還沒來得及刷入磁盤,此時突然機器宕機或者掉電那就丟了,當然這種情況很極端。

消費者丟失消息

消費者通過pull模式主動的去 kafka 集群拉取消息,與producer相同的是,消費者在拉取消息的時候也是找leader分區(qū)去拉取。

多個消費者可以組成一個消費者組(consumer group),每個消費者組都有一個組id。同一個消費組者的消費者可以消費同一topic下不同分區(qū)的數(shù)據,但是不會出現(xiàn)多個消費者消費同一分區(qū)的數(shù)據。

刨根問底,Kafka消息中間件到底會不會丟消息

消費者群組消費消息

消費者消費的進度通過offset保存在kafka集群的__consumer_offsets這個topic中。

消費消息的時候主要分為兩個階段:

1、標識消息已被消費,commit offset坐標;

2、處理消息。

敲黑板了,這里可能會丟消息的!

場景一:先commit再處理消息。如果在處理消息的時候異常了,但是offset 已經提交了,這條消息對于該消費者來說就是丟失了,再也不會消費到了。

場景二:先處理消息再commit。如果在commit之前發(fā)生異常,下次還會消費到該消息,重復消費的問題可以通過業(yè)務保證消息冪等性來解決。

總結

那么問題來了,kafka到底會不會丟消息?答案是:會!

Kafka可能會在三個階段丟失消息:

(1)生產者發(fā)送數(shù)據;

(2)Kafka Broker 存儲數(shù)據;

(3)消費者消費數(shù)據;

在生產環(huán)境中嚴格做到exactly once其實是難的,同時也會犧牲效率和吞吐量,最佳實踐是業(yè)務側做好補償機制,萬一出現(xiàn)消息丟失可以兜底。

- END -

特別推薦一個分享架構+算法的優(yōu)質內容,還沒關注的小伙伴,可以長按關注一下:

刨根問底,Kafka消息中間件到底會不會丟消息

刨根問底,Kafka消息中間件到底會不會丟消息

刨根問底,Kafka消息中間件到底會不會丟消息

長按訂閱更多精彩▼

刨根問底,Kafka消息中間件到底會不會丟消息

如有收獲,點個在看,誠摯感謝

免責聲明:本文內容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉