當(dāng)前位置：首頁 > 物聯(lián)網(wǎng) > 智能應(yīng)用

在阿帕奇卡夫卡集群中劃分冷熱數(shù)據(jù)層以實現(xiàn)最佳性能

時間：2024-08-04 22:52:07

關(guān)鍵字：阿帕奇卡夫卡集冷熱數(shù)據(jù)層

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]起初,數(shù)據(jù)分層是存儲系統(tǒng)用來降低數(shù)據(jù)存儲成本的一種策略。這涉及到將常常無法訪問的數(shù)據(jù)分組到更經(jīng)濟(jì)有效的存儲數(shù)組選擇中。例如,閑置一年或更長時間的數(shù)據(jù)可能會從昂貴的閃存層轉(zhuǎn)移到更便宜的SATA磁盤層。即使它們非常昂貴,SSDS和閃存也可以歸類為高性能存儲類。主動使用并需要最大性能的較小數(shù)據(jù)集通常存儲在閃存中。

起初,數(shù)據(jù)分層是存儲系統(tǒng)用來降低數(shù)據(jù)存儲成本的一種策略。這涉及到將常常無法訪問的數(shù)據(jù)分組到更經(jīng)濟(jì)有效的存儲數(shù)組選擇中。例如,閑置一年或更長時間的數(shù)據(jù)可能會從昂貴的閃存層轉(zhuǎn)移到更便宜的SATA磁盤層。即使它們非常昂貴,SSDS和閃存也可以歸類為高性能存儲類。主動使用并需要最大性能的較小數(shù)據(jù)集通常存儲在閃存中。

云數(shù)據(jù)分集技術(shù)在客戶尋求將數(shù)據(jù)分集或歸檔到公共云的替代選項時獲得了流行。公共云目前提供了一個混合的對象和文件存儲選項。對象存儲類,如亞馬遜S3和天藍(lán)球(天藍(lán)存儲)提供了顯著的成本效率和所有的好處,而沒有復(fù)雜的設(shè)置和管理。

"熱"數(shù)據(jù)和"冷"數(shù)據(jù)可以從多個節(jié)點(diǎn)卡夫卡集群的角度來看待。進(jìn)入卡夫卡主題的數(shù)據(jù)和到達(dá)下游應(yīng)用程序的快速檢索,作為通過各種數(shù)據(jù)管道后的最終輸出,可以被稱為"熱"數(shù)據(jù)。例如,從煉油廠使用的各種關(guān)鍵設(shè)備中獲得的微循環(huán)傳感器事件。類似地,下游應(yīng)用程序不經(jīng)常訪問的輸入到卡夫卡主題中的數(shù)據(jù)可以被稱為"冷"數(shù)據(jù)。作為"冷"數(shù)據(jù)的一個例子,我們可以考慮電子商務(wù)應(yīng)用中的庫存更新,吸收產(chǎn)品數(shù)量等。來自第三方倉庫系統(tǒng)。冷數(shù)據(jù)可以從集群轉(zhuǎn)移到成本效益高的存儲解決方案。

在根據(jù)下游應(yīng)用程序的需求將數(shù)據(jù)分類為卡夫卡主題之后,我們可以將數(shù)據(jù)層指定為熱層關(guān)于熱數(shù)據(jù)和冷層卡夫卡集群中的冷數(shù)據(jù)。高性能的存儲選項,如NVME(非易失性內(nèi)存快速處理器)或SSDS(固態(tài)驅(qū)動器),可以用于熱數(shù)據(jù)層,因為需要快速檢索數(shù)據(jù)。類似地,可擴(kuò)展的云存儲服務(wù),如亞馬遜S3,可以用于冷層。歷史數(shù)據(jù)和不經(jīng)常訪問的數(shù)據(jù)被確定為冷數(shù)據(jù)是理想的冷層。當(dāng)然,卡夫卡主題所包含的數(shù)據(jù)量以及保留期也是選擇云存儲的決定因素。

卡夫卡主題的基本執(zhí)行程序

熱數(shù)據(jù)層

如上所述,SSD或NVME是用于熱數(shù)據(jù)層和用于冷數(shù)據(jù)層的可伸縮云存儲的;同樣的可以在卡夫卡的服務(wù)、財產(chǎn) 文件。主題配置有一個默認(rèn)設(shè)置服務(wù)、財產(chǎn) 文件,在每個主題的基礎(chǔ)上覆蓋它的選項。如果沒有為某一專題提供具體的值,則在服務(wù)、財產(chǎn) 文件將被使用。不過,使用--config 選項,我們可以覆蓋在服務(wù)、財產(chǎn) 文件。

在此場景中,我們希望創(chuàng)建的主題應(yīng)該將熱層數(shù)據(jù)存儲在一個目錄中,該目錄中的位置應(yīng)該位于提供高速接入的存儲設(shè)備上,例如SSDS或NVME設(shè)備。

作為第一步,我們應(yīng)該禁用服務(wù)、財產(chǎn) 文件。默認(rèn)情況下,卡夫卡會自動創(chuàng)建不存在的主題。然而,在分層存儲場景中,最好是禁用自動主題創(chuàng)建,以保持對主題配置的更大控制。我們需要在服務(wù)、財產(chǎn) 文件。

· #禁用自動主題創(chuàng)建

auto.create.topics.enable=false

在第二步,更新log.dirs 酒店具有一個位置到提供高速接入的存儲設(shè)備。

log.dirs=/path/to/SSD or / NVMe devices for hot tier

最后,使用--config 選項在服務(wù)器.屬性文件。

topic.config.my_topic_for_hot_tier= log.dirs=/path/to/SSD or NVMe devices for hot tier

我們可能需要調(diào)整其他的鍵值對服務(wù)、財產(chǎn) 根據(jù)我們獨(dú)特的用例和諸如log.retention.hours ,default.replication.factor ,以及l(fā)og.segment.bytes .

冷數(shù)據(jù)層

如上所述,可擴(kuò)展的云存儲服務(wù),如亞馬遜S3,可以用于冷層。在卡夫卡中有兩種配置冷層的選項。一個是使用融合器內(nèi)置的亞馬遜S3接收器連接器,另一個是在卡夫卡的網(wǎng)站上配置亞馬遜S3桶。服務(wù)、財產(chǎn) 文件。

亞馬遜S3接收器連接器從阿帕奇卡夫卡主題導(dǎo)出數(shù)據(jù)到S3對象,無論是用avro格式、JSON格式還是字節(jié)格式。它定期從卡夫卡進(jìn)行民意測驗,然后將數(shù)據(jù)上傳到S3。在從指定的主題中消費(fèi)記錄并將它們組織到不同的分區(qū)之后,亞馬遜S3接收器連接器從每個分區(qū)向一個文件發(fā)送成批的記錄,然后將這些記錄上傳到S3桶中。我們可以通過使用融合連接插件安裝命令安裝這個連接器,或者通過手動下載ZIP文件,并且必須在將要運(yùn)行的集群上的每臺機(jī)器上安裝連接器。

除此之外,我們還可以用卡夫卡的服務(wù)、財產(chǎn) 使用以下步驟,為利用S3桶的冷數(shù)據(jù)層歸檔并創(chuàng)建一個主題:

· 更新log.dirs 屬性,具有位置到S3存儲位置。我們需要確保設(shè)置所有必要的aws憑證和權(quán)限,以便卡夫卡將其寫入指定的S3桶。

log.dirs=/path/to/S3 bucket

· 我們可以使用內(nèi)置腳本創(chuàng)建一個使用冷層(S3)的主題Kafka-topics.sh .在這里我們需要設(shè)置log.dirs 該特定主題的配置指向S3路徑。

bin/kafka-topics.sh --create --topic our_s3_cold_topic --partitions 5 --replication-factor 3 --config log.dirs=s3://our-s3-bucket/path/to/cold/tier --bootstrap-server <>:9092

· 根據(jù)S3存儲的要求和特點(diǎn),我們可以根據(jù)冷層調(diào)整卡夫卡配置,比如修改log.retention.hours 在…中服務(wù)、財產(chǎn) .

最后說明

最后,通過劃分阿帕奇卡夫卡集群中的冷熱數(shù)據(jù)層,可以根據(jù)數(shù)據(jù)特性優(yōu)化存儲資源。隨著越來越多的企業(yè)開始采用實時數(shù)據(jù)流來促進(jìn)業(yè)務(wù)增長,存儲的可伸縮性和成本效益變得至關(guān)重要。通過明智地實施高性能和成本效益高的存儲層,它們可以實現(xiàn)最佳性能和有效的存儲成本管理。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅(qū)動方式相比，共陰恒流驅(qū)動在能效有哪些優(yōu)勢

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字：驅(qū)動電源

[電源]

工業(yè)電機(jī)驅(qū)動電源設(shè)計：反電動勢抑制與過流保護(hù)的集成方案

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下，工業(yè)電機(jī)作為核心動力設(shè)備，其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動勢抑制與過流保護(hù)是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié)，集成化方案的設(shè)計成為提升電機(jī)驅(qū)動性能的關(guān)鍵。

關(guān)鍵字：工業(yè)電機(jī) 驅(qū)動電源

[電源]

如何解決 LED 驅(qū)動電源的易損壞問題

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而，在實際應(yīng)用中，LED 驅(qū)動電源易損壞的問題卻十分常見，不僅增加了維護(hù)成本，還影響了用戶體驗。要解決這一問題，需從設(shè)計、生...

關(guān)鍵字：驅(qū)動電源照明系統(tǒng) 散熱

[電力電工電路]

LED設(shè)計中LED驅(qū)動電源的公式

根據(jù)LED驅(qū)動電源的公式，電感內(nèi)電流波動大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字： LED 設(shè)計驅(qū)動電源

[汽車電子]

EV主驅(qū)IGBT隔離驅(qū)動電源方案選擇問題探討

電動汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機(jī)驅(qū)動控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動系統(tǒng)中的關(guān)鍵元件，其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字：電動汽車新能源驅(qū)動電源

[電源]

合理的驅(qū)動電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設(shè)中，街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分，其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步，高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關(guān)鍵字：發(fā)光二極管驅(qū)動電源 LED

[消費(fèi)電子]