www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 物聯(lián)網(wǎng) > 智能應用
[導讀]?大數(shù)據(jù)分析是一個很重要的功能,但是純粹的數(shù)據(jù)量被消化、處理和存儲會很快變成一個財政負擔。運行大數(shù)據(jù)平臺、每秒處理數(shù)百萬個事件的組織面臨著一個持續(xù)的挑戰(zhàn):平衡對穩(wěn)健數(shù)據(jù)管理的需求和成本效益。

大數(shù)據(jù)分析是一個很重要的功能,但是純粹的數(shù)據(jù)量被消化、處理和存儲會很快變成一個財政負擔。運行大數(shù)據(jù)平臺、每秒處理數(shù)百萬個事件的組織面臨著一個持續(xù)的挑戰(zhàn):平衡對穩(wěn)健數(shù)據(jù)管理的需求和成本效益。

本文以通用大數(shù)據(jù)平臺為例,通過不同的策略有條不紊地檢查和控制成本。

端到端大數(shù)據(jù)平臺組件

一個端到端的大數(shù)據(jù)平臺簡化了數(shù)據(jù)的過程,從原始格式到可行的見解。它由幾個關鍵組件組成,這些組件可以一起有效地管理整個數(shù)據(jù)生命周期。

· 數(shù)據(jù)攝取層: 這是一個切入點,無縫地從各種來源獲取數(shù)據(jù),無論其格式如何(結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化)。它可以過濾掉不相關的數(shù)據(jù),以提高效率,并將其轉(zhuǎn)換為一致的、定義明確的結(jié)構(gòu)(模式),以進行更好的分析。

· 低延遲分析層: 在這里,實時或近實時處理處于中心階段。這一層對于需要立即采取行動的應用程序至關重要,例如分析可疑活動交易的欺詐檢測系統(tǒng)。

· 臨時搜索和索引: 這一層授權(quán)靈活地探索您的數(shù)據(jù)。它創(chuàng)建可搜索的索引,使用戶能夠進行快速和有針對性的搜索,以滿足預期和未預見的分析需求。

· 儲存層: 平臺提供適合不同使用情況的存儲解決方案:

o 短期儲存: 該層存儲了數(shù)據(jù)科學項目、調(diào)查和模型開發(fā)或執(zhí)行中常見的批處理任務的數(shù)據(jù)。

o 長期儲存: 這種層存儲了較長時間的數(shù)據(jù),而檢索的頻率較低。對于審計目的或歷史分析來說,它是最理想的,因為長期的可訪問性是至關重要的。

攝取層的優(yōu)先攝取效率

計算機科學的核心原則,不僅僅是大數(shù)據(jù),是在開發(fā)生命周期的早期解決問題。單元測試完美地證明了這一點,因為及早捕捉錯誤是成本效益更高的。同樣的邏輯也適用于數(shù)據(jù)的攝取:盡快過濾掉不必要的數(shù)據(jù),最大限度地提高效率。通過將資源集中在具有潛在業(yè)務價值的數(shù)據(jù)上,可以最大限度地減少浪費。

另一個優(yōu)化策略是數(shù)據(jù)正常化。在攝入過程中將數(shù)據(jù)轉(zhuǎn)換為定義明確的模式(結(jié)構(gòu))提供了顯著的優(yōu)勢。這種前期處理減少了數(shù)據(jù)平臺中后續(xù)組件的解析負擔,使它們能夠?qū)W⒂诤诵娜蝿铡?/p>

低延遲的計算層雖然還不普遍,但對愿意投資的組織來說卻有很大的優(yōu)勢。通過利用現(xiàn)代流技術(shù),這些層可以大大降低處理成本,并以閃電般的速度產(chǎn)生洞察力。這種實時能力使企業(yè)能夠處理欺詐偵查、安全等關鍵用途案件?事件應對 ,以及以極具成本效益的方式處理通知書。

優(yōu)化對成本和效率的特設搜索

雖然臨時搜索提供了靈活性,但由于索引、復制和處理查詢所需的資源,它可能成為一個重要的成本因素。以下是優(yōu)化特設搜索和簡化數(shù)據(jù)管理的戰(zhàn)略:

· 分析搜尋模式: 通過仔細檢查用戶查詢,無論是臨時的還是定期的保存的搜索,您都可以確定向臨時搜索工具輸入數(shù)據(jù)的機會。這可能涉及過濾不相關的數(shù)據(jù)或預先處理數(shù)據(jù),以提高搜索效率。

· 利用低延遲分析: 審查計劃保存的搜索可以揭示將它們遷移到低延遲分析層的機會。這對于需要實時洞察力的搜索或涉及高計算成本的搜索特別有利,例如正則表達式(Regex)或子字符串搜索。通過在低延遲層中處理這些數(shù)據(jù),您可以釋放臨時搜索系統(tǒng)中的資源,并有可能降低總體成本。

· 為提高效率而規(guī)范化: 分析使用模式,以確定數(shù)據(jù)攝入過程中的正?;瘷C會。在正?;^程中,提前提取相關數(shù)據(jù)可以顯著降低復雜搜索(如Regex或子字符串搜索)的相關計算成本。

優(yōu)化數(shù)據(jù)存儲

存儲數(shù)據(jù)所涉及的費用與需要存儲的數(shù)據(jù)數(shù)量和數(shù)據(jù)的使用成正比。云計算提供者根據(jù)數(shù)據(jù)的大小收費,然后在計算、網(wǎng)絡和傳輸中需要額外的費用來執(zhí)行數(shù)據(jù)上的任何計算。有兩種簡單的優(yōu)化方法?儲藏室 費用:

了解您的數(shù)據(jù)使用頻率

實現(xiàn)成本優(yōu)化的第一步是明確了解您的數(shù)據(jù)環(huán)境。這包括根據(jù)訪問頻率對數(shù)據(jù)進行分類:

· 熱數(shù)據(jù): 經(jīng)常訪問對實時分析和決策至關重要的數(shù)據(jù)。實例包括流式傳感器數(shù)據(jù)、用戶活動日志和財務事務。

· 熱數(shù)據(jù): 數(shù)據(jù)定期訪問,但不是實時的。這可能包括歷史日志、客戶數(shù)據(jù)和點擊流數(shù)據(jù)。

· 冷數(shù)據(jù): 很少訪問具有長期保留要求的數(shù)據(jù)。這可能包括歷史備份、合規(guī)檔案和來自不活動項目的日志數(shù)據(jù)。

通過對數(shù)據(jù)進行分類,您可以定制其存儲策略。熱數(shù)據(jù)需要高性能的存儲,如固態(tài)驅(qū)動器(SSD),以便快速檢索。溫暖數(shù)據(jù)可以保存在更便宜的硬盤驅(qū)動器(HDDS)上,而冷數(shù)據(jù)最適合于成本效益高的對象存儲解決方案。

數(shù)據(jù)生命周期管理

數(shù)據(jù)積累得很快,如果沒有適當?shù)墓芾?就會導致存儲膨脹和不必要的成本。實現(xiàn)?數(shù)據(jù)生命周期管理 自動化數(shù)據(jù)移動和刪除的政策。這些政策可界定為:

· 數(shù)據(jù)保留期: 根據(jù)監(jiān)管和業(yè)務要求,設定存儲不同數(shù)據(jù)類型的具體時限。超過這些期間的舊數(shù)據(jù)可以歸檔或刪除。

· 數(shù)據(jù)質(zhì)量檢查: 自動檢查數(shù)據(jù)的完整性和一致性.識別并刪除重復數(shù)據(jù)或錯誤數(shù)據(jù),以優(yōu)化存儲利用率.

· 數(shù)據(jù)分類: 隨著數(shù)據(jù)年齡的增加,根據(jù)您的數(shù)據(jù)分類,將其自動移動到成本較低的存儲層。這確保了熱數(shù)據(jù)隨時可用,同時保持整體存儲成本效益。

優(yōu)化架構(gòu)促進效率

您的大數(shù)據(jù)平臺的架構(gòu)對其整體成本有重大影響。以下是如何優(yōu)化資源利用:

· 正確評估實例: 分析處理作業(yè)的資源使用模式.不要成為過度配置的犧牲品;根據(jù)實際的工作量需求,將實例(虛擬機)向上或向下擴展。這可以通過云計算提供者提供的自動規(guī)?;δ軄韺崿F(xiàn)。

· 云成本管理工具: 利用你的云平臺提供的成本管理工具。這些工具提供了對資源利用和成本細目的詳細了解,并確定了潛在的節(jié)約。探索以下特征:

o 保留實例: 在承諾使用期間以折扣率購買計算機資源。這可能有利于可預測的工作量。

o 局部實例: 利用未使用的云容量,降低需求價格。這對于具有靈活調(diào)度需求的批處理作業(yè)是理想的。

o 安排工作: 在云資源價格通常較低的情況下,在非高峰時間安排資源密集型數(shù)據(jù)處理任務。

監(jiān)測和報告費用

成本優(yōu)化是一個持續(xù)的過程。為了保持成本效益,實施健全的成本監(jiān)測和報告做法:

· 費用 :開發(fā)儀表板,提供不同資源類別的實時和歷史成本洞察力。可視化成本趨勢有助于積極主動地確定潛在的成本增加。將成本度量作為業(yè)務度量,需要對趨勢變化進行監(jiān)測,以便在成本成為問題之前采取行動。

· 費用歸屬 根據(jù)具體部門和項目的數(shù)據(jù)使用情況分配費用。這有助于提高內(nèi)部利益攸關方的成本意識,并鼓勵負責任的數(shù)據(jù)管理做法。

結(jié)論:實現(xiàn)成本效益高的大數(shù)據(jù)管理之路

優(yōu)化大數(shù)據(jù)平臺的成本是一個持續(xù)的過程。通過實施上述戰(zhàn)略,您可以在不損害數(shù)據(jù)生態(tài)系統(tǒng)的功能和價值的情況下節(jié)省大量費用。最有效的方法將取決于您的特定數(shù)據(jù)環(huán)境、工作負載和云環(huán)境。定期監(jiān)控、整個開發(fā)生命周期的成本意識以及持續(xù)改進的承諾是確保大數(shù)據(jù)平臺提供高效率和高成本效益的見解的關鍵。

本站聲明: 本文章由作者或相關機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術(shù)
關閉