www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 物聯(lián)網(wǎng) > 物聯(lián)網(wǎng)技術文庫
[導讀] 當數(shù)據(jù)倉庫可以處理非結構化數(shù)據(jù),而數(shù)據(jù)湖可以運行分析時,組織如何決定使用哪種方法?這取決于其需要采用數(shù)據(jù)回答新問題的頻率。 傳統(tǒng)上,數(shù)據(jù)倉庫收集來自組織業(yè)務的所有結構化數(shù)據(jù),因此組織可以

當數(shù)據(jù)倉庫可以處理非結構化數(shù)據(jù),而數(shù)據(jù)湖可以運行分析時,組織如何決定使用哪種方法?這取決于其需要采用數(shù)據(jù)回答新問題的頻率。

傳統(tǒng)上,數(shù)據(jù)倉庫收集來自組織業(yè)務的所有結構化數(shù)據(jù),因此組織可以將其集成到單個數(shù)據(jù)模型中,運行分析并獲取商業(yè)智能,無論是用于開發(fā)新產(chǎn)品還是向客戶營銷現(xiàn)有服務。這曾經(jīng)被稱為“大數(shù)據(jù)”,但現(xiàn)在所有組織都擁有來自電子商務網(wǎng)站、物聯(lián)網(wǎng)設備和傳感器等來源的大量數(shù)據(jù),因此現(xiàn)代數(shù)據(jù)倉庫需要處理結構化、非結構化和流媒體數(shù)據(jù),并提供實時數(shù)據(jù)分析以及商業(yè)智能和報告。

越來越多的組織在云中實現(xiàn)這一目標,以實現(xiàn)更高的速度和更低的成本。微軟Azure公司副總裁Julia White指出,越來越多的數(shù)據(jù)可能已經(jīng)存在于云中,以及組織想要使用這些數(shù)據(jù)的服務。White說,“隨著數(shù)據(jù)越來越多地遷移到云端,無論是來自SaaS應用程序還是只遷移到云端的應用程序;運營數(shù)據(jù)就在云端,客戶在詢問‘為什么我要將運營數(shù)據(jù)從云端遷回到內(nèi)部部署數(shù)據(jù)中心進行分析?它沒有意義。’”他指出,盡管組織內(nèi)部仍然有大量的數(shù)據(jù),而且隨著邊緣計算的發(fā)展,還會有更多的數(shù)據(jù),但許多客戶還是會將部分或全部數(shù)據(jù)轉移到云平臺上,這取決于法規(guī)遵從性問題。

White指出,“每個企業(yè)都在研究人工智能。他們很快意識到分析是其基礎,他們開始問‘我的分析和我的數(shù)據(jù)倉庫的狀態(tài)是什么?’,而且往往不夠好?!?/p>

Power BI的普及也推動了更多的微軟客戶進行云計算分析。White說,“當他們有了這些強大的數(shù)據(jù)可視化功能后,他們開始質(zhì)疑自己的分析能力——‘我想知道數(shù)據(jù)可視化背后發(fā)生了什么:我喜歡Power BI,我希望我的分析更有趣?!?/p>

更復雜的客戶希望分析他們自己的Office Graph數(shù)據(jù)(組織可以使用Azure Data Factory將其復制到Azure Data Lake)或利用Microsoft、Adobe和SAP(基于Azure Data構建的)之間的開放數(shù)據(jù)計劃(ODI)數(shù)據(jù)湖并將最終整合來自更多軟件供應商的數(shù)據(jù)。White說,“Azure Data Lake與Azure數(shù)據(jù)倉庫緊密結合,客戶正在使用Azure數(shù)據(jù)倉庫獲取更多見解,并在其上構建現(xiàn)代數(shù)據(jù)倉庫?!?/p> 采用哪種數(shù)據(jù)服務?

微軟公司擁有一系列看起來有點像數(shù)據(jù)倉庫的云計算服務,最明顯的是Azure SQL數(shù)據(jù)倉庫或微軟經(jīng)常稱之為的“DW”,但也有Azure數(shù)據(jù)工廠、Azure數(shù)據(jù)湖、Azure數(shù)據(jù)庫、Power BI和Azure機器學習,以及更多打包服務,如Dynamics 365中的人工智能銷售工具。

理解它們的方法不僅僅是關注它們提供的工具,還要關注它們所服務的用戶以及它們?nèi)绾螀f(xié)同工作。這是因為企業(yè)通常擁有的數(shù)據(jù)在多個數(shù)據(jù)存儲中分散,創(chuàng)建現(xiàn)代數(shù)據(jù)倉庫的第一步是整合所有這些孤島。微軟Azure上的這些不同數(shù)據(jù)存儲越多,連接就越容易——這也是微軟Azure提供如此多不同數(shù)據(jù)服務的原因之一。White表示,“另一方面,客戶并不是在尋找可以做任何事情的單一工具,有一系列細微差別的選擇,如果真的要挑選,并優(yōu)化自己的場景使用的工具。”

Azure DW適用于處理策劃數(shù)據(jù)的數(shù)據(jù)工程師。這可能是來自SQL Server數(shù)據(jù)庫的數(shù)據(jù),但它也可能是來自這些數(shù)據(jù)工程師使用Databricks或Spark和.NET從Azure HDInsight等源準備數(shù)據(jù)的管道構建的數(shù)據(jù)。

Azure數(shù)據(jù)工廠是數(shù)據(jù)工程師進行數(shù)據(jù)ETL(提取、轉換、加載)的另一項服務。組織可以將其視為云計算層級ETL工具,組織可以通過拖放界面(實際上是Logic Apps)或使用Python、Java或.NET SDK(如果組織更喜歡編寫代碼來執(zhí)行)來使用數(shù)據(jù)轉換和管理數(shù)據(jù)管道的不同步驟,通過Databricks或HDInsight、Azure Data Lake或Power BI。

Power BI還可以使用Dataflows(也是免代碼)進行數(shù)據(jù)轉換,但這是為業(yè)務分析師提供的自助服務功能。數(shù)據(jù)工程師或全職商業(yè)智能分析師可能會使業(yè)務用戶使用這些語義模型,而微軟公司正在將更多與Azure DW的集成添加到Power BI中。

Power BI用戶可以在其可視化和報告中添加人工智能。其中一些可能是使用微軟公司預先構建的認知服務來進行圖像識別和情感分析。但他們也可能正在使用數(shù)據(jù)工程師在Azure機器學習服務中為他們構建的自定義人工智能模型,并使用所有企業(yè)數(shù)據(jù)。

現(xiàn)代數(shù)據(jù)倉庫匯集了任何規(guī)模的數(shù)據(jù),通過分析儀表板、運營報告或高級分析提供洞察力。

數(shù)據(jù)湖附近的倉庫

這些場景的復雜性就是數(shù)據(jù)倉庫和數(shù)據(jù)湖之間的界限開始在云中看起來有些混亂的原因。傳統(tǒng)的數(shù)據(jù)倉庫允許企業(yè)從多個來源獲取數(shù)據(jù),并使用ETL轉換將該數(shù)據(jù)放入單個模式和單個數(shù)據(jù)模型中,該軟件旨在回答組織計劃一遍又一遍地提出的問題。

這些來源不必是結構化的關系數(shù)據(jù):SQL Server和Azure DW中的PolyBase和JSON支持意味著組織可以連接來自非關系存儲的數(shù)據(jù),如HDFS、Cosmos DB、MySQL、MongoDB以及Oracle、Teradata、PostgreSQL。這意味著數(shù)據(jù)倉庫(甚至SQL Server)看起來更像數(shù)據(jù)湖。

通過數(shù)據(jù)湖,組織可以獲取多個數(shù)據(jù)存儲,包括結構化和非結構化數(shù)據(jù)存儲,并以其本機格式或接近該格式的方式存儲它們,因此組織可以擁有多個數(shù)據(jù)模型和多個數(shù)據(jù)模式,并且能夠靈活地從同一數(shù)據(jù)中問出新問題(用于Azure Data Lake查詢的SQL變體稱為U-SQL,不僅僅因為它是T-SQL之后的下一個版本,而且因為組織可能需要一個U-boat進入數(shù)據(jù)湖,并找出隱藏在黑暗深處的東西。)

如果組織有問題需要反復詢問(例如銷售分析或監(jiān)控儀表板的交付時間),組織可以從數(shù)據(jù)的相關部分創(chuàng)建數(shù)據(jù)倉庫。但如果問題隨著時間的推移而發(fā)生變化,或者組織需要提出新問題,可以返回數(shù)據(jù)湖,在那里保存原始數(shù)據(jù),并創(chuàng)建另一個數(shù)據(jù)倉庫來回答這些問題。

這兩者的結合是微軟公司通過現(xiàn)代數(shù)據(jù)倉庫基礎設施的意義。組織可以從不同的地方獲取各種數(shù)據(jù),在數(shù)據(jù)湖中使用它來進行實時分析,或者使用機器學習來發(fā)現(xiàn)模式,告訴組織可以從數(shù)據(jù)中獲得哪些見解,并將其與熟悉的數(shù)據(jù)相結合數(shù)據(jù)倉庫工具有效地回答這些問題。

微軟公司沒有為所有這些服務提供單一服務。組織可以使用各種Azure服務執(zhí)行不同的部分,這意味著組織可以選擇所需的部分,但這也意味著組織需要擁有數(shù)據(jù)專業(yè)知識來構建自己的特定系統(tǒng)。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉