www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 為什么很多公司仍在努力構(gòu)建從采集數(shù)據(jù)到獲得洞察力的平穩(wěn)運(yùn)行的管道?他們希望投資和采用機(jī)器學(xué)習(xí)算法來分析數(shù)據(jù),并做出商業(yè)預(yù)測。 但是,不可避免的是,他們應(yīng)該意識到算法并不是魔法:如果采用的

為什么很多公司仍在努力構(gòu)建從采集數(shù)據(jù)到獲得洞察力的平穩(wěn)運(yùn)行的管道?他們希望投資和采用機(jī)器學(xué)習(xí)算法來分析數(shù)據(jù),并做出商業(yè)預(yù)測。

但是,不可避免的是,他們應(yīng)該意識到算法并不是魔法:如果采用的是垃圾數(shù)據(jù),得出的就不會是一流的見解。因此,他們雇傭了一些數(shù)據(jù)科學(xué)家,但通常他們90%的時間都花在數(shù)據(jù)清潔上,只剩下10%的時間來完成分析工作。

這個過程的缺點還在于企業(yè)喜歡采用終端算法的機(jī)器學(xué)習(xí)。Tamr公司的聯(lián)合創(chuàng)始人兼執(zhí)行官Andy Palmer表示,他們應(yīng)該在數(shù)據(jù)早期清潔階段盡可能地應(yīng)用機(jī)器學(xué)習(xí),而不是依靠工作人員來處理龐大的數(shù)據(jù)集。該公司幫助組織使用機(jī)器學(xué)習(xí)突破他們的數(shù)據(jù)孤島。

許多公司在大數(shù)據(jù)收集系統(tǒng)上花費了大量資金。他們強(qiáng)調(diào)的是數(shù)據(jù)數(shù)量而非質(zhì)量,這是顯而易見的。

Palmer說:“在大公司工作的人都可以告訴你,他們從大多數(shù)內(nèi)部系統(tǒng)獲得的數(shù)據(jù)很簡單,簡單明了?!?/p>

Tamr公司聯(lián)合創(chuàng)始人兼技術(shù)官Andy Palmer和SiliconSLE Media公司移動直播工作室CUBE的主持人Michael Stonebraker與Dave Vellante和Paul Gillin在會上進(jìn)行了探討,他們最近參加了在馬薩諸塞州劍橋舉行的麻省理工學(xué)院CDOIQ研討會。他們探討了大數(shù)據(jù)采用機(jī)器學(xué)習(xí)技術(shù),以及為什么Tamr認(rèn)為初創(chuàng)公司會比傳統(tǒng)公司提供更好、更具可擴(kuò)展性的大數(shù)據(jù)解決方案的原因。

大數(shù)據(jù)的清理和組織

Palmer和Stonebraker多年來一直關(guān)注大數(shù)據(jù)技術(shù)。早在2007年,他們就預(yù)測ApacheHadoop大數(shù)據(jù)框架不會帶來很多人所期望的結(jié)果。

Palmer說,“有人說大數(shù)據(jù)將是一場災(zāi)難,這有些太激進(jìn)了?!?/p>

他表示,這并不是說大數(shù)據(jù)集不好,顯然大數(shù)據(jù)是訓(xùn)練分析模型和人工智能的必要工具。有些人認(rèn)為,只要數(shù)據(jù)量夠大,其余的分析或人工智能方面就會到位,但這讓很多公司都感到失望。

企業(yè)現(xiàn)在意識到數(shù)據(jù)質(zhì)量不可忽視。他們還知道,數(shù)據(jù)科學(xué)家不應(yīng)該花費80%到90%或更多的時間清理數(shù)據(jù),須采用一種更好、更快的人工智能方法用于分析數(shù)據(jù)。

Palmer表示,其答案是將機(jī)器學(xué)習(xí)視為一種很實用的工具,用于執(zhí)行這些龐大而無趣的任務(wù)。許多供應(yīng)商使用機(jī)器學(xué)習(xí)來使預(yù)測、推薦引擎等軟件的營銷更具吸引力。Tamr公司將其用于不具吸引力的事情:在一些人分析、預(yù)測、營銷或銷售一些東西之前清理和組織大數(shù)據(jù)。

機(jī)器學(xué)習(xí)可以大規(guī)模處理數(shù)據(jù)

如今,并不缺乏針對數(shù)據(jù)沼澤問題的建議解決方案。許多科技公司正在推出或更新其原始產(chǎn)品。然而,Stonebraker指出,這些系統(tǒng)中通常使用的主要技術(shù)存在關(guān)鍵缺陷。這些傳統(tǒng)技術(shù)包括ETL(提取、轉(zhuǎn)換、加載)系統(tǒng)和主數(shù)據(jù)管理系統(tǒng)。但其缺點是不能擴(kuò)展。

ETL基于這樣一個前提:明智的企業(yè)會為用戶想要的數(shù)據(jù)源提供全局?jǐn)?shù)據(jù)模型。然后讓每個業(yè)務(wù)部門查看他們獲得了哪些數(shù)據(jù),如何在全局?jǐn)?shù)據(jù)模型中獲取數(shù)據(jù),將其加載到數(shù)據(jù)倉庫中等等。Stonebraker表示,人工密集型流程往往無法擴(kuò)展。他們通常會在數(shù)據(jù)倉庫中集成10或20個數(shù)據(jù)源。

那么這些數(shù)據(jù)足夠嗎?以現(xiàn)實世界中的一家公司為例。TAMR公司的客戶豐田汽車歐洲(TME)公司在各國都有經(jīng)銷商。如果有人在西班牙買了一輛豐田汽車,然后將其開到法國,那么其在法國的經(jīng)銷商對此一無所知。

總的來說,豐田汽車歐洲(TME)公司擁有250個獨立的客戶數(shù)據(jù)庫,擁有使用50種語言的4000萬條記錄。該公司正在將它們集成到單個客戶數(shù)據(jù)庫中,以解決此客戶的服務(wù)問題。機(jī)器學(xué)習(xí)提供了一種合理的方法來實現(xiàn)這一目標(biāo)。Stonebraker說,“我從未見過能夠處理這種規(guī)模的ETL系統(tǒng)?!?/p>

Stonebraker解釋說,主數(shù)據(jù)管理(MDM)無法擴(kuò)展的原因主要是因為它是基于規(guī)則的。通用電氣公司是Tamr公司的另一家客戶,希望對其交易支出進(jìn)行分析,該公司在去年有2000萬筆交易支出,希望將所有這些分類為基于規(guī)則的層次結(jié)構(gòu)。

“所以通用電氣公司制定了500條規(guī)則,只采用了18條規(guī)則就將2000萬筆交易中的200萬筆進(jìn)行了分類,但其余的400多條規(guī)則并不會像那18條規(guī)則那樣更快地進(jìn)行分類?!?/p>

他指出,這是收益遞減規(guī)律。他說,“企業(yè)將不得不寫出大量無法理解的規(guī)則,如果不使用機(jī)器學(xué)習(xí)技術(shù),那么將會不堪重負(fù)?!?/p>

Stonebraker承認(rèn),機(jī)器學(xué)習(xí)技術(shù)不是萬能的。真正的數(shù)據(jù)驅(qū)動需要技術(shù)和文化的調(diào)整。事實上,據(jù)NewVantage Partners 公司的一項研究,77%的受訪企業(yè)高管表示,盡管有大量新軟件涌入市場,他們的組織很難采用大數(shù)據(jù)/人工智能計劃。但這比去年的調(diào)查有所增加。這些高管列舉了采用機(jī)器學(xué)習(xí)的一些障礙,其中95%是文化或組織方面的障礙,而不是技術(shù)方面的障礙。Gartner公司分析師NickHeudecker說:“企業(yè)需要為此制定一個計劃,但大多數(shù)公司不會把大數(shù)據(jù)技術(shù)進(jìn)行計劃和處理。”

Stonebraker表示,盡管如此,技術(shù)仍然很重要,并且可能在某種程度上述案例顯示了通用電氣公司數(shù)據(jù)科學(xué)家如何在高達(dá)90%的時間內(nèi)過濾和分類,而不是致力于混合動力汽車或燃?xì)廨啓C(jī)的開發(fā)和維修。如果大數(shù)據(jù)對于現(xiàn)實世界的企業(yè)來說是實用的,那么機(jī)器學(xué)習(xí)就是前進(jìn)的方向。

他說,“須用機(jī)器學(xué)習(xí)取代人類,因為人們都明白,大規(guī)模傳統(tǒng)的數(shù)據(jù)集成技術(shù)根本不起作用?!?/p>

很多企業(yè)正在考慮這一點,并將機(jī)器學(xué)習(xí)打造成他們產(chǎn)品的核心。Stonebraker說:“總的來說,傳統(tǒng)的供應(yīng)商落后于時代10年,而創(chuàng)業(yè)公司可以提供尖端的產(chǎn)品?!?/p>

這種“尖端”的東西是否提供了一種簡便的數(shù)據(jù)貨幣化途徑?是否會彌補(bǔ)在數(shù)據(jù)沼澤中浪費的時間?

Palmer指出,“我們正進(jìn)入一個更快消耗數(shù)據(jù)的階段。這一階段是否會最終滿足企業(yè)數(shù)據(jù)倉庫的高期望?我不知道。但可以肯定離它越來越近了?!?/p>

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉