www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 智能硬件 > 人工智能AI
[導(dǎo)讀] 在過(guò)去的幾年間,數(shù)據(jù)社區(qū)已經(jīng)在關(guān)注收集和整理數(shù)據(jù),為此目的構(gòu)建基礎(chǔ)設(shè)施,并使用數(shù)據(jù)來(lái)改善決策制定?,F(xiàn)在我們看到,在很多垂直領(lǐng)域,對(duì)于高級(jí)分析和機(jī)器學(xué)習(xí)的興趣高漲。 在本博文里,我會(huì)分享和

在過(guò)去的幾年間,數(shù)據(jù)社區(qū)已經(jīng)在關(guān)注收集和整理數(shù)據(jù),為此目的構(gòu)建基礎(chǔ)設(shè)施,并使用數(shù)據(jù)來(lái)改善決策制定?,F(xiàn)在我們看到,在很多垂直領(lǐng)域,對(duì)于高級(jí)分析和機(jī)器學(xué)習(xí)的興趣高漲。

在本博文里,我會(huì)分享和解釋我在今年9月的Strata數(shù)據(jù)紐約大會(huì)上的演講,以此來(lái)為那些希望增加機(jī)器學(xué)習(xí)能力的企業(yè)提供一些建議。這些信息來(lái)自于和業(yè)界從業(yè)人員、研究人員和企業(yè)家的對(duì)話,他已經(jīng)把機(jī)器學(xué)習(xí)應(yīng)用在非常多的不同領(lǐng)域的問(wèn)題里。

和其他的技術(shù)與方法類似,一個(gè)成功的機(jī)器學(xué)習(xí)項(xiàng)目是從找到一個(gè)正確的應(yīng)用場(chǎng)景開(kāi)始的。機(jī)器學(xué)習(xí)有非常多可能的應(yīng)用,例如推薦系統(tǒng)和降低客戶流失等。一個(gè)有用的機(jī)器學(xué)習(xí)應(yīng)用的分類如下:

能增強(qiáng)決策制定的應(yīng)用

能帶來(lái)業(yè)務(wù)運(yùn)營(yíng)改進(jìn)的應(yīng)用

能產(chǎn)生收入的應(yīng)用

能預(yù)測(cè)或者防止欺詐或風(fēng)險(xiǎn)的應(yīng)用

為了能成為“機(jī)器學(xué)習(xí)型企業(yè)”,讓你自己了解開(kāi)始部署模型時(shí)將會(huì)面臨的困難是非常有益處的。如果你去咨詢那些機(jī)器學(xué)習(xí)的先行者,通常會(huì)得到如下三個(gè)東西:

數(shù)據(jù):目前大部分應(yīng)用個(gè)都依賴于監(jiān)督學(xué)習(xí)。因此一切都要從擁有高質(zhì)量的標(biāo)注(訓(xùn)練)數(shù)據(jù)集開(kāi)始。

工程化:你怎么能把一個(gè)原型變成生產(chǎn)系統(tǒng)?你如何在模型部署上線之后監(jiān)控它的表現(xiàn)?

模型:現(xiàn)在的機(jī)器學(xué)習(xí)庫(kù)已經(jīng)能把模型和數(shù)據(jù)適配變得很容易,那還有什么挑戰(zhàn)?

在文章下面的內(nèi)容里,我會(huì)逐個(gè)講述這些挑戰(zhàn)。

在構(gòu)建標(biāo)注數(shù)據(jù)集來(lái)訓(xùn)練你的機(jī)器學(xué)習(xí)模型時(shí),重要的一點(diǎn)就是使用你已經(jīng)能找到的數(shù)據(jù)。新的數(shù)據(jù)源在持續(xù)地出現(xiàn),數(shù)據(jù)集成是大部分公司都在做的工作。你目前在數(shù)據(jù)基礎(chǔ)設(shè)施上的投入可能已經(jīng)給你足夠的數(shù)據(jù)來(lái)開(kāi)始了。你也可以使用公共(開(kāi)源)的數(shù)據(jù)來(lái)增強(qiáng)你現(xiàn)有的數(shù)據(jù)集,或是去從第三方購(gòu)買數(shù)據(jù)來(lái)增強(qiáng)。

好消息是機(jī)器學(xué)習(xí)社區(qū)已經(jīng)意識(shí)到訓(xùn)練數(shù)據(jù)是一個(gè)主要的瓶頸。研究人員已經(jīng)在研究一些能用比較少的訓(xùn)練數(shù)據(jù)開(kāi)始的技術(shù)(弱監(jiān)督),以及可以讓你把一個(gè)問(wèn)題里獲得的知識(shí)用于另外的場(chǎng)景(遷移學(xué)習(xí))。

隨著數(shù)據(jù)重要性的增加,已有一些創(chuàng)業(yè)公司和企業(yè)在探索數(shù)據(jù)交易。數(shù)據(jù)交易讓企業(yè)間相互分享一些數(shù)據(jù)成為可能,同時(shí)還能保證私密性和隱秘性。目前已經(jīng)有一些研究成果來(lái)開(kāi)發(fā)安全機(jī)器學(xué)習(xí)算法。對(duì)一些應(yīng)用,如消費(fèi)金融業(yè)里的欺詐檢查,能在保證隱私和安全的情況下,分享私密數(shù)據(jù)可能被證明是有價(jià)值的。

今年早些時(shí)候,我們注意到企業(yè)已經(jīng)開(kāi)始定位一個(gè)新的角色,它專門把機(jī)器學(xué)習(xí)的模型進(jìn)行生產(chǎn)化部署,并監(jiān)控部署后的表現(xiàn)。但是這個(gè)機(jī)器學(xué)習(xí)工程師的角色就真的必要嗎?

對(duì)越來(lái)越多的公司來(lái)講,答案是肯定,這樣的專業(yè)技能是必須的。如果要列出一個(gè)能生產(chǎn)化并監(jiān)督模型必須了解的事情的清單,最后你會(huì)看到一堆工具和技術(shù)的列表。更具體的細(xì)節(jié),建議你看看我之前的一篇博文《應(yīng)用數(shù)據(jù)科學(xué)的現(xiàn)狀》。

機(jī)器學(xué)習(xí)研究的發(fā)展速度是很快的。可以公平地說(shuō),大部分企業(yè)是無(wú)法跟上研究出新技術(shù)和工具的速度。思考一下這個(gè)思維試驗(yàn):想象一下未來(lái)五年,所有的研究進(jìn)展都暫停(絕不可能,但是請(qǐng)?jiān)试S我幽默一下)。我堅(jiān)定地認(rèn)為依然有足夠的工具能讓企業(yè)忙活一陣子來(lái)學(xué)習(xí)。

用深度學(xué)習(xí)這一已經(jīng)成功地應(yīng)用于計(jì)算機(jī)視覺(jué)和語(yǔ)音的技術(shù)作例子。絕大部分的企業(yè)依然處于應(yīng)用深度學(xué)習(xí)的早期階段,不管是把它用于企業(yè)已經(jīng)熟悉的數(shù)據(jù)(文本、時(shí)間序列數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù))或是使用它來(lái)代替現(xiàn)有的模型(包括他們現(xiàn)有的推薦系統(tǒng))。我認(rèn)為在未來(lái)的幾年里會(huì)看到很多使用深度神經(jīng)網(wǎng)絡(luò)(DNN)的有趣案例。

深度學(xué)習(xí)帶來(lái)了所有令人激動(dòng)的東西,但也因此我們時(shí)常會(huì)忘記還有很多有趣的新數(shù)據(jù)應(yīng)用并不依賴于神經(jīng)網(wǎng)絡(luò)。請(qǐng)選擇適合你的技術(shù)和業(yè)務(wù)需求的那些技術(shù)。

隨著模型被推入邊緣設(shè)備,我對(duì)近期在聯(lián)合與協(xié)作學(xué)習(xí)方面的研究進(jìn)展非常感興趣。展望AI,可獲得的在線和持續(xù)學(xué)習(xí)的工具將會(huì)變得非常重要。

數(shù)據(jù)社區(qū)正在開(kāi)始明白對(duì)于模型而言,遠(yuǎn)遠(yuǎn)不僅僅只是優(yōu)化一個(gè)定量或是業(yè)務(wù)指標(biāo)那么簡(jiǎn)單。模型足夠魯棒從而能應(yīng)對(duì)對(duì)抗攻擊嗎?對(duì)特定的應(yīng)用模型來(lái)說(shuō),可解釋與可理解是必須的嗎?

公平:你是否理解你的訓(xùn)練數(shù)據(jù)的分布?如果不是的話,請(qǐng)意識(shí)到過(guò)去的歧視將很有可能導(dǎo)致未來(lái)的歧視。

透明:隨著機(jī)器學(xué)習(xí)變得無(wú)處不在,用戶正越來(lái)越想知道企業(yè)在對(duì)什么指標(biāo)進(jìn)行優(yōu)化,并想對(duì)此發(fā)表意見(jiàn)。

盡管機(jī)器學(xué)習(xí)領(lǐng)域在近幾年已經(jīng)取得了很多進(jìn)步,但是依然有很多研究人員和理論家不知道的東西。我們尚處在“試錯(cuò)”的階段。深度學(xué)習(xí)可能是降低了特征工程的必要,但是在構(gòu)建深度神經(jīng)網(wǎng)絡(luò)時(shí)依然有很多需要決定的東西(包括網(wǎng)絡(luò)架構(gòu)和非常多的超參數(shù))。

可以把模型的構(gòu)建看成是對(duì)機(jī)器學(xué)習(xí)算法空間的探索。企業(yè)需要能以有原則和高效的形式來(lái)進(jìn)行探索。這意味著企業(yè)要維護(hù)可再生的管道、保存試驗(yàn)里的元數(shù)據(jù)、擁有協(xié)作的工具和利用最新的研究成果。

那么,企業(yè)正在構(gòu)建的什么東西可以讓這一探索成為可能?大部分機(jī)器學(xué)習(xí)都要求有標(biāo)注(訓(xùn)練)數(shù)據(jù),因此任何數(shù)據(jù)平臺(tái)開(kāi)始都要有魯棒的數(shù)據(jù)管道,能夠把數(shù)據(jù)導(dǎo)入存儲(chǔ)系統(tǒng),讓數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師可以使用。數(shù)據(jù)集成不是一件無(wú)足輕重的事情,是所有的企業(yè)都要做并會(huì)持續(xù)做的工作。

企業(yè)也正在賦能數(shù)據(jù)科學(xué)家來(lái)分享特征和能產(chǎn)生這些特征的數(shù)據(jù)管道。為了給你一個(gè)關(guān)于特征的重要性的概念,看看這個(gè)事實(shí):大部分企業(yè)都能很容易地告訴你它們用了什么算法;但是他們卻很難描述哪些特征對(duì)模型最有用。

領(lǐng)先的企業(yè)讓他們的數(shù)據(jù)科學(xué)家使用多種機(jī)器學(xué)習(xí)庫(kù)。強(qiáng)迫你的數(shù)據(jù)科學(xué)家只使用一到兩個(gè)“保佑”過(guò)的庫(kù)時(shí)很瘋狂的。因?yàn)閿?shù)據(jù)科學(xué)家們要能做實(shí)驗(yàn),這可能就意味著讓他們能使用多種庫(kù)。

已經(jīng)出現(xiàn)了一些公司,他們能提供生產(chǎn)化部署機(jī)器學(xué)習(xí)模型的工具,并可以在部署后監(jiān)控模型。一些企業(yè)也在利用開(kāi)源技術(shù)來(lái)開(kāi)發(fā)自己的部署和監(jiān)控工具。如果你在尋找一個(gè)開(kāi)源的工具來(lái)部署和監(jiān)控模型,可以看看加州大學(xué)伯克利分校RISE實(shí)驗(yàn)室的新項(xiàng)目——Clipper。它可以讓你很容易地部署用多種流行的機(jī)器學(xué)習(xí)庫(kù)編寫(xiě)的模型。更為重要的是,Clipper團(tuán)隊(duì)最近加入了模型的監(jiān)控部分。(一些企業(yè)將會(huì)在2018年3月的Strata數(shù)據(jù)圣何塞大會(huì)上介紹他們部署和監(jiān)控模型的方法。)

想成為“機(jī)器學(xué)習(xí)型企業(yè)”, 你需要工具和流程來(lái)克服數(shù)據(jù)、工程和模型方面的挑戰(zhàn)。很多企業(yè)僅僅是剛開(kāi)始在他們的產(chǎn)品里使用和部署機(jī)器學(xué)習(xí)。工具正在被持續(xù)地改進(jìn),最佳實(shí)踐也開(kāi)始出現(xiàn)。

This arTIcle originally appeared in English: “How companies can navigate the age of machine learning”。

Ben Lorica是O‘Reilly Media公司的首席數(shù)據(jù)科學(xué)家和數(shù)據(jù)內(nèi)容策略總監(jiān),他還是Strata數(shù)據(jù)大會(huì)和O’Reilly人工智能大會(huì)的項(xiàng)目主管。他將商務(wù)智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)分析應(yīng)用到了各種領(lǐng)域,包括直接營(yíng)銷、消費(fèi)者和市場(chǎng)研究、精確廣告投放、文本挖掘以及金融工程。他曾在投資管理公司、互聯(lián)網(wǎng)創(chuàng)業(yè)公司以及金融服務(wù)業(yè)任職。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉