機器學習為何重要?機器學習落地時存在哪些挑戰(zhàn)?
機器學習將是下述內(nèi)容的主要介紹對象,通過這篇文章,小編希望大家可以對機器學習的相關情況以及信息有所認識和了解,詳細內(nèi)容如下。
一、機器學習為何重要
人工智能將比任何其他創(chuàng)新更有能力塑造我們的未來,任何不了解它的人很快就會發(fā)現(xiàn)自己被拋在后面。
在經(jīng)過多個人工智能冬天和“虛假繁榮”之后,數(shù)據(jù)存儲和計算機處理能力的快速發(fā)展極大地改變了游戲規(guī)則。
機器學習已經(jīng)對計算機視覺(機器識別圖像或視頻中對象的能力)做出了巨大改進。例如,您收集了幾十萬甚至幾百萬張圖片,需要分別給它們貼上標簽,比如要給有貓的圖片貼上標簽,然后,該算法試圖建立一個模型,可以準確無誤地給每一張有貓的圖片貼上標簽。一旦精度足夠高,機器就能“了解”貓的樣子。
為了在收集數(shù)據(jù)時立即進行分析,以準確識別先前已知和先前從未見過的新模式,還必須使用能夠生成和聚合這些大數(shù)據(jù)的機器來了解每個患者的正常行為,并跟蹤、發(fā)現(xiàn)和標記任何可能表明嚴重健康問題的異常內(nèi)容。
物聯(lián)網(wǎng)的實現(xiàn)依賴于能夠獲得隱藏在廣闊且不斷增長的數(shù)據(jù)海洋中的洞察力。由于目前的方法不能擴展到物聯(lián)網(wǎng)的規(guī)模,因此,實現(xiàn)物聯(lián)網(wǎng)承諾的未來依賴于機器學習來發(fā)現(xiàn)模式、相關性和異常,而這些模式、相關性和異常有可能會改善我們?nèi)粘I畹乃蟹矫妗?
機器學習是我們走向人工智能之旅的核心,與此同時,它將改變每個行業(yè),并對我們的日常生活產(chǎn)生巨大影響。
二、機器學習落地時存在哪些挑戰(zhàn)
在這部分,我們主要來了解一下當機器學習落地時,存在哪些挑戰(zhàn)。
在實際業(yè)務落地過程中,大部分大型云平臺提供商均已提供機器學習算力等資源服務,同時支持多種機器學習框架等以提供開放靈活的部署環(huán)境。但是,機器學習模型所需的數(shù)據(jù)往往并非從云平臺中產(chǎn)生,而是從傳感器、手機、網(wǎng)關等邊緣設備中產(chǎn)生。數(shù)據(jù)從邊側(cè)產(chǎn)生,而云端需從邊側(cè)采集數(shù)據(jù)以訓練和不斷完善機器學習模型。
在實際落地時,當前機器學習需面對以下問題:
1、海量設備數(shù)據(jù)導致延遲和成本問題
假設即使有100 Mbps的專網(wǎng)連接,將10TB的數(shù)據(jù)運送到云端也需要10天。面對大量邊緣連接設備每天生成數(shù)百兆字節(jié)甚至TB數(shù)據(jù),帶來的延遲和成本對客戶和服務提供方來說往往是難以承受的;
2、數(shù)據(jù)壓縮導致的延遲和精度問題
正因遷移所有數(shù)據(jù)通常不切實際,往往需要對數(shù)據(jù)進行“壓縮”(如特征工程、難例識別等)并傳輸?shù)皆贫?,而?shù)據(jù)壓縮過程容易引入新的延遲。壓縮數(shù)據(jù)不一定能完全代表完整數(shù)據(jù)集信息,容易導致精度損失。
3、邊側(cè)數(shù)據(jù)隱私和計算實時性問題
邊側(cè)數(shù)據(jù)與資源等具備地理分布性。隱私和網(wǎng)絡瓶頸導致數(shù)據(jù)集天然分割, 傳統(tǒng)集中式機器學習在邊緣情況下性能將顯著下降;單個邊側(cè)資源受限且異構(gòu)(算力、供電、場地等均受限),相對云上資源建設與維護成本更高。
上述問題的本質(zhì)來源是數(shù)據(jù)在邊緣產(chǎn)生,而算力卻在云端更為充足。也就是說,機器學習服務將邊緣產(chǎn)生的數(shù)據(jù)轉(zhuǎn)換為知識的過程中,一方面需要在邊緣快速響應并處理本地產(chǎn)生的數(shù)據(jù),另一方面需要云上算力與開發(fā)環(huán)境的支持。隨著邊緣設備數(shù)量指數(shù)級增長以及設備性能的提升,邊云協(xié)同機器學習應運而生,以期打通機器學習的最后一公里。
最后,小編誠心感謝大家的閱讀。你們的每一次閱讀,對小編來說都是莫大的鼓勵和鼓舞。希望大家對機器學習已經(jīng)具備了初步的認識,最后的最后,祝大家有個精彩的一天。