細(xì)數(shù)2018年全球AI突破性技術(shù)
2018年人工智能技術(shù)已在多方面實(shí)現(xiàn)突破進(jìn)展,國(guó)內(nèi)外的科技公司都在不斷嘗試將人工智能應(yīng)用于更多領(lǐng)域,不論科技巨頭還是初創(chuàng)企業(yè),都在致力于不斷創(chuàng)新,推動(dòng)技術(shù)進(jìn)步,接下來(lái)我們就來(lái)看看十項(xiàng)中外人工智能領(lǐng)域富有突破性的技術(shù)。
基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯
入選理由:翻譯是“自然語(yǔ)言處理”的最重要分支,也是比較難的一支。早年間,機(jī)器翻譯還被視作 “低級(jí)翻譯”被嘲諷,如今神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯準(zhǔn)確性大大提高,堪比專業(yè)人工翻譯。我們熟知的谷歌翻譯、微軟語(yǔ)音翻譯以及搜狗語(yǔ)音識(shí)別等都是基于此項(xiàng)技術(shù)。
技術(shù)突破:機(jī)器翻譯是科研人員攻堅(jiān)了數(shù)十年的研究領(lǐng)域,其技術(shù)核心是一個(gè)擁有海量結(jié)點(diǎn)的深度神經(jīng)網(wǎng)絡(luò),可以自動(dòng)的從語(yǔ)料庫(kù)中學(xué)習(xí)翻譯知識(shí)。
今年3月,微軟宣布其研發(fā)的機(jī)器翻譯系統(tǒng)首次在通用新聞的漢譯英上達(dá)到了人類專業(yè)水平,實(shí)現(xiàn)了自然語(yǔ)言處理的又一里程碑突破,將機(jī)器翻譯超越人類業(yè)余譯者的時(shí)間,提前了整整7年。
重大意義:基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯,直接改善了之前逐詞直譯的效果,升級(jí)為以整個(gè)句子為單位進(jìn)行翻譯。
基于多傳感器跨界融合的機(jī)器人自主導(dǎo)航
入選理由:機(jī)器人的終極目標(biāo)是為人類提供智能化的服務(wù),其中自主導(dǎo)航是近年來(lái)人類一直想要攻克的技術(shù)壁壘,臻迪(PowerVision)通過(guò)聲吶、視覺(jué)等多傳感器融合,使其水下機(jī)器人能實(shí)現(xiàn)自主導(dǎo)航及智能識(shí)別,在智能機(jī)器人領(lǐng)域內(nèi)取得了突破性進(jìn)展。
技術(shù)突破:隨著機(jī)器人的應(yīng)用場(chǎng)景及作業(yè)任務(wù)越來(lái)越復(fù)雜,單一傳感器難以滿足應(yīng)用需求。而多傳感器的信息融合對(duì)硬件資源依賴程度比較高,臻迪(PowerVision)基于自身在機(jī)器人行業(yè)深耕細(xì)作多年所積累的各類傳感器、慣性導(dǎo)航、運(yùn)動(dòng)控制、相機(jī)、視覺(jué)檢測(cè)/識(shí)別、SLAM等核心技術(shù),以及深度學(xué)習(xí)的深入研究,通過(guò)嵌入式端一體化集成平臺(tái)的系統(tǒng)架構(gòu)及優(yōu)化設(shè)計(jì),突破了移動(dòng)平臺(tái)硬件資源的限制,使水下機(jī)器人更加準(zhǔn)確、智能、全面地感知目標(biāo),并具備對(duì)水下目標(biāo)進(jìn)行鎖定、檢測(cè)、識(shí)別、跟隨的能力。
重大意義:通過(guò)導(dǎo)航控制、聲吶、視覺(jué)技術(shù)與深度學(xué)習(xí)的結(jié)合實(shí)現(xiàn)了機(jī)器人在全局環(huán)境中的定位及自主導(dǎo)航,以及智能化應(yīng)用,為人類探索更為廣闊的水下應(yīng)用提供了強(qiáng)有力的技術(shù)保障。
DuerOS對(duì)話式人工智能系統(tǒng)
入選理由:DuerOS3.0能夠?yàn)橛脩魩?lái)了劃時(shí)代的自然對(duì)話交互,包括情感語(yǔ)音播報(bào)、聲紋識(shí)別等能力在內(nèi)的自然語(yǔ)言交互技術(shù)的全面升級(jí)。
技術(shù)突破:DuerOS是百度度秘事業(yè)部研發(fā)的對(duì)話式AI操作系統(tǒng),擁有10大類目的250多項(xiàng)技能。DuerOS包括了從語(yǔ)音識(shí)別到語(yǔ)音播報(bào)再到屏幕顯示的一個(gè)完整交互流程,以及背后支撐交互的自然語(yǔ)言理解、對(duì)話狀態(tài)控制、自然語(yǔ)言生成、搜索等等核心技術(shù),這些技術(shù)支撐著應(yīng)用層和能力層的實(shí)現(xiàn)。
重大意義:DuerOS率先開(kāi)啟AI時(shí)代商業(yè)化,將為生態(tài)合作伙伴從產(chǎn)品、內(nèi)容與推廣三大方面提供完整的應(yīng)用方案支持,加速AI設(shè)備落地。
移動(dòng)AR技術(shù)
入選理由:未來(lái)AR與AI需要相互加持,可以將AR比喻成AI的眼睛。
技術(shù)突破:集成了眾多計(jì)算機(jī)科技和圖形圖像學(xué)技術(shù),包括實(shí)時(shí)渲染技術(shù)、空間定位追蹤、圖像識(shí)別、人機(jī)交互、顯示技術(shù)、云端存儲(chǔ)、數(shù)據(jù)傳輸、內(nèi)容開(kāi)發(fā)工具等領(lǐng)域。
重大意義:隨著蘋(píng)果 ARKit、谷歌 ARCore 的發(fā)布,移動(dòng)AR在兩大移動(dòng)平臺(tái)上均意義重大。這也意味著,全球 5 億臺(tái)支持 AR 功能的移動(dòng)設(shè)備正在吸引所有的公司入局,這些公司正在將數(shù)據(jù)與 API 相結(jié)合,為用戶創(chuàng)造新的 AR 體驗(yàn)。
生物特征識(shí)別技術(shù)
入選理由:行為識(shí)別技術(shù)應(yīng)用于安防,為安全又上了一道鎖。
技術(shù)突破:店鋪安裝攝像頭已經(jīng)是一件非常普遍的行為,但普通的攝像頭只能紀(jì)錄店鋪內(nèi)人們的行為,如果發(fā)現(xiàn)盜竊需要通過(guò)觀看監(jiān)控記錄人工排查,耗時(shí)費(fèi)力。
重大意義:通過(guò)行為識(shí)別技術(shù),能夠第一時(shí)間發(fā)現(xiàn)犯罪分子,預(yù)測(cè)犯罪行為,有效保護(hù)店鋪安全。
機(jī)器人流程自動(dòng)化
入選理由:機(jī)器人流程自動(dòng)化能夠幫助甚至代替人類負(fù)擔(dān)大量簡(jiǎn)單且單一、重復(fù)而繁重的工作,并且效率更高、零失誤。
技術(shù)突破:機(jī)器人流程自動(dòng)化(RPA)是通過(guò)使用高性能認(rèn)知技術(shù)實(shí)現(xiàn)業(yè)務(wù)的自動(dòng)化和工作的效率。人類只需在操作界面上編寫(xiě)需要人工完成的工作流程,即可處理各種業(yè)務(wù),如瀏覽器,云,以及各種軟件。
重大意義:機(jī)器人流程自動(dòng)化能夠大幅提升企業(yè)的工作效率,減少人員投入,幫助企業(yè)降低成本,讓人類釋放生產(chǎn)力,騰出雙手去做價(jià)值更高的事情。
像素級(jí)聲源定位系統(tǒng)PixelPlayer
入選理由:從視覺(jué)和聽(tīng)覺(jué)信號(hào)角度實(shí)現(xiàn)聲源分離,開(kāi)辟研究新途徑。
技術(shù)突破:在進(jìn)行音樂(lè)編輯時(shí),一般是利用均衡器將音樂(lè)中的低音部分調(diào)出來(lái),而麻省理工學(xué)院計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室的研究人員發(fā)現(xiàn)了更好的解決方案。他們所研發(fā)的新系統(tǒng)PixelPlayer。
PixelPlayer能夠通過(guò)結(jié)合聲音和圖像信息,機(jī)器學(xué)習(xí)系統(tǒng)能以無(wú)監(jiān)督的方式從圖像或聲音中識(shí)別目標(biāo)、定位圖像中的目標(biāo),以及分離目標(biāo)產(chǎn)生的聲音。當(dāng)我們給定一個(gè)輸入視頻,PixelPlayer可以聯(lián)合地將配音分離為目標(biāo)組件以及在圖像幀上定位目標(biāo)組件。PixelPlayer 允許在視頻的每個(gè)像素上定位聲源。
重大意義:PixelPlayer能夠過(guò)濾伴奏、識(shí)別音源,不僅能幫助人類處理音樂(lè),還能夠幫助機(jī)器人更好地理解其他物體所產(chǎn)生的環(huán)境聲音。
兼顧高精度學(xué)習(xí)和低精度推理的深度學(xué)習(xí)芯片
入選理由:這個(gè)芯片可以涵蓋了目前已知的最佳訓(xùn)練和最好推理,能夠保持所有處理器組件能夠得到數(shù)據(jù)和工作。
技術(shù)突破:該深度學(xué)習(xí)芯片是IBM正在研究的項(xiàng)目之一。IBM將這個(gè)芯片的目標(biāo)利用率定在90%。這將是一個(gè)質(zhì)的突破,為了實(shí)現(xiàn)這一突破,IBM的研發(fā)團(tuán)隊(duì)做了兩項(xiàng)創(chuàng)新。
重大意義:該芯片可以執(zhí)行當(dāng)前所有的三種主要深度學(xué)習(xí)AI:卷積神經(jīng)網(wǎng)絡(luò)(CNN)、多層感知器(MLP)和長(zhǎng)-短期記憶(LSTM)。這些技術(shù)共同主導(dǎo)了語(yǔ)言、視覺(jué)和自然語(yǔ)言處理。
智能代理訓(xùn)練平臺(tái)
入選理由:智能代理技術(shù)使計(jì)算機(jī)應(yīng)用趨向人性化、個(gè)性化。它能夠以主動(dòng)服務(wù)的方式完成的一組操作的機(jī)動(dòng)計(jì)算實(shí)體,不需要人的即時(shí)干預(yù)。
技術(shù)突破:智能代理技術(shù)具有解決問(wèn)題所需的豐富知識(shí)、策略和相關(guān)數(shù)據(jù),能夠進(jìn)行相關(guān)的推理和智能計(jì)算,智能代理還可以在用戶沒(méi)有給出十分明確的需求時(shí)推測(cè)出用戶的意圖、興趣或愛(ài)好,并按最佳方式代為其完成任務(wù),并能自動(dòng)拒絕一些不合理或可能給用戶帶來(lái)危害的要求;智能代理還從經(jīng)驗(yàn)中不斷自我學(xué)習(xí),能夠根據(jù)環(huán)境調(diào)整自身的行為,從而提高處理問(wèn)題的能力。
重大意義:Unity以使機(jī)器學(xué)習(xí)研究人員獲得最強(qiáng)大的訓(xùn)練場(chǎng)景為使命,為快速增長(zhǎng)的AI愛(ài)好者群體探索深度學(xué)習(xí)提供了一個(gè)研究平臺(tái)。
入耳式人工智能
入選理由:耳機(jī)從外變成了智能穿戴設(shè)備,可以無(wú)限延續(xù)使用時(shí)間和場(chǎng)景。
技術(shù)突破:蘋(píng)果在今年即將推出的AirPods 2中加入了Siri喚起、內(nèi)置芯片等等,可以收集行走步數(shù)、心率數(shù)據(jù)和體溫等等,還可以通過(guò)內(nèi)置陀螺儀捕捉用戶頭部移動(dòng)狀況甚至定位位置,當(dāng)然也可以通過(guò)麥克風(fēng)接受命令,再通過(guò)揚(yáng)聲器進(jìn)行反饋。
重大意義:智能耳機(jī)讓智能助理更接近隨身隨行,蘋(píng)果、谷歌的涉足,必將帶起一波耳中AI的風(fēng)潮。