2018年人工智能技術(shù)已在多方面實現(xiàn)突破進展,國內(nèi)外的科技公司都在不斷嘗試將人工智能應(yīng)用于更多領(lǐng)域,不論科技巨頭還是初創(chuàng)企業(yè),都在致力于不斷創(chuàng)新,推動技術(shù)進步,接下來我們就來看看十項中外人工智能領(lǐng)域富有突破性的技術(shù)。
基于神經(jīng)網(wǎng)絡(luò)的機器翻譯
入選理由:翻譯是“自然語言處理”的最重要分支,也是比較難的一支。早年間,機器翻譯還被視作 “低級翻譯”被嘲諷,如今神經(jīng)網(wǎng)絡(luò)的機器翻譯準(zhǔn)確性大大提高,堪比專業(yè)人工翻譯。我們熟知的谷歌翻譯、微軟語音翻譯以及搜狗語音識別等都是基于此項技術(shù)。
技術(shù)突破:機器翻譯是科研人員攻堅了數(shù)十年的研究領(lǐng)域,其技術(shù)核心是一個擁有海量結(jié)點的深度神經(jīng)網(wǎng)絡(luò),可以自動的從語料庫中學(xué)習(xí)翻譯知識。
今年3月,微軟宣布其研發(fā)的機器翻譯系統(tǒng)首次在通用新聞的漢譯英上達到了人類專業(yè)水平,實現(xiàn)了自然語言處理的又一里程碑突破,將機器翻譯超越人類業(yè)余譯者的時間,提前了整整7年。
重大意義:基于神經(jīng)網(wǎng)絡(luò)的機器翻譯,直接改善了之前逐詞直譯的效果,升級為以整個句子為單位進行翻譯。
基于多傳感器跨界融合的機器人自主導(dǎo)航
入選理由:機器人的終極目標(biāo)是為人類提供智能化的服務(wù),其中自主導(dǎo)航是近年來人類一直想要攻克的技術(shù)壁壘,臻迪(PowerVision)通過聲吶、視覺等多傳感器融合,使其水下機器人能實現(xiàn)自主導(dǎo)航及智能識別,在智能機器人領(lǐng)域內(nèi)取得了突破性進展。
技術(shù)突破:隨著機器人的應(yīng)用場景及作業(yè)任務(wù)越來越復(fù)雜,單一傳感器難以滿足應(yīng)用需求。而多傳感器的信息融合對硬件資源依賴程度比較高,臻迪(PowerVision)基于自身在機器人行業(yè)深耕細作多年所積累的各類傳感器、慣性導(dǎo)航、運動控制、相機、視覺檢測/識別、SLAM等核心技術(shù),以及深度學(xué)習(xí)的深入研究,通過嵌入式端一體化集成平臺的系統(tǒng)架構(gòu)及優(yōu)化設(shè)計,突破了移動平臺硬件資源的限制,使水下機器人更加準(zhǔn)確、智能、全面地感知目標(biāo),并具備對水下目標(biāo)進行鎖定、檢測、識別、跟隨的能力。
重大意義:通過導(dǎo)航控制、聲吶、視覺技術(shù)與深度學(xué)習(xí)的結(jié)合實現(xiàn)了機器人在全局環(huán)境中的定位及自主導(dǎo)航,以及智能化應(yīng)用,為人類探索更為廣闊的水下應(yīng)用提供了強有力的技術(shù)保障。
DuerOS對話式人工智能系統(tǒng)
入選理由:DuerOS3.0能夠為用戶帶來了劃時代的自然對話交互,包括情感語音播報、聲紋識別等能力在內(nèi)的自然語言交互技術(shù)的全面升級。
技術(shù)突破:DuerOS是百度度秘事業(yè)部研發(fā)的對話式AI操作系統(tǒng),擁有10大類目的250多項技能。DuerOS包括了從語音識別到語音播報再到屏幕顯示的一個完整交互流程,以及背后支撐交互的自然語言理解、對話狀態(tài)控制、自然語言生成、搜索等等核心技術(shù),這些技術(shù)支撐著應(yīng)用層和能力層的實現(xiàn)。
重大意義:DuerOS率先開啟AI時代商業(yè)化,將為生態(tài)合作伙伴從產(chǎn)品、內(nèi)容與推廣三大方面提供完整的應(yīng)用方案支持,加速AI設(shè)備落地。
移動AR技術(shù)
入選理由:未來AR與AI需要相互加持,可以將AR比喻成AI的眼睛。
技術(shù)突破:集成了眾多計算機科技和圖形圖像學(xué)技術(shù),包括實時渲染技術(shù)、空間定位追蹤、圖像識別、人機交互、顯示技術(shù)、云端存儲、數(shù)據(jù)傳輸、內(nèi)容開發(fā)工具等領(lǐng)域。
重大意義:隨著蘋果 ARKit、谷歌 ARCore 的發(fā)布,移動AR在兩大移動平臺上均意義重大。這也意味著,全球 5 億臺支持 AR 功能的移動設(shè)備正在吸引所有的公司入局,這些公司正在將數(shù)據(jù)與 API 相結(jié)合,為用戶創(chuàng)造新的 AR 體驗。
生物特征識別技術(shù)
入選理由:行為識別技術(shù)應(yīng)用于安防,為安全又上了一道鎖。
技術(shù)突破:店鋪安裝攝像頭已經(jīng)是一件非常普遍的行為,但普通的攝像頭只能紀錄店鋪內(nèi)人們的行為,如果發(fā)現(xiàn)盜竊需要通過觀看監(jiān)控記錄人工排查,耗時費力。
重大意義:通過行為識別技術(shù),能夠第一時間發(fā)現(xiàn)犯罪分子,預(yù)測犯罪行為,有效保護店鋪安全。
機器人流程自動化
入選理由:機器人流程自動化能夠幫助甚至代替人類負擔(dān)大量簡單且單一、重復(fù)而繁重的工作,并且效率更高、零失誤。
技術(shù)突破:機器人流程自動化(RPA)是通過使用高性能認知技術(shù)實現(xiàn)業(yè)務(wù)的自動化和工作的效率。人類只需在操作界面上編寫需要人工完成的工作流程,即可處理各種業(yè)務(wù),如瀏覽器,云,以及各種軟件。
重大意義:機器人流程自動化能夠大幅提升企業(yè)的工作效率,減少人員投入,幫助企業(yè)降低成本,讓人類釋放生產(chǎn)力,騰出雙手去做價值更高的事情。
像素級聲源定位系統(tǒng)PixelPlayer
入選理由:從視覺和聽覺信號角度實現(xiàn)聲源分離,開辟研究新途徑。
技術(shù)突破:在進行音樂編輯時,一般是利用均衡器將音樂中的低音部分調(diào)出來,而麻省理工學(xué)院計算機科學(xué)和人工智能實驗室的研究人員發(fā)現(xiàn)了更好的解決方案。他們所研發(fā)的新系統(tǒng)PixelPlayer。
PixelPlayer能夠通過結(jié)合聲音和圖像信息,機器學(xué)習(xí)系統(tǒng)能以無監(jiān)督的方式從圖像或聲音中識別目標(biāo)、定位圖像中的目標(biāo),以及分離目標(biāo)產(chǎn)生的聲音。當(dāng)我們給定一個輸入視頻,PixelPlayer可以聯(lián)合地將配音分離為目標(biāo)組件以及在圖像幀上定位目標(biāo)組件。PixelPlayer 允許在視頻的每個像素上定位聲源。
重大意義:PixelPlayer能夠過濾伴奏、識別音源,不僅能幫助人類處理音樂,還能夠幫助機器人更好地理解其他物體所產(chǎn)生的環(huán)境聲音。
兼顧高精度學(xué)習(xí)和低精度推理的深度學(xué)習(xí)芯片
入選理由:這個芯片可以涵蓋了目前已知的最佳訓(xùn)練和最好推理,能夠保持所有處理器組件能夠得到數(shù)據(jù)和工作。
技術(shù)突破:該深度學(xué)習(xí)芯片是IBM正在研究的項目之一。IBM將這個芯片的目標(biāo)利用率定在90%。這將是一個質(zhì)的突破,為了實現(xiàn)這一突破,IBM的研發(fā)團隊做了兩項創(chuàng)新。
重大意義:該芯片可以執(zhí)行當(dāng)前所有的三種主要深度學(xué)習(xí)AI:卷積神經(jīng)網(wǎng)絡(luò)(CNN)、多層感知器(MLP)和長-短期記憶(LSTM)。這些技術(shù)共同主導(dǎo)了語言、視覺和自然語言處理。
智能代理訓(xùn)練平臺
入選理由:智能代理技術(shù)使計算機應(yīng)用趨向人性化、個性化。它能夠以主動服務(wù)的方式完成的一組操作的機動計算實體,不需要人的即時干預(yù)。
技術(shù)突破:智能代理技術(shù)具有解決問題所需的豐富知識、策略和相關(guān)數(shù)據(jù),能夠進行相關(guān)的推理和智能計算,智能代理還可以在用戶沒有給出十分明確的需求時推測出用戶的意圖、興趣或愛好,并按最佳方式代為其完成任務(wù),并能自動拒絕一些不合理或可能給用戶帶來危害的要求;智能代理還從經(jīng)驗中不斷自我學(xué)習(xí),能夠根據(jù)環(huán)境調(diào)整自身的行為,從而提高處理問題的能力。
重大意義:Unity以使機器學(xué)習(xí)研究人員獲得最強大的訓(xùn)練場景為使命,為快速增長的AI愛好者群體探索深度學(xué)習(xí)提供了一個研究平臺。
入耳式人工智能
入選理由:耳機從外變成了智能穿戴設(shè)備,可以無限延續(xù)使用時間和場景。
技術(shù)突破:蘋果在今年即將推出的AirPods 2中加入了Siri喚起、內(nèi)置芯片等等,可以收集行走步數(shù)、心率數(shù)據(jù)和體溫等等,還可以通過內(nèi)置陀螺儀捕捉用戶頭部移動狀況甚至定位位置,當(dāng)然也可以通過麥克風(fēng)接受命令,再通過揚聲器進行反饋。
重大意義:智能耳機讓智能助理更接近隨身隨行,蘋果、谷歌的涉足,必將帶起一波耳中AI的風(fēng)潮。