人工神經(jīng)網(wǎng)絡(luò)在這六大領(lǐng)域的表現(xiàn)已經(jīng)超越了人類
掃描二維碼
隨時(shí)隨地手機(jī)看文章
五年前,研究人員在能夠解讀圖像的軟件的準(zhǔn)確性上有了一次突如其來(lái)但大幅度的飛躍,其背后的人工神經(jīng)網(wǎng)絡(luò)支撐了我們現(xiàn)在在人工智能行業(yè)所看到的繁榮景象。然而,我們?nèi)赃h(yuǎn)未達(dá)到《終結(jié)者》或《黑客帝國(guó)》中所描述的那種現(xiàn)實(shí)。
目前,研究人員正試圖把重點(diǎn)放在怎樣教機(jī)器把一件事做到極致。與人腦同時(shí)處理多個(gè)事物的大腦不同,機(jī)器人必須以線性的方式“思考”。無(wú)論如何,在某些領(lǐng)域,人工智能已經(jīng)打敗了人類。深度神經(jīng)網(wǎng)絡(luò)已經(jīng)學(xué)會(huì)了交談、駕駛汽車、玩電子游戲、下圍棋、畫畫,以及幫助探索科學(xué)發(fā)現(xiàn)。
在以下六個(gè)領(lǐng)域中,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)證明,它們可以超越人類智能。
1.圖像和物體識(shí)別
記錄表明,機(jī)器在圖像和物體識(shí)別方面的能力遠(yuǎn)遠(yuǎn)超過(guò)了人類。在一次測(cè)試軟件識(shí)別玩具的能力的實(shí)驗(yàn)中,Geoff Hinton發(fā)明的Capsule網(wǎng)絡(luò)的錯(cuò)誤率幾乎只有之前最低錯(cuò)誤率的一半。在不同的掃描過(guò)程中,增加這些膠囊的數(shù)量可以讓系統(tǒng)更好地識(shí)別一個(gè)物體,即使這個(gè)視圖與之前分析的不同。
另一個(gè)例子來(lái)自于一個(gè)最先進(jìn)的網(wǎng)絡(luò),它是在一個(gè)有標(biāo)簽的圖片數(shù)據(jù)庫(kù)上訓(xùn)練的,并且能夠比一個(gè)博士生更好地對(duì)物體進(jìn)行分類,而這些博士生在相同的任務(wù)上接受了超過(guò)100個(gè)小時(shí)的訓(xùn)練。
2.電子游戲谷歌的DeepMind使用一種被稱為“深度強(qiáng)化學(xué)習(xí)”的深度學(xué)習(xí)技術(shù),研究人員用這種方法教電腦玩雅達(dá)利的打磚塊游戲Breakout。他們沒(méi)有以任何特定的方式對(duì)這臺(tái)電腦進(jìn)行教學(xué)或編程。相反,它在看分?jǐn)?shù)的同時(shí)還控制了鍵盤,它的目標(biāo)是得到盡可能高的分?jǐn)?shù)。玩了兩個(gè)小時(shí)后,電腦就成為了這個(gè)游戲的專家。
深度學(xué)習(xí)社區(qū)正在進(jìn)行一場(chǎng)競(jìng)賽,訓(xùn)練計(jì)算機(jī)在幾乎所有你能想到的游戲中擊敗人類,包括太空入侵者、末日、Pong和魔獸世界。在大多數(shù)游戲中,深度學(xué)習(xí)網(wǎng)絡(luò)已經(jīng)勝過(guò)有經(jīng)驗(yàn)的玩家。電腦并不是通過(guò)編程來(lái)玩游戲的,他們只是通過(guò)玩游戲來(lái)學(xué)習(xí)。
3.語(yǔ)音生成和識(shí)別去年,谷歌發(fā)布了WaveNet,百度發(fā)布了Deep Speech。兩者都是深度學(xué)習(xí)網(wǎng)絡(luò),能自動(dòng)生成語(yǔ)音。這些系統(tǒng)學(xué)會(huì)了模仿人類的聲音,并且它們的水平隨著時(shí)間的推移不斷提高。將他們的演講與真實(shí)的人區(qū)別開(kāi)來(lái),要比人們想象的要難得多。
牛津大學(xué)和谷歌公司DeepMind的科學(xué)家們創(chuàng)造了一個(gè)深度網(wǎng)絡(luò),LipNet,在閱讀人們的唇語(yǔ)上達(dá)到了93%的正確率,而普通的人類唇語(yǔ)閱讀者只能達(dá)到52%的正確率。來(lái)自華盛頓大學(xué)的一個(gè)小組利用唇形同步創(chuàng)建了一個(gè)系統(tǒng),將合成音頻與現(xiàn)有視頻實(shí)現(xiàn)同步。
4.藝術(shù)品和風(fēng)格的模仿神經(jīng)網(wǎng)絡(luò)可以研究某一特定藝術(shù)作品的筆觸、顏色和陰影的圖案。在此基礎(chǔ)上,它可以根據(jù)分析將原始的藝術(shù)作品轉(zhuǎn)化為新的圖像。
DeepArt.io就是一個(gè)例子,這家公司開(kāi)發(fā)的應(yīng)用可以使用深度學(xué)習(xí)來(lái)學(xué)習(xí)數(shù)百種不同的風(fēng)格,你可以將它們應(yīng)用到你的照片中。藝術(shù)家和程序員Gene Kogan也運(yùn)用了風(fēng)格轉(zhuǎn)換,基于算法從埃及象形文字中學(xué)習(xí)的風(fēng)格來(lái)修改蒙娜麗莎畫像。
5.預(yù)測(cè)斯坦福大學(xué)的研究人員TImnit Gebru選取了5000萬(wàn)張谷歌街景圖片,探索一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)可以做些什么。結(jié)果是,計(jì)算機(jī)學(xué)會(huì)了定位和識(shí)別汽車。它檢測(cè)到超過(guò)2200萬(wàn)輛汽車,包括它們的制造、型號(hào)、體型和年份。這一系統(tǒng)獲得的洞見(jiàn)之一就是,選民隊(duì)伍的起點(diǎn)和終點(diǎn)在哪里。根據(jù)這一分析,“如果在15分鐘車程中遇到的轎車數(shù)量高于皮卡車的數(shù)量,那么這座城市可能會(huì)在下次總統(tǒng)選舉中投票給民主黨人(88%的幾率),”TImnit Gebru和他的合著者寫道。
另一個(gè)機(jī)器提供比人類更準(zhǔn)確的預(yù)測(cè)的例子來(lái)自谷歌的Sunproof項(xiàng)目,這項(xiàng)技術(shù)使用了來(lái)自谷歌地球的航拍照片來(lái)創(chuàng)建一個(gè)你的屋頂?shù)?D模型,將它與周圍的樹(shù)木和陰影區(qū)分開(kāi)。然后,它利用太陽(yáng)的軌跡,根據(jù)位置參數(shù)來(lái)預(yù)測(cè)你屋頂?shù)奶?yáng)能電池板能產(chǎn)生多少能量。
6.網(wǎng)站設(shè)計(jì)修改在網(wǎng)站生成器中集成的人工智能可以幫助網(wǎng)站更新,并對(duì)網(wǎng)站進(jìn)行有用的修改,比人類更快速、更準(zhǔn)確。這種系統(tǒng)的基本技術(shù)提供了關(guān)于網(wǎng)站外觀的普通用戶的意見(jiàn),這可以告訴設(shè)計(jì)師網(wǎng)站設(shè)計(jì)的好壞。如今,網(wǎng)站建設(shè)者們要么利用深層網(wǎng)絡(luò)來(lái)修改設(shè)計(jì),要么計(jì)劃在不久的將來(lái)使用它們。該技術(shù)可以分析不同的模式,并根據(jù)以前的轉(zhuǎn)化率和其他重要指標(biāo),創(chuàng)造更好的結(jié)果。
雖然我們距離實(shí)現(xiàn)矩陣級(jí)別的人工智能還差得很遠(yuǎn),但企業(yè)正在努力快速提高神經(jīng)網(wǎng)絡(luò)的智能化水平。上面提到的項(xiàng)目只是這項(xiàng)技術(shù)的淺層次應(yīng)用,新的想法和改進(jìn)不斷涌現(xiàn),證明機(jī)器在完成任務(wù)方面正在不斷超越人類的表現(xiàn)。