更強(qiáng)大的“谷歌大腦”,谷歌擴(kuò)充機(jī)器神經(jīng)網(wǎng)絡(luò)規(guī)模
掃描二維碼
隨時(shí)隨地手機(jī)看文章
“機(jī)器學(xué)習(xí)”的概念自上世紀(jì)50年代出來(lái)以來(lái)就備受科技界的關(guān)注,而近年來(lái)“深度學(xué)習(xí)”逐漸成為機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域,其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),模仿人腦的機(jī)制來(lái)識(shí)別圖像、聲音和文本等數(shù)據(jù)。
美國(guó)科技媒體《連線》雜志網(wǎng)絡(luò)版日前發(fā)文對(duì)“機(jī)器深度學(xué)習(xí)”技術(shù)的最新進(jìn)展進(jìn)行了總結(jié)。以下是文章的主要內(nèi)容。
在Quoc Le的眼中,世界都是由一系列的數(shù)字組成的。“一張數(shù)碼照片實(shí)際上都是數(shù)字,”他說道,“如果將人們所說的話拆分成單獨(dú)的音素,那么它們同樣可以被編譯成數(shù)字。”如果按照Quoc Le的說法,就可以將這些數(shù)字輸入到機(jī)器之中,機(jī)器能夠讀懂照片和人們所說的話,比如Facebook能夠識(shí)別出你的臉,谷歌則能夠聽懂你所說的話。
不過Quoc Le想要走得更遠(yuǎn),他希望能夠研究出一種能將整個(gè)句子、整個(gè)段落以及各種類型的自然語(yǔ)言轉(zhuǎn)譯成數(shù)字或其它載體的技術(shù),借助這項(xiàng)技術(shù),計(jì)算機(jī)科學(xué)家就可以讓機(jī)器也能夠獲得人們看到和聽到的信息。同時(shí),Quoc Le還在探索如何讓機(jī)器理解人們的觀點(diǎn)和情緒的方法。
盡管此類技術(shù)目前尚處于起步階段,未來(lái)還有很長(zhǎng)的路要走,但相對(duì)于同行而言,Quoc Le要擁有更多供其調(diào)配的資源。Quoc Le是“谷歌大腦”(Google Brain)項(xiàng)目的一員,該項(xiàng)目主要從事“機(jī)器深度學(xué)習(xí)”領(lǐng)域的研究,這是人工智能的一種形式,主要用機(jī)器來(lái)模擬人腦進(jìn)行數(shù)據(jù)處理。
現(xiàn)年32歲的Quoc Le一直在谷歌從事語(yǔ)音識(shí)別方面的工作,比如Android系統(tǒng)的語(yǔ)音識(shí)別功能以及為網(wǎng)絡(luò)圖片自動(dòng)添加標(biāo)簽等,這兩項(xiàng)工作都需要“深度學(xué)習(xí)”技術(shù)的支持。
除了谷歌之外,F(xiàn)acebook和微軟等互聯(lián)網(wǎng)巨頭也都在使用“深度學(xué)習(xí)”方面的技術(shù),同時(shí)百度公司最近也曾在公開場(chǎng)合談及利用這項(xiàng)技術(shù)來(lái)為客戶提供更為精確的廣告推送服務(wù)。不過Quoc Le希望將該技術(shù)推向更為廣闊的領(lǐng)域,包括對(duì)自然語(yǔ)言理解、機(jī)器人以及網(wǎng)絡(luò)搜索等。
Quoc Le最近開發(fā)出了一項(xiàng)“深度學(xué)習(xí)”技術(shù),能夠鑒別出網(wǎng)絡(luò)上不同的詞匯之間是如何關(guān)聯(lián)的,谷歌則在自己的“知識(shí)圖譜”中融入這項(xiàng)技術(shù),從而幫助其對(duì)搜索結(jié)果進(jìn)行知識(shí)系統(tǒng)化,讓每一個(gè)關(guān)鍵詞都能獲得完整的知識(shí)體系。
曾經(jīng)的困擾
Quoc Le上世紀(jì)90年代首次接觸到人工智能,但是確實(shí)讓他感到煩惱不已,因?yàn)楫?dāng)時(shí)的機(jī)器學(xué)習(xí)系統(tǒng)非常依賴工程師的手工輸入,盡管機(jī)器在一定程度上也具備理解能力,但是卻需要比較繁瑣的操作才能完成。比如當(dāng)時(shí)的機(jī)器在照片沒有添加標(biāo)簽的情況下就無(wú)法對(duì)其進(jìn)行識(shí)別。
“我們對(duì)大量無(wú)標(biāo)簽的數(shù)據(jù)進(jìn)行了學(xué)習(xí)研究,”Quoc Le說道,他曾與“谷歌大腦”項(xiàng)目的創(chuàng)始人之一吳恩達(dá)(Andrew Ng)在斯坦福大學(xué)共同研究人工智能,“如果未來(lái)我們能夠找到一種可行的算法來(lái)讓機(jī)器對(duì)無(wú)標(biāo)簽的數(shù)據(jù)進(jìn)行識(shí)別,那將有可能會(huì)改變整個(gè)計(jì)算行業(yè),畢竟現(xiàn)在網(wǎng)絡(luò)的大部分?jǐn)?shù)據(jù)(如Facebook、Twitter和谷歌)都是沒有標(biāo)簽的。”
這也正是“深度學(xué)習(xí)”技術(shù)未來(lái)想要實(shí)現(xiàn)的目標(biāo)。利用數(shù)萬(wàn)臺(tái)電腦通過軟件模擬人腦中的神經(jīng)元網(wǎng)絡(luò),從而讓機(jī)器獲得與人類相似的學(xué)習(xí)能力,比如在某些情況下機(jī)器能夠在無(wú)需對(duì)數(shù)據(jù)添加標(biāo)簽的情況下實(shí)現(xiàn)自動(dòng)學(xué)習(xí)。
谷歌的貓臉識(shí)別其實(shí)就是“深度學(xué)習(xí)”技術(shù)的典型案例,只不過在經(jīng)過了長(zhǎng)達(dá)三年的研發(fā)之后,這個(gè)項(xiàng)目仍然沒能獲得大的進(jìn)展。與此同時(shí),大部分商業(yè)深度學(xué)習(xí)系統(tǒng)目前仍然比較依賴人工監(jiān)控。“盡管貓臉識(shí)別技術(shù)的實(shí)用性很低,”吳恩達(dá)說道,“但是我認(rèn)為這項(xiàng)技術(shù)代表是深度學(xué)習(xí)未來(lái)發(fā)展的一個(gè)方向。”
語(yǔ)言的挑戰(zhàn)
“深度學(xué)習(xí)”技術(shù)需要面臨的另一個(gè)挑戰(zhàn)是對(duì)自然語(yǔ)言的識(shí)別。人類的語(yǔ)言中包含大量的微妙信息,迄今為止科學(xué)界還未能找到識(shí)別這些微妙信息的方法。比如一個(gè)相同的詞匯,在不同的語(yǔ)境或語(yǔ)氣下都會(huì)有不同的意思,目前大部分人工智能系統(tǒng)都無(wú)法區(qū)分這些信息。“機(jī)器非常善于處理數(shù)據(jù),但是卻無(wú)法應(yīng)付語(yǔ)言符號(hào),”Quoc Le介紹說,“因?yàn)檎Z(yǔ)言是一種具備高度象征意義的東西。”
對(duì)語(yǔ)言進(jìn)行識(shí)別的關(guān)鍵是找到將符號(hào)轉(zhuǎn)譯成數(shù)字的方式。“目前我們還沒有找到將語(yǔ)言概念轉(zhuǎn)變成機(jī)器能夠處理的數(shù)學(xué)結(jié)構(gòu)的方法,”Quoc Le說道,“不過在與Word2Vec工具的幫助下,我們?cè)谶@方面也取得了一定進(jìn)展。希望未來(lái)我們的機(jī)器能夠自動(dòng)識(shí)別發(fā)布在網(wǎng)絡(luò)上的海量信息。”
“人們未來(lái)是不可能隨時(shí)隨地監(jiān)督機(jī)器的學(xué)習(xí)的,”與Quoc Le一起在斯坦福大學(xué)攻讀博士學(xué)位的理查德索切(Richard Socher)說道,“我們希望未來(lái)能夠?qū)⒈O(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)結(jié)合起來(lái),這樣機(jī)器就能實(shí)現(xiàn)許多目前難以想象的事情。”
Quoc Le最近聯(lián)合谷歌的幾位同事發(fā)表了一篇關(guān)于在深度神經(jīng)網(wǎng)絡(luò)研究中使用機(jī)器翻譯的文章,其中談到了對(duì)“回歸神經(jīng)網(wǎng)絡(luò)”的利用,據(jù)了解這可能是目前語(yǔ)言識(shí)別領(lǐng)域最為先進(jìn)的技術(shù)。
更強(qiáng)大的“谷歌大腦”
Quoc Le在文章中表示,他們所發(fā)現(xiàn)的新方法要優(yōu)于其它機(jī)器翻譯算法,不過這也僅僅是“深度學(xué)習(xí)”的一個(gè)應(yīng)用而已,未來(lái)“深度學(xué)習(xí)”技術(shù)還將會(huì)用于網(wǎng)絡(luò)上的問題答疑、自動(dòng)說明以及情感分析等等。
為了充分利用這些先進(jìn)的算法,谷歌將不得擴(kuò)充自己的“機(jī)器神經(jīng)網(wǎng)絡(luò)”規(guī)模,而不是局限在圖像和語(yǔ)音的識(shí)別領(lǐng)域。“深度學(xué)習(xí)”概念的奠基人、目前供職于谷歌的杰夫·韓?。℅eoff Hinton)曾在介紹“谷歌大腦”項(xiàng)目時(shí)表示:“就像是鴿子的大腦一樣,雖然它擁有良好的視力,但是任何人都不會(huì)與一只鴿子進(jìn)行對(duì)話。”
實(shí)際上,即便是腦容量相當(dāng)小的鴿子,其大腦的計(jì)算能力也能夠輕松超越目前世界上最為先進(jìn)的“機(jī)器神經(jīng)網(wǎng)絡(luò)”(包括“谷歌大腦”),而在韓丁加盟谷歌之后,更是宣稱未來(lái)要幫助谷歌打造全球最大的“機(jī)器神經(jīng)網(wǎng)絡(luò)”來(lái)對(duì)“深度學(xué)習(xí)”進(jìn)行更加全面的研究。