去年,AlphaGo依賴人工智能挑戰(zhàn)號稱最難的人類游戲圍棋大獲成功,讓人工智能背后的“深度學習”廣為人知,也把谷歌收購的AI科技公司DeepMind推向了鎂光燈下。
深度學習需要兩樣東西:海量的計量處理能力和海量的可學習數(shù)據(jù)(大數(shù)據(jù))。DeepMind從匯聚業(yè)余和專家棋手的網(wǎng)站中摘選3000萬步棋來訓練AlphaGo。他們并對AlphaGo稍作改動,制造出它的一個分身,讓兩者互搏,從而更迅速地生成更多訓練數(shù)據(jù)。按照DeepMind的CEO及聯(lián)合創(chuàng)始人哈薩比斯的計劃,公司的目標是發(fā)明類似人腦運作方式的AI新算法,正因如此,公司聘用了大批神經(jīng)科學家。哈薩比斯稱,從人腦尋求靈感使DeepMind大大有別于其他機器學習研究團隊。雖然DeepMind的方法并沒有完全排除蠻力計算,但AlphaGo的自學法與人類下圍棋的方法接近的程度要遠高于“深藍”和人類在下國際象棋上的接近度。
提起“深藍”,馬上就能想起二十年前這臺IBM的超級計算機擊敗國際象棋冠軍卡斯帕羅夫的例子,當時機器第一次在人機大戰(zhàn)中獲勝。而Waston(沃森)就是深藍的后身。沃森在2011年大放異彩,因為當年它贏得了美國電視智力競猜節(jié)目《危險邊緣》(Jeopardy?。┨貏e版的冠軍。面對節(jié)目中用充滿雙關(guān)的英語提出的費解問題,沃森能做出分析并在巨大的自然語言數(shù)據(jù)庫中尋找線索,將這些線索合成答案,再用語音的方式回答,從而擊敗了美國競猜節(jié)目中最聰明的人腦。被沃森打敗的人類選手詹尼斯當時就感慨道:“我,代表本人,歡迎我們新的電腦霸主。”
與DeepMind力圖學習人腦運作方式創(chuàng)建新算法的做法不同,沃森背后依賴的是被IBM稱之為“認知計算”的原理,其核心是所涉軟件能自我修改從而不斷學習。沃森會把拿到的問題和一個潛在答案數(shù)據(jù)庫做比對,從中生成一個羅列各種可能答案的長列表。然后它用大量其他數(shù)據(jù)庫如百科全書、醫(yī)療文檔、音頻或圖片的內(nèi)容來給這些答案打分。事實核查算法會根據(jù)資料來源的可信度來調(diào)節(jié)這個過程,然后一個(或常常是幾個)最可能是正確答案的結(jié)果被挑選出來。最后一步是由人類專家評定和微調(diào)這些結(jié)果,在一個迭代過程中完善它們(從而教導(dǎo)軟件該做什么),直到該系統(tǒng)被訓練得足夠好而可向外界發(fā)布。為達到這一目標,IBM雇用了一批語言學家、心理學家、社會學家及編程人員,人機結(jié)合是沃森的重要賣點。
不管從什么方式去設(shè)計并改進算法,沃森與DeepMind所代表的人工智能研究都需要大量的數(shù)據(jù)幫助算法進行學習,盡快將人工智能推向市場,有助于它們在實踐中學習,再學以致用。
IBM推動沃森商業(yè)化應(yīng)用的步伐要早一些。2014年,IBM就把沃森開放給一般商業(yè)用途使用,讓企業(yè)創(chuàng)造和銷售自家基于沃森的應(yīng)用。為此,IBM還設(shè)立了一個價值1億美元的基金來支持那些使用沃森背后技術(shù)的創(chuàng)業(yè)公司。一年多以前,IBM發(fā)布了一套新工具來幫助外部人士開發(fā)沃森的商業(yè)應(yīng)用。
如今,沃森在醫(yī)療、法律等領(lǐng)域都已經(jīng)有了比較成熟的應(yīng)用,而最新的應(yīng)用在金融監(jiān)管合規(guī)領(lǐng)域。IBM意識到每年在監(jiān)管和合規(guī)方面的巨大支出(它預(yù)計達2700多億美元,僅是理解監(jiān)管要求就要花掉200億),2015年初開始在沃森上開發(fā)這一業(yè)務(wù)功能。大量可能的違規(guī)手法被輸入沃森,它可以對交易模式和各種交流內(nèi)容(從公開信息到社交媒體)進行分析,這種監(jiān)察還能延伸至交易對手方的人際網(wǎng)絡(luò),以厘清復(fù)雜的關(guān)系。同時,IBM希望旗下金融咨詢公司Promontory熟悉金融領(lǐng)域監(jiān)管及變化的專家能幫助沃森學習。
相比之下,DeepMind剛剛開啟在各個領(lǐng)域內(nèi)的應(yīng)用。去年七月,谷歌宣布DeepMind已找到方法將谷歌數(shù)據(jù)中心的制冷用電量減少五分之二。它的算法先分析數(shù)據(jù)中心的操作日志來理解任務(wù),然后通過反復(fù)模擬運行來優(yōu)化過程。同樣,DeepMind也已經(jīng)進入醫(yī)療行業(yè)。去年11月,公司獲得了首個付費工作,與NHS公立醫(yī)院皇家自由倫敦醫(yī)院(Royal Free London)簽下五年的合同,為其處理170萬份病歷。
人工智能的競爭已經(jīng)開始,谷歌、Facebook、微軟、亞馬遜、百度和IBM等全球IT巨頭都已投身其中,沃森與DeepMind只是廣為人知的兩個例子。在這場人工智能的比拼中,獲取現(xiàn)實世界的大數(shù)據(jù)至關(guān)重要。即使擁有大量數(shù)據(jù)的可供挖掘的谷歌,運用AI及機器學習技術(shù)改進醫(yī)院、電網(wǎng)及工廠等系統(tǒng)時,獲取其具體操作數(shù)據(jù)也非常重要。IBM開放沃森平臺給各個行業(yè)開發(fā)應(yīng)用,也是在積極獲取分析各種大數(shù)據(jù)的機會。人工智能算法通過對各類大數(shù)據(jù)的分析學習所獲得的改進和汲取的知識與洞察,可能是這場競爭的最大標的。