智能的基礎(chǔ)包括什么
我們往往會(huì)認(rèn)為心智(mind)位于更原始的認(rèn)知結(jié)構(gòu)(cognitive structures)之上。我們認(rèn)為我們是有意識(shí)的存在,畢竟,我們?cè)谝阅撤N方式感受我們心跳的韻律和腸胃的悸動(dòng)。如果大腦中的運(yùn)算可被分離出來(lái)或分層,那么也許我們構(gòu)造出類似于這個(gè)頂層的東西,并繞過(guò)有機(jī)物特有的雜亂肉身而實(shí)現(xiàn)人工智能。
我理解這種觀點(diǎn)的吸引力,因?yàn)槲以?lián)合創(chuàng)立了一家語(yǔ)言預(yù)測(cè)軟件公司 SwiftKey,該公司后來(lái)被微軟收購(gòu)了。我們的目標(biāo)是模擬出人類理解和操作語(yǔ)言的了不起的過(guò)程。我們?nèi)〉昧艘恍┎诲e(cuò)的進(jìn)展:我對(duì)我們?cè)?2012 年到 2014 年之間為物理學(xué)家史蒂芬·霍金所開(kāi)發(fā)的優(yōu)雅的新交流系統(tǒng)而感到十分自豪。但盡管有這些鼓舞人心的成果,但絕大多數(shù)時(shí)間我都被不斷提醒我們離類似人類的人工智能還遙不可及。為什么?因?yàn)榉謱拥恼J(rèn)知模型是錯(cuò)的。目前大部分人工智能研究者都缺失了整個(gè)藍(lán)圖的一個(gè)核心組分:具身化(embodiment)。
在 20 世紀(jì) 50 年代現(xiàn)代人工智能起步的時(shí)候,研究走上了錯(cuò)誤的方向。計(jì)算機(jī)科學(xué)家決定通過(guò)構(gòu)建基于符號(hào)的邏輯系統(tǒng)來(lái)嘗試模擬有意識(shí)的推理。這種方法涉及到將真實(shí)世界的實(shí)體和數(shù)字代碼關(guān)聯(lián)起來(lái)以創(chuàng)造出關(guān)于環(huán)境的虛擬模型,然后該模型可被用于投射回這個(gè)世界本身。比如說(shuō),使用符號(hào)邏輯,你可以通過(guò)使用類似「貓》是》動(dòng)物(cat 》 is 》 animal)」這樣的數(shù)學(xué)公式來(lái)編碼特定的知識(shí),從而指示一臺(tái)機(jī)器「學(xué)習(xí)」到:貓是動(dòng)物。這樣的公式可以匯集成更為復(fù)雜的陳述,從而讓系統(tǒng)可以操作和測(cè)試命題——比如你的貓平均下來(lái)是不是和馬一樣大,或者是不是很有可能會(huì)追逐老鼠。
這種方法在簡(jiǎn)單的經(jīng)過(guò)設(shè)計(jì)的環(huán)境中取得了一些早期的成功。比如 MIT 計(jì)算機(jī)科學(xué)家 Terry Winograd 在 1968 年到 1970 年之間創(chuàng)造的一個(gè)虛擬世界 SHRDLU,用戶可以通過(guò)與這臺(tái)計(jì)算機(jī)交談來(lái)在簡(jiǎn)單的塊狀體(如椎體和球)周圍移動(dòng)。但事實(shí)證明,在面對(duì)真實(shí)世界問(wèn)題時(shí),符號(hào)邏輯完全不行。在真實(shí)世界中,經(jīng)過(guò)精心調(diào)節(jié)的符號(hào)在面對(duì)模糊定義和多重解釋時(shí)就會(huì)崩潰。
后來(lái)幾十年,隨著計(jì)算機(jī)算力的提升,研究者開(kāi)始轉(zhuǎn)向使用統(tǒng)計(jì)學(xué)來(lái)從大量數(shù)據(jù)中提取模式(pattern)。這些方法通常被稱為「機(jī)器學(xué)習(xí)(machine learning)」。機(jī)器學(xué)習(xí)并不試圖編碼高級(jí)知識(shí)和邏輯推理,而是通過(guò)一種自底向上的方法來(lái)讓算法通過(guò)重復(fù)任務(wù)來(lái)分辨關(guān)系,這些任務(wù)包括分類圖像中的視覺(jué)目標(biāo)或?qū)浺艮D(zhuǎn)錄為文本。比如,這樣的系統(tǒng)能夠通過(guò)查看數(shù)百萬(wàn)張貓的照片學(xué)會(huì)識(shí)別貓,或根據(jù)貓和鼠在大量文本中被描述的方式來(lái)找到貓和鼠之間的關(guān)系。
近些年來(lái),機(jī)器學(xué)習(xí)已經(jīng)產(chǎn)生了很多實(shí)際的應(yīng)用。我們已經(jīng)創(chuàng)造了在語(yǔ)音識(shí)別、圖像處理和閱讀唇語(yǔ)上超越人類水平的系統(tǒng),也造出了在國(guó)際象棋、Jeopardy! 和圍棋上擊敗了人類的系統(tǒng),另外還有能夠創(chuàng)造視覺(jué)藝術(shù)、合成流行音樂(lè)和編寫自己的軟件程序的系統(tǒng)。在某種程度上,這些能自我學(xué)習(xí)的算法模擬了我們所知的有機(jī)大腦的潛意識(shí)過(guò)程。機(jī)器學(xué)習(xí)算法從簡(jiǎn)單的「特征(feature,比如單個(gè)字母或像素)」入手,然后將它們組合成更復(fù)雜的「類別(category)」,同時(shí)還考慮到了真實(shí)世界數(shù)據(jù)中所固有的不確定性和模糊性。這在某種程度上類似于視覺(jué)皮層,其能夠接收來(lái)自眼睛的電信號(hào)并將其解讀成可識(shí)別的模式和目標(biāo)。
但是能像人一樣思考的算法仍遙不可及,兩者最大的區(qū)別在于生物進(jìn)化以及信息處理方式。人類由數(shù)萬(wàn)億個(gè)真核細(xì)胞組成,真核細(xì)胞在 25 億年前的化石之中首次被發(fā)現(xiàn)。一個(gè)人類細(xì)胞即是一個(gè)非比尋常的網(wǎng)絡(luò),其組件數(shù)量等同于一架現(xiàn)代化大型噴氣式客機(jī),這是一個(gè)長(zhǎng)期而深入的自然進(jìn)化過(guò)程的結(jié)果。在《Basin and Range(盆地與山脈)》(1981)一書(shū)中,作者 John McPhee 發(fā)現(xiàn),如果你站著把手臂伸展出來(lái)以表示地球的整個(gè)歷史,復(fù)雜的有機(jī)體開(kāi)始只在手腕處進(jìn)化,而且「你拿著一個(gè)中型的指甲銼,一下子就可以抹除人類的歷史」。
傳統(tǒng)的進(jìn)化觀點(diǎn)暗示人類細(xì)胞的復(fù)雜性來(lái)自于早期真核細(xì)胞的隨機(jī)突變和選擇。但是在 2005 年,芝加哥大學(xué)生物學(xué)家 James Shapiro 描述了一個(gè)激進(jìn)的新觀點(diǎn)。他認(rèn)為真核細(xì)胞通過(guò)自我操控 DNA 響應(yīng)環(huán)境刺激以「智能地」適應(yīng)有機(jī)體寄主及其環(huán)境。最近的微生物學(xué)發(fā)現(xiàn)佐證了這一想法。例如,哺乳動(dòng)物的免疫系統(tǒng)傾向于復(fù)制 DNA 序列從而可以產(chǎn)生有效的抗體應(yīng)對(duì)疾病攻擊;現(xiàn)在我們知道 43% 人類基因組是由 DNA 組成的,通過(guò)一種自然的「基因工程(geneTIc engineering)」過(guò)程,DNA 可以在不同位置之間移動(dòng)。
現(xiàn)在,這只是聰明的自組織細(xì)胞進(jìn)化為大腦型智慧生物過(guò)程中的一丁點(diǎn)的小跨越。但重點(diǎn)是很久以前我們已是有意識(shí)會(huì)思考的生物,細(xì)胞讀取環(huán)境數(shù)據(jù)并協(xié)同工作以將我們塑造成穩(wěn)健可持續(xù)的存在。那么,我們認(rèn)為的智能不僅僅是使用符號(hào)以如其所是的形式表征世界。相反,世界僅展現(xiàn)被我們揭示出來(lái)的一面,這種認(rèn)識(shí)世界的方式深深根植于作為有機(jī)體的我們的進(jìn)化和表現(xiàn)的需求之中。自然「自然并非僅使用大腦構(gòu)建了理性,還使用了包含大腦的身體?!股窠?jīng)科學(xué)家 Antonio Damasio 在其對(duì)認(rèn)知科學(xué)產(chǎn)生巨大影響的《笛卡爾的謬誤》一書(shū)中這樣寫道。換句話說(shuō),除了大腦,我們還用身體思考。
我猜想身體的存續(xù)在一個(gè)不確定的世界中是基本而又至關(guān)緊要的,這構(gòu)成了人類智能的靈活性與能量的基礎(chǔ)。但是很少有人工智能研究者真正意識(shí)到這些見(jiàn)解的意義。絕大多數(shù)算法的目的在于從大量的訓(xùn)練數(shù)據(jù)集中推斷模式——因此算法在看了數(shù)百萬(wàn)甚至數(shù)十億只單個(gè)貓的照片之后才能精確地識(shí)別貓。與之相比,為了滿足作為有機(jī)體的需求,人類的身體包含有極其豐富的模型以應(yīng)對(duì)外部環(huán)境。從相對(duì)較少的被觀察樣本中我們就可以總結(jié)經(jīng)驗(yàn)做出預(yù)判。因此當(dāng)人類在思考一只貓時(shí),她很可能描畫貓行走的方式,聽(tīng)到咕嚕咕嚕的聲音,感受到貓伸出爪子就要抓撓。在其理解「貓」這一概念時(shí),人類有著豐富的感知信息,并且其他相關(guān)概念也有助于其理解。
這意味著當(dāng)人類解決一個(gè)新問(wèn)題時(shí),絕大部分的困難工作已經(jīng)完成了。通過(guò)這種我們剛剛開(kāi)始理解的方式,由細(xì)胞進(jìn)化而來(lái)的身體和大腦,已經(jīng)構(gòu)建了一種世界模式,使我們可以及時(shí)應(yīng)對(duì)各種挑戰(zhàn)。但是對(duì)于人工智能算法,每一次都是從頭開(kāi)始運(yùn)行。有一個(gè)活躍而重要的研究路線,其被稱為「歸納遷移」,致力于利用機(jī)器先前學(xué)習(xí)的知識(shí)解決新問(wèn)題。然而,照目前來(lái)看,人們?nèi)匀毁|(zhì)疑這種方法是否可以獲取一些像豐富的身體模型般東西。
2014 年,在 SwiftKey 推出霍金專用的新通信系統(tǒng)的同一天,他接受了 BBC 的采訪,警告說(shuō)智能機(jī)器有可能毀滅人類。這次采訪無(wú)疑成了當(dāng)日頭條。我同意霍金認(rèn)為應(yīng)該嚴(yán)肅對(duì)待流氓人工智能所造成的危害的觀點(diǎn)。但我認(rèn)為人類還遠(yuǎn)沒(méi)到擔(dān)憂被取代的時(shí)候。我們達(dá)成人工智能目標(biāo)的希望并不大,除非在算法中加入一種長(zhǎng)期的具身化關(guān)系,就像大腦具于身體之中。