為何說預(yù)測是機器智能的本質(zhì)
機器學(xué)習(xí)和智能都植根于預(yù)測,這是巧合嗎?
當(dāng)我們的技術(shù)體現(xiàn)了智能的本質(zhì)時,我們正在接近一個緊要關(guān)頭嗎?或者說我們?nèi)匀惶幱陂L期的錯誤觀念之中?如果它確實是一個由許多部分組成的系統(tǒng)的本質(zhì),是什么把預(yù)測提升到至關(guān)重要的地位?
以色列歷史學(xué)家哈拉瑞(Yuval Noah Harari)建議我們研究歷史,以放松對過去的控制,“研究歷史不會告訴我們應(yīng)該選擇什么,但至少它給了我們更多的選擇”。如果你在人工智能行業(yè)中繪制一個路線圖,那么調(diào)查這些選項是有意義的。通過追蹤馬庫斯·胡特、謝恩·萊格、杰夫·霍金斯和楊立昆的工作,我們就能深入了解為什么機器學(xué)習(xí)能強烈吸引著我們。楊立昆曾說:預(yù)測是智慧的本質(zhì)
技術(shù)塑造了我們對智能的解釋
歷史上,每個時代的主導(dǎo)技術(shù)都塑造了我們對智能以何種方式工作的解釋。古希臘的水力技術(shù)與“體液”的流動原理有著異曲同工之妙,“體液”決定了我們的身體狀態(tài)和心智功能。機械時代放大了人類是機器的觀念,包括大腦中的運動也未能幸免。進(jìn)入電力和通訊時代后,大腦變成了一個電話總機,進(jìn)入計算時代后,大腦又成了一個信息處理器。
在這個人工智能時代,許多人認(rèn)為預(yù)測和學(xué)習(xí)是智能的本質(zhì)。預(yù)測和學(xué)習(xí)也是機器學(xué)習(xí)的主要功能性組成部分,這是這個時代的主要技術(shù)。
因此,為什么預(yù)測是智能的本質(zhì)的一個可能的解釋是,我們的工具是預(yù)測的引擎。在這個歷史背景下,事物的本質(zhì)不在于預(yù)測的價值,更多的是在于關(guān)于跳出我們的工具去進(jìn)行思考的困難。無可否認(rèn),這段歷史很有趣,但這不是對這一想法的一種毀滅性的控訴,不論是從內(nèi)部原因來說還是就事物的本質(zhì)來說。預(yù)測很可能確實是智能的本質(zhì),當(dāng)我們的技術(shù)達(dá)到我們智慧的本質(zhì)的水平時,我們正在不斷靠近這個巨大的里程碑。為了權(quán)衡這個觀點,我們需要更直接地解決這個問題。
一種狹隘的智能
為了識別本質(zhì),我們需要分析一些重要的方面。要從這一概念抽離出不同的目標(biāo)、目的、屬性和本質(zhì),此時此刻所值得強調(diào)的是智能的概念所帶來的非凡的自由。
當(dāng)威廉·加爾文探究《智能的崛起》(The Emergence of Intelligence)時,他發(fā)現(xiàn)本質(zhì)并不總是與預(yù)測聯(lián)系在一起。“對大多數(shù)觀察者來說,智能的本質(zhì)是聰慧,是解決新問題的一種多功能性。”雖然他表達(dá)了對遠(yuǎn)見和預(yù)言的重要性的個人傾向性,但他的調(diào)查包含了一系列互補的行為,如探索、創(chuàng)造力和多功能性。
“我們永遠(yuǎn)不會同意對智能的普遍定義,因為它是一個開放的詞,就像意識這個詞一樣。”威廉·加爾文說,他總結(jié)道,找到一個關(guān)于智能的單一定義這樣的任務(wù)是徒勞的。
事實證明,那些追求機器智能的人并沒有因此而卻步。盡管它可能并不滿足所有人的需求和不同的目的,但一個社區(qū)可能會圍繞一個簡化的概念而團結(jié)起來。這些基本的選擇可能會反過來將智能的基本屬性帶入到大眾視野之中。這就是我們接下來要看到的。
機器智能的定義
謝恩·萊格和馬庫斯·胡特對社區(qū)將目光集中在機器智能定義上提供了一大助力。他們承認(rèn)在開發(fā)一個高度抽象但又普遍的概念的過程中遇到了困難。然而,他們目標(biāo)明確,就是要讓機器智能成為一個自主的目標(biāo)搜索系統(tǒng),最后他們克服了這個挑戰(zhàn)。
萊格和胡特通過一項關(guān)于智能的專家意見的調(diào)查,得出了他們的定義。考慮到他們對于概念的通用性的追求,他們尋求的是一種包含自然智能和人工智能的定義。根據(jù)他們的目標(biāo),智能的基本特征被提取進(jìn)了一個普遍的定義中:智能是衡量一個代理人在廣泛的環(huán)境中實現(xiàn)目標(biāo)的能力。
從歷史的角度來看,我們不僅是在用我們的技術(shù)的概念來思考智能,我們也在以一種非常明確的方式來思考。如果這個循環(huán)令人不安,萊格和胡特也承認(rèn)會有這種問題。
然而,他們的結(jié)論是通過將他們的研究結(jié)果與專家對包括自然智能在內(nèi)的智能所給出的定義相關(guān)聯(lián),并表明他們的工作與普遍最優(yōu)學(xué)習(xí)代理的理論一致而得出的,“我們所做的遠(yuǎn)遠(yuǎn)超出了僅僅重申基本的強化學(xué)習(xí)理論”。
然而,這仍然存在一個問題:為什么預(yù)測是智能的本質(zhì)。機器智能是一種由功能部件組合而成的系統(tǒng)。將其中一個部分表示為不可缺少的部分可能看起來很奇怪:大概,所有組成這個系統(tǒng)的部件都是不可或缺的。是什么把預(yù)測提升為這一切的本質(zhì)?
預(yù)測是機器智能的本質(zhì)
在一個系統(tǒng)的上下文中,本質(zhì)的意義可以被更好地理解為“缺失的環(huán)節(jié)”,即解決這個難題的元素。在他的通用人工智能理論中,馬庫斯·胡特通過“普遍歸納、概率規(guī)劃和強化學(xué)習(xí)的思想的統(tǒng)一”,著手解決機器智能的問題。順序決策理論和索洛莫諾夫的普遍歸納理論的結(jié)合,為在已知和未知環(huán)境中的理性代理提供了理論依據(jù)。
馬庫斯·胡特,提出通用人工智能的十年
值得注意的是胡特有關(guān)價值的陳述。在成功的標(biāo)準(zhǔn)中,他的理論抓住了上面討論的智能的非正式定義,這理論植根于一個歸納推理的理論。在另一篇文章中,我研究了歸納法如何驅(qū)動人工智能理論和方法。
在機器智能的理論中,我們已經(jīng)深入理解了為什么預(yù)測是一種本質(zhì)的東西。歸納推理是一個預(yù)測過程,解決了理性的代理人如何在未知的環(huán)境中實現(xiàn)他們的目標(biāo)的問題。
機器學(xué)習(xí)是一種歸納推理的過程,從具體的例子中得出一般結(jié)論,預(yù)測是機器學(xué)習(xí)的本質(zhì)。這一解釋與歷史期望沒有偏離,二者如出一轍。萊格和胡特認(rèn)為他們的方法是“明顯的功能性”方法。重要的是目標(biāo)和代理人可衡量的表現(xiàn)。他們?yōu)橐庾R、情感和創(chuàng)造力等無法衡量的方面可剝離開來而興高采烈。類似于任何擬人化的同情或?qū)ψ匀恢悄艿脑V求,他們對創(chuàng)造一個“人造人”毫無興趣。
另一些人則認(rèn)為,只有通過一種自然智能的逆向工程,人工智能才會被實現(xiàn)。在他們的世界觀中,預(yù)測是智能的本質(zhì)?在他的《人工智能的未來》(On Intelligence)一書中,杰夫·霍金斯提出,預(yù)測提供了一種重要的智能衡量方法,以理解的概念為框架。引用Searle所熟悉的“中文房間”思想實驗(在上面討論的功能觀點中沒有實際意義的問題),霍金斯解釋說,理解包含了記憶的方面。智能需要內(nèi)在的表征和經(jīng)驗的處理。(中文房間(Chinese room)又稱作華語房間,是由美國哲學(xué)家約翰·希爾勒(John Searle)在1980年設(shè)計的一個思維試驗以推翻強人工智能(機能主義)提出的過強主張:只要計算機擁有了適當(dāng)?shù)某绦?,理論上就可以說計算機擁有它的認(rèn)知狀態(tài)以及可以像人一樣地進(jìn)行理解活動。)
杰夫·霍金斯,《人工智能的未來》(On Intelligence)
在霍金斯的理論中,預(yù)測是根據(jù)對將要發(fā)生的事情的預(yù)期來評估。人類的大腦皮層是由數(shù)百萬列組成的,每一列都由一組神經(jīng)元組成。(再一次,回想起我們的工具的擺動,這提醒了霍金斯,一個訓(xùn)練有素的工程師,想到了一個硅芯片的架構(gòu))。
這些結(jié)構(gòu)的一致性暗示了一個單一的算法或原則,在這些結(jié)構(gòu)中,這些列構(gòu)成了預(yù)測的單元。在這個記憶預(yù)測框架中,預(yù)測是智能的本質(zhì)。即使在這個預(yù)測記憶框架內(nèi),預(yù)測作為本質(zhì)的想法也很難確定。雖然人們永遠(yuǎn)活在未來,但正在進(jìn)行中的功能應(yīng)當(dāng)更恰當(dāng)?shù)孛枋鰹?ldquo;繁榮”,而不是“預(yù)測”。我們不斷地評估我們對世界的內(nèi)在解釋,而不是那些相對稀少的、意想不到的觀察。
加里·馬庫斯等批評人士認(rèn)為,霍金斯的模型過于簡單化,只對大腦中已知的一些機制進(jìn)行了抽象化描述;他指出,許多其他方面仍然是一個謎。(這并不是說馬庫斯是主流機器學(xué)習(xí)的倡導(dǎo)者,他相信“機器學(xué)習(xí)有一種偏見,那就是假定一切都是學(xué)來的”)。其他研究人員,如杰夫·迪恩和德米斯·哈薩比斯,似乎更贊同霍金斯在自然中的靈感,如果他們沒有必要為他的想法的可行性或可實現(xiàn)性而鼓掌。
正如人們所預(yù)料的那樣,智能的復(fù)雜性和設(shè)計解決方案所需要的不可避免的妥協(xié)創(chuàng)造了斷層線。這就導(dǎo)致了社區(qū)之間的沖突,就像最近在楊立昆、尤夫·戈德堡和其他代表深度學(xué)習(xí)和NLP(自然語言處理)社區(qū)的代表人物之間的公開辯論中一樣,副標(biāo)題是“for fucks sake, DL people, leave language alone and stop saying you solve it”。當(dāng)我們把現(xiàn)實看做一個客觀的仲裁者時,智能的本質(zhì)就變得越來越不清楚了。最終,要理解為什么預(yù)測是智能的本質(zhì),我們需要訴諸于公眾輿論和業(yè)內(nèi)最有影響力的人。
一個問題變成了一個迷因
在這個故事的大部分都關(guān)于,無論是在追求機器智能還是研究自然智能的過程中,預(yù)測是否是智能的本質(zhì)的問題是一個相對模糊、實用的考量,然后這個問題變成了一個迷因。這種轉(zhuǎn)變可以通過一系列的事件來追溯。機器智能作為歸納推理的愿景在深度學(xué)習(xí)中應(yīng)用后,成為了一種非常成功的方法。這一方法的先驅(qū),如楊立昆,約書亞·本吉奧和杰弗里·辛頓,經(jīng)過幾十年的研究后,因為后來所發(fā)生的事情,他們成為了極為有影響力的預(yù)言家。
在注意力不集中的情況下,復(fù)雜的問題必然會被簡化,并被剝奪它們的歷史價值。為了向大量的新受眾進(jìn)行教育和推廣他們的研究議程,復(fù)雜的問題被簡化為一種適合于推文、聲音片段和演講稿的形式。
當(dāng)迷因變成教條
像楊立昆這樣的人工智能明星站起來發(fā)表宣言時,在整個行業(yè)中都產(chǎn)生了反響。比如在2015年,楊立昆說:“預(yù)測是智能的本質(zhì),而這正是我們想要做的”。而楊立昆想要做的是影響和約束許多人的思想領(lǐng)導(dǎo)和研發(fā)議程。
楊立昆認(rèn)為人工智能問題的關(guān)鍵在于“不確定性下的預(yù)測”,這與上面討論的功能觀點有相似之處。在2016年神經(jīng)信息處理系統(tǒng)大會的主題演講中,預(yù)測學(xué)習(xí)的中心角色——學(xué)習(xí)預(yù)測模型——被強調(diào)為取得進(jìn)展的必要步驟。主要的技術(shù)難題是“世界只是部分可預(yù)測的”。
楊立昆,2016年神經(jīng)信息處理系統(tǒng)大會
正如楊立昆勾勒出的路線圖,預(yù)測框架會帶來一系列的挑戰(zhàn),即使是在那些與預(yù)測無關(guān)的領(lǐng)域。例如,常識被描述為,“不論有什么可用信息,都能預(yù)測過去、現(xiàn)在或未來的任何信息。”
正如上面所討論的霍金斯的預(yù)測-記憶二象性,功能框架可能從預(yù)測轉(zhuǎn)移到其他技術(shù),例如表示、記憶或推理。但為什么要把拒絕成功?這是錘子法則,就是把一切都看成是釘子。當(dāng)作為事物的本質(zhì)時,預(yù)測不僅是描述性的,而且是衡量的標(biāo)準(zhǔn),而且是對解決方案本身的規(guī)定。當(dāng)一個對此崇拜的社區(qū)對其進(jìn)行規(guī)定的時候,這個問題就不再被質(zhì)疑了。它成了真理。
為什么預(yù)測是智能的本質(zhì)
主流技術(shù)對我們?nèi)绾卫斫馐澜绾臀覀冏约河兄薮蟮挠绊???v觀歷史,液壓、蒸汽機和計算機等技術(shù)已經(jīng)塑造了我們對智能的解釋。這種強大的力量今天仍在繼續(xù)。機器學(xué)習(xí)是一種概念框架,它解釋了為什么預(yù)測是智能的本質(zhì)。
像智能這樣的復(fù)雜概念在它被工程化之前就必須被簡化。僅僅是屬性和成功標(biāo)準(zhǔn)的一個子集便可以被抽象出來以適應(yīng)需求。雖然一個單一的定義不能滿足所有人,但是一個實踐型的社區(qū)可能會圍繞這個簡化的概念而團結(jié)起來。對于一個社區(qū)來說,圍繞著機器智能作為一個自主的、目標(biāo)搜索的系統(tǒng)的愿景便可達(dá)成共識。通過設(shè)計,這種智能的定義是在機器智能如何被實現(xiàn)和測量的預(yù)期中精心塑造的。
在這個架構(gòu)框架中,歸納推理這一預(yù)測過程,為理性的代理人如何在未知的環(huán)境中實現(xiàn)他們的目標(biāo)提供了一個解決方案。預(yù)測也是機器學(xué)習(xí)的本質(zhì),這是一個歸納推理的過程。
這種簡化和專注雖然有效,但也具有內(nèi)在的爭議性。智能的復(fù)雜性提供了強調(diào)許多目的、理論和架構(gòu)的自由。因此,人工智能是一種非常多樣化的研究和技術(shù)集合,其中許多研究和技術(shù)都與主流觀點相左。
然而,有力量便有話語權(quán)。機器學(xué)習(xí),尤其是深度學(xué)習(xí),已經(jīng)成為最成功和最具統(tǒng)治力的技術(shù),這掩蓋了人工智能其他的每一個方面。就像智力的概念被縮減為一個簡化的、實用的定義一樣,在許多人看來,人工智能已經(jīng)被簡化為機器學(xué)習(xí),后又進(jìn)一步簡化為深度學(xué)習(xí)。在這種世界觀中,預(yù)測確實是本質(zhì)。
成功也帶來了力量和影響力。經(jīng)過幾十年的研究,深度學(xué)習(xí)的先驅(qū)們被提升到了先知的地位。他們的聲明成為了推文、配樂和演講稿中不加選擇的素材;他們的研究議程和路線圖為整個行業(yè)奠定了基礎(chǔ)。
考慮到這些概念的可理解性,機器智能的任何功能缺口都可能被認(rèn)為是一個預(yù)測的問題。如果你的路線圖根植于預(yù)測的本質(zhì),那么錘子法則就表明了這是一個預(yù)測問題。當(dāng)你以一種規(guī)定性的方式對一個崇拜它的行業(yè)提出質(zhì)疑時,這個問題就不再被質(zhì)疑了,它變成了真理。
預(yù)測是智能的本質(zhì),它將一直存在,直到更主流的技術(shù)告訴我們其他的東西。