人工智能的能與不能
掃描二維碼
隨時(shí)隨地手機(jī)看文章
人工智能終于成真,并即將對(duì)商業(yè)產(chǎn)生深遠(yuǎn)的影響。但它并不是魔法,因此,本文說明對(duì)你的組織來說,人工智能能做什么,以及做不到什么。
250多年來,經(jīng)濟(jì)成長的根本動(dòng)力一直都是技術(shù)創(chuàng)新。其中最重要的,是經(jīng)濟(jì)學(xué)家說的“通用技術(shù)”(general-purpose technology):這類技術(shù)包括蒸汽機(jī)、電力和內(nèi)燃機(jī)。每一類都催生了一波波的互補(bǔ)性創(chuàng)新和機(jī)會(huì)。舉例來說,有了內(nèi)燃機(jī),汽車、貨車、飛機(jī)、鏈鋸和割草機(jī)應(yīng)運(yùn)而生,還有大賣場式零售商、購物中心、交叉配送倉庫(cross-docking warehouse)、新的供應(yīng)鏈,而你若仔細(xì)想想,連郊區(qū)也是。沃爾瑪(WalMart)、UPS和優(yōu)步(Uber)等各式各樣的公司,都找到善用這種技術(shù)的方式,創(chuàng)造出獲利的新商業(yè)模式。
我們這個(gè)時(shí)代,最重要的通用技術(shù)是人工智能,尤其是機(jī)器學(xué)習(xí),也就是機(jī)器有能力持續(xù)不斷改善本身的表現(xiàn),人類交付任務(wù)給機(jī)器時(shí),不必確切解釋如何完成所有那些任務(wù)。過去幾年之間,機(jī)器學(xué)習(xí)已遠(yuǎn)比從前有效且普及。我們現(xiàn)在建立的一些系統(tǒng),已懂得如何自行執(zhí)行任務(wù)。
為什么這件事非同小可?理由有二。第一,我們?nèi)祟惲私獾氖虑椋任覀兡苷f出來的更多。有很多事情,我們有能力做到,但沒有辦法確切解釋如何做到,從辨識(shí)人的臉,到玩古老亞洲斗智游戲圍棋時(shí)下聰明的一步棋,都包括在內(nèi)。在機(jī)器學(xué)習(xí)之前,無法明確表達(dá)自己的知識(shí),就表示我們不能把許多任務(wù)自動(dòng)化。而現(xiàn)在,我們做得到了。
第二,機(jī)器學(xué)習(xí)系統(tǒng)往往很擅長學(xué)習(xí)。它們能在廣泛的活動(dòng)上,展現(xiàn)出超乎人類的表現(xiàn),包括偵測詐欺和診斷疾病。優(yōu)異的數(shù)字學(xué)習(xí)者,正被部署到經(jīng)濟(jì)的各個(gè)角落,它們?cè)斐傻臎_擊會(huì)十分深遠(yuǎn)。
在商業(yè)領(lǐng)域,人工智能勢必會(huì)產(chǎn)生改造一切的沖擊,規(guī)模不亞于先前的通用技術(shù)。雖然世界各地已有成千上萬的公司開始使用它,但大多數(shù)的大機(jī)會(huì)還沒有被開發(fā)。未來十年,人工智能的影響將會(huì)擴(kuò)大,因?yàn)橹圃?、零售、運(yùn)輸、金融、健康照護(hù)、法律、廣告、保險(xiǎn)、娛樂、教育,以及其他每一種產(chǎn)業(yè),都會(huì)改造本身的核心流程和商業(yè)模式,以充分利用機(jī)器學(xué)習(xí)?,F(xiàn)在的瓶頸,是在管理、執(zhí)行和商業(yè)想象上。
然而,人工智能和其他許多新技術(shù)一樣,產(chǎn)生許多不切實(shí)際的期望。我們見到商業(yè)計(jì)劃動(dòng)不動(dòng)就提到機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò),以及這種技術(shù)的其他形式,卻很少提及它的真正能力。舉例來說,單單稱一個(gè)約會(huì)網(wǎng)站是“人工智能驅(qū)動(dòng)”,并不會(huì)使它的效果更好,但可能有助于籌募資金。本文將避開這些雜音,直接說明人工智能的真正潛力、它的實(shí)務(wù)意涵,以及有哪些障礙妨礙采用它。
現(xiàn)在,人工智能能做什么?
人工智能這個(gè)詞,是達(dá)特茅斯學(xué)院(Dartmouth)數(shù)學(xué)教授約翰.麥卡錫(John McCarthy),在1955年創(chuàng)造的。來年,他針對(duì)這個(gè)主題,籌辦開創(chuàng)性的研討會(huì)。此后,可能部分由于它那引發(fā)人們想象的名稱,這個(gè)領(lǐng)域產(chǎn)生了比它夢(mèng)幻般宣言和承諾還要多的東西。1957年,經(jīng)濟(jì)學(xué)家赫伯特.賽蒙(Herbert Simon)預(yù)測,十年內(nèi)計(jì)算機(jī)會(huì)在西洋棋比賽上打敗人類(實(shí)際上花了四十年)。1967年,認(rèn)知科學(xué)家馬文.明斯基(Marvin Minsky)說:“一個(gè)世代內(nèi),創(chuàng)造人工智能時(shí)遇到的問題,將會(huì)大幅解決。”賽蒙和明斯基都是知識(shí)巨人,卻都錯(cuò)得十分離譜。因此,對(duì)于未來的突破提出戲劇性的說法,卻遭到某種程度的懷疑,這情況是可以理解的。
我們先來探討人工智能已經(jīng)在做什么,以及它改善的速度有多快。最大的進(jìn)展在兩大領(lǐng)域:感知(perception)與認(rèn)知(cognition)。在感知方面,一些最實(shí)用的進(jìn)展和語音有關(guān)。語音識(shí)別要達(dá)到完美,還有一大段距離,但數(shù)百萬人正在使用它,例如Siri、Alexa和Google Assistant。你正在看的這篇文章,是先向計(jì)算機(jī)口述,然后以足夠的正確程度轉(zhuǎn)成文字,速度比打字要快。
史丹福大學(xué)計(jì)算機(jī)科學(xué)家詹姆斯.藍(lán)德(James Landay)和同事的研究發(fā)現(xiàn),平均來說,目前進(jìn)行語音識(shí)別,比在手機(jī)上打字約快三倍。以前的錯(cuò)誤率是8.5%,現(xiàn)在已經(jīng)降為4.9%。引人注目的是,這么大幅度的改善,不是過去十年發(fā)生的,而僅僅是2016年夏天以來的成果。
雖然世界各地已有成千上萬的公司開始使用人工智能,但大多數(shù)的大機(jī)會(huì)還沒有被開發(fā)。
圖像辨識(shí)也大幅改善。你可能已經(jīng)注意到臉書(Facebook)和其他應(yīng)用程序,現(xiàn)在認(rèn)得出你張貼照片中朋友的臉孔,并提醒你標(biāo)記他們的名字。安裝在智能手機(jī)里的應(yīng)用程序,認(rèn)得出野外中的幾乎任何鳥類。圖像辨識(shí)甚至取代企業(yè)總部中的身分識(shí)別證。無人駕駛汽車中使用的視覺系統(tǒng),以前確認(rèn)行人時(shí),每三十張圖像就會(huì)錯(cuò)誤一次(這些系統(tǒng)中的相機(jī),每秒就記錄約三十張);現(xiàn)在,它們的錯(cuò)誤次數(shù),是每三千萬張不到一次。一個(gè)名為ImageNet的大型數(shù)據(jù)庫,擁有數(shù)百萬張常見、模糊,或是十分詭異的圖片,辨識(shí)圖像的最佳系統(tǒng),辨識(shí)那個(gè)數(shù)據(jù)庫里圖片的錯(cuò)誤率,從2010年的高于30%,降為2016年的4%左右(見圖:“小狗或馬芬蛋糕?”)。
近年來采用的一種新方法,是以非常大型或“深度”的神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),因此改善的速度迅速加快。視覺系統(tǒng)的機(jī)器學(xué)習(xí)方法,仍有許多缺陷;但連人也很難迅速認(rèn)出小狗的臉,或者更令人尷尬的是,看到牠們可愛的臉孔,但其實(shí)并不存在。
第二類的重大改善,是在認(rèn)知和問題解決方面。機(jī)器已經(jīng)在撲克牌和圍棋方面,擊敗最優(yōu)秀的人類高手,專家本來預(yù)測至少還要再十年才會(huì)達(dá)到這樣的成就。Google的DeepMind團(tuán)隊(duì)使用機(jī)器學(xué)習(xí)系統(tǒng),改善數(shù)據(jù)中心的冷卻效率達(dá)15%以上,即使人類專家之前已經(jīng)將它們優(yōu)化了。網(wǎng)絡(luò)安全公司深度本能(Deep Instinct)使用智能代理(intelligent agent),偵測惡意軟件。
PayPal也用智能代理來防范洗錢。使用IBM技術(shù)的一套系統(tǒng),將新加坡一家保險(xiǎn)公司的理賠流程自動(dòng)化。數(shù)據(jù)科學(xué)平臺(tái)公司Lumidatum的一套系統(tǒng),實(shí)時(shí)提供建議,以改善顧客支持。數(shù)十家公司正使用機(jī)器學(xué)習(xí),決定要在華爾街執(zhí)行哪些交易,而且在它的協(xié)助之下,做成愈來愈多信用決策。亞馬遜(Amazon)運(yùn)用機(jī)器學(xué)習(xí),來優(yōu)化存貨,和改善對(duì)顧客的產(chǎn)品建議。無限分析公司(Infinite Analytics)開發(fā)出一套機(jī)器學(xué)習(xí)系統(tǒng),預(yù)測用戶會(huì)不會(huì)點(diǎn)按某一則廣告,為一家全球消費(fèi)性包裝產(chǎn)品公司改善在線廣告刊登效果。另一套機(jī)器學(xué)習(xí)系統(tǒng),用來改善巴西一家在線零售商的顧客搜尋與發(fā)現(xiàn)過程。前述第一套系統(tǒng)提高廣告的投資報(bào)酬率三倍,第二套系統(tǒng)使得年?duì)I業(yè)收入增加1.25億美元。
機(jī)器學(xué)習(xí)系統(tǒng)不只取代許多應(yīng)用軟件中比較舊的算法,現(xiàn)在,更在許多過去人類較擅長的任務(wù)上,表現(xiàn)卓越。這些系統(tǒng)仍然很不完美,但它們?cè)贗mageNet數(shù)據(jù)庫約5%的錯(cuò)誤率,表現(xiàn)已經(jīng)與人類的水平相當(dāng),或者更好。語音識(shí)別現(xiàn)在也幾乎等同于人類的表現(xiàn),即使在嘈雜的環(huán)境中也是如此。達(dá)到這個(gè)門坎,開啟了改造職場和經(jīng)濟(jì)的龐大新可能性。以人工智能為基礎(chǔ)的系統(tǒng),一旦在某個(gè)任務(wù)上的表現(xiàn)超越人類,就會(huì)遠(yuǎn)比從前更可能迅速擴(kuò)散。舉例來說,分別是無人機(jī)和機(jī)器人制造商的Aptonomy與Sanbot,正使用改良后的視覺系統(tǒng),將不少保全工作自動(dòng)化。軟件業(yè)者Affectiva等公司,正在使用它們來辨識(shí)焦點(diǎn)小組成員的喜悅、驚訝和憤怒等情緒。有幾家深度學(xué)習(xí)新創(chuàng)企業(yè)使用它們掃瞄醫(yī)療圖像,以協(xié)助診斷癌癥,Enlitic就是其中一家公司。
這些是令人印象深刻的成就,但是,以人工智能為基礎(chǔ)的系統(tǒng),應(yīng)用范圍仍然相當(dāng)狹隘。例如,ImageNet數(shù)據(jù)庫有高達(dá)幾百萬張圖像,人工智能辨識(shí)ImageNet圖像的表現(xiàn)可圈可點(diǎn),但是,不見得一定能在外界各種不同的條件和情況下,取得類似的成功率,因?yàn)檎彰髑鍥r、角度、圖像分辨率和背景,可能非常不同。從更根本的層面來說,若有一套系統(tǒng)可了解中文的語音,并翻譯成英文,我們會(huì)對(duì)這套系統(tǒng)的能力贊嘆不已,但我們不能期待這種系統(tǒng)懂得特定的中國字是什么意思,更別提是讓它們告訴我們,到了北京要去哪里用餐了。如果某個(gè)人有一項(xiàng)任務(wù)執(zhí)行得很好,我們自然會(huì)假定那個(gè)人,在相關(guān)任務(wù)上也擁有一些能力。但機(jī)器學(xué)習(xí)系統(tǒng)受到訓(xùn)練是要去做特定的任務(wù),通常它們的知識(shí)不會(huì)擴(kuò)大應(yīng)用(generalize)。有些人誤以為計(jì)算機(jī)狹隘地理解某件事,就意味著它能更廣泛地了解其他事物,可能主要是因?yàn)檫@種謬誤,而造成人們對(duì)人工智能進(jìn)展感到困惑,并出現(xiàn)浮夸的說法。機(jī)器要展現(xiàn)涵蓋各種領(lǐng)域的普遍智慧,這樣的境界仍然相當(dāng)遙遠(yuǎn)。
了解機(jī)器學(xué)習(xí)
關(guān)于機(jī)器學(xué)習(xí)的最重要事情,是它意味要用根本上完全不同的方式來制作軟件:機(jī)器從例子中學(xué)習(xí),而不是明確編寫程序,以得到特定的結(jié)果。這和以前的做法大不相同。過去五十年來的大部分時(shí)候,信息科技及應(yīng)用的進(jìn)步,都是聚焦在把目前的知識(shí)和工作程序?qū)懗沙绦虼a,并嵌入機(jī)器中。沒錯(cuò),編碼(coding)這個(gè)詞,是指開發(fā)人員很辛苦地將腦中的知識(shí),轉(zhuǎn)化成機(jī)器能了解和執(zhí)行的形式。這個(gè)方法有根本上的缺點(diǎn):我們擁有的許多知識(shí),是難以完整說明的內(nèi)隱(tacit)知識(shí)。我們幾乎不可能寫下一些指令,教另一個(gè)人學(xué)習(xí)如何騎腳踏車,或是辨識(shí)朋友的臉孔。
換句話說,我們懂的事情,比我們能表達(dá)出來的更多。這個(gè)事實(shí)十分重要,因此有個(gè)名稱:博藍(lán)尼悖論(Polanyi's Paradox),因?yàn)椴W(xué)多聞的哲學(xué)家博藍(lán)尼在1964年說明了這個(gè)現(xiàn)象。博藍(lán)尼悖論不只限制我們能告訴另一個(gè)人的事情,一直以來,也為我們賦予機(jī)器智慧的能力,設(shè)下根本的限制。長久以來,這限制了機(jī)器在經(jīng)濟(jì)中能有效執(zhí)行的活動(dòng)。
機(jī)器學(xué)習(xí)正在克服這些限制。在第二次機(jī)器時(shí)代的第二波浪潮中,人類打造的機(jī)器正從各種例子中學(xué)習(xí),并使用結(jié)構(gòu)化的回饋意見,解決它們本身的問題,例如,博藍(lán)尼提出有關(guān)臉孔辨識(shí)的經(jīng)典問題。
不同類型的機(jī)器學(xué)習(xí)
人工智能和機(jī)器學(xué)習(xí)有許多類型,但近年來,大部分的成功集中在一類:監(jiān)督式學(xué)習(xí)系統(tǒng)(supervised learning system),也就是把某個(gè)問題的許多正確答案的例子給機(jī)器。這個(gè)流程,幾乎總是要把一組投入元素X,對(duì)映到一組產(chǎn)出Y。舉例來說,投入元素可能是各種不同動(dòng)物的照片,正確的產(chǎn)出,可能是這些動(dòng)物的標(biāo)記:狗、貓、馬。投入元素也可能是來自錄制聲音的波形,產(chǎn)出可能是“是”、“否”、“你好”、“再見”等(見圖:「監(jiān)督式學(xué)習(xí)系統(tǒng)」)。
監(jiān)督式學(xué)習(xí)系統(tǒng)
這個(gè)領(lǐng)域的兩位先驅(qū)湯姆.米契爾(Tom Mitchell)和麥可.喬丹(Michael I. Jordan)注意到機(jī)器學(xué)習(xí)最近的進(jìn)展,包括將一組投入元素與一組產(chǎn)出作比對(duì)。其中一些例子如下:
成功的系統(tǒng)往往使用一組訓(xùn)練數(shù)據(jù)組,其中有數(shù)千、或甚至數(shù)百萬個(gè)例子,每個(gè)例子都標(biāo)記正確的答案。接著,就放手讓系統(tǒng)去觀察新的例子。如果訓(xùn)練進(jìn)行良好,系統(tǒng)預(yù)測答案的正確率會(huì)很高。
促成這些成功背后的算法,仰賴的是一種使用神經(jīng)網(wǎng)絡(luò)的“深度學(xué)習(xí)(deep learning)”方法。深度學(xué)習(xí)算法大幅勝過舊世代的機(jī)器學(xué)習(xí)算法:它們更能善用數(shù)量更多得多的數(shù)據(jù)集。
隨著訓(xùn)練數(shù)據(jù)中的例子數(shù)目增加,舊系統(tǒng)也會(huì)改善,但只能改善到某一個(gè)程度,在那之后,額外增加數(shù)據(jù)也不會(huì)使預(yù)測變得更準(zhǔn)。這個(gè)領(lǐng)域的大師之一吳恩達(dá)(Andrew Ng)表示,深度神經(jīng)網(wǎng)路似乎不會(huì)像這樣成效趨于持平:更多資料會(huì)使預(yù)測愈來愈好。有些非常大的系統(tǒng),使用3,600萬個(gè)或更多例子加以訓(xùn)練。當(dāng)然,運(yùn)用極大的數(shù)據(jù)集,需要愈來愈大的處理能力,因此,非常大的系統(tǒng)常必須在超級(jí)計(jì)算機(jī)和專用計(jì)算機(jī)架構(gòu)上運(yùn)作。
任何情況中,如果你有許多行為數(shù)據(jù),并且試著預(yù)測結(jié)果,都是監(jiān)督式學(xué)習(xí)系統(tǒng)的潛在應(yīng)用。領(lǐng)導(dǎo)亞馬遜消費(fèi)者業(yè)務(wù)的杰夫.威爾克(Jeff Wilke)說,監(jiān)督式學(xué)習(xí)系統(tǒng)已大量取代以記憶為基礎(chǔ)的過濾式算法,這種過濾式算法過去是用來向顧客做個(gè)人化推薦。在其他情況中,設(shè)定存貨水平和優(yōu)化供應(yīng)鏈的傳統(tǒng)算法,已被根據(jù)機(jī)器學(xué)習(xí)、更有效率和更穩(wěn)健的系統(tǒng)取代。摩根大通銀行(JPMorgan Chase)引進(jìn)一個(gè)系統(tǒng),審查商業(yè)貸款合約;以前需要放款行員36萬個(gè)小時(shí)的工作,現(xiàn)在能在幾秒之內(nèi)完成。而且,監(jiān)督式學(xué)習(xí)系統(tǒng)現(xiàn)在還可用來診斷皮膚癌。這些只是少數(shù)一些例子而已。
標(biāo)記一堆數(shù)據(jù),用它來訓(xùn)練監(jiān)督式學(xué)習(xí)者,是相當(dāng)直截了當(dāng)?shù)淖龇?正因如此,監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),比非監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng)更常見,至少在目前是這樣。非監(jiān)督式學(xué)習(xí)系統(tǒng)設(shè)法自行學(xué)習(xí)。我們?nèi)祟愂浅錾姆潜O(jiān)督式學(xué)習(xí)者。我們對(duì)世界的大部分知識(shí)(例如辨認(rèn)一棵樹),是在幾乎沒有標(biāo)記數(shù)據(jù)、甚至完全沒有標(biāo)記數(shù)據(jù)的情況下學(xué)到的。但要開發(fā)出用這種方式運(yùn)作的成功機(jī)器學(xué)習(xí)系統(tǒng),是極為困難的。
當(dāng)我們學(xué)習(xí)打造穩(wěn)健的非監(jiān)督式學(xué)習(xí)者,會(huì)出現(xiàn)令人振奮的可能性。這些機(jī)器能以全新的方式,觀察復(fù)雜的問題,協(xié)助我們發(fā)現(xiàn)一些目前我們還不知道的各種形態(tài);例如,疾病的蔓延、市場中不同證券的價(jià)格波動(dòng)、顧客的購買行為等。這種可能性,使得臉書人工智能研究主管、紐約大學(xué)教授揚(yáng).勒丘恩(Yann LeCun)把監(jiān)督式學(xué)習(xí)系統(tǒng)比喻成蛋糕上的糖霜,非監(jiān)督式學(xué)習(xí)則是蛋糕本身。
以人工智能為基礎(chǔ)的系統(tǒng),一旦在某個(gè)任務(wù)上的表現(xiàn)超越人類,就會(huì)遠(yuǎn)比從前更可能迅速擴(kuò)散。這個(gè)領(lǐng)域里的另一個(gè)成長中的小領(lǐng)域,就是強(qiáng)化式學(xué)習(xí)(reinforcement learning)。這種方法被嵌入擅長玩雅達(dá)利(Atari)電玩游戲的系統(tǒng),以及圍棋等棋盤游戲中。它也協(xié)助優(yōu)化資料中心的電力使用,以及發(fā)展出股票市場的交易策略。Kindred研發(fā)的機(jī)器人,使用機(jī)器學(xué)習(xí),來辨識(shí)和整理他們以前不曾遇過的對(duì)象,加快消費(fèi)性產(chǎn)品配銷中心的「拿取與放置」流程。強(qiáng)化式學(xué)習(xí)系統(tǒng)中,程序設(shè)計(jì)師會(huì)厘清系統(tǒng)的目前狀態(tài)和目標(biāo)、列出容許的行動(dòng),并說明限制每項(xiàng)行動(dòng)所獲得結(jié)果的環(huán)境要素。這套系統(tǒng)使用容許采取的行動(dòng),來判斷如何才能盡量接近目標(biāo)。如果人類能明確設(shè)定目標(biāo),但不見得知道要如何達(dá)到那個(gè)目標(biāo),那么這些系統(tǒng)運(yùn)作得很好。舉例來說,微軟(Microsoft)使用強(qiáng)化式學(xué)習(xí),若是有較多的訪客點(diǎn)按連結(jié),就會(huì)「獎(jiǎng)賞」系統(tǒng)更高的分?jǐn)?shù),用這種方式來選擇MSN.com新聞報(bào)導(dǎo)的頭條新聞。這套系統(tǒng)試著根據(jù)設(shè)計(jì)者給它的規(guī)則,極大化它得到的分?jǐn)?shù)。當(dāng)然,這表示強(qiáng)化式學(xué)習(xí)系統(tǒng)會(huì)優(yōu)化,以達(dá)到你明確表示要獎(jiǎng)賞的目標(biāo),而不見得是你真正在意的目標(biāo),例如終身顧客價(jià)值,因此,清楚地設(shè)定正確目標(biāo),是非常重要的。
讓機(jī)器學(xué)習(xí)得以運(yùn)作
目前想要使用機(jī)器學(xué)習(xí)的組織,有三個(gè)好消息。第一,人工智能技能正在迅速擴(kuò)散。全世界的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)專家仍不夠多,但對(duì)他們的需求,有在線教育資源和各個(gè)大學(xué)努力去滿足。其中最好的,包括Udacity、Coursera和fast.ai,不僅教導(dǎo)入門概念,實(shí)際上還教導(dǎo)聰明、上進(jìn)的學(xué)生創(chuàng)造工業(yè)級(jí)的機(jī)器學(xué)習(xí)部署。對(duì)這方面有興趣的公司,除了訓(xùn)練本身的人員,還可以利用Upwork、Topcoder和Kaggle等在線人才平臺(tái),尋找有可驗(yàn)證專長的機(jī)器學(xué)習(xí)專家。
第二個(gè)受歡迎的發(fā)展,是現(xiàn)代人工智能需要的算法和硬件,可視需要購買或租用。Google、亞馬遜、微軟、Salesforce和其他公司,正透過云端,提供強(qiáng)大的機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施。這些對(duì)手之間激烈的競爭,意味想要實(shí)驗(yàn)或部署機(jī)器學(xué)習(xí)的企業(yè),會(huì)發(fā)現(xiàn)長期而言,可用的能力愈來愈強(qiáng),價(jià)格卻愈來愈低。
最后一個(gè)好消息,可能最為人低估:你可能不需要那么多資料,就可以開始有效利用機(jī)器學(xué)習(xí)。大部分機(jī)器學(xué)習(xí)系統(tǒng),只要給它們更多數(shù)據(jù)去運(yùn)作,它們的績效就會(huì)改善。因此合理的結(jié)論似乎是,有最多資料的公司會(huì)勝出。這種說法若要正確,前提必須是:如果「勝利」是指「主宰單一應(yīng)用的全球市場,例如廣告定向(ad targeting)或語音識(shí)別等應(yīng)用」。但如果成功的定義并非如此,而是要顯著改善績效,那么,所需要的足夠數(shù)據(jù),往往令人意外地很容易取得。
舉例來說,Udacity共同創(chuàng)辦人塞巴斯欽.特倫(Sebastian Thrun)注意到,他的一些銷售人員在聊天室回復(fù)入站查詢方面,成效遠(yuǎn)高于其他人。特倫和他的研究所學(xué)生扎伊德.伊南(Zayd Enam)知道,他們的聊天室登錄,基本上是一組有標(biāo)記的訓(xùn)練數(shù)據(jù),這正是監(jiān)督式學(xué)習(xí)系統(tǒng)需要的。導(dǎo)致達(dá)成銷售的互動(dòng),標(biāo)記為成功,其他所有的互動(dòng),標(biāo)記為失敗。伊南使用這些數(shù)據(jù)來預(yù)測,成功的銷售人員,在響應(yīng)一些極為常見的查詢時(shí),可能會(huì)提供哪些答案,然后和其他銷售人員分享那些預(yù)測,敦促他們?nèi)〉酶玫目冃?。在一千次?xùn)練周期之后,銷售人員提高成效的幅度達(dá)54%,而且能同時(shí)服務(wù)兩倍多的顧客。
人工智能新創(chuàng)公司W(wǎng)orkFusion采取類似的方法。它和一些公司合作,用更高程度的自動(dòng)化,來進(jìn)行辦公室后端流程,例如,支付國際發(fā)票和結(jié)算金融機(jī)構(gòu)之間的交易。這些流程過去一直沒有自動(dòng)化,是因?yàn)樗鼈兿喈?dāng)復(fù)雜;相關(guān)的信息,不見得每次都以相同的方式呈現(xiàn)(“我們?nèi)绾沃浪麄冋劦氖鞘裁簇泿?”)而且需要某種程度的解讀和判斷。WorkFusion的軟件,在背景觀看人類做工作,并使用人類的行動(dòng),作為“分類”這項(xiàng)認(rèn)知任務(wù)的訓(xùn)練數(shù)據(jù)(“這張發(fā)票是用美元。這張是用日?qǐng)A。這張是用歐元……”)。一旦系統(tǒng)對(duì)本身的分類能力有足夠的信心,就會(huì)接管分類流程。
機(jī)器學(xué)習(xí)正在三個(gè)層次上推動(dòng)變革:任務(wù)與職業(yè)、商業(yè)流程、商業(yè)模式。重新設(shè)計(jì)任務(wù)與職業(yè)的一個(gè)例子,是使用機(jī)器視覺系統(tǒng),來辨識(shí)潛在的癌細(xì)胞,好讓放射科醫(yī)生把心力專注在真正危急的病例上、與病患溝通,以及與其他醫(yī)生協(xié)調(diào)。重新設(shè)計(jì)流程的一個(gè)例子,是亞馬遜訂單履行中心根據(jù)機(jī)器學(xué)習(xí),引進(jìn)機(jī)器人和優(yōu)化算法之后,改造工作流程和樓面規(guī)劃。同樣的,公司應(yīng)重新思考商業(yè)模式,以充分利用機(jī)器學(xué)習(xí)系統(tǒng),這種系統(tǒng)可以用個(gè)人化方式,聰明地推薦音樂和電影。與其根據(jù)消費(fèi)者的選擇,一首一首地銷售歌曲,更好的模式可能是讓顧客訂閱個(gè)人化電臺(tái),這個(gè)電臺(tái)可以預(yù)測和播放那個(gè)顧客會(huì)喜歡的音樂,即使他之前不曾聽過那些音樂。
注意,機(jī)器學(xué)習(xí)系統(tǒng)很少取代整個(gè)工作、流程或商業(yè)模式。最常見的情形,是它們與人類的活動(dòng)互補(bǔ),讓人類的工作更有價(jià)值。“把所有的任務(wù)交給機(jī)器”,不太可能是這個(gè)新分工方式的最有效準(zhǔn)則。相反地,如果成功完成某個(gè)流程需要十道步驟,其中一、兩道可能自動(dòng)化,其余的部分由人類來做,會(huì)更有價(jià)值。舉例來說,Udacity的聊天室銷售支持系統(tǒng),并沒有試著打造可接管所有對(duì)話的機(jī)器人。相反地,它會(huì)建議人類銷售人員如何改善績效。人類仍居于主導(dǎo)地位,但效能和效率遠(yuǎn)高于從前。這么做的可行性,遠(yuǎn)高于嘗試設(shè)計(jì)機(jī)器來做人類會(huì)做的每件事。這通常會(huì)使相關(guān)人員的工作變得更好、更令人滿意,最后提供更好的成果給顧客。
設(shè)計(jì)和執(zhí)行新方式,來結(jié)合技術(shù)、人類技能與資本資產(chǎn),以滿足顧客需求,這一切都需要大規(guī)模的創(chuàng)意與規(guī)劃。機(jī)器不是非常擅長這種任務(wù)。因此,在機(jī)器學(xué)習(xí)的時(shí)代當(dāng)創(chuàng)業(yè)家或企業(yè)經(jīng)理人,是社會(huì)中獎(jiǎng)酬最高的工作之一。
風(fēng)險(xiǎn)與限制
第二次機(jī)器時(shí)代的第二波浪潮,也伴隨著新的風(fēng)險(xiǎn)。尤其是機(jī)器學(xué)習(xí)系統(tǒng)的“可解釋能力”(interpretability)經(jīng)常偏低。意思是,人類難以清楚了解系統(tǒng)如何做成決定。深度神經(jīng)網(wǎng)絡(luò)可能有數(shù)億個(gè)連結(jié),每個(gè)都對(duì)最后的決定貢獻(xiàn)了一小部分力量。因此,這些系統(tǒng)的預(yù)測,往往無法提出簡單、清楚的解釋。機(jī)器和人類不同,機(jī)器不擅長說故事(目前還不擅長)。它們不見得能提出理由說明,為什么某人應(yīng)征某個(gè)職位獲得錄取,另一個(gè)人則落選,或是為什么推薦某種藥物。說來諷刺,即使我們開始克服博藍(lán)尼悖論,卻正面臨它的相反版本:機(jī)器懂的,比它們能告訴我們的更多。
這產(chǎn)生了三種風(fēng)險(xiǎn)。第一,機(jī)器可能有隱藏的偏誤,而偏誤來自訓(xùn)練系統(tǒng)所用的數(shù)據(jù),而不是設(shè)計(jì)者刻意制造偏誤。舉例來說,如果系統(tǒng)使用人類招募人員過去做的決策數(shù)據(jù)集,學(xué)會(huì)應(yīng)錄取哪些應(yīng)征工作的人,它們可能無意間永久沿用了人類決策者的種族、性別、族群或其他方面的偏誤。此外,這些偏誤可能不是以清楚的外顯(explicit)法則來呈現(xiàn),而是嵌入數(shù)千個(gè)被考慮的因素之間微妙的互動(dòng)當(dāng)中。
第二個(gè)風(fēng)險(xiǎn)是,神經(jīng)網(wǎng)絡(luò)系統(tǒng)和建立在外顯邏輯法則上的傳統(tǒng)系統(tǒng)不同,神經(jīng)網(wǎng)絡(luò)系統(tǒng)處理的是統(tǒng)計(jì)真相(statistical truth),不是實(shí)際真相(literal truth)。因此很難、甚至不可能
完全肯定地證明,系統(tǒng)會(huì)在所有的情況下運(yùn)作,尤其是訓(xùn)練數(shù)據(jù)里沒有呈現(xiàn)的情況。對(duì)于關(guān)鍵任務(wù)的應(yīng)用,例如,控制核能發(fā)電廠或攸關(guān)生死的決定,缺乏可驗(yàn)證性令人擔(dān)憂。
第三,當(dāng)機(jī)器學(xué)習(xí)系統(tǒng)的確會(huì)犯錯(cuò),幾乎不可避免會(huì)犯錯(cuò),可能就很難診斷什么事情出了差錯(cuò),并改正錯(cuò)誤。導(dǎo)出解決方案的根本結(jié)構(gòu),可能復(fù)雜得難以想象,而且,如果接受訓(xùn)練的系統(tǒng)所處狀況改變,解決方案可能很不理想。
雖然這些風(fēng)險(xiǎn)都很嚴(yán)重,但合適的比較標(biāo)準(zhǔn)并不是以“完美”為標(biāo)準(zhǔn),而是可能得到的最佳替代方案。畢竟,人類也會(huì)有偏誤,也會(huì)犯錯(cuò),也可能難以確實(shí)地解釋我們?nèi)绾巫龀赡硞€(gè)決定。以機(jī)器為基礎(chǔ)的系統(tǒng),優(yōu)點(diǎn)在于它們經(jīng)過一段時(shí)間之后能夠逐漸改進(jìn),而且若是給它們相同的數(shù)據(jù),會(huì)得到前后一致的答案。
這是否意味著人工智能和機(jī)器學(xué)習(xí)能做的事沒有極限?感知和認(rèn)知涵蓋很廣的領(lǐng)域:從開車到預(yù)測銷售額,到?jīng)Q定錄用或升遷誰。我們相信,人工智能有很好的機(jī)會(huì),不久就會(huì)在大部分或所有這些領(lǐng)域,達(dá)到超人的表現(xiàn)水平。
那么,人工智能和機(jī)器學(xué)習(xí)不能做什么事?
我們有時(shí)會(huì)聽到有人說:“人工智能永遠(yuǎn)不會(huì)擅長評(píng)估情緒化、詭計(jì)多端、狡猾、前后不一的人類:它太過一板一眼、不帶人性色彩,沒辦法做那種事。”我們不同意這種說法。像Affectiva的機(jī)器學(xué)習(xí)系統(tǒng),在根據(jù)音調(diào)或臉部表情,以察覺人的情緒狀態(tài)方面,表現(xiàn)已達(dá)到或超越人類的水平。其他系統(tǒng)能推斷,即使是世界上最佳的撲克牌好手,什么時(shí)候在虛張聲勢,而能在極復(fù)雜的一對(duì)一無限注德州撲克(Heads-up No-Limit Texas Hold'em)競賽上擊敗他們。正確看出一個(gè)人的情緒,是細(xì)致微妙的工作,但不是魔法。它需要感知和認(rèn)知,這正是機(jī)器學(xué)習(xí)目前很強(qiáng)的領(lǐng)域,而且持續(xù)變得更強(qiáng)。
若要討論人工智能的極限,一個(gè)很好的起始點(diǎn),就是畢加索(Pablo Picasso)對(duì)計(jì)算機(jī)的觀察:“但它們一無用處。只能給你答案。”從機(jī)器學(xué)習(xí)最近的勝利來看,它們絕對(duì)不是一無用處,但畢加索的觀察仍帶來深入的見解。計(jì)算機(jī)是回答問題的裝置,不是用來提出問題。這表示我們?nèi)匀粫?huì)很需要某些人,他們能夠看出接下來要處理什么問題或機(jī)會(huì),或是要探索什么新領(lǐng)域,像是創(chuàng)業(yè)家、創(chuàng)新者、科學(xué)家、創(chuàng)造者等等。
雖然人工智能的這些風(fēng)險(xiǎn)都很嚴(yán)重,但合適的比較標(biāo)準(zhǔn)并不是以“完美”為標(biāo)準(zhǔn),而是可能得到的最佳替代方案。同樣地,消極地評(píng)估某個(gè)人的心理狀態(tài)或士氣,和積極地設(shè)法改變它,這兩者有很大的不同。機(jī)器學(xué)習(xí)系統(tǒng)變得相當(dāng)擅長前者,但在后者仍遠(yuǎn)遠(yuǎn)落后我們。人類是強(qiáng)烈的社會(huì)性物種;最擅長運(yùn)用社會(huì)性驅(qū)力(social drive)如同情、自豪、團(tuán)結(jié)、羞恥等,以說服、激勵(lì)和鼓舞人的是其他人類,不是機(jī)器。2014年,TED大會(huì)和XPrize基金會(huì)宣布設(shè)立一個(gè)獎(jiǎng)項(xiàng),頒給“在這座講臺(tái)發(fā)表引人入勝的演說,贏得聽眾起立鼓掌的第一個(gè)人工智能”。我們懷疑這個(gè)獎(jiǎng)很快就會(huì)頒出。
我們認(rèn)為,在這個(gè)超級(jí)強(qiáng)大機(jī)器學(xué)習(xí)的新時(shí)代中,人類智慧最大和最重要的機(jī)會(huì),在于兩個(gè)領(lǐng)域的交會(huì)處:分析接下來要處理什么問題,以及說服許多人去處理那些問題,提出解決方案。這是領(lǐng)導(dǎo)力的合適定義,而這在第二次機(jī)器時(shí)代,變得遠(yuǎn)比從前重要。
人類和機(jī)器之間目前的分工情況,正在非常快速地崩解。堅(jiān)持原來見解的公司會(huì)發(fā)現(xiàn):相較于愿意且能夠?qū)C(jī)器學(xué)習(xí)應(yīng)用在所有合適地方的對(duì)手,以及能分析如何有效整合它的能力與人類能力的公司,堅(jiān)持原來見解的公司日益落居競爭劣勢。
由于技術(shù)進(jìn)步,商業(yè)世界已經(jīng)開始經(jīng)歷地殼變動(dòng)般的根本改變。和蒸汽動(dòng)力與電力的情況一樣,區(qū)分贏家和輸家的因素,不在于能不能取得新技術(shù),甚至不在于是否能聘用到最佳的技術(shù)人員。相反地,贏家將會(huì)是態(tài)度夠開放的創(chuàng)新者,他們的眼光能夠超越現(xiàn)狀,設(shè)想出非常不同的方法;他們也夠聰明,能夠運(yùn)用那些方法。機(jī)器學(xué)習(xí)留給我們最大的成果之一,可能是創(chuàng)造新一代的企業(yè)領(lǐng)導(dǎo)人。
我們認(rèn)為,人工智能,尤其是機(jī)器學(xué)習(xí),是我們這個(gè)時(shí)代最重要的通用技術(shù)。這些創(chuàng)新對(duì)企業(yè)和經(jīng)濟(jì)的沖擊,將不只反映在它們的直接貢獻(xiàn)上,也反映在它們能夠促成和啟發(fā)互補(bǔ)性的創(chuàng)新。
機(jī)器學(xué)習(xí)帶來很多能力,像是更好的視覺系統(tǒng)、語音識(shí)別、智能問題解決等等,有了這些能力,就可能出現(xiàn)新的產(chǎn)品和流程。
有些專家更進(jìn)一步。豐田研究所(Toyota Institute)現(xiàn)任領(lǐng)導(dǎo)人吉爾.普拉特(Gil Pratt),把目前這一波的人工智能技術(shù),比喻成五億年前的寒武紀(jì)大爆發(fā),那時(shí)孕育出不計(jì)其數(shù)的新生
命形式。那時(shí)候和現(xiàn)在一樣,一個(gè)關(guān)鍵新能力是視覺。當(dāng)動(dòng)物首次得到這種能力,便能遠(yuǎn)比從前更有效探索環(huán)境;這催化了物種的數(shù)量大幅增加,包括獵物和掠食者,而且,被填滿的生態(tài)棲位(ecological niche)范圍也大大增加。今天的情況也類似,我們預(yù)期會(huì)見到各種新產(chǎn)品、服務(wù)、流程和組織形式,同時(shí)也會(huì)有大量的滅絕。在出乎意料的成功之外,必然也會(huì)有一些可怕的失敗。
雖然很難確切預(yù)測哪些公司將主導(dǎo)新的環(huán)境,但有個(gè)通則很清楚:最靈活和順應(yīng)力最強(qiáng)的公司與高階主管,會(huì)繁榮發(fā)展。在由人工智能賦予能力的領(lǐng)域里,能迅速察覺和響應(yīng)機(jī)會(huì)的組織,將會(huì)掌握優(yōu)勢。所以,成功的策略是愿意做實(shí)驗(yàn),以及快速學(xué)習(xí)。如果經(jīng)理人不在機(jī)器學(xué)習(xí)的領(lǐng)域加強(qiáng)實(shí)驗(yàn),就沒有善盡職責(zé)。接下來十年,人工智能不會(huì)取代經(jīng)理人,但使用人工智能的經(jīng)理人,會(huì)取代那些不使用人工智能的經(jīng)理人。