人工智能哪些是真實(shí)的
人工智能是計(jì)算機(jī)技術(shù)發(fā)展到高級(jí)階段,融合了數(shù)學(xué)、統(tǒng)計(jì)學(xué)、概率、邏輯、倫理等多學(xué)科于一身的復(fù)雜系統(tǒng),是當(dāng)下所有信息技術(shù)所不能達(dá)到的高級(jí)應(yīng)用。其最為核心的技術(shù)便是人工智能算法。如何讓計(jì)算機(jī)能像人類(lèi)一樣進(jìn)行思考,如同人一樣利用現(xiàn)有的知識(shí)進(jìn)行學(xué)習(xí)并實(shí)現(xiàn)合乎邏輯的推理,是人工智能算法試圖實(shí)現(xiàn)的目標(biāo)。其技術(shù)絕不是一般公司能夠輕輕松松實(shí)現(xiàn)的。當(dāng)下國(guó)際社會(huì)公認(rèn)的人工智能研發(fā)頂尖公司,如Google和IBM等投入了海量資源,動(dòng)用了頂尖的數(shù)學(xué)科學(xué)家、計(jì)算機(jī)專(zhuān)家,能實(shí)現(xiàn)了計(jì)算機(jī)程序的一定程度智能化,但距離真正的AI仍然相差很遠(yuǎn)。
“徐匡迪之問(wèn)”對(duì)當(dāng)下中國(guó)人工智能直擊核心,不但表明當(dāng)下中國(guó)人工智能發(fā)展的短板,也揭去了披在當(dāng)下所謂“人工智能”算法外表華麗的面紗?!拔覈?guó)人工智能領(lǐng)域真正搞算法的科學(xué)家鳳毛麟角?!?,東南大學(xué)生物科學(xué)與醫(yī)學(xué)工程學(xué)院教授萬(wàn)遂人表示,“徐匡迪之問(wèn)”直擊我國(guó)人工智能發(fā)展的核心關(guān)鍵問(wèn)題,“如果這種情況不改變,我國(guó)人工智能應(yīng)用很難走向深入、也很難獲得重大成果”。中國(guó)制造正從“硬件組裝廠”向“軟件組裝廠”蔓延,政產(chǎn)學(xué)研浮躁如故、積習(xí)難改。發(fā)表于2019年4月17日的領(lǐng)英文章《人工智能:什么是真實(shí)的,什么是炒作》(作者BillyZhang),亦表達(dá)了類(lèi)似觀點(diǎn)。下面是其文章中文翻譯,原文附于文后。
人工智能:什么是真實(shí)的,什么是炒作
人工智能(AI)可以做很多事情,并且比人類(lèi)做得更好。這些都有很好的記錄和廣泛報(bào)道。
但是伴隨著這些真正的人工智能正在做的事情真的很棒,很多炒作,虛假的AI和徹頭徹尾的欺騙(虛假的AI)。
例如,不久前(2018年9月)人工智能在中國(guó)國(guó)際會(huì)議上同聲傳譯背后的說(shuō)法被證明是欺詐行為。
AI(真正的AI)真的擁有神秘的超級(jí)大國(guó)情報(bào),最終會(huì)超越人類(lèi)的智慧,因?yàn)樵S多夸張的說(shuō)法可能會(huì)讓我們相信嗎?
如果剝離AI洋蔥的所有層,機(jī)器學(xué)習(xí)、監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)(NN)、人工神經(jīng)網(wǎng)絡(luò)、復(fù)發(fā)神經(jīng)網(wǎng)絡(luò)、感知器、乙狀結(jié)腸神經(jīng)元、突觸、前饋、反向傳播在AI的核心,人們看到算法使用簡(jiǎn)單(通常是線性)函數(shù)來(lái)近似(“猜測(cè)”)主題是什么,無(wú)論是人體中的腫塊,還是手寫(xiě)的字母或數(shù)字、天氣或玩游戲。
算法是執(zhí)行操作的數(shù)學(xué)技術(shù),可以是加法和減法,也可以是蒙特卡羅樹(shù)搜索和梯度下降搜索。這些算法長(zhǎng)期以來(lái)作為解決物理和數(shù)學(xué)問(wèn)題以及計(jì)算機(jī)模擬中數(shù)值分析的一部分而存在。使用梯度下降搜索算法將實(shí)驗(yàn)數(shù)據(jù)擬合到數(shù)學(xué)函數(shù)(有時(shí)稱(chēng)為模型),以找到自計(jì)算機(jī)出現(xiàn)以來(lái)科學(xué)界已使用實(shí)驗(yàn)數(shù)據(jù)的第一原理參數(shù)。
在物理學(xué)和數(shù)學(xué)中,第一原理參數(shù)本身就是使用搜索算法的目標(biāo)。這些參數(shù)揭示了所研究主題的物理性質(zhì)(例如我的研究項(xiàng)目中表面膜的分子結(jié)構(gòu),使用梯度搜索算法將實(shí)驗(yàn)數(shù)據(jù)擬合到包含分子結(jié)構(gòu)參數(shù)的函數(shù))。在AI中,近似函數(shù)中的參數(shù)(權(quán)重和偏差)是中介,其本身并不具有任何物理意義。它們存儲(chǔ)(存儲(chǔ))在計(jì)算機(jī)中,僅用于后續(xù)計(jì)算和預(yù)測(cè)。因此,參數(shù)未被看到或隱藏在“機(jī)器學(xué)習(xí)”黑匣子中。這是導(dǎo)致機(jī)器學(xué)習(xí)和人工智能的“神秘”和“神奇”性質(zhì)錯(cuò)覺(jué)的原因之一。(魔術(shù)師表演魔法。我們都知道魔術(shù)是由魔術(shù)師靈巧的手法所造成的幻想。我們都可以對(duì)這些知識(shí)充滿信心。魔術(shù)師不具備超人的力量。)
機(jī)器學(xué)習(xí)中的“機(jī)器”一詞在圖靈的論文(COMPUTING MACHINERY&INTELLIGENCE)中被稱(chēng)為“數(shù)字計(jì)算機(jī)”?!皩W(xué)習(xí)”僅僅是搜索算法中固有的重復(fù)(迭代)步驟,以連續(xù)微調(diào)或更新(學(xué)習(xí))參數(shù),直到近似最接近正確(已知)答案。在數(shù)學(xué)中,這在均方誤差最小化時(shí)實(shí)現(xiàn)。機(jī)器學(xué)習(xí)中的“訓(xùn)練”不過(guò)是使用給定的數(shù)據(jù)來(lái)找到近似函數(shù)中的參數(shù)(權(quán)重和偏差)。
使用擬人化的術(shù)語(yǔ)來(lái)描述AI是完全正確的。除了“訓(xùn)練”和“學(xué)習(xí)”之外,還可以聽(tīng)到“神經(jīng)網(wǎng)絡(luò)”?!吧窠?jīng)網(wǎng)絡(luò)”只是一種計(jì)算機(jī)編程架構(gòu)。“神經(jīng)元”是程序中產(chǎn)生結(jié)果的一個(gè)步驟。人們還聽(tīng)說(shuō)“機(jī)器在沒(méi)有明確編程的情況下自動(dòng)學(xué)習(xí)和改進(jìn)經(jīng)驗(yàn)”,而事實(shí)上機(jī)器學(xué)習(xí)只不過(guò)是一套計(jì)算機(jī)程序。算法通過(guò)編程實(shí)現(xiàn)。“明確地”這個(gè)詞,夾在“沒(méi)有。..。..編程”之間,好像獨(dú)立于人的參與或干預(yù),是一種技巧的巧妙。關(guān)于機(jī)器“自我學(xué)習(xí)”的能力是如此誤導(dǎo)性的說(shuō)法,它引起了所有關(guān)于機(jī)器學(xué)習(xí)(以及延伸,AI)同時(shí)具有神奇,神秘,令人生畏,驚恐和可怕的感覺(jué)。事實(shí)是,使用數(shù)值分析算法進(jìn)行機(jī)器學(xué)習(xí)是非常困難甚至不可能明確編程的。
媒體被這些人格化的術(shù)語(yǔ)所淹沒(méi)。在關(guān)于機(jī)器學(xué)習(xí)和人工智能的炒作中,“人工”這個(gè)詞經(jīng)常是故意或潛意識(shí)地(通常是后者)被省略。“人造”意味著人造。真正的人工智能真的是人工制造的智能在工作,這意味著人類(lèi)的智慧在工作。更智能的AI僅僅意味著更聰明的人類(lèi)智能(例如,更好的算法或更高效的編程或更快的計(jì)算機(jī)等)。
這不是為了貶低機(jī)器學(xué)習(xí)和人工智能。人工智能可以做很多事情,并且比人類(lèi)做得更好。但是,人工智能超出它的真實(shí)范圍會(huì)導(dǎo)致誤解,虛假和欺詐。
將信息化與智能化混為一談也很常見(jiàn)。主題為另一天。
真正的AI能否在特定任務(wù)中擊敗人類(lèi)?是的,就像AlphaGo擊敗最佳人類(lèi)圍棋選手一樣。但計(jì)算機(jī)自問(wèn)世以來(lái)就擊敗了人類(lèi)。計(jì)算機(jī)執(zhí)行數(shù)學(xué)計(jì)算的速度比任何人都快。計(jì)算機(jī)本身就是人類(lèi)智慧的產(chǎn)物。人類(lèi)使用的任何工具都可以比人類(lèi)更好地完成特定任務(wù)。這正是工作中人類(lèi)智慧的體現(xiàn)。石頭可以做得比人類(lèi)裸露的手更好,就像開(kāi)裂核桃一樣。計(jì)算機(jī)是人類(lèi)發(fā)明的一種工具,可以幫助人類(lèi)更好地完成某些任務(wù)(在這種情況下,許多任務(wù))。人工智能也是人類(lèi)發(fā)明的一種工具,可以幫助人類(lèi)更好地完成某些任務(wù)??梢钥隙ǖ氖牵谶^(guò)去的幾十年中,在人工智能研究過(guò)程中沒(méi)有發(fā)明新的算法,只有應(yīng)用現(xiàn)有算法的新方法。新的應(yīng)用程序可以稱(chēng)為發(fā)明嗎?有待辯論。
AI會(huì)取代員工嗎?當(dāng)然,就像計(jì)算機(jī)一樣(或人類(lèi)歷史上的任何新工具)。但是,雖然新工具取代了現(xiàn)有的勞動(dòng)力,但他們也創(chuàng)造了更多新的勞動(dòng)力。用于PCB組裝的自動(dòng)拾取機(jī)器取代了許多工作臺(tái)工人,但它們也實(shí)現(xiàn)了更多的創(chuàng)新,這些創(chuàng)新需要比工作臺(tái)工人手動(dòng)組裝更高的裝配精度,從而創(chuàng)造更多的設(shè)計(jì)工程工作。雖然人工智能將取代現(xiàn)有的勞動(dòng)力,但它已經(jīng)對(duì)數(shù)據(jù)工作者(數(shù)據(jù)科學(xué)家,數(shù)據(jù)工程師等)和人工智能程序員產(chǎn)生了巨大的需求。例子是無(wú)限的。
數(shù)據(jù)位于AI的前端和中心。所有搜索算法都會(huì)產(chǎn)生更好(更準(zhǔn)確)的結(jié)果和更大的數(shù)據(jù)(當(dāng)然會(huì)隨著時(shí)間的推移而折衷。數(shù)據(jù)越大,產(chǎn)生結(jié)果所需的時(shí)間就越多)。此外,數(shù)據(jù)的質(zhì)量和完整性與數(shù)據(jù)量一樣重要(聽(tīng)起來(lái)很簡(jiǎn)單,但經(jīng)常在炒作中丟失)。遺憾的是,許多關(guān)于數(shù)據(jù)的炒作也是如此,特別是在大數(shù)據(jù)領(lǐng)域,有時(shí)會(huì)導(dǎo)致災(zāi)難性的投資決策。
但是,情報(bào)本身與數(shù)據(jù)量無(wú)關(guān)。愛(ài)因斯坦通過(guò)純粹的智慧制定了他的相對(duì)論(特殊和一般),沒(méi)有任何數(shù)據(jù)支持。開(kāi)普勒通過(guò)分析Brahe獲得的有限觀測(cè)數(shù)據(jù)來(lái)誘導(dǎo)行星運(yùn)動(dòng)定律,這反過(guò)來(lái)導(dǎo)致了牛頓萬(wàn)有引力定律。這種推理和歸納/演繹能力和以封閉形式表達(dá)結(jié)論的能力(牛頓定律,麥克斯韋方程,薛定諤方程等)是人類(lèi)智慧的獨(dú)特之處。
并非所有“大數(shù)據(jù)”都是大數(shù)據(jù),并非所有決策都需要大數(shù)據(jù)或人工智能。觀察一個(gè)人只吃一次或最多三到四次的晚餐,足以確定這個(gè)人是否是素食主義者。它并不需要關(guān)于此人和AI的“大數(shù)據(jù)”來(lái)做出這樣的決定。
使用大數(shù)據(jù)做出業(yè)務(wù)決策也不是新鮮事。六西格瑪(SixSigma)是一種數(shù)據(jù)驅(qū)動(dòng)的方法,用于企業(yè)提高產(chǎn)品和服務(wù)的質(zhì)量,例如汽車(chē)制造,半導(dǎo)體工廠或金融服務(wù)。用于評(píng)估金融風(fēng)險(xiǎn)和欺詐檢測(cè)的大數(shù)據(jù)的統(tǒng)計(jì)分析已經(jīng)確立,這些都是數(shù)據(jù)挖掘的一部分。
通常,在封閉形式的表達(dá)式(如天氣)中描述系統(tǒng)的行為是不切實(shí)際或不可能的。天氣受到太多變量的影響,不僅在本地,而且在區(qū)域,有時(shí)甚至是全球。數(shù)值分析(在超級(jí)計(jì)算機(jī)上,并且曾經(jīng)被稱(chēng)為計(jì)算機(jī)模擬,現(xiàn)在稱(chēng)為AI)已被用于模擬和預(yù)測(cè)天氣。但我們都經(jīng)歷過(guò)(或許甚至遭受過(guò))天氣預(yù)報(bào)的不準(zhǔn)確之處。為什么?不是因?yàn)樗惴ɑ蛴?jì)算機(jī)速度,而是因?yàn)槿狈ν暾臄?shù)據(jù),即使可用的數(shù)據(jù)已經(jīng)很大。這是一個(gè)雙重打擊刪除:缺乏用于訓(xùn)練的完整數(shù)據(jù)(機(jī)器學(xué)習(xí))意味著近似函數(shù)中的精確權(quán)重和偏差不足,加上缺乏用于預(yù)測(cè)的完整數(shù)據(jù),仍然加劇了預(yù)測(cè)準(zhǔn)確性。要預(yù)測(cè)準(zhǔn)確的天氣,需要進(jìn)行更多的第一原理研究,了解天氣如何受到溫度、壓力、濕度、風(fēng)、空氣中污染顆粒等的影響,超過(guò)每平方英里或每10平方英里或任何粒度,超過(guò)五十平方英里或二百平方英里或整個(gè)大陸。即使在實(shí)現(xiàn)了這樣的理解之后,挑戰(zhàn)仍然是以這樣的粒度收集數(shù)據(jù)以輸入到進(jìn)行預(yù)測(cè)的算法。
從某種意義上說(shuō),AI用于識(shí)別Go的手寫(xiě)或玩游戲是在“干凈和完整的數(shù)據(jù)”環(huán)境中。一切都是透明和可用的。在大多數(shù)其他實(shí)際應(yīng)用程序中并非如此。以招聘高績(jī)效員工為例。第一個(gè)HR必須定義什么構(gòu)成高性能。其次,HR必須在許多樣本(人數(shù))上識(shí)別出導(dǎo)致(或至少與之相關(guān))高性能的屬性集。既不容易也沒(méi)有錯(cuò)誤。高性能不僅僅是個(gè)人屬性的功能。它受到許多其他因素的影響,如公司文化和辦公室政治。不準(zhǔn)確或錯(cuò)誤的數(shù)據(jù)會(huì)導(dǎo)致不準(zhǔn)確或錯(cuò)誤的預(yù)測(cè)。在人力資源部門(mén),這可能僅僅意味著招聘人才。但在醫(yī)療保健方面,不準(zhǔn)確,錯(cuò)誤甚至無(wú)關(guān)的數(shù)據(jù)可能會(huì)導(dǎo)致生死攸關(guān)的后果。無(wú)論AI在醫(yī)療保健應(yīng)用中發(fā)現(xiàn)什么,都必須經(jīng)過(guò)訓(xùn)練有素的眼睛和頭腦仔細(xì)檢查。相關(guān)關(guān)系與因果關(guān)系不同。
同樣,在自動(dòng)駕駛中,數(shù)據(jù)環(huán)境不僅“不干凈”,而且可能被嚴(yán)重“污染”。主題為另一天。
人工智能可以做很多事情,并且比人類(lèi)做得更好。但人工智能永遠(yuǎn)不會(huì)取代或超越人類(lèi)的智慧。引用斯坦福大學(xué)醫(yī)學(xué)院院長(zhǎng)羅伊德·米諾(Lloyd Minor)教授的話說(shuō),“人工智能,曾經(jīng)是一門(mén)學(xué)科,現(xiàn)在正處于改變醫(yī)療保健的尖端。機(jī)器可能永遠(yuǎn)不會(huì)取代受過(guò)訓(xùn)練的眼睛,但它已經(jīng)擴(kuò)展并增強(qiáng)了人類(lèi)的視力,使我們能夠看到我們從未知道的東西“(https://stan.md/2IlJAk6)。與計(jì)算機(jī)輔助設(shè)計(jì)(CAD)非常相似,AI是一種可以擴(kuò)展和增強(qiáng)人類(lèi)能力的輔助工具。