想學(xué)AI和機(jī)器學(xué)習(xí)?先搞懂這 6 個(gè)領(lǐng)域
掃描二維碼
隨時(shí)隨地手機(jī)看文章
近期熱門(mén)的話題, 人們開(kāi)始重新討論這一基本定義----什么是人工智能(AI)。有些人將 AI 重新命名為「認(rèn)知計(jì)算」或「機(jī)器智能」,而其他人則錯(cuò)誤地將 AI 與「機(jī)器學(xué)習(xí)」概念進(jìn)行交換。在某種程度上,這是因?yàn)?AI 不是一種技術(shù)。它實(shí)際上是一個(gè)由許多學(xué)科組成的廣泛領(lǐng)域,從機(jī)器人學(xué)到機(jī)器學(xué)習(xí)。我們大多數(shù)人都認(rèn)為,人工智能的終極目標(biāo)是為了建造能夠完成任務(wù)和認(rèn)知功能的機(jī)器,否則這些機(jī)器只能在人類(lèi)的智能范圍內(nèi)從事相關(guān)工作。為了實(shí)現(xiàn)這一目標(biāo),機(jī)器必須能夠自主學(xué)習(xí)這些能力,而不是讓每個(gè)功能都被端到端地明確編程。
人工智能領(lǐng)域在過(guò)去十年中取得了巨大進(jìn)步,從自動(dòng)駕駛汽車(chē)到語(yǔ)音識(shí)別及合成,這一點(diǎn)令人驚訝。在這種背景下,人工智能已經(jīng)成為越來(lái)越多公司和家庭的話題,他們不再將人工智能視為一種需要 20 年時(shí)間開(kāi)發(fā)的技術(shù),而是影響他們今天生活的東西。事實(shí)上,流行的新聞報(bào)道幾乎每天都會(huì)報(bào)道 AI 和技術(shù)巨頭,闡述他們重要的長(zhǎng)期人工智能策略。雖然一些投資者和老牌企業(yè)都渴望了解如何在這個(gè)新世界中攫取價(jià)值,但大多數(shù)人仍在摸索著想出這一切意味著什么。與此同時(shí),各國(guó)政府正在努力應(yīng)對(duì)自動(dòng)化在社會(huì)中的影響。
鑒于 AI 將影響整個(gè)經(jīng)濟(jì),而這些討論中的參與者代表了社會(huì)上觀點(diǎn)的整體分布、理解水平以及構(gòu)建或使用 AI 系統(tǒng)的經(jīng)驗(yàn)程度。因此,對(duì)人工智能的討論至關(guān)重要—包括由此產(chǎn)生的問(wèn)題、結(jié)論和建議—必須以數(shù)據(jù)和現(xiàn)實(shí)為基礎(chǔ),而不是猜想,這點(diǎn)至關(guān)重要。畢竟各種民間大V從公布的研究、科技新聞公告、投機(jī)評(píng)論和思想實(shí)驗(yàn)中大肆推斷其中的含義,這太容易了(有時(shí)令人興奮?。?。
尤其值得注意人工智能的六個(gè)領(lǐng)域在影響數(shù)字產(chǎn)品和服務(wù)的未來(lái)方面產(chǎn)生的作用。我將會(huì)闡述它們分別是什么、為什么它們很重要、它們今天如何被使用,并列出了從事這些技術(shù)的公司和研究人員的清單(并非詳盡無(wú)遺)。
1、強(qiáng)化學(xué)習(xí)(RL)
RL 是一種通過(guò)試錯(cuò)來(lái)學(xué)習(xí)的范例,這種反復(fù)試錯(cuò)受到人類(lèi)學(xué)習(xí)新任務(wù)的方式啟發(fā)。在典型的 RL 設(shè)置中,智能體的任務(wù)是在數(shù)字環(huán)境中觀察其當(dāng)前狀態(tài)并采取最大化其已設(shè)置的長(zhǎng)期獎(jiǎng)勵(lì)的累積的動(dòng)作。 該智能體接收來(lái)自環(huán)境的每個(gè)動(dòng)作結(jié)果的反饋,以便它知道該動(dòng)作是否促進(jìn)或阻礙其進(jìn)展。因此,RL 的 智能體必須平衡對(duì)其環(huán)境的探索,以找到獲得獎(jiǎng)勵(lì)的最佳策略,并利用其發(fā)現(xiàn)的最佳策略來(lái)實(shí)現(xiàn)預(yù)期目標(biāo)。這種方法在 Google DeepMind 的 Atari 游戲和 Go 中(https://www.youtube.com/watch?v=Ih8EfvOzBOY)非常流行。RL 在現(xiàn)實(shí)世界中工作的一個(gè)例子是優(yōu)化能源效率以冷卻 Google 數(shù)據(jù)中心。在此項(xiàng)目中,RL 使得該系統(tǒng)的冷卻成本降低了 40%。在可以模擬的環(huán)境(例如視頻游戲)中使用 RL 智能體的一個(gè)重要的原生優(yōu)勢(shì)是訓(xùn)練數(shù)據(jù)可以以非常低的成本生成。這與監(jiān)督式的深度學(xué)習(xí)任務(wù)形成鮮明對(duì)比,后者通常需要昂貴且難以從現(xiàn)實(shí)世界中獲取的訓(xùn)練數(shù)據(jù)。
應(yīng)用程序:多個(gè)智能體在他們自己的環(huán)境實(shí)例中學(xué)習(xí)共享模型,或者通過(guò)在同一環(huán)境中相互交互和學(xué)習(xí),學(xué)習(xí)在迷宮或城市街道等 3D 環(huán)境中進(jìn)行自動(dòng)駕駛,通過(guò)學(xué)習(xí)任務(wù)目標(biāo)(例如學(xué)習(xí)駕駛或賦予非玩家視頻游戲角色以類(lèi)似人的行為)反向強(qiáng)化學(xué)習(xí)以概括觀察到的行為。頂尖專(zhuān)業(yè):Pieter Abbeel(OpenAI),David Silver,Nando de Freitas,Raia Hadsell,Marc Bellemare(谷歌 DeepMind),Carl Rasmussen(劍橋),Rich Sutton(阿爾伯塔大學(xué)),John Shawe-Taylor(UCL)等。代表公司:Google DeepMind,Prowler.io,Osaro,MicroPSI,Maluuba / Microsoft,NVIDIA,Mobileye,OpenAI。
2、生成模型
與用于分類(lèi)或回歸任務(wù)的判別模型不同,生成模型學(xué)習(xí)訓(xùn)練樣本的概率分布。通過(guò)從這種高維分布中抽樣,生成模型輸出與訓(xùn)練數(shù)據(jù)類(lèi)似的新例子。這意味著,例如,在面部的真實(shí)圖像上訓(xùn)練的生成模型可以輸出相似面部的新合成圖像。有關(guān)這些模型如何工作的更多詳細(xì)信息,請(qǐng)參閱 Ian Goodfellow 的 NIPS 2016 指導(dǎo)手冊(cè)(https://arxiv.org/abs/1701.00160)。他引入的架構(gòu),生成對(duì)抗網(wǎng)絡(luò)(GAN),現(xiàn)在在研究領(lǐng)域特別熱門(mén),因?yàn)樗鼈優(yōu)闊o(wú)監(jiān)督學(xué)習(xí)提供了一條道路。對(duì)于 GAN,有兩個(gè)神經(jīng)網(wǎng)絡(luò):一個(gè)生成器,它將隨機(jī)噪聲作為輸入,負(fù)責(zé)合成內(nèi)容(例如一個(gè)圖像),一個(gè)鑒別器,它了解了真實(shí)圖像的樣子,并負(fù)責(zé)識(shí)別生成器生成的圖像是真實(shí)的還是偽造的。對(duì)抗訓(xùn)練可以被認(rèn)為是一種游戲,其中生成器必須迭代地學(xué)習(xí)如何從噪聲創(chuàng)建圖像,使得鑒別器不再能夠?qū)⑸傻膱D像與真實(shí)的圖像區(qū)分開(kāi)。該框架正在擴(kuò)展到許多數(shù)據(jù)模式和任務(wù)。
應(yīng)用范圍:模擬時(shí)間序列的可能未來(lái)(例如,用于強(qiáng)化學(xué)習(xí)中的規(guī)劃任務(wù));超分辨率圖像;從 2D 圖像重建 3D 結(jié)構(gòu); 從小標(biāo)記數(shù)據(jù)集推廣;一個(gè)輸入可以產(chǎn)生多個(gè)正確輸出的任務(wù)(例如,預(yù)測(cè)視頻 0 中的下一幀;在會(huì)話界面中運(yùn)用自然語(yǔ)言處理(例如機(jī)器人);加密;當(dāng)不是所有標(biāo)簽都可用時(shí)運(yùn)用半監(jiān)督學(xué)習(xí);藝術(shù)風(fēng)格轉(zhuǎn)移;合成音樂(lè)和聲音;圖像修復(fù)。代表公司:Twitter Cortex,Adobe,Apple,Prisma,Jukedeck*,Creative.ai,Gluru*,Mapillary*,Unbabel。頂尖專(zhuān)家:Ian Goodfellow (OpenAI),Yann LeCun and Soumith Chintala (Facebook AI Research),Shakir Mohamed and A?ron van den Oord (Google DeepMind),Alyosha Efros (Berkeley) and manyothers。
3、記憶網(wǎng)絡(luò)
為了讓 AI 系統(tǒng)像我們一樣在不同的環(huán)境中都能得到適用,他們必須能夠不斷學(xué)習(xí)新任務(wù)并記住如何在未來(lái)完成所有任務(wù)。然而,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)通常不能進(jìn)行這種連續(xù)的任務(wù)學(xué)習(xí)。這個(gè)缺點(diǎn)被稱為災(zāi)難性遺忘。之所以出現(xiàn)這種情況,是因?yàn)楫?dāng)網(wǎng)絡(luò)隨后經(jīng)過(guò)訓(xùn)練以解決任務(wù) B 時(shí),網(wǎng)絡(luò)中對(duì)于任務(wù) A 來(lái)說(shuō)很重要的權(quán)重會(huì)發(fā)生變化。
然而,有幾種強(qiáng)大的架構(gòu)可以賦予神經(jīng)網(wǎng)絡(luò)不同程度的記憶性。這些包括能夠處理和預(yù)測(cè)時(shí)間序列的長(zhǎng)短期記憶網(wǎng)絡(luò)(遞歸神經(jīng)網(wǎng)絡(luò)的一種變體),DeepMind 的可微分神經(jīng)計(jì)算機(jī),它結(jié)合了神經(jīng)網(wǎng)絡(luò)和記憶系統(tǒng),以便自己學(xué)習(xí)和導(dǎo)航復(fù)雜的數(shù)據(jù)結(jié)構(gòu),彈性權(quán)重合并算法,根據(jù)它們對(duì)先前看到的任務(wù)的重要程度,減慢對(duì)某些權(quán)重的學(xué)習(xí),以及學(xué)習(xí)特定任務(wù)的模型之間的橫向連接的漸進(jìn)式神經(jīng)網(wǎng)絡(luò),以從先前學(xué)習(xí)的網(wǎng)絡(luò)中為新任務(wù)提取有用的特征。
應(yīng)用范圍:可以推廣到新環(huán)境的學(xué)習(xí)智能體;機(jī)器人手臂控制系統(tǒng);自動(dòng)駕駛汽車(chē);時(shí)間序列預(yù)測(cè)(例如金融市場(chǎng)、視頻、物聯(lián)網(wǎng)); 自然語(yǔ)言處理和下一步預(yù)測(cè)。代表公司:Google DeepMind,NNaisense,SwiftKey/Microsoft Research,F(xiàn)acebook AI Research。頂尖專(zhuān)家:Alex Graves,Raia Hadsell,Koray Kavukcuoglu(Google DeepMind),Jürgen Schmidhuber(IDSIA),Geoffrey Hinton(Google Brain/Toronto),James Weston,Sumit Chopra,Antoine Bordes(FAIR)。
4、從較少數(shù)據(jù)學(xué)習(xí)并構(gòu)建更小的模型
深度學(xué)習(xí)模型值得注意的是需要大量的訓(xùn)練數(shù)據(jù)才能達(dá)到最先進(jìn)的性能。例如,ImageNet 大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽中,每支隊(duì)伍需要挑戰(zhàn)他們的圖像識(shí)別模型,包含 120 萬(wàn)個(gè)手工標(biāo)記 1000 個(gè)對(duì)象類(lèi)別的訓(xùn)練圖像。如果沒(méi)有大規(guī)模的訓(xùn)練數(shù)據(jù),深度學(xué)習(xí)模型將無(wú)法收斂于其最佳設(shè)置,并且在語(yǔ)音識(shí)別或機(jī)器翻譯等復(fù)雜任務(wù)上表現(xiàn)不佳。只有當(dāng)單個(gè)神經(jīng)網(wǎng)絡(luò)用于端到端解決問(wèn)題時(shí),此數(shù)據(jù)要求才會(huì)增長(zhǎng);也就是說(shuō),將語(yǔ)音的原始錄音作為輸入并輸出語(yǔ)音的文本轉(zhuǎn)錄。這與使用多個(gè)網(wǎng)絡(luò)形成對(duì)比,每個(gè)網(wǎng)絡(luò)各自提供中間表示(例如,原始語(yǔ)音音頻輸入→音位→單詞→文本轉(zhuǎn)錄輸出;或來(lái)自直接映射到轉(zhuǎn)向命令的相機(jī)的原始圖像)。如果我們希望 AI 系統(tǒng)能夠解決訓(xùn)練數(shù)據(jù)特別具有挑戰(zhàn)性、成本高、敏感或耗時(shí)的任務(wù),那么開(kāi)發(fā)能夠從較少的樣本(即一次或零次學(xué)習(xí))學(xué)習(xí)最佳解決方案的模型非常重要。在對(duì)小型數(shù)據(jù)集進(jìn)行培訓(xùn)時(shí),難點(diǎn)包括過(guò)度擬合,處理異常值的困難,訓(xùn)練和測(cè)試之間數(shù)據(jù)分布的差異。另一種方法是通過(guò)使用統(tǒng)稱為遷移學(xué)習(xí)的過(guò)程來(lái)遷移從先前任務(wù)獲得的機(jī)器學(xué)習(xí)模型的知識(shí)來(lái)改進(jìn)新任務(wù)的學(xué)習(xí)。
一個(gè)相關(guān)的問(wèn)題是使用類(lèi)似數(shù)量或明顯更少的參數(shù)構(gòu)建具有最先進(jìn)性能的較小的深度學(xué)習(xí)架構(gòu)。優(yōu)點(diǎn)包括更高效的分布式培訓(xùn),因?yàn)閿?shù)據(jù)需要在服務(wù)器之間進(jìn)行通信,將新模型從云端導(dǎo)出到外圍設(shè)備的帶寬更少,以及部署到內(nèi)存有限的硬件的可行性得到提高。
應(yīng)用范圍:通過(guò)學(xué)習(xí)模擬最初訓(xùn)練大型標(biāo)記訓(xùn)練數(shù)據(jù)的深層網(wǎng)絡(luò)的性能來(lái)訓(xùn)練淺層網(wǎng)絡(luò);具有較少參數(shù)但與深度模型具有相同性能的架構(gòu)(例如?SqueezeNet);機(jī)器翻譯。代表企業(yè): Geometric Intelligence/Uber,DeepScale.ai,Microsoft Research,Curious AI Company,Google,Bloomsbury AI。頂尖專(zhuān)家: Zoubin Ghahramani(Cambridge),Yoshua Bengio(Montreal),Josh Tenenbaum(MIT),Brendan Lake(NYU),Oriol Vinyals(Google DeepMind),Sebastian Riedel(UCL)。
5、用于訓(xùn)練和預(yù)測(cè)的硬件
人工智能進(jìn)步的主要催化劑是重新利用圖形處理單元(GPU)來(lái)訓(xùn)練大型神經(jīng)網(wǎng)絡(luò)模型。與以順序方式計(jì)算的中央處理單元(CPU)不同,GPU 提供可以同時(shí)處理多個(gè)任務(wù)的大規(guī)模并行架構(gòu)。鑒于神經(jīng)網(wǎng)絡(luò)必須處理大量(通常是高維數(shù)據(jù)),GPU 上的訓(xùn)練要比使用 CPU 快得多。這就是為什么自 2012 年 AlexNet 發(fā)布以來(lái) GPU 已經(jīng)真正成為淘金熱的原因 - 這是 GPU 上實(shí)現(xiàn)的第一個(gè)神經(jīng)網(wǎng)絡(luò)。在 2017 年 NVIDIA 繼續(xù)領(lǐng)先于英特爾,高通,AMD 以及谷歌。
但是,GPU 不是專(zhuān)門(mén)用于訓(xùn)練或預(yù)測(cè)的;它們是為了呈現(xiàn)視頻游戲的圖形而創(chuàng)建的。 GPU具有高計(jì)算精度,但并不總是需要,并且存在內(nèi)存帶寬和數(shù)據(jù)吞吐量問(wèn)題。這為像 Google 這樣的大公司的新一代初創(chuàng)項(xiàng)目開(kāi)辟了公平的競(jìng)爭(zhēng)環(huán)境,專(zhuān)門(mén)為高維機(jī)器學(xué)習(xí)應(yīng)用設(shè)計(jì)和生產(chǎn)芯片。新芯片設(shè)計(jì)承諾的改進(jìn)包括更大的內(nèi)存帶寬,圖形而非矢量(GPU)或標(biāo)量(CPU)計(jì)算,更高的計(jì)算密度,效率和耗能性能。這是令人興奮的,因?yàn)?AI 系統(tǒng)為其所有者和用戶提供了明顯的加速回報(bào):更快,更高效的模型培訓(xùn)→更好的用戶體驗(yàn)→用戶更多地參與產(chǎn)品→創(chuàng)建更大的數(shù)據(jù)集→通過(guò)優(yōu)化提高模型性能。因此,能夠更快地訓(xùn)練并部署計(jì)算和能量效率的 AI 模型的人會(huì)占據(jù)顯著的優(yōu)勢(shì)。
應(yīng)用范圍:加快模型訓(xùn)練(特別是圖表);預(yù)測(cè)能源和數(shù)據(jù)效率;在外圍運(yùn)行 AI 系統(tǒng)(物聯(lián)網(wǎng)設(shè)備);實(shí)時(shí)活動(dòng)的 IoT 設(shè)備;云基礎(chǔ)服務(wù); 自動(dòng)駕駛汽車(chē),無(wú)人機(jī)和機(jī)器人。代表企業(yè): Graphcore,Cerebras,Isocline Engineering,Google(TPU),NVIDIA(DGX-1),Nervana Systems(Intel),Movidius(Intel),Scortex。
6、仿真環(huán)境
如前所述,為 AI 系統(tǒng)生成訓(xùn)練數(shù)據(jù)通常具有挑戰(zhàn)性。 更重要的是,如果 AI 在現(xiàn)實(shí)世界中對(duì)我們有用,那么它必須可以推廣到很多情況。 因此,開(kāi)發(fā)模擬現(xiàn)實(shí)世界的物理和行為的數(shù)字環(huán)境將為我們提供測(cè)試和訓(xùn)練 AI 的一般智能的測(cè)試平臺(tái)。 這些環(huán)境向 AI 呈現(xiàn)初始情況,然后 AI 采取行動(dòng)以解決他們已設(shè)置(或?qū)W習(xí))的目標(biāo)。 在這些模擬環(huán)境中進(jìn)行訓(xùn)練可以幫助我們了解 AI 系統(tǒng)如何學(xué)習(xí),如何改進(jìn)它們,同時(shí)也為我們提供可能轉(zhuǎn)移到實(shí)際應(yīng)用程序的模型。
應(yīng)用范圍:駕駛技能學(xué)習(xí);制造業(yè);工業(yè)設(shè)計(jì);游戲開(kāi)發(fā);智慧城市。代表企業(yè): Improbable,Unity 3D, Microsoft(Minecraft),Google DeepMind/Blizzard,OpenAI,Comma.ai,Unreal Engine,Amazon Lumberyard。
專(zhuān)家:Andrea Vedaldi(Oxford)。