人工智能、機器學習和深度學習——把這些術語放在一起容易混淆,所以這篇文章我們將從一些簡短的定義來介紹。
? 人工智能意味著讓電腦以某種方式模仿人類行為。
? 機器學習是人工智能的一個子集,它包括使計算機能夠從數(shù)據(jù)中找出問題并交付人工智能應用程序的技術。
? 與此同時,深度學習是機器學習的一個子集,它使計算機能夠解決更復雜的問題。
下面將通過一些通俗易懂的例子來簡單說明人工智能、機器學習和深度學習的區(qū)別。
一、什么是人工智能?
人工智能作為一門學科創(chuàng)建于1956年的美國。當時的目標和現(xiàn)在一樣,是讓計算機執(zhí)行被視為人類獨有的任務:需要智力的任務。最初,研究人員研究的問題包括下棋和解決邏輯問題。如果你觀察下跳棋程序的輸出,你會發(fā)現(xiàn)這些動作背后隱藏著某種形式的“人工智能”,尤其是當電腦打敗你的時候。早期的成功使第一批研究人員對AI的可能性表現(xiàn)出幾乎無限的熱情,與之匹配的只是只是在他們錯誤判斷某些問題有多難的程度上。因此,人工智能指的是計算機的輸出。計算機正在做一些智能的事情,所以它展示的是人工智能。
現(xiàn)在,AI更多的被描述為關于構建智能計算機程序來執(zhí)行這些任務:視覺感知、語音識別和情緒分析。例如,自駕駕駛汽車需要計算機具有視覺感知能力,另外像Siri這樣的應用程序需要具有語音識別能力。
AI這個術語并沒有說明這些問題是如何解決的。有許多包括規(guī)則型和專業(yè)型系統(tǒng)的不同技術。其中有一類技術在20世紀80年代開始得到更廣泛的應用:那就是機器學習。
二、機器學習是什么?
這些早期研究人員發(fā)現(xiàn)一些問題更難的原因是,這些問題根本不適合早期用于人工智能的技術。硬編碼算法或固定的、基于規(guī)則的系統(tǒng)在圖像識別或從文本中提取內容等方面表現(xiàn)得并不盡如人意。結果證明,解決方案不僅僅是模仿人類行為(AI),而是模仿人類的學習方式。
想想你是如何學會閱讀的。在拿起你的第一本書之前,若沒有坐下來學習拼寫和語法,你只能讀簡單的書,隨著時間的推移,你會讀到更復雜的書。實際上,你從閱讀中學到了拼寫和語法的規(guī)則。換句話說,你處理了很多數(shù)據(jù)并從中學習。
這正是機器學習的理念。機器學習是AI的核心驅動力。 簡單的說就是用算法來發(fā)現(xiàn)數(shù)據(jù)的有趣內容的過程,而無需編寫解決特定問題的代碼。 換句話說,這是一種用最少的編程方式讓計算機從數(shù)據(jù)中學習。 取代編寫代碼,你只需提供給機器數(shù)據(jù),機器會根據(jù)這些數(shù)據(jù)構建自己的邏輯功能。那么這在實踐中如何工作呢? 一切都是從“訓練數(shù)據(jù)”開始的。你提供一組數(shù)據(jù)給數(shù)據(jù)模型幫助它進行訓練。 你提供模型的數(shù)據(jù)越多,它就會越健壯。當你將訓練數(shù)據(jù)提供給您的機器學習模型時,這些數(shù)據(jù)由一組屬性和特征進行定義。 由機器學習模型來確定如何理解所有這些屬性。通過給算法(而不是你的大腦)輸入大量數(shù)據(jù),讓它把事情弄清楚。給算法輸入大量關于金融交易的數(shù)據(jù),告訴它哪些是欺詐行為,讓它找出哪些是欺詐行為,從而預測未來的欺詐行為?;蛘呓o它提供關于你的客戶群的信息,讓它找出最好的細分方法。
隨著這些算法的發(fā)展,它們可以解決很多問題。但有些人類覺得簡單的東西(比如語音或手寫識別)對機器來說仍然很困難。然而,如果機器學習是模仿人類的學習方式,為什么不直接模仿人類的大腦呢?這就是神經網絡背后的理念。
使用人工神經元(由突觸連接的神經元是大腦中的主要元素)的想法已經存在了一段時間。軟件模擬的神經網絡開始被用于解決某些問題。它們顯示出了很大的潛力,能夠解決一些其他算法無法解決的復雜問題。
但機器學習仍然被困在連許多小學孩子們都可以輕松解決的問題上,比如:這張照片里有多少只是狗,多少是狼?如何分辨生香蕉和熟香蕉?是什么讓書中的這個角色哭得這么厲害?
事實證明,這個問題與機器學習的概念無關,甚至還有模仿人類大腦的想法。只是簡單的神經網絡,有100甚至1000個神經元以相對簡單的方式連接在一起,只是無法復制人腦的功能。如果你仔細想想,應該不會感到驚訝:人類大腦有大約860億個神經元非常復雜的相互連接。
三、什么是深度學習?
簡而言之,深度學習就是使用包含更多神經元、層次和互聯(lián)性的神經網絡。我們離模擬人腦的復雜性還有很長一段路要走,但我們正在朝著這個方向前進。
當你讀到從自動駕駛汽車到玩圍棋的超級計算機再到語音識別等計算機技術的進步時,你就會發(fā)現(xiàn)這其實是一種隱藏的深度學習。你會體驗到某種形式的人工智能。在幕后,人工智能是由某種形式的深度學習驅動的。
讓我們來看幾個問題,看看深度學習與簡單的神經網絡或其他形式的機器學習有何不同。
深度學習的原理
深度學習能夠很好的自動學習帶嘈雜的數(shù)據(jù)(讀取:非結構化的),以便算法能夠更有效地學習。 它還可以:
? 使用復雜的算法來執(zhí)行任務,并在很少或是根本沒有人力監(jiān)督的情況下進行學習。
? 學習如何學習。 例如,像Google使用深度學習來不斷強化照片中的面部識別能力。
如果我給你一些馬的圖像,你會認出它們是馬,即使你從來沒有見過那個圖像。不管馬是躺在沙發(fā)上,還是在萬圣節(jié)盛裝打扮得就像一只河馬。你能認出這是一匹馬,是因為你知道定義一匹馬的各種要素:它的口鼻形狀、腿的數(shù)量和位置等等。
深度學習可以做到這一點。這對很多事情都很重要,包括自動駕駛汽車。在汽車決定下一步行動之前,它需要知道周圍是什么。它必須能夠識別人、自行車、其他車輛、路標等等。并在具有挑戰(zhàn)性的視覺環(huán)境中這樣做。然而標準的機器學習技術則無法做到這一點。
以自然語言處理為例
自然語言處理(NLP)是機器學習的一種形式,通過在大量數(shù)據(jù)中查找行為模式來識別語言及其許多用法和語法規(guī)則。 它可以:
? 進行情感分析,其中算法在社交媒體帖子中尋找行為模式,以了解客戶對特定品牌或產品的感受。
? 語音識別,提供從“聆聽”到基于音頻產生的文本文件。
? 問答解答,通常以具體答案處理這些問題(例如,4的平方根是什么?),未來還要探討如何處理更復雜和開放性問題。
自然語言處理被用于聊天機器人和智能手機語音助手時,思考以下這句話,并完成填空:
我出生在意大利,盡管我大部分時間生活在葡萄牙和巴西,我仍然說可以說一口流利的________。
希望你能發(fā)現(xiàn)最有可能的答案是意大利語(盡管你回答法語、希臘語、德語等好像都可以)。但是想想得出這個結論需要什么。
首先,你需要知道填空的單詞是一種語言。如果你能理解“我能說一口流利的…”你就能確定。要得到答案是意大利語,你必須回顧一下這句話并且不被文中的葡萄牙和巴西所迷惑?!拔页錾谝獯罄币馕吨以诔砷L過程中學習意大利語(根據(jù)維基百科,有93%的可能性),因此你需要理解“出生”的含義。 盡管”和“仍然”的組合清楚地表明我不是在說葡萄牙語,帶你回到意大利這個答案。所以意大利語是可能的答案。
想象一下你大腦中的神經網絡發(fā)生了什么。比如“出生在意大利”和“盡管…任然”這樣的事實是你大腦的其他部分在你做事情的時候的輸入。這一概念通過復雜的反饋回路被引入到深度神經網絡中。
結論
所以希望本文開頭的第一個定義能夠解釋得通。人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數(shù)據(jù)中學習。最后,深度學習是機器學習的一個子集,使用多層神經網絡來解決最難的問題。