(文章來源:教育新聞網)
賴特兄弟(Wright Brothers)在20世紀初制造了世界上第一架飛機時,從鳥類的“有見識”運動中汲取了靈感。他們觀察并對自然機翼的各個方面進行了逆向工程,這反過來又幫助他們在空氣動力學和推進方面取得了重要發(fā)現(xiàn)。
同樣,要構建具有思考能力的機器,為什么不從我們兩耳之間運作的三磅重物質中尋求靈感呢?人工智能的先驅,圖靈獎的獲得者杰弗里·欣頓(Geoffrey Hinton)似乎同意:“我一直堅信,使人工智能發(fā)揮作用的唯一方法就是以類似于人腦的方式進行計算?!?/p>
那么,人工智能(AI)的下一步是什么?下一波AI會受到生物學快速發(fā)展的啟發(fā)嗎?在分子水平上理解大腦回路的工具是否可以使我們對人的思維方式有更高的系統(tǒng)層次的理解?答案可能是肯定的,而且在學習生物系統(tǒng)與開發(fā)人工系統(tǒng)之間的思想交流實際上已經持續(xù)了數十年。
首先,生物學與機器學習有什么關系?得知機器學習的許多進步來自心理學和神經科學的見識,可能會讓您感到驚訝。強化學習(RL)是機器學習的三個范式之一(另外兩個是監(jiān)督學習和非監(jiān)督學習),起源于可追溯到1940年代的動物和認知神經科學研究。
RL是當今一些最先進的AI系統(tǒng)的核心,例如AlphaGo(由領先的AI公司Google DeepMind開發(fā)的,廣為人知的AI代理)。AlphaGo在Go(中國棋盤游戲)中擊敗了世界排名第一的棋手,該棋盤游戲包含的棋盤組合數量超過了宇宙中原子的數量。
盡管AlphaGo在圍棋游戲中具有超人的表現(xiàn),但其人類對手仍然擁有更多的通用情報。他可以在任何環(huán)境下開車,講語言,踢足球以及執(zhí)行許多其他任務。當前的AI系統(tǒng)在很大程度上無法利用學到的知識來玩撲克并將其轉移到另一項任務上,例如玩Cluedo游戲。這些系統(tǒng)專注于單個狹窄的環(huán)境,需要大量的數據和培訓時間。而且,他們仍然犯一些簡單的錯誤,例如將奇瓦瓦狗誤認為松餅!
與兒童學習類似,強化學習基于AI系統(tǒng)與其環(huán)境的交互作用。它采取的行動力圖使報酬最大化并避免懲罰。在好奇心的驅使下,孩子們是活躍的學習者,他們可以同時探索周圍的環(huán)境并預測其行為的結果,從而使他們建立思考因果關系的思維模型。例如,如果他們決定推紅色汽車,灑花瓶或向另一個方向爬行,他們將根據其行動的結果來調整其行為。
孩子們會經歷不同的環(huán)境,在其中他們發(fā)現(xiàn)自己經常以不同尋常的方式在各種情境和物體的處境中導航和互動。就像兒童大腦的發(fā)育可以激發(fā)AI系統(tǒng)的發(fā)展一樣,RL劑的學習機制與多巴胺的釋放所驅動的大腦學習機制是平行的,多巴胺是中樞神經系統(tǒng)的神經遞質,它會根據經驗訓練前額葉皮層。從而塑造刺激反應的關聯(lián)以及結果的預測。
生物學是人工智能最有希望的受益者之一。從研究促成肥胖的令人難以置信的遺傳突變組合到研究導致某些細胞失控并產生癌癥的拜占庭途徑,生物學產生了大量復雜而令人費解的數據。但是,這些數據集中包含的信息通常提供有價值的見解,可用于改善我們的健康狀況。
在合成生物學領域,工程師尋求“重新連接”活生物體并為其編程以新功能,許多科學家正在利用AI設計更有效的實驗,分析其數據并使用其來創(chuàng)建突破性的療法。我最近重點介紹了五家將機器學習與合成生物學相結合的公司,以為更好的科學和更好的工程鋪平道路。
? ? ? ?