用虛擬老鼠模擬神經(jīng)網(wǎng)絡(luò),完成4種復(fù)雜任務(wù)
人工智能,簡稱AI。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的技術(shù)科學(xué)。智東西5月9日消息,近日,谷歌旗下AI企業(yè)DeepMind和哈佛大學(xué)的研究人員用AI技術(shù)創(chuàng)造出一只虛擬3D老鼠,這只老鼠能夠完成跳躍、覓食、逃跑、擊球等多項復(fù)雜任務(wù)。這項研究或有助于增進人類對生物神經(jīng)系統(tǒng)的理解。
在生物科學(xué)領(lǐng)域,神經(jīng)活動與動物行為之間的關(guān)系一直是一個未解之謎。許多研究人員認為AI技術(shù)是解答這個疑問的金鑰匙,這是因為AI技術(shù)的靈感正是來自于人腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
這一點從名字上也可以看出來,比如,AI技術(shù)是由人工“神經(jīng)網(wǎng)絡(luò)”來驅(qū)動的,機器學(xué)習(xí)算法的組成部件則被稱為“神經(jīng)元”。
但是,由于運動控制的復(fù)雜性,之前的研究大多聚焦于單一、簡單的動作,并沒有針對更復(fù)雜、多樣的動作進行研究。DeepMind和哈佛大學(xué)的研究人員認為:如果用AI技術(shù)模擬出一個虛擬生物,就可以更簡便地觀察生物做復(fù)雜動作時的神經(jīng)活動、降低研究的難度。
基于這個設(shè)想,研究人員設(shè)計出了一只虛擬3D老鼠。
這項研究在4月26日至5月1日舉行的國際學(xué)習(xí)表征會議(ICLR)上發(fā)表。ICLR是每年舉行的機器學(xué)習(xí)會議,采用開放式同行評審的方式審閱論文。
論文題目為《虛擬嚙齒動物的深層神經(jīng)行為學(xué)(Deep neuroethology of a virtual rodent)》。
論文鏈接:https://openreview.net/attachment?id=SyxrxR4KPS&name=original_pdf
一、虛擬老鼠與真鼠生物學(xué)特征相同,能做4種復(fù)雜動作
研究人員利用物理模擬器MuJoCo創(chuàng)建模型。為了使虛擬老鼠盡可能地仿真,研究人員設(shè)計該模型擁有與真實老鼠相同的生物學(xué)特征:身體有38個等級的自由度,尾巴、脊柱、脖子由關(guān)節(jié)組成,利用肌腱控制關(guān)節(jié)。
虛擬老鼠與真鼠生物學(xué)特征相同
研究人員計劃使虛擬老鼠完成4種復(fù)雜動作,分別是:A.跳過地表縫隙(gaps run)、B.在迷宮中覓食(maze forage)、C.逃離丘陵環(huán)境(bowl escape)、D.前爪按照固定頻率觸球兩次(two-tap)。
虛擬老鼠能做4種復(fù)雜動作
為了達到這一目的,研究人員訓(xùn)練了一個多任務(wù)策略(Multi-Task Policy)。通過一個殘差網(wǎng)絡(luò)(Residual Network),以自我為中心的視覺圖像被編碼為特征。通過一個多層感知器(Multi-Layer Perceptron),本體感受狀態(tài)觀察也被編碼。
這些特征被傳遞到循環(huán)長短期記憶(recurrent LSTM)模塊中。訓(xùn)練過程中,核心模塊用反向傳播算法(BP,Backpropogation)進行訓(xùn)練。核心模塊的輸出也作為特征傳遞給策略模塊。策略模塊由一個或多個LSTM模塊堆疊而成。
短時間尺度上,虛擬老鼠借助一組制動器來驅(qū)動關(guān)節(jié)、產(chǎn)生移動。在更長的時間尺度上,虛擬老鼠的關(guān)節(jié)移動被組織成協(xié)調(diào)的、重復(fù)的,這樣就實現(xiàn)了奔跑、跳躍、轉(zhuǎn)彎等動作。
二、研究4種復(fù)雜動作對應(yīng)的神經(jīng)活動
模型制作好后,研究人員開始研究虛擬老鼠的神經(jīng)活動。
1、找到虛擬老鼠行為對應(yīng)的神經(jīng)區(qū)域
首先,研究人員試圖找到虛擬老鼠不同行為與特定大腦神經(jīng)區(qū)域之間的對應(yīng)關(guān)系。
為了便于觀察和記錄,研究人員從虛擬老鼠的動作中提取出特征。
研究人員按照動物行為學(xué)方法,提取虛擬老鼠的兩組行為特征:第一組采用一種行為映射方法,提取老鼠運動時最常用到的關(guān)節(jié)角度,生成一組描述虛擬老鼠姿態(tài)和運動學(xué)特性的特征。第二組提取老鼠運動時最常出現(xiàn)的15個關(guān)節(jié)角度及相應(yīng)姿勢,由此產(chǎn)生行為特征。
然后,研究人員用T-分布鄰域嵌入算法(t-SNE),把老鼠行為特征嵌入2D。
接下來,研究人員分別在1~25Hz時間尺度、0.3~5Hz時間尺度、5~25Hz時間尺度上劃分出25個尺度,計算這兩組行為特征的莫萊小波(Morlet wavelet)變換的15個最重要的特征。這產(chǎn)生了描述虛擬老鼠姿勢和運動學(xué)特征的60維特征集。
嵌入2D后,研究人員制作出一張?zhí)摂M行為“地圖”,虛擬老鼠的行為被劃分到對應(yīng)的大腦神經(jīng)區(qū)域。這反映了一些行為(跳躍、奔跑、攀爬等)與神經(jīng)網(wǎng)絡(luò)的關(guān)系結(jié)構(gòu)。
2、核心層、策略層各有分工
除了行為參數(shù),研究人員還測量和分析了每層架構(gòu)中長短期記憶(LSTM)細胞的神經(jīng)活動。
為了進一步找出核心層和策略層分別負責(zé)編碼哪些行為,研究人員使用了代表性的相似性分析(representational similarity analysis)。代表性的相似性分析可以提供一個整體性的測量標準,幫助研究人員發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)如何編碼行為特征以及這種編碼在不同層級中如何變化。
分析結(jié)果顯示,任務(wù)執(zhí)行期間,核心層與策略層在不同的時間尺度上運作。
核心層通常在1~10秒的時間范圍內(nèi)運作,更多用于編碼慢動作的行為特征,這可能說明了核心層與情景和獎勵等變量相關(guān)。
策略層通常在亞秒級別等時間尺度上運作,更多用于編碼快速動作的行為特征,這可能說明了策略層負責(zé)即時動作的編碼。
為了研究出神經(jīng)網(wǎng)絡(luò)如何編碼出完成不同任務(wù)所需的動作,研究人員分析了核心層、策略層在不同任務(wù)中的變化。使用多維標度(MDS,multidimensional scaling)將虛擬老鼠活動嵌入二維。
結(jié)果顯示,核心層在不同任務(wù)中的表現(xiàn)有較大不同,策略層在不同任務(wù)中的表現(xiàn)有較多重疊。
虛擬老鼠為神經(jīng)網(wǎng)絡(luò)研究帶來了更多可能性,還有助于提升AI技術(shù)水平。這項研究的論文合著者杰西·馬歇爾(Jesse Marshall)說:“這篇論文是我們了解大腦如何靈活處理任務(wù)的開始,通過獲得的知識,我們也可以設(shè)計出具有類似能力的人工代理?!?
但另一位研究者斯科特認為,在實際操作層面上還有一些問題亟待解決?!霸谶@么復(fù)雜的任務(wù)中收集動物的神經(jīng)數(shù)據(jù)是十分困難的?!彼f。
用虛擬老鼠的神經(jīng)活動模式與其他真實動物的模式相比較,測試兩種神經(jīng)模式分化源頭,這是目前研究人員在實驗室環(huán)境中的測試。