谷歌探索機(jī)器人向人類(lèi)學(xué)習(xí)的方法讓機(jī)器人互相傳授新技能

時(shí)間：2020-05-16 14:27:01

關(guān)鍵字：機(jī)器人神經(jīng)網(wǎng)絡(luò) GOOGLE 人工智能

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 試想一下，如果你不僅通過(guò)學(xué)習(xí)和練習(xí)，而且通過(guò)直接接觸他人的大腦來(lái)獲取他們的經(jīng)驗(yàn)，你還能更好地掌握一些技能呢？對(duì)于人類(lèi)來(lái)說(shuō)，這仍然是科幻小說(shuō)，但在人工智能機(jī)器人領(lǐng)域，通過(guò)讓機(jī)器人分享他們

試想一下，如果你不僅通過(guò)學(xué)習(xí)和練習(xí)，而且通過(guò)直接接觸他人的大腦來(lái)獲取他們的經(jīng)驗(yàn)，你還能更好地掌握一些技能呢？

對(duì)于人類(lèi)來(lái)說(shuō)，這仍然是科幻小說(shuō)，但在人工智能機(jī)器人領(lǐng)域，通過(guò)讓機(jī)器人分享他們的經(jīng)驗(yàn)，縮短訓(xùn)練時(shí)間是可能的。谷歌（Google）最近通過(guò)抓握機(jī)器人手臂展示了這一點(diǎn)。

六年前，谷歌前機(jī)器人主管詹姆斯·庫(kù)夫納（JamesKuffner）為這種技能的獲取創(chuàng)造了一個(gè)術(shù)語(yǔ)，稱(chēng)之為“云機(jī)器人”。它承認(rèn)由數(shù)據(jù)中心和更快的網(wǎng)絡(luò)支持的分布式傳感器和處理的影響。庫(kù)夫納現(xiàn)在是豐田研究所（ToyotaResearchInstitute）的首席技術(shù)官，他專(zhuān)注于云機(jī)器人技術(shù)，將家庭幫工機(jī)器人變成現(xiàn)實(shí)。

谷歌的研究、其英國(guó)人工智能實(shí)驗(yàn)室、Deepad和GoogleX還在繼續(xù)探索云機(jī)器人，以加速機(jī)器人的通用技能獲取。在周二發(fā)布的幾個(gè)演示視頻中，Google展示了使用共享體驗(yàn)來(lái)快速學(xué)習(xí)如何推動(dòng)對(duì)象和打開(kāi)門(mén)的機(jī)器人。

兩臂好，四臂更好：機(jī)器人如何重新定義手術(shù)的未來(lái)

在世界各地的醫(yī)院里，外科醫(yī)生正從新的機(jī)器人助手那里得到幫助。

研究人員正在使用的三種多機(jī)器人方法之一是強(qiáng)化學(xué)習(xí)，即嘗試和錯(cuò)誤，并結(jié)合深層神經(jīng)網(wǎng)絡(luò)。這也是DeepMind用來(lái)訓(xùn)練AI掌握Atari電子游戲和中國(guó)棋盤(pán)游戲Go的方法。

每個(gè)機(jī)器人都有自己的神經(jīng)網(wǎng)絡(luò)，幫助它決定打開(kāi)車(chē)門(mén)的最佳動(dòng)作。Google通過(guò)添加干擾更快地建立數(shù)據(jù)。中央服務(wù)器也在記錄機(jī)器人動(dòng)作、行為和最終結(jié)果，并使用這些經(jīng)驗(yàn)建立更好的神經(jīng)網(wǎng)絡(luò)，幫助機(jī)器人在任務(wù)中改進(jìn)。

正如谷歌在兩個(gè)視頻中展示的一樣，經(jīng)過(guò)20分鐘的訓(xùn)練后，機(jī)器人的機(jī)器人手臂正在摸索著尋找手柄，但最終設(shè)法打開(kāi)了門(mén)。然而，在三個(gè)小時(shí)內(nèi)，機(jī)器人可以很干凈地到達(dá)手柄，扭轉(zhuǎn)它，然后拉開(kāi)門(mén)。

他們正在探索的另一種方法可能會(huì)幫助機(jī)器人按照指令在房子周?chē)苿?dòng)物體。在這里，谷歌正在教它的機(jī)器人建立心智模型，通過(guò)建立像素在某個(gè)特定動(dòng)作后在屏幕上的位置的體驗(yàn)來(lái)了解事物是如何對(duì)某些行為做出反應(yīng)的。

這一次，機(jī)器人們分享了他們?cè)谧雷又車(chē)撇煌矬w的經(jīng)驗(yàn)，幫助他們預(yù)測(cè)如果他們采取某種行動(dòng)的話(huà)會(huì)發(fā)生什么。

最后，研究人員正在探索機(jī)器人向人類(lèi)學(xué)習(xí)的方法。谷歌的研究人員引導(dǎo)機(jī)器人走到門(mén)前，并展示了如何打開(kāi)它們。這些動(dòng)作被編碼成一個(gè)深層次的神經(jīng)網(wǎng)絡(luò)，將攝像機(jī)圖像轉(zhuǎn)換為機(jī)器人動(dòng)作。

再一次，后人類(lèi)訓(xùn)練，機(jī)器人分享他們的經(jīng)驗(yàn)后，試圖打開(kāi)門(mén)自己。此外，通過(guò)每次嘗試逐漸改變門(mén)的位置，機(jī)器人能夠在任務(wù)中逐漸提高，幫助他們?cè)趲讉€(gè)小時(shí)內(nèi)變得更多。