谷歌探索機器人向人類學習的方法 讓機器人互相傳授新技能
試想一下,如果你不僅通過學習和練習,而且通過直接接觸他人的大腦來獲取他們的經(jīng)驗,你還能更好地掌握一些技能呢?
對于人類來說,這仍然是科幻小說,但在人工智能機器人領域,通過讓機器人分享他們的經(jīng)驗,縮短訓練時間是可能的。谷歌(Google)最近通過抓握機器人手臂展示了這一點。
六年前,谷歌前機器人主管詹姆斯·庫夫納(JamesKuffner)為這種技能的獲取創(chuàng)造了一個術語,稱之為“云機器人”。它承認由數(shù)據(jù)中心和更快的網(wǎng)絡支持的分布式傳感器和處理的影響。庫夫納現(xiàn)在是豐田研究所(ToyotaResearchInstitute)的首席技術官,他專注于云機器人技術,將家庭幫工機器人變成現(xiàn)實。
谷歌的研究、其英國人工智能實驗室、Deepad和GoogleX還在繼續(xù)探索云機器人,以加速機器人的通用技能獲取。在周二發(fā)布的幾個演示視頻中,Google展示了使用共享體驗來快速學習如何推動對象和打開門的機器人。
兩臂好,四臂更好:機器人如何重新定義手術的未來
在世界各地的醫(yī)院里,外科醫(yī)生正從新的機器人助手那里得到幫助。
閱讀更多
研究人員正在使用的三種多機器人方法之一是強化學習,即嘗試和錯誤,并結合深層神經(jīng)網(wǎng)絡。這也是DeepMind用來訓練AI掌握Atari電子游戲和中國棋盤游戲Go的方法。
每個機器人都有自己的神經(jīng)網(wǎng)絡,幫助它決定打開車門的最佳動作。Google通過添加干擾更快地建立數(shù)據(jù)。中央服務器也在記錄機器人動作、行為和最終結果,并使用這些經(jīng)驗建立更好的神經(jīng)網(wǎng)絡,幫助機器人在任務中改進。
正如谷歌在兩個視頻中展示的一樣,經(jīng)過20分鐘的訓練后,機器人的機器人手臂正在摸索著尋找手柄,但最終設法打開了門。然而,在三個小時內,機器人可以很干凈地到達手柄,扭轉它,然后拉開門。
他們正在探索的另一種方法可能會幫助機器人按照指令在房子周圍移動物體。在這里,谷歌正在教它的機器人建立心智模型,通過建立像素在某個特定動作后在屏幕上的位置的體驗來了解事物是如何對某些行為做出反應的。
這一次,機器人們分享了他們在桌子周圍推不同物體的經(jīng)驗,幫助他們預測如果他們采取某種行動的話會發(fā)生什么。
最后,研究人員正在探索機器人向人類學習的方法。谷歌的研究人員引導機器人走到門前,并展示了如何打開它們。這些動作被編碼成一個深層次的神經(jīng)網(wǎng)絡,將攝像機圖像轉換為機器人動作。
再一次,后人類訓練,機器人分享他們的經(jīng)驗后,試圖打開門自己。此外,通過每次嘗試逐漸改變門的位置,機器人能夠在任務中逐漸提高,幫助他們在幾個小時內變得更多。