這個叫“達爾文”的機器人能跟兒童一樣學習
目前來說,機器人還停留在“機器”階段,實現(xiàn)這一跳躍的將是學習能力。難怪說知識改變命運~
據(jù)美國全國廣播公司新聞網(wǎng)媒體 News 12月7日報道,美國加州大學伯克利分校機器人學習實驗室的研究小組研發(fā)出一款名為達爾文(Darwin)的機器人,該機器人的一舉一動都由數(shù)個擬神經(jīng)系統(tǒng)的網(wǎng)絡(luò)控制著。通過使用增強學習技術(shù),達爾文能夠模仿人類兒童大腦的學習方式對不同情況作出不一樣的反應(yīng)。
據(jù)報道,在加大伯克利分校的實驗室中,達爾文像蹣跚學步的兒童一樣,搖搖晃晃,不斷跌倒,又不斷爬起,直到可以走得平穩(wěn)。這來源于研究人員用于達爾文的增強學習技術(shù),通過這種技術(shù),達爾文的神經(jīng)網(wǎng)絡(luò)能夠像人類兒童的大腦一樣運轉(zhuǎn)試錯過程。
“想象一下學一項新技能,比如學騎自行車,一開始你會一直摔倒,但經(jīng)過一些練習,你就能慢慢掌握竅門。”,機器人研究小組成員約翰•舒曼(John Schulman)如是說。
機器人在平坦的地面行走沒有任何問題,但當任一變量(如臺階或斜坡)出現(xiàn)時,它們就不知如何應(yīng)對了。在今年的DARPA機器人挑戰(zhàn)賽中,一些最頂尖的機器人要通過模擬真實世界災(zāi)難場景的障礙物,然而幾乎所有參與挑戰(zhàn)的機器人都沒能成功。
為了能使機器人在復(fù)雜的環(huán)境中靈活應(yīng)變,加大伯克利分校的研究小組在達爾文上使用了通用型神經(jīng)網(wǎng)絡(luò),這些網(wǎng)絡(luò)實際上就是模仿人類大腦進行學習的算法。研究小組的另一位科學家塞吉•萊文(Sergey Levine)說道:“這些算法中幾乎沒有具體動作的算法指令。實際上,這些算法從一開始就被設(shè)計成通用型的,它們不是具體的單一的走、握或洗碗動作,而是能適用于所有這些動作的算法。”
同時,如果機器人能夠自我學習,那么它運行所需的硬件控制的人力投入就會減少,這樣就可以降低機器人的制造成本。
加州大學伯克利分校的科學家們希望能將擁有完全自主意識的機器人變成現(xiàn)實,使機器人能夠靈活地執(zhí)行很多只有人類才能執(zhí)行的任務(wù)。赫伯特說,現(xiàn)在的機器人在很多情況下依然需要遠程控制,例如在精確度要求非常高的任務(wù)執(zhí)行中。但最近的研究顯示機器人研發(fā)正從預(yù)先編程向不斷提高機器人的個例歸納能力轉(zhuǎn)變。
達爾文研發(fā)小組的負責人彼得•阿布比爾(Pieter Abbeel)教授表示要將這種轉(zhuǎn)變從模擬實驗轉(zhuǎn)為實際應(yīng)用還要做大量工作,但它將對機器人研究產(chǎn)生重大影響。舒曼認為:“這有可能使《星球大戰(zhàn)》中的人形機器人C-3PO變成現(xiàn)實。”