OpenAI的AI機(jī)器人可用單手就能還原魔方
(文章來(lái)源:環(huán)球網(wǎng))
人工智能(AI)研究組織OpenAI在制造具有通用性、能夠自我學(xué)習(xí)的機(jī)器人方面取得了新的里程碑。該組織的機(jī)器人部門(mén)表示,其去年首次亮相的機(jī)器人手Dactyl已經(jīng)學(xué)會(huì)了單手解魔方。OpenAI將這個(gè)壯舉視為一次飛躍,這既體現(xiàn)在機(jī)器人手的靈巧性上,也體現(xiàn)在其自主研發(fā)的AI軟件上。這種軟件允許Dactyl在面臨真正的物理挑戰(zhàn)之前,利用虛擬模擬來(lái)學(xué)習(xí)如何執(zhí)行新任務(wù)。
在展示Dactyl新才藝的演示視頻中,我們可以看到機(jī)器人手以摸索的方式逐漸破解魔方,雖然其動(dòng)作顯得有點(diǎn)兒笨拙,但卻十分精確。盡管破解的過(guò)程有點(diǎn)兒長(zhǎng),但Dactyl最終解決了這個(gè)難題。這個(gè)機(jī)器人手的動(dòng)作看起來(lái)明顯不如真正的人手靈活,甚至有點(diǎn)兒脫節(jié),更無(wú)法與那些能在短短幾秒鐘內(nèi)破解魔方的人的驚人速度和敏捷相比。
但對(duì)于OpenAI而言,Dactyl的成就使其向更廣泛的AI和機(jī)器人行業(yè)令人向往的目標(biāo)又邁進(jìn)了一步。這個(gè)行業(yè)希望研發(fā)出能夠?qū)W習(xí)執(zhí)行各種現(xiàn)實(shí)世界任務(wù)的機(jī)器人,它們無(wú)需培訓(xùn)數(shù)月乃至數(shù)年時(shí)間,也無(wú)需專門(mén)進(jìn)行編程。
韋林德指的是過(guò)去幾年中出現(xiàn)的各種機(jī)器人,這些機(jī)器人已經(jīng)將破解魔方的方法推向遠(yuǎn)遠(yuǎn)超越人類雙手和思維的極限。2016年,半導(dǎo)體制造商英飛凌(Infineon)開(kāi)發(fā)了一款專門(mén)用于以超快速度破解魔方的機(jī)器人,該機(jī)器人成功地在一秒鐘內(nèi)完成了這個(gè)任務(wù)。這打破了當(dāng)時(shí)由人類保持的世界紀(jì)錄(不到5秒)。兩年后,麻省理工學(xué)院開(kāi)發(fā)的一臺(tái)機(jī)器在不到0.4秒的時(shí)間破解了魔方。
換句話說(shuō),為某一特定任務(wù)而設(shè)計(jì)的機(jī)器人,并被編程為盡可能高效地執(zhí)行該任務(wù),通常最適合人類,而破解魔方是軟件很久以前就掌握的東西。因此,開(kāi)發(fā)機(jī)器人來(lái)破解魔方,即使是與人手相似的機(jī)器人,本身也并不是那么引人注目。Dactyl操作的速度十分緩慢,這讓其取得的成就更顯得不起眼兒。
但是OpenAI的Dactyl機(jī)器人和驅(qū)動(dòng)它的軟件,在設(shè)計(jì)和用途上與專用的魔防破解及其有很大的不同。正如韋林德所說(shuō)的那樣,OpenAI正在進(jìn)行的機(jī)器人研發(fā)工作并不是為了在狹隘任務(wù)中獲得卓越的結(jié)果,因?yàn)檫@只需要你開(kāi)發(fā)更好的機(jī)器人并相應(yīng)地對(duì)它進(jìn)行編程就可做到。這甚至可以在沒(méi)有現(xiàn)代AI支持的情況下完成。
但直到最近,訓(xùn)練AI代理做些虛擬的事情(例如玩電腦游戲)比訓(xùn)練它執(zhí)行現(xiàn)實(shí)世界任務(wù)要容易得多。這是因?yàn)椋芯咳藛T可以加快訓(xùn)練軟件在虛擬世界中做某些事情的速度,這樣AI就可以在現(xiàn)實(shí)世界的短短幾個(gè)月時(shí)間內(nèi)接受相當(dāng)于數(shù)萬(wàn)年的訓(xùn)練,這得益于數(shù)千個(gè)高端CPU和超強(qiáng)大GPU并行工作的結(jié)果。
用物理機(jī)器人進(jìn)行同樣水平的訓(xùn)練并執(zhí)行物理任務(wù)是不可行的。這就是為何OpenAI試圖用模擬環(huán)境代替現(xiàn)實(shí)世界來(lái)開(kāi)創(chuàng)機(jī)器人訓(xùn)練新方法的理由,這也是機(jī)器人行業(yè)幾乎沒(méi)有嘗試過(guò)的東西。在這種情況下,該軟件可以同時(shí)在許多不同的計(jì)算機(jī)上以加速方式進(jìn)行廣泛的練習(xí),并希望它在開(kāi)始控制真正的機(jī)器人時(shí)保留這些知識(shí)。
由于訓(xùn)練的局限性和存在明顯的安全問(wèn)題,今天商業(yè)中使用的機(jī)器人不使用AI,而是用非常具體的指令進(jìn)行編程。韋林德解釋稱:“過(guò)去的方法是,你需要使用非常專業(yè)的算法來(lái)解決特定任務(wù),你可以對(duì)機(jī)器人模型和環(huán)境進(jìn)行精確操控。對(duì)于工廠機(jī)器人來(lái)說(shuō),你有非常精確的模型,而且你也確切地知道自己所處的工作環(huán)境,因此你非常了解它將如何執(zhí)行特定的任務(wù)?!?/p>
這也是為何當(dāng)前機(jī)器人遠(yuǎn)沒(méi)有人類那么多才多藝的最重要原因。人們需要大量的時(shí)間、精力和金錢來(lái)重新給特定的機(jī)器人編程,比如組裝汽車特定部件或計(jì)算機(jī)組件的機(jī)器人。沒(méi)有經(jīng)過(guò)適當(dāng)訓(xùn)練的機(jī)器人,即使是在執(zhí)行人類看起來(lái)非常簡(jiǎn)單的任務(wù),它都會(huì)經(jīng)歷慘敗。然而,有了現(xiàn)代AI技術(shù),機(jī)器人可以模仿人類,這樣它們就可以使用對(duì)世界同樣直觀的理解來(lái)做從開(kāi)門(mén)到煎蛋等各種事情。至少,這是我們的夢(mèng)想。
我們距離機(jī)器人能夠執(zhí)行這種復(fù)雜程度的任務(wù)仍然有幾十年的距離,AI社區(qū)在軟件方面所取得的飛躍,比如自動(dòng)駕駛汽車、機(jī)器翻譯和圖像識(shí)別,還沒(méi)有完全轉(zhuǎn)化為下一代機(jī)器人身上。目前,OpenAI只是試圖模仿人體某一部位的復(fù)雜性,并讓機(jī)器人的模擬操作變得更自然。
這就是為何Dactyl會(huì)被模仿人手設(shè)計(jì)成擁有24個(gè)關(guān)節(jié)機(jī)械手的原因,它與我們?cè)诠S里看到的機(jī)械爪或機(jī)械鉗完全不同。對(duì)于支持Dactyl學(xué)習(xí)如何以人類的方式利用所有這些關(guān)節(jié)的軟件,OpenAI嘗試在現(xiàn)實(shí)世界中破解魔方之前,已經(jīng)在模擬環(huán)境中對(duì)其進(jìn)行了數(shù)千年的訓(xùn)練。