麻省理工研發(fā)全新技術(shù),ComText讓機器人學(xué)會情節(jié)記憶
若要真正做到可以像人一樣交流,機器人得需要學(xué)會思考。
Alexa和Siri在一定程度上是可以為我們的生活提供便利的,但他們的幫助非常有限。你可以通過他們訂購一件新襯衫或安排一次清潔服務(wù),但你不能要求他們幫你清洗昨天穿過的上衣,或是挑選出你最喜歡的床單。事實上,這些工作都可以依靠擁有更聰明大腦的機器人來完成。
日前,麻省理工學(xué)院計算機科學(xué)與人工智能實驗室的一組研究人員創(chuàng)造了一個與Alexa有著異曲同工之妙的機器人系統(tǒng)。這個程序的作用正如它那不太可愛的名字——ComText一樣,讓人類能夠使用自然語言給機器人下達命令。研究團隊用一臺名為Baxter的機器人測試了ComText——Baxter主要用于倉庫和工廠,但ComText還可以應(yīng)用于其他類型的機器人。
教授機器人自然語言指令,特別是那些使用自然語言的命令,比聽起來要困難得多。機器人不具備任何理解情景的能力。如果你把工具放在桌子上,讓機器人“拿起它”,機器人并不會知道“它”是什么。如果你要求它拿起你正在使用的最后一個工具,它也沒有有能力憑借以前的經(jīng)驗而理解這個新的命令。
但是ComText——Commands in Context(理解性命令)的縮寫,本質(zhì)上來說,就是賦予了機器人心理學(xué)家稱之為“外顯記憶”的能力:能回憶發(fā)生過的事情。該程序有兩種類型的陳述性記憶。一個稱為語義記憶,是基于實際,譬如你生日的日期,或者是你在這家公司工作這樣的事實基礎(chǔ)。
另一種是情景記憶,是基于過去的經(jīng)驗,來做出未來的決定。換句話說,它是基于語境的——這是ComText賦予機器人的能力。使用此系統(tǒng)的時候,如果你要求機器人拿起你使用過的最后一個工具,它可以就可以真正地通過它的數(shù)字存儲器(以視頻提要的形式)回憶你以前使用工具的情景,在現(xiàn)實世界中再次識別該工具,并把它撿起來。
即使是在小時候,人類也總是在自然語言處理過程中使用情景記憶。如果你告訴一個小孩,“這個杯子是我的”,然后跟他們說,“拿起我的杯子”,他們就知道把桌子上的杯子和你聯(lián)系起來,當(dāng)你提到杯子的時候,他們就會把它撿起來。但這需要一個復(fù)雜的聯(lián)想,對機器人來說很困難。“Mine”是一個抽象的關(guān)系,”麻省理工學(xué)院博士后——羅姆·保羅說,他是關(guān)于ComText的論文的主要作者,“你無法建立一個抽象檢測器,因為這不能表現(xiàn)在表面。”
但是ComText可以執(zhí)行這種類型的動作,像“杯子是我的”一樣的“事實”被存儲在保羅稱之為“知識抽屜”的儲存空間中。然后,當(dāng)你要求它“拿起我的杯子”時,機器人就可以引用該數(shù)據(jù)庫來正確識別哪個杯子是你的。
ComText是人與機器人交互的一步,它可以讓人們自然地引用之前的事件和抽象的概念(如所有權(quán))與機器人交流。例如,如果在祖母的家中有一臺啟用了ComText的機器人,那么它就能夠在當(dāng)她讓它拿起包、當(dāng)她摔倒在地板上或是讓它帶她最喜歡的毛衣的時候做出正確的回應(yīng)。
保羅說:這兩項匯集在一起,能夠顯著擴展我們要求機器人在自然世界中執(zhí)行的命令。當(dāng)使用Baxter和ComText進行測試時,機器人在90%的時間內(nèi)精確地執(zhí)行了命令。
這一點很重要,因為人類和機器人在工廠、家庭和道路上的互動越來越多。事實上,這項研究有一部分是由豐田資助的。情景記憶對于與自主車輛進行交流來說是至關(guān)重要的,你可以發(fā)出命令:“在昨天離開我的同一個地方接我”,“下午五點在辦公室接我的妻子”,“看到行人步行時向左轉(zhuǎn)。”所有這些情況都需要根據(jù)情境信息推理自然世界中的互動。
ComText的下一步是更高級別的推論,而且是比拾取和放下物體更復(fù)雜的任務(wù),這都是為Baxter設(shè)計的。保羅說,他希望在程序中添加一個語音組件,以便機器人和人類可以進行對話,相互詢問問題,以便更好地協(xié)作。他還希望為機器人的內(nèi)存增加更多的知識,從而實現(xiàn)更復(fù)雜的任務(wù)和推理。例如,如果你告訴機器人桌子上有一塊導(dǎo)體鋁塊,那是一個遙控器,那么如果你以后說“給我一個遙控器”,機器人就可以把它帶給你。更多的知識與情景記憶將有助于該程序更好地推斷命令的實際意義。
這一切都是為了讓人和機器人更有效地進行交流。也許他們不會直接替代我們進行工作——但我們會一起工作。