麻省理工新科技:不開口就能說話的耳機
這樣一個耳機,幾乎是我們過去幻想中存在的東西,現(xiàn)在卻離我們不再遙遠。
不用開口就能互相交流,我相信你一定在一些小說或電影中看到過類似的橋段,最近,來自麻省理工的一個研究團隊開發(fā)出了一項新的技術(shù),讓這種愿望得以成真。
這個被稱為 AlterEgo 的裝置由計算機和可穿戴設(shè)備兩部分組成,計算機部分負責信息計算,而可穿戴部分負責信息采集以及傳送。如你所見,和我們?nèi)粘R姷降目纱┐髟O(shè)備差別很大。雖說是原型機,但它看起來倒更像是用來矯正人臉部肌肉的儀器。
這個儀器實際上也有兩部分,一部分是用于捕捉面部和下頜神經(jīng)肌肉信號的傳感器,通過貼合面部部位從而感知神經(jīng)運動;另一部分是骨傳導(dǎo)耳機,用于將信號處理結(jié)果反饋給佩戴者。
按照官方說法,研究人員發(fā)現(xiàn),人的語言信號實際上是內(nèi)部開始觸發(fā),也就是當你要張嘴說話之前,神經(jīng)信號就已經(jīng)出現(xiàn),并到達下頜部位。這種人眼無法察覺到的信號是可以被捕捉到的,也因此,只要能讓機器理解這種電信號的意義,它就會“理解”你說的話,按照這一思路,你就不難理解為何原型機這樣設(shè)計。
雖然聽上去不好理解,但只要看看它能做什么你就會知道有多神奇了。在研究人員設(shè)想中,這一設(shè)備是一種新的人機交流平臺,可以讓你在不開口說話的情況下進行三種操作。
第一種是物聯(lián)網(wǎng)操控,比如你看電視或者聽音樂時,只需要腦海中想要進行操作,就能不張嘴,直接控制這些操作,像換電視頻道,切歌這些操作就非常簡單,這時的 AlterEgo 相當于如今的智能音箱,當你不再需要張嘴就能控制家電了。
第二種功能是充當個人助理,語音助手出現(xiàn)這么多年,可我們還是不太習慣在公共場合喚醒并操控,但有了這個儀器,你只需要在心里默念一些任務(wù),計算機就會“聽懂”并告訴你結(jié)果,比如查詢時間,或者詢問天氣,甚至于在超市買東西算總價,都可以直接心里默念,讓 AlterEgo 的內(nèi)置計算器告訴你結(jié)果,按照官方設(shè)想,這個不用開口的個人助理可以為你翻譯,幫你搜索,查單詞,進行運算,以及設(shè)定鬧鐘,你甚至可以在下棋時讓計算機告訴你下一步要怎樣走最合適。
第三種功能是社交。雖然聽上去有點夢幻,但事實上,當身邊的人都佩戴上 AlterEgo 設(shè)備時,不用開口就能聽到對方想表達的東西也是可以實現(xiàn)的事情,這就相當于將原本要說的話直接傳遞到對方的耳機里,和第一種方式物聯(lián)網(wǎng)的交流有點類似。
設(shè)想當中適合的場景很多
以上三種,都是借助于肌肉傳遞出的電信號,通過人工智能對于電信號的理解做出相應(yīng)的判斷,說到底,這和人工智能助手理解語音操作的邏輯類似,但卻并不容易。
麻省理工學(xué)院媒體實驗室(MIT Media Lab)學(xué)生 Arnav Kapur 表示這個原型最初目的是構(gòu)建一個“IA 設(shè)備”,即“ intelligence-augmentaTIon”設(shè)備,正如它的英文名 AlterEgo 所代表的意義“另一個自己”一樣,他們設(shè)想這一設(shè)備將來會成為人類真正的助手,或者用 Kapur 的話說,“在某些方面融合人與計算機,并讓我們認知擴展。”
從現(xiàn)實意義出發(fā),項目指導(dǎo)老師 PatTIe Maes 教授認為,隨著當前人與智能手機越來越密切的關(guān)系,也帶來了一定的破壞性。比如在人和人交流時一旦需要搜索某些結(jié)果或者查詢信息,交流就會被手機強制打斷,而新的交互體驗無疑可以改變這種破壞性,它未必會替代手機,但它可以做的更好。
當然,從目前的研究來看,AlterEgo 也存在不小挑戰(zhàn),盡管自 19 世紀以來研究者就發(fā)現(xiàn)了身體語言表達和神經(jīng)肌肉信號之間存在關(guān)聯(lián),但這種關(guān)聯(lián)究竟怎樣表達,如何能讓計算機將神經(jīng)肌肉信號轉(zhuǎn)化成正確的語言,這些都是困難之處。即便目前,研究人員發(fā)現(xiàn)了下頜的特定位置具有可以傳達電信號的能力,但要徹底將這種可能性放大到完全可用的情況,還需要很多努力。
另外,你可能會好奇設(shè)備的準確率,研究人員對 10 名測試者進行了 15 分鐘的測試,讓他們通過配搭設(shè)備計算數(shù)學(xué)題,發(fā)現(xiàn)經(jīng)過 AlterEgo 的系統(tǒng),目前在這項目上的準確度為 92%,這聽上去是一個不錯的消息。
而說到不用張嘴就能傳遞信號的其它運用方式,來自佐治亞理工學(xué)院的教授 Thad Starner 說,“比如在機場的停機坪上要控制飛機,那時候的巨大噪音通常無法用語音交流,想象一下在類似情況下,當周圍環(huán)境是高噪聲時,航空母艦、發(fā)電廠、印刷機等地方,這都是一個有意義的系統(tǒng)。”他還認為在一些身體有殘疾的人群中,這個設(shè)備能幫助他們實現(xiàn)更好的生活。
盡管 AlterEgo 還處在原型階段,外形也很夸張,不適合佩戴在公共場合。但這項研究無疑為我們展現(xiàn)了把人工智能技術(shù)的另一種用途,并嘗試讓人和機器進一步“融合”,當相關(guān)技術(shù)不斷迭代并成熟時,相信終有一天,我們會看到令人大吃一驚的消費品。