甄嬛娘娘“附體”?會(huì)“察言觀色”的人工智能
硅谷就像個(gè)圍城。在硅谷待久了,會(huì)產(chǎn)生一種感覺,那就是一切機(jī)器都在變得像人。
先是亞馬遜推出Echo,成為一個(gè)家里隨時(shí)能跟你對(duì)話,幫你查天氣、訂餐廳的機(jī)器管家。
現(xiàn)在,這家叫做Eyeris的人工智能公司告訴我, 亞馬遜的下一代Echo智能管家產(chǎn)品就將有“眼睛”,它能看見我,讀懂我的表情,并且分析我的心情好壞。
好吧,會(huì)察言觀色的機(jī)器人終于要出現(xiàn)了。
發(fā)現(xiàn)這家公司,是在AT&T的年度“Shape”大會(huì)上。“Shape”是舊金山夏天的科技盛事,技術(shù)宅云集。 在各種日本機(jī)器人、韓國(guó)機(jī)器人、VR、AR硬件的光芒下,做軟件的人工智能公司真的不是很引人注意。
但是,Eyeris提出了一個(gè)“看臉”概念。“看臉”是人類認(rèn)知彼此的方式。我們萍水相逢,我第一眼,肯定是看你的臉,進(jìn)而猜測(cè)你的年齡、種族和心情。 Eyeris的技術(shù),簡(jiǎn)單來說,就是教會(huì)機(jī)器“看臉”。 攝像頭將會(huì)變成機(jī)器的眼睛,機(jī)器將會(huì)變得和人一樣聰明,它們會(huì)看你,捕捉你的微表情,以及分析你的情緒。
于是,硅谷密探探員造訪了Eyeris, 與Eyeris的CEO JR Alaoui聊了聊人工智能的前沿技術(shù)與趨勢(shì)。
Eyeris 創(chuàng)始人、CEO JR Alaoui
Eyeris做人臉識(shí)別和情緒分析,從哪一步開始?
2013年,Eyeris召集了數(shù)百名實(shí)驗(yàn)參與者,通過采集他們的面部表情數(shù)據(jù),建起了第一個(gè)數(shù)據(jù)庫(kù)。
通過給采集的數(shù)百萬個(gè)人臉表情分類,標(biāo)簽,Eyeris形成了機(jī)器學(xué)習(xí)的基礎(chǔ)。在此后的數(shù)年,Eyeris不斷進(jìn)行新的人臉采集,并且結(jié)合不同的環(huán)境、燈光條件,豐富這個(gè)數(shù)據(jù)庫(kù)、改進(jìn)算法,形成了通過“看臉”識(shí)別人類情緒的技術(shù)。除了教機(jī)器識(shí)別情緒之外,Eyeris還融入了識(shí)別人種 (5 種)、年齡層 (4 種)、性別 (2 種)、頭部位置 (13 種)等能力。
這個(gè)技術(shù)怎么用呢?首先,當(dāng)然是讓機(jī)器更像人。
如果我問機(jī)器管家,今天天氣怎么樣?目前的技術(shù)或許只能“就事論事”給出答案,就像亞馬遜的Echo一樣。但是,有了“看臉”能力,它將能讀懂我的心情,“審時(shí)度勢(shì)”的回答,或許客氣一點(diǎn),或許活潑一點(diǎn);總之就是get了順著我脾氣走,哄我開心的技能就對(duì)了!
這個(gè)技能的正式名稱,叫做用于社交機(jī)器人(Social Robots)的“臉部分析技術(shù)”。Eyeris的軟件,使社交機(jī)器人可以更好地理解人類的行為,包括通過人臉部的微表情,來理解人的情緒,為用戶提供個(gè)性化的體驗(yàn)。
當(dāng)然,它將不只是用于機(jī)器人,也用于各種應(yīng)用程序,只要這個(gè)應(yīng)用是裝載在有攝像頭的設(shè)備上,例如手機(jī)、平板電腦、無人機(jī)、游戲機(jī)、汽車等。
試想,在我用iPad看YouTube上的電影時(shí),iPad上的攝像頭能夠追蹤和捕捉我的情緒變化,自動(dòng)的了解哪些場(chǎng)景讓我笑,哪些故事讓我哭。這對(duì)個(gè)性化定制內(nèi)容是多么重要啊!
再比如,電視里的一個(gè)節(jié)目讓我笑了,我的攝像頭馬上get到我的笑點(diǎn),而電視臺(tái)則立馬根據(jù)收到的數(shù)據(jù)給我推送一個(gè)同類節(jié)目。
這個(gè)讓我更開心的世界還有多久會(huì)誕生? JR Alaoui 告訴我, Eyeris預(yù)測(cè)在不到12個(gè)月的時(shí)間里,我們就會(huì)看到情緒識(shí)別的軟件被大量的安裝在有攝像頭的社交機(jī)器人上,與各種應(yīng)用程序結(jié)合。而這些具有情緒識(shí)別能力的設(shè)備,價(jià)格將比我想象的低,只要300到500美元。12個(gè)月?好吧,我們拭目以待吧!
然而,這個(gè)技術(shù)更要緊的是能救命。
5月份,特斯拉自動(dòng)駕駛汽車的那場(chǎng)車禍,鬧得人心不寧。目前,美國(guó)的自動(dòng)駕駛技術(shù)分為四個(gè)級(jí)別。最高級(jí)別是谷歌的自動(dòng)駕駛汽車,完全不需要司機(jī)。但時(shí),這要求路面基礎(chǔ)設(shè)施也達(dá)到很高的水平,所以在10至15年內(nèi)都不可能大面積商用。而現(xiàn)在最普遍的,是準(zhǔn)自動(dòng)駕駛汽車,即必須有駕駛員,而車輛的操縱可以隨時(shí)在駕駛員手動(dòng)和汽車自動(dòng)模式間轉(zhuǎn)換。
Eyeris的基于微表情的情緒識(shí)別技術(shù),可以用來監(jiān)測(cè)司機(jī)的狀態(tài),例如眼睛是否睜開,姿態(tài)是否適于開車,情緒是否穩(wěn)定,注意力是否集中等。 如果發(fā)現(xiàn)司機(jī)困的睡著了,或是狀態(tài)很不好,Eyeris會(huì)觸發(fā)汽車的應(yīng)對(duì)機(jī)制,例如通過聲音或座椅的震動(dòng)來提醒駕駛員,勒緊安全帶。
這對(duì)于準(zhǔn)自動(dòng)駕駛汽車,是個(gè)重要的應(yīng)用。在司機(jī)狀態(tài)不好時(shí),攝像頭及時(shí)識(shí)別,提醒司機(jī),或者將汽車轉(zhuǎn)入自動(dòng)駕駛模式,避免掉很多風(fēng)險(xiǎn)。
面對(duì)駕駛員的攝像頭會(huì)以每秒200幀的速度持續(xù)的觀察司機(jī)。 夜間光線不好,或者駕駛員戴了又大又黑的墨鏡也沒問題,通過紅外識(shí)別攝像頭也可以看清一切。
準(zhǔn)自動(dòng)駕駛汽車從自動(dòng)模式轉(zhuǎn)為手動(dòng)模式時(shí),這個(gè)技術(shù)也能增加一層保障。攝像頭會(huì)通過識(shí)別司機(jī)是否注意力集中,精神狀態(tài)良好,眼睛是否在查看前方路況,來建議是否應(yīng)該把駕駛權(quán)交還給司機(jī)。
在Eyeris之前, CEO JR Alaoui經(jīng)營(yíng)著另一家公司。這家公司為廣布于機(jī)場(chǎng)、購(gòu)物中心等處的電視墻網(wǎng)絡(luò)提供解決方案,通過電視墻上的攝像頭,來觀察走近電視墻的人的特征,從而推送個(gè)性化的廣告。例如,一位女士在逛商場(chǎng)時(shí)走近電視墻,電視墻上的攝像頭和計(jì)算機(jī)察覺到了,就會(huì)自動(dòng)播歐萊雅的廣告。
理念上,這和JR Alaoui現(xiàn)在的人工智能公司很像。但JR Alaoui進(jìn)入情緒識(shí)別領(lǐng)域,還是從2010年左右開始。那段時(shí)間,JR Alaoui遇到了Eyeris的另一位創(chuàng)始人,后來的CTO Steven Cadavid。Steven Cadavid是邁阿密大學(xué)計(jì)算機(jī)視覺博士,在情緒識(shí)別方面有著很強(qiáng)的而背景,是將機(jī)器學(xué)習(xí)應(yīng)用于臉部識(shí)別的第一批研究者之一。
JR Alaoui雖然大學(xué)是學(xué)整合營(yíng)銷的,但他對(duì)人工智能、計(jì)算機(jī)視覺興趣濃厚,自學(xué)成才。在這兩個(gè)牛人的帶領(lǐng)下,Eyeris公司13個(gè)人的團(tuán)隊(duì),開發(fā)出了基于SDK的整套的臉部分析軟件,該軟件結(jié)合深度學(xué)習(xí)技術(shù),可以被安裝到硬件、攝像頭、操作系統(tǒng),也可以置于芯片上。
JR Alaoui表示,目前還沒有其他公司能夠把整套的臉部分析軟件融入一個(gè)SDK中。并且,Eyeris的軟件可以置于任何硬件,應(yīng)用范圍非常廣。
目前Eyeris的商業(yè)模式主要是授權(quán)自己的技術(shù)給硬件制造商,例如汽車制造商、電子設(shè)備制造商,攝像頭廠商等。另外,Eyeris也與芯片制造商合作,將軟件裝在芯片上,用于有攝像功能的設(shè)備。
如果說目前還有什么挑戰(zhàn),那主要是硬件方面。能達(dá)到要求,價(jià)格又低廉的攝像頭,和能支持軟件高速運(yùn)轉(zhuǎn)的硬件,是Eyeris推進(jìn)自己技術(shù)商業(yè)化應(yīng)用的兩大挑戰(zhàn)。紅外攝像頭可以追蹤人的動(dòng)作,但是并不適合于微表情的識(shí)別。而JR Alaoui希望,高質(zhì)量的3D攝像頭可以加速發(fā)展,很快被應(yīng)用起來。
另外,環(huán)境的變化也影響表情識(shí)別的準(zhǔn)確度。雖然Eyeris搜集了各種環(huán)境下的人臉表情,建立了龐大的數(shù)據(jù)庫(kù),但總是有新的環(huán)境情況出現(xiàn),例如夜店,例如光線變化快速的晚會(huì)。在普通情況下,Eyeris的表情識(shí)別準(zhǔn)確度能達(dá)到98%,但在這些情況下,就有所降低了。
甄嬛娘娘般的人工智能會(huì)不會(huì)出現(xiàn)?
在AT&T Shape上,JR Alaoui 談到了一個(gè)未來的愿景:無處不在的人工智能。
不遠(yuǎn)的未來,電子設(shè)備會(huì)無處不在,不管你是否察覺的到它們;而每一個(gè)電子設(shè)備,都與可識(shí)別人情緒的攝像頭與人工智能軟件結(jié)合。
在人工智能無處不在的世界里,我晚上加班回家再也不用擔(dān)心黑燈瞎火,因?yàn)榭斓郊視r(shí),房間就會(huì)根據(jù)我今天的心情亮好燈,放好音樂。我也不用擔(dān)心看電視節(jié)目無聊,因?yàn)殡娨曇矔?huì)察言觀色了,根據(jù)我喜歡看什么,給我推薦節(jié)目。而這一切,不需要我動(dòng)一根指頭說一句話,人工智能妥妥的心知肚明。
很像家有甄嬛娘娘吧?