近日,百度推出的“神燈搜索”吸引了外界關注——摩擦手機智能邊框,發(fā)出語音指令,搜索結果通過全息影像呈現(xiàn)在手機屏幕上方,并支持用戶進行多輪語音交互。
在之前上映的《復仇者聯(lián)盟2:奧創(chuàng)世紀》中,鋼鐵俠在復仇者聯(lián)盟總部,與其創(chuàng)造出來的人工智能賈維斯對話,該人工智能的展示方式便是全息影像。
近日,百度推出的“神燈搜索”吸引了外界關注——摩擦手機智能邊框,發(fā)出語音指令,搜索結果通過全息影像呈現(xiàn)在手機屏幕上方,并支持用戶進行多輪語音交互。
也許“阿拉丁搜索”看起來還有點遙遠,6月6日愛眼日當天,百度宣布與清華大學聯(lián)合研發(fā)創(chuàng)新搜索服務,通過觸摸與語音,讓盲人也可以同普通人一樣來獲取互聯(lián)網(wǎng)中的海量信息,向搜索“神燈”邁出了堅實一步。
“神燈”可為你做什么?
場景一:如果你對著手機說:“什么樣的早餐能在3分鐘內(nèi)做好啊?”一個法國大廚模樣的帥哥從手機里“蹦”了出來,懸浮在手機上方說:“咱們可以做法式吐司,首先,咱們來打雞蛋……”如果你希望帥哥的形象再大一些,用手指觸摸他,就可以放大、縮小了。
場景二:如果你問“最近有什么好看的電影?”可愛的帕丁頓熊竟然“跳”出來了,告訴你現(xiàn)在它最火,并且可以自動為你播放預告片,當你說“嗯,就看這個吧”,它又會馬上提示出最近的影院,幫你選座訂票。
預定餐廳時,你可以看到自己選擇的窗邊位,甚至直接在空中點菜,并自動提供行車路線載入地圖程序。
場景三:對于孩子們來說,直接問“蝴蝶寶寶長什么樣子?”便可以看到一棵綠色小樹的全息影像展現(xiàn),而蝴蝶寶寶就在樹上安睡,最終變成蝴蝶,在空中飛起來,帶孩子進入科幻世界。
在與更多的品牌合作后,用戶可以更直觀地訂外賣、選車、選玩具,在你不想打字或者不方便打字時,只要大聲說:“我要查快遞、我要停車、我要買機票、我要看小說、我要唱K……”就會得到各種服務。
通過全息投影,可在手機屏幕上方顯示頭像。
“迷你”全息投影
好吸引
百度的“神燈”搜索概念一經(jīng)宣布,便引起了業(yè)界關注,然而是真是假,一時眾說紛紜。近日,記者從百度內(nèi)部人士方面了解到,“神燈”搜索并非玩笑,但何時正式發(fā)布,目前并沒有時間表。事實上,2014年4月1日,百度曾在愚人節(jié)發(fā)布了一個概念性的“筷搜”產(chǎn)品,時隔半年后的百度世界大會上,健康生活智能設備“百度筷搜”正式與大家見面。
從目前概念中透露出的信息來看,“全息投影”,無疑是該全新搜索技術中最吸引的部分。很多用戶聽聞后開心地驚呼:“太好啦,以后想誰就喊誰‘出現(xiàn)’,不會寂寞啦!”
事實上,全息投影已經(jīng)越來越多出現(xiàn)在我們的生活里。2015春晚,歌手李宇春借助3D全息投影技術分身4次,四個“李宇春”變幻莫測,讓人難分真假,嘆為觀止。
不過,記者了解到,目前,大部分全息投影應用都在比較大的場景下,如:舞臺、博物館、地產(chǎn)模型展示等方面。而“迷你化”對于全息投影來說具有難度,尤其是通過手機邊框投影。
另外,全息投影要想達到一定的亮度和體積,需要的投射功率會很大,這就對手機電池有很高的要求。
全息投影能讓你與具有立體感的“對象”聊天。
人工智能強勢布局
與此同時,要想如“神燈”一樣做到“有求必應”,背后的人工智能技術亦是關鍵。
據(jù)了解,百度“大腦”是通過深度學習來模擬人類大腦的神經(jīng)元,參數(shù)規(guī)模達到百億級別,成為目前世界上最大規(guī)模的深度神經(jīng)網(wǎng)絡,目前已具備2~3歲兒童智力水平。基于人工智能深度學習等技術打造的“對象識別方法和裝置”專利技術也可以保證“神燈搜索”里所提及的多輪語音交互的實現(xiàn)。
在2014年,谷歌、百度、Facebook和IBM等科技公司在人工智能領域強勢布局,并將這些技術應用到具體的產(chǎn)品和服務中。谷歌去年初收購DeepMind公司后推出了新的“模擬神經(jīng)網(wǎng)絡”,可以模仿人類大腦進行歸納整理等邏輯推理,甚至可以自行處理任務。
不過,在科技界中,特斯拉CEO Eron Musk(埃隆·馬斯克)和霍金的“人工智能惡魔論”引發(fā)了激烈爭論:當越來越聰明的“虛擬人工助手”來到我們身邊,究竟是更像天使,還是更像惡魔?還要等待未來的檢驗。
語音交互 新型搜索第一步
“有事您說話!”新型的搜索,特別強化了語音交互的重要性。百度董事長兼首席執(zhí)行官李彥宏曾經(jīng)預測:“未來五年,使用語音和圖像來表達需求的比例將超過50%”。
在語音交互這一方面,微軟、蘋果、谷歌Google Now等都已實現(xiàn)重要進展。國外有Nuance語音技術公司,蘋果iPhone手機的虛擬語音助手Siri、谷歌的語音搜索服務、微軟的必應;國內(nèi)則是百度、科大訊飛等企業(yè)。
不過,“語音識別”的功能性對于類似“神燈”搜索這樣的智能交互來說,意義重大。百度首席科學家吳恩達曾透露,通過使用“神經(jīng)元系統(tǒng)”以及“數(shù)據(jù)燃料”,百度人工智能幫語音識別提高了準確性,語音識別可以很好地處理背景噪音,使手機離得比較遠也能很好地識別用戶講出的話。
記者采訪了解到,現(xiàn)階段,一些模糊不清的詞匯還是難以辨別,也不能通過語境理解用戶的真正意圖。拿“我要吃飯”這一句話來說,在中文里可能就有“我要點餐、我要吃夜宵、我要填飽肚子、我餓了”等的衍生表達。
“語音搜索”雖然現(xiàn)在已經(jīng)實現(xiàn)了,但是要實現(xiàn)后續(xù)的多輪對話,一方面需要更加出色的語音智能交互技術,另一方面也需要背后人工智能技術以及整合服務等方面的強力支持。比如,在Siri搜索“我要吃飯”,它會從大眾點評上獲取信息為你推薦最近的餐館,點擊進去會有餐館的簡介和地理位置,但只限于信息的獲取。