可穿戴設(shè)備頻出催生新語音需求 準(zhǔn)確率低成難題
10月是智能手表、互聯(lián)網(wǎng)電視開售的集中月,它們與智能手機(jī)不同,屏幕一個大一個小,按鈕又不多,傳統(tǒng)的觸屏、按鍵操控還要怎么繼續(xù)?于是“智能語音”的需求誕生了,目前智能語音的現(xiàn)狀是,聲音識別率高,但在理解方面差了點(diǎn)。
蘋果Siri領(lǐng)銜
智能語音爆紅
2007年,國產(chǎn)手機(jī)金立曾推出一種“語音王”的手機(jī),喊一聲“張三”,它會自動撥打張三的電話,這,算智能語音嗎?
別誤會,這只是一種傻瓜式語音,是單個字識別,一碰到連續(xù)的語句就“萎”了。
2011年10月,蘋果發(fā)布了iPhone 4S,自帶一種Siri的語音控制功能,能幫助用戶讀短信、查天氣,還能學(xué)習(xí)新的聲音語調(diào),提供對話式問答,蘋果開啟了智能語音交互時代。
不信?來看一組用戶與Siri的測試對話。“你是誰?”“我是Siri?!薄澳闶桥幔俊薄安皇恰薄澳闶悄泻??”“我不覺得咱們有時間扯這些”“我喜歡你”“咱倆是不可能的”。
Siri誕生之后爆紅全球,隨后谷歌、百度也推出了類似語音產(chǎn)品。今年HTC、摩托羅拉推出的旗艦機(jī)中也帶有此類功能,如小i機(jī)器人。
穿戴設(shè)備頻出
催生三個技術(shù)環(huán)節(jié)
易觀分析師王俊認(rèn)為,智能語音已經(jīng)誕生新的需求,“一些穿戴設(shè)備沒有鍵盤、沒有觸屏,有些連屏幕都沒有。”
繼索尼、三星發(fā)布智能手表后,10月17日,阿迪達(dá)斯也發(fā)布了miCoach SMART RUN,加上此前智器、盛大等國產(chǎn)廠商推出的產(chǎn)品,智能手表產(chǎn)品一時暴增。又在10月,樂視、小米、阿里酷開電視全面預(yù)售,三款電視中,樂視、酷開均支持語音識別功能。
智能產(chǎn)品的發(fā)布,對語音識別提出了新的要求。10月19日,記者見到了樂視TV、智器手表語音技術(shù)提供者云知聲團(tuán)隊(duì),其CTO康恒博士表示,智能語音主要包含三個部分:語音識別、語義解析、知識圖譜。
為了演示效果,他用手機(jī)語音操控電視:“明天上海天氣”,電視立刻回應(yīng)“正在為您查詢”,隨后天氣信息便顯示出來。電視先是聽懂康恒說話(語音識別),然后認(rèn)為他是要查詢上海天氣,最后提供了天氣信息(知識圖譜)。
準(zhǔn)確率逐級降低
達(dá)80%就算優(yōu)質(zhì)
“市面上產(chǎn)品語音識別準(zhǔn)確率會較高,但是到語音解析會低一點(diǎn),到知識圖譜會更低一點(diǎn),最終準(zhǔn)確率能達(dá)到80%就算是優(yōu)質(zhì)產(chǎn)品。”王俊表示,這三個環(huán)節(jié)中,語義解析技術(shù)難度最高。
目前的發(fā)展?fàn)顩r是,語音識別準(zhǔn)確率很高,據(jù)康恒介紹,云知聲語音識別準(zhǔn)確率為95%。
“要消滅剩下的5%非常困難,需要從每個細(xì)節(jié)入手,先把環(huán)境噪聲解決,1%可能解決了;再把口音問題解決一點(diǎn),1%就上去了;再把聲音采樣庫擴(kuò)大點(diǎn),1%又消滅了?!笨岛惚硎?,要達(dá)到99%的準(zhǔn)確率,云知聲可能需要五年。
康恒還說道,語義解析與知識圖譜是一個很前沿的課題?!氨热纭阌卸嗌俑^發(fā)’,我能聽明白也能理解,但是不知道答案。計算機(jī)也需要一個漫長的學(xué)習(xí)過程。”晨報記者王方