Audience是如何實現(xiàn)聽覺神經(jīng)科學商業(yè)化的
剛剛步入2014 GSMA亞洲移動通信博覽會的展廳時候,幾乎所有人的眼球都被入口處那超大型的中國移動展臺吸引了。作為此次GSMA的最大合作伙伴,中國移動占據(jù)了展會的有利地形,展出了眾多先進技術(shù)和產(chǎn)品。其中最吸引人的應該就是TD-LTE語音解決方案VoLTE。
VoLTE可帶來高清語音、低延遲視頻通話,將成為中國移動面向未來的融合通信業(yè)務的基礎。中國移動總裁李躍透露稱,中國移動將于今年二季度完成五個城市VoLTE測試,三季度推動外場規(guī)模測試,計劃2015年全面啟動商用。
未來中國移動TD-LTE語音解決方案以VoLTE為主,同時要兼顧CSFB,雙待機作為一種終端形態(tài)將長期存在。其中VoLTE由IMS網(wǎng)絡實現(xiàn)呼叫控制,通過PCC架構(gòu)提供端到端的QoS保障。在移動到?jīng)]有TD-LTE覆蓋時,采用切換至GSM的方案實現(xiàn)語音業(yè)務連續(xù)性。
在現(xiàn)場的DEMO展示中,筆者發(fā)現(xiàn)了一個非常有趣的現(xiàn)象,在現(xiàn)場嘈雜的環(huán)境下,使用GSM通話,語音不清晰,效果非常的差,而使用VoLTE通話,能夠清晰的聽到每一個字,與GSM有著非常明顯的區(qū)別。
語音通話質(zhì)量的提高不僅僅是由于采用了VoLTE,最主要的原因在于這些移動終端清一色的采用了Audience的語音處理器。能夠為我們的通話質(zhì)量打來如此巨大的變化,我們不禁要問,Audience到底是一家怎樣的公司?
實現(xiàn)聽覺神經(jīng)科學商業(yè)化
據(jù)了解,Audience的創(chuàng)始人是研究員Lloyd Watts和電腦芯片專家Carver Mead。Watts曾就職于保羅?艾倫(Paul Allen)的智囊團Interval Research,研究音頻技術(shù),但該機構(gòu)于2000年關(guān)閉。后來Allen的伏爾甘風險投資公司(Vulcan Ventures)投資于Audience,Mead也曾加入Audience的董事會一段時間。
自2000年, Audience就開始研究如何復制和再現(xiàn)人耳感知聲音的方式。他們將這些生物學的知識輸入電腦模型中,并打造出了能夠處理并再現(xiàn)聲音的芯片,讓人們能夠聽見手機中傳來的語音。其技術(shù)以聽覺神經(jīng)為基礎,提升了移動語音體驗,同時亦提高了基于語言的服務質(zhì)量,改善了多媒體的音質(zhì)效果。
Audience高級語音技術(shù)是基于人類聽覺系統(tǒng)的逆向工程,以將其功能在片上系統(tǒng)上得以復制。在移動設備中,高級語音技術(shù)如同人耳,能夠復制從內(nèi)耳到大腦復雜的聽覺傳導通路,本能地聽到并辨識聲音、分離并強化語音信號、降低來自通話雙方的環(huán)境噪音。
“我們的愿景是有朝一日感官計算在消費類電子設備中的地位能夠得到顯著的提升。”Audience的CEO Peter Santos 告訴《連線雜志》,“談到先進的語音和聽覺輸入計算,我認為我們已經(jīng)走在了這個領(lǐng)域的最前端。”
事實上,去年Audience就宣布,與中國移動以及科大訊飛等公司合作研究開發(fā)語音處理技術(shù)標準規(guī)范,拓展TD-LTE智能終端市場。Audience與中國移動的合作包括建立語音實驗室、標準規(guī)范與測試,以及應用程序和生態(tài)系統(tǒng)的開發(fā),智能手機設置語音質(zhì)量、噪聲抑制和語音識別等智能手機規(guī)范。
不僅僅是中國移動,全球領(lǐng)先電信運營商中,AT&T、Verizon無線、Sprint、沃達豐和Orange等,也都是Audience的合作伙伴。
Audience的芯片已經(jīng)被眾多設備所采用,如三星Galaxy Note II、谷歌Nexus 10 平板電腦、摩托羅拉Razr I,以及最薄的安卓智能手機 BBK Vivo X1。Audience芯片出貨量已達2億多單位,有超過90多家客戶。
VoiceQ和MotionQ帶來的變革
在參觀Audience展臺時,中國區(qū)總經(jīng)理林明璋向我們介紹到:“VoLTE技術(shù)可以為用戶提供與過去相比有顯著提高的語音質(zhì)量,因為LTE能夠提供相當于過去兩倍帶寬的寬帶語音,使聆聽內(nèi)容更加豐富清晰。然而,增加的頻譜范圍同樣適用于背景噪音的傳輸。帶有Audience先進語音技術(shù)的VoLTE終端,支持寬帶語音和世界領(lǐng)先的降噪技術(shù),可以在提供飽滿的VoLTE高清語音體驗的同時,免除背景噪音的侵擾。”
借著此次展會,Audience還推出不間斷偵測智能語音和音頻解決方案Audience eS700系列處理器。 eS700系列產(chǎn)品由eS750系列智能音頻編解碼器(eS754、eS752)和eS700系列獨立語音處理器(eS704、eS702)組成。相較于之前的產(chǎn)品,Audience的高級語音功能現(xiàn)在新增加了一個重要功能,VoiceQ。該功能允許移動設備持續(xù)偵聽周圍動靜并按設置好的語音命令執(zhí)行,不再需要通過觸摸屏進行互動,可最大限度降低電池耗電。此功能是在今年早些時候舉行的CES 2014上推出的,同時推出的還有另外一個功能MotionQ。
MotionQ可以利用陀螺儀、磁力計、加速度計和壓力傳感器產(chǎn)生的信號提供環(huán)境信息,然后將這些信息運用于健康、導航和行為識別等應用,以及用于識別點擊、搖動、滑動等典型智能手機手勢。同時僅消耗不足5毫瓦的功率,這種功耗水平顯著低于其他運動處理器架構(gòu)。
Audience總裁兼首席執(zhí)行官Peter Santos表示:“高端智能手機必須支持不間斷偵測,才能隨時獲取語音指令并根據(jù)指令行事,同時還能持續(xù)跟蹤運動,這種能力特別適合跟蹤身體健康等的應用程序。我們的新型MotionQ技術(shù)結(jié)合VoiceQ技術(shù),能以極低的功耗為移動設備提供廣泛的環(huán)境感知能力,從而提供真正自然的用戶體驗。”
Audience的eS700最新產(chǎn)品,是該公司挺進移動市場的重要一步。它能在嘈雜的環(huán)境中提供經(jīng)強化的語音識別,對于手機通話和執(zhí)行語音任務都效果頗佳。
高級語音技術(shù)能夠為移動設備提供最新移動寬帶應用以提高設備音質(zhì),除了能夠強化音質(zhì)清晰度和音質(zhì)之外,最大的特點就是使用語音重建功能以達到風噪抑制的作用。
手機在有風的環(huán)境中使用的時候,由于風對于麥克風震動的干擾,使得麥克風無法正常采集與傳遞聲音,因此我們通話的音質(zhì)一直都是斷斷續(xù)續(xù)的。在使用了語音重建功能之后,語音處理器能夠?qū)Ⅺ溈孙L無法采集到的聲音部分智能補全,雖然不能達到百分百完美復原的效果,但是已經(jīng)可以保證正常通話了。
Audience大中華區(qū)戰(zhàn)略營銷總監(jiān)Fred Caldwell
Audience大中華區(qū)戰(zhàn)略營銷總監(jiān)Fred Caldwell表示:“中國正在成為智能手機領(lǐng)域的創(chuàng)新頂峰,能和中國移動等合作伙伴及大量中國客戶合作,我們感到非常榮幸。很高興看到4G-LTE終端領(lǐng)域的巨大創(chuàng)新,也很高興看到中國智能手機OEM廠商欣賞高級語音、智能音頻和運動處理等技術(shù)給移動用戶帶來的差異化體驗。”
通過中國移動展位的VoLTE演示我們不難發(fā)現(xiàn),采用Audience技術(shù)的移動終端的通話質(zhì)量與普通的移動終端有著天壤之別,使觀眾體驗到了VoLTE提供的更大頻率范圍打來的通話優(yōu)勢。雖然目前國內(nèi)采用該技術(shù)的移動終端還在少數(shù),但是據(jù)了解,隨著中國移動的推廣,今年年底,我們就能到見到大量采用該技術(shù)的產(chǎn)品,讓我們拭目以待吧!