Synaptics語音及音頻技術(shù),推動下一次人機交互新革命
隨著可穿戴設(shè)備、智能家居、物聯(lián)網(wǎng)等領(lǐng)域在科技圈的大熱以及落地,全面打造智能化的生活成為了接下來的聚焦點,而人機交互方式會逐漸成為實現(xiàn)這種生活的關(guān)鍵環(huán)節(jié)。
比如終端用戶希望設(shè)備有更好、更簡單的使用體驗,這就涉及到簡化人機界面。SynapTIcs作為人機界面廠商,致力讓人與智能設(shè)備的交互更加簡單,在過去幾個月中SynapTIcs收購科勝訊和Marvell的多媒體部門,加速了在人機界面領(lǐng)域布局。
SynapTIcs CEO Rick Bergman
SynapTIcs CEO Rick Bergman指出,“目前Synaptics有很多決定性的支柱技術(shù),包括電容式傳感技術(shù)、顯示驅(qū)動和集成的傳感技術(shù)、視頻和圖像處理技術(shù)、光學成像技術(shù)、遠場語音和語音采集技術(shù)和聲學及音頻輸出處理技術(shù)。不過實際上,我們的征程才剛剛開始。這些技術(shù)幫助整個市場革新人機界面體驗,也幫助全新的設(shè)備類型更加豐富我們每個人的生活。”
了解的工程師可以發(fā)現(xiàn),在前幾年Synaptics只有一個支柱技術(shù),即電容式傳感技術(shù)。最早應用在筆記本電腦中,三年前收購了Renesas SP Drivers,幫助Synaptics拓展了顯示技術(shù)。同一時期,Synaptics內(nèi)部也投入了對光學成像技術(shù)的研發(fā),光學技術(shù)也將應用在指紋技術(shù)中。
當整個產(chǎn)業(yè)向前發(fā)展的時候,語音也作為關(guān)鍵的人機界面在快速成長,也直接讓Synaptics決定收購科勝訊和Marvell的多媒體部門。Rick Bergman表示,希望通過它們在技術(shù)方面幫助Synaptics成長,完整了人機界面的支柱技術(shù),提供了遠場語音和語音采集技術(shù)、聲學及音頻輸出處理技術(shù)以及視頻和圖像處理技術(shù)。
并提到未來Synaptics目標市場。除了電腦、手機和車載這三個市場,消費互聯(lián)網(wǎng)市場是Synaptics的四大目標市場之一,也是目前世界上最大的市場。消費互聯(lián)網(wǎng)市場有很多不同的產(chǎn)品,每年都有30億解決方案的機會。
成立新物聯(lián)網(wǎng)部門,立足三個主要業(yè)務在物聯(lián)網(wǎng)重要的組成部分中,Synaptics已經(jīng)擁有了語音、生物識別、觸控、顯示、處理和成像的技術(shù)。在當前新物聯(lián)網(wǎng)部門有三個主要業(yè)務,包括VideoSmart™,ImagingSmart™和AudioSmart®,AudioSmart®部門來自于科勝訊,ImagingSmart™技術(shù)主要關(guān)注成像技術(shù),還有一個是VideoSmart™,就是在視頻方面的技術(shù)。
Synaptics副總裁兼語音和圖像部門總經(jīng)理Saleel Awsare
Synaptics副總裁兼語音和圖像部門總經(jīng)理Saleel Awsare指出,“在被并購之后的四個月中,Synaptics成立了新的物聯(lián)網(wǎng)部門,專門面向消費物聯(lián)網(wǎng)市場。這一部門包含了三個主要組成部分,其中一個是科勝訊業(yè)務;第二部分是Marvell多媒體部門,為我們帶來了圖像和視頻處理能力;第三部分是Synaptics原有的視頻界面部門?,F(xiàn)在這三部分合并組成了新的物聯(lián)網(wǎng)團隊。通過新團隊的組成,我們添加了語音、圖像和視頻處理的能力,更擴大了客戶群。而且新團隊的組成也讓我們可以進入AI市場。”
通過對科勝訊、Marvell的整合,以及Synaptics原有的技術(shù),現(xiàn)在Synaptics在物聯(lián)網(wǎng)領(lǐng)域的專利已經(jīng)超過了700個,其中包含人工智能算法、還有機器學習/神經(jīng)網(wǎng)絡(luò),另外還有我們在市場中最主要的差異化技術(shù),也就是遠場語音。
提供兩種不同語音方案,推動人機界面的發(fā)展現(xiàn)在智能音箱很多采用的是語音控制,事實上語音技術(shù)可以適合多產(chǎn)品中,接下來將會有三十至四十個采用Synaptics技術(shù)的產(chǎn)品陸續(xù)上市。Saleel Awsare表示,Synaptics在語音技術(shù)上有兩個不同的解決方案,一個是遠場的語音解決方案,一個是個人語音解決方案。
1、在遠場語音交互技術(shù)方面。收購的科勝訊從2012年就開始進行研發(fā)并推出了首款產(chǎn)品,在語音交互市場還遠不成熟的時候,就在遠場語音方面投入了大量的資金用于研發(fā)。目前遠場語音解決方案出貨量已經(jīng)超過了3000,被用于各種類型的設(shè)備。而且遠場語音支持用戶在5-6米距離內(nèi)對設(shè)備進行語音操控。
2、在個人語音解決方案方面,引領(lǐng)耳機從模擬化到數(shù)字化的轉(zhuǎn)型?,F(xiàn)在很多新的手機是沒有耳機接口的,因為手機沒有耳機接口,所以需要提供數(shù)字接口,因而衍生出眾多數(shù)字化的產(chǎn)品和技術(shù)。Synaptics是全世界擁有這個技術(shù)解決方案的極少數(shù)供應商之一。
Saleel Awsare談到,與遠場語音技術(shù)一樣,科勝訊對個人語音解決方案的投入從三四年前就開始了,隨著解決方案的成功和市場的不斷發(fā)展,現(xiàn)在有越來越多的廠商開始拿掉了耳機接口,在這一市場也擁有極大的優(yōu)勢,并在這一市場已經(jīng)有超過5000萬產(chǎn)品USB和USB-Type C產(chǎn)品出貨。
從遠場語音的市場來看,目前在2017年全世界只有1600萬臺AI語音助手出貨。但IDC的研究報告指出,在2020年前,這個數(shù)據(jù)將會達到1.5億,增長達110%。在亞馬遜的Alexa這個市場上已經(jīng)投入了很多。Synaptics是唯一一個可以提供兩個麥克風和四個麥克風解決方案的廠商。
在AI產(chǎn)品中,Synaptics的AudioSmart® 產(chǎn)品位于麥克風和揚聲器之間,通過語音處理優(yōu)化語音辨識和設(shè)備輸出性能?;旧蠌募夹g(shù)上來講,算法里面有跟大部分廠商不同的是有一個盲源分離的技術(shù)。此外,還支持回聲消除,而且回聲消除是跟盲源分離緊密結(jié)合在一起的。在技術(shù)層面上有辦法得到音響播放音樂時返回的信號,有辦法用這兩種技術(shù)結(jié)合在一起之后,即使在音響很大聲的時候,也可以把回聲有效的處理掉。
Saleel Awsare表示,未來重點將集中在消費物聯(lián)網(wǎng)市場,這是一個將達到每年數(shù)十億體量的市場。并指出對目前的趨勢感到格外興奮,因為從5年前就開始投入研發(fā)語音界面,現(xiàn)在隨著市場的成熟發(fā)展,也和這一市場中的每一家公司都展開了合作。相對于成熟的PC和智能手機市場,消費物聯(lián)網(wǎng)市場才剛剛起步,未來還有廣闊的發(fā)展空間。對此,Synaptics已經(jīng)做好充分的準備,將繼續(xù)推動人機界面的發(fā)展。