語音識別市場夯,根據(jù)市調(diào)機構(gòu)Strategy AnalyTIcs研究指出,到2022年,預(yù)估全球消費市場將有超過六千兩百萬個裝置具備個人語音助理。為插旗此一市場,半導(dǎo)體業(yè)紛紛推出新一代解決方案。例如英飛凌(Infineon)結(jié)合雷達、MEMS麥克風和音頻處理器,進一步提升MESM麥克風語音識別效能;而意法半導(dǎo)體(ST)則是攜手語音接口和關(guān)鍵詞檢測算法開發(fā)商--Sensory,以及通訊無線芯片組解決方案供貨商DSP Group,共同開發(fā)高效語音檢測處理麥克風技術(shù)。
工研院IEK電子與系統(tǒng)研究組分析師呂佩如表示,語音助理目前相關(guān)服務(wù)雖仍處于起步階段,但隨著市場需求快速增長,未來將會滲透到智能家電、車載系統(tǒng),甚至更多物聯(lián)網(wǎng)設(shè)備中的應(yīng)用。目前半導(dǎo)體廠商、電信商等欲投入語音識別市場的業(yè)者,除積極發(fā)展相關(guān)應(yīng)用之外,如何提升語音識別效能,也是未來重點發(fā)展方向。
為此,半導(dǎo)體業(yè)者加速布局。 英飛凌結(jié)合雷達、硅麥克風傳感器,以及XMOS的音頻處理器,透過音頻波束成型加上雷達目標存在偵測技術(shù),以提供遠場語音擷取功能,確保各種廣泛的語音控制裝置能夠進行理想的聲音辨識,以執(zhí)行數(shù)字語音協(xié)助功能,進而改善多人談話時,MESM麥克風無法精確辨識語音來源的位置,也無法與物體所發(fā)出的雜音作分離之困境。
據(jù)悉,英飛凌的60GHz 2Tx/4Rx雷達IC搭配隨附的天線與70dB SNR麥克風,將有助于克服這些障礙。此麥克風采用該公司的雙背板MEMS技術(shù),適用于遠場語音擷取和波束成型。此外,麥克風的SNR獲得改善,也將進一步增強效能;而XMOS的音訊處理器會分析來自該公司數(shù)字麥克風數(shù)組的訊號數(shù)據(jù),并調(diào)整每個麥克風提供的角度和距離數(shù)據(jù),在雷達數(shù)據(jù)辨識的角度形成波束。透過雷達與XMOS波束成型器的組合,即使物體正在移動且有模糊的雜音,麥克風也能精準將目標鎖定于特定物體。
另一方面,意法則是攜手DSP Group與Sensory,發(fā)表高效語音檢測處理麥克風之技術(shù)。該款組件在微型系統(tǒng)級封裝(SiP)內(nèi)整合意法的低功耗MEMS麥克風、DSP Group的超低功耗語音處理芯片,以及Sensory的語音識別韌體,透過該公司先進封裝技術(shù)取得輕量型封裝、較長續(xù)航時間和先進的功能。
同時,新款麥克風采用DSP Group的HDClear低功耗音頻處理芯片,可大幅降低能耗,并將電池供電設(shè)備的續(xù)航時間延長多年,毋須充電或更換電池;且系統(tǒng)立即執(zhí)行命令,毋須預(yù)先識別命令,語音命令響應(yīng)速度將更為迅速。