隨著移動互聯(lián)網(wǎng)和人工智能的發(fā)展，智能家電的在線語音交互技術(shù)也在不斷完善

時(shí)間：2020-07-07 18:09:02

關(guān)鍵字：人工智能智能家電語音交互

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 隨著移動互聯(lián)網(wǎng)和人工智能的發(fā)展，基于語音的交互已經(jīng)越來越重要、也越來越普及，從目前技術(shù)水平來看，在安靜環(huán)境、標(biāo)準(zhǔn)口音、常見詞匯上的語音識別率已經(jīng)超過95％，完全達(dá)到了可用狀態(tài)，由此也奠定了語音交

隨著移動互聯(lián)網(wǎng)和人工智能的發(fā)展，基于語音的交互已經(jīng)越來越重要、也越來越普及，從目前技術(shù)水平來看，在安靜環(huán)境、標(biāo)準(zhǔn)口音、常見詞匯上的語音識別率已經(jīng)超過95％，完全達(dá)到了可用狀態(tài)，由此也奠定了語音交互功能被廣泛應(yīng)用在包括智能手機(jī)、智能音箱、智能家電等等各種各樣設(shè)備中的技術(shù)基礎(chǔ)。

在線語音交互痛點(diǎn)：依賴網(wǎng)絡(luò)和延遲大

不過，目前語音交互技術(shù)的使用還是離不開網(wǎng)絡(luò)和云端。從技術(shù)層面上看，一個(gè)完整的智能語音交互閉環(huán)的系統(tǒng)，包括語音信號采集和預(yù)處理（降噪、回聲消除）、后端語音識別、自然語音處理（理解、決策、表述）、語音合成等各個(gè)模塊。其中語音識別到語音合成過程需要較大的數(shù)據(jù)量和計(jì)算量，往往會被放到云端去處理。

無論是現(xiàn)今市場火爆的智能音箱還是各大家電廠商推出的智能冰箱、智能電視，采用的是語音交互大多數(shù)都是上述這種在線語音交互方案，所以設(shè)備在使用前往往需要借助智能手機(jī)將智能音箱連接網(wǎng)絡(luò)。深圳市木瓜電子科技有限公司技術(shù)支持工程師邱松曉指出，在智能家居、智能硬件中使用語音交互，替代遙控器，可以解放用戶雙手，帶來很多便捷性，但是，目前使用在線語音交互功能還需要先解決一些現(xiàn)有存在的缺點(diǎn)。

“在線的語音交互依賴于云端去處理，設(shè)備的前端往往只做聲音的采集、回聲消除和噪聲抑制等處理后，就通過網(wǎng)絡(luò)送入云端做語音識別和處理，處理后的結(jié)果又在通過網(wǎng)絡(luò)返回回到設(shè)備中，這其中就有產(chǎn)生兩個(gè)問題：首先，一旦網(wǎng)絡(luò)出現(xiàn)問題，語音交互功能就很有可能癱瘓；其次，就算在網(wǎng)絡(luò)狀態(tài)好的情況下，設(shè)備的響應(yīng)速度還是不盡理想，舉例來說，前端語音處理約50ms，通過網(wǎng)絡(luò)需要約100ms，云端處理約500ms，還有延遲，再返回，加起來估計(jì)是1S到2S，特別是國內(nèi)的網(wǎng)絡(luò)不穩(wěn)定的情況下，有可能時(shí)間會更長。”

“此外，在線語音交互方案往往需要一個(gè)喚醒詞，在說出喚醒詞，等設(shè)備做出相應(yīng)的回應(yīng)后，才可以開始與智能設(shè)備對話，體驗(yàn)不是很好?！?”邱松曉說到。邱松曉和其公司一直在從事語音交互技術(shù)方案的開發(fā)，也給客戶做過不少在線語音交互的方案，不過目前，他們也把不少精力放在一種更為簡化的離線語音方案上。此模塊方案可以實(shí)現(xiàn)單麥遠(yuǎn)場語音拾取、語音喚醒、回聲消除、智能控制及語音播報(bào)等功能。

離線語音方案優(yōu)勢在于實(shí)時(shí)和成本

離線語音方案，顧名思義就是語音識別處理在本地，并不需要上傳到云端去處理?！耙钥刂瓶照{(diào)為例，我們先將‘請開空調(diào)’、‘調(diào)高一度’等命令詞經(jīng)過算法訓(xùn)練和模型匹配后固化在本地存儲中，當(dāng)進(jìn)行語音控制時(shí)不需要聯(lián)網(wǎng)，在本地存儲直接調(diào)用?！鼻袼蓵哉f到，“相比在線方式，離線的方式確實(shí)有局限，這類方案更多屬于控制型的，不是交互型；而且由于本地的存儲空間有限，不像在線方案是通過云端處理，所以命令詞確實(shí)會比在線的少，一般命令詞條在幾十條左右?！?/p>

集成了離線語音模塊的設(shè)備可以通過語音來控制執(zhí)行一系列的操作指令，不過只是不能像智能音箱一般進(jìn)行查詢天氣、新聞、講故事、對話等交互。在智能音箱等在線語音方案如此火爆的情況下，木瓜電子同時(shí)也選擇了做離線方案，除了考慮到前面提到的在線方案的不足外，其實(shí)更多是市場真正需求的使然。

一方面，包括亞馬遜、京東、阿里、騰訊等都推出了智能音箱，用智能音箱控制和連接家電，希望想通過此類產(chǎn)品搶占智能家居入口；另一方面，各大家電巨頭也紛紛布局自己的智慧家庭生態(tài)，加入語音交互、AI等功能。無論是何種方式，智能家居要落地可能還需要一段較長時(shí)間，因?yàn)檫@其中涉及到一整個(gè)云端平臺和生態(tài)的打造，由某一家公司掌控或打通可能還是比較難的。“這樣我們是否就不能享受像智能家居中語音控制家電的便利呢？，其實(shí)家庭中很多設(shè)備，包括空調(diào)、窗簾、燒水壺、晾衣架、臺燈等等，并不一定需要語音交互，我們只是需要去簡化他們的控制方式，例如用語音控制來替代遙控方式，賦予一款產(chǎn)品具備被語音控制的能力，從而更高效解決用戶需求?！鼻袼蓵员硎尽?/p>

對于這些僅僅需要語音控制而不需要交互的設(shè)備，用離線的方案或許更為合適。首先，離線智能語音交互模塊由于沒有了網(wǎng)絡(luò)傳輸?shù)臅r(shí)間損耗，語音交互的實(shí)時(shí)性更高，據(jù)了解識別過程只需要200ms，命令發(fā)出馬上可以做出反應(yīng)，基本感覺不到延遲，用戶體驗(yàn)好；其次因?yàn)闊o需配網(wǎng)，離線智能語音交互模塊具備用戶開機(jī)即用的屬性，無需教育用戶。同時(shí)不存在網(wǎng)絡(luò)異常的意外情況，使用友好度非常高。再者，成本更低，與在線方案十幾美金的成本相比，離線的方案只需幾美金；而且，離線方案的目標(biāo)市場更多是單品，不涉及云端網(wǎng)絡(luò)或數(shù)據(jù)安全問題，產(chǎn)出會快很多。

通過不斷模型訓(xùn)練和測試，離線方案識別率可達(dá)95％

不過離線語音往往被認(rèn)為是相對在線語音識別定位更為低端的應(yīng)用，但是在技術(shù)上做到“離線語音識別”其實(shí)并不簡單?！拔覀兂３Ｕf‘臺上一分鐘，臺下十年功’，對離線識別來說，也正正是這樣。在將聲音送入到設(shè)備之前，同樣也需要做語音的遠(yuǎn)場拾音、降噪、回聲消除等處理，將處理干凈的聲音就會和本地的模型進(jìn)行匹配，如果匹配就執(zhí)行動作。整個(gè)過程看似簡單，但是在命令詞的模型建立也需要花費(fèi)不少功夫。” 上?；栃畔⒖萍加邢薰救A南區(qū)銷售總監(jiān)孔令亞說到，“離線的方案需要給每一個(gè)命令詞建立一個(gè)匹配模型，每一個(gè)詞會錄入至少800個(gè)左右的樣本，樣本經(jīng)過不停的訓(xùn)練、模型匹配和測試，只有通過測試這個(gè)模型才定下來，放到內(nèi)存中。外界發(fā)出一條指令，就會和本地的模型進(jìn)行匹配，如果匹配才能執(zhí)行動作。目前我們可以做到200多條命令詞，不過一般應(yīng)用場景在十幾天到幾十條就已經(jīng)足夠了?！?/p>

此外，離線方案在一些指令或詞條的識別率甚至可做到比在線的高，例如互問信息離線語音控制模塊在家居環(huán)境下達(dá)到了95％識別率、2次／天的誤觸發(fā)?？琢顏喗忉尩?，因?yàn)閺臉颖竞陀?xùn)練的數(shù)據(jù)量來看，建立模型的出發(fā)點(diǎn)就不一樣。離線的每一個(gè)詞條是專門花和時(shí)間去優(yōu)化。而在線的不會去這么做，中國的語言量這么豐富，方言這么多，這個(gè)工作量就非常大。例如‘請開門’這個(gè)指令／詞條，在線的方案不會專門去建立這樣的一個(gè)指令樣本和模型去進(jìn)行訓(xùn)練匹配，因?yàn)楣ぷ髁刻箅y以實(shí)現(xiàn)。。所以在線的語音識別是針對字或句，而不是詞條，如果說一個(gè)‘打’字，在線方案可能很快可以識別，但是如果說‘打開門’，語速快些或帶有情感，因?yàn)闆]有這個(gè)詞條的大量樣本訓(xùn)練，很有可能就會誤判或識別慢。。

“為達(dá)到95％識別率、2次／天的誤觸發(fā)，我們要求每個(gè)語音命令詞都有800人左右的樣本，在聲音訓(xùn)練過程中，不斷調(diào)整命令詞的語音模型，這些訓(xùn)練樣本中也包含了多個(gè)地方性的普通話，如廣東地區(qū)、湖南地區(qū)、河南地區(qū)、北京地區(qū)等普通話?！彼f到，“我們生成一個(gè)命令詞的時(shí)間需要6周左右的時(shí)間，前4周時(shí)間樣本采集和訓(xùn)練，后兩周時(shí)穩(wěn)定性測試。互問提供的語音命令詞，在國內(nèi)使用幾乎是沒有存在太多問題，95％的識別率也是目前比較高的參數(shù)了?！?/p> 離線方案潛在市場或?qū)㈤_啟，下半年將陸續(xù)出貨

“目前我們方案還沒有完全推開，可以看到大家近端時(shí)間關(guān)注點(diǎn)都集中在智能音箱上，其實(shí)離線也是一個(gè)潛在的市場，與智能音箱也不算是競爭關(guān)系，大家各有應(yīng)用場景。智能音箱去做交互都還可以理解，但是去控制一個(gè)家電的時(shí)候，這個(gè)過程還是比較復(fù)雜的，涉及到很多問題，生態(tài)問題，云平臺問題、安全問題?！鼻袼蓵苑治稣f，“像空調(diào)、燒水壺、臺燈、目前還沒有涉及到和家電深度交流，這是機(jī)器人需要去做的事情，沒有人會想和空調(diào)去聊天。未來如果把計(jì)算機(jī)的能力集成到家電中，你靠近了家電就能感知判斷出你想干什么，這是真正的智能的，但是目前還沒有人能做到這一塊，也沒什么人愿意去做，成本和用戶體驗(yàn)都是一道坎。所以目前大家的訴求就是加個(gè)語音控制，多了一種控制的方式，成本也不會提高很多，但是卻解決需要到處找遙控器的痛點(diǎn)，對消費(fèi)者來說，達(dá)到方便舒適的功能就可以，不會去追求超前技術(shù)?！?/p>

離線識別方案其實(shí)早就有出現(xiàn)，不過因?yàn)樽R別率等問題一直沒有鋪開。早在一兩年前還是85％左右的識別率，隨著技術(shù)的發(fā)展，目前離線語音在家居環(huán)境中可以達(dá)到了95％，而且可以做到5m距離的遠(yuǎn)場拾音、高語音識別率，低誤觸發(fā)率讓這一方案進(jìn)入家庭、開啟市場成為可能。

孔令亞指出，消費(fèi)者的操作習(xí)慣、市場的需求和聲音技術(shù)的積累，都是決定離線語音控制產(chǎn)品的市場發(fā)展的因素。近些年聲音技術(shù)公司的涌出，聲音信號處理技術(shù)提升和聲音樣本的積累，實(shí)現(xiàn)了離線語音識別率的提高，也就提升了用戶體驗(yàn)，使用說話的方式去控制設(shè)備，必然會得到消費(fèi)者喜歡。國內(nèi)能夠提供商業(yè)性的離線語音控制方案的廠商僅幾家，并且前幾年這幾家公司都重點(diǎn)去投入在線語音識別和聲音相關(guān)的內(nèi)容服務(wù)。所以離線語音控制方式的市場打開進(jìn)度也受到一定的限制。但是離線語音控制方案的市場近期必然會被打開，離線語音控制方案成本低、量產(chǎn)速度快，控制準(zhǔn)確率高。離線語音控制方案以輕量級方式進(jìn)入到各個(gè)產(chǎn)品中，而不會像在線語音識別那樣生態(tài)系統(tǒng)復(fù)雜。

從市場反饋上看，目前家電廠商對這種方案的接受程度還是比較理想的。據(jù)了解，現(xiàn)在市場存貨量已經(jīng)超過百萬級別，并且目前離線語音控制的聲控臺燈、晾衣架、燒水壺等已經(jīng)在量產(chǎn)出貨，在接下來的一年內(nèi)，消費(fèi)者將在空調(diào)、抽煙機(jī)、風(fēng)扇、家居控制面板、按摩儀、故事機(jī)、空氣凈化器，熱暖器，熱水器等產(chǎn)品中都可以體驗(yàn)到，互問信息的模塊都已經(jīng)切入到國內(nèi)這些產(chǎn)品生產(chǎn)商進(jìn)行項(xiàng)目配合。

“我們的離線模塊也是去年才開始推出，在之前有儲備很多研究和設(shè)計(jì)?？蛻裟玫綐颖緶y試到生產(chǎn)，可能需要半年到一年時(shí)間不等，所以還沒有那么快有典型的產(chǎn)品出來，預(yù)計(jì)今年下半年就有成品陸續(xù)出貨。接下來一年出貨量肯定不止1KK?！鼻袼蓵詫τ谑袌銮熬靶判臐M滿。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時(shí)聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅(qū)動方式相比，共陰恒流驅(qū)動在能效有哪些優(yōu)勢

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字：驅(qū)動電源

[電源]

工業(yè)電機(jī)驅(qū)動電源設(shè)計(jì)：反電動勢抑制與過流保護(hù)的集成方案

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下，工業(yè)電機(jī)作為核心動力設(shè)備，其驅(qū)動電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動勢抑制與過流保護(hù)是驅(qū)動電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié)，集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動性能的關(guān)鍵。

關(guān)鍵字：工業(yè)電機(jī) 驅(qū)動電源

[電源]

如何解決 LED 驅(qū)動電源的易損壞問題

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而，在實(shí)際應(yīng)用中，LED 驅(qū)動電源易損壞的問題卻十分常見，不僅增加了維護(hù)成本，還影響了用戶體驗(yàn)。要解決這一問題，需從設(shè)計(jì)、生...

關(guān)鍵字：驅(qū)動電源照明系統(tǒng) 散熱

[電力電工電路]

LED設(shè)計(jì)中LED驅(qū)動電源的公式

根據(jù)LED驅(qū)動電源的公式，電感內(nèi)電流波動大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字： LED 設(shè)計(jì) 驅(qū)動電源

[汽車電子]

EV主驅(qū)IGBT隔離驅(qū)動電源方案選擇問題探討

電動汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機(jī)驅(qū)動控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動系統(tǒng)中的關(guān)鍵元件，其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字：電動汽車新能源驅(qū)動電源

[電源]

合理的驅(qū)動電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設(shè)中，街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分，其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步，高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關(guān)鍵字：發(fā)光二極管驅(qū)動電源 LED

[消費(fèi)電子]