智能音箱是交互的革命,語音交互會是智能家居最理想的實現(xiàn)方式嗎?
繼阿里、小米、百度、獵豹移動等企業(yè)之后,騰訊于4月17日發(fā)布了其首款智能音箱——騰訊聽聽。4月20日,該款音箱將正式上線京東平臺,并公布具體定價。相比于走低價跑量路線的天貓精靈和小米智能音響,騰訊聽聽主打音質(zhì),定位將在千元左右。
目前市場上出現(xiàn)的智能音箱,價格上下浮動的空間非常大,從蘋果HomePod的349美元(折合人民幣約2200元),到天貓精靈打折時的99元,各家音箱的定價策略有著巨大的區(qū)別??梢钥吹剑F(xiàn)在幾乎大多數(shù)智能音箱的價格都集中在399、499、599的價格上,作為一臺音箱,這個價格可以說非常“互聯(lián)網(wǎng)”了。
而這樣定價的目的也非常明顯,那就是快速積累更多原始用戶,將自家在行業(yè)中的影響力推廣出去、放大,占據(jù)這一未來的“流量入口”。隨著人工智能的不斷發(fā)展,誰能夠搶占智能音箱市場,就能通過語音交互系統(tǒng)掌握整個智能家電市場、完成對智能家居的布局不僅僅意味著廠商對智能家居的掌控,更能夠通過智能交互系統(tǒng)掌握更多消費習慣,這里面蘊藏的是一個巨大的金礦。
智能家居與其說是連接的革命,不如說是交互的革命。那么,語音交互是否有望提高智能家居用戶的接受度呢?一切并沒有想象中的簡單,智能生活方式的普及還有很長一段路要走。眾所周知,如今的智能家居產(chǎn)品面臨著消費者不買賬的尷尬窘境。究其原因:消費者認為如今的智能家居產(chǎn)品操作過于復(fù)雜,戴著“偽智能”的帽子,導致用戶體驗不佳。此外,語音交互系統(tǒng)還面臨著許多技術(shù)性難題,例如語音交互的“智能化”和“人性化”。
從當前的語音識別技術(shù)發(fā)展看來,基礎(chǔ)理論和技術(shù)框架已經(jīng)基本成熟,目前主要是基于深度神經(jīng)網(wǎng)絡(luò)的識別架構(gòu),再加上大規(guī)模的真實數(shù)據(jù)訓練。目前在手機端的近講語音識別錯誤率可以做到3%以內(nèi),在電話語音識別錯誤率可以做到6%以內(nèi),基本上接近或超過人工識別的水平。語義理解和知識圖譜等認知技術(shù),目前還沒有形成通用的技術(shù)框架,主要是針對具體垂直領(lǐng)域進行優(yōu)化,這部分有待突破性進展。
目前,近場識別技術(shù)目前已經(jīng)比較成熟,現(xiàn)在手機上使用的語音輸入功能就屬于近場識別技術(shù),用戶必須在離手機比較近的距離內(nèi)說話,但在智能家居環(huán)境中,用戶和智能終端之間的距離被大大增加了,用戶能隨意用語音控制智能家居的一個必要條件就是在無論你在客廳哪個角落發(fā)出指令,設(shè)備都能準確的識別,語音識別技術(shù)必須突破距離的障礙。
此外,現(xiàn)在的物聯(lián)網(wǎng)設(shè)備,大到汽車、空調(diào)、機器人,小到玩具、穿戴設(shè)備等,有大有小、有帶屏幕和不帶屏幕、涉及不同的應(yīng)用領(lǐng)域,交互方式差異非常大,需要針對性優(yōu)化語義理解和知識圖譜。
語音交互是否是智能家居最理想的實現(xiàn)方式?有待商榷,智能家居更理想的實現(xiàn)方式是無需用戶參與控制,依靠大數(shù)據(jù)實現(xiàn)智能云平臺自動學習和感知用戶的需求和習慣,自動控制所有涉及的設(shè)備。這是一個設(shè)想,在技術(shù)未歸位前,也許語音聲控是智能家居現(xiàn)階段最佳實現(xiàn)方式。