我們所說的“語音”是什么意思?一文讀懂語音識別技術
基于語音的技術將對許多行業(yè)產(chǎn)生巨大影響,在短短兩年內(nèi),預計50%的搜索將基于語音技術。
該項技術的普及率可能因用戶的年齡、地理位置和讀寫能力而有所不同,但一些市場和平臺已擁有很高的滲透率,而全球10%的搜索已經(jīng)是基于語音的搜索。
在這一領域將會出現(xiàn)新的贏家和輸家,而現(xiàn)有品牌將需要考慮到在收購過程中失去對消費者對話的控制的影響,這加大了在競爭中脫穎而出的難度。
然而,語音界面為各品牌提供了前所未有的機會,讓它們能以一種極為強大的新方式與消費者進行互動,而目前來說,很少有品牌利用到了這一點。
當前廣泛使用的功能在范圍和用途上均受到限制。就開發(fā)創(chuàng)新的內(nèi)容和體驗,以及全新的服務來說,現(xiàn)下各品牌仍有機會。
那些能在此情景下崛起的品牌,在提升市場份額方面處于有利地位。此外,市面上有許多工具,讓用戶可以用最低限額的投資來輕松地進行語音實驗。
我們的建議是盡快開始一項服務設計和聲音試驗的低投資計劃,可能還要與市場推廣活動相結合,以便讓你的品牌充分利用這項技術所帶來的機遇。
我們所說的“語音”是什么意思?
在本文的語境中,我們對“語音”的定義是自動化的語音服務。它涵蓋了從交互式文字到實用工具內(nèi)的所有信息,內(nèi)置于定制的硬件設備,以及手機和云端應用內(nèi)的各種應用,可通過品牌產(chǎn)品或人工智能行業(yè)內(nèi)的幾大公司的虛擬助手來進行訪問。
很多關于基于語音的技術的宣傳都圍繞著智能音箱的普及(75%的美國家庭預計在2020年均擁有智能音箱),以及音響附帶的“語音助手”?,F(xiàn)在已有幾個公司允許第三方直接整合旗下的智能助理,有點像智能手機上的應用。
此外,需要注意的是,不論是上文提及的還是其他語音助手也可以在其他硬件(通常是手機和平板電腦)上使用,人們可通過手機應用和深度操作系統(tǒng)集成來使用,但也可以通過定制硬件設備,甚至是網(wǎng)站來使用語音助手。
從許多方面來看,語音和機器人背后的技術都是一樣的,但二者之間在生態(tài)系統(tǒng)和影響這兩方面的差異足以使語音技術成為一個非常重要的領域。
語音簡史
基于語音的交互界面已經(jīng)存在了幾十年,盡管它們最具影響力的方面一直是客戶服務電話。大多數(shù)與語音相關的系統(tǒng)都遭遇了各種各樣的問題,從語音識別到復雜的生態(tài)系統(tǒng)。
五年前,行業(yè)領先的語音識別技術的準確率僅為75%左右,機器學習技術、系統(tǒng)和硬件的最新發(fā)展,使得最好的語音識別系統(tǒng)的準確率提高到了95%到97%。
不斷接近并跨過這一認知門檻成了當前語音產(chǎn)業(yè)繁榮的最大因素。人類識別口語詞匯的準確率約95%,并能使用語境來糾正錯誤。對于大多數(shù)用戶來說,任何具有較低識別準確率的自動化系統(tǒng)都會讓他們失望,因此這在商業(yè)上并不可行。
機器學習在意圖推導方面的相關發(fā)展(后文另作解釋),這也是產(chǎn)業(yè)繁榮的一個巨大貢獻因素。幾年前,這一功能的商業(yè)系統(tǒng)已經(jīng)跨過了類似的門檻,并推動了機器人產(chǎn)業(yè)的繁榮;語音其實就是無文字版本的機器人。
機器人本身也已經(jīng)存在了幾十年,但處理自然語言的能力,而不是簡單地識別關鍵字,才帶來了基于對話的互動,這反過來又推動了相關平臺和服務近期的爆炸式增長。
在當前的語音技術領域,虛擬自動化助理的崛起首屈一指。盡管Siri(以及其他一些不太知名的語音助理)已經(jīng)推出多年,但Alexa和谷歌助理的崛起預示著一種更廣泛的平臺方式。
這些新出爐的助手會在一系列設備上推廣整個生態(tài)系統(tǒng)和功能,Alexa可以控制你的燈光,告訴你當天的會議是什么,并幫助你烹飪食譜上的菜品。
語音技術只是炒作嗎?
當然不是。的確,人們對語音技術的大肆宣傳,就像之前的3D打印和其他“改變我們生活方式的技術”的過度炒作一樣,但通過語音界面與計算機進行互動的趨勢將會持續(xù)下去。
除此之外,還有一系列極具說服力的統(tǒng)計數(shù)據(jù),例如,超過20%的移動搜索已經(jīng)是基于語音的搜索,并且,預計到2020年,這一比例將上升到50%?;蛟S更有趣的是,這些統(tǒng)計數(shù)據(jù)背后有一些原因也許更值得我們?nèi)ヌ接憽?/p>