語音巨頭時代來臨!誰將是中國Siri?
21ic通信網(wǎng)訊,如今,語音技術(shù)已經(jīng)成為巨頭的標(biāo)配,百度、騰訊、搜狗、云知聲它們或是傳統(tǒng)互聯(lián)網(wǎng)巨頭,或是出身中科院技術(shù)豪門。巨頭占領(lǐng)語音高點已是必然。而從去年開始語音市場受到業(yè)界關(guān)注,到今天云知聲獲得千萬美金融資,語音市場春天是否已經(jīng)到來?創(chuàng)業(yè)者在其中是否仍有機會?看看作者怎么說。
大約一年前,中國移動以13.6億人民幣的代價獲得了科大訊飛15%的股權(quán),后者股價一路攀升,從不足30元到最高61元,成為一大牛股,市值高達240多億人民幣。而在剛剛過去的長假中,“云知聲”也高調(diào)宣布獲得金額為千萬美金折合約1億元人民幣A輪融資。雖然其體量尚無法和科大相比,但這對沉寂一年的語音識別市場卻是重大利好。
而同樣涉足該領(lǐng)域的百度、騰訊、搜狗也正在加快技術(shù)迭代的腳步,作為戰(zhàn)略級標(biāo)配,語音技術(shù)在巨頭眼中都格外重要。與國外巨頭占領(lǐng)語音市場相似,業(yè)內(nèi)普遍認(rèn)為,受技術(shù)門檻的限制,語音市場創(chuàng)業(yè)窗口或已關(guān)閉。只屬于巨頭的語音戰(zhàn)國大幕拉開!
Siri成國內(nèi)語音市場爆發(fā)導(dǎo)火索
自從蘋果Siri推出后,語音市場獲得了高度關(guān)注。人們甚至驚呼這種更自然的操控將取代鍵盤。一時間跟隨者紛紛入局。蘋果勁敵Google帶著Google Now強勢殺入,憑著搜索技術(shù)特長和數(shù)據(jù)積累,在交互效果上略勝一籌。備受關(guān)注的Google Glass便由“Ok Google”這一酷極了的語音方式啟動。
國內(nèi)互聯(lián)網(wǎng)公司百度、騰訊、盛大和搜狗均推出語音相關(guān)產(chǎn)品。搜狗在去年11月便推出了語音助手,其語音識別技術(shù)采用的正是“云知聲”。而采用自有語音識別技術(shù)的百度,在去年圣誕節(jié)期間才推出語音助手,比搜狗晚了1個月。
騰訊在語音市場上則保守許多,微信發(fā)家于語音對講機,可天然地移植到語音助手。但除了在4.5推出“語音提醒”公眾號外,并未加強其他語音識別功能。這也符合騰訊一貫風(fēng)格,在模式被驗證,市場被教育成熟才會發(fā)力。值得注意的是,微信自建了一個30多人的技術(shù)團隊進行語音識別技術(shù)研發(fā)。
除了百度、騰訊等巨頭,盛大推出采用自有技術(shù)的“百靈語音助手”。中國移動聯(lián)手科大訊飛推出“靈犀助手”,訊飛本身還有“語點”這款語音助手產(chǎn)品。創(chuàng)業(yè)公司智能360、蟲洞語音助手、小i機器人則側(cè)重語義解析和前端功能。
語音技術(shù)普及存在較多限制條件
語音哪怕Siri依然未成為主流的交互方式。國內(nèi)也尚未出現(xiàn)能與“語音助手”劃上等號的產(chǎn)品。去年中國語音市場經(jīng)歷了一場“軍備競賽”,沒有人確定用戶是否真的需要這么個玩意兒。但如今,大家都不遺余力,生怕落后,被人搶占傳說中的入口。
1、“語音入口”可能只是傳說。
筆者并不是馬后炮,在Siri推出時我認(rèn)為語音交互有天生的缺陷:只能在安靜的場景下使用,有噪音則難以識別;只能在私密的場景使用,否則語音命令會干擾他人?,F(xiàn)實中這類場所并不多,哪怕在家中客廳使用語音功能,也可能影響家人。
就算無干擾場所存在,語音識別技術(shù)還有一個依賴:無線網(wǎng)絡(luò)。上傳大量的數(shù)據(jù)進行云端識別,必須有良好的網(wǎng)絡(luò)。在一些沒有WIFI的地方,使用語音操控簡直是噩夢。有產(chǎn)品提供離線識別技術(shù),安裝包將增大數(shù)倍,識別效果也會直線下降。
2、語音產(chǎn)品的智能化技術(shù)仍差強人意。
語音市場更難的問題在于“智能識別”的智能。語音技術(shù)分為語音識別、語義解析和語音合成。大多語音搜索產(chǎn)品能做到的僅僅是將語音轉(zhuǎn)換成文字,然后通過文字去搜索,實際是“語音識別”這部分技術(shù)應(yīng)用。語音助手要做到助理的程度,則需要能聽懂人話,理解自然語言,就像鋼鐵俠里的賈維斯系統(tǒng)。現(xiàn)在的“語音轉(zhuǎn)文字”這一步并不自然。而理解自然語言,依然是Google、百度等技術(shù)巨擘在攻堅的難點:語義解析。
3、用戶尚未形成習(xí)慣
最后還有一個難點在于用戶習(xí)慣。好的產(chǎn)品要觸及用戶,需要培養(yǎng),改變和教育。這需要時間。
目前,使用場景、無線網(wǎng)絡(luò)、語義識別和用戶習(xí)慣這些限制均使得語音仍處于探路期。砸入大量資源,并未獲得匹配的收獲,于是有了泡沫。
創(chuàng)業(yè)者的時間窗口已經(jīng)過去!
如今,語音語義這塊是兵家必爭之地,尤其是可穿戴設(shè)備興起后,重要性更加凸顯。語音市場必將成為巨頭的游戲,技術(shù)和數(shù)據(jù)門檻高企,而語音創(chuàng)業(yè)的時間窗口可能已經(jīng)過去。
1、巨頭轉(zhuǎn)型速度正在加快。“云知聲”和“科大訊飛”在這些角逐者中的角色,就像地圖領(lǐng)域的高德一樣,提供數(shù)據(jù)和技術(shù)供上層服務(wù)商使用。巧合的是,科大訊飛也在謀求高德的從“B”到“C”的多元化轉(zhuǎn)型之路。除了語音助手,科大訊飛還推出了訊飛語音輸入法、面向幼兒教育的語音機器人硬件等產(chǎn)品。
多元化目前是語音巨頭們正在做的事情,也是語音識別平臺必須要做的事情。他們面向企業(yè)市場提供免費識別技術(shù),但僅靠定制收費是行不通的?;ヂ?lián)網(wǎng)巨頭一貫熱衷免費,走開放平臺路線,籠絡(luò)開發(fā)者進而獲得流量、數(shù)據(jù)和個人用戶。8月底百度導(dǎo)航徹底免費,與高德導(dǎo)航正面交鋒就是活生生的例子。百度、騰訊等公司正在投入巨大的資金和資源加強語音技術(shù)建設(shè)。如果他們將語音識別技術(shù)免費必然將創(chuàng)造更大的語音生態(tài)圈。
2、資源技術(shù)優(yōu)勢成為創(chuàng)業(yè)阻礙。事實上,語音業(yè)務(wù)的基礎(chǔ)是建立是在強技術(shù)驅(qū)動下才能實現(xiàn)的,而目前僅有巨頭擁有相關(guān)優(yōu)勢。同時,語音技術(shù)加上語義解析技術(shù),借助知識圖譜、深度學(xué)習(xí),實現(xiàn)對話式搜索,在移動互聯(lián)網(wǎng)時代可以爆發(fā)出巨大能量,也更容易落地和商業(yè)化。單純提供語音識別技術(shù),做一個技術(shù)平臺,商業(yè)化是個大問題。而百度等互聯(lián)網(wǎng)巨頭在垂直整合上相比專業(yè)領(lǐng)域的創(chuàng)業(yè)者,更有優(yōu)勢。
語音市場的春天正在到來?
或許,上述問題會長期存在,但不可否認(rèn)的是,語音作為移動互聯(lián)網(wǎng)的前沿技術(shù)仍值得業(yè)界期待。
就使用場景而言,Glass的“Ok Google”是個開始。樂視TV、錘子OS、易信、inWatch、小米3等產(chǎn)品紛紛推出語音交互功能,均采用了云知聲或者訊飛這兩家公司的技術(shù)??纱┐髟O(shè)備的興起,硬件創(chuàng)業(yè)的浪潮會帶來更多的語音交互使用的土壤。[!--empirenews.page--]
對于環(huán)境噪音的干擾,百度負(fù)責(zé)多媒體搜索技術(shù)的余凱博士在幾個月前曾向筆者解釋過抗噪技術(shù),語音識別技術(shù)已經(jīng)進化到可以區(qū)分人聲和環(huán)境噪聲,甚至可以根據(jù)聲紋識別某個人的特定聲音。這個技術(shù)還可以應(yīng)用于移動支付。支付寶已推出利用聲音指紋的“聲波支付”。這也說明語音技術(shù)的使用場景只會被越來越多地發(fā)掘。
例如企業(yè)客服。今日便有消息稱科大訊飛與安徽移動簽下一筆近千萬的大單。相對中移動,千萬規(guī)模委實不算大單。但他們的合作內(nèi)容或?qū)⒁l(fā)新的企業(yè)Call Center的升級換代:后期中國移動在客服10086平臺將采用訊飛的智能語音技術(shù),用戶可以直接說出需求??头穆曇粢矔捎谜Z音合成技術(shù),這是科大訊飛的優(yōu)勢,其語音合成甚至可以支持主流方言。受此消息影響,今日科大訊飛股票漲停。
無線網(wǎng)絡(luò)的環(huán)境改善也是利好消息。4G牌照已是弦上之箭,不得不發(fā)。筆者近日拿到中國移動4G(TD-LTE)上網(wǎng)卡測試顯示,4G網(wǎng)絡(luò)在單用戶使用時帶寬已高達44M,下載速度為4MB/S。用戶多了這個速度會受到影響,不過可以預(yù)見4G相比3G時代已經(jīng)不可同日而語。除了4G,運營商、政府和商家對WIFI的投資熱情也帶來了覆蓋更廣的無線熱點。
最后,誰將成為中國的Nuance還尚無定論。但這一市場已經(jīng)帶給了眾多從業(yè)者無限的想象空間,可以預(yù)見,未來語音市場的將在巨頭的你爭我奪中成為業(yè)界焦點,而下游的語音產(chǎn)品也隨之將逐漸豐富,一個移動語音生態(tài)生態(tài)或?qū)⒃诓痪煤笮纬?....