語音技術(shù)的商業(yè)化路徑
成為移動互聯(lián)網(wǎng)的入口需要具備怎樣的特性?入口當(dāng)前,語音鏈條上的各家企業(yè)該如何破解產(chǎn)業(yè)化難題?
在高始興看來,能否實現(xiàn)查詢和搜索的功能、承載龐大的信息內(nèi)容服務(wù),以及積攢龐大的用戶量,并列為三個關(guān)鍵因子。“但如果沒有龐大的信息和內(nèi)容服務(wù),語音只能停留在交互手段的層面,不能構(gòu)成真正的入口”,高始興認(rèn)為,否則一家語音技術(shù)公司的出路往往是成為專業(yè)的語音技術(shù)提供商,而現(xiàn)在領(lǐng)先的兩三家語音識別技術(shù)性能差別無幾,如集中在2B領(lǐng)域,屆時將成為產(chǎn)品、模式和市場之爭。
但顯而易見,語音技術(shù)公司目前首要的盈利方式,即是作為技術(shù)服務(wù)商,幫助其他互聯(lián)網(wǎng)公司、企業(yè)、開發(fā)者提高應(yīng)用的交互體驗。例如,對于新東方等客戶,思必馳正在使用以年付或者使用量付費的技術(shù)授權(quán)模式。同時,思必馳也利用其語音識別、語音合成、語義理解和聲紋識別等綜合技術(shù)優(yōu)勢,面向2B領(lǐng)域,推出web端、移動端乃至電信端的服務(wù)和解決方案。
而云知聲得以在公眾視野里風(fēng)生水起,很大程度上也是由于它為一些知名的企業(yè)級客戶提供的語音技術(shù)支持:首先是去年11月的搜狗語音助手發(fā)布,云知聲獨家支持其語音識別環(huán)節(jié);4個月后,造勢洶涌的錘子ROM發(fā)布前夕,云知聲為羅永浩提供了應(yīng)急解決方案,成為與科大訊飛并舉的合作方;而5月隨著另一場聲勢浩大的LeTV超級電視發(fā)布會,云知聲為更多客戶所知。
來自微信的訂單亦接踵而至,出門問問、微信路況紛紛找到云知聲提供語音識別服務(wù)。類似的情形還發(fā)生在蟲洞,為運(yùn)營商和其他微信公眾賬號提供語音技術(shù)支持,已經(jīng)超過語音搜索產(chǎn)生的分銷收入,占據(jù)蟲洞營收的半壁江山。
但即便在梁家恩自己看來,按照單個項目的形式,并不能走出傳統(tǒng)的2B模式,必須用平臺化的方式去服務(wù)用戶。套用劉維的評價,“假如只是傳統(tǒng)的2B服務(wù),和互聯(lián)網(wǎng)關(guān)系不大,賺錢快但發(fā)展慢”。
對此,云知聲的應(yīng)對方案,是嘗試將微信平臺做成自助式的智能客服服務(wù),“比如企業(yè)的信息寫成一定格式后導(dǎo)入,用戶提問時即可自動應(yīng)答”。對于更多的開發(fā)者,云知聲則提供基礎(chǔ)的語音云服務(wù),即完全開放和永久免費的語音平臺。劉維認(rèn)為,這種基于移動互聯(lián)網(wǎng)的技術(shù)服務(wù)模式值得期許,不過,“短期內(nèi)需要較大投入,對技術(shù)和客戶的理解也有很大挑戰(zhàn)”。
12抵達(dá)終端用戶的語音助手類工具,是語音創(chuàng)業(yè)公司的另一條出路,但劉維表示,由于缺乏自然語言交互的技術(shù),語音工具的體驗普遍欠佳。云知聲微信語音輸入插件的走紅,卻實屬“無心插柳”,“產(chǎn)品線上的三款A(yù)PP都是為了讓用戶了解云知聲的語音識別和語義理解技術(shù)而展示的,并沒有主力推廣,但用戶自然增長也到了百萬量級,同時還帶來了超過600家的語音云平臺合作伙伴”,梁家恩說。
離用戶最近的李志飛表示,現(xiàn)階段還沒有考慮太多盈利模式的問題。作為垂直領(lǐng)域的接口進(jìn)行分銷提成或許是方式之一,但誠如他所言,“從細(xì)分做起,一開始很難石破天驚”。
對于風(fēng)險投資者而言,語音高技術(shù)公司需要他們抱以足夠的耐心。劉維認(rèn)為,這類公司通常都有較深的投入曲線,投入期內(nèi)雖然創(chuàng)造的利潤不大,但不能用金錢衡量的價值卻非常大。
“以科大訊飛為例,其積累的語料、用戶都非常有價值,這一邏輯和互聯(lián)網(wǎng)公司類似,未來有很大的變現(xiàn)、創(chuàng)造利潤的空間,這也是市場給予其較高估值的原因”,一位不愿具名的VC投資人表示。
如何改造搜索,是語音行業(yè)下一步進(jìn)擊的領(lǐng)域。盡管Google25%的移動搜索已經(jīng)來自語音,但某種程度上還停留在讓語音充當(dāng)輸入法的階段。“這是人機(jī)對話技術(shù)的最大價值--幾個輪次的對話下來,用戶就能找到所需的信息,甚至完成所需要的交易”,劉維說,但短期內(nèi),語音之于搜索,還有待技術(shù)的成熟和細(xì)分領(lǐng)域的積累與嘗試。
從更長遠(yuǎn)看,劉維認(rèn)為,語音、人臉等技術(shù)的長期空間,都是將原來只能通過設(shè)備傳遞、而不能被設(shè)備理解的語音、圖片等信息,逐漸變成可以被機(jī)器理解分析的結(jié)構(gòu)化數(shù)據(jù),從而大大提高機(jī)器對人的了解,給人以更準(zhǔn)確的推薦、提高各種信息服務(wù)的有效性--此處最有想象空間。
“這里面當(dāng)然會涉及隱私問題,但就像cookie和各種推薦技術(shù)一樣,只要有合適的規(guī)則就不用擔(dān)心”,劉維說。
12