構(gòu)筑語(yǔ)音新世界 車聯(lián)網(wǎng)中的“siri”
掃描二維碼
隨時(shí)隨地手機(jī)看文章
“車聯(lián)網(wǎng)構(gòu)筑語(yǔ)音技術(shù)應(yīng)用新世界”
在蘋果Siri所引發(fā)的全球語(yǔ)音熱潮的推動(dòng)下,科大訊飛成為了中文語(yǔ)音識(shí)別領(lǐng)域的弄潮兒。然而一些有識(shí)之士深刻認(rèn)識(shí)到,語(yǔ)音識(shí)別技術(shù)真正有價(jià)值的應(yīng)用領(lǐng)域是在汽車駕駛,車聯(lián)網(wǎng)將成為語(yǔ)音技術(shù)應(yīng)用領(lǐng)域的又一藍(lán)海。與科大訊飛走手機(jī)語(yǔ)音識(shí)別應(yīng)用之路不同,車音網(wǎng)將語(yǔ)音識(shí)別應(yīng)用的重點(diǎn)放在了汽車駕駛室內(nèi),并成功搭建了一個(gè)車載語(yǔ)音云平臺(tái)。
語(yǔ)音汽車
依托車載語(yǔ)音云平臺(tái),駕駛者只要開(kāi)口說(shuō)話,相關(guān)需求就能得到滿足。
1920年代生產(chǎn)的“Radio Rex”玩具狗是眼下有據(jù)可查的最早的語(yǔ)音識(shí)別器,當(dāng)這只狗聽(tīng)到自己的名字時(shí),它就會(huì)從底座上彈出來(lái),嚇人一跳。那時(shí)候的語(yǔ)音識(shí)別技術(shù)是基于英文語(yǔ)音為基礎(chǔ)開(kāi)發(fā),而作為象形文字的中文語(yǔ)音識(shí)別與作為音節(jié)文字的英文語(yǔ)音識(shí)別有著很大差別,而且也相對(duì)困難得多。
蘋果Siri(語(yǔ)音個(gè)人助理服務(wù))的問(wèn)世,展示出了語(yǔ)音識(shí)別技術(shù)在應(yīng)用領(lǐng)域的非凡前景??拼笥嶏w則是借助蘋果Siri所引發(fā)的全球語(yǔ)音熱潮,成為在中文語(yǔ)音識(shí)別領(lǐng)域中異軍突起的企業(yè)。為此,中國(guó)移動(dòng)宣布斥資14億元現(xiàn)金戰(zhàn)略入股科大訊飛,成為第二大股東。
對(duì)于這一舉措,中國(guó)移動(dòng)方面稱,主要是由于看好語(yǔ)音技術(shù)的發(fā)展?jié)摿Γ悄苁謾C(jī)下一步的發(fā)展將會(huì)是以語(yǔ)音技術(shù)為主的人機(jī)互動(dòng)科技,而科大訊飛已于內(nèi)地上市,在語(yǔ)音技術(shù)業(yè)務(wù)方面取得行業(yè)領(lǐng)先地位,基于此雙方形成了目前的資本合作格局。
其實(shí),語(yǔ)音識(shí)別技術(shù)并非蘋果的創(chuàng)舉,早期的聲碼器,可以看做是語(yǔ)音識(shí)別技術(shù)的雛形。在追溯中文語(yǔ)音識(shí)別技術(shù)起源時(shí),另一家公司的名字映入眼簾——車音網(wǎng)?;谑嗄暾Z(yǔ)音識(shí)別技術(shù)的研發(fā)耕耘,車音網(wǎng)成為為車主提供基于語(yǔ)音識(shí)別技術(shù)的智能輔助駕駛服務(wù)的領(lǐng)頭羊。
早在1999年,車音網(wǎng)創(chuàng)始人沈康麒所帶領(lǐng)的技術(shù)團(tuán)隊(duì)就開(kāi)始投身語(yǔ)音識(shí)別技術(shù)的研發(fā),這群工程師也可以說(shuō)是國(guó)內(nèi)研究中文語(yǔ)音識(shí)別技術(shù)最早的那撥人。因此,在語(yǔ)音識(shí)別技術(shù)研發(fā)道路上,科大訊飛并不孤單。
記者通過(guò)采訪發(fā)現(xiàn),科大訊飛與車音網(wǎng)的底層技術(shù)原理和算法幾乎完全一致,但在對(duì)語(yǔ)音引擎理解、應(yīng)用領(lǐng)域研究和業(yè)務(wù)發(fā)展方向等方面,兩家公司卻走著幾乎完全不同的道路。車音網(wǎng)的核心團(tuán)隊(duì)基于十余年語(yǔ)音識(shí)別技術(shù)的研發(fā)耕耘,深刻認(rèn)識(shí)到,語(yǔ)音識(shí)別技術(shù)真正有價(jià)值的應(yīng)用領(lǐng)域在車?yán)?,在手眼感官被占、行為受限的特定行為空間當(dāng)中。
車音網(wǎng)致力于為車主提供基于語(yǔ)音識(shí)別技術(shù)的智能輔助駕駛服務(wù),并成功搭建了一個(gè)車載語(yǔ)音云平臺(tái)。依托該平臺(tái),駕駛者只要開(kāi)口說(shuō)話,相關(guān)需求就能得到滿足。憑借優(yōu)秀的語(yǔ)音技術(shù)基礎(chǔ)和卓越的用戶體驗(yàn),車音網(wǎng)在短短三年時(shí)間內(nèi)就發(fā)展近20萬(wàn)用戶。
語(yǔ)音引爆車聯(lián)網(wǎng)
在車聯(lián)網(wǎng)服務(wù)大規(guī)模增長(zhǎng)的路上,人機(jī)交互的語(yǔ)音識(shí)別技術(shù)被認(rèn)為是必備的入場(chǎng)券。
車音網(wǎng)所在的行業(yè)叫車聯(lián)網(wǎng)(Telematics),也就是車載信息服務(wù),即借助無(wú)線通信網(wǎng),為駕車人士提供諸如免提電話、道路救援、指路導(dǎo)航、車輛遠(yuǎn)程診斷、預(yù)訂酒店等多樣化的汽車安全及信息服務(wù)。
在美國(guó),車聯(lián)網(wǎng)市場(chǎng)規(guī)模已超過(guò)100億美元,但在中國(guó),2009年車聯(lián)網(wǎng)才開(kāi)始起步。車聯(lián)網(wǎng)服務(wù)源自歐美,是一種結(jié)合了全球衛(wèi)星定位系統(tǒng)和無(wú)線通信技術(shù)的汽車遠(yuǎn)程信息服務(wù)。通俗地說(shuō),裝了Telematics的汽車,就像是航線上的飛機(jī),包括運(yùn)行軌跡、車況等一切數(shù)據(jù)信息都能被服務(wù)中心及時(shí)掌握,而駕駛者也能通過(guò)無(wú)線網(wǎng)絡(luò)隨時(shí)與服務(wù)中心進(jìn)行聯(lián)系,及時(shí)獲取所需的信息和服務(wù)。“路上快行、車下秘書、車上生活、車上辦公”是車聯(lián)網(wǎng)的本質(zhì)特征。
從產(chǎn)業(yè)鏈上來(lái)看,車聯(lián)網(wǎng)服務(wù)可以分為以移動(dòng)通信運(yùn)營(yíng)商為主的后裝市場(chǎng)和以汽車廠商為主的前裝市場(chǎng)兩個(gè)部分。前者主要側(cè)重位置導(dǎo)航、實(shí)時(shí)路況、資訊娛樂(lè)等車載位置與信息服務(wù);而后者則集中于車輛診斷、碰撞緊急求助、被盜車輛追蹤、呼叫中心等汽車安防服務(wù)。
在歐美,車聯(lián)網(wǎng)服務(wù)已經(jīng)是駕駛者不可缺少的一項(xiàng)服務(wù)。譬如,通用ON-STAR(安吉星)在全美有5000萬(wàn)用戶,且在通用車?yán)锸褂帽壤哌_(dá)到50%,但對(duì)中國(guó)車主而言,這還是一個(gè)全新的概念。
毫無(wú)疑問(wèn),這將是一個(gè)很龐大的市場(chǎng)。一個(gè)簡(jiǎn)單的數(shù)據(jù)對(duì)比或可以說(shuō)明,相對(duì)于中國(guó)過(guò)億的乘用車保有量相比,目前使用車聯(lián)網(wǎng)服務(wù)的還不足1%。無(wú)論是海外經(jīng)驗(yàn)證明還是簡(jiǎn)單的邏輯分析,都可以得出這樣的結(jié)論:鑒于這樣的服務(wù)與個(gè)體生命密切相關(guān),“用戶黏性”非常好,其市場(chǎng)一旦爆發(fā),規(guī)模勢(shì)必驚人。
但三年時(shí)光匆匆過(guò),車聯(lián)網(wǎng)行業(yè)的發(fā)展依然是“雷聲大,雨點(diǎn)小”。談及現(xiàn)狀,業(yè)內(nèi)普遍認(rèn)為,一方面是這一行業(yè)還缺乏“殺手級(jí)”的應(yīng)用,另一方面則是因?yàn)橹袊?guó)車主的消費(fèi)觀念短期內(nèi)難以改變,市場(chǎng)還需要逐步培育。
車音網(wǎng)副總裁陸凌濤分析稱,在前裝市場(chǎng),汽車廠商還沒(méi)有相關(guān)意識(shí),即使有了意識(shí)后,也涉及一些汽車生產(chǎn)標(biāo)準(zhǔn)的調(diào)整,這需要時(shí)間;而在后裝市場(chǎng),目前多數(shù)人還是把車當(dāng)奢侈品,而不是一個(gè)工具,這決定了消費(fèi)習(xí)慣。
不過(guò),多數(shù)人相信,這一市場(chǎng)即將爆發(fā),而在車聯(lián)網(wǎng)服務(wù)大規(guī)模增長(zhǎng)的路上,基于人機(jī)交互的語(yǔ)音識(shí)別技術(shù)被認(rèn)為是必備的入場(chǎng)券。陸凌濤說(shuō),在車載環(huán)境下用戶能做什么,受制于與汽車的交互方式。他認(rèn)為,在車載環(huán)境下,用戶的主要集中力在于駕駛,人與車的交互必須在不影響駕駛的前提條件下進(jìn)行。語(yǔ)音識(shí)別技術(shù)則提供了這樣一種安全便攜的交互方式,用戶只需動(dòng)口,即可滿足在行車過(guò)程中撥打電話、位置導(dǎo)航、資訊播報(bào)、語(yǔ)音點(diǎn)歌、車輛診斷等伴隨式服務(wù)。
語(yǔ)音夢(mèng)回車?yán)?/strong>
通過(guò)語(yǔ)音識(shí)別技術(shù),車音網(wǎng)已經(jīng)幫車主實(shí)現(xiàn)了“動(dòng)口不動(dòng)手”的車上信息服務(wù)。
車音網(wǎng)可以說(shuō)是國(guó)內(nèi)首家通過(guò)智能手機(jī)實(shí)現(xiàn)車聯(lián)網(wǎng)服務(wù)的企業(yè),十幾年的語(yǔ)音識(shí)別領(lǐng)域耕耘最終在車聯(lián)網(wǎng)的應(yīng)用領(lǐng)域迸發(fā)出火花。
蘋果公司在今年6月份舉行的全球研發(fā)者大會(huì)(WWDC)中提到,iPhone未來(lái)將會(huì)用一根數(shù)據(jù)線與汽車連接,駕駛者(用戶)可以通過(guò)方向盤上的按鈕觸發(fā)Siri,包括豐田、捷豹在內(nèi)等九大廠商已經(jīng)承諾將在未來(lái)一年內(nèi)開(kāi)發(fā)支持iPhone Siri的接口。屆時(shí),駕駛者將能一邊駕駛,一邊和身旁這位上知天文下知地理的助手聊天。
令人興奮的是,這些設(shè)想早在三年前就已經(jīng)在車音網(wǎng)的業(yè)務(wù)規(guī)劃當(dāng)中,通過(guò)藍(lán)牙技術(shù),車音網(wǎng)已經(jīng)實(shí)現(xiàn)手機(jī)與汽車的連接的產(chǎn)品化,通過(guò)語(yǔ)音識(shí)別技術(shù),車音網(wǎng)也已經(jīng)幫車主實(shí)現(xiàn)了“動(dòng)口不動(dòng)手”的車上信息服務(wù)。真正實(shí)現(xiàn)了將語(yǔ)音識(shí)別切入到人的實(shí)際生活場(chǎng)景中去。車音網(wǎng)整合了語(yǔ)音通訊、地圖、地理信息、音樂(lè)媒體等幾乎所有生活信息,然后進(jìn)行人性化的整合,并且用語(yǔ)音交互的方式表達(dá)出來(lái)。
通過(guò)切身的體驗(yàn),更加令人興奮的是,蘋果在WWDC上提出,未來(lái)的iPhone僅僅用一個(gè)觸發(fā)按鈕就能實(shí)現(xiàn)Siri與汽車的結(jié)合,而車音網(wǎng)卻已經(jīng)將這個(gè)按鈕裝到了車上,而且通過(guò)國(guó)際通用的藍(lán)牙技術(shù),這個(gè)按鈕能連接的手機(jī)當(dāng)然不僅僅是iPhone,還有其他各類的具備藍(lán)牙功能智能手機(jī),還因?yàn)檐囈艟W(wǎng)的服務(wù)實(shí)現(xiàn)方式是建立在2G基礎(chǔ)上的IVR話音通道和基于3G通訊網(wǎng)絡(luò)的數(shù)據(jù)通道,所以甚至就連非智能手機(jī)都能聽(tīng)得懂車主的“發(fā)號(hào)施令”,就如同在你駕車的時(shí)候,身邊多了一個(gè)聽(tīng)得懂人話、幾乎無(wú)所不能的助手副駕。
在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域中看似簡(jiǎn)單的語(yǔ)音應(yīng)用,在高速行駛、行為受限的車載應(yīng)用場(chǎng)景中,卻并非那么簡(jiǎn)單。首要問(wèn)題就是語(yǔ)音識(shí)別技術(shù)的商用能力成為關(guān)鍵,噪音、麥克風(fēng)回聲、口音問(wèn)題等等都會(huì)深深的影響語(yǔ)音技術(shù)的識(shí)別率,而語(yǔ)音識(shí)別率的高低又直接影響用戶的體驗(yàn),同時(shí)也關(guān)系到語(yǔ)音技術(shù)開(kāi)發(fā)企業(yè)的核心競(jìng)爭(zhēng)力。
“事實(shí)上,噪音和麥克風(fēng)回聲都有辦法建立模型來(lái)解決,但實(shí)現(xiàn)更高的語(yǔ)音識(shí)別率首先需要解決口音問(wèn)題,尤其在中國(guó)這個(gè)口音繁雜的環(huán)境下,不同地域不同口音的語(yǔ)料數(shù)據(jù)庫(kù)以及針對(duì)語(yǔ)料庫(kù)的語(yǔ)音模型分析至關(guān)重要。”陸凌濤說(shuō),要提高語(yǔ)音識(shí)別率,并不僅僅需要龐大資金的支持,還需要時(shí)間的積累。
據(jù)了解,在語(yǔ)料采集方面,沈康麒曾親自帶領(lǐng)一支數(shù)據(jù)團(tuán)隊(duì),專門在全國(guó)各地收集采錄不同口音、不同階段年齡、不同性別在不同環(huán)境下的真實(shí)語(yǔ)料。這樣的工作十余年來(lái)始終堅(jiān)持不懈,并不惜耗資過(guò)億進(jìn)行特征提取、模型訓(xùn)練,形成了世界上獨(dú)一無(wú)二的廣譜語(yǔ)音特征數(shù)據(jù)庫(kù)資源,這為車音網(wǎng)特有的商用級(jí)非特定人語(yǔ)音識(shí)別技術(shù)打下了堅(jiān)實(shí)的基礎(chǔ)。
機(jī)會(huì)總是留給有準(zhǔn)備的企業(yè)。
從2010年下半年開(kāi)始,汽車銷量在經(jīng)過(guò)大規(guī)??焖僭鲩L(zhǎng)后,增速放緩甚至出現(xiàn)了停滯,許多汽車廠商意識(shí)到需要通過(guò)差異化服務(wù)來(lái)增加銷量,而車聯(lián)網(wǎng)這一在歐美汽車行業(yè)發(fā)展了近十年的新興汽車信息服務(wù)被引進(jìn)后,幾乎成為了所有汽車廠商特別是國(guó)產(chǎn)汽車品牌尋求市場(chǎng)差異化的興奮劑。但當(dāng)時(shí)由于國(guó)內(nèi)很多汽車廠商缺乏相關(guān)的技術(shù)積累,只能找到技術(shù)相對(duì)成熟的第三方公司合作。
于是,國(guó)內(nèi)一些車廠紛紛找到了車音網(wǎng)洽談合作。截至目前,奔騰、蓮花、斯巴魯、一汽豐田、一汽馬自達(dá)、安吉星等車廠及TSP(Telematics運(yùn)營(yíng)服務(wù)商)紛紛開(kāi)始與車音網(wǎng)尋求合作打造語(yǔ)音服務(wù)平臺(tái)。車音網(wǎng)正逐漸成為中國(guó)車聯(lián)網(wǎng)行業(yè)中基于語(yǔ)音識(shí)別技術(shù)的人機(jī)交互平臺(tái)的主要提供商。
語(yǔ)音車的未來(lái)
陸凌濤表示,要達(dá)到更自然的人機(jī)交互,需要三個(gè)層面的努力:自然語(yǔ)言識(shí)別、人工智能和知識(shí)庫(kù),缺一不可。
完美的語(yǔ)音技術(shù),或者人類對(duì)這一技術(shù)的最終想象,早在上個(gè)實(shí)際80年代,就在美國(guó)的科幻電影《霹靂游俠》中的那輛聽(tīng)得懂人話的汽車上就已有所展現(xiàn),直到近期,電影《鋼鐵俠》中的那位無(wú)所不能的智能管家、《機(jī)器管家》中的那位機(jī)器人,都在不斷體現(xiàn)著人們對(duì)語(yǔ)音識(shí)別技術(shù)的應(yīng)用渴望,這些機(jī)器(人)不僅能夠完美執(zhí)行指令,而且還能夠讀懂人的感情。從這一意義上來(lái)說(shuō),從事語(yǔ)音識(shí)別研發(fā)的公司均存在著巨大的潛在前景。但讓機(jī)器讀懂你在說(shuō)什么,這實(shí)在是一件浩大的工程。
陸凌濤表示,要達(dá)到更自然的人機(jī)交互,需要三個(gè)層面的努力:自然語(yǔ)言識(shí)別、人工智能和知識(shí)庫(kù),缺一不可。而云計(jì)算和大數(shù)據(jù)時(shí)代的到來(lái),這些科幻小說(shuō)里的場(chǎng)景幾乎距離大眾只剩下“最后一公里”。云計(jì)算帶來(lái)的一個(gè)好處是,每個(gè)人的數(shù)據(jù)都是存儲(chǔ)在云端的,不管這個(gè)人到了哪里,他的數(shù)據(jù)都可以隨時(shí)調(diào)用,他的偏好都可以隨時(shí)下載下來(lái)。
設(shè)想這樣的場(chǎng)景,你在云端設(shè)置了一個(gè)叫“我的家”的地點(diǎn),然后當(dāng)你對(duì)著手機(jī)喊“我的家”時(shí),它會(huì)告訴你怎么走。但當(dāng)你和你的汽車系統(tǒng)說(shuō)去“我的家”時(shí),它顯然并不能理解“我的家”是什么,因?yàn)樗臄?shù)據(jù)和云端的數(shù)據(jù)是不相通的。
每個(gè)人每天用得最多的設(shè)備毫無(wú)疑問(wèn)是手機(jī),你的大多數(shù)個(gè)人數(shù)據(jù)和個(gè)人偏好都被手機(jī)記錄了下來(lái)。如果每臺(tái)手機(jī)都是一個(gè)助手,顯然這個(gè)助手是眾多數(shù)碼助手中最了解你的。而汽車系統(tǒng)因?yàn)槭窍鄬?duì)獨(dú)立的,它并沒(méi)有像手機(jī)那樣,了解那么多你的偏好,甚至,它能知道你經(jīng)常在什么地點(diǎn)之間往返就已經(jīng)算是“聰明的汽車”了。
另一方面,目前每個(gè)汽車廠商研發(fā)的汽車系統(tǒng)都是相對(duì)獨(dú)立的,這給數(shù)據(jù)共享帶來(lái)了難度。設(shè)想某一智能汽車已經(jīng)了解了你的偏好,某一天你換車了,你得重新調(diào)教這輛車,讓它更“懂”你。
于是,如果每個(gè)人開(kāi)車時(shí)都連上自己的手機(jī),這時(shí)在你手機(jī)里記錄的個(gè)人偏好就被完整的移植到了汽車系統(tǒng)當(dāng)中,哪怕這并不是你自己的車,那一瞬間,這輛車也是完全懂你的。所以更智能的、更個(gè)性化的汽車系統(tǒng),必將與手機(jī)密不可分,或者說(shuō),必將與手機(jī)記錄下來(lái)的用戶數(shù)據(jù)密不可分。
而這也恰是車音網(wǎng)眼中車聯(lián)網(wǎng)產(chǎn)業(yè)的最后一公里,讓你的車“聽(tīng)懂”你,讓你的車“更懂”你!
倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...
關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...
關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)