1952年世界上第一個(gè)能識(shí)別10個(gè)英語(yǔ)數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng)的誕生拉開(kāi)了語(yǔ)音識(shí)別技術(shù)研究的帷幕。語(yǔ)音識(shí)別技術(shù)經(jīng)歷了由小詞匯量、孤立詞的識(shí)別到大詞匯量、非特定人連續(xù)語(yǔ)音識(shí)別的飛躍。今天,iPhone4S內(nèi)置的Siri語(yǔ)音搜索助理更是將語(yǔ)音識(shí)別技術(shù)發(fā)揮得淋漓盡致。Siri的亮相,實(shí)現(xiàn)了語(yǔ)音識(shí)別技術(shù)的華麗變身。
Siri的問(wèn)世不僅給語(yǔ)音識(shí)別帶來(lái)了一場(chǎng)技術(shù)革命,更是人機(jī)交互、人工智能技術(shù)的一個(gè)重大突破。
首先,前臺(tái)人機(jī)交互方面,利用語(yǔ)音識(shí)別技術(shù)是把用戶的口語(yǔ)轉(zhuǎn)化成文字,其中采用了強(qiáng)大的語(yǔ)音知識(shí)庫(kù),需要用到所謂的"云計(jì)算"技術(shù)。再利用語(yǔ)音合成技術(shù)將返回的文字結(jié)果轉(zhuǎn)化成語(yǔ)音輸出。
其次,后臺(tái)語(yǔ)音處理方面則需要將人工智能與人機(jī)交互及智能搜索緊密地聯(lián)系起來(lái),以實(shí)現(xiàn)機(jī)器要根據(jù)對(duì)用戶所說(shuō)的話進(jìn)行理解,并快速尋找答案以語(yǔ)音的方式回答用戶。包括了:
①以Google為代表的網(wǎng)頁(yè)搜索技術(shù);
②以Wolfram Alpha為代表的知識(shí)搜索技術(shù)(或者知識(shí)計(jì)算技術(shù));
③以Wikipedia為代表的知識(shí)庫(kù)(和Wolfram Alpha不同的是,這些知識(shí)來(lái)自人類(lèi)的手工編輯)技術(shù)(包括其他百科,如電影百科等);
④以Yelp為代表的問(wèn)答以及推薦技術(shù)。處理用戶的請(qǐng)求,并返回最匹配的結(jié)果。
最終實(shí)現(xiàn)了Siri可以拋棄繁瑣的語(yǔ)法結(jié)構(gòu),甚至思維模式也可以混亂,它會(huì)結(jié)合上下文結(jié)構(gòu)去理解,還會(huì)從人類(lèi)語(yǔ)言史的角度出發(fā),利用人工智能系統(tǒng)去分析,并在絕大多數(shù)情況下領(lǐng)會(huì)你的意思。更加人性化的特點(diǎn)是,一旦你開(kāi)始和Siri進(jìn)入一段對(duì)話,它甚至能理解許多含義模糊或者引申的語(yǔ)義。
智能語(yǔ)音技術(shù)是人工智能的研究領(lǐng)域之一,其技術(shù)原理涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科。智能語(yǔ)音技術(shù)的研究周期長(zhǎng)、投入大,使得智能語(yǔ)音行業(yè)具有較高的進(jìn)入壁壘。
在全球范圍內(nèi),目前已形成寡頭壟斷競(jìng)爭(zhēng)格局,僅有Nuance、IBM、微軟和Google等少數(shù)廠商具備較強(qiáng)競(jìng)爭(zhēng)力。早在蘋(píng)果推出內(nèi)置Siri語(yǔ)音搜索功能的iPhone4S前,谷歌在2009年就已經(jīng)推出語(yǔ)音搜索軟件,并支持中文,而微軟高管也透露早于蘋(píng)果一年研究語(yǔ)音搜索技術(shù),并會(huì)在Windows8上內(nèi)置該服務(wù)器。我國(guó)的科大訊飛與聯(lián)想也正加緊合作開(kāi)發(fā)本土的語(yǔ)音軟件。
智能語(yǔ)音技術(shù)不僅僅只是將程序植入到手機(jī)、平板電腦、電視等多個(gè)終端設(shè)備上,未來(lái)智能語(yǔ)音技術(shù)的發(fā)展方向必是面向自然語(yǔ)言的處理,而在口語(yǔ)對(duì)話中提供自然的語(yǔ)言處理是一個(gè)雙重挑戰(zhàn)。首先,你必須識(shí)別這些單詞,然后,你必須理解這個(gè)意思。第一部分變得更加容易了。但是,第二部分仍然很難解決:意思是根據(jù)上下文確定且難以應(yīng)付的,人類(lèi)做的語(yǔ)法分析也不是總是成功的。盡管蘋(píng)果的Siri被稱(chēng)為iPhone4S中語(yǔ)音驅(qū)動(dòng)的"虛擬助手",但也有用戶稱(chēng)Siri在使用時(shí)故障不斷。看來(lái)要真正實(shí)現(xiàn)人機(jī)無(wú)障礙地交流,創(chuàng)造一個(gè)能力更高的語(yǔ)音助手,還有一段很長(zhǎng)的路要走。不過(guò)可以肯定的是Siri的問(wèn)世促使了語(yǔ)音搜索勢(shì)必會(huì)成為各大廠家的下一個(gè)競(jìng)爭(zhēng)點(diǎn),智能語(yǔ)音手機(jī)、智能電視和智能汽車(chē)的時(shí)代已經(jīng)來(lái)臨。
- 谷歌發(fā)布阿拉伯語(yǔ)版本語(yǔ)音搜索
- Windows 8將配置類(lèi)似Siri的語(yǔ)音識(shí)別技術(shù)
- Xbox 360將支持語(yǔ)音搜索
- 聯(lián)想lePhone2代可能加入中文語(yǔ)音類(lèi)功能
- 百度推出"百度搜索"移動(dòng)客戶端
- QQ2011正式版新增多人視頻+手寫(xiě)、語(yǔ)音輸入
- 類(lèi)Siri應(yīng)用 Vlingo語(yǔ)音助理試用
- 語(yǔ)音及語(yǔ)言信息處理國(guó)家工程實(shí)驗(yàn)室在中科大成立
- 上汽自主占領(lǐng)科技高地:推出汽車(chē)語(yǔ)音交互技術(shù)