www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 消費電子 > 音頻技術(shù)
[導(dǎo)讀]   一、語音識別技術(shù)定義   語音識別技術(shù),也被稱為自動語音識別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸

  一、語音識別技術(shù)定義

  語音識別技術(shù),也被稱為自動語音識別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。與說話人識別及說話人確認(rèn)不同,后者嘗試識別或確認(rèn)發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。

  語音識別技術(shù)的應(yīng)用包括語音撥號、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。語音識別技術(shù)與其他自然語言處理技術(shù)如機器翻譯及語音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,例如語音到語音的翻譯。

  二、語音識別技術(shù)原理

  語音識別系統(tǒng)提示客戶在新的場合使用新的口令密碼,這樣使用者不需要記住固定的口令,系統(tǒng)也不會被錄音欺騙。文本相關(guān)的聲音識別方法可以分為動態(tài)時間伸縮或隱馬爾可夫模型方法。文本無關(guān)聲音識別已經(jīng)被研究很長時間了,不一致環(huán)境造成的性能下降是應(yīng)用中的一個很大的障礙。

  其工作原理:

  動態(tài)時間伸縮方法使用瞬間的、變動倒頻。1963年Bogert et al出版了《回聲的時序倒頻分析》。通過交換字母順序,他們用一個含義廣泛的詞匯定義了一個新的信號處理技術(shù),倒頻譜的計算通常使用快速傅立葉變換。

  從1975年起,隱馬爾可夫模型變得很流行。運用隱馬爾可夫模型的方法,頻譜特征的統(tǒng)計變差得以測量。文本無關(guān)語音識別方法的例子有平均頻譜法、矢量量化法和多變量自回歸法。

  平均頻譜法使用有利的倒頻距離,語音頻譜中的音位影響被平均頻譜去除。使用矢量量化法,語者的一套短期訓(xùn)練的特征向量可以直接用來描繪語者的本質(zhì)特征。但是,當(dāng)訓(xùn)練向量的數(shù)量很大時,這種直接的描繪是不切實際的,因為存儲和計算的量變得離奇的大。所以嘗試用矢量量化法去尋找有效的方法來壓縮訓(xùn)練數(shù)據(jù)。Montacie et al在倒頻向量的時序中應(yīng)用多變量自回歸模式來確定語者特征,取得了很好的效果。

  想騙過語音識別系統(tǒng)要有高質(zhì)量的錄音機,那不是很容易買到的。一般的錄音機不能記錄聲音的完整頻譜,錄音系統(tǒng)的質(zhì)量損失也必須是非常低的。對于大多數(shù)的語音識別系統(tǒng),模仿的聲音都不會成功。用語音識別來辨認(rèn)身份是非常復(fù)雜的,所以語音識別系統(tǒng)會結(jié)合個人身份號碼識別或芯片卡。

  語音識別系統(tǒng)得益于廉價的硬件設(shè)備,大多數(shù)的計算機都有聲卡和麥克風(fēng),也很容易使用。但語音識別還是有一些缺點的。語音隨時間而變化,所以必須使用生物識別模板。語音也會由于傷風(fēng)、嗓音沙啞、情緒壓力或是青春期而變化。語音識別系統(tǒng)比指紋識別系統(tǒng)有著較高的誤識率,因為人們的聲音不像指紋那樣獨特和唯一。對快速傅立葉變換計算來說,系統(tǒng)需要協(xié)同處理器和比指紋系統(tǒng)更多的效能。目前語音識別系統(tǒng)不適合移動應(yīng)用或以電池為電源的系統(tǒng)。

  三、語音識別的技術(shù)實現(xiàn)方式

  語音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個方面,其中,最基礎(chǔ)的就是語音識別單元的選取。

 ?。?)語音識別單元的選取。語音識別研究的基礎(chǔ)是選擇語音識別單元。語音識別單元有單詞(句)、音節(jié)和音素三種,具體選擇哪一種語音識別單元由具體研究任務(wù)的類型決定:

  單詞(句)單元在中小詞匯語音識別系統(tǒng)中應(yīng)用廣泛,但由于模型庫過于龐大,模型匹配算法復(fù)雜,實時性不強,所以不適合大詞匯系統(tǒng);

  音節(jié)單元主要應(yīng)用于漢語語音識別,因為漢語是單音節(jié)結(jié)構(gòu)的語言,雖然有大約1300個音節(jié),但無調(diào)音節(jié)共408個,相對較少,所以音節(jié)單元在中、大詞匯量的漢語語音識別系統(tǒng)上是可行的。

  音素單元之前曾廣泛應(yīng)用于英語語音識別,也越來越多的應(yīng)用于中、大詞匯量漢語語音識別系統(tǒng)中。原因在于漢語音節(jié)僅由22個聲母和28個韻母構(gòu)成,把聲母細化,雖然增加了模型數(shù)量,但是提高了易混淆音節(jié)的區(qū)分能力

 ?。?)特征參數(shù)提取技術(shù)。特征提取就是對語音信號進行分析處理,把豐富的語音信息中的冗余信息去除,獲得對語音識別有用的信息。這是一個對語音信號進行信息壓縮的過程,目前經(jīng)常采用的特征參數(shù)提取技術(shù)是線性預(yù)測(LP)分析技術(shù)?;贚P技術(shù)提取的倒譜參數(shù)再加上Mel參數(shù)和基于感知線性預(yù)測(PLP)分析提取的感知線性預(yù)測倒譜對人耳處理聲音的模擬,進一步提高了語音識別系統(tǒng)的性能。

 ?。?)模式匹配及模型訓(xùn)練技術(shù)。早期的語音識別應(yīng)用的模式匹配和模型訓(xùn)練技術(shù)是動態(tài)時間歸正技術(shù)(DTW),它在孤立詞語音識別中獲得了良好性能,但是由于對大詞匯量以及連續(xù)語音識別的不準(zhǔn)確,目前已經(jīng)被隱馬爾可夫模型(HMM)和人工神經(jīng)元網(wǎng)絡(luò)(ANN)所取代。


本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉