www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 醫(yī)療電子 > 醫(yī)療電子
[導讀]1引言說話人識別是根據(jù)從說話人所發(fā)語音中提取信息判斷說話人身份的過程。語音信號中包含了話音特征和說話人個性特征,說話人識別的關鍵問題之一是提取反映說話人個性的語音特征參數(shù)。在說話人識別系統(tǒng)中常用的語音特

1引言

說話人識別是根據(jù)從說話人所發(fā)語音中提取信息判斷說話人身份的過程。語音信號中包含了話音特征和說話人個性特征,說話人識別的關鍵問題之一是提取反映說話人個性的語音特征參數(shù)。在說話人識別系統(tǒng)中常用的語音特征參數(shù)主要有,LPC 倒譜系數(shù)(LPCC) 、Mel 頻率倒譜系數(shù)(MFCC)、線譜對(LSP)等 。在純凈語音環(huán)境中,系統(tǒng)已經(jīng)達到很好的識別性能,但是在實際應用的環(huán)境中,由于背景噪聲的存在,系統(tǒng)往往達不到令人滿意的效果。

主分量分析PCA (primary component analyze)是統(tǒng)計學中一種根據(jù)數(shù)據(jù)的統(tǒng)計分布特性,提取數(shù)據(jù)主要成分的數(shù)據(jù)處理方法. 它是最小均方誤差下的最優(yōu)正交變換,對消除模式間的相關性、突出模式間差異性有最佳的效果,所以常被用于數(shù)據(jù)的壓縮和模式識別的特征提取 . 由于它需要對原始數(shù)據(jù)的方差矩陣進行估值并求取其特征值和特征向量, 計算量異常巨大, 而基于神經(jīng)網(wǎng)絡的主分量分析算法不必進行矩陣求逆運算,并且神經(jīng)網(wǎng)絡具有并行運算能力, 這將降低PCA 計算量, 提高PCA 的實用性 。對語音信號的原始特征作主分量分析后往往能得到更好的特征參數(shù) 。本文選用LPC倒譜系數(shù)作為表征聲道的特征參數(shù),采用相繼的幾幀組成的特征參數(shù)矢量作為樣本,對其進行主分量分析,這樣去除了特征中的冗余信息,壓縮特征參數(shù)的維數(shù),得到新的PCA特征參數(shù),然后把PCA特征參數(shù)作為GMM模型的輸入向量,進行說話人識別的訓練和識別。

本文第二節(jié)介紹主分量分析神經(jīng)網(wǎng)絡的原理和算法,第三節(jié)介紹高斯混和模型和LPCC特征參數(shù),第四節(jié)給出相應的說話人識別系統(tǒng)實驗和結果,最后是簡要的討論與展望。

2主分量神經(jīng)網(wǎng)絡(PCANN)

主分量神經(jīng)網(wǎng)絡是基于Hebb 學習規(guī)則的線性無監(jiān)督學習神經(jīng)網(wǎng)絡, 它可以通過對權矩陣W 的學習, 使W接近于原始數(shù)據(jù)X的關聯(lián)矩陣C中特征值所對應的特征向量, 而不必進行矩陣求逆運算,提高了運算速度。
2.1    基于Hebb學習的最大特征濾波器      

2.2    基于Hebb 學習的主分量分析網(wǎng)絡

圖3:提取前m個主分量的神經(jīng)網(wǎng)絡解析圖

3識別系統(tǒng)特征參數(shù)以及模型

3.1 語音的主分量特征參數(shù)(PCA特征)
本文選用線性預測倒譜系數(shù)(LPCC)作為語音的原始特征參數(shù)然后對其進行主分量分析。LPCC系數(shù)是一種非常重要的特征參數(shù)。它的主要優(yōu)點是比較徹底地去掉了語音產(chǎn)生過程中的激勵信息,主要反映聲道相應,而且往往只要十幾個倒譜系數(shù)就能較好地描述語音信號的共振峰特性,因此在識別中取得了較好的效果。在實際計算中,LPCC參數(shù)不是由信號直接得到的,而是由LPC系數(shù)得到的。關系式如下:


          (8)
這里 實際上是直流分量,反映頻譜能量,其值的大小不影響譜形,在識別中通常不用,也不去計算。當LPCC系數(shù)個數(shù)不大于LPC系數(shù)個數(shù)時用第二式,當LPCC系數(shù)個數(shù)大于LPC系數(shù)個數(shù)時,用第三式進行計算。

4實驗及結果分析
本文實現(xiàn)了一個在噪聲環(huán)境下與文本無關的說話人自動識別系統(tǒng)。使用的是一個含20人的語音數(shù)據(jù)庫,包括10名男性和10名女性,每人語音長度約90秒。采樣率為12kHz,采用16bit量化。

首先對數(shù)據(jù)進行預處理,包括端點檢測、預加重(H(z)=1-0.95 )和加窗(Hamming窗,幀長20ms,幀移10ms)。原始特征選為12階的LPCC倒譜參數(shù),主分量特征個數(shù)選12階。高斯模型混合數(shù)M=16。訓練音長為40s,測試音為3s。實驗結果如表(1):

表1  實驗結果(%)

圖(4)是根據(jù)表(1)中的數(shù)據(jù)畫出的曲線。

從表(1)可以看出,與傳統(tǒng)的GMM方法相比,PCANN_GMM方法明顯增強系統(tǒng)抗噪聲能力,改進了識別效果。并且在PCANN_GMM中,幀數(shù)不同對識別也有較小的影響,當幀數(shù)大于5幀時,系統(tǒng)的識別性能不再提高。

5總結

本文運用PCANN/GMM方法進行說話人識別,將多幀特征參數(shù)合并為一幀,利用了幀間相關性,對其進行主分量分析,減少了冗余度,提高了系統(tǒng)的魯棒性。另外,當前的說話人識別研究還主要集中在聲學特征層次進行,基于人們說話中含有的高級特征所進行的研究雖然很多,下一步的工作將結合聲學特征和高級特征,研究它們之間的關系,從而進一步提高說話人識別系統(tǒng)的性能。
 
參考文獻

[1] 趙力. 語音信號處理 北京:機械工業(yè)出版社,2003
[2] E.Oja. “A Simplified Neural Model as a Principal Components Analyzer”,Journal of Mathematic Biology,VOL.19,pp.267-273,1982
[3] Sanger T D. “Optimal Unsupervised Learing In a Singer Layer Linear Feedforward Neural Network”,Neural Networks, pp459-473, 1989
[4] 何振亞 顧明亮 語音信號的主分量特征 應用科學學報, VOL 17,NO.4,1999
[5]  Simon Haykin. 神經(jīng)網(wǎng)絡原理. 北京:機械工業(yè)出版社, 2004
[6] Chanchal Chatterjee. and Vwani P.Roychowdhury. “On Relative Convergence Properties of Principal Component Analysis Algorithms”,IEEE Transactions On Neural Networks, VOL.9,NO.2,March 1998
[7] Oh-Wook Kwon. and Kwokleung Chan. “Speech Feather Analysis Using Variational Bayesian PCA”,IEEE Signal Processing Letters,VOL.10,NO.5,May 2003

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉