www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 技術(shù)學(xué)院 > 基礎(chǔ)知識(shí)科普站
[導(dǎo)讀]對(duì)語(yǔ)音進(jìn)行編碼的目的是為了將語(yǔ)音數(shù)字化并利用人的發(fā)聲過(guò)程中存在的冗余度和人的聽(tīng)覺(jué)特性來(lái)降低編碼率。

對(duì)語(yǔ)音進(jìn)行編碼的目的是為了將語(yǔ)音數(shù)字化并利用人的發(fā)聲過(guò)程中存在的冗余度和人的聽(tīng)覺(jué)特性來(lái)降低編碼率。

1.1編碼的重要性編碼、傳輸、存儲(chǔ)和譯碼是語(yǔ)音數(shù)字傳輸和數(shù)字存儲(chǔ)的必要過(guò)程。隨著語(yǔ)音通信技術(shù)的發(fā)展,壓縮語(yǔ)音信號(hào)的傳輸帶寬,增加信道的傳輸速率,一直是人們追求的目標(biāo)。語(yǔ)音編碼在實(shí)現(xiàn)這一目標(biāo)的過(guò)程中擔(dān)當(dāng)重要的角色。語(yǔ)音編碼就是使表達(dá)語(yǔ)音信號(hào)的比特?cái)?shù)目最小。

1.2編碼速率用比特/秒(b/s或bps)來(lái)度量,用I表示,I=R·fs,R代表每個(gè)語(yǔ)音采樣值編碼所需的比特?cái)?shù);fs是采樣頻率。當(dāng)fs=8kHz,每個(gè)采樣值用8比特位來(lái)編碼,則編碼速率為64kb/s。

語(yǔ)音編碼就是對(duì)模擬的語(yǔ)音信號(hào)進(jìn)行編碼,將模擬信號(hào)轉(zhuǎn)化成數(shù)字信號(hào),從而降低傳輸碼率并進(jìn)行數(shù)字傳輸,語(yǔ)音編碼的基本方法可分為波形編碼、參量編碼(音源編碼)和混合編碼,波形編碼是將時(shí)域的模擬話音的波形信號(hào)經(jīng)過(guò)取樣、量化、編碼而形成的數(shù)字話音信號(hào),參量編碼是基于人類語(yǔ)言的發(fā)音機(jī)理,找出表征語(yǔ)音的特征參量,對(duì)特征參量進(jìn)行編碼,混合編譯碼是結(jié)合波形編譯碼和參量編譯碼之間的優(yōu)點(diǎn)。波形編譯碼器雖然可提供高話音的質(zhì)量,但數(shù)據(jù)率低于16kb/s的情況下,在技術(shù)上還沒(méi)有解決音質(zhì)的問(wèn)題。

2.1波形編碼基本原理是在時(shí)間軸上對(duì)模擬話音信號(hào)按照一定的速率來(lái)抽樣,然后將幅度樣本分層量化,并使用代碼來(lái)表示。在接收端將收到的數(shù)字序列經(jīng)過(guò)解碼恢復(fù)到原模擬信號(hào),保持原始語(yǔ)音的波形形狀。話音質(zhì)量高,編碼速率高。如PCM編碼類(a率或u率PCM、ADPCM、ADM),編碼速率為64-16kb/s,語(yǔ)音質(zhì)量好。波形編碼的目的在于盡可能精確地再現(xiàn)原來(lái)的語(yǔ)音波形,并以波形的保真度即自然度為其質(zhì)量的主要度量指標(biāo),但波形編碼所需的碼速率較高。

2.2參數(shù)編碼根據(jù)語(yǔ)音信號(hào)產(chǎn)生的數(shù)學(xué)模型,通過(guò)對(duì)語(yǔ)音信號(hào)特征參數(shù)的提取后進(jìn)行編碼(將特征參數(shù)變換成數(shù)字代碼進(jìn)行傳輸)。在接收端將特征參數(shù),結(jié)合數(shù)學(xué)模型,恢復(fù)語(yǔ)音,力圖使重建語(yǔ)音保持盡可能高的可懂度,重建語(yǔ)音信號(hào)的波形同原始語(yǔ)音信號(hào)的波形可能會(huì)有相當(dāng)大的區(qū)別。如線性預(yù)測(cè)(LPC)編碼類。編碼速率低,2.4-1.2kb/s,自然度低,對(duì)環(huán)境噪聲敏感。這種語(yǔ)音編碼的主要質(zhì)量指標(biāo)是可懂度,參量編碼可以將語(yǔ)音編碼以后的速率壓得很低。

2.3混合編碼(Hybridcoding)將波形編碼與參數(shù)編碼相結(jié)合,在2.4-1.2kb/s速率上能夠得到高質(zhì)量的合成語(yǔ)音?;旌暇幋a把波形編碼的高質(zhì)量和參量編碼的高效性融為一體,在參量編碼的基礎(chǔ)上附加一定的波形編碼特征,實(shí)現(xiàn)在可懂度的基礎(chǔ)上適當(dāng)?shù)馗纳谱匀欢鹊哪康摹S糜谝苿?dòng)通信中的語(yǔ)音編碼一般都是混合編碼。選擇混合編碼時(shí),要使比特率、質(zhì)量、復(fù)雜度和處理時(shí)延這4個(gè)參量及其關(guān)系達(dá)到綜合最佳化。

2.4語(yǔ)音編碼的極限速率語(yǔ)音中最基本的元素是音素,大約有128~256個(gè),如果按通常的說(shuō)話速度,每秒平均發(fā)出10個(gè)音素,則信息率為:I=[log2(256)10]bps=80bps把發(fā)音看成是以語(yǔ)音速率來(lái)傳送,則語(yǔ)音編碼的極限速率為80bps,從數(shù)字化標(biāo)準(zhǔn)的編碼速率64kbps,到極限速率80bps,之間的距離,對(duì)于理論研究和實(shí)踐有著極大的吸引力。

語(yǔ)音質(zhì)量是衡量語(yǔ)音編碼算法優(yōu)劣的關(guān)鍵性能之一。語(yǔ)音質(zhì)量通常分為四類:(1)廣播級(jí):寬帶(0-7000Hz)高質(zhì)量的語(yǔ)音,感覺(jué)不出噪聲存在(2)網(wǎng)絡(luò)或電話級(jí):200Hz-3200Hz,信噪比大于30db。(3)通信級(jí):完全可以聽(tīng)懂,但和長(zhǎng)途電話相比,有明顯失真。(4)合成級(jí):80%-90%可懂度,音質(zhì)較差,聽(tīng)起來(lái)像機(jī)器講話,失去了講話者的個(gè)人特征。語(yǔ)音質(zhì)量有主觀和客觀兩種評(píng)價(jià)方法

3.1主觀評(píng)價(jià)方法評(píng)價(jià)指標(biāo):清晰度或可懂度、音質(zhì)。前者是指語(yǔ)音是否容易聽(tīng)清楚;后者指語(yǔ)音聽(tīng)起來(lái)有多自然。(1)可懂度評(píng)價(jià)DRT:DiagnosticRhymerTest(2)音質(zhì)評(píng)價(jià):MOS:MeanOpinionScore平均意見(jiàn)得分DAM:DiagnosticAcceptabilityMeasure判斷滿意度得分。MOS得分為五級(jí):優(yōu)、良、可、差和壞。滿分為5分,相當(dāng)調(diào)頻廣播質(zhì)量;4分以上是長(zhǎng)途電話網(wǎng)標(biāo)準(zhǔn);3.5分為通信標(biāo)準(zhǔn);3.0分仍有較好的可懂度,保持自然度;2.5分只維持可懂度,是戰(zhàn)術(shù)通信標(biāo)準(zhǔn)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉