AVS與國際標準MPEG的區(qū)別
本文從技術(shù)角度對MPEG-2的視頻標準、MPEG-4 AVC/H.264和AVS視頻(GB/T 200090.2) 三個視頻標準進行對比,包括技術(shù)方案、主觀測試、客觀測試、復(fù)雜度等四個方面。
一、技術(shù)對比
AVS視頻與MPEG標準都采用混合編碼框架(見圖1),包括變換、量化、熵編碼、幀內(nèi)預(yù)測、幀間預(yù)測、環(huán)路濾波等技術(shù)模塊,這是當前主流的技術(shù)路線。AVS的主要創(chuàng)新在于提出了一批具體的優(yōu)化技術(shù),在較低的復(fù)雜度下實現(xiàn)了與國際標準相當?shù)募夹g(shù)性能,但并未使用國際標準背后的大量復(fù)雜的專利。AVS-視頻當中具有特征性的核心技術(shù)包括:8x8整數(shù)變換、量化、幀內(nèi)預(yù)測、1/4精度像素插值、特殊的幀間預(yù)測運動補償、二維熵編碼、去塊效應(yīng)環(huán)內(nèi)濾波等。
圖 1 典型視頻編碼框架
AVS視頻編碼器框圖如下圖所示。
圖 2 AVS視頻編碼器框圖
AVS視頻標準定義了I幀、P幀和B幀三種不同類型的圖像,I幀中的宏塊只進行幀內(nèi)預(yù)測,P幀和B幀的宏塊則需要進行幀內(nèi)預(yù)測或幀間預(yù)測,圖中S0是預(yù)測模式選擇開關(guān)。預(yù)測殘差進行88整數(shù)變換(ICT)和量化,然后對量化系數(shù)進行zig-zag掃描(隔行編碼塊使用另一種掃描方式),得到一維排列的量化系數(shù),最后對量化系數(shù)進行熵編碼。AVS視頻標準的變換和量化只需要加減法和移位操作,用16位精度即可完成。
AVS視頻標準使用環(huán)路濾波器對重建圖像濾波,一方面可以消除方塊效應(yīng),改善重建圖像的主觀質(zhì)量;另一方面能夠提高編碼效率。濾波強度可以自適應(yīng)調(diào)整。
AVS標準支持多種視頻業(yè)務(wù),考慮到不同業(yè)務(wù)之間的互操作性,AVS標準定義了檔次(profile)和級別(level)。檔次是AVS定義的語法、語義及算法的子集;級別是在某一檔次下對語法元素和語法元素參數(shù)值的限定集合。為了滿足高清晰度/標準清晰度數(shù)字電視廣播、數(shù)字存儲媒體等業(yè)務(wù)的需要,AVS視頻標準定義了基準檔次(Jizhun profile)和4個級別(4.0、4.2、6.0和6.2),支持的最大圖像分辨率從720576到19201080,最大比特率從10 Mbit/s到30 Mbit/s。
表1 AVS與MPEG-2、MPEG-4 AVC/H.264使用的技術(shù)對比和性能差異估計
視頻編碼標準
MPEG-2視頻
MPEG-4 AVC/H.264視頻
AVS視頻
AVS視頻與AVC/H.264性能差異估計
(采用信噪比dB估算,括號內(nèi)的百分比為碼率差異)
幀內(nèi)預(yù)測
只在頻域內(nèi)進行DC系數(shù)差分預(yù)測
基于4&TImes;4塊,9種亮度預(yù)測模式,4種色度預(yù)測模式
基于8&TImes;8塊,5種亮度預(yù)測模式,4種色度預(yù)測模式
基本相當
多參考幀預(yù)測
只有1幀
最多16幀
最多2幀
都采用兩幀時相當,幀數(shù)增加性能提高不明顯
變塊大小運動補償
16&TImes;16
16&TImes;8(場編碼)
16×16、16×8、8×16、8×8、8×4、4×8、4×4
16×16、16×8、8×16、8×8
降低約0.1dB
(2-4%)
B幀宏塊直接編碼模式
無
獨立的空域或時域預(yù)測模式,若后向參考幀中用于導(dǎo)出運動矢量的塊為幀內(nèi)編碼時只是視其運動矢量為0,依然用于預(yù)測
時域空域相結(jié)合,當時域內(nèi)后向參考幀中用于導(dǎo)出運動矢量的塊為幀內(nèi)編碼時,使用空域相鄰塊的運動矢量進行預(yù)測
提高0.2-0.3dB
(5%)
B幀宏塊雙向預(yù)測模式
編碼前后兩個運動矢量
編碼前后兩個運動矢量
稱為對稱預(yù)測模式,只編碼一個前向運動矢量,后向運動矢量由前向?qū)С?/p>
基本相當
¼像素運動補償
僅在半像素位置進行雙線性插值
½像素位置采用6拍濾波,¼ 像素位置線性插值
½像素位置采用4拍濾波,¼像素位置采用4拍濾波、線性插值
基本相當
變換與量化
8×8浮點DCT變換,除法量化
4×4整數(shù)變換,編解碼端都需要歸一化,量化與變換歸一化相結(jié)合,通過乘法、移位實現(xiàn)
8×8整數(shù)變換,編碼端進行變換歸一化,量化與變換歸一化相結(jié)合,通過乘法、移位實現(xiàn)
提高約0.1dB(2%)
熵編碼
單一VLC表,適應(yīng)性差
CAVLC:與周圍塊相關(guān)性高,實現(xiàn)較復(fù)雜
CABAC:計算較復(fù)雜
上下文自適應(yīng)2D-VLC,編碼塊系數(shù)過程中進行多碼表切換
降低約0.5dB(10-15%)
環(huán)路濾波
無
基于4×4塊邊緣進行,濾波強度分類繁多,計算復(fù)雜
基于8×8塊邊緣進行,簡單的濾波強度分類,濾波較少的像素,計算復(fù)雜度低
——
容錯編碼
簡單的條帶劃分
數(shù)據(jù)分割、復(fù)雜的FMO/ASO等宏塊、條帶組織機制、強制Intra塊刷新編碼、約束性幀內(nèi)預(yù)測等
簡單的條帶劃分機制足以滿足廣播應(yīng)用中的錯誤隱藏、恢復(fù)需求
——