H.264/AVC標準采用了很多新技術和新方法,大大提高了視頻編碼效率,其中CABAC便是H.264/AVC采用的新型熵編碼方法之一。CABAC采用了高效的算術編碼思想,同時充分考慮了視頻流相關統計特性,大大提高了編碼效率。概括起來,CABAC有三個豐要特點:
????? (1)上下文建模提供編碼符號條件概率分布的估計。利用適當的上下文模型,在編碼當前符號時,根據已編碼的臨近符號的概率統計,在不同的概率模型間轉換,借此去掉符號間的冗余。
????? (2)算術編碼可以給每一個符號字母分配非整數比特,因此符號能以接近它的熵率被編碼。這對概率大于O.5的符號很有效。如果選擇了高效的概率模型,符號概率常常大于O.5,這時分數比特就比UVLC的整數比特(至少1比特)高效得多。
????? (3)自適應的算術編碼可以使熵編碼器自適應動態符號的概率統計。一般情況下,運動矢量的概率統計隨空間、時間的不同,或序列、碼牢的不同可以發生較大的變化。因此,自適應模型由于充分利用已編碼符號的概率統計,可使算術編碼更好地適應當前符號的概率,從而提高了編碼效率。
CABAC包括三個部分:二進制化、上下文建模和二進制算術編碼
下面對每個部分進行詳述:
(1)二進制化
?????? CABAC是二進制算術編碼,對非二進制符號如運動矢量、宏塊類型、參考幀號以及變換量化后的殘差數據,需要預先進行二進制化。在H.264/AVC標準中,CABAC二進制化方案由基本方案和串接方案組成。基本方案有一元碼(Unary binarization,U),截斷一元碼(Truncatedunary binarization,TU),K階指數哥倫布碼(Kthorder Exp_golomb binarization,UEGK)和定長碼(Fixed.1ength binarization,FL)四種。串接方案由基本方案串接而成。不同的二進制化方案適用于不同類型的語法元素。對于數值變化范圍較大的殘差數據(如運動矢量與運動矢量預測值間的殘差數據MVD)用UEGK碼表示,對于簡單的符號標志元素用FL碼表示。下面是四種基本方案的編碼方法:
U二進制化編碼:此方法將一個無符號整數X,編碼為X個“1”并加上一個后綴位“0”。例如,整數3轉換為“lllO”。
TU二進制化編碼:此方法根據參數cMax采用不同的轉換方法。如果無符號整數x<cMax,用Unary binarization方法轉換;如果x=cMax,X被轉換成X個“1”。
UEGK二進制化編碼:用此方法轉換后的碼字由兩部分構成:前綴和后綴。前綴部分由Unary binarization轉換得到。
FL二進制化編碼:此方法為語法元素工設定固定的長度。假如0≤X<cMax,其長度L=
????? CABAC把待編碼的語法元素按照一定的規則轉換為只用“0”和“l”表示的二進制比特流,稱為比特流(bin string),然后采用不同的概率模型對bin string進行編碼,充分考慮了視頻流的相關性,能適應信號統計特性的變化,容易達到漸進性能。在編碼過程中,bin string的信源符號被分為大概率符號(Most Probability Symbol,MPS)和小概率符號(Least Probability Symbol,LPS)。若MPS為“0”,則LPS為“l"。反之,若NIPS為“l",則LPS為“0”。但當MPS與LPS的出現概率相差比較大時,根據信息熵的原理,bin string的熵值比較小,壓縮效果比較好。如果MPS與LPS出現概率相當或者相等,bin string的熵值就比較大,則壓縮效果不明顯。
(2)上下文建模
????? 編碼符號具有上下文相關性,利用已編碼符號提供的上下文信息,為編碼符號選擇合適的概率模型,這就是上下文建模。它是為了對與運動、模式和結構信息相關的句法元素進行編碼而設計的。通過對上下文模型的構建,摹本概率模型能夠適應隨視頻圖像而改變的統計特性,降低符號間的冗余度,并大大減少運算開支。
????? CABAC將片作為算術編碼的牛命周期,H.264/AVC標準將一個片內可能出現的數據劃分為399個上下文模型,每個模型均有自己的上下文序號(Ctxldx),每個不同的字符依據對應的上下文模型,來索引自身的概率查找表。即收到字符后,先索引該字符的Ctxldx,才能找到它的概率查找表(TransldxLPS)。這些模型的劃分精確到比特,幾乎大多數的比特和它們鄰近的比特處于不同的上下文模型中。查找每個比特所對應的上下文模型有兩個步驟:
????? 第一步:確定該比特所屬的句法元素。CABAC為每個句法元素分配了一個上下文模型區間,詳見Table9.1l。
????? 第二步:按照某一個法則為當前比特在上一步中得到的區間中找到對應的Ctxldx。該法則對不同的句法元素各不相同,它通常用表來表示。那些399個上下文模型模型分為4種類型:第一種類型根據左邊和上邊的語法元素對當前的語法元素進行預測。第二種類型僅用于宏塊類型和予宏塊類型。其中第n比特的類型要參考前面已編碼的n-1比特所采用的類型。第三、四種類型只用于殘差。第三種類型不依賴前面的編碼數據,而是依賴掃描路徑的位置。第四種類型還包括對編碼積聚數量的計算。在CABAC中用“個有代表性的概率值來表示LPS的概率。這64個概率值通過公式(3.1)和(3.2)來計算產生:
值可以用7個比特來表示。
?
?????? 前文提到CABAC的生命期是片,每個片開始,要對399種上下文模型全部過行初始化工作,初始化的步驟是:
?
?
?
?
?
?
?
?
?
?
(3)二進制算術編碼
?????? 概率估計和編碼器構成了一個自適應二進制算術編碼器。概率估計是在前一次上下文建模階段更新后的概率估計。在對每個二進制數值編碼過后,這個概率估計的值又要根據剛剛編碼的二進制符號進行調整。二進制算術編碼是算術編碼的特殊情況,其原理與一般算術編碼一樣。所不同的是,在二進制算術編碼中編碼序列只有“0"和“l一兩種符號,所涉及的概率也只有P(0)和P(1)。概率區間分成兩份,一份是MPS的編碼區間,一份是LPS的編碼區間。區間長度由每個信源符號的概率決定,LPS的編碼區間總應該小于MPS的編碼區間。若把LPS的概率記為Q,則MPS的概率記為P=I-Q。在編碼進程中,如果有連續的LPS輸入,有可能出現Q>P的情況,此時MPS和LPS所代表的信源符號要互換,以確保MPS所代表的信源符號的概率始終大于LPS所代表的信源符號的概率。在每個片開始時,CABAC進行初始化,建立了一個概率狀態表。在進行二進制算術編碼時,每一位的概率狀態值通過查概率狀態表得到。而且每編碼完一位,就要對概率狀態表中的狀態值進行更新。概率狀態值的更新是這樣實現的:如果編碼的比特位(binval)是NIPS,概率狀態值a加l,這意味著R值減小,(1.R)值增大,這實際就是表示下一次出現MPS的概率增大,出現LPS的概率減小。如果a=62,表示(1.n)已經達到最大,這時a不再改變,直到出現LPS。如果編碼的比特位biIlvm是LPS,且a=0,表示MPS和LPS的概率相等,MPS和LPS的值進行互換。具體的概率值更新參考公式(3.3)
?
?
?????? 為了方便觀察,我們給出CABAC概牢估計與更新模型圖(如圖3.2)。在處理binval時,概率的刷新有兩個方向:如果binval是LPS,則LPS的概率變大,順著下圖中的虛線向左尋找;如果binval是MPS,則LPS的概率變小,順著下圖中的實線向右尋找。我們可以看到,當出現MPS時的更新值都只是簡單地指向當前值的下一位,即a+l。也即,當前處理的字符為MPS時,區間遞進只是了區間的長度發生了改變,而作為影響實際輸出值的L卻沒有發生改變,這個現象意味著如果輸入流中連續出現大量的MPS,或者MPS相對LPS出現的概率比較高時,可以達到極高的壓縮效果,編碼輸出的碼率也更接近熵率。