264中 POC的計算方法

作者：jogh.264?? 參考代碼 JM86
一·參數說明
這一節闡述的是encoder.cfg 中的參數對編碼過程的影響
要注意的是encoder.cfg 中的參數跟input 結構體中的變量是一一對應的
?
?? StartFrame：從視頻流的第幾幀開始編碼
?? FramesToBeEncoded：指明了除去 B幀后將要被編碼的幀數
input->no_frames = FramesToBeEncoded
?? FrameSkip：指明了編碼過程中跳過的幀數，中間有 B 幀也算跳過一幀。
?? NumberBFrames：相鄰 I、P幀或相鄰的 P幀之間的 B 幀個數，必須有
???????????????????????? NumberBFrames< FrameSkip
input->successive_Bframe = NumberBFrames
?? IntraPeriod：I 幀出現的頻率。若 IntraPeriod="3"，則每 3 幀（不含 B 幀）中有一 I 幀；
?????????? IntraPeriod="0" 時只有第一幀是 I 幀。
?? IDRIntraEnable：此值為1時每個 I幀都是 IDR，否則只有第一個 I幀是 IDR。
?
舉例：在 StartFrame="0"
???????? FramesToBeEncoded="5"
???????? FrameSkip="3"
???????? NumberBFrames="2"
???????? IntraPeriod="3"
???????? IDRIntraEnable="1"
?????? 的情況下編碼情況如下，其中紅色代表 IDR 幀?
表 1
視頻流? 0? 1? 2? 3? 4? 5 6 7 8 9 10 11 12 13 14? 15? 16? 17
編碼流? I? B? B??? P? B B?? P B B?? I B B??? P??
編碼順序? 0? 2? 3??? 1? 5 6?? 4 8 9?? 7 11 12??? 10??
二·pic_order_cnt_type 為 0 的情況
這種情況下顯式的計算 POC
（1）? 編碼端 I 幀或 P 幀 toppoc 的計算
這個過程在 main()函數的組循環
??? “for (img->number=0; img->number < input->no_frames; img->number++){ }”
中實現
z? IntraPeriod或 IDRIntraEnable 為零時
這種情況下只有第一個 I 幀是 IDR 幀，比較簡單。對于 I幀或 P 幀，其頂場的 POC 為
????????? (img->number) * (2*(input->successive_Bframe+1)) z? IntraPeriod和 IDRIntraEnable 都不為零時
這種情況下每個 I 幀都是 IDR 幀，其 POC 必須設置為零， I幀出現的頻率為 IntraPeriod，
故其 toppoc為
??? (img->number % input->intra_period) * (2*(input->successive_Bframe+1))
z? 說明：
原程序中使用了宏定義 IMG_NUMBER
??? “#define IMG_NUMBER (img->number - start_frame_no_in_this_IGOP)”
通過搜start_frame_no_in_this_IGOP可知這個變量在NumberOfFrameInSecondIGOP為0
（encoder_main.cfg 中就是這樣設置的）時恒為 0，故有
?????????? IMG_NUMBER = img->number
（2）? 編碼端 B幀 POC 的計算
由表一可知，在編完一 I 幀或 P 幀之后才開始對它前面的 B幀進行編碼
?
? for (img->number=0; img->number < input->no_frames; img->number++)
? {
? ……I，P 幀編碼……
? if ((input->successive_Bframe != 0) && (IMG_NUMBER > 0))??
{
??? ……
??? for(img->b_frame_to_code=1; img->b_frame_to_code<=input->successive_Bframe;???
????????????????????????????????????????????????? img->b_frame_to_code++)
?? {
?? }
?
z? IntraPeriod或 IDRIntraEnable 為零時toppoc 等于
???? 2+(img->number-1) * (2*(input->successive_Bframe+1))?
?????? +2* (img->b_frame_to_code-1)
a)? 第一個 2 指得是 IDR 的兩個場;
b)? img->number要減一是因為要對當前幀(img->number)前面的 B幀進行編碼；
?
z? IntraPeriod和 IDRIntraEnable 都不為零時 toppoc等于
??? 2+(img->number % input->intra_period-1) * (2*(input->successive_Bframe+1))
??? +2* (img->b_frame_to_code-1)
IDR 幀前面
（3）? toppoc 到 pic_order_cnt_lsb 的轉化
??????? img->pic_order_cnt_lsb
?????? =img->toppoc &
??????? ~((((unsigned int)( –1)) << (log2_max_pic_order_cnt_lsb_minus4+4)))
?
z? (unsigned int)(-1)的十六進制形式是 0xffffffff，即它的每一位都是 1；
z? log2_max_pic_order_cnt_lsb_minus4+4是圖象數目（包括 B 幀）最大值的位數 z? 當 toppoc >0時，img->pic_order_cnt_lsb=img->toppoc
當 toppoc <0時，img->pic_order_cnt_lsb= max_pic_order_cnt+ img->toppoc
其中 max_pic_order_cnt=1<<( log2_max_pic_order_cnt_lsb_minus4+4)
z? 疑問：
不知道 toppoc 到 pic_order_cnt_lsb 這個過程有什么意義；
POC 的值會從 0 變到很大，為什么不對它進行熵編碼；
（4）? 解碼端 toppoc 的恢復
? 此過程在函數 decode_poc 中執行。其思想是對于 IDR 前的 B 幀
??????????? Toppoc = pic_order_cnt_lsb - max_pic_order_cnt
否則?
?????????????? Toppoc = pic_order_cnt_lsb
是否減去 max_pic_order_cnt 由變量 PicOrderCntMsb 決定，對于 IDR 前的 B 幀
?????????? PicOrderCntMsb = (– max_pic_order_cnt)
否則
?????????? PicOrderCntMsb = 0
到這就不難理解 PicOrderCntMsb 的含義了， PicOrderCntMsb 反映了 toppoc的值是否小于 0。
至于另外兩個參數：PrevPicOrderCntMsb 總是為 0；PrevPicOrderCntLsb 在當前圖象是 IDR
或 IDR 前（視頻流中）的 B 幀時為0，否則等于前一圖象（編碼序列中）的 PicOrderCntLsb。?
三·pic_order_cnt_type 為 1 的情況
這種情況下通過 frame_num來計算 POC
（1）frame_num 簡介
參考《畢厚杰》7.3.4 節中 frame_num 條款的解釋，對于表 1 中的圖象序列，其 frame_num?????
的值參考如下：
?
表 2
視頻流? 0? 1? 2? 4? 5 6 8 9 10 12 13 14? 16
編碼流? I? B? B? P? B B P B B I B B P
編碼順序? 0? 2? 3? 1? 5 6 4 8 9? 7 11 12? 10
frame_num? 0? 2? 2? 1? 3 3 2 1 1? 0 2 2 1
poc? 0? 2? 4? 6? 8 10 12 -4 -2 0 2 4 6
?
（2）算法思想以及其解碼端的實現
z? 對于 IDR 幀，poc = 0；
z? 對于 I 幀或P 幀
????? poc = frame_num*2*(input->successive_Bframe+1)
或??
????? poc = 2*(input->successive_Bframe+1)
?????????? + (frame_num – 1)*2*(input->successive_Bframe+1) 解碼端實現
????? poc = img->ExpectedPicOrderCnt
?????????? + img->delta_pic_order_cnt[0]?? (在 I，P 幀下為 0)
z? 對于 I 幀或P 幀之前的 B 幀（視頻流中）
??????????? poc = (frame_num – 1)*2*(input->successive_Bframe+1)
?????????? – 2*(input->successive_Bframe+1 – img->b_frame_to_code)
或
????? poc = 2*(input->successive_Bframe+1)
?????????? + (frame_num – 1 – 1)*2*(input->successive_Bframe+1)
?????????? + 2*( img->b_frame_to_code – 1)
?????????? – 2*input->successive_Bframe
解碼端的實現
????? poc = img->ExpectedPicOrderCnt
?????????? + img->delta_pic_order_cnt[0]
?????????? + active_sps->offset_for_non_ref_pic
z? 變量說明
a)? 其中 img->b_frame_to_code請參見標題一·（2）
b)? img->disposable_flag = (nalu->nal_reference_idc = = 0)，而 nal_reference_idc 只在 B 幀時
為0，即img->disposable_flag只在B幀時為1。這也是在B幀情況下img->AbsFrameNum
要比 I 幀或P 幀多減去一個 1 的原因。
c)? 其它變量參見下面小題；
（3）編碼端參數設置
a)? img->num_ref_frames_in_pic_order_cnt_cycle：
??? 這個參數在 init_poc( )函數中設置為 1 后就再沒改動過；
b)? img->offset_for_ref_frame[0]? ：
?? 在 StoredBPictures為0 時等于 2*(input->successive_Bframe+1)；
c)? img->offset_for_ref_frame[1]? ：
?? 沒什么用，264 頭文件中不會保存此變量；
d)? img->delta_pic_order_cnt[0]? ：
?? 這個變量只對 B 幀有用，等于 2*(img->b_frame_to_code –1)；? 對于 I 幀或 P 幀，??
???????? 其值為 0；
e)? active_sps->offset_for_non_ref_pic：
?? 只對 B 幀有用，在 StoredBPictures 為0 時等于–2*input->successive_Bframe,?

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/455953.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/455953.shtml
英文地址，請注明出處：http://en.pswp.cn/news/455953.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！