H.264的技術優勢及其在H.323系統中的應用

一、引言

  近年來,隨著我國通信網絡基礎設施的快速建設,視訊業務由于可以為處于多點的與會者提供音視頻等多種信息,節省大量費用,提高工作效率,因而發展迅速,并有望成為NGN的主要業務。視訊會議系統從產生至今,發展了多種適于各類通信網絡的系統,目前傳輸多媒體信息的主要有H.323、H.324和H.320等系統。IP技術的開放性特點使得它非常適合承載多種業務,隨著IP的安全和QoS等問題的逐步解決,以IP作為承載網的優勢將更加明顯,下一代網絡也將采用IP技術作為承載網技術。因此,本文以適用于在IP網上提供多媒體業務的H.323系統為主進行闡述。H.264是由JVT為實現視頻的更高壓縮比,更好的圖像質量和良好的網絡適應性而提出的新的視頻編解碼標準。事實證明,H.264編碼更加節省碼流,它內在的抗丟包、抗誤碼能力和良好網絡適應性使它非常適于IP傳輸,H.264有望成為H.323系統中首選的視頻標準。

  H.323系統對視頻編解碼標準提出了以下三個主要要求:

  (1)一些IP網絡接入方式如xDSL可提供的帶寬有限,除去音頻、數據占用的帶寬,傳輸視頻的可用帶寬就更少,這就要求視頻編解碼壓縮率高,這樣就可以在一定的比特率下具有更好的圖像質量。

  (2)抗丟包性能和抗誤碼性能好,適應各種網絡環境,包括丟包和誤碼嚴重的無線網絡。

  (3)網絡適應性好,便于視頻流在網絡中傳輸。 < type="text/javascript">< type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js">?

  二、H.264適于H.323系統的三個技術優勢

  H.264在制定時充分考慮了多媒體通信對視頻編解碼的各種要求,并借鑒了以往視頻標準的研究成果,因而具有明顯的優勢。以下將結合H.323系統對視頻編解碼技術的要求,闡述H.264的三個優勢。

  1. 壓縮率和圖像質量方面

  對傳統的幀內預測、幀間預測、變換編碼和熵編碼等算法的改進,使H.264的編碼效率和圖像質量在以往標準的基礎上進一步提高。

  (1)可變塊大小:幀間預測時可以靈活選擇塊的大小。在宏塊(MB)劃分上H.264采用了16×16,16×8,8×16,8×8四種模式;當劃分為8×8模式時,又可進一步采用8×4、4×8、4×4三種子宏塊劃分模式進一步劃分,這樣可以使運動物體的劃分更加精確,減小預測誤差,提高編碼效率。幀內預測一般采取兩種亮度預測模式:Intra_4×4和Intra_16×16。Intra_4×4適合圖像中細節豐富的區域,而Intra_16×16模式更適合粗糙的圖像區域。

  (2)高精度運動估值:在H.264中亮度信號運動補償預測的精度是1/4像素。如果運動矢量指向參考圖像的整像素位置,預測值就是該位置上參考圖像像素的值;否則使用6階FIR濾波器的線性內插獲得1/2像素位置的預測值,通過取整數和1/2像素位置像素值均值的方式獲得1/4像素位置的值。顯然采用高精度運動估計會進一步減小幀間預測誤差。

  (3)多參考幀運動估值:每一個M×N亮度塊都要經過運動補償預測得到運動矢量和參考圖像索引,子宏塊中的每個子宏塊劃分都會有不同的運動矢量。選擇參考圖像過程是在子宏塊層次上進行的,因而一個子宏塊中的多個子宏塊劃分在預測時使用相同的參考圖像,而同一個slice的多個子宏塊之間選擇的參考圖像可以不同,這就是多參考幀運動估值。

  (4)參考圖像的選取更加靈活:參考圖像甚至可以是采用雙向預測編碼方式的圖像,這就允許選取與當前圖像更加匹配的圖像為參考圖像進行預測,從而可以減小預測誤差。

  (5)加權預測:允許編碼器以一定的系數對運動補償預測值進行加權,從而在一定的場景下可以提高圖像質量。

  (6)運動補償循環內的消除塊效應濾波器:為消除在預測和變換過程中引入的塊效應,H.264也采用了消除塊效應濾波器,但不同的是H.264的消除塊效應濾波器位于運動估計循環內部,因而可以利用消除塊效應以后的圖像去預測其他圖像的運動,從而進一步提高預測精度。

  2. 抗丟包和抗誤碼方面

  參數集、片的使用、FMO、冗余片等關鍵技術的使用可以大大提高系統的抗丟包和抗誤碼性能。

  (1)參數集:參數集及其靈活的傳送方式會大大降低因關鍵的頭信息丟失而造成錯誤發生的可能。為保證參數集可靠地到達解碼器端,可以采用重發的方式多次發送同一參數集,或傳送多個參數集。

  (2)片(slice)的使用:圖像可以劃分成一個或幾個片。將圖像劃分為多個片,當某一片不能正常解碼時的空間視覺影響就會大大降低,而且片還提供了重同步點。

  (3)PAFF和MBAFF:當對隔行掃描圖像進行編碼時,由于兩個場之間存在較大的掃描間隔,這樣,對運動圖像來說幀中相鄰兩行的空間相關性相對于逐行掃描時就會減小,這時對兩個場分別進行編碼會更節省碼流。對幀來說,存在三種可選的編碼方式,將兩場合并作為一幀進行編碼或將兩場分別編碼或將兩場合并起來作為一幀,但不同的是將幀中垂直相鄰的兩個宏塊合并為宏塊對進行編碼。前兩種稱為PAFF編碼,對運動區域進行編碼時場方式有效,非運動區域由于相鄰兩行有較大的相關性,因而幀方式會更有效。當圖像同時存在運動區域和非運動區域時,在MB層次上,對運動區域采取場方式,對非運動區域采取幀方式會更加有效,這種方式就稱為MBAFF。

  (4)FMO:通過FMO可以進一步提高片的差錯恢復能力。通過片組(slice group)的使用,FMO改變了圖像劃分為片和宏塊的方式。宏塊到片組的映射定義了宏塊屬于哪一個片組。利用FMO技術,H.264定義了七種宏塊掃描模式。

  (1)幀內預測:H.264借鑒了以往視頻編解碼標準在幀內預測上的經驗,值得注意的是,在H.264中,IDR圖像可以使參考圖像緩存無效,之后的圖像在解碼時不再參考IDR圖像之前的圖像,因而IDR圖像具有很好的重同步作用。在一些丟包和誤碼嚴重的信道中,可以采取不定期傳送IDR圖像的方式進一步提高H.264的抗誤碼和抗丟包性能。

  (2)冗余圖像:為提高H.264的解碼器在發生數據丟失時的頑健性,可以采用傳送冗余圖像的方式。當基本圖像丟失時,可以通過冗余圖像重構原圖像。

  (3)數據劃分:由于運動矢量和宏塊類型等信息相對于其他信息具有更高的重要性,因而在H.264中引入了數據劃分的概念,將片中語義彼此相關的語法元素放在同一個劃分中。在H.264中有三類不同的數據劃分,三類數據劃分分開傳送,若第二類或第三類劃分的信息丟失,使用差錯恢復工具仍然可以通過第一類劃分中的信息對丟失信息進行適當恢復。

  (4)多參考幀運動估值:多參考幀運動估值不但可以提高編碼器的編碼效率,還可以提高差錯恢復能力。在H.323系統中,通過使用RTCP,當編碼器得知有參考圖像丟失時,可以選擇解碼器已經正確接收的圖像作為參考圖像。

  (5)為阻止錯誤在空間上的蔓延,解碼器端可以指定當P片或B片中的宏塊在做幀內預測時不使用相鄰的非幀內編碼宏塊作為參考。

  3. 網絡適應性方面

  為適應各種網絡環境和應用場合,H.264定義了視頻編碼層(VCL)和網絡提取層(NAL)。其中VCL功能是進行視頻編解碼,包括運動補償預測,變換編碼和熵編碼等功能;NAL用于采用適當的格式對VCL視頻數據進行封裝打包。

  (1)NAL Units:視頻數據封裝在整數字節的NALU中,它的第一個字節標志該單元中數據的類型。H.264定義了兩種封裝格式。基于包交換的網絡(如H.323系統)可以使用RTP封裝格式封裝NALU。而另外一些系統可能要求將NALU作為順序比特流傳送,為此H.264定義了一種比特流格式的傳輸機制,使用start_code_prefix將NALU封裝起來,從而確定NAL邊界。

  (2)參數集:以往視頻編解碼標準中GOB/GOP/圖像等頭信息是至關重要的,包含這些信息的包的丟失常導致與這些信息相關的圖像不能解碼。為此H.264將這些很少變化并且對大量VCL NALU起作用的信息放在參數集中傳送。參數集分為兩種,即序列參數集和圖像參數集。為適應多種網絡環境,參數集可以帶內傳送,也可以采用帶外方式傳送。

  三、在H.323系統中實現H.264

  由于H.264是一種新的視頻編解碼標準,在H.323體系中應用H.264存在一些問題,比如如何在H.245能力協商過程中定義實體的H.264能力,因此必須對H.323標準進行必要的補充和修改。為此,ITU-T制定了H.241標準。本文僅介紹與H.323相關的修改。

  首先,要規定如何在H.245能力協商過程中定義H.264能力。H.264能力集是一個包含一個或多個H.264能力的列表,每一個H.264能力都包含Profile和Level兩個必選參數和CustomMaxMBPS、CustomMaxFS等幾個可選參數。在H.264中,Profile用于定義生成比特流的編碼工具和算法,Level則是對一些關鍵的參數要求。H.264能力包含在GenericCapability結構中,其中CapabilityIdentifier的類型為standard,值為0.0.8.241.0.0.1,用于標識H.264能力。MaxBitRate用于定義最大比特率。Collapsing字段包含H.264能力參數。Collapsing字段第一個條目是Profile,ParameterIdentifier類型為standard,值為41,用于標識Profile,ParameterValue類型為booleanArray,其值標識Profile,可以為64、32或16,這三個值依次表示Baseline、Main和Extended三個Profile;Collapsing字段第二個條目是Level,ParameterIdentifier類型為standard,值為42,用于標識Level,ParameterValue類型為unsignedMin,其值標識H.264 AnnexA中定義的15個可選的Level值。其他的幾個參數作為可選項出現。

  其次,由于H.264中圖像的組織結構與傳統的標準不同,一些原有的H.245信令不在適用于H.264,如MiscellaneousCommand中的videoFastUpdateGOB等,因此H.241重新定義了幾個信令提供相應功能。

  最后,H.264的RTP封裝參考RFC 3550,載荷類型(PT)域未作規定。

  四、結束語

  作為一種新的國際標準,H.264在編碼效率、圖像質量、網絡適應性和抗誤碼方 < type="text/javascript">< type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js">?
面都取得了成功。但隨著終端和網絡的快速發展,對視頻編解碼的要求在不斷提高,因此H.264仍在繼續地完善和發展以適應新的要求。現在對H.264的研究主要集中在如何進一步降低編解碼時延、算法優化和進一步提高圖像質量上。目前,使用H.264進行編解碼的視頻會議系統越來越多,大多數做到了在Baseline Profile上的互通。隨著H.264自身的不斷完善和視頻通信的不斷普及,相信H.264的應用將越來越廣泛。

■ 參考文獻
[1] I TU-T H.241.Extended video procedures and control signals for H.300 series terminals.July 2003
[2] Wiegand T,Sullivan G J,BjΦntegaard G.Overview of the H.264/AVC video coding standard.IEEE Trans,Circuits,Syst Video Technol,2003,13(7)

?

本文來自CSDN博客,轉載請標明出處:http://blog.csdn.net/fengyv/archive/2006/05/11/723573.aspx

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/456061.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/456061.shtml
英文地址,請注明出處:http://en.pswp.cn/news/456061.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python中的列表

列表操作 一組有序數據的組合就是列表 創建列表 空列表 方式1&#xff1a;變量 []方式2&#xff1a; 變量 list() 具有一個數據的列表 變量 [值] 備注&#xff1a;列表中保存的每個都稱之為元素具有多個數據的列表 變量 [值,值,值....]普通操作 訪問列表中的元素 …

高通被歐盟指控壟斷 或將面臨高達25億美元罰款

在被韓國指控違反反壟斷規定后&#xff0c;高通近期又被歐盟指控以壟斷方式排擠競爭對手。在11月10日的聽證會上高通將回應有關指控。高通有可能因此遭受25億美元的巨額罰款。 歐盟之前就曾經指出&#xff0c;高通在2009至2011年以低于成本價售賣部分基帶芯片&#xff0c;將英國…

wireshark

wireshark使用&#xff1a; http://wenku.baidu.com/link?urljIT43RWZbHissG70TK_hqVKRO6KWNZ4nK9RfncaFA5p-mrmjxsNd2aIapcKTtDDAjG0mddEKiLtwbqpu3Z12bXStDiDevZUGWTPxop4mKhG wireshark開源代碼相關&#xff1a; http://blog.csdn.net/zx824/article/details/7207713 轉載于…

1萬條數據大概占多大空間_國漫丨2019年上半年漫畫數據報告

文 │ 骨朵國漫一、各漫畫平臺總體趨勢1、快看漫畫快看漫畫平臺2019年Q2各月評論數較Q1有較明顯的下滑&#xff0c;月評論數都在400萬條左右&#xff1b;收藏數方面&#xff0c;2019年2月達到了半年內最高值&#xff0c;為2660.1萬條。2、看漫畫、知音漫客等平臺(小明太極旗下)…

【機器學習】 LightGBM——優于XGBoost提升的集成算法(安裝+對比XGBoost改進+參數說明+python代碼實例)

中文官方文檔&#xff1a;http://lightgbm.apachecn.org/cn/latest/Installation-Guide.html 英文官方文檔&#xff1a;https://lightgbm.readthedocs.io/en/latest/ 一、lightGBM安裝 在anaconda中輸入&#xff1a;pip install lightGBM即可 輸入import lightgbm as lgb做測…

H.264簡單總結

&#xff08;quan整理&#xff09;一、視頻信息和信號的特點 < type"text/javascript">< type"text/javascript" src"http://pagead2.googlesyndication.com/pagead/show_ads.js"> 1&#xff0e;1直觀性 利用人的視覺系統&am…

輕量級代碼生成器-OnlyCoder 第一篇

程序猿利器&#xff1a;代碼生成器&#xff0c;使用代碼生成器已經好幾年了&#xff0c;增刪改查各種生成&#xff0c;從UI到DATA層均生成過。之前有使用過動軟的&#xff0c;T4模板等.... T4生成實體還是沒有問題的&#xff0c;但是生成MVC視圖就有點煩雜了&#xff0c;動軟給…

python中的元組操作

元組操作 元組也是一組有序數據的組合&#xff0c;和列表唯一的不同是&#xff0c;元組不可修改 列表 用鉛筆寫的清單(能擦能改) 元組 用鋼筆寫的清單(不能擦改) 創建元組 創建空元組 方式1&#xff1a;變量 ()方式2&#xff1a; 變量 tuple() 創建單個元素的元組 方式1…

從Java到Go面向對象--繼承思想.md

2019獨角獸企業重金招聘Python工程師標準>>> Go語言實現繼承 我們都知道Java中通過extends來實現對象的繼承&#xff0c;那么Go中怎么實現繼承呢&#xff1f;Go語言沒有繼承&#xff0c;只有組合。我們知道&#xff0c;繼承的目的是什么&#xff0c;是類的重用&…

電腦鍵盤練習_電腦新手最關心的:零基礎如何快速掌握電腦打字的技巧?

隨著計算機的普及&#xff0c;越來越多的人在工作和生活中需要使用計算機。有的朋友通過參與培訓學會了鍵盤打字&#xff0c;有的朋友自學成才學會了鍵盤打字。這里筆者給大家分享在0基礎的情況下&#xff0c;通過自學快速掌握鍵盤打字的一種方法。需要說明的是&#xff0c;鍵盤…

【解決】jupyter在deepin安裝上的坑

報錯&#xff1a;env: "wine": 沒有那個文件或目錄 jupyter打開之后無法直接跳轉瀏覽器 解決方法&#xff1a; 1、 生成配置文件jupyter notebook --generate-config 2、打開jupyter_notebook_config.py&#xff0c;在文件最后添加以下代碼 選擇你的瀏覽器位置 …

鹽城出臺推進大數據產業發展實施意見

日前&#xff0c;鹽城市政府印發了《關于推進大數據產業發展的實施意見》&#xff08;下稱《實施意見》&#xff09;&#xff0c;從指導思想、推進原則、發展目標、發展方向、重點工程和保障措施六個方面明確了鹽城市加快培育和發展大數據產業的具體實施意見&#xff0c;這是該…

json字符串轉換成json對象

Json字符與Json對象的相互轉換方式有很多&#xff0c;接下來將為大家一一介紹下&#xff0c;感興趣的朋友可以參考下哈&#xff0c;希望可以幫助到你1>jQuery插件支持的轉換方式&#xff1a; 代碼如下:$.parseJSON( jsonstr ); //jQuery.parseJSON(jsonstr),可以將json字符串…

python中的字典

字典操作 以鍵值對方式存在的無序數據的組合就是字典 創建字典 創建空字典 方式1&#xff1a;變量 {}方式2&#xff1a; 變量 dict() 創建多個元素的字典 方式1&#xff1a;變量 {鍵:值,鍵:值....}方式2&#xff1a;變量 dict({鍵:值,鍵:值....})方式3&#xff1a;變量 …

【深度學習】Win10安裝TensorFlow_gpu(避坑必看)

不用gpu的tensorflow 是沒有靈魂的Tensorflow 因為就是為了快&#xff01;快二十倍 FIRST Q&#xff1a;系統及顯卡版本問題&#xff01;!!! 到官網看&#xff01;別看別的博客 ~鏈接&#xff1a; Windows端&#xff1a;https://tensorflow.google.cn/install/source_wind…

SCL定時 1500_iPhone12開售當天黃牛加價1500,哪里買最劃算?

10月23日&#xff0c;蘋果iPhone12全系列正式開售。首批貨源非常搶手&#xff0c;各地的蘋果商店門口都排起了長隊&#xff0c;現場黃牛甚至加價1500元收購用戶手機。開賣首日熱度高&#xff0c;官方最快一周發貨據蘋果官網介紹&#xff0c;此次iPhone12系列共有4款機型&#x…

H.264編解碼

H.264是由ITU-T&#xff08;ITU Telecommunication Standardization Sector&#xff0c;國際電信聯盟遠程通信標準化組&#xff09;視頻編碼專家組&#xff08;VCEG&#xff09;和ISO/IEC動態圖像專家組&#xff08;MPEG&#xff09;聯合組成的聯合視頻組&#xff08;JVT&#…

Web開發基礎

-------------------siwuxie095 HTML HTML 即 HyperText Markup Language&#xff0c;超文本標記語言 由服務器返回&#xff0c;瀏覽器呈現 服務器 即 HTTP 服務器&#xff0c;如&#xff1a;Apache、Nginx、Tomcat 一段 HTML 代碼&#xff0c;可以是存放在 HTTP 服務器上的一個…

飛信即將歸來:移動企業IM面臨的三大難題

企業即時通訊(以下稱“企業IM” ) 激戰正酣&#xff0c;中國移動也有意攪局。中國移動方面日前向北京商報記者透露&#xff0c;中國移動的IM產品將于下月正式上線&#xff0c;此次中國移動拿出的是淡出人們視線許久的飛信。由于傳統通信業務持續下滑&#xff0c;正在蓬勃發展的…

【FFmpeg】Win10環境下安裝FFmpeg(實現視頻音頻提取裁剪等)

FFmpeg概述 在語音識別領域內&#xff0c;如何識別準確識別語音的第一步就是要將從音頻文件中提取相關語音特征。同時對于各大語音接口如百度對于音頻文件格式要求高&#xff0c;但是對于實際情況下&#xff0c;我們不可能都能拿到WAV文件&#xff0c;因此必須將首先將各種格式…