隨著多媒體信息技術和網絡通信技術的迅猛發展,數字視頻技術的應用領域不斷拓寬,IPTV、立體電影和自由視頻等多樣化新型視頻服務業務的不斷涌現,視頻編碼已成為數字電視、網絡視頻和移動多媒體等信息產業的基礎核心技術之一,在安防、教育、廣電、傳媒等領域具有廣闊的應用前景。
國際上制定視頻編碼標準的兩大組織分別是ITU-T與ISO/IEC,ITU-T制定的標準主要適用于電視電話、會議電視等,包括:H.261/3/4等;ISO/IEC主要制定關于活動圖像的編碼標準,包括:MPEG-1/2/4,應用于廣播電視、DVD、因特網上的流媒體等。目前,在安防行業中MPEG-4正逐漸淡出人們的視線,雖然H.264依然是目前視頻編解碼標準的主流,但是新一代編碼標準H.265憑借更高的壓縮效率正趨向逐步替代H.264,成為未來安防行業乃至整個音視頻行業編解碼技術的主力軍;另外,中國自主研發的安防音視頻編解碼標準SVAC,提高了整體監控系統的安全性,但源于相關產業鏈的尚未成熟,目前還未有較大規模的應用,未來的市場具體應用情況會為我們作進一步的檢驗。
視頻編解碼原理及應用分析
視頻為什么要編碼?目的是為了壓縮。由于未經壓縮的視頻源常伴有海量數據的產生,以期通過擴大存儲器容量、增加通信干線的傳輸速率來進行每幀圖像的全部數據的存儲或傳輸是不現實的。多媒體聲音、視頻等信源數據之間有極強的相關性,存在大量的冗余信息,如:時間冗余、空間冗余、視覺冗余等,視頻編碼技術就是在保證視覺效果的前提下盡可能的提取有效信息,去除視頻作用不大的冗余信息來減少視頻數據率,通過壓縮的形式進行聲音、視頻的數字傳輸和存儲,而如何實現高效的壓縮則是視頻編碼領域長期存在的挑戰性問題。
視頻編碼主要由以下幾個處理階段組成:預測-變換-量化-熵編碼,如:預測階段會有空間、時間冗余的檢測、幀類運動的檢測、幀間檢測等;變換包括空間變換,DTP變換等;量化包括視覺冗余、圖像質量提高、壓縮比等。不同的視頻編解碼標準從時間差、技術發展上可以得知,其實是在繼承預測變換混合視頻編碼框架的基礎上,對預測、變換、量化、熵編碼等技術細節上做出優化與改進,其區別可能體現在圖像分辨力的定義、預測精度、包括搜索范圍、量化、補強等參數上的差異。
隨著多媒體信息技術和網絡通信技術的迅猛發展,數字視頻技術的應用領域不斷拓寬,IPTV、立體電影和自由視頻等多樣化新型視頻服務業務的不斷涌現,視頻編碼已成為數字電視、網絡視頻和移動多媒體等信息產業的基礎核心技術之一,在安防、教育、廣電、傳媒等領域具有廣闊的應用前景。
國際上制定視頻編碼標準的兩大組織分別是ITU-T與ISO/IEC,ITU-T制定的標準主要適用于電視電話、會議電視等,包括:H.261/3/4等;ISO/IEC主要制定關于活動圖像的編碼標準,包括:MPEG-1/2/4,應用于廣播電視、DVD、因特網上的流媒體等。目前,在安防行業中MPEG-4正逐漸淡出人們的視線,雖然H.264依然是目前視頻編解碼標準的主流,但是新一代編碼標準H.265憑借更高的壓縮效率正趨向逐步替代H.264,成為未來安防行業乃至整個音視頻行業編解碼技術的主力軍;另外,中國自主研發的安防音視頻編解碼標準SVAC,提高了整體監控系統的安全性,但源于相關產業鏈的尚未成熟,目前還未有較大規模的應用,未來的市場具體應用情況會為我們作進一步的檢驗。
視頻編解碼原理及應用分析
視頻為什么要編碼?目的是為了壓縮。由于未經壓縮的視頻源常伴有海量數據的產生,以期通過擴大存儲器容量、增加通信干線的傳輸速率來進行每幀圖像的全部數據的存儲或傳輸是不現實的。多媒體聲音、視頻等信源數據之間有極強的相關性,存在大量的冗余信息,如:時間冗余、空間冗余、視覺冗余等,視頻編碼技術就是在保證視覺效果的前提下盡可能的提取有效信息,去除視頻作用不大的冗余信息來減少視頻數據率,通過壓縮的形式進行聲音、視頻的數字傳輸和存儲,而如何實現高效的壓縮則是視頻編碼領域長期存在的挑戰性問題。
視頻編碼主要由以下幾個處理階段組成:預測-變換-量化-熵編碼,如:預測階段會有空間、時間冗余的檢測、幀類運動的檢測、幀間檢測等;變換包括空間變換,DTP變換等;量化包括視覺冗余、圖像質量提高、壓縮比等。不同的視頻編解碼標準從時間差、技術發展上可以得知,其實是在繼承預測變換混合視頻編碼框架的基礎上,對預測、變換、量化、熵編碼等技術細節上做出優化與改進,其區別可能體現在圖像分辨力的定義、預測精度、包括搜索范圍、量化、補強等參數上的差異。
H.264/AVC標準是ITU-T和ISO/IEC聯合開發的新一代數字視頻編碼標準,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10部分---AVC。與以往的國際編碼標準一樣,H.264采用傳統的基于塊的混合編碼框架,將輸入的圖像分成若干個大小為16x16的編碼塊,即宏塊;利用相鄰像素進行幀內預測或者前面參考圖像進行幀間預測,分別去除空域冗余和時域冗余,將原始編碼塊與預測塊相減得到預測殘差;之后對預測殘差進行頻域DCT變換得到變換系數并量化;最后利用熵編碼進行二進制編碼,最大限度地去除量化后數據間的符號統計冗余。H.264其核心部分是在視頻編碼層采用了多項先進編碼技術,如:多模式的空域幀內預測、更小尺寸的幀間預測、可變動運動估計、1/4像素精度運動估計補償、整數DCT變換、基于內容的熵編碼以及自適應去塊效應濾波等,并且利用率失真優化進行運動估計矢量和預測模式選擇,提高視頻編碼的率失真性能。
與MPEG-4等以往的編解碼標準相比,H.264最具價值的部分無疑是更高的數據壓縮比、更友好的網絡適應性。在不同分辨率、碼率下,H.264都能提供較高的視頻質量;在同等的視頻質量條件下,H.264的數據壓縮比相較于DVD系統中使用的MPEG-2高2-3倍,比MPEG-4高1.5-2倍,因此在網絡傳輸過程中所需的寬帶就更少;另外,采用“網絡友善”的結構和語法,使其更有利于網絡傳輸;其靈活性的增強也為不同的開發商提供了互聯互通的通用平臺,這些對于有大量視頻傳輸及存儲需求的網絡視頻監控系統來說都是非常重要的,也是其成為目前視頻編解碼標準主流的奠基石。
H.265
隨著超高清技術、云存儲等技術的快速發展,盡管網絡帶寬和存儲能力得到迅速提升,但是也未能真正滿足海量視頻數據對傳輸和存儲產生新的要求。在ITU-T與ISO/IEC聯合協作小組再次通力合作下制定的新一代高效視頻編碼國際標準H.265/HEVC,提高了視頻壓縮效率、傳輸友好特性、網絡適應性以及加強并行處理能力等,其突出的核心競爭力如下:
1、 在圖像分塊以及運動補償、變換塊方面,支持更大尺寸和更多種類。H.264中每個宏塊的固定大小都是16x16像素,而H.265的編碼單位采用更大的編碼單元,可以從8x8到64x64進行選擇,其目的在于減少高清數字視頻的宏塊個數,相當于對圖像進行了有重點的編碼,降低了整體碼率;
2、 幀內/幀間預測模式、運動矢量預測模式和變換模式更加多樣。使用新的運動矢量預測方式,區別于H.264基于空間域的運動矢量預測方式,H.265擴充更多方向的幀內預測,同時將預測塊的集合由原來的空間域擴展到時間域及空時混合域,通過率失真準則計算后選擇最佳的預測塊,以獲得更高的壓縮比、更低的傳輸帶寬;
3、 更高的分辨率定義可以支持高達4K和8K分辨率的視頻圖像,視頻幀率也從30fps向60fps、120fps甚至240fps的超高幀率提升;
4、 增加環內采樣自適應偏移SAO,通過對重建圖像的分類,對每一類圖像像素值加減一個偏移,達到減少失真的目的,從而提高壓縮率,減少碼流。數據表明,采用SAO后,平均可以減少2%~6%的碼流,而編碼器和解碼器的性能消耗僅僅增加了約2%;
5、 考慮到芯片趨向從單核向多核并行化方向發展,引入Tile、Entropy slice、WPP等并行運算思路,更好地支持并行運算,以提高編碼解碼效率。
有反復測試數據表明,在相同的圖象質量下,相比于H.264,通過H.265編碼的視頻大小將減少大約39-44%;在碼率減少51-74%的情況下,H.265編碼視頻的質量還能與H.264編碼視頻近似甚至更好。
盡管H.265涵蓋了H.264的所有應用范圍,能夠較好的解決當前視頻高清化、網絡化發展所帶來的帶寬、存儲、顯示的難題,但是它的推廣、普及并非能一蹴而就。浙江大華技術股份有限公司產品經理楊陽分析:“H.265屬于新技術,需要專門的芯片來支持,目前為止還需要更多的芯片廠家支持該協議;另外,還涉及到授權費問題,如果商用化就必須繳納相應的授權費用,目前還未制定出未來將會如何收費。”
SVAC
目前主流推廣的視音頻編碼國際標準基本都針對廣播電視和大眾娛樂方面的應用,在安防領域具有很大的不適應性。我國公安部第一研究所和中星微公司牽頭制定了SVAC標準,旨在解決當前安防監控領域存在的由于信源編碼標準不統一導致的難以互聯互通、核心技術匱乏和信息安全隱患等問題,創新性地提出了多項針對安防監控領域應用的視音頻編解碼特殊要求和實現手段,如:感興趣區域的變質量編碼、可伸縮視頻編碼以及支持安防監控專用信息、支持數據安全保護等8大技術創新(如下)。
1、支持高精度視頻數據,在高動態范圍場景提供更多圖像細節,減少編解碼環節的圖像信息損失;
2、采用幀內4x4預測與變換、上下文自適應二進制算術編碼(CABAC)等技術提高編碼效率,在獲得更好圖像質量的同時也能獲得更高的編碼效率;
3、支持感興趣區域(ROI)變質量編碼,在網絡帶寬或存儲空間有限的情況下,對圖像中指定區域的編碼參數調整,保證該區域比圖像中其他區域有更好的解碼重建圖像質量,提供更符合監控需要的高質量視頻編碼;
4、支持可伸縮視頻編碼(SVC),即多種分辨率視頻圖像同時編碼,根據傳輸帶寬和存儲空間動態切換編碼碼流,滿足不同傳輸網絡帶寬和數據存儲環境的需求;
5、支持代數碼書激勵線性預測(ACELP)和變換音頻編碼(TAC)切換的雙核音頻編碼,保證對語音和環境(背景)聲音均有較好的編碼效果;
6、支持聲音識別特征參數編碼,避免編碼失真對語音識別和聲紋識別的影響;
7、支持監控專用信息,在編碼視(音)頻碼流中嵌入包括絕對時間、智能分析結果、報警信息在內的監控專用信息,信息格式符合國家標準GB/T 25724-2010(SVAC)的規定,便于視音頻內容的有效管理和綜合利用;
8、支持碼流加密和密鑰認證,對編碼視(音)頻碼流進行加密和認證,保護編碼數據的安全性、完整性和非否認性。
對于SVAC未來的競爭,杭州海康威視數字技術股份有限公司高級算法經理武曉陽為我們分析道:
在技術上,SVAC跟H.264和AVS屬于同一代標準。2013年,H.265標準已經頒布,作為國際標準,在業界呼聲很高,而且編碼性能也領先H.264,用一半的碼流達到與H.264相同的編碼質量,而且充分考慮了面向多核處理的并行技術。
在功能上,SVAC具有的行業特色功能: ROI、SVC、監控專用信息、加密認證等,通過對H.264、H.265編碼策略的優化以及設計有效封裝傳輸層方案也能夠滿足。其實,監控行業現有大量基于H.264的產品和方案,都是采用這樣的方式滿足視頻監控的需要。
在產業鏈上面,支持H.264的編解碼平臺很多,產業鏈成熟,成本較低。就是剛出來的H.265,國內外很多廠家也紛紛公布支持計劃,可以預見接下來一兩年會有很多平臺出現。對于SVAC,很多平臺廠家仍還在觀望,沒有推出可行的方案。
面對這些競爭壓力,SVAC要勝出,需要加快技術發展,推出更有競爭力的標準;同時采取更加開放政策,比如充分公開標準細節、公開標準的參考代碼、提供一致性測試碼流、明細知識產權政策等,以吸引更多廠家進來,合力打造SVAC發展的生態系統。
芯片迎來挑戰
編解碼的實現是依靠半導體芯片技術,它具有硬變硬解的能力,通過芯片編碼、解碼,來提高產品的性價比。霍尼韋爾(中國)有限公司解決方案顧問王洪波解析道,SVAC目前遇到的難點其實并不是在技術層面,更多的是在市場。不同于H.264這類國際標準,SVAC的產業鏈尚不成熟,由于采用的是中星微電子獨有的技術,目前只有這家公司能夠提供支持SVAC的芯片,其他廠商仍在觀察SVAC在國內的推廣力度,并沒有在芯片的設計上去深入的和中星微電子合作,而是在芯片的兼容性上盡量去匹配SVAC編解碼格式的需要。另外,被譽為下一代視頻壓縮標準主流規范的H.265,其革命性變化所帶來更好的壓縮比、圖像質量、更低的帶寬及存儲空間等優勢,是以算法的復雜度大增為代價的,算法越復雜,導致的直接需求是視頻編碼芯片、解碼芯片等硬件處理能力的更高要求,因此只有芯片處理能力的增強,算法復雜性對應用的影響因素越來越小,新一代更高效的編解碼技術才能在行業中真正的得以展現。
總結
經過三十年多的發展演變,視頻編碼技術得到了深入的研究和發展,視頻編碼技術日新月異,視頻編碼國際標準也在不斷的推陳出新。H.265的推出為監控行業帶來了諸多積極的影響,包括:加速高清普及,推進超高清4K的發展;降低存儲和傳輸成本,影響安防行業整個解決方案;隨著碼率降低和傳輸帶寬增加,特別是無線帶寬增加,監控應用場景更多,擴展到移動端,逐漸進入民用消費者等;而重在視頻監控行業的垂直發展,力求專業的國內強推的標準規范SVAC,提高了系統的安全性,擺脫國外相關標準目前存在的各種專利陷阱,也會在國內視頻監控領域得到廣泛的發展。究竟誰更能助力安防行業呢,讓我們一起翹盼吧!