編解碼格式這玩意兒對于視頻來說就好比mp3之于音樂,事業線之于薪水,杰士邦之于情人節,時常以一種“沒你我玩不轉”的方式存在著。在這個電視拼4K極清,網絡視頻拼超清,視頻監控拼高清的“視頻血拼”年代,人們都希望在不用大費周章增加帶寬的前提下獲得更高清更唯美的視頻畫質體驗。對于這樣的期待,交給H.265好了。H.264統治了過去的五年,按照“人品守恒定律”來看,差不多該接班了。本文重點從視頻監控編碼技術及標準兩方面進行探討。
視頻監控編碼需求日漸旺盛
由于網絡監控的需求量越來越大,刺激廣大機器視覺的廠商,特別是工業相機的廠家努力在網絡攝像機方面來發展,間接也促進了網絡視頻編碼器的發展,目前網絡視頻編碼器已經由單功能的視頻傳輸,逐漸發展成為帶WIFI網絡,帶本地SD卡存儲,或USB存儲或IDE硬盤存儲等;傳輸通道也從原來單路逐漸發展成為:單路D1,兩路HD1,四路CIF和多路兼容的多菜單操作與管理的集成系統。
目前,網絡視頻編碼器的通訊方式也由原來單純的有線網絡,逐漸發展成為:有線與無線WIFI(802.11abg通訊協議)兼容,無線的傳輸距離也由原來的幾十米(30-100米),發展成為目前的幾十公里(30-50公里)。
編碼器是將信號或數據進行編制、轉換后進行傳輸出去的設備。網絡視頻編碼器只是編碼器通過發展之后其中的一個很常見的應用,并且成功的應用于網絡設備而得到廣大電子工程師的認識和應用。
視頻編解碼三大技術展示
網絡適應性是影響網絡監控設備能否取得更快發展和普及的重要因素,因此,接下來將會有大量的網絡適應性技術被應用到IP前端與管理平臺中,視頻編碼器也不例外。在這些網絡適應性技術中,與存儲、傳輸、管理相關的三個方面應該是最迫切的。
1、ANR技術
與存儲相關的網絡適應性技術主要是ANR。ANR的前提是視頻編碼器支持本地存儲,同時系統部署有中心存儲。網絡正常時,所有錄像在中心完成;當網絡發生故障時,支持ANR的視頻編碼器和中心管理平臺將同時偵測到故障,并各自建立與時間相關的日志,同時視頻編碼器啟動本地錄像,利用本身內置的存儲介質進行存儲;在網絡恢復正常后,視頻編碼器與中心管理平臺將比較各自建立的日志,檢查比對網絡失效時的數據,然后由視頻編碼器將本地存儲的錄像上傳至中心存儲設備,完成后自動刪除本地錄像。ANR技術一方面可以提升存儲可靠性,另一方面可以保證錄像文件的完整性和統一管理性。
2、速率調整
與傳輸相關的網絡適應性技術主要是指速率調整技術。網絡正常時,視頻編碼器以正常編碼速率上傳監控碼流到中心平臺;當網絡發生擁塞時,視頻編碼器能自動檢測到擁塞,然后通過自動調整視頻分辨率、視頻幀率等編碼參數進行碼流占用帶寬的調整,以保證監控碼流可以穩定上傳;當網絡恢復時,視頻編碼器再自動恢復之前的編碼傳輸。
3、人性化設計
與管理相關的網絡適應性技術主要是指人性化設計。網絡發生擁塞時,要能夠主動提示管理人員和瀏覽人員并記錄;前端視頻編碼器IP地址與其他設備沖突時,要能夠有一定的機制通知中心管理平臺,由平臺主動提示相關工作人員并記錄等等。
視頻編碼標準不容忽視
在視頻傳輸過程中在要求圖像不失真,則圖像傳輸的比特數就大,在網絡帶寬一定的情況下,降低視頻圖像的碼流就成為一項重要的技術。H.264,又稱MPEG-4part10,也稱AVC(AdvancedVideoCoding),是一種先進數字視頻壓縮技術和標準,由VCEG(ITU-TVideoCodingExpertsGroup)和MPEG(ISO/IECMovingPictureExpertsGroup)聯合組成的JVT(JointVideoTeam)于2003年3月正式發布的。H.264標準的主要目標就是在同等保真條件下,提高編碼效率,與之前的H.263或者MPEG-4標準相比,其在保證相同圖像質量的情況下,降低約50%的碼率。
更為先進的H.265編碼技術是ITU-TVCEG繼H.264之后所制定的新的視頻編碼標準。2012年6月25日,國際電信聯盟(ITU)在其網站公布了工作計劃項目,原定于2008年至2010年推出的《Highefficiencyvideocoding》(HEVC或稱H.265)技術標準于2013年1月推出。在技術上,H.265將在現有的主流視頻編碼標準H.264上保留了一些較為成熟的技術和繼承其現有的優勢,同時對一些其他的技術進行改進,可能體現在提高壓縮效率、提升錯誤恢復能力、減少實時的時延、減少信道獲取時間和隨機接入時延以及降低復雜度等方面。但H.265還沒有進入商業化應用階段。
H.265的高明之處
從編碼框架上來說,H.265仍然沿用了H.264的混合編碼框架,但是每個技術細節都有提升或改進。比較大的改進是:1)在圖像分塊以及運動補償、變換方面,支持更大尺寸和種類;2)更多幀內/幀間預測、運動矢量預測和變換模式;3)增加環內采樣自適應濾波SAO;4)提供TILE模式,更好地支持并行處理等。這些新技術的應用,不但有效地提高壓縮性能,也為各種處理器平臺的有效實現擴展了空間。
1、更大的宏塊和變換塊。相對于H.264的4×4、8×8、16×16宏塊類型,H.265引入了32×32、64×64甚至于128×128的宏塊,目的在于減少高清數字視頻的宏塊個數,減少用于描述宏塊內容的參數信息,同時整形變換塊大小也相應擴大,用于減少H.264中變換相鄰塊問的相似系數。
2、使用新的MV(運動矢量)預測方式。區別于H.264基于空間域的運動矢量預測方式,H.265擴充更加多的方向進行幀內預測,同時將預測塊的集合由原來的空間域擴展到時間域及空時混合域,通過率失真準則計算后選擇最佳的預測塊。使用該方法,在基本模式下測試,在與H.264相同質量的情況下,得到平均為6.1%的壓縮增益,復雜圖像的壓縮增益甚至能提高到20%。
3、更多的考慮并行化設計。當前芯片架構已經從單核性能逐漸往多核并行方向發展,H.265引入了Entropyslice、WPP等并行運算思路,使用并行度更高的編碼算法,更有利于H.265在GPU/DSP/FPGA/ASIC等并行化程度非常高的CPU中快速高效的實現產業化。
4、新添加的Tile劃分機制使得以往的slice、幀或GOP為單位的粗粒度數據并行機制更加適合于同構多核處理器上的并行實現。Dependentslice和WPP機制解決了以往H.264等編碼技術中熵編碼環節無法并行實現的問題,使得整個編解碼過程中DCT、運動估計、運動補償、熵編碼等任務模塊的劃分更加均衡,顯著提高并行加速比。
5、更低的碼流。反復的質量比較測試已經表明,在相同的圖象質量下,相比于H.264,通過H.265編碼的視頻碼流大小比H.264減少大約39-44%。由于質量控制的測定方法不同,這個數據也會有相應的變化。通過主觀視覺測試得出的數據顯示,在碼率減少51-74%的情況下,H.265編碼視頻的質量還能與H.264編碼視頻近似甚至更好,其本質上說是比預期的信噪比(PSNR)要好。