安防監(jiān)控一直走在追逐更高清的路上,從以前的CIF,到D1,再到720p、1080p,甚至4K,一直延續(xù)著更高清的發(fā)展路程。一路走來,先進編碼技術的出現(xiàn)也無不是對更高清產(chǎn)品的一種保障,而對于每一位安防工程師來說,“降低視頻碼率”是一個一直存在的課題。
隨著編碼技術的深度挖掘,人們開始考慮,除了視頻壓縮標準的進一步提升,是否可以根據(jù)安防監(jiān)控場景的特點,進行有針對性的編碼,從而更加高效的在保證視頻質量的同時降低碼率?
監(jiān)控場景相對于其他的視頻,大致來說存在以下特征:
1) 多數(shù)情況下,相機固定安裝,背景信息相對穩(wěn)定,變化較少;
2) 相當一部分監(jiān)控場景,運動目標出現(xiàn)的次數(shù)也不多;
3) 從觀看角度來講,更多關注的是運動目標;
4) 常常需要24小時日夜監(jiān)控,噪聲等問題影響相對較大。
針對以上特點,安防行業(yè)的編碼專家們提出了多種智能編碼實現(xiàn)方案,而就當下來看,感興趣區(qū)域編碼和Smart編碼就是典型代表。
感興趣區(qū)域編碼
在實際應用中,圖像的接收者往往只對圖像的某一部分感興趣。這部分區(qū)域被稱為“感興趣區(qū)域(ROI,Regions of Interest)”,把感興趣以外的區(qū)域稱為“背景區(qū)域(BG,Background)”。從主觀上來講,感興趣區(qū)域恢復質量的好壞直接影響對恢復圖像的整體評價。因此可以對圖像中ROI采用低壓縮比的壓縮,甚至無損壓縮,以獲得比較高的圖像質量;而對于BG圖像,則仍采用高壓縮比、質量相對較差的有損壓縮,以節(jié)省空間。這樣既可以滿足人們對圖像的要求,又能降低傳輸時間,節(jié)省存儲空間,實現(xiàn)了真正的交互式壓縮。這就是感興趣區(qū)域編碼。
感興趣區(qū)域編碼技術,可對感興趣區(qū)域(如安防監(jiān)控關注的車牌、人臉等)進行無損壓縮或近無損壓縮,保證圖像質量,而對背景區(qū)域進行有損壓縮。而在帶寬有限的條件下,感興趣區(qū)域編碼可增強用戶設置或智能偵測獲取的感興趣區(qū)域圖像質量,準確地保留視頻監(jiān)控目標的關鍵信息,這樣在不提高碼流的情況下,獲得視頻監(jiān)控的關鍵信息。
圖1 1080p@2M,ROI關
圖2 1080p@2M,ROI開
感興趣區(qū)域編碼可將碼流資源按需分配,將有限的資源集中在一塊或多塊感興趣區(qū)域,這種處理思想不僅能夠滿足人們在低比特率條件下對重要的圖像信息實現(xiàn)高質量,甚至無損恢復的要求,還可以通過與圖像壓縮算法相結合來很好的解決通訊過程中的帶寬瓶頸、存儲空間等問題。這些突出的優(yōu)點使得感興趣區(qū)域編碼處理方法成為了近年來圖像處理領域的研究熱點。
但是從感興趣區(qū)域編碼的原理來看,該技術存在一定的局限性,技術更多的定位于一些固定的單一場景監(jiān)控應用,而對于大場景多運動目標等復雜監(jiān)控場景而言,處理起來就沒有那么理想了。
Smart編碼
前面我們有提到監(jiān)控場景特點,可以發(fā)現(xiàn)大部分的使用場景有著固定的特征,比如通常情況下,背景是不變的;大部分時間畫面只有少量的運動目標,甚至沒有;相對背景來說,用戶更加關注運動物體等。Smart編碼技術正是針對這個特點將視頻壓縮技術與智能分析技術相結合,通過建立背景模型和提取前景目標,對前景和背景采用不同的編碼方式,從而在保證主觀質量的前提下,提高編碼壓縮性能,降低碼率。
圖3 監(jiān)控場景特點
來看一下Smart編碼實現(xiàn)的原理。
視頻的應用通常包括采集、編碼、傳輸、解碼、顯示等環(huán)節(jié);對于現(xiàn)有的視頻壓縮標準,包括H.264、H.265在內(nèi),都只對解碼進行規(guī)范化,也就是說只對碼流中每個比特的含義、以及每個比特如何解析使用進行規(guī)定和說明,而從圖像如何得到碼流比特的編碼過程沒有規(guī)定,由各廠家自行設計和實現(xiàn),即所謂的編碼方法。如果用語言來類比,語言中的詞語就是碼流的比特,語法規(guī)則就是碼流解析使用規(guī)則;在語言中,只規(guī)定每個詞語的含義以及詞語使用的語法規(guī)則,至于如何利用詞語和語法規(guī)則描述一件事情,是每個作者自身的創(chuàng)造。
圖4 壓縮標準規(guī)定范圍
壓縮標準沒有規(guī)定編碼,而由各廠家自行設計,只要產(chǎn)生的碼率符合解碼的規(guī)則即可。換句話說,壓縮標準提供了一系列壓縮的工具,至于工具怎么用由廠家自行考慮。同樣的工具用的好,壓縮率就高;用的不好,壓縮率就低。舉個例子,H.264壓縮標準在剛剛頒布時,由于涉及能力、處理器性能局限,并沒有把H.264的工具用的很好,編碼性能與前一代壓縮標準的差距不大。隨著各廠家持續(xù)不斷的改進編碼方法,H.264的性能逐漸挖掘出來,1080p圖像的碼率也逐漸從6Mbps降低到4Mbps甚至2Mbps。這也是Smart編碼技術能夠基于視頻壓縮標準(比如H.264或者H.265等)提出進一步提高壓縮率編碼方案的原因。
為了提高視頻壓縮率,Smart編碼采用了智能分析中的背景建模技術來指導編碼。背景建模技術將畫面中運動的物體和靜止的背景分離開,從而可以針對背景區(qū)域和運動區(qū)域采用不同的編碼方法。具體來說,Smart編碼在提高壓縮率方面采用的方法有:多幀參考、動態(tài)I幀間隔、背景噪聲抑制。前兩種方法充分利用了監(jiān)控場景背景不變、運動區(qū)域少的特征;后一種方法則利用用戶關注運動區(qū)域的偏好。
圖5 smart編碼技術
由此看來,Smart編碼技術是基于視頻壓縮標準(采用H.264或者H.265等標準),對常規(guī)視頻壓縮技術的進一步挖掘提升。
H.265+Smart編碼
以當前炙手可熱的H.265為例,結合H.265編碼和Smart編碼兩種技術,經(jīng)過大量測試表明,與普通的H.265編碼保持基本同等的主觀質量,針對相機固定運動目標較少的監(jiān)控場景,“結合Smart編碼的H.265”平均碼率下降比例是70%左右;針對相機固定運動目標部分時間較多的監(jiān)控場景,“結合Smart編碼的H.265”平均碼率下降比例是50%左右;針對不斷大幅運動的監(jiān)控場景,“結合Smart編碼的H.265”平均碼率下降比例還可達30%左右。
表1 1080p攝像機碼率對比測試
與此同時,“結合Smart編碼的H.265”為了保證運動目標的編碼質量,瞬時峰值碼率會高于長周期的平均碼率,且運動目標所占圖像面積越大,瞬時峰值碼率會越高,但基本上不會高于同等主觀質量下H.265編碼的瞬時峰值碼率。
在兼容性方面,“結合Smart編碼的H.265”仍然符合H.265標準,底層碼流可以被大部分支持H.265解碼的軟硬件所兼容。部分解碼設備及軟件可能需要在播放控制策略上稍作調(diào)整,以改善錄像文件拖動時的體驗。
由此可見,Smart編碼技術是針對監(jiān)控視頻的特點,在常規(guī)視頻編碼技術的基礎上優(yōu)化的一種編碼技術,可以較大幅度的降低視頻監(jiān)控場景的碼率,節(jié)省系統(tǒng)成本。
再回首2015年的深圳安博會,客戶關注點除了圖像效果,更多的是如何降低碼率,目前主要有兩種做法:第一種是采用感興趣區(qū)域編碼技術降低碼率,第二種則是采用Smart編碼技術降低碼率。從參觀者的反饋來看,第二種Smart編碼技術似乎更受歡迎,因為采用Smart編碼技術的碼率得到顯著降低。
目前市場上出現(xiàn)的“Smart265”是基于視頻編解碼應用的技術,專門針對監(jiān)控場景的特點進行研發(fā),可在H.265編碼的基礎上進一步提升壓縮率,有效節(jié)約網(wǎng)絡和存儲資源。在白天的繁忙場景下,Smart265的碼率相比H.265可降低30%以上;當夜晚畫面基本靜止時,Smart265的碼率相比H.265可降低70%以上(最低可達50-60kbps);不僅節(jié)約了帶寬資源,更有效節(jié)省了存儲空間。
經(jīng)過多年的發(fā)展,編碼技術的進步,不斷引領著安防行業(yè)的發(fā)展,成為安防企業(yè)在新的經(jīng)濟常態(tài)下以技術取勝的關鍵之一。隨著一系列國產(chǎn)編碼技術的出現(xiàn),尤其Smart編碼技術的不斷深化與融合,成為了更高清視頻編碼的新選擇,實現(xiàn)了中國原創(chuàng)的編解碼技術的質的飛躍。
(本文作者杭州海康威視數(shù)字技術股份有限公司技術支持工程師)