國(guó)際視頻編解碼技術(shù)標(biāo)準(zhǔn)發(fā)展歷程
當(dāng)前視頻的應(yīng)用涵蓋了各個(gè)領(lǐng)域,包括ICT、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、廣電、安防等。制定視頻編解碼標(biāo)準(zhǔn)的國(guó)際組織主要有兩個(gè):ITU-T和ISO/IEC。ITU-T推薦委員會(huì)制定的大多數(shù)標(biāo)準(zhǔn)都是為實(shí)時(shí)視頻通信應(yīng)用的,例如H.261、H.262、H.263和H.264;ISO/IEC的MPEG標(biāo)準(zhǔn)大多是為視頻存儲(chǔ)、廣播視頻和視頻流應(yīng)用而制定的標(biāo)準(zhǔn),包括MPEG-1、MPEG-2和MPEG-4等。兩個(gè)標(biāo)準(zhǔn)化委員會(huì)組織在獨(dú)立地致力于不同的標(biāo)準(zhǔn)的制定的同時(shí),聯(lián)合發(fā)展了H.262/MPEG-2和H.264/AVC。
MPEG全稱是Moving Pictures Experts Group,它是“動(dòng)態(tài)圖象專家組”的英文縮寫,該專家組成立于1988年,致力于運(yùn)動(dòng)圖像及其伴音的壓縮編碼標(biāo)準(zhǔn)化工作。
MPEG-1
MPEG-1是MPEG組織制定的第一個(gè)視頻和音頻有損壓縮標(biāo)準(zhǔn)。視頻壓縮算法于1990年定義完成。1992年底,MPEG-1正式被批準(zhǔn)成為國(guó)際標(biāo)準(zhǔn)。MPEG-1標(biāo)準(zhǔn)用于數(shù)字存儲(chǔ)體上動(dòng)態(tài)圖像及音頻的存儲(chǔ)與檢索,其數(shù)碼率為1.5Mb/s。MPEG-1是為CD光碟介質(zhì)定制的的視頻和音頻壓縮格式。
MPEG-2
MPEG-2制定于1994年,設(shè)計(jì)目標(biāo)是高級(jí)工業(yè)標(biāo)準(zhǔn)的圖象質(zhì)量以及更高的傳輸率, MPEG-2專門針對(duì)數(shù)字電視而開(kāi)發(fā)。MPEG-2所能提供的傳輸率在3-10Mbps間, 其在NTSC制式下的分辨率可達(dá)720×486,MPEG-2也可提供并能夠提供廣播級(jí)的視像和CD級(jí)的音質(zhì)。目前MPEG2標(biāo)準(zhǔn)則用于廣播電視和DVD等。
MPEG-4
與MPEG-1和MPEG-2相比,MPEG-4的特點(diǎn)是其更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控。MPEG-4的制定初衷主要針對(duì)視頻會(huì)議、可視電話超低比特率壓縮(小于64Kb/s)的需求。MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法,它是針對(duì)數(shù)字電視、交互式圖像應(yīng)用、交互式多媒體等整合及壓縮技術(shù)的需求而制定的國(guó)際標(biāo)準(zhǔn)。MPEG -4標(biāo)準(zhǔn)將眾多的多媒體應(yīng)用集成于一個(gè)完整的框架內(nèi),旨在為多媒體通信及應(yīng)用環(huán)境提供標(biāo)準(zhǔn)的算法及工具,從而建立起一種能被多媒體傳輸、存儲(chǔ)、檢索等應(yīng)用領(lǐng)域普遍采用的統(tǒng)一數(shù)據(jù)格式。
H.261
H.261是ITU-T 編制的第一個(gè)主流視頻壓縮標(biāo)準(zhǔn)。它主要針對(duì)視頻會(huì)議應(yīng)用,是為支持 40kpbs~2Mbps 的 ISDN 網(wǎng)絡(luò)而設(shè)計(jì)的,主要針對(duì)實(shí)時(shí)編碼和解碼設(shè)計(jì),壓縮和解壓縮的信號(hào)延時(shí)不超過(guò)150ms,碼率px64kbps(p=1~30)。H.261 支持 352×288 (CIF) 及 176×144 (QCIF) 分辨率。
H.263
H.263是ITU-T制定的甚低碼率的圖像編碼國(guó)際標(biāo)準(zhǔn),它一方面以H.261為基礎(chǔ),以混合編碼為核心,其基本原理框圖和H.261十分相似,原始數(shù)據(jù)和碼流組織也相似;另一方面,H.263也吸收了MPEG等其它一些國(guó)際標(biāo)準(zhǔn)中有效、合理的部分,如:半像素精度的運(yùn)動(dòng)估計(jì)、PB幀預(yù)測(cè)等,使它性能優(yōu)于H.261。
H264/AVC
作為第三代視頻壓縮技術(shù),H264集中了以往標(biāo)準(zhǔn)的優(yōu)點(diǎn),并吸收了以往標(biāo)準(zhǔn)制定中積累的經(jīng)驗(yàn),H.264/AVC 在壓縮效率方面取得了巨大突破,和H.263和MPEG-4 相比可節(jié)省50%的碼率,降低傳輸帶寬和存儲(chǔ)容量。而且H.264創(chuàng)造性的采用了多參考幀、多塊類型、整數(shù)變換、幀內(nèi)預(yù)測(cè)等新的壓縮技術(shù),使用了更精細(xì)的分象素運(yùn)動(dòng)矢量(1/4、1/8)和新一代的環(huán)路濾波器,使得壓縮性能大大提高,系統(tǒng)更加完善。
H.265
H.265旨在在有限帶寬下傳輸更高質(zhì)量的網(wǎng)絡(luò)視頻,僅需原先的一半帶寬即可播放相同質(zhì)量的視頻。H.265標(biāo)準(zhǔn)也同時(shí)支持4K (4096×2160) 和8K (8192×4320) 超高清視頻。除了在編解碼效率上的提升外,在對(duì)網(wǎng)絡(luò)的適應(yīng)性方面H.265也有顯著提升,可很好運(yùn)行在互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等網(wǎng)絡(luò)環(huán)境。
H.265是ITU-T繼H.264之后所制定的新的視頻編碼標(biāo)準(zhǔn)。H.265標(biāo)準(zhǔn)圍繞著現(xiàn)有的H.264,保留原來(lái)的某些技術(shù),同時(shí)對(duì)一些相關(guān)的技術(shù)加以改進(jìn)。新技術(shù)使用先進(jìn)的技術(shù)用以改善碼流、編碼質(zhì)量、延時(shí)和算法復(fù)雜度之間的關(guān)系,達(dá)到最優(yōu)化設(shè)置。
我國(guó)視頻編解碼技術(shù)標(biāo)準(zhǔn)發(fā)展歷程
AVS
AVS是我國(guó)具備自主知識(shí)產(chǎn)權(quán)的第二代信源編碼標(biāo)準(zhǔn),是我國(guó)數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組制定《信息技術(shù) 先進(jìn)音視頻編碼》系列標(biāo)準(zhǔn)的簡(jiǎn)稱,其包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理等四個(gè)主要技術(shù)標(biāo)準(zhǔn)和符合性測(cè)試等支撐標(biāo)準(zhǔn)。AVS編碼效率比MPEG-2高2、3倍,與H.264相當(dāng),而且技術(shù)方案簡(jiǎn)潔,硬件實(shí)現(xiàn)復(fù)雜度低,達(dá)到了第二代標(biāo)準(zhǔn)的最高水平。AVS的主要?jiǎng)?chuàng)新在于提出了一批具體的優(yōu)化技術(shù),在較低的復(fù)雜度下實(shí)現(xiàn)了與國(guó)際標(biāo)準(zhǔn)相當(dāng)?shù)募夹g(shù)性能,有效地避開(kāi)了用國(guó)際標(biāo)準(zhǔn)背后的大量復(fù)雜專利。AVS采用混合編碼框架,包括變換、量化、嫡編碼、幀內(nèi)預(yù)測(cè)、幀間預(yù)測(cè)、環(huán)路濾波等技術(shù)模塊,這是主流的技術(shù)路線。
SVAC
《安全防范監(jiān)控?cái)?shù)字視音頻編解碼技術(shù)標(biāo)準(zhǔn)》(簡(jiǎn)稱SVAC,Surveillance Video and Audio Coding)。SVAC標(biāo)準(zhǔn)是第一個(gè)旨在解決安全防范監(jiān)控行業(yè)獨(dú)特要求的技術(shù)標(biāo)準(zhǔn),并具備以下的特性。
高安全性:SVAC標(biāo)準(zhǔn)規(guī)定了加密和認(rèn)證接口及數(shù)據(jù)格式,保證數(shù)據(jù)的安全性、完整性、非否認(rèn)性。密碼不是編到視頻信息里,提取時(shí)需要輸入認(rèn)證數(shù)據(jù),既保證格式的統(tǒng)一,便于互聯(lián)互通,也保留足夠的擴(kuò)展靈活性。
感興趣 (ROI) 區(qū)域編碼:圖像分為若干個(gè)ROI (感興趣) 區(qū)域和一個(gè)背景區(qū)域,對(duì)ROI區(qū)域采用低壓縮比,對(duì)非ROI區(qū)域采用高壓縮比,降低帶寬。
可伸縮性視頻解碼(SVC):對(duì)視頻數(shù)據(jù)分層編碼,滿足不同傳輸網(wǎng)絡(luò)寬帶和數(shù)據(jù)存儲(chǔ)的需求,普通編碼傳輸有主碼流、子碼流,而且主、子碼流分別傳輸,占用帶寬較大,SVAC傳輸只有一類碼流,對(duì)碼流分層就可獲得不同分辨率的圖片信息。
視頻編解碼技術(shù)在安防行業(yè)的應(yīng)用
安防行業(yè)的主流視頻編解碼技術(shù)有如下幾種:
MJPEG
MJPEG全名為"Motion Joint Photo graphic Experts Group",是一種視頻編碼格式,中文名稱翻譯為“技術(shù)即運(yùn)動(dòng)靜止圖像(或逐幀)壓縮技術(shù)”。MJPEG廣泛應(yīng)用于非線性編輯領(lǐng)域可精確到幀編輯和多層圖像處理,把運(yùn)動(dòng)的視頻序列作為連續(xù)的靜止圖像來(lái)處理,這種壓縮方式單獨(dú)完整地壓縮每一幀,在編輯過(guò)程中可隨機(jī)存儲(chǔ)每一幀,可進(jìn)行精確到幀的編輯,此外M-JPEG的壓縮和解壓縮是對(duì)稱的,可由相同的硬件和軟件實(shí)現(xiàn)。但M-JPEG只對(duì)幀內(nèi)的空間冗余進(jìn)行壓縮。不對(duì)幀間的時(shí)間冗余進(jìn)行壓縮,故壓縮效率不高。
早期安防行業(yè)采用過(guò)MJPEG編解碼技術(shù)。
MPEG-4
在早期安防行業(yè)對(duì)視頻分辨率要求不高的情況下,MPEG-4曾經(jīng)得到廣泛的應(yīng)用。
H.264
目前安防行業(yè)普遍采用的是H.264,H.264是一種高壓縮編解碼算法,具有速度快、信息損失小、成像質(zhì)量高、視頻流對(duì)帶寬占用率低等特點(diǎn);其最大的優(yōu)勢(shì)是具有很高的數(shù)據(jù)壓縮比,在同等圖像質(zhì)量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。
SVAC
SVAC作為由中星微電子和公安部第一研究所共同建立的我國(guó)安防行業(yè)編解碼技術(shù)規(guī)范,通過(guò)政府行政命令已經(jīng)在廣東、河北、山西等省強(qiáng)制推廣使用,但SVAC標(biāo)準(zhǔn)產(chǎn)品在源代碼和核心芯片的成本比H.264要高。
H.265
隨著視頻分辨率越來(lái)越高,如何通過(guò)高壓縮比來(lái)降低傳輸帶寬和存儲(chǔ)容量成為行業(yè)首要考慮的因素,因此從去年開(kāi)始越來(lái)越多的廠商推出了支持H.265的IPCam,伴隨著H.265產(chǎn)業(yè)鏈的更加成熟,H.265會(huì)取代H.264成為安防行業(yè)最主流的編解碼技術(shù)標(biāo)準(zhǔn)。
視頻編解碼技術(shù)在安防行業(yè)的發(fā)展趨勢(shì)
視頻編碼技術(shù)的發(fā)展趨勢(shì)一方面會(huì)繼續(xù)以混合編碼為框架,研究如何進(jìn)一步提高壓縮特性;隨著3D應(yīng)用在安防行業(yè)的普及,3D編解碼技術(shù)也將是發(fā)展方向之一,向可伸縮編碼、多視點(diǎn)編碼、智能、提高壓縮性能等分支方向發(fā)展。
可伸縮編碼技術(shù)(Sca1able Video Coding,SVC)
可伸縮編碼技術(shù)將視頻編解碼框架轉(zhuǎn)變?yōu)楦嗫紤]網(wǎng)絡(luò)適應(yīng)性和靈活性的編解碼框架。
可伸縮視頻編碼因?yàn)榫哂袝r(shí)域、空域和質(zhì)量等多方面的靈活性,尤其是適合需要實(shí)現(xiàn)雙碼流或多碼流的安防行業(yè)。在安防行業(yè),基本要求雙碼流,網(wǎng)絡(luò)或本地存儲(chǔ)高分辨率、高幀率的大碼流,實(shí)時(shí)瀏覽采用低分辨率的小碼流;甚至是三碼流,一路高清碼流用于存儲(chǔ)、一路用于有線側(cè)實(shí)時(shí)瀏覽,一路實(shí)時(shí)流用于手機(jī)瀏覽。常規(guī)的方案是編碼2次或3次,這樣會(huì)大幅增加DSP的計(jì)算工作量。而采用SVC技術(shù)將只需編碼一次。
多視點(diǎn)編碼技術(shù)
多視點(diǎn)視頻是一種新型的具有立體感知和交互操作功能的視頻技術(shù),它由一組平行、會(huì)聚相機(jī)陣列拍攝得到視頻信號(hào)。2001年,MPEG成立了3DAV工作組,其首要任務(wù)就是定義3D音視頻領(lǐng)域的范圍和應(yīng)用場(chǎng)景,制定多視點(diǎn)編碼技術(shù)的標(biāo)準(zhǔn)。
隨著3D GIS地圖、多視角的3D立體視頻畫面、基于3D場(chǎng)景的多攝像頭聯(lián)動(dòng)在安防行業(yè)的應(yīng)用,多視點(diǎn)編碼技術(shù)將會(huì)在安防行業(yè)得到越來(lái)越多的應(yīng)用。
而在視頻監(jiān)控類的應(yīng)用中,多視點(diǎn)視頻編碼技術(shù)有助于實(shí)現(xiàn)多視角立體監(jiān)控,多攝像頭聯(lián)動(dòng)等應(yīng)用。
智能化
將H.265等編解碼技術(shù)與智能視頻分析技術(shù)結(jié)合,提高編碼壓縮性能并降低碼率,提供基于視頻內(nèi)容的編碼是未來(lái)視頻編解碼技術(shù)在安防行業(yè)的重要發(fā)展方向。
智能視頻分析是通過(guò)過(guò)濾掉圖像中無(wú)用的或干擾信息,并自動(dòng)分析和抽取視頻源中的關(guān)鍵的有用信息,通過(guò)對(duì)視頻畫面的背景和對(duì)象,也就是物體特征進(jìn)行提取,正確識(shí)別出不同物體及其運(yùn)動(dòng)軌跡規(guī)律,它可以明確地區(qū)分出人、車或其它物體,然后對(duì)對(duì)象按照用戶設(shè)置的規(guī)則進(jìn)行分析。
結(jié)合智能視頻分析技術(shù)和編碼技術(shù),可以對(duì)視頻內(nèi)的對(duì)象進(jìn)行分類,對(duì)各感興趣的區(qū)域采用不同的編碼策略,也就是感興趣區(qū)域編碼。對(duì)需要做智能分析的區(qū)域采用
能夠根據(jù)智能分析的結(jié)果對(duì)干興趣區(qū)域采用低壓縮比以獲取較好的圖像,對(duì)如背景燈其他的非感興趣區(qū)域采用高壓縮比,節(jié)省傳輸帶寬和存儲(chǔ)容量。譬如,當(dāng)視頻畫面中需要做智能分析的區(qū)域沒(méi)有運(yùn)動(dòng)的人、車等對(duì)象時(shí),可以采用高壓縮比;當(dāng)智能分析算法對(duì)運(yùn)動(dòng)的人、車對(duì)象進(jìn)行分析時(shí),采用低壓縮比。通過(guò)整合視頻編解碼技術(shù)和智能視頻分析技術(shù),實(shí)現(xiàn)編解碼技術(shù)與安防業(yè)務(wù)結(jié)合是將來(lái)的發(fā)展方向。
高壓縮性能
隨著分辨率的越來(lái)越高,新的視頻編解碼技術(shù)應(yīng)該提升壓縮性能,能夠?qū)崿F(xiàn)對(duì)高分辨率視頻采用高壓縮性能的編解碼技術(shù),實(shí)現(xiàn)更低傳輸帶寬、降低存儲(chǔ)容量的需求,大幅的降低投資。
結(jié)語(yǔ)
視頻編解碼技術(shù)是不斷的隨著業(yè)務(wù)的發(fā)展而不斷的與時(shí)俱進(jìn),將來(lái)視頻編解碼技術(shù)將朝著3D編解碼、更加智能、更高壓縮性能發(fā)展。