和一般的業務不同,視頻是流特性業務,數據量很大。例如,數字電視圖像中的SIF格式、NTSC制式、彩色、4∶4∶4采樣,每幀的數據量為2028Kb,每秒的數據流量可達60.8Mb;CCIR格式、PAL制式、4∶4∶4采樣的彩色視頻的數據流量可達148.8Mbps。實驗表明,176×144的YUV原始視頻在10Mbps的LAN上傳送速率是3幀/秒左右??梢姡磯嚎s的視頻在Internet上傳輸的效果是無法容忍的,而且會很容易地將Internet資源吞沒,造成網絡擁塞甚至崩潰。因此,IP視頻通信的第一步就是視頻壓縮。
視頻壓縮編碼的理論基礎是信息論。壓縮就是從時域、空域兩方面去除冗余信息,即將可推知的確定信息去掉。編碼方法大致可分為三類:
1.考慮到圖像信源的統計特性采用的預測編碼方法、變換編碼方法、矢量量化編碼方法、子帶-小波編碼方法及神經網絡編碼方法等;
2.考慮到視覺特性采用的基于方向濾波的圖像編碼方法、基于圖像輪廓/紋理的編碼方法;
3.考慮到圖像傳遞的景物特征,采用的分形編碼、基于模塊的編碼方法。
在IP視頻通信應用中,編碼方法的選擇不但要考慮到壓縮比、信噪比,還要考慮到算法的復雜性。太復雜的編碼算法可能會產生較高的壓縮比,但也會帶來較大的計算開銷,軟件實現時會影響通信的實時性。目前,在眾多視頻編碼算法中,影響最大并被廣泛應用的算法是MPEG和H.26x。
MPEG編碼
MPEG是國際標準化組織ISO/IEC下的一個制定動態視頻壓縮編碼標準的組織,它為視頻壓縮編碼技術的標準化、實用化做出了巨大貢獻。如針對CD-ROM的1.5Mbps傳輸率的MPEG-1、針對HDTV的6Mbps以上傳輸速率的MPEG-2都已成功地得到應用,并創造了巨大的商業價值。MPEG-4是針對視頻會議、可視電話的甚低速率編碼標準,它融入了基于內容的檢索與編碼,可對壓縮數據內容直接訪問;即將于2001年制定完畢的MPEG-7標準被稱為"多媒體內容描述接口",這種標準化的描述可以加到任何類型的媒體信息上。不管視頻信息的表達形式或壓縮形式如何,具有這種標準化描述的多媒體數據均可被檢索。因此,MPEG-7的應用領域主要是數字化圖書館和廣播式媒體。
H.263編碼
H.261編碼是一種幀間預測減少時域冗余、變換編碼減少空域冗余的混合編碼方法,具有壓縮比高、算法復雜度低等優點,得到較為廣泛的應用。Mbone的重要應用工具之一IVS的視頻編碼采用的就是H.261編碼算法。在H.261的基礎上,1996年ITU-T推出了H.263編碼標準。H.263在許多方面對H.261進行了改進和擴充,如在編碼算法復雜度增加很少的基礎上,H.263能提供更好的圖像質量、更低的速率,十分適合于IP視頻會議、可視電話應用。目前,H.263編碼是IP視頻通信采用最多的一種編碼方法,并已被許多多媒體通信終端標準所吸收, 如:ITU-TH.310(B-ISDN)、H.320(ISDN)、H.324(PSTN)、H.323(LAN、 WAN、Internet)。
隨著計算機性能的快速提高,對于可視電話和視頻會議等應用(一般使用QCIF圖像),純軟件編碼器(codec)即可以滿足應用要求。我們實現的H.263純軟件編碼器在主頻為166MHz的主機上編碼幀率可達60幀/秒以上,平均圖像質量(用信噪比表示)大于38dB。
1998年ITU-T推出的H.263+是H.263建議的第二版,它提供了12個新的可協商模式和其他特征,進一步提高了壓縮編碼性能。如H.263只有5種視頻源格式,H.263+允許使用更多的源格式,圖像形狀和時鐘頻率也有多種選擇,拓寬了應用范圍;另一重要的改進是可擴展性,它允許多顯示率、多速率及多分辨率,增強了視頻信息在易誤碼、易丟包異構網絡環境下的傳輸。另外,H.263+的圖像分段依賴性也可以是受限的,以減少差錯傳播。H.263+對H.263中的不受限運動矢量模式進行了改進,加上12個新增的可選模式,不僅提高了編碼性能,而且增強了應用的靈活性。