由于寬帶網絡近年來在世界各地的高速發展,高品質的音視頻壓縮技術不斷推陳出新,更高的壓縮比率加上更寬的帶寬,使得互聯網用戶在互聯網上觀看高品質電視節目的愿望不再是幻想。美國、意大利、法國、加拿大等國網絡視頻市場的日漸成熟,國內哈爾濱、泉州、上海等地的小試牛刀,都證明了以更強的互動性作為賣點、基于互聯網技術和P2P傳輸技術的網絡視頻服務已經漸成氣候。
網絡視頻是對基于互聯網技術傳播的所謂寬帶視頻的統稱,可以是用戶自己制作、在線上傳或點播視頻節目,自主性和自助性強。各種視頻網站和流媒體服務器隨著人們對網絡視頻服務的需求快速增長,民營網絡視頻企業更是如雨后春筍。
2007年是網絡視頻用戶基數迅速成長的一年。據CNNIC今年1月份發布中國互聯網調查報告,76.9%的網絡用戶使用網絡視頻,成為繼音樂、即時通信之后的第三大互聯網應用。這也是網絡家庭娛樂應用第一次全面超過了網絡商務應用,即郵件、搜索引擎和新聞等傳統資訊應用。
但隨著網絡視頻的高速成長,各種黃色、暴力和反動等垃圾信息也摻雜在網絡視頻中在寬帶網絡上肆意泛濫,嚴重影響了人們的正常工作和生活,也對社會精神文明建設和未成年人教育帶來了巨大的隱患。
由于寬帶視頻網絡的高速數據包傳送,傳統的信息安全監控設備在這方面顯得力不從心,因此,我們提出應用關鍵幀提取技術來抽取網絡視頻中的關鍵幀,從而減小處理的負載和存儲空間,降低設備成本并提高處理效率。建立相應的垃圾視頻關鍵幀匹配庫,通過視頻關鍵幀匹配算法和模式,從高速的視頻流中監測出垃圾信息。應用此視頻監控系統和其他網絡安全設備,可以為企業、學校和家庭打造一個高速干凈的網絡視頻環境,讓人們輕松盡情享受寬帶視頻服務。
系統方案
1.視頻解碼方案論證
方案一:利用Xilinx公司的FPGA產品Spartan 3E實現系統的視頻解碼。在Spartan 3E支持的MicroBlaze微處理器軟核上移植開源視頻解碼器,由于MicroBlaze最高處理頻率為50MHz,遠不能滿足現在的高速視頻數據包的解碼;
方案二:通過在最新嵌入式微處理機eBox-4300上移植嵌入式操作系統WinCE來實現開源視頻解碼器。eBox處理器主頻為500MHz,可以滿足10/100MHz網絡的視頻解碼,且在eBox上的WinCE操作系統可移植性較好,便于以后在系統中加入更多的視頻格式解碼器。
2.數據包前端處理方案論證
方案一:利用Xilinx公司FPGA產品系列Spartan 3E來捕獲網絡中的視頻數據包。高速的邏輯結構和并行特性是FPGA的特性,通過FPGA來識別并捕獲視頻數據包能降低系統的丟包率和漏報率;
方案二:利用eBox-4300自帶的以太網接口直接連接到網絡上。由于WinCE操作系統下的以太網操作已封裝好,為了兼顧可移植性,因此其效率沒有直接在FPGA上實現的IP核好。
3.關鍵幀匹配方案論證
方案一:利用Xilinx公司的FPGA產品系列Spartan 3E來實現視頻關鍵幀標準庫的查找和匹配。由于FPGA特有的存儲單元結構,便于快速查找。
方案二:利用ADI公司的Blackfin 535數字信號處理器來實現視頻幀的匹配算法。DSP特有的快速音視頻處理能力能很好滿足系統的性能要求。但Blackfin的片上存儲空間有限,如果增加外部存儲器將降低關鍵幀查找速率,從而成為整個系統的瓶頸。
綜合上述:系統采用Xilinx公司的FPGA產品系列Spartan 3E來作為數據包前端處理,識別并捕獲相應格式的網絡視頻數據包,按序列將視頻數據包傳送到eBox-4300處理器上的視頻解碼單元。在eBox-4300處理器上抽取出視頻的關鍵幀后,將視頻關鍵幀傳送到在Spartan 3E上實現的關鍵幀匹配單元中進行匹配模式檢驗。
圖 1 系統示意圖
實現原理
1. 視頻數據包識別捕獲
實時流協議RTSP是一個應用層協議,用于控制具有實時特性的數據如多媒體流的傳送。為多媒體數據流提供遠程控制功能,如播放、 停止、快進等。該協議支持以下操作:
1. 從媒體服務器上獲取媒體;
2. 邀請媒體服務器加入會議;
3. 在一個已存在的演示中加入新的媒體流。
RTSP協議一般與RTP/RTCP和RSVP等底層協議一起協同工作,提供基于Internet的整套的流服務。它可以選擇發送通道如UDP、組播UDP和TCP和基于RTP的發送機制。它可以應用于組播和點播。
RTSP協議負責在服務器和客戶端之間建立并控制一個或多個時間上同步的連續流媒體,其目標是像HTTP協議為用戶提供文字和圖形服務那樣為用戶提供連續媒體服務。因此,RTSP協議的設計在語法和操作上與HTTP協議很相似,這樣,對于HTTP的大部分擴展也適用于RTSP。但是RTSP協議和HTTP協議在很多方面有著區別:
1. HTTP是一個無狀態協議,而RTSP協議是有狀態的。
2. HTTP本質上是一個非對稱協議,客戶端提出請求而服務器響應;而RTSP是對稱的,服務器和客戶端都可發送和響應請求。
在RTSP中,每個演示及其所對應的媒體流都由一個RTSP URL標識。整個演示及媒體特性都在一個演示描述文件中定義,該文件可能包括媒體編碼方式、語言、RTSP URLs、目標地址、端口及其它參數。用戶在向服務器請求某個連續媒體流的服務之前,必須首先從服務器獲得該媒體流的演示描述文件以得到必需的參數,演示描述文件的獲取可采用HTTP、Email或其他方法。
RTSP中的所有的操作都是通過服務器和客戶方的消息應答來完成的,其消息包括請求和響應兩種,RTSP正是通過服務器和客戶端的消息 應答來完成媒體流的創建、初始化、VCR控制以及拆線等操作的。在基于客服端/服務器結構的分布式視頻點播系統中,RTSP協議的操作過程如下所示:
圖 2 基于RTSP的流媒體服務器
客戶機在向視頻服務器請求視頻服務之前,首先通過HTTP協議從Web服務器獲取所請求視頻服務的演示描述文件,利用該文件提供的信息定位視頻服務地址包括視頻服務器地址和端口號,及視頻服務的編碼方式等信息。然后客戶機根據上述信息向視頻服務器請求視頻服務。視頻服務初始化完畢,視頻服務器為該客戶建立一個新的視頻服務流,客戶端與服務器運行實時流控制協議RTCP,以對該流進行各種VCR控制信號的交 換,如播放、暫停、快進、快退等。當服務完畢,客戶端提出拆線請求,需要說明的是,服務器使用RTP/UDP協議將媒體數據傳輸給客戶端,一旦數據抵達客戶端,客戶端應用程序即可播放輸出。在流式傳輸中,使用RTP/RTCP/UDP和RTSP/TCP兩種不同的通信協議在客戶端和服務器間建立聯系。
Microsoft公司的Windows Media的核心是ASF(Advanced Stream Format)。微軟將ASF 定義為同步媒體的統一容器文件格式。ASF是一種數據格式,音頻、視頻、圖像以及控制命令腳本等多媒體信息通過這種格式,以網絡數據包的形式傳輸,實現流 式多媒體內容發布。
ASF最大優點就是體積小,因此適合網絡傳輸,使用微軟公司的最新媒體播放器可以直接播放該格式的文件。用戶可以將圖形、聲音和動畫數據組合成一個ASF格式的文件,當然也可以將其他格式的視頻和音頻轉換為ASF格 式,而且用戶還可以通過聲卡和視頻捕獲卡將諸如麥克風、錄像機等等外設的數據保存為ASF格式
ASF具有可擴展的媒體類型,ASF文件允許制作者很容易地定義新的媒體類型。ASF格式提供了非常有效的靈活地定義符合ASF文件格式定義的新的媒體流類型。任一存儲的媒體流邏輯上都是獨立于其他媒體流的,除非在文件頭部分明顯地定義了其與另一媒體流的關系。
ASF是設計用來表示可伸縮的媒體類型的帶寬之間的依賴關系。ASF存儲各個帶寬就像一個單獨的媒體流。媒體流之間的依賴關系存儲在文件頭部分,為客戶機以一個獨立于壓縮的方式解釋可伸縮的選項提供了豐富的信息流的優先級,現代的多媒體傳輸系統能夠動態地調整以適應網絡資源緊張的情況如帶寬不足。多媒體內容的制作者要能夠根據流的優先級表達他們的參考信息,如最低保證音頻流的傳輸。隨著可伸縮媒體類型的出現,流的優先級的安排變得復雜起來,因為在制作的時候很難決定各媒體流的順序。
ASF設計為支持多語言。媒體流能夠可選地指示所含媒體的語言。這個功能常用于音頻和文本流。一個多語言ASF文件指的是包含不同語言版本的同一內容的一系列媒體流,其允許客戶機在播放的過程中選擇最合適的版本。
ASF提供可繼續擴展的目錄信息的功能,該功能的擴展性和靈活性都非常好。所有的目錄信息都以無格式編碼的形式存儲在文件頭部分,并且支持多語言,如果需要,目錄信息既可預先定義如作者和標題,也可以是制作者自定義。目錄信息功能既可以用于整個文件也可以用于單個媒體流。
ASF文件主要有三種數據對象組成Header Object,Data Object,Index Object。Header Object包括ASF文件的主要信息,必須位于文件首部。Data Object包含數據信息,緊跟在Header Object之后,Index Object是非必須,提供跳躍索引,位于文件結尾。RTSP協議中,ASF的Header Object用Base64編碼加密以后放在SDP(Session Description Protocol)數據包中。
在系統中,我們采用了移植在eBox-4300上的WinCE作為系統的嵌入式操作系統,為了解碼器的工作效率和移植方便,我們采用ASF流媒體文件格式。根據搭建的基于RTSP協議的流媒體服務器,可以校驗在網絡中截取到數據包的特定協議字段,如果應用層協議有RTSP的協議字段,就將數據包取出,按協議進行對包的卸載,提取出ASF文件,再將ASF文件按序列傳輸到下一處理單元進行視頻解碼,并提取出關鍵幀。
2.網絡視頻關鍵幀提取
視頻數據是分層結構,結構粒度從上到下逐漸減小。最頂層是粒度最大的視頻,即一段視頻流。最底層是粒度最小的幀,即單個的視頻幀圖像,對幀圖像的處理可以采用圖像特征提取技術,提取諸如顏色、紋理、形狀等靜態特征或空間運動的動態特征。鏡頭是一組時間上連續的幀序列,它代表一個場景中在時間上和空間上連續的動作,對應著攝像機的一次記錄起停操作,也稱為剪裁或拍攝。鏡頭是視頻數據的最小單元,視頻檢索的結果就是獲得符合條件的若干鏡頭。場景是一組語義上相關聯及在時間上相鄰的鏡頭的集合。
圖3 視頻層次結構示意圖
關鍵幀是反映一組鏡頭中主要信息內容的一幀或若干幀圖像,可以簡潔地表達鏡頭內容。因為每個鏡頭都是在同一場景下拍攝的,同一個鏡頭中的各幀圖像有相當大的重復信息。考慮到存儲容量和處理效率的因素,僅需要存儲鏡頭關鍵幀,可達到降低系統存儲容量和減少處理器冗余工作的效果。其次,從關鍵幀的匹配效率考慮,用關鍵幀來代表鏡頭,作用類似于入侵檢測系統中的匹配規則,這樣對網絡視頻流可用圖像匹配技術進行處理。
針對關鍵幀的特點,選取時有兩個基本要求:第一,所選幀必須能夠反映鏡頭中的主要事件,描述應盡可能準確完全,所以一般采用保守原則,寧可錯選,也不能少提取;第二,為了減少系統存儲設備,提高處理數據包的效率,數據處理量應盡量小,計算不宜過于復雜,因此關鍵幀的抽取應盡量少而精確。
早期的提取關鍵幀的嘗試主要是采用顏色特征。一個簡單的提取關鍵幀的想法是選擇鏡頭片段的第一幀作為關鍵幀。當然這樣提取的關鍵幀是很不準確的。在基于鏡頭的方法中,比較經典的有幀平均法和直方圖平均法。幀平均法是從鏡頭中取所有幀在某個位置上像素值的平均值,然后將鏡頭中該點位置的像素值最接近平均值的幀作為關鍵幀。直方圖平均法則是將鏡頭中所有幀的統計直方圖取平均,然后選擇與該平均直方圖最接近的幀作為關鍵幀。這些方法的優點是計算比較簡單,所選取的幀具有平均代表意義。缺點是只從一個鏡頭中選取一個關鍵幀,無法處理運動強度較高的鏡頭。一般說來,從鏡頭中選取一幀或固定數目的關鍵幀的方法并不是很好,因為當處理變化很少的鏡頭時,這樣選取的關鍵幀過多,而對于運動較多的鏡頭,用一兩個關鍵幀又無法充分描述其內容。所以有人提出了基于內容分析的方法。
綜合前人的研究成果,我們在本系統采用漸變控制的方法。首先選取每個鏡頭的第一幀作為關鍵幀,同時作為其他候選關鍵幀的參考幀,將后續每幀和參考幀比較,當其差別大于預定的閥值時,即將當前幀作為新的關鍵幀,同時將此幀作為新的參考幀。
3. 視頻關鍵幀匹配
常用的圖像特征有顏色特征、紋理特征、形狀特征、空間關系特征等。
顏色特征是一種全局特征,描述了圖像或圖像區域所對應的景物的表面性質。一般顏色特征是基于像素點的特征,此時所有屬于圖像或圖像區域的像素都有各自的貢獻。由于顏色對圖像或圖像區域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對象的局部特征。
顏色直方圖是最常用的表達顏色特征的方法,其優點是不受圖像旋轉和平移變化的影響,進一步借助歸一化還可不受圖像尺度變化的影響,基缺點是沒有表達出顏色空間分布的信息。顏色直方圖簡單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所占的比例,特別適用于描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像。
紋理特征也是一種全局特征,它也描述了圖像或圖像區域所對應景物的表面性質。但由于紋理只是一種物體表面的特性,并不能完全反映出物體的本質屬性,所以僅僅利用紋理特征是無法獲得高層次圖像內容的。與顏色特征不同,紋理特征不是基于像素點的特征,它需要在包含多個像素點的區域中進行統計計算。在模式匹配中,這種區域性的特征具有較大的優越性,不會由于局部的偏差而無法匹配成功。作為一種統計特征,紋理特征常具有旋轉不變性,并且對于噪聲有較強的抵抗能力。但是,紋理特征也有其缺點,一個很明顯的缺點是當圖像的分辨率變化的時候,所計算出來的紋理可能會有較大偏差。
通常情況下,形狀特征有兩類表示方法,一類是輪廓特征,另一類是區域特征。圖像的輪廓特征主要針對物體的外邊界,而圖像的區域特征則關系到整個形狀區域。形狀的表達和匹配采用更為簡單的區域特征描述方法,例如采用有關形狀定量測度(如矩、面積、周長等)的形狀參數法。
空間關系,是指圖像中分割出來的多個目標之間的相互的空間位置或相對方向關系,這些關系也可分為連接或鄰接關系、交疊或重疊關系和包含包容關系等。通常空間位置信息可以分為兩類:相對空間位置信息和絕對空間位置信息。前一種關系強調的是目標之間的相對情況,如上下左右關系等,后一種關系強調的是目標之間的距離大小以及方位。顯而易見,由絕對空間位置可推出相對空間位置,但表達相對空間位置信息常比較簡單。空間關系特征的使用可加強對圖像內容的描述區分能力,但空間關系特征常對圖像或目標的旋轉、反轉、尺度變化等比較敏感。另外,實際應用中,僅僅利用空間信息往往是不夠的,不能有效準確地表達場景信息。
優秀的匹配算法是系統工作效率和辨識能力的保證,而高效的匹配算法需要準確地描述出關鍵幀的特征。在本系統中,我們考慮到系統計算能力和穩定性的要求,采用顏色直方圖和形狀特征相結合的描述算法。當提取出當前網絡視頻流的關鍵幀序列后,將關鍵幀以流水線作業的方式后匹配規則庫中的匹配圖像做比較,若相似率大于預定的閥值時,我們就有理由相信當前視頻流是垃圾視頻。如果相似率低于預定的閥值,但落在了一個預定的有嫌疑的區間中,我們可以提取當前關鍵幀的顏色直方圖和輪廓特征,與匹配圖像的顏色直方圖和輪廓特征相比較,如果其匹配概率大于預警閥值,系統可向管理員提出告警,再通過人工識別的方式來判斷當前視頻流是否非法。
4. 告警響應和處理
隨著網絡風險系數不斷提高,網絡攻擊技術和病毒木馬技術日益更新,單純的網絡安全設備已經不能滿足企業、學校和家庭的安全保障。因此,本系統對視頻信息的監測也將和其它網絡安全設備結合在一起,構成全方位的網絡安全保障體系結構來保證一個安全和諧的網絡環境。
基于系統特有的預警機制,可以降低誤報率和提高監測效率。當系統檢測到垃圾視頻信息時,將提取出該視頻數據包的源IP地址和端口等信息,并將信息顯示在系統報警頁面通知系統管理員的同時,也會將信息傳輸到網絡安全保障體系結構中的其他相關安全設備,如防火墻等。防火墻將第一時間將此非法IP地址和端口列入黑名單中,禁止該IP地址的視頻數據包通過防火墻。
圖4 安全保障體系結構
系統也可和入侵檢測及安全審計等安全設備結合,來防止病毒和木馬等捆綁在視頻信息中對用戶進行攻擊。系統首先將關鍵幀進行匹配校驗,如果相似率低于預警閥值,我們也不能掉以輕心,不排除其圖像中隱藏有病毒和木馬等信息,導致圖像像素發生了肉眼無法區別的改變,由于圖像像素結構的改變,可能會欺騙視頻監測系統,從而通過了檢驗。因此,此時系統會將關鍵幀傳輸到病毒掃描系統進行進一步的檢查。
由于系統本身的匹配校驗和預警機制,同時結合網絡安全保障體系中其他安全設備的資源來對視頻流進行監測,可以保障視頻信息的干凈和安全,同時不影響用戶對視頻服務的享受。
系統實現
I.硬件實現
系統分別由視頻數據包識別捕獲單元、視頻解碼關鍵幀提取處理單元、關鍵幀查詢單元、視頻關鍵幀匹配單元、關鍵幀匹配規則庫和告警響應處理單元六個模塊組成。
視頻數據包識別捕獲單元
視頻數據包識別捕獲單元由FPGASpartan 3E板卡來實現。FPGA具有高速并行處理的邏輯編程結構,可以實現流水線識別源IP地址、源端口和目的IP地址、目的端口,以及協議類型、視頻標志字段等信息的處理。
根據用戶特定需要監測的視頻類型和流媒體協議,用戶可以自定義視頻特定位置的標志字段。識別捕獲數據包單元過濾到相應的視頻數據包時,將按照特定的流媒體協議對數據包進行卸載,提取出視頻信息后傳輸到后繼視頻解碼單元,提取出視頻的關鍵幀。
視頻解碼關鍵幀提取處理單元
視頻解碼關鍵幀提取單元在eBox-4300上的Wince操作系統上實現。Wince是微軟公司開發的嵌入式操作系統,具有很好的移植性和視頻處理庫,開發容易上手等優點。同時考慮到當前視頻格式標準多樣,為了提高系統的功能,以后一定會不斷向系統添加新的解碼器。而Wince上軟件的兼容性相對其他的操作系統較強,當用戶添加其他解碼器時更簡單。
關鍵幀查詢單元
關鍵幀的查詢是為了方便系統管理員對系統的工作效能進行控制。在系統管理過程中,管理員可以通過身份驗證登錄到系統管理頁面,查看當前時間段的告警信息和相應的關鍵幀,并可根據人為識別的方法,決定是否向關鍵幀匹配庫中添加新的匹配圖像。
視頻關鍵幀匹配單元
視頻關鍵幀的匹配是系統的主要部分,系統監測的準確性主要取決于關鍵幀的匹配算法和模式。FPGA中,與RAM存儲單元相關的資源有三類:Block RAM、LUT、寄存器。這三類資源可以通過配置和粘合邏輯實現為不同類型和位寬大小的單端口/雙端口RAM、ROM、CAM、FIFO等。FPGA中CAM的實現和配置非常靈活,CAM是實現模式匹配的核心資源。
CAM即內容可尋址存儲器。CAM這種存儲器在其每個存儲單元都包含了一個內嵌的比較邏輯,CAM基于內容尋址,通過硬件電路并行查找,實現快速匹配。一般來說在一個時鐘周期內,寫入CAM的待比較數據和其內部存儲的每一個數據進行比較,并返回與端口數據相同的內部數據存儲的地址和是否匹配的標識符。CAM的這種并行處理特性使得它在數據分選領域倍受青睞,被廣泛應用在以太網網址搜尋、路由器中的地址交換表、高速數據處理等方面。
基于CAM在模式匹配方面的良好特性,我們將關鍵幀的匹配單元在FPGA中實現。由于Spartan 3E的BRAM資源有限,所以系統存儲的關鍵幀數據不會很多。將匹配圖像的顏色直方圖和形狀輪廓信息存儲在CAM中后,提取關鍵幀的顏色直方圖和形狀輪廓信息進行匹配。用這種方法可以提高關鍵幀匹配的速率,避免了系統的瓶頸。
關鍵幀匹配規則庫
視頻關鍵幀匹配規則庫的更新是提高視頻監測準確性的關鍵。因此,視頻匹配規則庫良好的接口設計是用戶交互的重要方面,在本系統中,我們將關鍵幀信息存儲在CAM中,當用戶根據自己的需求,提取出自定義圖像的顏色直方圖和形狀輪廓特征信息后,可在線寫入CAM中,作為新的匹配規則。
告警響應處理單元
鑒于當前網絡攻擊方式的多種多樣和系統本身的處理能力有限,我們建議將此系統和其它網絡安全設備相結合構成網絡安全保障體系結構。綜合各種安全監測設備自身的優點和不足,合理利用有限的資源,全方位保障內部網絡的安全。
在此系統中,我們可以提取出視頻源的IP地址和端口號,如果確定當前視頻含有垃圾信息,系統將其IP地址和端口號傳輸到體系中的防火墻等設備,由防火墻截斷其數據包的傳輸,并將其列入黑名單重點監測。同時,提取出的關鍵幀還將由病毒掃描系統等安全審計設備進行檢查,防止視頻中捆綁有病毒和木馬等攻擊信息。
圖5 硬件實現示意圖
II.軟件實現
系統網絡接口
Lwip是瑞士計算機科學院(Swedish Institute of Computer Science)的Adam Dunkels等開發的一套用于嵌入式系統的開放源代碼TCP/IP協議棧。Lwip既可以移植到操作系統上,又可以在無操作系統的情況下獨立運行.
LwIP的特性如下:
(1) 支持多網絡接口下的IP轉發;
(2) 支持ICMP協議 ;
(4) 包括阻塞控制,RTT估算和快速恢復和快速轉發的TCP協議;
(5) 提供專門的內部回調接口(Raw API)用于提高應用程序性能;
(6) 可選擇的Berkeley接口API(多線程情況下);
(7) 在最新的版本中支持PPP;
(8) 新版本中增加了的IP fragment的支持;
(9) 支持DHCP協議,動態分配ip地址。
在Xilinx公司提供的ISE 10.1開發套件中,EDK開發軟件支持Lwip的應用,同時軟件自身包含Lwip的庫。因此,系統中的網絡接口我們全部基于Lwip的RAW IP模式開發。
關鍵幀提取
FFmpeg是用于制作和轉化流媒體音頻和視頻的完整解決方案, 包括 libavcodec ,一套先進的的音視頻編解碼類庫。FFmpeg 在Linux上開發,當可以在大多數操作系統下編譯,包括Windows。
Ffmpeg開源項目由以下幾部分組成:
FFmpeg 視頻文件轉換命令行工具,也支持經過實時電視卡抓取和編碼成視頻文件;
FFserver 基于HTTP(RTSP正在開發中)用于實時廣播的多媒體服務器.也支持時間平移;
FFplay 用 SDL和FFmpeg庫開發的一個簡單的媒體播放器;
libavcodec 一個包含了所有FFmpeg音視頻編解碼器的庫.為了保證最優性能和高可復用性,大多數編解碼器從頭開發的;
libavformat 一個包含了所有的普通音視格式的解析器和產生器的庫.
在系統中的網絡視頻解碼和關鍵幀提取單元,解碼器的實現是在開源音視頻解碼器庫libavccodec的開發上實現的。
RS232串口通信
1K Xmodem文件傳輸協議為基于點對點連接的服務與客戶端間的通信,提供了一種固定包長度的簡單的連續文件傳輸協議。每一個包都包含1024字節的文件數據,并且都單獨的被接收客戶端響應。每次只能傳輸一個文件,并且失敗后只能從新開始傳輸。
圖 6
文件數據包格式1K Xmodem文件傳輸協議并不需要向接收客戶端發送待發送文件的名稱 ,該文件將會被接收方授予一個局部有效的文件名。 要開始文件傳輸的過程,首先接收方向發送方發送一個輪詢字符,來提示發送方客戶端已經準備好了。如果接收方支持check-sum (CRC)校驗,則輪詢字符可以用0x43 (ASCII 字母 C);如果接收方只支持舊的checksum (求總和)校驗,則輪詢字符可以用0x15 (NACK線控制字符)。發送方響應接收方的啟動字符,開始發送文件數據包,每個包都是1024字節的固定長度。如果最后一個文件數據包不足1024字節,則利用NACK(0x1A)填充到1024字節。接收方通過ACK(正常接收)或者NACK(非正接收)來響應每一個包。如果發送方收到ACK,則發送下一個包知道文件傳輸完成;如果發送方收到NACK,則重新發送上一個包。當發送方發送完成后,發送EOT通知接收方文件傳輸結束,接收方發送ACK來響應,發送方收到ACK后則文件傳輸完成。在系統中,eBox-4300通過1K Xmodem文件傳輸協議和Spartan 3E的RS232串口進行關鍵幀的傳輸。同時,系統也可以通過串口和系統管理主機進行通信。
圖 7 軟件實現流程圖
1.捕獲分析:用戶可根據實際情況,調整視頻數據包捕獲的標志字段,來截取當前網絡中的視頻數據包; 2.靈活的解碼系統:由于當前流媒體文件格式多樣,我們在此系統中只進行了ASF格式流媒體文件的解碼,但用戶可以自己編譯自定義的解碼器并添加到當前系統中; 3.匹配規則更新:匹配規則的更新是系統高效工作的前提,系統良好的用戶交互界面,將幫助用戶輕松添加新的匹配規則到當前系統中; 4.協調功能:系統架構初期充分考慮到目前的網絡安全設備已經多種多樣,為了充分利用網絡中已有安全設備的資源,對一些常見的防御功能不再設計。因此,本系統可以很好地和其他安全設備交互網絡信息,協調工作功能,從而保障網絡各方面的安全。
本文引用地址:http://www.eepw.com.cn/article/201609/303911.htm
II.系統創新點
功能指標和系統創新點
首次提出用關鍵幀檢驗的方法來監測網絡視頻。關鍵幀技術是當前基于內容的視頻檢索中的熱門研究對象,同時我們基于入侵檢測的基本思想和模型,提出將視頻檢索中的關鍵幀技術同時結合入侵監測模型,可以簡化視頻監測的計算復雜度,同時具有較高的識別能力。