除了應用模式,技術也是目前橫亙在視頻大數據發展道路上的另一座大山。有很多方面,涉及采集、存儲、管理等多方面的領域,但是在作者看來,最大的技術障礙還是在于視頻的結構化。商業應用上的數據多為結構化數據,每個數據都由一系列明確的描述屬性組成,大數據處理系統則可以根據使用者的要求將不同的屬性進行歸類,從而發現和掌握事物發展的客觀規律。而視頻則不然,除了時間和空間的屬性外,并沒有其他的標簽。除了按照時間和地點查找相應的視頻外,大多的視頻只能靠人慢慢甄別,這離大數據應用還相去甚遠。
要做到大數據應用,就必須為每個視頻貼上更多的屬性標簽,也就是業內所說的結構化過程。作者認為這是未來視頻應用技術的制高點,其核心是模式識別算法,要做到自動把視頻中的特征識別出來貼上標簽后入庫。這樣在日后需要的時候,才能實現海量視頻的快速查詢和碰撞研判,甚至能像商業大數據那樣做到歸類統計。
結構化的意義不難理解,只是真正實現起來很難,作者總結了有幾個原因:
1.識別什么特征?一副圖像或者一段視頻可以有無數角度的標簽屬性去描述,什么才是我們需要的屬性?這與我們需要得到的目的密切相關,這就需要公安圖偵的人才來歸納終結。
2.識別算法開發難,由于是平面圖像,因此特征的識別主要原理就是看圖像區域中的輪廓、顏色、紋理與特征庫進行比較。但是在同一個物體在不同監控角度的攝像頭中顯示出的輪廓都不相同,因此無法做到識別。
3.大規模數據處理難,即使做到了識別算法,但是如果要通過數據處理服務器的形式對大規模的視頻進行結構化處理,這個建造成本巨大,其能源的耗費在中國這個夏季需要限電的情況里也不切實際。
如此看來,視頻結構化的路似乎走不通,但是,目前在業內也出現了許多“曲線救國”的方法。比如:
1.大力發展電警卡口建設:目前電警卡口在圖偵上的應用需求和頻率早就超越了交警,因為案件基本都要與車輛發生聯系,這能找出很多的線索。而卡口電警對于車輛的抓拍角度是相對固定的,能夠開發出相應的車輛特征識別技術,電警卡口屬于業務需求和技術實現的一個很好的匹配點。
2.結構化識別前移:在攝像機采集到圖像的同時就要做好結構化的工作,例如卡口攝像機,就應該把智能識別的算法集成進去。目前不少廠商都推出了相應的智能卡口攝像機,建議政府應該大力推廣,在老卡口攝像機更新換代的時候使用這類智能卡口攝像機進行替代,為未來大規模進行視頻結構化做好準備。
3.雙目等特種攝像機的開發,突破平面圖像特征的局限,得到更精準的三維系信息,如人體數量,高度,物體長度等。類似的產品適合應用在重點區域,符合國內目前嚴峻的反恐形勢。
4.物聯網等更多感知技術的應用,本文雖然主題是視頻大數據,但在業務的發展中,也積極倡議除了視頻外,融入更多的物聯網感知技術,如RFID技術等,作為視頻結構化信息的一個有效補充。
總而言之,對于視頻大數據的產業發展,一句話來總結:前途一片光明,同志仍需努力。