當前,視頻系統(tǒng)大數(shù)據(jù)應用仍然面臨三大技術(shù)挑戰(zhàn),可以概括為“存不下”、“找不到”、“看不清”三個方面。這三大挑戰(zhàn)在一定程度上反映出當前視頻大數(shù)據(jù)處理領(lǐng)域存在的主要問題,同時也對視頻大數(shù)據(jù)處理技術(shù)提出了更高的要求。
1、“存不下”主要體現(xiàn)在視頻壓縮編解碼性能的限制。
隨著數(shù)字視頻應用產(chǎn)業(yè)鏈的快速發(fā)展,政府、學校、社區(qū)、民用以及網(wǎng)絡(luò)終端所產(chǎn)生的海量視頻向傳統(tǒng)視頻編碼標準發(fā)出宣戰(zhàn)。存儲的視頻數(shù)量不斷加大就需要更大程度地提高編解碼效率,提高視頻壓縮率,從而降低存儲空間。網(wǎng)絡(luò)化進程的加快也要求編碼后的視頻在快速、便捷傳輸?shù)耐瑫r保證解碼還原的視頻質(zhì)量。
視頻壓縮也制約著智能視頻領(lǐng)域的發(fā)展。很多情況下我們要求降低解碼后的視頻損耗,比如多媒體視頻認證領(lǐng)域,視頻的無損還原是提高算法判斷準確度的先決條件,只有控制在一個合理的損耗范圍內(nèi),它才能提高視頻篡改提示的準確度。因此隨著視頻的網(wǎng)絡(luò)化、高清化、智能化時代的來臨,領(lǐng)先新一代視頻編碼標準,超越新的技術(shù)框架和編碼性能,才能在城市級視頻應用領(lǐng)域中取得核心的主導地位。
2、“找不到”主要體現(xiàn)為智能視頻監(jiān)控領(lǐng)域中的算法檢測識別準確率的問題。
目前的視頻監(jiān)控方法只能在非常簡單的環(huán)境下聚焦少量目標,檢測、識別、跟蹤性能還無法達到一個較高的水準,多數(shù)軟件都存在場景、環(huán)境的限制,例如在簡單、純凈的場景中,檢測目標背景與前景差別較大時,檢測結(jié)果較為準確;而在一些人流量密度大的復雜場景中,如地鐵、車站、商場,監(jiān)視成千上萬個個體時,準確地識別、跟蹤、檢測則是一項非常艱巨的任務(wù)。
同時算法檢測會受到光線、顏色、化妝、攝像機硬件誤差及精密度等一系列的問題影響,因此在低端智能與真正的人工智能之間還存在一個較大的鴻溝,它需要計算機處理能力及處理速度的提升。我們需要的是一種接近人類,甚至高于人類的識別準確率,并且能夠檢測區(qū)分人群行為,預測潛在的群體災難。這不僅僅在智能視頻領(lǐng)域,而且從多領(lǐng)域的交叉融合角度,智能分析的研發(fā)與探索對機器人的發(fā)展也能夠起到積極的推進作用。
3、“看不清”主要體現(xiàn)在高清監(jiān)控攝像機的智能化處理上。
以往大多數(shù)城市級安防監(jiān)控攝像頭錄制的視頻畫面都較為模糊,刑偵破案分析的依據(jù)僅僅為模糊畫面動作方向,甚至是模糊的像素點,對具體人物細節(jié)的描述不清晰導致刑偵難度加大,輔助公安機關(guān)研判的力度不強。在智能監(jiān)控領(lǐng)域,傳統(tǒng)的智能分析方法較多的是在CIF格式下進行算法處理,這樣處理速度更易達到實時。
D1Net評論:
顯而易見,當傳統(tǒng)視頻向高清視頻轉(zhuǎn)換過渡時需要多重處理策略相結(jié)合進行算法分析,這需要持續(xù)的研發(fā)革新。在從標清向高清的門檻跨越過程中,網(wǎng)絡(luò)帶寬的承載力、視頻的顯示、存儲等問題也不斷顯現(xiàn)。