據朱文武介紹,現在處于人機物的時代,設備的無所不在、網絡的無所不在、計算的無所不在,導致了數據產生的速度發生了爆炸性的增長。朱文武預計,隨著互聯網、物聯網和社交網絡的發展,預計到2020年將有40ZB的數據可供記錄。
大數據時代到來也會帶來很多挑戰,包括數據量巨大和處理及時有效性、真實性、防隱私泄露等問題。
數據量非常大、種類非常多,多模易構。“數據里面有語音、文本、圖片、視頻等等,給處理帶來了很多挑戰。另外數據的變化很快,傳播特性造成了數據的時效性,這樣一個矛盾非常難以解決。”朱文武說。
此外,數據真實性和可靠性也面臨嚴重挑戰。朱文武表示,最難的不是拿到越多越好,而是要大海撈針,把真實有用的數據提煉出來。數據如果不真實,將導致分析走向錯誤的方向。
此外,大數據在應用的時候,如何防隱私泄露也是需要在青島研究的課題。