在目前的南方大規模降雨中,百度、阿里巴巴等多家公司利用大數據,即時發布武漢等城市街道積雨狀況的地圖,提醒出行市民提前避讓。這顯示了大數據的巨大威力和前景。
在日前舉辦的中國大數據產業峰會暨中國電子商務創新發展峰會上,中國工程院院士、中國互聯網協會理事長鄔賀銓向記者表示,大數據不能追求以大蓋全,而應當追求數據精準并強調規律。“對一個大數據集而言,我們很難要求所有數據都精準,但只要大多數數據有代表性,就不妨礙我們利用數據集合得到較為準確的結果。”
據介紹, 2015年、2016年兩年內,全世界新產生的數據量約等于人類有史以來到2014年全球累積數據量的總和。鄔賀銓認為,大數據具有增長性、顆粒性、異構性、移動性、多維性、隱私性等特點。他以醫療大數據為例介紹說,一個千萬人口的國內城市50年累計的醫療數據量,預計能達到10PB級。這些數據具有多樣性和碎片化的特點,顆粒性大小差別很大。未來,人們需要將這些非結構化數據轉換為結構化數據進行處理和儲存。
“我們正加速進入大數據時代,但并不是所有數據都能開放,而是按照分類來進行部分開放。”鄔賀銓說,大數據有很多來源,包括社會空間數據、物理空間數據和信息空間數據。比如國家安全數據、商業秘密數據、個人隱私數據這三方面的數據就不能開放。