大數據是當前一個熱門詞語,但它本身的有效性還有待加強,主要基于三方面的原因:
一是數據條件還不成熟。豐富有效的數據源是大數據發展的前提。當前,我國數字化的數據資源總量遠遠低于美歐,每年新增數據量僅為美國的7%、歐洲的12%,其中政府和制造業的數據資源積累遠遠落后于國外。而已有的有限數據資源還存在標準化、準確性、完整性低、利用價值不高的情況,這大大降低了數據的價值。此外,中國要進入真正的大數據時代至少還需要10年,要從人人相連到物物相連,之后數據才能呈現爆發性增長,為進入大數據時代提供巨量有價值的數據支撐。
二是技術條件還不成熟。與成熟技術積累推動應用模式創新的云計算、物聯網、移動互聯網等領域不同,大數據領域的技術尚未完全成熟,還只能針對小規模、有結構或類結構的數據進行分析,談不上深層次的數據挖掘,現有的數據挖掘算法在不同行業中還難以通用。
三是大數據分析本身的局限性。大數據過于依靠數據的匯集,一旦數據本身有問題,就很可能出現“災難性大數據”,導致錯誤的預測和決策。同時,數據分析的結果本身可能影響進一步分析。
解決方案:第一,推進數據和技術完善。大力推進數據開放和標準化,消除數據共享壁壘,擴大數據總量和提升數據質量,加快推動互聯網、物聯網的發展。推進大數據技術發展與完善,特別是加快開發大數據技術在政府決策中的應用。第二,多元化手段相結合。正確認識大數據技術的局限性,揚長避短,形成信息技術與傳統決策模式的有機融合。