云計算是大數據的運行平臺,非結構化數據爆發式成長,大數據的智能分析和決策被粉飾的神乎其神,不過針對應用領域,還有四個要素將影響大數據發展:
1.預測后不敢用
如果把大數據比作算命顯然有點欺負了這位IT新寵,但從目前的大數據分析領域看,在很多行業應用上還存在敢測不敢用的尷尬,預測結果更多是印證而不是代替決策,除了大數據本身預測準確率以外,系統性風險帶來的決策失誤很可能最終讓大數據背鍋,信息部門以及咨詢機構憑空擔了責任,想想就覺得冤枉。
2.信息不對稱
大數據體現在一個大字上,是一個公司的數據還是一個行業的數據還是合縱連橫參考多個維度數據來做的最終分析?實際上各個“大數據庫”如一個個信息孤島,彼此缺乏聯動,而單一通過某個孤島來決策自然生態顯然是盲人摸象,不準也就不足為奇了。
3.非結構化難解人性
結構化數據的最大特點是基于考量數據做推演,總結過去做預測,可當前大數據面臨太多的非結構化數據,這里包含了龐雜的社會信息和干擾信息,如果我們按照結構化數據的方式來看,從過去10年情況來預測今年的走勢,也許會得到一個波動不太大的結果,但如果我們發現某位用戶衣服買了綠色,褲子買了綠色,襯衫買了綠色,然后系統認為用戶在服飾選擇上偏愛綠色的話,那有一天用戶想買頂帽子時,系統推薦的商品也許會激怒用戶。
這應該是大數據面臨最尷尬的一點,如果說大數據是基礎,深度學習和人工智能才是關鍵,因為這兩項必須依靠大數據作為基石,會讓決策準確度實現指數級提升,當這兩項技術水平得到了解放,大數據才完整體現了價值。
4.使用過期數據
數據的新鮮程度將極大影響最后的分析結果,不同的行業的數據保鮮時間也會有很大差別,例如服裝業的潮流變化速度明顯快于其他行業,很多大數據最終結果偏差都是由于數據更新的不及時性導致,因此如何確保數據不斷隨時更新對于大數據來言是一個很大的挑戰。
5.走不出安全隱私困局
安全是一個永久話題,數據越多,泄露后帶來的風險和損失越大,“大數據庫”越大,一鍋端后看著越辣眼睛。