當今世界,正在從數據時代走向大數據時代。然而,我們聽到的大數據似乎無所不能,看到的卻似乎又混沌不清。全球領先的信息技術研究和顧問公司Gartner數據中心首席分析師張瑾認為,“我們甚至不能將所有大數據解決方案進行分類,用戶不清楚自己的問題,也不清楚大數據究竟能解決哪些問題,甚至用戶已經知道可以應用何種技術解決大數據問題,但找不到合適的供應商、服務商,提供合適的數學分析模型,提供產品集成,用戶自己也沒有人才儲備,維護系統正常運轉。”
對于大數據時代,目前人們所討論的數據幾乎都是條數據。條數據是指某個行業或領域呈鏈條狀串起來的數據。人類生活、生產產出的大數據,無論是搜索引擎、電商、社交平臺形成的企業大數據,還是天氣預報形成的科學大數據,還是各政府部門形成的行業大數據,都可以定義為“條數據”。這類大數據彼此割裂、互不融通,呈現出一種“混沌”的狀態,限制了大數據在經濟社會中發揮作用。
與之相比,塊數據是在一個物理空間或者行政區域形成的涉及到人、事、物等各類數據的綜合,相當于將各類“條數據”解構、交叉、融合。在塊數據集合過程中,包含了數據空間的填充、空間數據的重構、集合過程的組構,及組構過程中的集合,同時還有新數據的匯集和原有數據組合后的衍生數據。塊數據概念的提出和應用,使我們對大數據的挖掘實現了從混沌到精準。
舉例來說,一個百貨商場每天都會賣出很多商品,每個商品的原材料、品牌設計、廣告營銷數據、百貨商場賣出商品的數量、種類數據,消費者在商場購物、娛樂的數據,將所有在商場這個物理空間產生的數據求和,得到的就是塊數據。而一個數據的變化會帶動其他數據發生改變,比如,當商場的影院播放一部聚集人氣的影片時,商場的其他產品銷量也會上升,這一過程又會衍生出新的數據,隨時隨地更新的數據能使我們對商場的狀況有更精準的把握,進而拿出更具針對性的解決方案。
塊數據的價值就在于通過對塊數據的挖掘、分析,實現對事物規律的精準定位,甚至能夠發現以往未能發現的新規律。通過塊數據讓以往的“數據孤島”連成一片,再通過對不同類型、來源信息的集成、挖掘、清洗,極大地改變信息的生產、傳播、加工和組織方式,對大數據的挖掘變得精準,這給創新發展帶來新的驅動力,將會推動產業徹底變革和再造。可以毫不夸張地說,在這個時代,得“塊”者得天下。以往很多數據價值的外部性難題,將可以通過塊數據以市場化和行政化手段得到解決。