企業的數據可以分為三種類型:結構化數據、半結構化數據和非結構化數據,其中85%的數據屬于廣泛存在于社交網絡、物聯網、電子商務等之中的非結構化數據。這些非結構化數據的產生往往伴隨著社交網絡、移動計算和傳感器等新的渠道和技術的不斷涌現和應用。
過去三年里產生的數據量比以往四萬年的數據量還要多,大數據時代的來臨已經毋庸置疑。我們即將面臨一場變革,新興大數據將成為企業發展的當務之急,而常規技術已經難以應對PB(1024TB)級的大規模數據量。這一變化所帶來的挑戰是成功的企業在未來發展過程中必須要面對的。只有那些能夠運用這些新數據型態的企業,方能打造可持續的重要競爭優勢。
大數據可以來自方方面面,從生活中的購物交易,到工業上的生產制造;從社交網絡媒體信息,到在線視頻圖像資料;從企業的信息管理系統,到政府部門的電子政務,都有著大量的數據產生。隨著物聯網和云計算產業的蓬勃發展,大數據的價值還會進一步顯現。
物聯網時代,成萬上億計的網絡傳感器被嵌入到現實世界的各種設備中,如移動電話、智能電表、汽車和工業機器中,用來感知、創造并交換數據,無處不在的傳感網絡帶來了無處不在的數據,這些數據正日益成為與實物資本和人力資源同等重要的生產要素。
同時,云計算為物聯網所產生的海量數據提供了存儲的空間,并使得實時在線處理成為可能。近幾年,IBM、甲骨文、微軟、SAP、谷歌等IT企業不僅在全球部署了多個數據中心,還花費了150億美元收購了專攻數據管理和分析方面的軟件企業。
較早行動起來的IBM在2005年-2009年間就投入120億美元,創立了6個達4000員工的全球分析中心。不難發現,當人們還在熱衷于物聯網和云計算概念炒作的時候,全球領先的IT企業們已經開始把注意力轉向物聯網和云計算產業背后的大數據,其潛在的價值正在被逐漸挖掘。“大數據比物聯網、云計算更重要”的判斷也許有點夸張,但是可以肯定的是:云計算不單是提供云存儲等服務,對大數據的智能化處理不僅是云計算的題中之義,更是其核心與關鍵。
在未來五年,大數據將逐漸成為越來越多CIO工作中的一部分。一方面,商業智能的普及,讓企業對數據的重要性已經有了充分認識;另一方面,社交媒體、電子商務、物聯網等新應用的興起,打破了企業原有價值鏈為圍墻,僅對原有價值鏈各個環節的數據進行分析,已經不能滿足需求,他們需要借助大數據戰略打破數據邊界,了解更為全面的運營及運營環境的全景圖。
對于CIO來說,如何實現高效、智能的大數據存儲?非結構化數據正在呈海量增長趨勢,如何對其進行有效的數據管理和應用?現有數據保護與文檔歸檔機制能否應對日益增長的海量數據?如何攻克移動數據管理的難點問題?如何在復雜的數據環境下實現高效的數據安全? 這些都是CIO在未來要面臨的問題,如果能夠有效解決好這些問題,大數據將為企業創造更多的價值。