在當前的大數據時代下,大數據,彷彿是企業潮流字眼,但企業該如何運用令其增值?很多時市面上都充斥著“大數據解決方案”,令大數據范疇留有灰色地帶,一切變得撲朔迷離。
大數據
某些數據供應商巧立名目,自稱大數據,企業應小心分辨。
重點不在于“大”、也不在于“數據”
大數據其實已運行差不多十年,起初進入市場時,“大”是其銷售重點,供應商需要面對很多挑戰,不停地攝取和消化以予改進,包括如何進化為 PB(1,000TB),如何運行這容量及制造一些結果,當時一切都以“大”為主題,故此如何運用、如何演繹都變得次要。
另一具爭議性地方是“數據”。大數據本來就是以大量數據進行一連串分析以找到一些結果,這也不難理解。這的確是個有效方法,過去多年,很多人都希望找尋一個方法去消化一系列數據而找尋結論,然而大數據滿足了這要求。時至今日,消化數據變得容易很多,而這趨勢看似將會繼續不停地發展下去。
那么大數據不在于“大”,也不在于“數據”,那在于甚么?以下為一些見解,可助企業分辨大數據工具的真偽。
大數據 VS 大商業智能
大商業智能(Big Business Intelligence,Big BI),有以下3點:
1. 分析相同結構及交易類數據,像過往多年一樣,也許有更多這方面數據。
2. 這些數據是一組組的,也是舊數據。
3. 分析結果后并不能讓企業進行行動。
而大數據則有以下叁點特征:
1. 把新數據及舊有數據連合在一起,尤其是那些有結構性數據及非結構性數據。
2. 可以實時或接近實時進行分析。
3. 制造亮點以採取即時行動。
由此可見,兩者方案其實都是企業的資訊工廠,然而各有特殊不同的特點和觀點價值。大企業智慧創造及維持資訊記憶十分有用;而大數據方案則引領企業徹底地進入另一營運模式及換來另一全新結果。
而第二個“真”“假”大數據工具在于,真大數據能幫助企業融合結構和非結構性數據、實時或接近實時分析、以及析出亮點;而假大數據并不能進行以上行為,所以企業必須小心分辨,以免浪費金錢在假大數據上。
大數據能克服各種限制
數據湖即擁有大量最新數據,儲存在數據倉庫等待進行分析,不過這字眼其實是比較舊,以“湖”形容其實不太準確,雖然數據很多很大,可以以“海量”來形容,故此用“數據淹沒”會比較合適。
腐爛、發臭、骯臟和非常困難發展為一些有用分析,協助企業生產就是數據淹沒的意思。即使再進行數據解壓、轉化及讀取,有不少隱藏數據都已損毀而無法使用。
相反地,好的大數據工具容許數據受到分析、生產、儲存及管理,不論在甚么地方都可以,包括任何流動裝置、社媒、云端等。事實上,數據能夠穿越地域限制,即使在小小空位也能隨意運用。如果需要時間移動、轉化、清洗和讀取,那么這樣的大數據就失去了它存在價值。
D1Net評論:
大數據必須運行資料夠快和維持數據準確,同時也要容許使用者在過百或過千的數據水坑運作,即使在訊號微弱時也能夠做得完美,而不是受數據淹沒而無力進行分析,這樣才是大數據最大價值,這樣的數據才是真正的大數據。