導語:所謂大數據(Big data)或稱巨量資料、海量資料、大資料,是指所涉及資料“數量龐大”、“種類繁雜”及“增加飛快”的特性,無法透過人工在合理時間內達到擷取、管理、處理、并整理成為人類所能解讀的資訊。
大數據與巨量資料分析(Big Data Analytics)均屬于以資訊科技領域軟硬體為基礎的應用工具,這工具要發揮到效用需要將此工具結合到決策模型中,才能展現價值。
市場預測,2015年將是Big Data蓬勃發展的一年。但是目前處于探討大數據的機會,遠多于投入實際使用。雖然每個人都知道需要做的事情與大數據息息相關,但實際上很少人懂得如何運用。甚至認為,能有效硬體部署與管理分類網路資訊就足夠,反而忽略資料種類多樣性與更新快速也是大數據的挑戰。
大數據建立首重資料搜集,必須依據各產業特性,決定要搜集何種資料,才不會陷入資料漩渦中。巨量資料的成功關鍵在于非結構化資料與快速流動資料清理過程需要新技術之導入,透過資料探勘與挖掘找出新規律,包括Hadoop及江河運算(Streams Computing)成為巨量資料分析技術核心。
分享大數據之決策分析也不能完全依賴先進技術,數據品質的關鍵在于資料建立者與使用者的良好溝通,資料品質的責任應該從資訊科技人員,轉移到需要資料正確而大量投資的經理人身上。否則,將產生“Big Data Gets Little”的反效果。
物聯網是成為這場“數據變革”的最大驅動力。因為物聯網與各種行動裝置的出現,迫使很多人思考而產生變化,進而影響到對于這些數據的互動方式。愈來愈多不同傳感器、設備、或應用程序產生出愈來愈多的數據,一個事件會伴隨出更多樣化結構數據,從企業內系統到外部數據,都必須經過清理整合才能轉化成有效情報進行分析。
巨量資料投資沒有效果的最大原因,是在于多數公司未善用本來就有的資料。千萬不要以為花大錢投資精密的分析工具,就能培養出分析能力。首先必須學習如何使用核心營運系統內有的資料,必須先學會使用資料和分析,來支持營運決策,才有可能從巨量資料受惠。
在結合巨量資料工具之決策模型方面,一、如何將巨量資料分析導入并整合傳統決策模式是關鍵,且這些決策問題需要針對不同類型之決策進行處理。二、有巨量資料后,要如何將傳統資料與決策模型結合,才能發揮綜效。
根據證據做決策而非直覺來決定,是很困難的文化轉變,工作流程必須重新定義,資料必須篩選,還要訂定商業規則做為指引,建立決策模式后,最大好處就是競爭對手無法輕易模仿。
D1Net評論:
不論從決策模式與需求出發,未來將出現不同類型的典型資料與巨量資料分析模型,并將發展出新興應用與商機。因此,誰先累積核心Know-How或是關鍵技術,將有機會成為新一代的巨量資料受益者或贏家。總而言之,一句話,把大數據邊成金山才是硬道理。