每個追尋大數據的組織機構都對它寄予厚望,希望它可以回答長期的業務問題,讓企業在市場中具有更多的競爭力,更好地交付產品和服務。然而在這種熱情之中,很容易產生對大數據的虛假期望——有些好處永遠不會實現,除非你借助一定的“幫助”。以下就是大數據不會為你做的10件關鍵的事情,除非你采取正確的步驟來優化它的價值。
1、解決你的業務問題
大數據不會解決業務問題,解決問題的是人。只有那些在采用大數據之前冷靜地坐下來考慮他們想要從中獲得什么的組織機構,才能獲得他們一直在尋求的商業智能的成果。
2、有助于你的數據管理
IBM聲稱全球每天會生成2.5億億個字節的數據,其中大多數數據是大數據。不出所料,全球企業中受管理的數據正在成倍增長。隨著數據快速累積卻沒有明確的數據保留和使用策略(尤其是針對大數據),那么機構組織就要面對管理這些數據的難題了。
3、緩解你的安全擔心
對于很多企業來說,確定對數據的安全訪問仍然是一個開放的話題。這是因為針對大數據的安全實踐,并不像系統記錄中的數據那樣已經限定好了。我們正處于這樣一個時間點,IT應該與終端用戶合作,確定誰可以訪問哪些大數據以及相應的分析結果。
4、解決關鍵IT技能領域
大數據數據庫管理、服務器管理、軟件開發和業務分析技能都是供不應求的。這在很多IT部門已經匱乏的重要核心IT技能上有增加了額外的負擔。
5、減少遺留系統的價值
如果有的話,在大數據時代,記錄在案的遺留系統要比以往任何時候都更有價值。通常情況下,這些遺留系統為如何更好地剖析大數據提供了關鍵線索,讓數據分析可以回答重要的業務問題。
6、簡化你的數據中心
大數據要求并行處理計算集群和不同于傳統IT轉型的系統管理模式以及數據倉庫系統。這意味運行這些新系統所需的能耗、冷卻、軟件、硬件和系統技能也將是不同的。
7、改善你的數據質量
傳統事務處理系統的優點在于,會有固定的數據字段長度,對數據的全面編輯和驗證,有助于讓其轉變為相對干凈的格式。對于大數據并非如此,大數據是非結構化的,可以是任何一種格式。這讓大數據質量成為一大難題。數據質量是至關重要的。如果你沒有數據質量的話,你就無法信任數據查詢的結果。
8、驗證當前的投資回報率指標
從記錄系統中衡量投資回報的最常用方法就是監測交易的速度,然后推斷這在獲得收入方面意味著什么(例如每分鐘你能獲得多少個新的酒店預定)。交易速度對于大數據處理來說并不是很好的指標,可能需要數小時甚至數天時間處理大規模數據并運行數據分析。相反,評估大數據處理效率的最好指標是利用率,這應該在定期基礎上高出90%(與交易系統相比,后者可能只有20%)。開發這些針對大數據的新ROI指標很重要,因為你仍然需要說服CFO和其他業務領導在大數據上進行投資。
9、減少“噪音”
大數據中95%都是“噪音”,對商業智能貢獻很少或者幾乎沒有。過濾這些數據、獲得能真正幫助企業的情報將是一件艱巨的事情。
10、每次都管用
多年來,大學和研究中心運作了很多大數據實驗以得出基因組、藥物研究以及外星生命方面難以捉摸的答案。雖然這些算法和查詢中很多會產生結果,但更多的是沒有定論的。大學和研究環境對于沒有定論是可以容忍的,但是在企業環境中就不行了。這是IT和其他關鍵決策者需要管理期望的所在。